십 대를 위한 영화 속 빅데이터 인문학

팜파스 / 2021년 01월 / 235쪽 / 13,800원

십 대를 위한 영화 속 빅데이터 인문학

십 대를 위한 영화 속 빅데이터 인문학

김영진 지음

저자 소개

통계학과에 입학했지만 다양한 삶을 꿈꾸었다. 소설가를 꿈꾸며 제1회 사이버 신춘문예에서 우수상을 받았고 대학교 때에 음악 동아리 활동을 하다가 군대에서 음악 밴드도 했다. 통계 관련 컨설팅 일을 하다가 CJ엔터테인먼트 영화연구소에서 영화와 관련된 일을 하기도 했다. 현재는 한국통계진흥원에서 통계 관련 연구, 교육, 홍보 업무를 하고 있으며, 노래 부르기를 좋아하고, 스케이트보드, 스노보드를 즐겨 타며, 저녁 시간이면 아이들과 함께 영화를 본다. 늘 같은 공간에 머물러 있는 삶일지라도 자유로운 여행을 즐긴다. 그렇게 경험한 세상에 대해서 글을 쓰고 있다.

책소개

이 책은 영화 속에 펼쳐지는 다양한 빅데이터의 활약을 살펴보면서, 빅데이터와 데이터 리터러시에 대해 알아본다. 십 대 청소년들은 인문과 과학이 결합된 ‘빅데이터’에 대해 배울 수 있고, 자연스럽게 미래 사회에 대한 안목과 통찰력을 키우게 될 것이다. 더 나아가 다양한 영역에서 활약하는 데이터 사이언티스트의 소양을 기르게 될 것이다.

요약본 본문

미래는 데이터를 먹고 산다

모든 것은 연결되어 있다 〈아바타〉

전기화학적 작용을 이용하여 나무들은 뿌리를 통해 서로 소통하고 있어요.

마치 인간의 뇌 신경 세포인 뉴런을 시냅스가 이어 주듯이요.

나무 한 그루는 주변에 있는 나무 1만 그루와 연결되어 있죠.

판도라 행성에는 1조 그루의 나무가 있어요.

인간의 뇌보다 더 많이 연결되어 있어요. 바로 네트워크죠.

_영화 <아바타> 중에서

미래 사회와 4차 산업혁명에 대해 이야기할 때 많은 사람이 인공지능과 로봇에 관해서 이야기합니다. 여기에 미래 사회를 구현하는 핵심 키워드로 ‘통신 기술’을 더하고 싶습니다. 왜냐하면 미래는 점점 많은 것들이 연결되는 사회가 될 것이기 때문입니다. 컴퓨터와 컴퓨터뿐만이 아니라, 각종 사물끼리의 연결, 도시와 사람 사이도 연결하는 초연결의 시대가 열리게 되는 것입니다.

2009년 개봉된 영화 <아바타>는 초연결이 어떻게 구현되는지 환상적으로 보여줍니다. 2154년 에너지가 바닥난 지구인들은 우주로 눈을 돌려 행성 판도라에서 자원을 채굴하려고 합니다. 판도라 행성에는 귀중한 자원, 언옵타늄이 매장되어 있습니다.

판도라 행성의 또 하나의 특성은 바로 전체 행성이 하나의 네트워크로 연결되어 있다는 것입니다. 모든 생명체가 연결되어 정보와 에너지를 주고받습니다. 판도라 행성에서 살아가는 나비족은 이크란이라는 동물과 서로의 신경을 연결하여 비행할 수 있고, 나무와 연결하여 정보를 주고받을 수 있습니다.

판도라 행성의 대기에는 인간에게 치명적인 독성이 있어서, 지구인은 나비족의 DNA와 인간의 DNA를 혼합해 인간이 조종 가능한 생명체인 아바타를 만듭니다. 자신의 DNA를 가진 나비족의 모습을 한 아바타에 의식을 주입하여 원격으로 아바타를 조정할 수 있는 것입니다. 한 사람당 하나의 아바타만 가지게 되고 이들의 신경은 서로 연결되어 있습니다.

아바타와 연결되어 몸을 조종하는 것이 영화 속에서만 가능한 일일까요? 미래에는 아마 ‘생각’만으로 로봇이나 기계를 움직일 수 있는 세상이 펼쳐질 것입니다. 그리고 이제 사람과 기계와의 연결만이 아니라 사물과 사물의 연결까지도 시도하고 있습니다. 바로 ‘사물 인터넷’입니다.

모든 것이 사물 인터넷으로 연결된다: 판도라 행성처럼 이제 우리 사회는 점점 모든 것이 빠르게 네트워크화되고 있습니다. 미래에는 주변의 모든 사물 예컨대 전등, 자동차, 냉장고, 에어컨, 더 나아가 학교, 회사, 버스 정류장과 같은 생활공간까지 인터넷으로 서로 연결될 것입니다.

이렇게 사람이 작동시키지 않아도 유•무선 통신망으로 연결된 기기들이 알아서 센서 등을 통해 수집한 정보를 서로 주고받아 일을 처리하는 것을 의미합니다. 사물이 주변의 정보를 수집하고 이 정보를 다른 기기와 주고받으며 스스로 적절한 결정도 내릴 수 있습니다. 이 모든 것은 다 빅데이터가 있기에 가능한 기술들입니다.

모든 것이 디지털화 되고 데이터화되어 연결된다: 사물 인터넷을 구현하기 위해서는 ‘센싱 기술’이 필요합니다. 앞으로 자동차, 대형 마트의 상품, 집 안에 있는 가전 기기, 공장 생산 설비 등 모든 사물에는 센서가 부착될 것입니다. 마치 사람들이 오감(시각, 청각, 후각, 미각, 촉각)을 통해서 정보를 받아들이듯, 연결된 사물을 통해 엄청난 데이터가 생성되고 인공지능은 이런 빅데이터를 정보로 바꾸어줄 것입니다. 이렇게 사물인터넷과 인공지능이 결합하면 기계가 점점 더 똑똑해질 것입니다.

이와 같은 미래를 대비해 현재 많은 기업이 사물 인터넷 제품과 시스템을 구축하고 있습니다. 일본의 건설•광산 기계 제조업체인 코마츠 회사는 굴착기, 불도저에 각종 센서를 부착했습니다. 이 센서를 통해 차량의 정상 작동 여부, 차량의 위치, 과열이나 엔진 오일의 유압 저하 정보, 연료 상황 등을 파악할 수 있습니다. 이런 데이터는 통신 위성 회선이나 이동 통신망을 통해 코마츠 서버에 저장됩니다. 이 데이터를 통해 장비의 고장 원인을 쉽게 추정하여 수리 비용과 시간을 줄이고, 도난을 방지하며 유지 관리를 체계적으로 할 수 있습니다.

미래는 이렇게 사람과 사람, 사람과 사물이 연결되는 초연결의 시대가 될 것입니다. 그 연결을 이루는 것이 바로 빅데이터입니다. 마치 우리 몸에 혈액이 흘러 각 장기에 산소를 공급하는 것처럼 빅데이터는 모든 것을 이어줄 것입니다.

빅데이터가 우리 삶의 문제를 어떻게 해결해 줄까?

자율자동차 : 스스로 판단하고 움직인다 〈캡틴 아메리카 : 윈터솔져〉

닉 퓨리: 수직 비행해!

자동차: 「비행 시스템이 손상되었습니다.」

닉 퓨리: 그럼 안내 카메라를 작동시키고 수동 운전 모드로 전환해. 힐 요원 연결해 줘!

자동차: 「통신 장치가 손상되었습니다.」

닉 퓨리: 아, 손상되지 않은 기능은 무엇이지?

자동차: 「에어컨은 정상 작동합니다. 앞에 차량 정체가 있습니다.」

닉 퓨리: 다른 길을 안내해 줘!

_영화 <캡틴 아메리카 : 윈터 솔져> 중에서

전 세계적인 인기를 구가하는 마블 영화들에는 실제 있을 법한 첨단과학의 모습을 구현하여 미래 기술과 관련된 볼거리가 아주 풍성합니다. 탄탄한 스토리와 멋진 액션으로 영화 팬들의 사랑을 받은 영화 <캡틴 아메리카: 윈터솔져>에서는 아주 인상 깊은 장면이 등장합니다. 바로 비서처럼 알아서 척척 일을 수행하는 자동차입니다.

도로를 유유히 운전하던 어벤져스의 퓨리 국장은 갑작스러운 습격을 당합니다. 누군지 모를 적이 쏜 총탄이 차창에 쏟아지면서 그 순간 퓨리 국장이 탄 차는 ‘알아서’ 방탄 시스템을 가동시킵니다. 퓨리 국장은 적과 치열한 교전을 하면서 자동차에게 여러 명령을 내립니다. 이에 따라 퓨리 국장의 자동차는 방어 시스템을 작동하고 공격에서 벗어나기 위해 ‘스스로’ 운전을 합니다. 퓨리 국장은 자율주행 자동차의 도움으로 위기를 벗어납니다.

‘자율주행 자동차’는 운전자가 핸들과 가속 페달, 브레이크 등을 조작하지 않아도 자동차 스스로 목적지까지 찾아가는 기술입니다. 자동차가 알아서 운전하므로 운전자가 차 안에서 자유롭게 시간을 보낼 수 있습니다. 그렇게 되면 미래의 자동차는 단순히 이동 수단이 아닌 또 하나의 생활공간이 되어 폭넓게 활용될 것입니다.

대표적인 제조 산업인 자동차 산업은 빅데이터와 아무런 관련이 없는 것 같지만 자동차가 주행하면서 엄청난 차량 데이터가 생겨납니다. 자동차에는 전자제어장치(ECU)가 200개 이상, 반도체가 6000개 이상, 센서 200여 개가 들어갑니다. 이렇게 다양한 전자 제품이 탑재되어 있어 주행 속도, 브레이크 이력과 같은 운전자의 운행 기록이나 운전자 행동과 감정 상태는 물론, 음주 여부와 공기 오염 데이터까지 얻을 수 있습니다.

이런 센서와 제어기를 통해 차 한 대가 한 시간 동안 만들어 내는 데이터는 100메가바이트(MB), 연간으로는 11기가바이트(GB)에 달한다고 합니다. 결국, 미래 자동차는 인공지능 알고리즘, 소프트웨어, 데이터 저장과 같은 빅데이터 기술이 주요 기능으로 쓰이게 됩니다.

미래 기술의 집합체, 자율주행 자동차: 자율주행 자동차의 개념은 1939년 뉴욕세계박람회에서 처음 등장했습니다. 산업 디자이너 노먼 벨 게디스와 제너럴 모터스(GM)는 컴퓨터와 자동속도조절 장치가 달린 자동차 컨셉을 선보였지요. 실제로 자율주행차가 제작된 것은 1977년 일본 쓰쿠바 기계공학 연구소에서 만든 자동차로, 미리 표시해 둔 표식을 따라 주행하는 차였습니다.

우리나라에서 최초 자율주행차가 선보인 것은 1993년 대전 엑스포입니다. 하지만 그 뒤 별다른 지원이 없어지면서 기술이 정체되었다가 최근에는 가시적인 성과를 보였습니다. 바로 2018년에 현대 자동차의 수소전기차 넥쏘가 서울특별시에서 평창군까지 서울-평창 간 고속국도를 자율주행 기능만 이용해 완주해낸 것입니다.

자율주행 자동차는 네트워크에 연결된 자동차가 다양한 서비스를 제공하는 커넥티드 카(Connected Car)로 먼저 다다르고 나서 점점 지능적인 서비스를 제공할 수 있는 스마트 카(Smart Car)의 모습으로 발전해 나갈 것입니다.

커넥티드 카는 차량의 내부나 주변의 네트워크 또는 인터넷을 통해 원격 시동과 진단이 가능하고 전화나 메시지, 이메일을 송수신할 수 있으며 실시간 교통정보, 긴급 구난 등의 서비스를 제공합니다. 차량과 차량, 차량과 사물이 서로 통신하여 주변 차들에 대한 위치와 속도, 상태를 공유하며 교통 상황을 파악합니다. 또한 전방 유리에다 차량의 속도와 주행 정보, 경로, 지도, 주차 안내 같은 다양한 정보와 오락을 탑승자에게 제공할 것입니다.

자율주행차가 실현되려면 크게 라이다 센서, GPS 안테나, 사물 인식 카메라 기술이 필요합니다. 라이다 센서를 통해 거리와 주변 사물을 감지하고, GPS 안테나를 통해 위치 정보를 수신하고, 사물 인식 카메라를 통해 주변 상황을 인지합니다. 라이다 센서는 빛을 보낸 뒤 반사되어 오는 신호를 계산하여 범위 내에 있는 물체의 형태를 3D로 인식합니다. 영상 데이터와 라이다 데이터를 종합해서 사람, 건물, 나무, 자동차, 차선, 표지판 등을 인지하게 됩니다. 이렇게 주변 차량이나 실제 도로에서 맞닥뜨릴 장애물들을 빨리 인식하여, 어떻게 자동차를 제어할지를 결정합니다.

왜 미래에 자율주행 자동차가 주목받을까요? 교통사고의 95% 이상이 운전자 또는 사람의 실수로 발생합니다. 자율주행 자동차는 소프트웨어를 바탕으로 움직이기 때문에 정확도 측면에서 사람보다 훨씬 나을 수 있습니다. 모든 것이 시스템에 따라 움직이면 교통사고와 함께 교통 체증도 없어질 것입니다.

또한 차량을 소유하기보다는 공유함으로써 사회적으로 경제성과 친환경성 역시 높아질 것입니다. 이런 자율주행차의 기술은 다른 분야에도 적용될 수 있습니다. 농업 기계가 스스로 움직인다면 노동력이 부족한 농촌의 인력 문제를 많이 해결해 줄 것입니다. 영국 시장조사기관 주니퍼리서치는 2025년까지 전 세계에 2200만 대에 달하는 자율주행차가 보급될 것이라고 예상합니다.

자율주행 자동차가 가져오는 문제점: 2020년 코로나19로 인해 무인 자율주행 자동차와 로봇이 급속도로 발전하고 있습니다. 미국 메이오클리닉 병원에서는 자율주행 셔틀이 코로나19 검사 구역을 돌아다니며 채취한 검체 박스를 검사 요원에게 전달합니다. 중국도 코로나19가 발생한 우한 지역에서 무인 자율주행차로 생필품을 배송하고 도시 방역과 병원 내 의료용품 이송에 활용하고 있습니다.

자율주행 자동차가 가져다주는 미래가 마냥 좋기만 한 것은 아닙니다. 이렇게 자율자동차가 보급될수록 일자리 문제가 불거질 수 있습니다. 가장 먼저 영향을 받을 분야는 바로 운수업계일 것입니다. 택시 기사, 버스 기사, 택배나 화물차 운전기사의 일자리가 감소할 것으로 예상합니다.

이보다 더 큰 문제가 바로 해킹입니다. 자율주행 자동차를 이용하면 많은 정보가 기록됩니다. 차량의 이동 경로, 통화 목록, 이메일 목록, 연락처, 사진, 차 안 대화, 음성 명령, 네트워크를 통해 집에 대한 정보에도 접근할 수 있습니다. 또한 PC에 바이러스를 심어두고 돈을 내게 하는 랜섬웨어처럼, 시동을 걸려면 돈을 내라고 요구한다든지, 브레이크를 못 쓰게 만들거나, 핸들을 엉뚱한 방향으로 틀어 운전자를 위협에 빠뜨리는 범죄도 가능해집니다.

실제 2015년 유명 해커 찰리 밀러가 16킬로미터 떨어진 곳에서 지프 체로키를 해킹하여 운전대와 브레이크를 마음대로 조작한 장면이 방송되기도 했습니다. 커넥티드 카에는 무선 인터넷 연결이 가능한 텔레매틱스 시스템을 사용하기 위해 IP 주소가 부여됩니다. 따라서 컴퓨터를 해킹하는 것처럼 IP 주소를 알아내어 어디서든지 차에 접속할 수 있는 취약점이 있는 것입니다.

또한 아무리 자율자동차라고 해도 교통사고의 위험을 완전히 벗어날 수는 없습니다. 이때 사람의 실수와는 다른 자율주행 자동차만의 판단 착오 문제가 불거질 수 있는데요. ‘트롤리 딜레마’라는 상황이 있다고 가정합시다. 이는 단순히 계산적으로 다수를 구하기 위해 소수를 포기하는 것이 과연 도덕적으로 허용되는지에 대한 생각 실험입니다. 만약 당신이 이런 상황에 부닥친다면 어떤 선택을 하실 건가요.

만일 선택을 내리는 이가 사람이 아닌 기계라면 기계는 어떤 판단 근거로 선택하게 만들어야 할까요?우선순위를 정하기는 쉽지 않은 문제입니다. 이에 대한 심도 있는 연구와 사회적 합의가 필요합니다. 결국 인공지능의 발전은 인간의 윤리와 철학을 밑바탕으로 하고 있으니까요.

우리가 궁금해하는 것은 대부분 보이지 않는 세계에 있다

빅데이터는 너에 대해 모두 알고 있다 〈서치〉

“최근에 내 딸 마고가 이상한 행동을 하지 않았니?”

“네, 텀블러를 많이 사용했어요.”

“뭐? 텀블러가 뭔데?”

나는 내 딸에 대해서 아는 것이 없다.

_영화 <서치> 중에서

갑자기 주변에 있던 사람이 사라졌고, 경찰조차 찾기 힘들어한다면 여러분은 그 사람을 어떻게 찾을 수 있을까요? 영화 <서치>는 갑자기 사라져 버린 딸을 찾는 아버지의 이야기입니다. 데이빗은 아내가 암으로 세상을 떠나고 딸과 단둘이 살고 있습니다. 그러던 어느 목요일 밤에 부재중 전화 세 통을 남기고 딸은 사라져 버렸습니다. 막막해하는 데이빗에게 딸의 노트북이 눈에 띄지요.

데이비는 딸의 노트북 안에 담겨 있던 보고서 파일, 인터넷 기록, 메일, 채팅, 영상, 방송 기록을 살피면서 딸의 삶을 추적해 나갑니다. 그 기록들을 통해 데이빗은 자신에게 내색하지는 않았지만 딸이 아직 엄마를 못 잊고 힘들어하며 친구도 없이 외톨이로 온라인에서만 자신의 속마음을 내보이며 생활하고 있었다는 것을 알게 되지요.

데이빗은 이런 온라인 흔적들을 찾아 딸의 친구들을 만나고 딸의 생활을 하나하나 이해하게 됩니다. 그러던 중 경찰에게서 CCTV에서 딸의 마지막 행적을 찾았다는 연락을 받고, 데이빗은 CCTV에 나오는 길이 딸이 고민이 있을 때마다 찾아가던 호수로 가는 길임을 알아냅니다. 그리고 그 호수에서 딸을 찾을 단서를 발견합니다.

우리는 온라인에 얼마나 머물고 있을까?: 안드로이드 운영체계의 스마트폰을 쓰고 있다면 구글맵을 열고 타임라인이라는 메뉴를 클릭해봅시다. 도보, 지하철, 운전을 해서 몇 분 동안 이동했고 그 장소에서 얼마 동안 머물렀는지 기록되어 있습니다. 구글 계정에 있는 ‘데이터 및 맞춤 설정’을 클릭하면 언제 어떤 앱을 얼마 동안 사용하고 어떤 검색을 하고 어떤 유튜브를 시청했는지 기록되어 있습니다.

분명한 것은 구글은 여러분에 대해서 여러분보다 더 잘 알고 있다는 것입니다. 온라인에서 남긴 데이터가 의도치 않게 현실 속 나보다 더 진실한 모습을 보이는 경우가 심심치 않게 있습니다.

미국의 대형 마트인 ‘타깃’에 한 남성이 화가 나서 찾아왔다고 합니다. 그는 한 여고생의 아버지였는데 타깃에서 딸에게 임산부용 쿠폰을 보냈다고 항의하러 온 것입니다. 이에 매장 직원들은 정중히 사과를 하고 그를 돌려보냈는데, 나중에 그 아버지에게서 미안하다는 연락이 왔다고 합니다. 알고 보니 딸이 실제로 임신 3개월째였던 것이지요.

부모도 몰랐던 임신 사실을 대형마트가 먼저 알아채고 할인 쿠폰을 보낸 것입니다. 이런 일은 대형 마트의 빅데이터 팀이 고객 구매 형태를 분석한 결과로 일어난 것입니다. 예를 들어 한 여성 고객이 갑자기 튼살 방지 크림과 임산부용 속옷 등을 구매하거나 향이 나는 로션을 사던 여성이 향이 없는 로션으로 바꾸거나 평소 사지 않던 미네랄 영양제를 갑자기 사들이는 경우, 그 고객이 임신했을 가능성이 크다고 판단하는 것입니다. 이런 구매 이력을 분석하면 임신 몇 개월인지도 추측할 수 있습니다.

데이터 활용이 높아지면서 필요해지는 정보 보호: 영화 <서치>에서 그려진 것처럼 온라인상에는 우리 자신의 흔적이 많이 있습니다. 이러한 사실을 놓고 보면 우리는 불안할 수밖에 없습니다. 빅데이터 활용도가 높아지고 금전적인 가치도 커지고 있으므로 이런 정보가 잘못 사용되어 사생활 침해나 범죄에 이용될 가능성 또한 높아지고 있기 때문입니다.

개인 정보 보호와 데이터 활용성은 언제나 동전의 양면처럼 빅데이터의 두 얼굴을 보여 줍니다. 개인 정보 보호를 강조하면 데이터의 활용성이 낮아질 수밖에 없고, 데이터 활용성을 강조하다 보면 정보 보호 침해 가능성이 커질 수밖에 없습니다.

이에 데이터 활용성을 유지하면서 개인 정보를 보호할 수 있는 비식별화 데이터를 개발하고 있습니다. ‘비식별화 데이터’는 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체하는 방법으로 가공한 정보입니다. 즉 민감한 데이터 정보를 일부 삭제하거나, 가명 처리 혹은 그룹으로 묶어 동일한 값을 주거나, 다른 값으로 대체하는 방법을 사용하여 정보 노출의 위험성을 줄이는 방법입니다. 이렇게 데이터에 잡음을 주어 특정 개인의 정보를 파악할 수 없도록 하는 것입니다.

비식별화 조치를 해도 데이터를 연결하고 분석하는 과정에서 재식별화 되기도 합니다. ‘재식별화’는 비식별화된 정보를 조합하고 분석하는 과정에서 개인 정보가 재생성되는 것을 의미합니다. 개인 정보를 삭제했는데 재식별화되어 문제가 된 사례가 생기고 있어서 이에 대한 주의가 요구되고 있습니다.

2006년 미국 넷플릭스는 더 정확한 영화 추천 알고리즘을 만들기 위해 아이디어 경연 대회를 열었습니다. 아이디어를 돕기 위해 50만명 이용자들이 6년 동안 영화를 평가한 자료 1억 건을 공개했는데 이때 이름 등 개인을 알아볼 요소는 지우고 평가 점수와 일시는 공개했습니다. 텍사스대학교 연구팀이 이 정보를 분석해 온라인 영화 전문 사이트에 올라온 영화 평가와 넷플릭스의 데이터를 결합하여 개인을 재식별해냈습니다. 이런 위험성 때문에 2차 경연 대회는 취소했다고 하네요. 이처럼 재식별화 사례가 끊이지 않고 있어 개인정보 보호 기술이 더 정교해져야만 안심하고 비식별화 데이터를 활용할 수 있게 될 것입니다.

빅데이터를 가장 맛있게 먹는 레시피

스몰데이터에 주목하자 〈쥬라기 공원〉, 〈관상〉

공룡과 같이 수백만 년 전에 멸종된 동물들은

우리가 찾을 수 있도록 그들의 청사진을 남겨뒀어.

우리는 단지 그것이 어디 있는지 찾기만 하면 돼.

_ 영화 <쥬라기 공원> 중에서

빅데이터는 과거의 흔적입니다. 마치 사라진 공룡의 화석과 같습니다. 화석을 통해 우리는 과거에 살았던 공룡에 대해서 알 수 있습니다. 그렇다면 오래전에 멸종된 공룡을 복원해 낼 수도 있을까요.

1993년에 개봉된 <쥬라기 공원>은 이러한 상상에서 만들어진 영화입니다. 호박 속에 갇혀 보존된 모기에 있던 공룡의 피 한 방울을 통해 공룡을 복제해 낸다는 아이디어는 영화가 나올 당시 많은 화제가 되었답니다. DNA 안에는 몸집, 생김새, 인체 내 구조, 혈액형, 행동 특성, 유전 질병의 정보가 담겨 있습니다. 마치 공룡의 설계도 같죠.

우리의 흔적은 DNA, 세포만 있는 것이 아닙니다. 친구와 나눈 대화, 게시판에 올린 글이나 사진은 여러분의 세포 조각과도 같은 것입니다. 거대한 얼음 속에 매머드의 사체가 저장되듯이 빅데이터 형태로 여러분의 샘플이 계속해서 디지털 세상에 담기고 있습니다. 지금에야 퇴적층에서 공룡의 화석을 찾아 그 비밀을 풀어내는 것처럼, 먼 미래에 이러한 정보들이 어떤 가치를 지닐지 지금은 알지 못하고 있습니다.

빅데이터의 한계를 이야기하다: 빅데이터 얘기가 주목받으면서 많은 사람들은 데이터 안에 모든 것이 들어 있을 것이라고 생각할 수 있습니다. 하지만 이것은 공룡이 남긴 혈액처럼 퍼즐의 핵심 조각과 같습니다.

빅데이터를 통해 본체를 알아내는 작업은 마치 커다란 항아리에 큰 돌을 집어넣어 채우는 것과 비슷합니다. 그 돌이 쌓인 모양을 통해 항아리의 형체는 파악할 수 있지만 항아리 안에는 빈 공간이 많습니다. 왜냐하면 데이터는 어떤 행동에 있어 특정 부분만 기록으로 남는 형태이기 때문입니다.

이러한 빈 부분은 세밀하게 관찰한 정보를 통해 메울 수 있습니다. 아무리 빅데이터가 발전해도 예전의 셜록 홈즈와 같은 관찰적인 접근을 통해서 얻을 수 있는 정보의 효용성은 여전히 높습니다. 이러한 관찰된 정보들을 ‘스몰데이터’라고 합니다. 스몰데이터는 개인의 취향이나 필요, 건강 상태, 생활양식 등 사소한 행동에서 나오는 정보들을 말합니다. 이러한 스몰데이터를 통해 빅데이터의 빈 공간을 메울 단서를 찾을 수 있습니다.

스몰데이터는 가설을 통한 빠른 문제 해결에 유리하다: 빅데이터 분석을 하기 위해서는 먼저 어떤 데이터에 접근해야 할지 결정해야 합니다. 말 그대로 엄청난 양의 데이터를 모두 분석해 보자고 덤벼드는 것은 너무 무모하기 때문입니다. 그러므로 현재 직면한 문제를 해결을 하기 위한 가설을 세워 접근하는 것이 효율적입니다. 가설이란 가상으로 세워보는 결론입니다.

이런 가설을 세우기 위해서는 인터뷰처럼 고객과 직접 접촉하거나 일상 속 행동을 관찰함으로써 그들의 진짜 속마음을 간파하는 작업이 필요합니다. 이를 통해 문제의 본질을 제대로 정의할 수 있습니다. 바로 스몰데이터를 통해 가설을 세워보는 작업이 필요한 것입니다. 이렇게 만들어진 가설을 빅데이터를 통해 확인해볼 수 있습니다.

그렇다면 스몰데이터가 유용하게 활용된 사례를 살펴볼까요. 오픈마켓 ‘11번가’는 2012년 터키 시장에 진출했습니다. 터키 소비자들은 택배가 너무 늦게 도착해서 짜증이 난다는 불만을 제기했다고 합니다. 그 불만의 내막을 살펴보니 터키는 한국과 달리 경비실이나 여타의 장소에 택배를 맡기기 어려워 한번 택배를 놓치면 언제 다시 받을지 알기 어렵다는 사실을 알아냈습니다.

터키인들이 실제보다 배송 시간을 더 길게 느끼는 것은 절대적인 시간의 문제가 아니라, 언제 도착할지 모르는 막연한 기다림과 불확실성이 주는 불안감 때문이었습니다. 그래서 택배 시간을 단축하는 것보다 ‘주문한 물건’이 언제 도착할지 정확하게 예측할 수 있는 시스템을 구축했습니다. 만약 빅데이터 분석 결과만 활용했다면 배송 프로세스를 효율적으로 개선하기 위해서만 힘을 쏟았을 것입니다.

코카콜라는 아랍 시장에 광고했다가 실패한 사례가 있습니다. 광고는 사막에 뻗어 있는 사람이 콜라를 마시고 뛰어가는 내용이었습니다. 그런데 아랍 사람들은 오른쪽에서 왼쪽으로 읽기 때문에 광고 내용이 거꾸로 읽혀서 펄펄 뛰어다니는 사람이 콜라를 마시고 뻗어 버리는 내용이 되어 버린 것입니다. 스몰데이터가 아니었다면 왜 아랍 사람들에게 콜라 광고에 대한 이미지가 좋지 않은지 파악하기 힘들었을 겁니다. 왜냐하면 그 광고는 현재 콜라를 마시고 있는 사람들에 대한 빅데이터를 분석해서 메시지를 만들어 제작했기 때문입니다.

로봇 청소기 룸바도 빅데이터 분석 결과, 제품의 소음과 부피를 줄여야 한다는 의견이 나왔다고 합니다. 그러나 스몰데이터를 분석해보니, 소비자들은 룸바를 가전제품이 아니라 반려동물처럼 다뤘고 애칭까지 지어 불렀다는 걸 알게 되었습니다. 소비자들은 오히려 ‘우웅’하는 소리와 귀여운 디자인 등을 중시하고 있었던 겁니다. 그래서 소음을 줄이는 첨단 기술보다는 룸바의 감성적인 요소를 되살리는 방향으로 개선했습니다. 이렇게 제품에 소리와 움직임과 같은 감성적인 요소를 더하자 매출이 전보다 크게 늘어났다고 합니다.

본 도서요약본은 원본 도서의 주요 내용을 5% 정도로 요약 정리한 것입니다. 원본 도서에는 나머지 95%의 내용이 들어 있습니다. 보다 많은 정보와 내용은 원본 도서를 참조하시기 바라며, 본 도서요약본이 좋은 책을 고르는 길잡이가 될 수 있기 바랍니다.

0 댓글
본문 피드백
모든 댓글보기