이 책은 다소 생소할 수 있는 빅데이터의 개념을 명쾌하게 설명해준다. 특히 데이터의 생성 과정과 처리 방법 등을 설명하고 있어 새로운 기술에 대한 궁금증을 해결해준다. 또한 의료, 공공 분야, 교통, 스포츠, 패션 산업, 대통령 선거 등 현재 빅데이터가 활용되고 있는 다양한 분야의 사례를 자세히 설명함으로써 빅데이터 기술에 대한 이해를 돕는 것이 큰 덕목이다.

하지만 이 책에서 가장 주목해야 할 부분은 빅데이터 기술에 대한 균형 잡힌 접근법이다. 이 책은 빅데이터 기술의 발달이 일상적인 사생활 침해와 인권 침해를 가져올 수 있음에 대해서 경고한다. 이 책의 내용을 따라가다 보면 신기술의 긍정적 효과는 물론이고, 그로 인해 파생되는 부정적 문제들에 대해서도 깊이 생각해 보게 한다. 이를 통해 신기술의 사회적 영향력에 대한 생각의 지평을 넓혀준다.세상에 대하여 우리가 더 잘 알아야 할 교양 41

저자 : 강이든

한양대학교에서 컴퓨터공학과 교육학을 공부했고, 동 대학원에서 컴퓨터공학 석사학위를 받았다. 지금은 ‘창작기획스튜디오 봄눈’에서 쉽고 재미있는 지식 교양 도서를 비롯한 다양한 콘텐츠 기획을 하고 있다. 지은 책으로는 《스마트 기기와 3D》《태극기가 힘차게 펄럭입니다》《생활 속 미스터리 해결사 과학 시크릿》《살면서 꼭 필요한 생활법률》등이 있다.

감수자 : 신동희

성균관대학교에 교수로 재직 중이며 한국HCI학회, 한국정보통신정책학회, 한국미디어경영학회 이사로 활동하고 있다. 전문 분야는 인간-컴퓨터 상호작용, 인터랙션, 정보통신정책이다. 성균관대학교를 졸업하고, 미국 시라큐스 대학에서 석사학위와 박사학위를 취득했다. 2006년 Outstanding Researcher, 2012년 SKKU Fellow, 2014년 연구재단 우수학자 등 국내외에서 많은 상을 수상하였다. 교육부가 주관한 World Class University 사업에 해외교수로 참여하였고, BK21 플러스 사업단장으로서 다양한 연구 업적을 내고 있다.

글쓴이의 말
들어가며 : 새 시대를 여는 데이터의 물결

1. 빅데이터란 무엇일까요?
2. 빅데이터, 어떻게 만들어질까?
3. 무궁무진한 빅데이터의 세계
4. 빅데이터, 새로운 해답일까요?
5. 빅데이터와 인권
6. 빅데이터와 미래

용어 설명
연표
더 알아보기
찾아보기

그렇다면 빅데이터란 무엇일까요? 빅데이터는 ‘크다’의 빅(Big)과 ‘정보’의 데이터(Data)에서 나온 합성어입니다. 쉽게 말해 아주 큰 데이터, 즉 수많은 데이터의 거대한 모음이라고 할 수 있지요. 정보 통신 기술의 발달로 현대에는 과거보다 더 많고 다양한 데이터가 생겨나고 있습니다. 기존 데이터 처리 기술로는 감당할 수 없을 만큼 양이 많고 복잡한 데이터가 생겨났지요. 이처럼 과거와 달리 엄청나게 복잡하고 무수히 많은 데이터를 모아놓은 거대한 집합체를 가리켜 ‘빅데이터’라고 합니다. --- p.16,「빅데이터란 무엇일까요?」중에서 데이터 분석에는 다양한 기법들이 이용됩니다. 분석 용도에 따라 통계, 데이터 마이닝, 텍스트 마이닝, SNS 분석 등의 기술을 이용하는데요. 데이터의 성격과 해결하려는 문제에 따라 다양한 방법의 분석 방법이 적용됩니다. 따라서 정확한 데이터 분석을 위해서는 해결하려는 문제를 명확히 정의해야만 합니다. --- p.46,「빅데이터, 어떻게 만들어질까?」중에서 그러다 보니 패스트 패션 업체들의 빅데이터 사랑은 대단합니다. 패스트 패션 업체들은 전 세계에 퍼져 있는 판매점들의 데이터를 모으고 SNS를 이용해 트렌드를 읽어 내는 방법으로 전 세계 공급망을 관리하지요. 이 모든 과정은 거의 실시간으로 이루어집니다. 그 덕분에 패스트 패션 업체들은 남보다 빠르게 유행하는 패션 스타일을 파악하고 대응할 수 있습니다. --- p.62,「무궁무진한 빅데이터의 세계」중에서 신기술은 양면성을 지니고 있습니다. 빅데이터 기술 역시 이를 피해 갈 수는 없지요. 새로운 기술이 현실에 어떤 영향을 미칠지 모르거니와 그 누구도 적용된 결과를 정확히 예견할 수 없기 때문입니다. 그래서 빅데이터 기술에는 낙관론과 비관론이 동시에 존재합니다. --- p.82,「빅데이터, 새로운 해답일까요?」중에서 예측 시스템이 아무리 발전한대도 100퍼센트 정확한 예측을 실현할 수는 없습니다. 만약빅데이터 시스템을 이용해 90퍼센트 정확도로 테 러범을 골라낼 수 있다고 해봅시다. 이 기술로 90명의 테러리스트를 잡 을 수 있을지는 모르지요. 하지만 10명의 무고한 사람들이 범죄자 꼬리 표를 달고 상상할 수도 없는 고통 속에서 살아가게 됩니다. --- p.105,「빅데이터와 인권」중에서 빅데이터를 통한 예측은 단지 분석 결과일 뿐입니다. 예측이란 것은 100퍼센트 정확하다고 말할 수 없어요. 수집된 데이터에 오류가 있을 수도 있고 누군가 의도적으로 결과를 조작할 수도 있어요. 따라서 모든 것을 빅데이터 분석에만 의존했다가는 큰 낭패를 겪을 수도 있습니다. 이러한 빅데이터의 허점을 메울 수 있는 것도 결국 우리들 사람입니다.

“빅데이터는 새 시대를 열어 줄 신기술이므로 적극적으로 데이터를 활용할 제도를 구축해야 한다.” vs “빅데이터로 인한 개인 정보 유출 등의 빅브러더 문제를 막으려면 데이터 활용을 적절히 규제해야 한다.”

2014년 4월 16일, 우리에게는 일어나지 말았어야 할 일이 일어났습니다. 그리고 많은 이야기가 있었습니다. 그 중에는 세월호 참사와 같은 재난의 원인을 관리하고 그 예후를 탐지할 수 있는 시스템을 조속히 구축해야 한다는 주장도 있었지요. 이러한 주장 가운데에는 최첨단 신기술인 빅데이터만 잘 활용했더라도 세월호의 비극을 막을 수 있었을지 모른다는 안타까움의 목소리가 있습니다. 빅데이터만 활용할 수 있었더라도 최적의 구조 방법을 결정하고 적용하는 일이 훨씬 빨랐을 거라는 주장이죠.

빅데이터는 엄청난 양의 디지털 데이터를 처리하고 가공할 수 있는 기술을 확보하면서 생겨난 개념입니다. 수많은 데이터를 정리한 자료들은 재난에 대비한다거나, 불치병을 고칠 실마리를 찾아낸다거나, 스포츠나 패션 사업에 활용하는 등 인류의 삶을 좀 더 풍요롭게 해줄 수 있지요. 그러나 이 신기술이 우리에게 이롭기만 할 것 같은데, 우려의 목소리도 좀처럼 잦아들지 않고 있습니다. 빅데이터 기술을 활성화하려면 어마어마한 양의 데이터가 필요한데, 이 과정에서 개인 정보에 대한 보안 문제나 사생활 침해, 인권 침해 문제가 필연적으로 발생할 수밖에 없기 때문이지요. CCTV에 찍힌 내 모습이나 개인의 통화내역 등의 개인 정보를 누군가 한데 모아 분석한다고 생각해 보세요. 사실 실제로 이런 일이 일어나고 있지 않다고 장담할 수 있는 사람이 아무도 없습니다. 정말 무섭지 않나요? 자, 그렇다면 우리는 최첨단 신기술인 빅데이터를 부수고 제한해야 할까요?

《세상에 대하여 우리가 더 잘 알아야 할 교양 41 빅데이터, 빅브러더가 아닐까?》는 다소 생소할 수 있는 빅데이터의 개념을 명쾌하게 설명해 줍니다. 특히 데이터의 생성 과정과 처리 방법 등을 설명하고 있어 새로운 기술에 대한 궁금증을 해결해 주지요. 또한 의료, 공공 분야, 교통, 스포츠, 패션 산업, 대통령 선거 등 현재 빅데이터가 활용되고 있는 다양한 분야의 사례를 자세히 설명함으로써 빅데이터 기술에 대한 이해를 돕는 것이 큰 덕목입니다.

하지만 이 책에서 가장 주목해야 할 부분은 빅데이터 기술에 대한 균형 잡힌 접근법입니다. 앞에서 말한 것처럼 이 책은 빅데이터 기술의 발달이 일상적인 사생활 침해와 인권 침해를 가져올 수 있음에 대해서 경고합니다. 이제 인터넷 사이트에 개인정보를 입력하지 않았다고 해서 개인 정보가 보호받는 시대가 아닙니다. 빅데이터를 이용한 기업이나 정부는 우리의 일거수일투족을 사실상 알고 있다고 하면 과언일까요? 이 책의 내용을 따라가다 보면 신기술의 긍정적 효과는 물론이고, 그로 인해 파생되는 부정적 문제들에 대해서도 깊이 생각해 보게 한다는 장점이 있습니다. 이 책이 부디 더 많은 이들에게 빅데이터 기술에 대한 바른 이해의 계기가 되기를 바랄 뿐이고 신기술의 사회적 영향력에 대한 생각의 지평이 넓어질 수 있기를 바랍니다.