컴퓨테이셔널 저널리즘은 뉴스 컨텐츠의 생산 속에서도 컴퓨팅을 활용하는 저널리즘의 방식 중 하나를 의미합니다. 컴퓨팅 능력이 향상됨에 따라 활용할 수 있는 영역이 점점 늘어나게 되면서 등장했는데, 아직 완벽히 정립된 개념은 아닙니다. 언론사에서도 아직은 실험단계로서 시도하는 정도 입니다. 다만, 사람의 행동들이 데이터로 저장되고 이에따라 알고리즘의 영향을 받게되어 행동하는것이 점점 늘어나고 있는 실정입니다. 그렇기 때문에 아직까지는 완벽히 정립된 개념이라고 보기는 힘들지만 향후에 성장 가능성이 뚜렷한 저널리즘의 한 분야라고 할 수 있습니다.
목차
알고리즘에 대한 이해 그리고 대규모 데이터 처리 능력이 갖추어져야만 컴퓨테이셔널 저널리즘을 수행할 수 있습니다. 스탠포드대학 제임스 해밀턴 교수는 이 저널리즘에 해당하는 영역을 세 가지로 나눕니다.
첫번째, 알고리즘을 통해 발견한 스토리
스탠포드대학과 마샬 프로젝트는 미국 내 20개의 주에서 교통경찰관이 운행중인 차량에 대해서 임의로 불러세워 검문을 하는 것과 관련된 데이터를 약 6천만건을 분석했습니다. 임의 검문에서 백인 운전자 보다 다른 인종 운전자의 임의 검문 비율이 높다는것을 검증하였고, 이것은 ‘임의 차량 검문과 운전자 인종의 상관관계’ 라는 컨텐츠로 만들어지게 되었습니다.
이 데이터에서 운전자의 인종과 임의 검문과의 상관관계가 있다는 의심이 없었더라면 약 6천만건이나 되는 데이터는 아무런 가치가 없었을 것입니다. 이렇게 숫자에 합리적인 의심이 더해지면 데이터가 가치를 지니게 됩니다. 이것이 알고리즘을 통해 발견한 스토리이며 ‘데이터 저널리즘’이라고 부르는 영역 입니다.
두번째, 알고리즘에 대한 스토리
이는 소재가 곧 ‘알고리즘’인 뉴스를 뜻 합니다. 하나의 기계가 알고리즘을 결정한다는 것에 대해서 불평등하지 않고 정확할것 같지만, 결국에는 알고리즘 자체를 짜는것도 인간이기 때문에 도출되는 결과에서 실수, 편견에서 자유로울 수는 없습니다.
‘프로퍼블리카’라는 매체의 보도를 적절한 사례로 들 수 있습니다. 미국의 한 사교육업체인 ‘프린스턴리뷰’는 각 지역에 온라인 SAT(Scholastic Aptitude Test) 개인지도 패키지를 상이한 가격에 판매했습니다. 가격은 알고리즘에 의해 정해졌는데, 아시아인들이 구매하는 패키지의 가격이 훨씬 비싸다는 결과가 나왔습니다. ‘프로퍼블리카’의 보도에서 아시아인은 더욱 높은 가격으로 제시받을 확률이 2배 가까이 되었으며, 특히 저소득층 지역의 아시아인에게 가장 높은 가격을 제시한 사례도 발견되었습니다. 이와같이 알고리즘에 대한 스토리는 문제의 소지가 될 수 있는 알고리즘에 대한 이해와 견제를 목표로 합니다.
세번째, 알고리즘에 의한 스토리
‘로봇 저널리즘’으로도 알려져 있는데요. 부동산 가격, 뉴스 속보, 날씨, 증권, 스포츠 등 다양한 분야에서 알고리즘이 직접 만든 뉴스를 뜻 합니다. 로봇 저널리즘 기술의 바탕은 컴퓨팅 기술에 있으며 소프트웨어를 활용한 기사 작성방법을 의미합니다. 로봇이 타이핑을 통해 작성하는 것이 아닌 축적된 데이터를 기초로 소프트웨어가 뉴스를 생성해내는 방식입니다. 로봇저널리즘은 미국의 제임스 미한 교수의 논문에서 최초로 고안된 개념이며 우리나라에서는 서울대학교에서 본격적으로 연구를 진행하고 있습니다. 이 저널리즘의 장점은 높은 효율성에 있습니다. 빠르게 다량의 기사를 작성해낼 수 있는 것을 뛰어 넘어 단순업무에 가까운 컨텐츠 제작에 발생하는 인력을 줄일 수 있어 기자들이 더욱 질 좋은 컨텐츠를 만들 수 있게 도와줍니다.