[데이터 수집] 데이터 저널리즘으로 권력 견제하기


Original Article by Data Journalism Awards Translated by JJ Hwang



- 브라질, 세르비아, 미국의 탐사보도의 사례를 중심으로


< [왼쪽부터] 팩트체크 : 트럼프와 클린턴의 1차 토론 (NPR, 미국), 세르비아 정치인들의 재산 데이터베이스 (KRIK, 세르비아), Ctrl + X (ABRAJI, 브라질) >

대부분의 나라에서 현대 저널리즘의 목표 중 하나는 권력을 견제하는 것입니다.

부정부패를 조사하거나 정부 또는 유력 인사가 은폐하고 싶어하는 데이터를 찾아낼 때 어떤 방식을 취해야 할까요? 대부분의 데이터 저널리스트들이 이러한 탐사를 수행할 때 당면하는 과제들은 무엇이며, 그들은 이 과제들을 어떻게 해결할까요?


< [왼쪽부터] 미국 NPR의 Amita Kelly, 브라질 ABRAJI의 Tiago Mali, 세르비아 KRIK의 Jelena Vasić>

일곱번째 시즌을 맞는 데이터 저널리즘 어워즈가 Amita Kelly, Tiago Mali, Jelena Vasić 세 분과 함께 권력 견제를 주제로 온라인 인터뷰를 진행했습니다. 세 분 모두 동유럽과 남미, 북미 곳곳에서 데이터 저널리즘에 대한 놀라운 시야를 제공해 주셨습니다.


브라질, 언론 자유에 반하는 정치권력과 사법기관의 유착

“브라질에서 정치인들과 사법기관들은 자신들이 견제와 책임에서 벗어나 있다고 생각하는 것 같습니다.” 브라질 탐사 보도 연합(ABRAJI)의 프로젝트 코디네이터 Tiago Mali의 견해입니다.

“견제와 균형이라는 개념이 없고, 판사들은 정치인들과 유착되어 있는 경우가 많습니다. 판사들은 정치인들을 보호하기 위해 언론 검열에 대부분 호의적입니다. 언론 자유에 반하여 그들은 서로 돕는 관계입니다.”

Mali의 진술에 따르면 2017년 9월, 미나스 제라이스 주 베칭 시의 시장이 자신에게 불리한 탐사 보도를 했다는 이유로 한 웹사이트를 고소했습니다. 이 보도를 담당한 저널리스트는 협박 전화를 받기까지 했습니다. ABRAJI의 팀원들은 사법 체계는 이러한 일에 전혀 책임을 지지 않아도 된다는 것이 문제임을 발견했습니다. 그들은 이에 대항하여 언론을 검열하려는 의도가 다분한 판사, 소송, 의사결정 사항들을 공표하기 시작했습니다.

“사법 체계에 사회적 압력을 가하고, 그들의 부정 행위를 낱낱이 드러내는 것이 우리의 방식이었습니다.” Mali의 진술은 계속되었습니다.

“아직까지는 ABRJI가 직접 협박을 받지는 않았습니다. 하지만 우리는 많은 저널리스트들이 끊임없이 협박을 받고 있는 사례를 계속 밝혀내고 있습니다.”


< Ctrl + X 프로젝트는 브라질 시민들이 시야를 가리기 위해 특정 개인들, 정치인들, 기업들이 기사나 컨텐츠를 삭제하려는 목적으로 제기한 소송을 모아놓은 데이터베이스이다.>

브라질의 Ctrl + X 프로젝트, 정보를 은폐하려는 정치인들에 대한 통렬한 고발

ABRAJI는 수 천건의 소송 내역을 웹크롤링/웹스크래핑 방식으로 수집하고, 대중의 눈을 가리려는 시도를 한 2,500명의 브라질 정치인들의 리스트를 작성하는 Ctrl + X 프로젝트를 통해 2017년 6월 데이터 저널리즘 어워즈를 수상하였습니다.

“우리는 법정에서 수많은 정치인들이 저널리스트들의 입을 막는 행동을 하는 것을 보고 이 프로젝트를 하기로 결심했습니다. 자신들에게 불리한 뉴스가 보도되는 것을 막기 위해 사법 체계를 이용하는 전직 대통령, 주지사, 시장들을 알고 있습니다. 80년대 독재 시절과 함께 끝났다고 하는 일들이 아직도 벌어지고 있는 것이지요.” Mali의 이야기입니다.

“당시는 몇 건의 소송이 진행되었는지 알지 못했습니다. 양심 있는 저널리스트라면 해야 할 일을 한 것이죠. 우리가 직접 소송의 건수를 집계하기 시작했습니다.”

2014년 이 프로젝트를 시작할 때, ABRAJI는 언론 관련 변호사와 기관에 저널리스트들을 상대로 이루어진 소송의 상세 내역을 요청했습니다. 이러한 행동이 2014년 선거에 어느 정도 영향력을 발휘했습니다만, 모두가 열성적으로 동참하거나 협조할 만한 시간적 여유가 있던 것은 아니었습니다.

그래서 ABRAJI의 팀원들은 데이터 수집의 방식을 좀 더 발전시켜 보기로 했습니다. 2015년과 2016년에 ABRAJI는 이러한 종류의 소송 정보를 모으기 위해 웹크롤링/웹스크래핑 툴을 활용하여 수많은 브라질 법원 사이트들을 탐색했습니다.

“이 툴을 활용하여 우리가 수집한 소송 건수는 수 십 건이 아니라 수 천 건이었습니다.” 라고 Mali가 이야기했습니다. “데이터를 보고 놀라움을 금치 못했죠.”

“소송 자료의 공개 이후, Ctrl + X는 표현의 자유에 관한 통찰력 있는 데이터를 제공했을 뿐만 아니라 다른 미디어가 투명성 관련 기사를 작성할 수 있도록 그 자료를 활용하게 해 주었습니다. 이 데이터가 2016년 선거에서 활용되었다는 것이 매우 중요한 점이지요,” 라고 데이터 저널리즘 중국 지부의 편집자이자 데이터 저널리즘 어워즈의 심사 위원인 Yolanda Ma가 평가하였습니다.

세르비아 정치 비판 탐사 보도, 위협과 협박에 직면


< 세르비아 국방 장관 Aleksandar Vulin에 대한 KRIK의 탐사 보도 스크린샷 >

2017년 9월, 세르비아 국방 장관 Aleksandar Vulin은 KRIK의 탐사 보도의 핵심 타겟이었습니다. KRIK은 범죄와 부정부패를 고발하는 세르비아의 저널리즘 네트워크입니다. 그는 세르비아 반부정부패 기관에서 진술하기를 캐나다에 있는 그의 처고모가 베오그라드의 아파트를 구매하기 위해 20만 유로를 빌린 것 뿐이라고 했습니다. 그러나 자신의 주장을 뒷받침 할 만한 증거는 제출하지 못했지요.

“Vulin이 속한 정당은 곧바로 KRIK의 보도와 반대되는 공식 논평을 며칠 동안 쏟아내기 시작했습니다,” 라고 KRIK의 저널리스트인 Jelena Vasić이 이야기합니다. 그들이 이른바 주장하는 바는 “KRIK의 편집인인 Stevan Dojcinovic는 검사를 받을 필요가 있는 약물중독자이다”라는 것이었고, 장관을 공격하도록 외국인들에게 돈으로 매수되었다는 것이었습니다. 뿐만 아니라 그 정당은 KRIK을 지지하는 입장의 모든 유력 인사들을 무례하게 비난했습니다.

이 사건 이후 유럽 연합의 관계 기관은 세르비아 정부가 자국의 언론 기관에 취하는 행동을 면밀히 추적하겠다고 베오그라드에 통보했습니다.

하지만 이는 KRIK에게만 일어났던 일이 아니었습니다. 지난 7월에는 언론 상을 수상한 KRIK의 저널리스트 Dragana Peco의 집에 누군가가 침입하여 집기들을 훼손한 일이 발생했습니다. “KRIK의 저널리스트들은 소셜 미디어에서 살해 위협도 받았습니다,” 라고 Jelena Vasić의 진술이 이어졌습니다.


< KRIK은 가장 광범위한 수준으로 세르비아 정치인들의 재산 현황을 온라인 데이터베이스화 했다는 평가를 받고 있다. >

세르비아 정치인들의 재산 데이터베이스


KRIK은 세르비아 정치인들의 재산을 가장 광범위한 수준으로 데이터베이스화 하여 2017년 데이터 저널리즘 어워즈를 수상하였습니다. 현재 이 데이터베이스는 모든 세르비아의 각료들과 2017년 선거에 출마한 대통령 후보들의 자산 카드로 구성되어 있습니다.

이 데이터베이스는 세르비아 국민들이 정치 지도자들이 누구인지 쉽게 알 수 있고 그들의 투명성을 높이는 데에 기여하도록 기획되었습니다. 각 페이지는 현 각료들과 대통령 후보들의 아파트, 주택, 승용차, 운영하는 회사 정보를 포함하고 있고, 그들이 그 재산을 어떻게 소유하게 되었는지의 세부 절차까지 망라하고 있습니다.

“KRIK의 프로젝트는 단순히 데이터를 공개하는 것을 넘어서서 사람들의 시야까지 열어주었습니다,” 반 범죄 및 반 부정부패 보도 연합의 임원이자 데이터 저널리즘 어워즈 2017년 심사위원이었던 Paul Radu의 이야기가 이어집니다.

“그 프로젝트로 인해 데이터에 대한 접근이 제한적이었던 세르비아 국민들은 정치인들이 어떤 부를 축적하고 있는가를 알 수 있게 되었습니다. 데이터의 공개 이후 KRIK의 저널리스트들은 감시와 감청을 받게 되고, 그들의 캠페인은 매도되었습니다. 하지만 KRIK은 공공 책임성과 투명성의 이름 하에 자신들을 지켜냈습니다.”

세르비아 정치인들의 온라인 재산 데이터베이스는 많은 주목을 받았습니다. KRIK은 세르비아의 그 어떤 다른 조직보다 이 주제에 대한 큰 성과를 얻었습니다. 이 데이터베이스는 정부 투명성과 정치인 재산 공개에 크게 기여했습니다. 이 프로젝트가 아니었다면 위의 데이터들은 대중들의 접근으로부터 영영 은폐되었을 것입니다.

미국 저널리스트들도 도전에 직면하다


미국에서 유력 인사에 관한 투명성을 확보하는 것이 힘겨운 싸움이라는 것은 공공연한 사실입니다. 불과 6개월 전에도 현직 대통령의 세금 탈루 의혹은 커다란 논쟁거리였습니다. “어떤 사람인가, 어떤 기관인가에 따라 많이 다를 수 밖에 없다는 것을 알게 되었습니다,” NPR의 디지털 편집인인 Amita Kelly의 이야기가 이어집니다.

“어떤 경우에는 투명성이 매우 높고, 꽤 세밀한 원칙들이 기술된 문서도 존재합니다. 2016년 선거에서 부딪힌 난관은 각 선거 진영과 후보자의 온라인 자료 및 소셜 미디어 자료가 많기는 하지만 이를 명확하게 정책과 후보 개인의 의견으로 분리하는 것이 쉽지 않았다는 점입니다.”

트럼프의 당선이 권력을 견제하는 미국의 저널리즘에 변화를 가져왔을까요?

Amita Kelly는 정부와 기업이 정말로 무엇을 하는지 그 진실의 중심에 접근하는 것은 항상 어려운 일이었다고 말합니다: “제가 보기에 트럼프의 선거운동에서 달라진 점은 그의 정책 제안과 정치적 입장이 선거운동과 재직기간의 과정에 따라 엄청나게 진화했다는 것입니다,” 라는 Kelly의 이야기입니다.


팩트체크 프로젝트 : 미국 대선 토론


< 국가 안보, 이민, 경제, 대외 정책 등을 다루는 기자와 편집자들의 지원을 받아 NPR의 정치팀은 지난 2016년 9월 트럼프와 클린턴 사이의 대선 토론에 온라인 주석을 달았다. >

Kelly의 팀은 트럼트와 클린턴의 대선 토론 팩트체크 프로젝트로 2017년 데이터 저널리즘 어워즈를 수상하였습니다. 그것은 매일매일 업데이트되는 놀라운 팩트들의 정점이었으며 이는 수많은 저널리스트들이 참여의 성과였습니다.

“선거 운동의 메시지나 대통령의 진술을 검토하고 올바른 정보에 입각한 반론을 하는 제반의 팩트 체크 과정은 전적으로 전문가 저널리스트들에 의해 진행되었습니다,” Kelly가 이야기를 이어갔습니다. “따라서 정보를 찾아내는 것은 그리 어려운 일이 아니었고, 오히려 확인된 정보를 가지고 무엇을 할 것인가가 우리의 관심사였습니다.”

이코노미스트 지의 온라인 수석 편집인인 Kennet Cukier과 2017 데이터 저널리즘 어워즈 멤버들은 이 프로젝트에 대해 다음과 같은 평가를 했습니다: “가짜 뉴스가 범람하는 이 시대에 저널리즘의 가장 중요한 임무는 근거를 기반으로 한 진실을 가지고 거짓을 빠르고 간결하게 가려내는 일입니다”

“NPR은 미국 대선 양 후보의 발언에 대해 균형 있고, 참신하며, 효율적인 팩트 체크 업무를 수행했습니다. 데이터와 팩트를 배열하는 방식으로 후보자들의 진술을 확증하거나, 비판하거나, 풍부하게 했습니다. 그들은 진실을 추구하는 저널리즘의 정신을 책임있는 비평으로 사실을 보도하는 뉴스 생산의 새로운 방식에 새겨 넣었습니다.”

보도 과정에서 당한 협박과 그 대응



이 세 기관은 모두 저널리스트들에게 가해지는 공격, 위협, 협박에 대한 적정한 대응 체계를 갖추고 있었습니다.

KRIK은 공개적으로 위협받는 상황이나 그들에 반대하는 비열한 여론이 조성되는 상황을 타개하는 대응 체계를 마련해왔습니다. “어떠한 위협도 우리를 멈출 수 없습니다,” Jelena Vasić의 이야기입니다.

“우리는 즉각적으로 기부자, 파트너, 국내외 저널리스트 협회, 유력 인사들에게 현재 일어나고 있는 협박에 대해 알리고 이에 대해 반대한다는 공식 논평을 보내주기를 부탁했습니다. 이를 받아 우리 웹사이트에 하나씩 공개했지요. 우리 독자들은 우리가 전문가들과 공동체의 지지를 받고 있음을 알게 되었습니다.”

“우리는 우리가 받은 모든 위협과 협박을 정리한 특별 사이트를 만들었습니다.” Jelena Vasić가 덧붙였습니다.

방어를 강화하기 위해 그들은 특별한 방식을 채택했습니다. 해당 기사를 준비하는 기자들은 기사에 대해 편집인에게만 이야기할 수 있고, KRIK의 직원들은 암호화된 전화나 이메일을 사용했습니다.

ABRAJI의 Tiago Mali는 위협을 받는 저널리스트들이 혼자 힘으로만 이에 대응해서는 안 된다고 지적합니다.

“우리 자신을 보호하기 위해 연대해야 합니다. ABRAJI에서는 받은 위협을 리스트화하고 그 배경을 조사하려고 노력합니다. 너가 우리 중 한 명을 공격하면 우리는 모두 함께 너를 응징할 것이다 정도의 정신이라고 할까요.”

브라질의 ABRAJI는 Tim Lopes (2002년에 살해된 저널리스트의 이름을 따서) 라는 프로젝트도 진행하고 있는데, 브라질 전역의 저널리스트들이 언론인들의 죽음에 대해 조사하는 일을 하고 있습니다.

NPR은 위협의 정도에 따라 대응하는 체계를 갖고 있습니다. “대응할 것인가 말 것인가를 판단해야 하는 소셜 미디어 상의 위협을 많이 받고 있습니다,” Amita Kelly의 이야기입니다. “선거 운동 중 위협을 받고 있다고 느낀 기자들도 있었는데, 다행히 이런 위협이 항시적이지는 않아서 다행이라고 생각하고 있습니다.”

정부나 유력 인사가 숨기고 싶어하는 데이터를 어떻게 확보했는가?



ABRAJI의 경우 소송에 대한 정보가 올라온 사법부 홈페이지를 정기적으로 웹크롤링/웹스크래핑하는 방식으로 데이터를 수집했습니다. “문제는 소송에 대한 온라인 문서에 특별한 표식이나 구조화된 뭔가가 없어서 이 소송이 언론 검열이나 언론인을 대상으로 한 것인지 아닌지 구별하기가 매우 어려웠다는 점입니다.” Tiago Mali의 이야기입니다.

“그래서 우리가 찾는 소송건들에 더 근접할 수 있는 다른 크롤링/스크래핑 방식을 채택해 보았습니다. 모은 수 천 건의 자료를 하나하나씩 모두 읽고 분류하는 방법이었습니다. 시간이 너무 많이 소요되는 작업이라 이를 차근차근히 자동화하는 방식으로 발전해가고 있습니다.”

ABRAJI의 팀원들은 소송건들을 리스트화하고 분류하는 데에 머신 러닝을 활용하려고 계획 중입니다. “모든 작업을 자동화하는 알고리즘을 설계하고 싶습니다. 이후 결과물만 한 번 더 검토하게 되면 좋겠다고 생각하고 있어요,” Mali의 이야기는 계속 됩니다. “이게 이루어지면 효율성 면에서 엄청난 발전이라고 생각하는데, 아직 자동화를 위해 소요되는 예산이 부족한 실정입니다.”

KRIK의 경우는 세르비아 뿐만 아니라 몬테네그로, 보스니아-헤르체코비나, 크로아티아, 이탈리아, 체코 같은 외국 및 델라웨어, 아랍에미레이트, 사이프러스 같은 역외 지역에 이르는 모든 나라들에서 기업, 범죄, 소송, 금융, 토지 등기, 판매 계약, 대출, 모기지 계약 데이터를 모두 수집합니다.

“우리는 정보공개청구를 많이 활용했습니다,” Jelena Vasić의 이야기입니다. “정부 기관이 우리의 정보공개청구에 응하지 않아 어려움을 겪었습니다. 그러더니 정부 기관이 바로 모든 세부 사항들을 해당 정치인과 친정부 언론사에 넘겨주더군요. 이 자료들은 우리 KRIK을 음해하는 여론 조성에 활용되었습니다.”

“이와 같은 국면에서 우리는 공공정보 중재기관에 적극 항의하였고 우리 웹사이트와 소셜 미디어에 우리 정보공개청구에 응답하지 않은 정부 기관들의 리스트를 업로드하였습니다. 정부 기관의 방해에도 불구하고, 우리는 우리가 필요로 하는 데이터 대부분을 획득할 수 있었습니다.”

데이터 저널리즘의 성과와 영향력


Ctrl + X가 수집한 데이터는 뉴스가 되었습니다. 2016년 선거에서 정치인들이 은폐하고 싶어하는 정보와 관련된 200개 이상의 스토리가 기사화 되었고, 브라질의 모든 주요 신문, TV, 라디오가 이 정보를 활용하여 언론의 자유에 대한 이야기를 다루었습니다.

세르비아의 KRIK은 법을 바꾸는 데에 기여했습니다. Jelena Vasić의 이야기에 따르면 세르비아의 토지 등기소는 이전의 방식을 바꾸어 모든 등기소가 받은 정보공개청구는 베오그라드의 승인을 받아 처리하기로 하였습니다.

미국의 NPR은 진실에 대한 대중의 열망이 높음을 확인하였다고 합니다. Amita Kelly의 이야기에 따르면 미국 대선 토론의 팩트체크 페이지는 2,000만 뷰 이상을 기록하였고 20분 이상의 체류 시간을 나타냈습니다. 이는 사이트를 방문한 이들이 실제로 팩트체크 페이지를 정독하였음을 의미합니다.


권력을 감시하는 일이 저널리스트들에게 좀 더 효율적인 작업이 되려면?


Mali의 지적대로 정보공개청구법을 강화하는 것입니다. “브라질에서 정보공개청구법의 통과 이후 큰 변화가 일어나고 있습니다. 유력 정치인들이 자발적으로 정보를 공개하는 데에 의존할 필요가 없어질 때에 모든 것이 더욱 효율적으로 향상될 것입니다.”

Jelena Vasić는 “언론인들이 위협과 협박을 받을 때 국제 협회의 역할이 큰 도움이 됩니다. 세르비아 정부는 국제적 압박을 매우 두려워하니까요.”

Amita Kelly는 정보공개청구법 등 법적 장치를 포함하여 투명성 제고를 위한 다양한 방면의 압박을 강조합니다. 언론인이 한 영역에서 장기적으로 전문성을 확보할 수 있도록 언론 기관들이 투자하는 것도 필요하다는 의견입니다.

보너스 : 프로젝트에 활용된 툴과 자료들


ABRAJI는 데이터를 효율적으로 수집하기 위해 크롤링/스크래핑 전문 기술을 보유한 기업인 parsehub.com과 협업했다고 합니다.

KRIK의 Jelena Vasić는 poslovna.rs 와 Facebook Graph 같은 기업정보 수집 사이트를 많이 활용했다습니다. Orbis 나 Lexis의 데이터베이스도 도움이 되었다고 합니다.

Amita Kelly는 Google Docs를 적극 활용하여 데이터 수집과 커뮤니케이션에 도움이 되었다고 합니다.


========================= 스파이더킴 (www.spiderkim.com) 웹크롤링, 웹스크래핑, 웹데이터 수집, 빅데이터에서 최고의 서비스를 제공합니다. 지금 바로 홈페이지를 방문하셔서, 문의 요청해 주십시오!



조회 9회

​고객센터

Tel: 02-596-8900  Fax : 02-6930-5709

10시 - 오후 7시(토, 일요일 및 공휴일은 휴무)

개인정보관리책임자 : 황재준   상호 : 유펜솔루션   대표자 : 김재훈   사업자등록번호 : 426-86-00939
주소 : (본사)대전광역시 유성구 엑스포로446번길 38, 3층 302호 / (지사 및 연구소)서울시 성동구 연무장 15길 11, B동 2층
​ⓒ 2019 UpennSolution Co., Ltd. All rights reserved.