Facebook에서 증오 발언 50% 가까이 줄어

Facebook은 플랫폼 상에서 증오 발언 확산을 저지하기 위해 모든 수단을 동원하고 있습니다.

저희의 기술은 증오 발언 확산을 줄이는 데 큰 영향력을 발휘합니다. 최근 발표된 커뮤니티 규정 집행 보고서(Community Standards Enforcement Report)에 따르면 증오 발언 확산은 조회 콘텐츠의 약 0.05%를 차지합니다. 이는 10,000 명당 조회 건수 5회 정도로, 지난 3분기 동안 50% 가까이 감소한 수치입니다.
Facebook은 여러가지 기술을 통해 증오 발언 확산을 줄이고 있습니다. 증오 발언을 사전에 탐지하여 감사 담당자에게 전달하고 규정을 위반한 경우에는 삭제 조치할 수 있도록 합니다. 이를 통해 규정 위반 가능성이 있는 콘텐츠의 배포를 감소시키기 위한 노력을 다하고 있습니다. 또한 이 모든 활동을 유기적으로 결합해 확산 방지까지 이어질 수 있도록 합니다.
2016년 Facebook의 콘텐츠 관리 (content moderation) 노력은 주로 사용자 신고에 의존했습니다. 이제는 사람들 신고가 있기 전 위반 콘텐츠를 미리 식별하는 기술을 구축했으며, 사전 탐지율이 이를 증명합니다. 여기에 그치지 않고, Facebook 앱에서 실제로 이루어지는 증오 발언 조회 횟수를 평가 기준으로 삼을 수 있도록 확산 수치를 보고하고 있습니다.

일각에서 유출 문건의 데이터를 바탕으로 Facebook이 사용하는 증오 발언 대응 기술에 의문을 제기하며, 저희가 의도적으로 수치를 왜곡한다는 비판의 목소리가 있지만, 이는 사실이 아닙니다. 저희는 Facebook 플랫폼에서 증오 발언이 퍼지는 것을 결코 원치 않으며, 플랫폼 이용자나 광고주를 위해서도 증오 발언 삭제 작업을 투명하게 진행하고 있습니다. 이 문건들이 증명하는 바와 같이 저희는 다년간 무결성(integrity)이라는 원칙을 고수해왔습니다. 물론 저희가 완벽해질 것이라고 말할 수 없지만, Facebook 내 수많은 팀들이 시스템을 개발하고 문제점을 파악하고, 솔루션을 구축하기 위해 지속적으로 최선을 다하고 있습니다.

최근에 증오 발언에 대처하는 Facebook의 방식이 근시안적이라는 지적이 나왔습니다. 하지만 이는 한 단면만을 보고 하는 이야기로, 실제로 Facebook에서는 증오 발언의 확산율이 0.05%, 즉 Facebook 사용자 10,000명당 조회건수 5회까지 떨어졌다는 중요한 사실을 간과하고 있습니다. 저희는 Facebook에서 실제로 얼마나 많은 증오 발언이 노출되었는지 보여주는 확산율을 가장 중요한 지표로 삼고 있습니다.

콘텐츠 삭제에만 몰두하는 것은 저희가 증오 발언에 맞서는 방식을 잘못 이해한 것입니다. 증오 발언을 삭제하기 위해 기술을 사용하는 것은 여러 대응 방식 중 하나일 뿐입니다. 삭제 조치는 증오 발언이라는 것이 확인이 되어야 실행됩니다. 삭제 기준을 충족하는지 확신할 수 없는 경우에도 그럴 가능성이 확인되면 저희는 기술을 활용해 해당 콘텐츠의 배포를 줄이고 있습니다. 또한, Facebook 정책을 위반할 가능성이 높은 콘텐츠를 정기적으로 게시하는 그룹, 페이지와 사람을 추천하지 않습니다. 나아가 추가 검토를 위해 콘텐츠에 플래그를 지정하는 기술도 활용하고 있습니다.

저희는 콘텐츠 자동 삭제 기준을 매우 엄격하게 관리하고 있는데, 그 이유는 증오 발언처럼 보이지만 실제로는 그렇지 않은 콘텐츠, 예를 들어 증오 발언 관련 경험에 대해 이야기하거나 이를 비판하는 사람들처럼 저희가 실제로 보호하려는 사람들에게 오히려 피해를 주는 실수를 줄이기 위해서입니다.

오해를 받고 있는 또 다른 저희 메트릭스로는 사전 탐지율(proactive detection rate)이 있습니다. 이는 저희 기술이 이용자가 신고하기 전 규정 위반 콘텐츠를 사전에 얼마나 잘 찾는지 알려줍니다. 또한, 사전 탐지율은 저희가 삭제하는 콘텐츠 가운데 직접 찾아낸 콘텐츠가 어느 정도인지 나타냅니다. 2016년까지 콘텐츠 삭제 조치 대부분이 사용자 신고를 기반으로 이루어진 것은 사실입니다. 하지만 저희는 기술을 더 발전시켜야 한다는 생각을 바탕으로 아무도 신고하지 않은 잠재적 규정 위반 콘텐츠를 식별하는 기술을 구축하기 시작했습니다.

Facebook이 증오 발언과 관련하여 메트릭스 결과를 보고하기 시작했을 당시, 삭제 콘텐츠 중 시스템이 탐지한 것은 23.6%에 불과했고 대부분은 이용자들이 찾은 것이었습니다. 현재는 시스템 탐지율이 97%를 넘습니다. 사전 탐지율은 저희가 무엇을 놓치고 있는지 알려주지 않으며 문제성 콘텐츠 배포를 줄이기 위해 어떤 노력을 하고 있는지 전부 보여주지도 않습니다. 이러한 이유로 저희는 확산율에 중점을 두고 가장 중요하게 여기는 메트릭스에 대해 일관성 있게 설명합니다. 확산율은 저희가 놓쳐서 사용자들이 접하게 되는 위반 콘텐츠를 알려주는 역할을 합니다. 이는 저희의 상황을 가장 객관적으로 평가하는 방법으로 저희가 하는 일에 대한 이해를 돕습니다. 저희는 분기마다 커뮤니티 규정 집행 보고서에서 확산에 대해 이야기하고, 투명성 센터(Transparency Center)를 통해서도 설명합니다.

확산율은 저희가 내부적으로 작업을 측정하는 방법이기 때문에 동일한 메트릭스를 외부에도 공유합니다. 이 분야 작업이 절대 끝나지 않을 것이라는 점을 알고 있지만 지난 3분기 동안 확산율이 거의 50% 감소했다는 사실은 저희 노력이 성과를 거두고 있다는 것을 의미합니다. 커뮤니티 규정 집행 보고서에 보고된 바와 같이 감소율 중 상당 부분은 개선되었으며, 이는 확장된 AI 시스템 덕분이라고 할 수 있습니다.

저희는 메트릭스를 개발하기 위해 국제 전문가들과 협력해왔습니다. 또한 자원해서 메트릭스에 대해 독립 감사를 받겠다고 한 유일한 회사입니다.

저희는 사람들의 이해를 돕기 위해 가장 포괄적인 분기별 보고서에서 여러 메트릭스 이야기를 다룹니다. 저희는 측정, 통계 및 기타 분야 국제 전문가들과 협력하여 독립적이고 공개적인 평가를 제공하며, 올바른 측정 방식을 추구합니다. 전문가들은 저희의 접근 방식에 대체로 동의하는 한편, 더욱 나은 방향으로 나아갈 수 있는 권장 사항도 제안했습니다. 전체 보고서는 이 링크에서 볼 수 있습니다. 또한 저희는 메트릭스를 정확하게 측정하고 보고하고 있는지 확인하기 위해 글로벌 감사 회사인 EY로부터 독립 감사를 받겠다는 약속을 이행할 것입니다.

관련 뉴스