블로터의 매거진

유튜브, “2017년 4분기 820만개 부적절 동영상 삭제”

블로터

2018.04.26 17:58
  • 1687
  • 콘텐츠에 ‘좋아’해줘서 고마워요 -
    0
  • 0

 


 

튜브가 부적절한 동영상을 분류하는 커뮤니티 가이드라인 시행 보고서를 처음으로 공개했다. 유튜브는 4월23일(현지시간) 공식 블로그를 통해 지난 12월 이후 강화한 커뮤니티 가이드라인 정책에 따라 2017년 10월부터 12월까지의 콘텐츠 관리 결과를 보고서 형식으로 발표했다.


유튜브는 지난해 4분기에 약 820만개의 동영상을 가이드라인에 따라 삭제했다. 이는 대부분 스팸이거나 성인용 콘텐츠로 유튜브가 유해성 콘텐츠로 지정한 분류에 해당됐다. 유튜브는 지난 분기 대비 얼마나 조정된 수치인지, 분기당 전체 업로드 동영상 숫자 대비 몇 퍼센트가 업로드됐는지는 공개하지 않았다. 다만 분기당 발생한 전체 조회수 중 1% 가량에 대한 조치라고 밝혔다.

 

 


 

유튜브는 이번 보고서를 통해 알고리즘에 의한 신속하고 자동화된 콘텐츠 관리를 강조했다. 유튜브는 삭제된 영상 중 670만개가 인간이 아닌 컴퓨터 알고리즘에 의해 자동 감지됐다고 밝혔다. 자동 감지된 콘텐츠의 76%는 조회수가 1이상 발생하기 이전에 삭제됐다. 보고서는 극단주의 콘텐츠의 삭제 전 조회수를 예로 들었다. 2017년 1분기에는 이러한 콘텐츠의 단 8%만이 조회수가 10회 미만이었을 때 삭제됐으나, 2018년 1분기에는 절반 이상이 삭제됐다.  


 


 

유튜브의 커뮤니티 가이드라인 시스템에서 인간은 여전히 중요한 역할을 했다. 유튜브는 현재 24시간 동안 신고된 콘텐츠를 검증하는 팀을 운영하고 있으며, 개인·NGO·정부 기관이 참여한 별도의 신고자 시스템을 운영 중이다. 유튜브는 해당 분기 동안 이용자로부터 총 3천만건의 신고를 받았다. 신고는 모두 930만개 콘텐츠를 대상으로 했다. 이 중에서 총 150만건의 콘텐츠가 삭제됐다. 

 

삭제된 동영상  3/4 가량이 조회수가 1 이상 발생하기 전 자동 신고 시스템에 의해 발견됐다.


이용자가 직접 신고한 콘텐츠의 신고 사유


유튜브는 또한 자동화된 콘텐츠 검증을 위해 사람의 재검토 과정이 기술 발전의 중요한 역할을 했다고 밝혔다. 문제가 되는 콘텐츠를 알고리즘이 자동감지하면 해당 콘텐츠를 사람이 직접 검토하고 실제로 유튜브의 정책을 위반하는지를 판단했다. 이런 재검토 과정은 또 하나의 데이터로 입력돼 컴퓨터 알고리즘이 기계학습할 수 있는 재료가 됐다. 

이에 대해 유튜브는 극단주의 콘텐츠를 예를 들었다. 유튜브는 200만개의 극단주의 콘텐츠를 사람이 수작업으로 검토한 결과를 기계학습 데이터로 활용했다. 이를 기반으로 유튜브 자동감지 시스템은 지난해 동안 극단주의 콘텐츠 약 70%를 업로드 8시간 이내에 삭제했으며, 그중 절반은 2시간 만에 삭제할 수 있었다고 밝혔다. 유튜브는 현재 기계학습 알고리즘으로 98%의 극단주의 콘텐츠를 삭제했다고 밝혔다.

유튜브는 지난 12월 정책 위반을 컴퓨터에게 학습시킬 직원을 2018년 1만명까지 늘리겠다고 밝힌 바 있다. 유튜브는 목표한 만큼의 역할 충원을 대부분 마무리했다고 밝혔다. 고용된 직원은 극단주의, 테러리즘, 인권 관련 전문 지식을 갖춘 상근 전문가이며, 지역 전문가팀 또한 고용했다고 밝혔다.

 

 




ㅣ블로터 권도연 
  • #동영상
  • #블로터