유튜브 추천 알고리즘 논문을 번역한 페이지입니다.
요약
유튜브는 현존하는 추천 시스템 중에서 매우 큰 스케일과 정교한 추천 시스템을 가지고 있다. 이 논문에서는 그 추천 시스템에 대해서 추상적으로 설명하고, 딥러닝을 통해서 비약적인 성능 발전 부분에 대해서 이야기하고자 한다. 이 논문에서는 후보 생성 모델과 심층 랭킹 모델, 두 단계로 나누어서 설명할 것이다. 그리고 대규모 사용자 추천 시스템을 설계, 반복 및 유지, 관리하는데 도움이 되는 실질적인 교훈과 인사이트를 제공할 것이다.
키워드
추천시스템, 딥러닝, 확장성
서론
유튜브는 비디오 컨텐츠를 생성, 공유, 검색하는 세계 최대의 플랫폼이다. 유튜브 추천 시스템은 끊임없이 성장하는 영상 컨텐츠들을 백만명이 넘는 유저들에게 개인화된 컨텐츠를 제공해야 한다. 이 논문에서는 유튜브 영상 추천 시스템에서 거대한 영향을 미친 딥러닝에 대해서 초점을 맞출 것이다. 그림 1 에서는 유튜브 모바일 앱 홈 화면의 추천에 대해서 보여준다.
그림 1
유튜브 영상 추천은 3가지 주요 관점에서 쉽지 않다.
•
Sclae: 기존의 많은 추천 알고리즘들은 작은 문제들을 해결하기에는 적합했지만 유튜브의 스케일에는 적합하지 않았다. 유튜브의 거대한 유저, 영상 규모에는 분산에 특화된 학습 알고리즘과 효율적인 전달 시스템이 필수였다.
•
Freshness: 유튜브는 1초에도 수많은 비디오가 올라올 정도로 빠르게 규모가 불어나고 있다. 추천 시스템은 새로 업데이트된 컨텐츠와 유저들의 최근 액션에 대해서도 방영해야했다. 새로운 컨텐츠와 기존 영상들 사이의 밸런싱이 필요했다.
•
Noise: 유튜브의 유저의 활동 기록은 본질적으로 희소성과 다양한 추적 불가능한 외부 요인으로 인해서 예측하기가 어렵다. 우리는 드물게 유저의 만족도에 대한 절대적인 피드백을 얻을 뿐이다. 심지어 컨텐츠에 대한 메타데이터는 잘 정의 되지 않는다면 구조를 잡기 어렵다. 우리의 알고리즘은 이러한 데이터 특징들을 고려해서 설계가 되어야 한다.
•