APP下载

大数据转化为多种算法成就Netflix精准影片推荐系统

消息来源:baojiabao.com 作者: 发布时间:2024-05-13

报价宝综合消息大数据转化为多种算法成就Netflix精准影片推荐系统

Netflix 的成功不可不归功于它们的影片推荐系统,不管使用者透过电脑、游戏机、智慧电视、电视盒、行动装置等各种装置登入 Netflix,都会进入同一个首页,依分类有约 40 列(Row)的(依照各装置屏幕大小略有不同),每列约 75 则推荐影片,在这个首页里要呈现哪些推荐影片给使用者、该如何分类、显示的前后顺序等,都是Netflix 透过收集大量使用者使用数据进行分析后,以至少六种算法后优化出的个人化结果,每个不同的使用者看到的首页都截然不同。

个人化影片评比制度

在 Netflix 影片推荐系统里的算法,首先先介绍“个人化影片评比”(Personalized Video Ranker, PVR),这个算法顾名思义是以巨量数据分析后的个人观影喜好为依据,计算出使用者喜欢哪种类型的的影片,以及这类型影片的出现次序,例如,数据显示这位使用者喜欢观赏恐怖片,Netflix 就会列出一列专门的恐怖片,并再依照使用者的喜好,把影片库中的恐怖片再进行排序,因此,即便是两位同样是恐怖片爱好者,其呈现推荐影片的先后次序也会不一样。Netflix 也利用个人化影片评比算法,去计算在各种受欢迎的影片中,哪一些是使用者会喜欢的,这些结合“受欢迎”与“符合个人喜好”的影片也就可以自成一个推荐影片列。

第二个主要影片推荐系统算法是“最佳推荐评比”(Top-N Video Ranker),这个评比算法着重计算影片库中所有的影片,并且透过使用者的喜好数据,找出使用者最喜欢的哪几部片,而不像个人影片评比算法一样,会先计算出使用者喜欢的影片类型,再从中排出次序。

针对短时间的收看趋势,Netflix 也会运用“最新趋势评比”(Tredning Now)算法,掌握使用者可能会想要看哪些影片,这种算法主要的依据像是每年都会有的节庆,例如情人节,或者现在刚好发生了某些灾祸,现在是镁光灯焦点的特定事件等,再将这些资料与使用者的喜好数据结合,就能够推荐使用者目前的趋势影片。

继续收看是推荐与否的关键

而最能够具体展现使用者收集的巨量数据影响力的算法,就是“继续收看评比”(Continue Watching)算法了,只有这个算法是特别针对已经看过的影片,在已经看过但却没有看完的影片中,尝试找出哪些使用者还会想要继续欣赏的影片。在这个算法中,有一些使用者的数据会被分析,包括这部影片的观看时间,在哪个时间点离开观赏(影片中间、一开始或结尾前),中断观赏后是不是还看了其它影片,以及用哪些装置观赏。

“影片相似度评比”(Video-Video Similarity)算法,这是针对使用者曾经看过的影片中,依照每一部影片都挑选出相似的影片来推荐,在评比影片的相似程度时,算法完全不会加入任何使用者喜好,完全是影片与影片之间来做评比。但评比完后,要将哪几列使用者曾经看过影片的相似影片,推荐给使用者,就会加上使用者喜好,例如使用者如果曾经看过“不可能的任务1”以及“黑洞频率”这两部片,算法就会评比出两列影片,分别代表与“不可能的任务1”相似的影片,以及与“黑洞频率”相似的影片,但是最后要出现哪一列影片给使用者,就会依照使用者的喜好去做判断。

相关又具多样性的推荐系统

最后一个算法是“页面产生评比”(Page Generation: Row Selection and Ranking),这个算法是用来决定,到底有哪些影片列可以出现在使用者的首页上。在透过上述提及的算法得出,究竟有哪些候选影片列使用者可能会想观赏后,Netflix 会再透过“页面产生评比”,排出一个与使用者相关且兼具多样性的影片推荐首页。

一般来说,以上这些算法都采用不同的数学与资料模式,以及输入不同的数据资料,并且依照每一种算法的目的,施以不同的模式训练。有 75%的使用者都是依照 Netflix 的推荐来选择电影,而 Netflix 目前也仍然就算法得出的结果,持续对少量使用者进行 A/B 测试(A/B Test),加强算法的准确度并且测试所有的极端可能性,这所有的目的都是为了能够彻底的黏住所有的 Netflix 使用者。

不只推荐影片 巨量数据更能预测使用者想看的影片

巨量数据除了用来做精准的影片推荐以外,而 Netflix 首部依照巨量数据打造而来的影片就是Netflix 近几年的最热门的自制影集:纸牌屋。

在开始制作纸牌屋之前,Netflix 已经透过数据分析,了解了三件 Netflix 的使用者喜好:第一,很多 Netflix 上的使用者喜欢导演 David Fincher 的电影:社群网战;第二,英国原版的纸牌屋很受欢迎;第三,喜欢英版纸牌屋的 Netflix 使用者,也喜欢 Kevin Spacey 的电影,或/和导演 David Fincher 的作品,因此按照这三项原则打造的纸牌屋,就几乎没有失败的可能。不只是制作面,在宣传时,Netflix 也剪了 10 部不同的预告,分别推荐给 10 种不同的使用者,喜欢 Kevin Spacey 的使用者可以看到多一点 Kevin Spacey 画面的预告片,喜欢 David Fincher 作品的使用者,就可以看到贯穿他执导风格的预告片。

除了预测影集的制作,因为 Netflix 的月租费向来并不会太过昂贵,所以 Netflix 并不会在电影下档后,购入每一部电影的版权,而是透过巨量数据分析预测,购入成本效益最高的电影,确保花出去的每一块钱都能有最高的收益。

从影片推荐系统到打造影片,甚至购买版权,Netflix 已经完美的将巨量数据分析活用到它服务运作的每一个角落。

2018-05-17 03:33:00

相关文章