TikTok的slogan是“Make Your Day”,目標(biāo)是給成千上萬的人推送他們喜歡的視頻。商業(yè)價(jià)值核心就是能夠讓用戶更沉迷的推薦系統(tǒng)讓更多的人每天能夠花更多一點(diǎn)時(shí)間在TikTok上。
推薦系統(tǒng)讓人更沉迷需要明確的知道人喜歡什么,哪些視頻這個(gè)人會(huì)喜歡,也就是這兩步:
- 猜準(zhǔn)喜好。
- 定義視頻。
接下來我們就從這兩步簡單講講TikTok推薦系統(tǒng)的原理。
猜準(zhǔn)喜好
從目前的數(shù)據(jù)和字節(jié)跳動(dòng)的歷史產(chǎn)品看來,TikTok已經(jīng)完全掌握了這點(diǎn)。猜準(zhǔn)觀眾喜好前提是從這四方面構(gòu)建觀眾畫像:
- 基礎(chǔ)信息:設(shè)備、系統(tǒng)設(shè)置、位置、日期和時(shí)間。通過基礎(chǔ)信息,可以給用戶推薦同類設(shè)備、位置或者節(jié)日時(shí)間點(diǎn)相似用戶喜歡的內(nèi)容。
- 交互信息:與不同定義的視頻的交互信息比如關(guān)注、點(diǎn)贊、評論、觀看時(shí)長。與不同標(biāo)簽的視頻交互后,觀看的視頻反向標(biāo)記了觀眾。
- 社交信息:通訊錄、社交網(wǎng)絡(luò)好友關(guān)系。
- 其他合作App內(nèi)部的數(shù)據(jù)(假的):有些公司為了構(gòu)建完整的用戶畫像來達(dá)到商業(yè)目的,會(huì)組成聯(lián)盟共享App間的用戶隱私數(shù)據(jù)。你有一部小電影,我有一部小電影,我們交換后都有兩部小電影。差不多就這個(gè)意思。共享經(jīng)濟(jì)的巔峰不過如此。
有所有這四方面的數(shù)據(jù)后,觀眾畫像就可以構(gòu)建完成,然后根據(jù)觀眾的交互行為完善用戶標(biāo)簽。這一步是在一個(gè)很大范圍內(nèi)完成的,比如10萬個(gè)相同標(biāo)簽的觀眾都喜歡一個(gè)標(biāo)簽下視頻,那有同樣標(biāo)簽的新觀眾就會(huì)喜歡這類視頻。這是一個(gè)不斷被訓(xùn)練、進(jìn)化的流程。
這個(gè)流程的目標(biāo)是占用觀眾的時(shí)間更多一點(diǎn)。終極目標(biāo)是占用每個(gè)觀眾每天的一切空閑時(shí)間。
定義視頻
定義視頻就是指通過視頻本身的數(shù)據(jù)以及觀眾的交互歷史給視頻打上標(biāo)簽,構(gòu)建視頻畫像。
- 視頻內(nèi)容:描述、標(biāo)簽、音樂、語言、圖案等。
- 觀眾交互信息:評論、點(diǎn)贊、觀看時(shí)長。
- 交互過的觀眾的畫像。
通過以上3個(gè)維度可以構(gòu)建視頻的畫像,隨著觀眾與視頻的交互,視頻畫像會(huì)越來越精確。
匹配
觀眾和視頻會(huì)通過某種邏輯進(jìn)行匹配,比如最簡單的有相同標(biāo)簽的觀眾和視頻互相匹配;被同樣喜好觀眾喜歡的視頻的關(guān)聯(lián)匹配等。隨著不斷的匹配及進(jìn)一步交互。觀眾、視頻的畫像,匹配的邏輯都會(huì)越來越準(zhǔn)確,衡量標(biāo)準(zhǔn)就是觀眾每天的停留時(shí)長。
最終沉淀下來的就是這套經(jīng)過全球幾十億人訓(xùn)練出來的推薦算法(匹配算法)。這也是產(chǎn)品的核心資產(chǎn)。單純的算法并沒有什么價(jià)值,經(jīng)過幾十億人的訓(xùn)練升級出來的算法價(jià)值巨大。