當我們打開一個資訊APP刷新聞時,有沒有想過,系統是如何迅速推送給我們想看的內容?資訊APP背后有一個巨大的內容池,系統是如何判斷要不要將某條資訊推送給我們的呢?這就是今天想跟大家探討的問題——推薦系統中的“召回”策略。
推薦系統中的召回
召回策略主要滿足的是能夠從海量的數據中召回一部分相關的候選集,在實現方法上也有很多種,主要可以分為離線召回和在線召回。離線召回的方法主要有協同過濾、聚類算法。協同過濾可以分為基于用戶的協同過濾和基于物品的協同過濾。在線召回主要是基于搜索的方式,從該用戶的歷史記錄中利用不同的算法抽取相關信息,這里的相關信息可以是物品的基本信息,也可以是離線標注的標簽,然后將這些抽取到的關鍵信息從索引中快速的查詢出相關的結果集。
Elastic Search是基于Apache Lucene(TM)的一個開源搜索引擎,是一個分布式且具有高擴展性的全文檢索的搜索引擎,而且還提供了近乎實時的索引、分析、搜索功能。 Lucene是現今搜索領域被認為速度最快、性能最穩定、功能最全的搜索引擎庫,而Elastic Search是以Lucene為核心進行二次開發的搜索引擎,主要完成索引和搜索的功能,它可以通過簡單的接口隱藏Lucene的復雜性,從而讓整個搜索引擎變得更方便。
在基于內容推薦的算法中,關鍵詞的提取是至關重要的一環,關鍵詞提取直接影響了物品相似度計算的效果。假如沒有關鍵詞提取的話,物品全部信息作為特征維度會造成維度災難,使得維度巨大,且構造的矩陣會相當稀疏,不利于計算。在關鍵詞提取的過程中,TF-IDF算法是很有效率的一種算法。關于TF-IDF算法我們不再這里展開詳述。
Elastic Search與推薦系統的結合
Elastic Search的搭建過程可以參考官網。安裝配置完成Elastic Search之后,當數據進入Elastic Search并完成分詞和索引以后,現在只能夠根據指定輸入的詞語進行搜索,與推薦系統并沒有任何聯系。因此,我們可以根據用戶的歷史記錄進行TF-IDF構造關鍵詞并且輸入Elastic Search,采用倒排索引的方式進行存儲,以便全文搜索。
簡單來說,用戶的瀏覽、收藏等行為會被記錄在數據庫中,推薦系統會收集用戶的各種行為記錄,利用TF-IDF關鍵詞提取算法,實現一個概率模型,這個概率模型可以計算出近期用戶記錄中用戶偏好的關鍵詞,由于這些關鍵詞由用戶的記錄產生,因此就具有了個性化的特性,再將關鍵詞輸入到Elastic Search,就可以召回與用戶強相關的內容集合。
利用這種方法搭建的推薦系統,其優勢也很明顯:一是能夠對內容池中的所有物料做可計算的精細整合,實現對所有物料的召回,特別是對長尾物料的召回,從而極大地提高物料利用率;二是自帶物品冷啟動,在沒有大量用戶數據的情況下也能實現個性化推薦,并且讓用戶對推薦結果滿意。
獲取更多詳細資料,或申請產品試用,歡迎訪問第四范式智能推薦產品先薦官網!本賬號為第四范式智能推薦產品先薦的官方賬號。本賬號立足于計算機領域,特別是人工智能相關的前沿研究,旨在把更多與人工智能相關的知識分享給公眾,從專業的角度促進公眾對人工智能的理解;同時也希望為人工智能相關人員提供一個討論、交流、學習的開放平臺,從而早日讓每個人都享受到人工智能創造的價值。
審核編輯 黃昊宇
-
人工智能
+關注
關注
1796文章
47853瀏覽量
240698 -
推薦系統
+關注
關注
1文章
43瀏覽量
10098
發布評論請先 登錄
相關推薦
軟件定義汽車(SDV)開發有哪些挑戰?SDV開發策略分享:福特汽車采用Jama Connect提升開發效率與質量
![軟件定義汽車(SDV)開發有哪些挑戰?SDV開發<b class='flag-5'>策略</b>分享:福特汽車采用Jama Connect提升開發效率與質量](https://file1.elecfans.com/web2/M00/E7/A3/wKgZomZMQFaABPseAAAwD5kHnx4413.png)
三星宣布大規模汽車召回計劃
小米汽車召回部分SU7電動汽車
軟件定義汽車(SDV)開發有哪些挑戰?SDV開發策略分享:福特汽車采用Jama Connect提升開發效率與質量
光伏儲能發電運維系統及能量管理策略研究
![光伏儲能發電運維<b class='flag-5'>系統</b>及能量管理<b class='flag-5'>策略</b>研究](https://file1.elecfans.com//web3/M00/06/B7/wKgZPGePLSaAeJDqAAAcw6MJhUk991.png)
京東廣告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速實踐
電動汽車充電策略與電力系統影響研究
![電動汽車充電<b class='flag-5'>策略</b>與電力<b class='flag-5'>系統</b>影響研究](https://file1.elecfans.com/web3/M00/02/A6/wKgZO2dhHASAF6lgAABnct3KU8Y717.png)
EM儲能網關&amp;ZWS智慧儲能云應用(5) — 削峰填谷策略接入介紹(二)
![EM儲能網關&amp;ZWS智慧儲能云應用(5) — 削峰填谷<b class='flag-5'>策略</b>接入<b class='flag-5'>介紹</b>(二)](https://file.elecfans.com/web2/M00/50/DA/pYYBAGLH6TyAB71EAAAPQ7KgtYA038.png)
評論