在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

系統機器學習算法總結知識分享

zhKF_jqr_AI ? 來源:未知 ? 作者:steve ? 2017-12-15 14:11 ? 次閱讀

Statsbot數據科學家Daniil Korbut簡明扼要地介紹了用于推薦系統的主流機器學習算法:協同過濾、矩陣分解、聚類、深度學習。

現在有許多公司使用大數據來制定高度相關的建議以提高收入。數據科學家需要根據業務的限制和需求,在各種推薦算法中選擇最好的算法。

為了簡化這一任務,Statsbot團隊準備了一份現有主要推薦系統算法的概覽。

協同過濾

協同過濾(collaborative filtering, CF)及其改版是最常用的推薦算法之一。 即使是數據科學初學者也可以使用它來構建他們的個人電影推薦系統,比如用它寫一個簡歷項目。

當我們想向用戶推薦東西時,最符合邏輯的做法是找到有相似興趣的人,分析他們的行為,然后給我們的用戶推薦相同的東西。 或者我們可以查看與用戶之前所購類似的物品,并進行相應的推薦。

這正是CF的兩種基本方法:基于用戶的協作過濾和基于物品的協作過濾。

在這兩種情形下,推薦引擎分兩步:

  1. 找出數據庫中有多少用戶/物品與給定的用戶/物品類似。

  2. 評估其他用戶/物品,這一評估基于比待評估用戶/物品更相似的用戶/物品的總權重,以預測給用戶推薦相應產品的評分。

算法中的“最相似”是什么意思?

假設我們有一個表示每個用戶的偏好的向量(矩陣 R的行)和一個表示用戶給每件產品評分的向量(矩陣 R的列)。

首先,讓我們去除一些元素,只保留兩個向量中值均已知的元素。

例如,如果我們想比較比爾和簡,我們可以看到,比爾還沒有看過《泰坦尼克號》,而簡到現在為止還沒看過《蝙蝠俠》,所以我們只能通過《星球大戰》來衡量他們的相似性。怎么會有人不看《星球大戰》,是吧?:)

最流行的衡量相似性的技術是用戶/物品向量之間的余弦相似性或加權平均數。

矩陣分解

下一個有趣的算法是矩陣分解。這是一個非常優雅的推薦算法,因為使用矩陣分解時通常不用考慮要在結果矩陣的列和行中保留的物品。

u是第i個用戶的興趣向量,v是表示第j部電影的參數的向量。因此,我們可以使用u和v的點積來逼近x(第i個用戶對第j部電影的評分)。我們使用已知評分來構建這些向量,并使用它們來預測未知評分。

例如,我們有表示用戶特德的向量(1.4; .9)和表示電影A的向量(1.4; .8),矩陣分解之后我們可以直接通過計算(1.4; .9)和(1.4; .8)的點積來還原電影A——特德的評分,結果為2.68。

聚類

前面兩個推薦算法非常簡單,比較適合小型系統。到目前為止,我們將推薦問題看作一個監督學習任務?,F在到了應用無監督方法來解決這個問題的時候了。

想象一下,我們正在建立一個大型推薦系統,協同過濾和矩陣分解會花很長時間。這時第一個想到的應該是聚類(clustering)。

根據屬于同一聚類的所有客戶的偏好,每個聚類會被分配一個典型偏好。每個聚類中的客戶將收到在聚類層次計算出的推薦。

業務初期缺乏用戶評分,因此聚類會是最佳選擇。

不過,單獨使用的話,聚類有點弱。因為通過聚類,我們識別出用戶群組,然后給同一群組中的每個用戶都推薦相同的物品。當我們有足夠多的數據的時候,更好的選擇是將聚類作為第一步,用來調整相關用戶/物品選取,以供協同過濾算法使用。聚類也能提升復雜推薦系統的性能。

深度學習

十年來,神經網絡有一個巨大的飛躍。今天,神經網絡被應用到許多領域,正逐漸取代傳統的機器學習方法。我想談一下YouTube使用的深度學習方法。

毫無疑問,為這樣的服務打造推薦系統是一項非常具有挑戰性的任務,因為這一服務的規模很大,語料庫是動態的,還有各種難以觀察的外部因素。

根據《YouTube推薦系統的深度神經網絡》,YouTube推薦系統算法包括兩個神經網絡:一個用于生成候選視頻,另一個用于排名。如果你沒有足夠的時間閱讀上面的論文,我這里有一個快速總結。

接受用戶的歷史事件作為輸入,候選生成網絡顯著減少了視頻的數量,從一個巨大的語料庫抽取出一組相關性最高的視頻。生成的候選視頻是最和用戶相關的,我們即將預測用戶給候選視頻的評分。這個網絡的目標只是通過協同過濾來提供一些范圍較廣的個性化候選視頻。

接下來我們需要更仔細地分析這些候選視頻,以挑選出其中最好的視頻。我們通過評分網絡完成這一任務,評分網絡可以通過一個期望目標函數給每個視頻賦值一個分數,該期望目標函數使用描述視頻的數據和有關用戶行為的信息。評分最高的那些視頻將被推薦給用戶。

使用這一兩步方法,我們可以基于一個非常巨大的視頻語料庫推薦視頻,同時保證推薦的少量視頻是個性化的。這一設計也允許我們混合從其他來源生成的候選視頻。

這一推薦任務構成了一個極端多類分類(extreme multiclass classification)問題,基于用戶(U)和情境(C)精確地分類在給定時刻t觀看(wt)的特定視頻,這一視頻取自一個語料庫(V),總共有數百萬的視頻類別(i)。

構建你自己的推薦系統

  • 基于大型數據庫的在線推薦,最好的辦法是將這個問題拆分成兩個子問題:1)選擇排名最高的N個候選 2)對它們進行評分。

  • 如何評估模型質量?除了標準的質量指標之外,還有一些特別針對推薦問題的指標:Recall at K和Precision at K,Average Recall at K和Average Precision at K。另外可以參考《A Survey of Accuracy Evaluation Metrics of Recommendation Task》(JMLR 10 (2009))

  • 如果使用分類算法解決推薦問題,則應考慮生成負樣本。如果用戶購買了推薦的物品,不應將其作為正樣本,也不應將未購買的推薦物品作為負樣本。

  • 基于在線分數和離線分數考量算法質量。 僅使用歷史數據的訓練模型可能導向簡陋的推薦系統,因為該算法不知道新的潮流和偏好。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 聚類
    +關注

    關注

    0

    文章

    146

    瀏覽量

    14243
  • 協同過濾
    +關注

    關注

    0

    文章

    45

    瀏覽量

    9798
  • 矩陣分解
    +關注

    關注

    1

    文章

    13

    瀏覽量

    3686

原文標題:推薦系統機器學習算法概覽

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《具身智能機器系統》第10-13章閱讀心得之具身智能機器人計算挑戰

    是全書最“硬核”的部分,涉及不少機器人的硬件、系統、算法等方面的知識,對于我這個非相關專業的人士,閱讀起來還是有些吃力,不過好在這本書也不是講解特別深入,還是偏向于綜述性質的概況
    發表于 01-04 01:15

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學習 AI,機器學習算法

    前言 由于本人最近在學習一些機器算法,AI 算法知識,需要搭建一個學習環境,所以就在最近購買的
    的頭像 發表于 01-02 13:43 ?159次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學習</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法
    的頭像 發表于 12-30 09:16 ?418次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    【「具身智能機器系統」閱讀體驗】1.全書概覽與第一章學習

    了解具身智能機器人相關的知識,我感到十分榮幸和幸運。 全書簡介 本書以循序漸進的方式展開,通過對具身智能機器人技術的全方位解析,幫助讀者系統化地
    發表于 12-27 14:50

    《具身智能機器系統》第7-9章閱讀心得之具身智能機器人與大模型

    醫療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優化手術路徑規劃。工業場景中,協作機器人面臨的主要挑戰是快速適應新工藝流程。具身智能通過在線
    發表于 12-24 15:03

    【「具身智能機器系統」閱讀體驗】+初品的體驗

    學習資源,以培養更多的專業人才。隨著具身智能機器人技術對社會的影響越來越大,該書還可以向公眾普及相關的知識,以提升社會對新技術的認知和接受度,從而為技術的發展創造良好的社會環境。 隨著具身智能
    發表于 12-20 19:17

    《具身智能機器系統》第1-6章閱讀心得之具身智能機器系統背景知識與基礎模塊

    與環境持續互動來優化決策策略。書中還進一步討論了強化學習的基本原理,包括狀態空間、動作空間、獎勵函數的設計,以及策略網絡的訓練方法。 具身智能機器系統是一個多學科知識交叉的復雜工程體
    發表于 12-19 22:26

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度
    的頭像 發表于 11-15 09:19 ?632次閱讀

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎理論出發,逐步深入到機器學習算法在時間序列預測中的應用,內容全面,循序漸進。每一章都經過精心設計,對理論知識進行了詳細的闡述,對實際案例進行了生動的展示,使讀
    發表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了
    發表于 08-12 11:21

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?1404次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習
    的頭像 發表于 06-27 08:27 ?1734次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典<b class='flag-5'>算法</b>與應用

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    和專業知識,對這一領域進行系統的梳理和總結。然而,將時間序列分析與機器學習技術相結合的書籍卻并不多見。 以上正是《時間序列與
    發表于 06-25 15:00

    基于FPGA的常見的圖像算法模塊總結

    意在給大家補充一下基于FPGA的圖像算法基礎,于是講解了一下常見的圖像算法模塊,經過個人的總結,將知識點分布如下所示。
    的頭像 發表于 04-28 11:45 ?670次閱讀
    基于FPGA的常見的圖像<b class='flag-5'>算法</b>模塊<b class='flag-5'>總結</b>

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是一類基于樣本數據和模型訓練來進行預測和判斷的
    的頭像 發表于 04-04 08:41 ?399次閱讀
    主站蜘蛛池模板: 精品福利在线观看 | 亚洲香蕉国产高清在线播放 | 午夜激情影视 | 亚洲一二三区在线观看 | 一区二区三区精品视频 | 五月天六月丁香 | 欧美视频一区二区三区在线观看 | 性欧美高清视频 | 5g影院欧美成人免费 | 爱操综合网| 四虎影视在线播放 | 久久久久国产 | 国产乱码免费卡1卡二卡3卡四 | 日韩亚洲人成在线综合 | 日韩一级片在线播放 | 欧美三级视频网站 | 亚洲人xx视频 | 日本aaaaa毛片动漫 | 狠久久| 宅男午夜 | 扒开双腿爽爽爽视频www | 男人边吃奶边做视频免费网站 | 在线观看黄色x视频 | 97玖玖 | 日本精品卡一卡2卡3卡四卡三卡 | 日韩毛片免费线上观看 | 狠狠色狠狠色综合日日小蛇 | 午夜狠狠操 | 性欧美巨大 | 美女操出水 | abc欧美成人影院 | 激情伦成人综合小说 | 欧美大黄 | sese国产| 亚洲成av人影片在线观看 | 综合五月天堂 | 夜夜摸夜夜操 | 国产va免费精品高清在线 | 快色视频免费 | 免费观看欧美一级高清 | 男女交性视频免费视频 |