在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大神教你怎么用Python抓取婚戀網用戶數據,用決策樹生成自己擇偶觀

悟空智能科技 ? 來源:未知 ? 作者:李倩 ? 2018-05-28 10:53 ? 次閱讀

最近在看《機器學習實戰(zhàn)》的時候萌生了一個想法,自己去網上爬一些數據按照書上的方法處理一下,不僅可以加深自己對書本的理解,順便還可以在github拉拉人氣。剛好在看決策樹這一章,書里面的理論和例子讓我覺得這個理論和選擇對象簡直不能再貼切,看完長相看學歷,看完學歷看收入。如果可以從婚戀網站上爬取女性的數據信息,手動給她們打標簽,并根據這些數據構建決策樹,不就可以找出自己的擇偶模式了嗎!github項目:huatian-funny,下面就詳細的闡釋一下。

數據爬取

之前在世紀佳緣上爬取過類似的數據,總體的感覺是上面的用戶數據要么基本不填要么一看就很假,周圍的一些老司機建議可以在花田網上看下,數據質量確實高很多,唯一的缺點就是上面的數據不給爬,搜索用戶的API需要登錄,而且只顯示三十多個用戶的信息。剛好我需要的數據也很少,就把搜索條件劃分的很細,每次取到的數據很小,但最終匯集的數量還是相當可觀的,最終獲取了位置在上海年齡22-27共計2000個左右的用戶數據。填寫好spider.py中的用戶名和密碼,直接運行這個文件就可以爬取數據,因為數據量不大,很快就可以運行完畢,存儲在mongodb中的數據如下:

爬蟲用到的工具是requests,流程上也很簡單,先發(fā)送登陸請求獲取cookie,然后調用搜索API獲取數據,拿到的數據是json格式,不需要任何轉換直接存儲mongodb,非常的方便,唯一想吐槽的就是花田搜索API接口竟然用的是POST方式,太沒有專業(yè)水準了。稍微提一下如何用request獲取cookie,用Session構建一個session對象,用這個對象發(fā)送登陸請求后,之后的請求都會自動帶上登陸返回的cookie,使用起來非常的簡單。

給用戶打標簽

由于決策樹屬于監(jiān)督學習,需要一個給定的標簽,因此需要自己根據用戶的外貌、年齡、學歷等多個維度的判斷給出一個標簽,最后生成的決策樹在一定程度上就可以反映自己的擇偶標準。針對女性的標簽很簡單粗暴,只有滿意和不滿意兩種,有興趣的同學可以按照真實的情況設置更多的標簽,例如優(yōu)秀、一般、備胎、不合格等等。因為外貌是選擇對象過程中一個必不可少的要素,把相貌量化至關重要,因為沒有相關的工具根據頭像進行評分,只能個人主觀進行量化,采用了當下非常流行的十分制。

為了增加打標簽的效率,專門寫了一個桌面窗口,運行mark.py即可,運行結果如下。(tkinter是一個坑,調代碼的時間夠我把整個數據集看好幾遍了,不過真的用起來的時候還是挺有意思的)

備注:因為剛開始看的很多用戶只有頭像、年齡、身高、工資、學歷這五個信息,所以整個過程中只參考了這五個維度進行評價,下面的決策樹也是根據這五個維度進行處理。

訓練數據

決策樹

機器學習中,決策樹是一個預測模型,它代表的是對象屬性與對象值之間的一種映射關系。樹中每個節(jié)點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結點則對應從根節(jié)點到該葉節(jié)點所經歷的路徑所表示的對象的值。決策樹僅有單一輸出,若欲有復數輸出,可以建立獨立的決策樹以處理不同輸出。從數據產生決策樹的機器學習技術叫做決策樹學習, 通俗點說就是決策樹,說白了,這是一種依托于分類、訓練上的預測樹,根據已知預測、歸類未來。

理論方面我可以參考《機器學習實戰(zhàn)》第三章或者這篇博客,很淺顯易懂的解釋了具體的原理,我就不贅述了。

結果展示

代碼參考的是《機器學習實戰(zhàn)》,針對現實自己做了一些優(yōu)化調整,和原來的代碼不是完全相同,運行train.py就可以顯示出結果,如下:

因為線很擠,調了很久只能拿到這個效果了。到這兒已經很清晰明了的闡明了主題,我就是一個外貌黨,顏值高的pass,顏值低的忽略,不高不低的考慮的相當糾結。有興趣的同學可以自己試一試。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8476

    瀏覽量

    133758
  • python
    +關注

    關注

    56

    文章

    4821

    瀏覽量

    85705

原文標題:Python抓取婚戀網用戶數據,用決策樹生成自己擇偶觀

文章出處:【微信號:WUKOOAI,微信公眾號:悟空智能科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    關于決策樹,這些知識點不可錯過

    用戶甲具備償還貸款能力。這整個判斷還貸能力的過程,就用到了決策樹的思想。02 決策樹算法——基尼不純度、熵基尼不純度,是指將來自集合中的某種結果隨機應用在集合中,某一數據項的預期誤差率
    發(fā)表于 05-23 09:38

    分類與回歸方法之決策樹

    統計學習方法決策樹
    發(fā)表于 11-05 13:40

    機器學習的決策樹介紹

    機器學習——決策樹算法分析
    發(fā)表于 04-02 11:48

    ML之決策樹與隨機森林

    ML--決策樹與隨機森林
    發(fā)表于 07-08 12:31

    怎樣使用UNICO生成具有多個決策樹的UCF文件呢

    使用 UNICO(v9.10.0.0),生成具有多個決策樹的 UCF 文件的過程似乎是:1.加載所有決策樹的所有測試數據,像對單個一樣標記
    發(fā)表于 12-26 06:30

    決策樹生成資料

    量、峰峰值、過零(正和負)、原始和過濾后的傳感器數據峰值檢測(正和負)。如果在所選的特征中觀察到不同的模式,則可以使用決策樹進行分類??紤]圖 1 中所示的加速度數據示例。
    發(fā)表于 09-08 06:50

    決策樹的介紹

    關于決策樹的介紹,是一些很基礎的介紹,不過是英文介紹。
    發(fā)表于 09-18 14:55 ?0次下載

    決策樹的構建設計并用Graphviz實現決策樹的可視化

    種涉及到的算法進行總結并附上自己相關的實現代碼。所有算法代碼以及用于相應模型的訓練的數據都會放到GitHub上。 本文中我將一步步通過MLiA的隱形眼鏡處方數集構建決策樹并使用Graphviz將
    發(fā)表于 11-15 13:10 ?1.5w次閱讀
    <b class='flag-5'>決策樹</b>的構建設計并用Graphviz實現<b class='flag-5'>決策樹</b>的可視化

    機器學習:決策樹--python

    今天,我們介紹機器學習里比較常用的一種分類算法,決策樹。決策樹是對人類認知識別的一種模擬,給你一堆看似雜亂無章的數據,如何用盡可能少的特征,對這些數據進行有效的分類。
    發(fā)表于 11-16 01:50 ?1693次閱讀

    機器學習之決策樹生成詳解

    根據給定的數據集創(chuàng)建一個決策樹就是機器學習的課程,創(chuàng)建一個決策樹可能會花費較多的時間,但是使用一個決策樹卻非常快。創(chuàng)建決策樹時最關鍵的問題就
    發(fā)表于 08-27 14:38 ?1.9w次閱讀
    機器學習之<b class='flag-5'>決策樹</b><b class='flag-5'>生成</b>詳解

    決策樹的原理和決策樹構建的準備工作,機器學習決策樹的原理

    希望通過所給的訓練數據學習一個貸款申請的決策樹,用于對未來的貸款申請進行分類,即當新的客戶提出貸款申請時,根據申請人的特征利用決策樹決定是否批準貸款申請。
    的頭像 發(fā)表于 10-08 14:26 ?6281次閱讀

    決策樹的基本概念/學習步驟/算法/優(yōu)缺點

    本文將介紹決策樹的基本概念、決策樹學習的3個步驟、3種典型的決策樹算法、決策樹的10個優(yōu)缺點。
    發(fā)表于 01-27 10:03 ?2806次閱讀
    <b class='flag-5'>決策樹</b>的基本概念/學習步驟/算法/優(yōu)缺點

    什么是決策樹模型,決策樹模型的繪制方法

    決策樹是一種解決分類問題的算法,本文將介紹什么是決策樹模型,常見的用途,以及如何使用“億圖圖示”軟件繪制決策樹模型。
    發(fā)表于 02-18 10:12 ?1.3w次閱讀
    什么是<b class='flag-5'>決策樹</b>模型,<b class='flag-5'>決策樹</b>模型的繪制方法

    決策樹的結構/優(yōu)缺點/生成

    決策樹(DecisionTree)是機器學習中一種常見的算法,它的思想非常樸素,就像我們平時利用選擇做決策的過程。決策樹是一種基本的分類與回歸方法,當被用于分類時叫做分類,被用于回歸
    發(fā)表于 03-04 10:11 ?8464次閱讀

    數據決策樹

    認為是if-then的集合,也可以認為是定義在特征空間與類空間上的條件概率分布。 決策樹通常有三個步驟:特征選擇、決策樹生成、決策樹的修剪。
    的頭像 發(fā)表于 10-20 10:01 ?1367次閱讀
    主站蜘蛛池模板: 欧美日韩高清一区 | 在线最新版www资源网 | 亚洲一区二区三区播放在线 | 三级理论在线 | 亚洲国产精品乱码一区二区三区 | 国产产一区二区三区久久毛片国语 | 欧美人成绝费网站色www吃脚 | 午夜三级理论在线观看视频 | 天天天综合网 | 成人剧场 | 亚洲欧洲日韩综合 | 国产成人在线影院 | 国产免费一级高清淫日本片 | 婷婷精品视频 | a欧美视频| 激情综合色综合久久综合 | 一本视频在线 | 国产色婷婷精品免费视频 | 牛牛a级毛片在线播放 | 免费黄色福利视频 | 性网站在线观看 | 国产精品免费久久 | 一级做a爱片就在线看 | 精品久久天干天天天按摩 | 国产一级爱c片免费播放 | 亚洲成a人不卡在线观看 | 亚洲天堂免费在线 | eeuss久久久精品影院 | 欧美人成一本免费观看视频 | 国产色婷婷免费视频 | 欧美性xxxx巨大黑人猛 | 一区二区三区四区免费视频 | 亚洲无色 | 在线视频午夜 | 一级毛片免费不卡直观看 | 啪啪网免费 | 亚洲人成电影在线小说网色 | 国产一区在线播放 | 性做久久久久久久久 | 欧美另类69xxxxx性欧 | 迅雷www天堂在线资源 |