基于話(huà)題標(biāo)簽和轉(zhuǎn)發(fā)的微博聚類(lèi)和主題詞提取
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
針對(duì)微博聚類(lèi)正確率不高的問(wèn)題,在研究微博數(shù)據(jù)特點(diǎn)的基礎(chǔ)上,利用微博hashtag來(lái)增強(qiáng)向量空間模型,使用微博之間的轉(zhuǎn)發(fā)關(guān)系提升聚類(lèi)的準(zhǔn)確性,并利用微博的轉(zhuǎn)發(fā)、評(píng)論數(shù)以及微博發(fā)布者信息來(lái)提取聚類(lèi)中的主題詞。在新浪微博數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)發(fā)現(xiàn),與k-means算法和基于加權(quán)語(yǔ)義和貝葉斯的中文短文本增量聚類(lèi)算法(ICST-WSNB)相比,基于話(huà)題標(biāo)簽和轉(zhuǎn)發(fā)關(guān)系的微博聚類(lèi)算法的準(zhǔn)確率比k-means算法提高了18.5%,比ICST-WSNB提高了6.48%,召回率以及F-值也有了一定的提高。實(shí)驗(yàn)結(jié)果表明基于話(huà)題標(biāo)簽和轉(zhuǎn)發(fā)關(guān)系的微博聚類(lèi)算法能夠有效地提高微博聚類(lèi)的正確率,進(jìn)而獲取更加合適的主題詞。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于話(huà)題標(biāo)簽和轉(zhuǎn)發(fā)的微博聚類(lèi)和主題詞提取下載
相關(guān)電子資料下載
- 對(duì)新輔助TCHP治療響應(yīng)的HER2+乳腺癌空間蛋白質(zhì)組特征 547
- 使用輪廓分?jǐn)?shù)提升時(shí)間序列聚類(lèi)的表現(xiàn) 316
- 基于K-means聚類(lèi)算法的圖像分割 1113
- 介紹一種基于最小化平方誤差的聚類(lèi)算法 498
- 介紹一種基于分層聚類(lèi)方法的木馬通信行為檢測(cè)模型 1060
- 深度學(xué)習(xí)聚類(lèi)的綜述 780
- 聚類(lèi)分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(二) 679
- 如何在 Python 中安裝和使用頂級(jí)聚類(lèi)算法 415
- 聚類(lèi)分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(一) 638
- 機(jī)器學(xué)習(xí)之分類(lèi)分析與聚類(lèi)分析 3550