基于粗糙集的屬性選擇算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)“大數(shù)據(jù)”中常見(jiàn)的大規(guī)模無(wú)監(jiān)督數(shù)據(jù)集中特征選擇速度難以滿足實(shí)際應(yīng)用要求的問(wèn)題,在經(jīng)典粗糙集絕對(duì)約簡(jiǎn)增量式算法的基礎(chǔ)上提出了一種快速的屬性選擇算法。首先,將大規(guī)模數(shù)據(jù)集看作一個(gè)隨機(jī)到來(lái)的對(duì)象序列,并初始化候選約簡(jiǎn)為空集;然后每次都從大規(guī)模數(shù)據(jù)集中無(wú)放回地隨機(jī)抽取一個(gè)對(duì)象,并且每次都判斷使用當(dāng)前候選約簡(jiǎn)能否區(qū)分這一對(duì)象和當(dāng)前對(duì)象集中所有應(yīng)當(dāng)區(qū)分的對(duì)象,并將該對(duì)象放入到當(dāng)前對(duì)象集中,如果不能區(qū)分則向候選約簡(jiǎn)中添加合適的屬性;最后,如果連續(xù),次都沒(méi)有發(fā)現(xiàn)無(wú)法區(qū)分的對(duì)象,那么將候選約簡(jiǎn)作為大規(guī)模數(shù)據(jù)集的約簡(jiǎn)。在5個(gè)非監(jiān)督大規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)表明,所求得的約簡(jiǎn)能夠區(qū)分95 %以上的對(duì)象對(duì),并且求取該約簡(jiǎn)所需的時(shí)間不到基于區(qū)分矩陣的算法和增量式約簡(jiǎn)算法的1%;在文本主題挖掘的實(shí)驗(yàn)中,使用約簡(jiǎn)后的數(shù)據(jù)集挖掘出的文本主題同原始數(shù)據(jù)集挖掘出的主題基本一致。兩組實(shí)驗(yàn)結(jié)果表明該方法能夠有效快速對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行屬性選擇。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于粗糙集的屬性選擇算法下載
相關(guān)電子資料下載
- LoRaWAN網(wǎng)絡(luò)服務(wù)器算法--下行路徑選擇算法對(duì)比與仿真(下) 160
- LoRaWAN網(wǎng)絡(luò)服務(wù)器算法--下行路徑選擇算法對(duì)比與仿真(上) 712
- 基于粗糙集聯(lián)合決策樹(shù)法的智能變電站遠(yuǎn)程調(diào)度管理優(yōu)化 392
- 基于馬爾科夫邊界發(fā)現(xiàn)的因果特征選擇算法綜述 1045
- H.264中低復(fù)雜度的快速多參考幀選擇算法的應(yīng)用研究 2421
- 一種新的H.264編碼幀間預(yù)測(cè)模式選擇算法 359
- 三種回歸算法及其優(yōu)缺點(diǎn),將會(huì)為我們理解和選擇算法提供很好的幫助 13979
- 不同特征選擇算法的各自特點(diǎn)及其在微博業(yè)務(wù)應(yīng)用中的演進(jìn)歷程 3425
- 基于粗糙集理論的電力變壓器絕緣故障診斷 669