資料介紹
聚類分析是數(shù)據(jù)挖掘領(lǐng)域中一種非常有用的技術(shù),它用于從大量數(shù)據(jù)中尋找隱含的數(shù)據(jù)分布模式,主要有分割法、層次法、密度法、網(wǎng)格法和模型法等。該文主要討論數(shù)據(jù)挖掘中一種基于密度和網(wǎng)格的聚類分析算法及其在客戶關(guān)系管理中的應(yīng)用。該算法具有較高的聚類效率而且容易實(shí)現(xiàn),可以發(fā)現(xiàn)任意形狀的聚類,時間復(fù)雜度低,聚類精度高,適用于數(shù)據(jù)的批量更新。該文還提出增量式聚類技術(shù),它不僅能夠利用前期聚類的結(jié)果,充分提高聚類分析的效率,而且可以降低維護(hù)知識庫所帶來的巨大開銷。實(shí)驗(yàn)證明了算法的有效性。
關(guān) 鍵 詞 聚類分析; 客戶關(guān)系管理; 數(shù)據(jù)挖掘; 密度; 網(wǎng)格
Clustering analysis is a very useful tool in the domain of data mining for searching distributing mode from a great deal of data. Its main algorithms are partition-based algorithm, hierarchy-based algorithm, density-based algorithm, grid-based algorithm, and model-based algorithm. The paper mainly discusses a clustering algorithm based on density and grid in data mining, which has high clustering efficiency and low time complexity. It is efficient and effective for multi-density and uniformity density data sets with noise and suitable for batch update. After that an incremental clustering technique is presented. This technique not only makes best use of the former clustering results and improves the efficiency of clustering analysis, but also brings to the reduction of enormous expenditure on knowledge base maintenance. At last an application of the algorithm in Customer Relationship Management (CRM) is gien.
Key words clustering analysis; customer relationship management; data mining; density; grid
聚類分析是數(shù)據(jù)挖掘領(lǐng)域研究的重要課題[1],其基本思想是:按照數(shù)據(jù)的相似性和差異性,將數(shù)據(jù)劃分為若干組,同組的數(shù)據(jù)盡量相似,不同組的數(shù)據(jù)盡量相異[2-3]。迄今為止,人們已經(jīng)提出了許多聚類算法,主要有分割法、層次法、密度法、網(wǎng)格法和模型法等[4-6]。基于網(wǎng)格和密度的聚類算法由于易于增量實(shí)現(xiàn)和高維數(shù)據(jù)挖掘而被廣泛地應(yīng)用于聚類算法中。基于網(wǎng)格的方法在聚類過程中將網(wǎng)格中的點(diǎn)作為一個整體處理,而不是考慮單元中的每一個點(diǎn),基于這一特性,該方法在所有的聚類方法中效率最高。其優(yōu)點(diǎn)是聚類的結(jié)果與輸入數(shù)據(jù)的順序無關(guān),算法的時間復(fù)雜度是數(shù)據(jù)點(diǎn)個數(shù)的線性函數(shù),速度快、可擴(kuò)展性好,能識別不同形狀的聚類。
本文給出一種基于密度和網(wǎng)格的聚類算法,它是一個基于密度的算法,既保留了基于網(wǎng)格算法運(yùn)行速度快的特點(diǎn),又通過細(xì)化技術(shù)彌補(bǔ)了該類算法精度不好的弱點(diǎn)。
1 算法分析
在基于密度的算法中,一個聚類就是一個比周圍區(qū)域有更高數(shù)據(jù)點(diǎn)密度的區(qū)域[7]。為識別數(shù)據(jù)點(diǎn)的密度,將數(shù)據(jù)空間進(jìn)行劃分并找出每個單元中數(shù)據(jù)點(diǎn)的數(shù)目。為使計(jì)算點(diǎn)的密度的方法簡單一些,將數(shù)據(jù)空間分割成網(wǎng)格狀,把數(shù)據(jù)空間中的每一維劃分成相同的區(qū)間數(shù),每一個單元具有相同的“體積”[8-9]。單元中點(diǎn)的密度的計(jì)算可以轉(zhuǎn)換成簡單的點(diǎn)計(jì)數(shù),然后把落到某個單元中的點(diǎn)的個數(shù)作為該單元的密度。這時可以指定一個閾值r,當(dāng)某單元格中點(diǎn)的個數(shù)大于該閾值時,就稱該單元格是密集的,聚類也就是所有相鄰近的密集單元格的集合。
- 基于群組和密度的大規(guī)模軌跡聚類算法 2次下載
- 基于網(wǎng)格多密度聚類的古建筑圖像特征匹配方法 3次下載
- 一種基于自然最近鄰的密度峰值聚類算法 12次下載
- 基于MapReduce和加權(quán)網(wǎng)絡(luò)信息熵的DBWGIE-MR算法 11次下載
- 一種自適應(yīng)的關(guān)聯(lián)融合聚類算法 13次下載
- 一種改進(jìn)的聚類聯(lián)合相似度推薦算法 10次下載
- 可檢測出租車載客的軌跡聚類算法 13次下載
- 如何使用拉普拉斯中心性和密度峰值進(jìn)行無參數(shù)聚類算法的研究 12次下載
- 如何融合密度峰值進(jìn)行高斯混合模型聚類算法概述 2次下載
- 如何使用多維網(wǎng)格空間進(jìn)行改進(jìn)K-means聚類算法資料概述 1次下載
- 聚類算法及聚類融合算法研究 33次下載
- 基于網(wǎng)格的多密度聚類算法
- 基于網(wǎng)格的帶有參考參數(shù)的聚類算法
- 基于模糊聚類思想的網(wǎng)格獨(dú)立任務(wù)調(diào)度算法
- 基于不均勻密度的自動聚類算法
- 聚類分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(二) 1261次閱讀
- 如何在 Python 中安裝和使用頂級聚類算法 613次閱讀
- 代碼實(shí)現(xiàn)密度聚類DBSCAN 718次閱讀
- 10種頂流聚類算法Python實(shí)現(xiàn)(附完整代碼) 1617次閱讀
- CCM和CRM的圖騰柱PFC哪個效率更高? 4356次閱讀
- 機(jī)器學(xué)習(xí)技術(shù)在圖像處理中的應(yīng)用 2372次閱讀
- 10種聚類介紹和Python代碼 3156次閱讀
- 基于距離的聚類算法K-means的設(shè)計(jì)實(shí)現(xiàn) 2348次閱讀
- 淺析四類機(jī)器學(xué)習(xí)在自動駕駛中的應(yīng)用 5605次閱讀
- Python無監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細(xì)概述 3w次閱讀
- 機(jī)器學(xué)習(xí)中五種常用的聚類算法 3.8w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設(shè)計(jì) 7382次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5377次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實(shí)例 1.5w次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費(fèi)
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費(fèi)
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費(fèi)
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費(fèi)
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費(fèi)
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費(fèi)
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費(fèi)
- 8AN-1308: 電流檢測放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費(fèi)
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費(fèi)
- 2免費(fèi)開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 130次下載 | 免費(fèi)
- 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費(fèi)
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費(fèi)
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論