在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

K-MEANS聚類算法概述及工作原理

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-06-06 11:53 ? 次閱讀

K-means 是一種聚類算法,且對于數據科學家而言,是簡單且熱門的無監督式機器學習(ML)算法之一。

什么是 K-MEANS?

無監督式學習算法嘗試在無標記數據集中“學習”模式,發現相似性或規律。常見的無監督式任務包括聚類和關聯。K-means 等聚類算法試圖通過分組對象來發現數據集中的相似性,與不同集群間的對象相似性相比,同一集群中對象之間的相似性更高。使用最小距離、數據點密度、圖形或各種統計分布等標準將其分組為集群。

K-means 通過最小化幾何點之間的平均距離將相似數據點分組成集群。為此,它以迭代方式將數據集分為非重疊子組(或集群)的固定數量 (K),其中每個數據點均屬于集群中心均值最近的集群。

為何選擇 K-MEANS?

K-means 是一種聚類算法,部署后可用于發現數據中尚未明確標記的組。目前,它已廣泛應用于各種商業應用,包括:

客戶分割:可以對客戶進行分組,以便更好地定制產品。

文本、文檔或搜索結果聚類:分組以查找文本中的主題。

圖像分組或圖像壓縮:圖像或顏色相似的組。

異常檢測:從集群中找出不相似的地方或異常值

半監督式學習:將集群與一組較小的已標記數據和監督式機器學習相結合,以獲得更有價值的結果。

K-MEANS 的工作原理

K-means 算法能夠識別數據集中一定數量的中心,而中心屬于特定集群所有數據點的算術平均值。然后,算法將每個數據點分配給最近的集群,因為其嘗試保持盡可能小的集群(K-means 中的“means”是指計算數據平均值或查找中心的任務)。同時,K-means 嘗試保持其他集群盡可能不同。

在實踐中,其工作原理如下:

K-means 算法首先將所有坐標初始化為“K”集群中心。(K 值是一個輸入變量,位置也可以作為輸入變量。)

每經過一次算法,每個點都會分配給其最近的集群中心。

然后,集群中心會被更新為在該經過中分配給其的所有點的“中心”。這是通過重新計算集群中心作為各自集群中點的平均值來實現的。

算法會重復執行,直到上次迭代的集群中心發生最小變化。

如果集群呈現一致的球形形狀,說明 K-means 在捕獲結構和進行數據推理方面非常有效。但是,如果集群呈現更復雜的幾何形狀,那就說明算法在數據聚類方面做得不好。K-means 的另一個缺點是,該算法不允許彼此距離較遠的數據點共享同一集群,而不管它們是否屬于該集群。K-means 本身不會從數據中了解到集群數量,而是必須預先定義信息。最后,當集群之間出現重疊時,K-means 無法確定如何分配重疊位置的數據點。

適用于數據科學家的 K-MEANS

由于其內在的簡單性以及在無監督機器學習操作中的普及,K-means 在數據科學家中大受青睞。盡管該算法存在局限性,但其在數據挖掘操作中的適用性允許數據科學家利用該算法從業務數據中衍生出各種推理,實現更準確的數據驅動決策。它被廣泛認為是數據科學家最具商業重要性的算法之一。

使用 GPU 加速聚類

聚類在各種應用程序中發揮著關鍵作用,但由于數據量不斷增加,其正面臨著計算挑戰。解決計算難題的極具前景的解決方案之一,即使用 GPU 進行并行計算。

在架構方面,CPU 僅由幾個具有大緩存內存的核心組成,一次只可以處理幾個軟件線程。相比之下,GPU 由數百個核心組成,可以同時處理數千個線程。GPU 具有大規模并行性,并且顯存訪問帶寬優勢顯著,因此十分適用于加速數據密集型分析。

GPU 加速的端到端數據科學

基于 CUDA 構建的 RAPIDS 開源軟件庫套件使您能夠完全在 GPU 上執行端到端數據科學和分析流程,同時仍然使用 Pandas 和 Scikit-Learn API 等熟悉的界面。

RAPIDS cuML 的機器學習算法和數學基元遵循熟悉的類似于 scikit-learn 的 API。單塊 GPU 和大型數據中心部署均支持 K-means、XGBoost 等主流算法。針對大型數據集,相較于同等功效的 CPU,這些基于 GPU 的實施方案能夠以 10 到 50 倍的速度更快地完成任務。

借助 RAPIDS GPU DataFrame,數據可以通過一個類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機器學習和圖形分析算法,而無需離開 GPU。這種級別的互操作性是通過 Apache Arrow 這樣的庫實現的。這可加速端到端流程(從數據準備到機器學習,再到深度學習)。

RAPIDS 支持在許多熱門數據科學庫之間共享設備內存。這樣可將數據保留在 GPU 上,并省去了來回復制主機內存的高昂成本。

原文標題:NVIDIA 大講堂 | 什么是 K-MEANS?

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11051

    瀏覽量

    216242
  • NVIDIA
    +關注

    關注

    14

    文章

    5267

    瀏覽量

    105906
  • 算法
    +關注

    關注

    23

    文章

    4701

    瀏覽量

    94929
  • 機器學習
    +關注

    關注

    66

    文章

    8496

    瀏覽量

    134210

原文標題:NVIDIA 大講堂 | 什么是 K-MEANS?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    開關電源的基本工作原理

    開關電源的工作原理 圖1-1-a 是串聯式開關電源的最簡單工作原理圖,圖1-1-a 中 Ui 是開關電源的工作電壓,即:直流輸入電壓;K 是控制開關,R 是負載。當控制開關
    發表于 03-10 17:01

    九種常見換熱器的工作原理概述

    接觸式換熱器,也叫混合式換熱器,是冷熱流體進行直接接觸并換熱的設備。通常情況下,直接接觸的兩種流體是氣體和汽化壓力較低的液體; ?蓄能式換熱器的工作原理,是利用固體物質的導熱特性,具體而言,熱介質先將固體物質加熱到一定溫
    的頭像 發表于 02-13 11:11 ?1077次閱讀
    九種常見換熱器的<b class='flag-5'>工作原理</b><b class='flag-5'>概述</b>

    數據降維工具介紹——SpatialPCA

    現有常用的空間轉錄組降維方法,如主成分分析(principal component analysis,PCA)、非負矩陣分解(non-negative matrix factorization
    的頭像 發表于 02-07 11:19 ?523次閱讀
    數據降維<b class='flag-5'>聚</b><b class='flag-5'>類</b>工具介紹——SpatialPCA

    晶振的工作原理概述

    類似電容的結構。當外界施加電壓時,由于石英晶體的壓電效應,它會發生微小的形變,反之,當晶體受到外力作用發生形變時,又會在其表面產生電荷,這種相互轉換的特性構成了晶振工作的基礎。 晶振的工作原理基于壓電諧振現象
    的頭像 發表于 02-05 14:08 ?549次閱讀

    K型熱電偶的工作原理

    K型熱電偶的工作原理基于熱電效應,也稱為塞貝克效應。以下是對其工作原理的介紹: 一、組成結構 K型熱電偶由兩種不同的金屬材料制成,通常是鎳鉻合金(作為正極)和鎳硅合金(作為負極)。這兩
    的頭像 發表于 01-14 09:34 ?1893次閱讀

    DSR算法工作原理 影響DSR的主要因素

    達目的地的路由,并且能夠適應網絡拓撲的變化。 DSR算法工作原理: 路由發現(Route Discovery) : 當源節點需要發送數據到一個目的地,但是沒有可用的路由時,它會啟動路由發現過程。 源
    的頭像 發表于 12-06 17:10 ?1890次閱讀

    人員軌跡分析算法有哪些?

    時段等。這些信息可以對城市規劃、交通管理、公共安全等方面具有重要的指導意義。而為了實現人員軌跡分析,我們需要使用一些專門的算法和技術。 下面是幾種常用的人員軌跡分析算法: 1. 基于密度的
    的頭像 發表于 09-26 10:42 ?855次閱讀

    交流放大器的工作原理是什么

    交流放大器的工作原理主要涉及對交流信號的放大過程,同時保持信號的波形和頻率不變。以下是交流放大器工作原理的介紹: 一、概述 交流放大器是一種電子電路,用于放大交流信號的幅度,同時保持信號的波形和頻率
    的頭像 發表于 09-26 09:17 ?1289次閱讀

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    。 ●第5章“時間序列的相似度與”:介紹時間序列的相似性度量方法,如歐氏距離、動態時間規整算法等,用于衡量兩個或多個時間序列在形狀和模式上的相似程度;
    發表于 08-07 23:03

    JK觸發器概述及工作原理

    JK觸發器,也被稱為通用可編程觸發器,是數字電路中的一種基本存儲器件。它得名于其輸入端口J(置位)和K(復位),以及一個時鐘控制端。JK觸發器能夠模擬其他多種類型觸發器的行為,具有置0、置1、翻轉
    的頭像 發表于 07-27 14:53 ?7907次閱讀

    可控硅的工作原理、特性參數及型號選擇

    眾多,但基本結構和工作原理是相同的。 一、可控硅的工作原理 可控硅是一種四層三端半導體器件,由兩個PN結組成,具有陽極(Anode,A)、陰極(Cathode,K)和門極(Gate,G)三個引腳。 可控硅的
    的頭像 發表于 07-25 11:03 ?3894次閱讀

    深度神經網絡概述及其應用

    通過模仿人類大腦神經元的連接方式和處理機制,設計多層神經元結構來處理復雜的數據模式,從而在各種數據驅動的問題中展現出強大的能力。本文將從深度神經網絡的基本概念、結構、工作原理、關鍵技術以及其在多個領域的應用等方面進行全面概述
    的頭像 發表于 07-04 16:08 ?2784次閱讀

    定時開關控制器的工作原理是什么

    部件、設計方法和應用場景。 一、定時開關控制器的工作原理 工作原理概述 定時開關控制器的工作原理基于時間控制原理,通過內置的微控制器或單片機對時間進行精確控制,實現對電器設備的定時開啟
    的頭像 發表于 06-30 09:59 ?4872次閱讀

    工業物聯網網關是什么?工業物聯網網關的工作原理

    著至關重要的作用。本文將詳細闡述工業物聯網網關的概述及工作原理。 一、工業物聯網網關的概述 工業物聯網網關是一種硬件設備或軟件程序,用于連接工業場景下的本地設備(如PLC、傳感器、機器人、數控機床等)與遠端業務系統(如IoT物聯
    的頭像 發表于 06-27 14:04 ?1503次閱讀
    工業物聯網網關是什么?工業物聯網網關的<b class='flag-5'>工作原理</b>

    徽觸控-工控一體機的工作原理

    工控一體機的工作原理主要涉及到其硬件和軟件兩個方面的協同工作
    的頭像 發表于 06-27 09:28 ?1047次閱讀
    主站蜘蛛池模板: 狠狠干狠狠插 | 国产亚洲综合精品一区二区三区 | 精品国产免费人成高清 | 91p0rn永久备用地址二 | 丁香激情五月 | 一区在线观看 | 国产重口老太和小伙乱视频 | 性欧美大胆高清视频 | 欧美性猛交ⅹxxx乱大交免费 | 美日韩一区二区 | 在线播放黄色网址 | 亚洲综合黄色 | 日韩操 | 色屁屁www影院免费观看视频 | 色婷婷视频在线 | 日本一区二区在线不卡 | 男女交性拍拍拍高清视频 | 亚洲影院手机版777点击进入影院 | 欧美二级黄色片 | 婷婷四房播客五月天 | a亚洲天堂| 欧美黄色高清 | 日韩精品你懂的在线播放 | 伊人电影综合网 | 乱人伦精品一区二区 | 又色又污又爽又黄的网站 | 九色综合久久综合欧美97 | 天天爽夜夜爽人人爽 | 加勒比一本大道香蕉在线视频 | 国产吧在线视频 | 亚洲成人黄色网址 | 国产男人午夜视频在线观看 | 色综合久久久高清综合久久久 | 狠狠操狠狠摸 | 俄罗斯美女在线观看一区 | 黄色午夜影院 | 亚洲综合国产一区二区三区 | 性感美女毛片 | 亚洲影视自拍揄拍愉拍 | 久青草免费在线视频 | 一区二区三区免费视频播放器 |