一、算法概述
算法是指解題方案的準(zhǔn)確而完整的描述,是一系列解決問(wèn)題、高度符合邏輯性、可執(zhí)行性的指令集合,代表運(yùn)用系統(tǒng)方法描述解決問(wèn)題的策略機(jī)制。算法能夠?qū)σ欢ㄒ?guī)范的輸入在有限時(shí)間內(nèi)運(yùn)行得到輸出。
算法中的指令描述的是計(jì)算過(guò)程,當(dāng)其運(yùn)行時(shí)能從初始狀態(tài)和初始輸入(初始輸入可能為空的)開(kāi)始,經(jīng)過(guò)一系列有限而清晰定義的狀態(tài),最終產(chǎn)生輸出并終止于某一狀態(tài)。
不同的算法在解決相同問(wèn)題所需時(shí)間、空間可能不同,即算法的效率不同。算法的優(yōu)劣可通過(guò)解決相同問(wèn)題所需的時(shí)間復(fù)雜度與空間復(fù)雜度衡量。
二、傳統(tǒng)算法與大數(shù)據(jù)算法
傳統(tǒng)的數(shù)據(jù)算法可被稱為數(shù)據(jù)分析,數(shù)據(jù)分析的目的在于對(duì)已有的數(shù)據(jù)進(jìn)行描述性分析,其重點(diǎn)在于發(fā)現(xiàn)數(shù)據(jù)隱含的規(guī)律,進(jìn)行商業(yè)分析和處理。
大數(shù)據(jù)時(shí)代的數(shù)據(jù)算法可被稱為數(shù)據(jù)科學(xué),與數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)相關(guān)。
機(jī)器學(xué)習(xí)是交叉學(xué)科,機(jī)器學(xué)習(xí)涉及的學(xué)科包括概率論、統(tǒng)計(jì)學(xué)、逼近論、圖分析、算法復(fù)雜度理論等。機(jī)器學(xué)習(xí)主要研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,并重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身性能。
大數(shù)據(jù)機(jī)器學(xué)習(xí)更強(qiáng)調(diào)學(xué)習(xí)是手段。機(jī)器學(xué)習(xí)成為一種支持和服務(wù)技術(shù),基于機(jī)器學(xué)習(xí)對(duì)復(fù)雜多樣的數(shù)據(jù)進(jìn)行深層次的分析和更高效地利用信息成為大數(shù)據(jù)機(jī)器學(xué)習(xí)研究的主要方向。所以,大數(shù)據(jù)機(jī)器學(xué)習(xí)逐漸向智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術(shù)的重要組成部分。
大數(shù)據(jù)時(shí)代,數(shù)據(jù)體量以空前的速度增長(zhǎng),需要分析新類(lèi)型數(shù)據(jù)也在不斷出現(xiàn),新類(lèi)型數(shù)據(jù)包括:文本理解、文本情感分析、圖像的檢索和理解、圖形和網(wǎng)絡(luò)等。數(shù)據(jù)體量快速增長(zhǎng)和新類(lèi)型數(shù)據(jù)不斷出現(xiàn)使得大數(shù)據(jù)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等智能計(jì)算技術(shù)在大數(shù)據(jù)智能化分析處理應(yīng)用中具有重要作用。
圖片來(lái)源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》
三、機(jī)器學(xué)習(xí)算法
目前,主流的機(jī)器學(xué)習(xí)算法包括:監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。
(1)監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是指從標(biāo)記的訓(xùn)練數(shù)據(jù)推斷某一功能的機(jī)器學(xué)習(xí)任務(wù),訓(xùn)練數(shù)據(jù)包括一套訓(xùn)練示例。每套訓(xùn)練示例均由一個(gè)輸入對(duì)象(通常為矢量)和一個(gè)期望的輸出值 (也稱為監(jiān)督信號(hào))組成。監(jiān)督學(xué)習(xí)算法通過(guò)分析訓(xùn)練示例(個(gè)人理解:需分析多套訓(xùn)練示例),產(chǎn)生某種推斷功能,該推斷功能可以用于映射新示例。
監(jiān)督學(xué)習(xí)包括:分類(lèi)算法和回歸分析。
1)分類(lèi)算法包括:自然貝葉斯、決策樹(shù)、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等。分類(lèi)算法主要針對(duì)離散數(shù)據(jù)。
2)回歸類(lèi)算法包括:線性回歸、邏輯回歸、支持向量機(jī)等。回歸類(lèi)算法主要針對(duì)連續(xù)數(shù)據(jù)。
(2)非監(jiān)督學(xué)習(xí)
非監(jiān)督學(xué)習(xí)是指在沒(méi)有類(lèi)別信息情況下,通過(guò)分析所研究對(duì)象大量樣本的據(jù)數(shù),實(shí)現(xiàn)樣本分類(lèi)的數(shù)據(jù)處理方法。
通過(guò)非監(jiān)督式學(xué)習(xí),可將樣本集劃分為若干個(gè)子集(類(lèi)別),或?qū)颖炯鳛橛?xùn)練樣本集,再通過(guò)監(jiān)督學(xué)習(xí)方法進(jìn)行分類(lèi)器設(shè)計(jì)。
非監(jiān)督學(xué)習(xí)包括:聚類(lèi)算法、抽維算法。
1)聚類(lèi)算法包括:距離聚類(lèi)、快速聚類(lèi)等。
2)抽維算法包括:主因子、典型相關(guān)等。
審核編輯:劉清
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4808瀏覽量
102797 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8492瀏覽量
134105 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8952瀏覽量
139496
原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(8)——算法
文章出處:【微信號(hào):行業(yè)學(xué)習(xí)與研究,微信公眾號(hào):行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
PID控制算法的C語(yǔ)言實(shí)現(xiàn):PID算法原理
深入解析ECC256橢圓曲線加密算法

【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+內(nèi)容簡(jiǎn)介
【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+介紹基礎(chǔ)硬件算法模塊
【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+一本介紹基礎(chǔ)硬件算法模塊實(shí)現(xiàn)的好書(shū)
激光雷達(dá)在SLAM算法中的應(yīng)用綜述

評(píng)論