在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工神經(jīng)網(wǎng)絡(luò)中語音分析與圖像識別的研究

0BFC_eet_china ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-09-27 14:20 ? 次閱讀

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是人工神經(jīng)網(wǎng)絡(luò)的一種,是當(dāng)下語音分析和圖像識別領(lǐng)域的研究熱點(diǎn)。

這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準(zhǔn)備好了嗎?Let’s go——

我們先從最基礎(chǔ)的內(nèi)容說起。

對二維數(shù)字信號(圖像)的操作,可以寫成矩陣形式。

比如對圖像做平滑,一個典型的8領(lǐng)域平滑,其結(jié)果中的每個值都來源于原對應(yīng)位置和其周邊8個元素與一個3X3矩陣的乘積:

也就相當(dāng)于對原矩陣,按照順序?qū)⒏鲄^(qū)域元素與W矩陣相乘,W 矩陣為:

這也被稱作核(Kernel, 3X3)

其處理效果如下:

也就是,這個核對圖像進(jìn)行操作,相當(dāng)于對圖像進(jìn)行了低通濾波。因此這個核也被稱為濾波器,整個操作過程按照概念稱為卷積。

擴(kuò)展來講,對二維圖像的濾波操作可以寫成卷積,比如常見的高斯濾波、拉普拉斯濾波(算子)等。

濾波器跟卷積神經(jīng)網(wǎng)絡(luò)有什么關(guān)系呢。不如我們預(yù)想一個識別問題:我們要識別圖像中的某種特定曲線,也就是說,這個濾波器要對這種曲線有很高的輸出,對其他形狀則輸出很低,這也就像是神經(jīng)元的激活

我們設(shè)計(jì)的濾波器和想要識別的曲線如下:

假設(shè)上面的核(濾波器)按照卷積順序沿著下圖移動:

那么當(dāng)它移動到上面的位置時,按照矩陣操作,將這個區(qū)域的圖像像素值與濾波器相乘,我們得到一個很大的值(6600):

而當(dāng)這個濾波器移動到其他區(qū)域時,我們得到一個相對很小的值:

如此,我們對整個原圖進(jìn)行一次卷積,得到的結(jié)果中,在那個特定曲線和周邊區(qū)域,值就很高,在其他區(qū)域,值相對低。這就是一張激活圖。對應(yīng)的高值區(qū)域就是我們所要檢測曲線的位置。

在訓(xùn)練卷積審計(jì)網(wǎng)絡(luò)(CNN)的某一個卷積層時,我們實(shí)際上是在訓(xùn)練一系列的濾波器(filter)。比如,對于一個32x32x3(寬32像素x高32像素xRGB三通道)的圖像,如果我們在CNN的第一個卷積層定義訓(xùn)練12個濾波器,那就這一層的輸出便是32X32X12.按照不同的任務(wù),我們可以對這個輸出做進(jìn)一步的處理,這包括激活函數(shù),池化,全連接等。

簡單來說,訓(xùn)練CNN在相當(dāng)意義上是在訓(xùn)練每一個卷積層的濾波器。讓這些濾波器組對特定的模式有高的激活,以達(dá)到CNN網(wǎng)絡(luò)的分類/檢測等目的。

一個實(shí)際CNN(AlexNet)第一個卷積層的濾波器>

卷積神經(jīng)網(wǎng)絡(luò)的第一個卷積層的濾波器用來檢測低階特征,比如邊、角、曲線等。隨著卷積層的增加,對應(yīng)濾波器檢測的特征就更加復(fù)雜(理性情況下,也是我們想要的情況)。

比如第二個卷積層的輸入實(shí)際上是第一層的輸出(濾波器激活圖),這一層的濾波器便是用來檢測低價(jià)特征的組合等情況(半圓、四邊形等),如此累積,以檢測越來越復(fù)雜的特征。實(shí)際上,我們的人類大腦的視覺信息處理也遵循這樣的低階特征到高階特征的模式。

可參考之前文章《為什么無彩色系(黑白灰色)在色彩搭配中可以和諧地與任何彩色搭配?》:https://www.zhihu.com/question/27380522/answer/36794240

最后一層的濾波器按照訓(xùn)練CNN目的的不同,可能是在檢測到人臉、手寫字體等時候激活[1]。

所以,在相當(dāng)程度上,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)的任務(wù)就在于構(gòu)建這些濾波器。也就是,將這些濾波器變成這樣(改變?yōu)V波器矩陣的值,也就是Weight)的——能識別特定的特征。這個過程叫做訓(xùn)練

在訓(xùn)練開始之時,卷積層的濾波器是完全隨機(jī)的,它們不會對任何特征激活(不能檢測任何特征)。這就像剛出生的孩子,TA不知道什么是人臉、什么是狗,什么是上下左右。

TA需要學(xué)習(xí)才知道這些概念,也就是通過接觸人臉、狗、上下左右,并被告知這些東西分別是人臉、狗、上下左右。然后TA才能在頭腦中記住這些概念,并在之后的某一次見到之后能準(zhǔn)確的給出結(jié)果。

把一個空白的濾波其,修改其權(quán)重(weights)以使它能檢測特定的模式,整個過程就如工程里面的反饋。

想想一下,如果有一只無意識的猴子,完全隨機(jī)的修改一個5X5濾波器矩陣的25個值,那完全可能經(jīng)過一定的輪次之后,這個濾波器能夠檢測棱角等特征。這是一種無反饋的訓(xùn)練情況。對神經(jīng)網(wǎng)絡(luò)的訓(xùn)練當(dāng)然不能如此,我們不可能靠運(yùn)氣去做這件事情。

舉個例子,我們要訓(xùn)練一個用于分類的神經(jīng)網(wǎng)絡(luò),讓它能判定輸入圖像中的物體最可能是十個類別的哪一類。那么,訓(xùn)練過程就是這樣的:

第一次訓(xùn)練,輸入一張圖像,這個圖像通過各層卷積處理輸出量一組向量[1,1,1,1,1,1,1,1,1,1], 也就是,對于完全由隨機(jī)濾波器構(gòu)建的網(wǎng)絡(luò),其輸出認(rèn)為這張圖等概率的是十個類別中的某一種。

但是對于訓(xùn)練,我們有一個Gound Thuth, 也就是這張圖中物體所屬的類別:[0,0,1,0,0,0,0,0,0,0],也就是屬于第三類。這時候我們可以定義一個損失函數(shù),比如常見的MSE(mean squared error)。

我們假定L是這個損失函數(shù)的輸出。這時候我們的目的就是,讓L的值反饋(這種神經(jīng)網(wǎng)絡(luò)概念下稱為 back propagation, 反向傳輸)給整個卷積神經(jīng)網(wǎng)絡(luò),以修改各個濾波器的權(quán)重,使得損失值L最小。

這是一個典型的最優(yōu)化問題。當(dāng)然地,在工程上我們幾乎不可能一次就把濾波器的權(quán)重W修改到使L最小的情況,而是需要多次訓(xùn)練和多次修改。

如果情況理想的話,權(quán)重修改的方向是使得L的變化收斂的。這也就是說很可能達(dá)到了我們訓(xùn)練這個神經(jīng)網(wǎng)絡(luò)的目的——讓各個卷積層的濾波器能夠組合起來最優(yōu)化的檢測特定的模式。

參考文獻(xiàn)

[1] Zeiler, M. D., & Fergus, R. (2014, September). Visualizing and understanding convolutional networks. In European conference on computer vision (pp. 818-833). Springer, Cham.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4810

    瀏覽量

    102916
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    526

    瀏覽量

    38928
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48783

    瀏覽量

    246888

原文標(biāo)題:給你一個卷積神經(jīng)網(wǎng)絡(luò)工作原理最直觀的解釋

文章出處:【微信號:eet-china,微信公眾號:電子工程專輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    BP神經(jīng)網(wǎng)絡(luò)圖像識別的應(yīng)用

    BP神經(jīng)網(wǎng)絡(luò)圖像識別中發(fā)揮著重要作用,其多層結(jié)構(gòu)使得網(wǎng)絡(luò)能夠?qū)W習(xí)到復(fù)雜的特征表達(dá),適用于處理非線性問題。以下是對BP神經(jīng)網(wǎng)絡(luò)圖像識別
    的頭像 發(fā)表于 02-12 15:12 ?593次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)語音識別的應(yīng)用實(shí)例

    語音識別技術(shù)是人工智能領(lǐng)域的一個重要分支,它使計(jì)算機(jī)能夠理解和處理人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,特別是長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的引入,語音
    的頭像 發(fā)表于 11-13 10:03 ?1728次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)有何用途 卷積神經(jīng)網(wǎng)絡(luò)通常運(yùn)用在哪里

    和應(yīng)用場景。 圖像識別 圖像識別是卷積神經(jīng)網(wǎng)絡(luò)最廣泛的應(yīng)用之一。CNN能夠自動學(xué)習(xí)圖像的特征,實(shí)現(xiàn)對
    的頭像 發(fā)表于 07-11 14:43 ?4126次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)和優(yōu)越性不包括什么

    在許多領(lǐng)域都取得了顯著的成果,如圖像識別語音識別、自然語言處理等。然而,人工神經(jīng)網(wǎng)絡(luò)也存在一些局限性和不足之處,以下是對
    的頭像 發(fā)表于 07-05 09:26 ?1558次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的工作原理及應(yīng)用

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是一種受到生物神經(jīng)網(wǎng)絡(luò)啟發(fā)的計(jì)算模型,用于模擬人腦處理信息的方式。它們在許多領(lǐng)域都有廣泛的應(yīng)用,包括圖像識別
    的頭像 發(fā)表于 07-05 09:25 ?1274次閱讀

    人工神經(jīng)網(wǎng)絡(luò)模型的分類有哪些

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計(jì)算模型,它在許多領(lǐng)域,如圖像識別語音
    的頭像 發(fā)表于 07-05 09:13 ?2204次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)芯片的介紹

    人工智能神經(jīng)網(wǎng)絡(luò)芯片是一類專門為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)的處理器。它們具有高性能、低功耗、可擴(kuò)展等特點(diǎn),廣泛應(yīng)用于圖像識別語音
    的頭像 發(fā)表于 07-04 09:33 ?1313次閱讀

    如何設(shè)計(jì)人臉識別的神經(jīng)網(wǎng)絡(luò)

    識別技術(shù)主要分為兩個步驟:人臉檢測和人臉特征提取。人臉檢測是指在圖像定位出人臉的位置和大小,人臉特征提取是指從人臉圖像中提取出能夠表征人臉特征的信息。人臉
    的頭像 發(fā)表于 07-04 09:20 ?1042次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識別圖像識別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時間長、
    的頭像 發(fā)表于 07-03 11:00 ?1172次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)圖像識別的應(yīng)用

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本原
    的頭像 發(fā)表于 07-02 14:28 ?1886次閱讀

    神經(jīng)網(wǎng)絡(luò)建模的適用范圍有哪些

    自然圖像、醫(yī)學(xué)圖像、衛(wèi)星圖像等。神經(jīng)網(wǎng)絡(luò)可以識別圖像
    的頭像 發(fā)表于 07-02 11:40 ?971次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的含義和用途是

    神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,包括圖像識別語音識別、自然語言處理、推薦系統(tǒng)、預(yù)測分析等。 一、人工
    的頭像 發(fā)表于 07-02 10:07 ?1459次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)語音識別的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,語音識別技術(shù)作為人機(jī)交互的重要橋梁,受到了廣泛的關(guān)注和研究語音識別
    的頭像 發(fā)表于 07-01 16:01 ?1425次閱讀

    神經(jīng)網(wǎng)絡(luò)圖像識別的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)圖像識別領(lǐng)域的應(yīng)用日益廣泛。神經(jīng)網(wǎng)絡(luò)以其強(qiáng)大的特征提取和分類能力,為圖像識別帶來了革命性的進(jìn)步。本文將
    的頭像 發(fā)表于 07-01 14:19 ?1118次閱讀

    如何訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)

    神經(jīng)網(wǎng)絡(luò)人工智能領(lǐng)域的重要分支,廣泛應(yīng)用于圖像識別、自然語言處理、語音識別等多個領(lǐng)域。然而,要使神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-01 14:14 ?918次閱讀
    主站蜘蛛池模板: 亚洲免费在线看 | 免费色片网站 | 免费一区二区 | 永久视频在线观看 | 亚洲操综合| 五月四房婷婷 | 久久免费国产 | 美女拍拍拍爽爽爽爽爽爽 | 欧美亚洲啪啪 | 婷婷色九月综合激情丁香 | 激情文学综合丁香 | 天天影视欧美综合在线观看 | 高清人人天天夜夜曰狠狠狠狠 | 久久国产美女 | 视频在线播放免费 | 色综合天天干 | 成人欧美一区二区三区视频不卡 | 四虎在线成人免费网站 | 天天槽任我槽免费 | 日美一级毛片 | 亚洲一区二区在线播放 | 亚洲人免费视频 | 婷婷丁香在线 | 午夜在线视频免费 | 午夜欧美精品久久久久久久久 | 2019天天干| 四虎永久免费在线观看 | 欲色影视 | 奇米一区二区三区四区久久 | 亚洲视频一区二区在线观看 | 亚洲人成电影在在线观看网色 | 色吧在线观看 | 国产精品三级视频 | 日本xxxx69日本 | 天天射天天爱天天干 | 一区在线播放 | 韩国最新三级网站在线播放 | 免费黄色一级片 | 九色视频网 | 特级一级毛片免费看 | 欧洲人体超大胆露私视频 |