在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

到底是什么讓機器學習達不到我們的期待呢?

nlfO_thejiangme ? 2018-03-27 13:56 ? 次閱讀

機器學習雖然能夠在很多地方顯示出強大的力量,同時也被集成到了很多的商業流程中去,但它依舊有一些不完美的地方,今天我們就通過一些典型的例子來深刻感受一下機器學習的局限性。

人臉識別

目前最先進的人臉識別系統可以達到99%的準確率。作為使用最為廣泛的機器學習算法,人臉識別得到了飛速的發展,但在這背后需要我們對幾件事情保持清醒。首先,99%的正確率是來自與驗證數據集的測試結果,而驗證數據集則來自于與訓練數據集相同的數據集,并從中隨機抽取。這就意味著數據的均值和方差與訓練數據十分相似。但當我們將系統置于真實情況下時,實際照片的特性與訓練數據不可能相同,那么實際的精度很有可能低于99%。

模型有時候會將其他的東西識別成人臉(假陽性)或者忘卻漏掉了人臉(假陰性)。不同的模型在不同的階段有著不同的表現,在使用時你需要確定你需要什么樣層次的模型,給出多高的精度是可以接受的。在選擇權衡算法時,一個模型在檢測幾千張臉時錯檢幾十張,而另一個模型可以將準確率提高一半但需要10x的處理時間和運算,那么前者將會是不錯的選擇。剩下的可以交給人類來做,我們對于少量假陽性和假陰性的樣本有著非常快的準確識別能力。

下面是幾個關于模型訓練的數據清理經驗。最好的當然是保證每一張臉都可以很容易地看到,沒有模糊遮擋,也沒有很奇怪的角度。同時圖像要保持適度的分辨率,分辨率太高的圖像容易引入造成算法失效的噪音。

光學字符識別(OCR)

目前最先進的光學字符識別系統對于文件的識別與排版已經有十分優異。基于邊緣檢測、計算機視覺與字符識別的技術使得OCR不斷改進,對于掃描文檔幾乎沒有障礙了。

但目前OCR還不能夠勝任的是非掃描文件的識別,這也是驗證碼還能作為網站人類識別的功能存在。人類對于字母識別有著無與倫比的能力,無論是模糊、扭曲、顏色不同都不在話下,而計算機望塵莫及。

OCR很有用但對于一些場景下使用不當就會文不對題,下面這張球賽的截頻就是一個典型的例子。

上圖如果用OCR識別很有可能生成這樣的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果沒有上下文語境我們很難明白識別出的意思,哪里是隊名哪里是logo?這會造成很大的混亂。

我們不應該像使用通用OCR一樣來直接簡單粗暴的套用,而是需要針對情況進行分析。對于上面的例子如果我們想要追蹤球員,那么目標追蹤的方法會很好,但如果想要追蹤比賽分數和時間,那么將OCR限定在固定區域中會是不錯的選擇。

視 頻

視頻是一種很神奇的存在,雖然很多機器學習模型能在視頻上實現和照片一樣的效果,但總會有意想不到的情況。數字世界的解碼和封裝總是與視頻的壓縮率和長寬比耦合在一起。

同時考慮到處理時間和算力的限制,對視頻進行處理時我們往往選擇低分辨的格式。當你選擇低分辨率或者較高的壓縮時,視頻并不會是一組連續的靜態圖片,所以計算機視覺的識別方法將會與靜態圖片中的識別方法有很大的差別。

為了說明這一情況我們可以隨便點開一個視頻并暫停,如下圖所示。人們的臉變得模糊、角度和整體形象都顯得和靜態下十分不同。

下面應該是計算機看到的人臉區域:

你能從中認出圖中的主角是誰嗎?如果對你來說很困難那么對于計算機來說也不容易!

對于人類來說,在視頻中識別人臉很容易,但要把獨立的幀抽取出來你會發現圖像質量出乎意料的差。

但我們也不能否定機器學習,因為機器學習在大多數情況下對于視頻的自動化分類和標注時十分重要的手段。我們需要明白的是我們期望得到的結果以及如何去修正模型實際的表現。如果一個龐大的全球名人識別模型對一段視屏進行檢測可能會出現很多假陽性的結果,但是如果使用一個僅僅包含幾個著名人士的模型來檢測則會得到好得多的結果。如果你的模型表現不好,你還可以從數據的角度來改進,譬如說某個節目中人臉出現的位置就可以作為先驗知識來幫助機器提高正確率。我們需要嘗試不同的模型和工作流總能取得成功。

如何成功的應用機器學習?

機器學習十分強大,有人將它應用于檢測學術造假的論文,也有人將它應用于人臉身份認證、不良內容的裸露檢測等。同樣也用于為用戶推薦商品和服務的推薦引擎上,在這樣的場景下假陽性和假陰性的推薦結果不會造成太大影響,事實上一些異常推薦還為用戶探索新事物提供了條件。

還有改善搜索引擎的個性化能力,檢測農作物動物的疾病以及預測產量等等方面。機器學習將會有無數的應用,我們對它充滿期待,但同時也會把握住期待的方向讓機器學習正常運轉。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    76

    文章

    4064

    瀏覽量

    83540
  • 機器學習
    +關注

    關注

    66

    文章

    8484

    瀏覽量

    133969

原文標題:靈魂拷問:是什么讓機器學習達不到我們的期待呢?(開頭有個大事兒)

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    ADS1298ECG-FE原理圖上看見很多NI的符號, 到底是什么意思

    我們在ADS1298ECG-FE原理圖上看見很多NI的符號, 到底是什么意思? 具體的值是多少? 如下面兩個圖所示: R1, R2電阻的值是多少? 這個比較重要。 R59
    發表于 02-05 08:16

    為什么DAC7811輸出達不到Vref?

    為什么DAC7811輸出達不到Vref,并且根據手冊上的這個圖輸出怎么不是線性的,不滿足這個等式V OUT=-V REF x CODE/4096
    發表于 01-17 07:38

    TPA3123 SE工作方式,實際輸出功率達不到標稱的70%,為什么?

    1、SE工作方式,實際輸出功率達不到標稱的70%:現象用示波器在負載兩端觀察,測試正弦波信號的上半周會先于下半周失真,從而影響輸出功率。 2、串擾只有20~40dB,達不到標稱參數:人不解的是,串擾信號波形是正弦波的半周,
    發表于 11-06 08:19

    TPA3136D2音頻功率放大器達不到10W,失真很高是什么原因

    TPA3136D2音頻功率放大器達不到10W,我是按照EVM給的電路圖畫的板子。焊好元器件用8921綜測儀測試時,12V電壓,負載6歐姆時,功率達不到10W,而且即使加大灌入的音頻電壓,失真很高,功率依然達不到10W,是什么原因
    發表于 10-15 08:29

    請問PCM2903C的溫度范圍到底是多少

    如下圖,PCM2903C的溫度范圍到底是多少? 如果用在-25~85℃,是否會出問題?
    發表于 10-14 07:14

    TAS2110 采用內部升壓模式, 輸出功率只有2W不到,是哪里的問題?

    后會恢復,然后又中斷。 所以達不到設計目標5W. 感覺系統哪里有保護啟動了。 請教可能到底是哪里有問題? 哪里起保護了嗎?
    發表于 10-11 06:53

    DRV8332芯片在調試的過程中,輸出始終達不到24V,為什么?

    您好,我們的DRV8332芯片在調試的過程中,輸出始終達不到24V,發現PVDD_A,PVDD_B,PVDD_C供電24V正常,GVDD_A,GVDD_B,GVDD_C,供電12V正常,由于控制
    發表于 09-10 07:04

    功放和運放到底是什么區別?

    想請問一下功放和運放到底是什么區別,感覺只要接一個小負載,運放的輸出電流也可以很大啊?到底有什么區別啊
    發表于 09-10 07:00

    運放的輸入電容到底是什么?

    我想請問一下運放的輸入電容到底是什么?
    發表于 09-04 06:52

    LMH6502的輸入電壓到底是多少?

    LMH6502的輸入電壓到底是多少,我稍微給如大一點點的信號,放大不行還能接受,我衰減都失真,
    發表于 08-27 07:02

    制作了VCA810的壓控增益電路,但是帶寬始終達不到35M,為什么?

    我按照器件手冊上的應用方法制作了VCA810的壓控增益電路,但是帶寬始終達不到35M,勉強也就16M。請問可能是什么原因
    發表于 08-26 07:03

    用OPA820設計差分放大電路時,放大倍數為2倍,輸出卻達不到要求是怎么回事?

    。 也就是說在兩端達不到我的設計要求。于是我又更換了電阻,選擇了360kΩ和180kΩ的電阻來替換2k和1k的,但輸出和之前的相差很小,依然達不到我的要求,請問這是什么原因?我電路上應該做什么改進才能滿足我的設計要求?
    發表于 08-20 07:24

    LM833實際放大倍數為4倍達不到設計的20倍,是什么問題

    LM833實際放大倍數為4倍達不到設計的20倍,是什么問題? 附件是相關電路,謝謝!
    發表于 08-19 06:54

    VCA810放大倍數達不到怎么解決?

    請教下大家,由于接收的信號動態范圍很大,我們選用VCA810,但是測試結果只能到-26到28dB,遠遠達不到±40dB,放大大概在給電壓大于-1.7V的時候就開始出現自激振蕩了,下面是電路圖還有
    發表于 08-16 13:33

    運放旁路電容必須靠近芯片引腳的原因到底是什么

    運放旁路電容必須靠近芯片引腳的原因到底是什么?有的說是怕走線的電感與旁路電容形成諧振,旁路電容靠近運放的時候走線的電感不應該更大了嗎(走線越長,走線的寄生電感也就越大)
    發表于 08-01 06:56
    主站蜘蛛池模板: 成年美女黄网站色大免费视频 | 99香蕉国产| 午夜爱爱爱爱爽爽爽网站免费 | 亚洲一区高清 | 免费特黄视频 | 欧美另类网 | 中文字幕网资源站永久资源 | 亚洲婷婷综合中文字幕第一页 | 扒开末成年粉嫩的流白浆视频 | 久久99精品久久久久久牛牛影视 | ts人妖在线观看 | 亚洲va久久久噜噜噜久久 | 在线一区二区观看 | 卡2卡三卡四卡精品公司 | 五月天六月丁香 | 欧美性猛交ⅹxxx乱大交免费 | 人人免费人人专区 | 日日干天天操 | 日韩特黄毛片 | 在线观看一区二区三区四区 | 四虎在线最新永久免费 | 91精品国产免费久久久久久青草 | 午夜黄色毛片 | 成人国产精品一级毛片了 | 爱看精品福利视频观看 | 欧美18性欧美丶黑吊 | 伊人久久综合网站 | 欧美精品国产第一区二区 | 506rr亚洲欧美 | 最新欧美精品一区二区三区 | 特黄特色的大片观看免费视频 | 丁香欧美 | 天天视频免费观看高清影视 | 国产妇女在线 | 成人精品第一区二区三区 | 字幕网中文aⅴ资源站 | 久久国产中文字幕 | 最近最新免费视频 | 国产伦精品一区二区三区免 | 影院在线观看免费 | 免费视频观看 |