91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習中賦予了什么數(shù)學意義

姚小熊27 ? 來源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-10-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習中的用于聲稱性能的指標標準很少被討論。由于在這個問題上似乎沒有一個明確的、廣泛的共識,因此我認為提供我一直在倡導并盡可能遵循的標準可能會很有趣。它源于這個簡單的前提,這是我的科學老師從中學開始就灌輸給我的:

科學報告的一般規(guī)則是,您寫下的每個數(shù)字都應為“真”的,因為“真”的定義是什么。

讓我們來研究一下這對測試性能等統(tǒng)計量意味著什么。當你在科學出版物中寫下以下陳述時:

測試準確率為52.34%。你所表達的是,據(jù)你所知,你的模型在從測試分布中提取的未見數(shù)據(jù)上成功的概率在0.52335和0.52345之間。

這是一個非常強有力的聲明。

考慮你的測試集是從正確的測試分布中抽取的N個樣本IID組成的。成功率可以表示為一個二項式變量,其平均概率p由樣本平均值估計:p?s/N

其標準差為:σ=√p(1-p)。

其中當p=0.5時,其上限為0.5。

在正態(tài)近似下,估計量的標準差為:δ=σ/√N。

這個精度估計上的誤差δ是這樣的,在最壞的情況下,有約50%的精度:

換句話說,為了保證上述報告中例子52.34%的準確率,你的測試集的大小至少應該在30M樣本的數(shù)量級上!這種粗略的分析很容易轉化為除了準確率以外的任何可計算的數(shù)量,盡管不能轉化為像似然率或困惑度這樣的連續(xù)數(shù)字。

下面是一些常見的機器學習數(shù)據(jù)集的說明。

在ImageNet上可以合理地報告多少位數(shù)的精度?準確率在80%左右,測試集是15萬張圖片:

√(0.8*0.2/150000)=0.103%

這意味著你幾乎可以報告XX.X%的數(shù)字,而實際上每個人都是這樣做的。

MNIST呢,準確率在99%:

√(0.99*0.01/10000)=0.099%

噗,也報個XX.X%就OK了!

然而,最值得注意的是,在大多數(shù)情況下,性能數(shù)據(jù)并不是單獨呈現(xiàn)的,而是用來比較同一測試集上的多種方法。在這種情況下,實驗之間的抽樣方差會被抵消,即使在樣本量較小的情況下,它們之間的準確度差異也可能在統(tǒng)計學上很顯著。估計圖方差的一個簡單方法是執(zhí)行bootstrap重采樣。更嚴格、通常更嚴格的檢驗包括進行配對差異檢驗或更普遍的方差分析。

報告超出其內在精度的數(shù)字可能很具有極大的吸引力,因為在與基線進行比較的情況下,或者當人們認為測試集是一成不變的情況下,同時也不是從測試分布中抽取的樣本時,性能數(shù)字往往更加重要。當在生產(chǎn)中部署模型時,這種做法會讓人感到驚訝,并且固定的測試集假設突然消失了,還有一些無關緊要的改進。更普遍的是,這種做法會直接導致對測試集進行過擬合。

那么,在我們的領域中數(shù)字為“真”意味著什么?好吧,這確實很復雜。對于工程師而言,很容易辯稱不應該報告的尺寸超出公差。或者對于物理學家來說,物理量不應超過測量誤差。對于機器學習從業(yè)者,我們不僅要應對測試集的采樣不確定性,而且還要應對獨立訓練運行,訓練數(shù)據(jù)的不同初始化和改組下的模型不確定性。

按照這個標準,在機器學習中很難確定哪些數(shù)字是“真”的。解決辦法當然是盡可能地報告其置信區(qū)間。置信區(qū)間是一種更精細的報告不確定性的方式,可以考慮到所有隨機性的來源,以及除簡單方差之外的顯著性檢驗。它們的存在也向你的讀者發(fā)出信號,表明你已經(jīng)考慮過你所報告的內容的意義,而不僅僅是你的代碼所得到的數(shù)字。用置信區(qū)間表示的數(shù)字可能會被報告得超出其名義上的精度,不過要注意的是,你現(xiàn)在必須考慮用多少位數(shù)來報告不確定性,正如這篇博文所解釋的那樣。一路走來都是烏龜。

數(shù)字少了,雜亂無章的東西就少了,科學性就強了。

避免報告超出統(tǒng)計學意義的數(shù)字結果,除非你為它們提供一個明確的置信區(qū)間。這理所當然地被認為是科學上的不良行為,尤其是在沒有進行配對顯著性測試的情況下,用來論證一個數(shù)字比另一個數(shù)字好的時候。僅憑這一點就經(jīng)常有論文被拒絕。一個良好的習慣是對報告中帶有大量數(shù)字的準確率數(shù)字始終持懷疑態(tài)度。還記得3000萬、30萬和30萬的經(jīng)驗法則對最壞情況下作為“嗅覺測試”的統(tǒng)計顯著性所需樣本數(shù)量的限制嗎?它會讓你避免追逐統(tǒng)計上的“幽靈”。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134567
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    LD Gen2 Lite激光雷達:賦予機器人 “感知力” 的關鍵

    機器人的感知世界里,激光雷達宛如一雙敏銳的“慧眼”,賦予機器人“看”清周圍環(huán)境、自主決策的能力。亮道智能最新推出的純固態(tài)Flash短距激光雷達LD Gen2 Lite,憑借其獨特的技術優(yōu)勢,在
    的頭像 發(fā)表于 04-25 10:42 ?209次閱讀

    嵌入式AI技術之深度學習:數(shù)據(jù)樣本預處理過程中使用合適的特征變換對深度學習意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡實現(xiàn)機器學習,網(wǎng)絡的每個層都將對輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡構成深度學習的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用深度學習
    的頭像 發(fā)表于 04-02 18:21 ?877次閱讀

    數(shù)學專業(yè)轉人工智能方向:考研/就業(yè)前景分析及大學四年學習路徑全揭秘

    隨著AI技術的不斷進步,專業(yè)人才的需求也日益增長。數(shù)學作為AI的基石,為機器學習、深度學習、數(shù)據(jù)分析等提供理論基礎和工具,因此越來越多的
    的頭像 發(fā)表于 02-07 11:14 ?1094次閱讀
    <b class='flag-5'>數(shù)學</b>專業(yè)轉人工智能方向:考研/就業(yè)前景分析及大學四年<b class='flag-5'>學習</b>路徑全揭秘

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章,我們介紹機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多
    的頭像 發(fā)表于 12-30 09:16 ?1180次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?452次閱讀

    zeta在機器學習的應用 zeta的優(yōu)缺點分析

    在探討ZETA在機器學習的應用以及ZETA的優(yōu)缺點時,需要明確的是,ZETA一詞在不同領域可能有不同的含義和應用。以下是根據(jù)不同領域的ZETA進行的分析: 一、ZETA在機器
    的頭像 發(fā)表于 12-20 09:11 ?1120次閱讀

    cmp在機器學習的作用 如何使用cmp進行數(shù)據(jù)對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?869次閱讀

    傅立葉變換在機器學習的應用 常見傅立葉變換的誤區(qū)解析

    傅里葉變換在機器學習的應用 傅里葉變換是一種將信號分解為其組成頻率分量的數(shù)學運算,它在機器學習
    的頭像 發(fā)表于 12-06 17:06 ?1049次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)主要以數(shù)據(jù)的形式存在,因此機器學習需要設法對數(shù)據(jù)進行分析學習,這就使得它逐漸成為智能數(shù)據(jù)分析技術的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?959次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發(fā)表于 11-15 09:19 ?1208次閱讀

    eda在機器學習的應用

    機器學習項目中,數(shù)據(jù)預處理和理解是成功構建模型的關鍵。探索性數(shù)據(jù)分析(EDA)是這一過程不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機器學習
    的頭像 發(fā)表于 11-13 10:42 ?885次閱讀

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    。 時間序列的單調性理論是數(shù)學求導。下面是使用EWMA分析股票價格變動,以決定買入還是賣出。通過仿真數(shù)據(jù),這種指數(shù)移動平均的技術剔除了短期波動,有助看清股票整體趨勢。 通過對本章學習,對時間序列的研究目的、方法與特征有較全
    發(fā)表于 08-17 21:12

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎理論出發(fā),逐步深入到機器學習算法在時間序列預測的應用,內容全面,循序漸進。每一章都經(jīng)過精心設計,對理論知識進行了詳細的闡述,對實際案例進行了生動的展示,使讀者在理論與實踐
    發(fā)表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示
    發(fā)表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供一個讓我學習時間序列及應用的機會! 前言第一段描述
    發(fā)表于 08-11 17:55
    主站蜘蛛池模板: 5g影院午夜伴侣 | 午夜小视频在线 | 欧美色亚洲 | 亚洲性夜| 色多多在线 | 可以免费看黄的网站 | 国内久久精品 | 一级片高清 | 免费一级毛片无毒不卡 | 色视频日本 | 亚洲天堂视频一区 | 中国一级特黄特级毛片 | 日韩亚射吧 | 欧美亚洲综合另类成人 | 亚洲视频一区二区在线观看 | 1024国产看片在线观看 | 新午夜影院 | 亚洲高清资源 | 性做久久久久久久免费观看 | 污视频18高清在线观看 | 国产女人和拘做受视频免费 | 欧洲亚洲国产精华液 | 亚洲一区二区色 | videosgratis欧美另类老太 | 婷婷第四色| 成人免费的性色视频 | xx日本69| 免费看的一级毛片 | 一二三区在线视频 | 亚洲精品aaa揭晓 | 视频免费在线 | 黄色在线播放视频 | 午夜精品福利在线观看 | 精品国产综合区久久久久99 | www国产永久免费视频看看 | 天天操天天谢 | 亚洲成人网在线观看 | 最新国产精品视频免费看 | 69国产视频| 清纯唯美亚洲综合欧美色 | 看视频免费网址 |