在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過利用機器學習模型破譯古籍

星星科技指導員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-04-08 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了揭示過去的秘密,世界各地的歷史學者花費畢生精力翻譯古代手稿。圣母大學的一個研究小組希望幫助這項任務,用一種新開發的機器學習模型來翻譯和記錄幾百年前的手寫文檔。

利用圣加爾修道院圖書館的數字化手稿和一個考慮到人類感知的機器學習模型 study 在深度學習轉錄能力方面有顯著提高。

“我們正在處理歷史文件,這些文件的書寫風格早已過時,可以追溯到幾個世紀以前,并且使用拉丁語等語言,而拉丁語已經很少使用了。你可以得到這些材料的美麗照片,但我們已經著手做的是以一種模仿專家讀者眼睛對頁面感知的方式自動轉錄,并提供快速、可搜索的文本閱讀,”圣母大學副教授、資深作者沃爾特·舍勒在新聞稿中說。

圣加爾修道院圖書館建于 719 年,是世界上最古老、最豐富的圖書館藏品之一。該圖書館藏有大約 160000 卷書和 2000 份手稿,可追溯到八世紀。在羊皮紙上用現在很少使用的語言手工書寫,這些材料中的許多尚未被閱讀——這是一筆潛在的歷史檔案財富,等待發掘。

機器學習方法能夠自動轉錄這些類型的歷史文件已經在工作中,但挑戰仍然存在。

到目前為止,大型數據集對于提高這些語言模型的性能是必不可少的。由于可供查閱的書籍數量巨大,這項工作需要時間,并且需要相對較少的專家學者進行注釋。缺少知識,如從未編纂過的中世紀拉丁語詞典,構成了更大的障礙。

該團隊將傳統的機器學習方法與研究物理世界和人類行為之間關系的視覺心理物理學相結合,以創建更多信息豐富的注釋。在這種情況下,他們在處理古代文本時將人類視覺測量納入神經網絡的訓練過程。

“這是機器學習中通常不使用的策略。我們通過這些心理物理測量來標記數據,這些測量直接來自于通過行為測量對感知進行的心理學研究。然后,我們通知網絡在感知這些角色方面的常見困難,并可以根據這些測量結果進行糾正,” Scheirer 說。

為了訓練、驗證和測試這些模型,研究人員使用了一套來自圣加爾的可追溯到九世紀的數字化手寫拉丁手稿。他們要求專家閱讀并將文本行中的手動抄本輸入定制的軟件中。測量每次抄寫的時間,可以洞察單詞、字符或段落的難度。根據作者的說法,這些數據有助于減少算法中的錯誤,并提供更真實的讀數。

所有的實驗都是使用 cuDNN-accelerated PyTorch 深度學習框架和 GPU 。“如果沒有 NVIDIA 硬件和軟件,我們肯定不可能完成我們所做的事情。

pYYBAGJPlEWAa7tcAAGssGNMcGs826.png

該研究引入了一種新的深度學習損失公式,該公式結合了人類視覺測量,可應用于手寫文檔轉錄的不同處理管道。信貸: Scheirer 等人/ IEEE

團隊仍在努力改進某些方面。損壞和不完整的文檔以及插圖和縮寫對模型提出了特殊的挑戰。

“由于互聯網規模的數據和 GPU 硬件,人工智能達到了拐點,這將使文化遺產和人文學科與其他領域一樣受益。我們只是初步了解我們可以對這個項目做些什么。

關于作者

Michelle Horton 是 NVIDIA 的高級開發人員通信經理,擁有通信經理和科學作家的背景。她在 NVIDIA 為開發者博客撰文,重點介紹了開發者使用 NVIDIA 技術的多種方式。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4937

    瀏覽量

    131111
  • 互聯網
    +關注

    關注

    55

    文章

    11244

    瀏覽量

    106261
  • 機器學習
    +關注

    關注

    66

    文章

    8500

    瀏覽量

    134493
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣計算中的機器學習:基于 Linux 系統的實時推理模型部署與工業集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學習模型(神經網絡)部署到邊緣設備上,利用從ModbusTCP寄存器獲取的實時數據來預測一臺復古音頻放大器的當前
    的頭像 發表于 06-11 17:22 ?320次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>:基于 Linux 系統的實時推理<b class='flag-5'>模型</b>部署與工業集成!

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編將探討機器學習
    的頭像 發表于 02-13 09:39 ?356次閱讀

    【「基于大模型的RAG應用開發與優化」閱讀體驗】+大模型微調技術解讀

    集對模型進行進一步訓練的過程。 大模型微調是利用預訓練模型的權重和特征,通過在新任務數據集上的訓練,對
    發表于 01-14 16:51

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    。 多模態融合的創新與突破 機器人控制技術的另一個重要突破在于多模態大模型的應用。相比于僅通過文字進行人機交互的傳統方法,現代機器人能夠融合視覺、聲音、定位等多模態輸入信息,為任務執行
    發表于 12-29 23:04

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    醫療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用模型優化手術路徑規劃。工業場景中,協作機器人面臨的主要挑戰是快速適應新工藝流程。具身智
    發表于 12-24 15:03

    cmp在機器學習中的作用 如何使用cmp進行數據對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習中的作用 模型
    的頭像 發表于 12-17 09:35 ?856次閱讀

    什么是機器學習通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發表于 11-16 01:07 ?953次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>通過</b><b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發表于 10-23 15:25 ?2849次閱讀

    AI大模型與傳統機器學習的區別

    AI大模型與傳統機器學習在多個方面存在顯著的區別。以下是對這些區別的介紹: 一、模型規模與復雜度 AI大模型 :通常包含數十億甚至數萬億的參
    的頭像 發表于 10-23 15:01 ?2539次閱讀

    構建語音控制機器人 - 線性模型機器學習

    輪子并識別音頻信號,但它仍然無法通過語音命令控制或按預定義路徑行駛。 線性控制模型 首先要解決的問題是實現直線驅動。為此,我們使用線性模型來控制提供給車輪的電壓。使用線性模型適合對汽車
    的頭像 發表于 10-02 16:31 ?554次閱讀
    構建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以利用
    發表于 08-14 18:00

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    今天來學習大語言模型在自然語言理解方面的原理以及問答回復實現。 主要是基于深度學習和自然語言處理技術。 大語言模型涉及以下幾個過程: 數據收集:大語言
    發表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    這個程序不需要程序員編寫,而是由計算機自動生成。因此,人工編程方法依賴程序員思考的規則,而自動編程是計算機算法通過分析數據自行創建規則。 作者通過類比學生準備高考的過程來說明機器學習
    發表于 07-25 14:33

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    上周收到《大語言模型應用指南》一書,非常高興,但工作項目繁忙,今天才品鑒體驗,感謝作者編寫了一部內容豐富、理論應用相結合、印刷精美的著作,也感謝電子發燒友論壇提供了一個讓我了解大語言模型機器
    發表于 07-21 13:35

    pycharm如何訓練機器學習模型

    PyCharm是一個流行的Python集成開發環境(IDE),它提供了豐富的功能,包括代碼編輯、調試、測試等。在本文中,我們將介紹如何在PyCharm中訓練機器學習模型。 一、安裝PyCharm
    的頭像 發表于 07-11 10:14 ?1684次閱讀
    主站蜘蛛池模板: 成人免费黄色网 | 色噜噜狠狠色综合欧洲selulu | 中文字幕一区二区三区在线不卡 | 久久久久国产精品免费网站 | 一区二区三区伦理 | 2018天天干天天操 | 天天操人人射 | 色五月婷婷成人网 | 黄色大片毛片 | 婷婷综合激情 | 亚洲啪啪网站 | 亚洲成在线 | 大香伊在人线免费 | 在线天堂中文有限公司 | 久久婷五月综合 | 四虎久久影院 | 日韩福利网站 | 久久永久视频 | 午夜情趣视频 | 免费一区在线观看 | 免费视频一区 | 天天综合色天天综合网 | 四虎影院色| 又粗又爽又色男女乱淫播放男女 | 精品伊人久久香线蕉 | 一区二区高清在线 | 国内一级特黄女人精品片 | 操操插插 | 久久三级国产 | 日韩系列 | 黄色网址在线免费观看 | 午夜视频网站在线观看 | 九九热精品国产 | 二级黄的全免费视频 | 久久亚洲精品成人综合 | 久久波多野结衣 | 亚洲小说区图片区另类春色 | 99精品热视频 | 久久精品午夜视频 | 久久看片网 | 日韩一级在线视频 |