在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>電子資料>支持語音的可教學機器構建

支持語音的可教學機器構建

2023-06-29 | zip | 0.13 MB | 次下載 | 2積分

資料介紹

描述

介紹

在這個項目中,我構建了一個支持語音的可教學機器,它可以掃描書頁或任何文本源中的文本并將其轉換為上下文,用戶可以提出與該上下文相關的問題,機器可以僅使用上下文進行回答。我一直想制造這種易于部署的邊緣設備,并且可以輕松地針對給定的上下文進行訓練,而無需任何互聯網連接。

應用程序中使用的機器學習模型

使用了三種機器學習模型:

1. Tesseract OCR(基于 LSTM 的模型)

Tesseract 是一個 OCR 引擎,支持 unicode 并且能夠開箱即用地識別 100 多種語言。它可以被訓練來識別其他語言。

2. DeepSpeech(TensorFlow Lite 模型)

DeepSpeech 是一個開源的 Speech-To-Text 引擎,使用由機器學習技術訓練的模型,谷歌的 TensorFlow 使實現更容易。

3.伯特

BERT 是一種語言表示模型,代表 Transformers 的雙向編碼器表示。預訓練的 BERT 模型只需一個額外的輸出層即可進行微調,從而為各種任務(例如問答和語言推理)創建最先進的模型,而無需對特定于任務的架構進行大量修改。

前 2 個模型在 Raspberry Pi 4 上運行,最后一個模型在英特爾神經計算棒 2 上使用 OpenVINO 工具包運行。

安裝說明

請按照下面給出的分步說明下載并安裝應用程序的所有先決條件。假設已經安裝了 Raspberry PI OS(以前稱為 Raspbian),并且使用 raspi-config 實用程序啟用了 SSH、音頻、SPI、I2C 和攝像頭。

安裝適用于 Raspberry Pi OS 的 OpenVINO 工具包

$ sudo apt update

$ sudo apt install festival cmake wget python3-pip

$ mkdir -p ~/Downloads 

$ cd ~/Downloads

$ wget https://download.01.org/opencv/2020/openvinotoolkit/2020.4/l_openvino_toolkit_runtime_raspbian_p_2020.4.287.tgz

$ sudo mkdir -p /opt/intel/openvino

$ sudo tar -xf  l_openvino_toolkit_runtime_raspbian_p_2020.4.287.tgz --strip 1 -C /opt/intel/openvino

設置 USB 規則

$ sudo usermod -a -G users "$(whoami)"

現在注銷并重新登錄。

初始化 OpenVINO 環境

$ source /opt/intel/openvino/bin/setupvars.sh

為英特爾神經計算棒 2 安裝 USB 規則

$ sh /opt/intel/openvino/install_dependencies/install_NCS_udev_rules.sh

現在插入英特爾神經計算棒 2。

Festival(語音合成系統框架)配置

Replace the following line in the /etc/festival.scm:  
(Parameter.set 'Audio_Command "aplay -q -c 1 -t raw -f s16 -r $SR $FILE")
with the line below:
(Parameter.set 'Audio_Command "aplay -Dhw:0 -q -c 1 -t raw -f s16 -r $SR $FILE")

為 Respeaker 2-mics PI HAT 安裝驅動程序

$ cd ~
$ git clone https://github.com/HinTak/seeed-voicecard
$ cd seeed-voicecard
$ sudo ./install.sh
$ sudo reboot

下載應用程序存儲庫

$ cd ~ 
$ git clone https://github.com/metanav/TeachableMachine

下載 BERT 模型 OpenVINO 中間表示文件

$ cd ~/TeachableMachine

$ mkdir models

$ cd models 

$ wget https://download.01.org/opencv/2020/openvinotoolkit/2020.4/open_model_zoo/models_bin/3/bert-small-uncased-whole-word-masking-squad-0001/FP16/bert-small-uncased-whole-word-masking-squad-0001.bin

$ wget https://download.01.org/opencv/2020/openvinotoolkit/2020.4/open_model_zoo/models_bin/3/bert-small-uncased-whole-word-masking-squad-0001/FP16/bert-small-uncased-whole-word-masking-squad-0001.xml

下載 DeepSpeech 模型文件

$ cd ~/TeachableMachine/models 

$ wget https://github.com/mozilla/DeepSpeech/releases/download/v0.8.2/deepspeech-0.8.2-models.tflite

$ wget https://github.com/mozilla/DeepSpeech/releases/download/v0.8.2/deepspeech-0.8.2-models.scorer

運行應用程序

$ cd ~/TeachableMachine
$ pip3 install -r requirements.txt
$ python3 main.py

它是如何工作的?

Raspberry Pi 4 連接到 ReSpeaker 2-mics PI HAT,用于使用板載麥克風接收語音。Raspberry Pi 攝像頭模塊使用 CSI2 連接器連接到 Raspberry Pi 4,該連接器用于掃描書中的文本。ReSpeaker 2-mics PI HAT 上有一個按鈕,用于觸發掃描過程的開始。按下按鈕后,用戶必須在 5 秒內立即向相機顯示文本(書頁或帶有一些有意義的英文文本的論文,例如故事段落或維基百科條目)。使用 Tesseract OCR 應用程序捕獲書頁圖像并將其轉換為文本。捕獲的文本用作 BERT 模型的上下文,用于回答問題。機器要求用戶提問。用戶提出問題并使用 DeepSpeech 應用程序將問題語音轉換為文本。轉換后的問題文本被輸入到在英特爾神經計算棒 2 上運行的 BERT 模型中,該模型通過置信度分數推斷出答案。使用 Festival 應用程序將最佳答案文本轉換為語音,該應用程序在連接到 Raspberry Pi 4 音頻輸出(3.5 毫米插孔)的揚聲器上播放。請參閱連接圖的原理圖部分并查看下面的流程圖以更好地了解應用流程。使用 Festival 應用程序將最佳答案文本轉換為語音,該應用程序在連接到 Raspberry Pi 4 音頻輸出(3.5 毫米插孔)的揚聲器上播放。請參閱連接圖的原理圖部分并查看下面的流程圖以更好地了解應用流程。使用 Festival 應用程序將最佳答案文本轉換為語音,該應用程序在連接到 Raspberry Pi 4 音頻輸出(3.5 毫米插孔)的揚聲器上播放。請參閱連接圖的原理圖部分并查看下面的流程圖以更好地了解應用流程。

流程圖

poYBAGN7JDaAd5VEAACp6VBR8Ps291.jpg
?

?

?


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數據手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費
主站蜘蛛池模板: 日日摸人人看97人人澡 | 人人艹人人干 | 久久综合九色综合97婷婷群聊 | 国产成人亚洲日本精品 | 色香影视| 一级片+国产 | 男人天堂网2021 | 国产性色视频 | 影院在线观看免费 | 久久精品最新免费国产成人 | 色视频在线免费观看 | 亚洲欧美色一区二区三区 | 免费视频性 | 农村妇女野外一级毛片 | 欧美性色欧美a在线观看 | 免费在线看视频 | 97在线亚洲 | 久青草免费视频手机在线观看 | 日本福利小视频 | 成人国产永久福利看片 | 1024手机看片欧美日韩 | 色站视频 | 免费人成激情视频在线观看冫 | 一区二区三区在线看 | 久久精品亚洲一区二区三区浴池 | аⅴ资源中文在线天堂 | 亚洲第一网站 | 国产汉服被啪福利在线观看 | 在线黄网 | 三级色网站 | 乱j伦小说在线阅读 | 黄色免费网站在线 | 婷婷激情四月 | 大色综合色综合网站 | 女女综合网| 国产美女亚洲精品久久久久久 | 亚洲一区二区三区网站 | 男啪女视频免费观看网站 | 日本特黄特色特爽大片老鸭 | 免费观看黄色在线视频 | 亚洲第一区二区快射影院 |