在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

會議系統(tǒng)設(shè)計組成及功能

FPGA技術(shù)江湖 ? 來源:FPGA技術(shù)江湖 ? 作者:FPGA技術(shù)江湖 ? 2022-10-19 09:04 ? 次閱讀

01. 設(shè)計概述 1.1 設(shè)計目的
隨著疫情的出現(xiàn),線上會議的應(yīng)用越來越廣泛,相關(guān)的技術(shù)也越來越成熟,但當前的線上會議系統(tǒng)大都基于電腦手機,便于個人使用,但由于其攝像頭拍攝方向固定,當會議一端有多人參與時,就需要每人都單獨開一個窗口才能有較好的效果,較為不便?;诖?,我們設(shè)計了一個新的會議系統(tǒng),以更好地適應(yīng)多人會議的需求。
本系統(tǒng)以 Xilinx PYNQ-Z2 FPGA 為控制核心,將聲源定位與圖像識別相結(jié) 合。通過對環(huán)境聲音的實時檢測,實現(xiàn)對聲源目標的定位,并基于特征提取和模式匹配的方法對目標進行圖像識別,根據(jù)提前訓(xùn)練的數(shù)據(jù)模型,在顯示屏上框出 目標并顯示目標的個人信息。同時,也可以通過 socket 通信將識別后的圖像信息 直接發(fā)送至客戶端(PC 機等)顯示,從而實現(xiàn)遠程會議的效果。
1.2 應(yīng)用領(lǐng)域
本系統(tǒng)理念較為新穎,將聲源定位與圖像識別相結(jié)合,并在 FPGA 上實現(xiàn), 使得系統(tǒng)整體體積與功耗都較小,可以在各種線上會議中使用,在疫情防控常態(tài) 化的當下,應(yīng)用前景十分廣泛。例如,該系統(tǒng)可以用于在企業(yè)之間進行的大型會 議,聲源定位功能可以使攝像頭實時跟蹤講話人,并對其進行識別,顯示人員信 息,這就使得只使用一個客戶端就可以較好地實現(xiàn)多人會議,節(jié)省資源;另外, 該系統(tǒng)在多方參與的學術(shù)會議或國際會議中也都比較適用。
1.3 主要技術(shù)特點

(1)采用四麥克風陣列采集聲音信息,并通過硬件電路將麥克風陣列輸出 PDM 信號直接轉(zhuǎn)換為 I2S 信號送入 FPGA 中處理。 (2)使用 python 編寫的 TDOA 算法進行聲源定位,即先通過 GCC-PHAT 算法 得出不同麥克風芯片接收到聲音的時延,再通過幾何關(guān)系計算出聲源所在的角度。 (3)采用 Haar 特征提取算法檢測人臉區(qū)域,速度快,識別率較高;采用 LBPH 特征識別算法對數(shù)據(jù)集中的圖片進行訓(xùn)練,訓(xùn)練完成后,建立標簽與真實人員姓 名的直接映射表,從而實現(xiàn)身份識別。 (4)基于 socket 通信,使用 UDP 通信協(xié)議,將圖像從 FPGA 中實時傳輸?shù)娇蛻?端 (PC 機等)中顯示,從而實現(xiàn)遠程會議的功能。 1.4 關(guān)鍵性能指標
(1)聲源定位速度與準確率 本系統(tǒng)在環(huán)境噪聲較小的情況下可在 1 秒之內(nèi)完成聲源定位,準確率幾乎為 100%;在環(huán)境噪聲較大的情況下定位時間會稍長,在 2 秒左右也基本可以完成 定位,準確度在 90%以上。 (2)人臉檢測與身份識別速度與準確率 本系統(tǒng)人臉檢測速度較快,當人臉進入攝像頭中部區(qū)域后就可立即框出 人臉,在攝像頭中部區(qū)域人臉檢測準確率幾乎為 100%;身份識別速度較人臉檢 測稍慢,但識別時間都在 0.5s 左右,當人員處于拍攝區(qū)域中部時識別準確率較 高,在 90%以上,當人員處于拍攝區(qū)域邊緣時準確度較低,但也基本都在 80%以 上。 (3)數(shù)據(jù)無線傳輸速率與延時 本系統(tǒng)無線數(shù)據(jù)傳輸時,客戶端(PC)接收到圖像信息的延時在 1s 左右,延時 較低;其傳輸速率也較快,顯示的圖像基本都在 3 幀/秒以上。 1.5 主要創(chuàng)新點
(1)采用了數(shù)字麥克風芯片,抗干擾能力較強,且在使用時外圍電路簡單;使 用四芯片麥克風陣列采集聲音信號,使得其在 360°平面內(nèi)對聲源方向角度的分 辨率大大提高。 (2)采用 AC108 芯片將 PDM 信號轉(zhuǎn)換為 I2S 信號,再送入 FPGA 中處理。 (3)采用 TDOA 算法,并在高速、并行的 FPGA 中實現(xiàn),使得聲源定位的速度 較快,延遲較低。 (4)使用舵機搭建了水平 360°云臺,使攝像頭可以更方便地跟蹤聲源。 (5)系統(tǒng)支持現(xiàn)場錄入人員并學習,且識別率較高。 (6)基于 socket 通信,實現(xiàn)將圖像信息從 FPGA 中實時傳輸?shù)娇蛻舳?PC 機等) 顯示的功能。 (7)該會議系統(tǒng)功耗低、體積小、易安裝并且可供多人在同一客戶端使用。

02. 系統(tǒng)組成及功能部分

2.1 整體介紹

本系統(tǒng)由麥克風陣列模塊、FPGA 處理器模塊、攝像頭模塊、遠程數(shù)據(jù)傳輸 模塊和顯示模塊共同組成。麥克風陣列模塊在檢測聲音信號后,將轉(zhuǎn)換后的 PCM 碼送入 FPGA 處理器模塊處理,實現(xiàn)對聲源目標的定位;攝像頭模塊在接收到 FPGA 處理器模塊發(fā)出的位置信號后,控制攝像頭轉(zhuǎn)向聲源方向,并將攝像頭拍 攝到的圖像信息傳入 FPGA 處理器模塊進行處理,識別其是否為檢測目標,若為 檢測目標則顯示檢測到的人員信息;若沒有檢測到相關(guān)目標,則重新進行聲源定 位。圖 2.1 為系統(tǒng)整體框圖。

ebbcdc24-4f45-11ed-a3b6-dac502259ad0.png

▲圖2.1系統(tǒng)整體框圖

2.2 各模塊介紹

2.2.1 麥克風陣列模塊

系統(tǒng)采用由 KNOWLES 公司制造的性能優(yōu)良的 MEMS 數(shù)字麥克風芯片 SPU0414HR5H,可識別頻率在 100Hz~10kHz 范圍內(nèi)的聲音信號。選用四芯片麥 克風陣列采集聲音信號,輸出四路 PDM 信號到 AC108 芯片中進行解調(diào),輸出 PCM 信號送入 FPGA 中進行處理。其實物圖如下圖所示:

ebe0ba86-4f45-11ed-a3b6-dac502259ad0.png

▲圖2.2.1麥克風陣列

2.2.2 FPGA 處理器模塊

處理器模塊主要采用 Xilinx PYNQ-Z2 開發(fā)板,其由 650MHz 雙核 Coryex-A9 處理器與 FPGA 組成。PYNQ-Z2 開發(fā)板支持 Python 語言開發(fā),也支持使用傳統(tǒng) 的 Xilinx Vivado 開發(fā)工具流程平臺開發(fā)編寫 Verilog 來開發(fā)嵌入式系統(tǒng)應(yīng)用。同 時,PYNQ-Z2 開發(fā)板也具有極其豐富的外設(shè)接口,如千兆以太網(wǎng)口、USB 接口、 UART 接口、HDMI 輸出/輸出接口等常用接口,還提供了兼容 Ardunio、RPi、 Pmod 的擴展接口。

聲源定位算法和圖像識別的算法均在處理器模塊中實現(xiàn)。

(1)TDOA 聲源定位算法

TDOA 定位算法是一種利用時間差進行定位的方法,通過測量信號到達的時 間,可以確定信號源的距離,利用信號源到各個信號接受點的距離,就能確定信 號的位置。采用 GCC-PHAT 算法,先對輸入 FPGA 中的 PCM 信號通過 I2S 協(xié)議 采樣,得到四路數(shù)字信號,以兩個信號為一組,采用廣義互相關(guān)的方法求出時延, 即求兩路信號的互頻譜,得出其頻譜峰值索引,即為聲音到這兩路信號采集點的 時延。得到時延后,根據(jù)幾何關(guān)系,即可求出聲源與兩對角信號采集點連線的角 度,進而得到攝像頭需要旋轉(zhuǎn)的角度信息。

(2)Haar 特征提取算法

系統(tǒng)使用 Haar 特征提取的識別算法進行人臉檢測。Haar 特征提取過程是將 一副圖像中所有黑色矩形框和白色矩形框中所包含的全部像素進行差值運算,得到該圖像的 Haar 特征值,但由于一副圖像中包含的 Haar 特征的個數(shù)較多,對于其中矩形特征的特征值的提取相對比較復(fù)雜,因此采用積分圖像的轉(zhuǎn)換來縮減其計算量,以提高運算速度。

在提取出 Haar 特征后,將其分別轉(zhuǎn)化為弱分類器,然后根據(jù)弱分類器處理樣本數(shù)據(jù),根據(jù)其正確分類樣本的情況來改變其權(quán)值大小,進而產(chǎn)生多個強分類器,然后將這些訓(xùn)練產(chǎn)生的強分類器繼續(xù)迭代,最終獲得一個識別率較高的最終強分類器,從而實現(xiàn)對人臉區(qū)域的準確識別。

(3)LBPH 特征識別算法

系統(tǒng)采用了基于 LBP(局部二值模式)特征的 Adaboost(級聯(lián)分類器)進行人臉 識別。LBP 是典型的二值描述算子,其更多的是整數(shù)計算,可以通過各種邏輯操 作對運算過程進行優(yōu)化,因此效率較高。此外,通常光照對圖像中物體的影響是 全局的,即圖像中物體的明暗程度通常是往同一個方向改變的,只是改變的幅度 會因距離光源的遠近而有所不同,故圖像中局部相鄰的像素間受光照影響后的相 對大小不會改變,LBP 特征也因此對光照具有比較好的魯棒性。Adaboost 是一種 迭代算法,其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的弱分類器,然后把這些弱 分類器集合起來,構(gòu)成一個更強的最終分類器。Adaboost 算法系統(tǒng)具有較高的 檢測速率,且不易出現(xiàn)過適應(yīng)現(xiàn)象。

2.2.3 攝像頭模塊

采用 GUCEE 攝像頭,1200 萬像素,動態(tài)分辨率支持 1920*1080,其機身小 巧,易于安裝,適合在各種環(huán)境下使用。同時,系統(tǒng)搭建了一個攝像頭云臺,使 用一個舵機來控制云臺上攝像頭的轉(zhuǎn)向,使其能在水平 360°范圍內(nèi)跟蹤聲源方位。

2.2.4 遠程數(shù)據(jù)傳輸模塊

系統(tǒng)基于 socket 通信,編寫 python 創(chuàng)建 UDP 服務(wù)端程序,在同一局域網(wǎng)下 可以將圖像信息直接從 FPGA 中發(fā)送到任一客戶端(PC 機等)中,客戶端只需打 開使用 python 編寫好的上位機程序,即可接收到信息并同步顯示。其無線傳輸延遲較小,傳輸速度較快且輸出圖像較為清晰。2.2.5 顯示模塊 采用 Creatblock7 寸 iPS 高清顯示屏,使用 FPGA 中的顯示模塊將識別后的 圖像直接顯示在顯示屏上。

03.

完成情況及性能參數(shù)

3.1 聲源定位

系統(tǒng)可較好實現(xiàn) 360°聲源定位,在環(huán)境噪聲較小的情況下,識別很精準, 誤差不超過 5°,在有一定噪聲干擾的情況下,其識別度也能穩(wěn)定在一定水平, 識別誤差不超過 15%。下表為聲源定位測試結(jié)果:

ec1217d4-4f45-11ed-a3b6-dac502259ad0.png

▲表3.1 單頻聲源定位測試結(jié)果

3.2 身份識別與顯示

系統(tǒng)能夠很好地實現(xiàn)人臉檢測與身份識別功能,且運算速度較快,在識別到 人臉后能夠迅速框出人臉,并將其人臉特征與數(shù)據(jù)庫中錄入特征進行匹配,若匹 配到相應(yīng)的人臉信息則直接在方框上方顯示當前人員信息,若未匹配到相應(yīng)人臉 信息,則只框出人臉。人臉檢測識別率很高,識別速度較快;身份識別速度較快, 在單人識別時成功率較高,達到 90%以上,當同時有多人在識別范圍內(nèi)時識別準 確度會受到影響,但也基本在 80%以上。識別后的圖像可以清晰地在顯示屏上顯 示,并且顯示延遲較小。下圖為人臉檢測與身份識別顯示畫面:

ec2c784a-4f45-11ed-a3b6-dac502259ad0.png

3.3 無線數(shù)據(jù)傳輸

系統(tǒng)通過 socket 通信,可以將圖像信息直接通過局域網(wǎng)傳輸?shù)娇蛻舳酥?,這 里使用 PC 機作為客戶端,在運行上位機程序后即可接收到從 FPGA 中實時傳輸?shù)膱D像。通過 FPGA 上的撥碼開關(guān)可以控制傳輸圖像的模式,即實時顯示模式和 身份識別模式。下圖為 PC 機接收到的圖像:

ec683fce-4f45-11ed-a3b6-dac502259ad0.png

04.

完成情況及性能參數(shù)

4.1 可擴展之處

(1)當前系統(tǒng)聲源定位在特定位置處定位誤差會略大,同時,在環(huán)境噪音較大 的情況下,也會對聲源定位造成一定影響。可通過增加麥克風數(shù)量,改變麥克風陣列結(jié)構(gòu)或改進聲源定位算法等進一步提高系統(tǒng)聲源定位的精度與抗干擾性。

(2)拓展圖像處理功能,將攝像頭拍到的圖像降噪,并根據(jù)圖像的具體情況自 動將圖像的亮度和對比度等特性調(diào)節(jié)到合適的值。

(3)當前系統(tǒng)無線數(shù)據(jù)傳輸功能只能將FPGA拍攝到的圖像數(shù)據(jù)發(fā)送到和FPGA 連接在同一局域網(wǎng)內(nèi)的客戶端中,可以進一步完善無線傳輸功能,使得 FPGA可以直接將圖像數(shù)據(jù)發(fā)送到外網(wǎng)的客戶端中,增加系統(tǒng)的實用性。

(4)優(yōu)化圖像處理算法,進一步提高人臉識別算法的準確度與魯棒性。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2179

    瀏覽量

    123995
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    526

    瀏覽量

    38829
  • 會議系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    47

    瀏覽量

    11917

原文標題:基于 FPGA 的會議系統(tǒng)設(shè)計

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    技術(shù)淺析:啟拓會議系統(tǒng)五步選擇

    困難?! ∫虼嗣绹娮咏?jīng)銷商啟拓電子為消費者來談?wù)勅绾稳ミx擇會議系統(tǒng),首先要明確的明白會議系統(tǒng)的分類,第一類要依據(jù)功能組成模式來劃分。常見的調(diào)音臺為主
    發(fā)表于 03-14 09:46

    WIFI技術(shù)在會議系統(tǒng)中的應(yīng)用

    。基于WIFI技術(shù)的會議系統(tǒng)再以下方面為有著明顯的應(yīng)用優(yōu)勢: 提高用戶效率。調(diào)查結(jié)果顯示,使用 Wi-Fi 接入功能的用戶能夠更出色地保持與客戶和辦公室之間的聯(lián)系。比如說,如果銷售人員參加會議,而他們能夠在
    發(fā)表于 04-09 09:55

    視頻會議系統(tǒng)原理

    視頻會議系統(tǒng)原理
    發(fā)表于 08-20 10:33

    視頻會議系統(tǒng)穩(wěn)定性更重要

    。 辰聯(lián)視頻會議系統(tǒng)引入“雙流融合”產(chǎn)品理念、集視頻、音頻、數(shù)據(jù)等功能于一體,連通專網(wǎng)、Intenet網(wǎng)、3G寬帶、衛(wèi)星網(wǎng)絡(luò)、DDN、ISDN等所有寬帶網(wǎng)絡(luò),是真正意義全網(wǎng)域視頻會議系統(tǒng)。突出的數(shù)據(jù)
    發(fā)表于 02-21 10:53

    什么牌子的視頻會議系統(tǒng)好?

    視頻會議系統(tǒng)好不好還需要看功能是否齊全和實用只要是要用視頻會議系統(tǒng)的企事業(yè)單位都希望是可以高效的遠程隨時隨地開會,培訓(xùn)或討論的。因此,一款好的視頻會議系統(tǒng)必須要可以支持遠程視頻會面,需
    發(fā)表于 04-26 17:49

    功能電話會議系統(tǒng)與視頻會議設(shè)計方案參考

    本帖最后由 宏芯佳 于 2017-9-10 21:31 編輯 本方案思路針對目前市面上電話會議系統(tǒng)成本高,功能單一而設(shè)計。采用低成本,功能多樣的USB聲卡加消回音芯片方案,不僅可以用于電腦
    發(fā)表于 09-10 21:27

    功能會議系統(tǒng)的解決方案

    作為一個完善的多功能會議系統(tǒng)的解決方案,不僅要有優(yōu)質(zhì)的會議系統(tǒng)設(shè)備,在系統(tǒng)功能擴充上還需要結(jié)合諸如DVD、錄音卡座、投影機、大屏幕圖型處理器
    發(fā)表于 09-21 10:31

    完整視頻會議系統(tǒng)組成部分有哪些?

    完整視頻會議系統(tǒng)組成部分有哪些?   一套完整的視頻會議系統(tǒng)通常由視頻會議終端、多點控制單元MCU、網(wǎng)絡(luò)管理軟件、傳輸
    發(fā)表于 02-21 09:47 ?7353次閱讀

    什么是數(shù)字會議系統(tǒng)

    什么是數(shù)字會議系統(tǒng) 數(shù)字會議系統(tǒng)系統(tǒng)一般由網(wǎng)絡(luò)子系統(tǒng)、投影顯示子系統(tǒng)、音響子系統(tǒng)、監(jiān)控子
    發(fā)表于 02-21 10:44 ?684次閱讀

    什么是智能會議系統(tǒng)

    什么是智能會議系統(tǒng) 1、什么是智能會議系統(tǒng)?  是通過中央控制器對各種會議設(shè)備及會議環(huán)境進行集中控制的
    發(fā)表于 02-21 10:44 ?1321次閱讀

    音頻會議系統(tǒng)的種類有哪些?

    音頻會議系統(tǒng)的種類有哪些?   音頻會議系統(tǒng)按照系統(tǒng)功能的不同分為:  1、討論型會
    發(fā)表于 02-21 11:02 ?1148次閱讀

    數(shù)字會議系統(tǒng)的原理、特點及組成

    數(shù)字會議系統(tǒng)的原理、特點及組成 數(shù)字會議系統(tǒng)的定義及原理   數(shù)字
    發(fā)表于 02-21 11:04 ?1546次閱讀

    視頻會議系統(tǒng),視頻會議系統(tǒng)是什么意思

    視頻會議系統(tǒng),視頻會議系統(tǒng)是什么意思  視頻會議視頻會議系統(tǒng),又稱會議電視系統(tǒng),是指兩個或兩個
    發(fā)表于 03-24 10:18 ?3493次閱讀

    【轉(zhuǎn)】數(shù)字會議系統(tǒng)功能之解析

    表決、智能控制等功能,實現(xiàn)會議數(shù)字化,提高會議效率。下面就來詳細解析下邁拓維矩數(shù)字會議系統(tǒng)的構(gòu)成與優(yōu)勢吧! 邁拓維矩數(shù)字會議系統(tǒng)包含:高清數(shù)
    發(fā)表于 05-20 17:37 ?1189次閱讀

    無線數(shù)字會議系統(tǒng)的設(shè)計理念與功能

    無線數(shù)字會議系統(tǒng)是一種便捷、高效、現(xiàn)代化的會議解決方案。它基于先進的技術(shù)和人性化的設(shè)計理念,為使用者提供了一系列實用的功能。本文將詳細介紹無線數(shù)字會議系統(tǒng)的設(shè)計理念與
    的頭像 發(fā)表于 01-24 15:07 ?1442次閱讀
    主站蜘蛛池模板: 天天爱天天干天天操 | 夜夜操天天射 | 午夜无码国产理论在线 | 人人舔人人爱 | 天天碰人人 | 欧美色视频在线观看 | 国产精品一区在线播放 | 免费看的黄网站 | 特黄色一级毛片 | 中文天堂最新版资源新版天堂资源 | 欧美美女被日 | 国产精品国产午夜免费福利看 | 欧美全免费aaaaaa特黄在线 | 日本污视频网站 | 一级毛片aaaaaa免费看 | 国产gav成人免费播放视频 | 日本美女视频网站 | 欧美肉到失禁高h视频在线 欧美三级成人 | 日本不卡免费一区 | 天天色综合天天 | 综合天天 | 欧美色视频网 | 男女在线免费视频 | 欧美人与z0xxxx另类 | wwwxxxx在线观看 | 久久精品网站免费观看 | 国产视频福利 | 日本黄色片在线观看 | 性欧美一级 | 色窝视频 | 91极品反差婊在线观看 | 国产成人精品日本亚洲网站 | 天天色姑娘 | 5月丁香6月婷婷 | 国产成人精品一区二区仙踪林 | 国产成人一区二区在线不卡 | aaa一级| 亚欧洲乱码专区视频 | 操片免费 | 久久视频免费看 | 插插插操操操 |