FPGA在Web搜索和信息檢索中的應用

無論為數以百萬計的用戶搜索請求提供服務還是處理超大量的信息，都需要數量龐大的計算資源，進而消耗大量能源。事實上，用于計算與冷卻的能耗費用是數據中心運營的最大成本 [1]。隨著數據中心的數量和規模不斷增長，如果其能耗保持當前水平的話，那么預計數據中心的二氧化碳排放量到 2020 年將超過航空公司 [2]。因而亟需開發能夠處理巨量數據的低能耗解決方案。數據中心的環保化發展是互利共贏的，服務供應商不僅能夠顯著降低運營成本，同時還能最大限度減少對環境的影響。

FPGA在加速Web搜索及類似信息檢索等常見數據中心工作任務方面擁有巨大的潛力，因為它具備固有的并行處理與低功耗優勢。充分認識到這一潛力的奧地利公司Matrixware購買了FPGA平臺，但缺乏自身實施復雜信息檢索應用的技術，因而公司聘請了我們聯合格拉斯哥大學 (University of Glasgow) 計算機系組建的團隊開發 FPGA 加速型專利搜索解決方案的概念驗證方案。該團隊成員包括三名設計人員和兼職助理研究員Stelios Papanastasious，他們在信息檢索、FPGA以及系統開發領域積累了豐富的專業知識，形成了一個開發原型應用所不可或缺的技能嫻熟的組合。經討論，大家一致同意采用FPGA加速型后端進行實時專利過濾應用的開發。

項目資源在人力和時間方面受到很大制約。因此，采用HDL實施過濾算法不可行，因而我們決定采用瑞典公司Mitrionics開發的高級編程解決方案。原型應用在去年11月于奧地利維也納舉行的信息檢索設施研討會(Information Retrieval Facility Symposium)上引起了專利研究人員的極大興趣。處理數以百萬份的專利通常需要幾分鐘，但若采用FPGA加速型后端，幾秒鐘就能反饋結果。

我們在2009年7月舉行的ACM SIGIR國際信息檢索研究暨開發大會(ACM SIGIR International Conference
on Information Retrieval Research and Development) 上發布了結果，介紹了相關的性能提升情況 [3]，并在FPL 2009國際現場可編程邏輯大會上對架構設計進行了詳細闡述 [4]。

文檔過濾的輸入與輸出通常情況下，信息過濾任務是指檢查傳送進來的文檔是否與一系列既定的需求信息或配置文件相匹配 [5]。這種任務可在多種情況下出于多種原因而進行，例如，檢測傳送進入的電子郵件是不是垃圾郵件，比較專利申請是否與現有專利發生重疊，監控是否存在恐怖活動通信，監測并跟蹤新聞報道，等等。面對大量涌入的文檔，處理工作必須實時完成，從而確保時效性成為重中之重。鑒于此，我們的目標就是采用FPGA來實施完成計算強度最大的過濾應用，從而在節約時間和降低能耗的情況下提高文檔過濾的效率。

在本文中，我們將采用Lavrenko和Croft提出的相關性模型 [6]。這一理念適用于信息過濾任務，可通過生成概率語言模型確定傳入文檔是否與主題配置文件存在差異。如果文檔得分超過用戶定義的閾值，那么就視為與主題配置文件相關。

在FPGA上實施的算法表達如下：文檔可以建模為一個“詞袋”，即由(t,f )對組成的D集，其中 f=n(t,d)，t 表示 t 這個詞在文檔d中出現的次數。配置文件M為一組對 p=(t,w)，這里的w加權為：

給定文檔對于給定配置文件的得分計算為：

這里，T是指在D和M中都出現的詞。該函數是大多數過濾算法的代表性內核算法，不同算法的主要區別在于配置文件中詞的加權。

圖 1 —— 系統架構以可作為客戶端與后端服務器之間代理的通信服務器為中心。

應用架構

文檔過濾應用采用客戶端—服務器架構，其構成形式為將基于GUI的客戶由FPGA加速的部分受限于計算強度最大的任務，也就是文檔與配置文件的匹配。主機系統則負責處理所有其他的任務（參見圖 2）。

配置文件服務器根據從客戶端獲得的配置文件過濾一系列文檔，并返回分數流。為了評估性能，我們同時創建了C++ 參考實施和FPGA加速實施方案。兩種版本的實施方案基本功能相同，都能通過TCP/IP接口接收構成配置文件的文檔列表，用相關性模型構建配置文件，并根據該配置文件對存儲器緩沖的文檔進行評分，從而通過TCP/IP向客戶端返回文檔分數流。可在存儲器中緩沖文檔流，否則會由于緩慢的磁盤存取影響應用的性能。

我們在具有兩個RC100刀片的SGI Altix 4700設備上實施該應用，其中的每個刀片都包含兩個運行頻率為 100 MHz
的賽靈思Virtex?-4 LX200 FPGA；每個FPGA都通過SGI NUMAlink高速I/O接口連接到主機平臺，并能通過最高速度為每秒 16GB 的 128 位數據總線存取本地 64MB 的 SRAM 存儲庫。主機系統是一套80個內核的64位NUMA設備，運行性能為64位Linux (OpenSuSE)。處理器為雙核Itanium-2，運行頻率1.6 GHz，其中每個處理器都能直接存取4GB 的存儲器，而且能通過 NUMAlink存取完整的320GB存儲器空間。值得注意的是，Itanium處理器功耗約為130瓦特 [7]，而每個Virtex-4 FPGA的功耗僅約1.25 W [8]。

對于 C++ 語言應用而言，我們實施 Lemur 信息檢索 (IR) 框架，對于與FPGA 應用的交互，我們則使用 SGI可配置專用計算 (RASC) 庫。Lemur Toolkit（詳情訪問）是一套開源工具集，專為IR研究而精心設計，可支持索引以及多種相關性和檢索模型。RASC 庫是 SGI的專有解決方案，能夠通過高性能 NUMAlink互連機制將 FPGA 與主機系統相集成。RASC 庫定義的硬件抽象 API 可控制系統中的所有硬件元素。

我們用 Mitrionics 軟件開發工具套件 (SDK) 將特定域的 Mitrion-C 語言轉換為 VHDL。生成的VHDL 現在能夠方便地指向 FPGA 器件架構。我們采用帶XST 合成工具的賽靈思 ISE? 工具鏈來創建 Virtex-4 比特流。

圖 2 —— 在FPGA子系統架構中，Virtex-4器件通過SGI的NUMAlink接口與主機平臺連接。

高級FPGA編程

Mitrionics SDK可提供Mitrion-C作為高級語言，專用于滿足在FPGA上快速開發應用之需。不過，作為后綴的C有些誤導作用。盡管這種語言采用了C風格的語法，但實際上是一種遵循函數編程風格的單賦值數據流語言。Mitrion-C原生支持廣泛（矢量）而深入（管道）的并行功能，因而非常適用于處理數據流的算法，例如過濾以及其他眾多類型的文本和數據挖掘算法等。

Mitrion-C還提供了一種流數據類型，可配合foreach looping構造實現流水線操作；此外，還提供矢量數據類型以支持數據并行工作，以及支持順序列表的列表數據類型。具體而言，用戶可過濾foreach loop的流輸出，生成較小的流，如以下Mitrion-C代碼示例所示。此外，程序人員還能用元組結構(tuple construct) 創建功能強大的數據類型。最后還有一個需要指出的特性是，該語言能支持可變寬度整數和浮點數。

為了在FPGA上高效實施評分操作，我們必須解決的關鍵問題是高效查詢配置文件以及文檔流的高效I/O流。

對于文檔中的每個詞，應用都要查詢配置文件中相應的詞并獲得詞加權 (term weight)。由于大多數查詢都找不到結果（即大多數文檔的大多數詞不會出現在配置文件中），因此必須首先丟棄否定詞。鑒于此，我們在FPGA Block RAM 中采用了Bloom過濾器[9]。BRAM的內部帶寬越高，拒絕否定詞的結果就越快。由于需要查詢，因此配置文件必須作為某種散列函數進行實施。不過，由于配置文件的大小不能提前知道，因而我們不可能構建出完美的散列函數。不完美的散列函數會出現沖突問題，進而降低性能。

為了解決這一問題，我們采用了分檔方案，即將外部SRAM分區為bin，每個bin都可包含固定數量的配置文件詞。Bin的大小決定了可處理的沖突數。如需給bin分配配置文件詞，只需將詞ID的較下部分作為存儲器地址，從而避免了實際的散列操作。

讓SRAM存儲器容量設定為NM配置文件詞。詞ID是一個無符號的整數，其范圍取決于詞匯量，就我們的例子而言約為 400 萬個詞，需要 24 位。詞加權為 8.32 定點數，因而配置文件詞需要64位。RC100上的SRAM包括4個16MB存儲庫，因此NM=223。Bins的數量nb=NM/b和bin地址用詞ID“t”進行計算，即 (t&(nb-1)).b。

Bin的占用概率x由組合決定，置換決定bin的數量nb和描述詞的數量np。這樣，我們就能計算bin溢出的概率就是bin大小的函數（即bin的數量），即NM=b.nb。bin尺寸越大，查詢就越慢，但是，由于SRAM存儲庫包括4個獨立的64位可尋址雙端口SRAM，我們實際上可以并行查詢四個配置文件詞。因此，相對性能會降低1/ceil(b/4)。我們的分析結果顯示，即便對最大型的配置文件來說（16K，我們研究所用的最大配置文件為12K，不過通常配置文件比這都要小得多），b=4時（最佳性能），bin溢出概率為10-9。換言之，描述詞被丟棄的概率不到10億分之一。應注意的是，由于我們假定詞匯量無限大，因而這一估算還是保守數字。

通過將文檔表述為“詞袋”，文檔流就是文檔ID、文檔詞對組 (document term pair set) 等對列表。從物理上說，FPGA 以每秒1.6 GB的速度從NUMAlin接受128位字流。因此，文檔流必須在字流上編碼。可將文檔詞對di =(ti,fi) 編碼為32位：24位用于詞ID（支持1,600萬個詞的詞匯庫），8位用于詞的頻率。這樣，我們就能將4個對組合到128位字中。要標示文檔的起點與終點，我們需要插入包含文檔ID（64位）和標志符（64位）的報頭與腳注字 (footer word)。

如上所述采用查詢表架構和文檔流格式，實際的查詢和評分系統（圖3）會非常直接。我們只需掃描輸入流以檢查報頭和腳注字即可。報頭字將文檔得分設為 0，而腳注字則收集并輸出文檔得分。對于文檔中的每四個配置文件
詞，Bloom過濾器首先丟棄否定詞結果，再從SRAM讀取四個配置文件詞。并行計算并添加（圖4）每個詞的得分。實際上，四分之三的配置文件詞ID不會匹配于文檔詞ID；只對第四個進行實際計算。將文檔中所有詞的得分進行累加，最后得分流在輸出到主機存儲器之前與限值進行比較過濾。

圖 3 —— 過濾應用的FPGA實施示意圖

主機—FPGA接口將文檔流從存儲器緩沖器中傳輸至FPGA，并將得分流返回至客戶端中。一旦從客戶端接收到配置文檔ID表，子進程即從主進程中分叉出來，以構建實際的配置文件，將其載入SRAM并在FPGA上運行算法。每個子進程都會產生一個獨立的輸出線程，以對從FPGA獲得的得分進行緩沖，并通過TCP/IP將這些得分傳輸到客戶端，從而使用網絡對得分流進行多路復用。若沒有該線程，網絡吞吐量的波動就會降低系統性能。這種主機接口架構的主要優勢在于，它具有很高的可擴展性，能輕松滿足大量FPGA的需求。

大幅度提速

為了評估FPGA加速型過濾應用的性能，我們進行了一系列實驗，將基于FPGA的實施方案與采用C++編寫的運行于Altix之上的優化參考實施方案進行了比較。在比較過程中，我們使用了三個IR測試集合（參見表 1）：一個是文本檢索會議 (TREC) 提供的基準參考集合TREC Aquaint，還有兩個分別是美國專利與商標署 (USPTO) 和歐洲專利署 (EPO) 提供的專利集合。我們選擇上述測試集合來評估不同文檔長度和大小對過濾時間的影響。

表 1——集合統計

為了仿真眾多不同的過濾器，我們通過選擇隨機文檔并用標題作為請求，隨后再選擇請求服務器返回的固定數量的文檔作為偽相關文檔，來為每個測試集合構建配置文件。我們接下來使用返回的文檔構建相關性模型，該模型定義了文檔集合中每個文檔應當匹配（就好像從網絡進行流處理一樣）的配置文件。配置文件中的文檔數量從1到50不等，可確定增加配置文件的大小（詞數和文檔數）會對性能有何影響。我們將上述進程重復30次，并計算平均處理時間。

圖4 ——相關性模型

我們在表2和圖5中對有關結果進行了總結。從表中可以清晰地看出，FPGA實施方案在速度方面通常比標準實施方案快一個數量級。從圖中可以看出，配置文件大小（需要匹配的詞數）增加后，標準實施方案變得越來越慢，而FPGA實施方案的速度相對保持不變。這是因為FPGA實施方案支持配置文件評分的流分線操作，這樣無論配置文件大小如何，時延基本保持不變。這些結果清晰表明，FPGA對加速IR任務有著巨大的潛力。FPGA的提速幅度已然相當大（特別對大型配置文件而言尤其明顯），而且仍有進一步提高的空間。通過仿真，我們確認FPGA算法給一個文檔詞評分需要兩個時鐘周期。制約因素為每周期128位的SRAM存取速度，這需要兩個周期才能讀取四個配置文件詞。如果時鐘速度為 100 MHz，則意味著FPGA能在15秒之內完成整個EPO文檔集合的評分。當前應用在四個FPGA上需要約8.5秒，因此原則上我們至少可以讓性能再翻一番。

表 2 —— 性能統計數據

圖 5 —— 時間（秒）和配置文件中文檔數量的對比圖

差異的原因在于I/O流 (streaming I/O)：通過主機操作系統設備驅動器可將文檔流從用戶存儲器空間傳輸至NUMAlink，這需要直接存儲器存取(DMA) 傳輸。驅動器可傳輸流的緩存模塊。目前，對所傳輸模塊的大小來說，這一傳輸并不是以最優的方式實施的，進而導致無法達到最高吞吐量。此外，用獨立的線程進行傳輸排序也能避免傳輸時延。

遇到的問題和吸取的經驗

這一項目的意義不僅在于它展示了FPGA作為信息檢索任務加速器的優勢，而且還為我們提供了FPGA加速系統軟硬件要求的重要信息。

至主機系統的I/O是確保性能的關鍵：NUMA存儲器與FPGA之間的DMA機制必須獲得Mitrionics SDK和SGI RASClib的支持。在此前的項目中，我們必須先將數據傳輸到電路板上的SRAM中才能進行處理，但這會嚴重影響性能，因為數據的載入和結果的卸載會造成非常大的開銷。此外，我們也清晰地認識到，IR任務尤其需要大量的片上和板上存儲器，才能實現效率最大化。

此外，為了充分使用FPGA，未來的平臺必須具備兩個重要特性，一是必需能在FPGA之間直接傳輸數據，二是必需能夠關閉主機處理器（或用一個主機處理器控制多個 FPGA）。關閉主機處理器的功能尤其重要：在Altix平臺上，即便Itanium處理器完全處于空閑狀態也不能關閉。但是，空閑的Itanium處理器的功耗也高達工作狀態下所需功耗的90%。因此，盡管FPGA加速的節能效果明顯，但我們目前的系統即便在加速器運行過程中主機存儲器空閑狀態下，其總體節能作用仍然有限。

開發FPGA加速型系統的另一重要領域就是軟件。我們的經驗明確反映出，主要的復雜問題在于FPGA 和主機系統之間的接口連接：Mitrion-C中的實際 FPGA 應用開發效率非常高；采用Lemur工具套件構建查詢和服務文檔的框架也相對容易開發。但是，采用RASClib開發連接主機應用和FPGA接口的代碼非常復雜，而且由于并發性問題，還非常難以調試。因而，接口代碼的開發占據了絕大部分的開發時間。

FPGA高級編程的最后一個問題是編譯速度。習慣于C++或Java等語言的開發人員認為即便應用非常復雜，構建時間也應該比較短。除了最基本的設計之外，當前的FPGA工具執行綜合以及放置路由工作幾乎都需要一整天的時間。非常長的構建時間會嚴重影響工作效率，因而時間應當縮短到一般性軟件構建時間，這樣才能使 FPGA 加速更具吸引力。

定制硬件平臺

我們用這個項目探討了FPGA加速的可能性，并展示了FPGA作為數據中心綠色環保技術的巨大潛力。我們希望進一步擴展這項研究，調查文檔處理所需的全系列工作任務，如語法分析、詞干、索引、搜索以及過濾等。我們清楚地認識到，現有系統在節能潛力方面很有限，我們希望研究能以業界最高效率專門執行信息檢索任務的可定制硬件平臺。這樣，我們就能顯著加速算法的執行，同時大幅度降低能耗，從而開發出更加環保、速度更快的數據中心。

閱讀全文

FPGA(591969) FPGA(591969)
Web(68377) Web(68377)

3200用SmartConfig搜索不到設備，請問在sta模式中為什么一定要聯網才能進入3200存儲的web？

使用smartconfig搜索設備時經常搜索不到，需要回到ap模式重新配置才可以，這是軟件的bug問題嗎？ap模式中可以用瀏覽器進入web 演示demo，在sta模式中為什么一定要聯網才能進入3200存儲的web？我們可以更改離線或在線網頁的內容嗎？謝謝

2018-06-07 04:08:18

FPGA為什么是實現綠色搜索技術的關鍵？

FPGA為什么是實現綠色搜索技術的關鍵？

2021-05-08 07:47:03

Web Service是如何工作的？

Web服務提供者按SOAP消息執行相應的Web服務，并將服務結果返回給Web服務請求者。（綁定）XML、Soap、WSDL和UDDI在Web Service中扮演著重要的角色，Web Service通過SOAP在Web上提供的軟件服務，使用WSDL文件進行說明，并通過UDDI進行注冊。

2018-03-16 16:04:06

web服務器在監控系統設計中的應用技巧有哪些？

本文根據監控系統對數據吞吐量和安全可靠性等各方面的實際要求，結合相關研究的新進展，深入討論了web服務器在監控系統設計中的應用技巧，并詳細做了實現上的闡述。對所有基于嵌入式web技術的監控系統的設計具有非常實際的指導作用。

2021-06-04 06:56:01

web滲透的測試流程

：就是在知道目標網站源碼和其他一些信息的情況下對其進行滲透，有點類似于代碼分析　　黑盒測試：就是只告訴我們這個網站的URL，其他都不告訴，然后讓你去滲透，模擬黑客對網站的滲透　　確定需求：web

2021-01-29 17:27:30

在子VI中，如何把匹配時的搜索區域和被搜索區域顯示出方框

想知道，在子VI中，如何把匹配時的搜索區域和被搜索區域顯示出方框，目前運行子VI,就只有圖片，望賜教！

2015-01-22 08:55:49

DSP及FPGA在系統設計中的應用

1 引言在信息技術高速發展的今天,電子系統數字化已經成為有目共睹的趨勢,從傳統應用中小規模芯片構造電路系統到廣泛地應用單片機,到今天DSP及FPGA在系統設計中的應用,電子設計技術已邁入了一個全新

2021-10-29 08:55:40

ESP8266 WEB智能小后臺，采電壓，繪曲線，向服務器傳信息

ESP8266 WEB小后臺，采電壓，繪曲線，向服務器傳信息一個月前，自己想設計一個不用安裝應用程序的智能手機控制的硬件。是否有人有興趣？有興趣的可以聯系我，朝“自帶智能使用程序的智能硬件，或是有

2022-11-25 22:15:03

IAR能否在整個工程中搜索關鍵字？

像mdk可以在整個工程中搜索關鍵字 IAR應該也有類似的功能吧，但是我貌似沒有找到

2023-11-08 07:21:59

LabVIEW web Service +LabVIEW NXG web開發

擴展至提交數據庫查詢條件并返回查詢結果。第一步進行LabVIEW web服務程序的編寫（程序可以直接下載附件）在進行web服務編寫過程中需要注意的內容有1、LabVIEW NXG的web開發要加入

2018-04-26 16:56:06

LabVIEW中的Web Service與網絡功能

LabVIEW中的Web Service與網絡功能什么是Web Services??一種通過網絡傳遞信息的方式?利用HTTP協議傳遞信息?提供的服務依應用領域而不同 [hide]

2009-12-16 09:15:21

Labview讀取excel信息時怎么查詢檢索某一個用戶的全部信息？

2018-04-20 16:11:01

WIZ550WEB

2023-03-28 14:29:56

ei源刊檢索發表，ei收錄論文檢索審稿見刊，加急錄用ei期刊目錄

不要太多，大約在160英文字左右，也不能太少，不然你的內容沒有辦法在摘要中體現出來，記得必須用英文書寫。再一個就是，摘要中不需要寫太多不期然實際的猜想等內容，這樣也是不容易被收錄的.ei檢索操作優勢

2016-01-21 16:45:37

【迪文COF結構智能屏試用體驗】迪文屏和esp32的圖書檢索及錄入系統

RF：識別nfc卡TF卡：存儲圖片及數據庫使用介紹：功能1——檢索：esp32從tf卡中讀取數據庫信息，通過迪文串口屏錄入書名或者i***n號用于檢索。；功能2——錄入：air105通過camera

2022-04-06 19:03:28

從手淘搜索到優酷短視頻，阿里巴巴是如何在搜索推薦領域下應用深度學習的？

述在搜索場景中所提到的模型結構去訓練深度學習模型，并學習用戶和商品之間的特征。這里為了統一地進行處理，就將搜索場景中的query或者檢索詞相關的域與推薦場景中的信息，比如詳情頁中的主商品信息都統

2018-05-08 16:28:04

國人突然流行元搜索，10個有9個設為首頁

大的英語)為代表的這類民間網站，由于其極具新聞價值的名字，被媒體們炒作稱作“山寨搜索引擎”。而網友們大多以非常寬容的心態看待這些所謂的“山寨搜索”。其實，這類引擎在互聯網中早已有之，而且它的學名就叫“元

2008-11-26 11:46:17

基于OWL屬性特征的語義檢索研究

【來源】：《電子設計工程》2010年02期【摘要】：在文獻檢索中,概念的語義相似度計算直接影響查準率和查全率指標。將本體描述語言OWL(Web Ontology Language)的屬性特征有機結合

2010-04-24 09:48:19

如何檢索最小化主機處理器負載的測量值呢？

是；使用 48 Mhz SPI使用中斷觸發 SPI 讀取。使用帶 DMA 的 SPI 讀取操作將數據存儲在緩沖區中。問題是我的中斷將每 2us 觸發一次……我認為這在微控制器上是不合理的。在 MCU 上有更聰明的方法嗎？或者我應該選擇其他解決方案，如 FPGA 或 DSP？謝謝！

2022-12-22 08:30:25

如何在STM32CubeIDE上進行包含頭文件的搜索？

在 STM32CubeIDE 上使用“ctrl + H”，只會檢索工作區中的 c 文件。我想搜索包含頭文件的內容，例如 EWARM 的“ctrl + shift + F”如果可能的話。請告訴我怎么做。

2023-02-09 06:47:26

如何清除電腦中文件的搜索記錄

如果我們找不到某個文件的具體位置，可以在一定范圍內搜索該文件的名稱，就可以檢索到。而執行文件搜索操作后會留下用戶搜索文件的記錄，雖然這樣可以方便用戶再次搜索，但是不利于保護用戶的個人隱私。不過這個

2015-10-21 15:28:23

如何跨多個SOA將RFID Web服務集成到EAI應用程序中

在本文中，我將首先討論兩種開發 RFID 應用程序的方法:傳統方法和 RFID Web服務。然后，我將討論把 RFID Web服務集成到多個 SOA 中的 EAI 應用程序將如何提高帶 RFID

2019-07-17 06:31:53

實用教程 | 在Web網頁端實時查看設計項目

甚至 BOM。只需通過您最喜歡的 Web 網頁瀏覽器訪問設計數據，即可開始審查項目文件。而且通過網絡瀏覽器還可以為任何人指定相應的訪問權限，對方無需任何許可證。在 Web 瀏覽器中顯示操作方法非常簡單

2022-07-29 18:20:46

嵌入式Web技術在無紙記錄儀中的應用研究

是服務器搜索的主要內容，并從中找到靜態網頁實現訪問，而 JavaApplet小程序被嵌入到網頁當中，JavaApplet小程序在應用過程中可以充當特殊計算機程序維持web頁組成部分的功能，并將信息進行發送

2018-08-11 22:37:27

怎么在Web頁面中實現簡單的按鈕按壓？

嗨，我們已經修改了使用和諧棧的Web服務器示例。現在我們希望在Web頁面中實現簡單的按鈕按壓。當按下按鈕時，我們應該把消息發送到調試端口。MEMCMP（文件名，“1234。HTM”，8））{TTR

2019-10-17 09:02:53

怎樣在PDM系統中快速找到3D零部件模型 2

的零部件！通過拓撲搜索可以在企業零部件庫中根據具體的技術特征進行搜索，搜索結果以此將更加精確。 6、顏色搜索工程師和采購人員可以依據顏色信息在零部件模型庫中進行數據檢索，這是對眾多創新性搜索功能

2019-12-25 16:34:52

有一篇論文怎么發表在ei期刊上快速檢索錄用

有一篇論文怎么發表在ei期刊上快速檢索錄用7天×8小時服務熱線：133-4323-9725（孟老師）QQ:2853127120本站是一個論文投稿平臺，幫您快速發表論文。以龐大的期刊庫為依托，為用戶

2016-01-21 15:58:46

求大佬幫忙完善一下這個圖書信息檢索的小程序

這個程序網上弄得，關于數據檢索這一塊不知道怎么弄，我是初學者，請各位多多指點，txt圖書信息怎么寫逗可以，只要程序可以運行檢索就好

2019-05-11 15:13:56

用labview進行信息檢索的簡單嘗試

看電影的時候經常看到這樣的場景：在電腦中輸入需要查詢人員的圖像，經過比對之后從數據庫中檢索到該人員的基本信息。當然那是很復雜的。也還是比較有意思的。于是自己也嘗試了一下首先創建一個數據庫，其中包含

2014-01-19 15:39:51

短信息在圖書查詢中的應用設計

Server操作系統下運行。3.1 動態鏈接庫技術　　動態鏈接庫是用作共享函數庫的可執行文件。一般情況下,DLL是一個庫中所有函數的集合,并通過包含在可執行文件中的信息進行檢索來使用。在收發短信息時需

2009-09-19 09:18:47

語境Web：未來信息家電的架構及業務模型分析

巨型數據庫中，都可進行訪問。在這一構想中，專業化搜索引擎、電子設備或電器不但可跨越所有Web站點理解所有內容，而且還能夠以一種定制的用戶友好型方式去分析和呈現所有在Web上散播的信息。通過把所有因特網

2011-07-27 10:52:37

資源分享季 (9)——FPGA在圖象處理中的應用的論文.zip

本帖最后由 upmcu 于 2012-7-28 15:07 編輯截圖：FPGA控制實現圖像系統視頻圖像采集.pdfFPGA在多制式視頻轉換系統中的應用.pdfFPGA在圖象處理中

2012-07-28 14:28:52

音頻信息識別與檢索技術

都在增加的語音文檔或視頻文檔，在日常生活中的音視頻電子郵件等。目前針對文字信息的檢索已經有許多成功的應用，如：Google、Yahoo、百度等搜索引擎，但如何利用計算機對非結構化的海量多媒體數據做信息

2011-03-05 22:53:09

電子信息資源的檢索與利用

電子信息資源的檢索與利用 -The retrieval and applications of the electronic resources在信息化、網絡化的時代里，知識增長的速度是爆炸式的，網絡和計算機帶給我們的不僅僅是電子郵件

2009-02-02 16:37:15

企業內部基于角色協作的個性化搜索系統

隨著信息系統的升級和Web 2.0 系統的廣泛應用，現代化企業的內部信息正在呈爆炸性的增長，為提高海量信息檢索的精確度，該文設計一個個性化搜索系統，該系統采用分類和聚類等

2009-03-28 09:01:36

基于偏好信息的案例檢索算法

案例推理方法建立在“相似問題具有相似解”的基礎上，能否從案例庫中檢索出與新問題“最相似”的案例是案例推理方法成功的關鍵因素之一。該文提出一種改進的檢索方法，在

2009-04-06 08:40:49

基于概率粗糙集模型的信息檢索

針對經典粗糙集模型難以分類標引空間以及體現類間關聯的缺陷，將條件概率關系結合粗糙集理論引入信息檢索，提出一種基于概率粗糙集的信息檢索模型。定義標引詞空間的條件

2009-04-10 08:47:47

基于重復模式的自動Web信息抽取

互聯網上存在很多在線購物網站，抽取這類網站頁面里的商品信息可以為電子商務、Web查詢提供增值服務。該文針對這類網站提出一種自動的Web信息抽取方法，通過檢測網頁中的重

2009-04-10 09:33:56

維、哈、柯全文搜索引擎檢索器的關鍵技術

研究維、哈、柯全文搜索引擎檢索器的關鍵問題，提出有效的解決方法，包括在用戶計算機沒有安裝本地輸入法和字庫的情況下輸入維、哈、柯文檢索詞并正常顯示搜索結果，針對

2009-04-11 09:26:31

問答式信息檢索中模式優化及性能評價

問答式信息檢索是新一代搜索引擎，集成自然語言處理和信息檢索科學的研究成果，提高信息檢索效率。該文介紹問答式信息檢索中的模式優化及其應用，并進行客觀評價。模式在

2009-04-17 09:29:59

Web Services在黃頁搜索引擎中的應用

提出一種將Windows平臺上的動態鏈接庫文件封裝為.NET平臺下的Web Services并使用Linux平臺下Java Web程序調用的方法。該方法已成功應用于中國電信公司黃頁搜索引擎系統。該文討論了整

2009-04-22 09:00:19

Web元數據信息提取技術的研究

Web 頁元數據提取是一種重要的信息獲取技術。本文在簡要介紹元數據的概念后給出了一種web 頁元數據的自動提取方法。給出了提取技術的框圖和實現細節，包括提取方法和規則

2009-05-30 10:37:01

基于FPGA的信息檢索技術實現研究

本文首先討論了基于關鍵詞的信息檢索的基本原理，然后介紹了一種基于FPGA的硬件哈希算法來加速信息檢索過程中的關鍵詞計數工作，最后比較了硬件實現和軟件實現完成關鍵詞

2009-06-16 08:41:21

基于元數據的語義搜索技術研究

描述了為現有的Web 資源加入元數據語義描述信息，從而可提高基于語義的搜索引擎的查準率；提出一種搜索引擎和外界智能設備或終端交互的接口形式；最后展望語義Web 和語義搜索

2009-08-21 12:19:46

語義檢索在電子商務中的應用研究

本文在介紹了語義Web 的幾種語言基礎上，給出了電子商務核心語言的分層結構，并把語義檢索這種智能型的檢索有效地運用到電子商務中，從而使電子商務網站中的信息資源能被

2009-08-31 09:39:14

基于XML的WEB信息抽取模型設計

對現有的信息抽取技術和XML 技術加以研究，在此基礎上提出了適合XML 的通用的web 信息抽取模型，它能夠把Web 上的數據抽取出來整合到指定模式的XML 文檔中去，最大限度地實現

2009-12-22 13:56:10

Lucene算法優化及其在P2P檢索中的應用

隨著P2P 搜索引擎的地位日益重要，如何提高其分布式性能成為近年來的研究熱點之一。同時，隨著其廣泛地應用，對于目前使用的P2P 搜索引擎，還急需解決其檢索結果中垃圾信

2010-01-22 15:04:27

Web信息采集系統的設計與實現

隨著Web 信息的爆炸性增長，如何快速、準確地從浩瀚的信息資源中尋找到所需信息已經成為困擾人們的一大問題。Web 信息采集系統就是分析頁面在Web 上的分布特征，利用網站和

2010-01-22 15:08:34

基于OWL屬性特征的語義檢索研究

在文獻檢索中，概念的語義相似度計算直接影響查準率和查全率指標。將本體描述語言OWL（Web Ontology Language）的屬性特征有機結合到語義檢索模型中，設計本體內實體間匹配度算法

2010-02-11 14:01:12

信息檢索分類系統中過濾推薦算法研究

針對信息檢索分類技術發展的需求,本文通過對協同過濾推薦算法的綜述,提出傳統過濾算法無法適用于用戶多興趣下的推薦問題進行了剖析,提出了一種基于用戶聚類的協同過濾推薦

2010-03-01 16:09:47

基于本體的信息檢索研究

介紹了本體Ontology的概念和理論知識，提出一種基于本體的Web 信息檢索模型。該模型利用本體技術對 Internet 上的各類信息進行領域分類，規范用戶信息檢索模式，以達到快速、準確

2010-07-08 15:29:26

基于用戶興趣的個性化Web信息檢索方法

針對現有的個性化信息檢索系統存在的問題，提出一種新的基于用戶興趣的個性化Web信息檢索方法，采用自動隱式學習方式來建立和更新用戶興趣庫，采用本體技術來

2010-07-21 16:32:03

什么是人肉搜索

什么是人肉搜索人肉搜索與刺青、美白、護膚、減肥等直接在人肉上施行的種種行為無關。顧名思義，人肉搜索就是利用現代信息科技，變傳統的網絡信息搜索為人找人，

2008-12-30 13:56:41

3584

什么是并行搜索技術

什么是并行搜索技術并行搜索引擎(又稱集成搜索引擎、元搜索引擎、大型搜索引擎)是一種可同時檢索多個搜索引擎，并以統一的檢索界面

2009-03-30 10:08:17

1531

計算機信息檢索基礎

隨著計算機技術、通信技術和高密度存儲技術的迅猛發展，利用計算機進行信息檢索已成為人們獲取文獻信息的重要手段。計算機信息檢索能夠跨越時空，在短時間內查閱各種數據庫，

2011-03-22 23:54:19

基于Web的教育信息化平臺建設

為提高教育信息化建設水平，加快教育現代化的進程，通過對教育信息化建設與應用現狀分析，闡述了目前在教育信息化建設方面所面臨的問題，實現了一種基于Web的教育信息化平臺。

2011-08-29 14:11:42

基于Web挖掘的層次凝聚類算法研究

網絡提供了海量的共享資源，人們需要從網絡上搜索出自己感興趣的信息，由此產生了Web挖掘的問題。Web挖掘就是借用數據挖掘技術來實現的。Web挖掘主要是文本信息的挖掘，本文主要

2012-07-06 16:03:24

基于XML的Web信息篩選器的設計

為了給用戶提供有效信息，能夠根據用戶的需要對Internet上的網頁信息進行獲取和過濾，設計了一個基于XML的Web信息篩選器。系統利用了XML作為中間數據的數據交換技術將Microsoft.NET技術

2012-08-10 14:08:04

低信噪比環境下WCDMA小區搜索的FPGA實現

針對區域內多個小區普查的需求，對復雜環境下低信噪比WCDMA小區搜索進行了針對性改進，采用差分相干累積以及RS軟譯碼算法提高了低信噪比條件下WCDMA小區搜索性能并利用FPGA進行了工

2012-08-13 17:26:45

基于前向對向傳播神經網絡的信息檢索技術研究

提出了一種基于前向對向傳播神經網絡的信息檢索算法。分析了信息檢索技術的基本概念、原理、以及檢索方式，研究了科技信息檢索的流程，研究了前向對向傳播神經網絡的基本模型

2012-10-17 11:19:53

基于Web的物流信息管理系統搭建研究

物流信息化管理已經成為一種趨勢，本文以此為依托，主要論述了如何構建基于Web的物流信息系統，在本文中，對基于Web的物流信息系統整體開發框架進行了設計，以及根據物流信息管

2013-06-06 10:57:04

基于內容的體育視頻檢索系統設計分析

針對當前人們對海量視頻信息搜索準確性的需求，提出一種基于內容的視頻檢索方法。該方法從視頻內容出發，通過特征匹配完成對視頻數據的檢索。同時以體育視頻作為應用案例，運用ASP.NET技術設計出了基于內容的體育視頻檢索系統，并通過實驗對該算法的檢索效率進行驗證，得到良好的檢索效率。

2015-12-31 09:25:13

基于OV9653和FPGA的圖像搜索定位系統

基于OV9653和FPGA的圖像搜索定位系統，感興趣的可以看看。

2016-09-22 14:08:55

海量信息檢索挖掘及視覺三維展現方法仿真

海量信息檢索挖掘及視覺三維展現方法仿真_孫鐘德

2017-01-07 20:32:20

基于單DOM的自適應WEB信息抽取方法

在傳統的輿情中多為基于模板采集模式，基于減少人工維護的目的，文中提出一種基于單DOM樹特征預分類的自適應Web信息抽取方法，分為鏈接預分類與信息抽取兩個部分。鏈接預分類采用SVM分類算法，提取信息

2017-11-06 11:26:18

基于云環境中web信息抓取技術

本部門的發展戰略，是網絡信息應用研究的核心任務。通過對Web網頁信息抓取技術的方式對網絡信息系統進行研究，提出使用垂直搜索技術是在適應云平臺環境中大數據現象的對策，得出了新聞型與數據密集型網頁信息變化的動態掌握方式。

2017-11-08 10:19:30

智能化信息檢索應用設計

文中通過分析現有信息檢索技術存在問題，為提高信息檢索系統的搜索精度和質量，將人工智能研究結果引入到信息檢索技術之中，提出一種基于多Agentri的智能化信息檢索系統框架。該系統中的每個智能Agent

2017-11-14 17:19:15

電子產品信息分布式檢索系統

語言，有著較多的展開形式，語義特征逐漸缺乏，難以實現穩定性和高效性的信息提取。基于商業信息的海量選擇，就要正確應用商業信息的一種應用系統，并實現信息的有效檢索。在搜索引擎的高速發展階段，信息檢索速度以及精確

2017-11-15 17:39:22

信息檢索的基本原理與基于前向對向傳播神經網絡的信息檢索技術研究

提出了一種基于前向對向傳播神經網絡的信息檢索算法。分析了信息檢索技術的基本概念、原理、以及檢索方式，研究了科技信息檢索的流程，研究了前向對向傳播神經網絡的基本模型和算法，提出了基于前向對向傳播

2017-11-16 17:16:36

基于蒙古語課程領域語義Web的檢索方法

由于蒙古語網絡教學相對落后，蒙古語教學資源的重用和利用率較低，并且基于關鍵字的教學資源檢索缺少在語義層面上的處理和表示，導致檢索結果不全面和不準確。針對這種情況，提出基于蒙古語課程領域語義Web

2017-12-05 14:46:34

基于點函數秘密共享的私有信息檢索協議

針對私有信息檢索（PIR）中的隱私安全問題，提出了一個基于點函數秘密共享的私有信息檢索協議。該協議將檢索的索引看成一個特殊的0-1點函數，利用點函數秘密共享技術生成這個點函數的密鑰組，分別發送給

2017-12-06 09:54:00

基于帶權集合的搜索引擎隱式反饋算法

隨著Internet的迅速發展，網絡信息資源開始爆炸式增長。傳統的搜索引擎很難從用戶輸入的檢索詞中獲知其檢索意圖，只能返回大量匹配結果供用戶選擇。為了有效的提高搜索引擎的查準率，本文提出了一種

2017-12-20 15:49:37

基于語義聚類的資源搜索策略

了基于語義聚類的資源搜索策略。仿真實驗的結果表明，該系統所采用的信息檢索策略能夠有效地提高信息檢索的查詢成功率，降低網絡負載，取得了良好的效果。

2018-01-04 16:09:21

基于模糊匹配的Lucene檢索應用

隨著大數據時代的到來，越來越多的站內搜索要求能夠快速精準的查找到需要的內容。目前很多的站內搜索引擎是基于Lucene檢索包來實現的，流行的solr檢索服務器其底層也是基于Lu-cene檢索包。然而

2018-01-09 10:16:27

可擴展的對稱密文檢索架構

現有可搜索加密方案通常索引的構建、檢索效率不高，數據節點的維護不便，難以適應分布式密文檢索要求。針對現有密文檢索方案出現的一些問題，提出了可拆分密文倒排索引架構，改善了密文索引的并行構建性能，簡化

2018-01-15 16:10:16

智能信息檢索系統

近年來，基于本體的智能信息檢索系統已成為智能信息檢索系統領域最為活躍的研究方向之一．如何利用本體進一步提高其檢索性能和智能性，成為基于本體的智能信息檢索系統的主要研究目標．從面向過程的角度，對近幾年

2018-01-30 15:13:34

節點屬性的海量Web信息抽取方法

為解決大數據場景下從海量Web頁面中抽取有價值的信息，提出了一種基于節點屬性與正文內容的海量Web信息抽取方法。將Web頁面轉化為DOM樹表示，并提出剪枝與融合算法，對DOM樹進行簡化；定義DOM

2018-02-06 14:36:53

Web實體語義信息搜索平臺

Web上實體信息過于分散且缺乏語義，傳統基于關鍵詞匹配的搜索引擎往往因缺少上下文等語義信息，無法搜索到精確的結果。為了對Web數據進行精確查找，使用信息網模型（INM）對Web數據進行語義表示和建模

2018-02-09 16:04:24

維修電工科技信息檢索練習題及課件

2018-02-24 11:03:56

網絡教程之信息搜索的詳細資料免費下載

本文檔的主要內容詳細介紹的是網絡教程之信息搜索的詳細資料免費下載主要內容包括了：1 網絡學術資源概述，2 資源檢索原理和方法，3 搜索引擎，4 常用搜索引擎簡介

2018-11-14 16:30:30

如何使用八叉樹進行三維室內地圖數據快速檢索方法

隔斷約束條件對檢索數據進行篩選;最后，對室內地圖數據進行檢索。與不具有約束條件的搜索方法相比，搜索代價平均降低了25個百分點，且搜索時間更加穩定。所提方法可以顯著地提高室內三維地圖數據的應用效率。

2019-05-15 17:23:04

使用八叉樹的三維室內地圖實現數據快速檢索的方法概述

隔斷約束條件對檢索數據進行篩選；最后，對室內地圖數據進行檢索。與不具有約束條件的搜索方法相比，搜索代價平均降低了25個百分點，且搜索時間更加穩定。所提方法可以顯著地提高室內三維地圖數據的應用效率。

2019-11-01 15:41:25

使用FPGA芯片系統可大幅降低使用網絡搜索的碳排放量

英國格拉斯哥大學稱，該校科學家通過使用現場可編程邏輯門陣列（FPGA）芯片系統，能夠以高出目前標準處理器20倍的速度完成文檔檢索，可大幅降低使用網絡搜索的碳排放量，從而向構建“綠色節能網絡”又邁進一步。

2020-07-20 18:04:56

606

如何使用八叉樹實現三維室內地圖數據快速檢索方法說明

隔斷約束條件對檢索數據進行篩選;最后，對室內地圖數據進行檢索。與不具有約束條件的搜索方法相比，搜索代價平均降低了25個百分點，且搜索時間更加穩定。所提方法可以顯著地提高室內三維地圖數據的應用效率.

2020-08-04 16:30:00

一個集檢測與檢索與一身的作品

本文轉載自 AI人工智能初學者，作者ChaucerG 傳統的目標檢索任務旨在學習具有內部相似度和內部相異度的區分特征表示，它假設圖像中的對象是手動或自動精確裁剪的。但是，在許多現實世界中的搜索場景

2020-09-28 16:09:32

1504

1928

Web的應用基礎

Web（World Wide Web,萬維網）是一種基于超文本和HTTP的、全球性的、動態交互的、跨平臺的分布式圖形信息系統。Web的發展已從1.0發展到3.0

2023-02-14 14:51:29

465

UniVL-DR: 多模態稠密向量檢索模型

多模態數據的信息獲取需求在用戶搜索過程中尤為重要。 ▲?圖1. 不同多模態檢索框架示意圖為了實現多模態檢索過程，當前的多媒體搜索系統通常采用“分而治之”的方法。如

2023-08-06 22:00:03

452

FPGA加速視覺搜索引擎解決方案

電子發燒友網站提供《FPGA加速視覺搜索引擎解決方案.pdf》資料免費下載

2023-09-13 10:32:05

已全部加載完成

搜索歷史

FPGA在Web搜索和信息檢索中的應用

評論