91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

成功構(gòu)建文本分析工作流的四個(gè)步驟

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Seth DeLand ? 2022-11-23 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文本分析(從原始人類語言中發(fā)現(xiàn)隱藏模式以實(shí)現(xiàn)更好的決策和預(yù)測(cè)的過程)為工業(yè)和預(yù)測(cè)性維護(hù)系統(tǒng)提供了幾個(gè)好處。這些分析使工程師能夠利用原始文本數(shù)據(jù)輕松生成有關(guān)維護(hù)記錄的見解,并構(gòu)建故障預(yù)測(cè)算法以預(yù)防潛在問題。

以非公路商業(yè)空間為例,在建筑工地上使用重型設(shè)備:如果一臺(tái)重型設(shè)備發(fā)生故障,在修復(fù)系統(tǒng)所需的時(shí)間和成本與施工停滯時(shí)現(xiàn)場(chǎng)的停機(jī)時(shí)間之間,可能會(huì)發(fā)生代價(jià)高昂的故障。傳統(tǒng)上,來自此設(shè)備的遙測(cè)數(shù)據(jù)已用于構(gòu)建可預(yù)測(cè)未來故障的預(yù)測(cè)性維護(hù)模型。但是,在機(jī)械師和操作員的文本注釋中也有關(guān)于過去故障及其原因的寶貴信息。工程師可以利用此文本數(shù)據(jù)來增強(qiáng)預(yù)測(cè)性維護(hù)模型,并確定應(yīng)解決的模式和故障模式。

文本分析的挑戰(zhàn)在于大量的非結(jié)構(gòu)化原始文本數(shù)據(jù)集,這可能會(huì)使分析工具不堪重負(fù)。這使得工程師更難快速直觀地提取用戶可能獲得的所有有價(jià)值的信息。但是,工程師可以通過正確的工具和遵守端到端工作流程來克服這些障礙。

當(dāng)涉及到端到端文本分析工作流程時(shí),工程師需要了解什么?工作流中有四個(gè)主要階段:

poYBAGN9yKuALPZSAACS46Gxj18876.png

圖1.端到端文本分析工作流。

第 1 階段:數(shù)據(jù)訪問和探索

文本數(shù)據(jù)將來自各種來源,包括數(shù)據(jù)庫、內(nèi)部文件存儲(chǔ)庫和 Internet,并且格式多種多樣。正確準(zhǔn)備數(shù)據(jù)是成功工作流程的關(guān)鍵因素。適當(dāng)?shù)臄?shù)據(jù)準(zhǔn)備會(huì)將原始文本數(shù)據(jù)清理并預(yù)處理為“清理數(shù)據(jù)”以供分析。

以詞云為例。該模型將數(shù)據(jù)轉(zhuǎn)換為一種格式,使工程師能夠快速輕松地可視化正在使用的單詞以及數(shù)據(jù)池中最常見的短語。當(dāng)與應(yīng)用其領(lǐng)域?qū)I(yè)知識(shí)的工程師相結(jié)合時(shí),諸如詞云之類的可視化效果有利于更大的文本分析工作流程,因?yàn)楣こ處熆梢暂p松發(fā)現(xiàn)數(shù)據(jù)可能缺少標(biāo)記或需要清理的地方,因?yàn)樗麄兞私饨o定環(huán)境或用例中的典型問題或問題。

第 2 階段:數(shù)據(jù)預(yù)處理

這些可視化效果還有助于指導(dǎo)需要采取的后續(xù)操作。如圖 2 所示,停用詞(不增加價(jià)值的低信息詞)很常見,它們的存在會(huì)扭曲可視化結(jié)果。在工程師開始模型開發(fā)過程之前,他們必須清理原始文本數(shù)據(jù),以過濾掉這些“停用詞”,并輸入真實(shí)、重要的數(shù)據(jù)以傳遞給建模過程。預(yù)處理階段允許用戶從原始文本中提取有意義的單詞。

數(shù)據(jù)清理通常是數(shù)據(jù)分析中最耗時(shí)的部分,根據(jù)數(shù)據(jù)量,清理步驟可能需要多次迭代。但是,投入所需的額外時(shí)間和資源所帶來的投資回報(bào)率允許在文本分析工作流的后期使用更準(zhǔn)確和成功的模型。在許多情況下,干凈的詞云會(huì)傳遞有關(guān)文本頁面上實(shí)際內(nèi)容的更多信息。

文本分析工具箱等工具通過提供用于預(yù)處理、分析和建模文本數(shù)據(jù)的算法和可視化,幫助用戶為模型構(gòu)建過程做好準(zhǔn)備,從而為工程師解決數(shù)據(jù)清理痛點(diǎn)。

這些工具從流行的文件格式中提取文本,從設(shè)備日志、新聞提要、調(diào)查、操作員報(bào)告和社交媒體等來源預(yù)處理原始文本,提取利用文本、數(shù)字和其他類型的數(shù)據(jù)的單個(gè)單詞或多詞短語 (n-gram),將文本轉(zhuǎn)換為數(shù)字表示,然后構(gòu)建統(tǒng)計(jì)模型。

第 3 階段:預(yù)測(cè)模型構(gòu)建

清理和預(yù)處理數(shù)據(jù)后,就可以開始使用機(jī)器學(xué)習(xí)深度學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型了。

這就是文本分析的優(yōu)勢(shì)所在:它發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式并以直觀的格式顯示它們,允許用戶消化數(shù)據(jù),然后采取糾正措施解決問題,然后再進(jìn)一步進(jìn)入工作流程。

以將干凈的文本數(shù)據(jù)轉(zhuǎn)換為數(shù)字形式為例。工程師可以應(yīng)用“詞袋”等建模方法,該方法根據(jù)提供的文本數(shù)據(jù)創(chuàng)建一個(gè)數(shù)字矩陣,顯示每個(gè)單詞的使用頻率。從那里,工程師可以使用預(yù)測(cè)模型,如潛在狄利克雷分配(LDA)模型,該模型可以擬合到單詞/頻率矩陣中,以發(fā)現(xiàn)文本數(shù)據(jù)集中隱藏的主題和見解。

LDA 模型可以生成與數(shù)據(jù)中“隱藏主題”相關(guān)的詞云,顯示將文本數(shù)據(jù)擬合到此預(yù)測(cè)模型中后如何開始出現(xiàn)模式,從而幫助為創(chuàng)建相應(yīng)問題的解決方案提供信息。

使用新的敘述對(duì)模型(如上面示例中的模型)進(jìn)行測(cè)試以驗(yàn)證模型的預(yù)測(cè)是否正確后,可以建立自動(dòng)警報(bào),以便系統(tǒng)在需要注意的任何問題上向響應(yīng)團(tuán)隊(duì)發(fā)送標(biāo)志。如果位置數(shù)據(jù)也可用,則結(jié)果會(huì)發(fā)現(xiàn)某些主題(例如,標(biāo)記的問題)與其位置數(shù)據(jù)之間存在相關(guān)性,因此該模型還可以通過使用多個(gè)數(shù)據(jù)流來補(bǔ)充文本數(shù)據(jù)來提醒響應(yīng)團(tuán)隊(duì)潛在的更大基礎(chǔ)設(shè)施問題。

第 4 階段:見解和預(yù)測(cè)模型部署

使用文本分析設(shè)置模型并驗(yàn)證其可接受的性能后,可通過多種方式與工程團(tuán)隊(duì)和/或管理層共享結(jié)果和模型,包括生成報(bào)告或交互式筆記本(例如 MATLAB Live 編輯器)、將數(shù)據(jù)傳送到桌面或 Web 應(yīng)用程序(例如 MATLAB 應(yīng)用程序設(shè)計(jì)器),或在生產(chǎn)服務(wù)器或 Web 應(yīng)用程序服務(wù)器上托管應(yīng)用程序。

對(duì)于工業(yè)自動(dòng)化、機(jī)械、汽車制造、航空航天設(shè)計(jì)或能源分配等行業(yè)的工程師來說,文本分析可以幫助他們執(zhí)行復(fù)雜的數(shù)值分析,以識(shí)別可以帶來更好結(jié)果并改進(jìn)預(yù)測(cè)性維護(hù)等功能的想法和概念組。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編輯器
    +關(guān)注

    關(guān)注

    1

    文章

    822

    瀏覽量

    32037
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134619
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122794
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    四個(gè)方面深入剖析富捷電阻的優(yōu)勢(shì)

    理成本的電阻產(chǎn)品系列,為電子行業(yè)提供了一個(gè)可靠的選擇。本文將從產(chǎn)品結(jié)構(gòu)、同業(yè)對(duì)比、成本分析以及品質(zhì)保障四個(gè)方面深入剖析富捷電阻的優(yōu)勢(shì),展現(xiàn)其如何在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。
    的頭像 發(fā)表于 05-09 10:47 ?452次閱讀
    從<b class='flag-5'>四個(gè)</b>方面深入剖析富捷電阻的優(yōu)勢(shì)

    非技術(shù)人員如何用n8n + DeepSeek打造AI自動(dòng)化工作流?

    ? 是一個(gè)開源的低代碼自動(dòng)化工作流工具,允許用戶通過可視化界面連接不同的應(yīng)用程序和服務(wù),實(shí)現(xiàn)任務(wù)自動(dòng)化。 掌握n8n,公司中的非技術(shù)人員也能快速上手自動(dòng)化,通過畫布的方式,構(gòu)建自動(dòng)化工作流
    的頭像 發(fā)表于 04-09 14:28 ?2067次閱讀
    非技術(shù)人員如何用n8n + DeepSeek打造AI自動(dòng)化<b class='flag-5'>工作流</b>?

    NX CAD軟件:數(shù)字化工作流程解決方案(CAD工作流程)

    NXCAD——數(shù)字化工作流程解決方案(CAD工作流程)使用西門子領(lǐng)先的產(chǎn)品設(shè)計(jì)軟件NXCAD加速執(zhí)行基于工作流程的解決方案。我們?cè)诹私庑袠I(yè)需求方面累積了多年的經(jīng)驗(yàn),并據(jù)此針對(duì)各個(gè)行業(yè)的具體需求提供
    的頭像 發(fā)表于 02-06 18:15 ?439次閱讀
    NX CAD軟件:數(shù)字化<b class='flag-5'>工作流</b>程解決方案(CAD<b class='flag-5'>工作流</b>程)

    模數(shù)轉(zhuǎn)換電路的四個(gè)過程

    模數(shù)轉(zhuǎn)換(Analog-to-Digital Conversion,簡稱ADC)是將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的關(guān)鍵過程,廣泛應(yīng)用于通信、數(shù)據(jù)采集、信號(hào)處理等領(lǐng)域。模數(shù)轉(zhuǎn)換電路的設(shè)計(jì)與實(shí)現(xiàn)涉及多個(gè)關(guān)鍵步驟,通??梢苑譃?b class='flag-5'>四個(gè)主要過程:采樣、保持、量化和編碼。本文將詳細(xì)
    的頭像 發(fā)表于 02-03 16:12 ?1491次閱讀

    AI工作流自動(dòng)化是做什么的

    AI工作流自動(dòng)化是指利用人工智能技術(shù),對(duì)工作流程中的重復(fù)性、規(guī)則明確的任務(wù)進(jìn)行自動(dòng)化處理的過程。那么,AI工作流自動(dòng)化是做什么的呢?接下來,AI部落小編為您分享。
    的頭像 發(fā)表于 01-06 17:57 ?722次閱讀

    如何使用自然語言處理分析文本數(shù)據(jù)

    使用自然語言處理(NLP)分析文本數(shù)據(jù)是一個(gè)復(fù)雜但系統(tǒng)的過程,涉及多個(gè)步驟和技術(shù)。以下是一個(gè)基本的流程,幫助你理解如何使用NLP來
    的頭像 發(fā)表于 12-05 15:27 ?1582次閱讀

    智譜推出四個(gè)全新端側(cè)模型 攜英特爾按下AI普及加速鍵

    隨著AI的發(fā)展,端側(cè)AI模型越來越受到廣大客戶及廠商的關(guān)注,業(yè)界領(lǐng)先的大模型公司智譜于近日推出了四個(gè)全新的端側(cè)模型,加速AI前沿技術(shù)路徑與創(chuàng)新應(yīng)用場(chǎng)景探索,推動(dòng)AI大模型普惠化發(fā)展。 四個(gè)模型中
    的頭像 發(fā)表于 12-02 17:13 ?599次閱讀
    智譜推出<b class='flag-5'>四個(gè)</b>全新端側(cè)模型 攜英特爾按下AI普及加速鍵

    數(shù)據(jù)科學(xué)工作流原理

    數(shù)據(jù)科學(xué)工作流包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索與可視化、特征選擇與工程、模型選擇與訓(xùn)練、模型評(píng)估與優(yōu)化、結(jié)果解釋與報(bào)告、部署與監(jiān)控等環(huán)節(jié)。
    的頭像 發(fā)表于 11-20 10:36 ?567次閱讀

    淺談無刷電機(jī)的工作流

    上一期的芝識(shí)課堂,我們跟大家一起分析了無刷電機(jī)的四個(gè)功能單元,并詳細(xì)分析了PWM和逆變器單元的工作情況,今天我們繼續(xù)來熟悉無刷電機(jī)工作流程中
    的頭像 發(fā)表于 11-12 13:46 ?1215次閱讀
    淺談無刷電機(jī)的<b class='flag-5'>工作流</b>程

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國慕尼黑舉行的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機(jī)器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機(jī)器人(包括人形機(jī)器人)的開發(fā)工作
    的頭像 發(fā)表于 11-09 11:52 ?914次閱讀

    全新NVIDIA AI工作流可檢測(cè)信用卡欺詐交易

    工作流由 AWS 上 的 NVIDIA AI 平臺(tái)驅(qū)動(dòng),可幫助金融服務(wù)機(jī)構(gòu)節(jié)省資金并降低風(fēng)險(xiǎn)。
    的頭像 發(fā)表于 10-30 11:41 ?828次閱讀

    放大電路的基本分析方法有哪兩種

    放大電路是電子學(xué)中的基礎(chǔ)組成部分,用于增強(qiáng)信號(hào)的幅度而不改變其基本特性。在電子工程中,放大電路的設(shè)計(jì)和分析是至關(guān)重要的。放大電路的基本分析方法主要有兩種:直流分析和交流分析。 直流
    的頭像 發(fā)表于 09-23 10:40 ?1205次閱讀

    使用OPA180運(yùn)放構(gòu)建差分放大器,如何確定四個(gè)電阻的大???

    我目前打算使用OPA180運(yùn)放構(gòu)建差分放大器。如下圖所示 如果我的放大倍數(shù)取0.4,那么取R1=R2=300K,RF=RG=120K,和R1=R2=30K,RF=RG=12K這兩個(gè)選取哪一組比較好?;蛘哂惺裁捶椒梢杂脕泶_定這四個(gè)
    發(fā)表于 08-16 12:36

    行云流水線 滿足你對(duì)工作流編排的一切幻想~skr

    的核心組成部分,旨在加速軟件交付、提高質(zhì)量和實(shí)現(xiàn)持續(xù)改進(jìn)。流水線的核心是流水線模型,是實(shí)現(xiàn)工作流編排,執(zhí)行的重要基石,一個(gè)優(yōu)秀的流水線模型可以覆蓋用戶更多的實(shí)踐場(chǎng)景,按照用戶的所思所想支持編排相應(yīng)的工作流程,通過模型的分層設(shè)計(jì),
    的頭像 發(fā)表于 08-05 13:42 ?548次閱讀

    IGBT的四個(gè)主要參數(shù)

    IGBT的四個(gè)主要參數(shù)對(duì)于選擇合適的IGBT器件至關(guān)重要。本文將介紹IGBT的四個(gè)主要參數(shù):電壓等級(jí)、電流等級(jí)、開關(guān)頻率和熱性能。 1. 電壓等級(jí) 電壓等級(jí)是IGBT的一個(gè)重要參數(shù),它決定了IGBT能夠承受的最大電壓。電壓等級(jí)的
    的頭像 發(fā)表于 07-25 11:05 ?7662次閱讀
    主站蜘蛛池模板: 久久99精品久久久久久野外 | 26uuu另类欧美亚洲曰本 | 最黄色的视频 | 手机毛片在线 | 五月天综合在线 | 特级做a爰片毛片免费看 | mide-776中文字幕在线 | www一区二区三区 | 老师别揉我胸啊嗯上课呢视频 | 国产精品久久久久久久久ktv | 国产在线五月综合婷婷 | 天天天干 | 免费观看黄a一级视频日本 免费观看黄色网页 | 天堂男人网| 亚洲va久久久噜噜噜久久狠狠 | 成年午夜一级毛片视频 | 午夜神马福利影院 | 九色在线看 | 国产毛片久久久久久国产毛片 | 草草影院ccyy国产日本欧美 | 欧美爽爽爽爽爽爽视频 | 国产美女亚洲精品久久久久久 | 99草在线观看 | 一二三区在线观看 | 国产h视频在线观看 | 成人免费午间影院在线观看 | 最新精品 | 午夜影院18 | 亚洲情a成黄在线观看动 | 欧美激欧美啪啪片免费看 | 国产色视频网站 | 欧美中出| 97影院午夜在线观看视频 | 人操人爱| 视频一本大道香蕉久在线播放 | 欧美三级黄视频 | 国产免费高清在线精品一区 | 久久99爰这里有精品国产 | 日本资源在线 | 一区二区三区中文国产亚洲 | 激情在线视频 |