在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種新聞關(guān)鍵信息的提取算法

大小:0.87 MB 人氣: 2017-12-13 需要積分:0

  針對網(wǎng)頁正文提取算法缺乏通用性,以及對新聞網(wǎng)頁的提取缺乏標(biāo)題、時(shí)間、來源信息的問題,提出一種新聞關(guān)鍵信息的提取算法newsExtractor。該算法首先通過預(yù)處理將網(wǎng)頁轉(zhuǎn)換成行號和文本的集合,然后根據(jù)字?jǐn)?shù)最長的一句話出現(xiàn)在新聞?wù)牡母怕蕵O高的特點(diǎn),從正文中間開始向兩端尋找正文的起點(diǎn)和終點(diǎn)提取新聞?wù)模鶕?jù)最長公共子串算法提取標(biāo)題,構(gòu)造正則表達(dá)式并以行號輔助判斷提取時(shí)間,根據(jù)來源的格式特點(diǎn)并輔以行號提取來源;最后構(gòu)造了數(shù)據(jù)集與國外開源軟件newsPaper進(jìn)行提取準(zhǔn)確率的對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,newsExtractor在正文、標(biāo)題、時(shí)間、來源的平均提取準(zhǔn)確率上均優(yōu)于newsPaper,具有通用性和魯棒性。

一種新聞關(guān)鍵信息的提取算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價(jià):好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?
      主站蜘蛛池模板: 天天摸夜夜添狠狠添2018 | 涩色影院 | 久久婷婷综合中文字幕 | 电源天堂 | www.青草视频 | 美女网站视频色 | 午夜精品久久久久久91 | 国产美女精品久久久久中文 | 五月天丁香婷婷网 | 亚洲午夜免费视频 | 在线视频 亚洲 | 美女自熨出白浆视频在线播放 | 27pao强力打造高清免费高 | 992tv国产精品福利在线 | 欧美另类激情 | 精品免费视在线视频观看 | 夜夜春夜夜爽 | 韩国三级床戏合集 | 免费在线一区二区三区 | 99久久精品费精品国产一区二 | 久久狠狠第一麻豆婷婷天天 | 亚洲人成影院在线高清 | 黄色在线视频免费看 | 久久久久国产精品四虎 | gay超刺激污文 | 经典三级一区二区三区视频 | 一级毛片一级毛片一级级毛片 | 精品视频一区二区三区 | 爱我免费视频观看在线www | 欧美高清在线播放 | 一级毛片美国一级j毛片不卡 | 亚洲第一视频网 | 在线免费看一级片 | 国产色婷婷精品综合在线观看 | 日本黄色大片免费 | 1000部啪啪未满十八勿入中国 | 高清一级做a爱免费视 | 黄 色 片成 人免费观看 | 国产亚洲卡二卡3卡4卡乱码 | 免费簧片视频 | 久久99色|