本文簡紹了 HanLP 的使用方法,HanLP 是一系列模型與算法組成的 NLP 工具包,由大快搜索主導并完全開源,目前支持很多功能,項目主要是 Java 的,也支持 python,本文詳細簡紹 pyhanlp 的使用方法。
簡介
HanLP 是由一系列模型與算法組成的工具包,目標是普及自然語言處理在生產環境中的應用。HanLP 具備功能完善、性能高效、架構清晰、語料時新、可自定義的特點。
HanLP 主要功能包括分詞、詞性標注、關鍵詞提取、自動摘要、依存句法分析、命名實體識別、短語提取、拼音轉換、簡繁轉換等等。
Github 地址:
https://github.com/hankcs/HanLP
官網:
http://hanlp.linrunsoft.com/
實戰
1. 安裝
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqiAEsN_AABqJhBp-lk982.png)
2. 分詞和詞性標注
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqiAfxBDAABY1PlKFF8456.png)
3.依存句法分析
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqiAHPPhAABh2XuZbAQ787.png)
4.關鍵詞提取
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqmAdU3fAAEZUtrLs8w052.png)
5.摘要提取
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqmANiC-AACCSb6YW1c617.png)
6. 感知機詞法分析器
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqqAOiycAAC6rwA-Hzw701.png)
7. 中國人名識別
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqqAHFhcAABl6BggSLE549.png)
8. 音譯人名識別
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPquAbkzAAAC9hJo1hsM113.png)
9. 短語提取
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPqyAPGlfAACQTSIxHt4231.png)
10. 拼音轉換
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPq2ATtMUAAC5-CRPHns165.png)
11. 繁簡轉換
![HanLP的使用方法](http://file.elecfans.com/web1/M00/91/77/o4YBAFzVPq2AaqiYAABqt_zuXpY325.png)
代碼已上傳:
https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/HanLPDemo.ipynb
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
原文標題:一文掌握 HanLP 用法
文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。
相關推薦
CharType.dat.yes 即可。相對比較簡單。嘗試HanLP主要處于各個開源自然語言處理工具包之間的差異,尋找一個適合學習的開源工具包。 HanLP調用方法HanLP幾乎所有
發表于 11-09 10:15
如何在一段文本之中提取出相應的關鍵詞呢? 之前我有想過用機器學習的方法來進行詞法分析,但是在項目中測試時正確率不夠。于是這時候便有了 HanLP-漢語言處理包 來進行提取關鍵詞的想法。下載:.jar
發表于 11-09 14:54
HanLP的一個很大的好處是離線開源工具包,換而言之,它不僅提供免費的代碼免費下載,而且將辛苦收集的詞典也對外公開啦,此誠乃一大無私之舉.我在安裝的時候,主要參照這份博客
發表于 12-10 11:36
的解決方法,大家可以借鑒學習以下! 由于要使用hanlp進行分詞,而我們的環境是python環境所以得安裝pyhanlp,但是安裝過程總是出現這樣的問題看上去感覺是缺少了visual c++環境,于是
發表于 12-19 10:27
`本篇分享的依然是關于hanlp的分詞使用,文章內容分享自 gladosAI 的博客,本篇文章中提出了一個問題,hanlp分詞影響了實驗判斷結果。為何會如此,不妨一起學習一下 gladosAI
發表于 02-18 10:29
摘要:elasticsearch是使用比較廣泛的分布式搜索引擎,es提供了一個的單字分詞工具,還有一個分詞插件ik使用比較廣泛,hanlp是一個自然語言處理包,能更好的根據上下文的語義,人名,地名
發表于 07-01 11:34
Python調用hanlp的方法此前有分享過,本篇文章分享自“逍遙自在017”的博客,個別處有修改,閱讀時請注意!1.首先安裝jpype首先各種坑,jdk和python 版本位數必須一致,我用
發表于 07-17 10:39
實體識別,她用了一個很有意思的方法,自己改了HanLP的詞典,手動加了好多詞,而且后期版本迭代中還有可能繼續改。。。。改了HanLP的詞典就意味著不能用maven直接導入倉庫里的包了,只能直接將修改后
發表于 10-18 14:33
?192次閱讀
【1】確定正確安裝配置Java和Eclipse【2】下載HanLp的各種東西http://hanlp.linrunsoft.com/services.html?下載這四個文件到本地,我是放在桌面的一
發表于 10-18 14:46
?374次閱讀
!")java.lang.System.out.println("hello world")jpype.shutdownJVM()出錯調試,原因已說;測試成功會有輸出。下面啟動虛擬機跑hanlp2.下載各種安裝包使用自定義
發表于 10-18 15:01
?218次閱讀
地不讓我做中文分詞處理(老報錯).無奈之下,我只能使用第三方的分詞工具.由于standford的源碼是java,我尋找了一個與之對應的分詞工具,即hanlp.HanLP的安裝使用 HanLP的一個很大
發表于 10-18 15:05
?231次閱讀
HanLP官方GitHub地址HanLP在java項目中配置HanLP推薦使用Maven方法在poem.xml中加入以下代碼
????com.hankcs
????
發表于 11-29 14:38
?1036次閱讀
摘要:elasticsearch是使用比較廣泛的分布式搜索引擎,es提供了一個的單字分詞工具,還有一個分詞插件ik使用比較廣泛,hanlp是一個自然語言處理包,能更好的根據上下文的語義,人名,地名
發表于 11-29 15:01
?377次閱讀
,在https://github.com/hankcs/HanLP/releases網站下載hanlp.jar包、模型data包、配置文件hanlp.properties,新建一個文件夾Han
發表于 11-29 15:02
?221次閱讀
示波器的使用方法并非很難,重點在于正確使用示波器的使用方法。往期文章中,小編對模擬示波器的使用方法和數字示波器的使用方法均有所介紹。為增進大家對示波器的
發表于 12-24 20:37
?3415次閱讀
評論