人工智能技術目前越來越火爆,近日,2018 年圖靈獎得主揭曉,獲獎的三位科學家是分別是 Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton。相信在人工智能領域,沒有人不知道這三位,眾所周知,他們被稱為「深度學習三巨頭」。
作為人工智能領域「皇冠上的明珠」,NLP 技術在經歷了過去幾年的發展之后,證明了它落地的可行性,因此目前也是相當火爆。想必同學們也會經常在網上找一些好的學習資源。
最近,小編在 github 上發現了一份基于的 NLP 學習教程。這份教程內容相當豐富,內容涵蓋神經網絡機器翻譯、問答匹配、電影評價分類、新聞分類等多個領域。
項目的 GitHub 地址為:https://github.com/lyeoni/nlp-tutorial。
這是一個教你逐步實現和適應簡單的實詞 NLP 任務的教程:
項目里面有 4 個資源:神經機器翻譯、問答匹配、新聞分類和電影分級。這些資源都提供了源碼,對初學者來說,極為友好。初學者可以學會建立自己的模型。
廢話就不多說了,讓我們一起來具體看看這些資源吧~
神經機器翻譯:這個 repo 提供了神經機器翻譯的簡單 PyTorch 實現,以及機器翻譯過程中各種序列到序列(seq2seq)模型的比較。
關鍵詞:序列到序列網絡(seq2seq),注意機制,自回歸,Teacher-forcing
問答匹配:這個 repo 提供了簡單的 PyTorch 問答匹配實現。在這里,我們使用來自 Stack Exchange 的英語語料庫來構建整個問題的嵌入。使用這些嵌入,我們找到給定問題的類似問題,并找到相應的答案。
關鍵詞: 長度可變的 LSTM 序列,TF-IDF,文本分類
新聞分類:此報告包含一個簡單的源代碼,用于基于 textcn 的文本分類。語料庫是英文的赫夫波斯特新聞分類數據集。大多數開放源代碼對于初學者來說有點難以學習和建立文本分類模型。所以,我希望這個 repo 對于那些想要擁有自己的文本分類模型的人來說是一個很好的解決方案。
關鍵詞:textcn,文本分類,文本分類
電影分級(韓國 NLP):此 repo 包含一個簡單的源代碼,用于基于 TextCNN 的文本分類任務中。其語料庫是 Huffpost 的新聞分類數據集。對初學者來說,學習大多數開放源代碼、建立文本分類模型是有難度的。所以,我希望這個 repo 可以幫助他們擁有自己的文本分類模型。
關鍵詞:TextCNN、文本分類、情感分析
如果在學習中遇到相關問題,還可以點擊下面的網址,加入小組答疑:https://github.com/lyeoni/nlp-tutorial/tree/master/question-answering-SQuAD
擁有這么好的資源,同學們趕快開始學習吧!
-
人工智能
+關注
關注
1797文章
47867瀏覽量
240781 -
機器翻譯
+關注
關注
0文章
139瀏覽量
14963 -
nlp
+關注
關注
1文章
489瀏覽量
22125
原文標題:NLP 新手必看!這是一份覆蓋全面的基于 PyTorch 和 keras 的 NLP 學習教程
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
怎么集齊7個云平臺?本文教你!
![怎么集齊7<b class='flag-5'>個</b>云平臺?本文<b class='flag-5'>教你</b>!](https://file1.elecfans.com/web3/M00/00/95/wKgZPGdKs4GAMcLyAAEq7LD5L4g777.png)
評論