雷鋒網 AI 研習社按:本文由來自倫敦的數據科學家 Pedro Lopez 編寫,文中提供了與人臉識別、圖像識別、文本分析、自然語言處理、情緒分析、語言翻譯、機器學習和預測有關的 50 多個應用程序接口(API),雷鋒網 AI 研習社根據原文進行了編譯。
本篇基于 2017 年的推薦清單做了一些改進——去除了一些不再進行維護的 API,并且更新了一些新的 API。主要覆蓋如下方向:
人臉與圖像識別
文本分析、自然語言處理、情感分析
語言翻譯
機器學習和預測
該清單按照字母排序,對 API 的概述是基于對應官網所提供的信息(截止 2018 年 4 月 16 日)整合而成。要是大家發現該清單中錯過了某些當前流行的 API,可以在評論中告知。
人臉與圖像識別
Animetrics Face Recognition:可用于檢測圖像中的人臉,支持同時多人檢測,并且可以將檢測到的人臉與已知的人臉數據進行匹配。這個 API 還可以添加或刪除可檢索圖庫中的主題,也可添加或刪除主題中的人臉。
Betaface:提供在線人臉識別和檢測服務。主要有如下功能:多人臉檢測、人臉裁剪、123 個人臉關鍵點檢測(22 個基本關鍵點,101 個高級關鍵點)、人臉驗證、人臉識別以及大型數據庫中相似人臉的檢索。
Eyedea Recognition:專注于高端計算機視覺解決方案,主要針對物體檢測和物體識別軟件開發。提供眼睛、面部、車輛、版權和牌照識別等服務。這一 API 的主要價值是可以即時理解畫面中的對象、用戶和行為。
Face++:在應用中提供人臉識別和檢測服務,具有檢測、識別和分析服務功能。用戶可以調用訓練程序、檢測人臉、識別人臉、人臉聚類、操縱人臉、創建人臉數據集、創建分組和獲取信息。
FaceMark:該 API 可以從一張正面的人臉圖像中檢測出 68 個關鍵點,從一張側面的人臉圖像中則可以檢測出 35 個點。
FaceRect:這是一個強大且完全免費的人臉檢測 API。該 API 能夠從單張圖像中找到單張人臉或者多張人臉(不論是正臉還是側臉),然后將找到的每個人臉信息存儲在生成的 JSON 文件中。此外,FaceRect 還能為每個檢測到的人臉找到面部特征(眼睛、鼻子和嘴巴等)。
Google Cloud Vision API:由諸如 TensorFlow 這樣的平臺作為支撐,該 API 允許模型學習和預測圖像中的內容。它能幫助你在大規模數據集中快速找到你最喜歡的圖像,并獲得豐富的圖像信息。它將圖像劃分成幾千個類別(例如“船”、“獅子”、“埃菲爾鐵塔”等),檢測人臉并分析情緒,識別圖像中的多國文字。
IBM Watson Visual Recognition:該 API 可以理解圖像的內容、視覺概念,然后在圖像中標記出來,檢測人臉、估計年齡和性別,從數據集中找到相似的圖像。你還可以通過創建自定義概念來訓練服務器。
Imagga:該 API 可以自動將標簽分配給圖像,從而使得圖像檢索起來更加簡單。它基于圖像識別平臺即服務(Platform as a Service)構建。
Kairos:這個平臺可以幫你快速將情緒分析和人臉識別添加到應用程序(APP)和服務中。
Microsoft Cognitive Service - Computer Vision:這個云端 API 可以根據輸入數據和用戶的選擇,通過不同的方式分析視覺內容。比如依據圖像內容給圖像打標簽、圖像分類、檢測人臉并返回人臉坐標、識別特定領域的內容、生成與圖像內容有關的描述、辨識圖像中的文本、標記成人內容。
ParallelDots Visual Analytics APIs:它提供特別服務來幫助進行圖像自動標注,可以過濾不合適的內容,從臉部表情中識別人物情緒。
Skybiometry Face Detection and Recognition:提供人臉檢測和識別服務。最新版本的 API 還可以區分墨鏡與一般眼鏡。
文本分析、自然語言處理與情感分析
Bitext:提供了市面上最準確的基于多語言話題的情緒分析服務。目前,有四種語義服務可用:實體和概念提取,情感分析和文本分類。該 API 支持 8 種主流語言。
Diffbot Analyze:為開發者提供了許多工具,支持從任意的網頁中識別、分析和提取出主要內容和部分。
Free Natural Language Processing Service:這是一項免費服務,包括情緒分析、內容提取和語言檢測。這個 API 在大型云 API 市場 mashape.com 上非常流行。
Google Cloud Natural Language API:分析文本的結構和意義,包括情緒分析、實體識別和文本注釋。
Watson Natural Language Understanding:分析文本并從內容中抽取元數據,例如概念、實體、關鍵詞、類別、關系和語義信息。
MeaningCloud Text Classification:該 API 可以執行預分類任務(Pre-classification),例如文本抽取、符號化、停止詞消除和詞形還原。
Microsoft Cognitive Service - Text Analytics:從所給的文本中檢測情緒、關鍵短語、主題以及語言。還有一些 API(語言的認知服務)與該 API 類似,包括:必應拼寫檢查、語言理解、語言分析、網絡語句模型。
nlpTools:一種簡單的基于 HTTP RESTful 網絡服務的自然語言處理 API,反饋結果是 JSON。它可以解碼在線新聞媒體,進行情緒分析和文本分類。
Geneea:能夠在用戶提供的原始文本上進行分析(自然語言處理),也能執行分析從指定的 URL 中提取的文本、直接提供的文件。
ParallelDots Text Analytics APIs:支持十四種語言,提供方便且多樣化的自然語言理解(NLU)算法,可以檢測文檔的情感,查找文檔中的重要實體,刪除不文明用語。利用 ParallelDots 自定義分類器,不需要任何訓練數據就能構建文本分類器。
Thomson Reuters Open Calais:通過使用自然語言處理、機器學習和其它方法,Calais 可以將文檔與實體(人物、地點、組織等)、事實(人物“x”供職于公司"y")和事件(人物"z"在日期“x”被任命為公司“y”的主席)進行分類與連接。
Yactraq Speech2Topics:這是一個通過語音識別和自然語言處理將音頻和視頻內容轉換為主題元數據的 API 。
語言翻譯
Google Cloud Translation:能夠在數以千計的語言對(Language pairs)中動態翻譯文本,允許網站和程序以編程的方式與翻譯服務進行集成。
Google Cloud SPEECH-TO-TEXT:應用強大的神經網絡模型,開發人員能夠利用該 API 將音頻轉化為文本。支持識別全球 120 種語言及其變體。
IBM Watson Language Translator:文本翻譯 API ,提供了多種特定領域的模型,你甚至能夠基于自己獨特的術語和語言進行定制。例如,顧客們可以通過自己的語言進行交流。
MotaWord:快速人工翻譯平臺,提供超過 70 種語言的翻譯服務。該 API 還可以為開發者們提供翻譯引用、翻譯項目提交、文檔和樣式指南功能,也可以跟蹤翻譯項目的進度并實時獲取活動反饋。
WritePath Translation:該 API 允許開發人員訪問和集成 WritePath 與其它應用程序的功能。可以使用此 API 完成的操作:檢索單詞數量、發布翻譯文檔、檢索已翻譯的文檔和文本。
Houndify:通過一個始終在學習的獨立平臺,將智能語音和智能對話集成到產品中。
IBM Watson Conversation:構建理解自然語言的聊天機器人,并將它們部署在任意設備上,比如信息平臺和網站。與此 API 相同的其它 API(語言的認知服務)包括:對話(Dialog)、自然語言分類(Natural Language Classifier)、個性觀點(Personality Insights)、文件轉換(Documen Conversion)和聲調分析器(Tone Analyzer)。
IBM Watson Speech:包括語音到文本的轉換和文本到語音的轉換,例如在聯絡中心錄制電話或創建語音控制的應用程序。
機器學習與預測
Amazon Machine Learning:可以進行謊話檢測、天氣預報、目標市場預測和點擊量預測。
BigML:為云托管的機器學習和數據分析提供服務。用戶可以設置數據源并創建一個模型,然后通過標準的 HTTP 協議使用基礎監督和無監督機器學習任務進行預測。
Google Cloud Prediction:提供一種基于 RESTful API 來構建機器學習模型的服務。這些工具可以幫助分析數據,從而為你的應用提供多種多樣的新功能,例如,客戶情感分析、垃圾郵件檢測、推薦系統等等。
co:為電商網站提供產品推薦引擎。Guesswork 使用在 Google Prediction API 上運行的語義規則引擎可以準確預測客戶意圖。
Hu:toma:提供免費訪問,幫助全世界的開發人員構建并實現深度學習聊天機器人,提供創建和分享對話式 AI 的工具和渠道。
IBM Watson Retrieve and Rank:開發人員可以將他們的數據加載到這一服務中,使用已知的結果來訓練機器學習模型(Rank),之后將輸出相關文檔和元數據的列表等。利用這一 API,可以幫助呼叫中心智能體快速找到答案,以改善客戶呼叫的平均處理時間。
indico:提供文本分析(例如情感分析、Twitter 預約、情感)和圖像分析(例如面部情緒、面部定位)功能。indico 的 API 可以免費使用,不需要訓練數據。
Microsoft Azure Cognitive Service API:支持批處理,擁有更好的 API Explorer,更簡潔的 API 接口,更一致的注冊/計費體驗等新功能。
Microsoft Azure Anomaly Detection API:用數值(均勻時間間隔)檢測時間序列數據中的異常情況。例如,當檢測到計算機內存使用量開始上升時,可能會指示內存泄露。
Microsoft Cognitive Service - QnA Maker:將信息提取成會話形式。與該 API 同一個組(知識的認知服務)的有如下 API:學術知識(Academic Knowledge)、實體鏈接(Entity Linking)、知識探索(Knowledge Exploration)和推薦(Recommendations)。
Microsoft Cognitive Service - Speaker Recognition:能讓你的應用程序理解誰正在說話。與該 API 位于同一個組(語音的認知服務)的其它 API 有必應語音(將語音轉換為文本,然后再將文本轉換為語音,并且還能理解語音隱含的意圖)和自定義識別。
MLJAR:為原型設計、開發和部署模式識別算法提供服務。
NuPIC:這是一個用 Python/C++ 編寫的開源項目,它實現了 Numenta 皮質學習算法(Cortical Learning Algorithm),由 NuPIC 社區進行維護。該 API 允許開發人員使用原始算法,將多個區域(包括層次結構)串聯起來,還支持使用其它平臺的功能。
PredicSis:從大數據中洞見趨勢,通過預測分析來提高營銷業績。
PredictionIO:這是在 Apache Spark 許可證下發布的基于 Apache Spark、HBase 和 Spray 的開源機器學習服務。示例 API 方法包括創建管理用戶和用戶記錄、項目和內容檢索以及基于用戶的推薦創建和管理。
RxNLP - Cluster Sentences and Short Texts:提供文本挖掘和自然語言處理服務。包含句子聚類 API(Cluster Sentences API),可以將句子(比如從多篇新聞中獲取的句子)或簡短文本(例如來自 Twitter 或者 Facebook 的貼子)劃分成多個邏輯組(Logical groups)。
Recombee:通過 RESTful API 提供數據挖掘、語言查詢和機器學習算法服務。
評論