本月的最熱機器學習項目出來了!Mybridge對過去一個月的近250個機器學習開源項目進行了排名,甄選出GitHub星數最多的10大熱門項目。開源項目是機器學習研究的寶庫,你一定能從中找到一個能啟發你的有趣項目。
Mybridge對過去一個月的近250個機器學習開源項目進行了排名,甄選出GitHub星數最多的Top 10熱門項目。
這個列表中10個項目的平均GitHub星星數:1041??
主題包括:DensePose,圖像分類, Mulit-Scale訓練,移動AI計算引擎,衛星圖像,NLP,Python包,Word detection,NCRF,DALI。
開源項目對程序員來說是很有幫助的。希望你能從中找到一個能啟發你的有趣項目。
No.1:DensePose:密集人體姿態估計
DensePose是一種實時的方法,可以將所有2D RGB圖像的人體像素映射到身體的3D表面模型。[Github 2901顆星]來自Facebook的研究
密集人體姿態估計(Dense human pose estimation)的目的是將RGB圖像的所有人體像素映射到人體的3D表面。DensePose-RCNN是在Detectron框架中實現的,使用的是Caffe2。
作者在這個GitHub存儲庫中提供了訓練和評估DensePose-RCNN的代碼。同時還提供了notebook,用于可視化收集的DensePose-COCO數據集,并展示與SMPL模型的對應關系。
DensePose-COCO注釋的可視化
項目地址:
https://github.com/facebookresearch/DensePose
No.2:Darts:卷積網絡和循環網絡的可微分架構搜索
[Github 1128顆星],來自CMU Hanxiao Liu,Yiming Yang以及DeepMind Karen Simonyan等人的研究。
這個GitHub庫提供了他們的論文“DARTS: Differentiable Architecture Search”中的代碼。在這篇論文中,研究者提出通過以可微分的方式表示任務來解決架構搜索可擴展性的挑戰。該方法基于架構表示的連續松弛(continuous relaxation),允許使用梯度下降來有效搜索架構。
該方法能夠有效地設計用于圖像分類的高性能卷積網絡架構(在CIFAR-10和ImageNet上)和用于語言建模的循環網絡架構(在Penn Treebank和WikiText-2上), 并且只使用一個GPU,比最先進的非可微分技術快幾個數量級。
隨時間推進,卷積網絡架構的搜索
隨時間推進,卷積網絡和神經網絡架構的搜索
項目地址:
https://github.com/quark0/darts
[Github 1352顆星]
SNIPER是一種高效的多尺度(multi-scale)訓練方法,用于實例級的識別任務,例如目標檢測和實例級分割。SNIPER不是在圖像金字塔中處理所有像素,而是有選擇地處理ground truth對象周圍(也就是芯片)的上下文區域。這大大加快了在低分辨率芯片上運行的多尺度訓練。由于其內存的設計十分高效,SNIPER可以在訓練過程中受益于batch normalization,并且可以在單個GPU上完成更大batch-sizes 的實例級識別任務。因此,我們不需要跨GPU同步batch-normalization 數據,我們可以訓練對象檢測器,就像做圖像分類一樣!
項目地址:
https://github.com/mahyarnajibi/SNIPER
No.4:Mace:專為移動端異構計算平臺優化的深度學習推理框架
[Github 2118顆星]。 來自小米
Mobile AI Compute Engine (MACE)是小米開源的移動端深度學習框架,它針對移動芯片特性進行了大量優化,目前在小米手機上已廣泛應用,如人像模式、場景識別等。
Mace主要從以下的角度做了專門的優化:
性能
代碼經過NEON指令,OpenCL以及Hexagon HVX專門優化,并且采用Winograd算法來進行卷積操作的加速。 此外,還對啟動速度進行了專門的優化。
功耗
支持芯片的功耗管理,例如ARM的big.LITTLE調度,以及高通Adreno GPU功耗選項。
系統響應
支持自動拆解長時間的OpenCL計算任務,來保證UI渲染任務能夠做到較好的搶占調度, 從而保證系統UI的相應和用戶體驗。
內存占用
通過運用內存依賴分析技術,以及內存復用,減少內存的占用。另外,保持盡量少的外部 依賴,保證代碼尺寸精簡。
模型加密與保護
模型保護是重要設計目標之一。支持將模型轉換成C++代碼,以及關鍵常量字符混淆,增加逆向的難度。
硬件支持范圍
支持高通,聯發科,以及松果等系列芯片的CPU,GPU與DSP(目前僅支持Hexagon)計算加速。 同時支持在具有POSIX接口的系統的CPU上運行。
項目地址:
https://github.com/XiaoMi/mace
No. 5:Robosat:用于航空和衛星圖像的語義分割工具
[Github 886顆星]。由Salesforce打造
RoboSat是用Python 3編寫的一個端到端的pipeline,用于從航空圖像和衛星圖像中提取特征。特征可以是任何視覺上可區分的東西,例如:建筑物,停車場,道路,或汽車。
RoboSat提供的工具可分為以下幾類:
數據準備:為訓練特征提取模型創建數據集
訓練和建模:用于圖像中特征提取的分割模型
post-processing:將分割結果轉換為簡潔的幾何圖形
項目地址:
https://github.com/mapbox/robosat
No.6 decaNLP:處理自然語言任務,一個頂十個
[Github 776顆星]
自然語言十項全能(decaNLP)的目標是構建一個能夠完成十項自然語言任務的通用模型,這些任務包括:問答、機器翻譯、摘要、自然語言推理、情感分析、語義角色標注、關系抽取、目標導向對話、語義分析、常識代詞消解。每個任務都被轉換為問答問題,以便使用新的多任務問題應答網絡(Multitask Question Answering Network,MQAN)。該模型聯合學習decaNLP中的所有任務,并且在多任務設置中不使用任何特定于任務的模塊或者參數。
項目地址:
https://github.com/salesforce/decaNLP
No.7 Magnitude:一個快速、高效的通用矢量嵌入實用包
[Github 427顆星]
Magnitude是一個功能豐富的Python包和矢量存儲的文件格式,用于以快速、高效、簡單的方式使用機器學習模型中的向量嵌入(由Plasticity開發)。它逐漸成為“輕量版”的Gensim,但卻可以用于NPL之外的領域,作為一種通用的關鍵向量(key-vector)存儲。
項目地址:
https://github.com/plasticityai/magnitude
No.8 Porcupine:由深度學習驅動的設備喚醒詞檢測引擎
[Github 373顆星]
Porcupine是一款自助式,高精度,輕量級的喚醒字檢測引擎。它使開發人員能夠構建始終監聽(always-listening)語音的應用程序/平臺。
自助式:開發人員有權在幾秒鐘內選擇任何喚醒詞并構建其模型。
在現實場景中用深度神經網絡進行訓練
由于它緊湊且計算效率高,使其適用于物聯網的應用
跨平臺:它是在純定點ANSI C中實現的。目前支持Raspberry Pi、Android、iOS、watchOS,Linux,Mac和Windows。
可擴展性:它可以同時檢測數十個喚醒詞,幾乎不增加CPU/內存占用。
開源:在這個存儲庫中找到的任何東西都是Apache 2.0許可的。
項目地址:
https://github.com/Picovoice/Porcupine
No.9 NCRF:神經條件隨機場,檢測腫瘤轉移
[Github 290顆星]
由百度深度學習研究院提出,其文章結構如下(附代碼和數據):
NCRF介紹
準備工作
數據介紹
模型介紹
訓練
測試
項目地址:
https://github.com/baidu-research/NCRF
No.10:NVIDIA DALI
這是一個包含高度優化的構建模塊和用于深度學習應用中數據預處理執行引擎的庫。NVIDIA DALI可加速深度學習應用程序的輸入數據預處理。 DALI 提供加速不同數據管道的性能和靈活性,作為一個單獨的庫,可以輕松集成到不同的深度學習訓練和推理應用程序中。
DALI的主要亮點包括:
從磁盤讀取到準備訓練/推理的完整的數據流水線;
可配置圖形和自定義操作員的靈活性;
支持圖像分類和分割工作量;
通過框架插件和開源綁定輕松實現集成;
具有多種輸入格式的便攜式訓練工作流 - JPEG,LMDB,RecordIO,TFRecord;
通過開源許可證可擴展以滿足用戶的特定需求
-
圖像
+關注
關注
2文章
1089瀏覽量
40581 -
機器學習
+關注
關注
66文章
8441瀏覽量
133098 -
數據集
+關注
關注
4文章
1209瀏覽量
24839
原文標題:【干貨】7月機器學習Top 10,GitHub平均1041星!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
2012年模擬行業熱門事件大盤點Top10
最新熱門電路圖設計TOP10精華集錦
分享幾個在GitHub上嵌入式相關的開源項目
2018 年 2 月份 GitHub 上最熱門的開源項目
總結一份GitHub熱門開源項目
GitHub熱門項目盤點(值得收藏)
豐田CUE類人機器人創造了新記錄 連續執行籃球罰球次數最多
10月份GitHub上最熱門的Python開源項目上榜詳情
2020年全球熱門娛樂應用TOP10榜單出爐
2020年11月Github上最熱門的11個開源項目
![2020年11月<b class='flag-5'>Github</b>上最<b class='flag-5'>熱門</b>的11個開源<b class='flag-5'>項目</b>](https://file.elecfans.com/web1/M00/D8/E4/pIYBAF_ytUCAPlXtAAGfCCTpMvQ588.png)
評論