【導語】隨著機器學習和數據科學的不斷發展,相關技術在越來越多的領域得到了應用,機器學習、數據科學和其他學科的結合已經成為了必然趨勢。在本文中,我們給大家分享了一個包含機器學習和數據科學技術在工業界開源應用的 Github 項目,具體領域包括會計、銀行和保險業務、法律和法規、政府和公共政策等等。該項目仍在持續更新中。
隨著機器學習和數據科學技術的不斷發展,在工業界出現了越來越多的相關技術應用,學科交叉已經成為必然趨勢。
在今天的分享中,營長為大家選取了一個來自GitHub的項目,該項目整理了機器學習和數據科學在工業界的落地應用,應用領域包括會計、銀行和保險業務、法律和法規、政府和公共政策等領域。在該項目中,除非特別注明,作者分享的大部分項目都基于 Python 。另外,為了使得項目代碼更具參考性,該項目列表沒有包含明確聲明“不再更新”或者已超出2年未更新的相關項目。
先為大家梳理了一下該項目的相關內容,以便大家快速查看。如果希望進一步了解相關內容,可查看文末的 GitHub 項目地址。
在該項目中,作者嘗試對機器學習和數據科學在工業界的具體應用情況進行匯總,預計包含的領域如下表:
目前,作者已經整理了會計、銀行和保險業務、法律和法規、政府和公共政策四個領域的相關開源項目情況,并進行了歸納和匯總。對于每個領域,作者對相關資源進行了分類和項目匯總,并給出了每個項目的鏈接和簡短介紹。該項目列表仍在持續更新中。
領域:會計
作者將會計相關的應用劃分為7類,包括機器學習、數據分析、文本分析、數據獲取與處理、相關研究和文章、網站、課程。下面對各部分進行分別介紹。
機器學習
1.Chartof Account Prediction:使用帶標簽的數據集預測每筆交易的賬戶名稱。
2.AccountingAnomalies:使用深度學習框架識別會計信息中的異常。
3.FinancialStatement Anomalies:基于 R語言,在會計文件歸檔前檢測會計異常信息。
4.UsefulLife Prediction:使用傳感器數據和特征工程預測資產的可使用年限。
5.AI Applied to XBRL:將可擴展商業報告語言(XBRL)用于 AI 和機器學習。
數據分析
1.ForensicAccounting:包含使用數據分析手段進行法務會計的案例研究集合。
2.GeneralLedger:對會計系統中的總賬進行數據處理。
3.BulletGraph:以子彈圖(bullet graph)形式對銷售、委托及其他會計活動進行可視化。
4.AgedDebtors:對長期債務人的案例分析。
5.AutomatedFS XBRL:自動生成 XBRL ,也可使用 python 格式輸出。
文本分析
1.FinancialSentiment Analysis:對交易信息進行情感分析、距離分析和交易份額分析。
2.Extensive NLP:針對會計研究的 NLP 技術匯總。
數據,句法分析和 APIs
1.EDGAR:獲取電子化數據收集、分析及檢索系統(EDGAR)數據的指南。
2.IRS:獲取美國國家稅務局(IRS)歸檔數據并進行句法分析的指南。
3.FinancialCorporate:羅格斯大學提供的金融數據集
4.Non-financialCorporate:羅格斯大學提供的非金融公司數據集
5.PDFParsing:從 PDF 文件中抽取有用信息
6.PDFTabel to Excel:從 PDF 文件中輸出表格
研究和文章
1.UnderstandingAccounting Analytics:介紹了會計分析的重要性。
2.VLFeat:一個計算機視覺算法的開源庫,并且提供了 Matlab 工具。
網站
1.RutgersRaw:羅格斯大學的數字會計研究
課程
1.ComputerAugmented Accounting:羅格斯大學的系列視頻課程,主要講解如何將計算機手段應用到會計中。
2.Accountingin a Digital Era:羅格斯大學的系列視頻課程,主要講解數字時代對會計的影響。
領域:銀行和保險業
作者將該領域歸納為7部分內容,包括消費經濟、管理、評估、欺詐、保險業及其風險、物質基礎、數據。下面進行分別介紹。
消費金融
1.LoanAcceptance:對借貸成功率的分類和時序分析。
2.PredictLoan Repayment:使用自動特征工程預測貸款是否會被歸還
3.LoanEligibility Ranking:檢驗消費者是否具有貸款資質的系統
4.HomeCredit Default:預測家庭信用違約
5.MortgageAnalytics:對按揭貸款的擴展分析
6.CreditApproval:輔助信用卡辦理申請批準的系統
7.LoanRisk:通過預測模型降低壞賬率,減小貸款損失
8.Amortisationschedule:用于個人使用的自動分期付款計劃
管理
1.CreditCard:對信用卡消費者進行顧客終生價值(CLV)評估
2.SurvivalAnalysis:對顧客進行生存分析
3.NextTransaction:使用深度學習模型預測下一次交易的金額和時間
4.CreditCard Churn:預測信用卡顧客流失
5.Bankof England Minutes:對英國銀行記錄的文本分析
評估
1.ZillowPrediction:預測 Zillow 公司提供的估價情況
2.RealEstate:評估城市地區的地產價格
3.UsedCar:二手車價格預測
欺詐
1.XGBoost:使用模擬退火算法調整 XGBoost 超參數以預測欺詐行為
2.FraudDetection loan in R:對銀行借貸的欺詐預測
3.AMLFinance Due Diligence:使用新聞進行反洗錢盡職調查
4.CreditCard Fraud:預測信用卡欺詐行為
保險業及其風險
1.BankFailure:對銀行破產進行預測
2.RiskManagement:關于金融業風險參與的課程資源
3.VaRGaN:使用 Keras 和 Tensorflow 評估市場風風險參與情況
4.ActuarialSciences (R):基于 R 語言的精算工具列表
物質基礎
1.BankNote Fraud Detection:使用Tensorflow 和隨機森林對紙幣進行鑒定
2.ATMSurveillance:銀行 ATM 監控
數據
1.EmployeeCount SEC Filings
2.SECParsing
3.OpenEdgar
4.RatingIndustries
法律法規
在該部分,作者介紹了3部分內容的相關應用,包括工具、政策和法規、司法應用。
工具
1.LexPredict:一個相關的代碼庫
2.AIPara-legal: AI 法律助理
3.LegalEntity Detection:對法律文件的命名實體識別
4.LegalCase Summarisation:對司法判例進行文摘的多種算法匯總
5.LegalDocuments Google Scholar:使用 Google scholar 自動抽取判例
6.ChatBot:法律領域的聊天機器人和郵件通知應用
政策和法規
1.GDPRscores:依據通用數據保護條例(GDPR)對法律文件的評分進行預測
2.DrivingFactors FINRA:對美國金融監管局(FINRA)發布限制令的影響因素分析
3.SecuritiesBias Correction:安全法規對價格影響的估計
4.PublicFirm to Legal Decision:分析上市公司對法律政策的反應
司法方面的應用
1.SuremeCourt Prediction:預測最高法院的觀念立場
2.SupremeCourt Topic Modeling:對最高法院的決定進行主題挖掘
3.JudgeOpinion:使用文本分析方法和機器學習分析法官針對某議題的觀點
4.ML LawMatching:使用機器學習匹配案例相關法律條例
5.BertMulti-label Classification:使用 AI 進行細粒度情感分析
6.SomeComputational AI Course:MIT的相關視頻課程
領域:政府和公共政策
在該部分,作者介紹了5部分內容,包括社會政策、選舉分析、災難管理、城市規劃、設施。
社會政策
1.Triage:對政策和公共利益問題的風險建模和預測工具
2.WorldBank Poverty I:對用于貧困預測的機器學習分類算法的比較優勢分析
3.WorldBank Poverty II:基于世界銀行數據的貧困分析
4.OverseasCompany Land Ownership:分析英國的外企情況
5.CFPB:美國消費者權益保護局(CFPB)的投訴分析
6.CannabisLegalisation Effect:關于大麻制品的法規對犯罪活動的影響分析
選舉分析
1.ElectionAnalysis:選舉分析和預測模型
2.AmericanElection Causal:使用美國國家選舉研究所(ANES)的數據構建因果推斷模型
3.CampaignFinance and Election Results:對競選經費和后續選舉結果間關系分析
災難管理
1.ConflictPrediction:沖突預測的相關代碼
2.BurglaryPrediciton:構建時空模型以預測入室盜竊
3.PredictiongDisease Outbreak:基于機器學習算法的相關應用
4.Roadaccident prediction:對巴西的聯邦公路的車禍分析
5.Text Mining:使用文本挖掘進行災難管理
6.Twitterand disasters:預測 twitter是否涉及災難事件
城市規劃
1.TrafficPrediction:使用多注意力機制的循環神經網絡模型對城市交通
進行時序分析
2.PredictCrashes:使用多數據來源的車禍預測模型
3.PredictHousehold Poverty:使用自動特征工程對哥斯達黎加的家庭貧困情況進行預測
設施
1.AirQuality Prediction:預測北京和倫敦在未來48小時的空氣質量
2.WaterAccountng: 對美國的水費預算進行預測
3.ElectrcityFrench Distribution:對法國的電力數據分布進行分析
以上就是今天的分享,希望對大家有所幫助。
-
機器學習
+關注
關注
66文章
8445瀏覽量
133121 -
GitHub
+關注
關注
3文章
474瀏覽量
16614 -
數據科學
+關注
關注
0文章
167瀏覽量
10104
原文標題:機器學習在金融、法律等領域的技術應用 | Github推薦
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
9月份最熱門的機器學習開源項目TOP 5
分享幾個在GitHub上嵌入式相關的開源項目
什么是機器學習?機器學習能解決什么問題?(案例分析)
![什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>機器</b><b class='flag-5'>學習</b>能解決什么問題?(案例分析)](https://file1.elecfans.com//web2/M00/A7/48/wKgZomUMQ46AWhvbAAArniEEIbo317.png)
Airbnb機器學習和數據科學團隊經驗分享
IBM與NVIDIA攜手為數據科學家拓展開源機器學習工具
計算機科學博士進入工業界的出路在哪里?
GitHub發布2018機器學習年度總結報告
![<b class='flag-5'>GitHub</b>發布2018<b class='flag-5'>機器</b><b class='flag-5'>學習</b>年度總結報告](https://file.elecfans.com/web1/M00/84/24/o4YBAFxRT2GAPum_AAAKYCEqKho733.png)
基于數據挖掘的4步工業界需求工程研究框架
![基于<b class='flag-5'>數據</b>挖掘的4步<b class='flag-5'>工業界</b>需求工程研究框架](https://file.elecfans.com/web1/M00/EC/7E/pIYBAGCCMeKAPcBiAAA4cYotcAY768.png)
評論