【導(dǎo)讀】Python數(shù)據(jù)工具箱涵蓋從數(shù)據(jù)源到數(shù)據(jù)可視化的完整流程中涉及到的常用庫(kù)、函數(shù)和外部工具。其中既有Python內(nèi)置函數(shù)和標(biāo)準(zhǔn)庫(kù),又有第三方庫(kù)和工具。
這些庫(kù)可用于文件讀寫、網(wǎng)絡(luò)抓取和解析、數(shù)據(jù)連接、數(shù)清洗轉(zhuǎn)換、數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析、圖像和視頻處理、音頻處理、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、數(shù)據(jù)可視化、交互學(xué)習(xí)和集成開發(fā)以及其他Python協(xié)同數(shù)據(jù)工作工具。
為了區(qū)分不同對(duì)象的來(lái)源和類型,本文將在描述中通過(guò)以下方法進(jìn)行標(biāo)識(shí):
Python內(nèi)置函數(shù):Python自帶的內(nèi)置函數(shù)。函數(shù)無(wú)需導(dǎo)入,直接使用。例如要計(jì)算-3.2的絕對(duì)值,直接使用abs函數(shù),方法是
abs(-3.2)
Python標(biāo)準(zhǔn)庫(kù):Python自帶的標(biāo)準(zhǔn)庫(kù)。Python標(biāo)準(zhǔn)庫(kù)無(wú)需安裝,只需要先通過(guò)import方法導(dǎo)入便可使用其中的方法。例如導(dǎo)入string模塊,然后使用其中的find方法:
import stringstring.find('abcde','b')
第三方庫(kù):Python的第三方庫(kù)。這些庫(kù)需要先進(jìn)行安裝(部分可能需要配置)。
外部工具:非Python寫成的庫(kù)或包,用于Python數(shù)據(jù)工作的相關(guān)工具。
「推薦度」3星最高,1星最低。
01 文件讀寫
文件的讀寫包括常見的txt、Excel、xml、二進(jìn)制文件以及其他格式的數(shù)據(jù)文本,主要用于本地?cái)?shù)據(jù)的讀寫。
1. open(name[, mode[, buffering]])
類型:Python內(nèi)置函數(shù)
描述:Python默認(rèn)的文件讀寫方法
推薦度:★★★
2. numpy.loadtxt、numpy.load和numpy.fromfile
類型:第三方庫(kù)
描述:Numpy自帶的讀寫函數(shù),包括loadtxt、load和fromfile,用于文本、二進(jìn)制文件讀寫
推薦度:★★★
3. pandas.read_*
類型:第三方庫(kù)
描述:Pandas自帶的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二進(jìn)制文件、HDF5、表格、SAS文件、SQL數(shù)據(jù)庫(kù)、Stata文件等的讀寫
推薦度:★★★
4. xlrd
類型:第三方庫(kù)
描述:用于Excel文件讀取
推薦度:★★
5. xlwt
類型:第三方庫(kù)
描述:用于Excel文件寫入
推薦度:★★
6. pyexcel-xl
類型:第三方庫(kù)
描述:用于Excel文件讀寫
推薦度:★★
7. xluntils
類型:第三方庫(kù)
描述:用于Excel文件讀寫
推薦度:★★
8. pyExcelerator
類型:第三方庫(kù)
描述:用于Excel文件讀寫
推薦度:★
9. openpyxl
類型:第三方庫(kù)
描述:用于Excel文件讀寫
推薦度:★
10. lxml
類型:第三方庫(kù)
描述:xml和HTML讀取和解析
推薦度:★★★
11. xml
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:xml對(duì)象解析和格式化處理
推薦度:★★★
12. libxml2
類型:第三方庫(kù)
描述:xml對(duì)象解析和格式化處理
推薦度:★
13. xpath
類型:第三方庫(kù)
描述:xml對(duì)象解析和格式化處理
推薦度:★★
14. win32com
類型:第三方庫(kù)
描述:有關(guān)Windows系統(tǒng)操作、Office(Word、Excel等)文件讀寫等的綜合應(yīng)用庫(kù)
推薦度:★
02 網(wǎng)絡(luò)抓取和解析
網(wǎng)絡(luò)抓取和解析用于從互聯(lián)網(wǎng)中抓取信息,并對(duì)HTML對(duì)象進(jìn)行處理,有關(guān)xml對(duì)象的解析和處理的庫(kù)在“01 文件讀寫”中找到。
15. requests
類型:第三方庫(kù)
描述:網(wǎng)絡(luò)請(qǐng)求庫(kù),提供多種網(wǎng)絡(luò)請(qǐng)求方法并可定義復(fù)雜的發(fā)送信息
推薦度:★★★
16. urllib
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的庫(kù),簡(jiǎn)單的讀取特定URL并獲得返回的信息
推薦度:★★
17. urllib2
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的庫(kù),讀取特定URL并獲得返回的信息,相對(duì)于urllib可處理更多HTTP信息,例如cookie、身份驗(yàn)證、重定向等
推薦度:★★
18. urlparse
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的URL解析庫(kù),可自動(dòng)解析URL不同的域、參數(shù)、路徑等
推薦度:★★★
19. HTMLParser
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的HTML解析模塊,能夠很容易的實(shí)現(xiàn)HTML文件的分析
推薦度:★★★
20. Scapy
類型:第三方庫(kù)
描述:分布式爬蟲框架,可用于模擬用戶發(fā)送、偵聽和解析并偽裝網(wǎng)絡(luò)報(bào)文,常用于大型網(wǎng)絡(luò)數(shù)據(jù)爬取
推薦度:★★★
21. Beautiful Soup
類型:第三方庫(kù)
描述:Beautiful Soup是網(wǎng)頁(yè)數(shù)據(jù)解析和格式化處理工具,通常配合Python的urllib、urllib2等庫(kù)一起使用
推薦度:★★★
03 數(shù)據(jù)庫(kù)連接
數(shù)據(jù)庫(kù)連接可用于連接眾多數(shù)據(jù)庫(kù)以及訪問(wèn)通用數(shù)據(jù)庫(kù)接口,可用于數(shù)據(jù)庫(kù)維護(hù)、管理和增、刪、改、查等日常操作。
22. mysql-connector-python
類型:第三方庫(kù)
描述:MySQL官方驅(qū)動(dòng)連接程序
推薦度:★★★
23. pymysql
類型:第三方庫(kù)
描述:MySQL連接庫(kù),支持Python3
推薦度:★★★
24. MySQL-python
類型:第三方庫(kù)
描述:MySQL連接庫(kù)
推薦度:★★
25. cx_Oracle
類型:第三方庫(kù)
描述:Oracle連接庫(kù)
推薦度:★★★
26. psycopg2
類型:第三方庫(kù)
描述:Python編程語(yǔ)言中非常受歡迎的PostgreSQL適配器
推薦度:★★★
27. redis
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Redis連接庫(kù)
推薦度:★★★
28. pymongo
類型:第三方庫(kù)
描述:MongoDB官方驅(qū)動(dòng)連接程序
推薦度:★★★
29. HappyBase
類型:第三方庫(kù)
描述:HBase連接庫(kù)
推薦度:★★★
30. py2neo
類型:第三方庫(kù)
描述:Neo4j連接庫(kù)
推薦度:★★★
31. cassandra-driver
類型:第三方庫(kù)
描述:Cassandra(1.2+)和DataStax Enterprise(3.1+)連接庫(kù)
推薦度:★★★
32. sqlite3
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的模塊,用于操作SQLite數(shù)據(jù)庫(kù)
推薦度:★★★
33. pysqlite2
類型:第三方庫(kù)
描述:SQLite 3.x連接庫(kù)
推薦度:★★
34. bsddb3
類型:第三方庫(kù)
描述:Berkeley DB連接庫(kù)
35. bsddb
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的模塊,提供了一個(gè)到Berkeley DB庫(kù)的接口
推薦度:★★
36. dbhash
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的模塊,dbhash模塊提供了使用BSD數(shù)據(jù)庫(kù)庫(kù)打開數(shù)據(jù)庫(kù)的功能。該模塊鏡像了提供對(duì)DBM樣式數(shù)據(jù)庫(kù)訪問(wèn)的其他Python數(shù)據(jù)庫(kù)模塊的接口。bsddb模塊需要使用dbhash
推薦度:★★
37. adodb
類型:第三方庫(kù)
描述:ADOdb是一個(gè)數(shù)據(jù)庫(kù)抽象庫(kù),支持常見的數(shù)據(jù)和數(shù)據(jù)庫(kù)接口并可自行進(jìn)行數(shù)據(jù)庫(kù)擴(kuò)展,該庫(kù)可以對(duì)不同數(shù)據(jù)庫(kù)中的語(yǔ)法進(jìn)行解析和差異化處理,具有很高的通用性
推薦度:★★★
38. SQLObject
類型:第三方庫(kù)
描述:SQLObject是一種流行的對(duì)象關(guān)系管理器,用于向數(shù)據(jù)庫(kù)提供對(duì)象接口,其中表為類、行為實(shí)例、列為屬性
推薦度:★★
39. SQLAlchemy
類型:第三方庫(kù)
描述:SQLAlchemy是Python SQL工具包和對(duì)象關(guān)系映射器,為應(yīng)用程序開發(fā)人員提供了SQL的全部功能和靈活性控制
推薦度:★★
40. ctypes
類型:第三方庫(kù)
描述:ctypes是Python的一個(gè)外部庫(kù),提供和C語(yǔ)言兼容的數(shù)據(jù)類型,可以很方便地調(diào)用C DLL中的函數(shù)
推薦度:★★★
41. pyodbc
類型:第三方庫(kù)
描述:Python通過(guò)ODBC訪問(wèn)數(shù)據(jù)庫(kù)的接口庫(kù)
推薦度:★★★
42. Jython
類型:第三方庫(kù)
描述:Python通過(guò)JDBC訪問(wèn)數(shù)據(jù)庫(kù)的接口庫(kù)
推薦度:★★★
04 數(shù)據(jù)清洗轉(zhuǎn)換
數(shù)據(jù)清洗轉(zhuǎn)換主用于數(shù)據(jù)正式應(yīng)用之前的預(yù)處理工作。
43. frozenset([iterable])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)新的frozenset對(duì)象,可選擇從iterable取得的元素
推薦度:★★★
44. int(x)
類型:Python內(nèi)置函數(shù)
描述:返回x的整數(shù)部分
推薦度:★★★
45. isinstance(object, classinfo)
類型:Python內(nèi)置函數(shù)
描述:返回object是否是指定的classinfo實(shí)例信息
推薦度:★★★
46. len(s)
類型:Python內(nèi)置函數(shù)
描述:返回對(duì)象的長(zhǎng)度或項(xiàng)目數(shù)量
推薦度:★★★
47. long(x)
類型:Python內(nèi)置函數(shù)
描述:返回由字符串或數(shù)字x構(gòu)造的長(zhǎng)整型對(duì)象
推薦度:★★★
48. max(iterable[, key])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)可迭代或最大的兩個(gè)或多個(gè)參數(shù)中的最大項(xiàng)
推薦度:★★★
49. min(iterable[, key])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)可迭代或最大的兩個(gè)或多個(gè)參數(shù)中的最小項(xiàng)
推薦度:★★★
50. range(start, stop[, step])
類型:Python內(nèi)置函數(shù)
描述:用于與for循環(huán)一起創(chuàng)建循環(huán)列表,通過(guò)指定start(開始)、stop(結(jié)束)和step(步長(zhǎng))控制迭代次數(shù)并獲取循環(huán)值
推薦度:★★★
51. raw_input(prompt)
類型:Python內(nèi)置函數(shù)
描述:捕獲用戶輸入并作為字符串返回(不推薦使用input作為用戶輸入的捕獲函數(shù))
推薦度:★★★
52. round(number[, ndigits])
類型:Python內(nèi)置函數(shù)
描述:返回number小數(shù)點(diǎn)后ndigits位的四舍五入的浮點(diǎn)數(shù)
推薦度:★★★
53. set([iterable])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)新的集合對(duì)象,可選擇從iterable獲取的元素
推薦度:★★★
54. slice(start, stop[, step])
類型:Python內(nèi)置函數(shù)
描述:返回表示由范圍(start、stop、step)指定的索引集的切片對(duì)象
推薦度:★★
55. sorted(iterable[, cmp[, key[, reverse]]])
類型:Python內(nèi)置函數(shù)
描述:從iterable的項(xiàng)中返回一個(gè)新的排序列表
推薦度:★★★
56. xrange(start, stop[, step])
類型:Python內(nèi)置函數(shù)
描述:此函數(shù)與range()非常相似,但返回一個(gè)xrange對(duì)象而不是列表
推薦度:★★★
57. string
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:字符串處理庫(kù),可實(shí)現(xiàn)字符串查找、分割、組合、替換、去重、大小寫轉(zhuǎn)換及其他格式化處理
推薦度:★★★
58. re
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:正則表達(dá)式模塊,在文本和字符串處理中經(jīng)常使用
推薦度:★★★
59. random
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:該模塊為各種分布實(shí)現(xiàn)偽隨機(jī)數(shù)生成器,支持?jǐn)?shù)據(jù)均勻分布、正態(tài)(高斯)分布、對(duì)數(shù)正態(tài)分布、負(fù)指數(shù)分布、伽馬和β分布等
推薦度:★★★
60. os
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:用于新建、刪除、權(quán)限修改、切換路徑等目錄操作,以及調(diào)用執(zhí)行系統(tǒng)命令
推薦度:★★★
61. os.path
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:針對(duì)目錄的遍歷、組合、分割、判斷等操作,常用于數(shù)據(jù)文件的判斷、查找、合并
推薦度:★★★
62. prettytable
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:格式化表格輸出模塊
推薦度:★★
63. json
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python對(duì)象與json對(duì)象的轉(zhuǎn)換
推薦度:★★★
64. base64
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:將任意二進(jìn)制字符串編碼和解碼為文本字符串的Base16,Base32和Base64
推薦度:★★★
05 數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析
數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析主要用于數(shù)據(jù)探查、計(jì)算和初步數(shù)據(jù)分析等工作。
65. numpy
類型:第三方庫(kù)
描述:NumPy是Python科學(xué)計(jì)算的基礎(chǔ)工具包,很多Python數(shù)據(jù)計(jì)算工作庫(kù)都依賴它
推薦度:★★★
66. scipy
類型:第三方庫(kù)
描述:Scipy是一組專門解決科學(xué)和工程計(jì)算不同場(chǎng)景的主題工具包
推薦度:★★★
67. pandas
類型:第三方庫(kù)
描述:Pandas是一個(gè)用于Python數(shù)據(jù)分析的庫(kù),它的主要作用是進(jìn)行數(shù)據(jù)分析。Pandas提供用于進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析的二維的表格型數(shù)據(jù)結(jié)構(gòu)DataFrame,類似于R中的數(shù)據(jù)框,能提供類似于數(shù)據(jù)庫(kù)中的切片、切塊、聚合、選擇子集等精細(xì)化操作,為數(shù)據(jù)分析提供了便捷
推薦度:★★★
68. statsmodels
類型:第三方庫(kù)
描述:Statsmodels是Python的統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)工具包,包括一些描述性統(tǒng)計(jì)、統(tǒng)計(jì)模型估計(jì)和統(tǒng)計(jì)測(cè)試,集成了多種線性回歸模型、廣義線性回歸模型、離散數(shù)據(jù)分布模型、時(shí)間序列分析模型、非參數(shù)估計(jì)、生存分析、主成分分析、核密度估計(jì)以及廣泛的統(tǒng)計(jì)測(cè)試和繪圖等功能
推薦度:★★★
69. abs(x)
類型:Python內(nèi)置函數(shù)
描述:返回x的絕對(duì)值
推薦度:★★★
70. cmp(x, y)
類型:Python內(nèi)置函數(shù)
描述:比較兩個(gè)對(duì)象x和y,并根據(jù)結(jié)果返回一個(gè)整數(shù)。如果x
推薦度:★★
71. float(x)
類型:Python內(nèi)置函數(shù)
描述:返回從數(shù)字或字符串x構(gòu)造的浮點(diǎn)數(shù)
推薦度:★★★
72. pow(x, y[, z])
類型:Python內(nèi)置函數(shù)
描述:返回x的y次冪。如果z存在,則返回x的y次冪,模z
推薦度:★★★
73. sum(iterable[, start])
類型:Python內(nèi)置函數(shù)
描述:從左到右依次迭代,返回總和
推薦度:★★★
74. math
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:數(shù)學(xué)函數(shù)庫(kù),包括正弦、余弦、正切、余切、弧度轉(zhuǎn)換、對(duì)數(shù)運(yùn)算、圓周率、絕對(duì)值、取整等數(shù)學(xué)計(jì)算方法
推薦度:★★★
75. cmath
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:與math基本一致,區(qū)別是cmath運(yùn)算的是復(fù)數(shù)
推薦度:★★
76. decimal
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:10進(jìn)制浮點(diǎn)運(yùn)算
推薦度:★★
77. fractions
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:分?jǐn)?shù)模塊提供對(duì)有理數(shù)算術(shù)的支持
推薦度:★★
06 自然語(yǔ)言處理和文本挖掘
自然語(yǔ)言處理和文本挖掘庫(kù)主要用于以自然語(yǔ)言文本為對(duì)象的數(shù)據(jù)處理和建模。
78. nltk
類型:第三方庫(kù)
描述:NLTK是一個(gè)Python自然語(yǔ)言處理工具,它用于對(duì)自然語(yǔ)言進(jìn)行分類、解析和語(yǔ)義理解。目前已經(jīng)有超過(guò)50種語(yǔ)料庫(kù)和詞匯資源
推薦度:★★★
79. pattern
類型:第三方庫(kù)
描述:Pattern是一個(gè)網(wǎng)絡(luò)數(shù)據(jù)挖掘Python工具包,提供了用于網(wǎng)絡(luò)挖掘(如網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)爬蟲等)、自然語(yǔ)言處理(如詞性標(biāo)注、情感分析等)、機(jī)器學(xué)習(xí)(如向量空間模型、分類模型等)、圖形化的網(wǎng)絡(luò)分析模型
推薦度:★★★
80. gensim
類型:第三方庫(kù)
描述:Gensim是一個(gè)專業(yè)的主題模型(發(fā)掘文字中隱含主題的一種統(tǒng)計(jì)建模方法)Python工具包,用來(lái)提供可擴(kuò)展統(tǒng)計(jì)語(yǔ)義、分析純文本語(yǔ)義結(jié)構(gòu)以及檢索語(yǔ)義上相似的文檔
推薦度:★★★
81. 結(jié)巴分詞
類型:第三方庫(kù)
描述:結(jié)巴分詞是國(guó)內(nèi)流行的Python文本處理工具包,分詞模式分為三種模式:精確模式、全模式和搜索引擎模式,支持繁體分詞、自定義詞典等,是非常好的Python中文分詞解決方案,可以實(shí)現(xiàn)分詞、詞典管理、關(guān)鍵字抽取、詞性標(biāo)注等
推薦度:★★★
82. SnowNLP
類型:第三方庫(kù)
描述:SnowNLP是一個(gè)Python寫的類庫(kù),可以方便的處理中文文本內(nèi)容。該庫(kù)是受到了TextBlob的啟發(fā)而針對(duì)中文處理寫的類庫(kù),和TextBlob不同的是這里沒有用NLTK,所有的算法都是自己實(shí)現(xiàn)的,并且自帶了一些訓(xùn)練好的字典
推薦度:★★
83. smallseg
類型:第三方庫(kù)
描述:Smallseg是一個(gè)開源的、基于DFA的輕量級(jí)的中文分詞工具包。可自定義詞典、切割后返回登錄詞列表和未登錄詞列表、有一定的新詞識(shí)別能力
推薦度:★★
84. spaCy
類型:第三方庫(kù)
描述:spaCy是一個(gè)Python自然語(yǔ)言處理工具包,它結(jié)合Python和Cython使得自然語(yǔ)言處理能力達(dá)到了工業(yè)強(qiáng)度
推薦度:★★★
85. TextBlob
類型:第三方庫(kù)
描述:TextBlob 是一個(gè)處理文本數(shù)據(jù)的Python庫(kù),可用來(lái)做詞性標(biāo)注、情感分析、文本翻譯、名詞短語(yǔ)抽取、文本分類等
推薦度:★★
86. PyNLPI
類型:第三方庫(kù)
描述:PyNLPI是一個(gè)適合各種自然語(yǔ)言處理任務(wù)的集合庫(kù),可用于中文文本分詞、關(guān)鍵字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK編碼的字符串等
推薦度:★★★
87. synonyms
類型:第三方庫(kù)
描述:中文近義詞工具包,可用于自然語(yǔ)言理解的很多任務(wù):文本對(duì)齊,推薦算法,相似度計(jì)算,語(yǔ)義偏移,關(guān)鍵字提取,概念提取,自動(dòng)摘要,搜索引擎等。
推薦度:★★★
07 圖像和視頻處理
圖像處理和視頻處理主要適用于基于圖像的操作、處理、分析和挖掘,如人臉識(shí)別、圖像識(shí)別、目標(biāo)跟蹤、圖像理解等。
88. PIL/Pillow
類型:第三方庫(kù)
描述:PIL是一個(gè)常用的圖像讀取、處理和分析的庫(kù),提供了多種數(shù)據(jù)處理、變換的操作方法和屬性。PIL僅支持到2.7版本且已經(jīng)很久沒有更新,一群志愿者基于PIL發(fā)布了新的分支Pillow。Pillow同時(shí)支持Python2和Python3并且加入很多新的功能
推薦度:★★
89. OpenCV
類型:第三方庫(kù)
描述:OpenCV是一個(gè)強(qiáng)大的圖像和視頻工作庫(kù)。它提供了多種程序接口,支持跨平臺(tái)(包括移動(dòng)端)應(yīng)用。OpenCV的設(shè)計(jì)效率很高,它以優(yōu)化的C / C ++編寫,庫(kù)可以利用多核處理。除了對(duì)圖像進(jìn)行基本處理外,還支持圖像數(shù)據(jù)建模,并預(yù)制了多種圖像識(shí)別引擎,如人臉識(shí)別
推薦度:★★★
90. scikit-image
類型:第三方庫(kù)
描述:scikit-image(也稱skimage)是一個(gè)圖像處理庫(kù),支持顏色模式轉(zhuǎn)換、濾鏡、繪圖、圖像處理、特征檢測(cè)等多種功能
推薦度:★★
91. imageop
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),對(duì)圖像基本操作,包括裁剪、縮放、模式轉(zhuǎn)換
推薦度:★
92. colorsys
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),實(shí)現(xiàn)不同圖像色彩模式的轉(zhuǎn)換
推薦度:★
93. imghdr
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),返回圖像文件的類型
推薦度:★
08 音頻處理
音頻處理主要適用于基于聲音的處理、分析和建模,主要應(yīng)用于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解等。
94. TimeSide
類型:第三方庫(kù)
描述:TimeSide是一個(gè)能夠進(jìn)行音頻分析、成像、轉(zhuǎn)碼、流媒體和標(biāo)簽處理的Python框架,可以對(duì)任何音頻或視頻內(nèi)容非常大的數(shù)據(jù)集進(jìn)行復(fù)雜的處理
推薦度:★★★
95. audiolazy
類型:第三方庫(kù)
描述:audiolazy是一個(gè)用于實(shí)時(shí)聲音數(shù)據(jù)流處理的庫(kù),支持實(shí)時(shí)數(shù)據(jù)應(yīng)用處理、無(wú)限數(shù)據(jù)序列表示、數(shù)據(jù)流表示等
推薦度:★★
96. pydub
類型:第三方庫(kù)
描述:pydub支持多種格式聲音文件,可進(jìn)行多種信號(hào)處理(例如壓縮、均衡、歸一化)、信號(hào)生成(例如正弦、方波、鋸齒等)、音效注冊(cè)、靜音處理等
推薦度:★★★
97. audioop
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),可實(shí)現(xiàn)對(duì)聲音片段的一些常用操作
推薦度:★★
98. tinytag
類型:第三方庫(kù)
描述:tinytag用于讀取多種聲音文件的元數(shù)據(jù),涵蓋MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式
推薦度:★★
99. aifc
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),讀寫AIFF和AIFC文件
推薦度:★
100. sunau
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),讀寫Sun AU文件
推薦度:★
101. wave
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),讀寫WAV文件
推薦度:★★
102. chunk
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),讀取EA IFF 85塊格式的文件
推薦度:★
103. sndhdr
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:Python自帶的函數(shù),返回聲音文件的類型
推薦度:★
104. ossaudiodev
類型:Python標(biāo)準(zhǔn)庫(kù)
描述:該模塊支持訪問(wèn)OSS(開放聲音系統(tǒng))音頻接口
推薦度:★★★
09 數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)
數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等是Python進(jìn)行數(shù)據(jù)建模和挖掘?qū)W習(xí)的核心模塊。
105. Scikit-Learn
類型:第三方庫(kù)
描述:scikit-learn(也稱SKlearn)是一個(gè)基于Python的機(jī)器學(xué)習(xí)綜合庫(kù),內(nèi)置監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)機(jī)器學(xué)習(xí)方法,包括各種回歸、聚類、分類、流式學(xué)習(xí)、異常檢測(cè)、神經(jīng)網(wǎng)絡(luò)、集成方法等主流算法類別,同時(shí)支持預(yù)置數(shù)據(jù)集、數(shù)據(jù)預(yù)處理、模型選擇和評(píng)估等方法,是一個(gè)非常完整、流行的機(jī)器學(xué)習(xí)工具庫(kù)
推薦度:★★★
106. TensorFlow
類型:第三方庫(kù)
描述:TensorFlow 是谷歌的第二代機(jī)器學(xué)習(xí)系統(tǒng),內(nèi)建深度學(xué)習(xí)的擴(kuò)展支持,任何能夠用計(jì)算流圖形來(lái)表達(dá)的計(jì)算,都可以使用 TensorFlow
推薦度:★★★
107. NuPIC
類型:第三方庫(kù)
描述:NuPIC是一個(gè)以HTM(分層時(shí)間記憶)學(xué)習(xí)算法為工具的機(jī)器智能平臺(tái)。NuPIC適合于各種各樣的問(wèn)題,尤其適用于檢測(cè)異常和預(yù)測(cè)應(yīng)用
推薦度:★★★
108. PyTorch
類型:第三方庫(kù)
描述:PyTorch是FaceBook推出的深度學(xué)習(xí)框架,它基于Python(而非lua)產(chǎn)生,它提供的動(dòng)態(tài)計(jì)算圖是顯著區(qū)別于Tensorflow等其他學(xué)習(xí)框架的地方。
推薦度:★★
109. Orange
類型:第三方庫(kù)
描述:Orange通過(guò)圖形化操作界面,提供交互式數(shù)據(jù)分析功能,尤其適用于分類、聚類、回歸、特征選擇和交叉驗(yàn)證工作
推薦度:★★★
110. theano
類型:第三方庫(kù)
描述:Theano是非常成熟的深度學(xué)習(xí)庫(kù)。它與Numpy緊密集成,支持GPU計(jì)算、單元測(cè)試和自我驗(yàn)證
推薦度:★★★
111. keras
類型:第三方庫(kù)
描述:Keras是一個(gè)用Python編寫的高級(jí)神經(jīng)網(wǎng)絡(luò)API,能夠運(yùn)行在TensorFlow或者Theano之上,它的開發(fā)重點(diǎn)是實(shí)現(xiàn)快速實(shí)驗(yàn)
推薦度:★★
112. neurolab
類型:第三方庫(kù)
描述:Neurolab是具有靈活網(wǎng)絡(luò)配置和Python學(xué)習(xí)算法的基本神經(jīng)網(wǎng)絡(luò)算法庫(kù)。它包含通過(guò)遞歸神經(jīng)網(wǎng)絡(luò)(RNN)實(shí)現(xiàn)的不同變體,該庫(kù)是同類RNN API中最好的選擇之一
推薦度:★★
113. PyLearn2
類型:第三方庫(kù)
描述:PyLearn2是基于Theano的深度學(xué)習(xí)庫(kù),它旨在提供極大的靈活性,并使研究人員可以進(jìn)行自由可控制,參數(shù)和屬性的靈活、開放配置是亮點(diǎn)
推薦度:★★★
114. OverFeat
類型:第三方庫(kù)
描述:OverFeat是一個(gè)深度學(xué)習(xí)庫(kù),主要用于圖片分類、定位物體檢測(cè)
推薦度:★★
115. Pyevolve
類型:第三方庫(kù)
描述:Pyevolve是一個(gè)完整的遺傳算法框架,也支持遺傳編程
推薦度:★★
116. Caffe2
類型:第三方庫(kù)
描述:Cafffe2也是FaceBook推出的深度學(xué)習(xí)框架,相比于PyTorch 更適合于研究,Caffe2 適合大規(guī)模部署,主要用于計(jì)算機(jī)視覺,它對(duì)圖像識(shí)別的分類具有很好的應(yīng)用效果
推薦度:★★
10數(shù)據(jù)可視化
數(shù)據(jù)可視化主要用于做數(shù)據(jù)結(jié)果展示、數(shù)據(jù)模型驗(yàn)證、圖形交互和探查等方面。
117. Matplotlib
類型:第三方庫(kù)
描述:Matplotlib是Python的2D繪圖庫(kù),它以各種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版質(zhì)量級(jí)別的圖形,開發(fā)者可以僅需要幾行代碼,便可以生成多種高質(zhì)量圖形
推薦度:★★★
118. pyecharts
類型:第三方庫(kù)
描述:基于百度Echarts的強(qiáng)大的可視化工具庫(kù),其提供的圖形功能眾多,尤其對(duì)于復(fù)雜關(guān)系的展示能力較強(qiáng)
推薦度:★★★
119. seaborn
類型:第三方庫(kù)
描述:Seaborn是在Matplotlib的基礎(chǔ)上進(jìn)行了更高級(jí)的API封裝,它可以作為Matplotlib的補(bǔ)充
推薦度:★★★
120. bokeh
類型:第三方庫(kù)
描述:Bokeh是一種交互式可視化庫(kù),可以在WEB瀏覽器中實(shí)現(xiàn)美觀的視覺效果
推薦度:★★★
121. Plotly
類型:第三方庫(kù)
描述:Plotly提供的圖形庫(kù)可以進(jìn)行在線WEB交互,并提供具有出版品質(zhì)的圖形,支持線圖、散點(diǎn)圖、區(qū)域圖、條形圖、誤差條、框圖、直方圖、熱圖、子圖、多軸、極坐標(biāo)圖、氣泡圖、玫瑰圖、熱力圖、漏斗圖等眾多圖形
推薦度:★★★
122. VisPy
類型:第三方庫(kù)
描述:VisPy是用于交互式科學(xué)可視化的Python庫(kù),旨在實(shí)現(xiàn)快速,可擴(kuò)展和易于使用
推薦度:★★
123. PyQtGraph
類型:第三方庫(kù)
描述:PyQtGraph是一個(gè)建立在PyQt4 / PySide和numpy之上的純Python圖形和GUI庫(kù),主要用于數(shù)學(xué)/科學(xué)/工程應(yīng)用
推薦度:★★
124. ggplot
類型:第三方庫(kù)
描述:ggplot是用Python實(shí)現(xiàn)的圖形輸出庫(kù),類似于 R中的圖形展示版本
推薦度:★★★
11交互學(xué)習(xí)和集成開發(fā)
交互學(xué)習(xí)和集成開發(fā)主要用來(lái)做Python開發(fā)、調(diào)試和集成之用,包括Python集成開發(fā)環(huán)境和IDE。
125. IPython/ Jupyter
類型:第三方庫(kù)
描述:IPython 是一個(gè)基于Python 的交互式shell,比默認(rèn)的Python shell 好用得多,支持變量自動(dòng)補(bǔ)全、自動(dòng)縮進(jìn)、交互式幫助、魔法命令、系統(tǒng)命令等,內(nèi)置了許多很有用的功能和函數(shù)。從IPython4.0開始,IPython衍生出了IPython和Jupyter兩個(gè)分支。在該分支正式出現(xiàn)之前,IPython其實(shí)已經(jīng)擁有了ipython notebook功能,因此,Jupyter更像是一個(gè)ipython notebook的升級(jí)版。
推薦度:★★★
126. Elpy
類型:第三方庫(kù)
描述:Elpy是Emacs用于Python的開發(fā)環(huán)境,它結(jié)合并配置了許多其他軟件包,它們都是用Emacs Lisp和Python編寫的
推薦度:★★
127. PTVS
類型:第三方庫(kù)
描述:Visual Studio 的 Python 工具
推薦度:★★
128. PyCharm
類型:外部工具
描述:PyCharm帶有一整套可以幫助用戶在使用Python語(yǔ)言開發(fā)時(shí)提高其效率的工具,比如調(diào)試、語(yǔ)法高亮、項(xiàng)目管理、代碼跳轉(zhuǎn)、智能提示、自動(dòng)完成、單元測(cè)試、版本控制并可集成IPython、系統(tǒng)終端命令行等,在PyCharm里幾乎就可以實(shí)現(xiàn)所有有關(guān)Python工作的全部過(guò)程
推薦度:★★★
129. LiClipse
類型:外部工具
描述:LiClipse是基于Eclipse的免費(fèi)多語(yǔ)言 IDE,通過(guò)其中的PyDev可支持 Python開發(fā)應(yīng)用
推薦度:★★
130. Spyder
類型:外部工具
描述:Spyder是一個(gè)開源的Python IDE,由IPython和眾多流行的Python庫(kù)的支持,是一個(gè)具備高級(jí)編輯、交互式測(cè)試、調(diào)試以及數(shù)字計(jì)算環(huán)境的交互式開發(fā)環(huán)境
推薦度:★★
12其他 Python 協(xié)同數(shù)據(jù)工作工具
其他Python協(xié)同數(shù)據(jù)工作工具指除了上述主題以外,其他在數(shù)據(jù)工作中常用的工具或庫(kù)。
131. tesseract-ocr
類型:外部工具
描述:這是一個(gè)Google支持的開源OCR圖文識(shí)別項(xiàng)目,支持超過(guò)200種語(yǔ)言(包括中文),并支持自定義訓(xùn)練字符集,支持跨Windows、Linux、Mac OSX 多平臺(tái)使用
推薦度:★★★
132. RPython
類型:第三方庫(kù)
描述:R集成庫(kù)
推薦度:★★★
133. Rpy2
類型:第三方庫(kù)
描述:Python連接R的庫(kù)
134. matpython
類型:第三方庫(kù)
描述:MATLAB集成庫(kù)
推薦度:★★★
135. Lunatic Python
類型:第三方庫(kù)
描述:Lua集成庫(kù)
推薦度:★★
136. PyCall.jl
類型:第三方庫(kù)
描述:Julia集成庫(kù)
推薦度:★★
137. PySpark
類型:第三方庫(kù)
描述:Spark提供的Python API
推薦度:★★★
138. dumbo
類型:第三方庫(kù)
描述:這個(gè)模塊可以讓Pythoner輕松的編寫和運(yùn)行 Hadoop 程序,程序版本比較早,可以作為參考
推薦度:★★
139. dpark
類型:第三方庫(kù)
描述:Python對(duì)Spark的克隆版本,類MapReduce框架
推薦度:★★
140. streamparse
類型:第三方庫(kù)
描述:Streamparse允許通過(guò)Storm對(duì)實(shí)時(shí)數(shù)據(jù)流運(yùn)行Python代碼
推薦度:★★★
關(guān)于作者:宋天龍,大數(shù)據(jù)技術(shù)專家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國(guó)區(qū)技術(shù)和咨詢負(fù)責(zé)人(Webtrekk,德國(guó)的在線數(shù)據(jù)分析服務(wù)提供商)。擅長(zhǎng)數(shù)據(jù)挖掘、建模、分析與運(yùn)營(yíng),精通端到端數(shù)據(jù)價(jià)值場(chǎng)景設(shè)計(jì)、業(yè)務(wù)需求轉(zhuǎn)換、數(shù)據(jù)結(jié)構(gòu)梳理、數(shù)據(jù)建模與學(xué)習(xí)以及數(shù)據(jù)工程交付。
-
二進(jìn)制
+關(guān)注
關(guān)注
2文章
806瀏覽量
42273 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8500瀏覽量
134413 -
python
+關(guān)注
關(guān)注
56文章
4826瀏覽量
86539
原文標(biāo)題:精華 | 140種Python標(biāo)準(zhǔn)庫(kù)、第三方庫(kù)和外部工具都有了
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
proteus第三方元器件庫(kù)
如何加入第三方元件庫(kù)
如何把第三方庫(kù)加到PROTEUS中?
關(guān)于proteus第三方元件庫(kù)的問(wèn)題
proteus第三方元件庫(kù)下載
移動(dòng)應(yīng)用第三方庫(kù)自動(dòng)檢測(cè)和分類
EE-303:將VisualDSP++?線程安全庫(kù)與第三方RTOS配合使用

鴻蒙開發(fā)中怎么引入第三方庫(kù)
使用pip安裝、更新和卸載Python的第三方庫(kù)
在AWorks中怎樣去修改第三方庫(kù)的源碼呢
學(xué)會(huì)安裝第三方開源庫(kù)

評(píng)論