龙空技术网

140种Python标准库、第三方库和外部工具(下)

加米谷大数据 362

前言:

而今小伙伴们对“python常用的第三方库和内置库的区别”大概比较讲究,看官们都想要学习一些“python常用的第三方库和内置库的区别”的相关文章。那么小编同时在网络上网罗了一些对于“python常用的第三方库和内置库的区别””的相关内容,希望大家能喜欢,大家快快来学习一下吧!

140种Python标准库、第三方库和外部工具(上)

05 数据计算和统计分析

数据计算和统计分析主要用于数据探查、计算和初步数据分析等工作。

65. numpy

类型:第三方库

描述:NumPy是Python科学计算的基础工具包,很多Python数据计算工作库都依赖它

推荐度:★★★

66. scipy

类型:第三方库

描述:Scipy是一组专门解决科学和工程计算不同场景的主题工具包

推荐度:★★★

67. pandas

类型:第三方库

描述:Pandas是一个用于Python数据分析的库,它的主要作用是进行数据分析。Pandas提供用于进行结构化数据分析的二维的表格型数据结构DataFrame,类似于R中的数据框,能提供类似于数据库中的切片、切块、聚合、选择子集等精细化操作,为数据分析提供了便捷

推荐度:★★★

68. statsmodels

类型:第三方库

描述:Statsmodels是Python的统计建模和计量经济学工具包,包括一些描述性统计、统计模型估计和统计测试,集成了多种线性回归模型、广义线性回归模型、离散数据分布模型、时间序列分析模型、非参数估计、生存分析、主成分分析、核密度估计以及广泛的统计测试和绘图等功能

推荐度:★★★

69. abs(x)

类型:Python内置函数

描述:返回x的值

推荐度:★★★

70. cmp(x, y)

类型:Python内置函数

描述:比较两个对象x和y,并根据结果返回一个整数。如果x y则返回值为正

推荐度:★★

71. float(x)

类型:Python内置函数

描述:返回从数字或字符串x构造的浮点数

推荐度:★★★

72. pow(x, y[, z])

类型:Python内置函数

描述:返回x的y次幂。如果z存在,则返回x的y次幂,模z

推荐度:★★★

73. sum(iterable[, start])

类型:Python内置函数

描述:从左到右依次迭代,返回总和

推荐度:★★★

74. math

类型:Python标准库

描述:数学函数库,包括正弦、余弦、正切、余切、弧度转换、对数运算、圆周率、值、取整等数学计算方法

推荐度:★★★

75. cmath

类型:Python标准库

描述:与math基本一致,区别是cmath运算的是复数

推荐度:★★

76. decimal

类型:Python标准库

描述:10进制浮点运算

推荐度:★★

77. fractions

类型:Python标准库

描述:分数模块提供对有理数算术的支持

推荐度:★★

06 自然语言处理和文本挖掘

自然语言处理和文本挖掘库主要用于以自然语言文本为对象的数据处理和建模。

78. nltk

类型:第三方库

描述:NLTK是一个Python自然语言处理工具,它用于对自然语言进行分类、解析和语义理解。目前已经有超过50种语料库和词汇资源

推荐度:★★★

79. pattern

类型:第三方库

描述:Pattern是一个网络数据挖掘Python工具包,提供了用于网络挖掘(如网络服务、网络爬虫等)、自然语言处理(如词性标注、情感分析等)、机器学习(如向量空间模型、分类模型等)、图形化的网络分析模型

推荐度:★★★

80. gensim

类型:第三方库

描述:Gensim是一个专业的主题模型(发掘文字中隐含主题的一种统计建模方法)Python工具包,用来提供可扩展统计语义、分析纯文本语义结构以及检索语义上相似的文档

推荐度:★★★

81. 结巴分词

类型:第三方库

描述:结巴分词是国内流行的Python文本处理工具包,分词模式分为三种模式:较精确模式、全模式和搜索引擎模式,支持繁体分词、自定义词典等,是非常好的Python中文分词解决方案,可以实现分词、词典管理、关键字抽取、词性标注等

推荐度:★★★

82. SnowNLP

类型:第三方库

描述:SnowNLP是一个Python写的类库,可以方便的处理中文文本内容。该库是受到了TextBlob的启发而针对中文处理写的类库,和TextBlob不同的是这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典

推荐度:★★

83. smallseg

类型:第三方库

描述:Smallseg是一个开源的、基于DFA的轻量级的中文分词工具包。可自定义词典、切割后返回登录词列表和未登录词列表、有一定的新词识别能力

推荐度:★★

84. spaCy

类型:第三方库

描述:spaCy是一个Python自然语言处理工具包,它结合Python和Cython使得自然语言处理能力达到了工业强度

推荐度:★★★

85. TextBlob

类型:第三方库

描述:TextBlob 是一个处理文本数据的Python库,可用来做词性标注、情感分析、文本翻译、名词短语抽取、文本分类等

推荐度:★★

86. PyNLPI

类型:第三方库

描述:PyNLPI是一个适合各种自然语言处理任务的集合库,可用于中文文本分词、关键字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK编码的字符串等

推荐度:★★★

87. synonyms

类型:第三方库

描述:中文近义词工具包,可用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。

推荐度:★★★

07 图像和视频处理

图像处理和视频处理主要适用于基于图像的操作、处理、分析和挖掘,如人脸识别、图像识别、目标跟踪、图像理解等。

88. PIL/Pillow

类型:第三方库

描述:PIL是一个常用的图像读取、处理和分析的库,提供了多种数据处理、变换的操作方法和属性。PIL仅支持到2.7版本且已经很久没有更新,一群志愿者基于PIL发布了新的分支Pillow。Pillow同时支持Python2和Python3并且加入很多新的功能

推荐度:★★

89. OpenCV

类型:第三方库

描述:OpenCV是一个强大的图像和视频工作库。它提供了多种程序接口,支持跨平台(包括移动端)应用。OpenCV的设计效率很高,它以优化的C / C ++编写,库可以利用多核处理。除了对图像进行基本处理外,还支持图像数据建模,并预制了多种图像识别引擎,如人脸识别

推荐度:★★★

90. scikit-image

类型:第三方库

描述:scikit-image(也称skimage)是一个图像处理库,支持颜色模式转换、滤镜、绘图、图像处理、特征检测等多种功能

推荐度:★★

91. imageop

类型:Python标准库

描述:Python自带的函数,对图像基本操作,包括裁剪、缩放、模式转换

推荐度:★

92. colorsys

类型:Python标准库

描述:Python自带的函数,实现不同图像色彩模式的转换

推荐度:★

93. imghdr

类型:Python标准库

描述:Python自带的函数,返回图像文件的类型

推荐度:★

08 音频处理

音频处理主要适用于基于声音的处理、分析和建模,主要应用于语音识别、语音合成、语义理解等。

94. TimeSide

类型:第三方库

描述:TimeSide是一个能够进行音频分析、成像、转码、流媒体和标签处理的Python框架,可以对任何音频或视频内容非常大的数据集进行复杂的处理

推荐度:★★★

95. audiolazy

类型:第三方库

描述:audiolazy是一个用于实时声音数据流处理的库,支持实时数据应用处理、无限数据序列表示、数据流表示等

推荐度:★★

96. pydub

类型:第三方库

描述:pydub支持多种格式声音文件,可进行多种信号处理(例如压缩、均衡、归一化)、信号生成(例如正弦、方波、锯齿等)、音效注册、静音处理等

推荐度:★★★

97. audioop

类型:Python标准库

描述:Python自带的函数,可实现对声音片段的一些常用操作

推荐度:★★

98. tinytag

类型:第三方库

描述:tinytag用于读取多种声音文件的元数据,涵盖MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式

推荐度:★★

99. aifc

类型:Python标准库

描述:Python自带的函数,读写AIFF和AIFC文件

推荐度:★

100. sunau

类型:Python标准库

描述:Python自带的函数,读写Sun AU文件

推荐度:★

101. wave

类型:Python标准库

描述:Python自带的函数,读写WAV文件

推荐度:★★

102. chunk

类型:Python标准库

描述:Python自带的函数,读取EA IFF 85块格式的文件

推荐度:★

103. sndhdr

类型:Python标准库

描述:Python自带的函数,返回声音文件的类型

推荐度:★

104. ossaudiodev

类型:Python标准库

描述:该模块支持访问OSS(开放声音系统)音频接口

推荐度:★★★

09 数据挖掘/机器学习/深度学习

数据挖掘、机器学习和深度学习等是Python进行数据建模和挖掘学习的核心模块。

105. Scikit-Learn

类型:第三方库

描述:scikit-learn(也称SKlearn)是一个基于Python的机器学习综合库,内置监督式学习和非监督式学习机器学习方法,包括各种回归、聚类、分类、流式学习、异常检测、神经网络、集成方法等主流算法类别,同时支持预置数据集、数据预处理、模型选择和评估等方法,是一个非常完整、流行的机器学习工具库

推荐度:★★★

106. TensorFlow

类型:第三方库

描述:TensorFlow 是谷歌的第二代机器学习系统,内建深度学习的扩展支持,任何能够用计算流图形来表达的计算,都可以使用 TensorFlow

推荐度:★★★

107. NuPIC

类型:第三方库

描述:NuPIC是一个以HTM(分层时间记忆)学习算法为工具的机器智能平台。NuPIC适合于各种各样的问题,尤其适用于检测异常和预测应用

推荐度:★★★

108. PyTorch

类型:第三方库

描述:PyTorch是FaceBook推出的深度学习框架,它基于Python(而非lua)产生,它提供的动态计算图是显著区别于Tensorflow等其他学习框架的地方。

推荐度:★★

109. Orange

类型:第三方库

描述:Orange通过图形化操作界面,提供交互式数据分析功能,尤其适用于分类、聚类、回归、特征选择和交叉验证工作

推荐度:★★★

110. theano

类型:第三方库

描述:Theano是非常成熟的深度学习库。它与Numpy紧密集成,支持GPU计算、单元测试和自我验证

推荐度:★★★

111. keras

类型:第三方库

描述:Keras是一个用Python编写的高级神经网络API,能够运行在TensorFlow或者Theano之上,它的开发重点是实现快速实验

推荐度:★★

112. neurolab

类型:第三方库

描述:Neurolab是具有灵活网络配置和Python学习算法的基本神经网络算法库。它包含通过递归神经网络(RNN)实现的不同变体,该库是同类RNN API中较好的选择之一

推荐度:★★

113. PyLearn2

类型:第三方库

描述:PyLearn2是基于Theano的深度学习库,它旨在提供极大的灵活性,并使研究人员可以进行自由可控制,参数和属性的灵活、开放配置是亮点

推荐度:★★★

114. OverFeat

类型:第三方库

描述:OverFeat是一个深度学习库,主要用于图片分类、定位物体检测

推荐度:★★

115. Pyevolve

类型:第三方库

描述:Pyevolve是一个完整的遗传算法框架,也支持遗传编程

推荐度:★★

116. Caffe2

类型:第三方库

描述:Cafffe2也是FaceBook推出的深度学习框架,相比于PyTorch 更适合于研究,Caffe2 适合大规模部署,主要用于计算机视觉,它对图像识别的分类具有很好的应用效果

推荐度:★★

010 数据可视化

数据可视化主要用于做数据结果展示、数据模型验证、图形交互和探查等方面。

117. Matplotlib

类型:第三方库

描述:Matplotlib是Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形,开发者可以仅需要几行代码,便可以生成多种高质量图形

推荐度:★★★

118. pyecharts

类型:第三方库

描述:基于百度Echarts的强大的可视化工具库,其提供的图形功能众多,尤其对于复杂关系的展示能力较强

推荐度:★★★

119. seaborn

类型:第三方库

描述:Seaborn是在Matplotlib的基础上进行了更高级的API封装,它可以作为Matplotlib的补充

推荐度:★★★

120. bokeh

类型:第三方库

描述:Bokeh是一种交互式可视化库,可以在WEB浏览器中实现美观的视觉效果

推荐度:★★★

121. Plotly

类型:第三方库

描述:Plotly提供的图形库可以进行在线WEB交互,并提供具有出版品质的图形,支持线图、散点图、区域图、条形图、误差条、框图、直方图、热图、子图、多轴、极坐标图、气泡图、玫瑰图、热力图、漏斗图等众多图形

推荐度:★★★

122. VisPy

类型:第三方库

描述:VisPy是用于交互式科学可视化的Python库,旨在实现快速,可扩展和易于使用

推荐度:★★

123. PyQtGraph

类型:第三方库

描述:PyQtGraph是一个建立在PyQt4 / PySide和numpy之上的纯Python图形和GUI库,主要用于数学/科学/工程应用

推荐度:★★

124. ggplot

类型:第三方库

描述:ggplot是用Python实现的图形输出库,类似于 R中的图形展示版本

推荐度:★★★

011 交互学习和集成开发

交互学习和集成开发主要用来做Python开发、调试和集成之用,包括Python集成开发环境和IDE。

125. IPython/ Jupyter

类型:第三方库

描述:IPython 是一个基于Python 的交互式shell,比默认的Python shell 好用得多,支持变量自动补全、自动缩进、交互式帮助、魔法命令、系统命令等,内置了许多很有用的功能和函数。从IPython4.0开始,IPython衍生出了IPython和Jupyter两个分支。在该分支正式出现之前,IPython其实已经拥有了ipython notebook功能,因此,Jupyter更像是一个ipython notebook的升级版。

推荐度:★★★

126. Elpy

类型:第三方库

描述:Elpy是Emacs用于Python的开发环境,它结合并配置了许多其他软件包,它们都是用Emacs Lisp和Python编写的

推荐度:★★

127. PTVS

类型:第三方库

描述:Visual Studio 的 Python 工具

推荐度:★★

128. PyCharm

类型:外部工具

描述:PyCharm带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制并可集成IPython、系统终端命令行等,在PyCharm里几乎就可以实现所有有关Python工作的全部过程

推荐度:★★★

129. LiClipse

类型:外部工具

描述:LiClipse是基于Eclipse的免费多语言 IDE,通过其中的PyDev可支持 Python开发应用

推荐度:★★

130. Spyder

类型:外部工具

描述:Spyder是一个开源的Python IDE,由IPython和众多流行的Python库的支持,是一个具备高级编辑、交互式测试、调试以及数字计算环境的交互式开发环境

推荐度:★★

012 其他Python协同数据工作工具

其他Python协同数据工作工具指除了上述主题以外,其他在数据工作中常用的工具或库。

131. tesseract-ocr

类型:外部工具

描述:这是一个Google支持的开源OCR图文识别项目,支持超过200种语言(包括中文),并支持自定义训练字符集,支持跨Windows、Linux、Mac OSX 多平台使用

推荐度:★★★

132. RPython

类型:第三方库

描述:R集成库

推荐度:★★★

133. Rpy2

类型:第三方库

描述:Python连接R的库

134. matpython

类型:第三方库

描述:MATLAB集成库

推荐度:★★★

135. Lunatic Python

类型:第三方库

描述:Lua集成库

推荐度:★★

136. PyCall.jl

类型:第三方库

描述:Julia集成库

推荐度:★★

137. PySpark

类型:第三方库

描述:Spark提供的Python API

推荐度:★★★

138. dumbo

类型:第三方库

描述:这个模块可以让Pythoner轻松的编写和运行 Hadoop 程序,程序版本比较早,可以作为参考

推荐度:★★

139. dpark

类型:第三方库

描述:Python对Spark的克隆版本,类MapReduce框架

推荐度:★★

140. streamparse

类型:第三方库

描述:Streamparse允许通过Storm对实时数据流运行Python代码

推荐度:★★★

作者:宋天龙,大数据技术专家,前Webtrekk中国区技术和咨询负责人(Webtrekk,德国的在线数据分析服务提供商)。擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。

标签: #python常用的第三方库和内置库的区别