Python数据分析相关的技术

1.机器学习和计算机视觉

Crab:灵活、快速的推荐引擎

gensim:人性化的话题建模库

hebel:GPU加速的深度学习库

NuPIC:智能计算Numenta平台

pattern:Python网络挖掘模块

PyBrain:另一个Python机器学习库

Pylearn2:一个基于Theano的机器学习库

python-recsys:一个用来实现推荐系统的Python库

scikit-learn:基于SciPy构建的机器学习Python模块

pydeep:Python深度学习库

vowpalporpoise:轻量级VowpalWabbit的Python封装

skflow:一个TensorFlow的简化接口(模仿scikit-learn)

Caffe:一个Caffe的python接口

OpenCV:开源计算机视觉库

pyocr:Tesseract和Cuneiform的包装库

pytesseract:GoogleTesseractOCR的另一包装库

SimpleCV:一个用来创建计算机视觉应用的开源框架

2.数据分析

blaze:NumPy和Pandas的大数据接口

cclib:一个用来解析和解释计算化学软件包输出结果的库

NetworkX:一个为复杂网络设计的高性能软件

Neupy:执行和测试各种不同的人工神经网络算法

Numba:PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发

NumPy:使用Python进行科学计算的基础包

OpenBabel:一个化学工具箱,用来描述多种化学数据

OpenMining:使用Python挖掘商业情报(BI)(Pandasweb接口)

orange:通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习

Pandas:提供高性能,易用的数据结构和数据分析工具

PyDy:PyDy是PythonDynamics的缩写,用来为动力学运动建模工作流程提供帮助,基于NumPy,SciPy,IPython和matplotlib

PyMC:马尔科夫链蒙特卡洛采样工具

RDKit:化学信息学和机器学习软件

SciPy:由一些基于Python,用于数学,科学和工程的开源软件构成的生态系统

statsmodels:统计建模和计量经济学

SymPy:一个用于符号数学的Python库

cclib:一个用来解析和解释计算化学软件包输出结果的库

NetworkX:一个为复杂网络设计的高性能软件

Neupy:执行和测试各种不同的人工神经网络算法

Numba:PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发

NumPy:使用Python进行科学计算的基础包

OpenBabel:一个化学工具箱,用来描述多种化学数据

OpenMining:使用Python挖掘商业情报(BI)(Pandasweb接口)

orange:通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习

Pandas:提供高性能,易用的数据结构和数据分析工具

PyDy:PyDy是PythonDynamics的缩写,用来为动力学运动建模工作流程提供帮助,基于NumPy,SciPy,IPython和matplotlib

PyMC:马尔科夫链蒙特卡洛采样工具

RDKit:化学信息学和机器学习软件

SciPy:由一些基于Python,用于数学,科学和工程的开源软件构成的生态系统

statsmodels:统计建模和计量经济学

SymPy:一个用于符号数学的Python库

3.数据可视化

matplotlib:一个Python2D绘图库

bokeh:用Python进行交互式web绘图

ggplot:ggplot2给R提供的API的Python版本

plotly:协同Python和matplotlib工作的web绘图库

pyecharts:基于百度Echarts的数据可视化库

pygal:一个PythonSVG图表创建工具

pygraphviz:Graphviz的Python接口

PyQtGraph:交互式实时2D/3D/图像绘制及科学/工程学组件

SnakeViz:一个基于浏览器的Python'scProfile模块输出结果查看工具

vincent:把Python转换为Vega语法的转换工具

VisPy:基于OpenGL的高性能科学可视化工具

4.数据API构建及服务

·Django

django-rest-framework:一个强大灵活的工具,用来构建webAPI

django-tastypie:为Django应用开发API

django-formapi:为Django的表单验证,创建JSONAPIs

·Flask

flask-api:为flask开发的,可浏览WebAPIs

flask-restful:为flask快速创建RESTAPIs

flask-restless:为SQLAlchemy定义的数据库模型创建RESTfulAPIs

flask-api-utils:为Flask处理API表示和验证

eve:RESTAPI框架,由Flask,MongoDB等驱动

·Pyramid

cornice:一个Pyramid的REST框架

·与框架无关的

falcon:一个用来建立云API和webapp后端的高性能框架

sandman:为现存的数据库驱动系统自动创建RESTAPIs

restless:框架无关的REST框架,基于从Tastypie学到的知识

ripozo:快速创建REST/HATEOAS/HypermediaAPIs

5.爬虫及网页处理

Scrapy:一个快速高级的屏幕爬取及网页采集框架

cola:一个分布式爬虫框架

Demiurge:基于PyQuery的爬虫微型框架

feedparser:通用feed解析器

Grab:站点爬取框架

MechanicalSoup:用于自动和网络站点交互的Python库

portia:Scrapy可视化爬取

pyspider:一个强大的爬虫系统

RoboBrowser:一个简单的,Python风格的库,用来浏览网站,而不需要一个独立安装的浏览器

BeautifulSoup:以Python风格的方式来对HTML或XML进行迭代,搜索和修改

bleach:一个基于白名单的HTML清理和文本链接库

cssutils:一个Python的CSS库

html5lib:一个兼容标准的HTML文档和片段解析及序列化库

lxml:一个非常快速,简单易用,功能齐全的库,用来处理HTML和XML

MarkupSafe:为Python实现XML/HTML/XHTML标记安全字符串

pyquery:一个解析HTML的库,类似jQuery

untangle:将XML文档转换为Python对象,使其可以方便的访问

xhtml2pdf:HTML/CSS转PDF工具

xmltodict:像处理JSON一样处理XML

6.算法和设计模式

·Python实现的算法和设计模式。

algorithms:一个Python算法模块

python-patterns:Python设计模式的集合

sortedcontainers:快速,纯Python实现的SortedList,SortedDict和SortedSet类型

以上内容为大家介绍了Python数据分析相关的技术,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注我们http://www.mobiletrain.org/

推荐阅读

    linux系统名称命令?

    linux系统名称命令?,系统,工作,地址,管理,信息,标准,名称,网络,命令,目录,Lin

    linux系统命令行在?

    linux系统命令行在?,系统,地址,工作,管理,信息,工具,最新,密码,首页,标准,怎

    linux网络服务命令?

    linux网络服务命令?,系统,地址,网络,基础,设备,信息,服务,工作,名称,标准,配

    手机linux命令行软件?

    手机linux命令行软件?,软件,系统,工具,名称,电脑,互动,设备,手机,代码,服务,

    linux命令行连数据库?

    linux命令行连数据库?,地址,服务,信息,名字,数据库,密码,网络,一致,软件,系

    linux网络探测的命令?

    linux网络探测的命令?,网络,系统,服务,检测,信息,地址,工具,电脑,命令,状态,l

    linux系统命令改时间?

    linux系统命令改时间?,时间,系统,服务,大陆,国家,基础,城市,命令,时区,时钟,

    linux做系统盘命令?

    linux做系统盘命令?,系统,信息,设备,软件,情况,报告,工具,命令,首次,网上,Lin

    linux系统重亲命令?

    linux系统重亲命令?,工作,系统,标准,设备,名称,服务,命令,提示,主机,级别,详

    运行linux命令的软件?

    运行linux命令的软件?,软件,平台,系统,灵活,工具,管理,终端,协议,服务器,用

    linux系统测试命令?

    linux系统测试命令?,系统,工作,地址,标准,信息,命令,数据,单位,软件,目录,软

    linux打通网络命令?

    linux打通网络命令?,网络,系统,地址,信息,密码,工具,命令,工作,软件,服务,lin

    linux重启网络命令?

    linux重启网络命令?,网络,标准,工作,设备,系统,名称,服务,命令,网络服务,提

    linux系统安卓命令?

    linux系统安卓命令?,系统,软件,信息,数据,地址,标准,名字,设备,工作,网络,lin

    Python网络爬虫教程

    Python网络爬虫教程,网络,代码,数据,爬虫,体系,设计,网站,时间,培训,智能,Py