by @梁斌
部分内容整理自互联网,感谢众多同学的分享。
针对科学计算领域的Python开源库生态系统在过去十几年中得到了飞速发展。本项目主要介绍如何利用Python进行数据控制、处理、整理、分析等方面的基本要点,包括用于高效解决各种数据分析问题的Python语言和库。希望让大家能了解如何运用Python进行数据分析,并能在随后的实际项目中将这里所介绍的工具高效地运用。
以下IDE选择一个即可
- PyCharm,Community版本已够用
- Eclipse + PyDev (Eclipse下载, PyDev下载)
- IPython,Anaconda已包含
- Visual Studio Code
- 其他...
- NumPy(Numerical Python),Python科学计算的基础包。
- SciPy(Scientific Python),一款方便、易于使用、转为科学和工程设计的Python工具包。
- Matplotlib,Python著名的绘图库。
- Pandas(Python Data Analysis Library),基于Numpy构建的含有更高级数据结构和工具的数据分析包。
- scikit-learn,基于Python的机器学习模块。
- 1880-2014年间全美婴儿姓名分析
- 项目地址
- 如果从Kaggle下载数据有困难,可以从这里获取:https://pan.baidu.com/s/1ejmMom 密码:yt33