机器学习:Python实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 SciPy

SciPy是在数学运算、科学和工程学方面被广泛应用的Python类库。它包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等,因此被广泛地应用在机器学习项目中。SciPy依赖以下几个与机器学习相关的类库。

NumPy:是Python的一种开源数值计算扩展。它可用来存储和处理大型矩阵,提供了许多高级的数值编程工具,如矩阵数据类型、矢量处理、精密的运算库。

Matplotlib:Python中最著名的2D绘图库,十分适合交互式地进行制图;也可以方便地将它作为绘图控件,嵌入GUI应用程序中。

Pandas:是基于NumPy的一种工具,是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,也提供了大量能使我们快速、便捷地处理数据的函数和方法。

安装并熟悉SciPy是提高机器学习实践的有效手段,尤其是在以下几个方面:

可以利用NumPy数组来准备机器学习算法的数据。

可以使用Matplotlib来创建图表,展示数据。

通过Pandas导入、展示数据,以便增强对数据的理解和数据清洗、转换等工作。