2.4 环境安装
前面介绍了在本书中使用的相关机器学习的类库,接下来将介绍如何进行安装,有多种方法可以用来配置机器学习的相关环境。在安装之前先说明一下,笔者使用的IDE是PyCharm,本书中相关示例的演示都基于PyCharm进行。PyCharm是JetBrains公司的产品,有收费的专业版和免费的社区版,在本书的学习过程中使用社区版就可以满足需求。可以自行到JetBrains的官网(http://www.jetbrains.com/pycharm/)进行下载。具体的PyCharm的说明见附录A.1。
2.4.1 安装Python
可以在python.org(https://www.python.org)下载合适的版本,并参照相应的安装说明进行安装,推荐安装Python3.6.1,本书中的所有示例都将基于Python3.6进行。当安装完成后,在命令终端执行以下命令来确认安装版本。
python3 --version
看到如下的实现后说明安装已经完成。
Python 3.6.1
2.4.2 安装SciPy
有多种方法可以用于安装SciPy,本书推荐使用Python的安装包管理工具pip进行安装。SciPy的文档非常完善,覆盖了多个平台和多种安装方式,请参考SciPy的安装指南(https://www.scipy.org/install.html)进行安装。在安装SciPy时,请确保至少安装了SciPy、Numpy、Matplotlib和Pandas。
安装完成后,可以在IDE里新建一个Python文件,输入以下代码并执行,确认安装结果。
import scipy import numpy import matplotlib import pandas print('scipy:{}'.format(scipy.__version__)) print('numpy:{}'.format(numpy.__version__)) print('matplotlib:{}'.format(matplotlib.__version__)) print('pandas:{}'.format(pandas.__version__))
在我的机器上的执行结果如下:
scipy:0.19.0 numpy:1.13.0 matplotlib:2.0.2 pandas:0.20.2
2.4.3 安装scikit-learn
建议采用与安装SciPy相同的方法来安装scikit-learn,通过pip来管理安装包。安装完成后,可以通过相似的方法来确认安装结果。代码如下:
import sklearn print('sklearn:{}'.format(sklearn.__version__))
在我的机器上的执行结果如下:
sklearn:0.18.1
2.4.4 更加便捷的安装方式
如果觉得通过pip管理安装包比较复杂,还可以利用一个更加简单便捷的方式来安装这些安装包:通过Anaconda安装相关的安装包。Anaconda提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换及各种第三方包的安装问题。Anaconda是免费的,可以自由地进行下载(https://www.continuum.io/downloads)和安装,目前支持Windows、Mac OS和Linux系统,读者可以选择适合自己的操作系统下载安装。