机器学习:Python实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4 环境安装

前面介绍了在本书中使用的相关机器学习的类库,接下来将介绍如何进行安装,有多种方法可以用来配置机器学习的相关环境。在安装之前先说明一下,笔者使用的IDE是PyCharm,本书中相关示例的演示都基于PyCharm进行。PyCharm是JetBrains公司的产品,有收费的专业版和免费的社区版,在本书的学习过程中使用社区版就可以满足需求。可以自行到JetBrains的官网(http://www.jetbrains.com/pycharm/)进行下载。具体的PyCharm的说明见附录A.1。

2.4.1 安装Python

可以在python.org(https://www.python.org)下载合适的版本,并参照相应的安装说明进行安装,推荐安装Python3.6.1,本书中的所有示例都将基于Python3.6进行。当安装完成后,在命令终端执行以下命令来确认安装版本。

    python3 --version

看到如下的实现后说明安装已经完成。

    Python 3.6.1

2.4.2 安装SciPy

有多种方法可以用于安装SciPy,本书推荐使用Python的安装包管理工具pip进行安装。SciPy的文档非常完善,覆盖了多个平台和多种安装方式,请参考SciPy的安装指南(https://www.scipy.org/install.html)进行安装。在安装SciPy时,请确保至少安装了SciPy、Numpy、Matplotlib和Pandas。

安装完成后,可以在IDE里新建一个Python文件,输入以下代码并执行,确认安装结果。

    import scipy
    import numpy
    import matplotlib
    import pandas
    print('scipy:{}'.format(scipy.__version__))
    print('numpy:{}'.format(numpy.__version__))
    print('matplotlib:{}'.format(matplotlib.__version__))
    print('pandas:{}'.format(pandas.__version__))

在我的机器上的执行结果如下:

    scipy:0.19.0
    numpy:1.13.0
    matplotlib:2.0.2
    pandas:0.20.2

2.4.3 安装scikit-learn

建议采用与安装SciPy相同的方法来安装scikit-learn,通过pip来管理安装包。安装完成后,可以通过相似的方法来确认安装结果。代码如下:

    import sklearn
    print('sklearn:{}'.format(sklearn.__version__))

在我的机器上的执行结果如下:

    sklearn:0.18.1

2.4.4 更加便捷的安装方式

如果觉得通过pip管理安装包比较复杂,还可以利用一个更加简单便捷的方式来安装这些安装包:通过Anaconda安装相关的安装包。Anaconda提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换及各种第三方包的安装问题。Anaconda是免费的,可以自由地进行下载(https://www.continuum.io/downloads)和安装,目前支持Windows、Mac OS和Linux系统,读者可以选择适合自己的操作系统下载安装。