机器学习:Python实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

6.4 描述性统计

描述性统计可以给出一个更加直观、更加清晰的视角,以加强对数据的理解。在这里可以通过DataFrame的describe()方法来查看描述性统计的内容。这个方法给我们展示了八方面的信息:数据记录数、平均值、标准方差、最小值、下四分位数、中位数、上四分位数、最大值。这些信息主要用来描述数据的分布情况。代码如下:

    from pandas import read_csv
    from pandas import set_option
    # 描述性统计
    filename='pima_data.csv'
    names=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age',
    'class']
    data=read_csv(filename, names=names)
    set_option('display.width', 100)
    # 设置数据的精确度
    set_option('precision', 4)
    print(data.describe())

执行结果如图6-2所示。

图6-2