上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
6.4 描述性统计
描述性统计可以给出一个更加直观、更加清晰的视角,以加强对数据的理解。在这里可以通过DataFrame的describe()方法来查看描述性统计的内容。这个方法给我们展示了八方面的信息:数据记录数、平均值、标准方差、最小值、下四分位数、中位数、上四分位数、最大值。这些信息主要用来描述数据的分布情况。代码如下:
from pandas import read_csv from pandas import set_option # 描述性统计 filename='pima_data.csv' names=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] data=read_csv(filename, names=names) set_option('display.width', 100) # 设置数据的精确度 set_option('precision', 4) print(data.describe())
执行结果如图6-2所示。
图6-2