一文看懂怎么用Python做数据分析
在前面的基础上增加第二个列名称,分布对 city 和 size 两个字段进行计数汇总。
除了计数和求和外,还可以对汇总后的数据同时按多个维度进行计算,下面的代码中按城市对 price 字段进行汇总,并分别计算 price 的数量,总金额和平均金额。
![]() 数据透视 Excel 中的插入目录下提供“数据透视表”功能对数据表按特定维度进行汇总。Python 中也提供了数据透视表功能。通过 pivot_table 函数实现同样的效果。 ![]() 数据透视表也是常用的一种数据分类汇总方式,并且功能上比 groupby 要强大一些。下面的代码中设定 city 为行字段,size 为列字段,price 为值字段。分别计算 price 的数量和金额并且按行与列进行汇总。
![]() 08 数据统计 第九部分为数据统计,这里主要介绍数据采样,标准差,协方差和相关系数的使用方法。 数据采样 Excel 的数据分析功能中提供了数据抽样的功能,如下图所示。Python 通过 sample 函数完成数据采样。 ![]() Sample 是进行数据采样的函数,设置 n 的数量就可以了。函数自动返回参与的结果。
![]() Weights 参数是采样的权重,通过设置不同的权重可以更改采样的结果,权重高的数据将更有希望被选中。这里手动设置 6 条数据的权重值。将前面 4 个设置为 0,后面两个分别设置为 0.5。
![]() 从采样结果中可以看出,后两条权重高的数据被选中。 ![]() Sample 函数中还有一个参数 replace,用来设置采样后是否放回。
![]()
![]() 描述统计 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |