数据分析之Pandas分组操作总结

张开发
2026/4/16 11:45:23 15 分钟阅读

分享文章

数据分析之Pandas分组操作总结
数据分析之Pandas分组操作总结Pandas做分析数据,可以分为索引、分组、变形及合并四种操作。之前介绍过索引操作,现在接着对Pandas中的分组操作进行介绍:主要包含SAC含义、groupby函数、聚合、过滤和变换、apply函数。在详细讲解每个模块之前,首先读入数据:dic = {'地市': ['廊坊','廊坊','廊坊','张家口','张家口','张家口','廊坊','承德','承德','承德','石家庄','石家庄','石家庄','石家庄'],'数量':[11,12,13,14,15,16,17,18,19,20,21,22,23,24]}p_city = pd.DataFrame(dic)print(p_city )输出:SAC过程1.内涵SAC指的是分组操作中的split-apply-combine过程。其中split指基于某一些规则,将数据拆成若干组;apply是指对每一组独立地使用函数;combine指将每一组的结果组合成某一类数据结构。2. apply过程在apply过程中,我们实际往往会遇到四类问题:整合(Aggregation):即分组计算统计量(如求均值、求每组元素个数);变换(Transformation):即分组对每个单元的数据进行操作(如元素标准化);过滤(Filtration):即按照某些规则筛选出一些组(如选出组内某一指标小于50的组);综合问题:即前面提及的三种问题的混合。groupby函数经过groupby后会生成一个groupby对象,该对象本身不会返回任何内容,只有当相应的方法被调用才会起作用。1.分组函数的基本内容:根据某一列分组

更多文章