Pandas是一个强大的Python数据分析库,它提供了许多用于数据处理和分析的功能。其中,分组与聚合是Pandas中非常重要的功能。
分组(Grouping)是指根据一个或多个列的值将数据分成多个组的过程。例如,如果你有一个包含学生信息的数据集,你可以根据学生的年级进行分组,这样每个组都包含同一年级的学生。
聚合(Aggregation)是指对每个组执行某种操作,以生成新的结果。例如,你可以计算每个年级的平均年龄,或者找到每个年级的最高分数。
在Pandas中,可以使用`groupby()`函数来实现分组,然后使用聚合函数(如`mean()`、`sum()`、`max()`等)来实现聚合。例如:
```python
df.groupby('grade').mean() # 计算每个年级的平均分数
df.groupby('grade').max() # 找到每个年级的最高分数
```
此外,Pandas还提供了更复杂的分组和聚合功能,如多层次分组、应用自定义函数等。