Pandas是Python中非常强大的数据处理库,它提供了一系列的函数来进行基本统计分析。以下是一些常用的Pandas统计分析函数:
1. `count()`: 返回每一列非空值的数量。
2. `sum()`: 返回每一列所有数值的和。
3. `mean()`: 返回每一列所有数值的平均值。
4. `median()`: 返回每一列所有数值的中位数。
5. `min()`: 返回每一列所有数值的最小值。
6. `max()`: 返回每一列所有数值的最大值。
7. `mode()`: 返回每一列所有数值的众数。
8. `std()`: 返回每一列所有数值的标准差。
9. `var()`: 返回每一列所有数值的方差。
10. `quantile()`: 返回每一列所有数值在指定分位数上的值。
以上这些函数都可以直接作用于DataFrame或者Series对象上,例如:
```python
import pandas as pd
# 创建一个简单的DataFrame
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [2, 3, 4, 5, 6],
'C': [1, 2, 3, 4, 5]
})
print(df.mean())
```
输出结果为:
```
A 3.0
B 4.0
C 3.0
dtype: float64
```
这表示每一列的平均值分别为3.0、4.0和3.0。
此外,Pandas还提供了`describe()`函数,它可以一次性返回上述大部分统计量:
```python
print(df.describe())
```
输出结果为:
```
A B C
count 5.0 5.000000 5.000000
mean 3.0 4.000000 3.000000
std 1.581139 1.581139 1.581139
min 1.0 2.000000 1.000000
25% 2.0 3.000000 2.000000
50% 3.0 4.000000 3.000000
75% 4.0 5.000000 4.000000
max 5.0 6.000000 5.000000
```
以上就是Pandas的基本统计分析函数的使用方法。