Pandas是一个强大的Python数据分析库,它提供了许多用于时间序列操作的函数。以下是其中三个重要的函数:resample(), shift()和rolling()。
1. resample(): 这个函数用于更改时间序列数据的频率。例如,你可以将每日数据转换为每月数据,或者将每小时数据转换为每分钟数据。这个函数使用一个规则(如'1M'表示每月一次)来指定新的频率。然后,它会根据这个规则对原始数据进行重新采样。例如:
```python
df.resample('M').mean()
```
这行代码将会返回一个新的DataFrame,其中包含按月计算的平均值。
2. shift(): 这个函数用于在时间序列中移动数据。它可以用来创建滞后或领先指标。例如,如果你想要查看昨天的股票价格,你可以使用shift()函数。参数为正数时,数据向右移动(滞后);参数为负数时,数据向左移动(领先)。例如:
```python
df.shift(1)
```
这行代码将会返回一个新的DataFrame,其中的数据比原始数据滞后一天。
3. rolling(): 这个函数用于创建滚动窗口。这对于计算移动平均值、标准差等统计量非常有用。你需要指定窗口的大小,然后Pandas将在这个窗口上应用你选择的函数。例如:
```python
df.rolling(window=3).mean()
```
这行代码将会返回一个新的DataFrame,其中包含每个点及其前两个邻居的平均值。