- 背景:有一时间序列数据,如下图,存在部分城市缺失一些日期的数据。
- 目标:补齐缺失的日期数据(本文完整的日期范围是2022.1.1-2022.1.5)。
- 代码
# 补全缺失日期
min_date = df['日期'].min()
max_date = df['日期'].max()
date_range = pd.date_range(min_date, max_date)
df.groupby(['省份','城市']).apply(lambda x: x.reindex(date_range))
仅展示部分结果。