python 划分时间段的方法

dt.to_period 是 pandas 库中的一个函数,用于将时间戳数据转换为周期(Period)数据。周期数据是一种表示时间跨度的数据类型,可以表示年、季度、月份、周等。

import pandas as pd

# 创建一个包含时间戳的 DataFrame
df = pd.DataFrame({'date': ['2021-01-01', '2021-02-01', '2021-03-01']})

# 将时间戳列转换为年份周期
df['period年'] = pd.to_datetime(df['date']).dt.to_period('Y')
df['period年月'] = pd.to_datetime(df['date']).dt.to_period('M')

print(df)

结果:

就是他可以直接搞一个年月的时间段出来,感觉比dt.year和dt.month拿出来再拼起来。

它返回的格式也和dt.year不一样

  • 使用 dt.year 方法得到的结果是一个整数的 Series 对象,表示每个日期的年份信息。
  • 使用 dt.to_period('Y') 方法得到的结果是一个 PeriodIndex 对象,其中的每个元素都是一个 Period 对象,表示每个日期所属的年份。

如果 data_csv['创建时间'] 列中包含了缺失值(NaN),则在计算年份时,缺失值会被视为 float 类型的特殊值。data_csv['创建时间'].dt.year 返回的结果是 float64 类型。