반응형
python pandas 열 인덱스로 만들기 : df.set_index¶
- 데이터는 다운로드 링크 :
kaggle.com/datasets/robikscube/hourly-energy-consumption?resource=download - Datetime 컬럼을 인덱스로 만들기 : set_index
In [1]:
import pandas as pd
# 예시 데이터
df = pd.read_csv("archive/PJME_hourly.csv")
df.head()
Out[1]:
Datetime | PJME_MW | |
---|---|---|
0 | 2002-12-31 01:00:00 | 26498.0 |
1 | 2002-12-31 02:00:00 | 25147.0 |
2 | 2002-12-31 03:00:00 | 24574.0 |
3 | 2002-12-31 04:00:00 | 24393.0 |
4 | 2002-12-31 05:00:00 | 24860.0 |
- datetime 타입 수정 없이 인덱스 변경
In [2]:
df1 = df.set_index(["Datetime"])
df1.head()
Out[2]:
PJME_MW | |
---|---|
Datetime | |
2002-12-31 01:00:00 | 26498.0 |
2002-12-31 02:00:00 | 25147.0 |
2002-12-31 03:00:00 | 24574.0 |
2002-12-31 04:00:00 | 24393.0 |
2002-12-31 05:00:00 | 24860.0 |
- datetime 타입 수정 후 인덱스 변경
In [3]:
# 타입 확인
df.dtypes
Out[3]:
Datetime object PJME_MW float64 dtype: object
In [4]:
# datetype 이 아니면 타입 수정 후 타입 확인
df["Datetime"] = pd.to_datetime(df["Datetime"])
df.dtypes
Out[4]:
Datetime datetime64[ns] PJME_MW float64 dtype: object
In [5]:
df2 = df.set_index(["Datetime"])
df2.head()
Out[5]:
PJME_MW | |
---|---|
Datetime | |
2002-12-31 01:00:00 | 26498.0 |
2002-12-31 02:00:00 | 25147.0 |
2002-12-31 03:00:00 | 24574.0 |
2002-12-31 04:00:00 | 24393.0 |
2002-12-31 05:00:00 | 24860.0 |
반응형
'python' 카테고리의 다른 글
파이토치 모델 입력값 확인하기 model.parameters (0) | 2023.01.05 |
---|---|
판다스 컬럼을 인덱스화 하기 (파이썬) (0) | 2023.01.04 |
파이썬 넘파이 워드 카운트와 정렬 (numpy unique, numpy argsort) (0) | 2023.01.03 |
파이썬으로 썸네일 이미지 만들기 (pillow thumbnail) (0) | 2022.12.29 |
파이썬 넘파이 랜덤 숫자 생성 (0) | 2022.12.28 |
댓글