본문 바로가기

전체 글544

판다스를 활용한 one-hot, 더미 컬럼 만들기 (pandas.get_dummies one-hot encoding) 판다스를 활용한 one-hot, 더미 컬럼 만들기 (pandas.get_dummies one-hot encoding)¶ In [1]: import pandas as pd import numpy as np In [2]: # 예시 데이터를 생성합니다 ! df = pd.DataFrame({"성별" : ["남성", "여성", np.nan, "여성", "남성"], "점수" : [85, 90, 78, 90, 88]}) df Out[2]: 성별 점수 0 남성 85 1 여성 90 2 NaN 78 3 여성 90 4 남성 88 In [3]: # 성별 컬럼 처럼 문자열로만 구성된 컬럼은 자동으로 더미항을 만들어 냅니다. pd.get_dummies(df) Out[3]: 점수 성별_남성 성별_여성 0 85 1 0 1 90 0 .. 2022. 12. 18.
파이썬 복사, 깊은 복사 copy() deepcopy() 20221217_파이썬 복사, 깊은 복사 copy() deepcopy()¶ 1 차원 데이터¶ In [1]: a = [1, 2, 3] b = a print(a) print(b) [1, 2, 3] [1, 2, 3] In [2]: b.append(4) print(a) print(b) [1, 2, 3, 4] [1, 2, 3, 4] a 를 b 로 복사한 후 b 에 a 와 다른 내용을 추가하고 싶은 목적이라면 위와 같이 코드를 작성해서는 안됩니다. 위 목적을 만족 시키기 위해서 아래 코드와 같이 copy() 함수를 사용합니다 In [3]: a = [1, 2, 3] b = a.copy() print(a) print(b) [1, 2, 3] [1, 2, 3] In [4]: b.append(4) print(a) print.. 2022. 12. 17.
파이썬 한국 휴일(holidays) 표시하기 (pytimekr) [파이썬] 한국 휴일(holidays) 표시하기 : pytimekr¶ In [1]: #!pip install pytimekr In [2]: from pytimekr import pytimekr pytimkr 에 holidays 함수를 사용하면 주말을 제외한 공휴일의 날짜를 알 수 있습니다. year옵션을 통해 원하는 연도에 공휴일을 찾을 수 있습니다. In [3]: kr_holidays = pytimekr.holidays(year=2022) kr_holidays Out[3]: [datetime.date(2022, 1, 31), datetime.date(2022, 2, 1), datetime.date(2022, 2, 2), datetime.date(2022, 9, 9), datetime.date(2022,.. 2022. 12. 17.
[넘파이] axis 옵션 활용한 argmax 함수 사용, 최대값 위치 [넘파이] argmax 최대값 위치 추출 axis 옵션 활용¶ 어레이에서 가장 큰 값의 위치를 알려줍니다. In [2]: import numpy as np data = np.array([0, 2, 3, 10, 3, 2, 1]) np.argmax(data) Out[2]: 3 axis 옵션을 활용해서 지정된 차원 별 가장 큰 값의 위치를 알려줍니다. In [3]: data = np.array([[1, 2, 3], # 1, 2, 3 중 가장 큰값의 위치 : 2 [6, 5, 4], # 6, 5, 4 중 가장 큰값의 위치 : 0 [8, 9, 7]]) # 8, 9, 7 중 가장 큰값의 위치 : 1 np.argmax(data, axis=1) Out[3]: array([2, 0, 1]) 분류 문제를 해결하면 predi.. 2022. 12. 16.
파이썬 아이리스(load_iris) 데이터 불러오기 sklearn.datasets 파이썬 아이리스(load_iris) 데이터 불러오기 sklearn.datasets¶ 분류문제 해결을 위해 대표적을 사용되는 예시데이터 입니다. 머신러닝을 처음 접할 때 지지고 볶던 데이터입니다. 데이터 설명은 아래 링크를 통해 보실 수 있습니다. 아이리스 데이터 설명 페이지로 이동 https://scikit-learn.org/stable/datasets/toy_dataset.html#iris-dataset In [2]: import pandas as pd from sklearn.datasets import load_iris iris = load_iris() df = pd.DataFrame(iris.data, columns=iris.feature_names) df['class'] = iris.. 2022. 12. 15.
파이토치(torch) 텐서 사이즈 보기 파이토치(torch) 텐서 사이즈 보기 (size(), shpae, dim())¶ In [1]: import torch In [2]: # 예시 x = torch.FloatTensor([ [1, 2], [3, 4], [5, 6], [7, 8] ]) In [3]: # size를 활용한 텐서 사이즈 보기 x.size() Out[3]: torch.Size([4, 2]) In [4]: # shape 활용한 텐서 사이즈 보기 x.shape Out[4]: torch.Size([4, 2]) In [5]: # dim을 활용한 텐서 차원 확인 x.dim() Out[5]: 2 In [6]: # 0 차원 사이즈 확인 x.size(0) Out[6]: 4 In [7]: # 1 차원 사이즈 확인 x.shape[0] Out[7]: .. 2022. 12. 14.