본문 바로가기

python305

sklearn train_test_split, 트레인 테스트 데이터 분할 sklearn train_test_split, 트레인 테스트 데이터 분할¶ 주안점 반환값 순서 ! 데이터 트레인셋, 데이터 테스트셋, 라벨 트레인셋, 라벨 테스트셋 In [1]: import numpy as np # 예시 데이터 생성 n = 150 x = np.arange(n*3).reshape((n,3)) y = np.random.randint(2, size=n) 옵션 train_size : 0과 1사이 숫자로 비율을 설정함. test_size : 0과 1사이 숫자로 비율을 설정함. In [2]: # train_size와 text_size 중 하나만 쓰면 나머지는 자동 남은 비율로 설정됨 from sklearn.model_selection import train_test_split x_train, x_.. 2022. 12. 18.
파이토치 view 텐서 차원 변경 (torch.view, shape 변경) 파이토치 view 텐서 차원 변경 (torch.view, shape 변경)¶ 텐서의 shape를 변경하는 함수입니다. In [1]: # - (2, 2, 5) 사이즈의 텐서를 (20) 사이즈로 변경하기 위한 예시데이터 구성입니다. import torch # batch, seq_lenth, feature data = torch.tensor([ [ [1, 2, 3, 4, 5], [2, 3, 4, 5, 6] ], [ [3, 4, 5, 6, 7], [4, 5, 6, 7, 8] ] ]) data Out[1]: tensor([[[1, 2, 3, 4, 5], [2, 3, 4, 5, 6]], [[3, 4, 5, 6, 7], [4, 5, 6, 7, 8]]]) In [2]: data.shape Out[2]: torch.Si.. 2022. 12. 18.
판다스를 활용한 one-hot, 더미 컬럼 만들기 (pandas.get_dummies one-hot encoding) 판다스를 활용한 one-hot, 더미 컬럼 만들기 (pandas.get_dummies one-hot encoding)¶ In [1]: import pandas as pd import numpy as np In [2]: # 예시 데이터를 생성합니다 ! df = pd.DataFrame({"성별" : ["남성", "여성", np.nan, "여성", "남성"], "점수" : [85, 90, 78, 90, 88]}) df Out[2]: 성별 점수 0 남성 85 1 여성 90 2 NaN 78 3 여성 90 4 남성 88 In [3]: # 성별 컬럼 처럼 문자열로만 구성된 컬럼은 자동으로 더미항을 만들어 냅니다. pd.get_dummies(df) Out[3]: 점수 성별_남성 성별_여성 0 85 1 0 1 90 0 .. 2022. 12. 18.
파이썬 복사, 깊은 복사 copy() deepcopy() 20221217_파이썬 복사, 깊은 복사 copy() deepcopy()¶ 1 차원 데이터¶ In [1]: a = [1, 2, 3] b = a print(a) print(b) [1, 2, 3] [1, 2, 3] In [2]: b.append(4) print(a) print(b) [1, 2, 3, 4] [1, 2, 3, 4] a 를 b 로 복사한 후 b 에 a 와 다른 내용을 추가하고 싶은 목적이라면 위와 같이 코드를 작성해서는 안됩니다. 위 목적을 만족 시키기 위해서 아래 코드와 같이 copy() 함수를 사용합니다 In [3]: a = [1, 2, 3] b = a.copy() print(a) print(b) [1, 2, 3] [1, 2, 3] In [4]: b.append(4) print(a) print.. 2022. 12. 17.
파이썬 한국 휴일(holidays) 표시하기 (pytimekr) [파이썬] 한국 휴일(holidays) 표시하기 : pytimekr¶ In [1]: #!pip install pytimekr In [2]: from pytimekr import pytimekr pytimkr 에 holidays 함수를 사용하면 주말을 제외한 공휴일의 날짜를 알 수 있습니다. year옵션을 통해 원하는 연도에 공휴일을 찾을 수 있습니다. In [3]: kr_holidays = pytimekr.holidays(year=2022) kr_holidays Out[3]: [datetime.date(2022, 1, 31), datetime.date(2022, 2, 1), datetime.date(2022, 2, 2), datetime.date(2022, 9, 9), datetime.date(2022,.. 2022. 12. 17.
[넘파이] axis 옵션 활용한 argmax 함수 사용, 최대값 위치 [넘파이] argmax 최대값 위치 추출 axis 옵션 활용¶ 어레이에서 가장 큰 값의 위치를 알려줍니다. In [2]: import numpy as np data = np.array([0, 2, 3, 10, 3, 2, 1]) np.argmax(data) Out[2]: 3 axis 옵션을 활용해서 지정된 차원 별 가장 큰 값의 위치를 알려줍니다. In [3]: data = np.array([[1, 2, 3], # 1, 2, 3 중 가장 큰값의 위치 : 2 [6, 5, 4], # 6, 5, 4 중 가장 큰값의 위치 : 0 [8, 9, 7]]) # 8, 9, 7 중 가장 큰값의 위치 : 1 np.argmax(data, axis=1) Out[3]: array([2, 0, 1]) 분류 문제를 해결하면 predi.. 2022. 12. 16.