본문 바로가기

분류 전체보기544

파이썬 자연어 처리 샘플 문서 받아오기 nltk news 파이썬 자연어 처리 샘플 문서 받아오기 nltk news¶ reuters 뉴스기사를 샘플로 모아둔 데이터입니다. 각 파일(행)은 뉴스 문서입니다. 각 문서는 하나 이상의 카테고리로 분류될 수 있습니다. 총 10,788개의 뉴스 문서가 파일에 있습니다. In [1]: from nltk.corpus import reuters In [2]: # 뉴스문서 파일 확인 file_name = reuters.fileids() len(file_name) Out[2]: 10788 In [3]: # catgories 메서드와 raw 메서드를 할용한 문서 카테고리와 내용 확인 for file in file_name[:10]: print(reuters.categories(file)) print(reuters.raw(file)).. 2023. 6. 27.
파이썬 딕셔너리 min / max 적용 파이썬 딕셔너리 min / max 적용 키(key) 중에서 min / max 찾기 example_dict = {'a': 0, 'c': 7, 'z': 1, 'e': 2} min(example_dict) # out : a max(example_dict) # out : z 값(value) 중에서 최대값 찾기 example_dict = {'a': 0, 'c': 7, 'z': 1, 'e': 2} min(example_dict.values()) # out : 0 max(example_dict.values()) # out : 7 값(value) 중에 최대값을 가지는 키(key) 도출 example_dict = {'a': 0, 'c': 7, 'z': 1, 'e': 2} min(example_dict, key=examp.. 2023. 6. 25.
sklearn을 활용하여 아이리스 데이터 분류 모델 만들기 sklearn을 활용하여 아이리스 데이터 분류 모델 만들기¶ 1. 데이터 불러오기(data road)¶ In [1]: from sklearn.datasets import load_iris iris = load_iris() 2. 데이터 소개(data introduce) 및 학습 데이터 구성¶ 아이리스 데이터 데이터 프레임으로 보여주기 show Iris data as DataFrame ¶ In [2]: import pandas as pd df = pd.DataFrame(iris.data, columns=iris.feature_names) sy = pd.Series(iris.target, dtype="category") sy = sy.cat.rename_categories(iris.target_names) d.. 2023. 6. 25.
우분투에서 vim 쓰다가 stopped 되었는데 복귀하는 법 우분투에서 vim 쓰다가 stopped 되었는데 복귀하는 법 1. 현재 터미널 세션에서 Vim이 실행 중인지 확인합니다. jobs 2. Vim으로 복귀하기 위해 다음 명령어를 입력합니다. fg 2023. 6. 23.
Input vector should be 1-D. Input vector should be 1-D. 차원 error 입니다. 입력 데이터 차원을 아래 모양에서 # Define two sequences sequence1 = [1, 2, 3, 4, 5] sequence2 = [2, 3, 4, 5, 6] 아래 모양과 같이 변경해 주세요 ! # Define two sequences sequence1 = np.array([[1, 2, 3, 4, 5]]) sequence2 = np.array([[2, 3, 4, 5, 6]] 2023. 6. 23.
넘파이 최대값 최소값, 넘파이 행별 최대값 넘파이 최대값 최소값, 넘파이 행별 최대값 최대값 np.max import numpy as np arr = np.array( [[5,8,5,3,3], [2,1,3,0,0]] ) np.max(arr) # out: 8 최소값 np.min import numpy as np arr = np.array( [[5,8,5,3,3], [2,1,3,0,0]] ) np.min(arr) # out : 0 행별 최대값 np.max axis=1 import numpy as np arr = np.array( [[5,8,5,3,3], [2,1,3,0,0]] ) np.max(arr, axis=1) # out : array([8, 3]) 열별 최대값 np.max axis=1 import numpy as np arr = np.array.. 2023. 6. 22.