본문 바로가기

python334

파이썬 리스트 차원 축소 파이썬 리스트 차원 축소 sum 메서드를 활용하여 리스트의 차원을 축소 할 수 있습니다. # 리스트 예시 a = [["qwe"], ["asd"], ["zxc"]] # sum 메서드 사용법 sum(a, []) # out : ['qwe', 'asd', 'zxc'] sum 메서드를 활용한 차원 예시 2 b = [["qwe", "asd", "zxc"]] sum(b, []) # out : ['qwe', 'asd', 'zxc'] 단 1차원 리스트에 적용하면 에러를 반환 합니다. c = ["qwe", "asd", "zxc"] sum(c, []) # TypeError: can only concatenate list (not "str") to list 2023. 6. 29.
nsmc 다운로드 네이버 영화 리뷰 댓글 샘플데이터 다운로드 nsmc 다운로드 네이버 영화 리뷰 댓글 샘플데이터 다운로드 1. 아래 링크 접속 후 https://raw.githubusercontent.com/e9t/nsmc/master/ratings.txt 2. Ctrl + s (맥 command + s) 2023. 6. 29.
파이썬을 텍스트 데이터 엘라스틱서치 업로드 파이썬을 텍스트 데이터 엘라스틱서치 업로드 패키지 설치 # 엘라스틱서치 5.5.3 버전을 활용합니다. #!pip install elasticsearch==5.5.3 데이터 업로드(sklean에 20newsgroups 데이터를 업로드 합니다) # 패키지 불러오기 import numpy as np from sklearn.datasets import fetch_20newsgroups from elasticsearch import Elasticsearch # 20newsgroups 데이터 불러오기 data = fetch_20newsgroups() # 엘라스틱 서치 접속 es = Elasticsearch(["localhost:9200"]) for document, category_num in zip(data.da.. 2023. 6. 27.
파이썬 한번이라도 같이 등장한 값 끼리 모으기 파이썬 한번이라도 같이 등장한 원소끼리 모으기¶ In [1]: # 예시 li = [[0, 9], [0, 16], [1, 3], [3, 4], [16, 7], [20, 21], [21, 18], [9,16], [9, 0]] 숫자간 엣지를 연결 In [3]: import networkx as nx G = nx.Graph() for i in li: G.add_edge(i[0], i[1]) 클러스터 확인 In [5]: degree = nx.degree(G) nx.draw(G,node_size=[v[1]*100 for v in degree], with_labels=True) 독립적인 클러스터에 노드값 확인 In [6]: G.edges() for i in nx.connected_components(G): print.. 2023. 6. 27.
파이썬 자연어 처리 샘플 문서 받아오기 nltk news 파이썬 자연어 처리 샘플 문서 받아오기 nltk news¶ reuters 뉴스기사를 샘플로 모아둔 데이터입니다. 각 파일(행)은 뉴스 문서입니다. 각 문서는 하나 이상의 카테고리로 분류될 수 있습니다. 총 10,788개의 뉴스 문서가 파일에 있습니다. In [1]: from nltk.corpus import reuters In [2]: # 뉴스문서 파일 확인 file_name = reuters.fileids() len(file_name) Out[2]: 10788 In [3]: # catgories 메서드와 raw 메서드를 할용한 문서 카테고리와 내용 확인 for file in file_name[:10]: print(reuters.categories(file)) print(reuters.raw(file)).. 2023. 6. 27.
파이썬 딕셔너리 min / max 적용 파이썬 딕셔너리 min / max 적용 키(key) 중에서 min / max 찾기 example_dict = {'a': 0, 'c': 7, 'z': 1, 'e': 2} min(example_dict) # out : a max(example_dict) # out : z 값(value) 중에서 최대값 찾기 example_dict = {'a': 0, 'c': 7, 'z': 1, 'e': 2} min(example_dict.values()) # out : 0 max(example_dict.values()) # out : 7 값(value) 중에 최대값을 가지는 키(key) 도출 example_dict = {'a': 0, 'c': 7, 'z': 1, 'e': 2} min(example_dict, key=examp.. 2023. 6. 25.