반응형
넘파이를 활용한 워드 카운트¶
- 파이썬에서 워드카운트를 하는 방식이 무수히 존재하지만 전 주로 넘파이를 활용합니다.
- 넘파이 어레이 혹은 리스트에
unique
함수를 적용하고return_counts
옵션을 쓰면 워드카운트 결과가 도출됩니다.
In [7]:
# 넘파이 패키지 호출
import numpy as np
In [12]:
# 예시 데이터 생성
example = ["철수", "철수", "철수", "영희", "영희", "마이클", "마이클", "마이클", "마이클", "마이클"]
np.unique(example, return_counts=True)
Out[12]:
(array(['마이클', '영희', '철수'], dtype='<U3'), array([5, 2, 3]))
unique
함수에return_counts
옵션을 주면 두가지 변수를 반환 합니다.- 첫번째 변수는 유니크 값을 어레이 형태로 반환 합니다.
- 두번째 변수는 각 유니크 값의 카운팅 결과를 반환 합니다.
In [13]:
# 반환 결과
words, counts = np.unique(example, return_counts=True)
print(words)
print(counts)
['마이클' '영희' '철수'] [5 2 3]
[참고] 인덱싱을 활용하여 카운트 크기순 정렬이 가능합니다.
In [15]:
idx = np.argsort(counts)
print(words[idx][::-1])
['마이클' '철수' '영희']
반응형
'python' 카테고리의 다른 글
파이썬으로 삼원색 팔레트 그리기 (0) | 2023.01.19 |
---|---|
파이썬 정규식 파일 조회 glob.glob (0) | 2023.01.19 |
파이토치 MNIST 데이터 셋 불러오기(pytorch mnist) (0) | 2023.01.15 |
파이썬 오늘 날짜 만들기 datetime (0) | 2023.01.15 |
주피터 노트북 사용법 모드와 스타일 (0) | 2023.01.15 |
댓글