import numpy as np
#데이터 순서 바꾸는 방법
x = np.arange(10)
print(x)
np.random.shuffle(x)
print(x)
#데이터 샘플링 - 데이터 집합에서 일부를 무작위로 선택하는 것
#numpy.random.choice(a, size=None, replace=True, p=None)
#a - 범위, size - 갯수, replace - true일 시 중복 가능, p - 각 데이터가 선택 될 확률
print(np.random.choice(5, 5, replace=False))
print(np.random.choice(5, 3, replace=False))
print(np.random.choice(10, 5))
print(np.random.choice(5, 10, p=[0.1, 0, 0.3, 0.6, 0])) #선택 확률이 다름
#데이터 카운팅
print(np.unique([11, 11, 2, 2, 34, 34])) #중복 제거
a = np.array(['a', 'b', 'b', 'c', 'a'])
index, count = np.unique(a, return_counts=True) #true로 설정시 각 값을 가진 데이터 갯수 출력
print(index)
print(count)
#unique 함수는 없는 데이터의 갯수는 세어주지 않음
#bincount 함수를 이용해 0부터 minlength - 1까지 숫자에 대해 카운트 해줌
print(np.bincount([1, 1, 2, 2, 3], minlength=6))
✏️ 소감
- numpy를 이용해서 데이터를 샘플링하고 카운팅하는 방법에 대해 공부했다. 오래만에 모각코를 하니 다시 공부를 하기위한 열정이 더 솓구치는 거 같아 좋았다.