import numpy as np

#데이터 순서 바꾸는 방법
x = np.arange(10)
print(x)
np.random.shuffle(x)
print(x)

#데이터 샘플링 - 데이터 집합에서 일부를 무작위로 선택하는 것
#numpy.random.choice(a, size=None, replace=True, p=None)
#a - 범위, size - 갯수, replace - true일 시 중복 가능, p - 각 데이터가 선택 될 확률

print(np.random.choice(5, 5, replace=False))
print(np.random.choice(5, 3, replace=False))
print(np.random.choice(10, 5))
print(np.random.choice(5, 10, p=[0.1, 0, 0.3, 0.6, 0])) #선택 확률이 다름

#데이터 카운팅

print(np.unique([11, 11, 2, 2, 34, 34])) #중복 제거
a = np.array(['a', 'b', 'b', 'c', 'a'])
index, count = np.unique(a, return_counts=True) #true로 설정시 각 값을 가진 데이터 갯수 출력
print(index)
print(count)

#unique 함수는 없는 데이터의 갯수는 세어주지 않음
#bincount 함수를 이용해 0부터 minlength - 1까지 숫자에 대해 카운트 해줌
print(np.bincount([1, 1, 2, 2, 3], minlength=6))

✏️ 소감