데이터 추출

rokky·2023년 4월 5일

통계

목록 보기
17/17

데이터 추출

  • 기계 학습에서 데이터 랜덤 추출할때가 많다.

  • 리스트 내의 1개의 원소만을 추출
    -> choice()메서드를 이용해 1개의 원소를 랜덤으로 추출

import random

arr = [i for i in range(1,6)]
sampled = random.choice(arr)
print(sampled)

-> 결과 1~5 사이 정수 중 한개

  • 리스트에서 중복없이 여러 원소 추출
    -> sample() 메서드 이용 k개의 데이터 중복없이 추출(데이터 개수 초과 불가)
import random

arr = [i for i in range(1,6)]
sampled = random.sample(arr, 3)
print(sampled)

-> 결과 1~5사이 정수 중 임의 추출한 3개를 포함한 리스트

  • 리스트에서 중복 허용 여러 원소 추출
    -> choice() 메서드 이용
import random

arr = [i for i in range(1,6)]
sampled = [random.choice(arr) for _ in range(3)]
print(sampled)

-> 결과값 : 중복허용 1~5사이 정수 중 3개를 포함한 리스트

-> choices()메서드 사용

import random

arr = [i for i in range(1,6)]
sampled = random.choices(arr, k = 3)
print(sampled)

-> 결과값 : 상동

  • 균등 분포에서 추출([0,1]범위의 균등분포 5개 데이터 추출)
import np

sampled = np.random.uniform(0,1,5)
print(sampled)

-> 결과값: 평균 0, 표준편차 1인 표준 정규분포에서 5개의 데이터 추출

0개의 댓글