# #TIL 프로젝트를 위한 Mock DATA 만들기 part-1

★코딩하는 인문학도 ☆·2020년 12월 20일

프로젝트를 위한 Mock DATA 만들기 part-1

프로젝트를 하면서 초기 설정에 대해 우리는 알아보았고, 백엔드 개발자로서 API를 만들고 DB에서 데이터를 꺼내고 통신이 잘 되는지 확인을 하고 로직을 점검하기 위해서는 일단 DB에 데이터가 있어야한다. 특히, 많은 데이터를 필터링해서 걸러주는 로직일 경우는 데이터가 많아야 잘 돌아가는 지 실험을 할 수가 있다.

가짜 데이터 만드는 법?

가짜 데이터 생성 패지키 활용(Faker or django-seed)

CSV 파일을 만들어 mysql에 직접 옮기는 방법이 있다.

가짜 데이터(fake data) , 왜 필요 한가?

앞서 말했듯이, 우리가 웹 사이트를 만들 때, 많은 유저가 들어오고 데이터가 많은 상황을 염두해두고 그러한 상황에서 만든기능을 실험해보기 위해서이다.

Fake library 이용

우리는 이미 프로젝트를 시작했기에 위한 가상환경(아나콘다 ,미니콘다 등등)이 설치되어 있을 것이다.

설치

가상 환경 내에서 아래와 같은 명령어로 패키지 설치

pip install faker

사용법

패키지를 임포트 해준 후 원하는 메소드를 활용하여 생성할 수 있다.

from faker import Faker

myfake = Faker() #faker 패키지의 메소드를 통해 어떤 종류의 가짜 데이터를 뽑을 지 결정해주면 된다.
myfake.name()
myfake.address()
myfake.text()
myfake.sentence()
myfake.image_url()
fake = Faker("ko_KR") #한국어로 된 가짜 데이터가 필요하다면 이렇게 해줌으로써 한국어로 변경이 가능하다.
fake = Faker('en_US') # 영어 가짜데이터 
fake = Faker('ja_jp') #일본어 가짜데이터
fake = Faker('cs_CZ') #체코어 가짜데이터 등 localizaiont을 설정 할 수 있다.

다양한 메소드 활용법은 아래의 공식문서 링크를 활용하자.

https://faker.readthedocs.io/en/master/index.html

SEED Method

우리는 가짜 데이를 일회성을 쓰는 것이 아니라 재활용하여 한번 더 사용하거나 지속해서 사용하고 싶은 경우가 있을 것이다.

faker 을 이용하여 생성할 때마다 랜덤으로 그 데이터가 바뀐다. 그 데이터를 유지하기 위해서는 seed메소드를 통해 해결 할 수 있다.

from faker import Faker
myfake = Faker()
myfake.seed() # Seed() 안에 랜덤 번호를 입력한다.
myfake.seed_instance(4321)
print(faker.name()) <-- 이 가짜 데이터를 계속해서 재사용 가능하다. 이미 seed instance에 번호를 할당 해주었기 때문에.

★코딩하는 인문학도 ☆

문과생 개발자되다

이전 포스트

TIL# Git 쉽게 배우는 깃 명령어&이론 1탄(clean,add,status)

다음 포스트

# #TIL 프로젝트를 위한 Mock DATA 만들기 part-1

프로젝트를 위한 Mock DATA 만들기 part-1

가짜 데이터 만드는 법?

가짜 데이터(fake data) , 왜 필요 한가?

Fake library 이용

설치

사용법

SEED Method

TIL# Git 쉽게 배우는 깃 명령어&이론 1탄(clean,add,status)

# TIL 프로젝트를 위한 Mock DATA 만들기 part-2

0개의 댓글