Comma Separated Values (데이터 직렬화 포맷)
- 컴퓨터 용어로, 표 형태의 데이터를 저장하는 파일 형식
- 주로 쓰이는 확장자 : .csv
- MIME 형식 : text/csv
구조
- 하나의 CSV파일은 하나의 독립된 2차원 데이터를 나타낸다
- 각 줄은 하나의 행이고 각 열 사이에는 쉼표를 넣어 구분한다
- 모든 행은 같은 갯수의 열을 가져야 한다
- 줄바꿈 문자는 라인피드(LF) 또는 캐리지 리턴-라인 피드(CRLF)를 사용한다
예시)
|이름|생년|월|일|국어점수|영어점수|수학점수|
|------|------|------|------|------|------|------|
|김김김|1995년|7월|11일|100점|48점|25점|
|이이이|1993년|2월|28일|65점|84점|78점|
위의 예시 데이터를 CSV형식으로 저장하면 아래와 같은 형태가 된다
이름, 생년, 월, 일, 국어점수, 영어점수, 수학점수
김김김, 1995년, 7월, 11일, 100점, 48점 25점
이이이. 1993년, 2월, 28일, 65점, 84점 78점
- CSV라는 포맷은 표준적으로 정의된 스키마나 데이터 타입이 있는게 아니다. 구분자를 뭘로 쓰던 데이터를 주고 받는 사이에 약속만 지키면 된다. 단지 주로 쓰는 구분자가 쉼표인거다
장점
- 직관적으로 나타내는 간단한 형식이라 이해하기 쉽다
- 별다른 파서/인코더가 필요 없이 기초적인 문자열 조립만으로 읽거나 쓸 수 있기 때문에 소프트웨어로 처리하는 것도 쉽다.
- 텍스트 기반 형식이라 사람이 직접 읽고 수정하는 것도 가능하다
- 간결한 형식으로 용량이 적다
단점
- 쉼표가 포함된 내용의 데이터를 취급하기 곤란하다 (예시: 10,000원 )