Comment
귀찮고 난해한
pd.read_csv
의sep
, 즉 seperator(구분기호) 종류를 알아보자 feat. ChatGPT
In Pandas, a DataFrame is a 2-dimensional labeled data structure that can hold data in different formats like CSV, Excel, JSON, etc. When reading data into a DataFrame, the 'sep' parameter is used to specify the character or sequence of characters used as a separator between values in a file.
Pandas의 DataFrame이란 CSV, Excel, JSON, txt 등과 같은 다양한 형식의 데이터를 저장할 수 있는 2차원, 라벨링된 데이터 구조
'sep' parameter는 읽어드리는 파일의 '값'들 사이에 구분자로 사용되는 문자 또는 문자열을 지정하는데 사용
,
comma : default separator value;
semicolon \t
tab : Text file, 즉 txt파일의 separator' '
single space : Text file에서 주로 사용됨\s+
one or more spaces : Text file에서 주로 사용됨|
pipe : csv, tsv, txt file에서 주로 사용됨