s3fs
라이브러리 설치 후 기능 사용이 가능하므로 먼저 설치를 해준다.
pip install s3fs
Object Storage에 있는 parquet 파일 읽기
import pandas as pd
aws_storage_options = {
"key" : "",
"secret" : ""
}
ncp_storage_options = {
"endpoint_url" : "http://kr.object.gov-ncloudstorage.com",
"key" : "",
"secret" : ""
}
df = pd.read_parquet(
"s3a://[Object Storage 내부 경로]",
storage_options = ncp_storage_options
)
df.head()
import pandas as pd
aws_storage_options = {
"key" : "",
"secret" : ""
}
ncp_storage_options = {
"endpoint_url" : "http://kr.object.gov-ncloudstorage.com",
"key" : "",
"secret" : ""
}
pdf.to_parquet(
"s3a://[Object Storage 내부 경로]",
compression='snappy',
engine = 'pyarrow',
storage_options = ncp_storage_options
)