[주제]
데이터 리터러시의 중요성 및 향상을 위한 방법
[아티클 요약]
데이터 리터러시의 정의
데이터 리터러시 향상을 위한 세가지 방법 소개

결론
[인사이트]
너무 많은 데이터를 보고자 하지만 문제와 관련없는 데이터는 쓸모가 없는 말에 공감했다. 특히 웬만한 정보는 다 모으는 성향이라, 졸업 논문을 작성할 때 쓸모없는 자료를 찾느라 시간만 허비하고 결국 활용은 하나도 못한 적이 있었다. 삼일 동안 진행된 아티클 스터디에서 똑같이 강조되는 내용이지만, 그만큼 중요한 내용이고 또 간과하기 쉬운 부분이라고 생각한다. 데이터를 문제를 잘 정의하고 해결하는 데이터 리터러시는 데이터 분석가 뿐만 아니라 모든 직무의 사람들이 알고 실천해야하는 내용이라고 느꼈다.
[주제]
잘못 해석된 데이터 유형 및 제대로 해석하는 방법
[아티클 요약]
[인사이트]
데이터를 해석하는 중 발생하는 실수를 다양한 유형으로 구분지어서 이해하기 편했다. 대학 생활을 돌아보면 나도 인지하지 못하게 다양한 오류를 범했다는 것을 느꼈다. 특히 같은 목적이라도 관점에 따라 선택할 수 있는 지표와 방식이 다를 수 있다는 사실이 흥미로웠다. 협업 시 의사소통이 제대로 이루어지지 않는다면 같은 목적으로 분석하는 것처럼 보이지만 내부적으로 혼란이 생길 수도 있겠다는 생각이 들었다. 팀원 간 의사소통과 목적의 명확한 설정이 반드시 필요한 것 같다.
또한 특별한 주장에는 특별한 근거가 필요하다는 세이건 표준이 인상깊었다. 사실 데이터 분석을 통해 혁신적인 해결책을 제시하고 싶은 마음은 나 뿐만 아니라 데이터를 공부하는 많은 사람들이 가지고 있다고 생각한다. 욕심에 앞서 잘못 해석한 데이터로 특별한 주장을 하는 오류를 범하지 말고 충분한 근거를 기반으로 주장하는 것의 중요성을 다시금 느끼게 되었다.
- 기본 사칙 연산 : +, -, *, /
- 합계 : SUM(컬럼)
- 평균 : AVG(컬럼)
- 최솟값 : MIN(컬럼)
- 최댓값 : MAX(컬럼)
- 데이터 갯수 : COUNT(컬럼)
[컬럼명 대신 1, * 사용 가능]
SELECT COUNT(price) AS high_price
FROM food_orders
WHERE price >= 30000;

어차피 주문건의 개수를 구하는 거니까,
COUNT(price) 말고 COUNT(1)을 해도 된다.
# 가격의 평균
SELECT AVG(price) AS korean_avg_price
FROM food_orders
# 한국 음식만 필터링
WHERE cuisine_type = 'Korean';

where 절을 사용해서 수십개의 쿼리를 작성하는 것은 너무 비효율적
카테고리별로 지정하여 연산 가능
SELECT 카테고리컬럼(원하는컬럼 아무거나), sum(계산 컬럼), FROM GROUP BY 카테고리컬럼(원하는컬럼 아무거나)
SELECT restaurant_name,
#최댓값 연산
MAX(price) AS max_pirce
FROM food_orders
#음식점 이름으로 카테고리 지정
GROUP BY restaurant_name;

SELECT pay_type,
#최근 결제일 지정
MAX(date) AS "최근 결제일"
FROM payments
#결제 타입으로 카테고리 지정
GROUP BY pay_type;

계산 결과를 오름차순 혹은 내림 차순으로 정리
select 카테고리컬럼(원하는컬럼 아무거나), sum(계산 컬럼), from group by 카테고리컬럼(원하는컬럼 아무거나) order by 정렬을 원하는 컬럼 (카테고리컬럼(원하는컬럼 아무거나), sum(계산 컬럼) 둘 다 가능)
오름차순 : ORDER BY 컬럼
내림차순 : ORDER BY 컬럼 DESC
SELECT restaurant_name,
MAX(price) max_price
FROM food_orders
# GROUP BY 에서는 별명을 사용할 수 없지만
GROUP BY restaurant_name
# ORDER BY에서는 별명을 사용할 수 있다
ORDER BY max_price DESC;

#주어진 조건이 없으므로 테이블 전체를 출력
SELECT *
FROM customers
ORDER BY name;

#주어진 조건이 없으므로 테이블 전체를 출력
SELECT *
FROM customers
ORDER BY gender,name;

아티클 두개를 해서 공부를 많이 못한 것 같지만, 그래도 SQL의 기초적 형식은 익혔다. 내일은 문제를 많이 풀면서 익숙해져야겠다. 별로 하는게 없는 것 같은데 4시간이 금방 지나간다. 문제 풀기만 하고 넘어가지 말고, 각주 잘 활용해서 기록하자. 안중요해 보여도 궁금한건 챗GPT한테 꼭 물어보자.