profile
Data Science 스터디로그

SQL - Python with MySQL

VSCode에서 jupyter Notebook 실행 ds_study 환경 작업Jupyter Notebook MySQL은 모두 sql_ws 같은 폴더에서 작업AWS RDS가 생성한 databae-1이 접속 상태인지 확인ds_study 환경으로 새로운 Jupyter Not

2024년 3월 19일
·
0개의 댓글
·

SQL - AWS RDS

<사용방법> (1) AWS RDS에 생성한 DB 'database-1'에 접속 mysql -h <엔드포인트> -P <포트> -u<마스터 사용자> -p<패스워드> (2) DB(zerobase) 생성 (3) 사용자 (zero)

2024년 3월 19일
·
0개의 댓글
·

SQL - UNION / JOIN / Subquery

여러 개의 SQL문을 합쳐서 하나의 SQL문으로 만들어 줌각 SQL문의 컬럼의 개수가 동일해야 오류 생기지 않음(1) UNION : 중복값 제거 후 검색 반환(2) UNION ALL : 중복된 값을 포함해 모두 반환(예제)(1) 성별이 여자인 데이터를 검색하는 쿼리와

2024년 3월 19일
·
0개의 댓글
·

SQL - CONCAT/ALIAS/DISTINCT/LIMIT/Scalar Functions/PRIMARY KEY/FOREIGN KEY

여러 문자열을 하나로 합치거나 연결예제 SELECT CONCAT('concat', ' ', 'test'); \+-------------------------------+ | CONCAT('concat', ' ', 'test') | \+----------

2024년 3월 19일
·
0개의 댓글
·

SQL - 부속 질의어

celeb 테이블 생성 ID (int) Name (varchar) BIRTHDAY (date) AGE (int) SEX (char) JOB_TITLE (varchar) AGENCY (varchar) (1) WHERE (조건 추가) \- Table

2024년 3월 18일
·
0개의 댓글
·

SQL - DDL / DML

Table : 데이터베이스 내에 데이터가 저장되는 형태로 행(Row) 과 열(Column)으로 구성된 데이터 집합(1) CREATE (Table 생성)(2) ALTER (Table 변경/수정)테이블 이름 변경테이블 컬럼 추가테이블 컬럼 변경테이블 컬럼 삭제(3) DRO

2024년 3월 18일
·
0개의 댓글
·

SQL - Database 기본

여러 사람이 공유하여 사용할 목적으로 체계화해 통합, 관리하는 데이터 집합체사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 생성해주고 데이터베이스를 관리서로간에 관계가 있는 데이터 Table들을 모아둔 데이터 저장 공간행row : 튜플tuple, 레코드rec

2024년 3월 18일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 인구 현황 데이터 분석 (catogram 시각화)

지리적 공간을 나타내는 지도에서 지역의 상대적 크기를 표현하는 방식특정 변수의 값을 반영하여 지역의 크기를 변형하여 나타냄. (일반적으로 지도에서는 지역의 면적이나 크기가 실제 지리적 크기와 일치)통계적 혹은 시각적으로 중요한 데이터를 강조하거나 특정 지역 간의 비교

2024년 3월 18일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 네이버 쇼핑 검색 API

검색 요청 URL 생성하는 함수파라미터들을 URL에 포함시켜야 함한번에 표시될 수 있는 검색 결과(display)의 최대 수 - 100개만약 1000개의 데이터 얻고자 하면 start 파라미터 이용해 시작갑 start = 1, start = 101,..., start

2024년 3월 18일
·
0개의 댓글
·

네이버 검색 API 사용하기

1. 네이버 API 사용 등록 네이버 개발자 센터 https://developers.naver.com/main/ Application 애플리케이션 등록 애플리케이션 이름 ds_study 사용 API 검색 데이터랩 (검색어 트랜드)

2024년 3월 18일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 시계열 데이터 웹 유입량 데이터 분석

(1) 데이터 읽어오기 \* 데이터 읽어온 후 Nan 값 제거전체 데이터 시각화(2) 경향분석 (Numpy 이용) \- Numpy 이용 경향성 분석 (trend) \- 다항식 회귀(Polynomial Regression) 모델을 사용. 다항식 함수 사용하여 데

2024년 3월 18일
·
0개의 댓글
·
post-thumbnail

프로젝트 - OIL PRICE분석

유가 (OIL PRICE) 분석 - 셀프 주유소가 저렴한가?대한민국 주유가격 알아보는 사이트 오피넷 (OPINET)웹 데이터 가져오기 (1) Selenium으로 Chrome 제어창 열기 \- Opiniet 에서 싼 주유소 찾기 / 지역별 페이지로 접근\_\_ (2)

2024년 3월 18일
·
0개의 댓글
·

프로젝트 - Selenium Basic

셀레니움 설치윈도우 mac(intel)conda install seleniummac(m1)pip install selenium (!pip list로 확인가능)chromedriver주의selenium의 코드가 바뀜 (인강의 내용과 달라짐 숙지) - 공식문서 확인하기 기

2024년 2월 28일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 웹데이터 분석 (시카고 맛집 데이터)

1\. 시카고 맛집 데이터 수집 및 정리

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 웹데이터 분석 (네이버 금융)

html태그 위치 : 부분

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 웹데이터 분석 (라이브러리)

HTML 뿐만 아니라 XML과 같이 태그로 구조화된 언어를 파싱하고 해석 및 검색하는 파이썬 라이브러리웹 스크레이핑 및 데이터 추출과 같은 작업을 쉽게 수행인터넷에 html을 보기 위한 도구크롬 오른쪽 상단 ... > 도구 더보기 > 개발자 도구 또는 그냥 F12원하는

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 서울시 범죄 현황데이터 분석 실습

(1) 특정 컬럼의 unique 조사(2) NaN값 제외하고 필요 데이터만 가져옴 (데이터 재편성)pivot_table()을 이용해 원하는 DataFrame 형태로 데이터 재편성(1) DataFrame 재편성 - pivot_table() 이용경찰서 이름인 "구분" 컬럼

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 서울시 범죄 현황데이터 분석 (라이브러리)

index : 새로운 테이블의 인덱스로 사용될 열columns : 새로운 테이블의 열로 사용될 열values : pivot할 값으로 재집계가 가능한 수치 값aggfunc : 집계 함수로, 겹치는 값이 있는 경우 어떻게 처리할 지 지정. 디폴트 함수는 '평균'go

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

프로젝트 - 서울시CCTV현황

서울시 구별 CCTV현황 데이터 (.csv)컬럼명 변경컬럼명 변경가장 많은 CCTV를 보유한 구'최근증가율' 컬럼 추가 이전에 보유한 CCTV 개수 대비 최근 3년(2014~2016)간 CCTV를 가장 많이 설치한 구는?첫 행(row0의 '합계' 데이터 삭제drop 메

2024년 2월 22일
·
0개의 댓글
·

EDA 환경설정

데이터 분석을 위해 데이터를 다양한 각도로 관찰하고 이해하는 과정데이터의 특징과 내재하는 구조적인 관계를 알아내기 위한 분석기법이론적 모형을 적용하기보다 데이터를 있는 그대로 보려는데 중점을 두고 데이터 스스로 말하도록 유도하는 분석법자료의 구조 및 특징 파악을 위하여

2024년 2월 22일
·
0개의 댓글
·