post-thumbnail

K-means Clustering의 검정력 확인하기 : 실루엣 분석(Silhouette Analysis) : Clustering 적절성 분석

Clustering이 되었다고 하여 해당 Cluster가 정확한지 확신할 수 없기에 군집화가 잘 되었는지 확인할 수 있는 실루엣(Shilhouette Analysis) 에 대해 알아보면 도움이 됩니다.실루엣 분석은 각 군집 간의 거리가 얼마나 효율적으로 분리돼 있는지를

2022년 11월 11일
·
0개의 댓글
·

정리해야하는 목록

SQL index와 Partitioninsert & on duplicate => 있으면 인서트 없으면 업데이트 ! excel에서 insert 구문 만드는 법update set value쿼리튜닝 테이블 풀스캔드라이빙 테이블해빙과 웨어절 등 로컬 db 구축 방법 mysq

2022년 11월 11일
·
0개의 댓글
·

[SQL] [문자열 연결 function] MySQL의 group_concat (oracle LISTAGG)

고객들의 하루 행동패턴을 보고싶을때 어떻게 보면 좋을까 ? cust_seq = 고객번호Reg_dttm = 로그가 등록된 일자tracking_cd = 행동한 로그 로그를 기록하는 테이블을 일자별로 나열한다. 아래와 같이 코드를 작성하면 고객별 , 일자별 로그가 기록된다.

2022년 11월 6일
·
0개의 댓글
·

[IBM data analyst]-Views, Stored Procedures and Transactions

일련의 쿼리를 마치 하나의 함수 처럼 실행하기 위한 쿼리의 집합이다.프로시저 호출VIEW를 사용하여 원천 데이터를 보호했던 것과 비슷하게 새로운 함수 선언을 통하여 직접적인 접근에서 SQL문을 보호하는 역할 도 해줌과 동시에, 많은 작업을 간편하게 해주는 역할 도 하는

2022년 8월 14일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst]-REST APIs, Webscraping, and Working with Files

얄팍한 코딩사전 - REST API가 뭔가요? :REST API가 뭔가요? \_ 링크생활 코딩 - https://youtu.be/PmY3dWcCxXIREST API를 실행하기 위해 요청을 전송해야 하는 것을 알고 계실 것입니다. 또한 그 요청은 HTTP 메시지

2022년 8월 10일
·
0개의 댓글
·
post-thumbnail

빅데이터 시대, 성과를 이끌어내는 데이터 문해력 – 카시와기 요시키

데이터문해력 표지 문제 및 목적 정의지표 결정현재 상태 파악하고 평가원인 분석해결 방안 모색1-1. 이 단계에서는무엇을 알고 싶은지, 어떤 문제를 해결하고자 하는지 구체적이고 명확한 언어로 정리하기Tip. 문제와 목적은 이미 우리가 알고 있는 것인 경우가 많으며 따라서

2022년 8월 1일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst] - Data Analysis Basics, Filtering and Sorting Data

You can use filters to temporarily hide some of the data in a table, so you can focus on the data you want to see. When filtering, you can specify exa

2022년 7월 31일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst] - Excel Basics for Data Analysis

linkAs a CPA, I use Microsoft Excel on a daily basis and I have done so for the duration of my career. The functionalities, the pivot, the pivot table

2022년 7월 22일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst] - Using Data Analysis for Detecting Credit Card Fraud

Using Data Analysis for Detecting Credit Card FraudBefore you can analyze the data for patterns and anomalies, you need to:Identify and gather all dat

2022년 7월 21일
·
3개의 댓글
·
post-thumbnail

[IBM data analyst] - Opportunities and Learning Paths

If the business side of things excite you more, you could similarly explore the skills required for making. A lateral move into business analytics or

2022년 7월 21일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst]-Analyzing and Mining Data

Data mining or the process of extracting knowledge from data, is the heart of the data analysis process.Its goal is to identify correlations in data,

2022년 7월 21일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst]-Understanding Data Repositories and Big Data Platforms

데이터 리포지토리는 비즈니스 운영에 사용하거나 보고 및 데이터 분석을 위해 마이닝할 수 있도록 수집, 구성 및 격리된 데이터를 참조하는 데 사용되는 일반적인 용어 데이터베이스 관리 시스템(DBMS)은 데이터베이스를 생성하고 유지 관리하는 일련의 프로그램 플랫 파일과 달

2022년 7월 17일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst]-The Data Ecosystem and Languages for Data Professionals

데이터의 구조가 얼마나 잘 정의되었는지에 따라 데이터는 구조화, 반구조화 또는 비구조화로 분류반정형 데이터는 일관된 특성을 가진 데이터와 경직된 구조를 따르지 않는 데이터가 혼합됨비정형 = 행과 열로 축소할 수 없는 복잡하고 대부분 질적 정보인 데이터입니다. 예를 들어

2022년 7월 17일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst]-Modern Data Ecosystem and the Role of Data Analytics

데이터 분석가의 역할데이터 분석가로서의 역할에 필요한 몇 가지 기술적인 기술Microsoft Excel 또는 Google Sheets와 같은 스프레드시트 사용에 대한 전문성, IBM Cognos, IBM SPSS, Oracle Visual Analyzer, Micros

2022년 7월 17일
·
0개의 댓글
·
post-thumbnail

[IBM data analyst]-Introduction to Data Analytics

Forbes 2020 향후 10년간 데이터에 대한 보고서를 인용데이터 처리 속도와 대역폭의 지속적인 증가, 데이터 생성, 공유 및 소비를 위한 새로운 도구의 끊임없는 발명, 새로운 데이터 생성자와 소비자의 꾸준한 추가 데이터가 계속해서 증가함 데이터가 나오는 곳 데이터

2022년 7월 17일
·
0개의 댓글
·

[python] - ModuleNotFoundError: No module named 'pip'

ModuleNotFoundError: No module named 'pip'pip 재설치 안됨 pip를 다시 깔아준다.

2022년 7월 10일
·
0개의 댓글
·

[python] - EOL while scanning string literal

EOL while scanning string literal오타 괄호 , ' ' 같은 부분 잘 되어있는지 확인하자

2022년 7월 10일
·
0개의 댓글
·

[SQL] - 스타 스키마

사실(Fact)차원(Dimension)속성(Attribute)계층(Hierarchies)구조하나의 사실 테이블(Fact Table)을 중심으로 다수의 차원 테이블(Dimensional Table)들로 구성장단점장점모델이 단순하여 이해 쉬움계층 구조 정의 용이응답 성능

2022년 7월 5일
·
0개의 댓글
·
post-thumbnail

Retention Chart를 SQL으로 그려보자 !(mysql)

\-- 고객 별 최초 방문일 구하기 Date_format(c.first_visit_date, '%Y-%m-01') first_visit_month, -- 데이트 포맷함수는일자를 원하는 포맷으로 변경해주는데, 이때날짜형식은파괴된다. \-- 첫 방문달을 기준으로 캐이스

2022년 7월 5일
·
0개의 댓글
·
post-thumbnail

[SQL] Query Tuning - Partition

파티션 - 구획 분할MySQL 서버 입장에서는 데이터를 별도의 테이블로 분리해서 저장하지만 사용자 입장에서는 하나의 테이블로 읽기와 쓰기를 할 수 있게 해주는 기능을 의미큰 table이나 index를, 관리하기 쉬운 partition이라는 작은 단위로 물리적으로 분할하

2022년 6월 12일
·
0개의 댓글
·