# datascience

70개의 포스트
post-thumbnail

데이터 사이언스란 - 0

머신러닝, AI, 데이터사이언스 공부하고 싶은데 뭔소린지 모르겠다고? 일단 들어와라 차근차근 설명해 줄테니

2022년 4월 7일
·
0개의 댓글
post-thumbnail

SciPy

Scipy는 파이썬 패키지로, 과학 계산용 패키지 모음입니다.Scipy에서는 고성능 선형대수, 함수 최적화, 신호처리, 특수한 수학 함수와 통계 분포 등 다양한 기능을 제공합니다.사이킷런은 Scipy의 여러 함수를 사용하여 알고리즘을 구현합니다.Scipy의 가장 중요한

2022년 3월 8일
·
0개의 댓글
post-thumbnail

R : Data Frame (데이터 프레임)

데이터프레임은 행과 열로 이루어진 데이터의 집합체로, 행렬과 유사합니다.가장 보편적인 데이터셋 형식이에요!하지만, 행렬과 다른 점은, 데이터프레임에는 자료형이 다른 데이터를 함께 입력할 수 있다는 점입니다.데이터프레임은 data.frame() 함수를 사용하여 만듭니다.

2022년 3월 7일
·
0개의 댓글

API

트위터 API트위터에서 개인 키를 발급받으면 트위터 API를 활용할 수 있습니다.hidden.py 파일의 return 부분에 발급받은 키(4종류)를 입력하면 트위터 API를 활용할 수 있게 됩니다.

2022년 2월 26일
·
0개의 댓글

JSON

JSON은 XML보다 더 자주 사용되는 데이터 포맷입니다. 이 코드는 이전 시간에 XML로 실행했던 것과 정확히 같은 내용의 코드입니다. 데이터가 XML 형식에서 JSON 형식으로 바뀐 것을 제외하면 말입니다.JSON은 파이썬에서의 딕셔너리와 굉장히 비슷하기 때문에 데

2022년 2월 26일
·
0개의 댓글

XML

계층 구조로 이루어져있고 HTML과 비슷하지만 원하는 이름의 태그를 만들 수 있다는 특징이 있고, HTML보다 문법 오류를 더 엄격하게 다룹니다.Tags: 요소의 시작과 끝을 나타냄Attributes: 키워드나 값의 짝을 XML시작 태그에 표시Serialize/De-

2022년 2월 26일
·
0개의 댓글

제품의 가치 분석하기 (제품 성장률 분석)

제분 성장률 분석을 위해, 제품 성장률 분석용 데이터 마트 생성Sales 테이블(mem_no) + Product테이블(category,brand)+ 구매금액, 분기(주문일자:2020.01~06)분석 보고서카테고리별 구매금액 성장률(2020년 1분기 ~ 2020년 2분기

2022년 2월 25일
·
0개의 댓글

고객의 구매 현황 및 패턴 분석하기 (재구매율 및 구매주기 분석)

재구매율 및 구매주기를 분석하기 위해서 기준 정하기재구매자: 최초 구매일 이후, +1일 후 구매자구매주기: 구매간격(최근 구매일자~최초구매일자)/(구매횟수-1)FROM절 서브쿼리 테이블재구매율 및 구매주기 분석을 위해서 재구매율 및 구매주기 분석용 데이터 마트를 생성F

2022년 2월 25일
·
0개의 댓글

고객 가치 평가모형 분석하기 (RFM 분석)

고객의 가치를 분석할 때 사용되는 고객가치 평가 모형Recency:최근성Frequency: 구매 빈도Monetary: 구매 금액RFM분석을 위해서 RFM 분석용 데이터 마트 생성Customer 테이블 + 구매금액, 구매횟수(주문일자:2020년)분석 보고서RFM 세분화별

2022년 2월 25일
·
0개의 댓글

간단한 데이터 마트를 활용하여 분석 시작하기 (회원 프로파일 분석)

회원 프로파일 분석을 위해서 회원 프로파일 분석용 데이터 마트를 생성Customer 테이블 + 가입년월, 나이, 연령대, 구매 여부분석 보고서가입년월별 회원수성별 평균 연령/ 성별 및 연령대별 회원수성별 및 연령대별 회원수(+구매여부)

2022년 2월 25일
·
0개의 댓글

BeautifulSoup를 이용한 웹 데이터 스크래핑

BeautifulSoup는 아주 강력한 라이브러리로 urllib과 더불어 사용하면 다음과 같이 원하는 웹 페이지에 존재하는 모든 링크의 URL을 출력할 수 있습니다.왜냐하면, 이것은 웹페이지에서 일어날 수 있는 다양한 문제들에 대해서 해결책을 모아놓은 것입니다.

2022년 2월 24일
·
0개의 댓글

urllib를 이용해 웹 데이터 읽어오기

urllib을 활용하면 아주 간단하게 웹 브라우저를 만들 수 있습니다.이전에 여러 줄에 걸쳐 만들었던 웹 브라우저가 urllib 라이브러리를 활용하면 이렇게 4줄만에 완성이 됩니다.이것을 응용하면 이전에 파일에서 데이터를 읽어왔던 것을 인터넷에서 데이터를 읽어올 수 있

2022년 2월 24일
·
0개의 댓글

문자를 표현하는 방법 및 인코딩과 디코딩

아스키 코드는 1 byte로 영문자와 숫자, 그리고 일부 특수문자들을 표현할 수 있습니다.ord() 함수를 사용하면 다음과 같이 각각의 문자에 대한 아스키 코드 값을 확인할 수 있습니다.유니코드 체계는 이미 몇 십억개의 문자를 포함하고 있으며, 새로운 문자 몇 십억개를

2022년 2월 24일
·
0개의 댓글

파이썬을 이용해 웹 데이터 읽어오기

간단한 웹 브라우저

2022년 2월 24일
·
0개의 댓글

HTTP를 이용해 서버에 요청 보내기

서로 소통할 수 있기 위한 규칙인터넷 안에서 dominant Application Layer 프로토콜웹으로 초대가 가능Retrieve HTMLImagesDocumentsDocuments안에서 데이터 연장RSSWeb Servicesdocument 요청문서 재시도연결 끊기

2022년 2월 24일
·
0개의 댓글

소켓 모듈을 통한 네트워크 연결

IP 만들 수 있다(인터넷 프로토콜)저장과 제한 데이터들은 잃게 보일 수 있다윈도우 tansmit사용 시 컨트롤의 흐름을 작동한다좋고 믿을만한 pipe 제공\*왼쪽은 내 컴퓨터, 오른쪽은 서브 컴퓨터입니다.Socketspipe로 서로 연결하여 데이터를 주고받는 상태Po

2022년 2월 24일
·
0개의 댓글

데이터 마트

데이터 마트는 분석에 필요한 데이터를 가공한 분석용 데이터회원 분서용 데이터 마트요약 변수: 수집된 데이터를 분석에 맞게 종합한 변수(기간별 구매 금액,횟수, 수량)파생 변수: 사용자가 특정 조건 혹은 함수로 의미를 부여한 변수(연령대, 선호 카테고리등)데이터 정합성은

2022년 2월 23일
·
0개의 댓글

View 및 Procedure

하나 이상의 테이블들을 활용하여, 사용자가 정의한 가상 테이블입니다.JOIN 사용을 최소화하여 편의성을 최대화합니다View테이블들은 가상 테이블이기에 중복되는 일이 저장될 수 있습니다.중복되는 열 불가Procedure는 매개변수를 활용하여 사용자가 정의한 작업 저장Pr

2022년 2월 23일
·
0개의 댓글

연산자 및 함수 (2)

함수는 단일 및 복수 행 그리고 윈도우 함수로 나뉘고, 특정 규칙에 의해 새로운 결과값을 반행단일 행 함수는 모든 행에 대하여 각각 함수가 적용되어 반환함수들을 중첩해서 사용 가능단일행 함수는 숫자형, 문자형, 날짜형, 형변환, 일반함수로 나뉨여러 행들이 하나의 결과값

2022년 2월 23일
·
0개의 댓글

연산자 및 함수 (1)

UNION: 2개 이상의 테이블의 중복된 행들을 제거하여 집합UNION ALL: 2개 이상 테이블의 중복된 행들을 제거없이 집합\*열 개수와 데이터 타입 일치

2022년 2월 23일
·
0개의 댓글