<span style= 'background-color: 원하는 웹 페이지의 HTML 문서를 긁어 오고긁어 온 HTML 문서를 파싱,파싱한 HTML 문서에 원하는 태그를 가져와 사용한다.<span style='color:비정형 데이터인 HTML, PDF, L
어느 한 게임에서 사용되는 아이템들은 업그레이드가 가능합니다.ITEM_A -> ITEM_B 업그레이드 가능할 때,ITEM_A를 ITEM_B의 PARENT 아이템,PARENT 아이템이 없는 아이템을 ROOT 아이템이라고 합니다.예를 들어 ITEM_A -> ITEM_B -
결정자에 의해 함수적 종속을 가진 일반 속성을 의존자로 입력, 수정, 삭제하여 이상 현상을 제거하는 것이다.쉽게 말해, 데이터를 잘게 나누어서 쓸데없이 중복되어 생기는 오류를 없애는 작업.하나의 칼럼에는 하나의 원자값만 포함되어야 한다는 것.테이블의 중복 데이터를 분리
다음은 어느 자동차 대여 회사의 자동차 대여 기록 정보를 담은 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블입니다. HISTORY_ID - 자동차 대여 기록 IDCAR_ID - 자동차 IDSTART_DATE - 대여 시작일END_DATE - 대여
어느 한 게임에서 사용되는 아이템들은 업그레이드가 가능합니다.ITEM_A ➡️ ITEM_B와 같이 업그레이드가 가능할 때ITEM_A를 ITEM_B 의 PARENT,PARENT 아이템이 없는 아이템을 ROOT라고 합니다.예를 들어 ITEM_A ➡️ ITEM_B ➡️ IT
다음은 식품의 정보를 담은 FOOD_PRODUCT 테이블입니다. PRODUCT_ID - 식품 IDPRODUCT_NAME - 식품 이름PRODUCT_CD - 식품 코드CATEGORY - 식품분류PRICE - 식품 가격 FOOD_PRODUCT 테이블에서 가격이 제일 비싼
📚 SQL 실행 순서 > #### GROUP BY와 HAVING의 차이 > SQL 쿼리를 작성할 때, 작성되는 구문 순서와 달리 DB 엔진이 해당 구문을 처리하는 순서에는 차이가 있다. 📍 구문 종류 (작성 순서에 따라) SELECT DB에 저장된 데이터들을 조
대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다.ID - 대장균 개체의 IDPARENT_ID - 부모 개체의 IDSIZE_
📍 데이터 유형 변수 공통의 측정 방법으로 얻은 같은 성질의 값이다. 즉, 똑같은 기준과 도구를 사용해 조사하여 측정 대상마다 결과값이 다르게 나오는 것을 의미한다. 한 번에 몇 개의 변수를 보느냐에 따라 n변수라고 표현한다. 차원 데이터를 좌표 공간으로 생각하면
✔️ 데이터 분석 시, 해당 데이터로 얻고자 하는 구체적인 목표와 알고자 하는 대상을 명확히 하는 것이 제일 중요하다. 그렇기에 모집단에서 표본으로 수집 단위를 좁혀 특정 집단의 성질을 예측하는 것이다. 📍 모집단 통계학에서 알고자 하는 대상 전체를 말한다. 상술한
아무런 처리도 되지 않은 원자료는 수치의 나열일 뿐이므로 경향 파악이 불가하다. 그렇기에 평균, 중앙값, 분산 등의 요약 및 정리를 통해 수치의 경향성을 대략적으로 파악해야 한다.대상이 가진 성질 및 관계성을 밝히고 이를 이해하는 것이다. 데이터 분석을 통해 객관적인
📚 Join 방법 Inner Join: 두 데이터에 모두 존재하는 값들을 위주로 합친다. Left Outer Join: 왼쪽 데이터에 존재하는 값을 위주로 데이터를 합친다. 왼쪽 데이터는 모두, 오른쪽 데이터는 왼쪽에 존재하는 값들만 합쳐진다. Right Outer Join: 오른쪽 데이터에 있는 값을 위주로 데이터를 합친다. 오른쪽 데이터는 모두, ...
📍 문제 문자열에 따라 다음과 같이 두 수의 크기를 비교하려고 합니다. 두 수가 n과 m이라면 ">", "=" : n >= m "", "!" : n > m " 두 문자열 ineq와 eq가 주어집니다. ineq는 ""중 하나고, eq는 "="와 "!"중 하나입니다. 그리고 두 정수 n과 m이 주어질 때, n과 m이 ineq와 eq의 조건에 맞으면 1을 아니...
📍문제 문자열 my_string과 정수 k가 주어질 때, my_string을 k번 반복한 문자열을 return 하는 solution 함수를 작성해 주세요. > ### ⚠️ 제한사항 1 ≤ my_string의 길이 ≤ 100 my_string은 영소문자로만 이루어져 있습니다. 1 ≤ k ≤ 100 이것밖에 생각이 안 났다. 혹시 너무 간단한 건 아닌지,...
📍 문제 문자열 mystring, overwritestring과 정수 s가 주어집니다. 문자열 mystring의 인덱스 s부터 overwritestring의 길이만큼을 문자열 overwrite_string으로 바꾼 문자열을 return 하는 solution 함수를 작성해 주세요. > ### ⚠️ 제한사항 mystring와 overwritestring은 ...
📍 문제 영어 알파벳으로 이루어진 문자열 str이 주어집니다. 각 알파벳을 대문자는 소문자로 소문자는 대문자로 변환 해서 출력하는 코드를 작성해 보세요. > ### ⚠️ 제한사항 1 ≤ str의 길이 ≤ 20 str은 알파벳으로 이루어진 문자열입니다. .isupper(), .islower() 메서드는 입력값의 대소문자를 판단해 boolean 값으로 반...
📚 데이터 전처리 방법 📍 데이터 전처리란? > 원시 데이터를 데이터 분석을 위해 분석에 적합한 형태로 가공하는 과정 불필요한 데이터를 제거, 결측치 및 이상치를 처리에 데이터의 질을 향상시킨다. 📌 결측치 처리 1. 결측 데이터 확인 .isna() or .i
📚 파이썬 라이브러리 📌 Numpy (Numerical Python) > 다차원 배열을 쉽게 처리하고 효율적으로 사용 가능하도록 지원하는 라이브러리 💡 특징 1. 메모리의 효율적 사용 배열 내부에는 동일한 데이터 타입을 가진 원소들로만 구성되어 있다. 대용