📁 클라우드 관리가 훨씬 쉽고, 보안이 뛰어나며, 가용성이 좋음 스파크를 쓸 때는 여러 대의 컴퓨터를 사용하는데, 보통 클라우드의 서버를 빌림 📁 클라우드 3대장 AWS : 지금까지 시장을 지배해왔고, 앞으로도 그럴 가능성이 높음 한 번 시장을 지배한 이
📁 File format 다양한 파일 유형이 있는데, 크게 시간적 비용과 공간적 비용으로 장단점을 비교 시간적 비용: 읽고 쓰는데 걸리는 시간 파일 유형에 따라 수십배까지 차이가 남 공간적 비용: 저장된 파일의 크기를 가리킴 마찬가지로 파일 유형에 따라
대규모 데이터 전처리에 있어 스파크는 표준실제 많은 회사가 스파크를 운용하고 있기에 협업 차원에서 도움이 됨Apache Spark : SQL, 스트리밍, 머신러닝 및 그래프 처리를 위한 기본 제공 모듈이 있는 대규모 데이터 처리용 통합 분석 엔진대용량 데이터를 다루는
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는
📁 문제 설명 다음은 식당의 정보를 담은 RESTINFO 테이블입니다. RESTINFO 테이블은 다음과 같으며 RESTID, RESTNAME, FOODTYPE, VIEWS, FAVORITES, PARKINGLOT, ADDRESS, TEL은 식당 ID, 식당 이름, 음
📁 문제 설명 다음은 어느 의류 쇼핑몰에서 판매중인 상품들의 정보를 담은 PRODUCT 테이블입니다. PRODUCT 테이블은 아래와 같은 구조로 되어있으며, PRODUCTID, PRODUCTCODE, PRICE는 각각 상품 ID, 상품코드, 판매가를 나타냅니다. 상품
📁 문제 문자 "A"와 "B"로 이루어진 문자열 myString과 pat가 주어집니다. myString의 "A"를 "B"로, "B"를 "A"로 바꾼 문자열의 연속하는 부분 문자열 중 pat이 있으면 1을 아니면 0을 return 하는 solution 함수를 완성하세요
📁문제 문자열 binomial이 매개변수로 주어집니다. binomial은 "a op b" 형태의 이항식이고 a와 b는 음이 아닌 정수, op는 '+', '-', '*' 중 하나입니다. 주어진 식을 계산한 정수를 return 하는 solution 함수를 작성해 주세요.
📁 딥러닝 머신러닝과 딥러닝은 내부 구조와 활용범위가 다를 뿐 기본적인 흐름은 같음 다만 딥러닝은 자연어처리와 이미지 처리에 뛰어난 발전을 이룸 공통점 : 데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는 알고리즘 개발과 관련된 인공지능(AI)의 하위
📁 문제 알파벳으로 이루어진 문자열 myString과 pat이 주어집니다. myString의 연속된 부분 문자열 중 pat이 존재하면 1을 그렇지 않으면 0을 return 하는 solution 함수를 완성해 주세요. 단, 알파벳 대문자와 소문자는 구분하지 않습니다.
K - 평균 군집화 혹은 알고리즘(K-means clustering) : 가장 일반적으로 사용되는 알고리즘sepal_length: 꽃 받침의 길이sepal_width: 꽃 받침의 너비petal_length: 꽃 잎의 길이petal_width 꽃 잎의 너비species(
의사결정규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법타이타닉의 예시 \- 성별의 기준으로 의사결정나무 시각화결정 트리의 과정→ 출처 : https://eehoeskrap.tistory.com/12명칭루트
정수가 담긴 리스트 num_list가 주어질 때, 리스트의 길이가 11 이상이면 리스트에 있는 모든 원소의 합을 10 이하이면 모든 원소의 곱을 return하도록 solution 함수를 완성해주세요.if에서 리스트의 길이 11 이상일 때 리스트에 있는 모든 원소들의 합
예측모델링 프로세스 데이터 수집 데이터 분석가는 이미 존재하는 데이터를 SQL 혹은 Python을 통해 추출하고 리포팅 혹은 머신러닝을 통한 예측을 담당 회사 내 데이터가 존재한다면 SQL 혹은 Python 을 통해 데이터 마트를 생성 회사 내 Data가 없
📁 문제 문자열 리스트 strlist에는 "u", "d", "l", "r" 네 개의 문자열이 여러 개 저장되어 있습니다. strlist에서 "l"과 "r" 중 먼저 나오는 문자열이 "l"이라면 해당 문자열을 기준으로 왼쪽에 있는 문자열들을 순서대로 담은 리스트를, 먼
📁 1. 선형 회귀(Linear Regression) 가장 기초 적인 머신러닝 모델 여러 가지 데이터를 활용하여 연속형 변수인 목표 변수를 예측해 내는 것이 목적 ex) 몸무게, 나이, BMI, 성별 등을 데이터로 활용하여 키와 같은 연속형 변수를 예측하는 것 → 남
📁 문제 두 정수 q, r과 문자열 code가 주어질 때, code의 각 인덱스를 q로 나누었을 때 나머지가 r인 위치의 문자를 앞에서부터 순서대로 이어 붙인 문자열을 return 하는 solution 함수를 작성해 주세요. 📁 입출력 예 💡 내가 적은 오답
📁 문제 어떤 문자열에 대해서 접두사는 특정 인덱스까지의 문자열을 의미합니다. 예를 들어, "banana"의 모든 접두사는 "b", "ba", "ban", "bana", "banan", "banana"입니다. 문자열 mystring과 isprefix가 주어질 때, i
📁 선형회귀 공통 Y는 종속 변수, 결과 변수 X는 독립 변수, 원인 변수, 설명 변수 통계학에서 사용하는 선형회귀 식 $$ Y = \beta0 + \beta1X + \varepsilon $$ $\beta_0$: 편향(
📁 문제 정수 startnum와 endnum가 주어질 때, startnum부터 endnum까지의 숫자를 차례로 담은 리스트를 return하도록 solution 함수를 완성해주세요. 📁 입출력 예 💡 내가 푼 정답 문제를 풀고 나서 무언가 더 간단한 정답이 있