
웹 크롤링(Web Crawling) 웹 크롤링(Web Crawling이란 인터넷에 있는 웹페이지를 방문하여 얻고자하는 데이터를 추출하는 자동화 기법으로 웹 크롤러(Web Crawler)라는 소프트웨어를 통해 수행되며 데이터 수집, 웹 콘텐츠의 변화 감지, 사이트의 구조 및 링크를 분석하는 등의 다양한 목적으로 활용된다. 웹사이트 구성 (HTML, CSS,...

Number of Cases Rule of Sum 합의 법칙 두 사건 $A$와 $B$가 상호 배타적일 때, 즉 동시에 발생할 수 없을 때, 사건 $A$가 일어나는 경우의 수가 $m$이고, 사건 $B$가 일어나는 경우의 수가 $n$이면, 사건 $A$ 또는 사건 $B$가 일어나는 경우의 수의 총합은 $m + n$이다. Rule of Product 곱의 법칙 ...

Git Git은 분산 버전 관리 시스템(DVCS)으로, 소프트웨어 개발에서 코드의 버전을 관리하는 데 필수적인 도구이다. Linus Torvalds가 처음 개발하였으며 효율성, 신뢰성, 비선형적인 개발 Workflow을 지원한다. 분산 버전 관리 시스템(DVCS) Git은 중앙 집중식 서버에 의존하지 않고 각각의 개발자가 전체 코드 베이스의 복사본을 로컬...
Pandas 1. Pandas DataFrame and Operations DataFrame은 2차원 테이블이고 테이블의 한 줄(행 or 열)을 Series라고하며 Series의 모임이 DataFrame이 된다. > X1 X2 X3 X4 0 0.496714 -0.138264 0.647689 1.523030 1 -0.234153 -0.234137 1.57...

자료구조 배열(Array) 배열은 동일한 타입의 요소들이 연속된 메모리 공간에 저장되는 자료구조이다. 배열의 장점은 인덱스를 통해 요소에 빠르게 접근할 수 있다는 점이며 단점은 크기가 고정되어 있어 크기를 변경할 수 없다는 점이다. 배열 예제 연결 리스트 (Linked List) 연결리스트는 각 요소가 노드로 구성되며 각 노드는 데이터와 다음 노드를 가...

House Price Prediction 경진대회 서울시의 아파트 실거래가를 예측하는 모델을 개발하는 대회로 제공된 아파트 특징 및 거래정보 데이터셋을 기반으로 모델을 학습하고 서울시 각 지역의 아파트 매매 실거래가를 예측한다. 평가 지표 $$ RMSE = \sq

CV Backbone Overview CNN CNN의 기본 구조 Filter 이미지처리를 위해 사용되는 행렬로 주로 edge detection, burring 등을 위해 사용되었으며 같은 filter로 이미지 전체에 sliding window로 convolution 연산 수행 Convolution 연산 이미지와 filter간의 합성곱 연산을 의미한다. ...

NLP (Natural Laguage Process NLP는 인간이 일상적으로 사용하는 언어를 컴퓨터가 이해하고 처리할 수 있도록 만드는 기술로 언어의 의미를 파악하고 문장 구조를 분석하며 텍스트나 음성을 처리하는 다양한 응용 프로그램을 포함한다. NLU (Natural Language Understanding) : 텍스트나 음성을 분석하고 그 의미를 이...