TIL은 Today I learned의 약자로 부트캠프에서 학습한 내용중 새로 학습하게 된 내용위주로 정리하는 것과 중요한 것을 정리하는 것을을 목표로 한다.2024.02.16 오늘 학습한 내용 : Python 기초 부분해당 파이썬 프로그래밍은 이전에도 진행한 적이 있
2024.02.16 오늘 학습한 내용 : class에 대하여... 1. Pass에 대하여 pass는 pass는 하나의 클래스, 함수, 조건문, 반복문등의 내용을 추후 정하고 다른 부분을 먼저 할때 넘어가기 위해 사용 즉, 비즈니스 로직의 전반적인 형식을 형성하기
1. 데이터베이스 데이터의 집합 여러명의 사용자나 응용프로그램이 공유하는 데이터들 동시에 접근 가능해야한다 데이터의 저장 공간 자체 2. DBMS(Database management system) 데이터베이스를 관리 운영하는 역할 특징> 무결성(integ
2024.02.21오늘 학습한 내용 : SQL 심화명령 프롬트를 킨다파일의 경로를 찾아 복사한다.cd 커맨드를 통해 디렉토리 경로를 파일의 경로로 변경한다.mysql -u root -p MySQL의 비밀번호를 기입source sql파일명 1~4를 통해 최종적으로 sq
1. 가상머신 가상머신 말 그대로 가상의 컴퓨터를 의미한다. 가상머신 소프트웨어 컴퓨터에 설치된 운영체제(호스트os)안에 가상의 컴퓨터를 만들고, 그 안에 다른 운영체제(게스트os)를 설치/운영할 수 있도록 제작된 프로그램 ex. VMware 호스트 os
2024.02.23 (22 -> 졸업식) 오늘 학습한 내용 : Linux 기본 개념 , Linux 명령어 1. Linux 기본 개념 a. root권한 vs 일반사용자 권한 root 권한은 시스템의 모든 측면을 제어할 수 있는 권한을 제공한다. 시스템의 설정
2024.02.26 오늘 학습한 내용 : 셸 스크립트, 원격 서버 구축, 셸 스크립트 셸 스크립트 작성 셸 스크립트(Shell Script)는 리눅스나 유닉스 기반 시스템에서 사용되는 스크립트 언어 c언어와 유사하게 프로그래밍 변수, 반복문, 제어문 사용 가능 텍
2024.02.26 오늘 학습한 내용 : 데이터 크롤링 기본 크롤링이란 인터넷 상에서 웹 페이지를 자동으로 탐색하고 필요한 정보를 수집하는 프로세스 웹 스크래핑의 한 형태로, 웹 페이지의 HTML 코드를 분석하여 원하는 데이터를 추출 HTML에서 데이터 불러오기
2024.02.28 오늘 학습한 내용 : 동적 웹페이지 크롤링 동적 웹페이지 크롤링 정적 웹페이지와 동적 웹페이지 정적 웹페이지 서버로부터 한 번에 전달되며, 사용자의 요청에 따라 동적으로 생성되거나 변경되지 않음 HTML,CSS,JavaScript 내용이 고정
Hadoop 이란? > Hadoop은 대규모 데이터를 처리하기 위한 오픈 소스 프레임워크. 주로 클러스터 컴퓨팅 환경에서 사용되며, 대용량 데이터를 저장하고 처리할 수 있는 기능을 제공한다. HDFS (Hadoop Distributed File System) HDF
Mapreduce Yarn과 Mapreduce MapReduce: MapReduce는 대규모 데이터 세트를 처리하기 위한 분산 병렬 처리 프레임워크 MapReduce는 맵(Map) 단계와 리듀스(Reduce) 단계로 구성 MapReduce는 데이터 처리 작
Apache Hive Hive란? > 하둡에 저장된 데이터를 쉽게 처리할 수 있는 데이터웨어하우스 패키지 > SQL과 유사한 Query Language를 지원 > SQL레벨의 ETL 처리도구로 활용 가능 Hive metastore 1. Embedded metas
Apache Sqoop이란 > sqoop은 일반적으로 사용하는 RDBMS(MySQL, Oracle)와 HDFS(Hive, HBase)간 데이터를 전송하기 위해 사용하는 툴이다. > >HDFS 저장소를 기준으로 import(RDBMS -> HDFS), export(HD