이번 포스팅에서는 데이터 엔지니어링 분야에서 비중 있는 역할을 차지하고 있는 데이터 레이크(Data Lake)와 트랜잭셔널 데이터 레이크(Transactional Data Lake)에 대해 다룰 예정입니다. (갑자기 뭔 트랜잭셔널 데이터 레이크라고 물으신다면... 그냥
이번 포스팅은 인공지능과 머신러닝의 가장 중요한 측면인 피처 엔지니어링에 대한 것이다.피처 엔지니어링은 일반적으로 머신러닝 파이프라인의 다른 단계보다 더 많은 시간을 투자해야 한다.피처 엔지니어링은 ☝ 데이터 차원을 줄이고(오버피팅 방지), ☝ 특정한 피처가 알고리즘을
데이터 품질은 데이터의 정확성, 완전성, 유효성, 중복성 등과 같은 측면을 평가하는 개념이다. 데이터 품질이 좋다는 것은 데이터가 정확하고 신뢰할 수 있다는 의미이다.데이터 품질의 중요성은 데이터를 기반으로 하는 의사결정 및 분석 결과의 신뢰성과 효과성에 직결된다.🚨
📌 요약 감사하게도 기회가 되어 Associate Solutions Architect Internship - Summer 2023 (Korea), Builder 포지션으로 2023년 7월 3일부터 3개월 동안 일하게 되었다. 인턴임에도 불구하고 지원부터 합격까지의
제곧내.이번 포스팅도 내가 보려고 만든 데이터 레이크와 데이터 웨어하우스의 공통점 및 차이점에 관한 포스팅이다.모두 알겠지만 데이터 레이크와 데이터 웨어하우스는 데이터 관리와 분석에 중요한 개념이다.하지만 나는 데이터 분석과 관련된 글을 읽을 때마다 등장하는 데이터 레
✅ 포스팅 요약 제곧내. 내가 헷갈려서 내가 보려고 만든 쿠키와 세션의 차이점을 정리한 포스팅입니다. 쿠키랑 세션은 일단 모두 웹 개발에서 사용되는 메커니즘으로, 상태(state)를 유지(maintain)하고 사용자 정보(user information)을 관리()하
이번 포스트는 단순히 내가 보려고 기록한 클라우드 컴퓨팅 서비스에서 사용하는 용어들에 대한 정리이다.쿠버네티스, 하둡, 엘라스틱서치 등과 같은 클라우드 컴퓨팅 서비스를 사용하다 보면 꼭 나오는 용어들이 있다.바로 바로, 클러스터와 노드 이다. (자매품으로 파드, 샤드
제곧내.내가 헷갈려서 내가 보려고 만든 스토리지와 데이터베이스의 차이점을 정리한 포스팅이다.🚨 잘못된 정보가 있으면 언제든지 댓글로 알려주세요. (제발🙏)스토리지는 데이터를 일시적으로 또는 영구적으로 저장하는 데 사용되는 장치 또는 시스템을 의미한다.즉, 데이터의
✅포스팅 요약 2023-02-22 IT Developer & Engineer를 위한 Slack 웨비나, Why Slack with 당근페이에 참석했습니다. 본 포스팅은 Slack 웨비나 내용 정리 및 후기 공유를 위해 작성되었습니다. 포스팅 목차는 다음과 같습니다.
이번 포스트은 깃허브의 메인 페이지인 프로필을 꾸미는 방법을 공유하기 위해 작성되었습니다.포스트 목차는 다음과 같습니다~!Repository > New 클릭이제 Special Repository를 본격적으로 생성할 겁니다.🚨 첫 번째 빨간 박스 안에 적는 Reposi
✅ 포스팅 요약 이번 포스트는 아래와 같은 프로세스를 추가적으로 슬랙앱을 제작하지 않고 쉽게 만드는 방법을 공유하고자 작성되었습니다. >1. S3 bucket에 Object를 업로드한다. >2. AWS Lambda 함수에서 업로드된 Object를 받아 가공한 후, Sl
✅ 포스트 요약 저는 2023년 1월 2일부터 약 2개월 동안 진행되는 2023 AWS Cloud Bootcamp에 참여하였고, 그 과정에서 AWS Certified Cloud Practitoner 자격증과 AWS Certified Solutions Architect