Upstage 현직자 특강

Sylen·2024년 4월 4일

Upstage AI Lab 3기

목록 보기
2/19

소개

Upstage의 김남혁 Data Manager님의 현직자 특강

  • 수학과 + 경제금융학부 복수전공 -> 퀀트 및 금융업 준비

  • 데이터분석 유행 | 코딩 공부 시작

  • Google Developer Machine Learning Bootcamp

  • Naver BoostCamp

Data Manager 직무

  • 데이터 매니저는 인공지능 + 개발 + 데이터(도메인) 지식을 골고루

  • 학습 데이터 구축

  • 평가 데이터 구축

  • 데이터 구축에 필요한 라이브러리 개발

  • 데이터 구축에 필요한 툴 개발 (수집 툴, 라벨링 툴, 관리 툴)

슬기로운 부캠생활

  • 취업을 목표로 어떻게 하면 부트캠프를 더 알차게 보낼 수 있을까?

  • 다양한 포트폴리오 제작 (SOTA 모델 활용)

  • 초반에 너무 스퍼트를 높이는 것은 금물 (번아웃 조심)

기본

  • 커리큘럼을 잘 따라가기
  • 면접 준비라고 생각하고 기본기 점검
  • 파이썬 및 데이터분석 기초는 꾸준히 익숙히지는 것
  • 취업교육 : 코딩테스트, Git <취업목적이라면 핵심>
  • AI 심화교육 : Machine Learning, Deep Learning, PyTorch

심화

  • Data Centric AI
  • 실전대회 : OCR, Information Retrieval, Recommender System, Anomaly Detection
  • SOTA 모델 구현, 데모페이지 구축이 순위보다 중요
  • 완벽한 이해보다 전체적인 흐름을 알고 키워드 중심으로 생각할 수 있는게 중요

채용

서류 (이력서, 자기소개서, 포트폴리오) | 코딩 테스트 (알고리즘, 딥러닝) | 기술 인터뷰 (CS 및 인공지능 관련 기술 검증) | 최종 인터뷰 (인적성 및 컬처핏)

코딩 테스트

정렬, 구현, 그리디, BFS/DFS, 최단 경로, 다이나믹 프로그래밍, 그래프 이론, 이진 탐색

SW Expert Academy, Programmers, BAEKJOON

  • 최소 하루 한 문제 꾸준히 풀기
  • 정답지나 ChatGPT 도움 없이 스스로 풀기
  • GitHub 또는 기술 블로그에 코드 + 해설 정리
  • 백준 기준 실버1 ~ 골드5, 프로그래머스 기준 레벨3을 편안하게 푸는 것
CS 5대 과목
  • 자료구조
  • 알고리즘
  • 운영체제
  • 네트워크
  • 데이터베이스
  • Back-End 위주로 공부하면 좋다.
  • 정보처리기사 자격증 따기

스터디

  • 복습 스터디
  • 코딩 테스트 스터디
  • CS 기초 스터디
  • 논문 스터디 : AI에서 기본이 되는 논문들을 읽고 정리하고 토론하는 스터디
    Github Repo의 Wiki나 기술 블로그에 정리해두면 포트폴리오로 활용할 수 있다.

사이드 프로젝트

  • 차별화된 포트폴리오를 위한 사이드 프로젝트
  1. Kaggle, DACON

  2. Demo Page

  • 개발하는 과정에서 겪게 되는 이슈가 현업과 밀접한 연관되어 포트폴리오를 더욱 풍성하게 만들어 줌
  • AI기술 + 다양한 기술 스택이 필요하여 전체적인 파이프라인에 대한 이해도가 필요
  • Demo Page 를 통해서 시각화되기 때문에, 보는 사람으로 하여금 임팩트가 큼 (Streamlit, Gradio)
  1. 공모전

이력서

이력서
PROJECT | COMPETITIONS | WORK EXPERIENCES | COURSEWORKS | CERTIFICATES

LINKEDIN(필수)

  • 특허, 학교, 논문, 평점, 외국어, 스킬, 수업내역, 추천서, 동아리, 대외활동, 수상 실적

GitHub Profile
GitHub.io - 기술블로그, JekyII
GitHub - 잔디심기 : 1일 1Commit

타임라인

AI경험자면 부트캠프와 취업 준비를 병행해야 함

  • 코딩테스트, 기술면접 준비

Q&A

  • 부트캠프에서 가장 중요한 것 : 커리큘럼(가장 기본기), 포트폴리오

  • 프로젝트를 진행할 때 고려하면 도움이 되는 것 : 소규모 프로젝트에서도 "이러한 노력을 해봤다"를 포트폴리오에 어필하는 것이 중요, 이쁘게 시각적으로 잘 만드는 것이 중요

  • 비대면 프로젝트의 소통 문제

  • 인사 담당자라면 무엇을 보고 인재를 뽑는지 : LSTM이나 트랜스포머에 대해 유창하게 설명 가능해야하고

  • 데이터 엔지니어링 분야 : 취창업을 한다면? 인턴활동경험이 핵심 (Hadoop,Kafka,Docker,Kubernetes)

  • 플러터 앱/웹/IOS/Android 모두 한방에 가능

  • AI 발전 따라가기 : AI동향 자료, 논문스터디

  • 분석가 - 시각화 | 엔지니어 - 백엔드,파이프라인 | 사이언티스트 - 시각화 + 모델 + 백엔드

Data-Centric AI : 모델을 고정한 채로 데이터의 퀄리티를 높여서 좋은 결과를 만들어내는 것

Data Manager : 데이터 관리 < 라벨링 관점, 데이터 보존 및 폐기 관점 > , AutoML로 하이퍼파라미터 튜닝만 하고 데이터 관리만으로 성능에 큰 영향을 준다.


공부해야할 우선 순위
0. 인공지능
1. AWS
2. 도커 & 쿠버네티스
3. Kafka, Hadoop

profile
AI가 재밌는 걸

0개의 댓글