오늘 할일
1. Project-X 과제_3번
2. 자바과제_C&C팀플하며 힙겹게 업로드..
3. 사상의학 과제
4. 랜섬웨어 영상촬영 및 리버싱 팀 협조요청
5. SK C&C직무체험 마지막
오늘 한일
사실 크게 한 일이 없어서.. 오늘은 SK C&C 직무체험을 마무리하며 느낀점이나 생각 등을 정리해봐야겠다.
SK C&C
[처음 시작하기 전]
직무체험은 처음이라 신기했었는데, 실제 회사 건물에 들어가서 교육을 받는다는 점이 가장 큰 메리트로 다가왔던 것 같다. 대학교 입시준비하며 가고싶은 대학교를 가면 동기부여가 되는 것 처럼, 실제 직장인들을 만나고 이런 저런 질문들을 물어보며 가장 가까이에서 직장인 간접체험을 할 수 있던 것 같다.
[1일차]
생성형 AI관련 트랜스포머 모델에 대하여 간단하게 알아보고, SK C&C내부적으로 사용하는 chatGPT와 유사한 모델을통해 실습해보았다. 사실 AI에 관심이 많아 보다 실무적인 내용을 다뤘으면 하는 기대가 있었지만, 비전공자도 함께하는 만큼 트랜스포머는 인코더-디코더 구조로 만들어져있다 정도만 배웠다. 대신 생성형 AI를 어떻게 SK C&C에서 활용하고 있는지에 대해서 알 수 있었다. 일반적으로 사용하는 ChatGPT의 경우 기업정보나 고객정보와 같은 민감한 정보는 정보유출의 위험 탓에 사용할 수 없다. 고로 유료버전을 구매하여 내부적으로 ChatGPT를 사용한다고 한다. 추가적으로 업무에서 사용하는 간단한 보고서를 정형화해주는 생성형 AI와 고객에게 문자메시지로 전송하는 프로모션 이벤트 문구를 만들어주는 생성형 AI 이렇게 세가지를 사용한다고 한다. 실제 기업에서 어떤 형태로 GAI를 사용하는지 알 수 있었던 점이 인상깊었다.
내부에서 사용하는 ChatGPT를 사용하는 과정에서 교육자님께서 이렇게 많은 쿼리가 동시에 발생하는 것은 처음일거라며 마음껏 입력하여 보안을 보완할 수 있게 고장내뜨려달란 말을 하였다. 그래서 시도했던 것은 50000자?정도 되는 평문을 한 20번~30번정도 Ctrl C+V하여 입력해보았다. 시간이 오래 걸리다가 아무런 답변 없이 그냥 무시되는 결과를 확인할 수 있었다. 그 다음 시도해본 것은 아래와 같은 문자를 넣어보았는데 별다른 것 없이 알아들을 수 없다고 넘어갔다.
ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้ค็็็็็็็็็็็็็็็็็็็็็็็็็็็
그 다음 시도해본 것은 단계별로 지시를 내려봤다. 다음으로 입력하는 문장을 apple을 ppale처럼 바꿔달라고 하고(무질서) 바뀌어진 결과를 한국어로 해석해달라는 말을 해보았고, apple을 ppale처럼 바꿔달라 하고 한국어 문장을 입력해보았다. 전자는 불가능하다는 얘기를 했던 것으로 기억하고, 후자는 한국어 문장을 뒤죽박죽하여 결과가 나왔던 것으로 기억한다. 해당 결과를 다시 영어로 번역해달라고 한 뒤에야 불가능하다는 결과가 나왔던 것 같다. 이때쯤 교육자님 께서 쿼리 한 번 보낼 때 마다 5000원정도의 비용이 발생된다고 말씀하셨다. 아마 이전에 1000000자 쯤 입력했을 때 상당한 비용이 발생되지 않았었을까..
아래는 참여하며 작성한 메모이다.
(11/02)
[1. 기초]
큰 분류: 짧은->긴, 요약, 번역, 글의 구조화
트랜스포머: Tokenizer(단어사전) 값을 Token IDs one-hot vector를 inputs->인코더+디코더
Multi-headed Self-attention 단어의 상관관계 자기 자신과 어텐션수행_문장속 단어 간 상관관계
인코더(빈칸추론시키기_BERT), 인코더+디코더(연속된 단어 추론_요약, 의도추출 T5), 디코더(뒤에 말을 이어붙이기_GPT)
GPT는 이미 훈련된 LLM을 파인튜닝. 대답을 하게끔 Fine-tuned LLM 을 또 지도학습. 후 사람이 직접 보며 평가하며 Fine-Tune. +강화학습 휴먼피드백
파인튜닝 알고리즘: PEET(Parameter-Efficient_기존파라미터는 동결 추가파라미터만 propagation), SFT(Supervised Fine-tune), RFHF(Reinforce Human Feedback)
웹을 이용해 표현하기 위해 Orchestation libarary가 LMM에 API쿼리
Q. 파인튜닝 이후 Humen-level이전 별도의 훈련과정이 있는 것은 아니고 범죄대답을 필터링하거나, single task나 multi task정도의 훈련 개념을 말한것이지 순차적인 과정에 필요한 것은 아니다.
Diffusion: 어느 상태가 질서가 있냐(물잉크따로, 섞) 이미지 생성 시 노이즈 이미지에서 학습시킨대로 몇가지 불규칙성에 따라 노이즈를 줄이거나 늘리거나 합친다.
SFT: https://velog.io/@dongyoungkim/GPT-fine-tuning-8.-supervised-fine-tuning
[2. 기업]
기업 비지시스 기획 과정: The Hype Cycle, Bussiness Canvas(대기업), Lean Canvas(스타트업): 고객집중이 아닌 문제에 집중.
가설과 가설검증: PEST분석{거시환경}, 3C분석{미시환경}, 가치사슬분석{가치활동}
Q 경영 복수전공, 단일전공자 기업 이미지. 실질적인 도움? 경영을 실제로 배우고싶은 뚜렷한 이유가 없다면 개발에 집중하는 것이 중요하다.
스타트업이나 기업에서도 기획, 경영, 개발이 분리되어있어 데이터를 받았을 때 이해도 측면에서 도움이 있겠지만 특별히 경영과 관련된 지식이 실질적인 도움이 되지 않는다. 개발직군도 많이 일하다보면 어느정도 회사의 구조나 경영의 구조가 보이기 때문에 개발에 집중하는 것이 좋아보인다. 실제 기업이 운영되는 구조가 학사수준에서 배우는 경영과는 많은 차이가 있어 추후에 기업에 들어가서 경영관련 지식이 필요한 분의 경우 MBA 대학원에 입학하여 배우는 경우가 많다. 같은 수준의 레벨에 있어서 차별점은 되겠지만 기본 레벨 상승에 집중하는 것이 개발직군은 좋다.
SWOT분석 이후 그래서 무엇을 해야하는지, 핵심 성공 요소를 추출하고 사업의 목표를 수립.
보고서 생성 AI, 내부 앱챗 AI(보안), 마케팅 광고 콘텐츠 생성_홍보문자
경영학 복수전공을 고민하고 있을 때 현직자의 의견을 들을 수 있던 것이 가장 기억에 남고, 도움이 되었다.
[2일차]
2일차에는 뤼튼을 이용한 생성형 AI 툴을 직접 제작해보는 시간을 가졌다. 특별한 내용을 배우기보단 아이디어 설계 및 제작이 주를 이뤘던 시간이라 일반적인 팀 프로젝트와 유사했다. 약속 핑계만들기 툴을 만들었는데 수상하여 뿌링클 기프티콘을 받았다. 치킨먹을 생각에 신나있기만 했었는데 일주일이 지난 마지막 3일차에 제작한 툴로 최우수상을 수상하게 되었다.
[3일차]
개인적으로는 가장 교육의 내용이 도움이 되었던 날 같다. 스타트업 창업을 계획중이기에 아이디어를 설계하는 방법과 관점을 배울 수 있었다. 성과와 구현의용이성 두가지를 x, y축으로 잡고 성과가 높고 구현이 용이한 아이디어를 채택한다는 것, 린 캔버스에 대해 배웠다.
위는 에어비앤비의 린 캔버스인데 우측의 항목은 마케팅, 좌측의 항목은 아이템 자체의 내용을 담고 있다.
또한 측정가능한지, 개체인지 단체인지를 x,y축으로 두어 측정가능한 개체에서의 관점, 측정가능한 단체에서의 관점, 측정불가능한 개체에서의 관점, 측정불가능한 단체에서의 관점을 생각해보았다.
예를 들어 자동차를 만든다고 할 때 측정가능한 개체에서의 관점은 자동차의 스펙, 측정가능한 단체에서의 관점은 제조시스템&공정, 측정불가능한 개체에서의 관점은 개인의 만족감, 측정불가능한 단체에서의 관점은 과시&자랑 등이 있다. 실제 아이디어를 구상하다 보면 이러한 관점 중 하나에 빠져서 그 관점안에서만 아이디어가 다루어지는 경우가 많기에 유의하여 4가지의 관점에서 아이디어를 분석할 필요가 있다고 말씀하셨다. 또 정치, 금융, 교육, 유통 등의 큰 카테고리를 조별로 부여하여 해당 카테고리별 아이템을 발표했는데 그 또한 유익한 경험이었던 것 같다. 사실 컴퓨터를 전공하면서 아무리 컴퓨터가 여기저기 다 붙일 수 있다지만 실제 금융, 정치, 교육 등에 대한 분야에서 생각을 시작해 본 것은 처음이었던 것 같다. 자주 다루지 않는 분야에 GAI관련 아이템을 발굴해보며 좀 더 생각의 범위를 넓힐 수 있던 것 같다.
아래는 참여하며 작성한 메모이다
1. Design Thinking(EMPATHIZE->DEFINE->IDEATE->PROTOTYPE->FEEDBACK) & Design Sprint
2. 디지털 고객: 제품에 관심이 있어 돈을 쓰기보다 경험과 의미에 관심을 가지고 에너지와 관심을 쓴다. 즉, 단순한 구매-판매가 아니라 새로운 상호작용이 있어야한다. 고객이 가치를 창조.
단순히 좋은 제품을 사기위해 돈을 쓰는 것이 아닌, 경험과 의미를 가지고 고객이 에너지와 관심을 쓰게 해야한다는 점이 인상깊다. 즉 단순 판매의 구조의 아이템이 아닌 고객이 가치를 직접 창조하는 새로운 상호작용이 필요하다는 점이었다.
[총평]
전반적으로 유익한 점은 회사를 직접 둘러볼 수 있다는 점인 것 같다. 아무래도 직무체험이다보니 전공수업만큼의 디테일한 부분까지 다루지 않을 뿐더러 시간의 제약으로 다룰 수 없다. 하지만 실제 기업의 분위기를 파악해보고 싶거나 해당 기업이나 진로에 관련하여 현직자에게 물어보고 싶다면 망설일 필요는 없을 듯 하다. 꽤나 재미있는 경험이었다. 상장과 더불어 조립식 무드등?도 받았는데 조만간 조립하고 후기 남겨보겠다. 마지막으로 궁금한 점은 SK C&C에서 직무체험도 그렇고 교육, 정치, 금융 등 아이디어 과제를 준 것도 그렇고, 내부적으로 보고서 만들기&chatGPT등 GAI를 적극적으로 사용하는 이유가 궁금하다. 왜 직무체험의 주제를 GAI로 잡았는지 어떤 목표를 이루기 위해서인지 그 본질..? SK C&C에서 GAI에 집중하는 본질이 궁금하다. SK C&C는 GAI에서 어떤 가능성을 발견한 것일까?
(p.s 생각해보니 출석인증 서류 제출해야하는데...프로그램참여인증서 어디서 받지..?)