
지난 4월, 10대 소년이 Chatgpt가 가르쳐준 방법으로 스스롤 목숨을 끊은 사건이 전세계적으로 알려져, 충격을 주고 있다. 이전부터 AI 윤리적 이슈들에 대한 논의는 끊임없이 이어지고 있었다. 이러한 사건들이 반복되지 않기 위해서 AI 산업에서는 기술적인 개선과

HALO FrameworkHigh-level : Planning agentMid-level : role-design agentsLow-level : inference agent → Workflow search engine (subtask execution with Mo
오늘은 같이 프로젝트를 했던 팀들과 AI Festa를 다녀왔다. AI를 다루는 대부분의 기업들이 모두 참석한 행사인만큼 볼거리가 정말 풍성했다. 팀원들과 AI 현재 동향도 살펴보고, 나름 우리가 공부했던 눈(?)을 바탕으로 비교도 해보고 재미난 시간을 보냈다 ☺️ 지금

드디어 최종 프로젝트를 끝으로, 6개월 간의 AI 캠프의 여정이 끝났다. 6개월이라는 길고도 짧은 시간에 정말 많은 부분을 배우고, 개발자로서 한층 성장된 나 자신을 마주할 수 있었다. 이번 마지막 회고는 2개월 간의 최종 프로젝트 기간 동안 기획부터 발표 준비까지 모

Introduction 저번주에 CNN에 대해 처음 접하게 되었다. 그 전까지는 NLP(자연어 처리)모델들을 배우다보니 이번 이론들은 꽤나 새롭고 흥미로웠다. 더 깊게 들어가면 분명 어려운 부분도 있지만, AI가 이미지를 파악하는 것이 얼마나 어려운지를 알게 되었다.

PEFT(Parameter Effficient Fine-Tuning) 배경: 1,750억 개의 학습 가능한 파라미터가 있는 GPT-3에서는 full-finetuning 방식을 활용하기엔 시간적 혹은 비용적 측면에서 힘들어지고 있다. 이에 많은 사람들이 일부 파라미터만
Runnable Sequence 1. RunnableLambda함수 2. RunnablePassthrough 1) 앞 Runnable이 처리한 결과를 다음 Runnable에 그대로 전달 2) RunnablePassthrough에서 그대로 전달하는 게 아닌 값을 추

Transformer는 Attention 메커니즘을 활용한 모델로, 병렬처리가 가능하고 긴 문맥을 잘 반영할 수 있다는 점에서 RNN/LSTM을 대체하는 대표적인 모델입니다. 본 포스트에서는 Encoder-Decoder 구조를 중심으로 Transformer의 핵심 구성

GRU(Gated Recurrent Unit)는 LSTM의 장점을 유지하면서 더 단순한 구조로 만든 순환 신경망(RNN) LSTM의 핵심 기능인 장기 기억 유지는 그대로 가져오되, 내부 구조를 더 간소화해서 연산량을 줄이고 학습 속도를 개선LSTM에서 사용되던 3개의

RNN은 이전 시점의 정보를 현재 시점으로 전달하며 시퀀스 정보를 처리하는 모델이에요! 하지만 아래와 같은 심각한 한계점이 존재합니다.RNN은 시퀀스가 길어질수록 역전파 과정에서 기울기(gradient)가 점점 작아지는 문제가 생깁니다.특히 RNN에서 사용하는 활성 함

: Sequential data(순서가 있는 데이터) 의 특성을 추출하는데 좋은 성능을 보이는 Recurrent Layer를 Feature Extractor로 사용하는 딥러닝 모델. RNN은 순서대로 입력되는 데이터를 반복 처리하는 Recurrent Layer를 이

Encoder-Decoder 구조를 RNN 계열에 적용한 모델.Encoder: 입력 Sequence의 전체 의미(특징)을 표현하는 context vector를 출력Decoder: Encoder가 출력한 Context Vector를 입력받아 결과 sequence를 생성S

순식간에 머신러닝을 다 배우고, 지난 금요일에 딥러닝을 나가기 시작했다. 그래도 머신러닝에서 배웠던 선형회귀 모델과 loss 함수 등을 배워서 이해하는데 큰 어려움이 있진 않았다. 예측 모델을 만드는 과정은 생각보다 정해져 있다보니, 어떻게 오차를 줄일 것인가, 혹은

이번 주간은 드디어 벚꽃이 만개함과 동시에 첫 프로젝트를 시작하게 되었다. 비전공자로서 팀에서 최소한 1만큼은 하고 싶다는 마인드로 최선을 다하고 싶었다. 아무래도 이제 막 파이썬과 SQL을 공부했던 터라 지금까지 배운 것들을 한번에 적용해서 프로젝트를 만들어낼 수 있