AI 연구 개발 단체인 오픈AI(OpenAI)에서 개발한 인간의 대화를 시뮬레이션하도록 프로그래밍된 소프트웨어로, 2022년 12월 1일 테스트 버전을 일반 공개한 챗GPT(ChatGPT) 사용자 수가 100만 명을 돌파하며 주목받고 있다.
챗GPT(ChatGPT)의 전문성은 광범위하며, 대화를 따라가는 능력은 특히 주목할만 하다.
1955년에 미국 대통령은 누구였는지와 같은 단답형 질문부터 어려운 개념을 쉽게 이해할 수 있도록 요약해 달라고도 요청할 수 있다.
단순 질문에 답하는 것은 넘어 실수도 인정할 뿐만 아니라 질문에 잘못된 전제가 있다면 거기에 대해 이의를 제기하고 부적절한 요청은 거부하는 역량도 갖췄다.
차별 및 혐오 발언으로 문제가 되면서 크게 성공하지는 못한 이전의 인공지능 챗봇과 달리 오픈AI는 이러한 유형의 스캔들을 피하기 위해 언어가 기업의 콘텐츠 정책에 위배되는지 여부를 결정토록 훈련된 AI 기반 조정시스템인 ‘모더레이션API’(Moderation API)를 사용했다. 물론 현재 정확도가 100% 있다고 보장되지는 않는다.
훈련 과정은 대충 다음과 같다. 인간 교육자는 사용자와 AI 모두에 대화 데이터를 공급하고 챗GPT가 보이는 대응을 평가하고 랭킹을 매긴다. 이들 평가를 챗봇에 다시 제공해 어떻게 대응해야 하는지 배울 수 있게 한다. 지금은 챗GPT 기술을 개선하기 위해 사용자 피드백에 의존하고 있다는게 오픈AI 설명이다.
ChatGPT는 2021년까지의 데이터를 기반으로 학습했기 때문에 기본적으로 최신 정보를 가지고 있지 않습니다. 실시간으로 정보를 찾는 것도 아니기 때문에 현재 상황에 맞는 정보를 제공할 수도 없다.
OpenAI의 GPT-3 모델을 이용하여 깃허브의 수많은 레포지토리들을 학습시키는 방식으로 개발되었다.
IDE를 열고, 파일을 만든 후 (ex. js파일) 주석을 작성하거나, function 이름(또는 method명)을 작성하면 그에 맞는 코드를 AI가 제시해준다. 만약 제시해준 코드가 마음에 들면 Tab(탭)을 누르면 된다.
아무런 목적성 없이 계속 코파일럿이 추천해주는 것들만 작성하면 계속 관련 라이브러리들만 import되지만, 적당한 시점에 개발자가 개입을 해주면 꽤 납득할만한 코드를 제시하는 것으로 보임.
코딩테스트의 알고리즘 문제들을 풀기 위해 개발된 소프트웨어로
딥러닝 기술을 사용해서 만듦. 딥러닝이란 데이터와 레이어(입력한 데이터를 분석하는 기법 ex) RNN)를 제공하여 모델을 만드는 기법
깃허브의 사용자 코드들과 트랜스포머라는 레이어를 사용하여 학습을 하고, 코드 콘테스트의 문제들과 솔루션으로 추가적으로 학습을 한다. 수많은 답안을 생성한 다음 필터링 과정을 거쳐서 가장 적합한 답안을 적는 방식임.
문제 지시문이 명확해야 정답확률이 높음
코드를 짜는 것 만큼이나 어려운 것이 요구사항 분석이다.
알파코드나 챗GPT의 개발이 잘 되더라도 요구사항을 분석할 요구사항 분석 개발자가 필요하지 않을까
챗 gpt 설명
https://www.btcc.com/ko-KR/academy/crypto-basics/what-is-chatgpt
깃허브 코파일럿
https://gomcine.tistory.com/entry/%EA%B9%83%ED%97%88%EB%B8%8C-%EC%BD%94%ED%8C%8C%EC%9D%BC%EB%9F%BFGithub-Copilot-%EC%8B%A0%EC%B2%AD-%EB%B0%8F-%EC%82%AC%EC%9A%A9%EB%B2%95