EDA : Exploratory Data Analysis데이터 분석은 데이터를 조사, 정리, 모델링하여 유용한 정보를 발견하고 의사결정을 돕는 과정입니다.데이터 과학과 유사하며, 통계학, 데이터 분석, 머신러닝, 데이터 마이닝 등을 포함하는 포괄적인 개념입니다.데이터
✔️ Git을 사용하면서 발생하는 각종 문제들을 계속해서 추가로 업데이트 해나갈 예정 Git이란 Git은 분산형 버전 관리 시스템 (Distributed Version Control System) 저장소가 '분산'됨 : 자신의 컴퓨터에 생성되는 로컬 저장소에 코드를 저장한 후, 이를 중앙 서버에 push할 수 있고, 다른 사람의 로컬 저장소에 저...
인공지능(AI)는 크게 두 가지로 나뉠 수 있습니다일반 AI (General AI)인간이 할 수 있는 모든 일을 할 수 있는 인공지능예) 게임을 하고, 대화를 나누고, 판단을 내릴 수 있는 AI좁은 AI (Narrow AI)특정 작업만 아주 잘하는 인공지능현재 산업계에
모든 프로그램은 컴퓨터 부품이 실행하며, 이는 성능, 용량, 그리고 비용을 결정한다.✔️ 컴퓨터구조의 큰 두 분류1\. 프로그램을 이루는 두 정보 1) 명령어 (instruction) : 컴퓨터를 동작시키는 실질적인 정보 2) 데이터 (data) : 명령어의 대
📌 컴퓨터 시스템의 일반적인 구조 📌 컴퓨터 공학 측면 자료구조와 알고리즘 📌 빅데이터 데이터베이스 모델링 실습 📌 인공지능과 알고리즘 설계 및 웹 기술 📌 리눅스 네트워크 시스템 구축 및 실습 📌 클라우드 컴퓨팅의 활용
변수 : 어떠한 값(value)을 담는 저장 공간과 그에 상응하는 이름🔻 변수 이름값(value\_의 의미를 추측할 수 있는 이름 사용변수 선언할 때 몇가지 규칙 존재영문자 혹은 \_(underscore)로 시작대소문자 구분숫자로 시작 불가특수 문자 (+,-,%,&)
✒️ 생성형 LLMs 개요 🔻Language Models 언어 모델은 자연어에 대한 확률 모델이다. vocabulary에서 만들어 낼 수 있는 특정한 단어 시퀀스가 주어졌을 때 이에 대해 확률을 계산할 수 있는 모델! 식 : $P(w1,....wk)
✒️ Understanding RAG 📌 Overview of RAG 🔻Fundamental papers in RAG ✔️ 발전과정 KNN-LM(2019) → REALM(2020) → RAG(2020) KNN-LM inference시에 explic
✒️ RAG Evaluation
현재 V2라는 폴더가 있다고 했을 때Reset : V2 폴더 삭제용량, 복잡 ↓히스토리 XRevert : V3 폴더 생성용량, 복잡 ↑ ↓히스토리, 불변 O
📌 요구사항 RAG 구조는 text split을 하고 vector organization으로 임베딩 후 vectore store에 저장한 후에 검색 후 llm 생성한 후에 유저에게 답변하는 구조. 필수 기능 API를 통해 답변이 제대로 생성되었는지 확인 LLM의 답
통계적 추론 (Statistical Inference) : 표본의 통계량으로부터 모집단의 모수를 추정하는 것모평균을 추정하기 위해서는 표본평균을 보고, 모분산을 추정하기 위해 표본분산을 활용해야함해당하는 통계량을 어떤 식으로 활용하느냐에 따라 점추정(point esti
표본공간 (sample space) : 모든 관측 데이터를 모아놓은 집합사건 (event) : 표본공간의 부분집합표본공간 S가 주어졌을 때, 확률 P는 아래의 세 조건을 만족시키는 함수를 뜻한다(positive measure) $\\forall \\underset{ev
통계적 추론 (Statistical Inference) : 표본의 통계량으로부터 모집단의 모수를 추정하는 것모평균을 추정하기 위해서는 표본평균을 보고, 모분산을 추정하기 위해 표본분산을 활용해야함해당하는 통계량을 어떤 식으로 활용하느냐에 따라 점추정(point esti
인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현하려는 컴퓨터 과학의 세부분야 중 하나정보공학 분야에 있어 하나의 인프라 기술이기도 함지능을 갖고 있는 기능을 갖춘 컴퓨터 시스템이며, 인간의 지능을 기계 등에 인공적으로 시연(구현)한 것인공지능이 발전해, 인간의
https://sincere-nova-ec6.notion.site/Fast-Up-Report-Guide-6e9ab2d757ef483ea9515e1f4b1e99b5 https://dacon.io/edu/1016/ https://dacon.io/competitions/o
✒️ 프로젝트 개요 이번에는 영화 추천 시스템을 만드는 프로젝트를 진행하게 되었다. 자동화기법을 접목하여 MLFlow, AirFlow를 사용해보는 것을 목표로 진행하는 프로젝트이다! 어떤 작품이 어떤 플랫폼에서 방영이 되는지 알려주는 시스템도 함께 제공함으로써 기존
✒️ 딥러닝 기본 개념 📌 딥러닝 발전 단계 AI/ML/DL 관점에서 크게 5단계로 개발 방법론이 진화해왔다 세 단계로 나눌 때는 SW1.0, SW2.0, SW3.0이라고도 부른다 개와 고양이를 구별하는 task가 있다고 해보자 각 단계에서 어떻게 구별을 해나가
✒️ 성능 고도화 방법 📍 과적합 📍 편향과 분산 📍 지역-전역 최소값 📍 네트워크 안정화 📍 가중치 초기화 📍 규제화 📍 학습률 📍 데이터 증강 및 그 외 방법 📌 성능 고도화 방법 실습
✒️ 기본 모델 구조들 📌 CNN 📌 RNN 📌 From AlexNet to ChatGPT
🖋️ 코드 구현
🖋️ 회고
할 때마다 까먹고할 때마다 애먹어서정리를 해야지!..^^ (진작하지 그랬니)우선! 기존 서버를 삭제 해줘야 한다.기존 contest에 들어가서 서버를 누르면 terminate / 종료 버튼이 있다.이걸 먼저 해줘야 한다.(나는 이걸 안해서 계속 bash에서 삽질만 이틀
AI 기반 버그바운티 리포트 상세정보 및 조치방안 상세화 자동 생성 시스템 개발기업 과제 이해하기 : 어떤 데이터, 프레임워크, 로직으로 개발을 수행할 것인지 전체적으로 파악보안 정보 익히기 : 어떤 종류가 있으며 어떤 데이터를 구축해서 RAG를 어떻게 설계할 것인지
(출처 : https://llm-examples.streamlit.app)streamlit은 오픈 소스 애플리케이션 프레임워크로, 몇 줄의 코드만으로 상호 작용이 가능한 데이터 애플리케이션을 만들 수 있게 해준다. 데모용으로 사용하기에 딱 적합하지 않을까 싶다
attackType으로 정보 fetch 하기vulnerabilityDetail : 취약점 설명 (이미지 포함)howToPatchDetail : 조치방안
Cyberbase-13B 모델을 아무리 시도해보아도...prompt를 아무리 수정해보아도 영어 답변에도 막 스펠링 에러가 있고 말도 안되는 일들이 계속해서 나타나고, 무엇보다 나는 지금 답변이 형식화 되어서 출력이 되어야 하는데 막 나중에는 괴상한 답변들만 내놓는 문제