시리즈

온디바이스LLM

1.로컬 LLM다루기 - 라마 윈도우 PC설치

그동안 업무를 진행하면서 ChatGPT 없이는 살 수 없는 몸이 되어버렸는데최악의 상황이 발생해 버렸다.온라인 ChatGPT 서비스가 접속이 안되는 현 상황에 대한 대처를 위해온 디바이스 LLM 서비스를 구축하고자 한다.https://ollama.com/dow

2024년 12월 12일

2.도커 설치를 위한 WSL 설정

도커 설치를 위한 윈도우 세팅 Docker을 설치하려면 윈도우 11에서 가상머신 플랫폼 등을 활성화 해야 한다. 이를 위한 내용은 아래와 같다 > Windows 기능 켜기/끄기 검색 -> Windows 기능 만 키워드 입력하면 Windows 기능 켜기/끄기 앱을

2024년 12월 14일

3.WSL환경에서 Docker : Container

1. 도커에 대한 실습 및 환경 이해 이전 포스트 : 도커 설치를 위한 WSL 설정에서 도커 설치 및 임의의 컨테이너 한두개를 실행하는 것까지 수행했다. 이제 도커 시스템에 대한 간단한 이해를 진행해보자 > docker0 Docker을 실행, 정확히는 Docke

2024년 12월 17일

4.WSL환경에서 Docker : 도커허브

1. 도커허브에서 Nginx 설치하기

2024년 12월 23일

5.도커 Portainer + 도커 살짝 개론

필자의 경우 윈도우 Docker Desktop를 사용해서 설치된 컨테이너의 관리를 GUI방식으로 수행할 수 있지만,이걸 CLI나 우분투 환경에서 관리가 용이하게 해주는 컨테이너가 따로 있는 듯 하다.Extension버전으로 먼저 설치를 해보니 대충 설치된 도커 컨테이너

2024년 12월 25일

6.LLama 모델 다운받기

라마 모델을 다운받는건Ollama설치하고이렇게 하면 된다이게 아니고 진짜 USB에 저장해서 갖고 다니는 모델을 다운받는 방법에 대해 설명하고자 한다.https://github.com/meta-llama/llama-models?tab=readme-ov-file먼

2024년 12월 26일

7.도커 컨테이너 관리 명령어 모음

https://docs.docker.com/reference/cli/docker/container/위 페이지에 나와있는 명령어를 중요도 순으로 실습하고 이를 정리하는게 본 포스트의 목적이다.먼저 실습 전 할 일로 runapp.js라는 파일과 Dockfile 파

2024년 12월 31일

8.오프라인 LLama 컨테이너 만들기

이전 포스트 LLama 모델 다운받기에서 모델을 USB로 다운받기를 완료했으니 이제 다운로드 받은 모델을 도커 컨테이너에 마운트하여 빌드하는 과정을 수행하자. 1) USBIPD-WIN 설치 https://learn.microsoft.com/ko-kr/windows/

2024년 12월 31일

9.llama.cpp로 모델변환

https://github.com/ggerganov/llama.cppC/C++ 기반의 경량화된 LLM을 실행(추론) 하는 기능을 제공하는 엔진으로 주요 수행가능한 항목은 아래와 같다.1) LLM의 Local PC 구동 지원 : llama이나 gemma 같이 로

2025년 1월 6일

10.PDF 읽는 RAG 실습하기

https://wikidocs.net/265456PDF 문서 기반 QA RAG를 설계하면서 필자가 이해가 안되는 정보를 정리하고, 응용한 내용을 기술하고자 한다.https://python.langchain.com/docs/integrations/doc

2025년 1월 7일

11.Docker Network (1/2)

1.도커 네트워킹 기술 기본적으로 리눅스 네트워크와 동일한 기술이 Docker Network에 적용됨 CNM(Container Networking Model) -> 도커 네트워크 아키텍쳐 CNM의 구조는 위와 같음

2025년 1월 10일

12.Docker - Cadvisor & 자원소비제어

구글에서 제공하고 관리하는 오픈소스 컨테이너 모니터링 도구이다.https://github.com/google/cadvisor해당 깃허브 페이지에 접속하면 설치방법에 대한 메뉴가 나오는데 윈도우 Powershell에서는 아래의 코드로 설치를 진행하면 된다.아무튼

2025년 1월 13일

13.허깅페이스에서 Gemma2모델 다운받기

https://huggingface.co/google/gemma-2-2b-it이 모델을 다운로드 받으려면 뭔가 설정을 해줘야 하는데 토큰설정이 필요하다먼저 엑세스 토큰 항목으로 들어간 뒤현재 생성한 토큰이 있다면 하나를 클릭해서 edit하자여기에서 repo에

2025년 1월 15일

14.딮식이에게 자유를 줘보자

딮식이가 MIT 라이센스로 풀리고 또 R1계열의 모델을 설계하는 레시피까지 쿨하게 공개를 하여 AI연구에 있어 개발의 가속화가 기대되고 있다.그리고 딮식이는 다른 모델 대비 중국스럽게 보안 특히 Jail Break이 잘되는 편이기도 하다.하여 이번 포스트는 딮식이를 L

2025년 2월 6일

15.llama.cpp는 자주 업데이트 하자

https://github.com/ggml-org/llama.cppllama.cpp를 사용해서 Hugging Face Checkmodel 규격을 GGUF변환해서 사용하거나 llama.cpp-cli를 이용해 LLM Serving API를 사용하는 경우에는 lla

2025년 3월 11일

16.Windsurf에 TaskMaster AI 붙이기

Cursor AI처럼 요즘 편집기에 채팅봇(Agent)가 같이 붙어서 코드 개발환경을 더 스마트하게 구축하는 것이 가능하지만아무래도 기본 Agent(LLM)성능으로는 한계가 발생한다.이 성능을 향상시키기 위해서는 역시 Tool Colling환경을 구축해야 하고, 요즘

2025년 8월 7일