제목을 머신러닝이라고 해야할까... 딥러닝이라고 해야할까... 고민했다. 머신러닝이 더 광의의 개념이니 리스크를 줄이는 쪽을 택했다.
오늘은 글을 쓰는데 GPT를 처음 활용해봤다. 항상 내가 직접 글을 쓰는걸 선호하는데, 지금 적는 글은 단순 요약과 복습에 가까우니 GPT를 믿어보자.
아래의 글은 나의 노트를 GPT가 요약한 것을 바탕으로 했다.
기술적 본질에 매몰되지 말고 산업 문제를 중심으로 접근해야 함.
개발자는 변화하는 시장에서 문제 도출 및 해결 사례를 만들어내는 데 주력해야 함.
역시 질문을 잘 하는게 중요하구나싶다. 일을 줄이고 싶어서 GPT를 사용하는데, GPT를 사용할때도 일을 줄이고 싶은 마음으로 대충 질문하면 요약도 대충 나오는 것 같다. 쩝...
오늘 학습한 내용중에 흥미로운건 인공지능 분야에서 말하는 모델의 실체를 알았다는 것이다. 모델은 학습이 끝난 가중치 값들의 덤프파일로 이해해도 충분할 듯 하다.
그리고 학습된 모델들은 hugging face라는 사이트에 올라와있었다. ai 모델계의 가히 깃허브라고 할 수 있다.
huggingface: https://huggingface.co/models
AI모델을 이용해 서비스를 개발한다는건 내가 인식한 문제해결을 위해 어떤 Task가 필요한지 도출하고, 어떤 모델이 해당 Task를 잘 지원하는지를 찾아내 최적의 모델들을 이용해 서비스를 개발한다는 의미었다.
딥러닝 신경망의 동작원리도 간략하게 배웠는데, 따로 정리할 만한 수준으로 내가 이해했다고 생각하진 않는다. 다만 convolutional backbone이나 head같은 용어에 조금 익숙해졌다. tasks는 input과 head의 조합으로 이해할 수도 있다.
왜 최근 브로드컴이 만드는 xpu가 선형대수 연산에 최적화된 방식으로 만들어지는지도 대강 알 듯 하다. 신경망의 모습을 보니 학습과 추론이 모두 행렬곱을 기반으로한 연산이 주를 이루는 것 같았다.
선형변환을 행렬로 표현할 수 있다는건 기하학적으로 이해하는게 훨씬 나은 것 같다. 이런 걸 볼때마다 이해라는게 뭔지 가늠이 안된다. 공간에서 자유롭게 사고할 수 있을때 이해했다고 하는게 맞지 않을까? 난 그냥 수식만 외는 수준이다.