이전 포스트에서 기존 모델(LSTM + FC Layer)에서 입력에 이전 날의 상추 무게를 concat하여 모델 개선을 이루어냈다. 이번에는 transformer 모델로 변경하여 학습을 시켜보려 한다.항상 hugging face를 통해 BERT와 같은 모델을 사용했었지
대회 링크: https://dacon.io/competitions/official/236033/overview/description이전 학습 결과를 보면 제대로 학습이 되지 않는 문제가 발생했다. 그 때 써놓았던 문제점을 해소하기 위해 먼저 데이터셋의 구성을
대회 링크: https://dacon.io/competitions/official/236033/overview/descriptionbaseline 코드를 몇 번 돌려보고 내 생각대로 더 좋은 방법으로 개선시켜, 학습시켜본 결과 다음과 같은 결과를 얻었다.(ba
dacon에 현재 열려 있는 "상추의 생육 환경 생성 AI 경진대회"를 준비해보려 한다.먼저 baseline 코드를 그대로 써보고 이를 해석한 것을 쓴다.출처: https://dacon.io/competitions/official/236033/codeshare
가끔 vscode를 사용하다보면 install을 완료했는데도 reportMissingImports 노란 밑줄 경고(pylance)가 나오는 경우가 있다. 이럴 때는 이 방법을 사용하면 웬만하면 해결되는 듯하다. 1) Ctrl + Shift + P을 통해
nohup은 server에서 파일을 실행할 때 백그라운드에서 계속 실행하게 해주는 유용한 녀석이다. 컴퓨터를 끄더라도 여러 개의 명령어를 sequential하게 실행해주니 매우 편리하다. 일단 사용방법은 다음과 같다.먼저 실행할 파일을 만들어준다.편집기를 통해 연 sh
한 번 접속하면 계속 vscode에서 ssh 접속이 되기에 잘 이용하진 않지만 다시 할 때 헷갈려서 이렇게 기록한다. 먼저 vscode와 연결할 서버에 다음과 같이 입력하여 비밀번호를 설정한다.위의 사진 처럼 명령어를 입력한 후 원하는 비밀번호를 두 번 입력하면 된다.
Transfomer의 논문 제목 "Attention is all you need"에서 볼 수 있듯이 Transformer는 Seq2Seq with attention 모델에서 attention을 주로 사용한 모델이다.
Seq2Seq 모델은 RNN의 유형 중 many to many를 사용하는 모델이다.attention은 RNN이 가진 문제(인코더의 끝단에 갈수록 병목 현상 및 정보 손실 문제)를 해결하기 위해 나온 idea이다. many to many model은 그림에서 볼 수 있듯
ndarray object의 메모리 크기 반환array의 크기를 변경, element의 갯수는 동일reshape의 변수로 -1을 입력하면, 다른 숫자에 맞춰 자동으로 reshape됨다차원 array를 1차원 array로 변환list와 달리 행과 열 부분을 나눠서 sli
정규식 연습장(http://www.regexr.com/)에서 연습 가능문자 클래스 \[]: \[]의 문자들과 매치메타 문자전화 번호IP 주소이메일주민등록번호search() 함수: 한 개만 찾기findall() 함수: 전체 찾기주어진 url의 html에서 htt
로그를 남길 때 프로그램이 실행되는 동안 일어나는 정보 기록 유저의 접근, Exception, 특정 함수 사용 기록 Console 화면에 출력, 파일에 남기기, DB에 남기기 기록된 로그를 분석하여 의미있는 결과를 도출할 가능성이 있을 때 실행 시점에 남겨야 의미가 있
함수 내에서 선언된 변수는 기존에 그 변수가 존재하더라도 영향을 끼치지 않는다.위의 예시처럼 f() 함수에 변수 a가 새로 선언되었더라도 기존 변수 a에 영향을 끼치지 않는다.하지만 함수 내에서 전역 변수의 값을 변경시키고 싶을 때가 있을 수 있다. 그럴 땐 globa
is 연산자는 메모리 주소를 비교하는 연산자입니다.그렇기에 a = b라고 선언하지 않는 한 a is b는 False입니다.그러나 예외도 있습니다.첫번째 경우에선 a와 b의 값이 같게 선언되어도 당연하게 둘의 메모리 주소값은 다른다는 것을 볼 수 있습니다. 그러나 두번째
cmd 환경에서 다음을 실행import A\>>> main 함수를 호출합니다.python A.py\>>> main 함수를 호출합니다.이번에는 cmd 환경에서 다음을 실행import B\>>>python B.py\>>> main 함수를 호출합니다.즉,위의 name mai
중학교 때 배웠던 지식으로 십진수를 이진수로 변환1\. 십진수를 2로 나눈다.2\. 몫을 2로 나눈다.3\. 몫이 0이 될때까지 과정2를 반복한다.4\. 위 과정을 통해 나온 나머지들을 반대로 정렬한 값이 그 십진수의 이진수 값이 된다.
str.format() 함수와 f-string은 다음과 같은 양식을 추가적으로 제공한다.:> : 오른쪽 정렬:< : 왼쪽 정렬:^ : 가운데 정렬:\*> : 오른쪽 정렬 후 \*로 채움:\*< : 왼쪽 정렬 후 \*로 채움:\*^ : 가운데 정렬 후 \*로
1. 슬라이싱(Slicing) list의 주소 값을 기반으로 부분 값을 반환 2. 리스트의 연산 concatenation (+) 연산 (*) 연산 print(A * 2) >>> ['alpha', 'beta', 'gamma', 'alpha', 'beta',