profile
https://github.com/naem1023

[프로그래머스] 징검다리

https://taesan94.tistory.com/154https://deok2kim.tistory.com/122

3일 전
·
1개의 댓글

부스트캠프 AI Tech 2기 11주차 학습정리

개인 대회 회고글: https://velog.io/@naem1023/Relation-Extraction-%ED%9A%8C%EA%B3%A0대회 준비를 위한 server, wandb 등의 environment 세팅모델 정의모델 커스텀 및 실험실험 재현리더보드 제출

3일 전
·
0개의 댓글

[프로그래머스] 구명보트

https://programmers.co.kr/learn/courses/30/lessons/42885문제의 제한 조건을 잘 읽자. 한 번에 2명밖에 타지 못하는 조건을 못 읽고 시간 낭비를 많이 했다. 하나의 보트에에 2명만 탈 수 있을 때 가장 효율적인 방법

4일 전
·
2개의 댓글

[프로그래머스] H-index

https://programmers.co.kr/learn/courses/30/lessons/42747문제에서 서술한 바를 코딩으로 옮기는 발상이 어려웠다."h번 이상 인용된 논문이 h편 이상이고, 나머지 논문이 h번 이하 인용"을 코드로 옮기면 되는 구현 문제

4일 전
·
1개의 댓글

[프로그래머스] 위장

https://programmers.co.kr/learn/courses/30/lessons/42578cloth 종류에 대한 경우의 수를 계산해야하는 문제이다. cloth의 종류는 clothes 리스트 요소들의 1번째 인자에 저장돼있기 때문에 해당 인자들을 기준

4일 전
·
1개의 댓글

[프로그래머스] 전화번호부

https://programmers.co.kr/learn/courses/30/lessons/42577해쉬문제였는데 정렬, 인덱스 비교로 해결이 됐다. phonebook 리스트를 정렬i, i + 1번째 전화번호를 비교한다. i가 head라는 가정하에 i+1의 앞

4일 전
·
1개의 댓글
post-thumbnail

QA with Phrase Retrieval

Error propagationReader가 아무리 뛰어나도 Retreiver가 제대로 된 context를 전달하지 못한다면 전체 프로세스의 성능이 떨어진다.Query-dependent encdoingquery에 따라 answer span의 encoding이 달라진다.

5일 전
·
0개의 댓글

[프로그래머스] 입국심사

https://programmers.co.kr/learn/courses/30/lessons/43238구현 문제로 접근하면 n이 너무 커서 풀 수 없다. 문제의 답은 최소한의 time cost를 묻고 있으므로 time cost를 기반으로 수용 가능한 인원을 정의

6일 전
·
5개의 댓글

Negative in-batch

query batch는 기존대로 유지한다. passage batch가 달라진다.1개의 positive passage와 batch_size개의 negative passage로 총 batch_szie + 1 개의 데이터로 하나의 batch를 구성한다.passage batc

2021년 10월 18일
·
0개의 댓글
post-thumbnail

Reducing Training Bias

Bias는 지양대상이 아니다. 하지만 일부 bias로 인해 모델의 성능에 악영향을 끼치는 경우가 있고, 이러한 bias issue는 해결해야 한다.ML/DLinductive bias(ref)학습 시에는 만나보지 않았던 상황에 대하여 정확한 예측을 하기 위해 사용하는 추

2021년 10월 18일
·
0개의 댓글
post-thumbnail

Linking MRC and Retrieval

앞선 Passage retrieval과 다르게 웹 전체, 혹은 위키피디아 전체와 같이 광범위한 Domain에서 Passage retrieval을 수행해야 한다. Context가 따로 주어지지 않는다. World Knowledge에 기반해서 QA 진행Modern sear

2021년 10월 17일
·
0개의 댓글
post-thumbnail

Passage Retrieval - Scaling up

Passage retrieal and Similarity Search Approximating Similiarity Search FAISS

2021년 10월 17일
·
0개의 댓글

부스트캠프 AI Tech 2기 11주차 학습정리

개인 대회 회고글: https://velog.io/@naem1023/Relation-Extraction-%ED%9A%8C%EA%B3%A0대회 준비를 위한 server, wandb 등의 environment 세팅모델 정의모델 커스텀 및 실험실험 재현리더보드 제출

2021년 10월 15일
·
0개의 댓글
post-thumbnail

Dense Embedding

Passage Embedding 중 Spare Embedding은 보통 90% 이상의 벡터값들이 0이다.차원의 수가 매우 크다.compressed format으로 극복 가능유사성을 고려하지 못한다.매우 유사한 단어라도, character가 달라지면 전혀 다른 차원으로

2021년 10월 14일
·
0개의 댓글
post-thumbnail

Passage Retrieval

Passage Retrieval query에 맞는 문서(Passage)를 검색(Retrieval)하는 것.

2021년 10월 13일
·
0개의 댓글

[백준] 2048 (Easy)

우리가 흔히 아는 그 게임이다. 다만 제약조건이 추가된다.한 번의 이동에서 이미 합쳐진 블록은 다시 못 합침3개 이상의 블럭이 합쳐질 수 있다면, 이동하는 방향에 가장 가까운 것들부터 합친다.e.g., 위로 이동하는거면 위에 것들부터합치는 아이디어 자체는 쉽게 도출 가

2021년 10월 13일
·
1개의 댓글
post-thumbnail

Generation-based MRC

context와 question을 보고 답변을 생성하는 task.Extraction-based MRC가 context의 token별로 정답 확률을 추출했다면, Genration-based는 이름처럼 Generation task다.즉, Extraction-based MR

2021년 10월 13일
·
0개의 댓글
post-thumbnail

Extraction-Based MRC

질문의 답변이 항상 주어진 지문(context)내에 span으로 존재.답변을 생성하지 않고 답변을 context에서 찾는 것으로 문제를 좁힐 수 있다.e.g.,) SQuAD, KorQuAD, NewsQA, Natural Questions이러한 dataset들은 Hugg

2021년 10월 13일
·
1개의 댓글
post-thumbnail

최신 모델

기존의 모델들의 문제점BERT MASK 토큰을 독립적으로 예측하기 때문에 Token 사이의 관계 학습이 불가능Embedding length의 한계로 Segment간 관계 학습 불가능GPT단일 방향성으로만 학습이러한 한계를 극복하고자 XLNet이 등장한다.512 toke

2021년 10월 13일
·
0개의 댓글
post-thumbnail

GPT 언어 모델

BERT: embedding 모델Transformer encoder 사용GPT: 생성 모델Transformer decoder 사용일반적으로 배웠던 Language model의 언어 생성 과정과 동일하다. 순차적으로 다음에 올 가장 적절한 단어들을 확률적으로 예측한다.G

2021년 10월 12일
·
0개의 댓글