profile
다음 생엔 너로 태어나 나를 사랑해야지 🌒 #ML Engineer #Python #NLP #Backend
post-thumbnail

[Paper Review] Sentence-BERT: Sentence Embedding using Siamese BERT-Networks

Intro 문장 간(혹은 문서 간) 유사도 분석에서 좋은 성능을 내고 있는 Sentence-BERT에 대해 알아보려고 한다. 논문 원제는 Sentence-BERT: Sentence Embedding using Siamese BERT-Networks이며, 최근 성능이

2021년 10월 10일
·
0개의 댓글
post-thumbnail

[Basic NLP] HuggingFace에 내 모델 포팅하기

지난 포스트(Transformers와 Tensorflow를 활용한 BERT Fine-tuning)에 이어, 이번에는 HuggingFace Model Hub에 학습된 모델을 포팅하는 방법에 소개하고자 한다.HuggingFace Model Hub는 코드 공유 저장소인 gi

2021년 8월 7일
·
0개의 댓글
post-thumbnail

[Basic NLP] Transformers와 Tensorflow를 활용한 BERT Fine-tuning

이번 포스트에서는 🤗HuggingFace의 Transformers 라이브러리와 Tensorflow를 통해 사전 학습된 BERT모델을 Fine-tuning하여 Multi-Class Text Classification을 수행하는 방법에 대해 알아보고자 한다. 특히 이번

2021년 8월 6일
·
0개의 댓글
post-thumbnail

Docker 설치 및 기본 명령어(commands)

docker service 시작sudo service docker start동작중인 컨테이너 확인docker ps정지된 컨테이너 확인docker ps -a컨테이너 삭제docker rm \[container id]복수의 컨테이너 삭제docker rm \[container

2021년 7월 18일
·
0개의 댓글
post-thumbnail

Apache Kafka(아파치 카프카)란 무엇인가?

기존 링크드인의 데이터 처리 시스템은 각 파이프라인이 파편화되고 시스템 복잡도가 높아 새로운 시스템을 확장하기 어려운 상황이였음기존 메시징 큐 시스템인 ActiveMQ를 사용했지만, 링크드인의 수많은 트래픽과 데이터를 처리하기에는 한계가 있었음이로 인해 새로운 시스템의

2021년 7월 18일
·
0개의 댓글
post-thumbnail

[Basic NLP] Transformer (Attention Is All You Need)

Intro지난 포스트인 Sequence-to-Sequence with Attention에서 sequence-to-sequence 모델의 경우 RNN 계열의 순환 신경망을 사용함으로 인해 입력 시퀀스가 길어질 수 록 하나의 Context Vector에 모든 정보를 담기

2021년 7월 18일
·
0개의 댓글
post-thumbnail

[Basic NLP] Sequence-to-Sequence with Attention

Intro최근 몇 년간 Transformer 모델의 등장 이후 BERT, GPT, RoBERTa, XLNet, ELECTRA, BART 등과 같은 언어 모델(Language Model)이 매해 새로운 SOTA를 달성하며 등장하고 있다. 특히 언어모델의 경우 self-s

2021년 7월 18일
·
0개의 댓글
post-thumbnail

[Paper Review] PEGASUS:Pre-training with Extracted Gap-sentences for Abstractive Summarization

Intro최근 NLP의 downstream tasks 중 하나인 Summarization분야에 "PEGASUS: Pre-training with Extracted Gap-sentences for Abstractive Summarization"이라는 새로운 논문(멋진 이

2021년 7월 18일
·
0개의 댓글
post-thumbnail

Basic Object-Detection

IntroInflearn의 딥러닝 컴퓨터 비전 완벽 가이드를 수강하며 공부 목적으로 정리한 글입니다.Classification(분류) : 이미지에 있는 object가 무엇인지만 판별, 위치 고려 xLocalization(발견) : object 판별 및 단 하나의 obj

2021년 7월 18일
·
0개의 댓글
post-thumbnail

LSTM Autoencoder for Anomaly Detection

Intro지난 포스팅(Autoencoder와 LSTM Autoencoder)에 이어 LSTM Autoencoder를 통해 Anomaly Detection하는 방안에 대해 소개하고자 한다. Autoencoder의 경우 보통 이미지의 생성이나 복원에 많이 사용되며 이러한

2021년 7월 18일
·
0개의 댓글
post-thumbnail

Autoencoder와 LSTM Autoencoder

Intro대표적인 자기 지도 학습인 Autoencoder와 Autoencoder에 LSTM cell을 적용해 시퀀스 학습이 가능한 LSTM Autoencoder에 대해 소개한다. 이후 다음 포스팅에는 LSTM Autoencoder를 통해 미래에 발생 할 고장이나 이상신

2021년 7월 18일
·
0개의 댓글
post-thumbnail

OpenCV를 활용한 기초 이미지 처리 with Python

Intro머신러닝 분야에서 가장 활발하게 연구 되고 있는 분야는 아무래도 컴퓨터 비전(computer vision)분야 인 것 같다. 최근 컨볼루션 네트워크 모델들은 feature extraction 능력이 매우 뛰어나서 이미지에 추가적인 전처리 작업을 하지 않더라도

2021년 7월 18일
·
0개의 댓글
post-thumbnail

Flask 웹 서버 AWS EC2에 배포하기

Intro지난 번 글에서 Flask 웹 프레임워크를 통해 간단한 딥러닝 웹 애플리케이션을 개발해보았다. 하지만 로컬(local) 환경에서 개발하였기 때문에 개발 서버를 종일 켜놓거나 고정 도메인을 따로 받지 않은 이상 외부 IP로 접근은 불가능하다. 그렇기 때문에 나처

2021년 7월 18일
·
0개의 댓글
post-thumbnail

Flask를 활용한 딥러닝 웹 애플리케이션 개발

IntroJava의 Spring처럼 Python에서도 웹 프레임워크를 제공한다. 그 중 가장 인기 있는 것이 Django와 Flask인데, Django의 경우 Instagram, LinkedIn 사이트로 사용될 정도로 인기 있고 안정적인 웹 프레임워크라고 할 수 있다.

2021년 7월 18일
·
1개의 댓글
post-thumbnail

[Paper Review] R-CNN(Regions with CNN features)

Intro오늘은 초기 Object Detection 발전에 가장 많은 영향을 미친 논문인 Ross Girshick의 Rich feature hierarchies for accurate object detection and semantic segmentation 즉, R

2021년 7월 18일
·
0개의 댓글
post-thumbnail

합성곱 신경망(ConvNet, Convolutional Neural Network)

Intro현재 ConvNet 기반의 모델은 단순 이미지 인식을 넘어 Object Detection, Semantic Segmentation 까지 딥러닝 알고리즘 중 가장 활발히 연구되고 성과를 내고 있는 분야이다. 우선 각 분야별 적용되고 있는 주요 모델을 간단히 살펴

2021년 7월 18일
·
0개의 댓글
post-thumbnail

[Kaggle] 분자 특성 예측(Predicting Molecular Properties)

Intro최근 kaggle에서 굉장히 눈에 띄는 competition이 있었으니 바로, Predicting Molecular Properties라는 이름의 대회였다. 해당 competition은 브리스톨 대학교, 카디프 대학교, 임페리얼 칼리지 및 리즈 대학교로 이루어

2021년 7월 18일
·
0개의 댓글
post-thumbnail

데이터 분석을 위한 기초 시각화 with Python

Intro데이터를 분석하려는데 데이터의 row와 columns 수가 많은 수백 차원 데이터의 경우 데이터를 파악하기가 쉽지 않다. 그렇기에 인간이 이해할 수 있는 정도의 차원으로 줄여 데이터를 개략적으로 파악하는 것이 필요하고, 역시 인간은 읽고, 듣는 것 보다는 눈으

2021년 7월 18일
·
0개의 댓글
post-thumbnail

[Kaggle] 보스턴 주택 가격 예측(House Prices: Advanced Regression Techniques)

Intro캐글의 고전적인 문제이며 머신러닝을 공부하는 사람이라면 누구나 한번쯤 다뤄봤을 Boston house price Dataset을 통해 regression하는 과정을 소개하려 한다. 정식 competition 명칭은 'House Prices: Advanced R

2021년 7월 18일
·
0개의 댓글
post-thumbnail

[Kaggle] 직소 악성 대화 분류(Jigsaw Unintended Bias in Toxicity Classification)

Intro얼마 전 캐글에서 구글 Jigsaw/Conversation AI팀에 의해 'Jigsaw Unintended Bias in Toxicity Classification'라는 주제로 competition이 개최되어 호기심에 도전해보았다. Jigsaw라는 곳을 처음

2021년 7월 18일
·
0개의 댓글