# Preprocessing

29개의 포스트
post-thumbnail

결측치(Missing values, Nulls) 처리에 대해서 (Imputation): SimpleImputer, IterativeImputer, MICE ..

이번에 카카오 테크 인턴 서합을 하면서 사전과제를 받았다.지금 진행중인데.. 결측치가 굉~장히 많았다.칼럼이나 갯수를 보아하니 의도적으로 정해진 비율만큼 제거하신 모양인(,,)데이터 갯수가 워낙 많아서 그냥 결측치를 떨궈도 70퍼센트정도는 살아있다고 생각하고 결측치를

2022년 1월 10일
·
0개의 댓글

Histogram Equalization

각 픽셀의 밝기나 색깔이 얼마나 강한지 히스토그램으로 분석해서 너무 강한 픽셀은 0-255 사이의 값으로 평준화 해주는 거다. gray scale 이미지에서는 어느 정도로 밝은지, rgb이미지에서는 어떤 색이 강한지 알아볼 때도 쓸 수 있을 것 같다.

2021년 12월 29일
·
0개의 댓글
post-thumbnail

np.log1p()를 하는 이유

np.log1p()를 하는 이유

2021년 12월 19일
·
0개의 댓글
post-thumbnail

[Tensorflow] 오디오 데이터 전처리하기1(librosa, fft, log- melspectrogram)

Reference https://ichi.pro/ko/tensorflowleul-sayonghayeo-gpueseo-odioleul-swibge-cheolihaneun-bangbeob-50154769354502 https://towardsdatascience.com

2021년 12월 12일
·
0개의 댓글
post-thumbnail

Pandas Series.str.extract()

Pandas Series.str.extract()에 대해 알아보자~

2021년 11월 30일
·
0개의 댓글
post-thumbnail

Preprocessing for Korean analysis

일반적으로 KoNLPy 같은 오픈소스 형태소 분석기를 사용하지만, 형태소 분석 과정에서 잘못된 태깅으로 말뭉치 정보가 왜곡되거나 손실될 경우가 존재한다. 이러한 문제점을 보안하기 위해 다음 방법을 쓰기도 한다.단어를 띄어쓰기 기준으로 나누고 3글자까지만 잘라서, 노말라

2021년 11월 18일
·
0개의 댓글

이미지 전처리

resize 228x228로 사이즈 조정.ToTensor()로 이미지 ndarray를 tensor 형태로 변환.normalize(0.485, 0.456, 0.406, 0.229, 0.224, 0.225)이미지 전처리 1)이미지 픽셀의 평균, 표준편차를 계산해서 정규화.

2021년 10월 28일
·
0개의 댓글
post-thumbnail

Medical Image Registration - Non-rigid registration via deformable model

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 9월 14일
·
0개의 댓글
post-thumbnail

Medical Image Registration - Non-rigid registration via ICP

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 8월 31일
·
0개의 댓글
post-thumbnail

Medical Image Registration - Registration using main axis

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 8월 31일
·
0개의 댓글
post-thumbnail

Medical Image Registration - Similarity measure

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 8월 31일
·
0개의 댓글
post-thumbnail

Medical Image Segmentation - Segmentation using graph model

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 8월 24일
·
0개의 댓글
post-thumbnail

Medical Image Segmentation - Region growing / Watershed algorithm

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 8월 24일
·
0개의 댓글
post-thumbnail

Medical Image Segmentation - Morphological processing

참고: https://www.edwith.org/medical-20200327/joinLectures/30437 (컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 edwith)

2021년 8월 20일
·
0개의 댓글
post-thumbnail

(2017)Image Registration Techniques: A Survey

Image Registration Techniques: A Survey 논문 리뷰

2021년 8월 17일
·
0개의 댓글
post-thumbnail

(2019)RandAugment: Practical automated data augmentation with a reduced search space

RandAugment: Practical automated data augmentation with a reduced search space 논문 리뷰

2021년 8월 17일
·
0개의 댓글
post-thumbnail

(2019)Recommendations for Processing Head CT Data

Recommendations for Processing Head CT Data 논문 리뷰

2021년 8월 12일
·
1개의 댓글
post-thumbnail

(2014)Detection of Early Ischemic Changes in Non-contrast CT Head Improved with ‘‘Stroke Windows’’

Detection of Early Ischemic Changes in Non-contrast CT Head Improved with ‘‘Stroke Windows’’ 논문 리뷰

2021년 8월 12일
·
1개의 댓글
post-thumbnail

이미지 데이터 처리의 기본 - Pillow를 이용한 전처리

이미지 데이터 처리의 전세계(?)에서 가장 널리 쓰이는 학습용 예제가 있다. 이름하여 CIFAR-100 예제이다.(발음이 정말 시파 같다!) 예제에서 사용할 데이터는 CIFAR-100 python version데이터이다. 여기선 train 데이터만 사용할 것이다.

2021년 7월 14일
·
0개의 댓글

구간화 (Binning) - 전처리

구간화에 대해 알아보자.

2021년 7월 8일
·
0개의 댓글