SKN10-8-1

최수헌·2025년 2월 24일
post-thumbnail

오늘은 Vision 배우는 날~

이미지 전처리

이미지는 애초에 0~255의 숫자로 표현되어있기 때문에 전처리가 그렇게 많이 필요하진 않음.
데이터 스케일링 정도가 필요할 것 같음.

형태학적 이미지 전처리

  • Dilation(확장): 이미지에서 객체의 경계에 픽셀을 추가합니다.
  • Erosion(침식): 이미지에서 객체 경계에서 픽셀을 제거합니다.

말로만 들어보니까 어려운 단어 있어서 쉽지 않아보이는데 그림으로 보면 이해되긴함.

이미지 매트릭스에서 어떤 일정한 크기의 박스를 이동시키면서 박스내에 있는 요소에 대해 어떤 연산을 하는거임.

위 이미지는 Erosion(침식)에 대한 예제임.
2*2 박스내에 1만 있으면 1로 치환하고, 0이 하나라도 있다면 0으로 치환함.
Dilation(확장)은 반대로 진행하는 거임.
이런 느낌으로 어떤 단위 픽셀(커널)에서 각각 연산하여 전체 이미지를 순회하는 거임.

가우시안 블러 이미지 전처리

위에서 설명한 원리와 똑같음.
가우시안 블러를 따르는 커널이 이미지를 순회하며 연산하여 이미지의 경계를 완만하게 만듦.

Edge Detection 이미지 전처리

위에서 설명한 원리와 똑같음.
이미지의 경계를 추출할 수 있는 커널이 이미지를 순회하며 연산하여 이미지의 경계를 완만하게 만듦.

CNN(Convolution Neural Network)

대충 알고 있는 부분이기 때문에 설명 안적을래.

나머지는 강의자료 보기~

잡다

비전 데이터 셋을 구할 때, jpg보다는 png로 구하는 것이 좋긴하다.
jpg는 이미지 화소 표현이 1600만까지 압축된다.
그런데 요즘 카메라들은 1600만은 그냥 넘는다.
따라서 jpg는 데이터가 상대적으로 적다는 것이다.
반면에 png는 1600만 화소가 넘는 이미지를 저장할 수 있는 압축형식이고,
심지어 RGBA로 이미지의 투명도까지 저장하고 있음.
따라서 jpg보다 png가 담고 있는 데이터가 더 많기 때문에 할 수 있다면 png로 이미지 데이터셋을 구축하는 것이 좋다.

0개의 댓글