CAC-Unet 데이터셋 설명

boingboing·2024년 3월 12일

서론

  • 대장내시경 병리 검사는 작은 조직 조각에서 초기 단계 대장 종양의 세포를 찾을 수 있습니다. 병리학자들은 매일 수백 개의 조직 슬라이스를 검사해야 하는데, 이는 시간이 많이 걸리고 지치는 작업입니다. 여기에서는 전체 조직의 자동 병변 분할 및 분류(양성 대 악성)를 목표로 하는 자동 대장 내시경 조직 분할 및 스크리닝에 대한 도전 과제를 제안합니다.

Binary Mask

  • 이 데이터 세트에는 양성 샘플과 음성 샘플이 있습니다. 양성 샘플 훈련에는 93개 WSI의 250개 조직 이미지가 포함되며, 픽셀 수준 주석이 jpg 형식으로 제공되며, 여기서 0은 배경을 의미하고 255는 전경(악성 병변)을 의미합니다. 임계값 128로 바이너리 마스크를 간단히 얻을 수 있습니다. 훈련용 음성 샘플에는 231 WSI의 410개 조직 이미지가 포함되어 있습니다. 이 음성 이미지에는 악성 병변이 없기 때문에 주석이 없습니다.

기타

  • 대장내시경 병리 검사의 경우 단일 WSI에 10개 이상의 조직이 있습니다. 이 작업을 더 쉽게 하기 위해 병리과 전문의가 WSI에서 한두 개의 조직을 선택해 세그먼트 주석을 달았습니다. 또한 병리학자들이 놓칠 수 있는 소수의 악성 과립을 발견했습니다.

  • 모든 이미지의 평균 크기는 5000x5000픽셀이며, 일부는 매우 큰 이미지도 있습니다. 또한 65명 환자의 90개 이미지에 병변이 포함된 152명 환자의 212개 조직을 테스트 세트로 추가로 제공할 예정입니다. 모든 전체 슬라이드 이미지는 헤마톡실린과 에오신으로 염색하고 X20으로 스캔했습니다.

  • 이 챌린지의 데이터는 4개의 의료 센터, 특히 개발도상국/지역의 여러 소규모 센터에서 수집한 데이터이기 때문에 외형적인 측면에서 큰 차이를 보입니다. 이미지 스타일의 차이는 선별 작업에 장애물이 될 수 있습니다. 이번 챌린지를 개최하고 대량의 전문가 수준의 주석을 공개함으로써 의료 영상 커뮤니티의 많은 관심을 끌고 자동 대장내시경 검사에 대한 연구를 크게 발전시킬 수 있을 것으로 기대합니다.

  • 양성(음성)과 악성(양성)을 구분하는 기준은 매우 어렵습니다. 다시 말하지만, 학술 대회를 위해 이 작업을 더 쉽게 하기 위해 WHO 소화기 종양 분류에 따라 유두 선암종, 점액성 선암종, 응집력이 낮은 암종 및 시그넷 링 세포 암종을 포함한 고등급 상피내 신생물과 선암종을 악성 병변으로 간주합니다. 낮은 등급의 상피내종양과 심한 염증은 일반적으로 병리학자에게는 어려운 케이스입니다. 그렇다면 이 데이터 세트에는 이러한 어려운 케이스가 포함되지 않습니다. 실제 임상 진단에서 병리학자들은 더 어렵고 복잡한 상황에 직면할 수 있다는 점에 유의하세요.

Translated with DeepL.com (free version)

0개의 댓글