※ Detection
An Assisted Diagnosis System for Detection of Early Pulmonary Nodule in Computed Tomography Images
컴퓨터 단층 촬영 영상에서 초기 폐결절 검출을 위한 보조 진단 시스템
2017년 논문, 인용수 37회 ( 21.01.11 기준 )
1. Abstract
폐 실질 조직 분할, 결절후보 감지, 특징추출(22개 기능) 및 결절 분류의 네가지 주요 섹션
앙상블 분류자 랜덤 포레스트(RF)로 SVM보다 나은 성적을 보임
→ false positive를 줄임.
→ 더큰 Area under the curve( AUC ) 획득
* Receiver Operating Characteristic ( ROC )
: 모든 임계 값에서 분류 모델의 성능을 보여주는 그래프
* Area under the curve( AUC )
: ROC 곡선 아래의 영역
: 값이 크면, 클래스를 구별하는 모델의 성능이 좋음
* 임상에서 AUC-ROC곡선이 정상/환자 구분 모델의 성능평가로 자주 사용됨
* TPR(민감도 의미) : 실제로 질병이 있을때, 검사 결과가 양성
* FPR(특이도 의미) : 실제로 질병이 없을때, 검사 결과가 음성
→ 참고자료 : bioinformaticsandme.tistory.com/328
2. Introduction
- X ray, 초음파, 양전자 방출 단층 촬영(PET) 및 컴퓨터 단층촬영(CT)으로 발견, 그중에서 CT가 가장 우수
- 진단 보조 시스템 순서
1) 폐 실질 부위를 분할하기위해 * OTSU 곡선 임계 값 방법 사용
2) spatial fuzzy C-means(SFCM) 방법으로 의심되는 폐 결절 추출
3) 무작위 포레스트 (RF) 분류기로 분류
- 원격진단에 적용시에 발생하는 정보 보안문제도 추가
* OTSU : 분류방법의 한종류. 히스토그램을 이용하여 최적의 임계값을 찾아서 분류 ( bskyvision.com/49 )
3. Related works
1) 모양이랑 질감을 이용해서 늑막근처의 결절을 90% 발견 By Taşcı, E. et al
2) 디지털화된 X-ray로 2-level ANN 을 이용하여 89~96%의 민감도 By Penedo MGEt
3) false negative을 줄이기 위해 SVM을 기반으로 개발하여 95.31% by Akram Sheeraz et al
...
4. Materials
LIDC 데이터 이용
→ 80명의 환자, 폐 결절 없는 이미지 제외한 20~100 CT 이미지
→ 폐 결절 : 평균 2.5mm, 1.3~3.0mm크기
→ wellcircumscribed, vascularized, juxtal-pleural and pleural-tail의 4가지 종류
→ 4명의 방사선사가 각각 검토 및 진단함
5. Methods
계산 속도와 검출 정확도를 고려하여 폐 조직 segmentation, 폐결절 후보 detection, 특징추출, 폐 결절 분류을 수행
1) Pulmonary parenchyma segmentation / 폐 조직 segmentation
- 2D OTSU curve threshold segmentation 방법, 유클리드 거리를 이용하여 폐를 segmentation함. ( ※ 이해가 좀 안됨 )
→ 2D OTSU curve threshold segmentation 방법을 이용하면, 노이즈 제거에 효과적 및 폐 조직 찾기 쉬움
2) Pulmonary nodule candidate detection / 폐 결절 후보 detection
- SFCM 알고리즘과 형태학을 이용하여 폐 결절과 조직내 혈관을 분류
- 혈관모양과 폐결절 모양이 유사해서 문제 발생
→ 인접한 결절과 혈관의 차이로 혈관을 강조해서 data를 이용함
3) Feature extraction and classifiers
- 실제 결절과 false positive의 질감과 모양이 다름
- 모든 결절 후보들의 질감과 형상 특징을 22개 추출 ( 13개의 질감, 9개의 형상 )
→ 이를 이용해서 data augmentation( translation, rotation, scale, mirror )에서도 불변성을 유지하는 7개 특징을 추출
- RF로 여러개의 의사결정 트리로 분류함
- 20개 이상의 트리가 있는 RF에서 92%이상의 정확도를 얻음
- 36개 트리에서 최적의 정확도
* data augmentation : 한정된 data를 늘리기 위해 사용
* 앙상블 분류기 : 여러개의 알고리즘을 사용하여 예측을 결합하여 정확한 예측을 도출하는것
* SFCM 방법: fuzzy C-means 알고리즘의 공간버전, 비지도 학습, soft clustering의 한종류로 여러군집에 속할 수 있음. 군집에 속할 가능성, 확률 제시 ( github.com/arranger1044/SFCM )* 의사결정 나무 : 분류와 회귀 모두 가능한 지도학습 모델, 분류 기준을 설정한 후에 데이터를 예측하여 규칙 찾음
6. Experiments and results
장비 : PC(Windows, Quad-core 2.5GHz, 2GB) matlab2014, LIDC의 80개 CT의 6400장,
4명의 방사선사가 표시한 978개 결절
1) 폐졀절 후보 검출 방법 평가
- 888개의 실제 폐결절 + 11,379개의 거짓 폐결절 발견
- 실제 방사선사는 83.2%~ 94.99%의 재현율을 가지며, 본 논문은 재현율로 성능평가해서 90.8%
➔ 방사선사와 유사한 성능, 더 높은 민감도(실제로 질병이 있을때, 검사 결과가 양성)
* 재현율 : 실제 True인 것중에서 모델이 True라고 예측한것 (관련링크 : sumniya.tistory.com/26)
2) 실제 결절 식별 성능 평가
- 본 연구에서의 36개 트리의 RF 알고리즘과 SVM, BP을 100번의 10 fold Cross-Validation으로 비교
- RP가 BP보다 모든 항목에서 나음, SVM보다 민감도가 높아서 양성 검체의 누락비율이 낮아짐
- ROC에서는 SVM보다 약간 나음
* SVM : Support vector machine ( 관련링크 : eehoeskrap.tistory.com/45 )
* BP(Back propagation): 출력값에 대해 입력값의 기울기를 출력층layer에서부터 계산해서 거꾸로 전파하는것 ( 관련 링크 : ganghee-lee.tistory.com/31)
* K-fold Cross Validation : 모델을 평가하는 방법. 전체 데이터의 일부를 validation set으로 이용 (관련 링크 : 3months.tistory.com/321)
7. Discussion
- 더 작은 결절의 검출 속도를 높임
- 폐결절 분할 전에 인접한 사진의 혈관 정보를 이용하여 혈관 모양을 개선, False Ture 비율을 낮출 수 있음
- 다른 연구에 비하여 발견한 결절의 양이 많음
→ 이 논문에서 더 작은 크기의 결절을 사용했기 때문
→ 작은 결절 검출율을 높이기 위한 유의미한 작업
- 결절을 크기 범위로 나누면 더 좋은 결과를 보일 수 있고 이는 다음 스텝
- 모바일이나 고해상도 카메라 같은 하드웨어를 통해 쉽게 알고리즘을 구성하고 구현 가능
- 생체인식을 사용하는 모바일에서 가장 보안이 좋음 ( 사용자 추적 불가능 )
8. Conclusion
- 적은 수의 특징을 가진 대량의 데이터에 초점을 맞춤
- RP를 이용하여 False Ture를 줄이고, 정확도/민감도/특수성을 얻음
- 원격 의료 분야에 대중화에 기여할 수 있음
'공부 서랍장 > 논문' 카테고리의 다른 글
Live Migration of Virtual Machines (0) | 2021.06.01 |
---|---|
[논문리뷰-의료] Accurate Pulmonary Nodule Detection in Computed Tomography Images Using Deep Convolutional Neural Networks (0) | 2021.01.12 |
[의료] Pulmonary nodule 2 (0) | 2021.01.10 |
[논문] 영문논문 쉽게 번역기 돌리는 꿀팁 (3) | 2021.01.10 |
[의료] Pulmonary nodule 1 (0) | 2021.01.09 |