공부 서랍장/논문

[논문리뷰-의료] An Assisted Diagnosis System for Detection of Early Pulmonary Nodule in Computed Tomography Images

만땅이 2021. 1. 11. 22:24

※ Detection

An Assisted Diagnosis System for Detection of Early Pulmonary Nodule in Computed Tomography Images

컴퓨터 단층 촬영 영상에서 초기 폐결절 검출을 위한 보조 진단 시스템

2017년 논문, 인용수 37회 ( 21.01.11 기준 )

 

1. Abstract

 폐 실질 조직 분할, 결절후보 감지, 특징추출(22개 기능) 및 결절 분류의 네가지 주요 섹션

 앙상블 분류자 랜덤 포레스트(RF)로 SVM보다 나은 성적을 보임 

  → false positive를 줄임. 

  → 더큰 Area under the curve( AUC ) 획득

    * Receiver Operating Characteristic ( ROC )

       : 모든 임계 값에서 분류 모델의 성능을 보여주는 그래프 

    * Area under the curve( AUC ) 

       : ROC 곡선 아래의 영역

       : 값이 크면, 클래스를 구별하는 모델의 성능이 좋음

    * 임상에서 AUC-ROC곡선이 정상/환자 구분 모델의 성능평가로 자주 사용됨

    * TPR(민감도 의미) : 실제로 질병이 있을때, 검사 결과가 양성

    * FPR(특이도 의미) : 실제로 질병이 없을때, 검사 결과가 음성 

→ 참고자료 : bioinformaticsandme.tistory.com/328

 

2. Introduction

- X ray, 초음파, 양전자 방출 단층 촬영(PET) 및 컴퓨터 단층촬영(CT)으로 발견, 그중에서 CT가 가장 우수

- 진단 보조 시스템 순서

   1) 폐 실질 부위를 분할하기위해 * OTSU 곡선 임계 값 방법 사용

   2) spatial fuzzy C-means(SFCM) 방법으로 의심되는 폐 결절 추출

   3) 무작위 포레스트 (RF) 분류기로 분류

   - 원격진단에 적용시에 발생하는 정보 보안문제도 추가

   * OTSU : 분류방법의 한종류. 히스토그램을 이용하여 최적의 임계값을 찾아서 분류 ( bskyvision.com/49 )

 

 

3. Related works

1) 모양이랑 질감을 이용해서 늑막근처의 결절을 90% 발견 By Taşcı, E. et al

2) 디지털화된 X-ray로 2-level ANN 을 이용하여 89~96%의 민감도  By Penedo MGEt

3) false negative을 줄이기 위해 SVM을 기반으로 개발하여 95.31% by Akram Sheeraz et al 

...

4. Materials 

LIDC 데이터 이용

→ 80명의 환자, 폐 결절 없는 이미지 제외한 20~100 CT 이미지

폐 결절 : 평균 2.5mm, 1.3~3.0mm크기

wellcircumscribed, vascularized, juxtal-pleural and pleural-tail의 4가지 종류

4명의 방사선사가 각각 검토 및 진단함

 

5. Methods 

계산 속도와 검출 정확도를 고려하여 폐 조직 segmentation, 폐결절 후보 detection, 특징추출, 폐 결절 분류을 수행

 

1) Pulmonary parenchyma segmentation / 폐 조직 segmentation

- 2D OTSU curve threshold segmentation 방법, 유클리드 거리를 이용하여 폐를 segmentation함. ( ※ 이해가 좀 안됨 )

2D OTSU curve threshold segmentation 방법을 이용하면, 노이즈 제거에 효과적 및 폐 조직 찾기 쉬움

2) Pulmonary nodule candidate detection / 폐 결절 후보 detection

- SFCM 알고리즘과 형태학을 이용하여 폐 결절과 조직내 혈관을 분류

- 혈관모양과 폐결절 모양이 유사해서 문제 발생

  → 인접한 결절과 혈관의 차이로 혈관을 강조해서 data를 이용함

3) Feature extraction and classifiers

- 실제 결절과 false positive의 질감과 모양이 다름

- 모든 결절 후보들의 질감과 형상 특징을 22개 추출 ( 13개의 질감, 9개의 형상 )

  → 이를 이용해서 data augmentation( translation, rotation, scale, mirror )에서도 불변성을 유지하는 7개 특징을 추출

- RF로 여러개의 의사결정 트리로 분류함

- 20개 이상의 트리가 있는 RF에서 92%이상의 정확도를 얻음

- 36개 트리에서 최적의 정확도

 

* data augmentation : 한정된 data를 늘리기 위해 사용

 

* 앙상블 분류기 : 여러개의 알고리즘을 사용하여 예측을 결합하여 정확한 예측을 도출하는것

* SFCM 방법: fuzzy C-means 알고리즘의 공간버전, 비지도 학습, soft clustering의 한종류로 여러군집에 속할 수 있음. 군집에 속할 가능성, 확률 제시 ( github.com/arranger1044/SFCM )* 의사결정 나무 : 분류와 회귀 모두 가능한 지도학습 모델, 분류 기준을 설정한 후에 데이터를 예측하여 규칙 찾음

 

6. Experiments and results

장비 : PC(Windows, Quad-core 2.5GHz, 2GB)  matlab2014, LIDC의 80개 CT의 6400장,

        4명의 방사선사가 표시한 978개 결절

 

1) 폐졀절 후보 검출 방법 평가

- 888개의 실제 폐결절 + 11,379개의 거짓 폐결절 발견

- 실제 방사선사는 83.2%~ 94.99%의 재현율을 가지며, 본 논문은 재현율로 성능평가해서 90.8%

➔ 방사선사와 유사한 성능, 더 높은 민감도(실제로 질병이 있을때, 검사 결과가 양성)

* 재현율 : 실제 True인 것중에서 모델이 True라고 예측한것 (관련링크 : sumniya.tistory.com/26)

 

2) 실제 결절 식별 성능 평가

- 본 연구에서의 36개 트리의 RF 알고리즘과 SVM, BP을 100번의 10 fold Cross-Validation으로 비교

- RP가 BP보다 모든 항목에서 나음, SVM보다 민감도가 높아서 양성 검체의 누락비율이 낮아짐

- ROC에서는 SVM보다 약간 나음

* SVM : Support vector machine ( 관련링크 : eehoeskrap.tistory.com/45 )

* BP(Back propagation): 출력값에 대해 입력값의 기울기를 출력층layer에서부터 계산해서 거꾸로 전파하는것 ( 관련 링크 : ganghee-lee.tistory.com/31)

* K-fold Cross Validation : 모델을 평가하는 방법. 전체 데이터의 일부를 validation set으로 이용 (관련 링크 : 3months.tistory.com/321)

 

 

 

 

7. Discussion

- 더 작은 결절의 검출 속도를 높임

- 폐결절 분할 전에 인접한 사진의 혈관 정보를 이용하여 혈관 모양을 개선, False Ture 비율을 낮출 수 있음

- 다른 연구에 비하여 발견한 결절의 양이 많음

   → 이 논문에서 더 작은 크기의 결절을 사용했기 때문

   → 작은 결절 검출율을 높이기 위한 유의미한 작업

- 결절을 크기 범위로 나누면 더 좋은 결과를 보일 수 있고 이는 다음 스텝

- 모바일이나 고해상도 카메라 같은 하드웨어를 통해 쉽게 알고리즘을 구성하고 구현 가능

- 생체인식을 사용하는 모바일에서 가장 보안이 좋음 ( 사용자 추적 불가능 ) 

 

8. Conclusion

- 적은 수의 특징을 가진 대량의 데이터에 초점을 맞춤

- RP를 이용하여 False Ture를 줄이고, 정확도/민감도/특수성을 얻음

- 원격 의료 분야에 대중화에 기여할 수 있음

 

반응형