인공지능 (Deep learning)을 통한 암치료결과 예측을 통한 각 암환자에게 최적화된 암치료 연구와 기술동향
2020-12-17
org.kosen.entty.User@6261c09f
김유성(yusungkim2010)
인공지능 (AI)을 통한 암치료결과 예측
Yusung Kim, Ph.D. (김유성), yusung-kim@uiowa.com
Clinical Professor of Radiation Oncology Department,
Carver College of Medicine, The University of IOWA.
Yusung Kim, Ph.D. (김유성), yusung-kim@uiowa.com
Clinical Professor of Radiation Oncology Department,
Carver College of Medicine, The University of IOWA.
Key words
AI, Artificial Intelligent, quantitative imaging, Machine learning, Deep learning, Positron Emission Tomography (PET), Computerized Tomography (CT), Cancer, Prognostication, Cancer therapy outcome prediction, personalized therapy, precision therapy, 인공지능, 머신러닝, 기계학습, 딥러닝, 정량적 이미지, 암치료, 암, 암치료 결과 예측, 암환자 맞춤치료
- 개요
암치료 효율은 지난 수십년의 생명공학기술, 생물학적 연구 그리고 첨단영상 장비 치료장비의 기술적 그리고 과학적 진보와 더불어서 급격히 향상되어 왔습니다. 지난 26년간 전체 암으로 인한 사망률은 지속적으로 줄어왔으며, 그 주요 원인으로는 4대 주요 암 사망률이 지속적으로 줄어왔기 때문입니다. 전립선암, 직장암, 유방암, 그리고 폐암입니다. 그럼에도 불구하고, 특정암들의 경우에는 여전히 사망율이 매우 높은 실정 입니다.1 예를 들어서 비소폐암(non-small cell lung cancer: NSCLC)의 경우 암 1기와 2기의 5년 생존율은 약 40-50%인 반면에, 수술이 불가한, 암 3기 (III A- III B)의 암의 경우에는 5년 생존율이 5-10%로 떨어지게 됩니다. 난소암 (Ovarian Cancer)은 5년 생존율이 미국의 경우 46.5 % 입니다. 뇌종양 (Brain Cancer), 위암 (Stomach Cancer), Hypopharynx 암의 경우 모두 5년 생존율이 30%대 초반으로 보고 되고 있다. 스티븐 잡스의 암으로 알려진, 췌장암 (Pancreatic Cancer)은 5년 생존율이 8.2%로써 치료를 받은 환자 10명중 약 1명이, 5년후에 생존하는 상황입니다. 뇌종양의 약 12 ~15%을 차지하는 교모세포종 (GBM: Glioblastoma)은 가장 일반적인 뇌 종양 중 하나인데, 이또한 5년 생존율이 7% 밖에 되고 있지 않습니다.
종양크기, 림프절 (lymph node) 그리고 전이상태에 따른 암이 몇기인지 (TNM staging) 나누는 방법이 현재 어떻게 암을 치료할 지를 가르는 중요한 암치료 결과 예측 방법이고, 임상 현장에서 TNM staging (즉, 암이 몇기인지)에 따라서 환자의 치료방법들이 정해집니다.2 물론, 환자의 흡연기록, 카노프스키 인자 (Karnofsky performance status (KPS)), 환자의 연령 또한 참고합니다. 그러나, 같은 TNM staging이라고 할 지라도, 현저히 다른 치료 결과가 환자마다 나타나고 있는 상태입니다.3 그래서, 어떤 환자는, 치료결과가 너무 않 좋고, 적절한 치료를 더 일찍 처방했으면, 치료효율을 올릴수 있는 데, 적절한 치료의 시기 (therapeutic window)를 놓치게 되는 데, 현재로는 종양크기, 림프절(lymph node) 그리고 전이상태에 따른 암이 몇기인지 나누는 기준으로는, 같은 암 기수 (TNM Staging) 안에, 다른 치료결과를 갖어올 환자들을 구분해 낼 방법이 없기 때문입니다. 이러한 문제로 인해서, 여러 치료결과를 예측케 하는 생물학적 인자 (biomarker)를 개발하고자 하는 노력들이 있어 왔고, 여전히 활발히 진행되고 있습니다. 그 생물학적 인자 (biomarker)는 환자 암의 분자구조와 치료결과를 연구해서, 몇몇 분자구조들은 환자의 암 치료결과에 중요한 영향을 미친 다는 것이 밝혀져 왔습니다. 예를 들면, 분자 생물학적 인자 (molecular biomarkers)들로써 암세포속의 ALK, EGFR, PD-1들은 환자치료 결과와 중요한 인과관계가 있음이 밝혀졌습니다. 이와같은, 생리학적인 (pathological) 분자 생물학적 인자들의 연구와 병행해서, 최근에는, 환자의 컴퓨터 단층촬영 (CT) 영상이나 양전자방출단층촬영술 (positron emission tomography, PET) 영상 안에 담겨진 암의 특성을 이용해서 암치료 결과를 예측하는 연구들이 시작되었습니다. 이미 잘 알려진 것처럼, CT는 X-선과 컴퓨터를 이용하여 인체의 목적부위를 여러 방향에서 조사하여 투과한 X-선을 검출기로 수집하고 그 부위에 대한 X-선의 흡수차이를 컴퓨터가 수학적 기법을 이용하여 재구성하는 촬영기법을 말한다. CT는 인체의 단면에 대한 재현 능력이 매우 우수하기 때문에 인체의 정상적인 해부학적 구조의 변형 정도를, 비교적 쉽고 정확하게 파악할 수 있게 정보를 주며, 혈액, 조직 뇌척수액, 백질, 회백질, 종양 등을 구분하는데 우수한 분해능력과 대조도를 표현하여 미세한 부분의 흡수차로 영상진단분야에 있어서 아주 중요한 영역을 차지하고 있고, CT 촬영은 인체의 어느 곳도 검사가 가능하다. 반면, PET은 양전자를 방출하는 방사성 의약품을 체내에 주입한 후 체내의 특정 부위에 분포한 양전자로부터 방출되는 감마선을 검출 하여 영상을 만드는 방법으로, 인체 내에서 일어나는 다양한 생화학적/기능적 변화를 영상으로 관찰하여 질병을 진단하는 방법이다. 이처럼, 환자의 3차원 영상 (CT 또는 PET 또는 이 둘이 결합된 PET-CT)을 활용한 암치료 결과 예측이 주목을 받기 시작했고, 초기 연구를 시작할 수 있었던 데에는, CT나 PET 영상 기술의 비약적인 발전으로, 그 영상을 통해서, 암의 크기만 진단하는 것이 아니라, 암의 특성을 정량적으로 분석할 수 있는 수준 (quantitative imaging) 까지 이르렀기 때문이다.
여전히 암환자 치료결과를 예측하는 매우 초기 단계의 연구들이 진행되고 있으나, 이 연구들의 암치료에 있어서 영향은 실로 매우 중요하다. 이 연구동향 보고서에서는, 지면 관계상 자세히 다루지 못하는 한계에도 불구하고, 1세대부터 3세대까지의 의료영상을 이용한 암치료 결과 예측을 살펴보려고 한다. 여전히, 개별 암환자의 암치료 방법을 결정하는 것이 의사이지만, 이와같은 개별 암환자의 3차원 영상에서 도출된 암환자의 치료결과에 대한 예측은, 의사들로 하여금 보다 더 효과적인 암치료 결정을 해줄 것으로 기대한다. 각 개별 환자의 3차원 영상(CT, PET, PET-CT, 그리고 MRI)을 가지고, 인공지능 기술을 이용해서 암을 진단(diagnostic)하는 연구는, 암치료결과(prognostic)를 예측하는 연구보다 훨씬 이전부터 연구가 되어져 왔고, 그 연구의 영역과 연구내용 또한 훨씬 방대해서, 이 기술동향보고서에서는 암치료 결과 (prognostic) 예측 연구에 제한해서 나누도록 한다. 의료 진단쪽의 인공지능활용에 대한 연구 동향 보고서 차후에 또 다른 보고서로 다루기로 한다.
2.암환자 치료결과 예측 (Prognostic) 연구: 1, 2, 3세대
앞서 개요에서 밝힌 것처럼, 가장 체계적이고, 의료적으로도 검증이 된, 암환자를 구분하여서 다른 치료방법을 적용하느 기준은 암이 몇기인지 나누는 방식(TNM Staging)이다.2 같은 암 3기라도, 너무나도 다른 치료결과가 나오는 일들이 너무나 많고, 이미 초기 치료후 치료결과가 나왔는데 그 결과가 좋지 않다면, 이미, 치료결과를 높일수 있는 조금더 공격적인 치료를 할 수 있는 치료의 기회 (therapeutic window)를 잃어버리기에, 그 환자들을 구별해 내려는 노력은 특별히, 핵의학과 분야에서 아주 오래전부터 활발하게 이뤄져 왔다. 특별히, 핵의학과에서 이와 같은 연구가 크게 일어나는 터닝 포인트가 되었던 것은 CT와 PET 영상이 합쳐진 형태의 PET-CT 영상치료기기가 계발되고, 활발히 보급된 이후 부터이다. 4-6 이 두 서로다른 영상이 합쳐졌을때, 해부학적으로도 정확하고, 암 세포들이 모여있는 곳도 정확히 알아낼수 있을 뿐만 하니라 PET 영상의 밝기, 좀더 정확히 말하면, 양전자가 보낸 시그널의 크기에 따라서, 암의 특성과 상태를 포함한 병리학적인 정보를 얻어 낼수가 있다. 특별히, 환자의 병리학적 정보 (pathological information)를 담고있는 PET 영상을 분석하여서 환자치료의 결과를 예측하려고 하는 연구가 핵의학분야를 중심으로 활발하게 되어졌다. 비유적으로이런 연구가 활발히 진행되던 시기를 1세대 암환자 치료결과 예측 (prognostic) 연구라고 칭한자. 1세대 연구는, PET 영상을 통해서 핵의학분야에서 기본적인 암의 크기와 PET 영상의 시그널 크기를 분석해서 그것들과 암환자 치료 결과의 상관관계를 통계적으로 분석하는 연구였다. 그리고, 인공지능 기술의 도래와 더불어서 백만 때로는 수조에 이르는 영상안에 담기 해부학적 그리고 병리학적 정보들을 분석해서 그중에서 어떤 영상 biomarker가 특정 환자군에서 특정 환자 치료결과와 관련이 있는지를 밝혀내는 연구가 시작되었다. 이 시기의 머신러닝을 활용한 연구를 암환자 치료 예측(prognostic)을 위한 연구의 2세대라 칭한다. 2세대 연구로는, 영상속에 담긴, 정보들을 정량적으로 (quantitatively) 연구하기 시작했던 시기들이라고 볼수 있다. 이 시기의 연구를 가능하고 하고 발전시킨 결정적인 기술들로는 머신 러닝 기술과 Radiomics라고 불리우는 환자의 3차원 영상을 연구자가 정량적으로 분석해내는 연구기술이 있다. 인공지능의 한 기술에 포함되는 머신러닝 기술의 발달과 함께, radiomics라고 불리우는 의료영상 (CT, PET, PET-CT 그리고, 자기공명영상 (MRI))을 학습하고 분석하며, 치료결과를 예측하는 연구로 이어졌다. 그리고, 머신러닝 기술 중의 한 방법 인 딥러닝이 계발되면서, 의료영상을 딥러닝을 적용하여, 학습하고, 통계적으로 분석하고, 암환자치료 결과를 예측하는 연구가 활발히 이루어지는 현재의 연구를 비유적으로 3세대라 칭하자. 딥러닝 기술을 통해서, 연구자가 아닌, 컴퓨터가 또는 인공지능 알고리즘이 학습을 통해서, 환자의 3차원 영상을 정량적으로 분석하고, 통계적으로 환자의 치료결과와 인과관계를 분석하여서, 개별 환자에 대해서 환자치료 결과를 예측하는 연구이다. 답보상태인 2세대 연구결과를 넘어서는, 뛰어난 연구결과를 보이면서, 활발히 진행되고 있다.
3.1세대: PET-CT 영상의 핵의학적 연구
PET-CT 영상을 이용한 환자치료 결과 예측을 위한 연구는 대사성 종양 부담 (metabolic tumor burden)에 대한 연구로 시작된다.7 즉, 암세포들이 뭉쳐있는 암의 크기가 얼마나 크고, 또한, 암세포들의 분열이, 밀도가 얼마나 단단하게 모여있는 지를 양전자단층촬영을 통해서 밝혀내는 것이다. 앞서 말한 것처럼, PET 영상에는 양전자를 방출하는 방사선 의약품을 몸안에 투입하는데, 그 의약품으로 가장 많이 사용되는 것이, 18F-Fluorodeoxyglucose (FDG)이다. 환자에게 투입되는 방사선 양은, 환자의 몸무게와 관련이 있다. 즉, 환자의 몸무게가 많이 나가면, 보다 많은 방사선 양이 투입된다. 그래서, 단순히 PET영상 상의 시그날 크기를 그대로 사용하지 않고, 환자의 몸무게를 고려해서 얼마나 암부위에서 양전자 방사선을 배출하는 지를 측정하는 데, 그 측정 지표가 SUV (Standardized update value)이다. 그 SUV 지표의 평균 값과9 환자 치료 결과와 통계적으로 연관되어 있다는 결과를 보여주는 연구들이 보고 되었다. 그러나, 그와 같은 연구결과들의 결과가 다른 기관에서 수행했을 때 재현되지 않는 경우가 많고 정확도가 떨어져서, 단순히 SUV 지표의 평균값 또는 최대치 값만 사용하는 것이 아니라, 암의 크기를 포함한 지표 (TLG (Total Lesion of Glocose) = SUV 평균값 곱하기 암의 크기)가 얼마나 환자 치료결과를 예측해내는 지에 대한 연구가 이어졌다.10 그러나, 환자예측에 있어서 이전 SUV 평균값 또는 최대치 지표 보다는, 향상된 예측결과를 내었지만, 임상에서 적용하기에는 여전히 정확도가 충분하지 못했다.
4.2세대: 머신 러닝을 활용한 연구
PET-CT 영상을 사용하는 것은 동일하나, 그 영상에 담긴 방대한 양의 암의 특성을 1세대 연구에서의 너무 단순한 암의 크기와 SUV 평균치 또는 최대치 값으로 나타내기에는 제한이 되었다. 그래서, 더 깊고 다양한 정보를 영상속에서 분석해내는 데, 인공지능의 초기 형태인 머신 러닝 기술이 도입되게 된다. 인공지능은 기계를 지능적으로 만드는 과학적 접근방법을 총괄하는 매우 포괄적인 개념으로 이 안에는 1980년대부터 시작된 머신러닝과 2010년 이후 본격적으로 연구와 개발이 진행된 딥러닝을 포함하고 있다. 1950년대에서 1980년대까지는 원시적인 인공지능이라고 할 수 있는, 학습 과정이 전혀 없는, 명시적인 규칙만 충분히 만들어서, 컴퓨터가 생각하고 결정할 수 있는 알고리즘이 지배했던 소위 상징적 인공지능 (Symbolic Artificial Intelligent)이 활발히 연구되었다. 상징적 인공지능 알고리즘이 체스게임같은 잘 정의된 문제를 푸는 데는 효율적이였지만, 이미지를 분류, 분석 그리고 예측되는 데는 효용이 없었기에 이 연구동향 보고서에서는 논의하지 않기로 한다. 대신, 머신러닝과 딥러닝에 집중해서 논의하고자한다. 머신러닝 시스템은 명시적으로 인간이 프로그램을 하는 것이 아니라, 데이터에 의해서 컴퓨터 알고리즘이 훈련되는 시스템을 말한다. 즉, 작업과 관련있는 많은 데이터를 계속 제공하면서, 머신러닝 시스템이 이 데이터에서 통계적 구조를 찾아 그 작업을 자동화하기 위한 규칙을 만들어내는 것이다. 그래서, 머신러닝안에, 특정 머신러닝의 형태로, 딥러닝이 포함되는 것이다. 딥러닝에 대해서는 3세대: 딥러닝을 활용한 연구 섹션에서 자세히 살펴 보도록 한다.
머신러닝 기술은 개별 환자의 3차원 영상과 암환자 치료 결과의 관계를 학습하고, 분석하고, 그리고, 예측할 수 있다. 3차원 영상에는 앞서서 소개한 CT와 PET 뿐만 아니라 뇌종양의 암을 진단하는 데 탁월한 자기공명영상 (MRI)도 포함된다. 머신러닝 기술이 의료 영상에 도입되는 데에는 앞서 말한 의료 영상의 기술적인 진보외에도, 의료 영상과 환자의 치료결과가 페이퍼 차트의 의료 기록에서 전자의료기록 시스템으로 바뀌면서, 각 의료 영상과 환자 치료 데이터가 방대한 양의 의료 치료 결과 시스템 안에 저장된 것과 또한, 컴퓨터의 연산능력 향상이, 머신 러닝 기술의 의료 영상에 적용되는 것을 가능하게 했다. 머신 러닝 기술이 의료 영상에 도입되면서, biomics (생명체학)처럼, radiomics (아직 radiomics라는 단어가 한국어로 번역되지 않아 영어표현을 그대로 사용한다)라는 단어와 개념이 소개된다. Radiomic는 질병의 특징을 알아내기 위해서 많은 양의 3차원 환자 영상을 분석하는 것이라고 정의할 수 있다. 좀더 세부적으로, Lambin은11 radiomics를 자동으로 환자치료 결과와 또는 진단과 인과관계가 있는 의료 영상 특징을 자동으로 발견해 내는 것이라고 정의했다. Radiomics, 즉, 환자 치료 결과를 예측하는 (prognostic) radiomics에는 4가지 단계의 과정이 포함된다 (그림 1).
(첨부된 화일 참조요망)
그림1. 암환자의 치료결과 예측 Radiomics의 4가지 단계: 개별 환자의 3차원 영상 (CT, PET, 또는 MRI), 3차원으로 머신러닝으로 암을 3차원 영상안에서 그려내기 (segmentaiton), 암환자 치료결과과 인과관계가 있는 암의 영상 특징 (feature) 찾아내기, 그리고 그것을 통계적으로 분석해 내는 단계 (Analysis) (출처: Vial A., et al. Translational Cancer Research, Vol 7, No 3:803-816, 2018.)
2 세대 머신 러닝에서, 환자치료결과 예측에 관한 연구는 radiomics의 4단계중, 3번째 단계를, 여러 연구를 통해서 밝혀진 특징 (hand-crafted features)을 통한 연구가 진행이 되었다. 이와 같은, 연구를 통해서 밝혀진 특징 (hand-crafted features)를 이용해서 암환자의 치료 결과를 예측한 연구들은 표1에서 보는 바와 같다.
논문 저자 | 연도 | 3차원 의료 영상 | 암 종류 |
Zhang et al. | 2017 | CT | 폐암 |
Aerts et al. |
2014 | CT | 폐암 |
Oikonomou et al. |
2018 | PET-CT | 폐암 |
Paul et al. |
2016 | CT | 폐암 |
Emaminejad et al. | 2017 | CT | 폐암 |
표1. 연구를 통해서 밝혀진 특징 (hand-crafted features)를 이용해서, 머신러닝을 통해서 암환자의 치료결과를 예측한 연구들
머신러닝을 활용한 암환자 치료 방법으로 50% 에서 79%의 통계적 정확도 (an area under the receiver operating characteristic curve (AUC))를 보이며 환자의 생존율 (overall survival)을 예측해 내었다. 17, 18 그런데, 머신러닝을19 사용하지만, 연구를 통해서 밝혀진 특징 (hand-crafted features)을 사용하는 초기 radiomics의 연구방법은, 여러 제약사항들이 있다. 먼저, 대부분의 그 방법은, 암 주변의 영상의 내용만을 분석하게 된다. 즉, 환자 전체의 영상을 분석하는 데 제한되는 면이 있다. 왜냐면, 연구자가 정의한 특징을 적용해야 하기 때문에 암이 퍼져 있을 수 있는 림프절의 영상 특징을 분석해서 포함하는 데 제한이 있다. 또한, 어느 정도의 데이타 양을 넘어서면, 더 이상의 예측 성능 향상이 되지 않고 정체되는 제한점이 있습니다. 그래서, 새로운 방식의, 인간의 뇌가 사고하고 학습하는 방식과 닮은 딥러닝이 고안되고 활발하게 의료영상에 적용되어 연구가 되고 있다.
(첨부된 화일 참조요망)
그림2. 머신러닝과 딥러닝의 데이터 양과 학습된 데이터를 가지고 새로운 내용을 예측하는 성능 비교 (출처: Shaikh, F., Deep Learning vs. Machine Learning-the essential differences you need to know!, Analytics Vidhya) (https://www.analyticsvidhya.com/blog/2017/04/comparison-between-deep-learning-machine-learning/))
5.3세대: 딥 러닝을 활용한 연구
머신러닝의 한 방법인 딥러닝은 초기 머신 러닝 연구자들이 만들어 낸 또 다른 알고리즘인 인공 신경망(Artificial Neural Network)에 영향을 준 것은 인간의 뇌가 지닌 생물학적 특성, 특히 뉴런의 연결 구조이다. 딥 러닝은 인공신경망에서 발전한 형태의 인공지능으로, 뇌의 뉴런과 유사한 정보 입출력 계층을 활용해 데이터를 학습한다.
(첨부된 화일 참조 요망)
그림3. 3차원의 개별 환자 영상 (CT, PET, MRI 또는 암세포를 분석한 병리학적 세포 영상)에서 암환자의 치료 결과를 예측(prognostication)하는 전통적인 딥러닝 (convolutional neural networks (CNN)) 방법.
딥러닝은 여러형태의 모델들이 있는데, 그중에는 Deep Autoencoders, Deep Boltzmann Machines (DBM), Recurrent Neural Networks (RNN) and Convolutional Neural Networks (CNN)이 대표적이라고 할 수 있다. 그런데, 이 딥 모델들 주에서, 의료영상을 학습하고 분석하고 분석해 내는 데에는 CNN 모델이 가장 효과적이다.19 CNN 모델은, 이차원의 의료영상을 반복해서 처리함으로 3차원으로 의료 영상을 학습하고, 암을 진단해 내거나, 확인된 암을 3차원으로 그려내는 일 (segmentation)에 탁월한 딥러닝 구조이다. 그렇기에 이 보고서에서는 딥러닝을 CNN 모델에 한정해서 이야기 하고자 한다. CNN 모델은 전통적인 머신 러닝에 비해서, 매우 향상된 성능을 모든 의료영상 활용 영역에서 보여 왔다.20, 21 딥러닝(CNN)을 활용한 암환자 치료 방법으로 70% 에서 82%의 통계적 정확도 (an area under the receiver operating characteristic curve (AUC))를 보이며 환자의 생존율 (overall survival)을 예측해 내었다.
논문 저자 | 연도 | 3차원 의료 영상 | 암 종류 |
Paul et al. | 2016 | CT | 폐암 |
Lao et al. |
2017 | MRI | 뇌종양 |
Shen et al. |
2017 | CT | 폐암 |
Hosny et al. |
2018 | CT | 폐암 |
Mobadersany et al. |
2017 | 조직영상 (Histology image) | 신경교종(Glioma) |
Ha et al. | 2018 | MRI | 유방암 |
Chaudhary et al. |
2018 | 조직영상 (Histology image) | 간암 |
Cui et al. |
2018 | PET | 폐암 |
Ypsilantis et al. |
2015 | PET | 식도암 |
Diamant et al. | 2019 | CT | 두경부암 |
Baek at al. | 2019 | PET-CT | 폐암 |
표2. 딥러닝을 통해서 암환자의 치료결과를 예측한 연구들
전통적인 딥러닝 (CNN)은 그림3과 같은 구조를 가지고 있다. 즉, 최종 암환자 치료결과를 의료영상으로부터 직접 학습시키는 순차적인 일렬구조이다. 이는 overfitted 문제를 만들수 있다. 즉, 환자 데이타를 학습시킨 그 데이터 안에서는 매우 높은 예측율을 보이지만, 같은 암의 같은 종류의 의료영상이지만, 다른 병원의 환자의 예측율은 현저히 낮을 수 있는 구조적인 문제를 가지고 있다.
(첨부된 화일 참조요망)
그림4. 딥러닝을 통해서 암환자의 치료결과를 예측하기 위해서, 환자데이터를 모델링하는 데 있어서 건강한 모델링 (왼쪽)과 지나치게 특정 데이터에만 국한 될 수 있는 (oiverfitted) 모델링 (오른쪽).
이 문제를 해결하기 위해서 필자의 연구기관에서 제안하고 연구중인 새로운 모델은, 두단계 딥러닝 (CNN) 모델이다. 이는 암환자의 암을 딥러닝을 이용해서 3차원으로 그려내는 것이 1단계이다. 그 과정에서, 암을 3차원으로 그려내는 데 있어서 가장 중요한 역활을 하는 의료영상의 특징들 (features)을 뽑아내게 된다. 예를들어, 아래 그림5에서 빨간 박스로 처리된 부분의 11만개에 해당하는 딥러닝 features들, 또는 CNN모델에서는 neurons (신경세포)들을 뽑아내는 데 이는, 수백만, 천만개의 의료영상에 포함된 features들중에서 뽑아낸 것이다. 그런데, 이 핵심 11만개의 features들이 최종 암환자 치료율과의 인과관계로부터 학습된 것이 아니라, 암 영상이 가지고 고유한 암의 특성일수 있다는 것이다. 그리고, 그렇게 뽑아진 핵심 features들속에서 통계적인 분석을 통해서, 암환자 치료율과 가장 통계적으로 연관이 있는 features들을 도출해 내는 것이다.
(첨부된 화일 참조요망)
그림5. 딥러닝 CNN 모델을 사용하되, 3차원 환자 의료영상에서 암을 3차원적으로 그리는 1단계 작업을 먼저하고, 그 과정 중에서 도출된 딥러닝 features들 속에서 암환자의 치료결과와 통계적으로 가장 강력한 인과관계를 갖는 feature들을 찾아내는 소위 두단계 딥러닝 CNN 모델을 보여주고 있다.
아래 그림6에서는 이 두 단계 모델을 적용했을때의 암환자 치료 예측결과를 보여주고 있다. PET/CT DESEP으로 표현된 암환자 치료예측 결과가 두단계 딥러닝 CNN 모델로 도출한 결과이다. 두단계의 모델의 결과가 전통적인 딥러닝 모델 (그림3)과 그리고 핵의학 쪽에서 PET 영상에서 도출한 TLG (Total Lesion of Glucose) 방법으로 도출된 결과와 비교되고 있다. Radiomic으로 표현된 데이터가 전통적인 딥러닝 모델 (그림3)을 통해서 얻어진 환자 치료 예측 결과이다. 이 연구동향보고서의 목적상 자세한 두단계 딥러닝 CNN 모델에 대한 연구내용은 Scientific Report에 보고된 논문을 참조하기 바란다. 그림6에서 확연히 확인할 수 있는 것처럼, 통계적으로 월등히 우수한 암환자 치료결과 (2년후 생존율)을 보이고 있다.
(첨부된 화일 참조요망)
그림6. 두단계 딥러닝 CNN 모델을 사용한 데이터가 PET/CT DESEP 모델이고, Radiomic은 전통적인 딥러닝 CNN 모델 방식(그림3)으로 도출된 결과이다. 또한 TLG (Total Lesion of Glucose)는 핵의학 쪽에서 PET 영상을 가지고, 머신러닝 그리고 딥러닝이 소개되기 전에 1세대 연구로 수행하던 방식을 지칭한다.
또한, 두단계의 딥러닝 작업중, 1단계에서 수집된 딥러닝 CNN features들을 분석해 보았을때, 그 features들 또는 neurons (신경세포들)이 어떻게 의료영상에 담긴 암 덩어리의 생물학적 특징들을 잡아내는 지에 대한 힌트도 제공해 주고 있었다.
(첨부된 화일 참조요망)
그림7. 두단계 딥러닝 CNN 모델을 통해서, 암환자 치료율과 가장 큰 통계적 연관성을 가지고 있는 features (또는 neurons(신경세포))들을 영상으로 재현 (visualize)했을때의 각 CNN 모델안의 신경세포들의 모습이다. 첫번째는 암 덩어리안에 얼마나 균일하게 암세포들이 분포하는 지 여부 (위의 줄), 또한, 암 덩어리에게 산소를 공급하고 신경조직들 (가운데 줄), 그리고 암 덩어리와 일반조직의 경계상의 특징들 (아래 줄)을 CNN 모델안에서 features들이 잡아내고 있음을 보여준다.
또 한가지, 흥미로운 발견은, 환자의 암 치료율에 대한 예측 확율을 3차원적으로 나타내었을 때 (3D risk map), 암 사망율이 가장 높게 나타난 폐의 부분에서 암환자가 실제로 암이 재발한것이 발견된 것이다. 물론, 아직은 연구 초기 단계이고, 많은 연구가 이어져서 보다 더 정밀하고 정확한 암재발 장기를 예측하는 연구가 수행되어져야 하지만, 암이 재발하는 장기 또는 한 장기내에서 재발부분을 예측할 수 도 있는 가능성이 있음을 보여주는 고무적인 발견이라고 할 수 있다.
(첨부된 화일 참조요망)
그림8. 두단계 딥러닝 CNN 모델을 통해서, 3차원적으로 환자의 사망율 확율을 분포예상도 (Risk map)를 마치 비올 확율을 예측해주는 예측도처럼, 계발해서 방사선으로 암을 치료하기 전 의료 영상(CT)에 적용한 경우이다. A는 암환자가 고정밀 방사선 치료 (Stereotactic-Body Radiotherapy)를 받기 전의 CT영상이다. C는 오렌지색 (고위험 지역을 나타낸다)으로 암환자 사망율 확률 분포도 (Risk map)를 치료전 영상 (A)에 겹쳐서 보여주는 그림이다. 두곳의 오렌지 색 폐의 부분이 있는데, 한곳은 암이 확정되어서 방사선 치료를 받을 부분 (D)이고, 한부분은 암이 너무 작아서 또는 PET영상에서 암으로 확정이 되지 않아서 치료되지 않은 부분(C)을 가르킨다. B는 방사선 치료후 1년후 다시 찍은 의료 영상 (CT)에서 오렌지색으로 고위험지역임을 딥러닝 CNN모델이 경고했던 지역에서 폐암이 재발 했음을 보여준다.
앞서 언급한 데로, 딥러닝 CNN모델을 의료영상에 적용해서 암환자 치료결과를 보여주는 연구는 아직도 매우 초기 단계라서, 의료적으로, 환자를 치료하는 단계에 적용하기 까지는 많은 연구들과 의료적 검증 (clinical trials)이 뒤따라야 한다. 의료영상을 이용한 딥러닝의 가장 큰 어려움으로는, 환자 암치료 결과가 잘 정리된 매우 많은 의료영상이 필요하다는 것이다. 의료영상 안에 담긴 수백만, 때로는, 수조의 영상 정보를 잘 모델링 하기위해서는, 매우 방대한 양의 양질의 의료영상 데이터와 환자 치료 결과 데이터가 필요하다. 그리고, 모델이 얼마나, 우수하게 암환자 치료결과를 예측하는 지 검증하기 위해서는, 한 치료기관의 데이터가 아니라, 완전히 독립적인 다른 기관의 데이터를 통해서 검증하는 작업들도 이뤄져야 한다. 이를 위해서는, 양질의 의료영상 데이터와 환자 치료결과를 공유할 수 있는 안정적이고도 보안성이 뛰어난 플랫폼의 계발이 시급하다.
6.결론
인간의 평균 수명이 증가함에 따라서, 암은 더이상 인류의 소수에게만 찾아오는 불행이 아니라, 모든 사람들에게 영향을 미칠 수 있는 질병이 되었다. 또한, 지난 수십년간의 의학적 연구와 첨단 장비의 발달과 의료영상의 발달에 힘입어, 지난 몇십년간 많은 암들의 치료후 생존율은 급격히 증가했다. 최근에는 면역치료 (immuno therapy)라는 인류에게 암을 완전히 정복할 수 있는 마지막 희망이라고 불리우는 치료가 활발히 연구되고 시행되고 있다. 인간 자체의 면역 메카니즘을 이용한 이 치료는, 아직도 많은 암부위의 경우, 연구중인 상태이다. 면역치료 단독으로, 또는 수술과 또는, 약물요법(Chemotherapy)과 또는, 방사선 치료와 아니면, 여러 치료를 동시에 또는 순차적으로, 등. 면역치료의 효과를 극대화하기 위한 연구들이 활발히 일어나고 있다. 그러나, 의료현장에서는, 아직도 많은 암들은, 인류가 할 수 있는 최상의 치료를 한 후에도, 5년 생존율이 극도로 낮은 것이 현실이다. 또한, 통계적으로 어느정도 좋은 생존율을 보이는 암의 경우에도, 특정 환자들은, 통계적인 생존율보다 훨씬 짧은 생존율을 보인다. 핵심 문제는, 개별 환자의 치료율이 어떻게 될것인지를 예측하는 것이다. 각 암치료 별로 예상 치료율, 의사들이 신뢰할 수 있는 정도의 정확도를 가지고, 예상 치료율을 보일 수 있다면, 의료현장에서는, 각 환자에게 맞춤형 치료를 적용할 수 있을 것으로 예상하고, 딥러닝을 통한 암환자 치료결과 예측 연구가 그것이 매일의 의료현장에서 가능하게 하는 데 중요한 역활을 할 것으로 기대한다.
References
1 R.L. Siegel, K.D. Miller, A. Jemal, "Cancer statistics, 2020," CA Cancer J Clin 70, 7-30 (2020).
2 M.K. Gospodarowicz, D. Miller, P.A. Groome, F.L. Greene, P.A. Logan, L.H. Sobin, "The process for continuous improvement of the TNM classification," Cancer 100, 1-5 (2004).
3 A. Hosny, C. Parmar, T.P. Coroller, P. Grossmann, R. Zeleznik, A. Kumar, J. Bussink, R.J. Gillies, R.H. Mak, H. Aerts, "Deep learning for lung cancer prognostication: A retrospective multi-cohort radiomics study," PLoS Med 15, e1002711 (2018).
4 S. Liao, B.C. Penney, K. Wroblewski, H. Zhang, C.A. Simon, R. Kampalath, M.C. Shih, N. Shimada, S. Chen, R. Salgia, D.E. Appelbaum, K. Suzuki, C.T. Chen, Y. Pu, "Prognostic value of metabolic tumor burden on 18F-FDG PET in nonsurgical patients with non-small cell lung cancer," Eur J Nucl Med Mol Imaging 39, 27-38 (2012).
5 H.H. Chen, N.T. Chiu, W.C. Su, H.R. Guo, B.F. Lee, "Prognostic value of whole-body total lesion glycolysis at pretreatment FDG PET/CT in non-small cell lung cancer," Radiology 264, 559-566 (2012).
6 Y. Zaizen, K. Azuma, S. Kurata, E. Sadashima, S. Hattori, T. Sasada, Y. Imamura, H. Kaida, A. Kawahara, T. Kinoshita, M. Ishibashi, T. Hoshino, "Prognostic significance of total lesion glycolysis in patients with advanced non-small cell lung cancer receiving chemotherapy," Eur J Radiol 81, 4179-4184 (2012).
7 P. Lee, D.K. Weerasuriya, P.W. Lavori, A. Quon, W. Hara, P.G. Maxim, Q.T. Le, H.A. Wakelee, J.S. Donington, E.E. Graves, B.W. Loo, Jr., "Metabolic tumor burden predicts for disease progression and death in lung cancer," Int J Radiat Oncol Biol Phys 69, 328-333 (2007).
8 M. Paesmans, T. Berghmans, M. Dusart, C. Garcia, C. Hossein-Foucher, J.J. Lafitte, C. Mascaux, A.P. Meert, M. Roelandts, A. Scherpereel, V. Terrones Munoz, J.P. Sculier, P. European Lung Cancer Working, I.L.C.S.P. on behalf of the, "Primary tumor standardized uptake value measured on fluorodeoxyglucose positron emission tomography is of prognostic value for survival in non-small cell lung cancer: update of a systematic review and meta-analysis by the European Lung Cancer Working Party for the International Association for the Study of Lung Cancer Staging Project," J Thorac Oncol 5, 612-619 (2010).
9 T. Berghmans, M. Dusart, M. Paesmans, C. Hossein-Foucher, I. Buvat, C. Castaigne, A. Scherpereel, C. Mascaux, M. Moreau, M. Roelandts, S. Alard, A.P. Meert, E.F. Patz, Jr., J.J. Lafitte, J.P. Sculier, I.L.C.S.P. European Lung Cancer Working Party for the, "Primary tumor standardized uptake value (SUVmax) measured on fluorodeoxyglucose positron emission tomography (FDG-PET) is of prognostic value for survival in non-small cell lung cancer (NSCLC): a systematic review and meta-analysis (MA) by the European Lung Cancer Working Party for the IASLC Lung Cancer Staging Project," J Thorac Oncol 3, 6-12 (2008).
10 S.M. Larson, Y. Erdi, T. Akhurst, M. Mazumdar, H.A. Macapinlac, R.D. Finn, C. Casilla, M. Fazzari, N. Srivastava, H.W. Yeung, J.L. Humm, J. Guillem, R. Downey, M. Karpeh, A.E. Cohen, R. Ginsberg, "Tumor Treatment Response Based on Visual and Quantitative Changes in Global Tumor Glycolysis Using PET-FDG Imaging. The Visual Response Score and the Change in Total Lesion Glycolysis," Clin Positron Imaging 2, 159-171 (1999).
11 P. Lambin, E. Rios-Velazquez, R. Leijenaar, S. Carvalho, R.G. van Stiphout, P. Granton, C.M. Zegers, R. Gillies, R. Boellard, A. Dekker, H.J. Aerts, "Radiomics: extracting more information from medical images using advanced feature analysis," Eur J Cancer 48, 441-446 (2012).
12 Y. Zhang, A. Oikonomou, A. Wong, M.A. Haider, F. Khalvati, "Radiomics-based Prognosis Analysis for Non-Small Cell Lung Cancer," Sci Rep 7, 46349 (2017).
13 H.J. Aerts, E.R. Velazquez, R.T. Leijenaar, C. Parmar, P. Grossmann, S. Carvalho, J. Bussink, R. Monshouwer, B. Haibe-Kains, D. Rietveld, F. Hoebers, M.M. Rietbergen, C.R. Leemans, A. Dekker, J. Quackenbush, R.J. Gillies, P. Lambin, "Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach," Nat Commun 5, 4006 (2014).
14 A. Oikonomou, F. Khalvati, P.N. Tyrrell, M.A. Haider, U. Tarique, L. Jimenez-Juan, M.C. Tjong, I. Poon, A. Eilaghi, L. Ehrlich, P. Cheung, "Radiomics analysis at PET/CT contributes to prognosis of recurrence and survival in lung cancer treated with stereotactic body radiotherapy," Sci Rep 8, 4003 (2018).
15 R. Paul, S.H. Hawkins, Y. Balagurunathan, M.B. Schabath, R.J. Gillies, L.O. Hall, D.B. Goldgof, "Deep Feature Transfer Learning in Combination with Traditional Features Predicts Survival Among Patients with Lung Adenocarcinoma," Tomography 2, 388-395 (2016).
16 N. Emaminejad, W. Qian, Y. Guan, M. Tan, Y. Qiu, H. Liu, B. Zheng, "Fusion of Quantitative Image and Genomic Biomarkers to Improve Prognosis Assessment of Early Stage Lung Cancer Patients," IEEE Trans Biomed Eng 63, 1034-1043 (2016).
17 S. Carvalho, R.T.H. Leijenaar, E.G.C. Troost, J.E. van Timmeren, C. Oberije, W. van Elmpt, L.F. de Geus-Oei, J. Bussink, P. Lambin, "18F-fluorodeoxyglucose positron-emission tomography (FDG-PET)-Radiomics of metastatic lymph nodes and primary tumor in non-small cell lung cancer (NSCLC) - A prospective externally validated study," PLoS One 13, e0192859 (2018).
18 D.V. Fried, O. Mawlawi, L. Zhang, X. Fave, S. Zhou, G. Ibbott, Z. Liao, L.E. Court, "Stage III Non-Small Cell Lung Cancer: Prognostic Value of FDG PET Quantitative Imaging Features Combined with Clinical Prognostic Factors," Radiology 278, 214-222 (2016).
19 A. Vial, D. Stirling, M. Field, M. Ros, C. Ritz, M. Carolan, L. Holloway, A.A. Miller, "The role of deep learning and radiomic feature extraction in cancer-specific predictive modelling: a review," Transl Cancer Res 7, 803-816 (2018).
20 A. Hosny, C. Parmar, T.P. Coroller, P. Grossmann, R. Zeleznik, A. Kumar, J. Bussink, R.J. Gillies, R.H. Mak, H.J.W.L. Aerts, "Deep learning for lung cancer prognostication: A retrospective multi-cohort radiomics study," Plos Medicine 152018).
21 P. Mobadersany, S. Yousefi, M. Amgad, D.A. Gutman, J.S. Barnholtz-Sloan, J.E. Velazquez Vega, D.J. Brat, L.A.D. Cooper, "Predicting cancer outcomes from histology and genomics using convolutional networks," Proc Natl Acad Sci U S A 115, E2970-E2979 (2018).
22 J. Lao, Y. Chen, Z.C. Li, Q. Li, J. Zhang, J. Liu, G. Zhai, "A Deep Learning-Based Radiomics Model for Prediction of Survival in Glioblastoma Multiforme," Sci Rep 7, 10353 (2017).
23 W. Shen, M. Zhou, F. Yang, D.D. Yu, D. Dong, C.Y. Yang, Y.L. Zang, J. Tian, "Multi-crop Convolutional Neural Networks for lung nodule malignancy suspiciousness classification," Pattern Recogn 61, 663-673 (2017).
24 R. Ha, C. Chin, J. Karcich, M.Z. Liu, P. Chang, S. Mutasa, E.P. Van Sant, R.T. Wynn, E. Connolly, S. Jambawalikar, "Prior to Initiation of Chemotherapy, Can We Predict Breast Tumor Response? Deep Learning Convolutional Neural Networks Approach Using a Breast MRI Tumor Dataset," Journal of Digital Imaging2018).
25 K. Chaudhary, O.B. Poirion, L. Lu, L.X. Garmire, "Deep Learning-Based Multi-Omics Integration Robustly Predicts Survival in Liver Cancer," Clin Cancer Res 24, 1248-1259 (2018).
26 S. Cui, Y. Luo, H. Hsin Tseng, R.K. Ten Haken, I. El Naqa, "Artificial Neural Network with Composite Architectures for Prediction of Local Control in Radiotherapy," IEEE Trans Radiat Plasma Med Sci 3, 242-249 (2019).
27 P.P. Ypsilantis, M. Siddique, H.M. Sohn, A. Davies, G. Cook, V. Goh, G. Montana, "Predicting Response to Neoadjuvant Chemotherapy with PET Imaging Using Convolutional Neural Networks," PLoS One 10, e0137036 (2015).
28 A. Diamant, A. Chatterjee, M. Vallieres, G. Shenouda, J. Seuntjens, "Deep learning in head & neck cancer outcome prediction," Sci Rep 9, 2764 (2019).
29 S. Baek, Y. He, B.G. Allen, J.M. Buatti, B.J. Smith, L. Tong, Z. Sun, J. Wu, M. Diehn, B.W. Loo, K.A. Plichta, S.N. Seyedin, M. Gannon, K.R. Cabel, Y. Kim, X. Wu, "Deep segmentation networks predict survival of non-small cell lung cancer," Sci Rep 9, 17286 (2019).