인공지능 머신러닝 기반 당뇨병 발병 예측모델 개발

경희대병원 상현지 교수팀, 97만명 데이터 분석
내부검증 통해 높은 예측 정확도 확인돼

이정수 기자 (leejs@medipana.com)2025-05-20 16:25

(왼쪽부터) 경희대병원 내분비내과 상현지, 임상의학연구소 연동건 교수
경희대병원은 내분비내과 상현지 교수와 임상의학연구소 연동건 교수팀이 머신러닝 기법을 활용해 향후 5년 이내 제2형 당뇨병 발병을 예측할 수 있는 모델을 개발하고 이를 세계적 국제학술지 란셋(The Lancet) 자매지인 e임상의학(eClinicalMedicine, IF 9.6)에 발표했다고 20일 밝혔다. 

연구팀은 2002년부터 2013년까지 약 12년 간 국민건강보험공단 건강검진에 참여한 약 97만명의 데이터를 기반으로 5년 이상 추적관찰을 진행했다. 이 중 당뇨병 병력이 있거나 사망 등으로 연구에 부적합한 사례를 제외한 약 39만명의 데이터를 활용해 머신러닝 기반 예측 모델을 개발하고 내부 검증을 수행했다.

로지스틱 회귀(Logistic Regression)와 어댑티브 부스팅(AdaBoost) 기법이 조합된 앙상블 구조의 예측 모델은 총 18개의 건강검진 데이터를 학습 변수로 활용했다.

그 중 ▲연령 ▲공복혈당 ▲헤모글로빈 ▲감마글루타밀전이효소(GGT) ▲체질량지수(BMI) 등이 제2형 당뇨병 발병과 유의한 상관관계를 보였으며, 모델은 72.6%의 높은 예측 정확도를 나타냈다. 

특히 일본 JMDC(1,200만명) 및 영국 UK Biobank(41만명)의 데이터를 활용한 외부 검증에서도 높은 예측 정확도를 보이며 해당 모델의 국제적 적용 가능성과 신뢰성을 입증했다. 

상현지 교수는 "기존 예측 모델 연구는 전자의무기록(EHR) 데이터 혹은 단일 국가에 한정돼 일반화에 많은 한계가 있었다"며 "이번 연구는 실제 건강검진 데이터를 기반으로 한 다국적 대규모 코호트를 활용해 예측 모델의 신뢰성과 확장성을 입증한 것에 의미가 있다"고 말했다. 

덧붙여 "해당 모델이 예측한 당뇨병 발생 확률이 가장 높은 상위 1/3 구간의 고위험군 사망위험은 발생 확률이 50% 미만인 저위험군에 비해 한국은 약 7.7배, 일본은 약 3.3배, 영국은 약 1.7배까지 증가하는 것으로 분석된 바, 당뇨병 조기 예측 및 예방의 중요성을 확인했다"고 말했다.

병원은 경희대학교 디지털헬스센터 홈페이지에 이번 연구 결과를 기반으로 누구나 쉽게 당뇨병 발병 위험을 확인할 수 있는 웹사이트가 공개돼 있다고 설명했다.

실시간
빠른뉴스

당신이
읽은분야
주요기사

독자의견

작성자 비밀번호

0/200

메디파나 클릭 기사

독자들이 남긴 뉴스 댓글

포토