인공지능(AI)에 인간의 직관과 추론 방식을 학습시키자 의료 조언 정확도가 크게 향상됐다는 연구 결과가 나왔다.
독일 베를린 공대 연구팀은 거대언어모델(LLM)이 인간의 의사결정 과정을 모방하도록 하는 새로운 프롬프트 전략이 의료 상담 정확도를 높인다는 연구 결과를 국제학술지 'JMIR 생의학 공학'에 발표했다고 11일(현지시간) 밝혔다.
연구팀은 현재 챗GPT와 같은 AI가 건강 상담 시 사소한 문제에도 응급 진료나 전문의 상담을 권하는 등 지나치게 보수적인 답변을 내놓는 경향이 있다고 지적했다. 이는 불필요한 의료 비용과 환자의 불안감을 유발할 수 있다.
이에 연구팀은 '자연주의적 의사결정'(NDM) 이론에 기반한 프롬프트 기법을 개발했다. 이는 불확실한 상황에서 인간 전문가가 결정을 내리는 방식을 AI에 적용한 것이다. 환자 증상을 '전형적 사례'와 비교해 결과를 예측하거나, 상황을 계속 재평가하며 결론을 수정하는 방식이다.
최신 GPT-4o 및 GPT-5 시리즈를 포함한 10개 챗GPT 모델에 이 기법을 적용한 결과, AI의 자가 치료 권고 정확도는 기존 13.4%에서 약 30%로 2배 이상 급증했다. 반면, 응급 상황을 정확히 판단하는 능력은 그대로 유지돼 안전성도 확보했다.
연구를 이끈 마빈 코프카는 "인간 전문가의 의사결정 모델을 AI 프롬프트로 활용하는 것은 당연한 수순"이라며 "이 방법이 실제 의사결정에 유용한 AI 도구를 개발하는 데 도움이 되기를 바란다"고 말했다.
연구팀은 이번 연구가 AI를 임상 의사결정의 효과적인 보조 도구로 만드는 중요한 단계라고 평가했다. 다만 현재 모델은 통제된 환경에 최적화되어 있어, 일반 사용자를 위한 실용화에는 추가 연구가 필요하다고 덧붙였다.

