인공지능(AI)이 그럴듯한 거짓 정보를 생성하는 '환각'(hallucination) 현상을 여러 AI의 '다수결'로 막는 기술이 개발됐다.
미국 빙엄턴대학교 연구팀은 2일(현지시간) 국제학술지 '스타 프로토콜'에 7개의 각기 다른 거대언어모델(LLM)에 같은 질문을 던져 가장 많이 나온 답변을 정답으로 채택하는 검증 프로토콜을 공개했다.
연구팀은 이 방식을 의료 분야에 적용해 1만회 이상 실험을 진행했다. 우선 7개의 LLM이 신뢰할 수 있는 의료 용어 데이터베이스를 참조해 답변을 생성하도록 '검색 증강 생성'(RAG) 기술을 적용했다.
이후 특정 증상에 대한 의학 용어를 질문하자, 답변의 76.85%는 4개 이상의 LLM이 일치된 결과를 내놓았다. 나머지 23.15%도 최소 2개 이상의 LLM이 같은 답변을 제시했다.
연구 결과, AI가 단독으로 생성한 오류나 환각 현상은 단 한 건도 발견되지 않았다. 여러 AI가 답변을 교차 검증하면서 사실상 거짓 정보가 걸러진 셈이다.
연구팀은 이 기술이 의료 분야뿐만 아니라 법률, 학술, 역사 등 AI가 잘못된 정보를 생성할 수 있는 모든 분야에 적용 가능할 것으로 기대했다.
연구를 이끈 아흐메드 압딘 하메드 연구원은 "이번에 개발한 워크플로우는 질병, 유전, 치료법 등 생물의학적 관점의 모든 것을 검증할 수 있다"며 "지식 검증의 민주화를 향한 큰 걸음"이라고 평가했다.

