구글이 인공지능(AI)을 활용해 과거 뉴스 기사를 분석, 예측이 가장 어려운 재난 중 하나인 돌발홍수 발생 가능성을 예보하는 새로운 모델을 개발했다.
12일(현지시간) 테크크런치에 따르면 구글 연구진은 대규모 언어 모델(LLM) '제미나이'(Gemini)를 이용해 전 세계 500만건의 뉴스 기사를 분석했다. 이를 통해 260만건의 과거 홍수 사례를 추출하고 위치와 시간 정보를 태그한 '그라운드소스'(Groundsource) 데이터셋을 구축했다. 길라 로이크 구글 리서치 프로덕트 매니저는 언어 모델을 이런 종류의 작업에 사용한 것은 이번이 처음이라고 밝혔다.
돌발홍수는 짧은 시간에 특정 지역에 집중돼 발생하기 때문에 기존의 기온이나 강수량 데이터처럼 포괄적인 정보를 수집하기 어려웠다. 이러한 데이터 부족은 AI 예측 모델 개발의 가장 큰 걸림돌로 작용해왔다.
연구진은 이렇게 구축한 데이터셋을 기반으로 롱숏텀메모리(LSTM) 신경망 기반의 AI 모델을 훈련시켰다. 이 모델은 전 세계 기상 예보를 입력받아 특정 지역의 돌발홍수 발생 확률을 생성한다. 현재 구글의 '플러드 허브'(Flood Hub) 플랫폼을 통해 150개국 도시 지역의 홍수 위험 정보를 제공하고 있으며, 전 세계 재난 대응 기관과 데이터를 공유하고 있다.
남아프리카개발공동체의 재난 대응 관계자인 안토니우 호세 벨레자는 구글과 함께 이 모델을 시험한 결과 홍수에 더 신속하게 대응하는 데 도움이 됐다고 평가했다.
다만 이 모델은 20㎢ 넓이의 지역 단위로 위험을 식별해 해상도가 비교적 낮다는 한계가 있다. 또한 실시간 강수량을 추적하는 지역 레이더 데이터를 통합하지 않아 미국 국립기상청의 홍수 경보 시스템만큼 정밀하지는 않다.
이에 대해 구글 복원력팀의 줄리엣 로젠버그 프로그램 매니저는 "이 프로젝트는 고가의 기상 감지 인프라에 투자할 여력이 없거나 광범위한 기상 데이터 기록이 없는 지역을 위해 설계됐다"고 설명했다. 그는 "수백만 건의 보도를 집계함으로써 그라운드소스 데이터셋이 지도의 균형을 다시 맞추는 데 도움이 된다"고 덧붙였다.
전문가들은 구글의 접근 방식이 데이터 부족 문제를 해결하는 창의적인 시도라고 평가했다. 수력 발전 회사 등에 강수량 예측 서비스를 제공하는 업스트림 테크의 마셜 무트노 최고경영자(CEO)는 "지구물리학에서 데이터 부족은 가장 어려운 과제 중 하나"라며 "진실과 비교 평가할 데이터가 부족한 상황에서 데이터를 확보하기 위한 매우 창의적인 접근"이라고 말했다. 구글 연구팀은 향후 폭염이나 산사태와 같이 예측이 중요한 다른 현상에 대한 데이터셋 구축에도 이 기술을 적용할 수 있을 것으로 기대하고 있다.
