상당수 대학생이 과제 수행에 인공지능(AI)을 사용하며 부정행위까지 저지르는 것으로 나타나, 대학의 학생 평가 방식에 대한 근본적인 재검토가 필요하다는 지적이 나왔다.
미국 코넬대와 캘리포니아대 버클리(UC 버클리) 공동 연구팀은 21일(현지시간) 국제학술지 '사이언스'에 이 같은 내용의 연구 결과를 발표했다. 연구팀은 2023-2024학년도 동안 미국 20개 공립 연구대학 소속 학생 9만5000여명을 대상으로 설문조사를 진행했다.
조사 결과, 학생 약 3분의 1이 챗GPT와 같은 생성형 AI를 과제 수행에 정기적으로 사용한다고 답했다. 특히 응답자 중 9%는 AI를 이용해 부정행위를 한 경험이 있는 것으로 추정됐다.
AI 사용률은 전공별로 큰 차이를 보였다. 컴퓨터과학 전공 학생은 62%가 AI를 정기적으로 사용한다고 답해 가장 높은 비율을 보인 반면, 예술 전공 학생은 24%에 그쳤다. 성별과 인종에 따른 격차도 확인됐다. 남학생의 정기 사용률은 45%로 여학생(33%)보다 높았으며, 백인·아시아계 학생(39%)이 소수 인종 학생(29%)보다 사용률이 높았다.
연구팀은 학생들이 부정행위 여부를 솔직하게 답하기 어렵다는 점을 고려해 '리스트 무작위화 실험' 기법을 사용했다. 이 기법은 여러 항목 중 자신에게 해당하는 개수만 답하게 해 민감한 질문에 대한 응답률을 높이는 방식이다.
분석 결과, AI를 매일 사용하는 학생의 부정행위 비율은 26%에 달해 월 단위 사용자(7%)보다 훨씬 높았다. 연구를 공동 저술한 르네 키질첵 코넬대 정보과학과 부교수는 "학생들의 AI 사용이 늘어날수록 부정행위도 증가할 것이 우려된다"고 말했다.
연구팀은 대학의 학문적 무결성을 지키기 위해 학생 평가 방식의 개혁이 시급하다고 강조했다. 구체적인 전략으로는 ▲종이와 펜, 감독관만 있는 통제된 시험 환경으로의 회귀 ▲AI의 허용 가능한 사용에 대한 명확한 지침 설정 ▲AI 활용을 전문 역량으로 평가하는 방식으로의 전환 등을 제안했다.

