이더리움 창시자 비탈릭 부테린이 거대 기술 기업과 정부가 인공지능(AI) 안전성 논의를 독점하려는 움직임에 대해 강한 우려를 표명하며 새로운 대안을 제시했다.

13일(현지시간) 암호화폐 전문매체 크립토폴리탄에 따르면 부테린은 소셜미디어 X를 통해 “AI 안전성이라는 개념이 대기업과 국가적 이해관계에 의해 도용되고 있다”고 지적했다. 그는 AI 기업 앤트로픽의 사례를 들며 특정 기업이 안전 조치의 적합성을 스스로 결정하는 것은 결국 '강자에 의해 규칙이 만들어지는' 시스템으로 이어진다고 비판했다.

앤트로픽은 최근 자사 AI 모델 '클로드'를 대량 감시나 자율 무기 개발에 사용하지 못하도록 한 조치로 긍정적 평가를 받았다. 하지만 동시에 모델의 역량이 안전성을 증명할 수 있는 수준을 넘어서면 개발을 무조건 중단하기로 했던 기존의 안전 서약을 철회해 논란을 낳았다.

부테린은 이러한 상황이 AI 안전 규제가 특정 기업이나 국가의 이익을 위한 도구로 변질될 수 있다는 우려를 낳는다고 설명했다. 특히 그는 “AI 안전 규제에서 국가 안보 기관이 예외로 취급된다면 규제 자체가 취약해질 것”이라며 최근 AI 연구소들이 방위 산업체와 수십억달러 규모의 파트너십을 모색하는 상황에 경계심을 드러냈다.

이에 부테린은 AI 기술 자체를 금지하거나 오픈소스를 제한하는 대신 '방어적 가속주의'(d/acc)라는 새로운 철학을 대안으로 제시했다. 이는 위험한 기술을 다루는 최선의 방법이 방어막 역할을 할 기술을 먼저 개발하고 오픈소스로 공개하는 것이라는 개념이다.

실제로 그는 자신의 이념을 뒷받침하기 위해 최근 4000만달러(약 576억원)를 관련 프로젝트에 할당했다. 투자 분야는 해킹 불가능한 컴퓨터 칩을 위한 '보안 하드웨어', 팬데믹 조기 감지를 위한 '생물 방어', AI 기반 공격으로부터 핵심 인프라를 보호하기 위한 '사이버 보안' 등이다.

과거 부테린은 생물학적 위협, 핵전쟁 등 인류의 실존적 위험을 연구하던 퓨처오브라이프 인스티튜트(FLI)의 주요 기부자였다. 그러나 최근 FLI가 AI 모델에 특정 행동을 거부하도록 하는 규제 로비에 집중하자, 그는 이러한 방식이 '탈옥'(jailbreaking) 등으로 쉽게 우회될 수 있는 취약한 해결책이라며 반대 입장을 분명히 하고 있다.