반도체 기업 엔비디아가 챗GPT와 같은 현재의 AI 시스템을 구형으로 만들 수 있는 강력한 신규 AI 프로세서를 공개할 준비를 하고 있다.
14일(현지시간) IT 전문매체 크립토폴리탄에 따르면 엔비디아는 연례 개발자 콘퍼런스 'GTC'에서 AI 추론에 최적화된 새로운 플랫폼을 선보일 예정이다. AI 추론은 학습된 모델이 사용자 질문에 대한 답변을 생성하는 단계를 의미한다.
이 신규 칩은 지난해 12월 엔비디아가 약 200억달러(약 28조8000억원)를 들여 AI 반도체 스타트업 그로크(Groq)의 기술을 확보하고 핵심 인력을 영입한 첫 가시적 결과물이다. 당시 젠슨 황 엔비디아 최고경영자(CEO)는 "그로크의 저지연 프로세서를 엔비디아 AI 팩토리 아키텍처에 통합할 계획"이라고 밝힌 바 있다.
월스트리트저널(WSJ)은 오픈AI를 비롯한 주요 고객사들이 이 칩을 채택할 가능성이 높으며, 오픈AI 추론 작업량의 약 10%를 처리할 수 있을 것으로 전망했다. 이 칩은 기존 AI 학습과 추론을 모두 처리하던 GPU와 달리, 추론에만 특화돼 더 빠르고 효율적인 응답 생성이 가능하다.
엔비디아는 신규 칩에 기존 고대역폭메모리(HBM) 대신 SRAM을 사용할 것으로 알려졌다. 최근 공급난을 겪는 HBM과 달리 SRAM은 접근성이 높고 AI 추론 작업의 성능을 개선할 수 있다는 장점이 있다.
시장에선 엔비디아의 독주에 제동을 걸려는 경쟁사들의 움직임도 빨라지고 있다. 메타는 최근 자체 개발한 추론용 프로세서 4종을 공개했다. 시드 셰스 디매트릭스 CEO는 "완성된 AI 모델을 실행하는 것은 학습과 다른 프로그래밍이 필요해 개발자들이 엔비디아 외 다른 경쟁사를 선택할 수 있다"고 지적했다.
그럼에도 시장은 추론 분야의 성장 가능성을 높게 보고 있다. 뱅크오브아메리카는 AI 데이터센터 지출에서 추론이 차지하는 비중이 지난해 50%에서 2030년 75%까지 늘어날 것으로 예상했다. 2030년 관련 시장 규모는 약 1조2000억달러(약 1728조원)에 달할 전망이다.
한편 엔비디아는 차세대 AI 칩 '베라 루빈' 출시 계획도 공개하며 기술 초격차를 이어간다는 전략이다. 젠슨 황 CEO에 따르면 루빈 칩은 2026년 하반기, 고성능 버전인 '울트라'는 2027년에 출시될 예정이다. 루빈 시스템은 단일 칩에 576개의 개별 GPU를 결합해 현재 72개 GPU를 탑재한 블랙웰 시스템을 크게 뛰어넘는 성능을 보일 것으로 기대된다.
