엔비디아가 스마트폰 시대를 연 아이폰에 비견되는 새로운 PC용 프로세서를 공개하며 '에이전트 AI' 시대의 본격적인 개막을 알렸다.
15일 IBK투자증권은 'NVIDIA GTC Taipei / COMPUTEX 2026 참관기' 보고서를 통해 이같이 밝혔다. 김운호 연구원은 젠슨 황 엔비디아 최고경영자(CEO)가 컴퓨텍스 2026 기조연설에서 제시한 AI 산업의 새로운 방향성을 분석했다.
보고서에 따르면 젠슨 황 CEO는 PC를 AI 컴퓨터로 진화시킬 'RTX 스파크' 프로세서를 공개했다. 그는 이 제품을 스마트폰 시대를 개척한 아이폰에 비유하며, AI 연산이 데이터센터에서 개인 기기로 확장될 것을 시사했다.
엔비디아는 AI가 단순 생성을 넘어 스스로 추론하고 계획하며 작업을 실행하는 '에이전트 AI' 단계로 발전했다고 진단했다. 에이전트 AI는 기존 생성형 AI보다 100배 많은 '토큰'을 요구하는 것으로 분석됐다. 토큰은 AI가 정보를 처리하는 기본 단위다.
실제로 16개 단어 수준의 단순 질문도 처리 과정에서 4만2025개의 토큰이 발생하며 13.1GB의 메모리(KV 캐시)를 차지하는 것으로 나타났다. 보고서는 2024년 9.7조개였던 전 세계 토큰 생성량이 2026년에는 3200조개로 330배 폭증할 것으로 전망했다.
엔비디아는 데이터센터용 차세대 시스템 '베라 루빈'의 전면 양산 돌입을 선언했다. 이 시스템은 케이블과 팬을 없애 조립 시간을 기존 2시간에서 5분으로 단축했으며, 공급망 규모는 이전 세대 대비 2배 확대됐다.
토큰 사용량 폭증은 메모리 수요 급증으로 이어진다. 보고서는 AI 서버의 메모리 계층이 기존 HBM, D램 외에 SSD를 활용한 'KV 캐시 계층'이 추가되는 형태로 재편될 것이라고 분석했다. 솔리디임 분석에 따르면 SSD를 활용할 경우 첫 토큰 생성 시간(TTFT)이 27배 빨라진다.
반면 웨스턴디지털(WD)은 데이터가 계속 누적되는 AI 시대에 대용량 데이터 저장을 위한 HDD의 경제적 이점을 강조했다. 100엑사바이트(EB) 규모에서 HDD는 QLC SSD 대비 1조5000억원의 비용 차이를 보인다고 주장했다. 이에 AI 시대의 저장 장치 아키텍처는 4단계로 변화할 것으로 전망됐다.
보고서는 AI 산업의 병목 현상이 연산(Compute)에서 메모리 대역폭을 거쳐 '연결성(Connectivity)'으로 이동하고 있다고 지적했다. 마이크로소프트는 "이제 빛의 속도가 핵심 병목"이라고 언급했으며, 이로 인해 랙 내부 연결도 구리선에서 광케이블로 전환되는 'CPO(Co-Packaged Optics)' 기술이 핵심으로 부상했다.
경쟁사들도 에이전트 AI 시대를 준비하고 있다. 인텔은 에이전트 AI 환경에서 CPU의 중요성이 GPU와 대등해질 것으로 보고 신제품 '제온 6 플러스'를 출시했다. 퀄컴은 2026년을 '에이전트의 해'로 정의하며 기기 중심의 AI 전략을 강조했다.
김운호 연구원은 보고서에서 "한국은 메모리, 파운드리, 기판뿐 아니라 클라우드, 로봇, 자율주행차 등 AI 관련 완벽한 생태계를 보유했다"고 평가했다. 젠슨 황 CEO 역시 한국에서 GTC 개최 의향을 표명한 바 있다.

