ASAPAi Soon As Possible · AI·테크 이슈를 가장 빠르게
Article

엔비디아 블랙웰, AI 에이전트 하드웨어 벤치마크 1위

AASAP
2026-06-12 · 2분 읽기

엔비디아(NVIDIA)의 블랙웰(Blackwell) GB300 NVL72 플랫폼이 AI 에이전트용 하드웨어 성능을 측정하는 새 벤치마크 'AA-에이전트퍼프(AA-AgentPerf)'에서 1위를 기록했습니다. 아티피셜 애널리시스(Artificial Analysis)가 2026년 도입한 이 벤치마크는 실제 코딩 에이전트 작업을 재현해 전력당 처리 능력을 평가하며, 블랙웰은 이전 세대 호퍼(Hopper) 대비 메가와트당 약 20배 많은 AI 에이전트를 처리한 것으로 나타났습니다. AI 에이전트 시대에 '전력 효율'이 핵심 경쟁 지표로 떠올랐음을 보여줍니다.

엔비디아 블랙웰 GB300이 AA-에이전트퍼프 벤치마크에서 호퍼 대비 메가와트당 20배 많은 AI 에이전트를 처리하며 1위를 기록한 도식
엔비디아 블랙웰 GB300이 AA-에이전트퍼프 벤치마크에서 호퍼 대비 메가와트당 20배 많은 AI 에이전트를 처리하며 1위를 기록한 도식

무엇이 발표됐나

엔비디아 블랙웰이 첫 에이전트 하드웨어 벤치마크에서 선두에 올랐습니다. 아티피셜 애널리시스가 공개한 AA-에이전트퍼프 첫 결과에서 블랙웰 GB300 NVL72가 최고 성능을 기록했고, 같은 평가에서 AMD의 MI355X를 앞섰습니다. 평가에 사용된 모델은 2026년 4월경 공개된 딥시크 V4 프로(DeepSeek V4 Pro)입니다. 엔비디아는 블랙웰이 이전 세대 호퍼보다 메가와트당 약 20배 많은 에이전트를 처리했다고 밝혔습니다.

AA-에이전트퍼프는 무엇을 측정하나

AA-에이전트퍼프는 실제 AI 에이전트 작업을 재현해 하드웨어의 처리 능력을 측정하는 벤치마크입니다. 단발성 질문이 아니라 최대 200턴, 10만 토큰을 넘는 실제 코딩 에이전트 작업 흐름을 재생하며, 서비스 품질 기준(SLA)을 지키면서 한 시스템이 동시에 처리할 수 있는 에이전트 수를 측정합니다. 핵심 지표는 '메가와트당 에이전트 수(Agents per Megawatt)'로, 같은 전력으로 얼마나 많은 에이전트를 감당하는지를 본다는 점이 특징입니다.

왜 전력 효율이 핵심인가

AI 에이전트가 늘수록 데이터센터의 전력이 가장 큰 병목이 되기 때문입니다. 에이전트는 한 번의 질문이 아니라 수십~수백 번의 추론을 연쇄로 수행해, 같은 작업도 훨씬 많은 연산과 전력을 씁니다. 따라서 단순 속도보다 '같은 전력으로 몇 명의 에이전트를 돌릴 수 있는가'가 운영 비용을 좌우합니다. 메가와트당 에이전트 수를 핵심 지표로 삼은 것은, 이제 하드웨어 경쟁이 성능과 전력 효율을 함께 보는 단계로 넘어갔음을 의미합니다.

왜 중요한가

이번 결과는 AI 인프라 경쟁의 무게중심이 '에이전트 처리 효율'로 이동하고 있음을 보여줍니다. 모델 성능뿐 아니라 이를 대규모로 저렴하게 돌리는 하드웨어가 AI 서비스의 수익성을 결정하기 때문입니다. 전력 효율에서 앞선 플랫폼은 같은 전기로 더 많은 사용자를 감당할 수 있어, 데이터센터 투자와 전력 확보 경쟁이 치열한 2026년에 중요한 우위가 됩니다.


출처: Artificial Analysis · NVIDIA Blog · Crypto Briefing

← 전체 글 보기