아마존 EC2 G7 공개: 엔비디아 블랙웰로 AI 추론 4.6배, 벡터 검색 10배

클라우드에서 AI 추론과 벡터 검색이 한 번에 빨라집니다. 엔비디아와 AWS는 2026년 6월 23일 블랙웰 기반 아마존 EC2 G7 인스턴스를 공개했습니다. G7은 엔비디아 RTX PRO 4500 블랙웰 서버 에디션 GPU로 이전 세대 G6 대비 AI 추론을 최대 4.6배 높이고, 아마존 오픈서치 서버리스는 엔비디아 cuVS로 벡터 인덱싱을 최대 10배 빠르게 4분의 1 비용으로 처리합니다. ASAP은 이 발표를 1차 출처 기준으로 정리합니다.

블랙웰 기반 EC2 G7, 추론 4.6배·그래픽 2.1배

아마존 EC2 G7 인스턴스는 엔비디아 RTX PRO 4500 블랙웰 서버 에디션 GPU로 이전 세대 G6 대비 AI 추론을 최대 4.6배, 그래픽을 최대 2.1배 높입니다. 한 인스턴스에 GPU 최대 8장, GPU 메모리 총 256GB, 700Gbps EFA 네트워킹, 7.6TB NVMe SSD를 담습니다. AWS 딥러닝 AMI와 컨테이너, EMR, EKS, ECS에서 바로 쓰고 세이지메이커 AI 지원도 예정입니다.

오픈서치 서버리스 + cuVS, 벡터 인덱싱 10배

아마존 오픈서치 서버리스는 엔비디아 cuVS로 GPU 가속 벡터 인덱싱을 기본 제공해 CPU 대비 최대 10배 빠르게, 4분의 1 비용으로 처리합니다. 엔비디아와 AWS는 10억 규모 벡터 데이터베이스를 한 시간 안에 구축할 수 있다고 밝혔습니다. RAG와 검색 서비스의 색인 비용과 시간을 동시에 줄이는 변화입니다.

GB300 학습까지: AWS, 엔비디아 엑셈플러 클라우드 인증

AWS는 엔비디아 GB300 학습 워크로드에 대해 엔비디아 엑셈플러 클라우드(Exemplar Cloud) 인증을 획득했습니다. 엑셈플러 인증은 엔비디아의 레퍼런스 아키텍처 성능 기준을 충족했다는 의미입니다. 추론용 GPU만이 아니라 대규모 학습 기반까지 검증 범위가 넓어졌습니다.

의미: 추론·검색·학습을 한 클라우드 스택으로

엔비디아와 AWS의 이번 발표는 추론용 G7, 검색용 cuVS, 학습용 GB300을 한 클라우드 스택으로 묶습니다. 4.6배와 10배는 이전 세대와 CPU 대비 최대치라 실제 워크로드에서는 달라질 수 있습니다. 그만큼 같은 클라우드 안에서 추론부터 학습까지 이어지는 통합 운영이 핵심 메시지입니다.

정리

엔비디아와 AWS가 블랙웰 기반 아마존 EC2 G7 인스턴스를 공개했습니다. RTX PRO 4500 블랙웰로 추론 최대 4.6배, 오픈서치 cuVS로 벡터 인덱싱 최대 10배, AWS의 GB300 엑셈플러 클라우드 인증이 핵심입니다. 추론과 검색, 학습이 한 클라우드 스택으로 모입니다.

출처: 엔비디아 블로그 'NVIDIA and AWS Collaborate to Bring AI to Production at Scale'(2026년 6월 23일; 아마존 EC2 G7 + RTX PRO 4500 블랙웰 서버 에디션, G6 대비 AI 추론 최대 4.6배·그래픽 최대 2.1배, GPU 최대 8장·256GB·700Gbps EFA·7.6TB NVMe, 아마존 오픈서치 서버리스 + 엔비디아 cuVS 벡터 인덱싱 최대 10배·4분의 1 비용, 10억 규모 벡터 DB 한 시간 내, AWS 엔비디아 GB300 엑셈플러 클라우드 인증) 기반 ASAP 정리.

아마존 EC2 G7 공개: 엔비디아 블랙웰로 AI 추론 4.6배, 벡터 검색 10배

블랙웰 기반 EC2 G7, 추론 4.6배·그래픽 2.1배

오픈서치 서버리스 + cuVS, 벡터 인덱싱 10배

GB300 학습까지: AWS, 엔비디아 엑셈플러 클라우드 인증

의미: 추론·검색·학습을 한 클라우드 스택으로

정리

관련 글

AI·테크 이슈,가장 빠르게

AI·테크 이슈,
가장 빠르게