제미나이-SQL2는 무엇인가

제미나이-SQL2는 사용자의 자연어 질문을 실행 가능한 SQL 쿼리로 변환하는 구글의 텍스트-투-SQL 모델입니다. AI타임스에 따르면 이 모델은 2026년 공개된 제미나이 3.1 프로를 기반으로 개발됐습니다. 사용자가 "지난달 매출 상위 10개 상품을 보여줘"처럼 평소 말로 질문하면, 모델이 이를 데이터베이스에서 곧바로 실행할 수 있는 SQL 문으로 바꿔 줍니다. SQL 문법을 몰라도 데이터를 다룰 수 있다는 점이 핵심입니다.

제미나이-SQL2는 기업의 비즈니스 데이터 분석과 데이터 엔지니어링 업무에 쓰입니다. AI타임스에 따르면 2026년 활용처로 기업의 비즈니스 데이터 분석, 데이터 엔지니어링, 그리고 SaaS 기업의 "데이터에게 질문하기" 기능이 꼽힙니다. SQL을 다루지 못하는 현업 담당자가 직접 자연어로 데이터를 조회할 수 있어, 분석 요청을 데이터팀에 넘기고 기다리던 병목을 줄여 줍니다.

기존 방식과 무엇이 다른가

제미나이-SQL2는 이전 버전 제미나이-SQL보다 BIRD 실행 정확도가 76.13%에서 80.04%로 높아졌습니다. AI타임스에 따르면 신형 모델은 제미나이 3.1 프로를 기반으로 단일 학습 모델 부문에서 새 기록을 세웠습니다. 2026년 두 모델의 차이는 아래 표와 같습니다.

구글 제미나이-SQL2 공개: 자연어를 SQL로 바꾸는 텍스트-투-SQL 모델

구글은 2026년 자연어 질문을 SQL 쿼리로 변환하는 제미나이-SQL2를 공개했고 BIRD 벤치마크 실행 정확도 80.04%를 기록했다. AI타임스에 따르면 이 수치는 단일 학습 모델 부문에서 새 기록이며, 이전 버전 제미나이-SQL의 76.13%를 약 4포인트 끌어올린 성과이다. 텍스트-투-SQL은 SQL을 모르는 사용자도 평소 말로 데이터에게 질문해 답을 얻게 한다.

자연어 한 문장이 SQL이 되기까지

제미나이-SQL2는 사용자의 자연어 질문을 실행 가능한 SQL 쿼리로 변환하는 구글의 텍스트-투-SQL 모델이다. AI타임스에 따르면 이 모델은 2026년 공개된 제미나이 3.1 프로를 기반으로 개발됐다. 사용자가 "지난달 매출 상위 10개 상품을 보여줘"처럼 평소 말로 질문하면, 모델이 이를 데이터베이스에서 곧바로 실행할 수 있는 SQL 문으로 바꿔 준다. SQL 문법을 몰라도 데이터를 다룰 수 있다는 점이 핵심이다.

80.04%라는 숫자를 어떻게 읽어야 하나

정확도 80.04%는 제미나이-SQL2가 만든 SQL 쿼리 100개 중 약 80개가 정답과 같은 결과를 실행해 냈다는 뜻이다. AI타임스에 따르면 이 수치는 BIRD 벤치마크의 실행 정확도로, 쿼리 문장이 비슷한지가 아니라 실제로 데이터베이스에서 돌렸을 때 올바른 결과가 나오는지를 측정한다. 여기서 눈여겨볼 대목은 측정 기준 자체다. 문장 유사도가 아니라 실행 결과를 본다는 것은, 문법은 그럴듯해도 엉뚱한 답을 내는 쿼리를 걸러 낸다는 의미다. 즉 80.04%는 "말이 되는" 쿼리 비율이 아니라 "실제로 맞는 답을 내는" 쿼리 비율이다. 실무 관점에서 후자가 훨씬 엄격한 잣대다.

인간 전문가 92.96%와의 12.9포인트, 이 격차의 무게

2026년 기록된 80.04%는 인간 전문가 수준인 92.96%와 12.9포인트 차이로, 아직 사람을 완전히 대체하기보다 보조하는 단계임을 보여준다. 이 격차를 어떻게 볼지가 도입을 검토하는 쪽의 핵심 판단점이다. 쿼리 다섯 개 중 하나가 틀릴 수 있다는 뜻이므로, 결과를 그대로 의사결정에 쓰기보다 사람이 확인하는 절차가 여전히 필요하다. 반대로 초안 작성이나 반복 조회처럼 검증이 쉬운 작업에서는 12.9포인트의 간극이 큰 문제가 되지 않는다. 자동화 대상을 "틀려도 즉시 알 수 있는 일"부터 고르는 편이 안전하다.

어떤 벤치마크로 측정했나

제미나이-SQL2의 성능은 텍스트-투-SQL 분야 표준 평가인 BIRD 리더보드로 측정됐다. AI타임스에 따르면 BIRD 벤치마크는 37개 전문 분야, 95개 데이터베이스, 12,751개의 질문-SQL 쌍으로 구성되며 전체 규모는 33.4GB에 달한다. 2026년 기준 이 벤치마크는 실제 산업 데이터에 가까운 복잡한 질의를 다루기 때문에, 단순 예제가 아니라 현실적인 데이터 분석 난이도를 평가한다는 점에서 신뢰도가 높다.

데이터팀 병목을 겨냥한 활용처

제미나이-SQL2는 기업의 비즈니스 데이터 분석과 데이터 엔지니어링 업무에 쓰인다. AI타임스에 따르면 2026년 활용처로 기업의 비즈니스 데이터 분석, 데이터 엔지니어링, 그리고 SaaS 기업의 "데이터에게 질문하기" 기능이 꼽힌다. SQL을 다루지 못하는 현업 담당자가 직접 자연어로 데이터를 조회할 수 있어, 분석 요청을 데이터팀에 넘기고 기다리던 병목을 줄여 준다.

이전 세대와의 4포인트, 무엇이 달라졌나

제미나이-SQL2는 이전 버전 제미나이-SQL보다 BIRD 실행 정확도가 76.13%에서 80.04%로 높아졌다. AI타임스에 따르면 신형 모델은 제미나이 3.1 프로를 기반으로 단일 학습 모델 부문에서 새 기록을 세웠다. 2026년 두 모델의 차이는 아래 표와 같다.

구분	제미나이-SQL	제미나이-SQL2
BIRD 실행 정확도	76.13%	80.04%
기반 모델	이전 세대 제미나이	제미나이 3.1 프로
인간 전문가와 격차	더 큼	12.9포인트
부문 기록	-	단일 학습 모델 신기록

한국 실무자가 기억할 점과 한계

한국 기업 환경에서 이 발표를 읽을 때는 몇 가지를 구분해야 한다. 첫째, 80.04%는 BIRD라는 영어권 벤치마크 결과이며 한국어 질문이나 국내 데이터 스키마에서 같은 정확도가 나온다는 보장은 없다. 둘째, "단일 학습 모델 부문 신기록"이라는 표현은 여러 모델을 조합한 방식과 구분한 순위이므로, 실제 서비스에서 쓰는 앙상블 구성과는 비교 기준이 다르다. 셋째, 공개된 근거는 AI타임스와 바이라인네트워크 보도에 기반하며 구글의 원자료가 아니다. 그럼에도 이전 세대 대비 약 4포인트 상승은 텍스트-투-SQL이 현업 보조 도구로 빠르게 실용화되고 있다는 신호로 읽을 만하다.