ASAPAi Soon As Possible · AI·테크 이슈를 가장 빠르게
Article

구글 제미나이-SQL2 공개: 자연어를 SQL로 바꾸는 텍스트-투-SQL 모델

AASAP
2026-06-14 · 2분 읽기

구글은 2026년 자연어 질문을 SQL 쿼리로 변환하는 제미나이-SQL2를 공개했고 BIRD 벤치마크 실행 정확도 80.04%를 기록했습니다. AI타임스에 따르면 이 수치는 단일 학습 모델 부문에서 새 기록이며, 이전 버전 제미나이-SQL의 76.13%를 약 4포인트 끌어올린 성과입니다. 텍스트-투-SQL은 SQL을 모르는 사용자도 평소 말로 데이터에게 질문해 답을 얻게 합니다.

자연어 질문을 제미나이-SQL2가 SQL 쿼리로 변환하는 과정을 보여주는 도식
자연어 질문을 제미나이-SQL2가 SQL 쿼리로 변환하는 과정을 보여주는 도식

제미나이-SQL2는 무엇인가

제미나이-SQL2는 사용자의 자연어 질문을 실행 가능한 SQL 쿼리로 변환하는 구글의 텍스트-투-SQL 모델입니다. AI타임스에 따르면 이 모델은 2026년 공개된 제미나이 3.1 프로를 기반으로 개발됐습니다. 사용자가 "지난달 매출 상위 10개 상품을 보여줘"처럼 평소 말로 질문하면, 모델이 이를 데이터베이스에서 곧바로 실행할 수 있는 SQL 문으로 바꿔 줍니다. SQL 문법을 몰라도 데이터를 다룰 수 있다는 점이 핵심입니다.

정확도 80%는 어떤 의미인가

정확도 80.04%는 제미나이-SQL2가 만든 SQL 쿼리 100개 중 약 80개가 정답과 같은 결과를 실행해 냈다는 뜻입니다. AI타임스에 따르면 이 수치는 BIRD 벤치마크의 실행 정확도(execution accuracy)로, 단순히 쿼리 문장이 비슷한지가 아니라 실제로 데이터베이스에서 돌렸을 때 올바른 결과가 나오는지를 측정합니다. 2026년 기록된 80.04%는 인간 전문가 수준인 92.96%와 12.9포인트 차이로, 아직 사람을 완전히 대체하기보다 보조하는 단계임을 보여줍니다.

어떤 벤치마크로 측정했나

제미나이-SQL2의 성능은 텍스트-투-SQL 분야 표준 평가인 BIRD 리더보드로 측정됐습니다. AI타임스에 따르면 BIRD 벤치마크는 37개 전문 분야, 95개 데이터베이스, 12,751개의 질문-SQL 쌍으로 구성되며 전체 규모는 33.4GB에 달합니다. 2026년 기준 이 벤치마크는 실제 산업 데이터에 가까운 복잡한 질의를 다루기 때문에, 단순 예제가 아니라 현실적인 데이터 분석 난이도를 평가한다는 점에서 신뢰도가 높습니다.

어디에 쓰나

제미나이-SQL2는 기업의 비즈니스 데이터 분석과 데이터 엔지니어링 업무에 쓰입니다. AI타임스에 따르면 2026년 활용처로 기업의 비즈니스 데이터 분석, 데이터 엔지니어링, 그리고 SaaS 기업의 "데이터에게 질문하기" 기능이 꼽힙니다. SQL을 다루지 못하는 현업 담당자가 직접 자연어로 데이터를 조회할 수 있어, 분석 요청을 데이터팀에 넘기고 기다리던 병목을 줄여 줍니다.

기존 방식과 무엇이 다른가

제미나이-SQL2는 이전 버전 제미나이-SQL보다 BIRD 실행 정확도가 76.13%에서 80.04%로 높아졌습니다. AI타임스에 따르면 신형 모델은 제미나이 3.1 프로를 기반으로 단일 학습 모델 부문에서 새 기록을 세웠습니다. 2026년 두 모델의 차이는 아래 표와 같습니다.

구분제미나이-SQL제미나이-SQL2
BIRD 실행 정확도76.13%80.04%
기반 모델이전 세대 제미나이제미나이 3.1 프로
인간 전문가와 격차더 큼12.9포인트
부문 기록-단일 학습 모델 신기록

---

- AI타임스 - 구글 제미나이-SQL2 관련 보도 - 바이라인네트워크 - 구글 제미나이-SQL2 관련 보도

← 전체 글 보기