AI에 인용되려면 '예쁜 정리'가 아니다: 25만 번 실험이 가른 4가지 관문
AI 답변엔진에 인용되는 콘텐츠를 가르는 것은 깔끔한 포맷이 아니라 주제 정합·최신성·노출 위치·근거입니다. 2026년 5월 25일 공개된 연구는 GPT-5.2·클로드·제미나이 2.5 등 6개 모델에서 25만 2천 회 시도로 18개 콘텐츠 요인을 비교해, 최신 타임스탬프·주제 정합·리스트 1위가 인용을 가르는 '관문'(오즈비 1만 배 이상)이라고 밝혔습니다. 반면 포맷 변경의 효과는 미미했습니다. ASAP은 이 결과를 1차 출처로 정리합니다.
무엇을 발견했나
핵심은 인용 여부가 콘텐츠 표면 형식이 아니라 몇 개의 결정적 요인에서 갈린다는 점입니다. 연구진은 같은 정보를 한 요인만 바꿔 짝지어 비교하는 방식으로 18개 요인을 시험했습니다. 그 결과 일부 요인은 모델 6개 전부에서 인용을 좌우한 반면, 형식·구성 같은 요인은 거의 영향을 주지 못했습니다.
인용을 가르는 4가지 관문
인용의 1차 관문은 네 가지이며, 하나라도 실패하면 인용 확률이 사실상 0으로 떨어집니다. 2026년 5월 25일 공개된 수치는 다음과 같습니다.
| 관문 요인 | 효과(오즈비) | 의미 |
|---|---|---|
| 주제 정합 | 1만 배 이상 | 질문 주제와 정확히 맞는가 |
| 최신 타임스탬프 | 1만 배 이상 | 2026년 vs 2019년 |
| 노출 위치 1위 | 1만 배 이상 | 후보 목록 1위 vs 2위 |
| 가격 정보 | 1만 배 이상 | 상거래 질문에서 명시 여부 |
네 요인 모두 오즈비가 1만 배를 넘었습니다. 즉 이 관문들은 가점이 아니라 통과 조건에 가깝습니다.
관문을 넘은 뒤 — 어조와 근거가 2차 변별
관문을 통과한 다음에는 어조와 근거가 인용 여부를 다시 가릅니다. 모델 4개 이상에서 유의했던 2차 요인은 다음과 같습니다.
| 2차 요인 | 효과(오즈비) |
|---|---|
| 확신 어조 vs 회피 어조 | 2.7~754배 |
| 명세·사양 포함 | 8.6~243배 |
| 근거 동반 주장 | 2.1배 이상 |
| 질문 용어 포함 | 6~40배 |
확신에 찬 단정형 문장이 회피적·모호한 문장보다 최대 754배 더 인용됐습니다. 근거를 붙인 주장과 질문의 핵심 용어를 그대로 담은 문장도 일관되게 유리했습니다.
반전: 포맷팅과 사회적 증거는 생각보다 약하다
통념과 달리 형식과 사회적 증거의 효과는 미미했습니다. 구조·정보 배치 같은 포맷 변경은 인용에 거의 영향을 주지 못했습니다. 평점·리뷰 같은 사회적 증거와 가치 제안 강도도 6개 모델 중 2~3개에서만 유의해, 보편적 설득력이라는 가정과 어긋났습니다. '예쁘게 정리하면 인용된다'는 직관은 데이터로 뒷받침되지 않았습니다.
의미
25만 회 실험 결과는 AEO의 우선순위가 형식이 아니라 콘텐츠 본질에 있음을 분명히 합니다. 인용을 원한다면 형식을 다듬기 전에 주제 정합·최신성·근거·단정형 어조부터 맞춰야 합니다. ASAP이 글마다 적용하는 규칙—최신성(2026년 기준), 단정형 두괄식, 수치·고유명사 근거, 질문 용어 반영—은 이 25만 회 실험과 같은 방향을 가리킵니다. 다만 가격 정보는 상거래 질문에 특화된 관문이라, 정보성 콘텐츠에는 최신성·근거·단정이 핵심 레버입니다.
정리
AI 인용은 미감이 아니라 조건의 문제입니다. 6개 모델 25만 회 실험은 주제 정합·최신성·노출 위치를 통과 관문으로, 확신 어조와 근거를 2차 변별 요인으로 지목했고, 포맷팅은 거의 무관하다고 밝혔습니다. 인용되고 싶다면 꾸미기보다 최신성·근거·단정에 먼저 투자해야 합니다.
출처: Rahul Vishwakarma 외, "What Gets Cited: Competitive GEO in AI Answer Engines"(arXiv 2605.25517, 2026-05-25; 6개 모델·4,320개 시나리오·25만 2천 회 시도).
AI·테크 이슈,
가장 빠르게
단순 소식을 넘어, 맥락과 구조까지 파고듭니다
Ai Soon As Possible · asapai.co.kr
