ChatGPT가 인용하는 콘텐츠 6가지 조건 · Princeton 연구 기반
ChatGPT와 Perplexity는 같은 질문에 같은 답을 하지 않습니다. 같은 질문에 같은 출처를 추천할 확률은 100번에 1번 미만이라는 SparkToro 분석도 있습니다. 그럼에도 세 가지 신뢰성 있는 연구 — Princeton University KDD 2024 논문, BrightEdge 12개월 관측 데이터, ConvertMate 12,500건 쿼리 분석 — 을 교차 확인하면 AI들이 공통으로 선호하는 콘텐츠의 구조적 특성이 뚜렷하게 드러납니다. 6가지 조건입니다. 각각의 조건에 F&B 업종 적용 예시를 더해 정리합니다.
ChatGPT가 출처를 고르는 메커니즘
본격적인 6가지 조건을 정리하기 전에, ChatGPT가 어떻게 출처를 고르는지 짧게 정리하는 게 이해에 도움이 됩니다. ChatGPT는 두 가지 독립된 메커니즘으로 콘텐츠를 참조합니다.
- 학습 기반 응답: 모델이 학습된 시점까지의 웹 콘텐츠를 패턴으로 기억하고, 실시간 검색 없이 바로 답변합니다. 학습 데이터에 브랜드가 자주·정확하게 언급되어 있을수록 자주 인용됩니다.
- 실시간 웹 브라우징: ChatGPT의 브라우징 기능과 OAI-SearchBot이 사용자 질의에 맞춰 웹을 검색해 최신 정보를 가져옵니다. 이때는 2026년 현재 접근 가능한 콘텐츠만 영향을 미칩니다.
BrightEdge 2025년 5월 분석에 따르면 ChatGPT는 답변 10개 중 2개에만 직접 인용 링크를 표시하고 나머지는 학습된 지식을 녹여 답하는 방식입니다. 반면 Perplexity는 답변당 평균 5개 이상의 인용을 명시하고, Google AI Overview는 그 중간 수준입니다. 즉 ChatGPT에 대해서는 "직접 인용 링크"보다 "브랜드 언급 자체"가 더 중요한 지표입니다.
6가지 조건 — 세 가지 연구가 동의하는 공통점
ConvertMate의 2026년 벤치마크 스터디(12,500개 쿼리·8,000개 도메인 분석)와 Princeton KDD 2024 논문, BrightEdge 1년간 데이터를 교차 확인했을 때, AI가 인용하는 콘텐츠는 다음 6가지 조건을 공유합니다.
포괄적 심층 — 20,000자 이상의 콘텐츠
얕은 소개글은 이제 AI에 인용되지 않습니다. ConvertMate 분석에서 20,000자 이상의 심층 콘텐츠는 그 이하 대비 4.3배 더 많이 인용되었습니다. Surfer SEO 조사에서도 AI Overview 인용 기사는 일반 상위 순위 기사보다 핵심 사실을 62% 더 많이 포함했습니다. AI는 "한 페이지 안에서 충분한 답"을 할 수 있는 콘텐츠를 선호합니다.
구조화 헤더 계층 — H1/H2/H3의 명확한 설계
AI는 긴 글을 통째로 삼키지 않습니다. H1 → H2 → H3의 계층이 명확한 섹션 단위로 분해해 관련성 높은 부분만 추출합니다. ConvertMate 분석에서 AI 인용 페이지의 68.7%가 명확한 헤더 계층 구조를 갖췄고, 그렇지 않은 페이지는 동일 주제 안에서도 잘 인용되지 않았습니다. 특히 H2 제목이 사용자가 실제로 물어볼 법한 질문 형태일 때 효과가 큽니다.
원본 통계·데이터 — 숫자 기반 권위 신호
Princeton 연구는 "통계, 인용, 구조화된 리스트를 포함한 콘텐츠가 그렇지 않은 콘텐츠 대비 AI 응답 내 가시성을 30~40% 끌어올린다"는 결론을 내렸습니다. AI는 구체적 숫자를 답변의 팩트 앵커로 사용하기 때문입니다. 단 인용할 수 있는 숫자는 출처가 명확하고 확인 가능한 통계여야 합니다.
최신성 — 30일 이내 업데이트된 콘텐츠
Ahrefs가 1,700만 건 인용을 분석한 결과 AI가 인용한 콘텐츠는 일반 조직 검색 상위 콘텐츠보다 평균 25.7% "더 신선"했습니다. ConvertMate 데이터에서는 30일 이내 업데이트된 콘텐츠가 인용 빈도에서 3.2배의 배수 효과를 보였습니다. 특히 Perplexity는 실시간 웹 검색 비중이 높아 최신성에 매우 민감합니다.
JSON-LD 구조화 데이터 마크업
AI 크롤러는 HTML 본문보다 JSON-LD 스키마로 명시된 데이터를 훨씬 신뢰합니다. ConvertMate 분석에서 AI 인용 페이지의 61%가 JSON-LD를 적용했으며, 특히 FAQPage·Article·Organization·LocalBusiness 스키마가 인용률 상승과 강한 상관관계를 보였습니다. 구글 공식 AI 검색 가이드(2025.05)도 구조화 데이터가 AI 검색 환경에서 여전히 중요한 신호임을 명시합니다.
크롤러 접근 허용 + E-E-A-T 신호
위 5가지가 아무리 완벽해도 AI 크롤러가 사이트에 접근하지 못하면 0점입니다. robots.txt에 GPTBot·OAI-SearchBot·PerplexityBot·ClaudeBot·Google-Extended·Applebot-Extended를 명시적으로 허용해야 합니다. 추가로 /llms.txt 파일을 두어 AI 크롤러 전용 사이트 요약을 제공합니다.
동시에 구글 공식 AI 검색 가이드는 E-E-A-T 신호(전문성·경험·권위·신뢰)가 AI 검색에서도 그대로 유효함을 명시합니다. 저자 실명·약력, 최종 업데이트 일자, 권위 있는 외부 인용, 실제 경험 사례, 제3자 언급·리뷰가 모두 E-E-A-T를 구성하는 요소입니다.
플랫폼별 인용 패턴의 차이
위 6가지 조건은 세 플랫폼에 공통으로 적용되지만, 실제 인용 행태는 플랫폼마다 상당히 다릅니다. BrightEdge 2025년 5월 분석과 2026년 2월 업데이트 기준으로 정리한 패턴입니다.
이 세 플랫폼 차이는 실제 운영 전략을 플랫폼별로 조정해야 함을 의미합니다. ChatGPT 대응은 "학습 데이터에 자주 노출되는 누적 권위 빌드업" 방식, Perplexity는 "최신 콘텐츠 지속 발행" 방식, AI Overview는 "구조화 데이터와 FAQ 스키마 강화" 방식이 효과적입니다.
TalkB는 파트너사에 매달 4대 AI 플랫폼에서 동일한 질문을 테스트한 인용 결과를 제공해, 플랫폼별 인용률 차이를 시각화하여 전달합니다. ChatGPT와 Perplexity에서 인용률이 다르게 움직이는 경우가 많고, 이 편차가 전략 조정의 근거가 됩니다.
F&B 업종의 특수성 — AI Overview 폭증 섹터
BrightEdge의 1년간 추적 데이터에서 가장 눈에 띄는 변화는 식당업의 AI Overview 노출률 폭증입니다. 2025년 2월 10%에서 2026년 2월 78%로 1년 만에 약 780% 증가했으며, 2025년 3월 Google 코어 업데이트에서는 식당업 AI Overview 노출률이 단독으로 +387% 급등했습니다.
배경은 사용자 쿼리 자체의 변화입니다. BrightEdge 분석에 따르면 식당업 쿼리의 32%가 복수 의도(multiple intent)를 갖습니다 — 예: "주차 되는 아이 데려갈 만한 한식당". 이런 복합 질문은 단일 키워드 SEO로는 답하기 어렵고 AI의 종합 판단이 필요해, AI Overview 노출이 자연스럽게 증가했습니다.
AI Overview에 인용되는 식당업 페이지 중 Google 상위 100위에 드는 비율은 약 24%에 불과합니다. 식당업 브랜드가 SEO 1위를 차지해도 AI Overview 인용은 별개의 싸움이라는 뜻입니다. 전통 SEO와 GEO를 별개의 트랙으로 동시 운영해야 합니다.
TalkB의 6가지 조건 진단 방법
TalkB는 파트너 브랜드 사이트를 6가지 조건별로 0~100점 점수로 진단합니다. 진단 후 구조 점수와 실제 인용률(25문항 4뎁스 테스트) 사이의 상관관계를 추적하여, 어느 조건에 투자했을 때 어떤 플랫폼에서 인용률이 올라가는지 실측합니다.
- 구조 진단 (Week 1) 6가지 조건별 현재 상태를 점검합니다. 콘텐츠 심도 분포, 헤더 계층, 원본 통계 개수, 최종 업데이트 일자, JSON-LD 적용 여부, 크롤러 허용 설정, E-E-A-T 신호 현황. 각 조건을 0~100점으로 산출.
- Before 인용률 측정 (Week 1) 25문항 4뎁스 질문을 ChatGPT·Perplexity·Gemini·Claude 4대 AI에 테스트. 뎁스별(D0 일반 탐색, D1 프랜차이즈 탐색, D2 카테고리, D3 브랜드 직접) 인용률과 정확도 기록.
- 우선순위 개선 (Week 2~4) 6가지 조건 중 가장 취약한 3개를 선별해 우선 개선. 일반적으로 JSON-LD·크롤러 허용·최신성 3가지가 빠른 개선이 가능한 영역.
- 매달 추적 리포트 매달 동일 25문항을 재테스트해 Before 대비 변화를 기록. 어느 조건 개선이 어느 플랫폼 인용률에 영향을 주었는지 상관관계 도출. 이 데이터가 다음 달 작업 우선순위가 됩니다.
자주 묻는 질문
Q. 6가지 조건 중 가장 중요한 것은?
모든 조건이 연결되어 있지만 2번(헤더 계층)과 5번(JSON-LD)이 가장 즉각적 효과를 냅니다. 콘텐츠 심도와 원본 통계(1·3번)는 쓰는 데 시간이 걸리는 반면, 헤더 재구성과 JSON-LD 삽입은 기존 콘텐츠에 구조만 얹으면 되어 단기 개선이 큽니다. 다만 장기적으로는 1번(심층 콘텐츠)이 누적 권위를 만들어 ChatGPT 인용에 결정적 영향을 줍니다.
Q. 콘텐츠가 20,000자 미만이면 인용이 안 되나요?
반드시 안 되는 건 아닙니다. ConvertMate 데이터는 "4.3배 더 많이"이지 "전혀 안 됨"이 아닙니다. 핵심은 해당 질문에 대한 답을 그 페이지 안에서 완결해서 주는 것이지 단순 단어 수가 아닙니다. 짧아도 답변의 완결성과 구체성이 충분하면 인용됩니다. 단, 동일 주제를 다룬 경쟁 페이지가 길고 심도 있는 경우에는 분명히 불리합니다.
Q. llms.txt는 꼭 만들어야 하나요?
2026년 현재 llms.txt는 업계 표준으로 굳어가는 중이지만 필수는 아닙니다. OpenAI·Anthropic·Google 모두 표준 robots.txt로 크롤러 제어를 처리하며, llms.txt는 추가 보완 역할입니다. 다만 AI 크롤러 전용 사이트 요약을 제공하면 "이 사이트가 AI 시대에 맞춘 사이트"라는 시그널이 되어 간접 효과가 있습니다. 추가 비용이 크지 않으니 두는 쪽을 추천합니다.
Q. 한국어 콘텐츠도 동일한 조건이 적용되나요?
네, 6가지 조건의 구조적 성격은 언어와 무관합니다. 다만 절대적 콘텐츠 양 기준(20,000자)은 한국어의 경우 표현 밀도가 영어보다 높아 약간 낮은 글자 수에서도 유사 효과가 관찰됩니다. 또 한국어 AI 답변은 아직 일부 플랫폼(특히 Perplexity)에서 영어 답변 대비 학습량이 적어, 초기 인용률 반응이 더 느릴 수 있습니다. TalkB는 이 특성을 감안해 한국어 권위 출처(공정위·KOSIS·KCC 등)를 우선 인용하도록 설계합니다.
우리 사이트 6가지 조건,
몇 점일까?
1:1 상담에서 귀 브랜드 사이트의 6가지 조건 점수를 무료로 진단해 드립니다. 30분 내 전체 구조 점수와 가장 취약한 2~3개 영역이 도출됩니다.
무료 진단 신청- Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan, Deshpande. "GEO: Generative Engine Optimization." Princeton University · Georgia Tech · Allen Institute for AI · IIT Delhi. KDD 2024. collaborate.princeton.edu
- ConvertMate. "GEO Benchmark Study 2026: What Actually Drives Visibility in Generative Search." 12,500 queries · 8,000 domains. convertmate.io/research/geo-benchmark-2026
- BrightEdge. "AI Overviews at the One-Year Mark: Presence, Size, and What They're Citing." 2026.02. brightedge.com
- BrightEdge. "Google AI Overviews Surge 58% Across 9 Industries." Feb 2025 ~ Feb 2026.
- Google Search Central. "Key ways to improve content performance in AI search environments." 2025.05. developers.google.com/search/blog/2025/05
- OpenAI. "GPTBot Documentation." platform.openai.com/docs/gptbot
- Mentionable. "How to Get Cited by ChatGPT: OpenAI Citation Best Practices." 2026.
- The Digital Bloom. "2026 AI Citation Position & Revenue Report." 2026.03.