Methodology
Citly는 AI 검색 엔진의 답변에 공개적으로 표시되는 출처(Citation)만을 수집합니다. AI 내부 가중치나 로그에는 접근하지 않으며, 측정 가능한 공개 데이터만 사용합니다.
1. 데이터 수집 방식
수집 주기
매주 월요일 새벽 3시, Node.js 배치 스크립트가 자동 실행됩니다. 실시간 조회는 하지 않습니다. 비용 통제와 데이터 안정성을 위해 주 1회 배치 방식을 유지합니다.
수집 AI 엔진
Phase 1 · Perplexity Sonar APIPhase 2 · ChatGPT Search APIPhase 3 · Gemini Search Grounding
현재 Phase 1 단계로 Perplexity Sonar API만 사용합니다. 트래픽 검증 후 순차적으로 엔진을 추가합니다.시드 키워드
총 1,000개의 키워드를 6개 카테고리로 분류해 사용합니다.
테크/IT · 200개
금융/재테크 · 200개
건강/의료 · 200개
맛집/여행 · 200개
커뮤니티/엔터 · 100개
쇼핑/이커머스 · 100개
금융/재테크 · 200개
건강/의료 · 200개
맛집/여행 · 200개
커뮤니티/엔터 · 100개
쇼핑/이커머스 · 100개
2. Query Mix Ratio (쿼리 편향 방지)
특정 유형의 질문에만 편향되지 않도록 4가지 인텐트를 혼합해 쿼리를 구성합니다. 특히 트렌딩 키워드 비율을 20%로 제한해 뉴스성 편향을 방지합니다.
| 유형 | 비율 | 예시 |
|---|---|---|
| Evergreen | 40% | 당뇨 식단, 파이썬 독학 |
| Commercial | 30% | 아이폰 16 추천, VPN 비교 |
| Trending | 20% | 민희진, 대통령 선거 |
| Informational | 10% | 양자역학 설명, NFT 뜻 |
프롬프트 변환
키워드 1개당 3가지 인텐트 프롬프트로 변환해 총 3,000건/주를 수집합니다.
키워드: "아이폰 16"
→ "아이폰 16 실사용 후기 알려줘" (리뷰형)
→ "아이폰 16 장단점 요약해줘" (정보형)
→ "아이폰 16 살만한지 추천해줘" (구매형)
→ "아이폰 16 실사용 후기 알려줘" (리뷰형)
→ "아이폰 16 장단점 요약해줘" (정보형)
→ "아이폰 16 살만한지 추천해줘" (구매형)
3. Hallucinated Citation Filter (환각 URL 제거)
AI가 존재하지 않는 URL을 인용하는 환각(Hallucination) 현상을 필터링합니다. 실제로 접근 가능한 유효한 URL만 랭킹에 반영합니다.
1. HTTP status 확인 → 404 / 410 등 → 제거
2. robots.txt noindex 확인 → 제거
3. canonical URL 정규화 → 중복 통합
4. DNS 조회로 도메인 실존 여부 확인
2. robots.txt noindex 확인 → 제거
3. canonical URL 정규화 → 중복 통합
4. DNS 조회로 도메인 실존 여부 확인
4. Clean URL Rule (URL 정규화)
플랫폼 특성에 따라 도메인 집계 단위를 다르게 적용합니다. 개인 블로그는 개인 단위로, 대형 플랫폼은 플랫폼 단위로 집계합니다.
일반 도메인 · brunch.co.kr → brunch.co.kr
네이버 블로그 · blog.naver.com/userid → blog.naver.com/userid (개인 단위)
티스토리 · userid.tistory.com → userid.tistory.com (개인 단위)
벨로그 · velog.io/@userid → velog.io/@userid (개인 단위)
유튜브 · youtube.com/watch?v=xxx → youtube.com (플랫폼 단위)
네이버 블로그 · blog.naver.com/userid → blog.naver.com/userid (개인 단위)
티스토리 · userid.tistory.com → userid.tistory.com (개인 단위)
벨로그 · velog.io/@userid → velog.io/@userid (개인 단위)
유튜브 · youtube.com/watch?v=xxx → youtube.com (플랫폼 단위)
5. Cite Score 계산 공식
단순 인용 횟수가 아닌 인용 순서와 복수 엔진 인용 여부를 가중치로 반영합니다. 실데이터 수집 후 가중치를 조정할 수 있으며, 변경 시 이 페이지에 공개합니다.
Cite Score =
(총 인용 횟수 × 1.0)
+ (1순위 인용 보너스 × 3.0)
+ (2순위 인용 보너스 × 2.0)
+ (3순위 인용 보너스 × 1.5)
+ (복수 AI 엔진 인용 보너스 × 1.5)
(총 인용 횟수 × 1.0)
+ (1순위 인용 보너스 × 3.0)
+ (2순위 인용 보너스 × 2.0)
+ (3순위 인용 보너스 × 1.5)
+ (복수 AI 엔진 인용 보너스 × 1.5)
현재 공식 버전: v1 · 마지막 업데이트: 2026-05-20
6. Known Limitations
샘플링 편향
수집하는 1,000개 키워드는 전체 검색 공간의 일부입니다. 키워드 선정에 따라 특정 카테고리가 과대/과소 대표될 수 있습니다.
AI 엔진 정책 변경
AI 엔진의 출처 표시 방식이나 API 정책이 변경될 경우 수집 방식도 변경될 수 있습니다.
주간 스냅샷 한계
주 1회 수집이므로 급격한 실시간 변화를 반영하지 못할 수 있습니다.
한국어 편향
현재 한국어 키워드만 수집합니다. 영문 키워드 기반 인용 패턴은 반영되지 않습니다.
면책 문구
본 서비스는 공개된 AI 답변 속 Citation 빈도를 집계한 통계 미디어입니다. Citly의 랭킹은 AI 검색 엔진이 특정 사이트를 신뢰하거나 보증한다는 의미가 아닙니다.
AI Visibility ≠ Truth.
본 서비스는 공개된 AI 답변 속 Citation 빈도를 집계한 통계 미디어입니다. Citly의 랭킹은 AI 검색 엔진이 특정 사이트를 신뢰하거나 보증한다는 의미가 아닙니다.
AI Visibility ≠ Truth.