📂 STUDY/AI 시스템 설계 2026. 7. 1.

[AI설계] RAG(Retrieval-Augmented Generation, 검색 증강 생성) - LLM에게 모르는 지식을 주는 법

검색(Retrieval): 질문과&nbsp;관련된&nbsp;문서&nbsp;조각을&nbsp;데이터베이스에서&nbsp;먼저&nbsp;찾아온다
증강(Augumented): 찾아온&nbsp;문서&nbsp;조각을&nbsp;LLM&nbsp;프롬프트에&nbsp;근거로&nbsp;추가(증강)한다
생성(Generation): LLM이&nbsp;그&nbsp;근거를&nbsp;바탕으로&nbsp;답변을&nbsp;생성한다

GitHub 댓글

	키워드 검색	벡터(임베딩) 검색
작동 방식	질문에 등장한 단어가 문서 조각에 몇 번 나오는지 카운팅	질문과 문서 조각을 각각 임베딩 후 코사인 유사도 계산
동의어·유사 의미	✗ — 정확히 같은 단어만	✓ — "강아지"로 검색해도 "개" 관련 문서 찾을 수 있음
비용	없음	임베딩 API 호출 비용·속도
예측 가능성	높음 (결정적, 룰베이스에 가까움)	낮음 — 의미상 무관한데 우연히 벡터가 가까운 경우(false positive) 발생 가능