🦉 Lv 4⏱ 25분
RAG 직접 만들어보기
🎯 청킹·임베딩·검색 4단계

코리의 한 마디
RAG는 "AI가 답하기 전에 너의 문서에서 근거를 먼저 찾아 같이 읽고 답하는" 구조야.
핵심 정리
왜 필요한가: AI는 학습 시점 이후 정보를 모름 + 사내·개인 문서는 학습되지 않음. RAG로 둘 다 해결.
기본 4단계: ① 문서 청킹(작은 조각) ② 임베딩(숫자 벡터화) ③ 벡터 DB 저장 ④ 질문 시 유사 조각 검색 → 컨텍스트로 첨부.
청킹 사이즈: 200~500자 권장. 너무 크면 정확도 저하, 너무 작으면 문맥 손실.
리랭킹(rerank)을 추가하면 정확도가 한 단계 더 올라감 — 1차 검색 결과를 다시 점수화.
최소 RAG 의사 코드
// 1. 사용자 질문 임베딩
q_vec = embed(question)
// 2. 상위 5개 유사 청크 조회
top = vectorDB.search(q_vec, k=5)
// 3. 모델에 컨텍스트로 전달
answer = ai.chat([
{role:'system', content: 'You answer using ONLY the provided context.'},
{role:'user', content: `Context:\n${top.join('\n')}\n\nQ: ${question}`}
]) 1분 점검
RAG에서 청킹 사이즈가 너무 크면?
직접 써보기0 / 1000