RAG 성능은 Chunking과 Embedding에서 갈린다
RAG 검색 정확도를 결정하는 보이지 않는 설계 포인트인 chunking과 embedding의 의미와 튜닝 기준을 정리합니다.
Corpus 구성, chunking, embedding, vector DB, re-ranking, 검색 정확도와 latency 사이의 균형을 다룹니다.
RAG 검색 정확도를 결정하는 보이지 않는 설계 포인트인 chunking과 embedding의 의미와 튜닝 기준을 정리합니다.
Top-k, Re-ranking, context 길이, latency와 비용 사이에서 운영 가능한 RAG 검색 전략을 설계하는 방법을 다룹니다.