LLM / RAG

RAG는 검색이 아니라 설계 문제입니다

Corpus 구성, chunking, embedding, vector DB, re-ranking, 검색 정확도와 latency 사이의 균형을 다룹니다.

2025-12-05LLM / RAG8분 읽기

RAG 성능은 Chunking과 Embedding에서 갈린다

RAG 검색 정확도를 결정하는 보이지 않는 설계 포인트인 chunking과 embedding의 의미와 튜닝 기준을 정리합니다.

2025-12-01LLM / RAG7분 읽기

Top-k, Re-ranking, context 길이, latency와 비용 사이에서 운영 가능한 RAG 검색 전략을 설계하는 방법을 다룹니다.