빅데이타 & 머신러닝/생성형 AI (ChatGPT etc)

Small to Big Chunking in RAG

Terry Cho 2024. 12. 25. 15:14

RAG에서 Chunk 를 retrieval 할때, 그 Chunk의 위와 아랫부분을 확장해서 같이 리턴하는 방법으로, 더 상세한 컨택스트를 리턴할 수 있다. 언뜻 보면 Parent/Child Chunking 기법과 유사하기는 하지만, 구현이 간단해 보이고, 문장을 중심으로 확장해서 컨택스트를 추출한다는 면에서 훨씬 효과가 있어보인다. 

 

출처 https://www.youtube.com/watch?v=TRjq7t2Ms5I