AIGC를 위한 검색 증강 생성: 서베이
인공지능 생성 콘텐츠(AIGC)는 모델 알고리즘 발전, 대규모 기반 모델 성장, 고품질 데이터셋 접근성 향상에 힘입어 빠르게 발전했습니다. 하지만 AIGC는 지식 업데이트, 롱테일 데이터 처리, 데이터 유출 완화, 높은 훈련 및 추론 비용 관리 등 여러 난관에 직면해 있습니다. 이러한 문제 해결을 위해 최근 검색 증강 생성(RAG) 패러다임이 부상했습니다. RAG는 정보 검색 과정을 도입하여 관련성 높은 객체를 데이터 저장소에서 검색함으로써 생성 정확도와 견고성을 향상시킵니다. 본 서베이 논문은 AIGC 시나리오에 RAG 기술을 통합하려는 기존 연구들을 종합적으로 검토합니다. 저희는 먼저 검색기가 생성기를 증강하는 방식에 따라 RAG의 기반을 분류하고, 다양한 검색기와 생성기를 위한 증강 방법론의 근본적인 추상화를 도출합니다. 이 통합된 관점은 모든 RAG 시나리오를 포괄하며, 미래 발전에 기여할 핵심 기술들을 조명합니다. 또한 RAG 시스템의 효과적인 엔지니어링 및 구현을 돕는 추가적인 개선 방법들을 요약합니다. 나아가, 다양한 모달리티와 태스크에 걸친 RAG의 실제 적용 사례들을 조사하여 연구자와 실무자에게 유용한 참고 자료를 제공합니다. 마지막으로 RAG 벤치마크를 소개하고, 현재 RAG 시스템의 한계를 논의하며, 미래 연구를 위한 잠재적 방향을 제시합니다.