대규모 언어 모델 연구 동향

A Survey of Large Language Models

Wayne Xin Zhao, Kun Zhou, Junyi Li 외 5인·Frontiers of Computer Science·발표 2026.05· 1,411 인용

최근 1년 511회 인용· 분야 최상위

한국어 핵심 요약

대규모 언어 모델(LLM)의 급속한 발전은 인공지능 분야에 혁신적인 변화를 가져왔으며, 연구 패러다임과 실제 응용 분야를 재편하고 있습니다. 전례 없는 규모와 향상된 역량을 특징으로 하는 LLM은 그 개발, 동작 및 사회적 영향을 이해하기 위한 새로운 프레임워크를 요구합니다. 본 조사는 LLM 기술의 최근 발전을 네 가지 핵심 차원에서 체계적으로 검토합니다. 첫째, 대규모 자기 지도 학습, 아키텍처 혁신, 데이터 큐레이션 전략을 통해 모델의 핵심 역량을 확립하는 사전 학습 방법론을 다룹니다. 둘째, 지도 미세 조정 및 강화 학습을 포함하여 기본 모델을 다운스트림 작업에 적응시키고 정렬 및 안전성을 향상시키는 사후 학습 기술을 분석합니다. 셋째, 인컨텍스트 학습, 프롬프트 엔지니어링, 에이전트 추론과 같은 활용 전략을 통해 실제 배포를 최적화하고 외부 환경과의 효과적인 상호 작용을 가능하게 합니다. 넷째, 핵심 언어 능력, 추론, 안전성과 같은 주요 능력 차원에 대한 벤치마크를 포함하는 평가 방법을 통해 모델 성능의 포괄적이고 신뢰할 수 있는 평가를 지원합니다. 또한, 이론적 토대, 효율적인 스케일링, 정렬, 에이전트 역량과 관련된 중요한 연구 과제를 식별하고, 이들이 제시하는 미해결 난제들을 강조합니다. 본 조사는 최신 통찰력과 새로운 트렌드를 종합하여 LLM 발전의 궤적, 현재 한계 및 미래 방향을 이해하기 위한 체계적이고 포괄적인 프레임워크를 제공하고자 합니다.

섹션 미리보기

연구 배경

대규모 언어 모델(LLM)은 인공지능 분야에 혁명적인 변화를 가져왔으며, 기존 연구 및 응용 방식을 근본적으로 바꾸고 있습니다. 이러한 모델의 전례 없는 규모와 고도화된 능력은 그 복잡한 특성을 이해하기 위한 새로운 분석 프레임워크의 필요성을 제기합니다.

핵심 발견

본 연구는 LLM 기술 발전을 사전 학습, 사후 학습, 활용 전략, 평가 방법론의 네 가지 핵심 차원에서 체계적으로 분석합니다. 이를 통해 LLM의 핵심 역량 구축부터 실제 적용 및 성능 평가에 이르는 전반적인 과정을 조망하며, 이론적 기반, 효율적 스케일링, 정렬, 에이전트 역량 등 주요 연구 과제와 미래 방향을 제시합니다.

전체 8개 섹션 분석

내가 읽고 있는 논문도 이렇게 정리해드릴게요

연구 배경 · 방법론 · 결과 · 한계점까지 8개 섹션 풀 분석. PDF 업로드 한 번이면 끝.

내 논문 분석하기

대규모 언어 모델 연구 동향

연구 배경

핵심 발견

내가 읽고 있는 논문도 이렇게 정리해드릴게요

관련 컴퓨터 과학 논문

다중 데이터 양식 AI 생성 콘텐츠 연구

의료 조언 LLM의 프롬프트 주입 취약성

대형 컨볼루션 커널 기반 범용 표현 학습

생성형 AI 기반 자율형 장애 복구 시스템