대규모 언어 모델(LLM)의 급속한 발전은 인공지능 분야의 연구 패러다임과 실제 응용 분야에 혁신적인 변화를 가져왔습니다. 전례 없는 규모와 향상된 역량을 특징으로 하는 LLM은 그 개발, 동작 방식, 그리고 사회적 영향을 이해하기 위한 새로운 프레임워크를 요구합니다.
본 조사는 LLM 기술의 최신 발전을 네 가지 핵심 차원에서 체계적으로 검토합니다. 첫째, 대규모 자기 지도 학습, 아키텍처 혁신, 데이터 큐레이션 전략을 통해 모델의 핵심 역량을 확립하는 사전 학습 방법론을 다룹니다. 둘째, 지도 미세 조정 및 강화 학습을 포함하여 기반 모델을 다운스트림 작업에 적응시키고 정렬 및 안전성을 향상시키는 사후 학습 기법을 분석합니다. 셋째, 인컨텍스트 학습, 프롬프트 엔지니어링, 에이전트 추론과 같은 활용 전략을 통해 실제 배포를 최적화하고 외부 환경과의 효과적인 상호작용을 가능하게 합니다. 넷째, 핵심 언어 능력, 추론, 안전성과 같은 주요 능력 차원에 대한 벤치마크를 포함하여 모델 성능의 포괄적이고 신뢰할 수 있는 평가를 지원하는 평가 방법을 고찰합니다.
또한, 이론적 기반, 효율적인 확장, 정렬, 에이전트 역량과 관련된 중요한 연구 과제를 식별하고, 이들이 제시하는 미해결 난제들을 강조합니다. 본 조사는 최신 통찰력과 새로운 트렌드를 종합하여 LLM 발전의 궤적, 현재의 한계, 그리고 미래 방향을 이해하기 위한 체계적이고 포괄적인 프레임워크를 제공하고자 합니다.
본 연구는 LLM(대규모 언어 모델) 통합 시스템의 신뢰성을 높이기 위한 새로운 이론인 인지 임피던스 매칭 이론(CIMT)을 제안한다. CIMT는 관측 가능하고 메타 정보가 없는 보호 컴파일러 이론으로, 고정된 모델 정책이 주변 환경 재설계를 통해 어떻게 다른 운영 능력을 발휘할 수 있는지 탐구한다.
CIMT는 시스템 수준의 역량 증폭을 모델 가중치 개선 문제가 아닌, 세계 측면의 컴파일 문제로 접근한다. 관측, 유형화된 액션 핸들, 유효성 검사기, 복구 경로, 롤백 모드 등을 통해 시스템의 운영 능력을 향상시킨다. 또한, 명시적인 클레임 및 증거 객체를 활용하며, 커밋된 관측 가능 원장, 목표 평가 채널 등을 사용하여 운영 주장을 정의한다.
이 이론은 인간 검토자나 LLM 평가자를 특권적인 평가자로 간주하지 않고, 명명된 오류 발생 가능한 측정 채널로 모델링한다. 이를 통해 목표 채널 개선, 벡터 부채 회계, 금지 좌표 제로 인증, 목표 방화벽 규율 등 보수적인 인증 프레임워크를 제공한다.
CIMT는 고정 모델 LLM 시스템의 신뢰성을 높이기 위한 실용적이고 형식적인 기반을 제공한다. 특히 관측 가능한 세계 측 인터페이스, 권한, 유효성 검사, 복구 및 감사 설계를 통해 시스템의 견고성을 강화하는 데 기여한다.
이 연구는 거대 언어 모델(LLM)의 역량을 최대로 발휘하기 위한 프롬프트 엔지니어링의 역할을 탐구한다. 프롬프트 엔지니어링은 입력 구조화 과정으로, LLM의 유용성과 정확성을 극대화하는 핵심 기술로 부상했다.
논문은 자기 일관성, CoT(사고의 사슬), 생성 지식 등 모델 성능을 크게 향상시키는 기초 및 고급 프롬프트 엔지니어링 방법론을 심층적으로 다룬다. 또한, 시각 언어 모델(VLM)을 위한 프롬프트 기법들을 상세히 검토하며, 이들의 효능을 주관적 및 객관적 지표로 평가하여 분석의 견고성을 확보한다.
특히, 인공지능 보안 측면에서 프롬프트 엔지니어링의 중요성을 강조한다. 이는 LLM의 취약점을 악용하는 적대적 공격에 대한 방어 전략과 관련되며, 이러한 위험을 최소화하고 모델의 견고성을 향상시키는 전략들을 종합적으로 검토한다.
궁극적으로 본 연구는 프롬프트 엔지니어링의 현재와 미래 연구 및 응용 분야에 대한 통찰을 제공하며, LLM 활용의 새로운 가능성을 제시한다.
보안 소프트웨어 개발에 대규모 언어 모델(LLM)이 통합되면서, 이 모델들이 단순히 취약한 코드를 탐지하는 것을 넘어 표준화된 분류 체계에 따라 취약점을 안정적으로 분류할 수 있는지에 대한 의문이 제기됩니다. 본 연구는 Llama3, Codestral, Deepseek R1 세 가지 최신 LLM을 대상으로, Big-Vul 데이터셋의 선별된 하위 집합과 8가지 대표적인 CWE(Common Weakness Enumeration) 범주를 활용하여 체계적인 평가를 수행했습니다.
폐쇄형 분류 설정을 통해 각 모델의 취약점 존재 식별 및 정확한 CWE 레이블 매핑 성능을 평가했습니다. 연구 결과, 높은 탐지율과 현저히 낮은 분류 정확도 사이에 뚜렷한 대조가 나타났으며, 과도한 일반화와 오분류가 빈번하게 발생했습니다.
또한, 모델별 편향과 일반적인 실패 모드를 분석하여, 현재 LLM이 미세한 보안 추론을 수행하는 데 있어 한계를 밝혀냈습니다. 이러한 통찰은 LLM이 교육 보조 도구로 채택되고 있음에도 불구하고 그 한계가 명확히 이해되어야 하는 교육 환경에서 특히 중요합니다.
학생들 사이에서 오개념이 확산되는 것을 방지하기 위해 LLM의 동작에 대한 미묘한 이해가 필수적입니다. 본 연구 결과는 LLM이 보안에 민감한 환경에 안정적으로 배포되기 전에 해결해야 할 주요 과제를 제시합니다.