EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes

📄 arXiv: 2507.11407v2 📥 PDF

作者: Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Yemuk Choi, Kyubeen Han, Seokhee Hong, Junwon Hwang, Taewan Hwang, Joonwon Jang, Hyojin Jeon, Kijeong Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Euisoon Kim, Hyosang Kim, Jihoon Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Gwangho Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Sangha Park, Young Min Paik, Yongmin Park, Youngyong Park, Sanghyun Seo, Sihoon Yang, Heuiyeen Yeen, Sihyuk Yi, Hyeongu Yun

分类: cs.CL, cs.AI

发布日期: 2025-07-15 (更新: 2026-01-02)

备注: Technical Report, 30 Pages

🔗 代码/项目: HUGGINGFACE


💡 一句话要点

EXAONE 4.0:融合非推理与推理模式的统一大型语言模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 推理能力 非推理模式 Agentic AI 工具使用 多语言支持 模型统一 EXAONE 4.0

📋 核心要点

  1. 现有大型语言模型在推理能力和通用性之间存在权衡,难以同时满足复杂推理和日常应用需求。
  2. EXAONE 4.0通过集成非推理模式和推理模式,旨在统一模型的可用性和高级推理能力,提升整体性能。
  3. EXAONE 4.0在工具使用和多语言支持方面进行了增强,并在不同规模的模型上实现了优异的性能表现。

📝 摘要(中文)

本技术报告介绍了EXAONE 4.0,它集成了非推理模式和推理模式,旨在兼具EXAONE 3.5的卓越可用性和EXAONE Deep的先进推理能力。为了迎接Agentic AI时代的到来,EXAONE 4.0融入了诸如Agentic工具使用等关键特性,并将其多语言能力扩展到支持西班牙语,除英语和韩语外。EXAONE 4.0模型系列包含两种尺寸:针对高性能优化的中型32B模型,以及为设备端应用设计的小型1.2B模型。EXAONE 4.0展示了优于同类开源模型的性能,甚至在与前沿模型竞争时也保持竞争力。这些模型已公开发布,供研究使用,并且可以通过https://huggingface.co/LGAI-EXAONE轻松下载。

🔬 方法详解

问题定义:现有的大型语言模型通常在推理能力和通用性之间做出妥协。一些模型擅长复杂的推理任务,但在日常应用中表现不佳;而另一些模型则更注重通用性,但在需要深度推理的场景下表现不足。EXAONE 4.0旨在解决这一问题,提供一个既具备优秀可用性,又拥有先进推理能力的统一模型。

核心思路:EXAONE 4.0的核心思路是将非推理模式和推理模式集成到一个统一的模型中。非推理模式用于处理日常任务和快速响应,而推理模式则用于处理需要深度思考和逻辑推理的复杂问题。通过这种方式,模型可以根据任务的性质自动选择合适的模式,从而实现最佳性能。

技术框架:EXAONE 4.0的技术框架主要包括两个核心模块:非推理模块和推理模块。非推理模块基于一个高效的语言模型,用于处理常见的语言任务。推理模块则采用更复杂的架构,例如Transformer网络,以支持更高级的推理能力。此外,模型还包含一个模式选择器,用于根据输入任务的特征动态选择合适的模块。

关键创新:EXAONE 4.0最重要的技术创新点在于其统一的架构,能够同时支持非推理和推理模式。这种架构允许模型在不同类型的任务之间无缝切换,从而提高了模型的通用性和效率。此外,EXAONE 4.0还引入了Agentic工具使用功能,使其能够与外部工具进行交互,从而扩展了其应用范围。

关键设计:EXAONE 4.0的关键设计包括模式选择器的设计、推理模块的架构选择以及损失函数的优化。模式选择器需要能够准确地判断输入任务的类型,并选择合适的模块。推理模块的架构需要足够强大,以支持复杂的推理任务。损失函数需要能够平衡非推理和推理模式的性能,并防止模型过度拟合。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

EXAONE 4.0在同类开源模型中表现出卓越的性能,并在某些任务上与前沿模型竞争。具体而言,32B模型在多个基准测试中取得了领先地位,而1.2B模型则在设备端应用中实现了高效的性能。这些结果表明EXAONE 4.0在性能和效率之间取得了良好的平衡。

🎯 应用场景

EXAONE 4.0具有广泛的应用前景,包括智能客服、内容生成、代码生成、教育辅助等领域。其强大的推理能力使其能够处理复杂的查询和请求,提供更准确和有用的信息。此外,其Agentic工具使用功能使其能够自动化执行各种任务,提高工作效率。未来,EXAONE 4.0有望成为各种智能应用的核心引擎。

📄 摘要(原文)

This technical report introduces EXAONE 4.0, which integrates a Non-reasoning mode and a Reasoning mode to achieve both the excellent usability of EXAONE 3.5 and the advanced reasoning abilities of EXAONE Deep. To pave the way for the agentic AI era, EXAONE 4.0 incorporates essential features such as agentic tool use, and its multilingual capabilities are extended to support Spanish in addition to English and Korean. The EXAONE 4.0 model series consists of two sizes: a mid-size 32B model optimized for high performance, and a small-size 1.2B model designed for on-device applications. The EXAONE 4.0 demonstrates superior performance compared to open-weight models in its class and remains competitive even against frontier-class models. The models are publicly available for research purposes and can be easily downloaded via https://huggingface.co/LGAI-EXAONE.