返回栏目
首页科技 • 正文

智谱发布GLM-5技术报告 技术细节全公开

发布时间:  浏览: 次  作者:网络

财联社2月22日消息,据智谱官微消息,智谱推出了GLM-5,这是一款旨在推动编程范式从“Vibe Coding”(氛围编程)转向“Agentic Engineering”(智能体工程)的下一代基础模型。GLM-5在前代模型GLM-4.5的智能体、推理与编程(Agentic, Reasoning and Coding, ARC)能力基础上,采用稀疏注意力(DeepSeek Sparse Attention,DSA)以大幅降低推理成本,同时保持长上下文能力无损。

为了让模型更好地与各类任务对齐,智谱构建了一套新型异步强化学习(RL)基础设施,通过将生成过程与训练过程解耦,从而大幅提升了后训练的迭代效率。此外,智谱还提出了全新的异步Agent强化学习算法,进一步提升强化学习的效果,使模型能够更有效地从复杂、长程交互中学习。

智谱称,基于上述创新,GLM-5在主流的开放基准测试中实现了SOTA性能。最关键的是,GLM-5在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面超越了此前所有开源基线。

原标题:智谱发布GLM-5技术报告 技术细节全公开

编辑:黄灵    责编:王光建     审核:杨四海

    相关文章Related

    返回栏目>>

    首页   |   帮助

    Power by DedeCms