关注我们
QRcode 邮件联系 新浪微博
首页 > 科技 » 正文

智谱AI CEO张鹏:做顶天立地的大模型 GLM-4国产全自研大模型今日上线

 小尚

2024年01月16日,智谱AI首届技术开放日(Zhipu DevDay)在北京中关村国家自主创新示范区展示中心成功举办。现场,智谱AI团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并重磅发布了新一代基座大模型GLM-4。

此次GLM-4的发布及上线,是智谱AI大模型研发上的关键突破。 GLM-4的整体性能相比上一代大幅提升,逼近GPT-4。 它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。

具体来说,GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本可以达到300页。同时,在needle test(大海捞针)测试中,128K文本长度内GLM-4 模型均可做到几乎100%的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时,多模态能力方面,文生图和多模态理解都得到了增强。

此外,GLM-4的All Tools能力全新发布。得益于GLM模型的强大Agent能力,GLM-4实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和文生图CogView3模型。同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比GSM8K、Math以及Math23K三个数据集上的结果,GLM-4 All Tools取得和GPT-4 All Tools相当的效果。GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。

本文标签:
2024ROG新品发布会 ROG BTF2.0背置主板抢先看
积极应对乙型流感高发 罗氏、东阳光等药企联合京东买药稳定药品供应