智谱推出GLM-5.1高速版：400 tokens/s

智谱推出GLM-5.1高速版：400 tokens/s
智谱推出GLM-5.1高速版：400 tokens/s智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这 2026-5-22 05:32:52 Author: blog.upx8.com(查看原文) 阅读量:23 收藏

智谱推出GLM-5.1高速版：400 tokens/s

智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这一速度刷新了当前全球大模型厂商 API 速度上限。该模型基于旗舰级GLM-5.1能力开发，打破了此前高速模型几乎总是轻量级模型的行业惯例，首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT团队联合打造，通过推理引擎、调度系统与底层基础设施的系统级优化实现。据演示，在长程任务中，模型可在30秒内完成复杂网页的代码生成；在Agent Swarm场景下，可瞬间调度50个不同人格并行回答。

—— 凤凰网科技

文章来源: https://blog.upx8.com/%E6%99%BA%E8%B0%B1%E6%8E%A8%E5%87%BAGLM-5-1%E9%AB%98%E9%80%9F%E7%89%88-400-tokens-s
如有侵权请联系:admin#unsafe.sh