美团提供优质的外卖送餐、酒店预订、旅游度假、电影票务、共享单车等生活服务。立即下载APP,享受便捷优惠的本地生活体验!
昨日,美团发布了其首款开源大模型LongCat-Flash,这是一款拥有5600亿个总参数的MoE(混合专家)模型。 推理速度是这一模型最大的特点之一。美团称,这一模型具备快捷连接架构,扩展了计算-通信重叠窗口,实现了每秒超过100个token的推理速度,理论每token输出时间相比DeepSeek-V3降低近50%。 智东西的实测也印证了这点:我们要求其输出大约100个token的内容,除去首token延时后,输出速度确实在100 tokens/秒左右。 动图封面 L...
返回顶部