华人学生立大功，新王Mamba-3直击Transformer死穴，推理效率碾压7倍

发布时间：2026-03-19 分类：AI资讯浏览量：31

Mamba-3

Transformer「杀手」架构迎重磅升级

就在今天，Mamba架构的「原班人马」正式发布了最新一代开源架构——Mamba-3。

与Mamba-2相比，Mamba-3对核心SSM做了三大改动：

改进了离散化过程，使其能够模拟卷积；
将状态转移引入复数域，以优化状态追踪；
采用MIMO架构提升推理利用率，在保持解码速度的同时增强模型表现。

结果显示，仅用一半的内部状态大小，Mamba-3实力便与Mamba-2相当。

在15亿参数规模下，Mamba-3 MIMO版本的平均准确率达到57.6%，比Transformer高出4%。

在长序列任务上，Mamba-3的端到端延迟仅为Transformer的七分之一。

剑指Transformer死穴

2017年，Transformer架构横空出世，成为当今LLM的基石。

然而，它是一个不折不扣的「算力黑洞」，随着对话长度增加，计算需求呈平方级增长，内存占用线性飙升。

Mamba-3代表着一种范式转移：从追求训练效率，转向「推理优先」的设计。

三大核心技术

1. 指数梯形离散化：从一阶到二阶的精度跃迁，精度提升显著。

2. 复数值SSM：给模型装上「内部指南针」，补上了逻辑推理的短板。在奇偶校验任务上，Mamba-3达到100%准确率。

3. MIMO：榨干每一分闲置算力，GPU不再空转。

全面碾压

在1.5B规模下，Mamba-3 MIMO以57.6%的平均准确率排名第一，领先Transformer 4%。

端到端推理延迟上，Mamba-3比vLLM快近7倍。

华人学生立大功

这是第一个由学生主导的Mamba架构。

指导者包括Albert Gu（CMU助理教授，SSM革命奠基人）和Tri Dao（FlashAttention发明者，斯坦福博士）。

论文地址：https://arxiv.org/pdf/2603.15569

来源：36氪

上一篇： 查看详情 +阿里发布企业级Agent平台"悟空"

直达

万兴智演

简介万兴智演是一款万兴科技AI演示工具，智能PPT生成，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新优...

直达

讯飞智文

简介讯飞智文是一款科大讯飞AI文档演示工具，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新优化算法模型...

直达

万知

简介万知是一款AI知识演示工具，智能文档生成，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新优化算法模...

直达

VoxDeck

简介 VoxDeck是一款AI语音演示工具，语音生成PPT，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新优化算法...

直达

Tenorshare AI

简介 Tenorshare AI是一款AI PPT生成工具，智能演示制作，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新...

直达

PicDoc

简介 PicDoc是一款AI图文演示工具，图片转PPT，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新优化算法模...

直达

Napkin

简介 Napkin是一款AI视觉演示工具，生成图文内容，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新优化算法...

直达

MindShow VIP

简介 MindShow VIP是一款AI演示工具高级版，专业PPT生成，专注于提供优质的AI服务，帮助用户提升工作效率和创作能力。平台采用先进的AI技术架构，具备良好的用户体验和稳定性。主要功能提供丰富的AI功能支持，包括智能生成、自动优化、实时处理等核心能力。支持多种输入格式和输出方式，满足不同场景的使用需求，让创作和工作更加高效便捷。特色优势采用业界领先的AI算法和模型架构，具备强大的计算能力和扩展性。持续更新...

Aoyii

华人学生立大功，新王Mamba-3直击Transformer死穴，推理效率碾压7倍

Transformer「杀手」架构迎重磅升级

剑指Transformer死穴

三大核心技术

全面碾压

华人学生立大功

站内搜索

Ai快讯

阿里发布企业级Agent平台"悟空"

Netflix为什么花6亿美金买AI后期工具公司

大厂集体押注，AI+IP是千亿新故事

阿里AI大整合：围绕Token打一场新仗

马斯克亲自点赞，Kimi动了十一年没人敢碰的东西

Article 5

热门标签

华人学生立大功，新王Mamba-3直击Transformer死穴，推理效率碾压7倍

Transformer「杀手」架构迎重磅升级

剑指Transformer死穴

三大核心技术

全面碾压

华人学生立大功

分享：

相关AI工具

万兴智演

讯飞智文

万知

VoxDeck

Tenorshare AI

PicDoc

Napkin

MindShow VIP

相关AI资讯

站内搜索

Ai快讯

阿里发布企业级Agent平台"悟空"

Netflix为什么花6亿美金买AI后期工具公司

大厂集体押注，AI+IP是千亿新故事

阿里AI大整合：围绕Token打一场新仗

马斯克亲自点赞，Kimi动了十一年没人敢碰的东西

Article 5

热门标签