大模型技术解析：从原理到应用场景的全面指南

2026-03-22

人形机器人热潮：资本、产业与工作的未来

当机器人走进人类世界 2026年，人形机器人不再只是科幻电影中的想象。从特斯拉的Optimus到Figure AI的Figure 01，从波士顿动力的Atlas到国产的宇树科技、优必选——一场关于"人形"的竞赛正在全球悄然展开。这些拥有双手、双脚、能够直立行走的机器人，正在从实验室走向工厂、从测试场走向家庭。它们不再是笨重的机械臂替代品，而是能够与人类共享工作空间、甚至可能取代部分人类工作的新一代生产力工具。资本狂潮：万亿赛道已开...

2026-03-20

全网爆火的龙虾总失忆？大佬亲自下场手搓解药，终结致命痛点

2026年最火的不是某个大模型，是一只龙虾。 OpenClaw——这个从奥地利程序员Peter Steinberger的一个周末实验中诞生的项目，短短三个月GitHub星标破16万，一周涌入200万人次访客，腾讯云为它在深圳大厦摆出「龙虾安装站」，深圳龙岗区甚至出了专项扶持政策。全民养虾的狂热背后，一个致命的问题正在困扰着每一个虾农—— 你的龙虾，是个金鱼脑。龙虾的「失忆」有多可怕？重度养虾用户一定经历过这些场景：这不是个例。OpenClaw...

2026-03-14

56个超火"养龙虾"玩法，快把你的AI牛马用起来

智东西3月11日报道，"小龙虾"OpenClaw火爆出圈，ClawDocs网站以及GitHub的"awesome-openclaw-usecases"项目，汇集了经验证的56个OpenClaw真实应用案例，从刷"油管"、管项目、修Bug，到盯盘炒币、管智能家居……这只"小龙虾"几乎无所不能。截至3月10日中午12点，"小龙虾"OpenClaw的GitHub星标数量已经达到29万个。仅昨天一天，腾讯、字节跳动、蚂蚁旗下支付宝三家国内大厂就官宣了5项OpenClaw相关服务。 01. 社交媒体篇：精准筛选...

2026-03-13

OpenAI发布GPT-5.4系列模型，强化专业工作与智能体能力

品玩3月6讯，OpenAI今日正式推出GPT-5.4及GPT-5.4 Pro模型，面向ChatGPT、API及Codex平台同步上线。作为当前最高效、能力最强的前沿模型，GPT-5.4融合GPT-5.3-Codex的顶尖编码能力，并在多工具协同、文档处理、电子表格与演示文稿生成等专业任务中显著提升准确性与效率。核心升级：原生计算机操作能力：支持在桌面和浏览器环境中执行复杂工作流，OSWorld-Verified基准中75.0%成功率超越人类水平（72.4%）工具搜索机制：减少4...

2026-03-13

当AI开始学做人：逐句解读OpenClaw的AgentS.md

本文是 OpenClaw 专题系列的第三篇。SOUL.md 回答了"你是谁"的问题，但知道你是谁，不等于知道怎么活。AgentS.md 就是 OpenClaw 给 Agent 写的"怎么活"。标题：一个词的重量 AgentS.md——复数。这暗示了一种可能性：这套行为准则不只适用于一个 Agent，而是适用于所有基于 OpenClaw 运行的 Agent。它是一个种族的宪法，不是一个个体的日记。再看副标题："Your Workspace"——你的工作空间。这里的"Your"指向 Agent——这是你的地方...

2025-09-23

GO-1 – 智元机器人推出的首个通用具身基座模型

GO-1是什么 GO-1（Genie Operator-1，智元启元大模型）是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action（ViLLA）架构，由VLM（多模态大模型）和MoE（混合专家）组成。VLM借助海量互联网图文数据，赋予模型通用场景感知和语言理解能力；MoE中的Latent Planner（隐式规划器）通过大量跨本体和人类操作视频数据，获得通用的动作理解能力；Action Expert（动作专家）则基于百万真机数据，实现精细...

2025-09-06

视频理解新标杆，快手多模态推理模型开源：128k上下文+0.1秒级视频定位+跨模态推理

能看懂视频并进行跨模态推理的大模型Keye-VL 1.5，快手开源了。相比此前的预览版本，Keye-VL 1.5的时序定位能力进一步升级，并且支持跨模态推理。还创新性地提出Slow-Fast双路编码机制，给模型带来了128k的超长上下文窗口，而且速度与细节兼顾。成绩上，不仅在Video-MME短视频基准斩获73.0的高分，还在通用、视频和推理场景的大量Benchmark当中领跑同级模型。视频元素0.1秒级定位，还支持推理要说Keye-VL-1.5最大的亮点，...

2025-09-02

美团首个开源大模型来了！5600亿个参数，推理速度比DeepSeek-V3快50%

昨日，美团发布了其首款开源大模型LongCat-Flash，这是一款拥有5600亿个总参数的MoE（混合专家）模型。推理速度是这一模型最大的特点之一。美团称，这一模型具备快捷连接架构，扩展了计算-通信重叠窗口，实现了每秒超过100个token的推理速度，理论每token输出时间相比DeepSeek-V3降低近50%。智东西的实测也印证了这点：我们要求其输出大约100个token的内容，除去首token延时后，输出速度确实在100 tokens/秒左右。动图封面 L...