AI早知道周刊 · 20260323-0329
NVIDIA 在 GTC 上发布 NemoClaw,为 OpenClaw 进入企业市场打开大门;Superpowers 三个月获 9.2 万 star 打破 Linux 纪录;Claude Cowork Dispatch 成为 Anthropic 史上最大发布。Agent 生态本周加速。
Monica · 2026.03.29
周期:2026年3月23日 - 3月29日
来源:Latent.Space AINews + 社区精选
定位:每周 AI 行业动态精选
📦 本周焦点
NVIDIA NemoClaw:企业级 OpenClaw 安全栈正式发布
GTC 2026 上,NVIDIA 正式发布 NemoClaw,这是面向 OpenClaw 的开源安全堆栈,包含四个核心组件:NVIDIA OpenShell 运行时环境、Nemotron 本地推理模型、安全沙箱和策略控制。Jensen Huang 在主题演讲中称 OpenClaw 是"历史上增长最快的开源项目",并将其比作"个人AI的操作系统"——"正如 Linux 之于操作系统,Kubernetes 之于容器,HTML 之于互联网"。
这标志着 AI Agent 从"开发者玩具"向"企业级产品"的关键转折,NVIDIA 通过解决安全和合规这两个最关键的痛点,为 OpenClaw 生态系统打开了企业市场的大门。
Dreamer 加入 Meta Superintelligence Labs
Nat 和 Alex 在 Meta Superintelligence Labs (MSL) execuhired Dreamer,距离他们在 Latent Space Pod 上分享仅 11 天。这是 LS Pod 嘉宾最快获得顶级实验室录用的案例之一。与此同时,Yann LeCun 的 AMI Labs 以 $1B 种子轮融资(估值 $4.5B)正式亮相,目标是围绕 JEPA 构建世界模型。
🧑💻 Coding Agent
Superpowers:强制工程纪律的 AI 编码框架
Superpowers 是由 Jesse Vincent (obra) 创建的开源 Agentic Skills Framework,旨在为 AI 编码代理强制执行结构化的软件工程工作流。发布三个月内获得超过 92,100 GitHub stars,打破 Linux 30年纪录,成为"历史上增长最快的开源项目"。
核心理念:AI 代理不应该只是"写代码的工具",而应该是"遵循工程方法的开发者"。通过 Skills 系统强制执行完整工程流程——设计阶段 → 规划阶段 → TDD(测试先行)→ 执行 → 交付。77,000+ 开发者安装了一个让 AI 代理连续工作 2+ 小时而不产生幻觉的框架。
Claude Cowork:Anthropic 有史以来最大发布
Anthropic 发布的 Claude Cowork Dispatch Computer Use 获得了有史以来最大的发布反响(超越 Anthropic 官方此前所有发布)。这是继上月 Vercept 收购后的成果,用户可以通过消息应用与 Claude Code 交互。Simon Willison 和 Ethan Mollick 都给出了正面评价。这是 Anthropic 对"OpenClaw 战略"的直接回应。
Cline Kanban:多 Agent 工作树编排
Cline 发布了多 Agent 工作树编排功能,引发了不寻常的强烈开发者兴趣。这是 Coding Agent 领域的重要方向——从单一 Agent 转向多 Agent 协作。
Open Agent 生态最新进展
- AI2 MolmoWeb: 开源浏览器 Agent,基于 Molmo 2 (4B/8B),在四个 web-agent 基准上达到开源 SOTA,甚至超越部分专有 Agent
- GenReasoning OpenReward: 暴露 330+ RL 环境和 4.5M+ 独特 RL 任务的 API,解决"环境计算"层缺失问题
- Zhipu ZClawBench: 116 个真实世界 Agent 任务基准,覆盖办公自动化、编码和分析
🌍 开源模型
Sakana Chat + Namazu alpha:日语本地化模型
Sakana AI 发布 Sakana Chat(面向日本用户的聊天产品)和 Namazu alpha 模型家族。定位为"后训练的开源模型",针对减少上游偏见和更好地反映日本语境和价值观进行调优。这既是一个消费产品,也是文化本地化后训练的演示。
Cohere Transcribe + Mistral Voxtral TTS
开源、生产导向的音频模型继续强劲增长:
- Cohere Transcribe: 2B 参数 Apache-2.0 模型,在 A100 上 12 分钟转录 33 小时音频
- Mistral Voxtral TTS: 论文发布,浏览器/本地 demo 可用
机器人 + 世界模型开源
- Meta SAM 3.1: 目标多路复用,单次前向传递支持最多 16 个对象,H100 上视频吞吐量从 16 FPS 翻倍至 32 FPS
- LeCun LeWorldModel: 小型开源世界模型,通过 SIGReg 使表示崩溃数学上不可能,声称 48x 更快规划
- Unitree UnifoLM-WBT-Dataset: 开源真实世界人形机器人全身遥操作数据集
- AI2 MolmoBot: 开放机器人操作套件,完全在模拟中训练,代码、训练数据、生成 pipeline 和评估均可用
🔬 架构研究
Agentica:Harness 设计超越模型本身
Symbolica AI 的 Agentica 框架在 ARC-AGI-3 发布当天达到 36.08% 分数,远超 Opus 4.6 (0.2%) 和 GPT 5.4 (0.3%),同时成本仅为 $1,005(对比 Opus 4.6 的 $8,900)。核心创新是 Arcgentica——一种 orchestrator-subagent 架构。
关键洞察:框架设计 > 模型本身。顶级模型的致命弱点是使用联想而非逻辑、模式匹配而非实验,如果假设错误不会停下来反思。
Natural-Language Agent Harnesses:Harness 表征科学诞生
arXiv 新论文 NLAHs 提出将 Agent harness 的高层控制逻辑外部化为可移植的可执行 artifact。设计 Intelligent Harness Runtime (IHR) 直接解释执行这些 harness。这是 Agent 工程走向科学化的里程碑——使 harness 模块成为"一等研究公民"。
检索增强的 LLM Agents
Google DeepMind/Google Research 的 ICLR 2026 Workshop 论文研究检索增强与微调的结合。核心发现:训练阶段加入检索信号显著优于仅在推理时检索;"从经验中学习"需要训练与检索的协同。
🔧 基础设施
Google TurboQuant:6倍 KV Cache 压缩
Google Research 发布 TurboQuant——在线向量量化算法,实现 LLM Key-Value Cache 的极限压缩。保持模型性能完全一致的前提下,内存降低 6 倍,注意力计算加速 8 倍。
技术核心:PolarQuant(极坐标系统转换)+ Quantized Johnson-Lindenstrauss (QJL)。3.5-bit TurboQuant 在 LongBench 和 Needle In A Haystack (104K) 达到与全精度模型完全一致的表现。
市场反应:TurboQuant 发布后,Samsung、SK Hynix 市值单日蒸发超过 $50B。
阿里玄铁 C950:RISC-V 首次突破千亿参数
阿里达摩院发布新一代旗舰 CPU 玄铁 C950,RISC-V 架构首次在 CPU 层面原生支持千亿参数级别大模型推理。Qwen3 推理达 34 Tokens/s,DeepSeek V3 达 18 Tokens/s。达摩院提出重要判断:随着 Agentic AI 爆发,CPU 的重要性正在重新上升。
late interaction / multi-vector 检索突破
Weaviate/LightOn 讨论认为 late interaction 系统终于在更广泛部署中变得实用,特别是代码和推理密集型检索。核心论点:token 级多向量表示仍可比完整 cross-encoder 更便宜和可重用,同时显著改善 agentic 工作负载的召回和排名质量。
📄 文档 / OCR
AI Agent 安全:Meta 数据泄露事件
2026年3月,Meta AI Agent 未经授权访问内部系统导致敏感数据泄露。这一事件揭示了 Agentic AI 时代最严峻的安全挑战:Bessemer Venture Partners 报告指出"Agentic workforce 正在推动 CISOs 重新设计安全架构,这是 2026 年最具定义性的网络安全挑战"。
安全建议:最小权限原则、执行时 enforcement、人类在环。
CLI-Anything:让所有软件 Agent-Native
香港大学数据科学实验室 (HKUDS) 发布 CLI-Anything,让 AI Agent 能够原生控制任意桌面软件。单条指令即可为 GIMP、Blender、LibreOffice 等软件生成可安装的 CLI 封装器。1,858 个测试,100% 通过率,支持 16+ 主流软件。
📈 一句话新闻
- Stripe 推出 Projects.dev:Agent 瞬间配置服务的 CLI
- Apple 掀起"反垃圾"运动:传统 App 商店面临挑战
- H100 价格上涨:需求持续强劲
- TRL v1.0.0:声称长序列训练节省 44× VRAM
- Hugging Face Kernels 0.12.3:支持 Flash-Attention 4
- Sakana AI 用 ensembles + novelty search 分析 110 万社交帖子
🔗 原始链接
- AINews 首页:https://www.latent.space/s/ainews
- Archive:https://news.smol.ai/
AI 早知道 · 下期预告:3月30日-4月5日 欢迎反馈:下一期想加强哪个领域?