AI早知道周刊 · 20260323-0329

周期：2026年3月23日 - 3月29日
来源：Latent.Space AINews + 社区精选
定位：每周 AI 行业动态精选

📦 本周焦点

NVIDIA NemoClaw：企业级 OpenClaw 安全栈正式发布

GTC 2026 上，NVIDIA 正式发布 NemoClaw，这是面向 OpenClaw 的开源安全堆栈，包含四个核心组件：NVIDIA OpenShell 运行时环境、Nemotron 本地推理模型、安全沙箱和策略控制。Jensen Huang 在主题演讲中称 OpenClaw 是"历史上增长最快的开源项目"，并将其比作"个人AI的操作系统"——"正如 Linux 之于操作系统，Kubernetes 之于容器，HTML 之于互联网"。

这标志着 AI Agent 从"开发者玩具"向"企业级产品"的关键转折，NVIDIA 通过解决安全和合规这两个最关键的痛点，为 OpenClaw 生态系统打开了企业市场的大门。

Dreamer 加入 Meta Superintelligence Labs

Nat 和 Alex 在 Meta Superintelligence Labs (MSL) execuhired Dreamer，距离他们在 Latent Space Pod 上分享仅 11 天。这是 LS Pod 嘉宾最快获得顶级实验室录用的案例之一。与此同时，Yann LeCun 的 AMI Labs 以 $1B 种子轮融资（估值 $4.5B）正式亮相，目标是围绕 JEPA 构建世界模型。

🧑‍💻 Coding Agent

Superpowers：强制工程纪律的 AI 编码框架

Superpowers 是由 Jesse Vincent (obra) 创建的开源 Agentic Skills Framework，旨在为 AI 编码代理强制执行结构化的软件工程工作流。发布三个月内获得超过 92,100 GitHub stars，打破 Linux 30年纪录，成为"历史上增长最快的开源项目"。

核心理念：AI 代理不应该只是"写代码的工具"，而应该是"遵循工程方法的开发者"。通过 Skills 系统强制执行完整工程流程——设计阶段 → 规划阶段 → TDD（测试先行）→ 执行 → 交付。77,000+ 开发者安装了一个让 AI 代理连续工作 2+ 小时而不产生幻觉的框架。

Claude Cowork：Anthropic 有史以来最大发布

Anthropic 发布的 Claude Cowork Dispatch Computer Use 获得了有史以来最大的发布反响（超越 Anthropic 官方此前所有发布）。这是继上月 Vercept 收购后的成果，用户可以通过消息应用与 Claude Code 交互。Simon Willison 和 Ethan Mollick 都给出了正面评价。这是 Anthropic 对"OpenClaw 战略"的直接回应。

Cline Kanban：多 Agent 工作树编排

Cline 发布了多 Agent 工作树编排功能，引发了不寻常的强烈开发者兴趣。这是 Coding Agent 领域的重要方向——从单一 Agent 转向多 Agent 协作。

Open Agent 生态最新进展

AI2 MolmoWeb: 开源浏览器 Agent，基于 Molmo 2 (4B/8B)，在四个 web-agent 基准上达到开源 SOTA，甚至超越部分专有 Agent
GenReasoning OpenReward: 暴露 330+ RL 环境和 4.5M+ 独特 RL 任务的 API，解决"环境计算"层缺失问题
Zhipu ZClawBench: 116 个真实世界 Agent 任务基准，覆盖办公自动化、编码和分析

🌍 开源模型

Sakana Chat + Namazu alpha：日语本地化模型

Sakana AI 发布 Sakana Chat（面向日本用户的聊天产品）和 Namazu alpha 模型家族。定位为"后训练的开源模型"，针对减少上游偏见和更好地反映日本语境和价值观进行调优。这既是一个消费产品，也是文化本地化后训练的演示。

Cohere Transcribe + Mistral Voxtral TTS

开源、生产导向的音频模型继续强劲增长：

Cohere Transcribe: 2B 参数 Apache-2.0 模型，在 A100 上 12 分钟转录 33 小时音频
Mistral Voxtral TTS: 论文发布，浏览器/本地 demo 可用

机器人 + 世界模型开源

Meta SAM 3.1: 目标多路复用，单次前向传递支持最多 16 个对象，H100 上视频吞吐量从 16 FPS 翻倍至 32 FPS
LeCun LeWorldModel: 小型开源世界模型，通过 SIGReg 使表示崩溃数学上不可能，声称 48x 更快规划
Unitree UnifoLM-WBT-Dataset: 开源真实世界人形机器人全身遥操作数据集
AI2 MolmoBot: 开放机器人操作套件，完全在模拟中训练，代码、训练数据、生成 pipeline 和评估均可用

🔬 架构研究

Agentica：Harness 设计超越模型本身

Symbolica AI 的 Agentica 框架在 ARC-AGI-3 发布当天达到 36.08% 分数，远超 Opus 4.6 (0.2%) 和 GPT 5.4 (0.3%)，同时成本仅为 $1,005（对比 Opus 4.6 的 $8,900）。核心创新是 Arcgentica——一种 orchestrator-subagent 架构。

关键洞察：框架设计 > 模型本身。顶级模型的致命弱点是使用联想而非逻辑、模式匹配而非实验，如果假设错误不会停下来反思。

Natural-Language Agent Harnesses：Harness 表征科学诞生

arXiv 新论文 NLAHs 提出将 Agent harness 的高层控制逻辑外部化为可移植的可执行 artifact。设计 Intelligent Harness Runtime (IHR) 直接解释执行这些 harness。这是 Agent 工程走向科学化的里程碑——使 harness 模块成为"一等研究公民"。

检索增强的 LLM Agents

Google DeepMind/Google Research 的 ICLR 2026 Workshop 论文研究检索增强与微调的结合。核心发现：训练阶段加入检索信号显著优于仅在推理时检索；"从经验中学习"需要训练与检索的协同。

🔧 基础设施

Google TurboQuant：6倍 KV Cache 压缩

Google Research 发布 TurboQuant——在线向量量化算法，实现 LLM Key-Value Cache 的极限压缩。保持模型性能完全一致的前提下，内存降低 6 倍，注意力计算加速 8 倍。

技术核心：PolarQuant（极坐标系统转换）+ Quantized Johnson-Lindenstrauss (QJL)。3.5-bit TurboQuant 在 LongBench 和 Needle In A Haystack (104K) 达到与全精度模型完全一致的表现。

市场反应：TurboQuant 发布后，Samsung、SK Hynix 市值单日蒸发超过 $50B。

Stripe 推出 Projects.dev：Agent 瞬间配置服务的 CLI
Apple 掀起"反垃圾"运动：传统 App 商店面临挑战
H100 价格上涨：需求持续强劲
TRL v1.0.0：声称长序列训练节省 44× VRAM
Hugging Face Kernels 0.12.3：支持 Flash-Attention 4
Sakana AI 用 ensembles + novelty search 分析 110 万社交帖子

🔗 原始链接

AINews 首页：https://www.latent.space/s/ainews
Archive：https://news.smol.ai/

AI 早知道 · 下期预告：3月30日-4月5日 欢迎反馈：下一期想加强哪个领域？