AMD MI355X × MoRI 在推理 TCO 上赢了 B200 — LMSys 深度解读
LMSys 联合 AMD 公布 DeepSeek-R1 分布式推理基准结果:MI355X 通过 MoRI 量化通信、TBO 重叠、AITER GEMM 调优等全栈优化,实现 $0.169/百万 tokens,比 B200 TRT-LLM 低 5%,比 B200 SGLang 低 40%。
面向 AI 工程师
围绕 AI 的脉动,精选真正值得跟进的变化与判断 —— 情报、深度、访谈、专题。
2026-06-01 精选
洞见
'Backrooms' Stuns with $81M Debut
A24出品的网络迷幻恐怖片《Backrooms》以8100万美元首周末票房震惊好莱坞,创下A24历史最高开画纪录和原创恐怖片最佳首映成绩。20岁YouTuber凯恩·帕森斯执导,制作成本仅约1000万美元。同时Focus Features的《Obsession》第三周逆势突破1亿美元。两部低成本恐怖片击败了迪士尼《曼达洛人与古古》的70%次周暴跌。
Hacker News
实践
supermemoryai/supermemory
Supermemory是一个为AI代理设计的超快速、可扩展记忆引擎和上下文层。提供统一API集成记忆存储、RAG检索、用户画像、连接器和文件处理等功能。支持自动提取事实、构建用户知识图谱、自动遗忘过期信息,在LongMemEval、LoCoMo、ConvoMem三大AI记忆基准测试中均排名第一。支持TypeScript和Python,可自部署。
GitHub Trending
影响
Anyone can build a platform now. Almost nobody can get people to find it
本文探讨AI时代独立开发者的核心困境:借助Claude Code等工具构建平台从未如此简单,但让用户找到这个平台却前所未有地困难。技术门槛消失导致供给爆炸,社交媒体算法打压外链,用户注意力极度稀缺。作者建议通过长期内容创作、真诚社区参与和付费广告解决分发问题,强调分发技能是可跨项目积累的长期资产。
Hacker News
精选
LMSys 联合 AMD 公布 DeepSeek-R1 分布式推理基准结果:MI355X 通过 MoRI 量化通信、TBO 重叠、AITER GEMM 调优等全栈优化,实现 $0.169/百万 tokens,比 B200 TRT-LLM 低 5%,比 B200 SGLang 低 40%。
Glean 用七年时间从企业搜索走到 AI Coworker,ARR 15 个月翻三倍到 $300M。核心壁垒 Context Graph 五层架构让巨头们追不上。
两个月内撒出 105 亿——41 亿入主中恒电气(HVDC 市占率 31%),64 亿拿下世纪互联第一大股东。宁德正在把锂电的"利润截流"模型搬进 AI 数据中心。这桌牌局的对手是英伟达、华为、国家电网。
专题
全部专题 →最新