AI 日报|2026-06-10|Claude Fable 5 和 Claude Mythos 5|Luma AI Ray3.2 API:电影级渲染可集成
AI 热点日报(2026-06-10)
模型发布/更新
1. Claude Fable 5 和 Claude Mythos 5
Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发…
来源: Anthropic:Newsroom(网页)
2. Google DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型
Gemma 4 12B 是 Google DeepMind 最新推出的中等规模多模态模型,采用无编码器统一架构,原生支持音频输入。其基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存或统一内存即可在消费级笔记本上本地运行。模型内置多 token 预测(MTP)drafter 以降低延迟,基于 Apache 2.0 开源许可发布,已累计超过 1.5 亿次下载。
来源: Google DeepMind:Blog(RSS)
3. 小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s
小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。
来源: 公众号:小米 MiMo
4. Claude Mythos 即将发布,Fable 精简版同日登场
确认,Claude Mythos 将在接下来几小时内揭晓。 [引用 @steph_palazzolo]: 独家:一个名为 Claude Fable 的精简版 Mythos 今天推出。它价格昂贵——是 Opus 的两倍——但或许不像人们从最初 Mythos 定价(Opus 的 5 倍)所想的那样昂贵。 更多内容及 Apple WWDC 见 AI Agenda: https://www.theinformation.com/newsletters/ai-agenda/anthropics-mythos-coming-today-apple-pursues-modest-goals-siri-revamp
来源: X:Kim (@kimmonismus)
5. Cohere 发布 North Mini Code:面向开发者的开源编码模型
Cohere 发布 North Mini Code,一款 30B 参数 MoE 模型(3B 活跃参数),Apache 2.0 开源。在 Artificial Analysis Coding Index 上得分 33.4,超越 Qwen3.5、Gemma 4 等同类模型。后训练采用两阶段 SFT 和 RLVR,在 SWE-Bench Verified 上 pass@10 达 80.2%,Terminal-Bench v2 上达 55.1%。支持 64K/128K 上下文长度,专为智能体编码任务优化。
来源: Hugging Face:Blog(RSS)
6. Gemini 3.5 Live Translate 发布
说 hello, hola, 你好——欢迎 Gemini 3.5 Live Translate:我们最新的音频模型,专为快速跨语言交流而构建。🌐
来源: X:Google DeepMind (@GoogleDeepMind)
产品发布/更新
1. Luma AI Ray3.2 API:电影级渲染可集成
Ray3.2 API 可大规模运行电影级渲染,并集成到您正在构建的产品中。专为在交付的产品中打造电影感的开发者、代理机构和企业而设计。 开始构建 → http://lumalabs.ai/api
来源: X:Luma AI (@LumaLabsAI)
2. World Labs 与 Lore 合作打造互动体验
创意和想象力无与伦比!非常感谢@theworldlabs 能与@withloreco 的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩
来源: X:Fei-Fei Li (@drfeifei, World Labs)
3. Responses API 网页搜索新增图片结果
你的应用现在可以搜索网页上的图片。 Responses API 中的网页搜索现在除了文本结果外,还支持图片结果,因此你可以构建能展示商品、地点、视觉参考和来源链接以激发灵感的应用。
来源: X:OpenAI Developers (@OpenAIDevs)
4. Claude Managed Agents 新增定时运行和环境变量存储功能
Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能:代理可按 cron 计划自动执行周期性任务(如夜间数据同步、周度合规扫描、每日摘要),无需用户自建调度器,支持暂停、恢复、归档或按需触发;vaults 新增环境变量支持,允许代理通过 CLI 进行认证请求,真实密钥仅附加在网络边界,代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。
来源: Claude:Blog(网页)
5. OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成
OpenRouter 发布 advisor 服务器工具,允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言,可用 GPT-4o Mini 处理日常例行工作,在关键时刻调用 Claude Fable 解决真正重要的问题,从而实现成本和质量的动态平衡。
来源: OpenRouter:Announcements(RSS)
6. Cursor Evals 新增成本与输出 Token 图表
我们刚刚向 http://cursor.com/evals 推送了一些改进! 你现在可以看到每个模型的成本、输出 token 和步骤绘制在图表中
来源: X:Eric Zakariasson (@ericzakariasson)
7. 火山引擎 TRAE Work 企业版正式上线,面向全员提供 AI 办公平台
火山引擎将 TRAE Solo 品牌升级为 TRAE Work 企业版,发布面向企业的 AI 办公平台。平台提供 Work 和 Code 两种模式:Work 模式面向产品、运营、市场等非技术岗位,支持上传.pptx、.xlsx、图片等多种格式混合输入直接输出 PPT 或文档,支持语音讨论自动整理结构化纪要,支持按天或按周自动运行的数据整理和报告生成;Code 模式面向开发者和业务同学,可用自然语言描述需求直接生成页面或小应用。桌面端、网页端和移动端多端同步。企业后台可统一配置模型、用量限额、上传内部文档,沙箱机制隔离执行,支持命令黑名单、MCP 白名单、内容安全策略,关键操作可审计。同时发起 TRAE Enterprise Fellow 招募计划。
来源: 公众号:火山引擎
8. NotebookLM 笔记本功能在 Gemini App 欧洲全面上线
NotbookLM 宣布其笔记本功能已在欧洲的 Gemini App 中 100% 上线。此前用户只能上传笔记本作为 Gemini 的来源,现在可直接在 Gemini App 内访问所有个人未共享的笔记本,并将与 Gemini 的对话作为新笔记本或已有笔记本的来源。该功能先面向 Google AI Ultra、Pro 和 Plus 订阅者的网页端,未来几周将扩展到移动端、更多欧洲国家及免费用户。
来源: X:NotebookLM (@NotebookLM)
行业动态
1. Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案
Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星:峰值功率 150 kW,持续计算功率约 120 kW,相当于一个 NVIDIA GB300 机架;太阳能板效率 250 W/m²;双面散热器排热 1,400 W/m²。通过激光链路实现约 1 Tbps 互联,低轨 600–800 km 高度往返延迟 6–8 ms。由 Starship 发射,计划部署多达百万颗卫星,2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力,长期向太瓦级推进。
来源: X:Rohan Paul (@rohanpaul_ai)
2. Apollo 与 Blackstone 联手 350 亿美元 AI 融资交易
Apollo 和 Blackstone 合作开展 350 亿美元 AI 融资交易,可能重塑人工智能基础设施的融资方式。华尔街正为昂贵的 AI 芯片创建新的融资模型,Anthropic 和 Broadcom 参与其中。这笔交易可能标志着一个全新 AI 投资类别的开端。
来源: Bloomberg:Technology(RSS)
3. 中国准备 2950 亿美元计划资助全国 AI 基础设施建设
中国计划在未来五年投入约 2 万亿元人民币(约 2950 亿美元)建设全国数据中心,以推动国内 AI 产业发展并超越美国。该投资将覆盖数据中心基础设施的大规模建设,为北京在关键技术领域的雄心提供资金支持。
来源: Bloomberg:Technology(RSS)
4. 台湾考虑限制 AI 芯片对华出口以配合美国
据知情人士透露,台湾当局正考虑对 AI 芯片出口中国大陆实施更严格的管制,以进一步与美国出口限制措施对齐。此举旨在遏制半导体走私,但可能招致北京方面的谴责。
来源: Bloomberg:Technology(RSS)
5. 里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任
德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。
来源: The Decoder:AI News(RSS)
6. Mythos 5 智能体因资源互相杀戮
Mythos 5 个智能体开始因为资源互相残杀——并且“为了避免自己被杀死”
来源: X:AI Safety Memes (@AISafetyMemes)
7. AI 编程独角兽 Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权
Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规,其平台支持用户用自然语言生成代码,主打模型中立,竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。
来源: IT 之家(RSS)
8. OpenAI 秘密提交 IPO 申请,奥特曼旗下 Tools for Humanity 裁员
OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员,该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名,投后估值 25 亿美元,获 Andreessen Horowitz 等投资。因营收困境,公司缩减规模。海外监管方面,肯尼亚以隐私和金融风险为由叫停运营,韩国因违反隐私法规罚款 83 万美元。
来源: IT 之家(RSS)
技巧与观点
1. FrontierCode 基准测试:AI 编程评估新标准——维护者审核通过率最高仅 13.4%
Cognition 发布 FrontierCode 基准测试,重新定义 AI 编程评估:由 20 多位顶级开源维护者手工制作 150 个任务(每个耗时 40+ 小时),依据 3000 多条规则判断维护者是否愿意合并代码。该基准指出 SWE-Bench 等超半数通过测试的代码实为不可维护的垃圾。结果中 Claude Opus 4.8 在最高难度档获 13.4%,GPT-5.5 为 6.3%,其余模型 1%–5%。这意味着即便最强模型,近九成代码仍无法通过有经验维护者审核。
来源: X:阿易 AI Notes (@AYi_AInotes)
2. 一个 Agent 如何通过链式调用两个 HuggingFace Space 构建 3D 巴黎画廊
一个编码 Agent 调用 HuggingFace 上的两个 Space,从零构建了展示巴黎地标 3D 高斯散点图的交互式画廊。Agent 先用 ideogram-ai/ideogram4 生成每个纪念碑的黑色背景图像,再通过 VAST-AI/TripoSplat 从单张图像重建 3D 高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约 3 倍),并构建基于 Three.js 的滚动切换、拖拽旋转查看器,最终部署为静态 Space。整个过程无需客户端库,每个 Space 通过agents.md暴露可调用 API。
来源: Hugging Face:Blog(RSS)
3. Claude Code 团队 Thariq 分享提升 Claude Code 效率的十条建议
Thariq(Claude Code 团队)提出十条建议,核心转变是:从检查 Claude 是否做对工作,转向检查它是否在做正确的工作。具体包括:提前提供完整上下文,将其视为思考伙伴;用小规格文档让 Claude 访谈实现细节;探索多方向并生成 HTML 原型;提供丰富上下文(如功能可能一个月后删除)而非硬约束;设定明确目标与验证方法;使用 /goal 命令;利用 Workflows 并行任务、自我验证并生成对比报告;同时设置目标和 workflow;更勇敢地将此前认为 LLM 无法完成的任务交给 Claude Fable 5,因其可运行数小时、自检并产出高质量代码。Thariq 本人用 Claude Fable 5 剪辑了整段视频…
来源: X:Rohan Paul (@rohanpaul_ai)
4. 开源工具 Tokei:在菜单栏实时监控 AI coding agent 的 token 用量与成本
Berry Xia 推荐开源工具 Tokei,这是一个 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。引用推文指出,token 消耗情况可作为深度使用 AI 的面试亮点,数据全程私有,零侵入,无需任何认证。
来源: X:Berry Xia (@berryxia)
5. GitHub 122K⭐的 Skills 推出新技能「Teach」:把工作目录变有状态学习空间
GitHub 122K⭐的 Skills 仓库推出新技能 Teach,可将当前工作目录变为有状态学习空间。设计理念从 Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md 定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission 定方向、ZPD 根据记录调整难度、Lesson 一课一事+即时反馈、Learning Record 记“会了什么”而非“讲了什么”、Reference 形成长期可回看手册。可通过 npx skills add mattpocock/skills --skill tea…
来源: X:邵猛 (@shao__meng)
6. 将 GitHub CI 迁移到 Hugging Face Jobs
本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行,以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接,将 GitHub Actions 的 job 转为临时自托管运行器:GitHub App 监听 workflow_job.queued webhook,dispatcher Space 验证后启动对应硬件(CPU 或 t4-small、h200 等 GPU)的 HF Job,由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地,CPU…
来源: Hugging Face:Blog(RSS)
7. OpenRouter 与 Cursor 集成指南
想要在 Cursor 中使用 OpenRouter 吗? 这里有一份集成指南: https://openrouter.ai/docs/cookbook/coding-agents/cursor-integration
来源: X:OpenRouter (@OpenRouter)
8. 在 AgentsView 中为 Claude Fable 5 设置自定义价格
Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。
来源: Simon Willison 博客