AI 日报｜2026-06-09｜小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型｜Runway Aleph 2.0 编辑模型：一键适配任意视频格式

0 条回复

20 次浏览

AI 热点日报（2026-06-09）

模型发布/更新

1. 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed，首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度，仅用单台标准 8-GPGPU 节点（非 Cerebras 或 Groq 方案）。提供限时免费聊天体验，UltraSpeed API 价格为 3 倍，输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日（PDT），企业可邮件联系 [email protected] 。
来源： X：小米 MiMo (@XiaomiMiMo)

2. 苹果发布第三代 Apple Foundation Models（AFM）

苹果推出第三代 Apple Foundation Models（AFM）基础模型家族，与 Google 合作定制，包含五个模型，覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能，包括全新 Siri 和智能工具，以用户为中心深度融合操作系统，隐私为核心设计原则。
来源： Apple Machine Learning Research（RSS）

3. VoxCPM2 技术报告发布

面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型，拥有 2B 参数，基于超 200 万小时多语言语音数据训练，支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估，以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建，在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。
来源： X：面壁智能 OpenBMB (@OpenBMB)

4. 全球首个：高德发布 3D 原生城市世界模型 ABot-Earth0.5

阿里巴巴旗下高德发布全球首个 3D 原生城市世界模型 ABot-Earth0.5，已建成覆盖 190 多个国家和地区的 3D 地图。用户输入卫星图或文字描述，10 分钟即可在消费级 GPU 上生成公里级 3D 城市，输出可编辑 3DGS 格式，可直接导入 Unity 等引擎。制图成本为传统百分之一，效率提升约千倍，可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测，可前往 abot-earth.amap.com 提交申请。
来源： IT 之家（RSS）

产品发布/更新

1. Runway Aleph 2.0 编辑模型：一键适配任意视频格式

一个视频，现在可以为每个信息流和格式制作。上传你现有的视频，选择你想要的宽高比，然后观看我们的编辑模型 Aleph 2.0，填充场景的其余部分，就像你从一开始就这样制作一样。在我们的桌面 Web 应用上尝试，链接如下。
来源： X：Runway (@runwayml)

2. Apple Core AI 框架

一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接（developer.apple.com）。该帖子由 buzzing.cc 中文翻译，发布于 2026 年 6 月 8 日 02:47（UTC）。
来源： Hacker News 热门（buzzing.cc 中文翻译）

3. Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 迎来大版本升级：一行命令安装，毫秒级启动；新增视频理解能力，支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码；集成同花顺、天眼查等权威数据源，可查询股票价格、财报、学术论文；支持 ACP 协议，可在 JetBrains、Zed 中使用；丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。
来源：公众号：月之暗面（Kimi）

4. 微信 AI 官宣内测：两种接入模式供开发者选择

微信开发者官方今日发布指引，确认微信 AI 正在内测阶段。开放平台提供两种接入模式：自动模式可授权平台读取小程序源码，无需额外开发即可让微信 AI 直接操作页面；开发模式下开发者可自主开发技能，审核后由微信 AI 调用。两种模式可同时开启。微信 AI 是微信内的 AI 助手，用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信 AI”可能非最终名称。接入与否不影响现有小程序服务。
来源： IT 之家（RSS）

5. Claude 为 Connector 开发者推出性能监控仪表盘

Claude 为目录中已发布的 Connector 新增性能监控仪表盘（公开测试版）。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟，并按工具细分错误归因；还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号（Admin/Owner 权限或自定义角色）。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录，该目录已有超 300 个第三方 Connector，每日被数百万人使用。
来源： Claude：Blog（网页）

6. Apple Intelligence 将强大 AI 能力融入日常体验

Apple 发布下一代 Apple Intelligence，将 AI 能力集成到 iPhone、iPad 和 Mac 中，带来更个性化和有帮助的日常体验。
来源： Apple：Newsroom（RSS）

7. NotebookLM 重大升级：智能体能力与高级推理

推出更强大的 NotebookLM 🚀 重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。现已面向 Google AI Ultra 订阅者推出。
来源： X：NotebookLM (@NotebookLM)

8. ChatGPT 新增数据图表生成功能

将数据和比较转化为图表，直接在 ChatGPT 中完成。现已支持移动端和网页端。
来源： X：ChatGPT (@ChatGPTapp)

行业动态

1. OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定

OpenAI 近日向 SEC 机密提交了 S-1 草案（即首次公开募股注册声明），目前尚未决定上市时间。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

2. 奥尔特曼宣布 OpenAI 进入第三发展阶段：让 AI 普及、易用且安全

本周一，OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文，宣布公司进入第三发展阶段，目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发，第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线，呼吁成立国际机构应对 AI 风险，必要时可暂缓前沿模型研发。同日，OpenAI 秘密提交 IPO 申请，但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。
来源： IT 之家（RSS）

3. 苹果 WWDC 2026 直播

苹果 WWDC 2026 主题演讲通过官网进行直播，Hacker News 用户讨论热度达到 110 点。
来源： Hacker News 热门（buzzing.cc 中文翻译）

4. NVIDIA 与 LG 集团合作建设 AI 工厂，加速物理 AI 与自动驾驶

NVIDIA 与 LG 集团合作建设 AI 工厂，为 LG 的机器人、自动驾驶、数据中心和 GPU 云服务提供加速计算基础设施。双方整合 NVIDIA AI 工厂平台与 LG 的消费电子、机器人技术，连接 AI 模型开发、物理 AI 数据生成、机器人仿真训练、边缘部署和工厂数字孪生。LG 电子将利用 NVIDIA Isaac Sim 和 Isaac Lab 仿真训练 CLOiD 家用机器人，探索采用 Isaac GR00T 模型，并开发物理 AI 数据工厂。LG Innotek 提供针对 NVIDIA GPU 优化的机器人传感组件，LG CNS 集成 NVIDIA 机器人技术。双方还将基于 NVIDIA DSX 平台建设下一代 AI 工厂，涵盖冷却、模块化设计和 800V 直流能源方案。LG 电子将基于 NVIDI…
来源： NVIDIA AI Blog

5. 受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线

由于欧盟《数字市场法案》（DMA），Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区，具体时间未公布。
来源： Apple：Newsroom（RSS）

6. 生数科技与华策影视达成战略合作，共建 AI 视听创制中心

6 月 7 日，生数科技与华策影视签署战略合作协议，共同推动 AI 与影视产业融合。双方将以华策影视科技产教示范区为载体、生数科技 Vidu 视频生成大模型为技术底座，设立“AI 视听创制中心”，探索 AI 虚拟制作与实拍结合。同时在浙江华策影视学校设立“华策&生数 AI 影视创制专业”，课程覆盖传统编导剪与 AI 视频制作技术。内容生产层面推广“实拍+AI”融合方案并优先在华策项目中试点，创作者生态层面引导 Vidu 社区超级创作者到产教基地注册。
来源：公众号：生数科技（Vidu·视频）

7. 英国借助 NVIDIA 技术将主权 AI 雄心转化为行动

一年前英国宣布做“AI 制造者”，如今主权 AI 计划取得实质进展：AI 云提供商数量翻倍，Nebius 部署三套 NVIDIA AI 基础设施，预计 2027 年满负荷达 65 兆瓦；基于 5,400 个 NVIDIA GH200 的 Isambard-AI 超级计算机全由零碳电力驱动。主权 AI 基金资助四家 NVIDIA Inception 初创公司：Cosine 训练多模态 MoE 编码模型；Cursive 使用 Megatron-LM 开发自改进 AI 系统；Doubleword 基于 Dynamo 和 Nemotron 3 Super 120B 实现 70 倍冷启动加速、4 倍 KV 缓存压缩，推理成本降低 90-95%…
来源： NVIDIA AI Blog

8. OpenAI 推出 Economic Research Exchange 经济研究交流平台

OpenAI 启动 Economic Research Exchange，研究 AI 对就业、生产力和经济的影响。该项目现已开放研究项目申请。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

论文研究

1. 为生物学 AI 智能体铺路

一项实验让 Claude、Biomni、Edison Analysis、GPT 等科研智能体从病毒学数据库 NCBI Virus 中检索序列数据，即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层 gget virus 后，准确率接近 100%。研究指出，当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题，导致 AI 智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键，生物学数据库需为智能体作为规模化用户而设计。
来源： Anthropic：Research（发表成果 · 网页）

2. Perplexity 与哈佛：AI 智能体提效 87% 降本 94%

我们与哈佛大学发表新研究，关于从聊天界面转向像 Computer 这样的自主智能体的转变。超过 3 个月的研究结果表明，使用 Computer 的工人在完成任务上比仅使用搜索快 87%，成本低 94%，且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work
来源： X：Perplexity (@perplexity_ai)

3. 腾讯混元联合多家机构发布首个音频编辑基准 MMAE

腾讯混元联合上海交大、南洋理工等机构推出 MMAE（Massive Multitask Audio Editing Benchmark），这是首个全面评估 AI 语音/音频编辑能力的基准。MMAE 要求模型理解现有音频并按自然语言指令精确修改，而非简单生成。当前模型在该基准上的精确匹配率（EMR）低于 5%，暴露了可靠音频编辑的短板。MMAE 包含 2000 个真实场景高保真样本、17741 条细粒度评估项，覆盖声音/音乐/语音及混合共 7 种模态、6 种任务复杂度（基础修改到多跳推理及多轮编辑）、8 种操作类型（局部到全局）。论文、代码、数据集和演示已公开。
来源： X：腾讯混元 (@TencentHunyuan)

技巧与观点

1. OpenAI 计划到 2028 年由 AI 主导研究

Sam Altman 关于 OpenAI 未来路径的新博客称，到 2028 年 3 月，其大量研究将由 AI 完成。该路径主要有 3 个目标：构建自动 AI 研究员，利用它加速科学和生产，然后给每个人一个个人 AGI，帮助处理工作、学习、编程、商业、健康文书和决策。
来源： X：Rohan Paul (@rohanpaul_ai)

2. 微软 AI CEO：超级智能即将到来，但不会取代你的工作

微软 AI CEO Mustafa Suleyman 在 Decoder 访谈中表示，超级智能即将到来，但不会导致大规模失业。他透露微软与 OpenAI 于去年 10 月签署新合同，巩固合作关系的同时，微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型，并于本周 Build 大会上发布 7 个全模态新模型。他批评 Anthropic 将 Claude 描述为有意识的做法，认为消费者产品需要足够好才能克服公众对 AI 的负面情绪。
来源： The Verge：AI（RSS）

3. 小互开源视频翻译工具：一句话自动下载、转写、翻译、烧字幕

小互（@xiaohu）开源视频翻译工具（xiaohu-video-translate），只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper 本地转写、AI 翻译润色、烧字幕、出文稿。转写本地运行，不花 API 费。支持 YouTube、Bilibili、抖音等链接及本地文件，英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳，按语义断句，每行不超过 12 字，双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成，可单独或串联使用，适配 Claude Code、Codex、OpenClaw 等 AI 编程工具。已开源，附安装指南。
来源： X：小互 (@xiaohu)

4. Hivemind 推出面向 AI 编程智能体的持续学习功能，即日起开放

Hivemind 发布面向 AI 编程智能体的持续学习功能，即日起开放。该工具收集团队运行的每个智能体（Claude Code、Codex、Cursor、Hermes、Pi）的轨迹，转化为可复用技能并推送到所有智能体，数据存储在用户自己的云存储中。内置 SkillOpt 使技能持续训练：Claude Code 准确率提升+19.1 分，Codex 提升+24.8 分，在全部 52 个测试设置中最佳或持平。开源，一行命令安装。
来源： X：Kim (@kimmonismus)

5. 邵猛开源 Brand to DESIGN.md 技能，提醒复刻易生新“AI Slop”

邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill，并开源 Brand to DESIGN.md Skill（GitHub: shaom/brand-to-design-md-skill），让 Agent 学习设计品味后复刻网站。但他指出，这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”，缺少设计精髓，仅皮毛相仿。
来源： X：邵猛 (@shao__meng)

6. Claude Code GA 一周年回顾：验证与自动模式

Claude Code 的第一个演示收到了两个 Slack 反应。 GA 一周年之际，@bcherny 和 @_catwu 回顾：验证最佳实践、为何构建自动模式、例程和循环，以及下一步计划。
来源： X：Claude Devs (@ClaudeDevs)

7. Pakistan Notice Helper：一款面向本地安全问题的轻量 AI 工具

Pakistan Notice Helper 是一款安全工具，帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入，返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语，乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型（通过 llama.cpp + CUDA），在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B（质量高但成本高）和 MiniCPM-V 4.6 Q8（速度慢且不稳定），最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。
来源： Hugging Face：Blog（RSS）

8. OpenRouter Advisor 助小模型问高级模型

新服务器工具：Advisor 让较小的模型咨询一个更高智能的“顾问”模型。帮助它们逃出困境循环，并帮助你迁移到更便宜的模型！🧵
来源： X：OpenRouter (@OpenRouter)