AI 日报|2026-06-09|小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型|Runway Aleph 2.0 编辑模型:一键适配任意视频格式
AI 热点日报(2026-06-09)
模型发布/更新
1. 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 [email protected] 。
来源: X:小米 MiMo (@XiaomiMiMo)
2. 苹果发布第三代 Apple Foundation Models(AFM)
苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能,包括全新 Siri 和智能工具,以用户为中心深度融合操作系统,隐私为核心设计原则。
来源: Apple Machine Learning Research(RSS)
3. VoxCPM2 技术报告发布
面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。
来源: X:面壁智能 OpenBMB (@OpenBMB)
4. 全球首个:高德发布 3D 原生城市世界模型 ABot-Earth0.5
阿里巴巴旗下高德发布全球首个 3D 原生城市世界模型 ABot-Earth0.5,已建成覆盖 190 多个国家和地区的 3D 地图。用户输入卫星图或文字描述,10 分钟即可在消费级 GPU 上生成公里级 3D 城市,输出可编辑 3DGS 格式,可直接导入 Unity 等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往 abot-earth.amap.com 提交申请。
来源: IT 之家(RSS)
产品发布/更新
1. Runway Aleph 2.0 编辑模型:一键适配任意视频格式
一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。
来源: X:Runway (@runwayml)
2. Apple Core AI 框架
一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接(developer.apple.com)。该帖子由 buzzing.cc 中文翻译,发布于 2026 年 6 月 8 日 02:47(UTC)。
来源: Hacker News 热门(buzzing.cc 中文翻译)
3. Kimi Code 焕新升级(附视频教程)
Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。
来源: 公众号:月之暗面(Kimi)
4. 微信 AI 官宣内测:两种接入模式供开发者选择
微信开发者官方今日发布指引,确认微信 AI 正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信 AI 直接操作页面;开发模式下开发者可自主开发技能,审核后由微信 AI 调用。两种模式可同时开启。微信 AI 是微信内的 AI 助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信 AI”可能非最终名称。接入与否不影响现有小程序服务。
来源: IT 之家(RSS)
5. Claude 为 Connector 开发者推出性能监控仪表盘
Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。
来源: Claude:Blog(网页)
6. Apple Intelligence 将强大 AI 能力融入日常体验
Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。
来源: Apple:Newsroom(RSS)
7. NotebookLM 重大升级:智能体能力与高级推理
推出更强大的 NotebookLM 🚀 重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。 现已面向 Google AI Ultra 订阅者推出。
来源: X:NotebookLM (@NotebookLM)
8. ChatGPT 新增数据图表生成功能
将数据和比较转化为图表,直接在 ChatGPT 中完成。 现已支持移动端和网页端。
来源: X:ChatGPT (@ChatGPTapp)
行业动态
1. OpenAI 向 SEC 机密提交 S-1 草案,上市时间未定
OpenAI 近日向 SEC 机密提交了 S-1 草案(即首次公开募股注册声明),目前尚未决定上市时间。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例)
2. 奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全
本周一,OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发,第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险,必要时可暂缓前沿模型研发。同日,OpenAI 秘密提交 IPO 申请,但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。
来源: IT 之家(RSS)
3. 苹果 WWDC 2026 直播
苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。
来源: Hacker News 热门(buzzing.cc 中文翻译)
4. NVIDIA 与 LG 集团合作建设 AI 工厂,加速物理 AI 与自动驾驶
NVIDIA 与 LG 集团合作建设 AI 工厂,为 LG 的机器人、自动驾驶、数据中心和 GPU 云服务提供加速计算基础设施。双方整合 NVIDIA AI 工厂平台与 LG 的消费电子、机器人技术,连接 AI 模型开发、物理 AI 数据生成、机器人仿真训练、边缘部署和工厂数字孪生。LG 电子将利用 NVIDIA Isaac Sim 和 Isaac Lab 仿真训练 CLOiD 家用机器人,探索采用 Isaac GR00T 模型,并开发物理 AI 数据工厂。LG Innotek 提供针对 NVIDIA GPU 优化的机器人传感组件,LG CNS 集成 NVIDIA 机器人技术。双方还将基于 NVIDIA DSX 平台建设下一代 AI 工厂,涵盖冷却、模块化设计和 800V 直流能源方案。LG 电子将基于 NVIDI…
来源: NVIDIA AI Blog
5. 受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线
由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。
来源: Apple:Newsroom(RSS)
6. 生数科技与华策影视达成战略合作,共建 AI 视听创制中心
6 月 7 日,生数科技与华策影视签署战略合作协议,共同推动 AI 与影视产业融合。双方将以华策影视科技产教示范区为载体、生数科技 Vidu 视频生成大模型为技术底座,设立“AI 视听创制中心”,探索 AI 虚拟制作与实拍结合。同时在浙江华策影视学校设立“华策&生数 AI 影视创制专业”,课程覆盖传统编导剪与 AI 视频制作技术。内容生产层面推广“实拍+AI”融合方案并优先在华策项目中试点,创作者生态层面引导 Vidu 社区超级创作者到产教基地注册。
来源: 公众号:生数科技(Vidu·视频)
7. 英国借助 NVIDIA 技术将主权 AI 雄心转化为行动
一年前英国宣布做“AI 制造者”,如今主权 AI 计划取得实质进展:AI 云提供商数量翻倍,Nebius 部署三套 NVIDIA AI 基础设施,预计 2027 年满负荷达 65 兆瓦;基于 5,400 个 NVIDIA GH200 的 Isambard-AI 超级计算机全由零碳电力驱动。主权 AI 基金资助四家 NVIDIA Inception 初创公司:Cosine 训练多模态 MoE 编码模型;Cursive 使用 Megatron-LM 开发自改进 AI 系统;Doubleword 基于 Dynamo 和 Nemotron 3 Super 120B 实现 70 倍冷启动加速、4 倍 KV 缓存压缩,推理成本降低 90-95%…
来源: NVIDIA AI Blog
8. OpenAI 推出 Economic Research Exchange 经济研究交流平台
OpenAI 启动 Economic Research Exchange,研究 AI 对就业、生产力和经济的影响。该项目现已开放研究项目申请。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例)
论文研究
1. 为生物学 AI 智能体铺路
一项实验让 Claude、Biomni、Edison Analysis、GPT 等科研智能体从病毒学数据库 NCBI Virus 中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层 gget virus 后,准确率接近 100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致 AI 智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。
来源: Anthropic:Research(发表成果 · 网页)
2. Perplexity 与哈佛:AI 智能体提效 87% 降本 94%
我们与哈佛大学发表新研究,关于从聊天界面转向像 Computer 这样的自主智能体的转变。 超过 3 个月的研究结果表明,使用 Computer 的工人在完成任务上比仅使用搜索快 87%,成本低 94%,且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work
来源: X:Perplexity (@perplexity_ai)
3. 腾讯混元联合多家机构发布首个音频编辑基准 MMAE
腾讯混元联合上海交大、南洋理工等机构推出 MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估 AI 语音/音频编辑能力的基准。MMAE 要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于 5%,暴露了可靠音频编辑的短板。MMAE 包含 2000 个真实场景高保真样本、17741 条细粒度评估项,覆盖声音/音乐/语音及混合共 7 种模态、6 种任务复杂度(基础修改到多跳推理及多轮编辑)、8 种操作类型(局部到全局)。论文、代码、数据集和演示已公开。
来源: X:腾讯混元 (@TencentHunyuan)
技巧与观点
1. OpenAI 计划到 2028 年由 AI 主导研究
Sam Altman 关于 OpenAI 未来路径的新博客称,到 2028 年 3 月,其大量研究将由 AI 完成。 该路径主要有 3 个目标:构建自动 AI 研究员,利用它加速科学和生产,然后给每个人一个个人 AGI,帮助处理工作、学习、编程、商业、健康文书和决策。
来源: X:Rohan Paul (@rohanpaul_ai)
2. 微软 AI CEO:超级智能即将到来,但不会取代你的工作
微软 AI CEO Mustafa Suleyman 在 Decoder 访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与 OpenAI 于去年 10 月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周 Build 大会上发布 7 个全模态新模型。他批评 Anthropic 将 Claude 描述为有意识的做法,认为消费者产品需要足够好才能克服公众对 AI 的负面情绪。
来源: The Verge:AI(RSS)
3. 小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕
小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper 本地转写、AI 翻译润色、烧字幕、出文稿。转写本地运行,不花 API 费。支持 YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过 12 字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配 Claude Code、Codex、OpenClaw 等 AI 编程工具。已开源,附安装指南。
来源: X:小互 (@xiaohu)
4. Hivemind 推出面向 AI 编程智能体的持续学习功能,即日起开放
Hivemind 发布面向 AI 编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置 SkillOpt 使技能持续训练:Claude Code 准确率提升+19.1 分,Codex 提升+24.8 分,在全部 52 个测试设置中最佳或持平。开源,一行命令安装。
来源: X:Kim (@kimmonismus)
5. 邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新“AI Slop”
邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill,并开源 Brand to DESIGN.md Skill(GitHub: shaom/brand-to-design-md-skill),让 Agent 学习设计品味后复刻网站。但他指出,这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”,缺少设计精髓,仅皮毛相仿。
来源: X:邵猛 (@shao__meng)
6. Claude Code GA 一周年回顾:验证与自动模式
Claude Code 的第一个演示收到了两个 Slack 反应。 GA 一周年之际,@bcherny 和 @_catwu 回顾:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。
来源: X:Claude Devs (@ClaudeDevs)
7. Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具
Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。
来源: Hugging Face:Blog(RSS)
8. OpenRouter Advisor 助小模型问高级模型
新服务器工具:Advisor 让较小的模型咨询一个更高智能的“顾问”模型。 帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵
来源: X:OpenRouter (@OpenRouter)