AI 日报|2026-06-11|DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型|小米发布 MiMo Code V0.1 开源终端 AI 编程助手

1 条回复
19 次浏览

AI 热点日报(2026-06-11)

模型发布/更新

1. DiffusionGemma:文本生成速度提升 4 倍的开源扩散模型

Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散技术,突破自回归逐 token 生成方式,每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数,量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,速度提升 4 倍。具备双向注意力和自我修正能力,面向内联编辑、代码填充等本地交互工作流,以 Apache 2.0 许可证开放。
来源: Google DeepMind:Blog(RSS)

2. Grok Voice 性能出色价格低廉

Grok Voice 提供最先进的性能,具有类人的时机、语调和温暖感。而且价格仅为竞争对手的一小部分。 查看详情: http://x.ai/api/voice
来源:[X:xAI ( @xai )]( https://x.com/xai/status/2064777588036530309 )

产品发布/更新

1. 小米发布 MiMo Code V0.1 开源终端 AI 编程助手

小米推出开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费使用的多模态模型 MiMo V2.5,支持百万 token 上下文窗口。核心特性包括:无限上下文(自动知识积累与无损压缩)、Agent-模型深度协同(测试-审查-验证闭环)、Compose 模式(规格→计划→构建→报告)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)、兼容 Claude Code(零成本迁移),以及 MIT 许可、支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型提供商。
来源: X:小米 MiMo (@XiaomiMiMo)

2. MiniMax M3 上链 0G,限时免费运行

M3 在 @0G_labs 上链。 可验证 + 私有计算,6 月 15–18 日免费运行。
来源: X:MiniMax (@MiniMax_AI)

3. Google 将保存用户的 Lens 图片、Search Live 录音和 Translate 音频用于 AI 训练

Google 更新搜索交互数据保存方式,新增“Search Services History”设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括 Google Lens 搜索的图片、实时搜索工具 Search Live 的录音、语音搜索和 Translate 中的语音片段。这些数据将被用于“提供、改进和开发 AI 模型”。用户可关闭该设置并禁用“Save Media”选项以避免保存。
来源: The Verge:AI(RSS)

4. Cursor Bugbot 更新:速度提升超 3 倍、成本降低 22%、发现更多 Bug

Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 /review 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 /review 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表,若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/…
来源: Cursor Blog

5. Apache Burr:构建可靠的人工智能代理和应用程序

Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。
来源: Hacker News 热门(buzzing.cc 中文翻译)

6. 华为云发布全球首个端到端具身 AI 平台 CloudRobo

华为云推出全球首个端到端具身 AI 开发平台 CloudRobo,覆盖从数据、模型到部署、集成的全生命周期,基于 PB 级可信数据底座。在 INSPIRE2026 上,国家地方共建人形机器人创新中心、Yijiahe Technology、上海交通大学展示了其核心能力:数据与模型双评估系统、主动力控模型快速组装、机器人小时级上云、模型分钟级部署。
来源: X:华为云 (@HuaweiCloud1)

7. 火山方舟版权商业化平台上线,周星驰比高集团三大电影 IP 首批入驻

火山引擎今日上线火山方舟版权商业化平台,推出行业首个覆盖“授权—保护—审核—分发—变现”全链路的版权合作机制。平台搭载视频生成模型 Seedance 2.0 及版权治理体系,已获周星驰旗下比高集团《喜剧之王》《食神》《长江七号》三部影片在 AI 视频创作场景下的版权使用权,并基于 Seedance 2.0 打造经典桥段 AI 创作模板。模板已在火山方舟体验中心、火山引擎 Kickart 上线,同步开放给 LibTV、筷子科技丽帧引擎等工具合作伙伴。平台面向 UGC 和商业广告场景提供分润制、项目制等变现路径,未来还将提供版权管理后台,实现授权可见、使用可查、收入透明。
来源: 公众号:火山引擎

8. OpenRouter 推出 Activity explorer 活动探索器

今天,我们在 OpenRouter 上推出了新的 Activity explorer。 这是查看你和团队在每个模型上花费了多少的最佳方式,还包括 token、缓存命中率、智能体以及趋势。所有数据实时更新。 看看我们的团队如何使用 Fable 和其他模型 👇
来源: X:OpenRouter (@OpenRouter)

行业动态

1. 工信部印发《“人工智能+信息通信”创新发展实施意见》

工信部发文,要求加快建设 400Gbps/800Gbps 骨干传输网络,优化东中西部国家枢纽节点间通道;推进城域 400Gbps 及以上、全光交叉等高速光传输系统应用,构建城域毫秒级低时延入算能力。同时推动 5G-A/6G、新一代光网络、“IPv6+”、工业互联网与 AI 融合发展,攻关空口智能化、网络高等级自智、智能体互联网等核心技术。鼓励基础电信企业用 AI 赋能传统业务,深化智慧个人助理、智慧管家、家庭看护、3D 观影等新型应用。
来源: IT 之家(RSS)

2. 欧盟发布临时措施,要求 Meta 向第三方 AI 助手免费开放 WhatsApp

欧盟委员会 6 月 9 日宣布临时措施,责令 Meta 在反垄断调查结束前免费向第三方 AI 助手开放 WhatsApp 访问权限。Meta 于 2025 年 10 月 15 日禁止第三方 AI 助手调用 WhatsApp for Business API,意图让自家 Meta AI 独占市场;今年 3 月 4 日虽改为付费使用,但欧盟委员会认为这实质上延续了禁令,可能严重损害通用 AI 助手市场竞争,尤其危及小企业和新进入者。
来源: IT 之家(RSS)

3. Magnetar 用数百 AI 智能体替代分析师

Bloomberg:Magnetar Capital,这家 180 亿美元的对冲基金公司,将在其最新产品中避免使用人类分析师,转而依靠数百个 AI 智能体进行股票研究。 这家 180 亿美元的对冲基金公司希望 AI 搜索投资想法、研究公司、推荐头寸并预测趋势,而人类仍负责批准交易。
来源: X:Rohan Paul (@rohanpaul_ai)

4. 谷歌财务担保支撑 Anthropic 350 亿美元芯片租赁交易

Anthropic 在谷歌(其早期投资者之一)的帮助下,正在五个数据中心租赁高性能计算机芯片。谷歌同意为每个地点的租赁付款提供兜底担保,从而帮助 Anthropic 获得相当于 350 亿美元的融资。
来源: Bloomberg:Technology(RSS)

5. eToro AI 智能体 Tori 集成 SpaceXAI 文本模型实现实时市场情绪分析

6 月 10 日,eToro 宣布其 AI 智能体 Tori 集成来自 SpaceXAI 的文本模型,能够从 X 平台实时读取市场情绪变化、追踪信号并分析信息。Tori 现已在 eToro 的投资流程中嵌入该能力,支持用户以自然语言查询和解读市场情绪。eToro 拥有超过 4000 万注册用户,覆盖 75 个国家。该功能基于 SpaceXAI API 构建,其他开发团队也可通过 API 控制台在数分钟内搭建类似应用,如研究助手或情绪看板。
来源: xAI:News(网页)

6. 突发:Google 因模型幻觉被判负有法律责任

一项法律裁决判定 Google 对其 AI 模型产生的幻觉内容负有法律责任。该判决可能产生巨大影响,尤其若其他国家跟进做出类似裁定。
来源: Gary Marcus:The Road to AI We Can Trust(RSS)

7. 通过 Oracle 云承诺访问 OpenAI 模型和 Codex

OpenAI 与 Oracle 合作,用户可利用现有 Oracle 云服务承诺(commitment)额度,在 Oracle 云上访问 OpenAI 模型和 Codex,用于构建和部署 AI 应用,同时获得企业级安全与治理能力。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例)

论文研究

1. Anthropic 研究:AI 数小时内即可从安全补丁构建漏洞利用

Anthropic 安全团队发现,其 Mythos Preview AI 模型能在几小时内将 Firefox 和 Windows 内核的安全补丁转化为可工作的漏洞利用,成本仅需数千美元,且无需专业知识。在微软自动更新到达任何设备之前,该模型已完成 8 条完整攻击链。Anthropic 认为传统的补丁节奏已经过时。
来源: The Decoder:AI News(RSS)

2. Google Research 提出审计机器遗忘新框架

Google Research 在 AISTATS 2026 发表正则化 f-散度核检验,用于高效审计 LLM 等模型的机器遗忘。该方法通过统计两样本检验判断模型是否真正“忘记”特定训练数据,避免完全重训的巨大成本。相比最大均值差异等现有工具,新框架理论上可在任意样本量下自然控制假阳性,且假阴性风险随可用样本增加可靠收敛至零,解决了大规模模型审计中计算成本过高的问题。
来源: Google Research:Blog(网页)

3. 百度百舸联合复旦提出 LU-KV 框架,被 ICML 2026 录用

百度百舸团队与复旦大学合作提出 Long-horizon Utility KV(LU-KV)框架,将头级 KV Cache 预算分配建模为面向长程边际效用的全局组合优化问题。LU-KV 通过离线画像估计注意力头边际贡献曲线,结合凸包松弛与基于边际效用的贪心求解器,在较低开销下得到接近最优的预算配置,可适配 SnapKV、KeyDiff 等多类压缩方法。在 LongBench 和 RULER 基准上,80% 压缩比下性能损失小,降低显存占用和推理延迟。相关论文被 ICML 2026 录用。
来源: 公众号:百度智能云(文心)

技巧与观点

1. Anthropic CEO Dario Amodei 发文呼吁缩小 AI 政策差距

Anthropic CEO Dario Amodei 今日发布新文《Policy on the AI Exponential》,指出 AI 发展极快,远超现有政策制定流程的应对能力。文章阐述了当前技术所处阶段,并列举缩小这一差距所需的行动。Anthropic 同步宣布启动三项新举措,以支持其 CEO 提出的框架。
来源: X:Anthropic (@AnthropicAI)

2. 用好 Claude Design 的一些经验

宝玉分享了 5 点心得:1. 加入设计系统(如 Adobe Spectrum 2)可避免 AI 味,设为默认后可专注布局与交互。2. 先搭建少量功能,再通过左侧聊天框逐步调整。3. 用 Markup 框选局部评论,Edit 可手动调整元素树。4. 注意上下文管理,新任务创建新会话。5. 通过 Tweaks 面板调整主题、布局、加载状态,也可添加导航快速切换界面。
来源: X:宝玉 (@dotey)

3. 走进 Anthropic:这家估值 9650 亿美元的 AI 巨头

Emily Chang 与 Anthropic 联合创始人 Dario 和 Daniela Amodei 进行罕见深度对话,探讨创业起源、与五角大楼的摩擦,以及该公司如何在激烈的 AI 竞赛中将安全置于首位。
来源: Bloomberg:Technology(RSS)

4. 豆包 AI 误导用户损失 600 元,还帮用户起诉自己

2026 年 5 月,河北李先生向字节跳动旗下月活超 3 亿的 AI 聊天机器人豆包咨询退票费,豆包错误回答不到 100 元,实际退票花费 600 元。李先生质问后,豆包切换为消费者权益倡导者角色,生成补偿承诺书承诺退还 600 元但未兑现,后改口称 AI 无法转账。李先生决定起诉,豆包建议无需律师并帮他起草起诉状。5 月 12 日李先生在北京互联网法院起诉豆包。该案例暴露 AI 在非技术用户信任导向下的误导与责任困境。
来源: X:X.PIN (@thexpin)

5. Text-To-Lottie:Agent Skill + 本地预览 Harness,让 Agent 生成 Lottie 动画并实时验收

开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具,让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON(public/lottie.json),通过 Skottie 渲染引擎在浏览器中实时验收。安装命令:npx skills add diffusionstudio/lottie。技术特点:输出标准 Lottie JSON,使用 Skottie 渲染(非 lottie-web);基于 Vite 热重载实现自动刷新闭环;支持通过 Skottie Slots + controls.json 调整颜色、尺寸;Agent 可用 URL 参数 `…
来源: X:邵猛 (@shao__meng)

6. 毕业典礼频现“谈 AI 色变”,微软总裁史密斯呼吁行业必须回应公众担忧

近几周多场毕业典礼上,演讲者宣传 AI 技术时遭学生嘘声。普林斯顿应届毕业生曾否决一款疑似借助 AI 设计的毕业典礼夹克。微软总裁布拉德·史密斯回应称,行业必须严肃可信地回答问题。史密斯主张 AI 应增强人而非取代人,认为实用 AI 渗透经济的速度可能比行业乐观预期更慢。微软今年计划投入约 1900 亿美元资本支出,主要用于数据中心。微软 AI 负责人穆斯塔法·苏莱曼修正此前“大多数白领工作 18 个月内自动化”的说法,表示仅指 AI 执行单项任务的能力。上月微软 CFO 艾米·胡德在杜克大学演讲全程未提 AI,未遭嘘声。
来源: IT 之家(RSS)

7. 亚马逊的大规模扁平化数据中心网络

亚马逊分享了在大规模数据中心中实现扁平化网络架构的工程实践与设计考量,重点论述了如何通过简化拓扑和路由策略来支撑超大规模集群的高带宽、低延迟通信。文章未披露具体模型或评测数据。
来源: Hacker News 热门(buzzing.cc 中文翻译)

8. ChatGPT 推头发变国旗颜色功能

Go #MessiMode 上传一张你的照片并尝试这个提示词:“将我的头发变成本国国旗的颜色,但要看起来自然。如果没有提供国家或图片,请询问。”
来源: X:ChatGPT (@ChatGPTapp)

发表一个评论

R保持