AI 日报｜2026-06-06｜Riverflow 2.5：可控制评分标准的图像模型｜Gemini Live 支持实时创建编辑图像

0 条回复

2 次浏览

AI 热点日报（2026-06-06）

模型发布/更新

1. Riverflow 2.5：可控制评分标准的图像模型

在 OpenRouter 上线：来自@Sourceful 的 Riverflow 2.5。首个具有独立评分标准的图像模型，你可控制该标准以引导其思维和编辑，并具备可控的推理努力，可在速度与质量之间进行权衡。免费至 6 月 9 日（周二）。Fast 和 Pro 见下方 🧵。
来源： X：OpenRouter (@OpenRouter)

产品发布/更新

1. Gemini Live 支持实时创建编辑图像

你现可直接在 Gemini Live 中创建和编辑图像。无论是测试房间装饰、解决数学问题，还是制作可分享的梗图，所有操作都实时完成。只需打开 Gemini 应用，点击 Live 按钮，共享摄像头，告诉 Gemini 你想看到的。
来源： X：Gemini (@GeminiApp)

2. 智能体协作应如同事般对话和手势

与 AI 智能体协作应感觉像与同事协作一样。你应能“与它们交谈”——不仅通过文本聊天，还能一起对着屏幕做手势、实时对话等。
来源： X：Michael Truell (@mntruell)

3. Google AI 本周产品更新：Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

Google AI 本周发布多项更新：Nano Banana 2 及 Pro 正式 GA，可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取；Co-Scientist 多智能体系统面向科研自动生成优化新假设；Google Labs 推出 dreambeans，根据用户 Google 应用数据每日生成个性化话题集；Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本；Gemma 4 系列及草稿模型引入 QAT 降低内存需求；Google Magenta RealTime 2 开源实时音乐模型，支持 MIDI 键盘、文本提示和手势演奏…
来源： X：Google AI (@GoogleAI)

4. PolarDB-X Zero 上线：30 秒全分布式数据库

PolarDB-X Zero 上线了！无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。原生 HNSW 向量索引——内置兼容 MySQL 的引擎。关系型 + 语义搜索——一条 SQL 语句。 AI 智能体就绪——MCP 协议、AI IDE 兼容（Cursor、Claude、Qoder、Qodex 等）立即尝试： https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB
来源： X：阿里云 / Alibaba Cloud (@alibaba_cloud)

5. Google Colab CLI 发布

Google 推出 Colab 命令行界面（CLI），允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时，实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本，并检索工件日志或模型（如微调后的 Gemma 3 适配器）。工具可直接集成到标准终端环境，可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。
来源： Google Developers Blog（RSS）

6. 你的 AI 账单失控了。Cloudflare 现在可以解决这个问题。

Cloudflare AI Gateway 新增实时消费限制功能，防止跨多个 AI 提供商的 token 账单失控。通过与 Cloudflare Access 集成，企业可以使用基于身份的预算和策略管理 AI 使用成本。
来源： Cloudflare Blog

7. ChatGPT 网页版支持从写作块发送邮件

草拟。调整。发送。现在你可以在网页版 ChatGPT 中直接从写作块发送邮件，无需离开对话。
来源： X：ChatGPT (@ChatGPTapp)

8. 社区基于 MiniCPM-V 4.6 打造财务分析工具 AccountingLLM

社区开发者使用面壁智能 MiniCPM-V 4.6 构建了 AccountingLLM（quaesto.com），用于自动化财务文档分析。该工具可上传 IPO 招股书、年报或审计文件，自动从复杂 PDF 中提取财务表格、重建跨页表格、对照会计等式检查关键数据，并标记可疑条目供人工审核。开发者已将其商业化，成为实际可用的产品。
来源： X：面壁智能 OpenBMB (@OpenBMB)

行业动态

1. Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象，呼吁全球暂缓先进 AI 研发

Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象，呼吁全球暂缓前沿 AI 开发，以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识，发布可验证的规则，并类比“核武器不扩散条约”，但指出 AI 更难监管。该观点引发美国白宫部分官员不满，批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。
来源： IT 之家（RSS）

2. Apollo 敲定 350 亿美元债务融资，为 Anthropic 采购 AI 芯片

Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案，用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易。
来源： Bloomberg：Technology（RSS）

3. SpaceX 与 Google 达成云计算新协议

SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元（约合每年 110 亿美元），用于 xAI 数据中心的计算能力。这再次表明，AI 算力正成为一种战略性商品，就像发射能力或能源一样，而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司，可能会在其原有业务之外获得巨大的杠杆优势。
来源： X：Rohan Paul (@rohanpaul_ai)

4. AI 热推高美国计算基建 GDP 占比翻倍

AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度，与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%，推动整个计算基础设施占 GDP 比重达到约 1.5%。
来源： X：Epoch AI (@EpochAIResearch)

5. Meta 智能眼镜 App 暗藏人脸识别代码，NameTag 功能已推送至超 5000 万设备

据《连线》今日报道，Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中，代号“NameTag”。该功能利用已部署的三个 AI 模型将人脸转换为“人脸特征模板”，与手机本地数据库匹配，识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索，尚未决定推出，且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。
来源： IT 之家（RSS）

6. 五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器

据 The Intercept 6 月 5 日报道，美国五角大楼正在运营一个针对拉丁美洲的人工智能宣传机器（AI propaganda mill）。报道指出，该机器利用 AI 技术生成并传播宣传内容，目标为拉丁美洲地区。该消息在 Hacker News 上获得 100 点热度。
来源： Hacker News 热门（buzzing.cc 中文翻译）

7. 苹果新版 Siri 不会被宣传为完成品，内部将其标记为“Beta”版

苹果新版 Siri 被内部标记为“Beta”版，不会作为完成品宣传；可能设置等待清单供用户尝试。iOS 27 细节：通知到达重新设计，通知中心手势移至左上角；“查找”应用视觉重设计；照片“清理”功能改进；大量底层安全改进。部分 Siri 查询将通过 Google Cloud 调用授权版 Gemini，并使用谷歌的 NVIDIA Blackwell B200 集群处理。
来源： IT 之家（RSS）

8. OpenAI 前 CTO 称若 Altman 未回归公司可能已“瓦解”

Mira Murati 表示，如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位，OpenAI 很可能已经“瓦解”。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。
来源： Bloomberg：Technology（RSS）

论文研究

1. Arena 发布真实世界 AI 智能体排行榜 Agent Arena

Arena 推出基于真实用户任务的智能体排行榜，评估模型在代码编写、应用构建、文档分析等工作中的表现，而非孤立基准。排行榜基于 30 万+任务、200 万+工具调用和 4000 万行代码，综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名：GPT-5.5 High（+10.7%）、Claude Opus 4.7 Thinking（+9.5%）、GPT-5.4 High（+8.9%）。
来源： X：Rohan Paul (@rohanpaul_ai)

2. PixelDiT 入选 CVPR2026 最佳论文决赛

被选为 #CVPR2026 最佳论文决赛作品：来自 NVIDIA Research 的 PixelDiT 在大多数图像生成模型中，预训练的自编码器会在任何扩散发生前压缩图像，导致质量损失在整个流程中累积。 PixelDiT，即像素扩散变换器，完全去掉了这一步骤。它是一个单阶段模型，直接在像素空间中端到端地学习扩散过程。
来源： X：NVIDIA AI (@NVIDIAAI)

3. Anthropic：让 Claude 成为化学家

Anthropic 与顶尖化学家合作，提升 Claude 在化学领域的实用性。首个白皮书测试 Claude 在 NMR 谱图分析上的表现：在 20 个化合物上，对比 Claude Opus 4.7、Opus 4.6、Sonnet 4.6 与 ChemDraw、MestReNova 的正向预测（从结构预测谱图）和反向结构解析（从实验谱图推断结构）能力。所有化合物选自模型训练截止日期后发布的 ChemRxiv 预印本，以避免选择偏差。
来源： Anthropic：Research（发表成果 · 网页）

4. Meta SAM 3D 获 CVPR26 最佳论文荣誉提名

热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名！这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。论文链接： https://arxiv.org/abs/2511.16624
来源： X：AI at Meta (@AIatMeta)

5. 微软 Project Mosaic：micro-LED 光学互连技术

微软 Azure CTO Mark Russinovich 在 Build 2026 上介绍 Project Mosaic，这是微软剑桥研究院的实验性光学互连技术，采用 micro-LED 实现低功耗、高速数据传输。高级研究员 Kaoutar Benyahya 现场演示单个 LED 调制形成字母，证明概念具备实时响应能力。
来源： X：Microsoft Research (@MSFTResearch)

技巧与观点

1. Open Code Review – 一款基于人工智能的代码审查命令行工具

Open Code Review 是一个基于人工智能的代码审查命令行（CLI）工具，旨在帮助开发者通过自动化的方式提升代码审查效率。
来源： Hacker News 热门（buzzing.cc 中文翻译）

2. Hinton 称 AI 拥有意识：人类最好接受非唯一智能生命

AI 先驱 Geoffrey Hinton 表示，他认为 AI 拥有意识，人类应接受自己并非唯一智能生命。他指出 AI“非常像我们”，AI 聊天机器人必须理解问题才能作答，这种觉知等同于感知能力，智能不限于生物。主推文作者进一步讨论意识本质：笛卡尔的“我思故我在”和 fMRI 等实证手段都无法真正定义意识，人类对自身了解远不及想象。作者呼吁转向新哲学问题，厘清人与机器的区别与联系。
来源： X：Kim (@kimmonismus)

3. 375 个公众号 RSS 源优化 Agent 输入

你的 Agent 还在全网垃圾里捞内容？不如先喂它 375 个高质量微信公众号 RSS 源。 🔽
来源： X：洪明 (@hongming731)

4. 一个非常狠的 AI 教学提示词：追问式检查清单教学

这是一则 AI 提示词，让 AI 扮演极度严格的老师，通过逐阶段教学、持续维护 MD 检查清单来确保用户真正理解。AI 先让用户复述当前理解，再填补漏洞，并用开放式或选择题（随机选项顺序，提交前不公布答案）测试。教学必须覆盖问题本身、解决方案、宏观背景三个层面，并不断深挖“为什么”。仅当用户通过清单上所有项目的验证，会话才算结束。提示词强调对理解程度的主动验证，而非一次性灌输。
来源： X：小互 (@xiaohu)

5. 微软 CEO Satya Nadella 最新访谈上线

Satya Nadella 在 Latent Space 发布最新访谈，链接见原文。原推文仅评论“chat is he cooked”。
来源： X：swyx (@swyx)

6. 用 Qwen2.5-3B 构建多智能体经济体：工程报告

开发者用 Qwen2.5-3B 构建了五人森林生物多智能体经济体，每个智能体独立运行，通过 vLLM 部署在 Modal，以 Gradio 为交互窗口。3B 模型在 100% 调用中输出有效 JSON，但经济判断能力弱。通过设计稀缺性（食物品种限制、易腐坏、冬季燃料危机）和优化提示词（禁止买入自产物品、给出示例）提升决策质量。15 轮模拟中，蜜价从 10 跌至 3、柴价从 4 涨至 7、财富基尼系数从 0.14 扩至 0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。
来源： Hugging Face：Blog（RSS）

7. 腾讯混元联合人大开源 PlanningBench 评估框架

腾讯混元（Tencent Hunyuan）与中国人民大学高瓴人工智能学院合作，开源 PlanningBench——一个可扩展、可验证的 LLM 规划能力评估与训练框架。该框架包含 30+真实世界规划任务，支持自动验证和训练。PlanningBench 旨在推动 LLM 从“说”到“做”的规划能力发展。资源已发布于 arXiv、GitHub 及 HuggingFace。
来源： X：腾讯混元 (@TencentHunyuan)

8. Claude 是否增加了 rsync 中的错误？

一篇 Hacker News 热门帖子（105 分）提出了 Claude 是否导致 rsync 工具中 bug 增加的问题，并附有分析链接。
来源： Hacker News 热门（buzzing.cc 中文翻译）