AI 日报｜2026-05-27｜谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题｜MiMo 2.5 Pro 大幅降价，与 DeepSeek V4 Pro 同价

1 条回复

33 次浏览

AI 热点日报（2026-05-27）

模型发布/更新

1. 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

2. 面壁智能开源 MiniCPM5-1B：在 AA-Index 上超越所有 2B 参数以下模型，能跑在手机、浏览器上

面壁智能开源其新一代端侧大语言模型 MiniCPM5-1B。该模型仅 1B 参数，在 AA-Index 榜单上超越所有 2B 参数以下模型，相比 3 个月前的 Qwen3.5-2B 效果更优且参数量减半。经 INT4 量化后权重仅 0.5GB，支持在手机和浏览器上运行。其 Base Model 版本由面壁智能自主研发的 AI 训练框架 ForgeTrain 预训练完成，现已全面开源模型权重、训练数据集与部署方案。
来源： IT 之家（RSS）

3. 腾讯混元新翻译模型双榜亮眼，小程序发布

腾讯混元发布翻译模型 Hy-MT2，在 Hugging Face 开源模型趋势排行榜上表现突出：1.8B 版本排名第一，30B-A3B（MoE）版本排名第四，下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序，支持语音输入与离线翻译，并可自定义翻译风格与指令。模型代码与权重已开源。
来源： X：腾讯混元 (@TencentHunyuan)

4. Qwen3.7-Max 成为全球第二 AI 编程模型

Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541，仅次于 Claude。专为生产环境打造：可运行 35 小时任务、1000+ 次工具调用，并在数小时内交付两周的项目。
来源： X：阿里云 / Alibaba Cloud (@alibaba_cloud)

产品发布/更新

1. MiMo 2.5 Pro 大幅降价，与 DeepSeek V4 Pro 同价

小米 MiMo-V2.5 系列 API 价格永久下调，最高降幅达 99%，现与 DeepSeek V4 Pro 同价。Token 套餐同步升级，同等价格下可用 token 量增加 5-8 倍，计费规则更简单透明。所有现有用户套餐额度将全额重置。此次降价源于 MiMo 全栈推理优化与服务效率提升，后续将发布技术博客详述细节。MiMo-V2.5-TTS 限时免费，新定价于 5 月 26 日生效。
来源： X：Kim (@kimmonismus)

2. Claude Code 推出安全漏洞识别插件

我们为 Claude Code 发布了一个安全指导插件，可在编写代码时帮助识别和修复漏洞。所有 Claude Code 用户均可使用。从插件市场（/plugins）安装。
来源： X：Claude Devs (@ClaudeDevs)

3. Replit 应用添加登录的两种方式

在 Replit 上为你的应用添加登录有两种方式： → Replit Auth：零配置，用户使用其 Replit 账户登录 → Clerk Auth：你自己的品牌化登录，开发/生产环境均只需一个提示词。文档和视频见下方 👇 文档： https://docs.replit.com/learn/projects-and-artifacts/auth#auth
来源： X：Replit (@Replit)

4. Kling AI 驱动《大卫之家》实现多项行业首创

Jon Erwin - Wonder Project 创始人兼首席创意官，Innovative Dreams 首席执行官，亚马逊 Prime 热门剧集《大卫之家》创作者： “Kling AI 是《大卫之家》第一季和第二季背后的核心力量。最让我兴奋的是它实现了多项行业首创：在完成的剧集中首次使用 AI 生成场景，首个原生 4K 模型。其运动控制功能也使我们能够在 AI 生成中保留演员真实的情感和感受。”
来源： X：可灵 Kling AI (@Kling_ai)

行业动态

1. 据报道 Claude Mythos 以“巧妙简洁的证明”解决了 OpenAI 里程碑式的 Erdős 问题

Anthropic 工程师 Sholto Douglas 表示，Claude Mythos 在周末期间解决了 OpenAI 提出的 Erdős 单位距离猜想问题，并给出了一个“巧妙简洁的证明”。这一成果被描述为人工智能在数学发现领域存在“严重超前”迹象。
来源： The Decoder：AI News（RSS）

2. SynthID 水印技术扩展合作，覆盖超千亿内容

SynthID 已为超过 1000 亿条内容添加水印，但透明度需要行业协作。因此，我们正与 OpenAI、ElevenLabs 和 Kakao 合作，将 SynthID 水印技术集成到他们的模型中——这延续了我们与 NVIDIA 共同推动的全行业趋势。
来源： X：Google DeepMind (@GoogleDeepMind)

3. OpenRouter 完成 1.13 亿美元 B 轮融资

今天我们宣布完成由@CapitalGVC 领投的 1.13 亿美元 B 轮融资。过去 6 个月，随着 AI 从实验快速转向生产，OpenRouter 的周处理量从 5 万亿增长到 25 万亿 token。我们对未来充满期待。
来源： X：OpenRouter (@OpenRouter)

4. Anthropic 任命 KiYoung Choi 为韩国代表董事

Anthropic 宣布任命 KiYoung Choi 为韩国代表董事，以支持其即将在首尔开设的办公室。根据 Anthropic 的经济指数，韩国是 Claude.ai 全球最活跃的市场之一，其使用率超过人口规模预期的 3.5 倍，主要用于技术和创意领域。KiYoung Choi 此前曾担任 Snowflake 韩国区总经理，在 Google Cloud、Adobe 等公司拥有超过 30 年的科技行业领导经验。他将在韩国领导市场战略，支持本地企业和初创公司应用 Claude，例如法律科技公司 Law&Company 及韩国电信巨头 SK Telecom 均已在使用 Claude 构建产品。
来源： Anthropic：Newsroom（网页）

5. 阿里云 CTO 阐述从云原生到智能体原生转型

在 #QwenConference2026 上，阿里云 CTO、国际业务总裁李飞飞博士阐述了我们从云原生到智能体原生的转变。为了普及 AI，我们构建了四大基石：模型、智能体云、工具与服务，以及规模。 👉 敬请关注： https://click.qwencloud.com/m/20000000187/
来源： X：阿里云 / Alibaba Cloud (@alibaba_cloud)

6. 微软亚洲研究院发起全球 AI 价值观挑战赛

AI 能否理解人类价值观的现实复杂性？微软亚洲研究院的全新全球 AI 价值观挑战赛，诚邀哲学、伦理、法学和社会科学领域的研究人员共同探索。立即注册： https://msft.it/6012vk8OO
来源： X：Microsoft Research (@MSFTResearch)

论文研究

1. KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分

团队推出 KPop，用于稳定大规模 MoE 模型的智能体强化学习训练。它用基于二元 KL 散度的自适应掩码机制，替代了此前 IcePop 方法中的固定比例掩码，能根据训练过程中的训练-推理不匹配程度动态调整。这一改进使得 Ring-2.6-1T 模型在无需修改基础设施或路由重放的情况下，仅通过纯 RL 训练，在 SWE-bench Verified 上取得了超过 76 分的成绩。
来源： X：蚂蚁百灵 (@AntLingAGI)

技巧与观点

1. Sundar Pichai 谈 AI、搜索的未来及网络的变化

Google 与 Alphabet CEO Sundar Pichai 在 Google I/O 后受访，回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合，包括全新的智能搜索框与 Gemini Spark 智能体平台，旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击，回应了主持人此前提出的“Google Zero”概念（即来自 Google 的网站流量可能归零），并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后，他对 Google DeepMind CEO Demis Hassabis 关于“处…
来源： The Verge：AI（RSS）

2. “龙虾之父”Peter 开源 skill-cleaner，为 AI 智能体技能“做体检”

“龙虾之父”Peter 开源了 skill-cleaner 工具，用于诊断和优化 AI 智能体的技能提示词。该工具包含 5 项核心功能，包括技能提示词预算审计、重复技能检测、未使用技能筛查、技能根目录审计和描述精简优化。其脚本采用标准 token 预算核算逻辑，旨在帮助减少冗长描述对 token 预算和上下文窗口的占用。已有用户实践显示，将技能描述从 90 多词精简至 40 词以内，能提升智能体选择技能的准确率。
来源： IT 之家（RSS）

3. Gemini Omni 视频提示词使用指南

Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧：利用模型已有的现实世界知识进行简洁描述；精确控制文本在视频中的渲染与排版；使用专业镜头指令（如推拉摇移）像电影摄影师一样调度画面；通过迭代编辑高效修改视频；以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。
来源： X：Google AI (@GoogleAI)

4. 人类与 AI 分工：教育咨询及文学奖争议

我写了一篇新文章，探讨我们需要保留哪些人类特质，以及哪些可以交给 AI，其中涉及教育、咨询领域的实验，以及最近关于文学奖的争议。
来源： X：Ethan Mollick (@emollick)

5. Project Luxo：跨越 AI 媒体的恐怖谷

Runway 通过 Project Luxo 研究发现，AI 生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等 AI 短片及广告样片，评估显示观众开始关注故事本身，而非技术瑕疵。所有作品均由单人团队制作，耗时从 3 周到 4 小时不等。Runway 认为，这标志着 AI 媒体成熟——当技术足够好以至于“隐形”，观众沉浸于故事时，便实现了这一跨越。
来源： Runway：News（网页）

6. 我们如何对不同产品中的 Claude 进行隔离控制

Anthropic 通过三重机制控制 Claude 智能体的部署风险，包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面：通过沙箱、虚拟机和网络出口控制限制智能体运行环境；利用系统提示词和模型训练引导其行为；以及对 MCP 服务器、第三方插件等外部内容实施细粒度权限管理。文章以 Claude Code、claude.ai 和 Claude Cowork 为例，阐述了不同产品如何设计对应的隔离架构。
来源： Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

7. SenseNova-U1 全训练代码开源，支持多模态多任务训练

OpenSenseNova 开源了 SenseNova-U1 的完整训练代码库，支持其 8B 密集模型与 A3B MoE 架构。该代码库使用一个统一的框架，可同时训练多种多模态任务，包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计，支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从 1×8 GPUs 到多节点集群的扩展能力。代码已在 GitHub 开源，采用 Apache-2.0 协议。
来源： X：商汤 SenseTime (@SenseTime_AI)

8. 未来展望：2026 年 5 月的一些想法

文章展望了截至 2026 年 5 月 AI 领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡（open-closed balance）的讨论、美国开源力量的显著增长（America's open-source surge），以及由此引发的新兴权力博弈（emerging power struggles）。
来源： Nathan Lambert：Interconnects（RSS）