AI 日报|2026-05-28|Runway 推出 Model Context Protocol 服务器|黄仁勋展示英伟达台湾新园区

0 条回复
17 次浏览

AI 热点日报(2026-05-28)

产品发布/更新

1. Runway 推出 Model Context Protocol 服务器

Runway 正式推出 Runway MCP 服务器,允许任何兼容 MCP 的 AI 智能体(如 Claude、ChatGPT、Cursor)在对话界面中直接生成图像与视频,无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型,包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便,通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用,无需单独申请 API 密钥。
来源: Runway:News(网页)

2. Claude Code v2.1.152 更新发布

Claude Code 发布 v2.1.152 版本更新。核心改进包括:/code-review --fix 现在会将审查建议直接应用于工作目录;技能与斜杠命令支持通过 frontmatter 的 disallowed-tools 移除模型工具;新增 /reload-skills 命令可不重启会话重新扫描技能目录;SessionStart 钩子现可返回 reloadSkills: true 重新扫描技能,并可通过 hookSpecificOutput.sessionTitle 设置会话标题;新增 MessageDisplay 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至…
来源: Claude Code:GitHub Releases(RSS)

3. OpenAI 产品支持私有 MCP 服务器安全连接

您的团队可以在内部网络中保留 MCP 服务器,同时 ChatGPT、Codex 和 Responses API 通过仅出站 HTTPS 进行连接。
来源: X:OpenAI Developers (@OpenAIDevs)

4. 开源 FastVideo Dreamverse 实时视频生成工具

🚀 仅需 7 秒即可生成 30 秒 1080p 视频! 我们开源了 FastVideo Dreamverse:基于单张 NVIDIA B200 GPU 和 LTX-2 模型,实现实时视频生成的氛围引导工具。 Repo: https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog: https://haoailab.com/blogs/fastvideo-dreamverse-release/
来源: X:Sky Computing Lab (@haoailab)

5. Grok 编程智能体登陆 Kilo IDE 平台

在 @kilocode 中使用您的 SuperGrok 或 X Premium+ 订阅。 尝试 grok-build-0.1,享受高速和智能体编程智能,可在 Kilo IDE 扩展或 CLI 中使用。 https://x.ai/news/grok-kilocode
来源:[X:xAI ( @xai )]( https://x.com/xai/status/2059666227115819149 )

6. Perplexity 开源 Unigram 分词器降低 CPU 占用

我们开源了重新构建的 Unigram 分词器,可将 CPU 占用降低 5-6 倍。 小型重排序器和嵌入模型在 GPU 上运行时间仅为个位数毫秒,使得 CPU 分词成为总延迟的重要组成部分。 http://github.com/perplexityai/pplx-garden
来源: X:Perplexity (@perplexity_ai)

7. 通过万亿参数与 Hub Bucket 实现增量权重同步:TRL 中的增量权重同步

本文标题涉及 Hugging Face TRL 框架中一项具体的增量权重同步技术。正文重申了 Hugging Face 的核心使命,即致力于通过开源和开放科学,来推动人工智能的进步与普及。
来源: Hugging Face:Blog(RSS)

8. OpenCode 与 MiMo V2.5 限时免费开放

OpenCode x MiMo V2.5 - 限时免费 1M 上下文 • 推理 • 文本 • 图像
来源: X:opencode (@opencode)

行业动态

1. 黄仁勋展示英伟达台湾新园区

黄仁勋展示了新的台湾园区。 英伟达计划每年在台湾投资约 1500 亿美元。 就在竞争对手 AMD 宣布将向台湾 AI 领域投资超过 100 亿美元一周后。
来源: X:Rohan Paul (@rohanpaul_ai)

2. 我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等

来源: IT 之家(RSS)

3. Cognition 成为全球最大独立智能体实验室

Cognition 宣布已成为全球最大的独立智能体实验室。公司完成超 10 亿美元融资,估值达 260 亿美元,由 Lux Capital、General Catalyst 等领投。其企业使用量自年初增长超 10 倍,年化收入增至 4.92 亿美元。Cognition 于两年前推出 Devin,定位为首个 AI 软件工程师。公司强调其拥有多项领先优势,包括首个编码智能体、顶级代码审查能力等,并得到了 Peter Thiel 的重大投资。
来源: X:swyx (@swyx)

4. 教皇没对 AGI 上头

教皇 Leo XIV 发布题为《Magnifica Humanitas》的通谕,警告人工智能的使用绝非纯粹技术问题,当其进入影响人类生活的过程时,便触及权利、机会、地位与自由。通谕发布时,Anthropic 联合创始人 Christopher Olah 出席。文件引发了科技界内外的广泛反应。
来源: The Verge:AI(RSS)

5. 消息称高通与字节跳动达成 AI ASIC 芯片合作,采购量在数百万颗级别

来源: IT 之家(RSS)

6. 阿里云入选 Omdia 智能体 AI 市场雷达领导者

阿里云在 Omdia 的智能体 AI 市场雷达中被评为领导者。Omdia 强调了阿里云在每一层的全栈能力,认可其是首个将整个平台围绕智能体范式进行构建的云服务商。
来源: X:阿里云 / Alibaba Cloud (@alibaba_cloud)

7. 阿里云成为 PyTorch 基金会白金会员

阿里云宣布以白金会员身份加入 PyTorch 基金会。作为 AI 基础设施全球领导者,阿里云是开源模型家族 Qwen 的缔造方,已在多样化硬件上大规模运行 PyTorch,将为社区带来生产级工程经验。
来源: X:阿里云 / Alibaba Cloud (@alibaba_cloud)

8. 2026 年选举信息与保障

在 2026 年全球选举临近之际,通过帮助公众获取选举信息、支持网络防御者以及提升人工智能透明度这三方面的努力,来为选举提供保障。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例)

论文研究

1. Fast, faster, Qwen. 🚀

Qwen3.5 在 TokenSpeed 推理引擎上,针对智能体工作负载达到了创纪录的 580 tokens per second (tps)速度。这一成果由通义千问推理团队、lightseekorg Foundation TokenSpeed 团队、NVIDIA 及 Mooncake 团队共同实现,并采用了 tri_dao 的 FlashAttention-4 (FA4) 优化。此里程碑标志着开源大语言模型推理性能的边界得到了推动,相关详情可查阅 PyTorch 社区博客。
来源: X:通义千问 / Qwen (@Alibaba_Qwen)

2. ITBench-AA:前沿大模型在首个智能体企业 IT 任务基准测试中得分均低于 50%

由 Artificial Analysis 和 IBM 推出的 ITBench-AA SRE 基准测试显示,所有前沿大模型得分均未超过 50%。Claude Opus 4.7(自适应推理,最大努力)以 47% 领先,GPT-5.5(xhigh)和 Qwen3.7 Max 分别得 46% 和 42%。该测试包含 59 个需要通过 Shell 命令调查 Kubernetes 事件快照并提交根因诊断的智能体任务。关键发现是模型推理轮次差异近 3 倍,但更长的轨迹并不转化为更高准确率,过度调查的模型会因提交误报而受罚。在成本方面,开源模型 Gemma 4 31B(Reasoning)以每任务$0.14 的成本获得 37% 得分,优于成本更高但得分更低的闭源模型。
来源: Hugging Face:Blog(RSS)

3. 通过零信任聚合实现的隐私分析

Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境(TEE)的透明性,旨在实现前沿的隐私与安全保证。其核心是基于零信任原则,通过密码学与硬件保护的结合,确保系统仅能获取群体的匿名化聚合洞察。
来源: Google Research:Blog(网页)

4. 社会科学中的编码智能体

一项针对 1260 名定量社会科学家的调查显示,虽然 81% 的受访者用过 AI 聊天机器人,但仅有 20% 将 Claude Code、Codex 等编码智能体常规应用于工作。采用率存在显著差异:以男性名字命名的研究者使用率是女性研究者的两倍;顶尖大学研究者可能性高出 40%。用户产出更多工作论文和基金申请,但这可能反映早期采用者自身差异。研究者对 AI 助力撰写可发表论文更乐观,但对重塑整个社会科学领域持保留态度。这是一项初步调查,更深入研究仍在进行中。
来源: Anthropic:Research(发表成果 · 网页)

技巧与观点

1. 与 Google 搜索产品副总裁 Robby Stein 的访谈:AI 原生搜索时代

本文记录了与 Google 搜索产品副总裁 Robby Stein 在 Google I/O 的访谈,核心探讨 Google Search 向“AI 原生”模式的重大转变。讨论话题包括 AI Mode 是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI 搜索的高运行成本、Google TPU 及基础设施的优势、AI 时代搜索量不减反增的原因,以及优质 AI 回答与出版商流量之间的张力。访谈还涉及 Google 决定展示哪些信息源与链接的逻辑,并围绕一个核心问题展开:如果 Google 直接给出答案,传统的基于链接的网页生态将走向何方?
来源: X:Kim (@kimmonismus)

2. 藏师傅发布小红书图文排版 AI Skill,集成地图与自动配图

该推文介绍了 guizang-social-card-skill,一款针对小红书图文常见类别进行优化的 AI Skill。其亮点在于为旅行博主集成了地图组件,用户输入目的地和线路后,AI 能自动在底图上标记并嵌入图片。根据引用,该 Skill 完全基于 HTML 和实拍图片生成内容,不会被平台标注为 AI 生成,并会主动从高质量图片网站寻找对应主题图片,以优化图文排版。
来源: X:歸藏 (@op7418)

3. 使用大语言模型保障源代码安全

本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环:威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出,漏洞发现现在易于并行化,瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例,截至 2026 年 5 月 22 日已披露 1,596 个漏洞,其中 97 个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型,以降低误报,提升发现的可利用性。
来源: Claude:Blog(网页)

4. 用好 Coding Agent,重点是两头,尤其是开头的部分,如果一开始就走偏了后面怎么改都改不好。

用好 Coding Agent 的关键在于初始规划。方法是先将需求整理后,用最强模型(如 GPT-5.5、Claude Opus 4.7)分别在 Codex、Claude Code、Cursor 的 Plan 模式下生成设计方案,选择最优方案并借鉴其他版本。对于复杂计划,可将其拆分为多个 Phases 并明确要求与验证标准,形成 Markdown 文档。执行时按 Phases 进行,并辅以人工审核纠偏。最后的代码审核(Code Review)用 GPT-5.5 审核代码质量与设计符合度即可。应避免让多个智能体交叉 Review,否则可能导致代码越改越多。
来源: X:宝玉 (@dotey)

5. 我认为 Anthropic 和 OpenAI 找到了产品市场契合点

Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点,这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价,从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用,OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5(4 月 23 日)和 Opus 4.7(4 月 16 日)的 API 定价也显著高于前代版本。
来源: Simon Willison 博客

6. Reachy Mini 实现完全本地化语音交互

Reachy Mini 机器人现可通过 speech-to-speech 库实现完全本地化的语音交互,无需依赖云端。该方案采用级联流水线架构,对外提供 Realtime API 兼容的 WebSocket 接口。默认组件包括 Silero VAD 用于语音活动检测、Parakeet-TDT 作为语音转文本模型、通义千问(Qwen3-TTS)作为文本转语音模型。大语言模型推荐使用 llama.cpp 运行 Gemma 4。所有数据均在本地处理,保障了隐私且无 API 费用。
来源: Hugging Face:Blog(RSS)

7. OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重:我很高兴自己当时错了

来源: IT 之家(RSS)

8. AI 智能体的零信任安全框架

Anthropic 发布了针对企业部署自主 AI 智能体的安全框架,指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险:基础设施易受 AI 加速攻击,且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构(基础、高级、优化级)及八阶段实施流程,并概述了提示注入、工具投毒、记忆投毒等特有威胁。
来源: Claude:Blog(网页)

发表一个评论

R保持