AI 日报｜2026-05-28｜Runway 推出 Model Context Protocol 服务器｜黄仁勋展示英伟达台湾新园区

0 条回复

17 次浏览

AI 热点日报（2026-05-28）

产品发布/更新

1. Runway 推出 Model Context Protocol 服务器

Runway 正式推出 Runway MCP 服务器，允许任何兼容 MCP 的 AI 智能体（如 Claude、ChatGPT、Cursor）在对话界面中直接生成图像与视频，无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型，包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便，通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用，无需单独申请 API 密钥。
来源： Runway：News（网页）

2. Claude Code v2.1.152 更新发布

Claude Code 发布 v2.1.152 版本更新。核心改进包括：/code-review --fix 现在会将审查建议直接应用于工作目录；技能与斜杠命令支持通过 frontmatter 的 disallowed-tools 移除模型工具；新增 /reload-skills 命令可不重启会话重新扫描技能目录；SessionStart 钩子现可返回 reloadSkills: true 重新扫描技能，并可通过 hookSpecificOutput.sessionTitle 设置会话标题；新增 MessageDisplay 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至…
来源： Claude Code：GitHub Releases（RSS）

3. OpenAI 产品支持私有 MCP 服务器安全连接

您的团队可以在内部网络中保留 MCP 服务器，同时 ChatGPT、Codex 和 Responses API 通过仅出站 HTTPS 进行连接。
来源： X：OpenAI Developers (@OpenAIDevs)

4. 开源 FastVideo Dreamverse 实时视频生成工具

🚀 仅需 7 秒即可生成 30 秒 1080p 视频！我们开源了 FastVideo Dreamverse：基于单张 NVIDIA B200 GPU 和 LTX-2 模型，实现实时视频生成的氛围引导工具。 Repo: https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse Blog: https://haoailab.com/blogs/fastvideo-dreamverse-release/
来源： X：Sky Computing Lab (@haoailab)

5. Grok 编程智能体登陆 Kilo IDE 平台

在 @kilocode 中使用您的 SuperGrok 或 X Premium+ 订阅。尝试 grok-build-0.1，享受高速和智能体编程智能，可在 Kilo IDE 扩展或 CLI 中使用。 https://x.ai/news/grok-kilocode
来源：[X：xAI ( @xai )]( https://x.com/xai/status/2059666227115819149 )

6. Perplexity 开源 Unigram 分词器降低 CPU 占用

我们开源了重新构建的 Unigram 分词器，可将 CPU 占用降低 5-6 倍。小型重排序器和嵌入模型在 GPU 上运行时间仅为个位数毫秒，使得 CPU 分词成为总延迟的重要组成部分。 http://github.com/perplexityai/pplx-garden
来源： X：Perplexity (@perplexity_ai)

7. 通过万亿参数与 Hub Bucket 实现增量权重同步：TRL 中的增量权重同步

本文标题涉及 Hugging Face TRL 框架中一项具体的增量权重同步技术。正文重申了 Hugging Face 的核心使命，即致力于通过开源和开放科学，来推动人工智能的进步与普及。
来源： Hugging Face：Blog（RSS）

8. OpenCode 与 MiMo V2.5 限时免费开放

OpenCode x MiMo V2.5 - 限时免费 1M 上下文 • 推理 • 文本 • 图像
来源： X：opencode (@opencode)

行业动态

1. 黄仁勋展示英伟达台湾新园区

黄仁勋展示了新的台湾园区。英伟达计划每年在台湾投资约 1500 亿美元。就在竞争对手 AMD 宣布将向台湾 AI 领域投资超过 100 亿美元一周后。
来源： X：Rohan Paul (@rohanpaul_ai)

2. 我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等

来源： IT 之家（RSS）

3. Cognition 成为全球最大独立智能体实验室

Cognition 宣布已成为全球最大的独立智能体实验室。公司完成超 10 亿美元融资，估值达 260 亿美元，由 Lux Capital、General Catalyst 等领投。其企业使用量自年初增长超 10 倍，年化收入增至 4.92 亿美元。Cognition 于两年前推出 Devin，定位为首个 AI 软件工程师。公司强调其拥有多项领先优势，包括首个编码智能体、顶级代码审查能力等，并得到了 Peter Thiel 的重大投资。
来源： X：swyx (@swyx)

4. 教皇没对 AGI 上头

教皇 Leo XIV 发布题为《Magnifica Humanitas》的通谕，警告人工智能的使用绝非纯粹技术问题，当其进入影响人类生活的过程时，便触及权利、机会、地位与自由。通谕发布时，Anthropic 联合创始人 Christopher Olah 出席。文件引发了科技界内外的广泛反应。
来源： The Verge：AI（RSS）

5. 消息称高通与字节跳动达成 AI ASIC 芯片合作，采购量在数百万颗级别

来源： IT 之家（RSS）

6. 阿里云入选 Omdia 智能体 AI 市场雷达领导者

阿里云在 Omdia 的智能体 AI 市场雷达中被评为领导者。Omdia 强调了阿里云在每一层的全栈能力，认可其是首个将整个平台围绕智能体范式进行构建的云服务商。
来源： X：阿里云 / Alibaba Cloud (@alibaba_cloud)

7. 阿里云成为 PyTorch 基金会白金会员

阿里云宣布以白金会员身份加入 PyTorch 基金会。作为 AI 基础设施全球领导者，阿里云是开源模型家族 Qwen 的缔造方，已在多样化硬件上大规模运行 PyTorch，将为社区带来生产级工程经验。
来源： X：阿里云 / Alibaba Cloud (@alibaba_cloud)

8. 2026 年选举信息与保障

在 2026 年全球选举临近之际，通过帮助公众获取选举信息、支持网络防御者以及提升人工智能透明度这三方面的努力，来为选举提供保障。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

论文研究

1. Fast, faster, Qwen. 🚀

Qwen3.5 在 TokenSpeed 推理引擎上，针对智能体工作负载达到了创纪录的 580 tokens per second (tps)速度。这一成果由通义千问推理团队、lightseekorg Foundation TokenSpeed 团队、NVIDIA 及 Mooncake 团队共同实现，并采用了 tri_dao 的 FlashAttention-4 (FA4) 优化。此里程碑标志着开源大语言模型推理性能的边界得到了推动，相关详情可查阅 PyTorch 社区博客。
来源： X：通义千问 / Qwen (@Alibaba_Qwen)

2. ITBench-AA：前沿大模型在首个智能体企业 IT 任务基准测试中得分均低于 50%

由 Artificial Analysis 和 IBM 推出的 ITBench-AA SRE 基准测试显示，所有前沿大模型得分均未超过 50%。Claude Opus 4.7（自适应推理，最大努力）以 47% 领先，GPT-5.5（xhigh）和 Qwen3.7 Max 分别得 46% 和 42%。该测试包含 59 个需要通过 Shell 命令调查 Kubernetes 事件快照并提交根因诊断的智能体任务。关键发现是模型推理轮次差异近 3 倍，但更长的轨迹并不转化为更高准确率，过度调查的模型会因提交误报而受罚。在成本方面，开源模型 Gemma 4 31B（Reasoning）以每任务$0.14 的成本获得 37% 得分，优于成本更高但得分更低的闭源模型。
来源： Hugging Face：Blog（RSS）

3. 通过零信任聚合实现的隐私分析

Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境（TEE）的透明性，旨在实现前沿的隐私与安全保证。其核心是基于零信任原则，通过密码学与硬件保护的结合，确保系统仅能获取群体的匿名化聚合洞察。
来源： Google Research：Blog（网页）

4. 社会科学中的编码智能体

一项针对 1260 名定量社会科学家的调查显示，虽然 81% 的受访者用过 AI 聊天机器人，但仅有 20% 将 Claude Code、Codex 等编码智能体常规应用于工作。采用率存在显著差异：以男性名字命名的研究者使用率是女性研究者的两倍；顶尖大学研究者可能性高出 40%。用户产出更多工作论文和基金申请，但这可能反映早期采用者自身差异。研究者对 AI 助力撰写可发表论文更乐观，但对重塑整个社会科学领域持保留态度。这是一项初步调查，更深入研究仍在进行中。
来源： Anthropic：Research（发表成果 · 网页）

技巧与观点

1. 与 Google 搜索产品副总裁 Robby Stein 的访谈：AI 原生搜索时代

本文记录了与 Google 搜索产品副总裁 Robby Stein 在 Google I/O 的访谈，核心探讨 Google Search 向“AI 原生”模式的重大转变。讨论话题包括 AI Mode 是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI 搜索的高运行成本、Google TPU 及基础设施的优势、AI 时代搜索量不减反增的原因，以及优质 AI 回答与出版商流量之间的张力。访谈还涉及 Google 决定展示哪些信息源与链接的逻辑，并围绕一个核心问题展开：如果 Google 直接给出答案，传统的基于链接的网页生态将走向何方？
来源： X：Kim (@kimmonismus)

2. 藏师傅发布小红书图文排版 AI Skill，集成地图与自动配图

该推文介绍了 guizang-social-card-skill，一款针对小红书图文常见类别进行优化的 AI Skill。其亮点在于为旅行博主集成了地图组件，用户输入目的地和线路后，AI 能自动在底图上标记并嵌入图片。根据引用，该 Skill 完全基于 HTML 和实拍图片生成内容，不会被平台标注为 AI 生成，并会主动从高质量图片网站寻找对应主题图片，以优化图文排版。
来源： X：歸藏 (@op7418)

3. 使用大语言模型保障源代码安全

本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环：威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出，漏洞发现现在易于并行化，瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例，截至 2026 年 5 月 22 日已披露 1,596 个漏洞，其中 97 个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型，以降低误报，提升发现的可利用性。
来源： Claude：Blog（网页）

4. 用好 Coding Agent，重点是两头，尤其是开头的部分，如果一开始就走偏了后面怎么改都改不好。

用好 Coding Agent 的关键在于初始规划。方法是先将需求整理后，用最强模型（如 GPT-5.5、Claude Opus 4.7）分别在 Codex、Claude Code、Cursor 的 Plan 模式下生成设计方案，选择最优方案并借鉴其他版本。对于复杂计划，可将其拆分为多个 Phases 并明确要求与验证标准，形成 Markdown 文档。执行时按 Phases 进行，并辅以人工审核纠偏。最后的代码审核（Code Review）用 GPT-5.5 审核代码质量与设计符合度即可。应避免让多个智能体交叉 Review，否则可能导致代码越改越多。
来源： X：宝玉 (@dotey)

5. 我认为 Anthropic 和 OpenAI 找到了产品市场契合点

Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点，这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价，从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用，OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5（4 月 23 日）和 Opus 4.7（4 月 16 日）的 API 定价也显著高于前代版本。
来源： Simon Willison 博客

6. Reachy Mini 实现完全本地化语音交互

Reachy Mini 机器人现可通过 speech-to-speech 库实现完全本地化的语音交互，无需依赖云端。该方案采用级联流水线架构，对外提供 Realtime API 兼容的 WebSocket 接口。默认组件包括 Silero VAD 用于语音活动检测、Parakeet-TDT 作为语音转文本模型、通义千问（Qwen3-TTS）作为文本转语音模型。大语言模型推荐使用 llama.cpp 运行 Gemma 4。所有数据均在本地处理，保障了隐私且无 API 费用。
来源： Hugging Face：Blog（RSS）

7. OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重：我很高兴自己当时错了

来源： IT 之家（RSS）

8. AI 智能体的零信任安全框架

Anthropic 发布了针对企业部署自主 AI 智能体的安全框架，指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险：基础设施易受 AI 加速攻击，且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构（基础、高级、优化级）及八阶段实施流程，并概述了提示注入、工具投毒、记忆投毒等特有威胁。
来源： Claude：Blog（网页）

AI 日报｜2026-05-28｜Runway 推出 Model Context Protocol 服务器｜黄仁勋展示英伟达台湾新园区

AI 热点日报（2026-05-28）

产品发布/更新

1. Runway 推出 Model Context Protocol 服务器

2. Claude Code v2.1.152 更新发布

3. OpenAI 产品支持私有 MCP 服务器安全连接

4. 开源 FastVideo Dreamverse 实时视频生成工具

5. Grok 编程智能体登陆 Kilo IDE 平台

6. Perplexity 开源 Unigram 分词器降低 CPU 占用

7. 通过万亿参数与 Hub Bucket 实现增量权重同步：TRL 中的增量权重同步

8. OpenCode 与 MiMo V2.5 限时免费开放

行业动态

1. 黄仁勋展示英伟达台湾新园区

2. 我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等

3. Cognition 成为全球最大独立智能体实验室

4. 教皇没对 AGI 上头

5. 消息称高通与字节跳动达成 AI ASIC 芯片合作，采购量在数百万颗级别

6. 阿里云入选 Omdia 智能体 AI 市场雷达领导者

7. 阿里云成为 PyTorch 基金会白金会员

8. 2026 年选举信息与保障

论文研究

1. Fast, faster, Qwen. 🚀

2. ITBench-AA：前沿大模型在首个智能体企业 IT 任务基准测试中得分均低于 50%

3. 通过零信任聚合实现的隐私分析

4. 社会科学中的编码智能体

技巧与观点

1. 与 Google 搜索产品副总裁 Robby Stein 的访谈：AI 原生搜索时代

2. 藏师傅发布小红书图文排版 AI Skill，集成地图与自动配图

3. 使用大语言模型保障源代码安全

4. 用好 Coding Agent，重点是两头，尤其是开头的部分，如果一开始就走偏了后面怎么改都改不好。

5. 我认为 Anthropic 和 OpenAI 找到了产品市场契合点

6. Reachy Mini 实现完全本地化语音交互

7. OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重：我很高兴自己当时错了

8. AI 智能体的零信任安全框架

发表一个评论