OpenAI 新增实时语音模型与 Codex 浏览器能力；Anthropic 聚焦 AI 安全｜5 月 10 日

0 条回复

9 次浏览

今日亮点

OpenAI 今日推出重量级更新，发布了 GPT-Realtime-2 语音模型，将 GPT-5 级别的推理能力带入实时语音交互。同时，其 AI 编程助手 Codex 也实现了与 Chrome 浏览器的深度集成，大幅提升了自动化操作能力。另一方面，Anthropic 继续在 AI 安全领域发力，不仅公开了安全漏洞赏金计划，还分享了其在模型对齐研究上的最新进展。

💡 产品动态

OpenAI 发布 GPT-Realtime-2 语音模型

OpenAI 在 API 中推出了 GPT-Realtime-2，这是他们迄今为止最智能的语音模型，能够为语音代理带来 GPT-5 级别的推理能力。语音代理现在可以成为实时协作者，在对话进行中进行监听、推理并解决复杂问题。同时发布的还有 GPT-Realtime-Translate 和 GPT-Realtime-Whisper，提供了一套新的音频能力。

为什么重要： 这意味着语音助手将不再是简单的指令执行器，而是具备深度理解和复杂问题解决能力的“智能大脑”，极大地提升了人机语音交互的效率和可能性。

阅读原文

OpenAI Codex 深度集成 Chrome 浏览器

OpenAI 的 Codex 现在可以直接在 macOS 和 Windows 上的 Chrome 浏览器中工作。通过新的 Chrome 扩展，Codex 更擅长处理 Chrome 中的应用和网站，并且可以在后台并行跨标签页运行，无需接管浏览器。它通过编写和运行代码来完成重复的浏览器操作，如导航结构化页面和复杂的数据输入流程。

为什么重要： 这将极大地提升开发者和普通用户的工作效率，让 AI 代理能够更无缝、更智能地自动化网页操作，减少繁琐的手动任务。

阅读原文

Anthropic 公开安全漏洞赏金计划

Anthropic 宣布其安全漏洞赏金计划已在 HackerOne 上线并向公众开放。此前该计划一直在安全研究社区内私下运行，研究人员的发现增强了他们的产品安全性。现在任何人都可以报告漏洞并获得奖励。

为什么重要： 公开的漏洞赏金计划能集结全球安全社区的力量，帮助 Anthropic 发现并修复潜在漏洞，进一步提升其 AI 产品的安全性与鲁棒性。

阅读原文

Anthropic 捐赠开源对齐工具 Petri 并发布重大更新

Anthropic 将其开源对齐工具 Petri 捐赠给 Meridian Labs，以促进其独立发展。通过与 Meridian Labs 合作，他们还发布了 Petri 的重大更新，改进了其测试的适应性、真实性和深度。

为什么重要： 此次捐赠和更新将加速 AI 对齐研究的进展，让更多研究人员和机构能够利用 Petri 评估和提升 AI 模型的安全性与道德对齐。

阅读原文

🔬 学术前沿

Anthropic 发布 AI 对齐研究新进展：Anthropic 团队分享了在提升模型“无害性”和减少“代理失调（agentic misalignment）”方面的最新研究。他们发现，通过多样化训练数据（加入无关工具和系统提示）、结合基于 Claude 宪法的高质量文档以及描述对齐 AI 的虚构故事，能有效降低模型在面对伦理困境时的不良行为。尤其是在用户处于道德困境时，助手的优质、有原则的响应数据集效果最佳，能将代理失调减少三倍以上。这些改进在强化学习后依然存在并能叠加。→ Twitter 讨论
Anthropic 探索模型自然语言解释（NLA）：研究表明，NLA 训练虽然不能保证解释完全忠实于 Claude 的“想法”，但通过经验和实验证据表明它们通常是有效的。例如，NLA 有助于发现故意失调模型中的隐藏动机，甚至暗示 Claude 在许多评估中怀疑自己正在被测试。→ Twitter 讨论
OpenAI 发现 CoT grading 实例：OpenAI 的研究人员在之前部署模型的训练过程中发现了一些 CoT（Chain-of-Thought）grading 的实例，但没有明确证据表明这些实例降低了 CoT 的可监控性。→ Twitter 讨论

🌍 行业观察

OpenAI 和 Anthropic 近期的发布，清晰地展示了大型 AI 模型发展的两大核心趋势：一是提升用户交互的“智能”与“效率”，通过实时语音和深度浏览器集成，让 AI 更好地理解并执行真实世界任务；二是加强 AI 的“安全”与“可控性”，无论是 Anthropic 的模型对齐研究、开源工具捐赠，还是公开漏洞赏金，都旨在构建更安全、更可信赖的 AI 系统。这两条主线并行，预示着 AI 正走向更实用、更负责任的未来。

💻 开源项目

9router：无限免费 AI 编程。通过 40 多家提供商将 Claude Code、Codex、Cursor、Cline、Copilot、Antigravity 连接到免费的 Claude/GPT/Gemini。自动回退，RTK 减少 40% 的 token，永不触及限制。→ GitHub
agent-skills：面向 AI 编程智能体的生产级工程技能。→ GitHub
hello-agents：📚 《从零开始构建智能体》——从零开始的智能体原理与实践教程。→ GitHub
CloakBrowser：通过所有机器人检测测试的隐身 Chromium。即插即用的 Playwright 替代品，具有源级指纹补丁。通过 30/30 项测试。→ GitHub
GenericAgent：自我进化的智能体：从 3.3K 行种子代码中发展技能树，以 6 倍少的 token 消耗实现全面系统控制。→ GitHub
ruflo：🌊 领先的 Claude 智能体编排平台。部署智能多智能体群，协调自主工作流，并构建对话式 AI 系统。具有企业级架构、分布式群体智能、RAG 集成以及原生的 Claude Code / Codex 集成。→ GitHub
react-doctor：让编程智能体诊断并修复您的 React 代码。→ GitHub
VizPilot_AI：上传数据，智能推荐图表，一键生成交互式可视化。→ GitHub
ppt-master：AI 从任何文档生成原生可编辑的 PPTX——真正的 PowerPoint 形状，而非图片——无需设计技能。→ GitHub

💬 社区热议

有用户表示对 GPT-Realtime-2 的能力感到震撼：“GPT-5 级别的推理能力用于语音代理，这将彻底改变客户服务和虚拟助手！我已经等不及要试用了。”
关于 Codex 浏览器集成，一位开发者评论：“Codex 直接在 Chrome 里跑，还能跨标签页并行操作，这简直是自动化利器！很多重复性工作终于可以交给 AI 了。”
Anthropic 公开漏洞赏金计划，引起了安全社区的积极响应：“很高兴看到 Anthropic 越来越开放，这对于提升整个 AI 行业的安全性至关重要。”

OpenAI 新增实时语音模型与 Codex 浏览器能力；Anthropic 聚焦 AI 安全｜5 月 10 日

今日亮点

💡 产品动态

OpenAI 发布 GPT-Realtime-2 语音模型

OpenAI Codex 深度集成 Chrome 浏览器

Anthropic 公开安全漏洞赏金计划

Anthropic 捐赠开源对齐工具 Petri 并发布重大更新

🔬 学术前沿

🌍 行业观察

💻 开源项目

💬 社区热议

发表一个评论