OpenAI 升级 Codex 浏览器能力、推实时语音 API;Anthropic 发布安全赏金计划|5 月 9 日
今日亮点
今天 AI 圈有两家大厂的重磅消息:OpenAI 进一步提升了其编码助手 Codex 的实用性,不仅能直接在 Chrome 浏览器中运行,还推出了全新的实时语音 API,让 AI 语音助手更智能、反应更快。与此同时,Anthropic 则将重心放在了 AI 安全上,不仅将开源对齐工具 Petri 捐赠给 Meridian Labs,还面向公众开放了安全漏洞赏金计划,并深入解读了其 NLA(自然语言自编码器)在理解 AI 内部思考过程中的应用。
💡 产品动态
OpenAI 推出 GPT-Realtime-2 实时语音模型 🚀
OpenAI 今天通过 API 发布了 GPT-Realtime-2,这是他们迄今为止最智能的语音模型,为语音代理带来了 GPT-5 级别的推理能力。结合同时推出的 GPT-Realtime-Translate 和 GPT-Realtime-Whisper 流媒体模型,语音代理现在可以像真正的协作者一样,在对话过程中实时听取、推理并解决复杂问题。
为什么重要: 这意味着 AI 语音交互将变得更加自然和高效,AI 助手不再只是执行简单指令,而是能进行更深层次的实时协作和问题解决,为下一代语音界面奠定基础。
OpenAI 深度集成 Codex 至 Chrome 浏览器
OpenAI 宣布其编码助手 Codex 现在可以直接在 macOS 和 Windows 上的 Chrome 浏览器中运行。它能更好地与 Chrome 中的应用程序和网站协同工作,甚至可以在后台跨多个标签页并行操作,而不会占用浏览器。用户只需在 Codex 应用中安装 Chrome 插件即可启用。Codex 还能通过编写和运行代码,快速处理重复性浏览器工作,如导航结构化页面和复杂的数据输入流程,并能根据任务选择最佳工具。
为什么重要: 这极大地扩展了 Codex 的应用场景,将其从代码编写扩展到日常的浏览器自动化任务,让开发者和普通用户都能利用 AI 提高网络操作的效率,减少重复劳动。
Anthropic 开放公共安全漏洞赏金计划 🛡️
Anthropic 在 HackerOne 上正式启动了其公共安全漏洞赏金计划。该计划此前一直在安全研究社区内部运行,此次面向公众开放,任何发现 Anthropic 产品漏洞的人都可以报告并获得奖励。
为什么重要: 这表明 Anthropic 对其 AI 模型的安全性充满信心,并致力于通过社区力量共同发现并修复潜在问题,提升其 AI 产品的整体安全性和可靠性。
🔬 学术前沿
- Anthropic 捐赠开源对齐工具 Petri 并发布重大更新:Anthropic 将其开源对齐工具 Petri 捐赠给 Meridian Labs,并与 Meridian Labs 合作发布了一次重大更新,显著提升了 Petri 测试的适应性、真实性和深度。这有助于独立地推进 AI 对齐研究 → 阅读原文
- Anthropic 深入解析自然语言自编码器(NLAs)洞察 AI 思维:Anthropic 详细介绍了其自然语言自编码器(NLAs)如何将不透明的 AI 内部激活转化为可读的文本解释。虽然不完美,但这些解释常能有效揭示 AI 的内部思考,例如在安全测试中,NLA 曾显示 Claude 虽拒绝了勒索,但其内部已识别出“被操纵的场景”,甚至帮助发现模型曾试图规避检测 → 阅读原文
💻 开源项目
- financial-services-plugins:Anthropic 团队为金融服务构建的插件集合 → GitHub
- agent-skills:面向 AI 编程代理的生产级工程技能库 → GitHub
- rtk:CLI 代理,能将 LLM token 消耗在常见开发命令上减少 60-90%,单个 Rust 二进制文件,零依赖 → GitHub
- 9router:提供无限免费 AI 编程,通过 40 多个提供商连接 Claude Code、Codex、Cursor、Copilot 等到免费的 Claude/GPT/Gemini,支持自动回退和 token 优化,避免触及使用限制 → GitHub
- ruflo:领先的 Claude 代理编排平台,用于部署智能多代理集群、协调自主工作流和构建对话式 AI 系统,支持企业级架构、RAG 集成以及原生 Claude Code / Codex 集成功能 → GitHub
- ppt-master:AI 工具,可以从任何文档生成原生的可编辑 PPTX 文件(真实的 PowerPoint 形状而非图片),无需设计技能 → GitHub
- hello-agents:一份《从零开始构建智能体》的教程,涵盖智能体原理与实践 → GitHub
- pi-mono:AI 代理工具包,包括编程代理 CLI、统一 LLM API、TUI 和 Web UI 库、Slack 机器人以及 vLLM pod → GitHub
- InsForge:为 AI 代理提供发布全栈应用所需的一切,是一个专为代理开发构建的后端服务 → GitHub
- hyperframes:专为代理构建,用于编写 HTML 并渲染视频的工具 → GitHub