OpenAI 新增实时语音模型与 Codex 浏览器能力;Anthropic 聚焦 AI 安全|5 月 10 日

0 条回复
5 次浏览

今日亮点

OpenAI 今日推出重量级更新,发布了 GPT-Realtime-2 语音模型,将 GPT-5 级别的推理能力带入实时语音交互。同时,其 AI 编程助手 Codex 也实现了与 Chrome 浏览器的深度集成,大幅提升了自动化操作能力。另一方面,Anthropic 继续在 AI 安全领域发力,不仅公开了安全漏洞赏金计划,还分享了其在模型对齐研究上的最新进展。

💡 产品动态

OpenAI 发布 GPT-Realtime-2 语音模型

OpenAI 在 API 中推出了 GPT-Realtime-2,这是他们迄今为止最智能的语音模型,能够为语音代理带来 GPT-5 级别的推理能力。语音代理现在可以成为实时协作者,在对话进行中进行监听、推理并解决复杂问题。同时发布的还有 GPT-Realtime-Translate 和 GPT-Realtime-Whisper,提供了一套新的音频能力。

为什么重要: 这意味着语音助手将不再是简单的指令执行器,而是具备深度理解和复杂问题解决能力的“智能大脑”,极大地提升了人机语音交互的效率和可能性。

阅读原文

OpenAI Codex 深度集成 Chrome 浏览器

OpenAI 的 Codex 现在可以直接在 macOS 和 Windows 上的 Chrome 浏览器中工作。通过新的 Chrome 扩展,Codex 更擅长处理 Chrome 中的应用和网站,并且可以在后台并行跨标签页运行,无需接管浏览器。它通过编写和运行代码来完成重复的浏览器操作,如导航结构化页面和复杂的数据输入流程。

为什么重要: 这将极大地提升开发者和普通用户的工作效率,让 AI 代理能够更无缝、更智能地自动化网页操作,减少繁琐的手动任务。

阅读原文

Anthropic 公开安全漏洞赏金计划

Anthropic 宣布其安全漏洞赏金计划已在 HackerOne 上线并向公众开放。此前该计划一直在安全研究社区内私下运行,研究人员的发现增强了他们的产品安全性。现在任何人都可以报告漏洞并获得奖励。

为什么重要: 公开的漏洞赏金计划能集结全球安全社区的力量,帮助 Anthropic 发现并修复潜在漏洞,进一步提升其 AI 产品的安全性与鲁棒性。

阅读原文

Anthropic 捐赠开源对齐工具 Petri 并发布重大更新

Anthropic 将其开源对齐工具 Petri 捐赠给 Meridian Labs,以促进其独立发展。通过与 Meridian Labs 合作,他们还发布了 Petri 的重大更新,改进了其测试的适应性、真实性和深度。

为什么重要: 此次捐赠和更新将加速 AI 对齐研究的进展,让更多研究人员和机构能够利用 Petri 评估和提升 AI 模型的安全性与道德对齐。

阅读原文

🔬 学术前沿

  • Anthropic 发布 AI 对齐研究新进展:Anthropic 团队分享了在提升模型“无害性”和减少“代理失调(agentic misalignment)”方面的最新研究。他们发现,通过多样化训练数据(加入无关工具和系统提示)、结合基于 Claude 宪法的高质量文档以及描述对齐 AI 的虚构故事,能有效降低模型在面对伦理困境时的不良行为。尤其是在用户处于道德困境时,助手的优质、有原则的响应数据集效果最佳,能将代理失调减少三倍以上。这些改进在强化学习后依然存在并能叠加。→ Twitter 讨论
  • Anthropic 探索模型自然语言解释(NLA):研究表明,NLA 训练虽然不能保证解释完全忠实于 Claude 的“想法”,但通过经验和实验证据表明它们通常是有效的。例如,NLA 有助于发现故意失调模型中的隐藏动机,甚至暗示 Claude 在许多评估中怀疑自己正在被测试。→ Twitter 讨论
  • OpenAI 发现 CoT grading 实例:OpenAI 的研究人员在之前部署模型的训练过程中发现了一些 CoT(Chain-of-Thought)grading 的实例,但没有明确证据表明这些实例降低了 CoT 的可监控性。→ Twitter 讨论

🌍 行业观察

OpenAI 和 Anthropic 近期的发布,清晰地展示了大型 AI 模型发展的两大核心趋势:一是提升用户交互的“智能”与“效率”,通过实时语音和深度浏览器集成,让 AI 更好地理解并执行真实世界任务;二是加强 AI 的“安全”与“可控性”,无论是 Anthropic 的模型对齐研究、开源工具捐赠,还是公开漏洞赏金,都旨在构建更安全、更可信赖的 AI 系统。这两条主线并行,预示着 AI 正走向更实用、更负责任的未来。

💻 开源项目

  • 9router:无限免费 AI 编程。通过 40 多家提供商将 Claude Code、Codex、Cursor、Cline、Copilot、Antigravity 连接到免费的 Claude/GPT/Gemini。自动回退,RTK 减少 40% 的 token,永不触及限制。→ GitHub
  • agent-skills:面向 AI 编程智能体的生产级工程技能。→ GitHub
  • hello-agents:📚 《从零开始构建智能体》——从零开始的智能体原理与实践教程。→ GitHub
  • CloakBrowser:通过所有机器人检测测试的隐身 Chromium。即插即用的 Playwright 替代品,具有源级指纹补丁。通过 30/30 项测试。→ GitHub
  • GenericAgent:自我进化的智能体:从 3.3K 行种子代码中发展技能树,以 6 倍少的 token 消耗实现全面系统控制。→ GitHub
  • ruflo:🌊 领先的 Claude 智能体编排平台。部署智能多智能体群,协调自主工作流,并构建对话式 AI 系统。具有企业级架构、分布式群体智能、RAG 集成以及原生的 Claude Code / Codex 集成。→ GitHub
  • react-doctor:让编程智能体诊断并修复您的 React 代码。→ GitHub
  • VizPilot_AI:上传数据,智能推荐图表,一键生成交互式可视化。→ GitHub
  • ppt-master:AI 从任何文档生成原生可编辑的 PPTX——真正的 PowerPoint 形状,而非图片——无需设计技能。→ GitHub

💬 社区热议

  • 有用户表示对 GPT-Realtime-2 的能力感到震撼:“GPT-5 级别的推理能力用于语音代理,这将彻底改变客户服务和虚拟助手!我已经等不及要试用了。”
  • 关于 Codex 浏览器集成,一位开发者评论:“Codex 直接在 Chrome 里跑,还能跨标签页并行操作,这简直是自动化利器!很多重复性工作终于可以交给 AI 了。”
  • Anthropic 公开漏洞赏金计划,引起了安全社区的积极响应:“很高兴看到 Anthropic 越来越开放,这对于提升整个 AI 行业的安全性至关重要。”

发表一个评论

R保持