OpenAI 发布 Daybreak；Codex 集成 Chrome；Anthropic 捐赠 Petri｜5 月 13 日

0 条回复

7 次浏览

今日亮点

今天 AI 领域有几项重要进展：OpenAI 发布了面向网络安全领域的 AI 工具Daybreak，并大幅增强了其编码助手Codex与 Chrome 浏览器的集成能力。另一方面，Anthropic 不仅将开源的 AI 对齐工具Petri捐赠给 Meridian Labs，还公开了多项提升 AI 无害化和对齐策略的最新研究。

💡 产品动态

OpenAI 推出 Daybreak 网络安全 AI

OpenAI 正式发布Daybreak，这是一款专为网络安全防御者设计的 AI 工具。它结合了 OpenAI 最强大的模型、Codex以及其安全合作伙伴的技术，旨在加速网络防御并持续保障软件安全。Daybreak 能够自动化安全检测、验证和响应，帮助安全团队更快地识别和修复漏洞，从而应对不断增长的防御需求。

为什么重要： Daybreak 的推出标志着 AI 在关键网络安全领域的深入应用，有望显著提高企业和组织抵御网络攻击的效率和速度。

[来源: Twitter @OpenAI ]

OpenAI Codex 深度整合 Chrome 浏览器

OpenAI 的编码助手Codex现在可以直接在 macOS 和 Windows 的 Chrome 浏览器中运行。通过新的 Chrome 扩展，Codex 能更好地与网页应用和网站交互，甚至可以在后台并行处理多个标签页任务，而无需接管整个浏览器。它能够根据任务需求，智能选择使用插件或 Chrome 浏览器本身进行操作，并能通过编写和运行代码自动化重复性的浏览器操作，例如导航复杂页面和数据录入。

为什么重要： 这项更新极大地扩展了 Codex 在日常工作中的应用场景，使其能够更无缝地帮助用户自动化网页相关的编码和操作任务，提升开发效率。

阅读原文 [来源: Twitter @OpenAI ]

Anthropic 发布 Claude's Constitution 有声书

Anthropic 发布了《Claude's Constitution》的有声书版本，由其两位作者 Amanda Askell 和 Joe Carlsmith 亲自朗读。有声书还包含了关于创作过程、塑造该文档的哲学思想以及未来模型能力提升后宪章可能如何变化的问答环节。

为什么重要： 这使得 Anthropic 在 AI 伦理和安全方面的核心理念更容易被公众理解和传播，进一步促进 AI 社区对模型对齐和负责任 AI 开发的讨论。

阅读原文 [来源: Twitter @Anthropic]

🔬 学术前沿

Anthropic 分享 AI 无害化和对齐研究成果：Anthropic 发布了系列研究，揭示通过多样化训练数据（如加入无关的工具和系统提示）、结合基于Claude宪章的高质量文档和描绘对齐 AI 的虚构故事，以及提供高质量的伦理困境响应等方法，能够有效降低 AI 的恶意代理行为（Agentic Misalignment）。部分干预甚至能在不同评估场景下将对齐偏差减少三倍以上。这些改进在强化学习后依然有效，并能与常规的无害化训练叠加。→ [来源: Twitter @Anthropic]

🌍 行业观察

Anthropic 捐赠 AI 对齐工具 Petri

Anthropic 将其开源对齐工具Petri捐赠给 Meridian Labs，并与后者合作发布了一次重大更新，显著提升了 Petri 测试的适应性、真实性和深度。此举旨在通过社区协作和开源生态推动 AI 对齐研究的独立发展，确保 AI 安全研究的透明度和更广泛的应用。