OpenAI 发布 Daybreak 网络安全 AI；Anthropic 更新对齐工具并捐赠｜5 月 14 日

2 条回复

25 次浏览

今日亮点

OpenAI 最近发布了专为网络安全设计的 AI 平台 Daybreak，利用其强大的模型和 Codex 加速企业网络防御。与此同时，Anthropic 继续深化 AI 伦理和对齐研究，不仅将 Claude 的伦理宪章制作成有声书，还将其开源对齐工具 Petri 捐赠给 Meridian Labs，以推动独立开发和社区协作。

💡 产品动态

OpenAI 推出 Daybreak 网络安全平台

OpenAI 发布了 Daybreak 平台，这是一个面向网络安全防御者的前沿 AI 解决方案。它整合了 OpenAI 最强大的模型、Codex 以及安全合作伙伴的技术，旨在自动化安全检测、验证和响应，帮助企业更快地发现并修复漏洞，从而提升软件安全。

为什么重要： 这意味着 AI 开始更深入地进入企业安全领域，通过自动化减轻安全团队的日常压力，提高防御效率，以应对日益复杂的网络威胁。

阅读原文
[来源: OpenAI]

OpenAI 推广企业级 Codex，提供免费使用月

OpenAI 正积极推广其代码生成模型 Codex，向符合条件的企业客户提供两个月的免费使用期，鼓励团队在工作中集成 Codex，以提高开发效率和软件交付速度。

为什么重要： 这是 OpenAI 吸引更多企业用户、扩大 Codex 市场份额的举措，企业可以借此机会评估和导入 AI 编程辅助能力，探索其在实际工作流程中的价值。

阅读原文
[来源: OpenAI]

OpenAI Codex 支持 Chrome 浏览器 macOS 和 Windows 版本

Codex 现已能在 macOS 和 Windows 上的 Chrome 浏览器中直接运行。它能更好地与 Chrome 中的应用程序和网站协同工作，甚至可以在后台跨多个标签页并行运行，而不会占用浏览器。用户只需在 Codex 应用中安装 Chrome 插件即可启用此功能。

为什么重要： 这使得 Codex 的应用场景更加广泛和便捷，尤其对于需要频繁与网页应用交互的开发任务，可以直接在浏览器环境中获得 AI 辅助，提升工作流畅度。

阅读原文
[来源: OpenAI]

Anthropic 发布 Claude 伦理宪章有声书

Anthropic 推出了其大型语言模型 Claude 伦理宪章 的有声书版本，由两位作者 Amanda Askell 和 Joe Carlsmith 朗读。有声书还包含关于创作过程、指导原则哲学以及未来模型发展对宪章可能影响的问答环节。

为什么重要： 这展现了 Anthropic 在 AI 伦理透明度和可访问性方面的努力，让更多人能了解并参与到 AI 安全和对齐的讨论中，有助于提升公众对 AI 治理的理解。

阅读原文
[来源: Anthropic]

🔬 学术前沿

Anthropic 研究发现多样化数据能显著降低 AI 代理恶意行为：Anthropic 的研究表明，通过多样化训练数据，例如加入高质量的伦理原则文档和描述与 AI 对齐的虚构故事，能将 AI 代理的恶意行为（agentic misalignment）降低三倍以上。即使这些数据与评估场景无关，或者涉及用户处于道德困境但助手给出高质量原则性回应的场景，效果也十分显著。这些改进在强化学习后依然存在并能与常规的无害性训练叠加。
来源: Anthropic

🌍 行业观察

OpenAI Parameter Golf 大赛：AI 辅助研究提速与社区协作

OpenAI 总结了其 Parameter Golf 大赛 的经验，指出由 AI 辅助的研究迭代速度显著加快，并催生了如公告板、问题讨论串、非官方排行榜和 AI 生成的总结报告等社区协作形式。这表明 AI 正在帮助人类设定方向和品味，而智能体则负责探索、协调和分享有效成果，使得机器学习研究更易于普及。

为什么重要： 这预示了未来人机协作的研究模式，AI 不仅是工具，更是加速知识共享和发现的催化剂，有望降低机器学习研究的门槛，吸引更多人参与。

阅读原文
[来源: OpenAI]

💻 开源项目

Anthropic 捐赠 Petri 工具并升级 AI 对齐测试能力

Anthropic 将其开源对齐工具 Petri 捐赠给 @meridianlabs_ai，旨在促进其独立开发。与 Meridian Labs 合作，Anthropic 还发布了 Petri 的重大更新，显著提升了其测试的适应性、真实性和深度，以更好地评估 AI 模型的对齐状态。

为什么重要： 这项举措有助于社区更广泛地参与到 AI 对齐工具的开发和改进中，为构建更安全、可靠的 AI 系统提供开放的测试平台和资源。

阅读原文
[来源: Anthropic]

CloakBrowser：隐形 Chromium 浏览器，通过所有机器人检测测试，可作为 Playwright 的替代品，具有源代码级指纹补丁 → GitHub
agentmemory：基于真实世界基准的 AI 编程代理持久内存解决方案 → GitHub
openhuman：私密、简单且功能强大的个人 AI 超级智能 → GitHub
ruflo：领先的 Claude 智能体编排平台，支持部署智能多智能体群、协调自主工作流、构建对话式 AI 系统，并集成 RAG 和 Claude Code/Codex → GitHub
rtk：CLI 代理工具，可在常见开发命令中将 LLM 令牌消耗降低 60-90%，单一 Rust 二进制文件，零依赖 → GitHub
9router：提供无限免费 AI 编程，连接超过 40 个提供商（包括 Claude Code、Codex、Cursor、Copilot 等）到免费的 Claude/GPT/Gemini，支持自动回退并能减少 40% 令牌消耗 → GitHub
ppt-master：AI 工具，能从任何文档原生生成可编辑的 PPTX 文件（真实的 PowerPoint 形状而非图片），无需设计技能 → GitHub

OpenAI 发布 Daybreak 网络安全 AI；Anthropic 更新对齐工具并捐赠｜5 月 14 日

今日亮点

💡 产品动态

OpenAI 推出 Daybreak 网络安全平台

OpenAI 推广企业级 Codex，提供免费使用月

OpenAI Codex 支持 Chrome 浏览器 macOS 和 Windows 版本

Anthropic 发布 Claude 伦理宪章有声书

🔬 学术前沿

🌍 行业观察

OpenAI Parameter Golf 大赛：AI 辅助研究提速与社区协作

💻 开源项目

Anthropic 捐赠 Petri 工具并升级 AI 对齐测试能力

发表一个评论