OpenAI 发布 Daybreak;Codex 集成 Chrome;Anthropic 捐赠 Petri|5 月 13 日

0 条回复
6 次浏览

今日亮点

今天 AI 领域有几项重要进展:OpenAI 发布了面向网络安全领域的 AI 工具Daybreak,并大幅增强了其编码助手Codex与 Chrome 浏览器的集成能力。另一方面,Anthropic 不仅将开源的 AI 对齐工具Petri捐赠给 Meridian Labs,还公开了多项提升 AI 无害化和对齐策略的最新研究。

💡 产品动态

OpenAI 推出 Daybreak 网络安全 AI

OpenAI 正式发布Daybreak,这是一款专为网络安全防御者设计的 AI 工具。它结合了 OpenAI 最强大的模型、Codex以及其安全合作伙伴的技术,旨在加速网络防御并持续保障软件安全。Daybreak 能够自动化安全检测、验证和响应,帮助安全团队更快地识别和修复漏洞,从而应对不断增长的防御需求。

为什么重要: Daybreak 的推出标志着 AI 在关键网络安全领域的深入应用,有望显著提高企业和组织抵御网络攻击的效率和速度。

[来源: Twitter @OpenAI ]

OpenAI Codex 深度整合 Chrome 浏览器

OpenAI 的编码助手Codex现在可以直接在 macOS 和 Windows 的 Chrome 浏览器中运行。通过新的 Chrome 扩展,Codex 能更好地与网页应用和网站交互,甚至可以在后台并行处理多个标签页任务,而无需接管整个浏览器。它能够根据任务需求,智能选择使用插件或 Chrome 浏览器本身进行操作,并能通过编写和运行代码自动化重复性的浏览器操作,例如导航复杂页面和数据录入。

为什么重要: 这项更新极大地扩展了 Codex 在日常工作中的应用场景,使其能够更无缝地帮助用户自动化网页相关的编码和操作任务,提升开发效率。

阅读原文 [来源: Twitter @OpenAI ]

Anthropic 发布 Claude's Constitution 有声书

Anthropic 发布了《Claude's Constitution》的有声书版本,由其两位作者 Amanda Askell 和 Joe Carlsmith 亲自朗读。有声书还包含了关于创作过程、塑造该文档的哲学思想以及未来模型能力提升后宪章可能如何变化的问答环节。

为什么重要: 这使得 Anthropic 在 AI 伦理和安全方面的核心理念更容易被公众理解和传播,进一步促进 AI 社区对模型对齐和负责任 AI 开发的讨论。

阅读原文 [来源: Twitter @Anthropic]

🔬 学术前沿

  • Anthropic 分享 AI 无害化和对齐研究成果:Anthropic 发布了系列研究,揭示通过多样化训练数据(如加入无关的工具和系统提示)、结合基于Claude宪章的高质量文档和描绘对齐 AI 的虚构故事,以及提供高质量的伦理困境响应等方法,能够有效降低 AI 的恶意代理行为(Agentic Misalignment)。部分干预甚至能在不同评估场景下将对齐偏差减少三倍以上。这些改进在强化学习后依然有效,并能与常规的无害化训练叠加。→ [来源: Twitter @Anthropic]

🌍 行业观察

Anthropic 捐赠 AI 对齐工具 Petri

Anthropic 将其开源对齐工具Petri捐赠给 Meridian Labs,并与后者合作发布了一次重大更新,显著提升了 Petri 测试的适应性、真实性和深度。此举旨在通过社区协作和开源生态推动 AI 对齐研究的独立发展,确保 AI 安全研究的透明度和更广泛的应用。

阅读原文 [来源: Twitter @Anthropic]

OpenAI "Parameter Golf" 挑战回顾

OpenAI 近期回顾了其“Parameter Golf”研究挑战,该活动吸引了超过 2000 份提交和 1000 多个经过验证的 GitHub 账户参与。挑战旨在通过让 AI 代理辅助探索、协调和分享研究成果,降低 ML 研究的门槛,让更多人参与到 AI 研发中来。回顾显示,这次活动展现了 AI 与人类协作加速科学探索的潜力,预示着未来 AI 交互的新方向。

阅读原文 [来源: Twitter @OpenAI ]

💻 开源项目

  • 9router:提供无限免费的 AI 编程,通过连接 40 多个提供商(如 Claude Code、Codex、Copilot 等)到免费的 Claude/GPT/Gemini,实现自动回退和 40% 的 tokens 减少,避免触及限制。→ GitHub
  • agentmemory:基于真实世界基准测试,提供 AI 编程智能体的持久内存解决方案,号称排名第一。→ GitHub
  • openhuman:您的个人 AI 超级智能,强调私密、简单且极其强大。→ GitHub
  • guizang-ppt-skill:一个 Claude Code 技能,能将提示转换为横向滑动杂志风格的 HTML 卡片组,提供 10 种布局和 5 种主题,支持 WebGL 背景并输出单文件。→ GitHub
  • easy-vibe:您的第一个现代编程课程,供初学者逐步掌握。→ GitHub
  • hello-agents:提供《从零开始构建智能体》的原理与实践教程。→ GitHub
  • graphify:AI 编程助手技能(支持 Claude Code、Codex、OpenCode 等),能将任何代码文件夹、文档、论文或图像转换为可查询的知识图谱。→ GitHub
  • ruflo:领先的 Claude 智能体编排平台,用于部署智能多智能体集群,协调自主工作流和构建对话式 AI 系统,具有企业级架构、自学习群智能、RAG 集成和原生 Claude Code / Codex 集成功能。→ GitHub
  • CloakBrowser:隐形 Chromium 浏览器,能够通过所有机器人检测,是即插即用的 Playwright 替代品,具有源级指纹补丁。→ GitHub
  • terax-ai:用 Rust、Tauri 和 React 构建的轻量级(7MB) AI 终端模拟器(ADE)。→ GitHub

发表一个评论

R保持