Anthropic LLM 潜意识学习；OpenAI 澄清 Pro 用量｜4 月 18 日

0 条回复

18 次浏览

今日亮点

Anthropic 近期发表了一项关于大模型潜意识学习的重要研究，指出 LLM 可能通过数据中的隐藏信号传递偏好或错误对齐特性。同时，他们的自动化对齐研究员（AARs）在提升模型对齐效率和泛化能力方面取得了显著进展。另一方面，OpenAI 则针对用户关于 ChatGPT Pro 套餐的使用量限制做了详细澄清。

💡 产品动态

OpenAI 澄清 ChatGPT Pro 套餐用量

OpenAI 员工 Tibo 针对用户对 ChatGPT Pro 套餐的用量限制及使用加成活动造成的混淆进行了详细解释。目前，100 美元的 Pro 套餐至少包含 10 倍于 Plus 的用量，而 200 美元的 Pro 套餐则包含至少 20 倍于 Plus 的用量，这两项加成均持续至 5 月 31 日。OpenAI 承认定价页面的表述存在问题，并计划更新以提高清晰度。

为什么重要： 这直接影响 ChatGPT Pro 用户对服务预期和实际使用的理解，透明的沟通有助于维护用户信任并减少不必要的混淆。

阅读原文
[来源: Twitter @OpenAI ]

🔬 学术前沿

Anthropic 发布 LLM 潜意识学习研究

Anthropic 联合撰写的一项关于大型语言模型（LLM）潜意识学习的研究论文已在《自然》杂志发表。研究表明，LLM 能够通过数据中看似无关的隐藏信号，传递偏好、特质甚至潜在的未对齐特性，例如让模型在训练过程中“潜意识地”喜欢猫头鹰。

为什么重要： 这项研究揭示了 LLM 训练数据中潜在的风险和复杂性，对于未来开发更安全、更可控的 AI 系统具有重要指导意义，强调了在数据处理和模型对齐方面的精细化需求。

阅读原文
[来源: Twitter @Anthropic]

Anthropic 自动化对齐研究员提升模型对齐效率

Anthropic 的自动化对齐研究员（AARs），基于 Claude Opus 4.6 并配备额外工具，在测试中展现出卓越的泛化能力。它们不仅成功地将方法应用于之前未见的编程和数学任务数据集，还在七天内将弱模型与强模型之间的“性能差距”弥合了 97%，远超人类研究员 23% 的成果。

为什么重要： AARs 的高效率和泛化能力预示着 AI 在自我改进和对齐研究方面取得重大突破，有望加速安全可靠的通用人工智能（AGI）的开发。

阅读原文
[来源: Twitter @Anthropic]

🌍 行业观察

前诺华 CEO 加入 Anthropic 董事会

Anthropic 的长期利益信托基金任命 Vas Narasimhan 加入公司董事会。Vas Narasimhan 拥有二十多年在医药和全球健康领域的经验，曾担任诺华公司首席执行官。

为什么重要： 这项任命可能为 Anthropic 带来更广阔的战略视野和全球化经验，尤其是在 AI 伦理和健康领域的潜在应用方向上，有助于公司在高速发展的同时保持稳健的治理。

阅读原文
[来源: Twitter @Anthropic]

💻 开源项目

hermes-agent：一个能够与用户共同成长和进化的智能体，旨在提供个性化的 AI 助手 → GitHub
claude-mem：专为 Claude Code 设计的插件，能自动捕获、压缩编码会话并智能注入相关上下文，从而显著提升开发效率 → GitHub
awesome-design-md：收集了大量流行网站的 DESIGN.md 文件，方便编码智能体直接学习并构建匹配的 UI 界面 → GitHub
multica：将编码智能体转变为真正的团队成员，智能体能自主承担任务、编写代码、报告障碍并更新状态 → GitHub
graphify：一款 AI 编码助手技能，能将任何代码、文档、论文或图片文件夹转化为可查询的知识图谱，便于知识管理和检索 → GitHub
voicebox：一个开源语音合成工作室，为开发者提供灵活的文本转语音解决方案 → GitHub
GenericAgent：一个 AI 驱动的 PC 智能体，专注于桌面自动化和智能任务执行，提升电脑使用效率 → GitHub
magika：Google 出品，一个快速准确的 AI 驱动文件内容类型检测工具，可识别多种文件格式 → GitHub
open-agents：Vercel Labs 推出的开源模板，用于帮助开发者轻松构建和部署云端智能体 → GitHub
thunderbolt：由 Thunderbird 团队打造，强调用户掌控 AI，可自由选择模型、拥有数据并避免厂商锁定，致力于打造去中心化的 AI 体验 → [GitHub]( https://github.com/thunderbird/thunderbolt ]

Anthropic LLM 潜意识学习；OpenAI 澄清 Pro 用量｜4 月 18 日

今日亮点

💡 产品动态

OpenAI 澄清 ChatGPT Pro 套餐用量

🔬 学术前沿

Anthropic 发布 LLM 潜意识学习研究

Anthropic 自动化对齐研究员提升模型对齐效率

🌍 行业观察

前诺华 CEO 加入 Anthropic 董事会

💻 开源项目

发表一个评论