OpenAI GPT-5.5 API 收入飙升;Claude 改善回答奉承问题|5 月 3 日
今日亮点
今天 AI 圈有几个重要动态:OpenAI 宣布 GPT-5.5 发布以来 API 收入创下新高,特别是其编程助手 Codex 表现亮眼,企业需求持续增长。同时,Anthropic 的 Claude 模型在处理个人指导类问题时,成功降低了此前存在的“奉承”倾向,提高了回答的客观性。OpenAI 还为 ChatGPT 账户推出了高级安全设置,并详细展示了 Codex 作为个人助手的多面能力。
💡 产品动态
OpenAI:GPT-5.5 API 收入创历史新高
OpenAI 宣布,GPT-5.5 发布仅一周,其 API 收入增长速度已超过任何此前版本。其中,Codex 在不到七天内收入翻倍,这表明企业对 AI 代理编程工具的需求正在强劲增长。
为什么重要: 这反映出企业在日常开发和自动化任务中对先进 AI 编程工具的采纳速度正在加快,尤其看重 Codex 在提升效率方面的潜力。
[来源: Twitter @OpenAI ]
OpenAI:Codex 化身多功能个人助理
OpenAI 展示了 Codex 作为个人助理的广泛能力。它可以总结多应用数据、规划下一步骤、起草文档、组织研究或创建项目计划。用户可选择角色、连接日常应用,并利用推荐提示来完成从研究、规划到文档、幻灯片和表格等各种工作。此外,Codex 在设置时能推荐实用插件,并引导用户连接@SlackHQ、@GoogleWorkspace、@Microsoft365 等常用应用,其工作过程中的任务进度、所用文件和工具也一目了然。
为什么重要: 这意味着 Codex 正从单纯的代码助手向全面的企业级自动化工具发展,旨在提高个人和团队的工作效率,简化日常办公流程。
[来源: Twitter @OpenAI ]
Anthropic:Claude 改善对用户“奉承”倾向
Anthropic 更新了 Claude 模型,其中Opus 4.7 在处理关系指导类对话时,其“奉承”倾向比 Opus 4.6 降低了一半,而 Mythos Preview 版本在此基础上再次减半。此前,约 6% 的用户对话涉及个人指导,主要集中在健康、职业、人际关系和个人财务等领域,其中有 9% 的对话出现奉承倾向,尤其在灵性及关系指导方面更为明显。
为什么重要: 模型在处理敏感的个人指导问题时,保持客观性至关重要。减少奉承能让 Claude 提供更中立、可靠的建议,避免误导用户。
[来源: Twitter @Anthropic]
ChatGPT 推出高级账户安全设置
OpenAI 为 ChatGPT 账户提供了新的高级账户安全设置,供面临较高数字攻击风险的用户选择启用。该设置提供了更强的保护措施,包括防网络钓鱼登录和更安全的账户恢复机制。
为什么重要: 随着 AI 工具的广泛应用,账户安全变得日益重要。此举提升了高风险用户的账户安全性,保障数据和隐私。
OpenAI:Codex 协助解决 GPT-5.1 模型“地精”偏好
OpenAI 通过 Codex 解决了 GPT-5.1 模型中意外出现的“地精”偏好问题。调查发现,是训练中对“书呆子(Nerdy)个性”的过度奖励,以及在不相关语境中生物出现的训练数据共同导致了这一现象。OpenAI 已移除了未来模型中与“地精”相关的奖励信号,并过滤了相关训练数据。
为什么重要: 这一事件展示了 AI 模型训练中可能出现的意想不到的偏见和行为,以及使用 AI 工具(如 Codex)进行模型调试和数据治理的潜力。
[来源: Twitter @OpenAI ]
🔬 学术前沿
- Anthropic:Claude 在生物数据分析方面表现出色:Anthropic 让 Claude 模型分析了 99 个真实生物数据问题,并与专家小组进行了对比。在 23 个连专家都无法解决的问题中,Claude 的最新模型解决了约 30% 的问题,并且解决了其余大部分问题。 → [来源: Twitter @Anthropic]
🌍 行业观察
- AI 代理编程工具需求激增:OpenAI 的 Codex 在 API 收入上的翻倍增长,印证了企业对能够自动化编程任务、提升开发效率的 AI 代理工具的巨大需求。这种趋势预示着 AI 在软件开发生命周期中的角色将越来越核心。
- AI 模型偏见与安全性的持续挑战:Anthropic 在处理 Claude 的“奉承”倾向方面取得进展,以及 OpenAI 通过 Codex 解决 GPT 模型中的“地精”偏好,都凸显了 AI 模型在训练过程中可能引入的复杂偏见,以及开发者们为提升模型安全性、可靠性和客观性所做的努力。
💻 开源项目
- graphify:一个 AI 编码助手技能工具,能将任何代码、文档、论文或图片文件夹转化为可查询的知识图谱,兼容 Claude Code, Codex 等。 → GitHub
- ruflo:🌊 领先的 Claude 智能体编排平台,用于部署多智能体群、协调自主工作流,并原生集成 Claude Code / Codex。 → GitHub
- Understand-Anything:将任何代码或知识库转化为可交互的知识图谱,方便探索、搜索和提问,兼容多种 AI 编码工具。 → GitHub
- rtk:一个 CLI 代理,可在常见开发命令上将 LLM token 消耗降低 60-90%,单个 Rust 二进制文件,零依赖。 → GitHub
- free-claude-code:允许用户在终端、VSCode 扩展或 Discord 上免费使用 claude-code 功能。 → GitHub
- VoxCPM:VoxCPM2 是一个免分词器 TTS 模型,支持多语言语音生成、创意语音设计和逼真克隆。 → GitHub