OpenAI 算力狂飙！GPT-5.4 将至，Codex 入驻科学圈

0 条回复

34 次浏览

📰 内容说明：本文为 AI 资讯摘要与编辑评论，所有内容均已标注原文链接。如涉及版权问题请联系处理。

今日亮点

今天 AI 圈的大事可不少！OpenAI 一边在威斯康星州大手笔扩建算力基地，一边又在论文中透露了 GPT-5.4 的进展，还将其强大的 Codex 能力带到了科学研究和 Windows 平台。与此同时，Anthropic 也在 AI Agent 的“技能”开发上迈出了一步。看来，AI 基础设施的军备竞赛和应用落地都在加速！

💡 产品动态

OpenAI 狂建算力基地，布局长期 AI 战略

OpenAI 宣布在威斯康星州新设计算站点，这是其长期算力策略的重要一步，并强调与 NVIDIA、AWS 以及 VantageDC、Oracle 等合作伙伴的深度合作。这表明 OpenAI 正在加速扩展其 AI 基础设施。

💡 编辑观点： 这次算力基地的扩建，清晰地传达出 OpenAI 对未来 AI 模型规模和复杂性的预期。在模型性能不断突破的背后，是对海量计算资源永无止境的需求。这不仅是技术竞争，更是资本和基础设施的“军备竞赛”，预示着大模型发展将进入一个新的阶段。

📎 查看完整报道 | 来源: Twitter @OpenAI

GPT-5.4 思维链可控性研究发布，新模型或临近

OpenAI 发布了一项关于 Chain-of-Thought (CoT) 可控性的评估套件和研究论文，发现 GPT-5.4 Thinking 模型在隐藏其推理过程方面的能力较低，这说明 CoT 监控仍然是一个有用的安全工具。同时，OpenAI 用“5.4 sooner than you Think”和“Soon”等口号预告新版本。

💡 编辑观点： 这篇论文为模型可解释性提供了一线曙光，意味着即便 AI 日益强大，我们仍有可能洞察其“思考”过程，这对于提升 AI 的安全性、可信赖性至关重要。而接连的营销暗示，无疑让整个行业对 GPT-5.4 或其核心技术充满期待，一场新的模型性能竞赛可能箭在弦上。

📎 查看完整报道 | 来源: OpenAI

OpenAI Codex 深入科学与开发者社区

OpenAI 将先进的 AI 模型 Codex 引入科学写作工具 Prism，让科研人员能在一个平台内完成写作、计算、分析和迭代。此外，Codex 应用也正式登陆 Windows 平台，支持原生沙箱和 PowerShell 开发环境。

💡 编辑观点： Codex 在科学研究领域的集成，是 AI 辅助科研的里程碑，它能显著提高科学写作和数据分析的效率。同时，Windows 版本的发布则降低了开发者使用门槛，进一步加速 AI 辅助编程的普及，让更多人能体验到 AI 带来的生产力飞跃。

📎 查看完整报道（Prism） | 来源: Twitter @OpenAI
📎 查看完整报道（Windows） | 来源: Twitter @OpenAI Developers

Anthropic 推出“CoWork Skill”，AI Agent 能力再升级

Anthropic 发布了一款令人印象深刻的非技术性“CoWork Skill”，它能够创建其他技能，包括进行访谈和提供基准测试。这标志着 Anthropic 在 AI Agent 的自主技能构建方面取得了显著进展。

💡 编辑观点： Anthropic 的 CoWork Skill 展示了 AI Agent 从特定任务执行者向“技能生成器”进化的潜力。这意味着未来的 AI 将不仅仅是完成指令，更能自我学习和构建新能力，从而在更广泛、更复杂的场景中发挥作用，推动 AI Agent 进入一个新纪元。

📎 查看完整报道 | 来源: Twitter @Ethan Mollick

Google Labs 预告 FlowbyGoogle 大更新，强化图像生成

Google Labs 预告了 FlowbyGoogle 的重大更新，重新设计了界面，并将图像生成功能放在了核心位置，让资产管理更便捷，并提供更精确的控制。

💡 编辑观点： Google 在多模态内容创作领域的发力意图非常明显。将图像生成提升到核心地位，旨在直接与 OpenAI 的 DALL-E 以及 Midjourney 等热门产品竞争，这预示着未来 AI 图像生成工具的易用性和功能性将持续提升，竞争也更加白热化。

📎 查看完整报道 | 来源: Twitter @Josh Woodward

Get 笔记推出 OpenClaw Skill，语音智能记笔记

Get 笔记刚上线 OpenClaw Skill，用户可以通过语音指令与 AI 交互，实现随口记录、自动抓取网页内容、搜索、打标签，甚至将 AI 生成的日报自动存档等智能笔记管理功能。

💡 编辑观点： 这是 AI 与个人生产力工具深度融合的又一例证。通过语音交互简化了传统笔记和信息管理的繁琐步骤，将解放用户的双手和大脑，让信息记录和检索变得更加自然和高效，对于提升个人工作效率具有革命性意义。

📎 查看完整报道 | 来源: Twitter @向阳乔木 (转述)

🔬 学术前沿

轻量化脑肿瘤分割新突破：GMLN-BTS 模型仅用 4.58M 参数，比主流 3D Transformer 减少 98% 参数，却在脑肿瘤分割任务上达到 SOTA 性能，大幅降低计算成本，有望推动医疗 AI 的实际部署。 → 📄 阅读论文
LLM 免检索事实核查：INTRA 方法利用大型语言模型（LLM）的内在参数化知识进行事实核查，无需外部检索即可验证声明，并在泛化性上优于传统检索方法。 → 📄 阅读论文
Web Agent 新数据集：WebChain 发布，一个大规模的人类标注真实世界网站交互轨迹数据集，包含 3 万多条轨迹和 31.8 万个步骤，旨在加速 Web Agent 的可复现研究，并提出了新的训练方法。 → 📄 阅读论文
LLM Agent 工具使用策略优化：EvoTool 框架通过“责备感知突变”和“多样性感知选择”的自进化范式，优化 LLM Agent 的模块化工具使用策略，在多项基准测试中性能提升超 5 个百分点。 → 📄 阅读论文
多模态自动驾驶轨迹生成：K-Gen 框架结合多模态大语言模型（MLLM）和关键点引导，实现可解释的自动驾驶轨迹生成，整合栅格化 BEV 地图与文本描述，性能超越现有基线。 → 📄 阅读论文

🌍 行业观察

AI Agent 协同仍是“盲区”，专家呼吁深入研究

著名 AI 学者 Ethan Mollick 指出，让 AI 之间互相协作完成任务是一个严重未被充分研究的领域，现有模型并未针对此优化。研究显示，在多 Agent 交互中，AI 模型的“话语连贯性”不足，即便使用更多 token 也无法达到人类水平。

💡 编辑观点： 随着多 Agent 协作成为未来 AI 系统的重要趋势，如何让 AI Agent 之间进行高效、可靠且连贯的沟通与协作，将是构建复杂 AI 应用的关键瓶颈。这不仅需要算法上的突破，更可能催生出 AI Agent 间新的“沟通协议”和“管理框架”。

📎 深度报道

Anthropic 对“战争部长”言论发声，AI 公司面临地缘政治挑战

Anthropic 针对“战争部长 Pete Hegseth 的评论”发表了声明，部分社区成员解读为 Anthropic 在某些地缘政治问题上采取了更柔和的立场，或与此前对中国用户的封禁等政策有关。

💡 编辑观点： 这次声明以及引发的社区讨论，揭示了 AI 大模型公司在全球化运营中面临的复杂性和敏感性。AI 技术的“普惠”与“可控”之间的张力，以及如何在不同国家和地区间平衡技术发展、商业利益与政治合规，是所有 AI 巨头都必须直面并谨慎处理的重大挑战。