Anthropic 并购强化 Agent，AI 安全新漏洞警示

2 条回复

28 次浏览

📰 内容说明：本文为 AI 资讯摘要与编辑评论，所有内容均已标注原文链接。如涉及版权问题请联系处理。

今日亮点

Anthropic 近日收购了 Vercept AI，旨在大幅提升 Claude 的计算机使用能力，这预示着大模型厂商正全力投入 Agent 技术发展。与此同时，一项令人担忧的研究揭示，AI 模型可能被文本中“隐形字符”操控，尤其当 AI Agent 具备工具调用能力时，潜在风险加剧。此外，谷歌 Flow 宣布其 Nano Banana 2 模型将提供免费使用和高分辨率图像能力，进一步降低了 AI 创作门槛。

💡 产品动态

Anthropic 收购 Vercept AI，强化 Claude Agent 能力

核心信息：Anthropic 完成对 Vercept AI 的收购，目标是提升 Claude 模型在计算机使用方面的能力，包括更复杂的工具集成和自主操作。

💡 编辑观点： 这次收购是 Anthropic 布局 AI Agent 生态的关键一步，意味着 Claude 将从“智能对话者”向“智能执行者”迈进。Agent 能够直接与外部软件和环境互动，是实现更高级自动化和通用人工智能的必经之路，也预示着未来 AI 应用将更深入地渗透到各种工作流程中。

📎 查看完整报道 | 来源: Anthropic Twitter

Claude Code 支持自动记忆功能

核心信息：Anthropic 的 Claude Code 现在推出了自动记忆功能，能够跨会话记住用户的项目上下文、调试模式和偏好设置，无需用户重复输入。

💡 编辑观点： 这项功能是 AI Agent 走向实用的重要里程碑。它解决了传统 AI 模型“短期记忆”的痛点，让 AI 能够像人类助手一样从过往经验中学习和积累，极大提升了开发者的工作效率和用户体验。这反映了模型正从单纯的“问答”向“个性化、长期协作”发展。

📎 查看完整报道 | 来源: Elvis Twitter (Thariq post)

谷歌 Flow 更新 Nano Banana 2：免费提供高级功能

核心信息：谷歌 Flow 发布了 Nano Banana 2 模型，并宣布所有用户将免费获得零信用点、高级角色与场景一致性以及 2K/4K 图像放大功能。

💡 编辑观点： 谷歌此举无疑是为了扩大其 AI 创意工具的市场份额和用户基础。免费开放这些曾是付费或高级的功能，将大大降低用户体验 AI 图像/视频生成技术的门槛，有望吸引大量创作者和中小企业，进一步加剧 AI 内容生成领域的竞争。

📎 查看完整报道 | 来源: Josh Woodward Twitter

NVIDIA 发布 Cosmos-Predict2.5 物理 AI 模型

核心信息：NVIDIA 推出了 Cosmos World Foundation Models 系列的最新一代模型 Cosmos-Predict2.5 和 Cosmos-Transfer2.5，实现了 Text2World、Image2World 和 Video2World 的统一生成，显著提升视频质量和指令对齐能力，并支持 Sim2Real/Real2Real 世界转换。同时，NVIDIA 已开源相关代码和模型。

💡 编辑观点： NVIDIA 在物理 AI 和世界模型领域的持续投入，对于机器人、自动驾驶等需要精确物理模拟和现实世界迁移的领域具有颠覆性意义。其开源策略将加速整个物理 AI 生态的发展，为具身智能的实现奠定更坚实的基础。

📎 查看完整报道 | 来源: arXiv.org

🔬 学术前沿

LLM 的“心智理论”能力存疑：一项研究发现，LLMs 在面对任务扰动时，“心智理论”（ToM，理解他人心理状态）能力会急剧下降，这质疑了当前大模型是否具备真正的、鲁棒的 ToM 能力。→ 📄 阅读论文
强化学习 LLM 的进化系统提示学习：新研究提出 E-SPL 方法，通过并行进化系统提示（system prompts）和 RL 权重更新，有效提升了 LLM 在推理和 Agent 任务中的表现和泛化能力。→ 📄 阅读论文
视觉语言模型（VLM）安全边界越狱方法：JailBound 框架通过探测 VLM 内部融合层的潜在安全决策边界，实现图像和文本输入的协同对抗性扰动，成功绕过模型的安全防护。→ 📄 阅读论文
统一多模态模型的综合基准 Uni-MMMU：新提出的 Uni-MMMU 是一个跨学科、双向耦合的基准，旨在系统评估统一多模态模型在视觉理解和生成任务间的协同能力。→ 📄 阅读论文
情感支持对话中的人类与 LLM 评估基准 HEART：HEART 框架首次直接比较人类和 LLM 在多轮情感支持对话中的表现，发现 LLM 在感知同理心上已接近人类，但在适应性重构和细微语气转换方面仍有差距。→ 📄 阅读论文

🌍 行业观察

今天的 AI 行业观察聚焦于 AI Agent 的演进趋势和其背后的基础设施支撑。OpenAI 持续强调其“Stargate”计算战略，目标是构建一个多元化的计算网络，通过与多家云服务商和芯片公司合作，以应对 AI 模型指数级增长的计算需求。这表明未来 AI 的竞争将不仅是模型算法的竞争，更是底层算力基础设施的较量。同时，OpenAI 也在积极招募非技术背景的优秀人才来推动 AGI 研究，体现出对人才多样性和跨领域合作的重视，这些都指向 AI 未来发展所需的核心要素——更强大的“大脑”和更聪明的“指挥系统”。
📎 深度报道

💻 开源项目

Project Solaris：一个用于 Minecraft 的多人视频世界模型项目，它提供了一套完整的多人数据收集系统、基于 DiT 的世界模型以及 VLM 评估工具，旨在构建一个超越单一视角、反映全球状态的共享世界表征。→ 🔗 GitHub | 介绍文章

💬 社区热议

“Harness Engineering”被提出为 AI Agent 的未来控制范式，它超越了传统的 Prompt Engineering 和 Context Engineering，更强调构建一个能保证 AI 产出可靠性的完整工作环境。来源: 宝玉 Twitter
一项研究警告称，AI 模型可能被文本中不可见的 Unicode 字符操控，尤其当 AI Agent 被赋予代码执行等工具权限时，这种“反向验证码”攻击的危险性更高，对 AI 安全构成新威胁。来源: Reddit /r/artificial
AI 的记忆功能不应仅限于存储事实，更重要的是能够从经验中学习，比如记住之前的失败原因和有效的解决方案，这才能真正提升 AI Agent 的自主学习和问题解决能力。来源: Reddit /r/artificial
有开发者反馈 OpenAI 的 Codex 5.3 模型在编程任务上表现优于 Anthropic 的 Claude Opus 4.6，这表明在特定领域，不同模型之间的竞争依然激烈。来源: Mitchell Hashimoto Twitter