字节 Seedance 2.0 登场|OpenAI 安全团队“变道”
今日亮点
今天 AI 圈有几件大事值得关注!字节跳动重磅发布了新一代视频生成模型Seedance 2.0,实现了工业级音画一体创作,并已在即梦 AI 和豆包上线。与此同时,OpenAI 再次调整其安全团队架构,解散了“使命协调”团队,其前负责人转任“首席未来学家”,引发外界对其安全策略的持续关注。此外,一款 Go 语言编写的超轻量 AI 助手PicoClaw开源,有望大幅降低 AI Agent 的部署门槛。
💡 产品动态
字节跳动 Seedance 2.0 发布:工业级音画一体
字节跳动 Seed 团队今天正式发布了新一代视频创作模型Seedance 2.0,采用了统一多模态音视频联合生成架构。它实现了 5 秒音画一体,并能处理复杂交互和运动场景,支持文字、图片、音频、视频四种模态输入,并新增视频编辑与延长能力。作为火山引擎豆包 2.0 系列升级的核心组成部分,Seedance 2.0 已在即梦 AI、豆包等平台上线。
为什么重要: 这标志着 AI 视频生成从“单点突破”迈向“全能协作”的工业级应用阶段,大幅降低专业内容制作成本,并展现了国内大模型在多模态领域的 SOTA 水平。
阅读原文
[来源: AI Base]
支付宝“AI 付”支付破 1.2 亿笔,开启 AI 支付时代
支付宝“AI 付”一周内累计支付笔数已超1.2 亿笔,成为全球首个支付笔数破亿的 AI 原生支付产品。该服务已在千问、Rokid、瑞幸等 AI 场景上线,在阿里千问“春节 30 亿免单活动”后加速普及。
为什么重要: 这表明 AI 支付服务正加速普及,AI 技术已深入融合到日常消费和新兴 AI 应用中,是 AI 原生支付规模化落地的里程碑。
阅读原文
[来源: AI Base]
MiniMAX M2.5 模型海外 Agent 内测,加速全球化
国产大模型 MiniMAX 的M2.5 模型即将上线,目前已在海外版本的 MiniMAX Agent 产品中率先开启内测,显示其加速全球化布局和在智能体场景的深耕。
为什么重要: 国产大模型正积极探索海外市场,通过 Agent 深度融合,有望在全球 AI 应用市场建立更具竞争力的技术护城河。
阅读原文
[来源: AI Base]
华米科技 AI 智能眼镜量产,定档 2026 CES
华米科技(Zepp Health)近日宣布,其全新的AI 智能眼镜已进入量产阶段,计划在2026 年 CES 展上正式推出。该产品将深度集成华米自研的健康监测算法,旨在打造运动时尚人群的穿戴式智慧生活入口。
为什么重要: 这预示着健康穿戴设备将迎来 AI 智能眼镜这一新的增长点,AI 与健康管理结合的硬件生态正在加速形成。
阅读原文
[来源: AI Base]
百度千帆 Coding Plan 上线,AI 编码“订阅自由”
百度千帆正式发布 AI 编码订阅服务Coding Plan,全面覆盖代码编写、逻辑理解、系统优化等全流程环节。该服务首批集成了 GLM-4.7、DeepSeek-V3.2 等多款顶尖代码模型,开发者可一键无缝切换。
为什么重要: 该服务降低了企业和个人开发者利用大模型进行软件开发的门槛,将 AI 从“偶尔咨询助手”真正转化为“日常编程搭档”。
阅读原文
[来源: AI Base]
🔬 学术前沿
- LLM“越狱”新姿势:对抗性隐喻攻击:研究人员提出一种名为 AVATAR 的新框架,通过构建“对抗性隐喻”来诱导大模型生成有害内容,实现了更高的攻击成功率 → 论文
- 无人驾驶感知系统对抗性威胁分析与检测:研究评估了端到端自动驾驶系统在黑盒对抗攻击下的漏洞,并提出 AD²模型,通过注意力机制捕捉时空一致性来提高检测效率和能力 → 论文
- PRISM-XR:隐私保护的 XR 多模态协作:该框架通过边缘服务器预处理 XR 视觉数据,过滤敏感信息,结合 MLLM 实现多用户协作,同时保证隐私安全和高效同步 → 论文
- 用于早期宇宙重建的波动流匹配:Cosmo3DFlow 框架利用 3D 离散小波变换与流匹配,实现空间到频谱压缩,将高维宇宙结构有效重建,采样速度比扩散模型快50 倍 → 论文
- AUDETER:大规模深度伪造音频检测数据集:该数据集包含超过 4500 小时、由 11 种 TTS 模型和 10 种声码器生成的 300 万音频片段,旨在解决现有检测模型在真实世界中的泛化问题 → 论文
🌍 行业观察
OpenAI 再解散核心安全团队:安全与速度的平衡之战
OpenAI 解散了旨在传达公司使命和确保 AI 影响力的“使命协调”(Mission Alignment)团队,其前负责人 Josh Achiam 转任公司首位**“首席未来学家”**。这继去年“超级对齐”团队解散后,再次引发外界对 OpenAI 在产品发展速度和安全承诺之间如何平衡的担忧。外界分析认为,安全职能正从独立的监督单元转向嵌入各产品线的“分布式”模式。
阅读原文
[来源: AI Base]
Anthropic 承诺承担数据中心电网升级费用,缓解社区压力
AI 初创公司 Anthropic 承诺将全额承担其数据中心连接电网所需的基础设施升级费用,以避免将成本转嫁给当地居民。公司还表示将在用电高峰期削减电力消耗,并支持新能源引入,以应对 AI 发展带来的巨大电力需求和公众舆论压力。
为什么重要: 在 AI 数据中心高能耗引发争议的背景下,Anthropic 此举是科技巨头在平衡商业发展与社会责任方面的一次积极尝试。
阅读原文
[来源: AI Base]
微软警告:警惕 AI 的“记忆陷阱”与恶意指令投毒
微软安全研究人员警告称,一种名为**“AI 建议投毒”**的新型攻击正在迅速蔓延。攻击者通过在网页“AI 摘要”按钮或链接中嵌入隐藏指令,诱导 AI 生成带有偏见或误导性的内容,这些恶意指令可能作为“历史背景”持久存在于 AI 的存储中。
为什么重要: 这种攻击隐蔽性强、门槛低,可能在医疗、金融等关键领域提供微妙但具有偏向性的建议,用户需保持警惕并定期清理 AI 助手的记忆。
阅读原文
[来源: AI Base]
Heroku“僵尸化”争议:开发者面临迁移抉择
Salesforce 宣布 Heroku 平台将以维护和运维为主,不再重点推出新功能。这一消息引发了 Heroku 老用户的担忧,他们面临高昂的迁移成本和潜在的开发体验(DX)损失。社区普遍认为 Heroku 已进入“僵尸模式”,促使团队考虑转向 Supabase、Vercel、Cloud Run 或 Kubernetes 等替代方案。
为什么重要: 这反映了 PaaS 市场竞争的激烈,以及科技巨头对旗下非核心产品线的战略调整,迫使开发者重新评估平台选择与技术路线。
阅读原文
[来源: News Hacker]
💻 开源项目
- PicoClaw:用 Go 语言打造的超轻量 AI 助手,内存占用不到 10MB,1 秒启动,可在低成本硬件如$10 开发板上运行 AI Agent,支持多模型和多聊天平台接入 → GitHub
- langextract:Google 开发的 Python 库,利用 LLM 从非结构化文本中提取结构化信息,提供精确的来源溯源和交互式可视化 → GitHub
- gh-aw:GitHub 智能体工作流,旨在提升开发效率和自动化 → GitHub
- chrome-devtools-mcp:用于编码智能体的 Chrome 开发者工具,帮助开发者更好地利用 AI 进行代码开发 → GitHub
- ai-engineering-hub:关于 LLM、RAG 和真实世界 AI 智能体应用的深入教程集合 → GitHub
💬 社区热议
- 用户对 GPT-5.3-codex 的赞赏:Greg Brockman 转发用户评论称,新的 GPT-5.3-codex 表现出色,“已习惯复杂的工作流和上下文管理,但 Codex 就是能按我要求做,质量不会在会话深入后下降。” [来源: Twitter @gdb]
- Kimi 月之暗面急招 Coding Agent:有网友转发 Kimi 团队招聘信息,表示急需 Coding Agent 方向的人才,可见国内大模型厂商在特定应用场景(如代码生成)上的投入。 [来源: Twitter @dotey]
- AI 搜索的营销策略转变:即刻网友讨论,传统 PR 稿只讲“我们是什么”,但在 AI 搜索时代,更应转向“定义问题场景,并给出判断框架”,解决用户“我该怎么办”的需求。 [来源: 即刻]
- Seedance 2.0 可纯音频驱动:有用户发现字节跳动的 Seedance 2.0 模型“甚至可以用纯音频驱动”,它能根据氛围生成故事情节和分镜,并卡点。 [来源: Twitter @op7418]
- 2026 年是虚拟网红爆发年:网友认为 Seedance 2.0 等模型将推动虚拟网红产业爆发,像 Fanvue 这类平台已开启虚拟网红订阅服务,“以前想象的很多事情,都将在这个丙午年逐一实现”。 [来源: Twitter @Yangyixxxx]
- LLMs 作为认知架构:笔记本作为长期记忆:Reddit 用户讨论,LLM 的上下文窗口限制了长期记忆,RAG 通过向量检索语义浅,提出 LLM 应将上下文保存到引文式文档库,并通过自然语言查询,让 LLM“提问自己的工作”,实现更高质量的记忆检索。 [来源: Reddit r/artificial]
2026 年 ai 是泡沫化还是实用化,就看今年了