字节 Seedance 2.0 登场｜OpenAI 安全团队“变道”

3 条回复

36 次浏览

今日亮点

今天 AI 圈有几件大事值得关注！字节跳动重磅发布了新一代视频生成模型Seedance 2.0，实现了工业级音画一体创作，并已在即梦 AI 和豆包上线。与此同时，OpenAI 再次调整其安全团队架构，解散了“使命协调”团队，其前负责人转任“首席未来学家”，引发外界对其安全策略的持续关注。此外，一款 Go 语言编写的超轻量 AI 助手PicoClaw开源，有望大幅降低 AI Agent 的部署门槛。

💡 产品动态

字节跳动 Seedance 2.0 发布：工业级音画一体

字节跳动 Seed 团队今天正式发布了新一代视频创作模型Seedance 2.0，采用了统一多模态音视频联合生成架构。它实现了 5 秒音画一体，并能处理复杂交互和运动场景，支持文字、图片、音频、视频四种模态输入，并新增视频编辑与延长能力。作为火山引擎豆包 2.0 系列升级的核心组成部分，Seedance 2.0 已在即梦 AI、豆包等平台上线。
为什么重要： 这标志着 AI 视频生成从“单点突破”迈向“全能协作”的工业级应用阶段，大幅降低专业内容制作成本，并展现了国内大模型在多模态领域的 SOTA 水平。
阅读原文
[来源: AI Base]

支付宝“AI 付”支付破 1.2 亿笔，开启 AI 支付时代

支付宝“AI 付”一周内累计支付笔数已超1.2 亿笔，成为全球首个支付笔数破亿的 AI 原生支付产品。该服务已在千问、Rokid、瑞幸等 AI 场景上线，在阿里千问“春节 30 亿免单活动”后加速普及。
为什么重要： 这表明 AI 支付服务正加速普及，AI 技术已深入融合到日常消费和新兴 AI 应用中，是 AI 原生支付规模化落地的里程碑。
阅读原文
[来源: AI Base]

MiniMAX M2.5 模型海外 Agent 内测，加速全球化

国产大模型 MiniMAX 的M2.5 模型即将上线，目前已在海外版本的 MiniMAX Agent 产品中率先开启内测，显示其加速全球化布局和在智能体场景的深耕。
为什么重要： 国产大模型正积极探索海外市场，通过 Agent 深度融合，有望在全球 AI 应用市场建立更具竞争力的技术护城河。
阅读原文
[来源: AI Base]

华米科技 AI 智能眼镜量产，定档 2026 CES

华米科技（Zepp Health）近日宣布，其全新的AI 智能眼镜已进入量产阶段，计划在2026 年 CES 展上正式推出。该产品将深度集成华米自研的健康监测算法，旨在打造运动时尚人群的穿戴式智慧生活入口。
为什么重要： 这预示着健康穿戴设备将迎来 AI 智能眼镜这一新的增长点，AI 与健康管理结合的硬件生态正在加速形成。
阅读原文
[来源: AI Base]

百度千帆 Coding Plan 上线，AI 编码“订阅自由”

百度千帆正式发布 AI 编码订阅服务Coding Plan，全面覆盖代码编写、逻辑理解、系统优化等全流程环节。该服务首批集成了 GLM-4.7、DeepSeek-V3.2 等多款顶尖代码模型，开发者可一键无缝切换。
为什么重要： 该服务降低了企业和个人开发者利用大模型进行软件开发的门槛，将 AI 从“偶尔咨询助手”真正转化为“日常编程搭档”。
阅读原文
[来源: AI Base]

🔬 学术前沿

LLM“越狱”新姿势：对抗性隐喻攻击：研究人员提出一种名为 AVATAR 的新框架，通过构建“对抗性隐喻”来诱导大模型生成有害内容，实现了更高的攻击成功率 → 论文
无人驾驶感知系统对抗性威胁分析与检测：研究评估了端到端自动驾驶系统在黑盒对抗攻击下的漏洞，并提出 AD²模型，通过注意力机制捕捉时空一致性来提高检测效率和能力 → 论文
PRISM-XR：隐私保护的 XR 多模态协作：该框架通过边缘服务器预处理 XR 视觉数据，过滤敏感信息，结合 MLLM 实现多用户协作，同时保证隐私安全和高效同步 → 论文
用于早期宇宙重建的波动流匹配：Cosmo3DFlow 框架利用 3D 离散小波变换与流匹配，实现空间到频谱压缩，将高维宇宙结构有效重建，采样速度比扩散模型快50 倍 → 论文
AUDETER：大规模深度伪造音频检测数据集：该数据集包含超过 4500 小时、由 11 种 TTS 模型和 10 种声码器生成的 300 万音频片段，旨在解决现有检测模型在真实世界中的泛化问题 → 论文

🌍 行业观察

OpenAI 再解散核心安全团队：安全与速度的平衡之战

OpenAI 解散了旨在传达公司使命和确保 AI 影响力的“使命协调”（Mission Alignment）团队，其前负责人 Josh Achiam 转任公司首位**“首席未来学家”**。这继去年“超级对齐”团队解散后，再次引发外界对 OpenAI 在产品发展速度和安全承诺之间如何平衡的担忧。外界分析认为，安全职能正从独立的监督单元转向嵌入各产品线的“分布式”模式。
阅读原文
[来源: AI Base]

Anthropic 承诺承担数据中心电网升级费用，缓解社区压力

AI 初创公司 Anthropic 承诺将全额承担其数据中心连接电网所需的基础设施升级费用，以避免将成本转嫁给当地居民。公司还表示将在用电高峰期削减电力消耗，并支持新能源引入，以应对 AI 发展带来的巨大电力需求和公众舆论压力。
为什么重要： 在 AI 数据中心高能耗引发争议的背景下，Anthropic 此举是科技巨头在平衡商业发展与社会责任方面的一次积极尝试。
阅读原文
[来源: AI Base]

微软警告：警惕 AI 的“记忆陷阱”与恶意指令投毒

微软安全研究人员警告称，一种名为**“AI 建议投毒”**的新型攻击正在迅速蔓延。攻击者通过在网页“AI 摘要”按钮或链接中嵌入隐藏指令，诱导 AI 生成带有偏见或误导性的内容，这些恶意指令可能作为“历史背景”持久存在于 AI 的存储中。
为什么重要： 这种攻击隐蔽性强、门槛低，可能在医疗、金融等关键领域提供微妙但具有偏向性的建议，用户需保持警惕并定期清理 AI 助手的记忆。
阅读原文
[来源: AI Base]

Heroku“僵尸化”争议：开发者面临迁移抉择

Salesforce 宣布 Heroku 平台将以维护和运维为主，不再重点推出新功能。这一消息引发了 Heroku 老用户的担忧，他们面临高昂的迁移成本和潜在的开发体验（DX）损失。社区普遍认为 Heroku 已进入“僵尸模式”，促使团队考虑转向 Supabase、Vercel、Cloud Run 或 Kubernetes 等替代方案。
为什么重要： 这反映了 PaaS 市场竞争的激烈，以及科技巨头对旗下非核心产品线的战略调整，迫使开发者重新评估平台选择与技术路线。
阅读原文
[来源: News Hacker]

💻 开源项目

PicoClaw：用 Go 语言打造的超轻量 AI 助手，内存占用不到 10MB，1 秒启动，可在低成本硬件如$10 开发板上运行 AI Agent，支持多模型和多聊天平台接入 → GitHub
langextract：Google 开发的 Python 库，利用 LLM 从非结构化文本中提取结构化信息，提供精确的来源溯源和交互式可视化 → GitHub
gh-aw：GitHub 智能体工作流，旨在提升开发效率和自动化 → GitHub
chrome-devtools-mcp：用于编码智能体的 Chrome 开发者工具，帮助开发者更好地利用 AI 进行代码开发 → GitHub
ai-engineering-hub：关于 LLM、RAG 和真实世界 AI 智能体应用的深入教程集合 → GitHub

💬 社区热议

用户对 GPT-5.3-codex 的赞赏：Greg Brockman 转发用户评论称，新的 GPT-5.3-codex 表现出色，“已习惯复杂的工作流和上下文管理，但 Codex 就是能按我要求做，质量不会在会话深入后下降。” [来源: Twitter @gdb]
Kimi 月之暗面急招 Coding Agent：有网友转发 Kimi 团队招聘信息，表示急需 Coding Agent 方向的人才，可见国内大模型厂商在特定应用场景（如代码生成）上的投入。 [来源: Twitter @dotey]
AI 搜索的营销策略转变：即刻网友讨论，传统 PR 稿只讲“我们是什么”，但在 AI 搜索时代，更应转向“定义问题场景，并给出判断框架”，解决用户“我该怎么办”的需求。 [来源: 即刻]
Seedance 2.0 可纯音频驱动：有用户发现字节跳动的 Seedance 2.0 模型“甚至可以用纯音频驱动”，它能根据氛围生成故事情节和分镜，并卡点。 [来源: Twitter @op7418]
2026 年是虚拟网红爆发年：网友认为 Seedance 2.0 等模型将推动虚拟网红产业爆发，像 Fanvue 这类平台已开启虚拟网红订阅服务，“以前想象的很多事情，都将在这个丙午年逐一实现”。 [来源: Twitter @Yangyixxxx]
LLMs 作为认知架构：笔记本作为长期记忆：Reddit 用户讨论，LLM 的上下文窗口限制了长期记忆，RAG 通过向量检索语义浅，提出 LLM 应将上下文保存到引文式文档库，并通过自然语言查询，让 LLM“提问自己的工作”，实现更高质量的记忆检索。 [来源: Reddit r/artificial]

👍1