AI 日报|2026-06-02|MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型|OpenBMB 发布 UltraData 两大开源数据集,登顶 HuggingFace 趋势榜

1 条回复
25 次浏览

AI 热点日报(2026-06-02)

模型发布/更新

1. MiniMax M3:前沿编码、100 万 token 上下文与原生多模态一体模型

MiniMax M3 是一个开源前沿模型,具备先进的编码与 AI 智能体能力。它支持 100 万 token 的超长上下文窗口,并采用名为 MSA(MiniMax Sparse Attention)的新型稀疏注意力架构。该架构使模型在 100 万 token 上下文下的每 token 计算成本降至前代的 1/20,预填充速度提升 9 倍以上,解码速度提升 15 倍以上。在 SWE-Bench Pro 编码基准上,MiniMax M3 得分 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro,性能接近 Opus 4.7。该模型可通过 MiniMax Code、Token Plan 和 API 服务使用。
来源: MiniMax:Blog(网页)

2. xAI 发布 Composer 2.5

xAI 的最新编程模型 Composer 2.5 现已在 Grok Build 中可用,用户可通过/models菜单选择使用。这是一款快速、先进的模型,擅长处理长时间运行的任务和复杂指令。该模型面向 SuperGrok 和 X Premium+用户开放。
来源: xAI:News(网页)

3. Qwen3.7-Plus:多模态智能体智能

Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。
来源: Qwen:Blog Retrieval(API)

4. 使用 NVIDIA Cosmos 3 开发物理 AI 推理、世界与行动模型

NVIDIA Cosmos 3 是一款面向物理 AI 的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。
来源: NVIDIA Technical Blog(开发者技术博客 · RSS)

5. SenseNova 新模型解决 AI 图表生成难题

大多数 AI 模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在 Hugging Face 提供了模型,并在 GitHub 展示了效果案例。
来源: X:商汤 SenseTime (@SenseTime_AI)

6. 介绍 Mellum2:JetBrains 推出的 12B 混合专家模型

JetBrains 在 Hugging Face 发布博客,介绍其新发布的 Mellum2 模型。该模型采用混合专家架构,参数规模为 12B。
来源: Hugging Face:Blog(RSS)

7. Nemotron 3 Ultra 本周即将发布

Nemotron 3 Ultra 本周即将发布。 ⌛️
来源: X:NVIDIA AI (@NVIDIAAI)

产品发布/更新

1. OpenBMB 发布 UltraData 两大开源数据集,登顶 HuggingFace 趋势榜

OpenBMB 联合清华 NLP 与 Modelbest 发布两个开源数据集:Ultra-FineWeb-L3(预训练合成数据)包含 600B+ tokens(超 400B 英文、200B+中文),是迄今最大开源中文预训练合成数据集;UltraData-SFT-2605(后训练 SFT 数据)包含 15M+样本,是中国首个开源且包含思考与非思考标注的大规模 SFT 数据集,覆盖数学、代码、知识和指令遵循。两者均基于 UltraData L0-L4 框架构建,并在 MiniCPM5-1B 训练中完成验证。数据集已在 HuggingFace 免费开放。
来源: X:面壁智能 OpenBMB (@OpenBMB)

2. Auto Router 新增成本质量权衡参数

Auto Router 现在允许你调整其在成本与质量之间的权衡。 新增 cost_quality_tradeoff 参数,范围 0 到 10: 设为 0 时,它总是选择最强大的模型,无论价格如何。设为 10 时,最便宜的模型胜出。
来源: X:OpenRouter (@OpenRouter)

3. OpenAI 前沿模型与 Codex 现可在 AWS 上使用

OpenAI 的前沿模型与 Codex 现已在 AWS 上全面可用。企业客户可通过其现有的 AWS 环境、控制与采购流程来使用 OpenAI 的 AI 技术,从而加速从评估到生产部署的过程。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例)

4. Replit 用单个提示词构建完整业务

你能用单个提示词免费构建一个真实的业务吗? 从今天起,在 Replit 上,答案是肯定的。 从一个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。 此外,还能解锁使用 @stripe @atlas, @QuickBooks, @mercury & @doolaHQ 运营业务的福利。
来源: X:Replit (@Replit)

5. 腾讯混元发布智能体长期记忆插件 Hy-Memory

腾讯混元正式发布专为 OpenClaw 等长期协作智能体(Agent)设计的记忆插件 Hy-Memory。它基于 6 层记忆框架、System1/System2 双系统与三层进化链构建,旨在成为智能体的“第二大脑”。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少 70% 以上,单条记忆信息密度提升 45% 以上,在超长上下文场景中 token 消耗降低 35%,记忆更新速度提升 20%。
来源: X:腾讯混元 (@TencentHunyuan)

6. NVIDIA 发布工厂运营蓝图,为工厂提供自主智能管理智能体

NVIDIA 在 GTC Taipei 发布了 NVIDIA 工厂运营蓝图(FOX),这是一个用于构建自主工厂管理智能体的参考设计。该蓝图基于 NVIDIA NemoClaw、AI-Q Blueprint 和 NVIDIA Nemotron 开源模型构建,旨在为工厂提供一个统一的决策层,以连接实时机器信号、质量数据和操作警报,实现快速问题解决。蓝图针对 NVIDIA DGX Station 桌面 AI 超级计算机进行了优化。首批采用者包括富士康、和硕、研华和纬创。富士康利用 FOX 和 NemoClaw 构建了 MoMClaw 多智能体系统,预计将根源分析时间缩短 80%,劳动生产率提高 15%,机器故障率降低 10%。
来源: NVIDIA Blog:Agentic AI(网页)

7. ChatGPT 新增长文编辑与保存功能

长文写作需要更多空间。 现在你可以在全屏模式下编辑更长的文章,并将其保存到你的资料库中,以便稍后继续。
来源: X:ChatGPT (@ChatGPTapp)

8. Perplexity 发布 Search as Code 搜索架构

推出 Search as Code,我们为 AI 智能体打造的全新搜索架构。 它直接编写 Python 代码调用我们的搜索栈,而非逐个循环函数调用。 现已在 Perplexity Agent API 中提供,并成为 Computer 的默认选项。 https://research.perplexity.ai/articles/rethinking-search-as-code-generation
来源: X:Perplexity (@perplexity_ai)

行业动态

1. Anthropic 保密向 SEC 提交 S-1 草案

Anthropic, PBC 今日保密向美国证券交易委员会提交了 S-1 表格草案,计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定,将取决于市场条件等因素。公司近期刚完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,估值达 9650 亿美元,并发布了 Claude Opus 4.8 模型。
来源: Anthropic:Newsroom(网页)

2. 智谱:建议 A 股发行并在科创板上市

智谱计划向中国监管机构申请发行 A 股并在科创板上市。发行股份数量占发行完成后总股本的 2% 至 8%,预计全部为新股,原股东不发售。本次发行募集资金净额将投资于人工智能通用基座大模型、大模型 MaaS 一站式服务平台及补充流动资金。此外,公司拟将英文名称由“Knowledge Atlas Technology Joint Stock Company Limited”变更为“Z.AI Co., Ltd.”。
来源: IT 之家(RSS)

3. Alphabet 将通过发行股票筹集 800 亿美元用于 AI 支出计划

Alphabet 正在通过发行股票等方式筹集 800 亿美元资金,其中包括与 Berkshire Hathaway 的投资协议,以资助其雄心勃勃的 AI 支出计划。
来源: Bloomberg:Technology(RSS)

4. 佛罗里达州起诉 OpenAI 与 Sam Altman:涉多起 ChatGPT 相关谋杀案

佛罗里达州对 OpenAI 及其 CEO Sam Altman 提起诉讼。该州总检察长指控 Altman 对人命“完全漠视”,案件与多起涉及 ChatGPT 的谋杀事件相关。
来源: Ars Technica:AI(RSS)

5. 王兴:美团 AI Agent“小美”与腾讯元宝即将深度合作,用户订单无缝连接

美团 2026 年第一季度财报显示营收 910.39 亿元,净利润亏损 68.27 亿元。财报电话会上,CEO 王兴透露其 AI Agent“小美”将与腾讯元宝深度合作。用户在腾讯元宝中提交本地服务需求,将被无缝连接至美团的外卖点餐、配送等生态。王兴强调,面向智能体的服务(To A)正变得日益重要,美团已将 AI 助手“小团”置于 App 核心位置,并拓展 AI 服务外延。
来源: IT 之家(RSS)

6. 英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展

来源: IT 之家(RSS)

7. OpenAI 在密歇根州启动 Stargate 1GW 数据中心建设

OpenAI 在密歇根州启动了名为 Stargate 的 1GW 数据中心项目。作为 AI 基础设施建设的一部分,该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。
来源: OpenAI:官网动态(RSS · 排除企业/客户案例)

8. Meta 的 AI 被利用来劫持 Instagram 账号

Meta 的 AI 聊天机器人被发现存在安全漏洞,黑客可以通过请求该 AI 关联一个新的电子邮件地址,从而接管目标用户的 Instagram 账号。该漏洞利用了 AI 智能体直接执行账户管理操作的能力。
来源: The Verge:订阅版科技(RSS)

技巧与观点

1. 作者分享使用 Codex App 开发的开源项目合集

作者分享了使用 Codex App 等工具开发的一系列开源项目,包括 4 个 Chrome 插件(如快捷提示词、新标签页)、4 个网站(如艺术家风格对比、音乐展示)和 5 个 AI Skill(如论文解读、阅读助手)。项目基于 GPT-Image-2 API、Suno 等技术,并整合了 Read-frog、Hyperframe 等开源项目。
来源: X:Vista (@vista8)

2. 使用 Claude Opus 4.8 将书籍转化为 AI 技能的教程

本文以《非暴力沟通》为例,提供了一个将书籍转化为可调用 AI 技能(Skill)的六步教程。作者使用 Claude Opus 4.8 模型,因其具备 100 万 token 上下文窗口、结构化输出及多步智能体(Agent)能力,能一次性处理全书逻辑。流程包含文本准备、全局结构分析、五类提炼(框架/原则/技法/反模式/作者声音)、技能生成及关键的自检步骤。生成的技能保留了书中原始框架命名(如 OFNR 四要素、长颈鹿语言),并将触发词优化为“怎么提意见不像在指责”等日常表达。整个流程耗时约 45 分钟,消耗约 30 万 token,成本不到 20 元人民币。
来源: X:阿易 AI Notes (@AYi_AInotes)

3. Sam Altman 强调 AI 发展应以人为本

Sam Altman 在采访中表示,AI 不应被设计为追求脱离人类需求的目标,人类必须始终处于 AI 发展的中心。他批判了行业内“AI 将摧毁大量工作”等言论,认为人们担忧的并非 AI 带来的好处,而是自身在未来的角色、经济前景与自主权。他指出,AI 行业的失败在于未能清晰解释人类如何在每一步保持对未来的控制权,以及如何在 AI 时代继续拥有充实、有意义的生活。
来源: X:Rohan Paul (@rohanpaul_ai)

4. 构建每周千美元预算上限的智能体教程

视频教程:如何构建一个每周预算上限为 1000 美元的智能体,包含模型拒绝列表与自定义数据保留 使用了新的、可堆叠的护栏架构: [引用 @OpenRouter]:OpenRouter 上的护栏是市场上最强大的:为您的 AI 流量提供集中式安全与治理 预算限制、ZDR、模型与提供商限制、提示词注入防御以及 DLP / 敏感信息检测,分层为您控制的规则!🧵
来源: X:OpenRouter (@OpenRouter)

5. Gemini Omni 支持创建个人数字分身

轻松将自己添加到 Gemini 的视频创作中。 以下是如何使用 Gemini Omni 创建一个外观和声音都像你的数字分身。🧵
来源: X:Gemini (@GeminiApp)

6. Google AI 展示并行子智能体自动整理文件

从杂乱到清晰。观看 @Antigravity 中的并行子智能体对数百个营销资产进行分类和重命名,消除手动文件管理。
来源: X:Google AI for Developers (@googleaidevs)

7. 开源与闭源模型在不同的增长曲线上

当模型智能的微小提升能直接转化为实际价值时,开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成了差异化的竞争格局。
来源: Nathan Lambert:Interconnects(RSS)

8. 微软研究聚焦:智能体评估与价值对齐

大规模评估智能体行为,论证代码库优于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。
来源: X:Microsoft Research (@MSFTResearch)

发表一个评论

R保持