AI 日报｜2026-06-30｜美团 LongCat Owl Alpha：OpenRouter 最流行模型，1.6 万亿 MoE，国产 ASIC 训练｜从任何地点构建——Cursor for iOS 公测版发布

0 条回复

18 次浏览

AI 热点日报（2026-06-30）

模型发布/更新

1. 美团 LongCat Owl Alpha：OpenRouter 最流行模型，1.6 万亿 MoE，国产 ASIC 训练

美团 LongCat 的 1.6 万亿参数 MoE 模型 Owl Alpha 成为 OpenRouter 上最流行模型，累计消耗 10 万亿 tokens，性能达 Gemini/Opus 4.6 级别。该模型使用 35 万亿 tokens 训练，完全在 5 万块国产 ASIC 上完成。据官方推文，Owl Alpha 上线后每日调用量全球 Top3，在 Hermes Agent 排名#1，Claude Code 排名#2，OpenClaw 排名#3。该模型即将退役，后续版本待公布。
来源： X：Emad Mostaque (@EMostaque)

产品发布/更新

1. 从任何地点构建——Cursor for iOS 公测版发布

Cursor 推出 iOS 原生公测版，所有付费计划可用。开发者可在手机上启动始终在线的云端智能体，或远程操控电脑端智能体。支持语音输入、斜杠命令和选择前沿模型。智能体运行后，锁屏 Live Activities 和推送通知实时更新状态，完成或需要输入时提醒。云端智能体在隔离虚拟机中运行，可自动迭代生成合并就绪的 PR，并输出演示、截图和日志。本地与云端智能体支持双向切换。移动端 Composer 2.5 享受 75% 折扣，优惠至 2026 年 7 月 5 日。
来源： Cursor Blog

2. EverOS：开源 Markdown 优先智能体记忆运行时，支持混合检索与自进化技能

EverMind 推出开源智能体记忆运行时 EverOS（Apache 2.0 许可）。它以可编辑的 Markdown 文件为记忆主体，经 SQLite 管理状态、LanceDB 实现混合检索（BM25 关键词 + 向量搜索 + 标量过滤）。每个完成的任务记录为 Case，离线提炼为可复用的 Skill，使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs（支持分类与话题搜索的 Markdown 页面）和 Reflection（跨会话优化 Profile 和 Skill）。据 EverMind 报告，LoCoMo 得分 93.05%，LongMemEval 83.00%，HaluMem 93.04%，p95 检索延…
来源： MarkTechPost（RSS）

3. 小红书 RedKnot 推理引擎：将 KV Cache 按注意力头拆解实现长文本加速

RedKnot 将 KV Cache 沿注意力头维度拆解，通过头分类稀疏（局部头占 83.4%–96.8%）、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上，TTFT 最高加速 1.6–3.54×，单卡并发提升 4.7–7.8×，预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×，KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。
来源：公众号：小红书技术（dots.llm）

4. OpenClaw 发布原生 iOS 与 Android 应用

OpenClaw 现已登陆 iOS 和 Android 🦞 📱 原生移动应用，终于来了 💬 智能体装进口袋 🔔 频道、任务、回复，随时处理用你的大拇指，在任何地方运行智能体。 iOS: https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android: https://play.google.com/store/apps/details?id=ai.openclaw.app
来源： X：OpenClaw (@openclaw)

5. Herdr：驻留在终端中的 AI 智能体多路复用器

Herdr 是一个驻留在终端中的 AI 智能体多路复用器，允许用户在单一终端界面内管理和切换多个 AI 智能体会话。
来源： Hacker News 热门（buzzing.cc 中文翻译）

6. 为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway，一个自托管控制平面，让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux，后端使用 PostgreSQL，提供企业级 SSO 登录（通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等）、集中策略管理、角色权限、路由（支持故障转移）以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据（除非配置使用 Claude A…
来源： Claude：Blog（网页）

7. Claude 在 Microsoft Foundry 正式可用

从今天起，Claude 模型在 Microsoft Foundry 上正式可用，托管于 Azure 环境，运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5，通过 Messages API 调用，支持提示缓存和扩展思考。用户可选择推理处理位置，包括美国数据区域，由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制，并获得统一账单；符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。
来源： Claude：Blog（网页）

8. Claude Code v2.1.196 发布

新增组织默认模型支持，未选模型时显示“Org default”。聊天会话可读默认名称，文件附件支持 Cmd/Ctrl-click 定位。安全方面，claude mcp list/get 不再启动通过 .claude/settings.json 自批准的不安全服务器；不受信任工作区显示“Pending approval”。/code-review 合并五个清理查找器，token 用量减少约 25%。终端 UI 跳过空子树遍历减少渲染。流式空闲看门狗默认开启，5 分钟无事件自动中止重试。修复背景对话误删、远程会话自动恢复、MCP OAuth 作用域冲突、Agents 侧边栏焦点丢失等多项问题。
来源： Claude Code：GitHub Releases（RSS）

行业动态

1. 国务院印发《教育发展“十五五”规划》，推进人工智能全学段教育

国务院日前印发《教育发展“十五五”规划》，要求推进人工智能全学段教育，提升学生人工智能素养及提出问题、解决问题的能力。规划明确完善科学教育体系，强化科技教育与人文教育协同，加强青少年科学素养、批判性思维和创新能力培养。同时实施学生体质强健计划、心理健康促进行动，加大拔尖创新人才自主培养力度，推动学科交叉融合，扩大优质本科招生规模。目标到 2030 年高质量教育体系基本建成。
来源： IT 之家（RSS）

2. Rubin Ultra 取消，新版尺寸性能减半

有意思：在 GTC 2026 宣布 Rubin Ultra 仅 3 个月后，原 4-die Rubin Ultra 因制造执行问题被取消。新的“Rubin Ultra”尺寸减半，实际性能约为原版的一半。1/4🧵
来源： X：SemiAnalysis (@SemiAnalysis_)

3. 美军用 AI 选目标却误炸伊朗学校，Anthropic Claude 嵌入 Palantir 系统首日建议约 1000 目标

美军在打击伊朗时首次大规模使用 AI 选择目标（Anthropic 的 Claude 模型嵌入 Palantir 的 Maven Smart System，首日建议约 1000 个目标），但对一所学校的导弹袭击导致约 120 名儿童死亡。调查发现，情报分析师早在 2019 年就通过数字工具标记该地点已变为小学，但该工具未连接军方官方目标数据库 MIDB，信息从未送达指挥官。MIDB 建于 1980 年代，依赖手动输入，替代系统 MARS 多年延迟。五角大楼事后宣布推出 agentic AI initiative。Project Maven 创建人 Jack Shanahan 批评目标验证不力不可原谅。
来源： The Decoder：AI News（RSS）

4. 三星和 SK 海力士计划投资 5900 亿美元扩产芯片，AI 需求推高内存价格

在韩国政府支持下，三星和 SK 海力士计划投入 5900 亿美元扩大芯片产能，包括 800 万亿韩元新建四座工厂、81 万亿韩元建封装中心，以及未来 15 年 30 万亿韩元用于研发下一代芯片。AI 数据中心需求是主要驱动力。Jefferies 预测，2026 年 Q3 内存价格将上涨 40% 至 50%，Q4 再涨 30% 至 40%，2027 年继续上涨 40% 至 45%，到 2028 年新产能仅上线 15% 至 20% 才可能缓解。两家公司合计控制全球近 80% 的高带宽内存芯片市场。内存涨价已推高消费电子产品成本，苹果已上调 Mac 和 MacBook 售价。
来源： The Decoder：AI News（RSS）

5. SK 集团会长崔泰源：到 2035 年建设 15GW AI 数据中心，总投资达 1000 万亿韩元

SK 集团会长崔泰源 6 月 29 日宣布，计划到 2035 年建成 15GW AI 数据中心容量，作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元（约 4.4 万亿元人民币），未来 10 年保持年均 100 万亿韩元以上国内投资，旨在实现从出口传统商品向智能服务的转变，构建韩国智能市场。此外，SK 海力士将向韩国西南部投资 400 万亿韩元，半导体供应项目总投资达 1100 万亿韩元（约 4.84 万亿元人民币）。
来源： IT 之家（RSS）

论文研究

1. Meta 发布 Brain2Qwerty v2：非侵入式实时句子解码

Meta 公布 Brain2Qwerty v2，这是非侵入式脑电信号解码研究的最新里程碑。基于当天发表在《Nature》的 v1，v2 是性能最高的端到端管道，能从原始脑信号实时解码句子。其从字符级性能提升至解码单词和语义，提高整体沟通准确性。该研究有望帮助数百万因脑损伤或疾病无法沟通的人群。
来源： X：AI at Meta (@AIatMeta)

2. Claude Code 打开 GitHub 仓库即执行隐藏恶意代码，攻击者可获完全控制

安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本，该脚本运行时从 DNS 条目拉取命令并执行，恶意代码从未存在于仓库中，对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时，Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本，打开反向 shell，攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容，开发者应将第三方仓库的 setup 说明视为不受信任代码。
来源： The Decoder：AI News（RSS）

3. OpenAI 报告：绘制欧洲 AI 劳动力机遇版图

OpenAI 发布新报告，分析 AI 对欧盟就业的影响，划定哪些职业面临自动化、增长或工作流程变化。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

4. DiScoFormer：一个跨分布同时估计密度与分数的单一 Transformer 模型

DiScoFormer（Density and Score Transformer）是一个无需重新训练即可从数据点估计分布密度和分数的单一模型。它利用 Transformer 的交叉注意力机制，在单次前向传播中输出密度和分数，并通过一致性损失实现分布外自适应。在 100 维空间中，DiScoFormer 比最优调参的核密度估计（KDE）降低分数误差约 6.5 倍、密度误差超过 37 倍，且随样本量增加持续提升，而 KDE 内存耗尽。模型基于高斯混合模型训练，可泛化至非高斯分布（如 Laplace、Student-t）及未见过的多模态混合。
来源： Hugging Face：Blog（RSS）

技巧与观点

1. Anthropic 工程师 Margot Van Laar：提示词工程实战——调试生产提示词为主，评估是唯一严谨方式

An anthropic 应用 AI 工程师 Margot Van Laar 在 Code with Claude 分享提示词工程实战，核心观点：大部分时间在调试和维护已有生产提示词而非从零编写。两个场景：客服机器人维护中，用 XML 标签结构化清理，移除旧模型遗留的“禁止列表”指令（新模型会过度拟合），精确计算应调用工具，转人工决策需明确代价与收益；零售排班 Agent 从零构建时，拆成生成-评估-修复三个简单提示词更稳定，选用更强推理模型（Opus）。她反复强调：评估（Eval）是唯一严谨方式，没有评估就是碰运气。
来源： X：Berry Xia (@berryxia)

2. Qwen 3.6 27B 是本地开发的理想选择

Qwen 3.6 27B 是一款密集参数本地大语言模型，原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版（含多 token 预测）可达 30 tokens/s；用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务，作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B，但作者推荐 27B 版本。
来源： Hacker News 热门（buzzing.cc 中文翻译）

3. 分享两个 Vibe Coding 必备的实用 Prompt：第一性原理与对抗式审查

作者分享 Vibe Coding 中两个关键 Prompt：一是“从第一性原理出发”，强制 AI 跳出类比推理，从基本事实重新推导本质，曾帮作者发现 AIHOT 抓取海外信源的底层流量路由隐患并彻底重构；二是“对抗式审查”，让 AI 站在恶意用户角度攻防式审查代码，检出 OOM 死循环、未来时间污染等手工难发现的 BUG。两个 Prompt 形成生成与验证闭环，使纯 Vibe Coding 项目 AIHOT 最近一周请求量超千万次。
来源：公众号：数字生命卡兹克

4. Anthropic：当 AI 成本超过工程师薪酬

Anthropic 在算力上的支出达到每位工程师每年 51.5 万美元，是其完全薪资（22.4 万美元）的 2.3 倍。相比之下，顶尖 1% 软件公司的算力支出为 8.9 万美元，中位数仅为 1.37 万美元。三个 2029 年情景预测了这一差距的缩小路径。
来源： Tomer Tunguz 博客（VC 分析）