AI 日报｜2026-06-26｜Ornith-1.0 开源模型家族发布，专注 Agentic Coding 全参数规模｜OpenRouter MCP 服务器发布

0 条回复

17 次浏览

AI 热点日报（2026-06-26）

模型发布/更新

1. Ornith-1.0 开源模型家族发布，专注 Agentic Coding 全参数规模

Ornith-1.0 开源模型家族发布，专注智能体编程（Agentic Coding），覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖：SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5、NL2Repo 48.2、SWE Atlas 41.2 QnA、ClawEval 77.1。基于 gemma4 和 qwen3.5 后训练，采用强化学习联合优化任务脚手架（scaffold）与最终解决方案，让模型自主改进执行框架。全系列 MIT 开源，提供 GGUF 版本，支…
来源： X：Berry Xia (@berryxia)

产品发布/更新

1. OpenRouter MCP 服务器发布

OpenRouter 推出 MCP 服务器，为编程智能体提供实时模型数据、基准排名、定价和文档查询。开发者通过一键安装（支持 Claude Code、Codex CLI、Cursor 等客户端），即可在编辑器内完成模型筛选、价格对比和测试推理，无需切换标签页。服务器整合 Artificial Analysis、Design Arena 及 OpenRouter 自身排名数据，例如推荐 GLM-5.2 作为性价比最佳的编码模型。工具集包括 models-list、model-get、model-endpoints、benchmarks 等，支持通过 chat-send 发送测试提示，比较不同模型（如 Claude Opus 4.8、G…
来源： OpenRouter：Announcements（RSS）

2. Midjourney 预览 V8.2 并加速草稿模式

Midjourney 带来两项更新。一是加入 --preview 参数可提前体验 V8.2 的美学与个性化效果；二是此前在 V8.1 推出的大批量草稿模式（生成 24 张低分辨率图，价格仅为标准 4 张的一半，点击 "Vary" 可升级为全分辨率）现在支持搭配 --sref random 使用，探索风格空间的速度比之前快 24 倍。
来源： X：Midjourney (@midjourney)

3. Codex 在 ChatGPT 移动 App 正式可用

OpenAI 宣布 Codex 在 ChatGPT 移动应用中正式开放（GA），并新增一对一设备配对实现更安全的手机与电脑连接。移动端新增通知、目标、侧边聊天、文件预览及内联审阅评论功能。此前预览版已明确，用户可通过 ChatGPT 移动 App 启动新工作、审查输出、引导执行和批准下一步，而 Codex 实际继续在笔记本、Mac mini 或开发机上后台运行。
来源： X：OpenAI Developers (@OpenAIDevs)

4. Runway 发布 Agent 2.0

Runway 发布 Agent 2.0，帮助营销人员创建、测试和优化广告、视频及营销活动。品牌营销人员可在对话中开发活动概念、生成变体并自动本地化；绩效营销人员可上传创意并导入 Meta、YouTube、TikTok 或 Google 广告数据，由 Agent 分析后生成下一轮待测广告。社交媒体营销人员可一次性生成一周内容，自动裁切为 9:16、16:9、1:1 等格式；产品营销人员可借助 Agent 确定定位角度并构建活动资产。Agent 2.0 面向所有用户开放。
来源： Runway：News（网页）

5. Midjourney V8.1 草稿模式新增随机风格功能

Midjourney V8.1 的草稿模式（draft mode）添加了随机风格功能。用户在提示词中加入 --sref random 即可一键生成 24 张不同风格的图片。开启草稿模式可通过点击提示栏的 ⚡ 图标或添加 --draft 参数。
来源： Midjourney：Updates（RSS）

6. Claude Code v2.1.193 发布

Claude Code v2.1.193 新增 autoMode.classifyAllShell 设置，将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及 /permissions 页面。新增 claude_code.assistant_response OpenTelemetry 日志事件（默认不记录，需设置 OTEL_LOG_ASSISTANT_RESPONSES=1）。Bash 模式支持实时文件路径自动补全；MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收（可禁用）。修复 /model UI 状态滞后、后台任务误取消、…
来源： Claude Code：GitHub Releases（RSS）

7. Google Finance 全新 Android 应用与投资组合功能上线

本周，Google Finance 推出正式版 Android 应用，同步上线全球投资组合跟踪功能。用户可通过截图、CSV/PDF 上传或文字描述创建组合，并利用 AI 研究工具提问资产配置、固定收益影响等问题。新增市场情报简报功能：用户设定任务（如每日盘前简报），后台自动生成并推送至 Google 应用（Android/iOS）及网页端。Android 应用包含 watchlist、实时数据、金融新闻 feed、AI 研究工具及 AI 驱动的“关键时刻”解释股价波动。未来数月将把更多 web 功能（如财报电话、投资组合与任务）迁移至移动端，今年晚些推出 iOS 应用。
来源： Google Blog：AI（RSS）

8. 盈透证券（Interactive Brokers）与 Grok 集成：组合分析、情景建模与实时交易指令生成

盈透证券（Interactive Brokers）近日与 Grok 集成，用户可在几分钟内免费关联现有账户，无需注册新账户。通过自然语言与 Grok 对话，可完成组合收益分析（如股息与利息预测）、行业/地区/经济事件的风险敞口情景建模、市场趋势研究，并直接生成对冲订单等实时交易指令，实现从数据洞察到执行决策的一体化。
来源： xAI：News（网页）

行业动态

1. 美国政府要求 OpenAI 暂缓 GPT-5.6 广泛发布

The Information 报道，美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 的广泛发布，改为推出受控预览版。OpenAI 计划先向小部分合作伙伴提供早期访问，并由政府逐客户审批准入。这一非常规做法主要担忧模型在自动化高技能网络工作上的能力：既能帮防御者更快发现漏洞，也可能被攻击者用于加速测试漏洞利用。本周四，CEO Sam Altman 已向员工确认该审批流程。
来源： X：Rohan Paul (@rohanpaul_ai)

2. Anthropic 称阿里巴巴非法获取了 Claude AI 模型的功能

Anthropic 指控阿里巴巴未经授权提取了其 Claude AI 模型的能力。该指控基于 Anthropic 的调查，认为阿里巴巴通过逆向工程或其他手段复制了 Claude 的核心技术。目前阿里巴巴尚未公开回应。
来源： Hacker News 热门（buzzing.cc 中文翻译）

3. Meta 员工警告 AI 内容审核部署过快

Meta 在 2025 年已用大语言模型替换约一半人工审核请求，计划年底前将部分内容类型的 AI 审核比例提升至 90% 以上，每年节省数十亿美元。Meta 否认成本动机，称自 3 月测试显示其模型错误率比人类低 13%，且多捕捉 10% 违规。但员工指出模型仍会移除或限流无害内容，缺乏足够监督，快速部署已导致外包裁员。此外，Meta 已从使用 Google Gemini 转向自家新基础模型 Muse Spark，该模型基于人工审核员的历史决策训练。
来源： The Decoder：AI News（RSS）

4. General Intuition 完成 3.2 亿美元融资，用游戏数据训练通用 AI 智能体

General Intuition 以 23 亿美元估值完成 3.2 亿美元融资，累计披露融资 4.54 亿美元。公司从旗下游戏剪辑平台 Medal 获取数亿小时含精确按键动作标签的游戏操作数据，训练单一模型同时驾驭 Fortnite 等虚拟环境和四足机器人。演示中，AI 智能体在游戏中连续运行 100 小时，机器人仅靠 8 分钟真实街道数据微调即可自主探索办公室。本轮由 Khosla Ventures 领投，General Catalyst、Jeff Bezos、Eric Schmidt 等参投。资金将用于通过 CoreWeave 扩大计算规模、预训练下一代模型，计划夏末前开放 API。
来源： TechCrunch：AI（RSS）

5. Suno 推出 Spark：支持下一代独立艺术家

Suno 宣布启动 Spark 孵化器项目，面向年满 18 岁的未签约独立歌手、词曲作者和制作人。入选者将获得创作资助和额外营销经费，受邀与知名艺术家共同参与写歌营，并有机会为 Suno 正在构建的新功能提供反馈。艺术家保留其作品的创意控制权和商业权利。即日起开放申请。
来源： Suno：Blog（网页）

论文研究

1. 赫库兰尼姆古卷首次被完整虚拟解读

研究人员利用高分辨率 X 射线显微断层扫描和机器学习，在未物理展开的情况下完整虚拟展开并读取了赫库兰尼姆古卷 PHerc.1667（Scroll4）。这是首卷被从头到尾连续读取的纸莎草卷，内容为斯多葛哲学论著，提及克里西普斯的侄子 Aristocreon。第二卷 PHerc.Paris4 通过更高分辨率成像使墨水在三维数据中直接可见，独立确认了 2023 年大奖赛的解读。第三卷 PHerc.139 确定标题和作者为菲洛德穆《论诸神》第八卷。所有数据与代码已公开。
来源： Hacker News 热门（buzzing.cc 中文翻译）

2. IBM 首度推出亚纳米级芯片技术

IBM 于 2026 年 6 月 25 日发布全球首款亚纳米级芯片技术，采用 0.7 nm（7 埃米）节点与全新三维纳米堆叠（nanostack）架构。指甲盖大小的芯片集成近 1000 亿个晶体管，密度约为 IBM 2021 年 2 nm 芯片的两倍。相比 2 nm 芯片，性能最高提升 50%，能效最高提升 70%。纳米堆叠架构还实现 SRAM 面积缩减 40%，有助于支撑先进 AI 工作负载的高带宽需求。该技术已在 VLSI 2026 会议上验证，IBM 预计 5 年内量产。
来源： Hacker News 热门（buzzing.cc 中文翻译）

3. OpenAI 内部报告：智能体 Codex 如何改变工作

OpenAI 在 2025 年 8 月至 2026 年 6 月间观察到，智能体产品 Codex 取代 ChatGPT 成为主要工作工具，各部门输出 token 中 Codex 占比从不足 10% 升至 99.8%。80.6% 个体用户曾发起预计等效人类工作时间超 30 分钟的请求，70.2% 超 1 小时，25.6% 超 8 小时；99 百分位用户每日生成超 60 小时 agent turns。非开发者用户增长迅猛：个体用户增长 137 倍，组织用户增长 189 倍。Legal、Finance、Recruiting 部门在 2026 年 4 月前后跨过 Codex 使用过半拐点，平均每位律师或招聘人员超 85% 输出 token 来自 Codex。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

4. 用线性弹性缓存优化云经济

Google Research 与 Google Cloud 提出线性弹性缓存，将缓存管理转为线性成本优化问题，动态调整大小以最小化总拥有成本。为每条数据引入“滑雪租赁”决策框架，在租用内存（持续付费）与购买缺失（缓存未命中惩罚）间选择，并用轻量级机器学习实时优化内存占用与缺失率权衡。无服务器云场景下（每 GiB 内存每天 $3），该技术可在不牺牲性能的同时显著降本。论文发表于 CIDR。
来源： Google Research：Blog（网页）

技巧与观点

1. @exponentialview 发布《State of the AI Economy》报告：AI 经济年化收入超 1750 亿美元

报告基于去重后的消费端 AI 支出统计，过去 12 个月实际 AI 营收达 1100 亿美元，年化运行率超 1750 亿美元，增长速度约为移动/互联网普及浪潮的 3 倍。营收形成速度急剧加快：2023 年新增 10 亿美元收入需 180 天，现缩短至不足 2 天。企业 AI 已脱离试点阶段，但全面推广仍处早期。31% 的标普 500 公司在财报电话会提及 AI，仅 20% 量化影响。Token 降价每 10% 刺激 12-18% 用量增长，需求价格弹性强。超大规模云厂商 AI 收入目前大致覆盖基础设施折旧，GPU 经济效益依赖 6 年计算寿命假设。电力供应和数据中心成本仍是未来扩展主要瓶颈。
来源： X：Rohan Paul (@rohanpaul_ai)

2. 多数主流 AI 聊天机器人政治立场偏左，“反觉醒”模型也不例外

华盛顿邮报调查显示，多数主流 AI 聊天机器人在政治问题上明显偏左。OpenAI GPT-5.5 在 80% 回答中仅呈现左派论据；DeepSeek V4 Pro 为 70%；Anthropic Claude Opus 4.8 有 43% 纯左、57% 给出双方观点。xAI 的 Grok 4.3 左倾回答仍多于右倾。右翼平台 Gab 的 Arya 左倾回答是右倾的 12 倍。Google Gemini 3.1 Pro 是例外，93% 回答同时呈现双方立场。特朗普推动的“反觉醒”AI 未能改变这一格局。
来源： The Decoder：AI News（RSS）

3. OLMo Hybrid vs Transformer：混合模型在实义词上优势明显，但重复短语上几无优势

通过对比 7B 参数的 OLMo 3（Transformer）与 OLMo Hybrid（混合架构），实验发现混合模型在大多数 token 上预测损失更低：对名词、动词、形容词等实义词优势明显（loss gap 约 0.04），功能词上 gap 约 0.02，且在需上下文推理的代词指代上更好。但在重复出现的 n-gram 和闭合括号（如}）上，混合模型的优势几乎消失，Transformer 凭借注意力机制更擅长从输入中直接检索精确信息。
来源： Hugging Face：Blog（RSS）

4. Meta 隐私感知基础设施的资产分类：混合模式将 LLM 蒸馏为确定性规则

Meta 在 Privacy-Aware Infrastructure (PAI) 的资产分类中采用混合模式：先构建含代码、血缘、语义标注的上下文证据，再调用 LLM 处理歧义、冷启动和新颖资产；人工审核标签与模型推荐严格隔离。LLM 不直接做生产决策，其稳定行为被蒸馏为版本化确定性规则用于生产执行，LLM 角色随规则积累逐步缩小。核心原则：上下文比提示词更重要、解耦评估与优化、将稳定行为规则化。
来源： Meta Engineering Blog（RSS）

5. 跨模型与任务的 GitHub Copilot agentic harness 性能与效率评估

GitHub Copilot agentic harness 在多个基准测试中表现强劲，同时具备领先的 token 效率，并支持在 20 多个模型间灵活选择。
来源： GitHub Blog

6. Sail Research 构建集群感知编排，加速异步推理

推理市场是软件中最大的市场。AI 工作负载正从同步聊天转向异步、多轮智能体，运行时长可达数小时。Sail Research 为此构建了集群感知（fleet‑aware）编排系统，以最大化每美元推理支出的吞吐量。
来源： Tomer Tunguz 博客（VC 分析）

7. Generative AI Fizzle™：生成式 AI 泡沫正在缓慢消退

Gary Marcus 昨日提出新术语 Generative AI Fizzle™，认为生成式 AI 行业估值过高，投资者对 hype 与利润的落差失去热情。LLM 已商品化，价格战激烈，提供商盈利艰难。昨日一款新的中国开源模型发布，可能进一步冲击美国 LLM 公司。多数 AI 股票本月显著下跌，泡沫可能不会突然破裂，而是缓慢消退。
来源： Gary Marcus：The Road to AI We Can Trust（RSS）