AI 日报|2026-06-20|阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式|Figure 机器人数首超人类员工
AI 热点日报(2026-06-20)
产品发布/更新
1. 阿里开源向量数据库 Zvec,UCSD 黄碧薇教授提出因果 AI 第四代范式
阿里开源内部向量数据库 Zvec,pip install zvec 免费使用,对标 Pinecone 每月 70 美元能力。支持十亿向量毫秒级检索,无需单独起服务,全平台兼容;v0.5.0 新增原生全文混合搜索。UCSD 黄碧薇教授(causal-learn 作者)提出 AI 四代范式:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型,认为当前正站在第四代门口。其创立的 Aether AI 完成首轮融资,致力于从视频中自动抽取物理规律,探索下一代因果 AI 范式。
来源: X:阿易 AI Notes (@AYi_AInotes)
2. NVIDIA Research 发布 SpatialClaw:免训练空间推理框架
NVIDIA Research 发布 SpatialClaw,一个免训练的空间推理框架。它通过将代码作为动作接口,让智能体调用感知工具(Depth Anything 3、SAM 3)并自由组合输出,解决视觉语言模型在 3D 空间判断上的弱点。在 20 项基准测试中平均准确率达 59.9%,比近期智能体 SpaceTools 高 11.2 个百分点,比无工具基线高 6.5 点,比结构化工具调用高 3.2 点。框架无需重新训练,同一提示词和工具集可跨所有基准和骨干网络运行,支持 Qwen3.5/3.6 及 Gemma4 等 26B 至 397B 参数的模型。
来源: MarkTechPost(RSS)
3. Cloudflare 为 AI 智能体推出临时账户
Cloudflare 在 Workers 上推出临时账户(Temporary Accounts),允许 AI 智能体直接运行 wrangler deploy --temporary,在数秒内获取一个可用的实时 Worker,无需绕开面向人类设计的部署流程。该功能旨在降低智能体部署门槛。
来源: Cloudflare Blog
4. Claude Code v2.1.183 发布
Claude Code v2.1.183 增强了自动模式安全性:未经请求时阻止 git reset --hard、git commit --amend(非本轮提交)、terraform destroy 等破坏性命令。新增 attribution.sessionUrl 设置,可省略 claude.ai 会话链接;/config --help 列出所有速记键;/config 切换行为改为 Enter/Space 变更、Esc 保存退出。修复了 thinking 块导致 400 错误、子智能体 WebSearch 空结果、vim 模式光标滞留、Windows Terminal TUI 错乱、多插件技能重复、MCP …
来源: Claude Code:GitHub Releases(RSS)
行业动态
1. Figure 机器人数首超人类员工
我们已超越理论阶段。 有史以来第一次,Figure 的机器人数量超过了人类员工数量。
来源: X:Rohan Paul (@rohanpaul_ai)
2. JAWBONE Act:一项打击政府为压制合法网络言论而施压的新法案
上周,参议员 Ted Cruz 和 Ron Wyden 提出两党法案 JAWBONE Act,为受政府胁迫的广播商、互动计算机服务商及 AI 提供商创建针对政府官员的联邦诉讼权,并建立政府与中间方就用户表达问题沟通的透明度体系。法案旨在应对政府施压私营公司审查受第一修正案保护的言论。EFF 支持该法案,并举证:2025 年 6 月联邦高官威胁起诉 ICEBlock 创建者,同年 10 月司法部长要求苹果下架该应用。EFF 还提起信息自由诉讼,要求披露政府与苹果、谷歌、Meta 的沟通记录。
来源: Hacker News 热门(buzzing.cc 中文翻译)
3. AlphaFold 负责人 John Jumper 离职 Google DeepMind,加入 Anthropic
AlphaFold 团队负责人 John Jumper 宣布,在 Google DeepMind 工作近 9 年后决定离职,将加入 Anthropic(先休整一段时间)。DeepMind CEO Demis Hassabis 表示,过去 9 年与 Jumper 的非凡合作改变了世界,AlphaFold 展示了 AI 在科学与医学领域的巨大潜力,并为 AI 造福人类指明了方向。Jumper 回忆,Hassabis 在他博士毕业仅 6 个月后就大胆让他领导 AlphaFold 团队,感谢团队教会他如何做伟大的科学。
来源: X:Demis Hassabis (@demishassabis)
技巧与观点
1. Humanize PPT v0.9:为演讲而生的开源 PPT Skill
Humanize PPT v0.9 是一款专为演讲场景设计的 PPT Skill,核心通过 AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游 Skill。渲染前先输出 4 张真实预览页,并将图片、视频素材的占位与生成 prompt 写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按 S 键在独立窗口显示演讲稿备注,按 ESC 键打开全局索引快速跳页。项目已开源至 github.com/LearnPrompt/humanize-ppt,由卡尔 & yc 星辰开发。
来源: 公众号:卡尔的 AI 沃茨
2. DeepSeek 研究员开源 AutoResearch:AI 自主跑通 285B 模型 RL 研究闭环
DeepSeek 研究员 Deli Chen 将 AutoResearch 协议开源,并发布 Self-play 综述论文。其 AI 智能体首次完全自主地在 DeepSeek 285B 模型上完成完整 RL 研究闭环——从实验设计、写代码、提交 GPU 任务、debug 到结论总结,全程零人工干预。系统调用了 GRPO 工具,被视为持续学习研究的开端。
来源: X:阿易 AI Notes (@AYi_AInotes)
3. baoyu-design Skill 迭代:修复导出样式与渐变丢失问题,支持 AI 配图导出 PPTX
宝玉分享 baoyu-design Skill 的迭代过程:用户测试发现导出问题(样式表未铺满整页、渐变色丢失),他在本地复现后让 Agent 分析原因、给出解决方案并添加测试覆盖,修复后效果改善。该 Skill 可在制作 PPT、动画视频或网站时调用 AI 生图配图,支持 Codex 内置画图或配合 baoyu-image-gen Skill 调用 Codex CLI 画图,并能连同图片一起导出为 PPTX,在 PowerPoint/Keynote 中二次编辑。迭代循环:自己用 → 发现问题 → 让 Agent 分析 → 出方案 → 确认 → 更新 Skill。
来源: X:宝玉 (@dotey)
4. /youtube-notetaker:YT 视频转 Artifacts
YT 视频 -> Artifacts 看看我如何使用新的 /youtube-notetaker 技能从 YT 视频生成 Artifacts。 捕获幻灯片、笔记、转录内容…… 快去试试 ↓
来源: X:Elvis Saravia (@omarsar0, DAIR.AI)
5. Salesforce CodeGen 教程:生成、验证并重排序 Python 函数(含单元测试与安全检查)
本教程实现一个基于 Salesforce CodeGen 的端到端代码生成工作流。从 HuggingFace 加载 CodeGen 模型(支持 350M、2B、codegen2-1B、codegen25-7b 等版本),通过自然语言提示生成 Python 函数,随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N 候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了 CodeGen 作为结构化代码生成流水线的能力,不仅完成代码补全,还能评估、筛选和组织生成结果。
来源: MarkTechPost(RSS)
6. 我们在 Elasticsearch 上构建了一个持久化代理内存层,其召回率为 0.89
Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 GitHub。
来源: Hacker News 热门(buzzing.cc 中文翻译)
7. OpenRouter vs LiteLLM:如何选择 LLM 网关
OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关,无需管理基础设施,收取 5.5% 平台费(前 100 万次请求免费),支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理(Docker/PostgreSQL/Redis),数据不离开内网,免费开源,但需承担基础设施成本(生产部署约数百美元/月)。当模型月支出超过约 $3,600(基础设施 $200/月)或 $9,100(基础设施 $500/月)时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由;OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。
来源: OpenRouter:Announcements(RSS)
8. AI 中心的数据黑洞
智能的一种定义是样本效率,但近年 AI 进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日 Epoch 报告,开源模型仅落后前沿闭源模型 4 个月,原因在于数据可从公开 API 蒸馏,而超参数等不易复制。人类一生接触约 2 亿 token,前沿模型训练在数十到数百 T token 之间,相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。
来源: Dwarkesh Patel:Podcast & Blog(RSS)