AI 日报｜2026-06-20｜阿里开源向量数据库 Zvec，UCSD 黄碧薇教授提出因果 AI 第四代范式｜Figure 机器人数首超人类员工

0 条回复

7 次浏览

AI 热点日报（2026-06-20）

产品发布/更新

1. 阿里开源向量数据库 Zvec，UCSD 黄碧薇教授提出因果 AI 第四代范式

阿里开源内部向量数据库 Zvec，pip install zvec 免费使用，对标 Pinecone 每月 70 美元能力。支持十亿向量毫秒级检索，无需单独起服务，全平台兼容；v0.5.0 新增原生全文混合搜索。UCSD 黄碧薇教授（causal-learn 作者）提出 AI 四代范式：相关性小模型→因果小模型→相关性大模型（LLM）→因果大模型，认为当前正站在第四代门口。其创立的 Aether AI 完成首轮融资，致力于从视频中自动抽取物理规律，探索下一代因果 AI 范式。
来源： X：阿易 AI Notes (@AYi_AInotes)

2. NVIDIA Research 发布 SpatialClaw：免训练空间推理框架

NVIDIA Research 发布 SpatialClaw，一个免训练的空间推理框架。它通过将代码作为动作接口，让智能体调用感知工具（Depth Anything 3、SAM 3）并自由组合输出，解决视觉语言模型在 3D 空间判断上的弱点。在 20 项基准测试中平均准确率达 59.9%，比近期智能体 SpaceTools 高 11.2 个百分点，比无工具基线高 6.5 点，比结构化工具调用高 3.2 点。框架无需重新训练，同一提示词和工具集可跨所有基准和骨干网络运行，支持 Qwen3.5/3.6 及 Gemma4 等 26B 至 397B 参数的模型。
来源： MarkTechPost（RSS）

3. Cloudflare 为 AI 智能体推出临时账户

Cloudflare 在 Workers 上推出临时账户（Temporary Accounts），允许 AI 智能体直接运行 wrangler deploy --temporary，在数秒内获取一个可用的实时 Worker，无需绕开面向人类设计的部署流程。该功能旨在降低智能体部署门槛。
来源： Cloudflare Blog

4. Claude Code v2.1.183 发布

Claude Code v2.1.183 增强了自动模式安全性：未经请求时阻止 git reset --hard、git commit --amend（非本轮提交）、terraform destroy 等破坏性命令。新增 attribution.sessionUrl 设置，可省略 claude.ai 会话链接；/config --help 列出所有速记键；/config 切换行为改为 Enter/Space 变更、Esc 保存退出。修复了 thinking 块导致 400 错误、子智能体 WebSearch 空结果、vim 模式光标滞留、Windows Terminal TUI 错乱、多插件技能重复、MCP …
来源： Claude Code：GitHub Releases（RSS）

行业动态

1. Figure 机器人数首超人类员工

我们已超越理论阶段。有史以来第一次，Figure 的机器人数量超过了人类员工数量。
来源： X：Rohan Paul (@rohanpaul_ai)

2. JAWBONE Act：一项打击政府为压制合法网络言论而施压的新法案

上周，参议员 Ted Cruz 和 Ron Wyden 提出两党法案 JAWBONE Act，为受政府胁迫的广播商、互动计算机服务商及 AI 提供商创建针对政府官员的联邦诉讼权，并建立政府与中间方就用户表达问题沟通的透明度体系。法案旨在应对政府施压私营公司审查受第一修正案保护的言论。EFF 支持该法案，并举证：2025 年 6 月联邦高官威胁起诉 ICEBlock 创建者，同年 10 月司法部长要求苹果下架该应用。EFF 还提起信息自由诉讼，要求披露政府与苹果、谷歌、Meta 的沟通记录。
来源： Hacker News 热门（buzzing.cc 中文翻译）

3. AlphaFold 负责人 John Jumper 离职 Google DeepMind，加入 Anthropic

AlphaFold 团队负责人 John Jumper 宣布，在 Google DeepMind 工作近 9 年后决定离职，将加入 Anthropic（先休整一段时间）。DeepMind CEO Demis Hassabis 表示，过去 9 年与 Jumper 的非凡合作改变了世界，AlphaFold 展示了 AI 在科学与医学领域的巨大潜力，并为 AI 造福人类指明了方向。Jumper 回忆，Hassabis 在他博士毕业仅 6 个月后就大胆让他领导 AlphaFold 团队，感谢团队教会他如何做伟大的科学。
来源： X：Demis Hassabis (@demishassabis)

技巧与观点

1. Humanize PPT v0.9：为演讲而生的开源 PPT Skill

Humanize PPT v0.9 是一款专为演讲场景设计的 PPT Skill，核心通过 AST（Audience, State, Transfer）逻辑重新编排大纲，将页面渲染外包给下游 Skill。渲染前先输出 4 张真实预览页，并将图片、视频素材的占位与生成 prompt 写入大纲。新增质检环节自动修复常见渲染问题，并支持演讲模式：按 S 键在独立窗口显示演讲稿备注，按 ESC 键打开全局索引快速跳页。项目已开源至 github.com/LearnPrompt/humanize-ppt，由卡尔 & yc 星辰开发。
来源：公众号：卡尔的 AI 沃茨

2. DeepSeek 研究员开源 AutoResearch：AI 自主跑通 285B 模型 RL 研究闭环

DeepSeek 研究员 Deli Chen 将 AutoResearch 协议开源，并发布 Self-play 综述论文。其 AI 智能体首次完全自主地在 DeepSeek 285B 模型上完成完整 RL 研究闭环——从实验设计、写代码、提交 GPU 任务、debug 到结论总结，全程零人工干预。系统调用了 GRPO 工具，被视为持续学习研究的开端。
来源： X：阿易 AI Notes (@AYi_AInotes)

3. baoyu-design Skill 迭代：修复导出样式与渐变丢失问题，支持 AI 配图导出 PPTX

宝玉分享 baoyu-design Skill 的迭代过程：用户测试发现导出问题（样式表未铺满整页、渐变色丢失），他在本地复现后让 Agent 分析原因、给出解决方案并添加测试覆盖，修复后效果改善。该 Skill 可在制作 PPT、动画视频或网站时调用 AI 生图配图，支持 Codex 内置画图或配合 baoyu-image-gen Skill 调用 Codex CLI 画图，并能连同图片一起导出为 PPTX，在 PowerPoint/Keynote 中二次编辑。迭代循环：自己用 → 发现问题 → 让 Agent 分析 → 出方案 → 确认 → 更新 Skill。
来源： X：宝玉 (@dotey)

4. /youtube-notetaker：YT 视频转 Artifacts

YT 视频 -> Artifacts 看看我如何使用新的 /youtube-notetaker 技能从 YT 视频生成 Artifacts。捕获幻灯片、笔记、转录内容…… 快去试试 ↓
来源： X：Elvis Saravia (@omarsar0, DAIR.AI)

5. Salesforce CodeGen 教程：生成、验证并重排序 Python 函数（含单元测试与安全检查）

本教程实现一个基于 Salesforce CodeGen 的端到端代码生成工作流。从 HuggingFace 加载 CodeGen 模型（支持 350M、2B、codegen2-1B、codegen25-7b 等版本），通过自然语言提示生成 Python 函数，随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N 候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了 CodeGen 作为结构化代码生成流水线的能力，不仅完成代码补全，还能评估、筛选和组织生成结果。
来源： MarkTechPost（RSS）

6. 我们在 Elasticsearch 上构建了一个持久化代理内存层，其召回率为 0.89

Agent Builder 正式上市（GA）。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类，分别存入独立索引，各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合，再经交叉编码器重排序。在 168 道 QA 题评估中，R@10 平均 0.89，零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问，不绑定特定运行时，已开源至 GitHub。
来源： Hacker News 热门（buzzing.cc 中文翻译）

7. OpenRouter vs LiteLLM：如何选择 LLM 网关

OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关，无需管理基础设施，收取 5.5% 平台费（前 100 万次请求免费），支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理（Docker/PostgreSQL/Redis），数据不离开内网，免费开源，但需承担基础设施成本（生产部署约数百美元/月）。当模型月支出超过约 $3,600（基础设施 $200/月）或 $9,100（基础设施 $500/月）时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由；OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。
来源： OpenRouter：Announcements（RSS）

8. AI 中心的数据黑洞

智能的一种定义是样本效率，但近年 AI 进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据，再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例，数据行业年收入已达数十亿美元。近日 Epoch 报告，开源模型仅落后前沿闭源模型 4 个月，原因在于数据可从公开 API 蒸馏，而超参数等不易复制。人类一生接触约 2 亿 token，前沿模型训练在数十到数百 T token 之间，相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。
来源： Dwarkesh Patel：Podcast & Blog（RSS）