AI 日报｜2026-06-19｜首个统一科学大模型 LOGOS 正式开源｜GPT-5.5 Instant 提升 ChatGPT 健康智能

0 条回复

8 次浏览

AI 热点日报（2026-06-19）

模型发布/更新

1. 首个统一科学大模型 LOGOS 正式开源

LOGOS 由 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源，是首个基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B（1B 参数）在六大科学任务上匹配或超越领域专用方法：口袋条件配体生成纯序列范式首次超越 3D 扩散模型，超越 NatureLM（8×7B）；逆合成预测 Top-1 准确率 74.8%；口袋位点识别仅靠序列达 58.5% Top-n 准确率；MOF 材料生成 NBB 提升至 17.78%。模型采用统一词汇表将蛋白质、小分子等编码为离散 Token，通过空间交互离散化实现无需 3D 坐标的序列预测。预训练与下游任务形式与目标一致，跨领域知识迁移经实验验证有效。已完整开源模型权重、推理代码与技术报告。
来源：公众号：通义实验室（千问）

2. 火山引擎上线豆包实时语音模型 3.0 API 服务，开启邀测

火山引擎上线豆包实时语音模型 3.0（Seeduplex）API 服务并开启邀测。该模型为原生全双工端到端语音大模型，具备精准遵循、抗干扰、动态判停三大优势。可在多人对话中安静待命，指定话题出现时主动加入；支持通过自定义工具在实时交互中完成预定日历、发送邮件等任务。抗干扰力提升，误回复率与误打断率大幅降低；判停延迟缩短约 250ms，复杂场景抢话比例下降 40%，用户主动打断延迟缩短约 300ms。适用于汽车智能座舱、智能硬件、智能客服等场景。
来源：公众号：火山引擎

3. Grok TTS 盲测人类感得分 96 登顶

xAI 的 Grok TTS 模型在 @Vapi_AI 的 Humanness Index 盲测中以 96 分（真人 100 分）位居榜首。该指数选取同一声音和引文，经各模型克隆后由听众盲评。
来源：[X：xAI ( @xai )]( https://x.com/xai/status/2067654108123910495 )

产品发布/更新

1. GPT-5.5 Instant 提升 ChatGPT 健康智能

每周超 2.3 亿用户通过 ChatGPT 获取健康信息。GPT-5.5 Instant 在健康评估中表现显著提升，最具挑战性评测上达到前沿 Thinking 模型水平，已面向所有免费用户开放。基于医生编写的 HealthBench 和 HealthBench Professional 评估，其回复在准确性、安全性和沟通质量上优于医生手写回复及早期模型，故障模式发生率更低。近两个月生产流量显示，健康类回复事实性问题率下降 71%。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

2. OpenAI 联合多国医生：GPT-5.5 Instant 健康问答能力追平前沿 Thinking 模型

OpenAI 与全球 60 个国家、49 种语言、26 个专科的数百名医生合作，通过医生主导的评估大幅提升了 GPT-5.5 Instant 在健康相关问题的智能水平，现已能与公司前沿 Thinking 模型（推理模型）相当。该模型每周为超过 2.3 亿 ChatGPT 用户服务，能更好识别紧急医疗需求、询问相关上下文、解释不确定性并简化复杂信息。由于面向所有 ChatGPT 免费用户开放，这些改进可惠及更多人。
来源： X：Greg Brockman (@gdb)

3. 免费开源乔木画布：AI 生图+抠图，一键部署 Vercel

乔木画布推出免费开源在线图像编辑器，可一键部署 Vercel 为网站，功能类似简化版 PS。支持 Seedream 和 GPT-image-2 生图、图片模板存储分享、一键抠图、2 万图标和常见 Emoji，甚至能绘制 PRD。随时创建 3:4/16:9/21:9 等不同尺寸画布。原计划高级功能收费，庆祝端午节现全免费开源。在线体验： https://ps.qiaomu.ai/ ，GitHub 见评论区。
来源： X：Vista (@vista8)

4. AI 员工 Viktor 登陆 Microsoft Teams，年化收入达 2000 万美元

AI 员工 Viktor 在 Slack 上实现 2000 万美元年化收入（无销售团队、未大规模推广），现已正式进驻 Microsoft Teams。Viktor 定位为零门槛 AI：用户无需学习、无需提示词，像 @同事一样提及即可获得完整工作成果，甚至无需主动 @ 也能自动完成。产品面向 Teams 的 3.2 亿用户，助力企业内部运营和管理人员零学习成本使用 AI。即日起免费试用，含 100 美元信用额度，无需绑定信用卡。
来源： X：Rohan Paul (@rohanpaul_ai)

5. Claude Code 现已支持 artifacts

从今日起，Claude Code 可将工作进度生成为 artifacts——实时、可分享的交互式网页，涵盖 PR 走查、系统说明、仪表盘、发布清单等。artifacts 基于会话完整上下文（代码库、连接器、对话）自动构建，更新时页面原地刷新，同事即时可见。默认仅作者可见，可分享给组织内成员，由管理员通过组织层级开关和角色权限管控。内部测试中最常见用例为调试：工程师调查事件，Claude Code 分析日志并发布包含时间线、嫌疑提交和错误率图表的 artifact，团队无需再“走过场式汇报”。
来源： Claude：Blog（网页）

6. Adobe 为 Photoshop、Premiere 等多款 Creative Cloud 应用加入 AI 智能体

Adobe 将其“创意智能体”扩展至 Photoshop、Premiere 等应用，以公开测试形式提供 AI Assistant。该智能体可自动完成多步骤常规任务，如 Premiere 分拣素材和粗剪、Photoshop 换背景、Illustrator 批量生成文件、InDesign 更新版式等。Firefly 新增面向个人创作者的品牌套件、产品图转短视频及 Quick Cut 自动剪辑功能。Adobe 工具已集成至 ChatGPT、Claude 及 Microsoft 365 Copilot，Google Gemini 和 Slack 集成即将推出。
来源： The Decoder：AI News（RSS）

7. DeepSeek 识图模式正式上线 App 和网页端

DeepSeek 识图模式于 6 月 18 日在网页和 App 端正式上线，与快速模式、专家模式并列。开启后用户可直接上传图片让 DeepSeek 识别图像，能力超越简单文字提取。目前 App 端仍显示“图片理解功能内测中”，网页端无此提示。该模式背后的多模态模型技术细节于今年 4 月公开，核心框架为“Thinking with Visual Primitives（以视觉原语思考）”。
来源： IT 之家（RSS）

8. 深入解析 Midjourney Scanner 技术内幕

我们全新“Midjourney Scanner”的技术深潜。
来源： X：Midjourney (@midjourney)

行业动态

1. 八部门：用好个人消费贷款财政贴息政策，支持消费者购买 AI 相关产品

商务部等八部门 6 月 18 日发布关于加快“人工智能+消费”发展的实施意见。其中提到加大财政资金支持，落实数码和智能产品购新政策，鼓励地方在消费品以旧换新框架内自主制定补贴，重点支持新一代智能终端消费。增加 AI 手机、智能电脑、智能电视、智能家居、AI 眼镜、智能网联汽车、人形机器人等产品供给，培育智能穿戴消费市场。同时加快 AI 在居家服务、养老服务、文化旅游、住宿餐饮、教育教学等领域的应用，建设 AI 商品首发平台，举办“人工智能进万家”活动。
来源： IT 之家（RSS）

2. Noam Shazeer 离开 Google 加入 OpenAI

两年前谷歌花 27 亿美元请回的 AI 传奇 Noam Shazeer 已离开谷歌，加入 OpenAI。对 Gemini 来说是个残酷的消息。
来源： X：Yuchen Jin (@Yuchenj_UW)

3. 我国首部 L3/L4 自动驾驶强制性国标公示：2027 年 7 月起实施

工信部 6 月 16 日就《智能网联汽车自动驾驶系统安全要求》等 2 项强制性国标公开征求意见，公示至 6 月 24 日，建议 2027 年 7 月 1 日起实施。该标准系我国首部针对 L3/L4 的强制性国标，要求系统安全水平至少达到“合格且专注驾驶人”，引入 Safety Case 机制。L3 重点规范人机交接，L4 强调自身风险处置、不得依赖远程协助。新申请车型实施日起执行，已获批车型有约一年过渡期。
来源： IT 之家（RSS）

4. 伯尼·桑德斯提出 7 万亿美元 AI 计划：对大型 AI 公司征收 50% 股票税

伯尼·桑德斯提出立法，对年 AI 销售额超 2 亿美元的公司征收 50% 股票税，建立价值约 7 万亿美元的主权财富基金。基金每年向每位美国公民发放超 1000 美元股息（5% 年股息），并资助医疗、教育、住房。同时成立由总统提名、参议院确认的两党“民主 AI 独立委员会”，通过投票权阻止公司损害公共利益。法案还要求 AI 公司剥离非 AI 业务。该计划面临共和党国会和特朗普政府阻力。
来源： Ars Technica：AI（RSS）

5. OpenAI IPO 前连下两城：招揽 Transformer 共同作者及前白宫 AI 政策官员

OpenAI 在 IPO 前夕连招两位重量级人物：Google DeepMind AI 先驱、Transformer 架构共同作者 Noam Shazeer，以及前特朗普白宫 AI 政策官员 Dean Ball。Shazeer 此前通过 27 亿美元收购协议重返 Google，此次离职加盟 OpenAI。Ball 将于 7 月 6 日加入，领导新组建的 Strategic Futures 团队，向首席战略官 Jason Kwon 汇报，团队将负责前沿 AI 政策与内部治理，聚焦灾难性风险、递归自我改进、劳动力市场影响及前沿实验室与政府关系等议题。此举正值 Anthropic 因美国政府出口管制禁令被迫下架 Fable 5 和 Mythos 5 模型。
来源： TechCrunch：AI（RSS）

6. AI 数据中心获政府强制电网快车道

美国联邦能源监管委员会（FERC）命令六大电网运营商为数据中心等大型用户提供快速并网通道，数据中心需承担并网费用。FERC 同时要求运营商考虑“替代输电技术”，并在 30 天内报告剩余发电容量、60 天内审查本区域电价。指令并未解决发电容量短缺问题。数据中心电力需求预计到 2035 年增长近三倍，而电网运营商此前长期应对近乎零的需求增长。据 Bloomberg，部分地区批发电价较五年前上涨了 267%。
来源： TechCrunch：AI（RSS）

7. Grok 现集成 Databricks Agent Bricks

Grok 模型现已原生集成到 Databricks Agent Bricks 平台。在 2026 年 Data + AI Summit 上，Databricks 宣布与 SpaceXAI 合作，使 Grok 与其他前沿及开源模型在同一受控平台中可用。Agent Bricks 结合 Lakehouse 数据上下文与控制和选择，帮助工程团队构建处理大规模数据的 AI 智能体。此外，企业也可在 Amazon Bedrock 上运行 Grok 模型。
来源： xAI：News（网页）

论文研究

1. ChatGPT 图像生成器可被绕过滤镜生成暴力和色情内容

Mindgard 红队研究发现，ChatGPT 的图像生成器可通过简单提示词轻易绕过内容过滤器，在未直接请求的情况下自动生成性暴力、血腥谋杀等露骨图像。一个热门的“恢复照片”提示词因输入模糊而绕过输入过滤器，结果如同俄罗斯轮盘赌；进一步添加虚假图像 ID 和“不做审查”指令后，模型持续生成高度性化女性图像，甚至出现被捆绑殴打的尸体，并自动赋予惊悚标题。研究指出，OpenAI 此前声称修复的裸体问题仍未解决，暴露了 AI 工具广泛可及性与不足内容过滤的现实风险。
来源： Hacker News 热门（buzzing.cc 中文翻译）

2. Anthropic Project Fetch 第二阶段：Claude Opus 4.7 自主完成任务，速度比人类团队快约 20 倍

Anthropic 发布 Project Fetch 实验第二阶段结果。在 2024 年 8 月原始实验中，配备 Claude Opus 4.1 的人类团队在操控四足机器人时显著超越无 AI 团队。新实验中，Claude Opus 4.7 无需人类协助即完成所有任务，速度比最快人类团队快约 20 倍，比无 Claude 团队快 37 倍以上，编码量减少近 10 倍。模型在传感器连接、路径规划等环节表现出色，但在精确移动沙滩球等闭环控制任务上仍存在困难。这些进展源于通用模型规模化，而非针对机器人领域的专项优化。
来源： Anthropic：Research（发表成果 · 网页）

3. MosaicLeaks: 你的研究智能体能保守秘密吗？

深度研究智能体在结合私有本地文档与外部网页检索时存在隐私泄露风险。MosaicLeaks 提出包含 1,001 条多跳研究链的新任务，每条链交错混合本地与公共子问题。测试发现智能体频繁泄露私有信息，单纯优化任务性能反而加剧泄露。基于此，研究提出隐私感知深度研究（PA-DR）强化学习训练方法，将严格链成功率从 48.7% 提升至 58.7%，同时将答案/全面信息泄露率从 34.0% 降至 9.9%。
来源： Hugging Face：Blog（RSS）

4. OpenAI 与哈佛等合作研究：o3 Deep Research 模型辅助诊断儿童罕见病，额外诊断率 4.8%

波士顿儿童医院、哈佛大学与 OpenAI 合作，在《NEJM AI》发表研究。团队使用 OpenAI o3 Deep Research 推理模型重新分析 376 例此前未确诊的罕见病案例，产出基于证据的候选解释。经专家评审、额外检测和临床确认，医生在 18 例中建立诊断，额外诊断率达 4.8%。研究显示，AI 辅助工作流可帮助专家在未解病例中生成可检验假设，使定期再分析更具可扩展性。模型不直接诊断或做临床决策，仅提供证据链供专家审查。
来源： OpenAI：官网动态（RSS · 排除企业/客户案例）

5. OpenAI 强化学习实现广泛且持久的有益模型

OpenAI 通过强化学习在真实对话场景中训练模型，使其展现诚实、认知谦逊、元认知透明、可纠正性、普遍公平性和对人类福祉的关心等有益特质。训练数据涵盖健康、教育、科学、法律、工程等多个领域。训练后模型在数十项独立对齐评测（包括奖励黑客、欺骗、有害建议、规范遵从等）上均表现提升，且这种改善泛化到未参与训练的领域、任务和评分设定。在对抗性提示或微调下，模型仍难以被导向有害行为，表明有益特质强化学习可产生广泛且持久的对齐泛化。
来源： OpenAI：Alignment 研究博客（RSS）

技巧与观点

1. AI 智能体够格吗？在自有工具上评测开源模型

Hugging Face 发布面向 AI 智能体使用场景的基准测试框架，以 transformers 库为案例评估库的智能体友好度。框架使用 pi coding agent 与开源模型驱动，通过 Hugging Face Jobs 分散任务确保硬件一致。评估关注 agent 完成任务的成本、延迟、token 使用量和失败率，而非仅最终结果。此前 hf CLI 经优化后 agent token 使用量减少 1.3-1.8 倍（最高 6 倍），该框架旨在验证类似优化对 transformers 的效果。
来源： Hugging Face：Blog（RSS）

2. 驾驭 Claude Code：CLAUDE.md、技能、钩子、规则、子智能体等

Claude Code 提供七种自定义指令方式：CLAUDE.md（根目录始终加载，子目录按需加载）、规则（无范围或路径范围）、技能（按需调用，共享 token 预算）、子智能体（隔离上下文运行并返回最终消息）、钩子（生命周期事件触发，绕过压缩）、输出样式（注入系统提示，永不压缩）和附加系统提示（CLI 标志，仅单次有效）。每种方式在加载时机、压缩行为、上下文成本和适用场景上各有不同，例如 CLAUDE.md 适合存放构建命令与编码规范，路径范围规则避免无关上下文消耗，子智能体用于并行隔离任务，钩子用于确定性自动化（如运行 linter 或备份聊天记录）。
来源： Claude：Blog（网页）

3. 超越 LoRA：如何选择最佳参数高效微调技术？

参数高效微调（PEFT）技术中，LoRA 占据绝对主导：Hugging Face Hub 上 20,834 张提及单一 PEFT 技术的模型卡中 20,509 张指向 LoRA（98.4%）；外部站点 10,000 个检查点中 95.0% 是 LoRA；GitHub 搜索 from peft import 代码片段的 71.3% 结果为 LoRA。但研究者宣称其他技术超越 LoRA 的论文结果具备偏向性——调整学习率即可让 LoRA 匹配更优技术。Hugging Face 的 PEFT 库提供统一 API 实现 40 余种 PEFT 技术，并开始建立基准测试：在数学数据集上对 LLM 进行思维链推理微调，以帮助用户做出更优选择。
来源： Hugging Face：Blog（RSS）

4. Cloudflare 发布多阶段漏洞发现工具，详解对抗性审查与上下文绕过技术

Cloudflare 分享了其多阶段漏洞发现工具的技术架构，包含自动化分类循环。该系统通过管理状态控制、引入对抗性审查来压制误报，并围绕 LLM 上下文窗口限制设计路由策略。
来源： Cloudflare Blog

5. Google 庆祝 A2A 协议发布一周年：协作智能体生态

Google 庆祝 Agent-to-Agent（A2A）协议发布一周年。A2A 专为生成式 AI 设计，相比传统 REST API 提供安全边界、零上下文污染、动态自主性和工作负载分布四大架构优势。应用实例 FoldRun 是一个独立的智能体接口，可在 Gemini Enterprise 或 Gemini CLI 等 A2A 兼容环境中部署，自动管理蛋白质结构预测任务，动态选择 AlphaFold 2、OpenFold 3 或 Boltz-2 等模型，无需自定义胶水代码。
来源： Google Developers Blog（RSS）

6. 埃森哲：昔日与今朝，以及它如何预示未来

埃森哲去年九月高调宣称 AI 将改变其业务，但本季度财报令人失望，股价下跌约 18%，本周跌幅近 23%，较 52 周高点已跌超 50%。生成式 AI 并未带来预期的大幅收益，MIT、麦肯锡、贝恩等多份研究均显示类似结论。Claude Code（特殊神经符号系统，非通用聊天机器人）或能提升程序员生产力，但企业整体 AI 投资回报未达预期，tokenmaxxing 热潮正在消退。
来源： Gary Marcus：The Road to AI We Can Trust（RSS）