AI 日报|2026-05-31|Nano Banana Pro 与 Nano Banana 2 正式发布|Show HN: Tiny-vLLM——基于 C 和 CUDA 的高性能大型语言模型推理引擎

0 条回复
28 次浏览

AI 热点日报(2026-05-31)

模型发布/更新

1. Nano Banana Pro 与 Nano Banana 2 正式发布

ICYMI:Nano Banana Pro [gemini-3-pro-image] 和 Nano Banana 2 [gemini-3.1-flash-image] 现已正式发布,可通过 Gemini API 投入生产使用。 查看这些优秀的社区示例,了解两个模型的实际能力 🧵
来源: X:Google AI for Developers (@googleaidevs)

2. 小即是美:开源多模态模型发布

小即是美。😌
来源: X:阶跃星辰 StepFun (@StepFun_ai)

产品发布/更新

1. Show HN: Tiny-vLLM——基于 C 和 CUDA 的高性能大型语言模型推理引擎

Tiny-vLLM 是一个用 C 和 CUDA 编写的高性能大语言模型推理引擎,项目代码已开源至 GitHub。
来源: Hacker News 热门(buzzing.cc 中文翻译)

行业动态

1. xAI 放弃 JAX GPU 转向自研训练框架

突发新闻:JAX NVIDIA GPU & XLA:GPU 最大客户刚刚宣布已放弃 JAX GPU,宁愿用 Grok Build“氛围编程”一个 C 训练框架。据报道 xAI 的 JAX 堆栈 MFU 低于 10%。NVIDIA JAX 团队过去两年全部主力 996 专注于支持 xAI 却失败了,我想他们现在可以休息并兑现期权了。
来源: X:SemiAnalysis (@SemiAnalysis_)

2. AI 骗子正在创建虚假的黑人形象来销售 Shein 劣质商品

有卖家利用 AI 生成虚假的黑人形象,在 TikTok、Facebook 和 Instagram 上扮演手工制品创作者进行销售。例如一个名为 Aliyah 的 AI 生成形象,以带泪诉说的方式售卖所谓手工皮带扣,但该形象及其产品均为虚构。此类 AI 虚拟网红被用于推广通过代发货模式销售的批量生产品。
来源: The Verge:AI(RSS)

3. 新加坡防务论坛:AI 风险超过核武器

在新加坡举行的防务论坛上,专家警告 AI 风险已超越核武器。面板讨论指出,AI 可能大幅压缩反应时间,导致决策者做出草率决定,对战略稳定构成威胁。
来源: Bloomberg:Technology(RSS)

4. 据报道:软银将在法国投资 750 亿欧元用于 AI

软银集团计划投资高达 750 亿欧元(约合 870 亿美元),用于在法国建设人工智能数据中心。该投资计划由《论坛报》与《金融时报》报道。
来源: Bloomberg:Technology(RSS)

5. “开玩笑吧”:GitHub Copilot 新的基于 token 的计费模式引发开发者不满

微软旗下 GitHub Copilot 的黄金时代似乎正在终结。其新推出的计费模式改为按 token 计量,这一变化引发了开发者的广泛担忧与不满。
来源: TechCrunch:AI(RSS)

6. 阿里云与 Qwen 成为 UEFA 多年全球 AI 合作伙伴

阿里云和 Qwen 成为 UEFA 官方独家 AI、云计算与电子商务合作伙伴,合作期覆盖 2027/2028 赛季至 2032/2033 赛季的 UEFA 男子俱乐部赛事,以及 UEFA EURO 2028。阿里巴巴集团主席蔡崇信表示,将投入云计算、全栈 AI 及全球电商平台能力,支持赛事运营。合作将利用 Qwen 大语言模型部署先进 AI 技术,增强球迷互动与媒体内容体验,并依托阿里云基础设施打造全球沉浸式观赛体验。
来源: X:阿里云 / Alibaba Cloud (@alibaba_cloud)

技巧与观点

1. NVIDIA 或将于六月发布整合 Blackwell GPU 与 AI 单元的 ARM 笔记本芯片 N1X

NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。
来源: X:阿易 AI Notes (@AYi_AInotes)

2. 免费领取 6 个月 ChatGPT Pro 及 AI 工具思考

OpenAI 为开源项目维护者提供福利,可免费领取 6 个月 ChatGPT Pro(价值$1200),申请无硬性 Star 数要求,有项目链接即可。同时,文章引用讨论了 AI 工具的分类:一类是“agent 型”(如 Claude Code、Codex),可自主运行;另一类是“实习生型”(如 Cursor),需人工决策,有助于使用者以术入道、培养判断力,但受限于需人在场。作者推荐了网易的 UU 远程工具,称其免费两年,支持 4K 144 帧无延迟连接 Mac 并可使用原生终端,解决了“实习生型”工具的地点限制问题。
来源: X:阿易 AI Notes (@AYi_AInotes)

3. 在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用

作者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用。此前的 Datasette Lite 使用 Web Workers,但无法执行 <script> 标签中的 JavaScript。新方案由 Claude Opus 4.8 协助完成开发,解决了这一问题。作者已展示了基础的 ASGI FastCGI 演示和运行 Datasette 1.0a31 的演示,并计划后续将此方法应用于升级 Datasette Lite。
来源: Simon Willison 博客

4. 随着成本飙升,美国企业开始对人工智能实施配给

由于运行和使用 AI 工具的成本持续飙升,美国企业正开始对人工智能的使用实施配给制。企业通过限制使用量、设置分层级审批流程等方式控制开支,以应对 AI 费用增长过快的问题。这种从广泛采用转向精细化管理的策略,标志着企业在 AI 应用上从追求速度转向注重成本效益。
来源: Hacker News 热门(buzzing.cc 中文翻译)

5. 最后一次技术面试

Steve Yegge 在 Medium 发表观点文章《最后一次技术面试》,探讨 AI 时代传统技术面试的意义变化。文章在 Hacker News 社区获得 100 分关注。
来源: Hacker News 热门(buzzing.cc 中文翻译)

发表一个评论

R保持