
AI 产品更新日报 | 2026.05.29
Groq 拟追加募资 $6.5 亿押注推理云;XCENA $1.35 亿 B 轮押注 AI 内存瓶颈;微软同日曝光 AI 超级应用并上线 Copilot Health 预览;OpenAI 终结 Canvas、Codex 扩展至 Windows;Pinterest 用定制开源模型将 AI 成本削减 90%。
今日概览:Groq 寻求内部追加 $6.5 亿;微软同日双管齐下——AI 超级应用曝光、Copilot Health 开放预览;OpenAI 终结 Canvas、Codex 扩展至 Windows;XCENA 押注"内存才是 AI 真正瓶颈"拿下 $1.35 亿;Pinterest 用定制开源模型将 AI 成本削减 90%。
1. Groq 拟向现有投资方追加募资 $6.5 亿,押注推理云增长
AI 推理芯片公司 Groq 正寻求向现有投资方募集 $6.5 亿新资金,主导方向为面向开发者与企业的推理云(inference neocloud)业务。1
背景:去年 12 月,Groq 与 Nvidia 达成一份价值约 $200 亿的「非收购」协议——部分高管加入 Nvidia、硬件技术授权输出,现有投资人获现金退出;此次新募资的资金将用于扩大推理云规模,而不是重走芯片研发路线。1 据 Axios,现有投资方 Disruptive 和 Infinitium 已承诺兜底,本轮几乎已板上钉钉。目前由临时 CEO Adam Winter 与 CFO Matt Eng 主持大局。
意义:推理成本持续成为 AI 部署的关键变量,Groq 转型推理云正踩在这一需求高点上。
2. XCENA 完成 $1.35 亿 B 轮:押注"内存才是 AI 瓶颈"

韩国芯片创业公司 XCENA 完成 B 轮融资 $1.35 亿(累计 $1.85 亿),估值达 $5.7 亿。本轮由首尔风投机构 Atinum 和 IMM Investment 领投,SBI Investment、Mirae Asset Capital 跟投。2
XCENA 的核心逻辑:当前 AI 最大的瓶颈不是算力,而是数据在 GPU、CPU 与内存之间反复搬运所产生的延迟和功耗。其 MX1 芯片通过 CXL 接口连接 CPU,让数据在离开内存模块前就完成预处理和 KV 缓存管理,宣称可把原来需要 10 台服务器的负载压缩到 1 台。芯片核基于 RISC-V 架构,由三星代工,量产版预计 2026 年底下线、2027 年开始产生收入。2
意义:不同于众多 NPU 厂商争抢 Nvidia 主导的训练市场,XCENA 切入所有 AI 业务底层都要碰的内存密集型环节,一旦规模化将直接影响 hyperscaler 的基础设施成本。
3. 微软双管齐下:AI 超级应用曝光 + Copilot Health 上线预览

AI 超级应用(预披露)
据《财富》报道,微软正开发一款 AI"超级应用",计划将 GitHub Copilot、Copilot 聊天机器人、Copilot Cowork,以及内部代号为「Autopilot」的全新代理工作流能力整合进同一入口。3 该产品可能将在下周的微软 Build 2026 大会上亮相,对标 OpenAI 旗下 ChatGPT 的「超级应用」战略。
Copilot Health 开放预览
3 月首次公布的 Copilot Health 今日向 Microsoft 365 订阅用户开放预览,支持连接用户的医疗记录、可穿戴设备数据及 Apple Health 等第三方应用,提供个性化健康洞察并辅助查找医生。4 此举与 OpenAI 和 Anthropic 此前推出的健康 AI 模型方向高度吻合。官方公告见微软 Copilot 博客。4
4. OpenAI:Canvas 下线,Codex 扩展至 Windows
Canvas 停用
OpenAI 宣布终止 ChatGPT 的 Canvas 界面——这一支持用户与模型并排编辑代码或文本的功能将不再出现在 GPT-5.5 Instant 和 GPT-5.5 Thinking 上,订阅用户仍可在「有限时间内」通过旧版模型访问。5 同时 OpenAI 对 GPT-5.5 Instant 做了响应格式优化:缩短回复长度、减少项目符号滥用,让输出更易阅读。
Codex 计算机控制扩展至 Windows
此前仅限 macOS 的 Codex computer use 功能今日登陆 Windows,用户可通过 ChatGPT 应用让 Codex「看见」屏幕并在设备上执行任务,也可在离开电脑时远程管理和查看 Codex 的任务进度。6
콘텐츠 카드를 불러오는 중…
5. Pinterest 用定制开源模型将 AI 成本削减 90%
Pinterest CTO Matt Madrigal 披露,该公司为旗下对话式购物助手 Navigator 1 定制了 Qwen3-VL——核心做法是「抽掉」Qwen 原有的视觉编码层,替换为 Pinterest 自研的多模态 embedding,从而让视觉向量可离线预计算并定期重训,而不是在每次推理时实时调用并编码。7
结果:AI 成本削减 90%,推理准确率提升 30%,推理延迟从同类方案的 20 倍基准大幅压缩。面向 6.2 亿月活用户,这套架构还支撑了 Pinterest 的「taste graph」——一个追踪用户不断演变偏好的动态图谱,将灵感发现转化为购买意图。7
对行业的启示:在前沿闭源 API 价格战的背景下,深度定制开源模型(尤其是 Apache 许可的开放权重)正在成为大规模消费级 AI 产品的竞争筹码。
今日速览
| 公司 | 事件 | 要点 |
|---|---|---|
| Groq | 拟募 $6.5 亿 | 现有投资方跟投,押注推理云增长 |
| XCENA | B 轮 $1.35 亿 | 内存计算芯片,估值 $5.7 亿 |
| 微软 | AI 超级应用曝光 | 整合 Copilot 系列 + Autopilot,或在 Build 亮相 |
| 微软 | Copilot Health 预览 | M365 用户可连接医疗记录与可穿戴数据 |
| OpenAI | Canvas 停用 | GPT-5.5 系列不再支持,旧模型延续有限时间 |
| OpenAI | Codex 扩展至 Windows | computer use 功能跨平台落地 |
| 开源模型定制 | 成本降 90%、准确率升 30% |

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.