最新AI资讯

73

追踪 AI 领域的关键产品、研究、工程与商业动态。先看信号,再按主题或人物筛选细节。

Follow Builders 信息源33

X 上的 AI 建造者 · 25

播客 · 6

官方博客 · 2

今天
2026-05-25
FPV Ventures partner Nikunj Kothari· 三日简报
5月25日X

Claude Code 被用于发现网页背后的 API 与自动化入口

FPV Ventures partner Nikunj Kothari 分享了用 Claude Code 配合 browser harness 或 Playwright 观察网络请求,再识别 API 结构、认证方式与 rate limit 的自动化方法。他据此提出,网站未来可能需要面向 agent 暴露类似 `tools.txt` 的能力描述。这反映出 coding agent 的应用边界正在从生成代码扩展到理解和编排已有在线工具。

Box CEO Aaron Levie· 三日简报
5月25日X

企业采用 Agent 的真正难点在最后一公里

Box CEO Aaron Levie 认为,企业领导者很容易从 AI 的顺利 demo 推导出过度宽泛的结论,却没有承担代码进入生产前的复核、合同发出前的校验,以及既有系统接入等后续工作。他主张管理者应高频实际使用 AI,以同时理解 agent 的上限和将结果变成持续业务价值所需的真实成本。

昨天
2026-05-24
Roblox Product Peter Yang· 三日简报
5月24日X

单人创业者先搭建制造 MVP 的 Agent 系统

Roblox Product Peter Yang 分享 Ryan Carson 的单人创业工作流:OpenClaw 承担邮件、日程与销售外联,Codex 和 Devin 承担部分工程任务,skills 与文档用于让 agent 持续复用上下文。Ryan 的核心取向是先建立“能够制造 MVP 的系统”,并表示即便已经完成融资,也不会急于扩大招聘规模。

Anthropic Claude Code 团队 Thariq· 三日简报
5月24日X

旧代码库可能成为 AI 重构软件的蒸馏材料

Anthropic Claude Code 团队的 Thariq 从 Bun rewrite 得出的观察是,legacy codebase 可能成为将软件“蒸馏”为新形态的有价值素材,例如转向跨平台或 Web 运行。他同时补充,当前 model 还没有完全达到这个阶段,Bun 极强的可验证性与测试覆盖是这类实践成立的重要条件。

Y Combinator CEO Garry Tan· 三日简报
5月24日X

Garry Tan 称数小时完成 Qwen3.5-397B fine-tuning

Y Combinator CEO Garry Tan 表示,自己通过 Thinking Machines 在数小时内完成了一个 Qwen3.5-397B model 的 fine-tuning,并将其与快速、可用的多模态能力联系到个人 AI 的潜力。这里更值得关注的信号是,大模型定制正在被 builder 讨论为可在短周期内实践的产品能力,而不再只是大型研究团队的流程。

Vercel CEO Guillermo Rauch· 三日简报
5月24日X

Builder 社群开始用可运行产品检验 AI 开发工具

Vercel CEO Guillermo Rauch 邀请开发者提交最满意的 AI 构建产品,并注明主要使用的 model 或 agent。随后他称自己处理了 1400 条回复,其中 Codex 被提及的次数超过 Claude Code,OpenAI 在相关讨论中正追近 Anthropic。这不是市场份额统计,但显示 builder 的比较维度正在从口头能力转向能否交付真实产品。

Box CEO Aaron Levie· 三日简报
5月24日X

自动化任务不等于消灭岗位,AI 价值讨论转向工作扩容

Box CEO Aaron Levie 认为,把 AI 完成单项任务直接等同于岗位消失,是对企业工作结构的误读。其判断是:当编码、法务、销售或营销中的部分任务成本降低,工作可能转向更高质量、更大规模或尚未自动化的部分,小企业也会因此有能力启动过去负担不起的项目。

5月23日 周六
2026-05-23
Y Combinator CEO Garry Tan· 三日简报
5月23日X

GBrain 接入 Gemini Live,个人 AI 增加语音 Agent 入口

Y Combinator CEO Garry Tan 表示,GBrain v0.40.0 已为 OpenClaw/Hermes Agent 与 GBrain 加入基于 Gemini Live 的语音 Agent,强调大 context、tool use 与个人知识访问。这个更新提供了一个具体方向:个人 AI 不只等待文本指令,而是开始以语音入口连接已有 agent 工作流。

Box CEO Aaron Levie· 三日简报
5月23日X

AI 发现漏洞之后,安全修复成为新的瓶颈

Box CEO Aaron Levie 从 Mythos 更新中提炼出的判断是:AI 会让发现安全问题变得更容易,但审核、响应与真正修复漏洞仍依赖工程师的判断。值得关注的变化不是安全工程被自动化消失,而是问题发现速度上升后,修复与处置能力可能成为更稀缺的环节。

5月22日 周五
2026-05-22
Zara Zhang · Builder· 日报
5月22日X

AI 原生团队的角色边界正在重画

Zara Zhang 提到,在 AI-native team 里,IC 要开始像 manager 一样思考:如何把任务委派给 agent、如何设标准、如何验收输出;manager 则要更像 IC:更 hands-on 地参与建造,而不只是做人管人。这是 AI agent 进入团队工作流后很关键的组织变化信号。

Google Labs · Google 实验性 AI 项目官方· 日报
5月22日X

Google Project Genie 面向 AI Ultra 用户全球开放

Google Labs 宣布 Project Genie 已面向 Google AI Ultra 订阅用户全球开放。Genie 的定位是从玩游戏走向几分钟内设计游戏:选择角色、设定场景,由模型生成可交互世界。这代表 Google 继续把世界生成、游戏生成和多模态创作推向消费级入口。

Garry Tan · Y Combinator 总裁· 日报
5月22日X

AI Agent 的搜索基础设施继续升温

Garry Tan 和 Swyx 都提到 Exa 在 agent web search 场景里的表现。Garry Tan 说 YC 在自己的 OpenClaw 和 Hermes agents 中使用 Exa;Swyx 则提到团队做过 Exa 与竞品 bake-off 后快速达成一致。趋势很清楚:agent 要可靠工作,搜索和检索层会变成关键基础设施。

Sam Altman · OpenAI CEO· 日报
5月22日X

OpenAI 强调 AGI 加速研究、公司和个人目标

Sam Altman 提到 OpenAI 当前最兴奋的三件事:AGI accelerating research、AGI accelerating companies、personal AGI accelerating everyone。结合他关于通用模型解决数学开放问题的表述,OpenAI 的叙事正在从模型能力提升转向 AI 作为研究与组织加速器。

Anthropic Engineering· 日报
5月22日博客

Claude Code 推出 Auto Mode,试图解决 Agent 权限疲劳

Anthropic Engineering 发布 Claude Code auto mode。核心问题是:手动审批太多会让用户习惯性点击同意,而 --dangerously-skip-permissions 又过于危险。Auto Mode 的方向是在高自主性和低安全风险之间做新平衡,让 Claude Code 能更连续地执行任务,同时减少误删分支、误触生产数据库、泄露 token 等 agentic misbehavior。

Dan Shipper · Every CEO· 日报
5月22日X

MCP、API、SDK 基础设施成为热点

Anthropic 收购 StainlessAPI,Stainless 做 API、SDK 和 MCP server 基础设施,客户包括 OpenAI 和 Google。MCP 协议正在成为 AI 工具连接的标准层。

Claude Blog· 日报
5月22日博客

Claude Managed Agents 连续更新,Agent 平台化加速

Anthropic 围绕 Claude Managed Agents 发布 dreaming、outcomes、multiagent orchestration、memory、self-hosted sandboxes、MCP tunnels 等更新。核心方向是让 agent 能长期执行任务、跨 session 学习、在企业自己的环境中运行工具,并连接私有 MCP 服务。

Andrej Karpathy · AI 教育者· 日报
5月22日X

Karpathy 加入 Anthropic

Andrej Karpathy 宣布加入 Anthropic,未来几年会重新回到 LLM 前沿 R&D 工作。这强化了 Anthropic 在基础模型研究和顶级研究人才上的声势,也让 AI 自我加速研发成为更值得关注的主线。

5月21日 周四
2026-05-21
Anthropic Engineering· 博客
5月21日博客

Effective Context Engineering:Anthropic 发布 AI Agent 上下文工程指南

Anthropic Engineering 发布《Effective Context Engineering for AI Agents》深度指南。从 prompt engineering 到 context engineering,这篇文章系统总结了如何为 Agent 构建高质量的上下文——包括信息检索策略、工具设计原则和多轮对话中的上下文管理。是 Agent 开发者的必读工程实践文档。

Swyx · AI 工程师· 日报
5月21日X

Local-first 技术栈重新进入 AI 应用讨论

Swyx 认为某个 local-first stack 已经赢下了 fast apps fast 的方向。放在 AI 应用里看,local-first 不只是前端体验问题,也关系到 agent 状态、离线可用、同步冲突和用户数据控制。随着 AI 工具从 demo 走向日常生产,底层应用架构会重新变重要。

Ryo Lu · AI 产品设计师· 日报
5月21日X

AI 软件协作开始强调 team workflow

Ryo Lu 提到 new model、interface、sdk、automations with your team,指向 AI 软件工具的一个重要方向:不只是个人提高效率,而是把模型、界面、自动化和团队协作放在同一个工作流里。AI-native 产品会越来越围绕团队执行而不是单人 prompt 展开。

Claude · Anthropic 旗下的 AI 助手· 日报
5月21日X

Claude Design 继续预热,AI 设计生成进入 Claude 入口

Claude 官方账号连续展示 Claude Design,并询问用户正在用它做什么。这个信号值得注意:Claude 的产品边界正在从聊天、代码和 agent 扩展到设计生成与视觉表达,AI 助手的工作台属性更强。

Google Labs · Google 实验性 AI 项目官方· 日报
5月21日X

Google Labs 展示 I/O 后的新实验:Stitch 与 Project Genie

Google Labs 在 5 月 21 日继续展示 I/O 之后的实验组合:Stitch 生成网站体验、Labs 实验被做成小游戏,并用 Project Genie 把 Labster 带到 Grand Canyon。Google 正在把 AI 创作从单点工具扩展为可玩、可展示、可 remix 的实验场。

The MAD Podcast with Matt Turck· 日报
5月21日播客

OpenAI 后训练负责人谈 AI 进展为何突然变真实

The MAD Podcast 采访 OpenAI Post-Training Frontiers 负责人 Yann Dubois,讨论 GPT-5.5、模型可靠性、test-time compute、真实工作场景中的强化学习,以及为什么最近 AI 进展开始像阶跃一样被感知。核心判断是:当可靠性跨过阈值,模型就不再只是 demo,而会进入真实工作流。

Sam Altman · OpenAI CEO· 日报
5月21日X

OpenAI 新版 Codex 发布

Sam Altman 在 5 月 21 日表示 new Codex ships today。结合 OpenAI 近期对 Codex 的持续投入,AI 编程工具正在从代码补全进一步走向任务执行、代理式协作和开发流程自动化。

5月20日 周三
2026-05-20
Anthropic Engineering· 三日简报
5月20日博客

Anthropic 扩大 frontier AI 社会对话,纳入宗教、哲学和伦理群体

Anthropic 发布 Widening the conversation on frontier AI,表示过去几个月已与 15 个以上宗教、跨文化、哲学和伦理群体展开对话。对 frontier AI 公司来说,安全不再只是技术评测,也越来越涉及制度、社会和价值判断。

Anthropic Engineering· 三日简报
5月20日博客

Anthropic 与 KPMG 达成全球联盟,Claude 进入 27.6 万员工工作流

Anthropic 宣布与 KPMG 建立战略联盟,将 Claude 嵌入 KPMG Digital Gateway,并向全球 276,000 多名员工开放。企业 AI 的竞争正在从买模型走向把模型嵌进核心业务软件和行业流程。

Google Labs· 三日简报
5月20日X

Project Genie 继续扩展,AI 世界模型进入消费级入口

Google Labs 在 5 月 20 日继续展示 Project Genie,让用户通过角色、场景和提示生成可交互世界。这个方向代表多模态生成正在从生成图片/视频走向生成可探索环境,游戏、教育和模拟训练都会受影响。

Google· 三日简报
5月20日X

Gemini App 变得更主动:Gemini Spark、Daily Brief、Omni 成为重点

Google 宣布 Gemini app 进入更 agentic 的阶段:新 UI、主动 daily briefs、Gemini Spark 个人代理,以及 Gemini Omni 的多模态生成能力。Google 的方向很明确:把 Gemini 从问答助手推向 24/7 的个人行动代理。

Google· 三日简报
5月20日X

Google I/O 2026:Gemini 3.5 Flash 发布,主打 agentic workflows

Google 在 I/O 期间发布 Gemini 3.5 系列,先推出 3.5 Flash。官方强调它面向复杂、长程的 agentic workflow,在编码、工具调用、多模态理解和企业任务自动化上提升明显。Gemini 3.5 Flash 已进入 Gemini app、AI Mode、AI Studio、Android Studio 和企业平台。

Axios· 三日简报
5月20日X

Karpathy 加入 Anthropic,进入 Claude 预训练团队

Andrej Karpathy 于 5 月 19 日宣布加入 Anthropic。Axios 报道称,他将加入 Claude 的 pre-training 团队。这件事说明 frontier lab 的竞争重点仍然在底层模型能力,同时也强化了 Anthropic 在顶级研究人才上的吸引力。

OpenAI· 三日简报
5月20日X

OpenAI 通用推理模型解决离散几何开放问题

OpenAI 宣布,一个通用推理模型推翻了离散几何中关于 unit distance problem 的核心猜想。重点不只是数学突破,而是这个结果来自通用模型,不是专门为该问题训练的数学系统。这是 AI 进入前沿科研工作的强信号。

AI & I by Every· 播客
5月20日播客

Agent 驱动的商业新时代:Stripe 谈 AI 支付与欺诈检测

AI & I 邀请 Stripe 团队讨论 Agent 驱动经济的基础设施需求。核心话题:AI 公司的增长速度远超顶级 SaaS 公司、结果导向计费正在取代按席位定价、Stripe 如何将欺诈检测从结账环节扩展到全客户生命周期。当购买者变成 Agent,支付和商业基础设施都需要重新设计。

Latent Space· 播客
5月20日播客

Notion 联合创始人谈知识工作 AI Agent 的产品化

Latent Space 邀请 Notion 联合创始人兼 AI 负责人,揭幕 Notion 终于推出的知识工作 AI Agent 功能。讨论了从概念验证到产品化的漫长过程、知识工作 Agent 的产品设计挑战、以及如何在保持用户体验的同时让 AI 真正理解用户的文档和工作上下文。

5月19日 周二
2026-05-19
Claude Blog· 博客
5月19日博客

KPMG 将 Claude 整合到核心业务和全员工作流

KPMG 宣布将 Claude 整合到其核心业务和全体员工工作流中。这是四大审计公司中最大规模的 AI 部署之一,标志着 AI 从「试点项目」正式进入专业服务行业的生产级应用。对 Anthropic 而言,这是企业客户采纳 AI 助手的重要里程碑。

No Priors· 播客
5月19日播客

SAP CTO 谈将企业级软件「操作系统」带入 AI 时代

No Priors 邀请 SAP CTO Philipp Herzig 讨论:50 年前定义企业软件标准的 SAP,如何在经历了从大型机到移动端的技术变迁后,推动 AI 时代的转型。核心挑战不是技术本身,而是如何在一个全球最复杂的企业软件体系中嵌入 AI 能力,同时保持向后兼容和稳定性。

Google· 日报
5月19日X

Gemini Neural Expressive 全面改版上线

Gemini app 基于 Neural Expressive 设计语言全面改版,加入流动动画、新字体和触觉反馈。同时上线 Daily Brief 功能,自动整合邮件、日历和任务,生成个性化的每日摘要。Gemini Live 现在内联打开,打字和语音对话无缝切换。

Google· 日报
5月19日X

Google 推出 AI Ultra 订阅,月费 100 美元

Google 推出 AI Ultra 订阅计划,月费 100 美元,面向开发者、创作者和高级用户。包含 Gemini Spark agent、最高级模型访问和优先功能。AI 订阅经济的定价正在从 20 美元/月的基础层扩展到 100 美元/月的专业层。

Google· 日报
5月19日X

Android XR 智能眼镜正式发布,秋季上市

Google 在 I/O 上发布 Android XR 智能眼镜,三星和 Gucci 型号将于秋季上市。眼镜内置 Gemini,支持实时翻译、信息叠加和拍照识别。AI 硬件不再是概念验证,而是正在成为 Google 产品矩阵中与手机、手表并列的第三个入口。

Google· 日报
5月19日X

Gemini Omni:Google 发布视频生成模型

Google 在 I/O 上发布 Gemini Omni 视频生成模型,支持在 Gemini app 和 Flow 创作工具中生成和编辑视频。结合 Flow 新推出的角色一致性、场景一致性和视频到视频编辑功能,Google 正在把 AI 视频从实验推向制作级工作流。

Google· 日报
5月19日X

Gemini Spark:Google 的 24/7 个人 AI Agent

Google 发布 Gemini Spark,定位为 24/7 个人 AI agent,运行在 Gemini 3.5 和 Antigravity 上,能在后台执行长程任务。Google 的方向很明确:把 Gemini 从问答助手推向持续工作的行动代理。AI 助手的竞争正在从「谁更聪明」转向「谁能持续为你做事」。

Google· 日报
5月19日X

Google I/O 2026:Gemini 3.5 Flash 发布,主打 agentic workflows

Google 在 I/O 期间发布 Gemini 3.5 系列,先推出 3.5 Flash。官方强调它面向复杂、长程的 agentic workflow,在编码、工具调用、多模态理解和企业任务自动化上提升明显。Gemini 3.5 Flash 已进入 Gemini app、AI Mode、AI Studio、Android Studio 和企业平台。

5月18日 周一
2026-05-18
Claude Blog· 博客
5月18日博客

Claude Managed Agents 支持 Memory:Agent 获得跨会话学习能力

Claude 平台发布 Managed Agents Memory 公测版。Agent 现在可以跨会话保留记忆——基于文件系统的记忆存储、API 控制、审计日志和可迁移存储。这意味着企业级 Agent 不再是「一次性」工具,而是能随着使用积累经验的长期助手。对构建长时间运行的 Agent 应用是关键基础设施升级。

Unsupervised Learning· 播客
5月18日播客

AI 基础设施趋于稳定?Swyx 谈编程 Agent 的下一步

Unsupervised Learning Ep 85:Jacob Effron 与 Swyx(Shawn Wang)对谈,讨论 AI 基础设施是否已经趋于稳定、基础模型的「感觉转变」、以及编程 Agent 的未来方向。Swyx 身兼 AI 工程师、播客主持人和 Cognition 运营者三重身份,对 AI 生态的观察兼具建设者和社区组织者的视角。

Josh Woodward · Google VP· 日报
5月18日X

Google I/O 前夜:Gemini 3.5、Spark 和智能眼镜预期

Google I/O 2026 前夜,多个渠道确认 Gemini 3.5 系列模型、代号 Spark 的个人 AI agent 以及 Android XR 智能眼镜将在主题演讲中亮相。Google 正在从模型发布转向构建完整的 AI 产品矩阵:从基础设施到消费级应用全覆盖。

Axios· 日报
5月18日X

Axios 独家:Karpathy 将加入 Anthropic 预训练团队

Axios 报道 Andrej Karpathy 将加入 Anthropic 的 Claude pre-training 团队。Karpathy 是 OpenAI 联合创始人、前 Tesla AI 总监,他的去向一直是 AI 人才竞争的风向标。这件事说明 frontier lab 的竞争重点仍在底层模型能力,也强化了 Anthropic 在顶级研究人才上的吸引力。

5月17日 周日
2026-05-17
Reuters· 三日简报
5月17日X

Anthropic Mythos 引发金融稳定层面的安全讨论

Reuters 5 月 17 日报道,Anthropic 将向 Financial Stability Board 介绍 Mythos Preview AI 模型发现的全球金融系统网络漏洞。重点是:前沿模型不只是提高防御能力,也可能让漏洞发现能力进入宏观金融风险讨论。AI 安全议题正在从模型评测扩大到金融监管和关键基础设施稳定性。

9to5Google· 三日简报
5月17日X

Gemini App 开始测试 Extended Thinking 与更多第三方集成

9to5Google 在 5 月 17 日报道,Gemini app 正在有限测试 Thinking level 菜单,用户可在 Standard 和 Extended 之间选择;同时支持文档显示 Gemini 正准备加入 Canva、Instacart、OpenTable 等更多第三方 app 集成。这说明消费端 AI 助手正在同时走向更可控的推理深度和更广的行动入口。

OpenAI Academy· 三日简报
5月17日X

Codex 进入数据科学团队的日常分析工作

OpenAI Academy 在 5 月 15 日发布面向数据科学团队的 Codex 工作流:把仪表盘、指标定义、导出数据、实验记录和业务上下文整理成可审阅的分析资产。Codex 的定位正在从写代码扩展为生成 root-cause brief、impact readout、KPI memo 和 dashboard spec 等业务交付物。

OpenAI· 三日简报
5月17日X

OpenAI 与马耳他合作,向全民提供 ChatGPT Plus

OpenAI 和马耳他政府在 5 月 16 日宣布全球首个国家级合作:向所有马耳他公民推出 ChatGPT Plus,并配套 AI literacy 课程。这个案例的意义不只是用户增长,而是把 AI 当作公共基础设施来部署,类似电力和互联网那样普惠化。

OpenAI· 三日简报
5月17日X

Databricks 将 GPT-5.5 带入企业 Agent 工作流

OpenAI 与 Databricks 在 5 月 15 日宣布,Databricks 将 GPT-5.5 用于客户企业 Agent 工作流。GPT-5.5 在 Databricks 的 OfficeQA Pro 企业文档任务基准上达到新 SOTA,在 agent-harness 设置下相较 GPT-5.4 错误减少 46%,首次超过 50% 准确率。企业 Agent 的竞争正在转向复杂文档、长上下文和可验证推理。

OpenAI· 三日简报
5月17日X

ChatGPT 推出个人金融体验预览

OpenAI 在 5 月 15 日面向美国 Pro 用户发布 ChatGPT 个人金融体验预览。用户可以通过 Plaid 安全连接金融账户,在 ChatGPT 中查看支出、账单、订阅、净资产和投资信息,并基于自己的财务上下文提问。关键变化是:ChatGPT 正在从通用问答进入高敏感、强上下文的个人决策场景。

5月16日 周六
2026-05-16
Anthropic Engineering· 日报
5月16日博客

Anthropic 扩大 frontier AI 社会对话范围

Anthropic 发布 Widening the conversation on frontier AI,表示已与 15 个以上宗教、跨文化、哲学和伦理群体展开对话。对 frontier AI 公司来说,安全不再只是技术评测,也越来越涉及制度、社会和价值判断。

Swyx · AI 工程师· 日报
5月16日X

Swyx 讨论 local-first 技术栈与 AI 应用的结合

Swyx 认为 local-first stack 已经赢下了 fast apps fast 的方向。放在 AI 应用里看,local-first 不只是前端体验问题,也关系到 agent 状态、离线可用、同步冲突和用户数据控制。随着 AI 工具从 demo 走向日常生产,底层应用架构会重新变重要。

OpenAI· 日报
5月16日X

ChatGPT 推出个人金融体验预览

OpenAI 面向美国 Pro 用户发布 ChatGPT 个人金融体验预览。用户可通过 Plaid 安全连接金融账户,在 ChatGPT 中查看支出、账单、净资产和投资信息。ChatGPT 正在从通用问答进入高敏感、强上下文的个人决策场景。

5月15日 周五
2026-05-15
Unsupervised Learning· 播客
5月15日播客

Yann LeCun:LLM 不是 AI 的终局,JEPA 世界模型才是未来

Redpoint 的 Unsupervised Learning 节目邀请 Yann LeCun 挑战 LLM 主导地位。LeCun 介绍 JEPA 世界模型架构,讨论 AMI Labs 的创立,认为行业将在 2027 年初认识到范式转变的必要性。他还澄清了自己在 Meta 的角色(对 Llama 零技术影响),并解释为什么选择巴黎而非硅谷创立新实验室。

Latent Space· 播客
5月15日播客

Abridge CEO 谈医疗 AI:从临床记录到临床智能层

Latent Space 邀请 Abridge CEO Shivdev Rao 深度讨论医疗 AI 的演进。核心观点:医疗对话可能是最重要的工作流数据,Abridge 正从「环境抄写员」升级为「临床智能层」——不只节省医生 10-20 小时/周的文书时间,更在实时辅助决策。当 AI 从后台介入变成前台智能,医疗行业的每一个环节(患者、支付方、药企)都将受益。

OpenAI· 日报
5月15日X

Databricks 将 GPT-5.5 带入企业 Agent 工作流

OpenAI 与 Databricks 宣布将 GPT-5.5 用于客户企业 Agent 工作流。GPT-5.5 在 OfficeQA Pro 企业文档任务上相较 GPT-5.4 错误减少 46%,首次超过 50% 准确率。企业 Agent 的竞争正在转向复杂文档、长上下文和可验证推理。

OpenAI· 日报
5月15日X

OpenAI 与马耳他达成全球首个国家级 AI 合作

OpenAI 和马耳他政府宣布全球首个国家级合作:向所有马耳他公民推出 ChatGPT Plus,并配套 AI literacy 课程。这个案例的意义不只是用户增长,而是把 AI 当作公共基础设施来部署,类似电力和互联网那样普惠化。

OpenAI Academy· 日报
5月15日X

OpenAI Academy 发布 Codex 数据科学工作流

OpenAI Academy 发布面向数据科学团队的 Codex 工作流:把仪表盘、指标定义、实验记录和业务上下文整理成可审阅的分析资产。Codex 的定位正在从写代码扩展为生成 root-cause brief、impact readout 和 KPI memo 等业务交付物。

5月14日 周四
2026-05-14
Claude Blog· 博客
5月14日博客

Claude 发布新宪法:从原则列表到有机价值体系

Anthropic 发布 Claude 的新版「宪法」(Constitution),从之前的原则列表升级为更有层次的价值体系。新宪法融合了自 2023 年以来 Constitutional AI 训练的实践经验,不再是孤立的规则条目,而是更有机、更连贯的行为准则。这标志着 AI 对齐方法从「规则约束」走向「价值内化」。

Amjad Masad · Replit CEO· 日报
5月14日X

Amjad Masad 谈 Replit 的 AI 编程民主化路径

Amjad Masad 分享了 Replit 在 AI 编程工具上的最新进展。当模型能力足够强、部署成本持续下降时,编程的门槛不再是对语言的掌握,而是对问题的定义能力。Replit 的路径验证了一个判断:AI 编程工具的最大价值不是加速程序员,而是让非程序员也能构建可运行的产品。

Anthropic Engineering· 日报
5月14日博客

Claude Code Remote Control 支持服务器端运行

Anthropic 扩展 Claude Code Remote Control 功能,允许在服务器和 CI 环境中无需本地终端即可运行。配合此前发布的 auto mode 和 MCP tunnels,Claude Code 正在从本地开发助手变成可以在任何基础设施上运行的 agent runtime。

Google Labs · Google 实验性 AI 项目官方· 日报
5月14日X

Google Stitch 设计工具进入公开测试

Google Labs 的 AI 设计工具 Stitch 进入公开测试阶段,支持流式内联编辑和品牌一致性。结合 Ryo Lu 关于 AI 软件协作强调 team workflow 的讨论,AI 设计工具正在从个人效率工具变成团队协作平台。

5月13日 周三
2026-05-13
AI & I by Every· 播客
5月13日播客

从 Claude Code 切换到 Codex:Every 团队的真实体验

Dan Shipper 在 AI & I 节目中分享 Every 团队从 Claude Code 切换到 OpenAI Codex 的决策过程和真实体验。讨论了 AI 编程工具对非程序员工作流的改变,以及为什么在 AI 时代通用型人才会比专家更有优势——每个人都成为 AI 工具的「管理者」。

Swyx · AI 工程师· 日报
5月13日X

科技巨头就 Agentic AI 标准达成一致

Swyx 讨论了主要 AI 公司在 agentic AI 标准上的趋同。OpenAI 推动能操作软件的 agent,Anthropic 偏好多 agent 协作系统,Microsoft 把 AI 嵌入 M365 当「同事」,Google 则在做分层基础设施。方向一致但路径不同,这种收敛本身就是 agent 时代来临的信号。

Josh Woodward · Google VP· 日报
5月13日X

Google I/O 前瞻:Android 17 AI 功能预览

Google 在 I/O 前的 Android Show 上展示了 Android 17 的 AI 功能:Gemini 可代用户预约 appointments、增强自动填充能从手机其他应用拉取个人信息、AI 生成的自定义 widget 能自动刷新信息。Google 的策略很清晰:把 Gemini 深度嵌入操作系统的每一个交互层。

Anthropic Engineering· 日报
5月13日博客

Anthropic 与盖茨基金会合作推进健康 AI

Anthropic 宣布与盖茨基金会合作,将 AI 用于全球健康领域的优先问题。这是 AI lab 从商业竞争走向社会基础设施的又一个信号——frontier model 的应用场景正在从编程和聊天扩展到公共卫生、医疗和教育等关键领域。

5月12日 周二
2026-05-12
No Priors· 播客
5月12日播客

AI 推理需求爆发:Baseten CEO 谈推理云的战略地位

No Priors 节目邀请 Baseten CEO Tuhin Srivastava 讨论 AI 推理需求的爆发式增长。Baseten 实现 30 倍增长,Tuhin 认为推理正在成为 AI 产业链的「最后一个市场」——随着模型能力趋同,谁能以最低成本、最低延迟交付推理服务,谁就掌握战略制高点。

Dan Shipper · Every CEO· 日报
5月12日X

MCP 协议加速进入企业 AI 工具链

Dan Shipper 报道,Anthropic 收购 StainlessAPI,后者专注 API、SDK 和 MCP server 基础设施,客户包括 OpenAI 和 Google。MCP 正在从 Anthropic 的一个开源项目,变成连接 AI 工具与外部系统的事实标准层。谁控制了协议层,谁就控制了 agent 生态的入口。

Anthropic Engineering· 日报
5月12日博客

Claude Managed Agents 发布 Memory 和自托管沙箱

Anthropic 为 Claude Managed Agents 推出 memory 功能和 self-hosted sandboxes。Memory 让 agent 能跨 session 学习用户偏好和项目上下文,自托管沙箱则允许企业在自己的环境中运行 agent 工具。这标志着 AI agent 从「每次从零开始」走向「有记忆的长期协作者」。

Reuters· 日报
5月12日X

Anthropic 成立企业 AI 服务公司,Blackstone 和高盛参投

Anthropic 宣布成立新的企业 AI 服务公司,由 Blackstone、Hellman & Friedman 和 Goldman Sachs 支持,帮助中型企业将 Claude 嵌入核心业务。AI 模型公司不再只卖 API,而是直接切入传统上由系统集成商承担的落地实施环节。

5月10日 周日
2026-05-10
Google Labs · Google 实验性 AI 项目官方· 周报
5月10日X

Google Flow 达成 1 亿 AI 生成视频里程碑

Google 宣布其视频创作平台 Flow 已达成 1 亿次 AI 生成视频的里程碑。这个数字意味着 AI 视频生成正在从实验工具走向规模化内容生产基础设施,对短视频、广告和影视工作流的影响才刚开始。

Reuters· 周报
5月10日X

Anthropic 承诺向 Google 云和 TPU 投入 2000 亿美元

Reuters 报道,Anthropic 签署协议将在 Google 云和 TPU 上投入 2000 亿美元。加上此前与 CoreWeave 和 AWS 的合作,Anthropic 与 OpenAI 的合同已占主要云厂商 2 万亿美元积压订单的一半以上。AI 公司的算力军备竞赛正在重塑整个云计算基础设施格局。

End of Feed — Stay Curious