铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音

愤怒的蜗牛

penAI 又放大招了!用实力正名:在AI圈,自己的“一哥”地位不可动摇!

就在今天凌晨,OpenAI 官方开发者账号 @OpenAIDevs 在 X 平台上,一口气连续发布了 4 项关键更新,直接把 AI 代理(Agent)开发体验提升到新维度,围绕 Agent 开发体验、实时语音应用、人类干预机制和全链路追踪都做了重要升级。

具体包括:推出了TypeScript 原生支持,语音代理可以实时跑,执行过程还能人工干预,全链路追踪也一站搞定。

别小看这 4 个更新,它们背后透露出的,OpenAI 对于 AI Agent 产品线的定位再升级: 从“开发者玩具”,转向升级成为“企业级 AI 工具链”。

所以,今天这 4 个更新,哪怕你不写代码,也值得关注。我们这就来细细拆一下,告诉大家为什么这么说。

Agents SDK 正式跳出 Python 圈,支持 TypeScript,前端全栈开发者福音

过去,OpenAI Agents SDK 只提供 Python 版本,对大多数前端、全栈和 Node.js 开发者不太友好。

这次,官方直接放出了 TypeScript 版本 SDK,功能完全对齐 Python 版,支持:

  • handoffs(任务移交)

  • guardrails(安全机制)

  • tracing(执行追踪)

  • MCP(多通道代理控制)

  • 以及 Agent 所需的各类基础能力。

安装也是非常简单:

npm install @openai/agents1.

官网还给出了使用示例:

import { Agent, run } from'@openai/agents';const agent = new Agent({
name: 'Assistant',instructions: 'You are a helpful assistant',});const result = await run(
  agent,'Write a haiku about recursion in programming.',);console.log(result.finalOutput);// Code within the code,// Functions calling themselves,// Infinite loop's dance.1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.

可以说,OpenAI 的 AI Agent 终于从 Python 圈子里跳出来了,前端开发者也能玩转 AI 代理。

对 AI 工具 SaaS、智能客服、网页嵌入式 AI 助手这些场景是重大利好。

👉 官方文档:

https://openai.github.io/openai-agents-js/

新增 Human-in-the-loop 功能,AI 调用过程可人工干预

AI 黑箱执行、无法插手,一直是企业在部署 Agent 时最大的顾虑,尤其对于

金融风控、内容审核、法务审校这些场景,可控性尤其重要。


这一次,AI 不再是一锤子买卖,OpenAI贴心地将「人类介入权」被纳入了开发体系。

这次 SDK 增强了 Human-in-the-loop 功能,允许开发者:

  • 在 Agent 调用工具或执行任务时,主动暂停

  • 保存当前 agent 状态

  • 让人工审核、确认或调整调用

  • 再决定是否恢复执行

👉 功能指南:

https://openai.github.io/openai-agents-js/guides/human-in-the-loop/

实时语音 Agent 功能上线,实时语音代理可以跑了

第三个更新,相信适合所有在做各种 AI 助手的朋友,比如 AI 语音助手、客服机器人、播报应用等等,终于有了靠谱的官方方案。

铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音 图片

这次新出的 RealtimeAgent 功能,基于 OpenAI 的 Realtime API,可以让语音代理在本地客户端或服务器端实时运行,具体可以支持:

  • 和文字 agent 一样的工具调用、任务移交、guardrails(护栏)

  • 自动处理语音输入、输出、用户打断

👉 入门地址:https://openai.github.io/openai-agents-js/guides/voice-agents/

从“对话文字机器人”迈向“语音实时助手”,Agent 从文本应用进化到多模态 AI 产品,这是一个业内的共识和趋势,所以小编认为,OpenAI 这一次的功能真的很香!

这里也给大家放一个示例:

import { z } from'zod';import { RealtimeAgent, RealtimeSession, tool } from'@openai/agents/realtime';const createTicket = tool({
name: 'createTicket',description: 'Create a support ticket for a faulty laptop.',parameters: z.object({}),needsApproval: true,execute: async () => 'Ticket filed!',});const faqAgent = new RealtimeAgent({
name: 'FAQ',instructions: 'Answer laptop support questions concisely.',});const customerServiceAgent = new RealtimeAgent({
name: 'Customer Service',instructions: 'Handle customer service inquiries, including support tickets.',tools: [createTicket],});const triageAgent = new RealtimeAgent({
name: 'Triage',instructions: 'Route laptop support questions to FAQ or customer service.',handoffs: [faqAgent, customerServiceAgent],});const session = new RealtimeSession(triageAgent, {
model: 'gpt-4o-realtime-2025-06-03'});await session.connect({ apiKey });1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.

Agent也有了抓手:Traces 仪表盘支持实时语音代理追踪

为了方便开发者监控 Agent 执行过程,OpenAI 的 Traces dashboard 现在也支持实时语音代理。

铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音 图片

可实时查看:

  • 语音输入、输出

  • 工具调用记录

  • 用户打断情况

  • 执行链路

这里值得注意的是,无论通过 API 还是 Agents SDK 调用,执行过程都能清晰追踪。

这也就意味着,企业彻查 Agent 的黑箱行为,也算是有了清晰的抓手。

写在最后:Agent 正在成为 AI 世界的操作系统

这 4 个更新看似琐碎,但放在一起,就是一个很清晰的信号:

AI Agent 不再是一个单点功能,而是正走向“全栈可控、支持语音、支持人类干预、过程全追溯”的企业级 AI 操作系统。

未来,客服、销售助理、内容审核、IoT 智能设备、企业运营辅助,这些场景里,AI Agent 不仅能实时跑,执行过程还能随时插手、随时追踪。

这意味着什么?

这就意味着,AI 正从“生成答案”,变成“执行任务”的超级数字劳动力。

而今天 OpenAI 的这波更新,正是为这个趋势铺路。

最后给大家看一下,最早一批尝鲜该功能的 Perplexity 开发的新品效果——


铁了心为Agent开发铺路!OpenAI“真香”式升级:跳出Python圈、可人类干预、实时语音Agent、全链路追踪,代理福音


参考资料:https://x.com/OpenAIDevs/status/1929950489539686901


您需要 登录账户 后才能发表评论

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,8人围观)

还没有评论,来说两句吧...

目录[+]

取消
微信二维码
微信二维码
支付宝二维码