快科技5月8日消息,据媒体报道,OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。
本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。
相比前代产品,它能够更精准地理解并处理复杂的人类指令,实现更自然、更智能的连续对话交互。
在翻译方面,GPT-Realtime-Translate支持超过70种语言的识别以及13种语言的语音输出,能够同步人声语速完成实时翻译,实现无卡顿的跨语言沟通。
配套上线的Whisper实时转录模型,可在人机互动过程中同步完成语音转文字,适用于会议记录、实时笔录等高频办公场景。
OpenAI表示,本次升级将AI音频交互从基础问答提升为综合性智能语音操作系统,集聆听、思考、翻译、转写与实时响应于一体,实用性大幅增强。

热门排序
推荐文章
从“卖车”到“卖运力”:新石器即时配送如何重塑城市商业逻辑
大佬亲自服务!周鸿祎现身360龙虾安装活动 现场上阵为用户安装
马斯克:非常欣赏黄仁勋 将继续大规模订购英伟达芯片
人声接近真人!OpenAI一口气更新三款超强语音AI
关键时刻能救命!隧道指示灯亮起双红叉 网友:靠边停车切勿进入
A股人形机器人第一股来了!宇树科技要上市 CEO王兴兴年薪公布
微软最安全主机神话破灭!Xbox One终于沦陷:任意代码随意跑
青岛地铁通报大爷骑电动车乘地铁:出于人文关怀 符合规定
罗永浩联动杨笠被喷爆!罗永浩自称是她的铁粉
微软吃相难看!Copilot竟在GitHub代码审查里塞广告:超150万次PR遭污染





