OpenAI发布更新,实现实时跨音频、视觉和文本推理

BlockBeats 消息,10 月 2 日,据 Cointelegraph 报道,OpenAI 在 10 月对其模型进行了四项更新,帮助其 AI 模型更好地进行对话并提高图像识别能力。第一项重大更新是实时 API,它允许开发人员使用单个提示创建人工智能生成的语音应用程序,实现类似于 ChatGPT 高级语音模式的自然对话。以前开发人员必须将多个模型「拼接在一起」才能创建这些体验。音频输入通常需要在接收响应之前完全上传和处理,这意味着语音相互对话等实时应用程序的延迟较高。借助 Realtime API 的流媒体功能,开发人员现在可以实现即时、自然的交互,就像语音助手一样。该 API 运行在 2024 年 5 月发布的 GPT-4 上,可以实时跨音频、视觉和文本进行推理。

另一项更新包括为开发人员提供的微调工具,使他们能够改进从图像和文本输入生成的人工智能响应。基于图像的微调器使人工智能能够更好地理解图像,从而增强视觉搜索和物体检测能力。该过程包括来自人类的反馈,他们提供了好的和坏的反应例子进行训练。

除了语音和视觉更新之外,OpenAI 还推出了「模型蒸馏」和「提示缓存」,允许较小的模型向较大的模型学习,并通过重用已处理的文本来减少开发成本和时间。据路透社报道,OpenAI 预计明年收入将增至 116 亿美元,高于 2024 年预计的 37 亿美元。






声明:本内容为作者独立观点,不代表 ChainMedia 立场,不承担法律责任。文章及观点也不构成投资意见,请谨慎对待。如有侵权,请联系客服删除。
尼日利亚证券交易委员会将打击无监管的加密货币平台

尼日利亚证券交易委员会将打击无监管的加密货币平台

尼日利亚证券交易委员会(SEC)正准备对未遵守其监管框架的个人和加密货币交易所采取行动。 当地媒体Nairametrics报道称,SEC总干事埃莫莫蒂米·阿加马博士(Dr….
Aave获得英国FCA颁发的电子货币机构许可证

Aave获得英国FCA颁发的电子货币机构许可证

去中心化借贷协议Aave的英国公司已经获得了英国金融行为监管局(FCA)颁发的电子货币机构(EMI)许可证。 据The Block报道,非托管借贷协议Aave的英国实体公司已经获得了英国金融行为监管局(FCA)颁发的电子货币机构(EMI)许可证。…
美联储重大鸽派转向,全球资产狂欢

美联储重大鸽派转向,全球资产狂欢

来源:华尔街见闻 作者:杜玉、李丹、何浩…
ETF、美联储降息以及大选事件能否助推加密市场迎来牛市?

ETF、美联储降息以及大选事件能否助推加密市场迎来牛市?

整理:Uweb ETF、美联储降息以及大选事件能否助推加密市场迎来牛市?前高盛亚洲…