ChatGPT现在可以说、听和看,告诉你如何使用新的语音和图像功能

【华e生活讯】OpenAI在ChatGPT中引入了新的语音和图像功能,再次推动了人工智能技术的发展。这些功能将彻底改变用户与人工智能模型的交互方式,提供更加直观和身临其境的体验。

语音对话与ChatGPT

这次更新的突出特点之一是能够与ChatGPT进行语音对话。用户现在可以与他们的人工智能助手进行实时、来回的对话,开启了一个充满可能性的世界。无论您是在旅途中,为家人寻找睡前故事,还是解决餐桌辩论,ChatGPT的语音功能都可以提供帮助。

要开始使用语音,只需导航到移动应用程序的设置菜单,选择“新功能”,然后选择语音对话。开启后,点击主屏幕右上角的耳机图标,从五种不同的声音中进行选择。这些声音是由专业配音演员精心制作的,以提供类似人类的音频体验。此外,OpenAI的开源语音识别系统Whisper可以将语音转换为文本,从而提高整体对话质量。

图像交互与ChatGPT

另一个改变游戏规则的功能是与ChatGPT共享图像的能力。用户现在可以向ChatGPT显示一个或多个图像,以排除问题、探索内容或分析复杂的数据。无论你是想弄清楚烤架为什么不启动,根据冰箱里的东西计划一顿饭,还是为了工作破译数据图表,ChatGPT都可以帮助你。

要使用此功能,请点击照片按钮来捕获或选择图像。在iOS或Android上,先点击加号按钮来添加多个图像,或者使用绘图工具来引导你的助手。这些图像功能由包括GPT-3.5和GPT-4在内的多模态模型提供支持,这些模型将语言推理技能应用于广泛的视觉内容,如照片、屏幕截图以及包含文本和图像的文档。

逐步部署安全和响应性

语音和图像功能的部署将在未来两周逐步向Plus和企业用户推出。语音在iOS和安卓平台上都可以使用,可以通过设置来选择,而图像在所有平台上都可以访问。

OpenAI承认与这些高级功能相关的潜在风险。在语音方面,重点是语音聊天,该技术是与配音演员合作开发的,以确保真实性和安全性。值得注意的是,Spotify也在其语音翻译功能中利用了这项技术,通过使用自己的声音将内容翻译成各种语言来扩大播客的覆盖范围。

在图像输入方面,OpenAI已经采取措施限制ChatGPT对人的分析和直接陈述的能力,尊重个人隐私。实际使用情况和用户反馈将在进一步加强这些保障措施的同时确保工具的有用性方面发挥关键作用。

Leave a Comment

您的电子邮箱地址不会被公开。 必填项已用 * 标注