Google推出Gemini语音助手,挑战ChatGPT语音模式

Google推出Gemini语音助手,挑战ChatGPT语音模式

Profile image
AIGC X
Aug 26, 2024 • 3 min read

引言
Google近日发布了全新的AI语音助手Gemini Live,旨在与OpenAI的ChatGPT语音模式竞争。该助手不仅具备高级对话能力,还能与多款应用程序集成,为用户提供更智能、更自然的交互体验。

Gemini Live功能概述

Gemini Live通过Android和iOS上的Gemini应用程序提供,允许用户使用语音与AI互动。这个由Google的Gemini 1.5 Flash模型驱动的功能,可以用10种不同的生成语音回答问题。用户可以使用该助手管理购物清单或总结收件箱中的电子邮件。

Google Gemini体验和Google Assistant的总经理Sissie Hsiao表示:“通过Gemini,我们重新定义了个人助手的真正帮助意义。Gemini正逐步演变为提供AI驱动的移动辅助,以更自然、对话式和直观的方式提供全新水平的帮助。”

Gemini Live的特点在于,用户在切换应用程序或手机锁屏状态下仍能与聊天机器人对话,互动体验如同进行电话通话。目前,Gemini Live仅在Android手机上的Gemini Advanced订阅用户中提供英语支持,并将在接下来的几周内扩展到iOS和更多语言。

高级订阅与扩展功能

Gemini Advanced提供首月免费试用,之后每月订阅费用为20美元。除了语音功能外,订阅用户还可以使用Gemini 1.5 Pro模型,享受更大的输入长度、更大的存储空间、在Workspace应用中的Gemini访问权限,以及上传文件以供聊天机器人互动的功能。

此外,Gemini Live将进一步扩展功能,包括与其他Google应用的互操作性。例如,用户可以通过语音提示让聊天机器人在YouTube Music中创建播放列表。此外,Google还计划增加日历支持,允许聊天机器人与用户的日历应用互动,设置即将到来的事件提醒。

深度集成与未来展望

Hsiao在博客文章中表示:“由于Gemini为Android构建了深度集成,它不仅可以读取屏幕内容,还能与用户已经在使用的许多应用程序互动。例如,用户可以将Gemini生成的图像直接拖放到Gmail和Google Messages等应用中。”

除了新增功能,Google还计划提升Live响应的速度和质量。今年Google I/O大会上发布的1.5 Flash模型虽然比旗舰版1.5 Pro模型体积更小,但仍拥有同样强大的上下文窗口,能够处理大量数据输入。

结论

Google的Gemini Live语音助手通过其高级对话功能和广泛的应用集成,为用户提供了全新的互动体验。随着更多功能的推出,Gemini Live有望在AI语音助手领域占据一席之地,成为与ChatGPT语音模式竞争的有力对手。