Google推出Gemini语音助手，挑战ChatGPT语音模式

引言
Google近日发布了全新的AI语音助手Gemini Live，旨在与OpenAI的ChatGPT语音模式竞争。该助手不仅具备高级对话能力，还能与多款应用程序集成，为用户提供更智能、更自然的交互体验。

Gemini Live通过Android和iOS上的Gemini应用程序提供，允许用户使用语音与AI互动。这个由Google的Gemini 1.5 Flash模型驱动的功能，可以用10种不同的生成语音回答问题。用户可以使用该助手管理购物清单或总结收件箱中的电子邮件。

Google Gemini体验和Google Assistant的总经理Sissie Hsiao表示：“通过Gemini，我们重新定义了个人助手的真正帮助意义。Gemini正逐步演变为提供AI驱动的移动辅助，以更自然、对话式和直观的方式提供全新水平的帮助。”

Gemini Live的特点在于，用户在切换应用程序或手机锁屏状态下仍能与聊天机器人对话，互动体验如同进行电话通话。目前，Gemini Live仅在Android手机上的Gemini Advanced订阅用户中提供英语支持，并将在接下来的几周内扩展到iOS和更多语言。

Gemini Advanced提供首月免费试用，之后每月订阅费用为20美元。除了语音功能外，订阅用户还可以使用Gemini 1.5 Pro模型，享受更大的输入长度、更大的存储空间、在Workspace应用中的Gemini访问权限，以及上传文件以供聊天机器人互动的功能。

此外，Gemini Live将进一步扩展功能，包括与其他Google应用的互操作性。例如，用户可以通过语音提示让聊天机器人在YouTube Music中创建播放列表。此外，Google还计划增加日历支持，允许聊天机器人与用户的日历应用互动，设置即将到来的事件提醒。

Hsiao在博客文章中表示：“由于Gemini为Android构建了深度集成，它不仅可以读取屏幕内容，还能与用户已经在使用的许多应用程序互动。例如，用户可以将Gemini生成的图像直接拖放到Gmail和Google Messages等应用中。”

除了新增功能，Google还计划提升Live响应的速度和质量。今年Google I/O大会上发布的1.5 Flash模型虽然比旗舰版1.5 Pro模型体积更小，但仍拥有同样强大的上下文窗口，能够处理大量数据输入。

Google的Gemini Live语音助手通过其高级对话功能和广泛的应用集成，为用户提供了全新的互动体验。随着更多功能的推出，Gemini Live有望在AI语音助手领域占据一席之地，成为与ChatGPT语音模式竞争的有力对手。