Google Drive 新增“音频速览”功能:PDF 听着走,通勤也能高效学习
Google 正在悄悄改变你使用 Drive 的方式。最新上线的“音频速览”(Audio Overview)功能,让数十页的 PDF 文档瞬间变成几分钟的语音摘要——无需再熬夜啃报告,上下班路上、散步时、做家务时,只需点开播放,Gemini 就能为你朗读关键内容,把信息“听”进耳朵。
操作极其简单:在电脑端打开 Google Drive,选中任意 PDF 文件,点击右上角的“Create audio overview”按钮,系统便会自动调用 Gemini 分析全文,提取核心观点、数据和结论,生成一段自然流畅的语音摘要。整个过程通常只需 30 秒到 2 分钟,完成后,音频会自动出现在侧边栏,支持播放、暂停、快进,还能调节语速。

生成失败?别刷新!注意这个关键细节
不少用户在测试时发现,如果在音频生成过程中刷新页面、关闭标签页或切换应用,任务就会中断,音频无法保存。Google 明确提示:请确保在生成完成前保持页面打开。建议在生成时开启“勿扰模式”,或使用电脑自带的“保持唤醒”功能,避免系统休眠导致中断。
自动生成+自动归档,再也不怕找不到音频
每一份生成的音频都会被自动保存到 Drive 根目录下的“Audio overviews”文件夹中,文件名按“原文件名_YYYY-MM-DD_HH-MM-SS”格式命名,比如《2025年Q1财报_2025-03-15_14-22-08.mp3》。你还会收到一条 Google 账户通知,提醒你“音频摘要已准备好”,方便在手机端快速定位。
目前,每位用户每天最多可生成 20 条音频速览,覆盖大多数办公场景。虽然该功能目前仅支持网页端触发,但生成后的音频文件可在所有设备上访问——包括 iOS 和 Android 的 Google Drive App,真正实现“生成在电脑,收听在手机”。
不止是听:Gemini 已成你的全能办公助手
音频速览只是开始。如今,Gemini 已深度融入 Drive,成为你随身的“AI 办公协作者”:
- 一键生成视觉素材:输入“帮我设计一个科技风的项目Logo”,Gemini 能在几秒内生成多个风格选项,支持修改颜色、字体、元素,甚至直接下载 PNG 或 SVG 文件。
- 自动整理数据:只需说“把上周的销售记录整理成表格,按地区分类”,Gemini 就能从你上传的聊天记录、邮件或笔记中提取信息,自动生成 Google Sheets 文件并存入 Drive。
- 快速撰写提案:输入“写一份关于远程办公政策优化的简报,3页以内”,Gemini 会生成结构完整、语言专业的 Docs 文档,包含标题、要点、建议和参考数据。
- 语音创建文件夹:不用手动新建文件夹了,直接说“创建一个叫‘客户反馈2025’的文件夹,里面放PPT和PDF”,Gemini 会帮你一次性建好结构,甚至自动归类已有文件。
为什么这波更新让打工人直呼“太懂我了”?
过去,我们用 Drive 只是“存文件”;现在,它变成了“处理文件”的中枢。尤其对于经常需要:
- 阅读大量行业报告、学术论文的分析师
- 每天接收几十份合同、标书的法务与采购
- 要写周报、做PPT、整理数据的职场新人
- 时间碎片化、想利用通勤时间“充电”的知识工作者
这一系列功能,等于把一个AI助理塞进了你的云盘。无需跳转多个工具,不用复制粘贴,所有操作都在 Drive 内完成,真正实现“所想即所得”。
据 Google 官方透露,音频速览功能正在逐步向所有 Google One 会员开放,未来还将支持多语言切换、自定义摘要长度(如“只保留数据部分”)等进阶选项。而随着 Gemini 的持续进化,Drive 很可能成为下一个“无需打开Word、Excel、PPT就能完成全部办公任务”的终极平台。
别再只是存文件了——让你的 Drive,开始替你工作。