谷歌杀入AI音乐赛道：Gemini新增Lyria 3音乐生成功能，30秒可生成歌曲并自定义歌词

今天，谷歌在Gemini中正式引入Lyria 3音乐生成模型，支持30秒歌曲生成并自定义歌词与音频，把Gemini变成“音乐工坊”。这一更新覆盖文本/图像输入，多种风格与人声，面向18岁以上用户，进一步拉低了音乐创作门槛。对创作者而言，可以在同一应用内完成从脚本、视觉到配乐的全流程。本文详解功能要点与实用建议。

AI音乐谷歌Gemini Lyria 3 生成式AI 音乐创作科技趋势

今天，谷歌在Gemini中正式引入了由DeepMind打造的最新音乐生成模型Lyria 3，允许用户通过文字或图像直接生成30秒音乐片段，并自定义歌词与音频。这一更新让Gemini不再只是聊天与创作的工具，也成为一个“音乐工坊”。

在此之前，Gemini已具备图像生成等功能。现在新增音乐能力，覆盖了“多模态内容创作”的关键一环。这意味着你可以在同一个会话里，完成从构思、提示词、文本或图片参考，到生成一段完整30秒音乐的全流程。

Lyria 3模型能生成包含人声、歌词与封面在内的30秒歌曲，支持多种风格（包括广告曲、节拍、更复杂的编曲与歌曲），并面向全球18岁以上用户开放。用户可以通过上传文本、照片或视频作为输入，数秒内获得音乐结果。这大幅降低了音乐创作门槛，也强化了Gemini的“一站式创作”属性。

AI音乐赛道并非从今天才开始。2024年的Suno、2025年的Udio等已经让不少创作者尝到甜头。而谷歌此次的节奏更像是“把成熟模型快速带到主流应用里”。从时间线看，Lyria 3大约在2月19日前后正式发布，随后陆续整合到Gemini应用与YouTube生态。到今天，这项能力已经在Gemini中可用。

对内容创作者而言，这意味着更快的原型与配乐效率：你可以先用Gemini写脚本、生成视觉素材，再用新增的音乐生成能力完成配乐。对播客主或短视频创作者来说，快速生成与主题契合的BGM与人声片段，有助于加快内容交付节奏。

当然，新能力也引发一些关注点：生成的音乐能否商用、版权与训练数据来源、模型对歌词与人声的可控性等，都是业界与用户关心的方向。从公开资料看，谷歌在此次落地中强调了数据来源的合规性与可商用的范围（具体以官方条款为准）。后续如何进一步优化可控性、提供更长的生成时长与更好的人声表现，也将是竞争的关键。

整体来看，谷歌的这次动作是其在生成式AI产品线的一次重要扩展，也是迄今在AI音乐领域最积极的战略布局之一。对于创作者而言，工具箱里又多了一个实用选项。你可以先尝试小段30秒片段，用于片头、转场或情绪烘托，再根据反馈优化提示词或参考素材。

你打算用Gemini新功能生成哪一类音乐？欢迎在评论区分享你的提示词或作品链接。

谷歌杀入AI音乐赛道：Gemini新增Lyria 3音乐生成功能，30秒可生成歌曲并自定义歌词

Related Posts