logo
  • AI Image Generator
  • AI Chat
  • Nano Banana ProAD
  • Blog
Back to List
ADMIN
2026年2月23日
2 Views
4 min read

谷歌杀入AI音乐赛道:Gemini新增Lyria 3音乐生成功能,30秒可生成歌曲并自定义歌词

今天,谷歌在Gemini中正式引入Lyria 3音乐生成模型,支持30秒歌曲生成并自定义歌词与音频,把Gemini变成“音乐工坊”。这一更新覆盖文本/图像输入,多种风格与人声,面向18岁以上用户,进一步拉低了音乐创作门槛。对创作者而言,可以在同一应用内完成从脚本、视觉到配乐的全流程。本文详解功能要点与实用建议。

今天,谷歌在Gemini中正式引入了由DeepMind打造的最新音乐生成模型Lyria 3,允许用户通过文字或图像直接生成30秒音乐片段,并自定义歌词与音频。这一更新让Gemini不再只是聊天与创作的工具,也成为一个“音乐工坊”。

在此之前,Gemini已具备图像生成等功能。现在新增音乐能力,覆盖了“多模态内容创作”的关键一环。这意味着你可以在同一个会话里,完成从构思、提示词、文本或图片参考,到生成一段完整30秒音乐的全流程。

Lyria 3模型能生成包含人声、歌词与封面在内的30秒歌曲,支持多种风格(包括广告曲、节拍、更复杂的编曲与歌曲),并面向全球18岁以上用户开放。用户可以通过上传文本、照片或视频作为输入,数秒内获得音乐结果。这大幅降低了音乐创作门槛,也强化了Gemini的“一站式创作”属性。

AI音乐赛道并非从今天才开始。2024年的Suno、2025年的Udio等已经让不少创作者尝到甜头。而谷歌此次的节奏更像是“把成熟模型快速带到主流应用里”。从时间线看,Lyria 3大约在2月19日前后正式发布,随后陆续整合到Gemini应用与YouTube生态。到今天,这项能力已经在Gemini中可用。

对内容创作者而言,这意味着更快的原型与配乐效率:你可以先用Gemini写脚本、生成视觉素材,再用新增的音乐生成能力完成配乐。对播客主或短视频创作者来说,快速生成与主题契合的BGM与人声片段,有助于加快内容交付节奏。

当然,新能力也引发一些关注点:生成的音乐能否商用、版权与训练数据来源、模型对歌词与人声的可控性等,都是业界与用户关心的方向。从公开资料看,谷歌在此次落地中强调了数据来源的合规性与可商用的范围(具体以官方条款为准)。后续如何进一步优化可控性、提供更长的生成时长与更好的人声表现,也将是竞争的关键。

整体来看,谷歌的这次动作是其在生成式AI产品线的一次重要扩展,也是迄今在AI音乐领域最积极的战略布局之一。对于创作者而言,工具箱里又多了一个实用选项。你可以先尝试小段30秒片段,用于片头、转场或情绪烘托,再根据反馈优化提示词或参考素材。

你打算用Gemini新功能生成哪一类音乐?欢迎在评论区分享你的提示词或作品链接。