模型与实验室 4.0 · 优秀 2026-06-07 · X

Gemini 3.1 Flash TTS:表现力最强控制粒度最细的语音合成模型

今天我们发布了 Gemini 3.1 Flash TTS迄今为止表现力最强控制粒度最细的文本转语音模型 本次发布包含音频标签(Audio Tags)功能!音频标签是一种无缝的方式,用嵌入在文本中的自然语言命令来引导语音风格节奏和表达方式想要不同的语速或语调?给音频加上标签,AI 语音输出就会按你的指令来!...

打开原文回到归档

今天我们发布了 Gemini 3.1 Flash TTS迄今为止表现力最强控制粒度最细的文本转语音模型 本次发布包含音频标签(Audio Tags)功能!音频标签是一种无缝的方式,用嵌入在文本中的自然语言命令来引导语音风格节奏和表达方式想要不同的语速或语调?给音频加上标签,AI 语音输出就会按你的指令来!...