这个会创作音乐的Stable Diffusion名叫Riffusion(riff+Diffusion),输入提示词,即可获得一段对应的音乐。比如,输入“民谣,女声引入,过渡到青少年流行歌星”。
Riffusion的工作方式是首先构建一个索引的频谱图集合,每个频谱图都标有代表频谱图中捕获的音乐风格的关键字。
一旦在此频谱图主体上进行训练,该模型就可以使用与 Stable Diffusion 相同的方法,干预噪声以获得与文本提示匹配的声波图具有相似质量的声波图像。
Riffusion
本文链接:https://www.zkjds.com/post/1463.html ,转载需注明文章链接来源:https://www.zkjds.com/
- 喜欢(11)
- 不喜欢(3)