"稳定音频开放 — 稳定性人工智能"

齐思GPT 2024-06-06 00:00:00 844

Stability AI推出了Stable Audio Open，这是一个开源模型，彻底改变了声音设计师和音乐家创作音频的方式。这个工具的独特之处在于它能够从简单的文本提示中生成高质量的音频样本，最长可达47秒。与其商业版本Stable Audio专注于完整曲目不同，Stable Audio Open专注于像鼓点、环境声音和声音设计中的foley等较短的音频元素。这一发布的重要之处在于模型在Hugging Face上的可访问性，以及用户可以利用自己的自定义音频数据对其进行微调的潜力。这一发展证明了Stability AI对开源AI技术的承诺，以及其与创意社区合作的方式。对于任何对人工智能和音频制作交叉领域感兴趣的人来说，探索Stable Audio Open可能是一次有价值且创新的体验。- Stable Audio Open是一个开源的文本到音频模型 - 该模型用于生成短音频样本、音效和制作元素 - 用户可以使用文本提示创建鼓点、乐器旋律、环境声音、foley和制作元素 - 该模型支持音频样本的变化和风格转换 - Stable Audio Open允许用户根据自己的音频数据对模型进行微调 - 该模型的训练数据来自FreeSound和Free Music Archive - Stable Audio Open模型权重可在Hugging Face上下载 - 这只是开放和负责任音频生成能力的开始，将继续研究和与创意社区合作发展

奇绩创坛

>>>了解更多创新创业资讯

上一篇：从零开始 - 生成对抗网络

下一篇：GenAI技术落地白皮书

上一篇：从零开始 - 生成对抗网络下一篇：GenAI技术落地白皮书