Stability AI推出Stable audio的文本到音頻生成人工智能平臺

Stability AI是一家主要以人工智能生成的視覺效果而聞名的公司，它推出了一個名為Stable audio的文本到音頻生成人工智能平臺。

Stable Audio使用擴散模型，與該公司更受歡迎的圖像平臺Stable diffusion的AI模型相同，但使用音頻而非圖像進行訓練。用戶可以使用它為任何項目生成歌曲或背景音頻。

音頻擴散模型傾向于生成固定長度的音頻，這對音樂制作來說很糟糕，因為歌曲的長度可能不同。Stability AI的新平臺允許用戶發出不同長度的聲音，要求公司對音樂進行訓練，并在歌曲的開始和結束時間周圍添加文本元數據。

同時，它可以實現實時的音頻生成，無需等待長時間的渲染過程。Stability AI 宣稱，Stable Audio 模型可以在一秒內渲染出 95 秒的立體聲音頻，并且只需要一個 NVIDIA A100 GPU。

并且，Stable Audio是一個開源的項目，任何人都可以免費使用和修改。Stability AI 希望通過開源的方式促進 AI 領域的創新和發展，并讓更多人享受到 AI 技術帶來的便利和樂趣。

該公司在一份聲明中表示：“Stable Audio代表了Stability AI生成音頻研究實驗室Harmonai的尖端音頻生成研究。我們會繼續改進我們的模型架構、數據集和訓練程序，以提高輸出質量、可控性、推理速度和輸出長度。”

文本到音頻的生成并不是什么新鮮事，因為生成人工智能領域的其他大牌一直在玩弄這個概念。Meta于8月發布了AudioCraft，這是一套生成的人工智能模型，有助于根據提示創建聽起來自然的ERM、聲音和音樂。到目前為止，它只提供給研究人員和一些音頻專業人士。谷歌的MusicLM也可以讓人們產生聲音，但只對研究人員開放。

審核編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

音頻

音頻

+關注

關注
29

文章
3029

瀏覽量
83154
AI

AI

+關注

關注
88

文章
34589

瀏覽量
276236
人工智能

人工智能

+關注

關注
1805

文章
48843

瀏覽量
247448
模型

模型

+關注

關注
1

文章
3500

瀏覽量
50134
數據集

數據集

+關注

關注
4

文章
1223

瀏覽量
25321

原文標題：Stability AI發布AI音頻平臺Stable Audio

文章出處：【微信號：IEEE_China，微信公眾號：IEEE電氣電子工程師】歡迎添加關注！文章轉載請注明出處。

IEEE電氣電子工程師
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 經久不衰的魅力來自輝光數碼管豐富多彩的歷史
Hot 《覺醒》是世界上第一款由大腦控制的虛擬現實游戲

New IEEE新突破：數學解法引領光子晶體激光器創新
New 極簡電子墨水屏設備:廉價智能手機的創新替代品

精選推薦
更多

文章

資料

帖子

當工業設備開始“思考”：HZ-RK3576-SP_EVM如何讓傳統工業行業煥發智能新生？

合眾恒躍
1天前

580 閱讀

樹莓派5上的Gemma 2：如何打造高效的邊緣AI解決方案？

上海晶珩電子科技有限公司
1天前

368 閱讀

新品 | 視美泰發布高性價比四核工控主板GK-68A，開啟智能工業新時代！

視美泰
1天前

488 閱讀

技術干貨 | DAC靜態參數計算全解析：從偏移誤差到總未調整誤差

德思特測試測量
1天前

343 閱讀

PLL技術在FPGA中的動態調頻與展頻功能應用

智多晶
1天前

329 閱讀

激光遙感成像信號與目標細特性關系研究

xgshao
154

免費

0下載

SM3-PHP國密標準SM3的原生PHP實現

姬房有
0.04 MB

免費

1下載

Zdocker docker管理工具

殷谷光
1.59 MB

2積分

1下載

rqbit Rust實現的BitTorrent客戶端

名士流
0.43 MB

2積分

1下載

GW-BASIC BASIC的方言版本

ah此生不換
0.33 MB

免費

0下載

【正點原子STM32MP257開發板試用】基于 YOLO 模型的物體識別

jf_07365693
1天前

134 閱讀

【正點原子STM32MP257開發板試用】基于 MobileNet 的物體識別

jf_07365693
2天前

122 閱讀

【RA4L1-SENSOR】07 低功耗待機模式及功耗實測

jf_83922529
2天前

772 閱讀

ArkUI-X平臺橋接Bridge說明

jf_14971143
3天前

559 閱讀

電容三點式無法起振的原因

jf_01102310
3天前

1543 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

Stability AI推出Stable audio的文本到音頻生成人工智能平臺

評論