☰

用大模型寫歌，豆包上線音樂生成功能字節再補一塊AI拼圖

AI時代，寫一首歌的時間也許只需按秒計算。

8月8日，《每日經濟新聞》記者瞭解到，字節跳動旗下智能AI助手豆包已上線音樂生成功能。用戶在豆包的“音樂生成”中輸入主題或自己寫的歌詞，設定音樂風格、情緒及音色，便能快速生成一首約1分鐘的詞曲。

《每日經濟新聞》記者使用該功能發現，目前豆包音樂生成功能提供民謠、嘻哈、R&B等11種音樂風格，其中還涵蓋了爵士、雷鬼、電音等相對小衆的曲風，用戶可選擇男聲或女聲演唱。

爲讓AI音樂更好地貼合普通用戶的情感表達，豆包還預設了快樂、傷感等多種情緒狀態。同時，生成歌曲支持一鍵分享至抖音等社交平臺。

事實上，AI生成式音樂大模型已有先例。今年3月，科技公司Suno推出了AI音樂工具SunoV3，一度被外界視爲“音樂界的ChatGPT”，該款大模型能夠一次性完成歌詞、演唱、編曲、配樂等音樂創作的全流程。5月末發佈的最新3.5版本已支持所有用戶製作4分鐘的歌曲，創建最長2分鐘的歌曲擴展。

《每日經濟新聞》記者瞭解到，現階段，豆包生成的音樂時長不超過1分鐘，歌詞字數不超過200。豆包相關負責人表示，音樂生成能力剛剛推出，還有各種待完善之處。豆包希望，這個功能可以激發更多人的創造力，讓他們以音樂的形式表達自己的心情，分享自己的故事。

在新增音樂功能的同時，豆包的主力模型和多個垂類模型均在今年5月首次亮相後進行了升級迭代。

在7月25日的火山引擎2024“AI創新巡展”首站成都站上，豆包模型家族正式發佈了“新成員”豆包·圖生圖模型。該模型能力已經在抖音、剪映、豆包、星繪等字節系App中落地，並通過火山引擎服務了三星、努比亞等企業客戶，目前日均圖生圖數量達到數千萬張。

此外，字節也沒有忽略在AI視頻生成工具上的投入。8月6日，字節跳動旗下剪映團隊研發的一站式AI創作平臺“即夢AI”移動版正式上架至蘋果App Store應用商店，該應用目前擁有文生圖和文/圖生視頻等功能。

官方數據顯示，截至7月，豆包大模型日均Tokens使用量已突破5000億，平均每家企業客戶日均Tokens使用量較5月15日模型發佈時期增長22倍。

用大模型寫歌，豆包上線音樂生成功能 字節再補一塊AI拼圖