用大模型寫歌,豆包上線音樂生成功能 字節再補一塊AI拼圖

AI時代,寫一首歌的時間也許只需按秒計算。

8月8日,《每日經濟新聞》記者瞭解到,字節跳動旗下智能AI助手豆包已上線音樂生成功能。用戶在豆包的“音樂生成”中輸入主題或自己寫的歌詞,設定音樂風格、情緒及音色,便能快速生成一首約1分鐘的詞曲。

《每日經濟新聞》記者使用該功能發現,目前豆包音樂生成功能提供民謠、嘻哈、R&B等11種音樂風格,其中還涵蓋了爵士、雷鬼、電音等相對小衆的曲風,用戶可選擇男聲或女聲演唱。

爲讓AI音樂更好地貼合普通用戶的情感表達,豆包還預設了快樂、傷感等多種情緒狀態。同時,生成歌曲支持一鍵分享至抖音等社交平臺。

事實上,AI生成式音樂大模型已有先例。今年3月,科技公司Suno推出了AI音樂工具SunoV3,一度被外界視爲“音樂界的ChatGPT”,該款大模型能夠一次性完成歌詞、演唱、編曲、配樂等音樂創作的全流程。5月末發佈的最新3.5版本已支持所有用戶製作4分鐘的歌曲,創建最長2分鐘的歌曲擴展。

《每日經濟新聞》記者瞭解到,現階段,豆包生成的音樂時長不超過1分鐘,歌詞字數不超過200。豆包相關負責人表示,音樂生成能力剛剛推出,還有各種待完善之處。豆包希望,這個功能可以激發更多人的創造力,讓他們以音樂的形式表達自己的心情,分享自己的故事。

在新增音樂功能的同時,豆包的主力模型和多個垂類模型均在今年5月首次亮相後進行了升級迭代。

在7月25日的火山引擎2024“AI創新巡展”首站成都站上,豆包模型家族正式發佈了“新成員”豆包·圖生圖模型。該模型能力已經在抖音、剪映、豆包、星繪等字節系App中落地,並通過火山引擎服務了三星、努比亞等企業客戶,目前日均圖生圖數量達到數千萬張。

此外,字節也沒有忽略在AI視頻生成工具上的投入。8月6日,字節跳動旗下剪映團隊研發的一站式AI創作平臺“即夢AI”移動版正式上架至蘋果App Store應用商店,該應用目前擁有文生圖和文/圖生視頻等功能。

官方數據顯示,截至7月,豆包大模型日均Tokens使用量已突破5000億,平均每家企業客戶日均Tokens使用量較5月15日模型發佈時期增長22倍。