字節跳動澄清關於OpenAI服務使用情況:今年4月已禁止將GPT生成數據用於訓練

12月17日消息,近日,有外媒報道稱,字節跳動在使用OpenAI技術開發自己的大語言模型,違反了OpenAI服務條款。對此,字節跳動相關負責人迴應稱,公司在使用OpenAI相關服務時,強調要遵守其使用條款。我們也正與OpenAI聯繫溝通,以澄清外部報道可能引發的誤解。

以下是公司使用OpenAI服務相關情況的介紹:

1、今年年初,當技術團隊剛開始進行大模型的初期探索時,有部分工程師將GPT的API服務應用於較小模型的實驗性項目研究中。該模型僅爲測試,沒有計劃上線,也從未對外使用。在4月公司引入GPT API 調用規範檢查後,這種做法已經停止。

2、早在今年4月,字節大模型團隊已經提出了明確的內部要求,不得將GPT模型生成的數據添加到字節大模型的訓練數據集,並培訓工程師團隊在使用GPT時遵守服務條款。

3、9月,公司內部又進行了一輪檢查,採取措施進一步保證對GPT的API 調用符合規範要求。例如分批次抽樣檢測模型輸出結果與GPT的相似度,避免數據標註人員私自使用GPT。

4、未來幾天裡,我們會再次全面檢查,以確保嚴格遵守相關服務的使用條款。