深度求索帶來的新課題
(圖/路透)
過年期間最震撼的新聞莫過於DeepSeek(深度求索,簡稱DS)的橫空出世。一開始打亂了美國股市,更被喻爲中國科技超車的象徵。隨後,美國抵制DS,歐洲國家也如法照辦,臺灣沒例外,緊跟美國限制政府部門使用。這情況與華爲5G剛出現的情況一樣。但在AI時代,會重演嗎?恐怕不盡然。
趁着年節,跟幾個學電機、資工的子侄輩請教了一下,略有一點初步觀察,在此分享淺見。
首先,DS當然不是橫空出世,他們早已交待,是從OpenAI、ChatGPT等得來的靈感,許多程式設計與開發仍使用他們的大模型。質言之,是建立在巨人肩上的另一種模型。有關誰抄誰,誰有政治問題先不論,我們不妨放下意識形態、冷戰思維,務實面對。
他們說,無論ChatGPT、OpenAI、DS,都是建立在大量資料數據的基礎上,他們比賽誰喂的資料多,誰就可讓AI學習更多,但如何更有效使用這些大量資料卻是下一個課題。因爲AI學習後雖可迅速給出答案,但不一定正確。
所以年輕人的想法是,有沒有可能,我們在這大模型之上,去建構一些小模型。例如,用AI看病,輸入相關病情病徵,可能很快給出診斷,但如何斷定其正確與否,是否可以與有經驗的醫院合作,建立一個更爲準確的模型,然後纔可以推廣。
其他領域也一樣,是否可在各個專業領域建立一些足以判斷準確與否的參考?質言之,AI提供了大量的資訊,但判斷仍是要由更多有經驗的人來修正。如果夠多的數據、夠多的修正可增加準確度,那麼它是不是意味着另一種模式的存在?這是不是下個階段的另一種商機?
最近出版界則提出了一個問題:有關版權。現在AI所學習的大量數據會在吸收之後,依你的指令給出答案。例如你要它用典雅的中文寫詩詞,它可能會給出一種古典的字句。這是它大量學習古典文學之後的結果。
閱讀古文沒問題,但問題是它如果學習了現代作家的作品,用閱讀器吸收之後,要不要付權利金?現在的圖像鑑別轉文字檔系統發達,如果一家數位公司與圖書館合作,一本本去掃描,連版稅都免了,那要如何處理?傳聞祖克柏曾在內部會議中表示:「去非洲找些不太有人管的圖書館一本本掃描,才能讓Meta的AI系統儘快成立。」由此可以想見,AI公司多麼想吃盡天下資料。
想想,文化工作者的作品一本一本被掃描到資料庫,然後被AI怎麼使用都不知道,而AI的來源可能是非洲的圖書館,那還有什麼智慧財產保護呢?
另一個問題來了,翻譯書的版權要如何處理?例如,我們翻譯了馬奎斯的《一百年孤寂》,這個中文版被掃描進去大數據庫裡,AI拿去用,那該怎麼付使用費?誰來付?是AI公司還是使用者?付給誰?作者還是譯者?而如果AI只是應用你的某些文字、語料,那怎麼算?如果是臺灣作家的作品被AI吸收引用,那版權該如何處理?
最近媒體報導,傳聞有海外機構向臺灣收購海量的本土版權書籍,書目規模高達15萬種,交易金額推估近1億臺幣。它如果全數進入大數據庫作爲AI生成的參考,那麼作家有沒有權利收取版稅?或只是聽之任之,無可奈何?這些都是有待解決的課題。
這些AI時代的未來課題,充滿未知的挑戰。DS帶出來的課題是:新時代,新工具,絕對不是抵制它,而是怎麼好好使用它,學習它,創造新可能、新機遇。願以此期望於新世代,不要相信政治人物,不要自限,好好開創自己的道路吧!(作者爲作家)