Google 釋出新的機器學習API,開放識別影片中的圖像

記者洪聖壹臺北報導

在以往的應用當中使用者僅能夠過在網站上輸入關鍵字,搜尋文字,這包括文章中的文字,或甚至是相關的圖片,而在未來這項應用,將擴大到影片的識別。未來人們可望透過第三方應用程式,用關鍵字直接搜尋影片當中的資訊

就在稍早,Google 在舊金山舉辦的雲端應用大會「Cloud Next」當中,發表新的機器學習API(稱爲Google Cloud Video Intelligence API),讓開發者得以標記影片當中的場景變化利用 TensorFlow 框架量身訂做機器學習模組工具,藉此自動提取影片當中的實體影像,讓用戶可以在應用程式當中用關鍵字搜尋影片當中的資訊,而且搜尋結果會越來越準確。

舉例來說,未來只要在網站當中搜尋「臘腸犬」,那麼除了圖片跟文字,系統還會跳出內容有臘腸犬的相關影片出來。現場展示的是在搜尋引擎當中輸入棒球海灘等關鍵字,那麼系統可以分別釋出影片當中有棒球、球賽,或是海灘的搜尋結果。

▲搜尋「棒球」,就會出現內有棒球、球棒、球等相關影像的影片搜尋結果。(圖/取自YouTube)

▲搜尋「海灘」,就會出現內有海灘影像的影片搜尋結果。(圖/取自YouTube)

當然,雖然這個 API 相當好用,然而所有的影片都必須要儲存在 Google Cloud 雲端儲存服務當中,若還不熟悉這個工具的開發者,可以到官網註冊私人測試版試用

Google 公司也公開表示,他們希望公開機器學習技術,讓更多開發者得以開發出更方便的應用,除了Google Cloud Video Intelligence API,Vision API 是另一個例子