找出關鍵參數 亦思Yieldata 半導體制程最愛
亦思科技Yieldata大數據分析系統,可加速篩選關鍵參數。圖/亦思提供 文/楊智強
半導體產業明年將進入10奈米世代,隨機臺設備的演進,可擷取的資料更爲繁雜,掌握大數據運算,將有助於產業迅速發展。位於竹科的亦思科技,專精於提供大數據平臺的建置與分析計算等技術,針對大數據分析的應用開發出的Yieldata系統,在半導體業界已獲得大量使用,協助客戶優化製程,利用數據創造更多的黃金。
受限於過去傳統關聯式資料庫的特性,資料量的成長往往使得資料庫的運用受限,不但效能上無法達到要求,對於空間的配置和資料查詢也無法提供有效的解決方案,Hadoop叢集系統的擴充性則因此逐漸被大量應用。叢集系統爲分散式架構,可用來儲存極爲大量的資料與快速計算,且提供良好的擴展性來應付資料量的成長。在Hadoop叢集上可以建立HBase分散式資料庫來處理結構化的資料,亦可利用Spark這類in-memory快速計算技術處理非結構化資料,這些特性都恰恰滿足大量資料分析的需求。
目前在高科技產業的應用中,叢集資料庫主要是用來蒐集FDC(Fault Detection Classification)系統資料庫的資料,及對應機臺設備的紀錄檔Tool Log資料,FDC系統是廣泛應用於晶圓廠的製程監控系統,每個重要的機臺設備都有一對應的FDC系統,該系統可以針對重要的數個參數進行監控,對於異常的參數範圍或是組合來發出警告,但礙於FDC資料庫的資料容量限制與計算速度,每個機臺設備的異常狀況僅能單獨來考慮,而數個機臺設備彼此之間的影響狀況須考量的參數資料過於龐大,需要大數據系統才能進行處理。另外,每個機臺設備還儲存了更巨量的紀錄檔,目前資料擷取的頻率已經到達每0.1秒進行一筆的紀錄,而可以記錄的參數多達數百到上千個,這種巨量的檔案與FDC資料庫之間,再加上數個機臺設備交互的作用,其組合而成的資料變化是傳統方法無法負荷的儲存與計算挑戰。
亦思科技所研發的Yieldata系統,可以進行巨量參數資料的篩選及可能問題參數的排序,可以協助工程師在面對大量未知問題參數時,先找出可能的蛛絲馬跡,再用數學統計相關軟體工具進行更深層分析,對於原本可能耗費很多人力及時間的流程,轉換成爲系統化的資料蒐集與篩選方法,可節省分析時間及提高找尋問題參數的精準度,進一步再串聯生產相關係統數據,達成更完整的自動化效益。