Page 86 - NO.165銀行家雜誌
P. 86
特別報導
Special Issue
金融業的大數據分析,非常重視數據整理、數據建模,通常還得將結論圖像化、影像化。(圖/達志影像)
資料品質決定分析品質 資料正確性高低,決定大數據分析預
測的價值。張惠欣建議,因為資料可能來自多
「其實,在全球金融業共同遵守的《巴 個源頭,紀錄格式不一,金融業應先建立統一
塞爾協定》(Basel Accord)中,便已明文 的標準、規格,並以此標準、規格,重新整理
規範,金融業應如何界定資料品質。」張惠 資料,否則很可能誤刪諸多寶貴、甚至關鍵的
欣引用《巴塞爾協定》,說明品質優良的資 資料,「最常見的情況是,有些機構習慣以西
料,應符合攸關性高、完整性高、正確性高 元紀年,有些機構堅持以民國紀年,有些紀錄
等3個條件。 以月為單位,有些紀錄則以季為單位,若不統
攸關性,指資料內容與大數據分析目的的 一,分析便易失焦、失真。」
關聯性;若目的是為評估信用風險,資料內容
與信用風險攸關性越高,其分析價值越高。 社群網路留言亦是資料
長期資料的完整性,必定高於短期資
料。但張惠欣提醒,若金融業大數據分析的 與 其 他 產 業 的 數據相較,金融業的數
目的,屬性偏穩定、保守,就需要完整性較 據精準甚多。張惠欣說,人們在買衣服、辦
高的資料,「如用於評估信用風險,金融業 手機時,所填寫的客戶資料,或不甚精確,
必定期待建立不易波動的模型,不要一直變 或故意造假,「金融業會嚴格查核客戶填寫
來變去,難以追蹤、掌控」;若目的是為發 的資料,有時還要求客戶提供證明、檢附證
想行銷方案,僅需短期資料即可,完整性不 件,不同業者還會互通資料,故其資料價值較
必太高。 高。」
86 台灣銀行家2023.9月號
1 5% JOEE