Page 86 - NO.165銀行家雜誌
P. 86

特別報導
               Special Issue


































              金融業的大數據分析,非常重視數據整理、數據建模,通常還得將結論圖像化、影像化。(圖/達志影像)



              資料品質決定分析品質                                            資料正確性高低,決定大數據分析預
                                                               測的價值。張惠欣建議,因為資料可能來自多
                  「其實,在全球金融業共同遵守的《巴                            個源頭,紀錄格式不一,金融業應先建立統一
              塞爾協定》(Basel  Accord)中,便已明文                       的標準、規格,並以此標準、規格,重新整理
              規範,金融業應如何界定資料品質。」張惠                              資料,否則很可能誤刪諸多寶貴、甚至關鍵的

              欣引用《巴塞爾協定》,說明品質優良的資                              資料,「最常見的情況是,有些機構習慣以西
              料,應符合攸關性高、完整性高、正確性高                              元紀年,有些機構堅持以民國紀年,有些紀錄
              等3個條件。                                           以月為單位,有些紀錄則以季為單位,若不統
                  攸關性,指資料內容與大數據分析目的的                           一,分析便易失焦、失真。」
              關聯性;若目的是為評估信用風險,資料內容
              與信用風險攸關性越高,其分析價值越高。                              社群網路留言亦是資料
                  長期資料的完整性,必定高於短期資
              料。但張惠欣提醒,若金融業大數據分析的                                   與 其 他 產 業 的 數據相較,金融業的數
              目的,屬性偏穩定、保守,就需要完整性較                              據精準甚多。張惠欣說,人們在買衣服、辦

              高的資料,「如用於評估信用風險,金融業                              手機時,所填寫的客戶資料,或不甚精確,
              必定期待建立不易波動的模型,不要一直變                              或故意造假,「金融業會嚴格查核客戶填寫
              來變去,難以追蹤、掌控」;若目的是為發                              的資料,有時還要求客戶提供證明、檢附證
              想行銷方案,僅需短期資料即可,完整性不                              件,不同業者還會互通資料,故其資料價值較
              必太高。                                             高。」






         86   台灣銀行家2023.9月號






   1                  5%     JOEE
   81   82   83   84   85   86   87   88   89   90   91