Page 34 - 信用評等模型12堂課-以消費金融為例
P. 34
20
第一節 資料蒐集、品質檢驗
就筆 者過 往 評分模型開發經驗來看,資 料 的 蒐集 往往 是
整 個專案過 程 中 最 繁 複 吃 力 的 工作 , 畢竟 資 料 的 品 質 及其 涵
蓋 範 疇 係 主導 : 最 終 模型的 預測結 果 。模型 鑑 別 力 是 否 合 乎
專案 預期 目 標 ?使用的資 料 變 數 是 否 足 夠 解 釋 應變 數 的產
生?這一切 皆 端賴 完 整良好 的開發資 料 ,來 確 保 評分模型的
效 度與 適 切性。
在資 料蒐集階段 我 們首 要 檢視 的項目如 下 :
一、是否有足夠的壞客戶?
模型開發的 最 終 目的 即 在分 辨 好 壞 客戶 , 倘 若 開發 母 體
本身的 壞 客戶 數 不多,此 會 直接 影響 我 們 找 出 壞 客戶 的 行 為
模 式 , 致 使 缺乏 足 夠 的 樣 本以產生有意 義 的 統 計分析。
二、資料的可得期間是否滿足專案目標? 統 計模型的重要 基礎乃 是利用過去 歷 史 資 料 預測 未來 母
體
假
使資
料
間所
涵蓋
期
性。
母
或未來
行 的表現 結 果 ,此 亦 暗 示 歷 史 資 料 必 須 某 種程 度上具有與現 的產 品 或
似
的相
體客群