Page 34 - 信用評等模型12堂課-以消費金融為例

P. 34

第一節資料蒐集、品質檢驗

就筆者過往評分模型開發經驗來看，資料的蒐集往往是

整個專案過程中最繁複吃力的工作，畢竟資料的品質及其涵
蓋範疇係主導：最終模型的預測結果。模型鑑別力是否合乎

專案預期目標？使用的資料變數是否足夠解釋應變數的產
生？這一切皆端賴完整良好的開發資料，來確保評分模型的

效度與適切性。
在資料蒐集階段我們首要檢視的項目如下：

一、是否有足夠的壞客戶？

模型開發的最終目的即在分辨好壞客戶，倘若開發母體

本身的壞客戶數不多，此會直接影響我們找出壞客戶的行為
模式，致使缺乏足夠的樣本以產生有意義的統計分析。

二、資料的可得期間是否滿足專案目標？統計模型的重要基礎乃是利用過去歷史資料預測未來母

體
假
使資
料
間所
涵蓋
期
性。
母
或未來
行的表現結果，此亦暗示歷史資料必須某種程度上具有與現的產品或
似
的相
體客群

29 30 31 32 33 34 35 36 37 38 39