Page 87 - 信用評等模型12堂課-以消費金融為例
P. 87
73
算
方
WOE
的計
下
:
式
如
Distr Good
i
WOE = ln
i
Distr Bad
i
其中,
i : 特徵變 數 分 箱 的組 別
Distr Good : 各 分組中 好 件 占 全 體好 件 的 比 例。
Distr Bad : 各 分組中 壞件 占 全 體 壞件 的 比 例。
以表 6-1 為例, 特徵變 數 年 紀 (Age) 的分 箱 群 中, 年 紀
23 至 26 歲 的分 群 ,其 WOE 值為 :
13 . 61 %
WOE = ln = − 0 . 7261
i
28 . 13 %
由公 式 可看出 WOE 值表 述 各 分 箱 內 樣 本的 好 件 對 壞件
的 比率 , 換 言之 , WOE 值表 述該 特徵變 數 中 各 個屬性
(Attribute) 的風險 程 度大 小 。 WOE 值愈高,代表 該 屬性的
風險 程 度愈 小 , WOE 值愈低,代表 該 屬性的風險 程 度愈
大。
(二)虛擬變數
(dummy
,
變
名
目
或
羅吉斯迴歸
variable) 另外 。在 亦 利用 每 一個 來 變 數 分組 設 置 虛擬 尺 度的 數 變 數 ,例
說
離散
,
如性 別 、 學歷 、 婚姻狀態 等並不 適 宜 ,以 區 間 尺 度為例, 每