Page 117 - 金融科技力
P. 117
去辨識及分類剩餘 90 張照片。因為已經有辨識的依據,所以預 測
出來的結果通常比純非監督式學習準確。
4. 強化式學習:
機器自己 嘗試錯誤 並且找出 最佳答案 ,透過每 一次與環 境互
動來學習。強化式學習的特色是訓練必須要有正負反饋 (Positive
/ Negative Reward),在訓練過程中,模型會根據不同的狀況嘗試
各種決定,再 根據此決定,告訴機器所採取的哪一步是正確的 (正
反饋 )、 那 一步是錯 誤的 (負反 饋 ), 根 據反饋的 好壞,機 器自 行
逐步修正 、最終得 到正確的 結果。若 機器自行 辨識特徵 與分類,
將某張大 象的照片 預測成獅 子,則人 類告訴機 器是錯誤 的 (負反
饋 ),機器會再次辨認特徵及分類。透過一次一次正確與錯誤 的學
習,最後 的預測將 會越來越 精準。例 如:進行 圍棋遊戲 時,必須
依照對手 的每一步 棋來修正 下一步的 走法,或 是自動駕 駛車,必
須依照路況的變化,來修正下一步要怎麼行駛等。
103