Page 117 - 金融科技力
P. 117

去辨識及分類剩餘 90 張照片。因為已經有辨識的依據,所以預 測
                          出來的結果通常比純非監督式學習準確。


                        4.  強化式學習:


                               機器自己 嘗試錯誤 並且找出 最佳答案 ,透過每 一次與環 境互
                          動來學習。強化式學習的特色是訓練必須要有正負反饋  (Positive

                          / Negative Reward),在訓練過程中,模型會根據不同的狀況嘗試
                          各種決定,再 根據此決定,告訴機器所採取的哪一步是正確的 (正

                          反饋 )、 那 一步是錯 誤的  (負反 饋 ), 根 據反饋的 好壞,機 器自 行
                          逐步修正 、最終得 到正確的 結果。若 機器自行 辨識特徵 與分類,

                          將某張大 象的照片 預測成獅 子,則人 類告訴機 器是錯誤 的  (負反
                          饋 ),機器會再次辨認特徵及分類。透過一次一次正確與錯誤 的學

                          習,最後 的預測將 會越來越 精準。例 如:進行 圍棋遊戲 時,必須
                          依照對手 的每一步 棋來修正 下一步的 走法,或 是自動駕 駛車,必
                          須依照路況的變化,來修正下一步要怎麼行駛等。











































                                                                                                         103
   112   113   114   115   116   117   118   119   120   121   122