Page 76 - 金融科技力
P. 76

然而更應 該要注意 的是一般 傳統所認 知的大數 據的四大 特 徵

                        (4V),也因為這四項特徵,使得在處理大數據資料格外辛苦及費心,
                        分別是:


                        1.  具大量性的 (Volume):

                               資料的取 得是大量 性的,而 且各式各 樣的來源 資料都可 視為

                          可分析的 母體。例 如累積歷 史性的交 易資料來 進行趨勢 分析;或
                          者根據人 和人之間 常有共同 的想法來 進行預測 分析;又 或者根據

                          長時間蒐 集客戶在 網站上的 點擊記錄 來猜測客 戶的意圖 ,這些都
                          是需要大 量的母體 資料來進 行全量分 析,所以 大數據分 析的應用
                          需要大量的資料。


                        2.  具多樣性的 (Variety):


                               資料的樣 貌是多格 式性的, 甚或是沒 有格式的 。過去應 用電
                          腦系統做 資料處理 時,必須 給予一定 的格式讓 電腦來處 理,這種

                          資料稱為 結構化的 資料。例 如在銀行 開戶時, 一定有帳 號、帳戶
                          名稱、帳 戶類別… 等等,每 一個欄位 的規範都 是定義好 的,按一

                          定的結構 來進行處 理,所以 稱之為結 構化資料 。過去二 、三十年
                          來,金融 行業為分 析客戶行 為所建立 的資料倉 儲系統, 使用的資

                          料大多為 此種結構 化資料。 但結構化 資料約僅 佔大數據 內容中的
                          二成多, 另有七成 屬於非結 構化資料 。所謂非 結構化的 意思,是

                          指資料的 內容沒有 一定的結 構性,也 沒有欄位 的屬性、 長度或是
                          內容的規 範;例如 多媒體資 料、社群 媒體資料 、視訊影 像、感應

                          器 (Senior)  所取得的感知資料等,都屬於非結構化資料。進行大
                          數據分析 時,結構 化資料與 非結構化 資料,都 是可以應 用的資料

                          來源。

                        3.  具不斷傳輸性的速度 (Velocity):


                               隨著時間 軸的轉動 而能不停 產生連續 性而且多 樣性的資 料。
                          從各式各 樣感知機 器的運作 、社群媒 體的發展 或是不間 斷的網路






             62
   71   72   73   74   75   76   77   78   79   80   81