Page 78 - 金融科技力
P. 78
大數據資料類型
資料依據其組成結構,可以分為以下三種類型:
1. 結構化資料 (Structured Data)
結構化資 料是指採 用特定規 格組成的 數據資料 ,方便利 用電
腦資料庫技術進行管理,每筆資料都有固定的欄位、大小、格 式 ,
每個欄位 亦經過特 別規劃設 計,不同 意義的資 料不會存 在同一個
欄位中, 例如客戶 資料可能 包括姓名 、生日、 連絡電話 、 Email
等屬性資 料。資料 也經過標 準規則要 求的建立 ,例如在 台灣的手
機欄位就只能存放 10 數字位元,而且前兩個位元是 09 開頭 ; 生
日欄位必 須是合理 的日期資 料等,當 然這些規 則也可能 因為後續
變動而調 整,規則 調整後的 資料若有 不符合規 則的地方 ,也需同
時更正,例如為加速郵件的投遞效率,原本 3 碼的郵遞區號調 整
為 3+2 碼的郵遞區號時,原資料中已存在的 3 碼數字,為了投 遞
效率考量,就需將 3 碼的郵遞區號藉由地址規則轉成 3+2 碼的郵
遞區碼。
一般 存在 傳統 資料 庫 (關連式 資料 庫 ) 裡 的資料, 都是 以結
構化資料 的方式存 在,這個 方式將很 方便、有 效率的存 取資料,
並作為處 理、分析 、統計之 用,也容 易提供給 程式進行 自動化的
處理及應 用,加快 資料運用 的效率。 另外為了 呈現整體 資料態樣
或更清楚 看出資料 的輪廊, 坊間也有 不少資料 視覺化的 工具,例
如 IBM Watson Analytics、Sas、PowerBI、Tableau、QlikView 等,
這些工具 軟體透過 長條圖、 圓餅圖、 曲線折線 圖、方塊 圖、泡泡
圖或是地 理圖等的 視覺化資 訊呈現, 讓企業資 料分析人 員快速看
到資料特性及大概輪廊,進而產生商業決策的參考訊息。
64