Page 81 - 金融科技力
P. 81
而一 般常 用的 半結 構化 資料 格式 大致 可以 分 為 CSV、 JSON、
XML 等三類,以下就針對這三種格式進行說明:
1. CSV (Comma-Separated Values) 格式資料:可 以從 MS Excel 軟體
以另存檔案方式得到,此格式基本上就是以逗號作為分隔,這 類
的資料以儲存表格形式的資料集為主,較 為複雜的格式或是多層
巢狀結構的資料格式,則無法表示,有時會影響資料呈現的完整
性。
2. XML (Extensible Markup Language) 格式資料:XML 被廣泛作為
跨系統 或 跨平台 之 間資料 交 換的標 準 ,它被 用 來傳送 及 攜帶資
料,說明資料是什麼,而非用於資料的表現或展示。以下的一 個
XML 格式 的案例說 明小明傳 送給小華 的早安問 候訊息記 錄 , 每
個欄位資料透過開始標籤 <#name> 及 結束標籤 </#name> 來表
示,而 <?xml version="1.0"?>這個 標 籤則會 告 訴程式 解 譯器應 採
用 XML 1.0 版本規則進行解析。
3. JSON (JavaScript Object Notation) 格式資料:在網際網路還沒 盛
行之前, XML 作為 跨平台或 跨系統交 換為主流 標準實行 了一 段
時間,因此目前仍然有不少早期的系統程式仍以此為資料交換標
準,然而隨著網際網路 WWW 的流行,對於網路頻寬的不足,漸
漸產生對資料傳輸量的重視,為了提升網路傳輸的效率,一個較
為輕量的 JSON 資料交換格式遂逐漸取代 XML 的使用。以下圖
的資 料為 例, 這份 資料 (Data) 包括 有兩 個 公司的 資 料,公 司分
別是 “AAA Ltd”及 “BBB Ltd”,每個公司各自有一個員工 “John”及
“Mary”,以 JSON 格式表示,它減少了 XML 許多不必要的起始
67