正文 數據交換實現模式分析(1 / 2)

數據交換實現模式分析

技術研發

作者:葛建新

摘 要 隨著互聯網的廣泛普及以及用戶計算機數量的劇增,各種數據呈現爆發式增長,其具有來源廣泛,類型各異等特點。數據交換需要提供數據載體對異構數據庫中的數據進行數據描述。XML和CSV作為兩種數據描述語言,具有各自的特點,文章對兩者進行介紹和比較並介紹了數據交換的實現模式。

關鍵詞 XML;CSV;數據交換

中圖分類號:TP39 文獻標識碼:A 文章編號:1671-7597(2014)10-0042-01

Abstract:As the number of the widely spread of the Internet and computer users increasing, various data show explosive growth, which has a wide range of sources, different types of features. Data exchange need to provide data support for data description of the data in the heterogeneous database. XML and CSV as two kinds of data description language, have their own characteristics, this article in carries on the introduction and comparison and further introduces the realization mode of data exchange.

Key Words:XML;CSV;Data exchange

1 XML和CSV數據描述語言比較

1.1 XML語言描述

可擴展置標語言(eXtensible Markup Language,簡稱XML),又稱可擴展標記語言,是一種置標語言。置標指計算機所能理解的信息符號,通過此種標記,計算機之間可以處理包含各種信息的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,比如HTML,也可以使用像XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。XML是從標準通用置標語言(SGML)中簡化修改出來的。它主要用到的有可擴展置標語言、可擴展樣式語言(XSL)、XBRL和XPath等。

1.2 CSV介紹

逗號分隔型取值格式(英文全稱為Comma Separated Values,簡稱CSV),是一種純文本格式,用來存儲數據。在CSV中,每一行都對應表中的行,數據的字段由逗號分開,每個字段都對應一個表中的數據項。由於CSV文件格式非常簡單,並支持幾乎所有的電子表格和數據庫管理係統,所以CSV文件常常被用於兩個不同的計算機程序的移動表格數據,例如關係數據庫程序和電子表格程序。許多編程語言提供了庫支持CSV文件。因此該格式廣泛應用於數據的導入和導出。

在計算機科學方麵,這種類型的格式是所謂的“平麵文件”,因為隻有一個表可以存儲在CSV文件。大多數係統都使用了一係列的表來存儲他們的信息,因此往往信息重複幾次,才能創建一個文件。

1.3 XML同CSV比較

1)應用XML可以使用XPath,XML Schema,XSLT這些宣告性(Declarative)的技術,如果用CSV就要用程序性(Procedural)的方式來達到同樣的效果。宣告語句比程序語句更容易維護,換句話說就是CSV中無法包含屬性定義信息,所以要編寫相應的解釋程序,大大增加了編程量。