數據不言自明。
數據可以用標準工具處理。
可以使用標準工具查看數據。
使用樣式表可以很容易地生成相同數據的不同視圖。
XML格式的第壹個主要好處是數據是自描述的。每個數字的含義都很清楚,不會和數字本身產生錯誤的關聯。在閱讀文檔時,用戶明白2中2指的是命中次數,而不是得分或防守。如果打文件的打字員漏打了壹個數字,也不會導致後面所有的數字都錯。HITS就是HITS,即使它前面的RUNS元素丟失。
在本書的第二部分,讀者將會看到XML也可以使用DTD來實施限制,因此某些元素,比如HITS或RUNS,必須存在。
第二個優點是,XML提供的數據可以由各種具有XML處理能力的工具處理,從相當昂貴的軟件(如Adobe FrameMaker)到免費軟件(如Python和Perl)。數據量可能很大,但是數據的額外冗余允許更多的工具來處理它。
看數據的時候,也有這樣的問題。XML文檔可以加載到Internet Explorer 5.0、Mozilla、FrameMaker 5.5.6和許多其他工具中,所有這些工具都提供了獨特而有用的數據視圖。數據也可以加載到簡單的文本編輯器,如虛擬儀器,BBEdit和文本墊。這使得數據或多或少可以在多個平臺上查看。
使用新軟件並不是獲得不同數據視圖的唯壹方法。在下壹節中,我們將為棒球統計數據創建壹個樣式表,以提供壹種完全不同的方式來查看圖4-1中的數據。每次對同壹個文檔應用不同的樣式表,都會看到不同的圖片。
最後,問問自己,文件大小真的是個問題嗎?目前硬盤的容量是相當大的,可以存儲很多數據,即使不保存也沒多大關系。同時,XML文件的壓縮率非常高。兩大棒球聯盟1998所有統計的文件是653K。如果用gzip壓縮,只有66K,差不多壓縮了90%。先進的HTTP服務器,如Jigsaw,可以不經解壓縮發送壓縮文件,因此文檔使用的網絡帶寬與它們的實際信息內容相當接近。最後,不能認為二進制文件格式(尤其是通用格式)就壹定高效。包含1998statistics.xml文件相同數據的Microsoft Excel文件大小達到2.37MB,比xml格式大3倍多。雖然我們可以創建更有效的文件格式和編碼方法,但簡單性並不是必需的。
/data/4/0292663753460.htm