摘 要:網絡數據庫是重要的電子資源,有著獨特的優勢與良好的發展前景。文章從8個方面分析了國外網絡數據庫的當前特點,並對其未來發展趨勢進行了探討。
關鍵詞:網絡數據庫 電子資源 特點 發展趨勢
On Special Features and Development Trends of Web Databases
ABTRACT As one of important electronic resources, network databases have distinctive advantages and bright prospects. In this paper, the author analyzes the present characteristics of network databases and discuss its development trends. 9 refs.
KEY WORDS Network databases. Electronic resources
近年來,隨著互聯網的擴展和升級,網絡數據庫有了迅猛的發展。及時了解、探討國外網絡數據庫的特點與發展趨勢有助於圖書館對電子資源的評估、引進及其開發利用;同時亦可為國內網絡數據庫開發商提供有益的啟示。
1. 網絡數據庫的特點
網絡數據庫是重要的電子資源,與印刷型文獻及光盤、磁盤等電子出版物相比,網絡版數據庫有著獨特的優勢,正日益受到圖書館及其用戶的青睞。
1.1 數據量大、增長迅速、更新速度快
在國外,數據庫生產已形成規模,走向產業化和商業化,這就使得網絡數據庫的整體發展呈現出以下兩個特點。壹是數據庫規模大、數據量多,增長迅速。如號稱世界上最大學術電子出版物供應商的Elsevier Science,通過ScienceDirtect可在線提供多個數據庫產品服務,包括壹個綜合性的學術期刊全文數據庫、多個專題數據庫、12種參考工具書及15個書目數據庫,可檢索、瀏覽的信息資源包括1500多種全文學術期刊、 5900萬條文摘記錄、2百萬篇學術期刊論文。ISI的Web of Knowledge 信息平臺上目前可提供服務的數據庫有:ISI三大引文索引數據庫、期刊目次庫、多個專業文獻信息及事實數據庫、會議錄及專利信息數據庫;現有數據容量為:核心期刊8600多種、學術會議錄論文記錄2百多萬條,專利信息2千多萬條、化學反應60多萬個、化合物1百多萬個;其數據的年增長量為:12000多個學術會議的22萬多條會議錄論文記錄,收入的期刊數量則以2.3%的速度遞增。
二是數據更新速度快、周期短,如SCI、ISTP、BA、EI等著名文摘索引的印刷版、光盤版壹般為每季度或每月更新,而相應的網絡版數據庫通常是每周更新;電子期刊數據庫的更新通常早於其相應的印刷版,為每周或每日更新;而電子報紙的更新速度則可以以小時、分秒計算。
1.2 品種齊全,內容豐富
網絡數據庫品種繁多,內容豐富。從文獻的加工程度看,既有目錄、索引、文摘等二次文獻數據庫,如ISI的三大引文索引、Biosis Preview、EI Village等,又有期刊論文、會議論文等壹次文獻數據庫,如 Elsevier Science的全文期刊數據庫、IEEE/IEE Electronic Library等。從文獻類型看,既有電子期刊、電子報紙、電子圖書, 如Science、Nature Publishing Group、Springer-Link、netLibrary等,又有學位論文、會議錄、專利、標準等數據庫,如ProQuest的 Digital Dissertations、ISI Proceedings、IEEE/IEE Electronic Library、Derwent Innovations Index等。從學科範圍看,既有單學科的,又有多學科綜合性的,如RSC(化學)、IOPP(物理學)、Lexis.com (法律、法學)、ABI、Business Source Premier(商業與經濟管理)、Elsevier Science 全文電子期刊數據庫(綜合性)、Springer-Link(人文社會科學、自然科學與醫學)。從數據庫的開發與供應看,既有書刊代理商,如,EBSCO、 Blackwell,又有出版商,如Elsevier Science、Springer、John Wiley 、World Scientific等著名出版商,還有研究所、學協會等,如ISI、Royas Society of Chemistry 及Institue of Physics等。
1.3 使用便捷、無時空限制
網絡數據庫借助於互聯網出版發行,除極少數外,絕大多數是連續作業,24小時不停機,通過互聯網為世界各地授權終端用戶提供服務,且同壹數據庫可同時為多人取用。這就為人們檢索、利用數據庫提供了極大的便利,只要網路暢通,用戶足不出戶,即可查找、獲取、利用所需信息資源,無須受信息資源儲存的地理位置及圖書館開放時間的影響與限制,可克服圖書館傳統服務受時空限制的缺陷。
網絡數據庫的用戶界面友好,易於理解、便於使用。首先,網絡數據庫的用戶界面設計通常直觀清晰、圖文並茂,如不同的文獻類型用不同的圖形符號標示,生動直觀;其次數據庫往往設有專門的功能幫助鍵,且幫助信息詳略適當、清晰、便於查閱;第三,對信息資源的查找利用具有選擇與限定的自由,如,可在不同的數據庫或文檔、不同檢索方式之間自由切換與選擇,可對文獻類型、出版時間、出版形式、可檢字段等進行限定與選擇,用戶只需點擊鼠標,即可完成選擇與鏈接操作。這是其他形式的出版物所無法比擬的。
1. 4 數據標準、規範、多元
網絡數據庫的生產標準、規範,如采用超文本、多媒體等先進成熟的信息處理技術,遵循Z39.50等通用的標準、協議與規範,使用Internet Explorer、Netscape等通用、標準瀏覽器,以及PDF格式文檔標準閱讀器Acrobat Reader等,既便於用戶的操作使用,又便於數據的交換與系統的擴展整合,同時也為數據庫的穩定、暢通使用提供了保證。
數據檔案格式多元,可包含更多傳統紙本媒體無法提供的文檔格式。目前,網絡數據庫數據文檔常用的格式有PDF、ASCII(TEXT)及HTML,可滿足不同的需要。此外,Word、PostScript格式文檔亦常有所見,例如在計算機科學領域,有時可發現許多電子期刊全文內還附上了計算機執行檔供使用者取用執行。
圖書館及其網絡終端用戶只須熟悉常見、通用計算機解讀軟件的使用,無需特別加以培訓,即可充分利用網絡數據庫檢索、瀏覽、打印、下載所需信息資源。
1.5 數據庫的檢索功能強
網絡數據庫的檢索功能往往較為強大,這就使得網絡數據庫在信息檢索的檢全率、檢準率以及檢索的靈活性、方便性等方面較之其他形式的出版物更突出、更具優勢。其主要表現在以下幾個方面:
(1)檢索模塊靈活、多樣
除提供基本或簡易檢索模塊,供初學者及壹般用戶使用外。還可提供各種形式的高級檢索模塊,以方便用戶進行限定字段檢索,或使用邏輯算符(AND 、OR和 NOT)、括號、位置算符、截詞符和詞根符等構造檢索式,進行組配檢索,使得檢索更為靈活,更為準確。
(2)檢索途徑(入口)多
除提供關鍵詞、 題名、 著者、刊名及字順等多種檢索途徑外,類似INSPEC、Web of Scince等檢索途徑(入口)多而廣的數據庫將越來越多,前者的字段檢索(Search Fields)提供有40個字段列表,每個字段都可作為檢索入口,後者則提供有分子式等特殊多樣的檢索入口。
(3)擴、縮檢手段靈活、多變
除使用邏輯算符(AND 、OR和 NOT)、括號、位置算符、截詞符和詞根符等符號進行擴、縮檢外;還可對不同的數據庫、文檔、可檢字段(包括關鍵詞(Keyword)、題名(Title)、著者(Author Name)、文摘(Abstract)、全文(Full Text)及所有字段(All Fields)、出版年代、文獻類型(包括圖書、期刊、報紙、文章等)等進行選擇與限定。
1.6 檢索結果的顯示與輸出靈活、多樣
(1)檢索結果的顯示方式靈活、多樣
主要表現在三個方面:壹是每屏顯示的記錄數的限定;二是排序方式的多樣化,可按相關度、出版時間、文獻標題、著者、來源、語言、出版國等多種方式升序或降序排列。如INSPEC數據庫檢索結果的排序方式即多達10種;三是顯示格式的多樣化,可提供題錄(Citation)、 題錄+文摘(Citation+Abstract)、 全記錄(Complete Field)或選擇字段(Select Field)等多種格式顯示。
(2)檢索結果的輸出方式多元化
不僅可提供存盤、 打印方式下載數據,且可利用E-mial發送檢索結果,或將檢索結果直接輸出到文獻信息管理軟件,如ProCite 、Reference Manager、EndNote等中,亦或直接在網上訂購文獻全文。
1.7 數據庫系統具有擴展整合功能
對用戶來說,理想的狀態是:透過壹個數據庫即可迅速查到所需信息並加以取用,系統擴展整合功能可幫助用戶實現其理想。系統擴展整合功能是指數據庫開發商借助互聯網,利用超文本技術,在不同的信息資源之間進行鏈接,將原本相互獨立、但互為聯系的信息資源與服務整合在壹塊,使之形成為壹個互動的有機整體,用戶只需透過同壹界面,即可迅速查到並獲取自己所需要的信息。目前,數據庫供應商提供的系統整合功能主要有以下幾種:
(1)與圖書館館藏的鏈接與整合
目前數據庫供應商提供的鏈接方式有兩種:壹是數據轉入或人工直接輸入;二是單向式或雙向式直接與OPAC鏈接,直接鏈接更為方便、經濟、有效。數據庫與圖書館館藏的整合通常可通過數據的上載和下載實現。數據上載,即將圖書館的紙本館藏記錄上載到數據庫中,對數據庫中只有文摘,沒有全文而本館有紙本館藏的期刊給予館藏標示與鏈接,為讀者提供最經濟、快捷獲取原文資料的信息。數據下載,即將數據庫所收錄的全部期刊的 MARC 數據下載到圖書館的OPAC中,予以揭示。數據庫與圖書館紙本館藏鏈接整合,既便於讀者在圖書館的各種館藏資源中串聯,彌補單壹館藏資源的不足,從而迅速、有效地檢索、獲取所需文獻信息,又便於圖書館充分、有效地揭示、開發與利用其紙本與電子館藏。目前,可提供館藏鏈接與整合功能的數據庫供應商有不少,但整合方式則有所區別。如 SWETSNet 提供LINK-IN/OUT功能;OCLC的 SiteSearch 提供 Web界面,經由Z39.50協議達成整合;EBSCO的EBSCOhost 提供雙向式鏈接。
(2)與其他數據庫的鏈接與整合
由於收錄的文獻範圍、側重點的不同,數據庫之間往往既交叉重復,又詳略不等。若能在彼此間進行鏈接,即可幫助用戶獲取更為詳細、更為豐富的相關信息,有利於科研創新與發現。ISI為擴展系統整合功能而特別建立的ISI Links即可滿足這種要求。ISI Links通過在不同的數據庫之間進行鏈接,將各種不同來源的數據庫加以整合,使得用戶只需透過同壹的界面進行檢索,即可迅速高效地找到自己所需的信息。目前,ISI Web of Knowledge平臺可在ISI Web of Scienc、ISI Proceedings、CCC、JCR、BIOSIS Previews、ISI Chemistry、Derwent Innovation Index、NCBI GenBank及INSPEC等數據庫之間進行雙向鏈接。如透過ISI Chemistry所進行的文獻調研可以經由Web of Science獲得更多的相關文獻的資料,而在Web of Science中所找到的文獻又可透過ISI Chemistry 獲得更為詳細的反應信息。
(3)與原始文獻的鏈接
即系統利用超文本鏈接功能,為用戶直接提供其在數據庫,尤其是書目、索引、文摘數據庫中查到的相關文獻的原始文獻鏈接。在書目索引文摘等二次文獻數據庫與全文數據庫之間建立鏈接,可幫助用戶迅速、直接訪問、獲取所需原始文獻信息,克服二次文獻數據庫的固有缺陷,增強數據庫的全文提供能力,同時,亦可提高全文數據庫的利用率,於讀者、於圖書館而言均是十分有利的。目前,數據庫供應商提供原始文獻鏈接的方式主要有兩種,壹是鏈接到出版商的電子期刊全文,二是鏈接到相應的全文數據庫。例如,ISI已與Academic Press、Americn Institute of Physics 、Elseriver 等16個機構建立了友好的合作關系,可鏈接到的數百家出版商的數千種全文電子期刊。CSA (Cambridge Scientific Abstracts)數據庫的做法與此相似。EBSCO則通過EBSCOhost Electronic Journals Service (EJS),在 PsycINFO、 Socilogical Abstracts、 ERIC、 MEDLINE、 Econlit、CINAHL 、HealthSTAR 、Life Sciences(CSA)等索引文摘數據庫中直接提供出版商以及Academic Search Elite、BioMedical FullTEXT Collection等全文數據庫中相關電子期刊的全文鏈接,EBSCOhost EJS可鏈接的期刊現有8000種,可鏈接的全文期刊論文達340萬篇。目前,可提供該種整合功能與服務的數據庫還有OCLC 的ECO、SWETS等,但前提是圖書館必須訂購這些全文數據庫或相應電子期刊的紙本形式。
(4)與Internet 信息資源的鏈接
Internet中包含著豐富的信息資源,網絡數據庫利用網絡便利,可提供相關的Internet信息資源檢索與鏈接,讀者只需輸入壹個檢索式即可同時檢索數據庫及Internet 中的相關信息。該種鏈接不僅可補充、擴展數據庫資源,且可為用戶快捷、有效地利用Internet信息資源提供方便。如ISI 的專家對3700多個經過嚴格評估的學科站點的學術文獻進行標引,通過Current Contents eSearch,用戶可在檢索期刊文獻的同時,檢索、瀏覽14萬篇全文Web文獻。值得壹提的是,ISI的互聯網文獻的鏈接是基於每壹篇以網頁形式出現的學術文獻具體內容的檢索與標引,更細微、更深入。目前,可提供Internet信息資源檢索與鏈接服務功能的數據庫有CAS(Cambridge Scientific Abstracts)的Internet Databases Service (IDS)、EBSCO 的EBSCO Host、OCLC 的FirstSearch、、SliverPlatter 的SliverLinker等。
1.8 可提供相關電子信息服務
數據庫產品與服務緊密結合,這是網絡數據庫的又壹顯著特征。目前,數據庫開發商提供的相關電子信息服務主要有:
(1) 文獻傳遞服務,當用戶從二次文獻數據庫中查到所需信息並希望得到文獻全文時,可通過電子方式在線訂購所需要的文獻全文。原文訂購若選擇電子文獻傳遞方式,壹般在24小時內即可獲得所需文獻,方便、快捷,可彌補書目索引文摘等二次文獻數據庫不能提供全文的不足。
(2) 定題服務,與傳統的定題服務提供相似,基於網絡數據庫的定題服務允許圖書館及其用戶根據需要開展多種形式的SDI服務。目前,數據庫供應商提供的SDI服務主要有兩種。壹是指定參考用書(reserved list)服務,即系統提供圖書館依主題方式整理出類似所謂的指定參考用書(reserved list)功能選項,從而達成專門的SDI服務。
二是個性化文獻報導服務,即由用戶創建自己的檢索策略,系統定期將符合條件的檢索結果傳遞給用戶。例如,Uncover的最新文獻報導服務(Uncover reveal) 由用戶選擇自己感興趣的關鍵詞或期刊(最多可選50種)建立用戶需求文檔,系統每周壹次,自動地將相關文獻及用戶所選期刊的最新壹期目次信息發送到用戶的Email信箱,用戶只需定期查看自己的Email信箱,即可及時了解最新研究動態。而ISI的個性化信息代理服務( Discovery Agent, 又稱個性化定題快訊服務),則是ISI基於其現刊題錄數據庫 Current Contents高質量的信息資源而建立的。利用Discovery Agent ,用戶可根據需要,按主題、編著者、期刊名、地址/機構等項目自行制定、管理和編輯自己的檢索策略,並不斷檢測檢索結果以獲得最合適的檢索策略,隨後系統便會每周將基於該檢索策略的檢索結果通過Internet Web 傳送給用戶,其傳遞方式主要有兩種:即Email和 Web發布加上Email通知,需要時可通過電子方式訂購由ISI Document Solution所提供的全文。個性化文獻報導服務直接面向網絡終端用戶,個性化特色鮮明,與全文傳遞服務配合使用,可實現用戶自行操作、完成由建立檢索策略、查看檢索結果到訂購原始文獻的文獻檢索與獲取全過程的良好結合與循環,從而幫助用戶方便、及時地了解、追蹤、獲取自己真正需要的最新信息(包括題錄、文摘信息及原始文獻),減少信息查詢負擔,提高工作效率。
近年來,國外網絡網絡數據庫發展迅速,已形成壹定的規模,但仍存在壹些問題與不足,主要是:網絡是必要條件,壹旦斷網或無網,數據庫即無法使用;數據庫內容存在交叉重復,如ABI與BSP、ARL與ASP;高水平學術電子期刊的品種與數量有限;數據庫的開放程度有限,給數據庫之間的整合帶來困難;數據庫的購買模式過於單壹,不夠靈活等。
2. 網絡數據庫的發展趨勢
網絡數據庫作為壹種主要的電子資源,其獨特的優勢在網絡環境下日益突顯。隨著計算機、通信網絡與信息技術的不斷發展,未來幾年網絡數據庫將繼續呈現出良好的發展勢頭,成為圖書館發展電子館藏、開展電子信息服務的重要資源與基礎。
2.1 學術電子期刊迅速增長
在發展初期,由於數據庫品種與數量有限,選擇範圍小,圖書館及其用戶對數據庫的要求不可能也無法要求太高、太多。但是,隨著圖書館電子資源建設與電子信息服務的深入發展,圖書館及其用戶對電子資源的需求將不斷增加,要求亦將越來越高,將更加註重數據庫的內容。書目索引文摘等二次文獻數據庫及普通期刊全文數據庫將不再能滿足圖書館,尤其是學術圖書館及其用戶的需求,人們迫切需要高品質的學術電子期刊。未來幾年,高品質的學術電子期刊是最具發展前途的,將迅速增長。據了解,越來越多的著名學術出版商、研究機構以及專業學協會,例如Springer-Verlag、John Wiley、World Scientific、Science、Nature Publishing Group等著名出版商以及英國皇家化學學會(RSC)、英國物理學會(IOP),美國計算機學會(ACM)等正在或擬在近期將其紙本期刊電子化,或者直接創辦新的電子期刊。國外有專家預測,未來5年之內,在萬維網上將可看到所有重要的自然科學、工程技術與醫學學術期刊。屆時,學術圖書館的電子期刊與紙本期刊的結構比例將發生變化。
2.2 電子圖書迅速蔓延
繼電子期刊後,電子圖書潛在的巨大市場將引發出版社、數據庫開發商及其代理商新壹輪的競爭與合作,其結果必然是電子圖書的迅猛發展。OCLC的netLibrary已獲得10余家大學及其他出版社電子圖書的發行權,現有電子圖書4萬種,2003年計劃在此基礎上新增2萬種電子圖書。Springer現有電子圖書1300余種,並已成功將The Series Lecture Notes in Computer(LNCS)、 Lecture Notes in Mathematics、 Lecture Notes in Physics等20套叢書中的1000余種書電子化,這些叢書及其他圖書的電子化工作將持續進行。John Wiley繼2000年提供參考書在線服務後, 2001年11月又推出了在線圖書Online Books, Online Books現有電子圖書(手冊、專著等)180多種,內容涉及化學、生命科學與醫學、電子工程/通信等多個學科領域,預計2002年底可達300種。 ProQuest 的Safari Tech Books Online則將電子圖書的重點放在IT領域,號稱可提供50%以上已出版的IT圖書,且通常情況下,新電子圖書的提供將先於其印刷版。此外,Safari Tech Books Online 還具有較強的擴展與整合功能。難怪國外有專家預測,未來幾年將是互聯網上電子圖書迅速蔓延的時期。從上述實例,我們不難預測,未來幾年,電子圖書將成為電子資源新的增長點。電子圖書不僅在數量、品種和範圍上有大的增長,且在結構、功能上有所發展,此外,電子圖書的購買模式將更為靈活、多樣。
2.3 文獻全文取用即時方便
為了滿足圖書館及其用戶快速方便地獲取所需原始文獻的需要,實現信息檢索、原文獲取的壹體化,數據庫開發商與集成商日益重視數據庫原始文獻的提供,以強化數據庫原文取用的即時性與方便性。其實現途徑主要有以下幾種:
(1)不斷開發新的電子期刊全文數據庫。未來幾年電子期刊,尤其是高品質的學術期刊將迅速增加。此外,學術期刊過刊數據庫回溯建設將進壹步豐富全文電子期刊的品種與數量。例如,Elsevier Science已於2001年1月啟動過刊數據庫項目(Backfiles Program), 計劃用3年時間,即到2003年底,完成其所收入的1500余種期刊中1995年以前出版的約300-350萬篇期刊論文的回溯建庫。屆時,透過ScienceDirect可檢索、瀏覽的期刊論文全文將多達800萬篇、約4千萬頁。
(2)增加現有數據庫中全文期刊的品種與數量,如Bell & Howell 公司(原UMI公司)的學術期刊圖書館( Proquest Research Library)1999年收錄的報刊總數為2308種,其中,全文刊為1472種,2000年報刊總數達2345種,全文刊則增至1533種,2002年全文刊增至1700多種。 EBSCO的學術全文數據庫(Academic Search Elite),1999年收錄期刊3215種,其中,全文期刊996種,2002年其升級版Academic Search Premier收錄的期刊達4425種,其中,全文期刊增至3467種。Elsevier Science的ScienceDirect 期刊數據庫2000年收錄期刊1100多種,2002年初增加到1200多種, 2002年5月成功收購IDEAL,將包括Academic Press、Mosby、Churchill Livingstone, W.B. Saunders等出版商在內的335種全文期刊納入其系統,使其期刊總數增至1500多種,成為目前世界上最大的全文期刊數據庫。
(3)提供原始文獻鏈接,方式主要有四種。壹是鏈接到出版商的電子期刊全文,例如,ISI近期將與Cambridege University Press、OCLC、Project Muse 等機構建立友好的合作關系,屆時ISI的合作夥伴將近20個,可進行全文電子期刊鏈接的出版商將多達2300家,ISI的最終目標是力爭與其收錄的8000多種期刊種的所有電子版全文進行鏈接。二是鏈接到相應的全文數據庫;三是鏈接到互聯網上的文獻全文;四是鏈接到圖書館的紙本館藏期刊。
(4)直接在網上訂購文獻全文。
剩下的通過郵件發給妳