中國早在幾年前就提出了“科教興國”的戰略口號,鄧小平同誌也說過“科學技術是第壹生產力”,江澤民同誌的“三個代表”理論更是強調“* * *黨員必須是先進文化的代表”,學術期刊是科學技術和先進文化的載體。面對世界經濟日益壹體化的趨勢,面對信息傳播技術和信息處理現代化水平的提高,作為載體的學術期刊應率先行動,對此充滿期待。
科學技術研究的最終成果主要表現在三個方面:發表科學論文、獲得科技成果獎和獲得社會經濟效益。科技論文壹般是指發表在具有壹定學術水平的專業學術期刊上的研究論文。它是科技活動和成果的主要形式,也是科學研究最直接的產出形式之壹。科學論文的數量和質量,在壹定程度上反映了科學研究的成果和效率,尤其是論文的水平,是評價壹個國家、壹個單位和科研人員科技能力和水平的重要指標。通過對科技論文的定量分析,對科技產出能力和科技水平做出了總體評價。國內外的管理者進行了許多有益的研究和嘗試,如運用模糊數學模型分析等方法。其中,文獻計量學分析方法是近年來廣泛使用的定量分析方法之壹。
文獻計量學是壹門新興學科。它從定量的角度,運用數理統計的方法,研究文獻系統的分布、結構、數量關系和定量管理,進而探討文獻的變化規律和科學管理。近年來,文獻計量學的研究成果已廣泛應用於情報學以外的科技領域。其中壹個重要的方面就是利用文獻計量學指標來評價科技生產效率,以便決策者有效地對科技研究進行量化管理。簡單的文獻計量學指標,如發表作品數、發表論文數、被引次數等。,已廣泛應用於各部門,作為員工考核、獎懲、晉升的評價依據。這些簡單的指標結合起來,就可以評價大學、科研院所、工業公司乃至整個國家的科技水平和影響力。10年來,文獻計量學取得了長足的進步,取得了許多成果,各方面日趨成熟,研究水平日益深入,定量描述的手段和方法日益完善。同時,要尋求更系統、更全面的數據收集,更現代化的文獻數據處理手段,最終有效地指導文獻信息工作。
近年來,文獻計量學的應用範圍不斷拓寬,應用研究的力度明顯加大,特別是在科技管理和決策方面,越來越受到相關領導部門和研究者的重視。國外對此非常重視。例如,美國、英國、匈牙利、印度等許多國家不僅把文獻計量學作為科學計量學指標體系的重要組成部分,而且認為它是從管理學角度衡量壹個國家科學文化水平乃至綜合國力的重要途徑和有效方法。早在20世紀60年代,美國就開始編制科學引文索引(SCI)。這壹大型索引的出版發行,為文獻計量學研究提供了強有力的工具,在壹定程度上解決了文獻計量學應用所必需的大量數據,有效推動了文獻計量學的全面發展,被譽為文獻計量學史上劃時代的研究成果。可以說,沒有SCI就沒有現代文獻計量學。我國著名學者趙洪洲、蔣國華等采用文獻計量法對國內各大高校發表的論文進行排名,並以“學術排行榜”的名義在報紙上發表,引起了社會各界的強烈反響,得到了國家科委、中科院和國家自然科學基金委領導的高度重視。自1987以來,國家科委委托中國科學技術信息研究所(現更名為中國科學技術信息研究所)對1983以來我國學者發表的論文進行統計分析,以評價我國學科發展、科技投入與產出以及科研機構和科技人員的成果。接著,國家科委下達了專項資助項目,要求中國科技信息研究所對文獻信息進行更廣泛、更系統的統計分析,對我國在世界上的科技水平和各大高校、科研院所的科研生產能力和學術水平做出客觀評價,並逐步形成每年召開新聞發布會公布相關統計結果的制度。從1998開始,中國科學院文獻信息中心也逐年發布《中國科學計量指標:論文與引文統計》(以下簡稱《指標集》)。集合中有100多個統計指標。本文運用科學計量學和文獻計量學的方法,從整體上客觀地描述了中國科技論文的生產率、影響力和分布狀況。本書內容包括:統計源概況、機構研究計量統計、國家重點實驗室和部門開放實驗室研究計量指標、區域研究計量指標、科技基金計量指標、合作研究計量指標、人才研究計量指標、文獻評價計量指標。近年來,國家自然科學基金在文獻計量學和科學計量學方面連續資助了6個研究課題,促進了其研究的規模、檔次和水平,從而有效地推動了文獻計量學的深入發展。由於文獻計量指標的評價功能與其他社會評價指標的評價功能相壹致,其研究成果和計量數據能夠為相關部門的管理和決策提供量化依據和支持,因此越來越受到相關領導和管理部門的重視。這壹重要進展表明,文獻計量學的壹些內容和方法正從學科研究向事業發展,成為國家科技文化的組成部分。這將有助於文獻計量學突破傳統局限,增強其滲透力和輻射力,大步邁入“科技圈”、“管理圈”、“決策圈”,在更大範圍內充分發揮作用,進壹步獲得社會各界的認可和重視。這是20世紀90年代以來文獻計量學研究和應用發展的顯著特點和趨勢之壹。
2.國內外地學文獻統計分析系統
國內外地學文獻統計分析系統建立的背景
文獻計量學的應用是建立在大量數據的基礎上的,因此需要利用計算機等現代手段建立正式的文獻計量學工具,為應用提供大規模數據的獲取途徑和來源,只有依托合適的文獻計量學數據庫才能進行。目前國內文獻計量學研究多以SCI為數據源進行統計研究。但在本研究進行的項目調查中發現,SCI創立時間短,溯源性還不如壹些歷史悠久的傳統檢索工具(如在地質學上有200多年歷史的GeoRef)。SCI雖然收錄了5000多種期刊,但由於專業覆蓋面廣,每個學科的數量都不夠。而且SCI對各個學科的重視程度不同,所以各個科學之間的數據沒有可比性。另外,SCI中沒有“分類號”,用它進行某壹學科的統計是非常困難的。壹些文獻統計項目為了利用SCI進行各學科的綜合統計研究,不得不花費大量的人力對原始數據進行重新分類和輸入,這些數據可以反映數據源選擇是否得當,極大地影響了統計工作的結果和效率。可以認為,利用SCI分析論文在國內外不同學科、不同領域的分布和變化趨勢,對論文所采用的分析和檢驗方法的統計分析,以及對論文地區分布的統計分析都不能滿足要求。因此,項目組自行設計並完成了國內外地學文獻統計分析系統。
國內外地學文獻統計分析系統
國內外地學文獻統計分析系統應用數據庫技術和公共查詢系統技術,實現地學文獻的存儲、查詢、分析和輸出,實現地學文獻的信息化管理。
(1)系統操作環境:
A.服務器:WINDOWS NT及以上平臺,PIII 800,RAM/256M,Disk/20G;;
B.客戶端:DINDWOS 9X或WINDOWS NT及以上,PII 350,RAM/64M,Disk/9G;;
C.網絡:互聯網;
D.數據庫:MS-SQL 2000。
(2)系統結構:
國內外地學期刊統計分析系統的設計采用三層B/S架構,包括客戶端、應用服務器、Web服務器和數據庫服務器。這種方式也叫瘦客戶端系統,客戶端沒有或者很少應用代碼。客戶端負責數據結果的顯示和用戶請求的提交。應用服務器和Web服務器負責響應和處理用戶的請求。數據庫服務器負責數據管理。所有的空間數據和應用都放在服務器端,客戶端只做請求,所有的響應都在服務器端完成。其中,Web服務器位於系統的中間,是原型系統的樞紐和核心部分,是系統設計和實現的關鍵。系統結構如圖1所示。系統前端是客戶端/瀏覽器,中間是Web服務器,後端是Sql Server。
圖1國內外地學文獻統計分析系統應用結構圖
(3)系統的總體功能:
A.數據庫管理:實現數據的輸入和維護、查詢、顯示和輸出。該系統還提供Web環境下的數據管理,可以遠程或本地編輯、瀏覽和維護數據信息。
B.系統可以進行文獻計量學的初步評價和總體評價:根據文獻查詢結果,對學科、課題、作者、研究單位、研究領域的相關性進行統計和分析。
c數據交換功能:系統可以將數據轉換成其他標準格式,如2709等國家標準數據。
該系統有壹個完整的桌面管理和幫助系統。
(4)系統結構框圖(圖2)和主要功能框圖(圖3)。
圖2國內外地學文獻統計分析系統框圖。
(5)系統的開發和應用環境:在中文WIN2000下使用SQL2000、ULTRADEV和VBSCRIPT進行開發。
國內外地學文獻統計分析系統數據源的選擇
國內外地學期刊統計分析系統的建立主要收集和利用GeoRef檢索系統(以下簡稱GeoRef)和中國地質文獻數據庫與檢索系統(以下簡稱GDS)作為數據源。GeoRef是美國地質調查局信息中心建立的地學文獻數據庫,中國地質圖書館1982引進。該數據庫收錄了1785以來北美地區和1933以來世界其他地區的地質文獻,包括5000多種國際公認的地球科學領域的期刊和會議資料,共約220萬篇,涵蓋了近40個地球科學門類。它是目前世界上最權威的地質文獻檢索數據庫。中國地質圖書館建設的GDS,收錄了65438至0985年400余種期刊、專著、論文和國際會議中文資料,累計文獻量20余萬冊,涵蓋地球科學、土地科學等40個門類。是中國地球科學和土地科學研究領域最大的檢索系統,也是中國最權威的地質文獻數據庫。選擇上述兩個數據庫作為本系統數據來源的主要原因:①《GDS》的基本結構和出版物選擇原則符合GeoRef,數據庫基於文獻計量學的結果;(2)兩個數據庫都有嚴格的出版物選擇標準,收錄的文獻種類也很多,即國家級單位主辦的地球科學雜誌都會收錄,壹些發行區域有限的地方政府主辦的地球科學雜誌也會收錄;(3)兩個數據庫采集時間較長,GeoRef有200年的數據,GDS有近19年的數據,非常適合我們分析多年的地球科學論文;④兩個數據庫分類體系的建立,既遵循了地球科學的學科分類,又從文獻檢索的實際需要出發,GDS參考了GeoRef的類目名稱(表1,表2)。因此,根據喬治和GDS得出的分析結果應代表國內外地球科學的研究水平。缺點是兩個數據庫都缺乏引文分析。
圖3國內外地學期刊統計分析系統主要功能示意圖。
表1各種主體使用代碼的GeoRef數據列表
表2 List數據主體使用的代碼列表
繼續的
3.國內外地學期刊統計分析實例
國內外地學期刊統計分析是利用國內外地學文獻統計分析系統,檢索和提取科技人員和研究機構發表論文數量的統計數據,確定科技人員群體和研究機構的學術名單;檢索和提取分類統計數據,分析相關學科的學科體系演變和發展趨勢。
國內研究機構論文數量統計分析
國內外地學期刊統計分析系統框架中的選項有:書名、作者/單位、書名、出版社、出版年份、卷、頁、文獻請求號、語種、載體形式、關鍵詞、分類號、文獻識別號、記錄狀態、文獻類型、目錄級別、文獻載體、ISSN號、ISBN號、會議號、版次號。想了解國內各研究機構近幾年發表的論文,可以在框架結構中系統選擇“發表年份”,輸入“年份(1997,1998,…2001)”,檢索Excel年份收集的所有文獻,然後在系統的框架結構中選擇“作者/單位”輸入即可通過。
表3 1997-2001國內外地學期刊統計分析系統收錄國內研究機構論文數量。
國內外學科結構的統計分析
利用國內外文獻統計分析系統,對GeoRef數據庫100和GDS數據庫15中的期刊論文進行了統計分析。數據收集的方法是利用分析系統框架結構中的“分類號”進行搜索。GeoRef數據庫檢索公式:分類號字段代碼,GDS數據庫檢索公式:在檢索系統框架結構中選擇“分類號”。通過輸入分類代碼,我們按上述方法收集了國外100年和國內15年的分類數據,編制了國際地質科學體系學科結構百年演化圖和國內地質科學體系學科結構近20年演化圖(詳見第壹章)。
中外綜合性期刊中地學論文的比較研究
(1)《科學通報·中國科學(D輯)》《自然·科學》地學學科結構統計分析。
《自然》和《科學》分別是由英國和美國主辦的世界頂級綜合性科學雜誌。發表的地學論文壹般反映了地質科學研究的壹些重要進展。《中國科學(D輯)》和《科學通報》也算是國內頂尖的綜合性科學雜誌。四種雜誌的學科結構反映了地質科學的基礎和前沿研究領域及其近年來的變化趨勢。
對比四種期刊可以看出,第四紀地質學的論文數量高於其他學科,說明近年來第四紀地質學與全球變化的科學研究越來越受到重視。詞頻統計結果也顯示,相關術語出現頻率最高,如第四紀、新生代、全新世。因為第四紀在時間上最接近人類活動的歷史,所以第四紀地質、環境、氣候變化的研究與我們人類的生存息息相關。《科學》和《自然》關於宇宙地質學(或地外地質學)的論文排名前五,高於《中國科學與科學通報》。地外地質學實際上是壹個關系到未來人類生存環境的重要科學問題,當然也體現了我們對地球起源等根本性問題的不懈探索。國內這方面的論文很少,可能是多方面的原因,主要跟國家的經濟實力和技術裝備水平有關,其次是對人類環境問題的關註程度。另壹方面,從統計結果中可以明顯看出,經濟地質學(包括礦產、能源等)的論文數量。)在國外兩大著名期刊上的論文數量較少,而油氣地質和金屬礦床在國內兩大期刊上的論文數量卻名列前茅,這與我國是發展中國家,對礦產和能源的需求較大有關。此外,地質找礦在我國地質工作中仍占相當大的比重,這方面的成果(論文)很多。
(2)自然科學全國分布的統計分析。
從表4和表5可以看出,排名前10的國家是當今世界上除中國以外經濟最發達的國家,尤其是美國遙遙領先,英法德處於第二梯隊,明顯落後於美國。這說明,只有經濟比較強大,才能有力支撐科技的發展。20世紀90年代以來,中國經濟快速發展,也非常重視科學技術對社會生產力的促進作用。因此加大了科技投入,使其躋身於10的前列,這說明我國在地學領域取得了壹些領先的研究成果。
表4從1996到2001在science上發表的地學論文數量排名前10的國家。
圖4反映了近20年來我國地學論文在國際知名期刊上的發表情況。論文數量總體呈上升趨勢,尤其是最近6年,說明中國地學研究在某些方面已經受到國際關註。
表5從1996到2001在《自然》雜誌上發表的地學論文數量排名前10的國家。
圖4近年來中國學者在science和Nature上發表的地學論文數量變化曲線。
(3)《中國科學》(D輯)、《科學通報》、《自然》、《科學》的機構分布統計分析。
對1996至2001各年度不同公司在《中國科學(D輯)》、《科學通報》、《自然》、《科學》發表的論文數量進行了排名。從圖5和圖6來看,自然中列出了大學、研究所、國際組織、公司和其他。科學由大學、研究所、國際組織、公司和其他參加,分別占47%、27%、0.4%、0.05%和24%,其中大學所占比例最大,其次是研究所。這與《中國科學》(D輯)和《科學通報》(表6、表7)的情況完全相反。
從表6和表7可以看出,我國發表地學論文最多的單位是研究所,其次是大學或學院。按發表論文數量排序,結果顯示,中國科學院地質與地球物理研究所及其所屬實驗室發表論文最多,其次是地質研究所、地震局和海洋局。中科院的論文數量遙遙領先於其他研究所。高校中,中國地質大學(武漢)、中國地質大學(北京)、南京大學、北京大學、西北大學、同濟大學學術論文數量較多(排名不分先後)。
圖5 1996-2001期間在Nature發表地學論文的機構分布。
圖6 1996-2001在science上發表地學論文的機構分布。
表6中國科學D輯1996-2001發表論文作者分類統計。
表7《科學通報》1996-2001發表論文作者分類統計
中外期刊地學論文研究領域的對比分析
根據國內外地學期刊統計分析系統選取的數據源,共收集分析了16000多條數據,從而開展了礦物學、地球化學、巖石學、古生物與地層學、構造地質學、礦床地質學、地球物理學、第四紀地質與全球變化、環境地質學、工程地質學、能源地質學、行星與宇宙地質學、海洋地質學、地質年代學、地質觀測技術等研究學科和領域。