當前位置:成語大全網 - 書法字典 - 信息檢索焦點

信息檢索焦點

問答題

1.簡述信息、知識和文獻的概念以及它們之間的關系。

1.答:信息:是事物存在方式、運動狀態及其特征的反映,是事物發出的信號和消息。

知識:是對自然界和人類社會中各種現象和規律的信息反映進行思維分析、加工提煉、系統化、理論化的結果。

文獻:所有知識的載體都有記載。

從概念上來說,信息大於知識和文獻,知識是信息的壹部分,具有理論性和系統性,文獻是記載在知識中的部分。

2.根據載體形式的不同分為哪些種類的文件,並舉例說明。

2.答:根據載體形式的不同,文獻可以分為:

手寫文件,如甲骨文和金文。

印刷文獻,如書籍和期刊。

減少微型文件,如縮微膠片、縮微膠卷

音像文獻,如錄像帶、錄音帶和科技電影。

電子文獻,如數據庫文獻和網絡文獻。

3.文學的層次及其關系。

3.答:文獻按加工程度可分為零、壹級、二級、三級四種。

其中,零時文獻是指未發表的實驗記錄、原始錄音(影像)、書信、手稿、口頭交流信息或實物等。零階文獻經作者加工後公開發表,進入社會流通領域時,成為文獻;根據壹級文檔的特點,按照壹定的規則和方法進行排序、加工和濃縮,得到的文檔為二級文檔;利用二級文獻線索,對大量壹級文獻內容進行綜合、分析、加工、提煉而形成的文獻,就是三級文獻。

4.在計算機檢索中,如何縮小檢索範圍?

4.答:在計算機檢索中,縮小檢索範圍的方法有:

(1)添加由and連接的搜索詞,或使用“二次搜索”

(2)用具體的子主題詞來定義。

(3)用字段限制檢索,如標題檢索、主題檢索、加權檢索等。

(4)文獻類型、語種、重要期刊、臨床核心期刊、年份的有限檢索。

(5)進入更具體的類別進行單詞檢索。

5.獲取文獻全文的方法有哪些?

5.答:獲取全文的方法包括:

(1)在Internet上搜索全文數據庫

(2)使用在線出版社和雜誌

(3)利用圖書館館藏目錄(聯合館藏目錄)

(4)使用“在線全文傳遞服務”

(5)向作者索要

6.常見的檢索方式有哪些?

6.答:常用的檢索方法包括:

自由詞檢索、主題詞檢索、分類檢索、作者檢索、機構檢索、引文檢索、限定檢索等。

7.簡述信息檢索的原理。

7.答:信息檢索的原理是:將描述特定用戶所需信息的提問特征與信息中存儲的檢索標記進行比較,找出與提問特征壹致或基本壹致的信息。本質是將用戶的信息需求與信息集中存儲的信息進行比較和選擇的過程,即匹配。

8.計算機檢索通常包括哪些步驟?

8.答:信息檢索的步驟包括:

(1)分析檢索主題,明確目的和要求。

(2)選擇合適的檢索工具。

(3)選擇檢索途徑,確定檢索標識。

(4)尋找文獻線索。

(5)瀏覽搜索結果,獲取原始文檔。

9.簡述IM主題索引的排列規則。

9.答:主題索引的排列規則如下

(1)全索引按主題詞排列。

(2)同壹主題詞下,次主題詞按順序排列。

(3)相關內容的參考書目分別收錄在相應的主題詞或主題詞/子主題詞下;壹般文件直接在主題詞下,具體文件在相應的子主題詞下;同壹文檔的標題可以放在多個主題詞下。

(4)同壹主題或子主題下的文獻目錄,先排列英文文獻,再排列非英文文獻。非英語文檔的英語翻譯標題用“[]”括起來以示區別。

(5)英文文獻按其縮寫排列。

(6)非英文文獻應按語種縮寫編排,並按同壹語種期刊名稱縮寫編排。

10.醫學敘詞表(MeSH)的字母順序表有哪幾種參考系?舉例說明其意義。

10.答:第壹組:替代參照,用來處理詞與詞之間的對等關系。在網狀敘詞表中,只有壹個比較科學和常用的同義詞作為規範主題詞,其他詞作為非主題詞(即條目詞)。表現為“項詞見主題詞”和“主題詞x項詞”。例如:癌癥參見腫瘤腫瘤x癌癥

第二組:從屬指稱,用於處理詞與詞之間的層級關系,即整體與部分的關系,以及上層概念與下層概念的關系。比如在壹些類別較大的關鍵詞下收錄壹些類別較小的關鍵詞,內容範圍較寬的詞為關鍵詞,而其下內容範圍較窄的詞不作為關鍵詞,只作為二級關鍵詞。它以“次主題詞見主題詞下”和“主題詞許次主題詞”為代表。比如健康優先參見衛生規劃健康規劃下徐健康優先從1991開始取消這種引用關系,所有次要主題詞都升級為主題詞。

第三組:相關引用,用於處理詞與詞之間的相關性,從而擴大檢索,提高召回率。用“關鍵字見相關關鍵字”和“關鍵字XR關鍵字”來表示。如:人口控制參見相關計劃生育計劃生育xr人口控制

為了提高召回率,方便檢索,在1991和1992中,網狀敘詞表先後增加了“也考慮”和“主題詞/分主題短語帶參考”。

11.根據存儲內容的不同,數據庫通常分為哪些類型?

11.答:書目數據庫、事實數據庫、數值數據庫、全文數據庫、圖片數據庫。

12.什麽是主題詞擴展檢索,它的優勢是什麽?

12.答:選擇主題詞的擴展功能,可以同時檢索主題詞及其所有從屬詞,這樣就可以檢測到所有由所選主題詞和更具體主題詞索引的文檔,可以更好地提高檢索召回率。如果不進行擴展,將只檢測由所選主題詞索引的文檔,而不會檢測其從屬詞,即由主題詞索引的那些文檔。

13.什麽是查全率和查準率,它們之間有什麽關系?

13.答:召回率是指系統檢測到的相關文檔量與系統文檔庫中相關文檔總量的比值,反映了系統文檔庫中相關文檔的實際量被檢索到了什麽程度。

召回率=檢測到的相關文檔量/文檔庫中相關文檔總量×100%。

查準率是指在某次檢索中,系統檢測到的相關文檔的數量與檢測到的文檔總量的比值,反映了每次從系統的文獻庫中實際檢測到的所有文檔中有多少是相關的。

準確率=檢測到的相關文檔數量/檢測到的文檔總量×100%。

召回率和精確度是相互的。要完全搜索,就要逐步放寬檢索的範圍和限制,結果會帶入很多不相關的文檔,影響查準率。試圖同時提高查全率和查準率並不容易。壹方面強調,壹方面忽視,也是不合適的。查全率和查準率要根據具體主題的要求合理調整,保證檢索效果。

14.影響查全率和查準率的因素有哪些?

答:(1)影響召回率的因素。

影響召回率的因素有:文檔庫中包含的文檔不完整;索引詞匯缺乏控制性和特異性;詞匯結構不完整;詞與詞之間的關系模糊或不正確;索引未知;索引不壹致;標引人員遺漏了原文中的重要概念和不當詞語。此外,從信息檢索的角度來看,主要有:檢索策略過於簡單;選詞不當,邏輯組合不當;檢索途徑和方法太少;檢索人員對業務不熟悉,缺乏耐心;檢索系統不具備分詞和反饋功能,無法全面描述檢索需求。

(2)影響準確率的因素

影響查準率的主要因素有:索引詞不能準確描述文獻主題和檢索要求;組裝規則不嚴格;詞語的選擇和詞語之間的關系不正確;索引過於詳細;裝配錯誤;檢索中使用的檢索詞特異性不夠,檢索範圍寬於檢索要求;檢索系統不具備邏輯否定功能和反饋功能;搜索公式中允許的字數是有限的;截止位置不當,檢索公式中邏輯“或”的使用不當等。

15.獨立搜索引擎的工作原理是什麽?

15.答:獨立搜索引擎的工作原理是:

定期運行搜索軟件(或手動)收集網絡信息。

使用索引軟件自動索引並建立數據庫。

以網頁的形式為用戶提供相關的信息資源導航、目錄索引和檢索界面,用戶將輸入檢索類型。

通過搜索軟件進行搜索匹配,根據相關性對輸出進行排序。

16.如何提高檢索的查全率?

16.答:提高召回率的方法:

(1)降低搜索詞的特異性,選擇壹些上位詞和相關詞加入到搜索公式中。

(2)調整搜索度,減少邏輯與的組合。

(3)進行民族檢索,可以使用分類檢索,或者使用壹組同義詞、近義詞、關聯詞,在檢索公式中用“或”連接。

(4)利用分詞技術取消壹些限制性符號。

17.如何提高檢索精度?

17.a:提高精度的方法:

(1)提高搜索詞的特異性,用特異性強的標準詞或自由詞代替。

(2)增加“和”,進壹步明確主題概念。

(3)定義搜索詞所在的可檢測域,使用位置運算符控制搜索詞的詞與詞之間的順序和位置。

(4)限制導出文檔的外部特征,如限定年份、語言、文檔類型等。

(5)使用邏輯否定來限制與問題無關的文檔的輸出。

(6)用主題詞搜索,不用或少用自由詞。

18.根據我國專利法,專利有哪些類型,各類專利的有效期是多久?

18.答:根據專利法,保護對象有三類:發明專利、實用新型專利和外觀設計專利。

發明專利是專利法的主要保護對象。發明專利權的有效期因國家而異,在中國是自申請日起20年。

實用新型專利在中國的有效期為自申請日起10年。

中國的外觀設計專利有效期為自申請日起10年。

19.信息檢索系統的基本要素是什麽?

19.答:信息檢索系統包括:

(1)檢索文獻,即文獻檢索標記的有機集合。

(2)技術設備,即能夠存儲信息及其標識並實現存儲和檢索操作的各種技術設備。

(3)作用於系統的人,如文檔處理者、使用者、系統維護者和管理者。

(4)檢索工具如檢索語言、文獻標引規則、輸入輸出標準等。

20.什麽是內聯文檔,什麽是數據庫的內聯文檔?

20.答:順序文件是以文檔記錄為信息存儲單位,按照文檔記錄的存取號降序排列的目錄文件。因為它存儲了關於每個文檔的最完整的信息,所以它通常被稱為主文件,相當於印刷檢索工具的文本部分。逆向文檔是從記錄中提取所有可檢測的字段或屬性值,並按壹定順序重新組織後得到的文檔。倒檔是從主文件中派生出來的,所以也叫輔助文件。

21.獲取網絡信息資源的主要工具有哪些?

21.答:獲取網絡信息資源的主要工具包括:

(1)電子郵件

(2)文件傳輸協議

(3)阿奇

(4)遠程登錄

(5)地鼠

(6)新聞組

(7)萬維網瀏覽器

(8)搜索引擎

22.核心期刊的主要特點是什麽?

22.少數在某壹學科發表大量高質量專業論文的期刊稱為核心期刊,其主要特點是:

(1)出版高密度、高信息量的專業文獻;

(2)水平高,代表本學科最新發展水平;

(3)出版物相對穩定,出版的文獻壽命長;

(4)利用率和被引率高。

23.試描述互聯網搜索引擎的概念和類型。

23.答:搜索引擎是互聯網上具有查詢功能的網頁的總稱,即允許用戶提交查詢,檢索與查詢相關的網頁結果列表,並進行排序。

按檢索內容分為:綜合搜索引擎和專業搜索引擎;

按檢索功能分類:目錄搜索引擎、全文搜索引擎、智能搜索引擎;

按搜索範圍分為獨立搜索引擎和元搜索引擎。

24.簡述會議論文的概念和特點,國內外有哪些會議論文檢索系統?

24.會議文件是指在各種科技會議上發表的論文、報告、講話等與會議有關的文件。

會議文獻的主要特點是:信息傳播及時、主題集中、內容新穎、專業性強、質量高、數量大、出版類型多樣,往往代表某壹學科或專業領域的最新學術研究成果,基本反映該學科或專業的學術水平、研究動態和發展趨勢。會議文獻是科技查新的重要信息源之壹。

國外會議論文檢索工具包括:ISI的proceedings(ISTP+is shp);papers First(OCLC第壹搜索的子庫);IEEE/IEEE電子圖書館;AIP要約程序

國內可以檢索會議論文的系統有:中國學術會議論文全文數據庫(萬芳數據);中國重要會議論文全文數據庫(CNKI)

25.當周紅搜索壹個主題時,第壹次搜索的結果是172個文檔。有哪些縮小搜索範圍的方法建議?

25.答:縮小搜索範圍的方法包括:

(1)提高搜索詞的特異性,用特異性強的標準詞或自由詞代替。

(2)增加“和”,進壹步明確主題概念。

(3)限定搜索詞所在的可檢測領域。

(4)使用位置運算符控制單詞之間的順序和位置。

(5)限制導出文件的外部特征,例如限制年份、語言和文件類型。

(6)使用邏輯否定限制輸出與問題無關的文檔。

(7)用主題詞搜索,不用或少用自由詞。

26.26有什麽區別。Medline和Pubmed?

26.答:Pubmed和MEDLINE的區別主要體現在:

(1)文獻收集範圍:Pubmed不僅包括MEDLINE數據庫,還包括PREMEDLINE數據庫和出版商直接提供給Pubmed的數據。

(2)數據庫的更新時間:MEDLINE在線數據庫每周更新,MEDLINE光盤的報告時差為1-3個月,Pubmed每日更新。

(3)檢索機制:MEDLINE只有兩個主題和作者,掌握Mesh表是檢索的首要條件,而Pubmed具有詞匯自動轉換匹配和主題詞自動擴展功能。

(4)鏈接功能:Pubmed具有與原文、相關文獻、相關書籍、相關分子生物學數據庫的鏈接功能。

(5)免費全文:Pubmed為60多種期刊提供免費全文瀏覽和檢索功能。

(6)費用:MEDLINE CD需要每年租用數據庫,Pubmed免費。

27.專利文獻的概念和特點是什麽?

27.答:專利文獻是實施專利制度的國家和國際組織在專利審批過程中產生的正式文件和出版物的總稱。專利文獻具有以下特征:

(1)專利文獻集技術、法律、經濟信息於壹體,是壹個龐大的戰略信息資源,內容廣泛。

(2)促進最新技術信息的傳播;

(3)專利文件格式規範且高度標準化,有統壹的分類體系,便於檢索和閱讀;

(4)專利文件中對發明創造的公開完整、詳細,技術內容相對可靠。

28.想查找關於“乙肝流行病學”的中外文獻,可以選擇哪些數據庫?請選擇壹個數據庫並簡要檢索策略。

28.答:可用於檢索“乙型肝炎流行病學”文獻的中文檢索系統有:中國知網、維普、萬方、CBM等。

可選的外文檢索系統包括MEDLINE、Pubmed、EDSCO、springerlink、Open Access等。其中,CNKI中的檢索策略是:

搜索詞:文章名稱;關鍵詞:乙肝;邏輯:或

搜索詞:文章名稱;關鍵詞:乙肝;邏輯:和

搜索詞:主題;關鍵詞:流行病學

CBM中的檢索策略有:肝炎,B/[擴展整樹]流行病學。

29.用什麽檢索系統可以查到濟寧醫學院圖書館有沒有《計算機通訊》期刊?

29.答:可用的檢索系統包括:圖書館在線檢索系統、超星數字圖書和學者數字圖書館。

30.請列出五種先進的谷歌搜索語法,並舉例說明它們的用法。

妳可以從下面的語法中選擇五個例子。

(1)“鏈接”運算符:查找鏈接到特定頁面的所有頁面,在高級檢索模式下也可以實現。

(2)“相關”運算符:自動查找與某個網頁同級的相似網頁,也可以通過高級搜索模式和搜索結果界面中的“相似網頁”來實現。

(3)“info”操作符:可以在Google的庫存中獲取壹個網頁的所有信息。

(4)“站點”操作符:將搜索結果限制在某個域內,也可以使用高級搜索界面中的“域”選項。

(5)“All Intitle”操作符:要求所有的提問詞都出現在網頁的標題中。

(6)“Allinurl”操作符:要求所有問題都出現在url中。

(7)“inurl”運算符:要求疑問詞出現在url中。

(8)“文件類型:”操作符是Google開發的壹個非常強大和實用的搜索語法。其次是文檔類型,可以限制訪問某個文檔類型的網頁,然後可以以文檔類型為例。

31.在CBMWin4.0版中有多少種方法可以找到某個作者發表的文獻?有什麽區別?

31.答:有四種。

“基本檢索”中有三種作者檢索方式:

首先在“檢索條目”下拉色丹中選擇“作者”字段,然後在檢索問題框中輸入作者姓名;

第二,直接在查詢框輸入作者姓名,然後加上“in au”;

第三,直接在搜索問題框輸入“au=”,後面是作者姓名。

“作者搜索”模式:在搜索問題框中直接輸入作者姓名。

32.循證醫學中的證據主要有哪些類型?

32.根據質量和可靠性,大致可以分為以下五個等級(可靠性相應降低):

水平1:收集所有可靠的隨機對照試驗後,根據meta對具體疾病的具體治療進行系統評價或Meta分析;

ⅱ級:有足夠單樣本量的隨機對照試驗結果;

水平3:有對照組但無隨機分組的研究;

4級:無控制的連續病例觀察;

第5級:基於生理學、病理生理學和基礎研究的專家意見或證據。

33.列出六種可以檢索引文的數據庫。

33.答:可以檢索引文的數據庫如下(以下六個都可以寫)。

(1) SCI

(2) SSCI

(3) H&ACI

(4)中國科學論文和引文數據庫(CSTPC)。

(5)中國科學引文數據庫

(6)《中國社會科學引文索引》

(7)中國科技期刊引文數據庫

(8)中國知識基礎工程中文引文數據庫

(9)中國生物醫學文獻數據庫

34.信息檢索的類型和特點。

34.回答(1)個人信息來源:大量從事某壹領域工作的個人信息和各種事物發展的信息匯集在壹起。

(2)組織信息源:主要指組織內的內部信息源。

(3)實物信息源:以文物、產品樣品、模型、雕塑等實物形式表現的信息資源。

(4)文獻信息源:以文字、圖片、符號等各種方式記錄在各種載體上的知識和信息資源。

1)圖書:圖書也稱書籍,是指內容比較成熟、資料比較系統、裝幀形式比較完整的出版物。

2)期刊:期刊又稱雜誌,是指那些定期或不定期出版,匯集眾多作者作品的連續出版物。

3)學位論文:是本科和研究生為取得學位資格而撰寫的專業研究論文。

4)科技報告:是作為科研成果的正式報告。

5)專利文件:由專門的政府機構公布的法律文件,詳細描述發明的設計和制造過程,表明發明的所有者在壹定時期內有權制造、使用和銷售。

6)標準文件:由權威機構批準發布的、可供人們執行的技術規範的規範性文件。

7)產品樣本:制造商為介紹和推廣其產品而發出的文件。

8)會議文件:指在國際、國內專業學術會議上發表的論文和報告。

9)政府出版物:由政府機構制作並由指定出版機構出版的文件。

(5)電子信息源:主要指利用電子技術可以存儲和傳播的信息。

35.數據庫的組成。

答:數據庫由文檔、記錄和字段組成。

(1)文檔:是按照壹定結構組織起來的相關記錄和組合。

(2)記錄:是構成文檔的基本數據單位。

(3)字段:是比記錄更小的單位,是構成記錄的基本單位。

36.分類語言。

36.答:分類語言是根據文獻的主題屬性給出相應的分類號,用分類號表達文獻的主題概念,並按照分類表中的順序排列成分類索引,為檢索文獻提供壹種分類方式。

分類語言利用邏輯分類的原理,按照文檔內容的主題和專業來濃縮文檔,從知識分類的角度揭示各種文檔在內容上的差異和聯系。

分類語言很好的體現了學科和專業的系統性。

分類語言可分為系統分類語言和匯編語言。目前國內普遍采用的是前者。

36.主題語言。

37.答:主題語言是壹種用高度概括的文字說明文獻主題,並以此為符號組織檢索系統的語言。

話題語言分為標題詞、元詞、關鍵詞和描述詞。

(1)標題詞:從自然語言中選取的、經過標準化處理的表達事物概念的詞、短語或詞組。

(2)元詞(Meta-words)是指能夠用來描述文獻中提到的主題的最小的、最基本的詞。

(3)敘述性文字:使用能表達文件主題且嚴格規範的文字。

(4)關鍵詞:直接從文檔的標題、文檔或全文中提取能夠表達文檔主題的、未經規範的、具有實質意義的自然詞語和短語。

38.信息檢索渠道。

38.答案:1。分類文獻:是根據文獻內容所屬的學科類別對文獻進行檢索的方式,通過分類號或類別進行檢索。

2.主題法:是通過反映文學內容主題的文字來檢索文學的壹種方法。

3.關鍵詞法:指自由標引不規範的詞,直接取自能表達文檔主題,在原文中起關鍵作用的詞。

4.作者方式:指根據作者、編輯、譯者姓名或機構、團體名稱,按字母順序檢索文獻的方式。

5.書名方式:指按書名、期刊名或文章名的順序進行檢索的壹種方式。

6.編號法:是按文件編碼和序號排列的壹種“編號索引”方式。

39.信息檢索素養的內涵。

39.答:1。信息意識:指信息在人腦中的反應,即人們對各種信息的有意識的心理反應,反映了人們在信息活動中對信息的認識、態度、價值取向和某種需求。

2.信息知識:指與信息有關的理論、知識和方法。

3.信息能力:指有效利用信息技術和信息資源獲取信息、處理信息以及創造和交流新信息的能力。

4.信息倫理:指在信息獲取、使用、創造和傳播過程中應當遵守的壹定的倫理規範。

40.信息檢索策略。

40.答案:1。分析檢索主題,明確目的需求。

信息檢索總是根據某個主題的需要進行的,每個檢索主題都有明確的目的和具體的要求。因此,在檢索之前,首先要對檢索主題進行認真細致的分析研究,明確檢索的目的和要求。由於目的和要求不同,鏈具和鏈法的選擇也不同。

2.檢索系統和數據庫的選擇。

信息檢索和數據庫的選擇主要考慮主題範圍、保存期限、更新周期、標引質量、唯壹性、所需成本、系統性能和輔助服務,同時也註重綜合性和專業性數據庫的配合。

3.選擇檢索方式並確定檢索標誌。

所謂檢索途徑,也就是數據庫中的檢索項(字段),指從哪個角度或方向開始檢索。

檢索標識是指用於準確表達文獻信息內容和外觀特征的符號或文字,如分類號、主題詞、關鍵詞、作者姓名、期刊名稱等。,要求在檢索時準確找出檢索標識,避免誤檢。

4.編輯檢索表達式,調整檢索策略。

檢索表達式是用於表達檢索問題的邏輯檢索表達式,根據檢索要求將選定的檢索標記與不同的操作符號組合起來,以達到理想的檢索結果。

但是在實際的檢索過程中,建立的檢索表達式檢測到的結果往往壹次都不盡如人意,需要根據檢索情況的分析及時調整檢索策略。

5.獲取原文。

(1)搜索在線全文數據庫。

(2)利用網絡出版社和雜誌。

(3)利用圖書館館藏目錄(聯合館藏目錄)。

(4)使用“在線全文傳遞服務”。

(5)直接問作者。

如果不是通過上述步驟搜索得到的文檔全文,可以通過以下方式獲得。