文獻回顧1 - PubMed搜尋技巧

[回到目錄]

Five Must-Knows about Literature Review using PubMed

1. PubMed是什麼是一個資料庫還是搜尋引擎?

PubMed是一種搜尋引擎或搜尋介面,它搜尋好幾個與醫學及生命科學有關的資料庫的文獻資料,其中以MEDLINE為主,而MEDLINE則是源於大名鼎鼎的Index Medicus,後者現在已經完全被電子版的PubMed取代。

注意PubMed去搜尋的資料庫是以醫學生科為主,行為科學方面的資訊相對地比較不齊全,特別是這些行為科學領域如果與臨床關係不太大。例如行為經濟學極有名的prospect theory的原著(Kahneman & Tversky, 1978, Ecometricka),這篇在PubMed找不到,但是PsycINFO可以找到。所以當我們使用一整搜尋引擎,第一件事情就是要了解它到底涵蓋哪些資料庫。資料庫不對頭,當然什麼都搜不到!

2. 我在PubMed搜尋一個目標字, 到底怎樣找到與目標字有關的文章?

很多人以為PubMed是針對文獻的題目(title)和摘要(abstract)去搜尋,看看哪些文獻的題目與摘要有這個關鍵字。其實PubMed的搜尋機制更複雜! 它除了去搜尋這個字本身,也會根據全文去搜尋 – 但它不是真的全文去找這個字,而是運用一種”MeSH”的機制。簡單講,MeSH就是PubMed的”概念語庫”,裡面包含很多研究的概念, 例如”pulpitis”, “magnetic resonance imaging”(沒錯,不管幾個字組成,多數字形成一個概念,就算一個)。每篇被收入資料庫的文獻都會被分析,找出裡面的概念字有哪些。然後當你在搜尋時輸入一個目標字,PubMed也會把這個目標字與文獻的MeSH作配對,如果一篇文章的MeSH剛好與目標字合,PubMed就會把它找出來。

請注意很多時候我們輸入一個目標字, PubMed會自動把它轉譯成有關的MeSH來搜尋. 比方你輸入目標字dental pain, 其實PubMed裡面並沒有dental pain這個MeSH. 但是它有toothache這個字 – 所以搜尋時它會先把dental pain轉換成toothache(這是一個MeSH), 然後再去找哪些文章同樣有toothache這個MeSH.

練習1: 在PubMed的search欄位打dental pain, 然後注意坐右邊的, scroll down就會看到一個Search details的項目. 裡面就會出現”toothace”[MeSH terms]的字眼. 這裡你就會看到它的搜尋法則: 把dental pain轉換成toothache這個MeSH字然後去搜尋.

練習2: 既然PubMed會去自動轉譯這些目標字, 表示如果今天兩個概念是一樣的, 你不用做兩次搜尋. 現在比較用dental pain作搜尋, 一共得到13311筆文Results: 1 to 20 of 13311). 如果你擔心”這樣會不會漏掉toothache有關的文章?” 其實大可不必擔心 – 因為剛剛提過, PubMed會自動搜尋包含toothache這個MeSH的文章. (你可以試試搜尋dental pain OR toothache, 一樣是13311篇文章.)

3. 善用且一定要利用布林邏輯進行搜尋

什麼是布林邏輯? 請參考維基百科的說明

這個翻譯成文獻搜尋技巧, 就是在講如何把搜尋目標(1)限縮與(2)擴大:

練習3: 目標字找pulpitis共2560篇; 找somatosensory共30212篇; 交集: pulpitis AND somatosensory 共3篇; 聯集: 找pulpitis OR somatosensory共32769篇. 注意32769=2560+30212-3, 為什麼?

練習4: 目標字找dental pain共13311篇; 交集dental pain AND toothache共2569篇; 差集dental pain NOT toothache共10742篇. 注意10742=13311-2569, 為什麼?

練習5: 目標字找pulpitis共2560篇; 聯集pulpitis OR pain共540188篇! 注意這54萬多出來的文章中, 極大一部分與pulpitis無關. 事實上pulpitis這個概念本身就包含pain, 所以pulpitis OR pain是一個沒太大意義的目標字組合.

4. 什麼時候該用引號””?

引號不要隨便亂用. 請比較dental pain, dental AND pain, 以及(加了引號的) “dental pain”三組目標字組合. 會發現使用引號以後能找到的文章少很多, 這是因為PubMed會把引號內的字詞當成”一個字”來做搜尋(你可以想像它將解釋為d e n t a l (space) p a I n這10個字符組成的字. Space當成一個字符). 所以某個文章也許提到了dental treatment…. Pain is…. 卻不會被找到, 因為它並未出現”dental pain is ….”這樣的資訊. 簡單講, 引號就是把多個文字(word)強制合併成一個目標字.

“dental pain”和dental AND pain完全不同, 前者是一個目標字做搜尋, 後者是兩個, 分別搜尋後做布林運算, 一定要記得!

5. 有用的小工具