用數字搜尋工程文獻 : Compendex資料庫數字檢索Numeric Search功能

微晶片零組件的尺寸、資料傳輸的位元率、材料的熔點比熱等熱屬性、符合國際民用航空組織(ICAO)標準的最新寬頻無線通信技術……,工程領域研究中數字資訊常常是重要的關鍵,使用”數字”搜尋學術文獻就是掌握研究資訊最快速的方法。

但實際上,當試圖使用數字蒐集科學文獻中的相關研究時,卻是相當的困難。

以長度63英尺(feet)為例,英尺通常寫成feet或foot或縮寫 FT.,也可以用不同單位756英吋(inches)、0.12英里(miles)或是21碼(yards)表示。長度也可以用公制測量,例如公尺(meters),公尺meter的英式拼法為metre末尾是“re”,縮寫為字母”m”,當然也可以用毫米,厘米或千米表示,而所有這些都有自己的縮寫。

為了確保檢索完整,考慮了”63英尺”的各種表示方式,但可以保證的是仍舊會錯過許多未考慮到的變體。

除了,數字表示方式的多樣性,數字檢索的另一個困難是無法支援範圍檢索。試想,要查詢”3000英尺以上的超深井鑽井技術”,「超過」3000英尺要如何檢索?要使用什麼樣的檢索詞彙與指令呢?

Compendex的數字檢索功能,成功地克服了這些障礙。Compendex運用複雜的數值數據索引演算法(numerical data indexing algorithm)深度分析工程領域使用數值的方式,使用國際單位系統(International System of Units,簡稱SI) 進行數值的轉換和標準化,同時提供了範圍檢索的功能。

下圖顯示了在Compendex中檢索石油鑽井相關研究,搜尋的結果再利用”大於或等於3000英尺”的條件進行過濾,快速獲得使用不同單位的超深井研究文獻。

Compedex數字檢索的主要特點:

  1. 可建立彈性的檢索策略 – 在”快速檢索”或”專家檢索”的檢索模式下,運用布林邏輯建立數字、關鍵字、控制詞彙等的組合策略,也可排除特定數字數據。
  2. 可快速優化檢索結果 – 限縮結果的功能以簡易介面逐步引導設定屬性類型、範圍、單位,快速地精準檢索結果。

Compendex 目前提供62種物理屬性,包含Frequency (hertz)頻率(赫茲)、Electric current (ampere)電流(安培) 、Voltage (volt)電壓(伏特)、Power (watt)功率(瓦特)…….等。

  1. 可忽略同屬性的單位轉換-按照國際單位制(SI)標準化,意味著可同時搜尋到不同的測量標準,例如攝氏溫度,華氏溫度或凱氏溫度。
  2. 可忽略量級單位: 例如,使用”千米”會同時抓取等值以”米“表示的數值。
  3. 可搜索指定範圍: 例如,限定在300 MHz至3 GHz的頻率範圍內搜尋UHF頻段內的運行技術。範圍檢索包括搜尋正數和負數。

在Compendex 中如何使用數字檢索

以搜尋超過3000英尺的超深井石油鑽井技術的相關文獻為例,說明如何在Compendex中進行檢索。

方法一:利用限縮結果(Refine)-簡易的使用介面,逐步設定完成檢索

  • 選擇 ”快速檢索”模式,以”oil drilling”, “oil well drilling”為關鍵字檢索


  • 查詢結果左方,限縮結果(Refine),列出各項數值屬性的文獻數量

  • 選擇屬性”size”, 單位”Foot”, 運算元”Greater or equal”, 輸入數值”3000”

方法二:建立檢索策略-自行設計檢索指令,可完成較複雜的檢索需求。

  • 選擇”專家檢索”模式

  • 檢索框輸入檢索指令(oil drilling) WN ALL) OR (oil well drilling) WN ALL) 表示不限定欄位檢索包含”oil drilling”, “oil well drilling”的資料

NU_SIZE GTE 3000 ft為數字檢索指令,意即搜尋size大於或等於3000英尺的資料。完整的指令包含屬性、運算元、數值與單位四部分

屬性:  NU_SIZE

運算元: GTE代表greater than or equal

單位: ft

完整的數字檢索指令定義,請參閱說明

Compendex是工程領域專業資料庫,超過2000萬筆文獻,掌握了數字檢索的技巧,就是掌握了取得高度精確關鍵文獻的利器,趕快來試試看吧!

文 / 推廣組 巫惠屏