
圖、Google Scholar建立符合研究人員直覺的排名新準則
新聞:(2006年4月20日 Search Engine Journal - PaperRank Implemented on Google Scholar)Today Google launched a new feature over at Google Scholar - a system that ranks scholarly papers and information based upon criteria Google believes researchers value.
評析:
根據新聞指出,Google 更新了Google Scholar的排名準則(ranking criteria),並且引進了一種較符合學術研究學者習慣的新指標,這個排名準則可使研究人員快速瀏覽與找到所要的科學文獻(scientific paper)。
搜尋有兩種模式,一種是讓使用者很”快”與”很容易”找到資料,一種是讓人很”慢”或很”不容易”找到。Google的成名是因為有了創辦人提出了PageRank的觀念,根據此概念的引導,搜尋不再是在茫茫大海撈針,而能夠根據關鍵字出現次數、關鍵字在該網頁出現的位置、其他網頁超連結(hyperlink)此網頁的多寡等建立起此網頁的重要性與排名準則。若是此網頁較重要(權重高),那麼搜尋結果將會將此網頁順序往前擺,搜尋人員也可據此快速找到該資料。另一種是故意讓別人找不到,而不得不向搜尋引擎公司買廣告(哈哈,或許Google Adwords廣告也有此種特性),以增加該網站曝光率的搜尋引擎公司。當然這種故意找不到資料的公司理論上不存在,但是難免在”某些”特殊狀況下,搜尋引擎公司可能會幹這種勾當。
表一是Google網頁與Google Scholar排名準則對應關係,基本上包括幾大類,其一為該文(指作者)或是該網頁(指出處)的名聲,一旦名聲較高,則網頁或是文章重要性也較高;其二為根據文章出現關鍵字的次數與重要性來論,例如出現在標題(Title)或是出現在內文中(Text)的重要性也有所不同;其三為該網頁或是該文章被引用的次數,包括引用次數、引用次數的成長率與被較權威機構引用的次數等;第四為時間考量,包括公開日期或是第一次被編入索引日期等。
表一 Google網頁排名與Google Scholar挑選準則對照關係 |
Google Scholar
|
Google Web Pages
|
Prominence of Author
|
Prominence of Page
|
Prominence of Journal
|
Authority of Site
|
Previous Papers
|
Historical Data of Domain
|
Citations
|
Links
|
Date Authored
|
Date Page is Indexed
|
First Publication Appears
|
First Site with Unique Content
|
Text of Article
|
Page Content
|
Rate of Citation
|
Growth of Links
|
Citation in Scholarly Literature
|
Trusted Links
|
Google重新定義Google Scholar排名準則(ranking)具有重要意義。因為文獻種類的不同,其對應的搜尋準則也應該有差異,例如網路使用者對於網頁(web pages)、新聞(news)、購物商品(shopping)與科學文獻等的內容期望原本就有差異的。換句話說,每一種資料種類應該都有其獨特搜尋排名準則,如此才能符合不同使用者需求。
最後,有了搜尋與排名準則概念後,我們對於搜尋引擎的運作將能有各進一步的認識。搜尋包括兩個步驟,其一建立資料倉庫(data warehouse),例如建立網頁資料庫、建立新聞資料庫、建立商品資料庫與建立Blog等。其二為資料探勘(data mining)功能,即是快速又有效率的找到使用者的資料,並且希望這些資料都是讀者最想要的。由此觀點我們也發現,最近Google努力擴充的功能除了在搜尋與data mining能力上提升外,也逐漸建立一系列的data warehouse,包括個人網頁(Google Pages)、個人日曆(Google Calendar)與3D物件倉庫(Google 3D Warehouse)等。(1082字)
--------------------------------------------------------------------------------------------------------------------------------------------