查準率是什么意思詞義解釋來源:辭書
1:查準率(precision ratio)是評估檢索成效的一項指標又稱精確率、求準率等。在資訊檢索系統(tǒng)中系統(tǒng)找出相關資料的筆數與系統(tǒng)找出資料總筆數的比值稱為查準率。例如假設在某一次檢索需求中系統(tǒng)回傳100筆檢索結果其中有20筆被判斷為相關則此次查詢的查準率為0.2或是20%。查準率可以用來了解系統(tǒng)輸出的準確程度或是監(jiān)定系統(tǒng)過濾不必要資料的能力。跟查準率非常相關的概念是查全率其為系統(tǒng)找出相關資料的筆數與文件集內所有相關資料筆數的比值。在衡量系統(tǒng)檢索成效時查準率與查全率是一起并用的單獨檢視其中一項指標并無意義。例如假設資料庫內有文件10000篇就某一個檢索主題其中相關的文件有100篇若系統(tǒng)僅查詢出1筆資料且此資料是相關的則其查準率為100%但此時系統(tǒng)漏掉了99篇相關文件。同理若系統(tǒng)將資料庫里所有的文件都當作查詢結果回覆使用者則其查全率為100%但此時系統(tǒng)查出9900篇不相關的資料。查準率與查全率一起并用的方式最常見的是F度量(F-measure)詳見F度量辭目。另外檢索結果按相關程度排序的技術發(fā)展出來后為評估這些系統(tǒng)的成效發(fā)展出:平均精確率(non-interpolated average precision rate簡稱NAP)與第R篇前的精確率(precision rate at recall position簡稱Pre@R)等也是將查準率與查全率一起考量的指標。NAP的定義為:在此R代表該次檢索應有的相關文件總篇數而Ranki是第i個相關文件在檢索結果中排序之名次。Pre@R則是描述當使用者從第一篇檢索結果往下看到第R篇時所累計到的精確率也就是r/R其中的r是前R篇結果中相關文件的篇數如此Pre@R的值可同時代表查準率也代表查全率。至于這兩個指標的關鍵數據R如何求得詳見查全率條目。
|