2016年6月6日 星期一

6/1資組心得

6/1

  • 資訊組織
1.英文:Knowledge Organization,簡稱KO

2.其他英文別名:  (文字遊戲)
(1)Organization of Knowledge
(2)Organization of Information
(3)Information Organization

3.詞性:動詞

4.應用在不同的領域中會有不同的意義:
(1)期刊:資訊組織Knowledge organization (journal)
(2)管理學:知識組織Knowledge organization (management)

5.定義:
(1)組織任何資訊記錄(recorded information)或資訊物件(information objects),為其建立替代性的紀錄(例如:文字或符號),以幫助使用者能夠查詢、檢索、辨識、取得資料。
(2)泰勒(Taylor,1999):「資訊組織」是指人類所有資訊紀錄的組織
各種資訊紀錄有些是文字,有些是非文字。好的資訊組織能夠提供使用者及時精確掌握具相關性的書目資訊。

6.本質:
利用知識組織的程序(knowledge organizing processes,簡稱KOP)(例如:分類學taxonomy、本體論ontology)、知識組織的系統(knowledge organizing systems,簡稱KOS),組織檔案。

7.內容:關於一些活動,包含:
(1)文獻描述document description  (即編目)
(2)圖書館中的索引與分類indexing and classification performed in libraries(3)資料庫database:資料庫的類型、設計
(4)檔案archive

註:索引與分類是人的本能,適用於各方面的領域
註:索引 → 書名、作者等等

8.圖書分類編目v.s.資訊組織:圖書分類編目是資訊組織的一部分
傳統上,在課堂名稱中,資訊組織被稱為圖書分類編目。但圖書分類編目較偏向圖書館館藏目錄的編製,而資訊組織的範圍較大,包括種種的資訊檢索工具的製作與研發,除了傳統的圖書館目錄外,還包含索引、書目、電子化的書目資料庫、檔案查詢輔助(finding aids)等等。

9.研究範圍的相關領域:與圖書資訊學相關
圖書資訊學的一部分。

註:圖書資訊 (LIS)
(1)Library and Information Science → 合併成1個學問(為本系目前所採用)
(2)Library and Information Sciences → 分成2個學問

10.資組執行處理機構:
圖書館博物館美術館檔案館網際網路社群(可做任何千奇百怪的事,包括資訊組織在內)等等。

11.完成者:
圖書館員(librarian)、檔案保管員(archivist)、學科專家(subject specialist)、程式設計師(computer algorithm)等等。

註:computer algorithm → 演算法

12.今昔轉變:
檢索由傳統人力human-based(俗稱暴力法、蠻力)轉為透過電腦computer-based執行解決。

13.六大理論研究方法theoretical approaches
(1)Traditional approaches傳統
杜威十進分類法 Dewey Decimal Classification,簡稱DDC (Melvil Dewey麥爾威·杜威, 1851-1931)→暴力法;目前廣泛使用
布立斯分類法 / 書目分類法 Bliss bibliographic classification (Henry Bliss亨利·布利斯, 1870-1955)→影響深遠
其分類法的程序、過程:
Natural order宇宙秩序(自然產生) → Scientific Classification科學分類法 / 生物分類法(人類賦予) → Library classification圖書分類法(人類賦予)
人類觀察出宇宙秩序後,根據自然界的變化歸納而得出科學分類法,再以科學分類法分類之;人類記錄下來後,改以各種圖書館分類法處理之
The sciences tend to reflect the order of Nature and that library classification should reflect the order of knowledge as uncovered by science.
註:分類學從生物學(界、門、綱、目、科、屬、種)而來
註: 科學分類法 / 生物分類法,例如:
動 → 不動 => 動物(脊椎、無脊椎) → 礦物 → 植物
考試重點!!!
傳統資訊組織所根據的四大原則:主宰了超過100年
Principle of controlled vocabulary控制語彙:用語經過管控
例如:採用全稱檢索,而非簡稱 (O 輔仁大學學校財團法人輔仁大學;X 輔大)
生活化舉例:無法理解他人的敘述,是因為沒有進入個人的控制語彙
Cutter’s rule about specificity克特訂定的字典、目錄規則中的精準:資訊組織必須精準
註:Cutter Expansive Classification克特展開式分類法
Hulme’s principle of literary warrant胡爾梅文獻保證原理:資訊必須要存在,才可以組織,不可憑空想像
註:blind entry內容未加說明的分錄、失實的記錄:目錄中顯示"本館無館藏"的一筆記錄→錯誤示範
Principle of organizing from the general to the specific組織知識層次的原則由一般到特別:類目明確層次分明,例如:020→020.6→020.64

註:美國認為圖書館學從19世紀Dewey開始
註:第一所圖書館學校肇始於1887年,杜威在美國哥倫比亞大學(Columbia University)設立的圖書館學院(School of Library Economy)

(2)Facet analytic approaches層面分析
詳見5/11資組心得
(3)The information retrieval tradition (IR)資訊檢索

結合克蘭菲爾德的實驗Cranfield experiments (1950s) 與 文件檢索會議實驗Text Retrieval Conferences(TREC) experiments (1992)

Recall and Precision評估系統效能system efficiency的標準、方法
(由Cranfield experiments引進)

甲:欲搜尋到的資料

乙:實際搜尋到的所有資料

丙:搜尋到符合需求的資料 (甲 ∩ 乙)









①召回率Recall:欲得的資料中,有多少被搜尋出   (只求找到所需的資料)
if 丙 ⊂ 甲, recall ratio = 100%
Q:甲 = 20,乙 = 30,丙 = 18,recall ratio = ?
A:18 / 20 = 90%
         (搜尋結果有90%為符合需求的資料;2%為不相干的資料)
Classification systems like UDC and facet-analytic systems were less efficient compared to free-text searches or low level indexing systems (“UNITERM”).
相較於全文檢索或低階的索引系統,分類系統(如:UDC、層面分析)的效率較低
systemrecall
UNITERM82,0%
Alphabetical subject headings81,5%
UDC75,6%
Facet classification scheme73,8%
精確率Precision:實際搜尋到的資料中,有多少符合需求  (還需排除雜訊)
if 乙 ⊂ 甲, precision ratio = 100%
註:召回率 與 精確率 不可能同時升高 →物理 測不準原理  (無法在千分之一秒內同時測出某物體的速度和位置)
(4)User-oriented and cognitive views讀者導向 (以讀者為考量,以認知觀看待)
①Systems based upon user-oriented approaches must specify how the design of a system is made on the basis of empirical studies of users.
系統的設計必須滿足讀者需求
User studies demonstrated very early that users prefer verbal search systems as opposed to systems based on classification notations.
讀者偏好以其熟悉的"文字"搜尋,而非數字(例如:索書號)
③例如:Folksonomies大眾分類法:a recent kind of KO based on users' rather than on librarians' or subject specialists' indexing. → 無既定的分類法,圖書館員不設定立場,讓讀者自己依其認知做分類工作,跳脫專家的規範,回歸到一般民眾
註:onomies → 學
(5)Bibliometric approaches書目計量學
本質意涵:文章若重要,一定會有人引用,只要從引用文章,就可得知被引用文章的品質

註:類似概念為:從週遭的朋友、與誰來往,即可得知此人的品性等等

(6)The domain analytic approach從社會學角度切入

註:另外還有歷史的研究法historical approaches
There exist different historical and theoretical approaches.

reference:
https://en.wikipedia.org/wiki/Knowledge_organization

註:中文圖書分類法
(1)所謂的十類  (實際上只有八類?)
000 總類Generalities  (不是類?)
100 哲學類Philosophy
200 宗教類Religions
300 科學類Sciences
400 應用科學類Applied Sciences
500 社會科學類Social Sciences
600-700 史地類History and Geography
600 史地類:中國史地 History and geography
700 史地類:世界史地 World history and geography
800 語言文學類Linguistics and Literature
900 藝術類Arts
(2)分成十類的原因:方便使用
阿拉伯數字從0至9
手指共有10隻,方便書寫
註:杜威十進分類法
(1)所謂的十類
000 總類Generalities
100 哲學與心理學Philosophy & psychology
200 宗教學Religion
300 社會科學Social sciences
400 語言學Languages
500 科學Sciences  (純粹科學)
600 科技Technology (Applied sciences)  (技術科學)
700 藝術與娛樂Arts & recreation
800 文學Literature & rhetoric
900 地理與歷史Geography & history
(2)分成十類的原因:後設 (非實際原因)

100
在原始人類中想問的第一個問題必然是「我是誰?」,此與哲學相關,故用100來代表哲學與其相關學科。
200
下個問題是「誰創造了我?」,此為宗教問題,故用200代表宗教。
300
瞭解自己後,會想瞭解他人,於是下個問題是「住在我隔壁洞穴的人是誰?」此乃人際關係的開始,故用300來代表社會科學。
400
見到隔壁的人後,「怎麼使他瞭解我?」為溝通的問題,故400代表語言。
500
瞭解人後,接著想瞭解天地間自然現象,故500表自然科學。
600
如何將自然科學加以應用,是技術問題(應用科學),故600表應用科學。
700
人類終日忙碌,總該來點消遣。所以700是藝術與娛樂。
800
如何用故事小說陶冶心情並流傳後代是文學問題,所以800代表文學。
900
人類所有作為應有記錄,載明事發時間地點,是歷史與地理問題,所以900代表史地。
000
總有一些知識不屬於以上任何一類,為了讓這些資料被分類時有所歸屬,故用100代表總類。

註:在wikipedia寫文章的人大多不是專業大師,而是熱心的人,因為專業大師通常都很忙,沒有時間去做這些事情。雖然如此,其內容還是有參考價值,由於眾多人的投入,因此只要一發現內容有誤,就會及時被修正
註:真正的學問可以屹立不搖,數年後仍然有其影響力
註:1900前,以文言文溝通,當時代的白話文,相對於今是文言文

沒有留言:

張貼留言