Session1-1 全文資料標記

Session1-1 全文資料標記─如何教電腦讀材料
這堂課介紹 TEI (Text Encoding Initiative) ── 一種標記文本的方法,標記的目的是讓電腦能讀懂文本 (machine-readable),以開啟用電腦分析文本的可能性。祝平次老師將介紹 TEI 的架構,並以他的研究資料為例,讓大家看看用 TEI 標記後的歷史文本長什麼樣,以及標記之後能有什麼樣的應用。 講者:祝平次(清華大學中文系副教授)

課程錄影:




講解示範大綱:(請參考課程投影片)

  • 關於TEI
    • Text Encoding Initiative
    • TEI是西方人文學界用來標註文本的一套標準系統。
    • 給的越多,就得到越多;標越多東西,就有越多操作的可能性。
  • 客制化的檢索瀏覽系統(TEI+eXist):以部分《全宋文.朱熹》為例。
  • TEI能做什麼?以《全宋詩.邵雍》為例。
    • 示範網站(因為掛在個人電腦,常常掛掉;如有這種現象,敬請原諒;講解當天會把資料掛在電腦裏,以防萬一):
    • 包含詩題中人名的前一個字是什麼?
    • 邵雍好以「吟」做為詩題,在他的詩中有幾首以吟為題目最後一個字的詩?
  • TEI和人文研究
    • 資料的結構性
    • 迅速集聚資料
    • 分類研究

課程測試資料下載:


課程投影片下載:


 參考網路資源:

當日課程錄影:


    沒有留言:

    張貼留言