2 檔案描述

本節描述 fileDesc 元素,這是 teiHeader 元素的第一個元件。

一個機器可讀的或數位文本的書目描述,在結構上類似一本書、一篇文章或任何其他種類文本物件的書目描述。

TEI header 的檔案描述元素因此密切仿照圖書館現存的編目標準;它應該因而提供了足夠的資訊讓使用者能夠給予該電子文本的標準書目參考,並讓編目人員可以將它編目。

在 header 中的其他地方、並且也在文本本身出現的書目引用,來自於相同的模型 (一般的書目引用,進一步參考 3.11 Bibliographic Citations and References)。

進一步參考:2.7 Note for Library Cataloguers

電子文本的書目描述應以強制性的 fileDesc 元素提供:

<fileDesc> (檔案描述) 包含對電子檔案的完整書目敘述。

fileDesc 元素包含三個強制性元素以及四個選用元素,它們各別在下面的 2.2.1 The Title Statement2.2.6 The Notes Statement 等小節中詳細描述。

下面按照它們在 fileDesc 元素中必須出現的順序列出這些元素:

<titleStmt> (題名陳述) 匯集關於作品標題與作品智慧內容責任歸屬的資訊。

<editionStmt> (版本陳述) 匯集文件某一版本的相關資訊。

<extent> 描述電子文件儲存在某一承載媒介時的約略大小,標以任何適用的單位。

<publicationStmt> (出版陳述) 匯集電子文件或其他類型文件的出版或發行相關資訊。

<seriesStmt> (集叢陳述) 若出版品隸屬於某叢書,則在此匯集該叢書的相關資訊。

<notesStmt> (附註陳述) 收集其他部分的書目描述中所未記載的任何文件相關附註。

<sourceDesc> 提供所製電子文件的一個或數個來源文件的書目描述。

一個包含所有可能子元素的完整檔案描述可能看來像這樣:

<teiHeader>
 <fileDesc>
  <titleStmt>
   <title><!-- 資源標題 --></title>
  </titleStmt>
  <editionStmt>
   <p><!-- 資源的版本資訊 --></p>
  </editionStmt>
  <extent><!-- 資源大小描述 --></extent>
  <publicationStmt>
   <p><!-- 資源發行資訊 --></p>
  </publicationStmt>
  <seriesStmt>
   <p><!-- 資源所屬任何集叢的資訊 --></p>
  </seriesStmt>
  <notesStmt>
   <note><!-- 資源其他方面的註解 --></note>
  </notesStmt>
  <sourceDesc>
   <p><!-- 資源取得來源的資訊 --></p>
  </sourceDesc>
 </fileDesc>
</teiHeader>

這些元素中只有 titleStmtpublicationStmt 以及 sourceDesc 是必須的,其他的可以省略,除非認為它們有用。

題名陳述

titleStmt element 是 fileDesc 的第一個元件,而且它是強制性的:

<titleStmt> (題名陳述) 匯集關於作品標題與作品智慧內容責任歸屬的資訊。

它包含該電子作品的標題,跟一個或多個責任歸屬陳述在一起,這些責任歸屬陳述指出編碼者、編輯者、作者、編譯者或其他負責的個人或團體:

<title> 包含任何種類作品的完整題名 。

<author> 在書目參照中,包含一件作品的作者 (群) 姓名,無論是個人或是團體性質;這也是書目項目責任歸屬的主要陳述。

<editor> 書目項目的次要責任歸屬,例如扮演編輯、編譯、翻譯等角色的個人、機構或組織 (或其他類似者) 的名稱。

<sponsor> 標明贊助的組織或機構名稱。

<funder> (資助者) 標明負責資助一項計畫或文件製作的個人、機構或組織名稱。

<principal> (主導研究者) 提供負責電子文件製作的主導研究者的姓名。

<respStmt> (責任陳述) 當未使用作者、編輯者等特定元素,或元素內容不足時,在此補充說明文件、版本、記錄、或是叢書的智慧內容所屬負責人的責任陳述。

<resp> 包含一個詞彙,來描述個人智慧責任的類型。

<name> (名稱,特定名稱) 包含一個特定名稱 或名詞詞組。

title 元素包含該電子作品的主要名稱,包括任何可能的替代標題或副標題。

它可以重複,如果該作品有超過一個標題 (也許是不同語言),而且可以是創作者認為適當的任何形式。

如果電子作品是來自已存在的來源底本,強烈建議前者的標題應該來自後者,但是有清楚的區分,例如加上類似「:電子轉錄」或「數位版」的片語。

這可以在引用或書目中區分電子作品與來源底本,當它們同時包含這兩種材料的時候。

該電子作品也有一個外部名稱 (它的「檔名」或「資料集名稱」) 或它在任何時候存在於電腦系統上時的參照編號。

這個名稱可能經常變動,當它在電腦系統上複製為新檔案的時候。

它的形式完全依賴所使用的特定電腦系統,不總是能夠簡單的轉換到另一個系統。

此外,某件作品還可能由多個檔案組成。

由於這些原因,本指引強烈建議這樣的名稱不應用做任何電子作品的 title

在困難的案例中,如何構想有用的描述標題,可以在英美編目規則 (Anglo-American Cataloguing Rules, Gorman and Winkler, 1978, chapter 25) 或相當於國家等級的書目文件中找到有用的引導。

authoreditorsponsorfunder 以及 principalrespStmt 這個通用性元素的專用化。

These elements are used to provide the statements of responsibility which identify the person(s) responsible for the intellectual or artistic content of an item and any corporate bodies from which it emanates.

題名陳述裡可以出現任意個這樣的陳述。

至少,指出文本的作者以及(如果適當的話)檔案的創建者(creator)。

如果是文集的書目描述,指出文集的創作者。

可選用包括的還有其他參與文本文字轉錄或發展的名字、贊助者,以及出資機構。

負責資料輸入(physical data input)的人名一般不需要記錄,除非這個人也在該檔案製作的某些方面負有智識性的責任(intellectually responsible)。

如果要記錄的責任歸屬不是作者、贊助者、出資者、主導研究者,那就應該使用 respStmt 元素。

它有兩個子元件:一個 name 元素指出負責的個人或機構,以及一個 resp 元素指出責任性質。

對於 resp 的適當內容沒有特定的建議:它應該清楚解釋責任性質,如下範例所示。

名稱可以是人名或法人組織的名稱。

按照希望這些個人或團體如何被公開引用的格式來給予這些名稱。

這通常是最正式、完整的名稱,包括 first names (西方人名的第一個字)。5

範例:

<titleStmt>
 <title>Capgrave's Life of St. John Norbert: a machine-readable transcription</title>
 <respStmt>
  <resp>compiled by</resp>
  <name>P.J. Lucas</name>
 </respStmt>
</titleStmt>
<titleStmt>
 <title>Two stories by Edgar Allen Poe: electronic version</title>
 <author>Poe, Edgar Allen (1809-1849)</author>
 <respStmt>
  <resp>compiled by</resp>
  <name>James D. Benson</name>
 </respStmt>
</titleStmt>
<titleStmt>
 <title>Yogadarśanam (arthāt yogasūtrapūṭhaḥ): a digital edition.</title>
 <title>The Yogasūtras of Patañjali: a digital edition.</title>
 <funder>Wellcome Institute for the History of Medicine</funder>
 <principal>Dominik Wujastyk</principal>
 <respStmt>
  <name>Wieslaw Mical</name>
  <resp>data entry and proof correction</resp>
 </respStmt>
 <respStmt>
  <name>Jan Hajic</name>
  <resp>conversion to TEI-conformant markup</resp>
 </respStmt>
</titleStmt>

版本陳述

editionStmt 元素是 fileDesc 元素的第二個元件。

它不是必須的,但建議使用。

<editionStmt> (版本陳述) 匯集文件某一版本的相關資訊。

它包含片語或更專門化的元素來指出文件版本,以及為該版本負責的人。

<edition> (版本) 描述文件某一版本的特質。

<respStmt> (責任陳述) 當未使用作者、編輯者等特定元素,或元素內容不足時,在此補充說明文件、版本、記錄、或是叢書的智慧內容所屬負責人的責任陳述。

<name> (名稱,特定名稱) 包含一個特定名稱 或名詞詞組。

<resp> 包含一個詞彙,來描述個人智慧責任的類型。

以印刷本來說,「版本」這個詞應用於所有完全相同的副本,這些副本來自於某個或某群出版機構發行的主副本。

在副本上的改變通常不會構成一個版本的變動,如果是在主副本裡的改變就會了。

以電子文本來說,主副本 (master copy) 這個概念並不完全適當,因為它們遠比印刷本容易修改、複製;但是版本一詞仍用於機器可讀文本(machine-readable text)的某個大量修改已固定的特定狀態。

本指引使用的同義詞有 version、level 和 release。

相對來說,revision 跟 update 這些詞用於較小的檔案修訂,還不足以形成一個新的版本(edition)。

沒有簡單的規則可以規定多「大量」的修改才能視為產生新的 edition,否則只能算是個簡單的 update。

這裡建議的一般性原則是,一個新版本的產生必須是檔案智識性內容的重大變更,而不只是編碼或外觀的改變。

在文本上增加分析性的編碼(coding)構成一個新版本,而從某個編碼呈現自動轉換到另一個則不是。

關於字元碼或物質儲存細節的改變、拼字錯誤的更正、內容安排的簡單變動,以及輸出格式的變動,通常都不構成一個新的版本,而增加新資訊 (例如 在演講部分加上標籤的語言分析,聲音或圖形,外部資料集的參考連結) 則幾乎都構成新版本。

顯然地,總是會有模棱兩可的案例,如何處理就見仁見智。

最簡單的規則是:如果你認為你的檔案是一個新版本,那就這麼叫它吧。

電腦檔案第一次釋出不一定要有版本陳述;但之後的每個釋出則是強制性的,雖然這個需求無法由 parser 強制執行。

注意,檔案的所有變更,不管它們被視為一個新版本或只是個新的 revision (修訂版),都應該在檔頭的修訂描述區各別記錄(參考 2.5 The Revision Description)。

edition 元素應包含描述 edition 或 version 的片語,包括 edition、version 字眼或同義字,跟一個可以與其他版本區隔的數字、日期或名稱放在一起,例如新版、修訂本等等。

出現在版本陳述裡的任何日期都應該用 date 元素標記。

edition 元素的 n 屬性可以像其他地方一樣用來提供版本的正式識別碼 (例如版本號碼)。

一個或多個 respStmt 元素可以用來提供該版本的責任歸屬陳述。

這些責任歸屬陳述可以指到個人或是團體,並能指出他們所扮演的職責,例如校訂者,或負責在新版中增補附錄的個人或團體等等。

respStmt 元素的進一步詳細資訊請參考 3.11 Bibliographic Citations and References

範例如下:

<editionStmt>
 <edition n="P2">Second draft, substantially extended, revised, and corrected.</edition>
</editionStmt>
<editionStmt>
 <edition>Student's edition, <date>June 1987</date></edition>
 <respStmt>
  <resp>New annotations by</resp>
  <name>George Brown</name>
 </respStmt>
</editionStmt>

檔案的類型和大小

extent 元素是 fileDesc 元素的第三個元件。它是可有可無的。

<extent> 描述電子文件儲存在某一承載媒介時的約略大小,標以任何適用的單位。

以印刷書本來說,關於承載媒介的資訊,例如媒體的種類以及它的大小,對編目程序很重要。

某個編目項目的媒體、大小的印刷導向書目描述規則,應用到電子媒體的時候需要一些重新詮釋。

一個電子檔是否為不同個體的存在,與它的承載媒體無關,不管它是儲存在磁帶上、光碟上、一些軟式磁碟上,或是在大型主機上的一個檔,它都是同一個知識性物件。

此外,由於本指引特別注重在促進透明的文件存儲和交換,任何純粹依賴於機器的資訊(machine-dependent information)與檔頭所關心的是不相關的。

這點對於檔案類型資訊尤其正確,雖然圖書館導向的編目規則經常區分「資料」和「程式」這兩種類型的電腦檔案。

在某些情況下要作出這種區分相當困難,例如超媒體(hypermedia),或內建搜尋檢索軟體的文本。

雖然同樣是依賴於系統,電腦檔案大小的某些度量可能對於編目或其他實務目標是有用的。

由於檔案大小的測量與表達困難重重,只可能有一般性的建議;為了這個目的提供 extent 元素。

它包含一個片語指出電腦檔案的大小或約估大小,可能方式如下:

  • 以位元組(bytes)為單位的指定長度 (例如 ‘4000 16-bit bytes’)
  • 在某幾類範圍內,例如:
    • 小於 1 Mb
    • 在 1 Mb 與 5 Mb 之間
    • 在 6 Mb 與 10 Mb 之間
    • 超過 10 Mb
  • 以任何方便的邏輯單位表達 (例如,單字或句子、引用、段落)
  • 以任何方便的物理單位表達 (例如,blocks,磁碟、磁帶)

數量的單位建議使用適用的標準縮寫,這裡或其他地方都一樣 (見 http://physics.nist.gov/cuu/Units/binary.html)。

範例:

<extent>between 1 16-bit MB and 2 16-bit MB</extent>
<extent>4.2 MiB</extent>
<extent>4532 bytes</extent>
<extent>3200 sentences</extent>
<extent>5 90 mm High Density Diskettes</extent>

出版、發行...等

publicationStmt 元素是 fileDesc 元素的第四個元件,而且是強制性的。

<publicationStmt> (出版陳述) 匯集電子文件或其他類型文件的出版或發行相關資訊。

它可以包含一個由一個或多個段落組成的散文描述,或是一個或多個來自 model.publicationStmt class 的元素。

這個 class 匯集若干元素,依序討論如下。

<publisher> 提供負責出版或發行書目項目的機構名稱。

<distributor> 提供負責發行文件的個人或其他經銷商的名稱。

<authority> (供應機構) 說明除了出版者或發行者之外,負責提供電子檔案的個人或其他經銷商的名稱。

出版者是授權公開某版本檔案的個人或機構。

經銷商(distributor)是可以從他們那裡獲得文本副本的個人或機構。

某個文本不被視為正式發行,但仍然經由某些個人或組織流通,這個人或機構稱為 release authority

上面三個元素至少必須出現一個,除非整個出版陳述以散文方式提供。

每一個後面都可以接著一個或多個下列元素,按照下次的次序:6

<pubPlace> 包含書目項目的出版地名稱。

<address> 包含出版者、機構、或是個人的郵寄地址或其他地址。

<idno> (識別代碼) 提供任何用來識別書目項目的標準或非標準編碼。

@type 表明編碼的種類,例如國際標準書號 (ISBN) 或其他標準系列編碼。

<availability> 提供關於文件可利用性的資訊,例如使用或發行上的任何限制、版權狀態等。

@status 提供一個代號,用來確認文件目前的可利用性。

<date> 包含任何格式的日期表示。

注意在出版陳述中的日期、地點等等,是關於最近提及的出版者、經銷商或 release authority。

如果文本的創建(created)日期與出版日期不同,那麼它的創建日期應該記錄在 profileDesc 元素裡,而不是出版陳述裡面。

在 note 裡提供其他有用的日期 (例如,資料收集日期)。

13 Names, Dates, People, and Places 這一章所描述的 module 有被包括在 schema 裡面的時候,可以使用額外的詳細元素來標記名稱、日期以及地址,如同 3.5 Names, Numbers, Dates, Abbreviations, and Addresses 所進一步描述的。

範例:

<publicationStmt>
 <publisher>Oxford University Press</publisher>
 <pubPlace>Oxford</pubPlace>
 <date>1989</date>
 <idno type="ISBN">0-19-254705-4</idno>
 <availability>
  <p>Copyright 1989, Oxford University Press</p>
 </availability>
</publicationStmt>
<publicationStmt>
 <authority>James D. Benson</authority>
 <pubPlace>London</pubPlace>
 <date>1984</date>
</publicationStmt>
<publicationStmt>
 <publisher>Sigma Press</publisher>
 <address>
  <addrLine>21 High Street,</addrLine>
  <addrLine>Wilmslow,</addrLine>
  <addrLine>Cheshire M24 3DF</addrLine>
 </address>
 <date>1991</date>
 <distributor>Oxford Text Archive</distributor>
 <idno type="ota">1256</idno>
 <availability>
  <p>Available with prior consent of depositor for purposes of academic research and teaching only.</p>
 </availability>
</publicationStmt>

集叢陳述

seriesStmt 元素是 fileDesc 元素的第五個元件,它是可有可無的。

<seriesStmt> (集叢陳述) 若出版品隸屬於某叢書,則在此匯集該叢書的相關資訊。

In bibliographic parlance, a series may be defined in one of the following ways:

以書目的說法,一個集叢可以下列方式之一定義:

  • 一群個別的項目,它們除了自己的標題之外,還有一個將整群項目視為一個整體的集體標題,這些項目因為這個事實而彼此相關。個別的項目可能有也可能沒有編號。
  • 兩冊或更多冊的散文、演講、論文或其他項目,在性質上類似,並依序發行。
  • 在一個系列或期刊裡分別依序編號的各冊。

seriesStmt 元素可以包含一個散文描述,或者一個或多個下列特定元素:

<title> 包含任何種類作品的完整題名 。

<idno> (識別代碼) 提供任何用來識別書目項目的標準或非標準編碼。

<respStmt> (責任陳述) 當未使用作者、編輯者等特定元素,或元素內容不足時,在此補充說明文件、版本、記錄、或是叢書的智慧內容所屬負責人的責任陳述。

<resp> 包含一個詞彙,來描述個人智慧責任的類型。

<name> (名稱,特定名稱) 包含一個特定名稱 或名詞詞組。

idno 可以用來提供任何關聯到該項目的識別號碼,包括像 ISSN 這樣的標準碼,以及特定的發行編號。

(在此目的下,建議使用標點分隔的阿拉伯數字:例如 6.19.33,而不是 VI/xix:33)。

它的 @type 屬性進一步用於該編號的分類,例如,如果是 ISSN 編號,就將 @type 值設為 "ISSN"。

範例:

<seriesStmt>
 <title level="s">Machine-Readable Texts for the Study of Indian Literature</title>
 <respStmt>
  <resp>ed. by</resp>
  <name>Jan Gonda</name>
 </respStmt>
 <idno type="vol">1.2</idno>
 <idno type="ISSN">0 345 6789</idno>
</seriesStmt>

附註陳述

notesStmt 元素是 fileDesc 元素的第六個元件,它是可有可無的。

如果用了它,它包含一個或多個 note 元素,每個都包含一段描述性資訊,類似於傳統編目描述中的「一般附註」(general notes)。

<notesStmt> (附註陳述) 收集其他部分的書目描述中所未記載的任何文件相關附註。

<note> 包含附註或註釋。

傳統書目附註區發現到的某些資訊,在本指引中已指定了特定的元素;尤其是下列項目應該依指示標記,而不是當做一般附註:

  • 檔案的性質、範圍、藝術形式或目的;它所屬的文藝作品類型或其他知識類別:例如「文本類型:報紙社論以及報導文學、科幻小說、西部、偵探故事」。這些應該要在 profileDesc 元素裡正式描述 (2.4 The Profile Description)。
  • 檔案主題內容的事實性、非評價性的記述摘要描述:例如「1963年春夏期間,在17個城市,與英語母語講者的一般性主題採訪的文字轉錄」。這些也應在 profileDesc 元素正式描述 (2.4 The Profile Description)。
  • 關於電子文本來源的書目詳細資料:例如「文字轉錄自 Norton 摹寫本1623頁」。這些應在 sourceDesc 元素裡正式描述 (2.2.7 The Source Description)。
  • 關於文本的出版、發行或釋出等更多資訊,包括可以取得文本的來源,任何使用限制或正式版權宣告。這些應該放在 publicationStmt 元素的適當區域 (2.2.4 Publication, Distribution, etc.)。
  • 關聯到該檔案的公開記錄數字:例如「ICPSR 研究編號 1803」或「牛津文獻庫文本編號 1243」。這些應該在 publicationStmt 元素的適當區段裡以 idno 元素來記錄。國際標準連續出版物號(ISSN),國際標準圖書編號(ISBN),和其他可以識別某個項目唯一性的國際商定標準編號,應以同樣方式對待,而不是當做特殊的書目附註。

不過,notesStmt 元素仍可用於記錄一些關於檔案以及它的功能、具有潛在意義的細節,例如:

  • 日期,檔它們與電腦檔的內容或條件相關的時候:例如「manual dated 1983」,「採訪第一波:1989年4月;第二波:1990年1月」
  • 對於檔案製作有貢獻的製作技術、行政管理、顧問諮詢有關的人員或機構的名稱,如果這些名稱沒有記錄在標題的責任歸屬陳述或檔案描述的版本陳述裡面:例如「由馬克‧科恩提供的歷史評論」
  • 以另外媒體承載的檔案可用性,或者關於文件可用性尚未記錄的資訊:例如「用戶手冊是活頁式的11個編頁小節」。
  • 作品及摘要的語言,如果沒有標記在 langUsage 元素,例如「英文文本、法文及德文摘要」
  • 由國際期刊資料系統 (International Serials Data System, ISDS) 給予某期刊的唯一名稱,如果沒有以 idno 元素標記的話。
  • 相關出版品的列表,描述來源本身,或與電子作品的創建或使用有關,例如「Burrows (1987) 使用的文獻」。

每一個這樣的項目資訊可以使用通用性的 note 元素來標記,該元素在 3.8 Notes, Annotation, and Indexing 裡描述。

附註群組被包含在 notesStmt 元素裡面,如下範例:

<notesStmt>
 <note>Historical commentary provided by Mark Cohen.</note>
 <note>OCR scanning done at University of Toronto.</note>
</notesStmt>

不過,如果有可用的元素的話,能將這些資訊在 TEI header 的其他地方用更精準的元素來標記,會更有好處。

例如,上面的附註也可以標記如下:

<titleStmt>
 <title></title>
 <respStmt>
  <persName>Mark Cohen</persName>
  <resp>historical commentary</resp>
 </respStmt>
 <respStmt>
  <orgName>University of Toronto</orgName>
  <resp>OCR scanning</resp>
 </respStmt>
</titleStmt>

來源描述

sourceDesc 元素是 fileDesc 元素的第七個也是最後一個元件。

它是強制性的元素,用於記錄電腦檔案取得來源的詳細資訊。

這可能是個印刷文本或手寫本、另一個電腦檔、以某種方式錄製的聲音或影像,或這些東西的組合。

一個電子檔也可能沒有來源,如果它就是以電子形式創建的原始文本。

<sourceDesc> 提供所製電子文件的一個或數個來源文件的書目描述。

sourceDesc 元素可以包含比簡單散文更多一點的描述,或是簡略陳述該文件沒有來源:

<sourceDesc>
 <p>生下來就是數位版。</p>
</sourceDesc>

或者,它也可包含取自下列三個 classes 的元素:

model.biblLike 匯集包含書目描述的元素。

model.sourceDescPart 匯集可在sourceDesc中使用並且可多次出現的元素

model.listLike 匯集所有類似列表的元素

這些 classes 預設提供某範圍的書目引用方式可以指明文本的出處。

對於書寫或印刷來源來說,也可以用跟其他書目引用相同的方式來描述該來源,使用下列元素之一:

<bibl> (書目資料) 包含結構零散的書目資料,其中次要元件不一定會明確標記。

<biblStruct> (結構次要書目) 包含僅出現子節點的結構書目資料,並以特定順序呈現。

<listBibl> (書目列表) 包含任何種類的書目資料列表。

這些元素在 3.11 Bibliographic Citations and References 有更詳細的說明。

使用它們,來源可以很簡單的措辭描述:

<sourceDesc>
 <bibl>The first folio of Shakespeare, prepared by
  Charlton Hinman (The Norton Facsimile, 1968)</bibl>
</sourceDesc>

或更詳細闡述:

<sourceDesc>
 <biblStruct xml:lang="fr">
  <monogr>
   <author>Eugène Sue</author>
   <title>Martin, l'enfant trouvé</title>
   <title type="sub">Mémoires d'un valet de chambre</title>
   <imprint>
    <pubPlace>Bruxelles et Leipzig</pubPlace>
    <publisher>C. Muquardt</publisher>
    <date when="1846">1846</date>
   </imprint>
  </monogr>
 </biblStruct>
</sourceDesc>

如果 header 所描述的文本來自某個已經存在的符合 TEI 或其他的數位文件,使用下列元素可能更簡單:

<biblFull> 包含結構完整的書目資料,其中呈現出TEI檔案描述內的所有元件。

因為這是專門為來自「天生數位化 (born digital)」文本的文件所設計的,如同 2.2.8Computer Files Derived from Other Computer Files 所進一步描述的。

當用於手寫稿描述的 module 被包括在 schema 裡面的時候,這個 class 也讓下列元素成為可以使用的:

<msDesc> 包含單一份可識別手稿的描述。

它讓標記者可以記錄非常詳細的關於手寫稿或類似來源的資訊,如同 10 Manuscript Description 所進一步討論的。

如果包括了額外的 module,model.sourceDescPart 這個 class 也會讓一些額外的元素成為可以使用的。

例如,如果包括了 spoken 這個 module,sourceDesc 元素就可以包括下列專門用途的元素,用於電子文本來源是口說文本而不是書寫文本的案例:

<scriptStmt> (腳本陳述) 包含口說文本的來源腳本相關細節。

<recordingStmt> (影音陳述) 當所轉錄的口說文本來源為影音檔案時,在此描述影音錄製的相關資訊。

這些元素以及它們的內容的完整描述在 8.2 Documenting the Source of Transcribed Speech

一個單獨的電子文本可能來自多個來源文件的全部或者部份。

因此 sourceDesc 可以包含一個 listBibl 元素,將各個來源的 biblbiblStructmsDesc 元素匯集在一起。

這種情況下,重複使用 sourceDesc 元素也是種可能性。

這兩種情況都可以使用 15.3 Associating Contextual Information with a Text 章節中所描述的 @decls 屬性,將被標記文本的某部份與它的出處書目元素關聯在一起。

來源描述還可以包括名稱、人物、地點等清單,當它們被視為構成被標記文件來源的一部份。

當這樣的資訊使用 namesdates module (13Names, Dates, People, and Places) 裡所討論的專門元素來記錄的時候,model.listLike 這個 class 會讓下列可記錄這類資訊的元素成為可以使用的:

<listNym> (list of canonical names) 包含一正式名稱列表,即任何事物的標準名稱。

<listOrg> (list of organizations) 包含一元素列表,每個元素提供關於一個可以識別的(identifiable)機構的資訊。

<listPerson> (list of persons) 人物描述清單,其中每個項目包含一個已知人物的相關資料,例如語言互動中的參與者、或是歷史來源中提及的人物。

<listPlace> (list of places) contains a list of places, optionally followed by a list of relationships (other than containment) defined amongst them.

來自其他電腦檔的電腦檔

如果一個電腦檔案 (以下簡稱 B) 不是來自於印刷來源,而是來自另一個含有 TEI 檔頭的電腦檔案 (以下簡稱 A),那麼電腦檔案 B 的來源文本是另一個電腦檔案 A。

A 檔頭的四個區段需要以稍微不同的方同整合進 B 的新檔頭,如下所列:

fileDesc

A 的檔案描述應複製到 B 的檔案描述裡的 sourceDesc 區段,用一個 biblFull 元素包起來。

profileDesc

A 的 profileDesc 應複製到 B 的 profileDesc 裡面,原則上不必修改;不過可以根據 B 的專案相關資訊擴充。

encodingDesc

A 的標記實務可能跟 B 一樣,也(更)可能跟 B 不一樣。

既然編碼描述的目的是要定義目前檔案與來源的關係,原則上只有 A 與 B 的編碼實務變動才有需要在 B 裡面說明。這樣的話,A 跟它的來源的關係就只能從 A 的原始檔頭找回來。實務上,可能更便利的做法是在 A 的 encodingDesc 的基礎上為 B 新建一個完整的 encodingDesc

revisionDesc

B 是一個新的電腦檔,應該要有一個新的修訂描述。然而,如果覺得將 A 的 revisionDesc 之中的某些資訊包括進來有用的話,例如主要更新或版本的日期,那麼這些資訊應該要清楚的標示它們是關於 A 而不是 B。

這總結了 fileDesc 元素以及它的內容的討論。