6 最小的以及建議的檔頭

本文翻譯自 http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/HD.html#HD7, 2011.12.6

TEI header 允許提供關於文本本身的大量資訊,它的來源、它的編碼、修訂,以及豐富的描述性資訊,例如所使用的語用以及製作環境、參與人員。

這種多樣性和豐富性反應了遵循本指引的電子文本用途的多樣性。

明顯地,它並沒有打算要求以上描述的所有元素都要出現在每一個 TEI header。

Header 裡的標記數量取決於文本的性質和用途。

其中的一個極端情況是,標記人員可能期望 header 只需要提供適合本地端需求的文本書目識別資料。

另一種情況,則希望確保他們的文本能用於最廣範圍的應用,標記人員會想要儘可能明確的記錄書目以及描述性資訊,這樣的話就不必要求事前必須具有該文本的輔助知識才能處理它。

這種情況的 header 將是非常充份的,近似於經常以手冊形式提供的文件。

大部份的文本會落在這兩個極端之間;文件語料庫特別會傾向於後者。

本節之後的部分會先展示 TEI header 所持有的書目資訊的最小標記等級,然後是最常用的建議等級。

只提供需要標記的最小等級,某個單一文本的 TEI header 可能看起來像下面的例子:

<teiHeader>
 <fileDesc>
  <titleStmt>
   <title>Thomas Paine: Common sense, a machine-readable transcript</title>
   <respStmt>
    <resp>compiled by</resp>
    <name>Jon K Adams</name>
   </respStmt>
  </titleStmt>
  <publicationStmt>
   <distributor>Oxford Text Archive</distributor>
  </publicationStmt>
  <sourceDesc>
   <bibl>The complete writings of Thomas Paine, collected and edited
    by Phillip S. Foner (New York, Citadel Press, 1945)</bibl>
  </sourceDesc>
 </fileDesc>
</teiHeader>

TEI Header 強制要求必須具備的元件只有 fileDesc 元素。

Within this, titleStmt, publicationStmt, and sourceDesc are all required constituents.

在這裡面,titleStmtpublicationStmt 以及 sourceDesc 都是必要的組件。

在標題陳述裡面,必須有一個標題,也應該指定一個作者,即使作者不明,也應在這裡使用 respStmt 元素提供一些額外的責任陳述。

publicationStmt 裡面,必須明確說明一個出版者、發行者或其他負責該檔案的代理機構。

最後,來源描述最少應包含一個鬆散結構的書目引用指出該電子文本的來源,如果有的話 (通常是這樣)。

現在我們擴充這個相同的 header 範例,額外包括一些建議資訊,適用於大部分的書目用途,特別是創建一個符合 AACR2 的書目紀錄。

我們也增加了在這個(想像的)標記中使用的標記原則資訊,關於文本本身 (以美國國會圖書館標題的形式),以及關於該檔案的修訂。

<teiHeader>
 <fileDesc>
  <titleStmt>
   <title>Common sense, a machine-readable transcript</title>
   <author>Paine, Thomas (1737-1809)</author>
   <respStmt>
    <resp>compiled by</resp>
    <name>Jon K Adams</name>
   </respStmt>
  </titleStmt>
  <editionStmt>
   <edition>
    <date>1986</date>
   </edition>
  </editionStmt>
  <publicationStmt>
   <distributor>Oxford Text Archive.</distributor>
   <address>
    <addrLine>Oxford University Computing Services,</addrLine>
    <addrLine>13 Banbury Road,</addrLine>
    <addrLine>Oxford OX2 6RB,</addrLine>
    <addrLine>UK</addrLine>
   </address>
  </publicationStmt>
  <notesStmt>
   <note>Brief notes on the text are in a supplementary file.</note>
  </notesStmt>
  <sourceDesc>
   <biblStruct>
    <monogr>
     <editor>Foner, Philip S.</editor>
     <title>The collected writings of Thomas Paine</title>
     <imprint>
      <pubPlace>New York</pubPlace>
      <publisher>Citadel Press</publisher>
      <date>1945</date>
     </imprint>
    </monogr>
   </biblStruct>
  </sourceDesc>
 </fileDesc>
 <encodingDesc>
  <samplingDecl>
   <p>Editorial notes in the Foner edition have not been reproduced. </p>
   <p>Blank lines and multiple blank spaces, including paragraph indents, have not been preserved. </p>
  </samplingDecl>
  <editorialDecl>
   <correction status="high" method="silent">
    <p>The following errors in the Foner edition have been corrected:
     <list>
      <item>p. 13 l. 7 cotemporaries contemporaries </item>
      <item>p. 28 l. 26 [comma] [period] </item>
      <item>p. 84 l. 4 kin kind </item>
      <item>p. 95 l. 1 stuggle struggle </item>
      <item>p. 101 l. 4 certainy certainty </item>
      <item>p. 167 l. 6 than that </item>
      <item>p. 209 l. 24 publshed published </item>
     </list>
    </p>
   </correction>
   <normalization>
    <p>No normalization beyond that performed by Foner, if any. </p>
   </normalization>
   <quotation marks="all" form="std">
    <p>All double quotation marks rendered with ", all single quotation marks with apostrophe. </p>
   </quotation>
   <hyphenation eol="none">
    <p>Hyphenated words that appear at the
     end of the line in the Foner edition have been reformed.</p>
   </hyphenation>
   <stdVals>
    <p>The values of <att>when-iso</att> on the <gi>time</gi>
     element always end in the format <val>HH:MM</val> or
     <val>HH</val>; i.e., seconds, fractions thereof, and time
     zone designators are not present.</p>
   </stdVals>
   <interpretation>
    <p>Compound proper names are marked. </p>
    <p>Dates are marked. </p>
    <p>Italics are recorded without interpretation. </p>
   </interpretation>
  </editorialDecl>
  <classDecl>
   <taxonomy xml:id="lcsh">
    <bibl>Library of Congress Subject Headings</bibl>
   </taxonomy>
   <taxonomy xml:id="lc">
    <bibl>Library of Congress Classification</bibl>
   </taxonomy>
  </classDecl>
 </encodingDesc>
 <profileDesc>
  <creation>
   <date>1774</date>
  </creation>
  <langUsage>
   <language ident="en" usage="100">English.</language>
  </langUsage>
  <textClass>
   <keywords scheme="#lcsh">
    <term>Political science</term>
    <term>United States -- Politics and government —
     Revolution, 1775-1783</term>
   </keywords>
   <classCode scheme="#lc">JC 177</classCode>
  </textClass>
 </profileDesc>
 <revisionDesc>
  <change when="1996-01-22" who="#MSM"> finished proofreading </change>
  <change when="1995-10-30" who="#LB"> finished proofreading </change>
  <change notBefore="1995-07-04" who="#RG"> finished data entry at end of term </change>
  <change notAfter="1995-01-01" who="#RG"> began data entry before New Year 1995 </change>
 </revisionDesc>
</teiHeader>

本章所討論到的元素,它們的建議用法的更多其他範例可以在參照索引及相關的教程中提供。