3.4 簡單編輯修改

周邦信 翻譯自 http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/CO.html#COED, 2012.1.9-5.24

在編輯印刷文本的時候,將某個文本以電子形式編碼時也一樣,可能需要能容納文本上的編輯註釋,而且要能呈現文本在準備階段所做的任何變更。

本節描述的標籤可以用來記錄這樣的編輯介入,不論來自標記人員,來自做為複製文本的印刷版的編輯者,來自更早期的編輯群,或來自手寫稿的抄寫者。

這裡描述的標籤處理最常見的編輯介入類型以及定型的評論;其他類型的結構化較低的評註應以 3.8 Notes, Annotation, and Indexing 描述的 note 元素標示。

有系統的解釋性註釋也可以使用 16 Linking, Segmentation, and Alignment 描述的各種方法。

這裡給出的例子只說明了簡單的編輯介入;尤其是,對於文本的一個小部份的替代用字集合,它們允許經濟的編碼。

要編碼大型或異源的文段的多個觀點,應使用 16 Linking, Segmentation, and Alignment 描述的機制。

要對某個特定文本的多個版本 (witnesses) 做編碼,特別為版本考據所設計的類似機制在 12 Critical Apparatus 中描述。

這大部分這裡討論的元素,有些標記者可能希望指出責任的歸屬,也就是說,一個代碼指出負責這個編輯介入的人或機構,以及把握的程度 (degree of certainty)。

因為這些是本節討論元素的共同需求,它們是由屬性類別提供,具體地說是 att.editLike,它本身分別繼承來自另兩個類別 att.responsibilityatt.dimensions 的屬性。

這裡討論的任何元素可以帶有下列可選的屬性:

att.responsibility 提供屬性指出誰該為標記所聲稱的東西負責,以及肯定、把握的程度。

@cert (certainty) 標誌對於該介入或詮釋的肯定、把握的程度。

@resp (responsible party) 指出為該介入或詮釋負責的機構,例如編輯者或抄錄人員。

att.editLike 提供屬性描述任何種類的學術性介入或詮釋編碼的本質。

@evidence 指出支持介入或詮釋的可靠度或正確性的證據的本質。

att.dimensions 提供屬性用於描述物理物件的大小。

@unit 用於測量的單位名稱

@quantity 指定以指定單位量得的長度

@extent 指出所考慮的物件的大小,使用專案特定的詞彙,在由字詞組成的單一字串中結合數量以及單位。

@precision 描繪 其他屬性指定值的精準度 特性。

@scope 當測量總結了一個以上的觀察,指定這個測量的適用性。

許多這裡討論的元素可以兩個方式使用。

它們的主要目的是要指出,元素內容所編碼的文字表示某個特定種類(由元素本身指出)的編輯介入(或非介入)。

然而,也可以提供成對的或其他由這些元素組成的有意義的群組,將它們包在一個特殊目的的 choice 元素裡:

<choice> 在文本中相同的某個點匯集一些替代性的編碼。

這個元素讓標記人員能夠表達,例如某個文字的原始的、未改正的、未被改變的形式,旁邊跟著一個或多個編輯過的形式。

這個用法允許電腦軟體可以在文本的某個 view 跟另一個之間自動切換,因此 (例如) 可以設定某個樣式表顯示文本的原始形式,或者應用了某些特定種類的編輯介入之後的形式。

可以用這個方式組合的元素構成 model.choicePart 類別。

這個類別的預設成員是 siccorrregorigunclearadd 以及 del;它們的功能跟用法在下面描述。

本節討論三種類型的編輯介入:

  • 表示或更正明顯的(表面的)錯誤
  • 表示 變異、不規則、非標準或古怪的形式,或對它們的規則化。
  • editorial additions, suppressions, and omissions
  • 編輯新增、抑制、刪除

這些標籤在轉錄、編輯工作中的延伸處理在 11 Representation of Primary Sources 裡面。

3.4.1 明顯的(表面的)錯誤

當複製文本顯然有錯誤的時候,編碼人員或轉錄人員可能選擇直接更正而不做任何註解,雖然為了學術目的,如果能夠同時記錄更正後的以及文本的原始狀態,通常會更有用。

這裡描述的元素都可以使用三種方法,最後一種方式讓軟體容易呈現原始的或更新後的。

<sic> (latin for thus or so ) contains text reproduced although apparently incorrect or inaccurate.

<corr> (correction) contains the correct form of a passage apparently erroneous in the copy text.

下面例子顯示對於相同材料的不同處理方式。複製文本如下:

Another property of computer-assisted historical research is that data modelling must permit any one textual feature or part of a textual feature to be a part of more than one information model and to allow the researcher to draw on several such models simultaneously, for example, to select from a machine-readable text those marginal comments which indicate that the date's mentioned in the main body of the text are incorrect.

標記人員可能選擇訂正印刷錯誤,悄悄地修改,或是留下訂正的標示,如下:

… marginal comments which indicate that the <corr>dates</corr>
mentioned in the main body of the text are incorrect.

或者,標記人員也可能只記錄這個印刷錯誤而不訂正它,不留下任何註釋,或是使用 sic 元素來指出這個錯誤並不是在編碼轉錄過程發生的:

… marginal comments which indicate that the <sic>date's</sic>
mentioned in the main body of the text are incorrect.

如果標記人員選擇同時記錄原始來源文本,並且提供訂正以供字詞搜尋以及其他程式使用,那就 siccorr 都使用,包在一個 choice 裡面:

… marginal comments which indicate that the
<choice>
  <corr>dates</corr>
  <sic>date's</sic>
</choice> mentioned in the main body of the text are
incorrect.

siccorr 元素的順序怎麼排都可以。

如果想要指出這個校訂的負責人或版本,可以這麼做:

… marginal comments which indicate that the
<choice>
  <corr resp="#msm">dates</corr>
  <sic>date's</sic>
</choice> mentioned in the main body of the text are
incorrect.
<!-- 在這個文件的檔頭裡 ... -->
<respStmt>
  <resp>editor</resp>
  <name xml:id="msm">C.M. Sperberg McQueen</name>
</respStmt>

這裡的 @resp 屬性用來指出這個訂正的責任歸屬。

它的值 (#msm) 是 3.6 Simple Links and Cross-References 所討論的 pointer values 的一個例子;在這個案例裡,它指向一個 TEI Header 裡的 name 元素,但是它可以指向任何元素,包括像一個 person 元素 (如果有 include 13 Names, Dates, People, and Places 所描述的 module),或者 3.11 Bibliographic Citations and References 所描述的書目元素之一,如果這個訂正是取自其他來源。

att.responsibility class 的所有元素成員都可以使用 @resp 屬性。

這個 class 也提供 @cert 屬性,可以用來指出某個特定訂正的編輯信心程度,如下例:

An <choice>
  <corr cert="high">Autumn</corr>
  <sic>Antony</sic>
</choice> it was,
That grew the more by reaping

進一步的討論請看 11.3.1.3 Correction and Conjecture

如果訂正的形式是像這裡一樣,加上一些沒有出現在來源文本的文字,標記人員應使用 corr 元素。

如果訂正是出現在來源文本上,並且由一些可見的插入和刪除組成,那麼應該使用 adddel:詳見下面章節 3.4.3 Additions, Deletions, and Omissions

如果訂正的形式是增加一些材料,它們沒有出現在原始文本中的原因是物理損壞或模糊,可以使用 supplied 元素。

如果「訂正」只是展開某個縮寫,可以使用 ex 元素。

這些以及其他一些用來支援這種作者或抄寫員介入的詳細標記元素,都由 11 Representation of Primary Sources 描述的 module 提供。

3.4.2 正規化 (Regularization) 以及 常態化(Normalization)

如果來源文本使用大量非標準拼寫的異體形式,可能有一些原因會想要將它「正規化」:也就是說,提供與非標準形式同義的「標準」或「正規」形式。

如同其他一些在複製文本中所做的變更,這些變更可能是無聲地進行 (這樣的話應該在 TEI header 裡指出有哪些無聲變更的類型),或是使用下列元素明確標記:

<reg> (regularization, 正規化) 包含經過某種正規化或常態化的用字。

<orig> (original form, 原始形式) 包含遵循原始文件的用字,而不是經過常態化或訂正後的用字。

<choice> 在文本中的某一個相同點,將某些替代編碼包成一個群組。

這些元素的典型應用包括產生各種針對學生或在家讀經人 (lay reader)、語言研究的版本,這時候拼寫或用法的變異不是主要的問題,或是產生拼寫詞典等等。

考慮這個16世紀的文本:

how godly a dede it is to overthrowe so wicked a race the world may judge: for my part I thinke there canot be a greater sacryfice to God.

標記人員可能選擇保留這個文本的原始拼寫,但是簡單使用沒有屬性的 orig 元素將它標示為非標準:

<p>...how godly a <orig>dede</orig> it is to
<orig>overthrowe</orig> so wicked a race the
 world may judge: for my part I <orig>thinke</orig>
 there <orig>canot</orig> be a greater
<orig>sacryfice</orig> to God</p>

或者,標記人員可能使用沒有屬性的 reg 元素指出某些字詞已經現代化,如下:

<p>...how godly a
<reg>deed</reg> it is to <reg>overthrow</reg> so wicked a race the
 world may judge: for my part I <reg>think</reg>
 there <reg>cannot</reg> be a greater
<reg>sacrifice</reg> to God.</p>

或者,標記人員可能決定同時記錄新舊拼寫,這樣子,同一份電子文本可以做為舊版或新拼寫版本的基礎:

<p>...how godly a <choice>
  <orig>dede</orig>
  <reg>deed</reg>
 </choice> it is to
 <choice>
  <orig>overthrowe</orig>
  <reg>overthrow</reg>
 </choice> so wicked a race the
 world may judge: for my part I <choice>
  <orig>thinke</orig>
  <reg>think</reg>
 </choice>
 there <choice>
  <orig>canot</orig>
  <reg>cannot</reg>
 </choice> be a greater
 <choice>
  <orig>sacryfice</orig>
  <reg>sacrifice</reg>
 </choice> to God.</p>

跟別的地方一樣,@resp 屬性可以用來指出正規化的責任歸屬。

未完待續....