3.3 突顯及引用

本文翻譯自 http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/CO.html#COHQ, 2011.12.16-2012.1.9

這一節處理多種文字功能 (features),它們全部都有一個共同點,在傳統印刷實務中使用底線、斜體字或引號來實現這種功能,這裡統稱為「突顯」(highlighting)。

初步討論這種現象以及替代標記方法之後,本節描述以下文字功能的標記方式,它們依慣例都是以某種突顯 (highlighting) 方式呈現:

  • 重點強調,外文以及其他語言上的不同突顯用法
  • 代表談話、思考、引文等等。
  • 技術用語、評註等。

什麼是「突顯」?

我們所說的「突顯」,指的是使用印刷或書寫文中的任意排版功能(字型、大小、顏色等)的組合,將某段文字與它週圍的文字做出區分。9

突顯的目的通常是要吸引讀者的注意力到被突顯文字的某些功能或特點上;本節描述本指引建議用於標記這類文字功能(textual features)的標記。

依慣例印刷的現代文本中,「突顯」通常被用來標示出下列一種或多種情況的字詞或片語:

  • 在某種方式上有區別 — 外文、方言、古代的、技術的等等。
  • 強調,例如在談話時會用重音強調
  • 不是文本主體的一部分,例如交叉引用、書名、章節標題、標籤等等。
  • 一個獨立的敍事文字串(narrative stream),例如一個內部獨白或評論。
  • 敍事者歸責於其他機構,不管是文本裡面或外面:例如,直接談話或引文。
  • 以某種其他方式自文本中分離出來:諺語片語、提到但未使用的字詞、舊文本中的人名和地名、編輯勘誤或補充等等。

由「突顯」指出的文字功能,在文本中的不同部分、或在不同文本中,不一定會有一致的呈現。

(例如,羅馬字型包圍的外文可能以斜體呈現,而斜體字包圍的外文則以羅馬字型呈現。)

因此,本指引區別「標記該呈現本身」以及「標記該呈現方式所代表的功能」之間的不同。

這樣的「突顯」可能由全域屬性 @rend 或 @rendition 屬性來標記(見 1.3.1.1 Global Attributes)。

藉由在本指引中選擇適當的元素,標記者可以指出某個被突顯的片語或字詞的功能,同時也可以藉由 @rend 屬性進一步描述它被突顯的方式。

如果標記者不想詮釋來源文本中的「突顯」所代表的功能,那可以使用 hi 元素,它只是指出所標記的文字以某種方式突顯。

<hi> (顯目標示, highlighted) 標誌其字型外觀上和週遭文字有所區別的字詞,但不指出顯目原因。

hi 元素由 model.hiLike class 提供。

本版指引未正式定義 @rend 屬性所能攜帶的可能值。

由於 @rend 屬性可以用來記錄某段文字在原始來源文本中任何古怪的呈現方式,它可能需要表達一個很大範圍的排版功能,不限於字型、字體大小等等。

這是適當的,同時也是合理可行的,本指引建議「突顯」所標示的文字功能應該要加以標記,而不只是簡單標記「突顯」這個事實。

這是基於下列理由:

  • 同樣種類的「突顯」在不同的上下文脈之中可能用於不同的目的
  • 同樣的文字功能在不同的上下文脈之中可能以不同的方式突顯
  • 基於分析的目的,能夠知道某個突顯片語預期的功能通常比較有用,而不只是知道它有所區別。

在許多(如果不是大多數)情況下,某個突顯片語所代表的功能是顯而易見而且沒有爭議的,因為突顯變動所指出的區別與本指引其他地方所討論的區別符合。

用於記錄這種區別的元素大部分是 model.emphLike class 的成員。

這和上面提到的 model.hiLike class 構成 model.highlighted class,它是一個片語等級的 class。

這個 class 的成員可以出現在段落等級元素裡的任何地方。

這兩個 classes 之間的區別很簡單,分別由 hiemph 這兩個元素代表:前者簡單標示出某段文字的印刷格式在某種方式上有所區別,後者則聲稱某段文字為了某種目的在語言上做了強調。

這兩個屬性雖然經常結合在一起,但並不相同。

它應該被辨識出來,然而的確存在某些情況,要標示出它的功能在經濟上並不適當(例如準備大型文集),也有一些情況在理智上並不適當(例如某些古老材料的文字轉錄,或是準備排版實務研究的材料)。

這種情況,應使用 hi 元素或來自 model.hiLike class 的一些其他元素。

有些可以經由排版格式的不同辨認出來的元素沒有在這一節裡討論,包括 title(在 3.11 Bibliographic Citations and References 中討論)以及 name(在 3.5.1 Referring Strings 中討論)。

強調、外文、罕用語言

這個小節討論下列元素:

<foreign> (外文) 標明所屬語言不同於週遭文字的字詞。

<emph> (強調) 為了語言上或修辭上的效果而加重語氣或特別強調的字句。

<distinct> 標明被視為特殊用語的字詞,例如:古語、專業用語、方言、非推薦用語等,或標明形成部分次要語言的字詞

這些元素都是 model.emphLike class 的成員。

外文

非文本主要語言的字詞或片語應該貼上外文的標籤,至少在文本中有指出這個事實的地方。

如果這個字詞或片語已經可以透過它的功能而與文本其它部分有所區別(例如它是個名稱、術語、引文、提到的字詞等等)那麼應使用全域屬性 @xml:lang 來指出它的語言和週遭文字不同。

Any element in the TEI scheme may take a xml:lang attribute, which specifies both the writing system and the language used by its content (see sections 1.3.1.1.2 Language Indicators and vi.1. Language identification for discussion of this attribute and its values respectively).

TEI 系統架構裡的任何元素都可以有 @xml:lang 屬性,它指出該元素內容的書寫系統以及所用的語言(關於這個屬性以及它的值請分別參考 1.3.1.1.2 Language Indicators 以及 vi.1. Language identification)。

如果沒有其它適用的元素,可以使用 foreign 元素再加上 @xml:lang 屬性。

<q>Aren't you confusing <foreign xml:lang="la">post hoc</foreign> with <foreign xml:lang="la">propter
  hoc</foreign>?</q> said the Bee Master.
<q>Wax-moth only succeed when
  weak bees let them in.</q>

文本中提到或評註的外文字詞不應使用 foreign 元素:這些應使用下面 3.3.4 Terms, Glosses, Equivalents, and Descriptions 的適當元素。

比較下列範例句子:

John eats a <foreign xml:lang="fr">croissant</foreign> every morning.
<mentioned xml:lang="fr">Croissant</mentioned> is difficult to
  pronounce with your mouth full.
A <term xml:lang="fr">croissant</term> is a crescent-shaped
  piece of light, buttery, pastry that is usually eaten for
  breakfast, especially in France.

沒有明確以 @xml:lang 屬性陳述它們的內容語言的元素,會被理解為從它們的上層元素繼承該屬性值。

因此,在一般情況下,建議的做法是為根 TEItext 元素提供一個 @xml:lang 屬性的預設值,如 1.3.1.1.2 Language Indicators 所進一步討論的。

強調的字詞或片語

emph 元素用於標示在語言上強調或加強語氣的單字或片語。

只在印刷上強調的文字屬於突出顯示的文字,可以用 hi 元素標記。

在印刷作品中,強調通常是由斜體字、較大字體或加大字距來表示;而在手寫稿、打字稿中,則通常是使用底線來表示。

如下範例所示,標記人員可以選擇是否要使用 @rend 屬性明確指出該強調所採用的特定呈現方式。

如果來源文本中始終以某種特定的方式來呈現某個功能(例如強調或外文字詞),那可以在 TEI header 裡使用 rendition 元素來描述該功能的呈現方式。

這時,@rend 屬性就可以用來描述偏離規範的特例。

例如,假設 TEI Header 定義了 emph 元素的預設呈現方式,下面的編碼會使用它:

<q>Sex, sir, is <emph>purely</emph> a
question of appetite!</q> Tarr exclaimed.

另一方面,如果沒有為該元素定義預設值,標記人員可以使用 @rend 屬性指定:

<q>What it all comes to is this,</q> he said.
<q>
  <emph rend="italic">What does Christopher
    Robin do in the morning nowadays?</emph>
</q>

或者,在檔頭中有提供了 rendition 元素(不一定要跟任何其他元素聯結),可以使用 @rendition 屬性指到它:

<l>Here Thou, great <name rend="italics">Anna</name>!
  whom three Realms obey,</l>
<l>Doth sometimes Counsel take —
  and sometimes <emph rendition="#italic">Tea</emph>.</l>
<!-- in the header ... -->
<rendition xml:id="italic" scheme="css">text-style:italic</rendition>

使用 rendition 元素的進一步資訊在 2.3.4 The Tagging Declaration 中提供。

hi 元素用來標示以某些方式突出顯示的字詞或片語,但是要識別它所想要表達的區分有困難、有爭議,或是不可能。

它讓標記人員可以簡單記錄突出顯示的事實,可能使用 @rend 或 @rendition 屬性來描述它,如上所述,但不管這個突出顯示所代表的功能。

如果文本是以兩階段處理,這可能也有用:第一階段簡單表示印刷上的區別,然後在第二階段將 hi 元素取代為更明確具體的特定元素。

一些簡單的例子:

<hi rend="gothic">And this Indenture further witnesseth</hi>
  that the said <hi rend="italic">Walter Shandy</hi>, merchant,
  in consideration of the said intended marriage ...

在這個例子裡,第一個突出顯示的片語使用黑色字母或哥德式印刷模仿法律文件的外觀,並以斜體字標示 Walter Shandy 為名稱。

在第二階段,第一個地方可能適合用 headlabel 元素,第二個地方使用 name 元素。

The heaviest rain, and snow, and hail, and sleet, could
 boast of the advantage over him in only one respect. They
 often <hi rend="quoted">came down</hi> handsomely, and
 Scrooge never did.

這個例子裡,came down 這個片語使用引號來表示一個文字遊戲。10

在第二階段,可能使用 soCalled 元素。

Other Linguistically Distinct Material

對於某些類型的分析來說,可能想要比 foreign 元素更精緻地標記某些字詞、片語在語言上的區別。

為了這個目的提供了 distinct 元素。

它的屬性允許額外資訊描繪兩種不同方式造成的語言區別的性質特徵:@type 屬性簡單指定某種使用者定義碼給某個字詞或片語,指出它是某些語域、次語言等等。

目前在該領域的共識不多,對於該屬性的可能值也就沒有建議。

此外,其餘的三個屬性可以組合使用,將一個字詞或片語置於一個描述語言學有時會使用的三維尺度上,例如 Mattheier et al, 1988

@time 屬性將某個字詞放在時間尺度上,例如它是古代的、老式的、當代的、未來的等;@space 屬性是關於地理分類,例如全國的、地區的、國際的等等;@social 屬性是關於社會分類,例如技術的、有禮貌的、無禮的、限制的等等。

同樣的,這些屬性目前沒有建議的屬性值;標記人員應在 header 的適當區段提供架構描述。 (請看 2.3 The Encoding Description)

範例:

Next morning a boy in that dormitory confided to his
 bosom friend, a <distinct type="psSlang">fag</distinct> of
 Macrea's, that there was trouble in their midst which
 King <distinct type="archaic">would fain</distinct> keep
 secret.
Next morning a boy in that dormitory confided to his
 bosom friend, a
<distinct time="1900" space="GB" social="publicschool">fag</distinct>
 of Macrea's, that there was trouble in their midst which
 King <distinct time="archaic">would fain</distinct> keep
 secret.

當需要更複雜 (或更嚴密) 的詮釋性分析,相較於這些簡單的特性描述,應優先採用 18 Feature Structures 所描述的更詳細、一般化的機制。

或者使用 3.8Notes, Annotation, and Indexing 所描述的簡單註解元素 note,或 17.3 Spans and Interpretations 描述的 span 元素來記錄這裡建議的各種分析。

引文

有一種呈現變化的形式在書寫及印刷文本中特別經常出現,那就是引號的使用。

如同上一節所討論的印刷變體,如果能將以下兩種分開標記,通常會有所助益:一種是標記它所代表的文字功能 (例如一個引文或直接談話),一種是標記它的呈現 (例如使用某種特定樣式的引號)。

本節討論下列元素,它們通常都以引號呈現:

  • <q> (引用的言詞、思想、或文字) 包含標記為 (看似) 引用自他處的內容;在敘述文中,此元素用來標記直接或間接敘述;在字典中,用來標記實例或編者設計的範例;在寫本描述或其他上層資訊中,用來標記由來源文本中所摘錄的引文。
  • <said> (談話或思想) 表示思想的段落或口語朗讀,不論在來源中是否明確表示,直接或間接,來自真實的人或虛構的人物。
    • @direct 屬性用來指出引文被視為直接或間接的談話。
    • @aloud 屬性用來指出引文有用口語說出來或只是以手勢示意。
  • <quote> (引文) 包含敘述者或作者引用自文本以外來源的字 (句) 詞或段落。
  • <cit> 從其他文件中引用的內容,並包含引用來源的書目參照資料。
  • <mentioned> 標誌被提到的但意義上不被使用的字句。
  • <soCalled> 作者或敘述者使用的字句在意義上另有所指的表現,例如:諷刺所使用的引號或斜體標示。

mentionedsoCalled 元素是 model.emphLike 類別的成員;qsaid 本身是 model.qLike 類別的成員,而 citquotemodel.quoteLike 類別的成員,它是 model.qLike 的子類別。

這個類別是 model.inter 的子類別;因此所有這些元素都允許出現在段落層級的元素裡面或之間。

引號最常見和最重要的用途當然是標示引文,意思是作者或敍述者想要指出將文本的某個部份歸因於敍述聲音之外。

如果不需要進一步判斷在這之上的區別,可以使用 q 元素。

如果覺得有需要進一步區分,例如指出它們是演講、書寫或思想,可以使用 @type 屬性或本節討論的專門元素。

例如,quote 可以用於引用自其他作品的段落,或者 said 元素用於目前作品中的人物所說或所想的字詞或片語。

soCalled 元素使用於這種情況:作者或敍述者跟某些字詞保持距離,然而又沒有指出它們來自任何其他特定的聲音。

當某個字詞或片語是在文本的主體中被討論,而不是直接形成文本的一部分,這種情況就適合用 mentioned 元素。

如上所述,如果某段文字跟週圍文字不同的原因,不能可靠的做出區別,或是沒興趣,那麼任何談話、思想或書寫可以簡單的使用 q 元素標示。

引文在印刷來源中可能是以字體指出,或是特殊的標點符號 (單引號、雙引號、角括號、破折號等等) 以及文字編排 (段落縮排等),或者也可能完全沒有明確表示。

如果對這些特徵有興趣,可以使用 1.3.1.1 Global Attributes 所討論的全域 @rend 或 @rendition 來記錄它們。

引號本身,像其它標點一樣,為了某些原因可能覺得值得保留在文本中,完全不依賴 @rend 屬性對它們的描述。

一般應使用適當的 Unicode 字元,如果不可能,那就使用數值字元參考 (numeric character reference, 參見 Character References)。

如果標記人員決定要保留這些引號,同時以明確的標籤,例如 quote 來表示它們的功能,那麼引號應被包括在元素裡面,而不是外面。

然而,為了許多目的,較好的做法是完全抑制引號,或是在 @rend 屬性裡使用一些適當的協定集合來描述它們。

以下是一些例子:

<said rend="PRE lsquo POST rsquo">Who-e debel
 you?</said> — he at last said —
<said rend="PRE lsquo POST rsquo">you no speak-e,
 damme, I kill-e.</said> And so saying,
 the lighted tomahawk began flourishing
 about me in the dark.
Adolphe se tourna vers lui :
<said>— Alors, Albert, quoi de neuf?</said>
<said>— Pas grand-chose.</said>
<said>— Il fait beau,</said> dit Robert.
Adolphe se tourna vers lui :
<said rend="PRE mdash">Alors,
 Albert, quoi de neuf ?</said>
<said rend="PRE mdash">Pas grand-chose.</said>
<said rend="PRE mdash">Il fait beau,</said>
 dit Robert.

做為 att.ascribed class 的成員,saidq 元素共享下列屬性:

att.ascribed 提供的元素屬性代表言詞或行為,可出自某一特定個人。

@who 指出該元素內容所歸屬的個人或團體。

這可以用來明確指出是誰在說話:

Adolphe se tourna vers lui :
<said who="#Adolphe">— Alors, Albert,
 quoi de neuf?</said>
<said who="#Albert">— Pas grand-chose.</said>
<said who="#Robert">— Il fait beau,</said>
 dit Robert.
<!-- .... -->
<list type="speakers">
 <item xml:id="Adolphe"/>
 <item xml:id="Albert"/>
 <item xml:id="Robert"/>
</list>

不管在文本中有沒有明確指出說話的人,都可以提供 @who 屬性。

它的形式可以是說話者名稱的常態化(如上),不過它的角色是一個指示器,指到文本的另一個提供每一個說話者的地方。

放置這種資訊最適當的地方是 TEI Header 的參與者描述元件裡面,如同 15.2.2 The Participant Description 所進一步描述的。

不過像上面這樣簡單的情況,在 text 元素下的 front 或 back 元素裡放一個簡單的說話者清單也許就足夠了。

它對於區分談話或思想的表現方式也有幫助,現代印刷品通常是以字體的改變來指出這個區別。

為了這個目的提供 @aloud 屬性,像這個例子:

<said aloud="true">Oh yes,</said> said Henry,
<said aloud="false">I mean
 Gordon Macrae, for example…</said>
<said aloud="false">Jungian
 Analyst with Winebox! That's what you called him, you callous bastard,
 didn't you? Eh? Eh?</said>

引文裡面可以再包引文,例如某個說話者在報告另一個人的談話:

<said who="#Wilson">Spaulding, he came down into the office just this day
 eight weeks with this very paper in his hand, and he says:—
 <said who="#WilsonSpaulding">I wish to the Lord, Mr. Wilson, that I was a
 red-headed man.</said>
</said>
<!-- ... -->
<list type="speakers">
 <item xml:id="Wilson">Wilson</item>
 <item xml:id="WilsonSpaulding">Spaulding reported by Wilson</item>
<!-- ...-->
</list>

以這種方式套疊的直接談話跟其他地方用一樣的方式處理:可能發生呈現方式的變更,但是應使用相同的元素。

然而標記人員可能選擇在「包含引文的直接談話」與「額外文本素材及直接談話本身」做出區分,如下範例:

<p>
 <said>The Lord! The Lord! It is Sakya Muni himself,</said> the lama half
 sobbed; and under his breath began the wonderful Buddhist
 invocation:-<said>
  <quote>
   <l>To Him the Way — the Law — Apart —</l>
   <l>Whom Maya held beneath her heart</l>
   <l>Ananda's Lord — the Bodhisat</l>
  </quote>
 And He is here! The Most Excellent Law is here also. My
 pilgrimage is well begun. And what work! What work!</said>
</p>

來自其他作品的引文通常伴隨一個來源出處參照。

cit 元素可以用來將引文和它相關的書目參考匯集在一起,這個書目參考應以 3.11 Bibliographic Citations and References 所討論的元素來標記,如下範例。

<div xml:id="mm01" type="chapter">
 <head>Chapter 1</head>
 <epigraph>
  <cit>
   <quote>
    <l>Since I can do no good because a woman</l>
    <l>Reach constantly at something that is near it.</l>
   </quote>
   <bibl>
    <title>The Maid's Tragedy</title>
    <author>Beaumont and Fletcher</author>
   </bibl>
  </cit>
 </epigraph>
 <p>Miss Brooke had that kind of beauty which seems to be thrown into
  relief by poor dress...</p>
</div>

如同其他書目參照,附加到一個引文上的引用可能只簡單以一個 pointer 來表示,像這個例子:

Lexicography has shown little sign of being affected by the
 work of followers of J.R. Firth, probably best summarized
 in his slogan, <cit>
 <quote>You shall know a word by the company it keeps.</quote>
 <ref>(Firth, 1957)</ref>
</cit>

跟本章討論的大部分其他元素不同,直接談話和引文經常包含段落或詩偈類的高層級元素,它們本身也經常被包含在這類元素裡面。

這個眾所周知的結構性問題,存在三種可能的解決方案:

  • 把引文切成多個分段,每一個分段整個被包含在一個段落裡面
  • 使用 stand-off markup 來標記引文
  • 引文的邊界由空的區段邊界定義元素(empty segment boundary delimiter elements ) 來表示

進一步討論以及多個範例,請看 20 Non-hierarchical Structures

本節最後,當引號是用來將引文與敍述者或談話者保持距離的時候,soCalled 元素可以用於所有這些情況。

常見的例子包括報紙頭條和廣告裡常出現的 ‘scare’ quotes,效果是對某個主張的真實性表示懷疑:

<head>PM dodges <soCalled>election threat</soCalled> in interview</head>

各種特別具有諷刺意味的用法也應使用相同的元素來標記。

下面是一些範例:

He hated <soCalled>good</soCalled> books.
<soCalled>Croissants</soCalled> indeed! toast not good enough for you?
Although Chomsky's decision that all NL
 sentences are finite objects was never justified by arguments from
 the attested properties of NLs, it did have a certain
<soCalled>social</soCalled> justification. It was commonly assumed in
 works on logic until fairly recently that the notion
<mentioned>language</mentioned> is necessarily restricted to finite
 strings.

Terms, Glosses, Equivalents, and Descriptions

本節說明一些文本元素,用來提供字詞定義或註解 (gloss)、替代辨識名稱,或某些東西的描述。

技術術語在印刷文本中第一次提到時通常會用斜體或粗體;有時候會有解釋或 gloss 括在引號裡面。

按照慣例,語言分析會以斜體字舉出所討論語言的字詞,緊接著提供一個以單引號括起來的 gloss。

其他文本在提到 (例如做為範例) 而不是使用個別字詞或片語的時候,可能以斜體字或單引號標示,提供 gloss 的情況則不規律。

<term> 包含作為專有名詞的一個單字、詞彙、或是表示符號。

<gloss> 標明用來為另一個字詞下定義或提供註解的字詞。

這些元素也是 model.emphLike class 的成員。

A term may appear with or without a gloss, as may a mentioned element.

一個 term 的出現可能伴隨一個 gloss,也可能沒有,跟 mentioned 元素一樣。

如果有 gloss 的話,它可以使用 @target 屬性連結到它所註解的 term。

要建立這樣的連結,標記者應給予 termmentioned 元素一個 @xml:id 值,並提供這個 id 做為 gloss 元素的 @target 屬性值。

下面的例子示範這個機制:

We may define <term xml:id="TDPv" rend="sc">discoursal point of view</term>
 as
<gloss target="#TDPv">the relationship, expressed through discourse
 structure, between the implied author or some other addresser,
 and the fiction.</gloss>
<gloss rend="unmarked" target="#PRSR">A computational device that infers
 structure from grammatical strings of words</gloss> is known as a
 <term xml:id="PRSR">parser</term>, and much of the history of NLP over the
 last 20 years has been occupied with the design of parsers.

注意 term 元素是打算給本質上是專門術語的字詞或片語使用;如果字詞或片語只是在文本中被引用、討論或註解,通常更適合使用 mentioned 元素,如下範例:

There is thus a striking accentual difference between a verbal
 form like <mentioned xml:id="cw234" xml:lang="grc">eluthemen</mentioned>
<gloss target="#cw234">we were released,</gloss> accented on the
 second syllable of the word, and its participial derivative
<mentioned xml:id="cw235" xml:lang="grc">lutheis</mentioned>
<gloss target="#cw235">released,</gloss> accented on the last.

特別是對於技術術語來說,以及在用語研究裡的一般情況,如果能將文本中出現的術語關聯到一個權威標準定義,這可能是有用的,這個定義可能在同一文本的其他地方 (例如在一個術語表裡) 或是在外部,例如一個資料庫、權威檔,或是公佈的標準。

為了這個目的,term 元素可以使用 3.5.1Referring Strings 討論的 @key 和 @ref 屬性。

另一組元素用來提供 TEI 所描述的物件的各種不同名稱。

這種用法的範例是元素、屬性、類別 (以及合適處的屬性值) 的文件說明,以及字形 (glyphs) 的描述。

<altIdent> (alternate identifier, 供替換的辨識符) 以某個語言提供某個元素、類別、屬性等的建議 XML 名稱。

<desc> (description, 描述) 包含一個上層元素所要說明的物件的簡略描述,包括它打算的用途、目的,或適當的應用範圍。

<equiv/> (equivalent) 以 co-reference 或外部連結,指定一個認為相當於上層元素的元件。

@uri (uniform resource identifier) references the underlying concept of which the parent is a representation by means of some external identifier

@filter references an external script which contains a method to transform instances of this element to canonical TEI

@name names the underlying concept of which the parent is a representation

這些元素跟上面提到的 gloss 元素一起組成 model.glossLike 類別。

gloss 元素可以用來為該物件的名稱提供一個簡短說明,如果這不是不言自明的。

例如,用來標示文本任意區塊 (arbitrary blocks) 的 ab 元素,它的規格開頭如下:

<elementSpec module="linking" ident="ab">
 <gloss>anonymous block</gloss>
<!--... -->
</elementSpec>

類似的情況下也可以為某個屬性名稱或屬性值提供一個 gloss

<valList type="open">
 <valItem ident="susp">
  <gloss>suspension</gloss>
  <desc>the abbreviation provides the first letter(s)
   of the word or phrase, omitting the remainder.</desc>
 </valItem>
 <valItem ident="contr">
  <gloss>contraction</gloss>
  <desc>the abbreviation omits some letter(s) in the middle.</desc>
 </valItem>
<!--...-->
</valList>

請注意這跟使用 desc 元素相當不同,其中包含該物件預期語意的完整描述。

equiv 元素用來記錄這個物件所代表的概念,和其他系統或 ontologies 裡描述的相同概念之間的同等關係。

@uri 屬性用來提供一個 pointer 指到某個外部概念定義的地方。

例如,要指出 TEI 的 death 元素符合 CIDOC CRM 類目 E69 定義的概念,前者的宣告可能如下開頭:

<elementSpec module="namesdates" ident="death">
 <equiv name="E69" uri="http://cidoc.ics.forth.gr/"/>
<!--... -->
</elementSpec>

equiv 元素也可用於對映新定義的元素至 TEI 的現有結構中,使用 @filter 及 @name 屬性指到一個對映的實施 (implementation)。

這是有用的,當一個 TEI 的客製化 (見 23.2 Personalization and Customization) 為了資料輸入的方便或標記可讀性而定義「捷徑」的時候。

例如,假設在某個 TEI 客製化裡定義了一個 <bo> 元素,它在概念上等同於標準標記 <hi rend="bold">。

下面的聲明將額外表明,從 URI 指定的地方得到一個過濾器 (filter),然後執行名稱為「bold」的程序,可以將 <bo> 元素的實例轉換至標準 TEI。

@mimeType 屬性指定該過濾器的撰寫語言 (本例中為 XSL):

<elementSpec ident="bo" ns="http://www.example.org/ns/notTEI">
 <equiv
  filter="http://www.example.com/equiv-filter.xsl"
  mimeType="text/xsl"
  name="bold"/>
 <gloss>bold</gloss>
 <desc>contains a sequence of characters rendered in a bold face.</desc>
<!-- ... -->
</elementSpec>

altIdent 元素用來為某個物件提供替代名稱,例如使用不同的自然語言。

因此,下面可能被用來指出 abbr 元素應以德文字 Abkürzung 來辨識:

<elementSpec ident="abbr" mode="change">
 <altIdent xml:lang="de">Abkürzung</altIdent>
<!--...-->
</elementSpec>

同樣的方式,下列 graphic 元素的規格指出 @url 屬性也可以使用 href 替代辨識符:

<elementSpec ident="graphic" mode="change">
 <attList>
  <attDef mode="change" ident="url">
   <altIdent>href</altIdent>
  </attDef>
<!-- .... -->
 </attList>
</elementSpec>

預設情況下,某個元件的 altIdent 跟它的 @ident 屬性是完全相同的。

The contents of the desc element provide a brief characterization of the intended function of the object being documented in a form that permits its quotation out of context, as in the following example:

desc 元素的內容提供被說明物件的預定功能的簡要特性,如下範例:

<elementSpec module="core" ident="foreign">
<!--... -->
 <desc>identifies a word or phrase as belonging to some language other
  than that of the surrounding text. </desc>
<!--... -->
</elementSpec>

按照慣例, desc 元素由一個動詞開始,例如 containsindicatesspecifies 等等,並包含一個單一的子句。

一些進一步的例子

做為這裡所討論的元素的簡單範例,考慮下面的句子:

On the one hand the Nibelungenlied is associated with the new rise of romance of twelfth-century France, the romans d'antiquité, the romances of Chrétien de Troyes, and the German adaptations of these works by Heinrich van Veldeke, Hartmann von Aue, and Wolfram von Eschenbach.

這個句子的第一個近似標記可能是簡單記錄以斜體字突出顯示的事實,如下:

On the one hand the <hi rend="italic">Nibelungenlied</hi> is
 associated with the new rise of romance of twelfth-century France,
 the <hi xml:lang="fr" rend="italic">romans d'antiquité</hi>,
 the romances of Chrétien de Troyes, ...

然而,這個編碼會失去斜體標題與斜體外文版語之間的重要區別。

文本中可能還有許多其他片語是斜體字,想要鑑別外文語詞的檢索程式如果只是簡單尋找斜體字,將不能產生可靠的結果

因此,在經濟和知識產權限制允許的情況下,更好的方式是將突顯片語的功能以及外觀都進行編碼,如下:

On the one hand the <title rend="italic">Nibelungenlied</title>
 is associated with the new rise of romance of twelfth-century France,
 the <foreign rend="italic">romans d'antiquité</foreign>, the
 romances of Chrétien de Troyes, ...

在這個例子中,以突出顯示的方式來區分文本特徵的決定,相對來說比較不會引起爭議。

一個不那麼直截了當的例子,考慮下列文段中斜體字型的使用:

A pretty common case, I believe; in all vehement debatings. She says I am too witty; Anglicé, too pert; I, that she is too wise; that is to say, being likewise put into English, not so young as she has been: in short, she is grown so much into a mother, that she had forgotten she ever was a daughter. ...

顯然,vehement 這個詞斜體化的原因跟 not so young as she has been 這個片語不一樣;前者是強調,後者則像諺語。

它也為 too wise 提供了一個具有諷刺意味的註解,同樣的方式以 too pert 來註解 too witty

The glossed phrases are not, however, technical terms or cited words, but quoted phrases, as if the writer were putting words into her own and her mother's mouths.

最後,mother 跟 daughter 這兩個字的斜體化顯然只是為了顯示它們在句子中的對比;當然它們不屬於目前所提出的斜體化原因的任何類別。

還要注意 Anglicé 這個字並沒有斜體化,雖然它通常不被視為英文字。

下面這個上面文段的編碼範例嘗試考慮到所有上述各點:

A pretty common case, I believe; in all <emph>vehement</emph>
 debatings. She says I am <q rend="italic">too witty</q>;
<foreign xml:lang="la" rend="roman">Anglicé</foreign>,
<gloss rend="italic">too pert</gloss>; I, that she is
<q rend="italic"> too wise</q>; that is to say, being likewise
 put into English, <gloss rend="italic">not so young as she has
 been</gloss>: in short, she is grown so much into a
<hi rend="italic">mother</hi>, that she had forgotten she ever
 was a <hi rend="italic">daughter</hi>.