Detailní členění skupin slov řazených ke slovnímu druhu zájmen je v různých mluvnicích podáno s menšími odchylkami. Klasické mluvnice i školská praxe dělí zájmena podle funkce (syntaktické, sémantické kritérium) na substantivní a adjektivní a třídí je do sémanticky definovaných skupin (druhy zájmen – osobní, přivlastňovací, ukazovací, tázací, vztažná, neurčitá, záporná, zvratná). Po formální stránce (morfologické kritérium) zájmena představují různorodou skupinu. Patří sem lexémy se speciální „zájmennou“ flexí, lexémy pravidelně skloňované adjektivně (oba druhy adjektivní flexe jmenná i složená) i lexémy kombinující tvary „zvláštní“ s pravidelně tvořenými tvary adjektivními.
V následujícím textu se pokusíme uvést přehled vycházející z formálního popisu této skupiny a dále přehled opírající se o popis funkčních sémantických charakteristik. Návrh NovaMorf si oproti dosavadnímu pražskému systému klade za cíl a) přehlednější klasifikaci slovního druhu zájmen,[1] b) přeřazení některých jednotek především z kategorie adjektiv (ale i číslovek) k zájmenům podle jasně definovaných kritérií, c) propojení klasifikace zájmen, zájmenných adverbií a zájmenných číslovek a d) doplnění některých opomenutých jednotek do slovníku automatického morfologického analyzátoru.
Kategorie a hodnoty zájmen v pojetí NovaMorf jsou představeny v § 1.2. V § 1.2.1 uvádíme poznámky k některým z relevantních kategorií (i těm, které nejsou v textu dále probírány), další pododdíly jsou podrobně věnovány hodnotám kategorií SUB (§ 1.2.2), DEI (§ 1.2.3) a jejich kombinacím v § 1.2.4.
V § 2 bude stručně představena lemmatizace zájmen.
Poté v § 3 probereme podrobněji pojetí kategorií poddruh (SUB) a deixe (DEI), jejichž kombinacemi jsou vymezeny jednotlivé druhy zájmen.
V § 4 se budeme krátce věnovat dalším kategoriím: osobě (PER) a mutacím (FMU, GMU).
Poslední část § 5 kapitolu krátce uzavírá.
Přehled toho, jak koresponduje popis zájmen s popisem zájmenných příslovcí a zájmenných číslovek viz jednotlivé kapitoly a také tabulková příloha (zajmena-prislovce-cislovky.xlsx).
Pro zájmena (POS=P) budou v pojetí NovaMorf relevantní tyto kategorie: poddruh (SUB), deixe (DEI), zkratka (ABR), rod (GEN), číslo (NUM), pád (CAS), osoba (PER), negace (NEG), jmenný tvar přídavných jmen (NOM), typ agregátu (AGR), globální mutace (GMU), flektivní mutace (FMU), viz tabulka 1.
Tabulka 1: Seznam relevantních kategorií zájmen a jejich hodnot
#
kategorie
značka kategorie
hodnoty
1
slovní druh
POS
P
2
poddruh
SUB
[oNUv]
3
deixe
DEI
[UNZTDVS]
5
zkratka
ABR
[+-]
6
rod
GEN
[MIFN-]
7
číslo
NUM
[SP-]
8
pád
CAS
[1234567-]
9
osoba
PER
[123-]
11
negace
NEG
[NA-]
13
jmenný tvar přídavných jmen
NOM
[J-]
14
typ agregátu
AGR
[P-]
15
globální mutace
GMU
16
flektivní mutace
FMU
a. Kategorie SUB a DEI
Kategorie poddruh a deixe jsou představeny v § 1.2.2 (SUB) a § 1.2.3 (DEI) a § 1.2.4 (druhy zájmen vzniklé kombinací hodnot těchto kategorií), podrobně jsou probrány v § 3.
b. Kategorie PER
Zaznamenáním kategorie osoby se budeme zabývat v § 4.1, a to u zájmen vyjadřujících kategorii osoby lexikálně (osobní zájmena, přivlastňovací zájmena a přivlastňovací vztažná zájmena) a u zájmen, které vstupují do agregátů a budou mít POS={P,V}|{R,P}|{R,P,V}.2
c. Kategorie NEG
Hodnotu NEG budou mít vyplněny pouze tvary zájmen jiný, každý s vydělitelným prefixem ne- (substantivizovaný tvar zájmene já, tedy nejá bude značkován jako POS=N).[3] V obou uvedených případech (nejiný, nekaždý) bude lemmatem tvar s ne- a NEG=N. Opozita těchto zájmen budou mít NEG=A, jinak budou mít zájmena NEG=-.
d. Kategorie NOM
Hodnotu NOM=J budou mít pouze tvary sám, sama, samo, sami, samy, které budou lemmatizovány jako zvláštní lemmata, viz § 3.4.1.
e. Kategorie GMU, FMU
Případy, u nichž bude využit koncept mutací, stručně uvedeme v § 4.2. Na této úrovni nebudeme řešit mutace, které se váží na obecněji definovaný hláskový/grafický kontext (například protetické v u lemmat/tvarů začínajících na o: on/von, nebo to, zda jako mutaci na rovině slovníku zaznamenávat varianty který/jaký kluk × kterej/jakej kluk nebo kteří/jací kluci × který/jaký kluci)4. Jedná se o úroveň, která je popsána na obecné rovině v kapitole Morfologické kategorie a jejich hodnoty # 05, § 15.
Značkování bude odrážet tyto poddruhy zájmen, viz Tabulka 2.
Tabulka 2: Poddruh zájmen (SUB)
SUB
vysvětlení
příklady
viz
o
osobní
já, ty, oni, se, si, sebe
§ 3.1
N
substantivní
kdo, nikdo
§ 3.2
U
přivlastňovací
můj, čí
§ 3.3
v
ostatní, zvl. vymezovací
každý, všechen, týž, sám, (v)oba, (v)obé, (v)obojí, (v)oboje, jediný
§ 3.4
Napříč dělení podle poddruhu jde dělení podle deixe, viz Tabulka 3.
Tabulka 3: Deixe zájmen (DEI)
DEI
vysvětlení
příklady
U
určitá
já, ty, můj, jeho, každý, oba
N
neurčitá
někdo, čísi
Z
záporná
nikdo, ničí
T
tázací
kdo(ž), co(ž), čí, který, jaký
V
vztažná
an, jehož, jejichž, jejíž, jenž, kterýžto
S
zvratná
se, si, sobě, sebe, sebou
D
ukazovací
ten, takový
Kombinací kategorií SUB a DEI jsou vymezeny následující kategorie zájmen. Jejich seznamy jsou probrány v jednotlivých pododdílech, viz tabulka 4.
Tabulka 4: Značkování zájmen na základě kombinací kategorií SUB a DEI
SUB
DEI
kategorie číslovek
příklady
viz
o
U
osobní zájmena (v užším smyslu)
já, ty, on, ona
§ 3.1.1
o
S
zvratná osobní zájmena
si, se, sebe
§ 3.1.2
N
N
neurčitá zájmena substantivní
někdo, něco, kdosi
§ 3.2.1
N
Z
záporná zájmena substantivní
nikdo, nic, pranic
§ 3.2.2
N
T
tázací zájmena substantivní
kdo, což, cože
§ 3.2.3
N
V
vztažná zájmena (v užším smyslu)
jenž, an
§ 3.2.4
U
U
posesivní zájmena (v užším smyslu)
můj, jeho, váš
§ 3.3.1
U
N
neurčitá zájmena posesivní
něčí, kdečí, čís(i)
§ 3.3.2
U
Z
záporná zájmena posesivní
ničí
§ 3.3.3
U
T
tázací zájmena posesivní
čí, čípak, číže
§ 3.3.4
U
V
vztažná zájmena posesivní
jejíž, jehož, jejichž
§ 3.3.5
U
S
zvratné zájmeno posesivní
svůj
§ 3.3.6
v
U
ostatní zájmena určitá
každý, sám, oba
§ 3.4.1
v
N
ostatní zájmena neurčitá
všelijaký, nějaký, jakýkoli
§ 3.4.2
v
Z
ostatní zájmena záporná
nijaký, žádný, pražádný
§ 3.4.3
v
T
ostatní zájmena tázací
který, jakýpak, ký
§ 3.4.4
v
V
ostatní zájmena vztažná
kterýž(to), jakýž(to)
§ 3.4.5
v
D
ostatní zájmena ukazovací
ten, onen, tamten
§ 3.4.6
a. Zájmena se zájmenným a adjektivním skloňováním
Lemmatem zájmen skloňovaných zájmenně a adjektivně bude tvar nominativu singuláru maskulina (životného). Bezrodá zájmena kdo a co budou mít lemma kdo a co.
b. Bezrodá osobní zájmena 1. a 2. osoby a rodová osobní zájmena 3. osoby
Bezrodá osobní zájmena první a druhé osoby singuláru budou lemmatizována tvarem nominativu singuláru. Pod lemma já budou zahrnuty tvary já, mne, mě, mně, mi, mnou, popřípadě další substandardní varianty, pod lemma ty budou zahrnuty tvary ty, tebe, tě, tobě, ti, tebou. Bezrodá osobní zájmena první a druhé osoby plurálu budou lemmatizována tvarem nominativu plurálu. Pod lemma my budou zahrnuty tvary my, nás, nám, námi, náma, pod lemma vy budou zahrnuty tvary vy, vás, vám, vámi, váma.
Pod lemma on budou zahrnuty tvary osobního rodového zájmena maskulin (GEN=[MI] – k desambiguaci) singuláru, pod lemma oni budou zahrnuty tvary osobního rodového zájmena maskulin životných v plurálu, pod lemma ony budou zahrnuty tvary osobního rodového zájmena maskulin neživotných a feminin (GEN=[IF] – k desambiguaci) v plurálu, pod lemma ona budou zahrnuty tvary osobního rodového zájmena feminin (GEN=F) v singuláru a stejné lemma budou mít i tvary osobního rodového zájmena neuter (GEN=N) v plurálu (shodné tvary se budou lišit v GEN a budou se desambigovat), pod lemma ono budou zahrnuty tvary osobního rodového zájmena neuter singuláru. Variantní tvary s protetickým v- budou odlišeny pomocí flektivní mutace.
c. Posesivní zájmena
U posesivních (i posesivních vztažných) zájmen se ctí posesivnost, u posesivních i posesivních vztažných zájmen 3. osoby se ctí jmenný rod a číslo. Pod lemma můj budou zahrnuty tvary všech rodů obou čísel posesivního zájmena 1. osoby singuláru, pod lemma tvůj budou zahrnuty tvary všech rodů obou čísel posesivního zájmena 2. osoby singuláru, pod lemma náš budou zahrnuty tvary všech rodů obou čísel posesivního zájmena 1. osoby plurálu, pod lemma váš budou zahrnuty tvary všech rodů obou čísel posesivního zájmena 2. osoby plurálu. Pod lemma svůj budou zahrnuty tvary všech rodů obou čísel posesivního zájmena svůj/svá/své. Pod lemma jeho budou zahrnuty tvary posesivního zájmena 3. osoby singuláru přivlastňující rodům [MIN]. Přestože jeho je tvar nesklonný, bude se u všech tvarů desambiguovat GEN=[MIFN] a NUM=[SP]. Rovněž se budou desambiguovat tvarově homonymní osobní zájmena. Pod lemma její budou zahrnuty tvary posesivního zájmena 3. osoby obou čísel přivlastňující rodu F, opět se bude u vysoce homonymních tvarů desambiguovat GEN=[MIFN] a NUM=[SP], pod lemma jejich budou zahrnuty tvary posesivního zájmena 3. osoby plurálu. Přestože jejich je tvar nesklonný, bude se u všech tvarů desambiguovat GEN=[MIFN] a NUM=[SP]. Stejná pravidla platí i pro lemmatizaci vztažných posesiv.
[POS=P & SUB=[oNUv] & DEI=[UNZTDVS]]
Níže uvedené kombinace hodnot POS, SUB a DEI u zájmen v návrhu NovaMorf mají za cíl nahradit velmi složitou dosavadní klasifikaci na druhé pozici ve značkách zájmen v pražském systému.5 Některé kombinace SUB & DEI jsou společné zájmenům, zájmenným příslovcím a zájmenným číslovkám.
[POS=P & SUB=o & DEI=U]
Seznam: já,6 ty,7(v)on, (v)ona, (v)ono, (v)oni, (v)ony, (v)ona, my,8 vy;
[POS=P & SUB=o & DEI=S]
Seznam: si, se, sebe, sebou, sobě;
Rozdíly mezi „krátkými formami“ („mě“, „mi“, „ti“, „mu“,...) a všemi ostatními tvary osobních zájmen, tedy ve stávajícím pražském značkování detailní určení slovního druhu (na druhé pozici) rozdíl [HP]9 budou zahrnuty pod jediné lemma a popsány pomocí flektivní mutace. Osobní zvratná zájmena sebou, sobě, sebe, se, si nemají první pád, jejich lemma je stejné jako slovní tvar, tedy sebou, sobě, sebe, se, si, viz kapitola Morfologické kategorie a jejich hodnoty # 05, § 2.3.
[POS=P & SUB=N & DEI=N]
Seznam:10 někdo/co, všelico(s)/kdo(s), bůhvíkdo/co, pánbůhvíkdo/co, pámbuvíkdo/co, čertvíkdo/co, kdovíkdo/co, nevímkdo/co, kdekdo/co, leckdo(s)/co(s), ledakdo(s)/co(s), ledaskdo/co, málokdo/co, všelikdo/co, zřídkakdo/co, sotvakdo/co, kdo/cokoli(v), kdo/cožkoli, kdo/cokolivěk, kdos/cos11, kdosi/cosi;
[POS=P & SUB=N & DEI=Z]
Seznam: nikdo, nic, pranic, pranikdo;
[POS=P & SUB=N & DEI=T]
Seznam: kdo(ž)(e), co(ž)(e), kdo(ž)pak, co(ž)pak, kdože, cože;
[POS=P & SUB=N & DEI=V]
Seznam: jenž, an, kterýžto,...;12
[POS=P & SUB=U & DEI=U]
Seznam:13 můj, tvůj, jeho, její, náš, váš, jejich;
[POS=P & SUB=U & DEI=N]
Seznam: něčí, bůhvíčí, pánbůhvíčí, pámbuvíčí, čertvíčí, kdovíčí, nevímčí, kdečí, lecčí, ledačí, ledasčí, máločí, všeličí, všelisčí, zřídkačí, sotvačí, číkoli, číkoliv, čížkoli, číkolivěk, čís(i);14
[POS=P & SUB=U & DEI=Z]
Seznam: ničí;
[POS=P & SUB=U & DEI=T]
Seznam: čí, čípak, číže;
[POS=P & SUB=U & DEI=V]
Seznam: jejíž, jehož, jejichž;
[POS=P & SUB=U & DEI=S]
Seznam: svůj;
[POS=P & SUB=v & DEI=U]
Seznam: každý, sám/samý15, všechen/všecek/všecken16, týž, tentýž, veškerý, jediný17, (v)oba, (v)obé, (v)obojí, (v)oboje18, všeliký, jiný19;
Tvary jiný, každý budou mít lemma jiný, každý a NEG=A, tvary nejiný, nekaždý budou mít lemma nejiný, nekaždý a NEG=N.
[POS=P & SUB=v & DEI=N]
Seznam: všelijaký, všeliký, nějaký/některý, bůhvíjaký/který, pánbůhvíjaký, pámbuvíjaký, čertvíjaký, kdovíjaký, nevímjaký, kdejaký, lecjaký, ledajaký, ledasjaký, málojaký, všelijaký, všelisjaký, zřídkajaký, sotvajaký, jakýkoli, jakýkoliv, jakýžkoli, jakýkolivěk, jakýs(i)20;
[POS=P & SUB=v & DEI=Z]
Seznam: nijaký, žádný, nižádný, pražádný, nijeden...
[POS=P & SUB=v & DEI=T]
Seznam: jaký, který, jaký/kterýpak, jaký/kterýže, jaký/kterýž, ký;
[POS=P & SUB=v & DEI=V]
Seznam: kterýž(to), jakýž(to);
[POS=P & SUB=v & DEI=D]21
Seznam: ten, tento, takový, tenhle/tendle/tenhlenc/tendlenc22, onen, takovýto, takovýhle, tenhleten/tendleten, tamten, tuten, taký, tamhleten/támdleten, tuhleten/tudleten, tedyhleten/tadydleten, tadyten, toť,...
Bezrodá zájmena osobní 1. a 2. osoby budou mít uvedenu hodnotu PER=[12].
Rodová zájmena osobní (on, ona, ono, oni, ony, ona), přivlastňovací (jeho, její, jejich) i přivlastňovací vztažná (jehož, jejíž, jejichž) budou mít uvedenu hodnotu osoby PER=3.
Hodnotu PER=- bude mít zájmeno co/-č uvnitř agregátu (POS={R,P} & AGR=c) se zájmennou složkou č za tvar zájmena co (oč ← o co, nač ← na co, zač ← za co, več ← v co,...).
Hodnotu PER=3 bude mít zájmeno on/-ň uvnitř agregátu (POS={R,P} & AGR=n) se zájmennou složkou za tvar zájmena on (oň ← o něj, doň ← do něj,...).
Hodnotu PER=2 bude mít sloveso být/-s uvnitř agregátu (POS={P,V} & AGR=P) se složkou s za tvar druhé osoby slovesa být (kdos ← kdo jsi, komus ← komu jsi, čemus ← čemu jsi, tohos ← toho jsi,… a také tys ← ty jsi).
Hodnotu PER=2 bude mít sloveso být/-s uvnitř agregátu (POS={R,P,V} & AGR=G) se složkou s za tvar druhé osoby slovesa být (očs ← o co jsi, načs ← na co jsi,...).
Hodnotu PER=3 bude mít zájmeno on/-ň a PER=2 bude mít sloveso být/-s uvnitř agregátu (POS={P,V}|{R,P,V} & AGR=[PG]) se složkou ň za zájmeno on a s za tvar druhé osoby slovesa být (níms23 ← ním jsi, naňs24 ← na něj jsi), viz podrobněji kapitola Agregáty # 08-15.
Koncept flektivní mutace bude u zájmen využit pro odlišení krátkých a dlouhých variantních tvarů osobních a zvratných zájmen (například tě/tebe, ti/tobě, u osobního zájmena on bude koncept flektivní mutace využit rovněž pro odlišení tvarů na j/ň: ho/jeho/něho), u zájmen přivlastňovacích bude využit pro odlišení krátkých a dlouhých tvarů (má/moje). (FMU: k-d, j-n).
Nářeční varianty existují a v brněnském slovníku jsou zachyceny ty, které se vyskytly v bmk + nějaké doplněné (viz Hlaváčková, 1998, 2001). Převážně jde o různé teritoriálně podmíněné varianty (například mnou/mnó, naše/naša/našé/našu/našou/našó, ji/ju, s ní/ňou,…), dále varianty grafického znázornění nedbalé výslovnosti (který/kerý/kerej…). Více lze u jednotlivých lemmat vidět přes www rozhraní analyzátoru Ajka. (http://nlp.fi.muni.cz/projekty/wwwajka/WwwAjkaSkripty/morph.cgi?jazyk=0). Nakolik budou tyto a podobné variantní tvary zájmen zaznamenány, je na zvážení. V korpusech řady SYN jsou řídce doloženy a často25 nerozpoznány automatickou analýzou.26
Koncept globální mutace a několikanásobného lemmatu bude využit například pro varianty s protetickým v ({oba, voba}), pro varianty jako {všechen, všecek, všecken}, {tenhle, tendle, tenhlenc, tendlenc},…, {leda.*, ledas.*, lec.*}, {.*koli,.*koliv,.*kolivěk,.*žkoli,.*žkoliv}, {kdos27, kdosi}, {cos28, cosi},…, {kdo, kdož}, {co, což}.
Zájmena představují uzavřenou skupinu lemmat, jejichž tvary jsou v textech velmi frekventované a plní navíc důležité syntaktické funkce. Výše uvedený přehled byl vytvořen na základě podrobných korpusově podložených analýz a všímá si okrajově také různých substandardních variant. Za diskutabilní pokládáme především zaznamenání teritoriálních variant do slovníku automatického analyzátoru. Pokud by ovšem zaznamenávány byly, mělo by se tak dít konzistentně29.
Hlaváčková, D. (1998): Korpus mluvené češtiny. (Diplomová práce pod vedením K. Osolsobě.) Brno: FF MU.
Hlaváčková, D. (2001): Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. Slovo a slovesnost, 62, s. 62–70.
Karlík, P. – Nekula, M. – Pleskalová, J. (2016): Nový encyklopedický slovník češtiny. Praha: Nakladatelství Lidové noviny. Dostupný z: <https://www.czechency.org/>.
Rychlý, P. – Šmerk, P. – Pala, K. – Sedláček, K. (2008): Morphological Analyzer Ajka. Dostupný z: <https://nlp.fi.muni.cz/projekty/wwwajka/WwwAjkaSkripty/morph.cgi?jazyk=0>.
Sedláček, R. – Smrž, P. (2001): A New Czech Morphological Analyser ajka. In: Proceedings of the 4th International Conference TSD 2001. Berlin: Springer-Verlag, s. 100–107.
[1] Tagování zájmen ve stávajícím pražském tagsetu je založeno na značkování velmi heterogenních vlastností na druhé pozici (detailní určení slovního druhu).
2 Značky slovního druhu oddělené čárkami uvnitř složené závorky značí slovnědruhovou příslušnost částí agregátu.
[3] V korpusech lze okrajově narazit na etymologickou figuru založenou na negaci nejen u osobního zájmena já. Typ já-nejá se vyskytuje i u posesiv, např. moje-nemoje, tvoje-netvoje. Tato spojení jsou lematizována jako jedno slovo. Upozorňujeme na ně pouze pro pořádek.
4 Není problém dogenerovat do slovníku nejrůznější substandardní varianty a označkovat je pomocí kategorie flektivní mutace. Prakticky byl obdobný postup aplikován v brněnském slovníku a příslušná varianta slovníkubyla použita při značkování korpusu soukromé korespondence, který obsahoval nejrůznější substandardní morfologické varianty (desambiguace probíhala ručně). Je třeba ovšem upozornit na to, že takový přístup má za následek zmnohonásobení případů, které je třeba desambiguovat, a výsledky automatické desambiguace nemusí být uspokojivé. Proto je třeba takový postup pečlivě zvážit.
5 V brněnském systému je klasifikace bližší školské klasifikaci zájmen. Konkrétně jde o rozlišování homonymních tvarů tázacích a vztažných zájmen na rovině slovníku. V novějších verzích analyzátorů pracujících s brněnským slovníkem je značkování zájmen zjednodušeno. Podobně je tomu i v pražském systému. Návrh redukovat vztažná zájmena pouze na ta, která plní výhradně vztažné funkce, a ostatní ponechat mezi tázacími, byl prodiskutován na přednášce věnované návrhu NovaMorf v porovnání se současným pražským systémem 14. 5. 2018 na ÚFAL MFF UK, následně znovu zvážena všechna pro a proti. Níže nebereme v potaz hledisko funkční a navrhujeme slovník nepřegenerovat a tázací zájmena, která mohou plnit funkci vztažných zájmen, ponechat ve slovníku uložena pouze jednou, a to jako zájmena tázací. Subklasifikaci zájmen v pražském slovníku nahrazuje v návrhu NovaMorf transparentní popis druhů zájmen pomocí hodnot SUB a DEI. Varianty osobních zájmen lišící se funkčně (např. krátké / dlouhé tvary) popisuje pomocí konceptu flektivní mutace.
6 Zájmeno já (asi nejčastěji z osobních zájmen, nikoli jako jediné, viz příklady níže) se substantivizuje, a to tak, že tvar nominativu se stává nesklonným substantivem. Užívá se i v negované podobě nejá. (Například: V tomto třetím kroku, který Fichte vztahuje k zásadě dostatečného důvodu, rozehrává nyní Fichte vztahy vzájemného působení <Já> na <Nejá> a naopak.… Zážitek fúze <já> a <nejá> je těžko srozumitelný západním psychologům...Grafická realizace je rozkolísaná, kromě psaní s velkým počátečním písmenem se objevuje dokonce i varianta neJá. Interpretace tvaru nejá je v dosavadním značkování lemma="nejá" & tag="NNNS.----N.*", já je v dosavadním značkování vždy zájmeno. V návrhu NovaMorf je zájmeno já značkováno jako [POS=N & GEN=N & NEG=A], zájmeno nejá jako [POS=N & GEN=N & NEG=N]. Zájmennou interpretaci mají i substantivizovaná užití dalších osobních zájmen. Viz kapitola Substantiva # 08-01, § 8.3.1.
7 Příklad substantivizace: Nejde přece o to, že Ty jsi Ty, ale že mé Já bude součástí Tvého <Ty [POS=N & GEN=N & NEG=-]>.
8 Příklad substantivizace: Předsudky a stereotypy tady totiž byly, jsou a budou, neboť jsou součástí našeho já i našeho <my [POS=N & GEN=N & NEG=-]>.
9 V grafické podobě krátkých tvarů zájmen 1. osoby singuláru se dosti často chybuje: ... Pak jsme točili scénu, která trvala poměrně dlouho a <mně> nic celkem nebolelo. Utekla ode <mně> žena? Je otázka, jak se na rovině automatické analýzy k takovým jevům stavět. Přegenerování slovníku směrem k podobným jevům totiž znamená dosti značnou zátěž desambiguace, takže patrně zaznamenány nebudou, upozorňujeme na ně pro pořádek.
10 Mezi neurčitá zájmena nebude zařazen lexém jeden, přestože v některých kontextech má jeden zájmenný význam (jedna paní povídala), tedy význam, který se v řadě jazyků gramatikalizoval jako neurčitý člen. Lexém jeden bude i v těchto kontextech interpretován jako POS=C, viz kapitola Číslovky # 08-04, § 3.1.1 a # 08-04, § 3.1.2.
11 Zájmena neurčitá tvořená postfixem -s (kdos, cos) jsou homonymní s agregáty vzniklými grafickým spojemím zájmen s volným morfem s nahrazujícím tvar auxiliáru/spony slovesa být (kdo+s, co+s:… Můj synáčku, viď, srdíčko tě bolí, byls ve světě a vrátil jsi se zpět, <kdos> jiný utrhl ten čarokrásný květ a tobě zůstaly jen suché stvoly. ×… <Kdos> mého těla opěra, ty mě máš jednou zrodit…; Je otázka, jeli <cos> podobného v jiném kraji možno jako u nás.… ×… <Cos> jí udělal?…; v případě cos je také ve hře interpretace významu pojmenování goniometrické funkce (substantivum - zkratka): Pravděpodobnost určité hodnoty <cos> je určena potenciální energií daného dipólu v magnetickém poli B působícím na dipól. Je třeba zajistit doplnění všech interpretací do slovníku morfologického analyzátoru (viz také kapitola Agregáty # 08-15, § 3.2 a # 08-15, § 4) a jejich desambiguaci. Tvar kdos (nominativ singuláru) bude pravděpodobněji v textech tvarem neurčitého zájmena (variantou ke kdosi) než tvary ostatní. (Bohužel se objevují homonymní zkratky a propria:… Svaz je členem <KDOS>…,… V nedalekém Komárově uspěl ve firmě <Komus> se žádostí…… Z kalendáře pro společnost <Koms>… a dokonce i substantiva:… mezi něž patří židovská harfa nazývaná <komus>, šoor a další exotické nástroje…, nehledě na doklady jako… Moc dobře si to uvědomoval naříkající Dalimil: Ach českého nedomyšlenie, jich nemúdré dopuščenie, že dachu neznámým liudem po zemi sě túlati, svú zemiu dachu <komus> spytati!…). Na tyto okrajové záležitosti upozorňujeme pouze pro pořádek.
12 Rozdíl mezi tázacími zájmeny a s nimi homonymními zájmeny vztažnými byl v pražském systému potlačen. Na druhé pozici jsou uvedeny hodnoty: 1 vztažné přivlastňovací zájmeno „jehož“, „jejíž“,…, 9 vztažné zájmeno „jenž“, „již“,… po předložce („n-“: „něhož“, „níž“,…), E vztažné zájmeno „což“, J vztažné zájmeno „jenž“ („již“,…), bez předložky, nebo hodnoty: 4 vztažné nebo tázací zájmeno s adjektivním skloňováním (obou typů: „jaký“, „který“, „čí“,…), K zájmeno tázací nebo vztažné „kdo“, vč. tvarů s „-ž“ a „-s“, Q zájmeno tázací/vztažné „co“, „copak“, „cožpak“. Kromě případu zájmena což, které je pokládáno pouze za vztažné (případy typu <Což> nevznikají velká díla i bez velkých protivenství? nejsou zohledněny), se tázací a vztažná funkce na rovině morfologického tagu u homonymních zájmen v pražském systému u řady zájmen nerozlišuje. Podobně se nerozlišuje vztažná a tázací funkce u zájmenných číslovek (Cu.* číslovka tázací násobná „kolikrát“ a Cz číslovka tázací řadová „kolikátý“), které mohou rovněž uvozovat vztažné věty ve funkci spojovacích výrazů. Tato homonymie nebude do slovníku doplněna (viz také kapitola Číslovky # 08-04, § 3.2.2 a # 08-04, § 3.3.2). Podobně budeme zacházet s tázacími zájmennými adverbii a s agregáty (typu nač, cos, načs), které funkci spojovacích výrazů mohou plnit stejně jako zájmena (viz kapitoly Adverbia # 08-06, § 4.1.4 a # 08-06, § 4.1.5 a Agregáty # 08-15, § 3.1.1, # 08-15, § 3.2.3 a # 08-15, § 3.2.9). Původně vztažné zájmenné příslovečné spřežky přičemž, načež, začež, pročež, natož, protož, tož,..., a snad i archaické očež, počemž jsou užívány výhradně jako spojovací výrazy, jsou tudíž řazeny mezi spojky POS=J, viz kapitola Spojky # 08-08, § 3.1.1.
13 Přivlastňovací zájmena se mohou substantivizovat, často plní funkce substantiva tam, kde jde o elipsu. (Já vím, že tě tvoje hlava štve. Jenomže mně ta <moje> zatím docela vyhovuje!). Budou ovšem i v těchto funkcích považována za zájmena (POS=P).
14 Přestože v korpusech jde často o překlepy (nesprávně umístěná mezera ve slovech čís lo/la/lech…, čís t,...),popřípadě o fonetický přepis angl. cheese, nebo o proprium, objevují se i doklady na zkrácenou podobu neurčitého zájmena čísi:… že stéká zlatě po <čís> hlavě vlas hedvábnou účeskou…,… na klíně <čís> holku…,… lýtko vydouvané <čís> slastí o pelest..., které jsou označkovány chybně. Upozorňujeme na tento fakt pouze pro pořádek. K desambiguaci by mohl pomoci jednak kontext, jednak typ textu (beletrie, poezie). Kontext, v němž by slovo čís bylo agregátem (<Čís> jedl chleba? <Čís> zpíval píseň?), jsme v dostupných korpusech nenalezli. Hypoteticky vytvořit lze.
15 Tvary sám, sama, samo, sami, samy budou mít NOM=J, ostatní tvary (samý, samého,…) budou mít NOM=-. Adjektivní i jmenné tvary samotný/samoten budou i nadále značkovány jako adjektiva, přestože sám/samý a samoten/samotný jsou v češtině synonyma. Důvodem pro toto rozhodnutí je (byť jen okrajově na internetu doložená: A v neposlední řadě i o tom, že čas je iluze, všechno má svůj smysl a ani ten zdánlivě <nejsamotnější> ze samotných není na tomto světě sám.) stupňovatelnost složených tvarů. (Významový rozdíl mezi sám/samoten, který je v jiných jazycích prezentován různými lexémy (například německé selbst a allein, ale i einsam), se v češtině lexémy sám/samoten nerozlišuje.) Nadále nebude na slovnědruhové rovině značkováno přesažné užití v bezpodmětových konstrukcích typu jde to samo. I zde bude jako doposud slovní druh POS=P.
16 Jako adjektivum bude nadále interpretován lexém celý, a to navzdory jak významovým, tak syntaktickým vlastnostem, které sdílí se zájmeny. Také spřežky zcela, docela nebudou řazeny mezi zájmenná adverbia.
17 Mezi vymezovací zájmena nebude zařazen lexém jeden, přestože v kontextu jen jeden je zájmenný vymezovací význam přítomen. Lexém jeden bude i v těchto kontextech interpretován jako POS=C, viz kapitola Číslovky # 08-04, § 3.1.1.
18 Slova (v)oba, (v)obé, (v)obojí, (v)oboje, bývala tradičně interpretována jako číslovky. Patřičnější (viz MČ 2) je řadit je (na základě významu) mezi zájmena (totalizátory) spolu s jediný a sám/samý. Viz též kapitola Číslovky # 08-04, § 2, bod 4.
19 Lemma jiný bylo dosud značkováno jako adjektivum. Navržená změna se snaží systematizovat popis limitativ u zájmen (jiný) a zájmenných adverbií (jinde, jindy, jinak nikoli *jině, takže vedle sémantického kritéria se ukazuje i kritérium morfologické, jímž se jiný liší od adjektiv pravidelně tvořících odpovídající adverbia). Slovo jiný má jednak limitativní (zájmenný) význam (=totálně odlišný / opozitum zájmena týž), jednak vágní (adjektivní) význam (=lišící se nějakými vlastnostmi, které se určují na základě vlastností objektu, s nímž srovnáváme). Desambiguovat tato dvě užití limitativní/adjektivní není úkolem automatické morfologické analýzy. Z toho důvodu je třeba zvolit jedno řešení. Další deriváty od základu jin- (jinší, jinačí,...) budou na rovině POS=A, viz kapitola Adjektiva # 08-02, § 2.2.3. Jsme si vědomi toho, že položit hranici mezi zájmenná a adjektivní užití je rozhodnutí, které lze z různých pozic napadat. Podobnou otázku jako v případě jiný můžeme nastolit u stejný, odlišný, a možná by se našla i další (u těchto převládá adjektivní rys morfologický, který vidíme v možnosti pravidelné derivace adverbií stejný → stejně, odlišný → odlišně). Tato slova budeme nadále značkovat jako adjektiva. Podobně slovo druhý má užití, která jsou synonymní s jiný (v zájmenném i adjektivním významu) a navíc má užití ve významu řadové číslovky. Ani tato užití nelze na rovině automatické morfologické analýzy rozumně desambiguovat. Pro zájmennou (neadjektivní) interpretaci hovoří opět i morfologické kritérium (zájmenná adverbia druhdy, druhde). Domníváme se, že v případě rozdílu mezi číslovkovou a zájmennou interpretací druhý jde o to, že připustíme-li, že dva prvky mohou tvořit řadu, pak je zájmenný význam zahrnut v číslovkovém a naopak. Slovo druhý bude na rovině POS interpretováno pouze jako číslovka (viz kapitola Číslovky # 08-04, § 3.2.1), a to především proto, aby číslovková řada řadových číslovek nebyla přerušena. Jiné řešení (nedesambiguované POS=C&P) pokládáme za překomplikované.
20 Zájmeno tvořené postfixem -s (jakýs) je homonymní s agregátem vzniklým grafickým spojemím zájmena jaký s volným morfem s nahrazujícím tvar auxiliáru slovesa být:… „Tak co, <jakýs> byl,“ zeptala se Madla... Je třeba zajistit doplnění interpretace do slovníku morfologického analyzátoru (viz také kapitola Agregáty # 08-15, § 3.2.3) a zabývat se otázkou desambiguace. Desambiguaci může napomoci například kontext (kolokace jakýs takýs).
21 Mezi ukazovací zájmena nebude zařazen lexém jeden, přestože v některých kontextech má jeden zájmenný význam (jeden = ten mi říká to, druhý/jiný = tamten tamto). Lexém jeden bude i v těchto kontextech interpretován jako POS=C, viz kapitola Číslovky # 08-04, § 3.1.1. Jiné řešení (nedesambiguované POS=C&P) pokládáme za překomplikované.
22 Zájmena ukazovací ten/takový se mohou kombinovat s postfixy to/[hd]len?c. Za postfixem [hd]len?c může být připojen tvar zájmena ten shodný s tím tvarem, který stojí před postfixem, tedy např. touhletou, tímhlectím, téhlencté,.... Další kombinace lze popsat pomocí regulárních výrazů: ([tam|tady|tu)ten], [(tam|tám|tady|tu|taj)[hd]?len?c?ten], nářeční: [t[ůó][hd]len?c?ten], kde zase místo ten může být jiný tvar.
23 Dorotko, řekni mi, jestlipak s <níms> mluvila?
24 Doklady jako naňs, zaňs, proňs, veňs,… se v dostupných korpusech nevyskytují, což neznamená, že neexistují.
25 Tvar našu je rozpoznán automatickou analýzou, tvary naša, našó, našou nikoliv.
26 Potvora, letí se <mnó> až z pivováru, jen jsem vyšel ze šalandy, tak za <mnó>...… dva jsme zůstali první týden v Praze, jinak celá <naša> třída odjela na chmelovou brigádu…,… Také Vám, drazí rodičové naši, musíme připomenouti, abyste tu adresu tak nepsali, jak <ju> obyčejně píšete, nýbrž pište <ju>, jak zde dole udávám…,… Ber mu tu flašku, nebo on <ju> vyžere!! Zájmeno ju je interpretováno v prvním případě jako částice, ve druhém jako citoslovce.
27 Viz výšek homonymii s agregátem kdo+s.
28 Viz výšek homonymii s agregátem co+s.
29 Máme na mysli jednotné zaznamenání analogických variantních tvarů (takže například bude-li ve slovníku zaznamenána varianta našó, pak by v něm měly figurovat i varianty vašó, mojó, tvojó, svojó, kteró, jakó,… Takový postup nebyl striktně dodržován při doplňování substandardních tvarů do morfologického slovníku v brněnském systému (více Hlaváčková 1998, 2001). Byly doplňovány pouze tvary doložené v bmk. Takový (korpusově závislý) postup není ovšem zcela v pořádku.