08-06 Adverbia

Obsah

Podrobný obsah

1 Úvodní přehled

2 Členění adverbií v dosavadních gramatikách a slovnících automatických morfologických analyzátorů

3 Lemmatizace adverbií

4 Značkování adverbií podle kombinací kategorií SUB, DEI a NOM

5 Značkování dalších kategorií adverbií – kategorie pádu, stupně

Literatura

1 Úvodní přehled

1.1 Představení kapitoly

Adverbia se řadí mezi neohebné slovní druhy. Na rozdíl od ostatních neohebných slovních druhů ovšem mají (alespoň některá) na základě původu patrnou morfematickou strukturu.

V gramatikách se obvykle vydělují následující skupiny: (i) adverbia pravidelně (paradigmaticky) tvořená z adjektiv a s pravidelně tvořenými tvary II./III. stupně, (ii) predikativa jako poměrně heterogenní skupina adverbií užívaných v jistých syntakticky a sémanticky vymezitelných konstrukcích (v pojetí Mluvnice češtiny, dále MČ), (iii) adverbia vzniklá adverbializací prostých a předložkových pádů jmen, (iv) zájmenná příslovce a adverbiální číslovky, tj. jednotky se slovnědruhovými přesahy. (Podrobněji viz dále § 2.1.)

V morfologickém slovníku ‚pražský systém‘ (Hajič, Hlaváčová, 2013) se typicky rozlišují adverbia na dvě skupiny: (i) adverbia tvořená paradigmaticky od adjektiv / rozgenerována na rovině slovníku, (ii) adverbia tvořená jinak. (Podrobněji viz dále § 2.2.)

V navrhovaném pojetí NovaMorf je členění detailnější. Kategorie a hodnoty adverbií jsou představeny v § 1.2. V § 1.2.1 uvádíme poznámky k některým z relevantních kategorií, další pododíly jsou věnovány hodnotám kategorií SUB (§ 1.2.2), zájmenným příslovcím lišícím se hodnotou kategorie DEI (§ 1.2.3) a dalším skupinám adverbií s různě vyjádřenými hodnotami kategorií SUB, DEI a NOM (§ 1.2.4).

V § 2 jsou nastíněna dosavadní pojetí adverbií (viz výše).

V § 3 bude představena lemmatizace adverbií. Podrobně mapujeme lemmatizaci adverbií z adjektivních (nejednoznačných základů) (§ 3.1), zejména ustrnulých/adverbializovaných jmenných tvarů, a to se zřetelem k případům spřežek a spojení předložka + ustrnulý jmenný tvar (§ 3.1.2 a § 3.1.3). Další části jsou věnovány lemmatizaci adverbií ze substantiv a sloves (§ 3.2), lemmatizaci zájmenných příslovcí (§ 3.3), lemmatizaci číslovek s adverbiální formou i funkcí (§ 3.4) a také je zde popsána lemmatizace s ohledem na stupňování a globální mutace (§ 3.5).

Poté v § 4 probereme jednotlivé skupiny/seznamy adverbií podle kategorií poddruh (SUB), deixe (DEI) a jmenný tvar přídavných jmen (NOM).

V závěrečné části § 5 se budeme krátce věnovat několika dalším kategoriím a jejich hodnotám: pádu (CAS) v § 5.1, stupni (DEG) v § 5.2 a negaci (NEG) v § 5.3.

1.2 Kategorie a hodnoty relevantní pro adverbia

Pro adverbia (POS=D) budou v pojetí NovaMorf relevantní tyto kategorie: poddruh (SUB), deixe (DEI), zkratka (ABR), pád (CAS), stupeň (DEG), negace (NEG), jmenný tvar přídavných jmen (NOM), typ agregátu (AGR), globální mutace (GMU), flektivní mutace (FMU), viz tabulka 1.

Tabulka 1: Seznam relevantních kategorií zájmen a jejich hodnot

kategorie

značka kategorie

hodnoty

slovní druh

POS

poddruh

SUB

[PsCV0]

deixe

DEI

[UNZTVD-]

zkratka

ABR

[+-]

pád

CAS

[2346-]

stupeň

DEG

[123s-]

negace

NEG

[N-]

jmenný tvar přídavných jmen

NOM

[J-]

typ agregátu

AGR

[D-]

globální mutace

GMU

flektivní mutace

FMU

1.2.1 Poznámky k jednotlivým kategoriím

a. Kategorie SUB, DEI

Kategorie poddruh a deixe jsou představeny v § 1.2.2 (hodnoty kategorie SUB) a § 1.2.3 (druhy zájmenných příslovcí lišících se hodnotou DEI) a § 1.2.4 (skupiny dalších adverbií s různými kombinacemi hodnot kategorií SUB, DEI a NOM), podrobně jsou probrány v § 4.

b. Kategorie CAS

Kategorie CAS je relevantní pro adverbia tvořící konstrukci s předložkou (zejména spojení předložka + ustrnulý jmenný tvar), viz kategorie CAS ve vztahu k lemmatizaci v § 3.1.4 a hodnoty kategorie CAS v § 5.1.

c. Kategorie DEG

Kategorii DEG budeme sledovat u pravidelně tvořených deadjektivních adverbií s ohledem na derivaci tvarů komparativu a superlativu, viz kategorie DEG ve vztahu k lemmatizaci v § 3.5 a hodnoty kategorie DEG v § 5.2.

d. Kategorie NEG

Kategorii NEG se budeme věnovat s ohledem na derivaci tvarů negativním prefixem ne-, viz hodnoty kategorie v § 5.3.

e. Kategorie NOM

Kategorie NOM je relevantní pro ustrnulé/adverbializované jmenné tvary adjektiv, především pro případy spřežek a spojení předložka + ustrnulý jmenný tvar, viz zejména lemmatizace těchto tvarů v § 3.1.2 a § 3.1.3.

f. Kategorie GMU, FMU

V souvislosti s variantností lemmat uvádíme v § 3 průběžně i značkování pomocí konceptu mutace (u vícenásobného lemmatu půjde patrně o globální mutaci (GMU), vzhledem tomu, že adverbia nejsou ohebným slovním druhem). Na značkování pomocí konceptu flektivní mutace upozorňujeme rovněž u variantních tvarů pozitivu, komparativu a superlativu (§ 3.5). Na této úrovni nebudeme řešit mutace, které se váží na obecněji definovaný hláskový/grafický kontext (například protetické v u lemmat začínajících na o, například ostře/vostře). Jedná se o úroveň, která je popsána na obecné rovině v kapitole Morfologické kategorie a jejich hodnoty # 05, § 15.

1.2.2 Poddruh adverbií (SUB)

Značkování bude odrážet tyto poddruhy adverbií, viz Tabulka 2.

Tabulka 2: Poddruh adverbií (SUB)

SUB

vysvětlení

příklady

viz

zájmenná

odkud, kdy, jak

§ 4.1

spřežková

dopředu, namodro, doruda

§ 4.2

číslovková

mnoho, málo, více

§ 4.4

adverbia pravidelně rozgenerovaná od slovesných (SUB=V) adjektiv

zamyšleně, zmateně, nečekaně

§ 4.5

ostatní

§ 4.3, § 4.6

1.2.3 Zájmenná příslovce (SUB=P) rozlišená podle deixe (DEI)

U zájmenných příslovcí (SUB=P) se určuje také kategorie deixe, kombinací kategorií SUB a DEI jsou vymezeny následující skupiny zájmenných příslovcí, jejich seznamy jsou probrány v jednotlivých pododdílech, viz Tabulka 3.

Tabulka 3: Skupiny zájmenných příslovcí podle deixe (DEI)

SUB

DEI

kategorie adverbií

příklady

viz

určitá adverbia vymezovací a totalizátory místa, času, způsobu

jinde, vždy, jenom

§ 4.1.1

neurčitá adverbia místa, času, způsobu

někde, bůhvíkdy, jakkoliv

§ 4.1.2

záporná adverbia místa, času, způsobu

nikam, nikdy, nikterak

§ 4.1.3

tázací adverbia místa, času, způsobu

kudy, odkdypak, jak

§ 4.1.4

vztažná adverbia (nevyužitá kategorie)

§ 4.1.5

ukazovací adverbia místa, času, způsobu

tady, tehdy, takhle

§ 4.1.6

adverbiální spřežky se zájmenným základem ve frazémech

(vzít) zasvé, (jít) posvých

§ 4.1.7

1.2.4 Značkování dalších adverbií pomocí kategorií SUB, DEI a NOM

Kombinací kategorií SUB, DEI a NOM jsou vymezeny následující skupiny adverbií. Jejich seznamy jsou probrány v jednotlivých pododdílech, viz tabulka 4.

Tabulka 4: Značkování skupin adverbií pomocí kategorií SUB, DEI a NOM

SUB

DEI

NOM

kategorie adverbií

příklady

viz

adverbia tvořená ustrnutím předložkových pádů adjektiv

nasucho, zatepla, vlevo

§ 4.2.1

adverbia tvořená ustrnutím předložkových pádů substantiv, popřípadě ta, která nelze vztáhnout k slovnědruhově jednoznačnému základu

dole,vpřed, odzadu

§ 4.2.2

adverbiální spřežky s vícenásobným lemmatem

{začasto, začasty}, {zespod, zespodu, zespoda}, {znovu, znova}

§ 4.2.3

další ustrnulá adverbia a adverbia tvořená sufixací ze substantiv a sloves

celkem, loďmo, mlčky, vsedě, jaksepatří, křížemkrážem

§ 4.3

deriváty a kompozita korespondující s deriváty a kompozity podobného charakteru, které mají POS=C

mnoho, málo, moc

§ 4.4

adverbia derivovaná pravidelně z adjektiv, která budou mít SUB=V

nepokrytě, zdvojeně

§ 4.5

adverbia derivovaná pravidelně z adjektiv, která budou mít SUB=G

nemohoucně, kajícně

§ 4.5

všechna ostatní adverbia paradigmaticky tvořená od adjektiv slovnědruhovou charakteristikou e/ě (adverbia, která mají lemma=.*[eě]) a některá na o

suše, hluboce, hluboko

§ 4.6.1

adverbia, která mají [lemma=.*y]

domácky, česky

§ 4.6.2

adverbia, která mají [lemma=.*[oau]] a nejsou spřežky

(na) sucho, (za) sucha, (po) česku

§ 4.6.3

ostatní adverbia s vícenásobným lemmatem

{hezky, hezce}, {brzy, brzo}

§ 4.6.4

2 Členění adverbií v dosavadních gramatikách a slovnících automatických morfologických analyzátorů

2.1 Adverbia v gramatikách

Klasické gramatiky řadí adverbia mezi neohebné slovní druhy. Řada adverbií však má na základě původu patrnou morfematickou strukturu. V Mluvnici češtiny 1 se pracuje s termínem slovnědruhová charakteristika (u adverbií paradigmaticky tvořených od adjektiv se tradičně uvádějí segmenty -e/-ě, -y, -o).

Velká skupina adverbií se tvoří pravidelně (paradigmaticky) z adjektiv a pravidelně (vymezeným a omezeným souborem formálních prostředků – sufixy -[eě]/-[eě]j(i), prefix nej-) se tvoří také tvary II./III. stupně, které sice v gramatických popisech češtiny bývají zahrnovány spíše do oblasti slovotvorby, nicméně na rovině lexikografického popisu (výkladové slovníky) není ani transpozice (adjektivum → adverbium), ani modifikace stupně téměř nikdy prezentována formou samostatného heslového slova (hnízdování), předpokládá se totiž, že význam je beze zbytku odvoditelný z významu adjektiva v pozitivu, a informace o tvoření II. a III. stupně je součástí hesla pouze tehdy, je-li tvoření nějak nepravidelné (tvoří-li se komparativ/superlativ od supletivního, nebo redukovaného kmene, popř. má-li variantní tvary). Informace o tvoření II./III. stupně jsou zahrnuty do výkladu na místě, které je zpravidla vyhrazeno údajům o formální morfologii (formalizované poučení o skloňování, časování – morfologické varianty/dublety).

MČ pracuje při popisu adverbií s termínem predikativum, jímž označuje co do formy i derivační historie poměrně heterogenní skupinu adverbií užívaných v jistých syntakticky a sémanticky vymezitelných konstrukcích (bezpodměté struktury v nichž adverbium/predikativum je částí přísudku, označuje stavy modální, emoce, povětrnostní situace: je nutno, možno, třeba..., je (mi) teplo, veselo, smutno..., je sychravo, teplo, mlhavo...).

K adverbiím se dále řadí ta, která vznikla v procesu adverbializace prostých a předložkových pádů jmen (substantiv, adjektiv, zájmen). Kromě gramatik a dalších odborných prací jsou tato adverbia předmětem zájmu ortografické praxe (viz zachycení pravidel psaní adverbiálních spřežek v Pravidlech českého pravopisu a posuny v této oblasti kodifikace). I u těchto adverbií lze teoreticky vydělit slovnědruhovou charakteristiku, která odpovídá vydělitelnému flektivnímu morfu původního tvaru jména/jmenného tvaru (a, u, o, y...včetně nulového zakončení v případech jako vzad × dozadu, navrch × svrchu...).

Samostatnou skupinu tvoří zájmenná příslovce a adverbiální číslovky, tj. jednotky se slovnědruhovými přesahy, které lze na základě použití standardních kritérií pro třídění slovních druhů zařadit do více kategorií klasických slovních druhů.

Poměrně malou skupinu tvoří adverbia tvořená sufixy ze substantiv a sloves a dalšími okrajovými způsoby (ustrnutí přechodníků i dalších slovesných tvarů: takřka, neřkuli...).

2.2 Adverbia ve slovnících automatických morfologických analyzátorů

Adverbia z hlediska morfologie, jak ji sledují slovníky automatických morfologických analyzátorů, představují otevřenou třídu lemmat. Jejich popis vychází z toho, co měli autoři těchto slovníků v době jejich vzniku k dispozici v gramatikách, tištěných slovnících i další lingvistické literatuře. Řada řešení, k nimž se autoři uchýlili, prezentují technická řešení, která jsou užitečná uvnitř NLP. U některých z nich se během více než dvacetileté zkušenosti s užíváním nástrojů automatické morfologické analýzy ukázalo, že neodpovídají zcela požadavku konzistentního a transparentního popisu. Některá řešení (viz níže) jsou naprosto zavádějící a budí rozpaky.

Morfologický slovník ‚pražský systém‘ (Hajič, Hlaváčová, 2013) typicky rozlišuje adverbia na dvě skupiny. Do první jsou zařazena adverbia tvořená paradigmaticky od adjektiv / rozgenerována na rovině slovníku. Ta jsou navíc ideálně pokládána za stupňovatelná a mají, je-li to možné, na rovině slovníku rozgenerovány tvary II. a III. stupně.¹ Tento stav ve většině případů vyhovuje, je zakotven v běžné praxi tištěných slovníků a pokrytí² je velmi dobré.

Do druhé patří adverbia tvořená jinak. Z lingvistického hlediska jde o adverbia vzniklá adverbializací prostých (kolem, časem) a předložkových (okolo, načas) pádů jmen, zájmenná adverbia a další okrajové typy.

Tvary adverbií na o (horko, smutno, veselo, brzo...)³ patří buď do první, nebo do druhé skupiny.

Do druhé skupiny jsou zařazena i tzv. zájmenná příslovce a některé adverbiální číslovky, které jsou interpretovány buď jako nestupňovatelná adverbia, nebo jako zájmena/číslovky, přičemž v některých případech je ve slovníku možné víceré značkování slovního druhu, čímž vznikají problémy, které se řeší na rovině desambiguace.

3 Lemmatizace adverbií

3.1 Lemmatizace adverbií z adjektivních (nejednoznačných) základů

Přístup k problému lemmatizace adverbií, která lze tvořit (z adjektivního základu), a to buď paradigmaticky (tvary na [eě] a nebo tvary na y od adjektiv na [sc]ký), a nebo adverbializací (především ustrnulé / adverbializované jmenné tvary), bude diferencovaný.

Nejdříve (§ 3.1.1) se zaměříme na případy, kdy tvar na [eě] není v úzu frekventovaný (hezky/hezce, pokradmo/pokradmu/pokradmě, pomalu/pomale, znenáhla/znenáhlu/znenáhle...), popřípadě není v úzu k dispozici (brzo/brzy). Tyto případy budou řešeny pomocí konceptu vícenásobného lemmatu a kategorie globální mutace (GMU).⁴

Poté (§ 3.1.2 a § 3.1.3) si všimneme adverbií tvořených od jednoho adjektivního základu pravidelně (paradigmaticky slovnědruhovou charakteristikou [eě] nebo y), a to s ohledem na ta, k nimž existují od téhož základu adverbializované jmenné tvary adjektiv na o (rušno), a (do tuha), u (k stáru) a adverbiální spřežky jako naplno, vpravo, zrovna, potichu,.... Tyto případy budou lemmatizovány více (dvěma, třemi) různými lemmaty.[5]

Probereme postupně dvojice a trojice podle zakončení.

3.1.1 Typy, v nichž tvar na [eě] není v úzu frekventovaný, nebo není k dispozici a další méně frekventované typy

a. Typ [eěy]

Tento typ je zastoupen v korpusech jedinou doloženou dvojicí adverbií z adjektiv.⁶ Je jí dvojice hezky/hezce. Jedná se o standardní (hezky) a naprosto okrajovou (hezce) variantu. K odlišení využijeme kategorii globální mutace (GMU) a koncept vícenásobného lemmatu {hezky, hezce}.

b. Typ [oy]

Tento typ je zastoupen v korpusech jedinou doloženou dvojicí adverbií, u níž navíc nejde o pravidelné tvoření z adjektiv.⁷ Je jí dvojice brzy/brzo. K odlišení využijeme kategorii globální mutace (GMU) a koncept vícenásobného lemmatu {brzy, brzo}.

Další dvojice jsme získali pomocí nástroje Deriv z brněnského morfologického slovníku (napolo/napoly, šupito/šupity,⁸ začasto/začasty⁹). Pokud budou i tyto doklady zařazeny do slovníku, nechť se k odlišení variant využije kategorie globální mutace (GMU) a koncept vícenásobného lemmatu.

c. Typ [eěuo]

Tento typ je zastoupen v korpusech jedinou doloženou trojicí adverbií pokradmo/pokradmu/pokradmě,¹⁰ kterou navrhujeme lemmatizovat jako vícenásobné lemma {pokradmu, pokradmě, pokradmo} a tvary rozlišit pomocí kategorie GMU.

d. Typ [eěu]

Tento typ je zastoupen v korpusech dvojicemi bezhlesu/bezhlese, polehoučku/polehoučce, polehounku/polehounce, pomalu/pomale, ponenáhlu/ponenáhle, povětšinu/povětšině, vbrzku/vbrzce, vkrátku/vkrátce. Lze je pokládat za varianty. K odlišení využijeme kategorii globální mutace (GMU) a koncept vícenásobného lemmatu {polehounku, polehounce}, {pomalu, pomale}, {ponenáhlu, ponenáhle}, {vbrzku, vbrzce}, {vkrátku, vkrátce}...¹¹

Další dvojice jsme získali pomocí nástroje Deriv z brněnského morfologického slovníku pohotově/pohotovu, pomále/pomálu, porozličně/porozličnu, porůzně/porůznu, poskrovně/poskrovnu, pošeptmě/pošeptmu, potajmě/potajmu, vnově/vnovu. Pokud budou i tyto doklady zařazeny do slovníku, nechť se k odlišení variant využije kategorie globální mutace (GMU) a koncept vícenásobného lemmatu.

Spřežka naživě synonymní s pravidelně užívanou spřežkou naživu je okrajově doložena v korpusech. Dvojice {naživu, naživě} je dalším kandidátem na vícenásobné lemma.

e. Typ [eěua]

Tento typ je zastoupen v korpusech trojicemi znenáhle/znenáhlu/znenáhla, poznenáhle/poznenáhlu/poznenáhla. Lze je pokládat za varianty. K odlišení využijeme kategorii globální mutace (GMU) a koncept vícenásobného lemmatu.

f. Typ [ua]

Tento typ je zastoupen ve slovníku brněnského analyzátoru dvojicemi: doposledu/doposleda, dospodu/dospoda, odpolu/odpola, odspodu/odspoda, pozdaleku/pozdaleka, poznovu/poznova, (z) venku / (z) venka, zespodu/zespoda, znovu/znova, zprv(k)u/zprv(k)a, zúmyslu/zúmysla, zvenku/zvenka, zvnějšku/zvnějška, zvnitřku/zvnitřka. Lze je pokládat za varianty. Pokud budou i tyto doklady zařazeny do slovníku, nechť se k odlišení variant využije kategorie globální mutace (GMU) a koncept vícenásobného lemmatu.

Do této skupiny lze zařadit také variantní spřežky odznovu/odznova a zprostředku/zprostředka.¹² Dvojice {odznovu, odznova}, {zprostředku, zprostředka} jsou dalšími kandidáty na vícenásobné lemma.

g. Typ [oa]

Tento typ je zastoupen ve slovníku brněnského analyzátoru dvojicemi: (z) tamo / (z) tama, teďko/teďka, *velo/*vela, zpolodarmo/zpolodarma, zpřímo/zpříma, zrovinko/zrovinka. Lze je pokládat za varianty. Do slovníku mohou být zařazeny dvojice zpolodarmo/zpolodarma, zpřímo/zpříma, zrovinko/zrovinka. Pokud se tak stane, nechť se k odlišení variant využije kategorie globální mutace (GMU) a koncept vícenásobného lemmatu. První dvě dvojice ztamo/ztama a teďko/teďka¹³ patří mezi zájmenná příslovce ukazovací, viz níže § 4.1.6. Dvojici velo/vela je vhodné ignorovat.

h. Typ [eěa]

Tento typ je zastoupen ve slovníku brněnského analyzátoru dvojicemi: čerstvě / (z) čerstva, oranžově / (do) oranžova, pozvolně/pozvolna, teprve/teprva, znenadále/znenadála, zpozvolně/zpozvolna, zúmyslně/zůmyslna, zvolně/zvolna. Lze je až na dvě výjimky (čerstvě / (z) čerstva a oranžově / (do) oranžova) pokládat za varianty. Pokud budou i tyto doklady zařazeny do slovníku, nechť se k odlišení variant využije kategorie globální mutace (GMU) a koncept vícenásobného lemmatu.

Adverbia čerstvě / (z) čerstva a oranžově / (do) oranžova by měla být samostatnými lemmaty, viz níže § 3.1.2.

i. Typ [eěao]

Tento typ je zastoupen ve slovníku brněnského analyzátoru dvojicemi: donedávně/donedávna a odnedávně/odnedávna, nicméně v korpusech se objevují sporadicky i varianty další (donedávno a odnedávno). Pokud budou i tyto doklady zařazeny do slovníku, nechť se k odlišení variant využije kategorie globální mutace (GMU) a koncept vícenásobného lemmatu {odnedávně, odnedávna, odnedávno}, {donedávně, donedávna, donedávno}.

j. Typ [eěuů]

Tento typ je zastoupen v korpusech významově odlišnými ustrnulými prostými (dole/dolů) a předložkovými (nahoře/nahoru¹⁴) pády jmen, které se adverbializovaly. Jde o dvě odlišná lemmata.

3.1.2 Typy [eě], o, u, a

Typy jsou zastoupeny poměrně bohatě a domníváme se, že je nelze interpretovat jako varianty a zahrnout adverbia pod vícenásobné lemma s příslušnou globální mutací. Navrhujeme je lemmatizovat odděleně. (barvit na <modro>..., pěkně po <staru>, zabarveno do <modra>..., jako za <stara>...)

Adverbia na o (a také na u, a) mají velice často slovnědruhový přesah, lze je hodnotit nejen jako adverbia, ale také jako ustrnulé jmenné tvary adjektiv (pojí se s předložkou – proces adverbializace není dokončen vznikem příslovečné spřežky), popřípadě mají rysy jak adjektiv/adverbií (lze je rozvíjet adverbiem), tak substantivizovaných adjektiv (lze je rozvíjet adjektivem). Navrhujeme tudíž, aby byla lemmatizována samostatně jako POS=D¹⁵ (původní návrh na nevyhraněný/oscilující slovní druh byl změněn). Jedná se o případy jako… žije se tu po <staru>…,… ale bylo to jako za <stara>...,… že nás k <stáru> zrazuje paměť….

Rozlišujeme (minimalisticky) dvě možnosti lemmatizace a slovnědruhového značkování slov, u kterých lze vydělit zakončení [eěo].

a. Typ [eě] [lemma=.*[eě] & lc=.*[eě] & POS=D & SUB=0 & NOM=-]

např. dlouze vyprávět, těžce oddychovat, široce využívat,...

Tvary na [eě] jsou adverbia (tvoří se paradigmaticky z adjektiv), tvary na o jsou ustrnulé jmenné tvary adjektiv v adverbálním užití. Tvary na o, a, u nejsou většinou zaměnitelné s tvary na [eě].

Tvary na [eě] budou mít [POS=D & SUB=0 & NOM=-].

b. Typ na.*o|za.*o [lemma=[nz]a.*o & lc=[nz]a.*o & POS=D & SUB=s & NOM=J]

např. přijet nadlouho, sedět nasucho, je mu to zatěžko, brýle nablízko

Spřežky¹⁶ typu na.*o/za.*o budou mít [POS=D & SUB=s & NOM=J].

c. Typ o [lemma=.*o & lc=.*o & POS=D & NOM=J]

a typ o [lemma=.*o & lc=.*o & POS=D & NOM=J]

např. trvat dlouho, je mu těžko, úzko, smutno,… a např. je (velké/velmi) sucho, přijet na dlouho, sedět na sucho, je mu to za těžko, brýle na blízko

Tvary na o paralelní s tvary na [eě] budou mít ve vyjmenovaných případech POS=D (blízko, daleko, dlouho, hluboko, husto, nízko, snadno, široko, těžko, úzko, vysoko).

Seznam uvádí adverbia, která tvoří (s výjimkou hustě) komparativ/superlativ nikoli od supletivního, ale od redukovaného kmene (ztrácí -ok-,-k-, -h-, -n-, tedy část sufixu, který figuruje u odpovídajících adjektiv a také u pozitivu: hlub-ok-o/hlub-oc-e → (nej)hloub-ěji). Jsou níže zařazena mezi adverbia, u kterých bude porušen jinak dodržovaný princip lemmatizace tvarů všech tří stupňů tvarem pozitivu. Pod lemma(ta) pozitivu bude spadat tvar/tvary pozitivu a pod lemma komparativu tvary komparativu a superlativu. (Také v mluvnicích a slovnících jsou uváděny zvlášť mezi případy nepravidelného tvoření II. a III. stupně.) Mohou u nich totiž nastat situace, kdy tvar komparativu (superlativu) lze vztáhnout ke dvěma tvarům pozitivu (na [eě] i na o, což vidíme na příkladu transfomace věty: I toto číslo je opět hlouběji pod průměrem. ← I toto číslo je opět hluboce/hluboko pod průměrem.). Většinou se ale tvary pozitivu funkčně a významově liší (Ukrajina je hluboce rozdělena. Libanon stále hlouběji rozděluje postoj ke konfliktu v Sýrii. × Hluboko do peněženky musel po nedělní projížďce sáhnout čtyřiačtyřicetiletý Slovák. Hlouběji do peněženky budou muset sáhnout po nového roce i nájemníci z Přerova.), takže by pod jedno (vícenásobné) lemma spadat neměly. Lemmatizací tvarů komparativu a superlativu odděleně od tvarů pozitivu se snažíme vyhnout desambiguaci (kterému lemmatu pozitivu tvary komparativu a superlativu přiřadit¹⁷), kterou nelze rozumně řešit automaticky.

Tvary na o, které nejsou spřežkami, budou mít POS=D, viz některé poznámky v kapitole Adjektiva, zejména # 08-02, § 3.6.

V případě, že ve slovníku budou rozgenerovány u adjektivního lemmatu na .*ý jmenné tvary všech rodů a obou čísel a zároveň bude ve slovníku uložena interpretace lemmatu s uvedením slovního druhu POS=D na .*o, bude třeba desambiguovat případy jako dítě není už několik dní zdrávo × není zdrávo se takovými věcmi zabývat. Není jisto, jaké budou výsledky desambiguace. Z toho důvodu je třeba na možné chyby v desambiguaci uživatele upozornit.

To, že adverbiální užití je od původu jmenným tvarem adjektiva, bývá patrné ve spojení s předložkou (například narychlo × na rychlo), přičemž mezi tvar a předložku nelze vložit další slovní tvar (na *velmi rychlo), jde tedy o případ směřující k vytvoření adverbiální spřežky. Proces vzniku adverbiální spřežky není dosud ukončen ustálením grafické podoby psaní dohromady, slovnědruhová transpozice není ukončená, takže existují důvody pro obě interpretace, jmennou i adverbiální. Kromě toho lze tvar na o někdy substituovat dlouhým tvarem adjektiva (bylo mu líno tam jít → byl líný tam jít; je životu nebezpečno dotýkat se drátů i na zem spadlých × je nebezpečné dotýkat se hvězd na zem spadlých), jindy vystupuje do popředí jmenné (název vlastnosti¹⁸) chápání a spolu s ním i možnost substantivní slovnědruhové interpretace, například je sucho, teplo, horko... × jsou sucha, tepla, horka....

Seznam dvojic tvar na e a tvar na o:

bezpečně/bezpečno, blátivě/blátivo, blízce/blízko, bouřlivě/bouřlivo, častě/často, děsně/děsno, deštivě/deštivo, divě/divo, dlouze/dlouho, draze/draho, drsně/drsno, hlučně/hlučno, hořce/hořko, kluzce/kluzko, kolmě/kolmo, kradmě/kradmo, krušně/krušno, krvavě/krvavo, ledově/ledovo, lehce/lehko, lehoučce/lehoučko, lehounce/lehounko, letmě/letmo, levně/levno, lezavě/lezavo, libě/libo, líně/líno, lítě/líto, lhostejně/lhostejno, marně/marno, mdle/mdlo, mělce/mělko, měňavě/měňavo, mile/milo, mlhavě/mlhavo, mocně/mocno, mokvavě/mokvavo, možně/možno, mrazivě/mrazivo, naprostě/naprosto, nenávratně/nenávratno, nudně/nudno, oblačně/oblačno, oplzle/oplzlo, ošklivě/ošklivo, pohodlně/pohodlno, ponuře/ponuro, pošmourně/pošmourno, pradávně/pradávno, prašně/prašno, proměnlivě/proměnlivo, přehledně/přehledno, předlouze/předlouho, přehluboce/přehluboko, přetěžce/přetěžko, příjemně/příjemno, přímě/přímo, přípustně/přípustno, přítomně/přítomno, pustě/pusto, radostně/radostno, rovně/rovno, rušně/rušno, slaďoučce/slaďoučko, slunečně/slunečno, snadně/snadno, stydně/stydno, šeredně/šeredno, teskně/teskno, těsně/těsno, tichounce/tichounko, trapně/trapno, trpce/trpko, tupě/tupo, útulně/útulno, vesele/veselo, větrně/větrno, vlídně/vlídno, volně/volno, voňavě/voňavo, vratce/vratko, vzdušně/vzdušno, vyprahle/vyprahlo, záhadně/záhadno, zataženě/zataženo,...;

Do této skupiny by měly patřit jmenné tvary deverbálních adjektiv na -telný → -telně/-telno, neboť u nich se tvar na o objevuje s vyšší frekvencí, než ostatní tvary, a to často v predikativním užití, viz více kapitola Adjektiva # 08-02, § 3.4.2.

Seznam dvojic tvar na e a tvar na o (i po předložce):

divoce / (na) divoko/ nadivoko

dlouze / (na) dlouho/ nadlouho

drobně / (na) drobno/ nadrobno

kratičce / (na) kratičko/ nakratičko

kraťoučce / (na) kraťoučko/ nakraťoučko

lacině / (za) lacino/ zalacino

ležatě / (na) ležato/ naležato

měkce / (na) měkko/ naměkko

mokře / (na) mokro/ namokro

nízce / (na) nízko/ nanízko

pilně / (na) pilno/ napilno

ploše / (na) plocho/ naplocho

rychle / (na) rychlo/ narychlo

sladce / (na) sladko/ nasladko

slaně / (na) slano/ naslano

slepě / (na) slepo/ naslepo

stále / (na) stálo/ nastálo

šedě / (na) šedo/ našedo

tajně / (na) tajno/ natajno

tence / (na) tenko/ natenko

těsně / (na) těsno/ natěsno.

Problematické: smutně / smutno i smuten, smutna, smutno,… vesele / veselo i vesel, vesela, veselo,… mrtvě / mrtvo i mrtev, mrtva, mrtvo,...

d. Typ o [lemma=.*o & lc=.*o & POS=D & NOM=J]

V některých vybraných případech hovoří lexikalizace substantivního významu pro desambiguaci substantivní interpretace, jejíž výsledky ovšem nemusí být uspokojivé. O substantivní interpretaci mohou svědčit i syntaktické vlastnosti (lze rozvíjet adjektivem¹⁹).

Seznam dvojic typu tvar na e a tvar na o, který je kandidátem na desambiguovatelnou substantivní interpretaci: chladně/chladno, parně/parno, temně/temno, ....

V těchto případech jde o jednoznačný slovnědruhový přechod tvarů na o ve funkci substantiva, které v predikativní pozici nebudeme desambiguovat, pokud nebude rozvito shodným adjektivním přívlastkem (je velmi teplo [D] × je velké teplo [N] × je teplo [D], naopak v pozici subjektu (Obtěžovalo ho (velké) teplo [N] a objektu (Naříkal si na (velké) teplo [N]) desambiguovat budeme. I takové rozhodnutí má svoje úskalí, neboť může dojít k obtížně automaticky desambiguovatelným případům jako Chlapi si v hospodě stěžovali na sucho. × Chlapi v hospodě seděli na sucho; Úroda se zničila za sucha. × Kožich se zničil při čištění za sucha. Z tohoto důvodu je třeba upozornit uživatele na možné chyby v desambiguaci.

e. Typ [nz]a.*o [lemma=[nz]a.*o & lc=[nz]a.*o & POS=D & SUB=s & NOM=J]

např. vajíčka naměkko/natvrdo, být zatěžko

Spřežky typu na.*o/za.*o budou mít [POS=D & SUB=s & NOM=J].

f. Typ o [lemma=.*o & lc=.*o & POS=D & NOM=J]

např. je mu teplo, ale i vajíčka na měkko/tvrdo, být za těžko

Tvary na o, které nejsou spřežkami, budou mít [POS=D & NOM=J].

U tvarů na o, které bezprostředně následují po předložce, lze uvažovat o vyplnění hodnoty CAS. Takže například tvar těžko by měl v kontextu je mu těžko CAS=-, kdežto v kontextu přišlo mu to za těžko CAS=4.

g. Typ z.*a|za.*a|do.*a [lemma=(z|za|do).*a & lc=(z|za|do).*a & POS=D & SUB=s & NOM=J]

např. dýchat ztěžka, jít ztuha, zamlada, doruda,…

Spřežky typu za.*a/z.*a/do.*a budou mít [POS=D & SUB=s & NOM=J].

h. Typ a [lemma=.*a & lc=.*a & POS=D & NOM=J]

např. dýchat z těžka, jít z tuha, za mlada, do ruda,…

U tvarů na a, které bezprostředně následují po předložce, lze uvažovat o vyplnění hodnoty CAS. Takže například tvar těžka by měl v kontextu dýchal z těžka CAS=2.

Seznam trojic typu tvar na e, tvar na o a tvar na a (i po předložce):

čistě / (na) čisto / načisto/ (do) čista/ dočista

dalece/ daleko/ (z) daleka/ zdaleka

hluboce/ hluboko/ (z) hluboka/ zhluboka

hustě / husto / (z) husta/ zhusta

lehce / (na) lehko / nalehko/ (z) lehka/ zlehka

mladě / mlado²⁰ / za mlada/ zamlada

studeně / (na) studeno / nastudeno/ (za) studena/ zastudena

syrově / (na) syrovo / nasyrovo/ (za) syrova/ zasyrova

šikmě / (na) šikmo / načikmo/ (ze) šikma/ zešikma

široce / (na) široko / naširoko/ (ze) široka/ zeširoka

těžce / (za) těžko / zatěžko/ (z) těžka/ ztěžka

vysoce/ vysoko/ (z) vysoka/ zvysoka

…

Dále sem patří deriváty od adjektiv označujících barvy / odstíny barev:

azurově / na azurovo / do azurova

bíle / (na) bílo / nabílo/ do {bíla, běla}/ doběla

blankytně / na blankytno / do blankytna

blonďatě / na blonďato / do blonďata

černě/ (na) černo/načerno/ (do) černa/ dočerna

červeně / (na) červeno / do červena

oranžově / na oranžovo / do oranžova

zeleně/ (na) zeleno/ nazeleno/ (do) zelena/ dozelena

žlutě/ (na) žluto/ nažluto/ (do) žluta/ dožluta

...

Problematické:

blízce / (na) blízko / nablízko/ z blízka/ zblízka i blízek,?blízka,?blízko,…

plně/ z plna²¹ (hrdla) / zplna/ na plno/ naplno i pln, plna, plno, plni, plny,...

živě / (na) živo / naživo/ (za) živa/ zaživa i živ, živa, živo, živi, živy

i. Typ o [lemma=.*o & lc=.*o & POS=D & NOM=J]

např. sedět na sucho, ale např. naříkat na sucho má být POS=N.

j. Typ a [lemma=.*a & lc=.*a & POS=D & NOM=J]

např. vytřít do sucha, ale např. deště přišly v období sucha, naříkat na sucha má být POS=N.

Tvar na u má navíc:

krátce / (na) krátko / nakrátko/ nakrátko/ (na) krátku[22] / (z) krátka/ zkrátka / zkrátku[23], vkrátku / (v) krátku[24]

slepě / za slepa / zaslepa/ po slepu / poslepu/ na slepo/ naslepo

staře / za stara / zastara/ po staru / postaru/ staro²⁵...

V některých vybraných případech hovoří lexikalizace substantivního významu pro desambiguaci substantivní interpretace, jejíž výsledky ovšem nemusí být uspokojivé.

Seznam trojic tvar na e, tvar na o a tvar na a, který je kandidátem na desambiguovatelnou substantivní interpretaci:

horce / horko / za horka/ zahorka

jasně / jasno / z čista jasna/ zčista jasna

světle / světlo / (za) světla/ zasvětla

teple / teplo / (za) tepla/ zatepla

volně / volno / z volna/ zvolna

vlhce / vlhko / za vlhka/ zavlhka

…

K nim se druží ještě čtveřice tiše/ticha/ticho/tichu a suše/sucha/sucho/suchu, kde alespoň tvary na o, a, u mají dvojí slovnědruhovou interpretaci (POS=D, např. Jsou ticho, z ticha, tiše,?po tichu²⁶), tak jasně substantivní interpretaci POS=N (velké ticho, z velkého ticha, po velkém tichu,...). (Ve starší češtině se k nim druží i tvar na e²⁷.)

Problematické:

Suše / sucho / (za/do) sucha / zasucha/ dosucha i such, sucha, sucho, suši²⁸, suchy

tiše / ticho / (z) ticha / zticha i tich, ticha, ticho, tiši²⁹, tichy

k. Typ o [lemma=.*o & lc=.*o & POS=D & NOM=J],

typ a [lemma=.*a & lc=.*a & POS=D & NOM=J],

typ u [lemma=.*u & lc=.*u & POS=D & NOM=J],

adjektiva jmenné tvary [lemma=.*ý & lc=.*[oayi]? & POS=A & NOM=J],

substantiva [lemma=.*o & lc=.*[oayi]? & POS=N & NOM=-]

Velmi komplikovaná je situace v případě, že přichází v úvahu více interpretací.

V kapitole Adjektiva # 08-02, § 3.6 jsme uvedli následující příklady:

a. Bylo velké sucho. (substantivum → POS=N)

b. Bylo velmi sucho. (adverbium → POS=D);

c. Bylo sucho. (adverbium → POS=D)

d. Dítě bylo sucho. (adjektivum – jmenný tvar → POS=A);

e. Chlapi seděli v hospodě na sucho. (adverbium → POS=D)

f. Chlapi si v hospodě stěžovali na sucho. (substantivum → POS=N)

g. Do sucha, které ničilo úrodu v roce 1947, jsem hroznější počasí nezažil. (substantivum → POS=N)

h. Utři se do sucha. (adverbium → POS=D)

i. Jsem už zcela such, manželka je sucha i dítka jsou již sucha, ale šaty nejsou dosud zcela suchy. (adjektivum – jmenný tvar → POS=A)

j. Tolik such nebylo ani v minulém století. (substantivum → POS=N)

k. Tak to by bylo v suchu³⁰. (adverbium → POS=D)

l. V takovém dlouhotrvajícím suchu dojde snadno k požáru. (substantivum → POS=N)

m. Nevěděli jsme si rady s velkými suchy. (substantivum → POS=N)

Domníváme se, že s ohledem na výše uvedené zcela okrajové případy adjektivní interpretace by bylo možné tuto interpretaci na rovině automatické morfologické analýzy co nejvíce eliminovat (viz kapitola Adjektiva # 08-02, § 3.6). Vyloučit substantivní interpretaci u těchto případů: dusno, horko, chladno, mokro, parno, prázdno, sucho, temno, teplo, ticho, vedro, vlhko, ale i světlo, volno, jasno, však za žádoucí nepokládáme.

Navrhujeme tedy, aby u nich byla ve slovníku jak interpretace POS=N (např. [lemma="sucho" & lc="such([oauy]?|em|ům|ách)"]), tak POS=D (např. lemma="such[oau]"), a aby uživatel byl upozorněn na to, že seznam si neklade nárok na úplnost a desambiguace není zcela spolehlivá. Je tomu tak proto, že můžeme v praxi rozlišit tři případy, a sice 1) jasně lingvisticky i automaticky desambiguvatelné případy jako bylo velké <sucho [N]> a bylo velmi <sucho [D]>, 2) lingvisticky dobře a automaticky patrně obtížně desambiguvatelné případy jako stěžovat si na <sucho [N]> a sedět na <sucho [D]> a konečně lingvisticky nedesambiguovatelné případy jako je <sucho>, u nichž technicky při desambiguaci navrhujeme hodnotu POS=D.

Jsme si vědomi toho, že v korpusech jsou řídce doložena další substantivní užití deadjektivních substantiv ze jmenných tvarů, která se většinou adverbializují.³¹ Viz kapitoly věnované substantivům # 08-01, § 8.2 a adjektivům # 08-02, § 3.6.

3.1.3 Typ [yu]

Tento typ je zastoupen poměrně bohatě a domníváme se, že jej nelze interpretovat jako varianty a zahrnout adverbia pod vícenásobné lemma s příslušnou mutací. Navrhujeme je lemmatizovat odděleně.

Adverbia na y se tvoří paradigmaticky od adjektiv zakončených na ský/cký (latinský → latinsky, typický → typicky), adverbiálně užité tvary na u (po latinsku, po bolševicku) mají slovnědruhový přesah, lze je hodnotit nejen jako adverbia, ale také jako ustrnulé jmenné tvary adjektiv (pojí se s předložkou – proces adverbializace není dokončen vznikem příslovečné spřežky³²: po latinsku, po americku) a lze je nahradit spojením po.*[sc]kém způsobu³³. Navrhujeme tudíž, aby jmenné tvary v adverbiálním významu po předložce po byly lemmatizovány samostatně (aby nebyly zahrnovány pod lemma substantiva .*[sc]ko, od něhož by se v řadě případů navíc měly lišit velikostí počátečního písmene) a na rovině POS navrhujeme hodnotu D. Hodnotu POS=N budou mít pouze existující substantiva (propria) typu Česko, Rakousko, Burgundsko,...

a. Typ y [lemma=.*y & lc=.*y & POS=D & SUB=0 & NOM=-]

např. mluvit česky

b. Typ po.*u [lemma=po.*u & lc=po.*u & POS=D & SUB=s & NOM=J]

např. Vánoce budou počesku

c. Typ u [lemma=.*u & lc=.*u & POS=D & NOM=J]

např. odpověď po babišovsku

Ze screenshotu je patrné, jak vypadá dosavadní značkování druhých členů spojení:

po.*[sc]ku.

Navrhujeme, aby:

a) byly do slovníku doplněny spřežky porušující současnou pravopisnou normu (typ počesku) a aby byly označkovány jako [POS=D & SUB=s & NOM=J],

b) aby byly do slovníku doplněny ustrnulé jmenné tvary většinou užívané v adverbiální platnosti (typ po česku) a aby byly lemmatizovány tvarem .*u a označkovány jako [POS=D & NOM=J],

c) aby byla vytvořena desambiguační pravidla pro odlišení případů typu cestovat po Česku (POS=N) a výchova dívek po česku (POS=D & NOM=J),

d) aby byla ze slovníku odstraněna uměle vytvořená substantiva jako bolševicko, bondovsko, bruselsko, cimrmanovsko, čapkovsko… a aby byla nahrazena lemmaty .*u označkovanými [POS=D & NOM=J].

- -

Je nanejvýš pravděpodobné, že při nedodržení pravopisné normy nebudou výsledky desambiguace typu cestovat po <Burgundsku> × hovězí po <Burgundsku> spolehlivé. Na tuto obtíž lze uživatele upozornit a dát jim k dispozici seznamy skutečně se vyskytujících (většinou zeměpisných) názvů substantiv na [sc]ko, které budou mít ve slovníku i adverbiální lemma a příslušnou interpretaci (viz více kapitola Substantiva # 08-01, § 8.1.15).

3.1.4 Poznámka k určení kategorie pádu u předložek před lemmaty s POS=D

Půjde o slovní tvary, které budou mít v bezprostředním levém kontextu předložku.³⁴ U předložek, které se pojí s více pády, se desambiguuje ve značce hodnota pádu. Pravidlová desambiguace vychází z totožnosti pádu řídícího jména předložkové skupiny a pádu rekčně požadovaného předložkou. V případě víceslovných jednotek jako na lehko, za mlada, po staru, po anglicku, budou lemmaty tvarů lehko, mlada, staru, anglicku,…, tedy tvary samy a POS=D. Navrhujeme, aby u nich byla vyplněna hodnota CAS, která by se pak využila při desambiguaci.³⁵

Tvary na o mají CAS=[4-[36]], tvary na a mají CAS=2, tvary na u mají CAS=[26]³⁷.

Kategorie CAS bude doplňována i v případech, kdy adverbium nemá jasný jmenný původ v synchronně existujícím jménu. Jedná se o případy užití jako na <zítra>, na <ven>, na <doma>, na <pořád>, na <později>, na <příště>,...

3.2 Lemmatizace adverbií ze substantiv a sloves^[38]

Lemmatem desubstantivních adverbií tvořených z prostých pádů jmen bude příslušný ustrnulý tvar jména (ráno, včera, bokem, celkem, dílem, kolem, časem, honem, kvapem, předem, středem, vrchem, zadem, smíchy, vzteky...).³⁹

Za velmi problematické pokládáme zachycení odděleně psaných dvouslovných adverbiálních určení (na beton / nabeton, na zlost / nazlost, na sekyru / nasekyru) na rovině slovníku automatického analyzátoru. Do slovníku lze doplnit spřežky, které automatická analýza nerozpoznává (chybí ve slovníku). Doplnění slovnědruhově přesažné interpretace u tvaru substantiva, který se vyskytuje v kontextu předložky a může mít v kontextu s předložkou adverbiální význam, nepokládáme za žádoucí.⁴⁰ Přesto pokládáme za vhodné dát uživateli k dispozici seznamy spřežek, popřípadě předpřipravené složitější dotazy k vyhledávání víceslovných jednotek majících jednoslovné varianty. Víceslovné jednotky, u nichž se tvar vyskytuje výhradně ve spojení s předložkou v adverbiálním významu, navrhujeme lemmatizovat příslušným tvarem a interpretovat je na rovině POS=D (oscilují mezi adverbiem a substantivem, např. k duhu).⁴¹

Lemmatem desubstantivních adverbií tvořených z předložkových pádů podstatných jmen (okolo, nahonem, doprostředka, navenek, zvenku, popravdě, navěky, naruby...)⁴² bude jediný adverbiální tvar.

Lemmatem desubstantivních adverbií tvořených sufixy -mo a -ky (koňmo, vozmo, pěšmo, pěšky, loďmo...) bude jediný adverbiální tvar.

Lemmatem deverbativních adverbií tvořených sufixem -mo (letmo, zkusmo, kradmo, obkročmo...)⁴³ a sufixem -ky (plačky, mlčky...) bude jediný adverbiální tvar.

Pro lemmatizaci příslovcí stejného druhu a významu tvořených různými prostředky od jednoho základu a příslovcí s alternací v základu bude využit koncept vícenásobného lemmatu a globální mutace GMU. Zdá se, že mezi případy, které by měly být řešeny pomocí vícenásobného lemmatu a GMU a takovými, které by měly být lemmatizovány samostatnými lemmaty, je neostrá hranice. Existují dvojice, u nichž lze najít argumenty pro obě řešení. Tak například u dvojic {zítra, zejtra}, {nazítří, nazejtří}, {zvenku, zvenka} jde naprosto bezpochyby o případy, které pod vícenásobné lemma a koncept GMU spadají, kdežto u dvojic pěšky/pěšmo, kradí/kradmo, dnes/dneska, zpět/zpátky a nazpět/nazpátky je situace složitější, a sice z toho důvodu, že z jistého hlediska jde o adverbia synonymní, která jsou ovšem tvořena odlišnými slovotvornými prostředky. Pokud bychom rozšiřovali užití konceptu vícenásobného lemmatu a GMU tímto směrem, otvírali bychom takovým rozhodnutím cestu k jistému rozostření hranic popisu morfologie a sémantiky, které by mohlo vést k nejasným pravidlům a v důsledku toho k nekonzistentním rozhodováním, například v případě tzv. slovotvorných synonym (strýček/strejda, mládí/mladost...), která zajisté prostřednictvím konceptu vícenásobného lemmatu a GMU řešena být nemají.

Seznam: {zítra, zejtra}, {nazítří, nazejtří}, {zvenku, zvenka},…

GMU: 0-j, u-a.

3.3 Lemmatizace zájmenných příslovcí

Pro lemmatizaci zájmenných příslovcí stejného druhu (stejné hodnoty SUB a DEI, viz níže § 4.1) od jednoho základu bude využit koncept vícenásobného lemmatu. Koncept GMU bude využit pro dvojice lišící se +/− protetickým v (odkud/vodkud), +/− koncovým v (kdykoli/kdykoliv), +/− koncovým e (jedinkrát/jedinkráte), +/− e ve vokalizované předponě (odvždy/odevždy). V ostatních méně pravidelných případech uvedeme seznam.

Seznam⁴⁴: {všude, všudy, všade}, {pokaždé, pokaždý}, {zprvu, zprva}, {pokavad, pokavád}, {potud, potuď}, {pocuď, pocud}, {tehdy, tehdá, tehdáž}, {posavad, posavaď}, {doposavad, doposavaď}, {ztamo, ztama},

{nikdy, nikdá, nikdáž}…;

{takhle, takdle}, {semdle, semhle}, {tamhle, tamdle}, {tadydle, tajdle}, {hned, hnedka, hnedle},

{vždy, vždycky, dycky}, {navždy, navždycky, nadycky}, {provždy, provždycky, prodycky}, {teďka, teďko, teďky, teďkom, teďkonc}…;

3.4 Lemmatizace číslovek s adverbiální formou i funkcí

Na tomto místě upozorňujeme na slovnědruhový přesah mezi násobnými číslovkami a adverbii. Jedná se o slova pravidelně tvořená z číslovkových základů číslovek určitých, neurčitých a zájmenných, a to 1) kompozicí s druhým členem krát(e) včetně spřežek na- -krát(e) (dvakrát(e)/nadvakrát(e), mnohokrát(e)/namnohokrát(e), tolikrát(e)/natolikrát(e), kolikrát(e)/nakolikrát(e), několikrát(e)/naněkolikrát(e)), násobně/násob (dvojnásobně, dvojnásob, mnohonásobně, tolikanásobně, kolikanásobně, několikanásobně), 2) derivací číslovek adverbiálního charakteru od násobných číslovek adjektivní flexe tvořených od příslušných základů sufixem -itý → -itě (dvojitě, trojitě)⁴⁵ a 3) sufixem -mo (dvojmo, trojmo, ...)⁴⁶.

Uvedené případy budou mít [POS=C & SUB=n & DEI=[UN]]. Pro lemmatizaci variant s druhým členem násobně/násob a krát/kráte bude využit koncept GMU. Podrobnější popis je uveden v kapitole Číslovky # 08-04, § 3.3.

3.5 Lemmatizace s ohledem na stupňování (DEG) a GMU

V dosavadním značkování byly až na některé výjimky lemmatizovány tvary druhého a třetího stupně tvarem prvního stupně.⁴⁷

3.5.1 Lemmatizace tvarem pozitivu

Pod lemma (tvar pozitivu) končící slovnědruhovou charakteristikou [eě], y, popř. [eu], [ey]…, viz výše § 3.1 (vícenásobné lemma) budou zahrnuty tvary prvního, druhého a třetího stupně tvořené pravidelně (nově/nověji/nejnověji, cize/cizeji/nejcizeji, hezce|hezky/hezčeji/nejhezčeji), včetně substandardních pravidelně tvořených tvarů komparativu a superlativu u adverbií, která mají standardní tvary komparativu a superlativu od supletivních kmenů (dobře/dobřeji/nejdobřeji, zle/zleji/nejzleji)⁴⁸.

Adverbia se dvěma tvary pozitivu, kteréžto tvary se liší významově a/nebo distribucí, například: hluboce/hluboko, blízce/blízko, vysoce/vysoko, nízce/nízko, těžce/těžko, široce/široko, hustě/husto, úzce/úzko, dlouze/dlouho, snadně/snadno budou dvě zvláštní lemmata, k nimž nebude vztahován žádný komparativ a superlativ.

3.5.2 Lemmatizace tvarem komparativu

Tvarem komparativu (podle významu i užití) bez zřejmého vztahu k jedinému tvaru pozitivu budou lemmatizovány tvary, které nelze vztáhnout k jedinému tvaru pozitivu (viz výše) a dále ty, u nichž dochází při tvoření tvarů komparativu/superlativu

a) k redukci kmene (redukuje se finální skupina tvořená příponou fundujícího adjektivního tvaru a slovnědruhovou charakteristikou -ok-o/-oc-e, -k-o/-c-e, -h-o/-z-e, -n-o/-n-ě),

b) k alternaci kořenového vokálu (například alternace u/ou u tvarů hust[oě] a houšť)

c) ke tvoření variantních tvarů komparativu/superlativu (komparativ/superlativ má tvarovou slovnědruhovou příponu jak [eě]ji, tak [eě]) a

d) k apokopě koncového e tvarů komparativu/superlativu. Pod variantní lemma na e s možnou apokopou, případně na [eě]ji budou zahrnuty tvary adverbií druhého a třetího stupně tvořené nepravidelně. Budou lemmatizovány variantními lemmaty: {blíže, blíž}, {níže, níž}, {tíže, tíž}, {výše, výš}, {déle, dýl}, {šířeji, šíře, šíř}, {úžeji, úže, úž⁴⁹}, {hlouběji, hloub}, {hustěji, houšť}⁵⁰. Variantní lemmata {blíže, blíž}, {níže, níž}, {tíže, tíž}, {výše, výš} budou mít GMU e-0, variantní lemmata {déle, dýl} budou mít GMU e-0, é-ý, variantní lemmata {šířeji, šíře, šíř}, {úžeji, úže, úž} budou mít GMU eji-e-0, variantní lemmata {hlouběji, hloub}, {hustěji, houšť} budou mít GMU eji-0.

3.5.3 Zvláštní případy

a. Pod lemmata končící slovnědruhovou charakteristikou o, a, u (popřípadě bez explicitní slovnědruhové charakteristiky, například navrch × navrchu, napříč, naštorc, nadél...) budou zahrnuty pouze tvary prvního stupně. Uživatel by měl být na tento zjednodušující technický přístup upozorněn.⁵¹

b. Adverbium dole bude mít lemma {dole, důle} a budou pod ně zahrnuty tvary prvního, druhého a třetího (dole/důle/doleji⁵²/nejdoleji) stupně.⁵³ Teritoriální varianta důle bude zahrnuta pod koncept vícenásobného lemmatu a označkována pomocí konceptu flektivní mutace.

c. Adverbium daleko bude mít lemma daleko a nebude k němu vztahován žádný komparativ a superlativ.⁵⁴

d. Adverbia mnoho, málo, velmi, moc, budou lemmaty, k nimž nebude vztahován žádný komparativ a superlativ.⁵⁵

e. Adverbium hodně, které převážně funguje jako měrové adverbium, bude lemmatem, k němuž bude vztahován komparativ a superlativ (nej)hodněji. Uvedené tvary jsou velmi řídké, občas jsou výsledkem překlepů, nicméně objevují se i pravidelně utvořené doklady. Z toho důvodu nepokládáme za chybu je pravidelně lemmatizovat. Jsme si vědomi napadnutelnosti zvoleného řešení a s tímto vědomím na ně upozorňujeme.

f. Pod variantní lemma na e s možnou apokopou, případně na [eě]ji⁵⁶ (nepravidelně tvořený tvar komparativu) budou zahrnuty tvary adverbií druhého a třetího stupně tvořené nepravidelně od supletivního kmene. Budou lemmatizovány variantními lemmaty: {hůře, hůř}, {zadněji, záze},⁵⁷ {lépe, líp}. Variantní lemmata {hůře, hůř} budou mít GMU e-0, variantní lemmata {zadněji, záze}⁵⁸ budou mít GMU eji-e, k-d, variantní lemmata {lépe, líp} budou mít GMU e-0, é-í.

g. Tvarem komparativu (podle významu i užití) bez zřejmého vztahu k jedinému tvaru pozitivu budou lemmatizovány variantními lemmaty: {více, víc}⁵⁹, {méně, míň}⁶⁰, {dříve, dřív}⁶¹, {spíše, spíš}⁶², {dále, dál}⁶³, {prve, prv⁶⁴}⁶⁵. Variantní lemmata s vypuštěným koncovým e budou mít GMU e-0, variantní lemmata s apokopovaným e a s alternací v kořeni {méně, míň} budou mít GMU e-0, é-í.

h. Odlišně bude ovšem pro přehlednost řešena lemmatizace adverbia prvně⁶⁶ i řídce doložených tvarů prvněj(i)⁶⁷, nejprvněj(i)⁶⁸. Všechny tři tvary budou zahrnuty pod pravidelné lemma pozitivu (lemma=prvně & POS=D & SUB=C & DEI=- & DEG=[123]).

Poznámka: Po významové stránce pojmenovávají adverbia dříve, prve i okrajové teritoriálně vymezené užití adverbia spíš(e) (spolu s dlouho/dýl ve významu ‚později‘, viz přijdu spíš/dýl) časovou okolnost na ose vymezené zájmennými příslovci předtím/potom, která patří do skupiny zájmenných adverbií pojmenovávajících skutečnosti buď na ose času (předtím/potom), nebo na osách prostorových (nadtím, podtím, předtím, zatím). Obdobně jako komparativy slouží k pojmenování skutečností na ose pro vyjádření míry (viz také interpretace více, méně jako adverbií míry). Podobně adverbium spíš(e) (kromě užití ve významu synonyma více a dříve) vyjadřuje abstraktní prostorovou okolnost (= blíže abstraktně pojaté skutečnosti / pravděpodobněji). Teritoriálně omezeně má tento význam i adverbium dřív(e) (to bude dřív tohle/tak). Rovněž adverbium dál(e) mívá kromě významu opozitního k blíže v konkrétním prostorovém slova smyslu také další konkrétní prostorový význam, a sice ‚dovnitř‘.

Společným znakem všech uvedených příslovcí je, že vyjadřují hodnocení pojmenované skutečnosti z hlediska jejího umístění na časové/prostorové ose vzhledem k blíže neurčenému, přesto však určitému časovému/prostorovému bodu. Tento časový/prostorový bod není pojmenován žádným konkrétním adverbiem, ale je konstruován.

Adverbium dříve je komparativem, který nemá žádný vztah ke konkrétní formě adverbia v pozitivu, nebude tudíž uměle přiřazeno k lemmatu pozitivu brzy a adjektivum dřívější nebude analogicky řazeno k lemmatu pozitivu adjektiva brzký.⁶⁹

i. Tvary (nej)raděj(i) budou i nadále zahrnuty pod lemma raději, které bude i nadále značkováno POS=D. Pod lemma raději budou s příslušnou GMU zahrnuty nestandardní varianty (jako (nej)radši, (nej)rač(i)). Viz kapitola Adjektiva # 08-02, § 2.2.3.

4 Značkování adverbií podle kombinací kategorií SUB, DEI a NOM

[POS=D & SUB=[PsCGV0] & DEI=[UNZTD-]]

POS je kategorie slovní druh, pro adverbia je POS=D. Další rozlišení je na rovině kategorií SUB a DEI. Pomocí kategorie SUB budou vydělena adverbia na základě fundačně motivačního vztahu (k číslovkovým kořenům, k adjektivům se SUB=[GV]), utvářenosti (příslovečné spřežky), významových a funkčních specifik (zájmenná adverbia).

Hodnoty [POS=D & SUB=P & DEI=[UNZTVSD]] budou mít tzv. zájmenná příslovce. Ta mají se zájmeny společné kořeny a plní podobné (zástupné, deiktické funkce). Podrobněji o nich bude pojednáno v kapitole Zájmena # 08-03.

4.1 Zájmenná příslovce

4.1.1 Určitá adverbia vymezovací a totalizátory místa, času, způsobu^[70]

[POS=D & SUB=P & DEI=U]

Seznam (adverbia místa): druhde, mnohde, jinde, jinam, jinud[yá], (v)onde, (v)onam, vš[ua]de, vš[ua]dy.

Seznam (adverbia času): vždy, vždycky, navždy, navždycky, provždy, provždycky, od(e)vždy, od(e)vždycky, jind[yá], najind[yá], (v)odjind[yá], dojind[yá], (v)ond[yá], (v)onehd[yá], druhd[yá], pokažd[éý], jedině, jedinkrát(e), po(v)obakrát(e), pojednou, mnohd[yá], hned(ka)/hnedle, ihned, hnedlinko, už, již, užuž, juž; spřežky: zevšad, nadevše, od(e)vždy,?pokdy.

Seznam (adverbia způsobu)⁷¹: jinak, onak, poněkud; jenom, všehovš[ua]de, všehovš[ua]dy, taktak; spřežky: především,...

4.1.2 Neurčitá adverbia místa, času, způsobu

[POS=D & SUB=P & DEI=N]

Seznam (adverbia místa): ně(kde/kam), bůhví(kde/kam), pánbůhví(kde/kam), pámbuví(kde/kam), čertví(kde/kam), kdoví(kde/kam), nevím(kde/kam), kde(kde/kam), lec(kde/kam), leda(kde/kam), ledas(kde/kam), málo(kde/kam), všeli(kde/kam), všelis(kde/kam), zřídka(kde/kam), sotva(kde/kam), (kde/kam)koli, (kde/kam)koliv, (kde/kam)žkoli, (kde/kam)kolivěk, (kde/kam)s⁷², (kde/kam)si; spřežky: (v)odněk[ua]d,...;

Seznam (adverbia času): ně(kdy), bůhví(kdy), pánbůhví(kdy), pámbuví(kdy), čertví(kdy), kdoví(kdy), nevím(kdy), kde(kdy), lec(kdy), leda(kdy), ledas(kdy), málo(kdy), všeli(kdy), všelis(kdy), zřídka(kdy), sotva(kdy), (kdy)koli, (kdy)koliv, (kdy)žkoli, (kdy)kolivěk, (kdy)s, (kdy)si; spřežky typu odkdysi, dokdysi, nakdysi, (v)odněkdy,...

Seznam (adverbia způsobu): ně(jak)/ňák, bůhví(jak), pánbůhví(jak), pámbuví(jak), čertví(jak), kdoví(jak), nevím(jak), kde(jak), lec(jak), leda(jak), ledas(jak), málo(jak), všeli(jak), všelis(jak), zřídka(jak), sotva(jak), (jak)koli, (jak)koliv, (jak)žkoli, (jak)kolivěk, (jak)s, (jak)si;

Poznámka k doplnění slovníku

Je třeba doplnit do slovníku obvyklejší homonymní interpretace zájmenných adverbií kdes, kdys, kams, kudys, jaks,… POS={D,V}⁷³.

Ve slovníku chybí i další adverbia s volným morfémem -s, jako např. tadys, tudys, tams, teďs…

4.1.3 Záporná adverbia místa, času, způsobu

[POS=D & SUB=P & DEI=Z]

Seznam (adverbia místa): nikde, nikudy, nikam, odnikud, pranikde;?kdeže

Seznam (adverbia času): nikdy/nikdá, nikdáž, (v)odnikdy, donikdy, nanikdy, pranikdy;

Seznam (adverbia způsobu): nijak, pranijak, nikterak;

4.1.4 Tázací adverbia místa, času, způsobu

[POS=D & SUB=P & DEI=T]

Seznam (adverbia místa): kde, kudy, kam, odkud, kdež⁷⁴, kamž⁷⁵; výrazy {pokud, pokuď, pokaď, pokavaď} budou interpretovány pouze jako spojky (POS=J), viz kapitola Spojky # 08-08, § 3.2.1;

Seznam (adverbia času): kdy(pak), odkdy(pak), dokdy(pak), nakdy(pak),?pokdy; výrazy {dokud, dokuď, dokad, dokáď, dokavaď, dokaváď} budou interpretovány pouze jako spojky POS=J, viz kapitola Spojky # 08-08, § 3.2.1;

Seznam (adverbia způsobu): jak(pak), kterak(pak),...;

4.1.5 Vztažná adverbia (nevyužitá kategorie)

[POS=D & SUB=P & DEI=V]

Tato kombinace nebude patrně využita. Tázací adverbia nebudou na rovině slovníku morfologického analyzátoru uložena jako relativa.⁷⁶.

Původně vztažné zájmenné příslovečné spřežky přičemž, načež, začež, pročež, natož, protož, tož,... a snad i archaické očež, počemž jsou užívány výhradně jako spojovací výrazy, jsou tudíž řazeny mezi spojky POS=J, viz kapitola Spojky # 08-08, § 3.1.1.⁷⁷

4.1.6 Ukazovací adverbia místa, času, způsobu

[POS=D & SUB=P & DEI=D]

Seznam (adverbia místa): tu, tady, tam, tamhle, tamdle, tajdle, ztamo/ztama, tudy, tudyma, tamtudy, (v)odtud, (v)odsud, dotud, odkaď potud, pocaď, pocuď, pocamcáď, zde, sem, semhle, semka, semtam, pokavad/pokavád, (v)odtady, (v)odtam(a), (v)odtámhletud, (v)odtamtéž,...;

Seznam (adverbia času): teď, teďka/teďko/teďkom/teďkonc, tehdy, tehdáž, nyní, nynčko, dotehdy, (v)odtehdy, natehdy…; předtím, potom, zat[íi]m, přitom, dosud, posud, posavad, doposavad, prozat[íi]m, (v)odteď, doteď, proteď, tentokrát(e), protentokrát(e), natentokrát(e), dotentokrát(e), tenkrát(e), ztenkrát(e), mezit[ií]m;

Seznam (adverbia způsobu): tak, takto, takhle, takdle…

4.1.7 Adverbiální spřežky se zájmenným základem ve frazémech

[POS=D & SUB=P & DEI=-]

Seznam: (vzít) zasvé, (jít) posvých,...

4.2 Adverbiální spřežky

Adverbia tvořená ustrnutím předložkových pádů adjektiv a substantiv (nikoliv zájmen, ta budou zařazena mezi zájmenná adverbia), zvlášť uvádíme adverbiální spřežky s vícenásobným lemmatem.

4.2.1 Adverbia tvořená ustrnutím předložkových pádů adjektiv

[POS=D & SUB=s & DEI=- & NOM=J]⁷⁸

Příklad: nasucho, zatepla, potichu, podomácku, vpravo, doprava, napravo, vlevo, doleva, nalevo, nadlouho/nadýl…

4.2.2 Adverbia tvořená ustrnutím předložkových pádů substantiv, popřípadě ta, která nelze vztáhnout k slovnědruhově jednoznačnému základu^[79]

[POS=D & SUB=s & DEI=- & NOM=-]

Příklad: nahoru⁸⁰, nahoře, navrch, navrchu, naspod, naspodu, vpřed, vpředu, dopředu, napřed, odpředu, vzad, vzadu, dozadu, nazad, odzadu....⁸¹

4.2.3 Adverbiální spřežky s vícenásobným lemmatem

[POS=D & SUB=s & DEI=- & NOM=-]

Příklad (seznam): {začasto, začasty}, {pokradmu, pokradmě, pokradmo}, {pošeptmě, pošeptmu}, {potajmě, potajmu}, {zpolodarmo, zpolodarma}, {zúmyslu, zúmysla}, {doposledu, doposleda}, {dospod, dospodu, dospoda}, {odspod, odspodu, odspoda}, {zespod, zespodu, zespoda}, {pozdaleku, pozdaleka}, {vkrátku, vkrátce}, {zvenku, zvenka}, {zvnějšku, zvnějška}, {zvnitřku, zvnitřka}, {zrovinko, zrovinka}, {vbrzku, vbrzce}, {odpolu, odpola}, {napolo, napoly}, pomalu, pomale, pomaly}, {pomále, pomálu}, {polehounku, polehounce}, {pohotově, pohotovu}, {porůzně, porůznu}, {porozličně, porozličnu}, {poskrovně, poskrovnu}, {ponenáhlu, ponenáhle}, {znenáhle, znenáhlu, znenáhla}, {poznenáhle, poznenáhlu, poznenáhla}, {znenadále, znenadála}, {poznovu, poznova}, {vnově, vnovu}, {znovu, znova}, {zpřímo, zpříma}, {donedávně, donedávna}, {odnedávně, odnedávna}, {pozvolně, pozvolna}, {zpozvolně, zpozvolna}, {zvolně, zvolna}, {zúmyslně, zúmyslna}.

4.3 Další ustrnulá adverbia a adverbia tvořená sufixací ze substantiv a sloves

[POS=D & SUB=0 & DEI=- & NOM=-]

a. Adverbia vzniklá ustrnutím prostých i předložkových pádů substantiv včetně případů, které bývají označovány jako predikativa (třeba, potřeba, zima,…)

Příklad: ráno, včera, zítra, časem, bokem, celkem, dílem, dole[82], dolů, dokola, doprostředka, vprostředku, kolem, časem, honem, kvapem, předem, středem, vrchem, zadem, smíchy, vzteky…;

b. Adverbia ze substantiv tvořená sufixací

Příklad: koňmo, vozmo, pěšmo, pěšky, loďmo…;

c. Adverbia ze sloves tvořená sufixací

Příklad: letmo, zkusmo, kradmo, obkročmo, plačky, mlčky…;

d. Adverbia vzniklá ustrnutím slovesných tvarů

Příklad: neřkuli, takřka, vleže, vsedě,…;

e. Další (např. adverbia vzniklá ustrnutím celých frází)

Příklad: jaksepatří, jakbysmet, conevidět,…;

f. Ustrnulé adverbiální spřežky, které jsou součástí frazémů^[83], včetně těch z číslovkových základů

Příklad: křížemkrážem, zubynehty, ostošest, jednadvě, razdva, razdvatři,...

4.4 Deriváty a kompozita korespondující s deriváty a kompozity podobného charakteru, které mají POS=C

[POS=D & SUB=C⁸⁴ & DEI=- & NOM=-]

SUB=C budou mít adverbia derivovaná pravidelně z adjektiv, která budou mít SUB=C (viz více kapitoly věnované číslovkám # 08-04 a adjektivům # 08-02, § 3.5) a adverbiální užití slovnědruhově přesažných číslovek (mnoho) a substantiv (málo, moc).

Pomocí SUB=C je řešen statut vybraných⁸⁵ měrových adverbií (hodně) a měrových adverbií druhého a třetího stupně, která nelze vztáhnout k jednoznačnému tvaru pozitivu (více, méně).

Příklad: mnoho⁸⁶, málo⁸⁷/nemálo, víc(e), méně/míň / neméně, moc, hodně, jednou, projedenkrát, nadvakrát, potřikrát, nejednou, nejedenkrát, nijednou, prve, prvně, poprvně; nejprvněji, jednoduše, dvojitě, dvojrozměrně, trojjazyčně.⁸⁸

4.5 Adverbia derivovaná pravidelně z adjektiv, která budou mít SUB=[VG]

[POS=D & SUB=[VG]⁸⁹ & DEI=-]

Viz více kapitola Adjektiva # 08-02, § 3.2 a # 08-02, § 3.4.⁹⁰

Příklad: nepokrytě, nemouhoucně, zdvojeně, zdvojujícně.

SUB=V nebudou mít adverbializované tvary sloves jako takřka, vleže,...

4.6 Ostatní adverbia

4.6.1 Všechna ostatní adverbia paradigmaticky tvořená od adjektiv slovnědruhovou charakteristikou e/ě **(adverbia, která mají lemma=.*[eě]) a některá na** o

[POS=D & SUB=0 & DEI=- & NOM=-]

Příklad: suše, teple, nově, cize, hluboce, vysoce, široce, hluboce, blízce, nízce, úzce, těžce, dlouze, snadně, hustě, dalece...; Ale i: blízko, daleko, dlouho, hluboko, husto, nízko, snadno, široko, těžko, úzko, vysoko…;

**4.6.2 Adverbia, která mají [lemma=.*y]**

[POS=D & SUB=0 & DEI=- & NOM=-]

Příklad: domácky, česky.

**4.6.3 Adverbia, která mají [lemma=.*[oau]] a nejsou spřežky**

[POS=D & SUB=0 & DEI=- & NOM=J]

Značení [POS=D & SUB=s & DEI=- & NOM=J] budou mít pouze adverbiální spřežky (nasucho, zasucha, počesku,...), viz výše § 4.2.1.

a. Adverbia, která mají [lemma=.*o] a nejsou spřežky

Příklad: (je) sucho, (je) teplo, mokro….

b. Adverbia, která mají [lemma=.*a] a nejsou spřežky

Příklad: (za) sucha, (za) tepla, (za) studena, (za) mlada, (za) stara, (za) živa….

c. Adverbia, která mají [lemma=.*u] a nejsou spřežky

Příklad: (po) domácku, (po) česku, (po) anglicku...

Podrobný seznam spřežek a adverbializovaných spojení předložka + jmenný tvar nezachycených automatickou morfologickou analýzou včetně upozornění na chyby v desambiguaci viz disertační práce H. Žižkové (2019).

4.6.4 Ostatní adverbia s vícenásobným lemmatem

[POS=D & SUB=0 & DEI=- & NOM=-]

Příklad: {hezky, hezce}, {brzy, brzo},?{šupito, šupity}.

5 Značkování dalších kategorií adverbií – kategorie pádu, stupně a negace

5.1 Hodnoty kategorie pádu (CAS)

Kategorie CAS je relevantní pro všechna adverbia, které mají v bezprostředním levém kontextu předložku, s níž tvoří předložkovou frázi:

a. Kategorie je relevantní pro odděleně psané příslovečné spřežky typu na tvrdo vedle natvrdo, u nichž bude v případě dvouslovné varianty uváděna hodnota CAS u jednotek značkovaných POS=D, tedy například tvar (na) tvrdo bude mít [POS=D & CAS=4]. Kategorie CAS může nabývat hodnot CAS=[2346]: (na) lehko [CAS=4], (za) mlada [CAS=2], (k) stáru [CAS=3], (po) staru [CAS=6]. Viz výše poznámka v § 3 Lemmatizace.

b. Hodnota kategorie CAS bude doplňována i v případech, kdy adverbium nemá jasný jmenný původ v synchronně existujícím jménu. Jedná se o případy užití jako na <zítra>, na <ven>, na <doma>, na <pořád>, na <později>, na <příště>,...

Všechna ostatní adverbia budou mít vyplněnu hodnotu [CAS=-].

5.2 Hodnoty kategorie stupně (DEG)

Všechna adverbia v pozitivu bez ohledu na sémantické rysy, které bývají uváděny jako rozhodující pro pravidelné (více méně paradigmatické) odvozování tvarů komparativu sufixy -e/-[eě]ji a superlativu prefixem nej-, budou mít hodnotu DEG=1, pravidelně i nepravidelně odvozené tvary komparativu a superlativu budou mít hodnotu DEG=[23s⁹¹].

Jedná se o změnu dosavadní praxe, která považovala některé typy adverbií za explicitně nestupňovatelné.⁹²

Hodnotu DEG=- budou mít pouze zájmenná adverbia.⁹³

5.3 Hodnoty kategorie negace (NEG)

Lemmatizace tvaru derivovaného negativním prefixem ne- tvarem bez tohoto prefixu je praxe, která má svá pro i proti. V novém značkování bude zachována u sloves. U adverbií tuto praxi navrhujeme změnit.

a. značení negace u adverbií [NOM=-] tvořených od adjektiv (skupiny adverbií vymezené v § 4.5, § 4.6.1, § 4.6.2 a lemma {hezky, hezce})

Má-li počáteční řetězec ne- negující význam, pak bude lemmatem tvar s ne- a hodnota NEG=N (nedobře, neslaně, neochotně, nevkusně, nepřejícně, nečekaně, ale i nestoudně, nekale, nepřátelsky).

Nemá-li počáteční řetězec ne- negující význam, bude pochopitelně lemmatem tvar s ne- a NEG=A (jednak případy jako neurotizovaně, neurotizujícně, neuroticky, jednak adverbiální negativa tantum, přičemž máme na zřeteli, že vymezení této kategorie výčtem na rovině morfologického slovníku není triviální,⁹⁴ viz více a podrobněji v kapitole Adjektiva # 08-02, § 4.2).

Ostatní adverbia tohoto typu mají NEG=A.

b. značení negace u všech ostatních adverbií

Má-li počáteční řetězec ne- negující význam, pak bude lemmatem tvar s ne- a hodnota NEG=N (např. zájmenná příslovce {nejinak, nejináč, nejináče}, nejen, netoliko, nevždy, netak, číslovková příslovce nemálo, nemnoho, neméně). Nemá-li počáteční řetězec ne- negující význam, bude lemmatem tvar s ne- a NEG=A (nejednou). Hodnotu NEG=A mají pouze opozita adverbií s NEG=N (např. jen, vždy, málo, méně…), všechna ostatní adverbia mají NEG=-.

Literatura

Hajič, J. (2004): Desambiguation of Rich Inflection (Computational Morphology of Czech). Vol. 1. Praha: Karolinum Charles University Press.

Hajič, J. – Hlaváčová, J. (2013): MorfFlex CZ, LINDAT/CLARIN digital library at Institute of Formal and Applied Linguistics, Charles University in Prague, <http://hdl.handle.net/11858/00-097C-0000-0015-A780-9>.

Mluvnice češtiny 1, 2 (Petr J. et al.) (1986). Praha: Academia.

Pravidla českého pravopisu (Hlavsa Z. et al.) (1993). Praha: Academia.

Osolsobě, K. (1996): Algoritmický popis české formální morfologie a strojový slovník češtiny. Disertační práce. Brno: MU.

Osolsobě, K. (2014): Česká morfologie a korpusy. Praha: Karolinum.

Žižková, H. (2017): Compound Adverbs as an Issue in Machine Analysis of Czech Language. Jazykovedný časopis, 68, č. 2, s. 396–403.

Žižková, H. (2019): Slovnědruhové přechody a přesahy jako problém automatické morfologické analýzy. (Disertační práce.) Brno: MU. Dostupná z: <https://is.muni.cz/auth/th/gomfh/?vysl=106245>.

Křen, M. – Cvrček, V. – Čapka, T. – Čermáková, A. – Hnátková, M. – Chlumská, L. – Jelínek, T. – Kováříková, D. – Petkevič, V. – Procházka, P. – Skoumalová, H. – Škrabal, M. – Truneček, P. – Vondřička, P. – Zasina, A.: Korpus SYN, verze 6 z 18. 12. 2017. Ústav Českého národního korpusu FF UK, Praha 2017. Dostupný z WWW: <http://www.korpus.cz>.

czTenTen12: FI MU – czTenTen12. Centrum zpracování přirozeného jazyka FI MU, Brno. Cit. 21. 11. 2013, dostupný z WWW: <http://ske.fi.muni.cz/bonito>.

IJP. Dostupná z WWW: <http://prirucka.ujc.cas.cz/>.

¹ Brněnský slovník (Osolsobě, 1996) je řešen podobně, rozgenerování tvarů komparativu a superlativu je výsledkem ruční práce. Mezi oběma slovníky nepanuje ve všech jednotlivostech shoda. Zásadní rozdíl je ve značkování kategorie stupeň. V brněnském slovníku nejsou stupňovatelná a nestupňovatelná adverbia ve značce nijak odlišena, hodnotu pozitiv (1) mají všechny pozitivy a všechna „nestupňovatelná“ adverbia, kdežto v pražském slovníku se kontroluje korespondence mezi značkou nestupňovatelné adverbium (tag="Db.*") a vyplněním hodnoty stupeň: „-“ (= neurčuje se). Řešení v brněnském slovníku reflektuje poněkud neostrou hranici stupňovatelnosti/nestupňovatelnosti adjektiv potažmo adverbií. V dostupné lingvistické literatuře existují vágní pravidla týkající se stupňovatelnosti adjektiv a potažmo i adverbií (opírají se o ně oba slovníky, a sice v tom smyslu, nakolik jsou v nich tvary komparativu a superlativu vygenerovány a přiřazeny k lemmatu I. stupně, popřípadě zřídka lemmatizovány tvarem II. stupně.). Téměř každé adjektivum/adverbium lze ovšem užít v přeneseném významu tak, že zahrnuje hodnocení kvality/okolnosti, a tedy možnost vyjádřit v rámci hodnocení stupeň/míru kvality/okolnosti. Opřít se o data, která dnes skýtají velké korpusy, je sice možné (díky nim lze nabourat některé zažité lingvistické poučky o nestupňovatelnosti některých typů adjektiv/adverbií), nicméně narážíme na fakt, že tvary II./III. stupně představují velmi malé procento všech adjektivních/adverbiálních tvarů, takže pro frekvenční analýzy bychom potřebovali více větších korpusů (srov. Osolsobě 2014). Přesnější pravidla, o která se opírá rozgenerování tvarů II. a III. stupně, existují pro syntetické stupňování. Analytickému stupňování se nevěnuje v české lingvistické literatuře velká pozornost, a tak je i automatická morfologická analýza ponechává stranou.

² Zjistit pokrytí slovníku na rovině adverbií paradigmaticky tvořených od adjektiv lze např. tak, že projdeme nerozpoznaná slova v rozsáhlém korpusu. Např. v SYN2010 zadáme dotaz ([lemma=".*[eě]" & lemma!="[[:upper:]].*" & lemma!=".*[aeéiíoóuúyýábpfvmdtnrkhgszw][eě]" & tag="X.*"]). Ruční analýza frekvenčního seznamu takto získaných jednotek odhalí adverbia nerozpoznaná automatickou morfologickou analýzou. Například: odstále <odstálý, hedvábitě <hedvábitý, pavučinatě <pavučinatý, florálně <florální, středověce <středověký, enciánově <enciánový, bělovlnatě <bělovlnatý, trojboce <trojboký, plátovitě <plátovitý, nadějeplně <nadějeplný, láhvově <láhvový, kobercovitě <kobercovitý, entitativně <entitativní, bočníkově <bočníkový, třásňovitě <třásňovitý, srdcervoucně <srdcervoucí, pramenně <pramenný, petrklíčově <petrklíčový, filutárně, edukativně, diluviálně a jistě i další ve frekvenčním pásmu 3–1 výskyt. Lepší pokrytí slovníku by bylo možné řešit využitím guesseru.

³ Viz dotaz [lemma=".*o" & tag="D.*"] frekvence lemma+tag.

⁴ Data jsme získali užitím nástrojů Morfio a Deriv.

[5] Výjimkou jsou případy synonymních spřežek typu {znova, znovu}. Ty budou zahrnuty pod vícenásobné lemma a tvary se budou lišit globální mutací (GMU).

⁶ Hojněji jsou dvojice adverbií lišící se zakončením na e/y zastoupeny mezi zájmennými významově diferencovanými adverbii (kde/kdy,...).

⁷ Variantní tvar má i deadverbiální zájmenné adverbium {teďko, teďky}.

⁸ V SSJČ je interpretováno jako citoslovce, v PSJČ se navíc uvádí kontext etymologické figury šupity šup.

⁹ Tvar začasty uvádí PSJČ jako vymřelý. Není bez zajímavosti, že tvar je doložen ve webovém korpusu Araneum Bohemicum Maximum, a sice v citátu z Jana Václava Pohla. (... Zde <začasty> se procházím, dříve nežli slunce vyjde, za příčinou přemejšlení.)

¹⁰ Tvar pokradmě je doložen pouze jednou v celém SYN v5, jednou je ovšem doložen superlativ nejpokradměji.

¹¹ V korpusech se v těchto případech objevuje i psaní spřežek zvlášť, například v brzku, v brzce.... Měly by se doplnit do morfologického slovníku automatického analyzátoru.

¹² Lemma zprostředka je navíc na rovině slovního druhu víceznačné (POS=[DR]), může jít i o předložku (R). V platnosti předložky funguje i okrajově v korpusu doložená varianta zprostředku, která není rozpoznána automatickou morfologickou analýzou. Viz kapitola Předložky # 08-07, § 3.4 a # 08-07, § 4.1.

¹³ Varianty jsou nejen teďko, teďka, ale i další (teďky, teďkonc). Všechny je třeba zahrnout a označkovat pomocí konceptu GMU.

¹⁴ Lemma nahoru má i substandardní variantu nahorů, viz níže.

¹⁵ V bylo navrhováno (schůzka Jarka&Niki 18. 10. 2018), aby POS v případě neukončeného procesu adverbializace byl afixový segment typu spřežkový (S). Toto řešení je ovšem nevýhodné v případě, že se adverbializují bezpředložkové pády.

¹⁶ Všechny příslovečné spřežky kromě zájmenných adverbií budou mít SUB=s, viz níže.

¹⁷ Jde o řešení desambiguace lemmatu tvarů komparativu a superlativu v případech jako je jim <smutněji> ← je jim <smutno/smutně>, <snáze> uchopitelný ← <snadno/snadně> uchopitelný, <hlouběji> pod průměrem ← <hluboko/hluboce> pod průměrem × <hlouběji> rozdělena ← <hluboce> rozdělena, sáhnout <hlouběji> do peněženky ← sáhnout <hlouboko> do peněženky atd.

¹⁸ Mám <hořko> v ústech. Pocit <hořkosti> v ústech je poměrně častý.

¹⁹ Viz případy jako Bylo <teplo>. × Bylo velmi <teplo>. × Bylo velké <teplo>.

²⁰ Je tu <mlado> a živo. Tvar je ovšem většinou částí složeniny (mlado Čech) oddělený jako samostatný token.

²¹ V tomto případě jde o ojedinělé užití jmenného tvaru adjektiva v atributivní funkci. Tyto případy bude třeba řešit jednotlivě. Jde o zbytky jmenných tvarů v atributivní pozici. Existují dobré důvody, jak pro značkování POS=D, tak POS=A, okrajově i POS=N. Navrhujeme tvar plna ve spojení z <plna> hrdla desambiguovat jako POS=A, tedy stejně jako případy typu žasla <plna> nevole a šedivá díla jsou <plna> citlivých barevných valérů, ve spojení natankovat/nacpat do <plna> desambiguovat jako POS=D a jde z prázdna do <plna> jako POS=N.

[22] Toč se a vrč můj kolovrátku, ejhle adventu již <nakrátku>. Adventu již na <krátku>, blízko, blizoučko Štědrý den!

[23] Jedli, pili, hodovali, až se hory červenaly. Anduličku, <zkrátku> Anku - nalili.

[24] Domnívám se, že z tohoto ohniska je možno pozměniti i jedovitě ošeptávající matky i sny pedagogické a dospěti v <krátku>, to jest tak za padesát let, když by to šlo hladce, do stadia tichého jazyka, kterým se mluví a nikoli, kterým se mlčí, nebo zařve a zase mlčí.

²⁵ Tvar staro je v korpusech značkován jako substantivum. Většinou jde o části složenin oddělené jako samostatné tokeny. Přesto se najdou i okazionální užití jako Tam je mlado, tady je <staro>. Tyto okazionalismy budou mít jako lemma tvar sám a POS=D. Zároveň u nich bude uvedena ve značce příslušná hodnota CAS, tedy staro bude mít CAS=-, za stara CAS=2, po staru CAS=6.

²⁶ Italská mafie v Česku "úřaduje" po <tichu>.

²⁷ Viz F. L. Čelakovský: Což je pánům! Ti na voze/ sedí pěkně v <suše>,/ ale chudý, ten za nimi/ v dešti, blátě kluše.

²⁸ Tvar je homonymní s nesklonným substantivem označujícím pokrm japonského původu.

²⁹ Tvar má jak interpretaci jmenného tvaru adjektiva (Pak ovázal pro všechno Edgarovy oči, velel přítomným, aby byli <tiši> a nalil bezvědomému zbytek jedu do úst...), tak okrajově i tvaru substantiva feminina tiš: Sám a sám si vyjdu v noční <tiši>, bílá cesta z mlh se vynoří...

³⁰ Domníváme se, že ačkoliv se nabízí interpretace substantivní, jde spíše o idiom adverbiální povahy, a to na základě významu něco je v suchu = něco je v pořádku/DOBŘE vyřešeno.

³¹ Z korpusu SYN v6 uvádíme doklady na substantivní užití označkované jako tag=D.*:… ňák podezřelý <mrtvo>...,… nové <výtvarno>...,… pečlivě předestřené <pěkno>...,… právě probíhající silná oblačnost, neli úplné <zataženo>… atd. Substantivní užití v těchto případech bude moci být doplňováno do slovníku automatického analyzátoru průběžně podle potřeby. Nemělo by být automaticky přegenerováno.

³² Přestože v Internetové jazykové příručce je uvedeno, že: „V ustrnulých spojeních typu kapr po mlynářsku, pstruh po námořnicku píšeme předložku zvlášť (na rozdíl od ustálených spojení poslepu i po slepu, postaru i po staru, podomácku i po domácku, která můžeme psát dvojím způsobem); zeměpisná jména v nich píšeme s malým počátečním písmenem: vepřové po německu, nákyp po francouzsku, stejně tak lze zmizet po anglicku.“, psaní dohromady (spřežky) se v korpusech vyskytují (Vánoce budou <počesku>, samozřejmě s cukrovím), nebývají však vždy doplněny ve slovníku automatického analyzátoru (mají značku X: Nechci <poamericku> říkat, že to je pro mě výzva.). V případě, že je dodržena první pravopisná norma (výrazy typu po anglicku se píší zvlášť) a zároveň není dodržena druhá pravopisná norma (v příslušných spojeních se zeměpisná jména píší s malým počátečním písmenem), vzniká problém s desambiguací. V případě spojení typu po.*[sc]ku jsou jako adverbia značkovány pouze tvary domácku, cikánsku a spřežka podomácku. V ostatních případech jsou tvary v těchto spojeních označkovány buď jako substantiva (někdy zcela oprávněně: nabízejí volání na všechny pevné linky po <Česku> zdarma, jindy nikoli: Věc má ovšem drobný doslov po <česku>..., Jinak ovšem pěkně po <evropsku> a postaru myju nádobí...), nebo nejsou rozpoznány automatickou analýzou (Odpověděl bych po <babišovsku> – efektivita, úspornost). Slovník je třeba zrevidovat a doplnit.

³³ To, že zastupují jmennou skupinu (po.*[sc]kém způsobu / na.*[sc]ký způsob), vedlo patrně k tomu, že pokud byly tvary na .*[sc]ku zaznamenány ve slovníku automatického analyzátoru, jsou většinou interpretovány jako substantiva, a to i tehdy, když se v jiných (substantivních) tvarech v úzu nevyskytují (např. lemmata jako africko, americko, anglicko, arabsko, asijsko, balkánsko, bolševicko, britsko, čínsko, evropsko, chlapsko, indiánsko, indicko, kanadsko, klausovsko, křesťansko, lidsko, mexicko, moravsko, myslivecko, námořnicko, pražsko, selsko, sousedsko, vídeňsko, vietnamsko, vojensko, židovsko…).

³⁴ Mezi předložkou a tvarem směřující k adverbializaci (vytvoření příslovečné spřežky grafickým splynutím tvaru s předložkou) není možné vložit další slovní tvar. Toto pravidlo může posloužit pro desambiguaci v případě potřeby (například Seděli tam na sucho a stěžovali si na hrozné sucho. bude mít ve slovníku lemma sucho dvě interpretace POS=D a POS=N, přičemž ve druhém případě lze desambiguovat POS=N na základě pravidla prověřujícího levý kontext, kdežto desambiguace prvního případu je složitější a mohl by se pro ni využít frazeologický modul).

³⁵ Jde o technické řešení, které nemusí být viditelné pro uživatele. Viz více kapitola Lemmatizace # 04, § 3.6.

[36] CAS=- nají tvary na o, před kterými nepředchází předložka. Je mi <teplo/smutno, úzko/veselo/horko>.

³⁷ Desambiguace se bude řídit rekcí předložky, tedy např. od spodu bude CAS=2, kdežto po staru bude CAS=6.

³⁸ Některá desubstantivní a deverbální adverbia byla již uvedena výše, a sice v souvislosti s vícenásobnými lemmaty významově blízkých/synonymních spřežek, u nichž je slovnědruhová příslušnost odvozovacího základku nevýrazná/sporná a které navrhujeme lemmatizovat vícenásobným lemmatem, viz výše. Nechceme na tomto místě řešit fundačně motivační vztahy mezi substantivem dar, adjektivem darmý, adverbiem darmo, spřežkami nadarmo, zdarma, zadarmo, kompozity spolodarmo s variantou spolodarma. Z toho důvodu jsme o těchto spřežkách pojednali již na začátku v rámci poznámek k lemmatizaci deadjektivních adverbií.

³⁹ Vzhledem k tomu, že výsledky značkování budou závislé jak na pokrytí slovníku, tak na úspěšnosti desambiguace, bylo by vhodné, aby měl uživatel k dispozici seznam adverbií tohoto typu, která budou podchycena slovníkem automatického analyzátoru. Homonymní budou adverbializovné prosté pády (časem, kolem, ...), u kterých bude ve hře interpretace POS=D vedle interpretace POS=N, viz výše, nebo POS=R (kolem), viz více kapitola Předložky # 08-07, § 3.4 a # 08-07, § 4.1.

⁴⁰ Desambiguace užití dopadlo to na <beton> dobře (beton je součástí spojení směřujícího k adverbializaci, v případě psaní dohromady má adverbiální spřežka nabeton význam ‚určitě‘) × dopadlo na <beton> tvrdě (beton je tvar substantiva v akuzativu) překračuje rámec rozumných možností automatické morfologické analýzy, a to přesto, že ruční desambiguace je patrně snadná.

⁴¹ Upozorňujeme na fakt, že zařazení slovních tvarů, které se vyskytují v idiomech, není triviální, protože v korpusech se k řadě tvarů petrifikovaných v idiomech nacházejí tvaroslovné varianty, popřípadě se objevují tvary etymologicky příbuzných slov s plně rozvinutelným souborem tvarů. Jako příklad může sloužit adverbiální spojení v idiomu vejce na <hniličku> s oblastní v korpusu doloženou variantou na <hniličko> a substantivum <hnilička> s významem ‚shnilý plod‘. Je třeba vytvořit seznamy slovních tvarů petrifikovaných v idiomech, jejich lemmat (lemmatem u nich nebude tvar nominativu, ale tvar, který se vyskytuje v idiomu) a jejich slovnědruhového značkování. Viz více v kapitole Lemmatizace # 04, § 3.6 a v kapitole Substantiva # 08-01, § 8.2.6.

⁴² Bylo by vhodné, aby uživatel měl k dispozici seznam adverbií, která se prepozicionalizovala (například okolo, doprostředka…), neboť výsledek automatické analýzy bude v těchto případech záviset jak na pokrytí slovníku, tak na úspěšnosti desambiguace. Viz také kapitola Předložky # 08-07, § 3.4, # 08-07, § 4.1.

⁴³ Sufixem -mo se tvoří i číslovky adverbiálního charakteru (dvojmo, trojmo, čtvermo), které budou v novém pojetí značkovány jako [POS=C & SUB=n], viz níže a také kapitola Číslovky # 08-04, § 3.3.1.

⁴⁴ Pokrytí slovníku bude závislé na použitých datech. Varianty jsou mnohdy teritoriálně podmíněné. Uvedené varianty jsou vybrány z korpusů řady SYN. Bude jich patrně více.

⁴⁵ Tvar jednoduše bude mít [POS=D & SUB=C]. Viz též níže a kapitola Číslovky # 08-04, § 3.3.3.

⁴⁶V tomto směru bude třeba upravit morfologický slovník a přeznačkovat/doplnit relevantní lemmata. Například tvary dvojmo, trojmo jsou dosud značkovány tag=Db.*, tvary dvojitě, trojitě jsou dosud značkovány tag=Dg.*, kdežto tvar čtvermo není rozpoznán automatickou analýzou a má značku tag=X.*.

⁴⁷ Pro dodržení této tradice hovoří to, že je to tradice běžná ve výkladových slovnících. Následující návrh ji ctí všude tam, kde technicky nevzniká výrazný problém spojený s tím, že existuje více tvarů pozitivu, k nimž lze vztahovat jeden tvar komparativu/superlativu. Nicméně situace se komplikuje při zpracování starších a archaizujících textů. Není tudíž zcela nepatřičné uvažovat i o změně přístupu k lemmatizaci, a to v tom smyslu, že tvary komparativu a superlativu spolu s tvary sebe.*[eě] budou spadat pod lemma, jímž bude tvar komparativu, a to vždy, kdežto tvary pozitivu budou lemmatizovány samostatně a nebudou jimi lemmatizovány tvary komparativu/superlativu spolu s tvary sebe.*[eě] nikdy.

⁴⁸ V tomto směru není třeba slovník zbytečně přegenerovávat. Nicméně okrajově se doklady ve webových korpusech najdou: To kdyby pan Jan Kalvoda popsal – namísto posuzování dalších kulturních zápůjček – vznik celé situace v devadesátých letech, kdy byl státem dobře živen – a její následky, jež jej dnes živí ještě „<dobřeji>“...,… byla jsem tu jen já a alkohol a různý pomůcky aby mi bylo líp ikdyž mi to spíš dělalo ještě <zleji>...,… Zamračila jsem se na něj, co <nejzleji> jsem dokázala.

⁴⁹… kdekoli jilm svou korunu klene, odstřepky světla a lanoví stínů v dlouhých šlezích se splétají a spichují <úž>...

⁵⁰ Patrně pro úplnost by tuto mutaci měl mít i tvar (patrně monokolokabilní v kontextu jen houšť) houšť ve významu hustěji. Bohužel zkrácené tvary bývají homonymní se substantivy (femininy kolísajícími mezi vzory píseň a kost (například a teď už je tu zas býlí a v něm mladé stromečky a hlavně <houšť>, v níž nic nepoznáš…). Navíc například Houšť je i maskulinum – příjmení.

⁵¹ Ve většině případů dvojic/trojic adverbií od jednoho základu interpretovaných jako paradigmaticky odvozená z adjektiv charakteristikami [eě] nebo y na straně jedné a formanty vydělitelnými jakožto bývalé koncovky ustrnulých jmenných adjektivních tvarů na straně druhé (aderbia na o, a, u…) bychom v případě potřeby použili patrně (alespoň v dnešní češtině) opisného stupňování: jeď rychle/rychleji/nejrycheji × přijel jsem (více / co nejvíce) na rychlo. Podobně tam, kde tvar na e není k dispozici (u ustrnulých tvarů substantiv), bychom užili opisné stupňování: ten kufr je více navrchu, dej ten kufr víc navrch. Takové pravidlo neplatí ovšem univerzálně. Tak například adverbia smutno a smutně budou lemmatizována jako dvě různá lemmata a tvary (nej)smutněji budou vztaženy pouze k lemmatu smutně, přestože jde o zjednodušení, neboť tvaru… je jim <smutno/(nej)smutněji>… odpovídá stejný tvar komparativu/superlativu jako tvaru… vypadá <smutně/(nej)smutněji>…. Situace je navíc proměnlivá v diachronní perspektivě. Tak například adverbia lítě a líto, která spolu etymologicky souvisejí, jsou v dnešní češtině výrazně významově diferencována a patrně pro dnešního uživatele je komparativ lítěji vztáhnutelný pouze k pozitivu lítě ve významu ‚vztekle, zuřivě‘. Ve starší češtině se ovšem setkáme s tvary komparativu, které ukazují na společný původ, a tedy i význam:… Elliot newstal s postele po tři měsíce, ku konci kteréhož času wzkázal mu pán jeho welmi zdwořile, že mu jest lítonehody, která ho potkala, ale mnohem <lítěji> ještě, že přinucen byl místo jeho w swé počtárně obsaditi, jelikož tak dlouho nepřišel a snad ještě mnohem déle nemoc ho pozdrží.….

⁵² Homonymní s 1.sg. ind. préz. akt. lemmatu dolít.

⁵³ V morfologickém slovníku pražského analyzátoru je lemma dole jednak chápáno jako stupňovatelné s rozgenerovanými tvary (nej)doleji, jednak jako nestupňovatelné. Nepokládáme za nutné toto rozlišení podržet. Význam adverbia dole stejně jako příslovečné spřežky nahoře lze chápat jako slovní označení bodů na vertikální ose. Pokud budeme myslet střed takové vertikální osy, pak výrazy dole/nahoře budou svým lexikálním významem referovat k hodnotě stupně vzhledem k tomuto středu. Nicméně sám výraz dole lze chápat jako pojmenování bodu na vertikální ose, po níž lze dále klesat a body ležící níže označovat výrazy doleji/nejdoleji.

⁵⁴ Tedy tvary dále, nejdále nebudou lemmatizovány lemmatem daleko, vysvětlení viz níže.

⁵⁵ Jde o měrová adverbia, z nichž mnoho bude navíc značkováno (a desambiguováno) i jako POS=C (viz kapitola Číslovky # 08-04, § 3.1.2) a málo bude navíc značkováno (a desambiguováno) i jako POS=N (viz kapitola Číslovky # 08-04, § 3.1.3). K lemmatizaci tvarů více, nejvíce a méně, nejméně viz níže a také kapitola Číslovky # 08-04, § 3.1.3.

⁵⁶ Za jediný doklad pokládáme adverbium zadněji s archaickou variantou záze. Lemmatizace tvarem komparativu odpovídá stavu, kdy k tomuto komparativu lze vztáhnout více adverbií v pozitivu (zcela okrajově se vyskytující pozitiv zadně: Může být integrován buď čelně, nebo jako <zadně> nesený, ale i adverbia vzadu a dozadu většinou stupňovaná opisně:… jenže ještě více <vzadu>, kde bydlí zavazadla, má znovu navrch peugeot…., řidičům, kteří mají sedadlo posunuté více <dozadu>...).

⁵⁷ <Nejzáze> stíní šero hor, tam bříza k boru, k bříze bor...

⁵⁸… Stáj a ovčín v jednom pořadí Pod kolnou pak orní nářadí Stodůlka šest kroků <záze> Vůkol plot a kousek hráze… Nakolik zatěžovat morfologický slovník interpretacemi okrajových jevů, je na zvážení.

⁵⁹ Oba tvary lze užít jak jako kvantifikátory, tak jako měrová adverbia. Budou interpretovány výhradně jako adverbia (POS=D), viz kapitola Číslovky # 08-04, § 3.1.3. Substituční testy ukazují, že je nelze vztáhnout k jedinému tvaru, který by bylo možno vyložit jako pozitiv. Kandidáty jsou tvary jako mnoho, moc, hodně, ale patrně i další, jako například teritoriálně podmíněné tuze, ale v některých kontextech i velmi.

⁶⁰ Oba tvary lze užít jak jako kvantifikátory, tak jako měrová adverbia. Budou interpretovány výhradně jako adverbia (POS=D), viz kapitola Číslovky # 08-04, § 3.1.3. Substituční testy ukazují, že je nelze vztáhnout k jedinému tvaru, který by bylo možno vyložit jako pozitiv. Kandidáty jsou tvary jako málo, ale i trochu, krapet….

⁶¹ Oporou pro utvářenost adverbia dřív(e) (etymolog. ze sln. drévi = dnes večer) je existující archaické adjektivum dřevní i deadverbiální adjektivum dřívější. Po formální stránce není bez zajímavosti, že koncové e, ať už je diachronně interpretujeme jakkoli, je synchronně jiným e než e, jímž se paradigmaticky tvoří adverbia z adjektiv, neboť toto e pravidelně způsobuje jotaci při derivaci od kmene s kmenovou finálou labiálou [bpfvm]. Naopak e, jímž se tvoří komparativ od supletivního kmene jotaci labiál nepůsobí (viz lépe, tak jako dříve, prve, ale blbě, tupě, strmě, fialově a dokonce sic! lepě).

⁶² Adverbium spíš(e) má etymologicky fundačně motivační vztah k dějovému jménu spěch od slovesa spět, původně mělo význam rychle, spěšně, později začalo být chápáno jako II. stupeň (viz Rejzek 2001).

⁶³ Adverbium daleko lze sice jakožto pozitiv vztáhnout k II./III. stupni dále/nejdále, pozorujeme-li ovšem užití adverbia dál(e), vidíme, že vztažení k pozitivu daleko působí poněkud násilně, neboť referenčním bodem nemusí nutně být bod, který je daleko, ale může to být i bod, který je buď blízko, nebo uvnitř, nebo může být konstruován kdekoliv.

⁶⁴ Škrt plch z mlh Brd pln skvrn z mrv <prv> hrd scvrnkl z brzd skrz trs chrp v krs vrb mls mrch srn čtvrt hrst zrn.

⁶⁵Adverbia prve, teprve (z adv. pierw) souvisí synchronně s řadovou číslovkou prvý (etymolog. je psl. prьvъ od původu adjektivum s významem přední/první). Srov. též kapitolu Číslovky # 08-04, § 3.2.1. Význam druhého stupně je opět odvozen od významového vztahu k bodu „před tím“ na časové ose.

⁶⁶ Tvar prvně se užívá ve dvou různých významech. Jednak synonymním s poprvé: Jsem tu <prvně>, ale určitě přijedu i podruhé..., jednak synonymním s prve=dříve: <Prvně> se jmenovaly Ferdinandovy kasárny. Pak byly zestátněny a přejmenovány na Mariánské. Desambiguace obou významů přesahuje rámec automatické morfologické analýzy. Z toho důvodu bude tvar prvně interpretován výhradně jako POS=D SUB=C DEI=- DEG=1, odlišně od spřežky poprvé (POS=C SUB=r DEI=U). Spřežka poprvně bude opět POS=D.

⁶⁷ Tvar prvněji je doložen na internetu, ale i ve webovém korpusu czTenTen. Častá jsou užití synonymní k adverbiu dříve: Předmětem <prvněji> řečené jest poznání povahy a úkazů na rostlině pozorovatelných bez ohledu na jednotlivé formy rostlinné (specie), druhá pak má za předmět poznání jednotlivých forem a veškerého rostlinstva v jeho souvislosti..Diskutující přilétne a čím víc se projevuje, tím <prvněji> je lapen.. Výrobci se začínají předhánět kdo dříve a <prvněji> dodá modemy podporující nový rychlejší standard. V některých případech jde ovšem o metajazykové užití uměle utvořeného komparativu k adverbiální číslovce prvně: Jaké číslovky mají češtináři nejradši? První a třetí, protože nejde říct <prvněj>, třetěj...

⁶⁸ Pivo se na Žatecku a Lounsku pilo v Čechách <nejprvněji> - to je skalní přesvědčení všech zdejších rodáků a Zdeněk Hanzlík k nim patří.

⁶⁹ Toto technické řešení bylo použito v morfologickém slovníku pražského analyzátoru (Hajič a kol.). Jde o pouhé zjednodušující technické řešení, které je třeba uvést na pravou míru. V tištěných českých slovnících žádná taková zjednodušení nefigurují.

⁷⁰ K vymezovacímu zájmenu sám/samý nebude odpovídající vymezovací adverbium. V konstrukcích typu jde to samo bude tvar samo interpretován jako POS=P, viz také kapitola Zájmena # 08-03, § 3.4.1.

⁷¹ Spřežky zcela, docela nebudou mít SUB=P. Viz kapitola Zájmena # 08-03, § 3.4.1, poznámka k zájmenu všechen.

⁷² Zájmenná neurčitá adverbia tvořená postfixem -s (kdes, kams, kdys,...) jsou homonymní s agregáty vzniklými grafickým spojením zájmenných adverbií s volným morfem s nahrazujícím tvar auxiliáru/ spony slovesa být (kde+s, kam+s, kdy+s,…:… Když padnu, můžeš vzpomínat: <kdes> v dálné zemi leží cizí lán, ten patří Anglii ×… Prosím tě, lásko, <kdes> byla...). Je třeba zajistit doplnění všech interpretací do slovníku morfologického analyzátoru (viz také kapitola Agregáty # 08-15, § 3.2.6 a # 08-15, § 4) a jejich desambiguaci.

⁷³ Tyto tvary lze interpretovat buď jako neurčitá zájmenná adverbia, nebo jako tázací adverbia s volným morfémem -s. Druhá interpretace je důležitá (mělo by být zakódováno, že jde o agregát s významem 2. osoby pomocného/ sponového slovesa být), což nelze ze značky v současné podobě vyčíst.

⁷⁴ <Kdež> to stojí psáno?

⁷⁵ Doklad je z Diakorp v6, ovšem ze druhé pol. XIX. stol. Sabina, Karel: Duchovný komunismus (1861): <Kamž> národ takový dojíti může bez jarého zanícení srdce, bez vzletu duchovního, beze vší svěžesti mysli?

⁷⁶ V kapitole Zájmena # 08-03, § 3 (poznámka v úvodu) a # 08-03, § 3.2.4 je podrobněji popsáno zdůvodnění nezavedení homonymních tázacích a vztažných zájmen do slovníku. Stejné principy platí i pro zájmenná adverbia.

⁷⁷ Stejnou funkci spojovacích vztažných výrazů ovšem mohou plnit i agregáty se zájmennou složkou (nač, zač, več, oč, cos, očs,…, tedy POS=(R&P|P&V|R&P&V) AGR=[cPG]). Ty by pak měly mít DEI=T, a to jak v případech jako <Nač> se ptáš? / <Cos> říkal? / <Načs> narážel?, tak v případech jako To, <nač> nikdo z nás nebyl připraven, byla moje reakce. / Ta z fotky, <cos> našla u Kitty v ložnici. / Kadára sháním, abych mu od Tebe vyřídil, <očs> mě žádal..... Viz kapitoly Agregáty # 08-15, § 3.1 a Zájmena # 08-03, § 3.2.4.

⁷⁸ Prostřednictvím NOM=J budou spřežkové tvary na o, u, a korespondovat s tvary, u kterých navrhujeme POS=D, tedy s takovými případy, kdy příslovečná spřežka buď dosud nevznikla, nebo je variantou k dvojslovnému výrazu (tvar na o, a, u… následuje bezprostředně po předložce: namodro × na modro). Jde vlastně o vyřešení značkování jednoho typu MWE. Řada těchto tvarů není rozpoznána automatickou morfologickou analýzou. Podklady pro slovník jsou zpracovány v disertaci H. Žižkové (2019).

⁷⁹ Do této skupiny řadíme i adverbia jako naspod, naspodu, vpřed, vpředu, dopředu, napřed, odpředu, vzad, vzadu, dozadu, nazad, odzadu, o kterých nelze s určitostí tvrdit, že jsou fundována substantivy. Etymologicky je společný kořen *dheh odvozovaný od slovesa.

⁸⁰ Lze zvážit zařazení k adverbiím s vícenásobným lemmatem {nahoru, nahorů} (tvar nahorů je doložen ve webových korpusech: Pořád <nahorů> dolů...). Je také možné využít koncept globální mutace (GMU).

⁸¹ Některá adverbia mají vícenásobné lemma, například {dospod, dospodu, dospoda}, {odspod, odspodu, odspoda}, {zespod, zespodu, zespoda}, viz níže.

[82] Lze zvážit zařazení k adverbiím s vícenásobným lemmatem {dole, důle}. V korpusech se teritoriálně omezená varianta důle vyskytuje sporadicky, frekventovanější je výskyt nesklonného propria Důle, které je značkováno jako substantivum femininum, přestože jde o maskulinum.

⁸³ V případě frazému křížem krážem jsou obě složky interpretovány jako tag=Db.* a stejnou značku má i grafická podoba křížemkrážem, v případě frazému zuby nehty mají obě složky interpretaci tag=N.* a grafická podoba zubynehty není automatickou morfologickou analýzou rozpoznána a má značku tag=X.*. Viz práce frazeologického modulu. Je třeba zavést pravidla.

⁸⁴ SUB=C nebudou mít adverbia paradigmaticky tvořená z adjektiv pravidelně tvořených z denumerálních sloves, tedy například zdvojnásobující → zdvojnásobujícně, zdvojnásobovaný → zdvojnásobovaně.

⁸⁵ Jako [POS=D & SUB=C] nebudou označkovány ustrnulé tvary substantivního původu označující množství jako trochu, trošku, kapku, trošinku, kapičku, trošičku,… Některé z nich jsou označkovány v současnosti jak jako adverbia (tag=Db.*), tak jako substantiva (tag=N.*). Podobné (např. spousta, spoustu) pouze jako substantiva. Desambiguace není zcela v pořádku. Návrh NovaMorf směřuje ke zjednodušení desambiguace, pro kterou neexistuje shoda, a k tomu, aby značkování slov různých slovních druhů, která plní funkci kvantifikátorů, nezatěžovalo automatickou morfologickou analýzu problémy, které na rovinu morfologie striktně vzato nepatří. Tato slova budou většinou substantiva (POS=N, například: moře, hromada, kupa, spousta…), nebo budou desambiguována (POS=D, například: trocha, troška…, tedy ta substantiva s funkcí kvantifikátorů, jejichž ustrnulé tvary rozvíjejí sloveso: dej mi <trochu/N> vody a já ti <trochu/D> pomůžu).

Na tato slova by měl být uživatel upozorněn a měl by být zveřejněn jejich seznam. Jedná se patrně o otevřenou množinu a slovník automatického analyzátoru zaznamená pouze výběr případů substantiv, která fungují jako kvantifikátory u jmen, ale ustrnulý tvar jména plní funkci měrového adverbiálního doplnění sloves, v důsledku čehož se nabízí jejich adverbiální slovnědruhová interpretace (POS=D). Domníváme se, že by bylo vhodné u nich desambiguovat POS=D, a to i tehdy, kdy se tvary rozvíjející substantivum deflektivizují (Některé úseky potoků v létě vysychají a tam, kde alespoň trochu vody zůstane, není dostatek kyslíku, takže ryby zpravidla uhynou. Krásné vlasy nejsou samozřejmostí a bez trochu námahy a pravidelné péče to prostě nepůjde…), takže fungují spíše jako adverbia. V kapitole Číslovky # 08-04, § 3.1.3 se hovoří o důvodech řazení slova málo k substantivům i adverbiím se SUB=C. Ostatním případům (substantivům ve funkcích kvantifikátorů) není věnována pozornost. Proto na ně upozorňujeme zde. Více pozornosti jim je věnováno v kapitole věnované substantivům # 08-01, § 2.3.

⁸⁶ Výraz mnoho bude slovnědruhově homonymní, takže se bude desambiguovat [POS=C & SUB=z] a [POS=D & SUB=C]. Viz kapitola Číslovky # 08-04, § 3.1.2 a # 08-04, § 3.1.3.

⁸⁷ Výraz málo bude slovnědruhově homonymní, takže se bude desambiguovat [POS=N & SUB=C] a [POS=D & SUB=C]. Viz kapitola Číslovky # 08-04, § 3.1.3.

⁸⁸ Podrobnější informace viz též kapitola věnovaná číslovkám # 08-04.

⁸⁹ SUB=[VG] „přebíjí“ SUB=C, takže adverbia tvořená pravidelně z adjektiv derivovaných ze sloves s číslovkovými kořeny (zdvojit → zdvojený → zdvojeně, zdvojit → zdvojující → zdvojujícně – tvar je doložen na internetu: A večerní / pro dospělé mi zní trochu <zdvojujícně>…) budou mít SUB=[VG], viz výše.

⁹⁰ V ní především poznámky k rozgenerouvání adverbií na .*oucně/.*ícně od adjektiv na .*oucí a .*ící.

⁹¹ Ke tvarům superlativu bude pravidelně doplněn tvar tvořený od komparativu prefixoidem sebe- a bude mu přiřazena interpretace DEG=s (viz kapitola Morfologické kategorie a jejich hodnoty # 05, § 10).

⁹² Za explicitně nestupňovatelná byla v pražském slovníku pokládána adverbia s tagem Db.*. Tuto praxi navrhujeme zrušit. Navržené řešení odpovídá praxi brněnského slovníku.

⁹³ Pokud se od zájmenného základu tvoří tvary komparativu/superlativu, pak je interpretujeme jako adjektiva/nezájmenná adverbia (např. jiný/P → jinačí/jinaký/(nej)jinačejší/A, jinak/jináč/DP → (nej)jinačeji/D0).

⁹⁴ Seznam má být k dispozici uživatelům, aby bylo patrné, že jde o napadnutelné rozhodnutí autorů slovníku. Hranice mezi slovy utvořenými negujícím prefixem, u nichž běžný uživatel jazyka identifikuje a) negující prefix a b) negující význam a negativa tantum, u nichž neplatí a), b), nebo a)+b), není ostrá. Předběžně navrhujeme zařazení těchto adverbií: nerudně, neřestně, neduživě, nestvůrně, nezbedně, nehorázně, nedělně, nemocně, nenasytně. Naopak u adverbií s převahou tvarů s ne- a byť jen (o)krajově doloženými tvary bez ne- bychom byli opatrní (kale/nekale, stoudně/nestoudně, odolatelně/neodolatelně,...) a do seznamu negativ tantum bychom je nezařadili. Rovněž bychom do tohoto seznamu nezařadili případy, kdy dvojice s/bez ne- od jednoho základu nejsou sice striktně vzato opozity (přátelsky/nepřátelsky je protiklad jiného typu než třeba dobře/nedobře), nicméně prefix ne- lze intuitivně vydělit a přiřknout mu nějaký negující význam. Domníváme se, že lemma s prefixem ne- odstraní z uživatelského pohledu sporná dosavadní řešení. Naopak rozdíl NEG=A a NEG=N bude nadále signalizovat utvářenost slova negujícím prefixem, která je patrná v nejrůznějších případech negativně pojatých významových modifikací.

Page updated

Google Sites

Report abuse

08-06 Adverbia

1 Úvodní přehled

1.1 Představení kapitoly

1.2 Kategorie a hodnoty relevantní pro adverbia

1.2.1 Poznámky k jednotlivým kategoriím

1.2.2 Poddruh adverbií (SUB)

1.2.3 Zájmenná příslovce (SUB=P) rozlišená podle deixe (DEI)

1.2.4 Značkování dalších adverbií pomocí kategorií SUB, DEI a NOM

2 Členění adverbií v dosavadních gramatikách a slovnících automatických morfologických analyzátorů

2.1 Adverbia v gramatikách

2.2 Adverbia ve slovnících automatických morfologických analyzátorů

3 Lemmatizace adverbií

3.1 Lemmatizace adverbií z adjektivních (nejednoznačných) základů

3.1.1 Typy, v nichž tvar na [eě] není v úzu frekventovaný, nebo není k dispozici a další méně frekventované typy

3.1.2 Typy [eě], o, u, a

3.1.3 Typ [yu]

3.1.4 Poznámka k určení kategorie pádu u předložek před lemmaty s POS=D

3.2 Lemmatizace adverbií ze substantiv a sloves[38]

3.3 Lemmatizace zájmenných příslovcí

3.4 Lemmatizace číslovek s adverbiální formou i funkcí

3.5 Lemmatizace s ohledem na stupňování (DEG) a GMU

3.5.1 Lemmatizace tvarem pozitivu

3.5.2 Lemmatizace tvarem komparativu

3.5.3 Zvláštní případy

4 Značkování adverbií podle kombinací kategorií SUB, DEI a NOM

4.1 Zájmenná příslovce

4.1.1 Určitá adverbia vymezovací a totalizátory místa, času, způsobu[70]

4.1.2 Neurčitá adverbia místa, času, způsobu

4.1.3 Záporná adverbia místa, času, způsobu

4.1.4 Tázací adverbia místa, času, způsobu

4.1.5 Vztažná adverbia (nevyužitá kategorie)

4.1.6 Ukazovací adverbia místa, času, způsobu

4.1.7 Adverbiální spřežky se zájmenným základem ve frazémech

4.2 Adverbiální spřežky

4.2.1 Adverbia tvořená ustrnutím předložkových pádů adjektiv

4.2.2 Adverbia tvořená ustrnutím předložkových pádů substantiv, popřípadě ta, která nelze vztáhnout k slovnědruhově jednoznačnému základu[79]

4.2.3 Adverbiální spřežky s vícenásobným lemmatem

4.3 Další ustrnulá adverbia a adverbia tvořená sufixací ze substantiv a sloves

4.4 Deriváty a kompozita korespondující s deriváty a kompozity podobného charakteru, které mají POS=C

4.5 Adverbia derivovaná pravidelně z adjektiv, která budou mít SUB=[VG]

4.6 Ostatní adverbia

4.6.1 Všechna ostatní adverbia paradigmaticky tvořená od adjektiv slovnědruhovou charakteristikou e/ě (adverbia, která mají lemma=.*[eě]) a některá na o

4.6.2 Adverbia, která mají [lemma=.*y]

4.6.3 Adverbia, která mají [lemma=.*[oau]] a nejsou spřežky

4.6.4 Ostatní adverbia s vícenásobným lemmatem

5 Značkování dalších kategorií adverbií – kategorie pádu, stupně a negace

5.1 Hodnoty kategorie pádu (CAS)

5.2 Hodnoty kategorie stupně (DEG)

5.3 Hodnoty kategorie negace (NEG)

Literatura

3.2 Lemmatizace adverbií ze substantiv a sloves^[38]

4.1.1 Určitá adverbia vymezovací a totalizátory místa, času, způsobu^[70]

4.2.2 Adverbia tvořená ustrnutím předložkových pádů substantiv, popřípadě ta, která nelze vztáhnout k slovnědruhově jednoznačnému základu^[79]

4.6.1 Všechna ostatní adverbia paradigmaticky tvořená od adjektiv slovnědruhovou charakteristikou e/ě **(adverbia, která mají lemma=.*[eě]) a některá na** o

**4.6.2 Adverbia, která mají [lemma=.*y]**

**4.6.3 Adverbia, která mají [lemma=.*[oau]] a nejsou spřežky**