08-02 Adjektiva

1 Úvodní přehled

1.1 Představení kapitoly

Slovní druh adjektivum je v české mluvnické tradici vymezen z hlediska morfologického jako ohebný slovní druh se třemi typy flexe (převládající adjektivní neboli složenou, jmennou, která je dochována v neúplných paradigmatech a je funkčně omezena, a tzv. smíšenou, která je omezena na slovotvorné typy desubstantiv na -ův a -in). Z hlediska syntaktického plní adjektivum primárně funkci shodného přívlastku substantiva, sekundárně stojí ve jmenné části přísudku a v doplňku. Ze syntaktického hlediska je přinejmenším diskutabilní zařazení od původu jmenných tvarů adjektiv v adverbiálních funkcích (ustrnulé prosté a předložkové pády jmenných tvarů adjektiv, které jsou mnohdy ortografickými variantami příslovečných spřežek). Z hlediska sémantického adjektivum pojmenovává vlastnost, přičemž tradičně se rozlišují adjektiva kvalifikační (vlastnost je pojata buď objektivně, nebo subjektivně, takže v sémantické struktuře je přítomen rys hodnocení) a relační (vlastnost je chápaná jako různě pojatý vztah k substanci, ději, okolnosti, popř. vlastnosti).

Primární je při řazení adjektiv v běžné školské praxi kritérium flexe, kritérium syntaktické se uplatňuje zejména při vymezení jmenných tvarů adjektiv a při definování slovnědruhových transpozic/přechodů (nejčastěji substantivizace, adverbializace). Sémantické kritérium se uplatňuje při vydělení adjektivně skloňovaných číslovek a zájmen (adjektiválií). Sémantika adjektiva má vliv na možnost pravidelného odvozování tvarů deadjektivních adjektiv, které se v některých pojetích chápe jako součást adjektivní flexe (stupňování).

V následujícím textu se budeme zabývat vymezením adjektiv z hlediska automatické morfologické analýzy v novém pojetí značkování. Nové pojetí morfologického značkování navazuje na více než čtvrt století dlouhou tradici. Snahou je udržet kontinuitu tam, kde se buď osvědčila, nebo dosud nejsou dostatečné důvody ke změně, doplnit (na rovině morfologického slovníku) a zkonzistentnit stávající popis, a dále zavést některé jeho změny.

Kategorie a hodnoty adjektiv jsou představeny v § 1.2. V § 1.2.1 uvádíme poznámky k některým z relevantních kategorií, další pododdíly jsou věnovány hodnotám kategorie SUB (§ 1.2.2) a dále skupinám adjektiv vymezeným kombinací kategorií SUB, VRB a NOM (§ 1.2.3).

V § 2 se budeme zabývat určením kategorie slovní druh ve vztahu k typu flexe adjektiv a k lemmatizaci (§ 2.1). V rámci pojednání o lemmatizaci probereme vztah mezi lemmatizací a kategorií stupeň (DEG) (§ 2.2).

V následujícím § 3 podrobně probereme (včetně rozboru problematických případů) jednotlivé skupiny adjektiv a jejich značkování podle kategorií poddruh (SUB), slovesný tvar (VRB) a jmenný tvar přídavných jmen (NOM).

V § 4 se budeme krátce věnovat dvěma kategoriím a jejich hodnotám: stupni (DEG) v § 4.1 a negaci (NEG) v § 4.2.

V závěrečných třech částech (umístěných ve zvláštních souborech) jsou představeny Podklady pro úpravy slovníku automatického morfologického analyzátoru: v § 5 pro přivlastňovací adjektiva se zakončením -ův, -in, v § 6 pro adjektiva se zakončením -, -ší tvořená od sloves, v § 7 pro pasivní (n-ová/t-ová) příčestí a jmenné tvary adjektiv tvořené od sloves (s poznámkou o adjektivech od sloves se zakončením -telný).


1.2 Kategorie a hodnoty relevantní pro adjektiva

Pro adjektiva (POS=A) jsou v pojetí NovaMorf relevantní tyto kategorie: poddruh (SUB), vid (ASP), zkratka (ABR), jmenný rod (GEN), číslo (NUM), pád (CAS), stupeň (DEG), negace (NEG), slovesný tvar (VRB), jmenný tvar adjektiv (NOM), typ agregátu (AGR), globální mutace (GMU) a flektivní mutace (FMU), viz Tabulka 1.

Tabulka 1. Seznam relevantních kategorií adjektiv a jejich hodnot

#

kategorie

značka kategorie

hodnoty

1

slovní druh

POS

A

2

poddruh

SUB

[UGMVC0]

4

vid

ASP

[DNO-]

5

zkratka

ABR

[+-]

6

jmenný rod

GEN

[MIFN-]

7

číslo

NUM

[SP-]

8

pád

CAS

[1234567-]

10

stupeň

DEG

[123s-]

11

negace

NEG

[NA-]

12

slovesný tvar

VRB

[T-]

13

jmenný tvar adjektiv

NOM

[J-]

14

typ agregátu

AGR

[A-]

15

globální mutace

GMU


16

flektivní mutace

FMU


1.2.1 Poznámky k jednotlivým kategoriím

a. Kategorie POS

POS je kategorie slovní druh. [POS=A] budou mít:

a) tvary slov s adjektivní flexí tzv. složenou (školské vzory mladý a jarní) s výjimkou adjektivně skloňovaných substantiv1 (hajný, krejčí, vrátná, hovězí, šampaňské, vlakvedoucí, spropitné...), dále adjektivně skloňovaných příjmení (Hladký, Černý, Nový, Stará, Suchá,… a všech feminin na .*ová), adjektivně skloňovaných číslovek2 (první, druhý, třetí, dvojnásobný,…) a adjektivně skloňovaných zájmen3 (jaký, který, čí…);

b) tvary slov s adjektivní flexí smíšenou (školské vzory otcův a matčin);

c) jmenné tvary adjektiv (rád, jist, živ, mrtev…), a to tehdy a jen tehdy, pokud existují tvary, kterými se vyjadřuje shoda v rodě a čísle mezi příslušným tvarem a podmětem věty; jinak by měly být značeny tvary na o, ale i na u, nebo na a,4 které plní adverbiální funkce;

d) v řadě kontextů synonymní krátké i dlouhé tvary pasivních příčestí pravidelně tvořené tvarovými sufixy -n/-t od kmene minulého sloves5 (upečen/upečený, zakryt/zakrytý);

e) nesklonná adjektiva (lila, khaki, bordó).

b. Kategorie SUB, VRB a NOM

Kategorie poddruh je představena v § 1.2.2 (hodnoty kategorie SUB). Kategorie VRB a NOM mohou každá nabývat jedné hodnoty (pro VRB: pasivní příčestí [VRB=T], pro NOM: jmenný tvar [NOM=J]). Kombinacemi hodnot kategorií SUB, VRB a NOM jsou vymezeny jednotlivé skupiny adjektiv (§ 1.2.3).

c. Kategorie ASP

Adjektiva pravidelně tvořená od sloves s oporou v tvaru příslušného přechodníku, tedy ta, která budou mít [SUB=[GM]], budou dědit hodnotu kategorie ASP od základového slovesa. Pomocí této hodnoty bude možné snadno vyhledat nestandardně tvořená adjektiva (například vzplanoucí místo regulérního vzplanuvší, viz níže § 3.2, § 3.3).

d. Kategorie GMU, FMU

Kategorie globální mutace (GMU) si všimneme v souvislosti s lemmatizací. Kategorii flektivní mutace (FMU) se budeme věnovat v souvislosti s variantními tvary složené flexe ke jmenným tvarům u adjektiv na ův/in, dále v souvislosti s variantními tvary prvního, druhého a třetího stupně v případě, kdy jsou varianty vázány na konkrétní lemmata definovatelná pouze výčtem. Na této úrovni nebudeme řešit mutace, které se váží na obecněji definovaný hláskový/grafický kontext (například protetické v u lemmat začínajících na o: ostrý/vostrý, nebo to, zda jako mutaci na rovině slovníku zaznamenávat varianty dobrý, starý, chrabrý, kluk × dobrej, starej, chrabrej, kluk nebo dobří, staří, chrabří, kluci × dobrý, starý, chrabrý, kluci)6. Jedná se o úroveň, která je popsána na obecné rovině v kapitole Morfologické kategorie a jejich hodnoty # 05, § 15.


1.2.2 Poddruh adjektiv (SUB)

Značkují se tyto poddruhy adjektiv, viz Tabulka 2.

Tabulka 2. Poddruh adjektiv (SUB)

SUB

vysvětlení

příklady

viz

U

přivlastňovací

matčin, otcův...

§ 3.1

G

adjektiva od přechodníku přítomného

mající, sedící, beroucí...

§ 3.2

M

adjektiva od přechodníku minulého

ušedší, usedší, nakoupivší...

§ 3.3

V

jiná deverbativní adjektiva

namazaný, nakousnutý, namazán, nakousnut, rozpoznatelný...

§ 3.4

C

číslovková adjektiva slova vyjadřující souvislost s číslovkami

dvojkový, čtyřčetný

§ 3.5

0

ostatní adjektiva

jarní, starý,...

§ 3.6

1.2.3 Značkování adjektiv pomocí kategorií SUB, VRB a NOM

Kombinací kategorií SUB, VRB a NOM jsou vymezeny následující skupiny adjektiv. Jejich seznamy jsou probrány v jednotlivých pododdílech, viz Tabulka 3.

Tabulka 3. Značkování skupin adjektiv pomocí kategorií SUB, VRB a NOM

SUB

VRB

NOM

kategorie adjektiv

příklady

viz

U

-

[J-]

adjektiva derivovaná od substantiv sufixy -ův, -in

králův, Fordův, matčin

§ 3.1

G

-

-

adjektiva procesuální tvořená paradigmaticky od kmene přítomného sufixem -((ou)|(í))c-í

nesoucí, brousící

§ 3.2

M

-

-

adjektiva tvořená paradigmaticky od kmene minulého sufixem -š-í/-(v)-š-í

přišedší, byvší

§ 3.3

V

-

-

adjektiva na [aeě]ný/[áeěuiy]tý pravidelně tvořená z krátkých tvarů jmenných participiálních

ohraze, naladě, umy

§ 3.4.1

V

T

J

participiální tvary odpovídající adjektivům na [aeě]ný/[áeěuiy]tý

ohrazen, naladěn, umyt

§ 3.4.1

V

-

-

adjektiva na na .*telný

čitelný, odvoditelný, myslitelný

§ 3.4.2

V

-

J

případy, kdy je tvar používán v jiném rodě a čísle

čitelni, odvoditelny, myslitelna

§ 3.4.2

C

-

-

slova z číslovkových kořenů s výjimkou adjektivně skloňovaných číslovek řadových

dvojkový, dvojitý, dvojsečný,

§ 3.5

0

-

[-J]

ostatní adjektiva, včetně jmenných tvarů

mladý, myší, stropní

§ 3.6


2 Lemmatizace adjektiv

2.1 Lemmatizace a dvojice lišící se typem adjektivní flexe

Lemmatizaci adjektiv probereme s ohledem na jednotlivé typy adjektivní flexe představené v § 1.2. Pro přehlednost je tu zopakujeme:

(a) tvary slov s adjektivní flexí tzv. složenou (školské vzory mladý a jarní) s výjimkou adjektivně skloňovaných substantiv7 (hajný, krejčí, vrátná, hovězí, šampaňské, vlakvedoucí, spropitné...), dále adjektivně skloňovaných příjmení (Hladký, Černý, Nový, Stará, Suchá… a všech feminin na .*ová), adjektivně skloňovaných číslovek8 (první, druhý, třetí, dvojnásobný…) a adjektivně skloňovaných zájmen9 (jaký, který, čí…);

(b) tvary slov s adjektivní flexí smíšenou (školské vzory otcův a matčin);

(c) jmenné tvary adjektiv (rád, jist, živ, mrtev,…), a to tehdy a jen tehdy, pokud existují tvary, kterými se vyjadřuje shoda v rodě a čísle mezi příslušným tvarem a podmětem věty; jinak by měly být značeny tvary na o, ale i na u, nebo na a10, které plní adverbiální funkce;

(d) v řadě kontextů synonymní krátké i dlouhé tvary pasivních příčestí pravidelně tvořené tvarovými sufixy -n/-t od kmene minulého sloves11 (upečen/upečený, zakryt/zakrytý);

(e) nesklonná adjektiva (lila, khaki, bordó).

Lemmatizace adjektiv nebude využívat vícenásobného lemmatu k zachycení toho, že tvar adjektiva v nominativu singuláru mužského rodu má dvě podoby: adjektivní (dlouhou12) a jmennou (krátkou).

Lemmatem tvarů typu a) a c) bude vždy dlouhý tvar maskulina13 /životného/ v singuláru, výjimku pžedstavují případy víceznačných lemmat (hodný1/*hoden114, hodný2/hoden215), u nichž navrhujeme vícenásobné lemma {hodný, hoden}16, a lemmata adjektiv, která mají pouze jmenný tvar nevztažitelný k žádnému dlouhému tvaru17 (seznam: rád, milerád, práv, jakživ)18.

Lemmatem tvarů typu b) bude vždy tvar krátký19 maskulina životného v singuláru ({otcův}, {matčin}).

Lemmatem tvarů typu d) bude vždy tvar dlouhý maskulina životného v singuláru ({pečený}).

Lemmatem tvarů typu e) bude vždy jediný tvar nesklonného adjektiva.

Vícenásobné lemma tedy NEBUDOU mít:

(i) synonymní dlouhé a krátké tvary adjektiv (mladý/mlád);

(ii) krátké a dlouhé tvary pasivních příčestí tvořených pravidelně tvarovými sufixy -n/-t od kmene minulého (upečený/upečen, zakrytý/zakryt);20

(iii) krátké a substandardní dlouhé tvary tvořené ze substantiv sufixy -ův/-in (otcův/otcovej, matčin/matčinej).

Vícenásobné lemma BUDOU mít nesynonymní etymologicky příbuzné tvary adjektivní a jmenné flexe adjektiv {hodný, hoden} a případy, kdy dlouhý tvar sice krátkému tvaru významově odpovídá, nicméně není jeho rovnocennou variantou ({radno, radný}, {vidno, vidný}, {hrd, hrdý}, {svato, svatý}, {zajímavo, zajímavý}, {vysvětlitelno, vysvětlitelný}, {žádoucno, žádoucný}, {spadeno, spadený}).21


2.2 Lemmatizace s ohledem na stupňování

V dosavadním pražském značkování (https://wiki.korpus.cz/doku.php/seznamy:tagy, Hajič 2004) byly až na některé výjimky lemmatizovány tvary druhého a třetího stupně tvarem prvního stupně. Tato praxe bude v některých případech pozměněna.22

Ke tvarům superlativu bude pravidelně doplněn tvar tvořený od komparativu prefixoidem sebe- a bude mu přiřazena interpretace [DEG=s] (viz kapitola Morfologické kategorie a jejich hodnoty # 05, § 10).


2.2.1 Lemmatizace tvarem pozitivu

Pod lemma (tvar nominativu singuláru maskulina v pozitivu) budou zahrnuty tvary prvního, druhého a třetího stupně tvořené pravidelně od jednoho (nový/novější/nejnovější/sebenovější, cizí/cizejší/nejcizejší/sebecizejší), byť i redukovaného (hluboký/hlubší/nejhlubší/sebehlubší, snadný/snadnější/snazší/nejsnadnější/nejsnazší/sebesnadnější/sebesnazší, dlouhý/delší/nejdelší/sebedelší) kmene, včetně substandardních pravidelně tvořených tvarů komparativu a superlativu u adjektiv, která mají standardní tvary komparativu a superlativu od supletivních kmenů (dobrý/dobřejší/nejdobřejší/sebedobřejší, zlý/zlejší/nejzlejší/sebezlejší23). Variantní komparativy a superlativy (například prostší/prostější, čistší/čistější, hrubší/hrubější, pustší/pustější, snazší/snadnější, zazší/zadnější, hezčí/hezčejší, hebčí/hebčejší, křehčí/křehčejší, křepký/křepčejší, lehčí/lehčejší, měkčí/měkčejší, mělký/mělčejší, tenčí/tenčejší, trpčí/trpčejší24, brzčí25/brzčejší26) budou značkovány pomocí kategorie flektivní mutace.27

Pod lemma (tvar nominativu singuláru maskulina v pozitivu) na .*cný budou zahrnuty tvary prvního stupně na .*cný a druhého a třetího stupně (včetně derivátů prefixoidem sebe-) na .*cnější bez ohledu na to, že tvar na .*cný je užíván jako synonymum dezaktualizovaného významu odpovídajícího adjektiva na .*cí (např. kající/kajícný, vroucí/vroucný...).28

Pod lemma (tvar nominativu singuláru maskulina v pozitivu) na .*cí budou zahrnuty pouze tvary prvního stupně bez ohledu na to, že tvar na .*cí lze vztáhnout ke komparativu/superlativu na .*cnější.29

2.2.2 Lemmatizace tvarem komparativu

Pod lemma (tvar nominativu singuláru maskulina v komparativu) budou zahrnuty tvary adjektiv druhého a třetího stupně i tvary tvořené prefixoidem sebe- tvořené nepravidelně od supletivního kmene (lepší/nejlepší/sebelepší, horší/nejhorší/sebehorší, větší/největší/sebevětší, menší/nejmenší/sebemenší). Variantní tvary (lepčí, lepčejší atd.) budou mít lemma lepší a budou popsány pomocí globální30 mutace.

Pod lemma (tvar nominativu singuláru maskulina v komparativu) budou zahrnuty tvary adjektiv druhého a třetího stupně (popřípadě tvary na sebe-), a sice adjektiva ze zájmenného základu (jinější/nejjinější, jinačejší/nejjinačejší, onačejší/nejonačejší), adjektiva z číslovkového základu (prvnější/nejprvnější)31, adjektiva z deadverbiálních základů s ambiguitní interpretací stupně (dolejší/nejdolejší, dřívější/nejdřívější32, hořejší/nejhořejší) a dezaktualizovaná adjektiva na .*cnější bez doložených odpovídajících dezaktualizovaných adjektiv na .*cný (alarmujícnější/nejalarmujícnější, vzrušujícnější/nejvzrušujícnější, zneklidňujícnější/nejzneklidňujícnější,...)33.

2.2.3 Zvláštní případy

Pod lemma (tvar nominativu singuláru maskulina v pozitivu) budou zahrnuty tvary adjektivizovaných zájmen, která jsou nejednoznačná, co se týče stupně (jinší, jinačí, onačí)34.

Pod lemma (tvar nominativu singuláru maskulina v pozitivu) budou zahrnuty tvary prvního stupně (rád, ráda,…). Neměnné tvary druhého a třetího stupně (včetně tvarů na sebe-) raději/nejraději/seberaději budou i nadále lemmatizovány samostatně jako adverbia [POS=D]. (Varianty radši, rači, nejradši, nejrači…, budou zahrnuty jako příslušné globální mutace).35

Pod lemma (tvar nominativu singuláru maskulina v pozitivu) budou zahrnuty pravidelně tvořené tvary pozitivu, komparativu a superlativu adjektivizovaných adverbií dolní/dolnější/nejdolnější a horní/hornější/nejhornější36.

Pod lemma (tvar nominativu singuláru maskulina v komparativu: dřívější, dolejší, hořejší) budou zahrnuty pravidelně tvořené tvary interpretované jako tvary komparativu a superlativu adjektivizovaných adverbií dřívější/nejdřívější,37 dolejší/nejdolejší, hořejší/nejhořejší.38


3 Značkování adjektiv podle kategorií SUB, VRB a NOM

[SUB=[UGMVC0] & VRB= & NOM=[J-]]

V následujícím textu podrobně probereme přiřazení kategorie slovní druh [POS=A], kategorie poddruh (SUB) v kombinaci s kategoriemi slovesný tvar (VRB) a jmenný tvar (NOM).


3.1 Přivlastňovací adjektiva

[SUB=U & VRB=- & NOM=[J-]]39

Poddruh [SUB=U] budou mít adjektiva derivovaná od substantiv sufixy -ův (od maskulin životných/personifikovaných: králův, Fordův, ale i fordova karoserie) a -in (od feminin: matčin, Růžin účes, ale i růžinu jevil vonný vzdech), která bývají nazývána adjektivy posesivními. Adjektiva na ův/in jsou ve slovníku automatického morfologického analyzátoru generována automaticky od substantivních označení maskulin životných (osob a patrně někdy i zvířat) sufixem ův a feminin označujících osoby (zvířata, personifikované entity) sufixem in. Většina40 lingvistických popisů se shoduje na tom, že od neuter se adjektiva na ův/in netvoří. Dále se v lingvistické literatuře najdou poznámky o omezeném tvoření adjektiv na in od substantiv na -ice/-yně (více Kopáčková 2013).

„Rozgenerování adjektiv na -ův/in“ od substantiv rodu mužského životného a feminin označujících živé bytosti na rovině morfologického slovníku používaného automatickým morfologickým analyzátorem je vcelku uspokojivé. Případné úpravy by měly zahrnout:

(a) adjektiva od feminin na -ice (viz níže § 5.1)

(b) kontrolu rozgenerování adjektiv od feminin (kontrola rozsahu a obsahu seznamů feminin označujících živé bytosti – lze porovnat seznamy pražského a brněnského slovníku)

c) rozšíření generování adjektiv na -ův/-in na substantiva (maskulina neživotná, feminina neoznačující v primárním významu životné substance), která se užívají personifikovaně (více viz níže § 5).41


3.2 Adjektiva od přechodníku přítomného

[SUB=G & VRB=- & NOM=-]

[SUB=G & VRB=- & NOM=-] budou mít ve značce uvedena přídavná jména procesuální tvořená paradigmaticky od kmene přítomného (tvaru shodného s přechodníkem přítomným pro fem. a neut. sg.) sufixem -((ou)|(í))c-í (např. nesoucí, brousící). (Značení poddruhu G na druhé pozici existuje již v současném pražském tagsetu.) K rozlišování různé míry nominalizace (atributivní a predikativní funkce) na rovině morfologického tagování nepřistoupíme. Uplatňujeme primárně morfologické hledisko (jde o slova sklonná), syntaktické funkce neznačkujeme. Co se týče dezaktualizace, jde o hledisko sémantické, které na úrovni automatické analýzy uplatňujeme pouze výběrově (viz níže). Rovněž neuplatňujeme sémantické hledisko u desémantizovaných užití substituovatelných / přeložitelných prepozicemi (práce <týkající se> značkování = práce <o> značkování). Tato užití si zachovávají flektivní vlastnosti (například při transponování s pracemi <týkajícími se> značkování = s pracemi <o> značkování, se mění číslo i pád), pokládáme je tudíž za adjektiva.42

a. Adjektiva, která nelze jednoduše vztáhnout k příslušnému opěrnému slovesnému tvaru nebo která nemají procesuální význam

Z výše uvedených hledisek lze za problematická v první řadě pokládat adjektiva jako: horoucí, žádoucí, živoucí, budoucí, smrtící, zničující, stísňující…, která

(i) formálně nelze jednoduše vztáhnout k příslušnému opěrnému slovesnému tvaru (synchronně užívanému tvaru 3. pl. ind. préz. akt.) a

(ii) nemají procesuální význam (lidé žijící na samotě jsou <živoucím> důkazem toho, že lze žít o samotě). K tomuto seznamu je možné přidávat další adjektiva, která sice lze pravidelně vygenerovat od příslušného slovesného tvaru, ale v úzu prezentovaném korpusy figurují výhradně nebo s vysokou frekvencí pouze v dezaktualizovaných významech (jako důsledek lexikalizace). Jsou to např. adjektiva: okouzlující, neutuchající; jinými případy jsou ovšem adjektiva stávající,43 vroucí,44 která mají patrně jak procesuální, tak lexikalizované dezaktualizované významy.

Máme za to, že uživateli lze dát k dispozici seznam adjektiv, která automatická morfologická analýza hodnotí jako případy, u nichž proces lexikalizace pokročil natolik, že na pozici SUB nebude vyznačen vztah ke slovesu přiřazením tagu G a budou mít [SUB=0].

Seznam adjektiv na -oucí/-ící majících vztah ke slovesu, která budou mít [POS=A & SUB=0]: budoucí, horoucí, žádoucí, živoucí, smrtící, neutuchající, zničující, stísňující, okouzlující.

Tento seznam si neklade nároky na úplnost a ani zcela nevylučuje okrajové užití v procesuálním významu (... dívka <okouzlující> jej svým zjevem pokaždé, když ji uviděl, se mu stala noční můrou...). Totéž platí o kompozitech (viz níže).

Návrh na řešení otázky, jak se stavět k často hapaxovým dokladům adjektiv, která jsou tvořena analogicky (varianty jako např. souznící/souznějící nebo pekoucí/pečící/pečoucí), a jak se stavět k doloženým adjektivům tvořeným v rozporu s aktuálně platnou kodifikací od sloves dokonavých (vzniknoucí, troufnoucí), je uveden v § 6.1.45

b. Adjektiva, která se substantivizují

Řada adjektiv tvořených od sloves sufixy -oucí/-ící se substantivizuje (výsledkem substantivizace je většinou pojmenování osoby vykonávající děj označený motivujícím slovesem, prostředkem procesu substantivizace je užití deverbativního adjektiva ve funkci substantiva). Na základě sond do korpusových dat lze předpokládat, že slovotvorný proces substantivizace je v současné češtině otevřený, to znamená, že i adjektiva tvořená od nově vznikajících sloves se substantivizují.46 Meze tvoření jsou dány sémantikou motivujícího slovesa (substantivizací vznikají pojmenování osob, které aktuálně i neaktuálně vykonávají činnost označenou základovým slovesem, tvoří se tedy od sloves, která mají/mohou mít ve svém valenčním rámci personického činitele děje).

Doklady substantivizace nacházíme víceméně pravidelně mezi frekventovanými i méně frekventovanými slovy.47

Máme za to, že přinejmenším adjektiva, která se často substantivizují, by měla být zaznamenána ve slovníku morfologického analyzátoru jak jako [POS=A], tak jako [POS=N]. Seznam opřený o frekvenční analýzu korpusů řady SYN, který obsahuje nejfrekventovanější slova na -oucí/-ící v substantivní funkci (slovnědruhový přechod/transpozice), je k dispozici v disertační práci Olgy Richterové (2017, s. 137n.). Jedná se o lemmata, která by měla mít jak adjektivní ([POS=A & SUB=G]), tak substantivní ([POS=N]) interpretaci (nejde-li o kompozita, u nichž je otázka složitější a je ji třeba řešit u každého kompozita individuálně, neboť některá kompozita adjektivní význam mít mohou, např. Při nehodě zahynuli oba řidiči a tři <spolucestující> bulharští občané, jiná patrně nikoli, např. vlakvedoucí). I toto rozhodování bude složité.

Seznam [(POS=A & SUB=G) | (POS=N & GEN=M) | (POS=N & GEN=F)]:48 cestující, soutěžící, věřící, pracující, účinkující, kupující, prodávající, nastávající, přihlížející, dospívající, protestující, vedoucí, kolemjdoucí, tonoucí, okolojdoucí, okolojedoucí.

Máme za to, že uživatel by měl být upozorněn na to, že uvedený seznam a) neodpovídá ani zdaleka potenci procesuálních adjektiv transponovat se do substantiv a b) desambiguace je minimálně z tohoto hlediska nepřesná (protože slovník je podgenerovaný[49]).

Část seznamu kompozit, která jsou v existujícím pražském slovníku interpretována jako [POS=N]: kolemjdoucí, protijedoucí, okolostojící, vševědoucí, spolutrpící, protijedoucí, vševidoucí, místopředsedající, délebydlící, okolojdoucí, okolojedoucí, spolubydlící, spolucestující, strojvedoucí, vlakvedoucí, stavbyvedoucí, dílovedoucí, obchodvedoucí...


3.3 Adjektiva od přechodníku minulého

[SUB=M & VRB=- & NOM=-]

[SUB=M & VRB=- & NOM=-] budou mít ve značce uvedena přídavná jména tvořená paradigmaticky od kmene minulého (tvaru shodného s přechodníkem minulým pro mask. sg.) sufixem -š-í/-(v)-š-í (např. přišedší, byvší). (Toto značení existuje již v současném tagsetu.)

Kompozita: nanebevstoupivší, znovunavrátivší,…

a. Adjektiva tvořená analogicky jako varianty a adjektiva tvořená v rozporu s aktuálně platnou kodifikací

Řešení otázky, jak se stavět k často hapaxovým dokladům adjektiv tvořeným analogicky jako varianty (např. nastanuvší/nastavší nebo započnuvší/započavší) a jak se stavět k doloženým adjektivům tvořeným v rozporu s aktuálně platnou kodifikací od sloves nedokonavých/obouvidových (rodivší, konvertovavší) je uvedeno níže v § 6.2.50

b. Adjektiva, která se substantivizují

V současné češtině se slovesná adjektiva na -(v)ší substantivizují; výsledkem tohoto procesu jsou názvy osob, přičemž prostředkem substantivizace u nichž je deverbativní adjektivum užito ve funkci substantiva.51 Na základě sond do korpusových dat lze předpokládat, že slovotvorný proces substantivizace je v současné češtině otevřený. Meze tvoření jsou (podobně jako u adjektiv procesuálních) dány sémantikou motivujícího slovesa (substantivizací vznikají pojmenování osob, tvoří se tedy od sloves, která mají/mohou mít ve svém valenčním rámci personického činitele děje).

Slovník automatického analyzátoru je z hlediska možných substantivizací adjektiv na ší/vší podgenerován – substantivizace nepřipouští.

Máme za to, že uživatel by měl být upozorněn na potenci adjektiv na ší/vší transponovat se do substantiv. Pokud zůstane při tomto stavu podgenerování slovníku, bude i nadále desambiguace minimálně z tohoto hlediska nepřesná.52


3.4 Jiná deverbativní adjektiva

3.4.1 Adjektiva na [aeě]ný/[áeěuiy]tý

[POS=A & SUB=V & VRB=[-T] & NOM=[-J]]

[POS=A & SUB=V & VRB=- & NOM=-] budou mít ve značce uvedena adjektiva na [aeě]ný/[áeěuiy]tý (např. ohrazený, uklizený, naladěný, vysátý, prokletý, vyvinutý, prošitý, umytý) pravidelně tvořená z krátkých tvarů jmenných – participiálních, které měly v pražském systému dosud převážně značku Vs.* a výjimečně AC.* (viz podrobněji níže v § 7.1).

[POS=A & SUB=V & VRB=T & NOM=J] budou mít odpovídající participiální tvary dosud značkované výše uvedeným způsobem (většinou správně jako Vs.* a občas nekonzistentně jako AC.*). Společným a až na výše uvedené výjimky53 jediným lemmatem bude tvar „dlouhý“ (lemma=".*[nt]ý"). Pomocí flektivní mutace budou odlišeny tvary na .*íno.54

Kompozita: polozapomenutý, polozadušený,… budou značkována jako [POS=A & SUB=V].

a. Adjektiva s komplikovaným vztahem ke slovesu

Za problematická lze v prvé řadě pokládat adjektiva jako: šílený, hubený, kýžený, zkušený, přirozený, vznešený55 atd., ke kterým někdy lze formálně utvořit sloveso, k němuž je lze vztáhnout, nicméně jde o vztah obecně řečeno komplikovaný. Případný vztah ke slovesu navrhujeme na rovině automatické analýzy nezohledňovat a značkovat je jako [VRB=-].

b. Problém generování

Další problém je generování adjektiv na rovině slovníku, která v případě zakončení tvaru na -í kolidují s odpovídajícími verbálními substantivy na -ní/-tí tvarem mask. živ. nom. pl.,56 a jsou tak velmi nepříjemným zdrojem chybné desambiguace. Z tohoto důvodu by slovník neměl být masivně přegenerovaný.57

c. Adjektiva tvořená analogicky jako varianty

Řešení otázky, jak se stavět k mnohdy hapaxovým dokladům adjektiv, která jsou tvořena analogicky jako varianty (např. postižený/postihnutý, sepnutý/sepjatý, vyhostěný/vyhoštěný nebo unesený/unešený) a k variantám, které se významově profilovaly (vznesený/vznešený), je uvedeno v samostatném § 7.1. Upozorňujeme v něm jednak na některé pravidelně utvářené a nezaznamenané varianty, jednak na substandardní tvary (teritoriální varianty) na .*íno hojně (s nízkou frekvencí) doložené v korpusech, jako například… mít <uvaříno, napečíno, uklidíno, nakoupíno>.58

3.4.2 Adjektiva na na .*telný

[POS=A & SUB=V & VRB=- & NOM=[-J]]

[POS=A & SUB=V & VRB=- & NOM=-] budou mít ve značce uvedena přídavná jména na .*telný pravidelně tvořená ze sloves (např. čitelný, odvoditelný, myslitelný). [POS=D & NOM=J] budou mít odpovídající varianty na .*telno (např. myslitelno).59

Tvar „dlouhý“ bude mít [lemma=".*telný" & POS=A], „krátký“ tvar na o bude mít [lemma=".*telno" & POS=D]. Problematické jsou pouze případy, kdy je krátký tvar užíván i v jiném rodě/čísle [lc=".*teln[iya]"]. V takovém případě, bude tvar lemmatizován [lemma=".*telný"] a bude mít značku [POS=A & SUB=V & VRB=- & NOM=J].

a. Adjektiva, která nelze formálně tvořit od slovesného kmene, a problém nepravidelného tvoření

Mezi relevantní adjektiva nepatří adjektiva světelný, vodnatelný, smrtelný, která nelze formálně tvořit od slovesného kmene, protože se vztahují k substantivům nebo kmenům, jež v dnešní češtině nelze u sloves doložit (smrtelný ← *mьrti (odpovídá dnešnímu mřít(i)).

Za nepravidelně utvořené je třeba pokládat citelný. Nedoložené sloveso má adjektivum potutelný.

Naopak pravidelně lze derivovat adjektivum zřetelný ← zřel ← zřít. Nepravidelně je utvořeno frekventované adjektivum čitelný.60

b. Problémy dosavadního značkování

Tvary na telno jsou v dosavadním pražském značkování značkovány buď jako substantiva, dále jako jmenné tvary adjektiv (AC.*), nebo nejsou na úrovni automatické analýzy rozpoznány (chybí ve slovníku a mají tag X.*).

Jako adjektiva byly značkovány jmenné varianty (pochopitelno/pochopitelný [AC.*], myslitelno/ myslitelný [AC.*], uvěřitelno/uvěřitelný [AC.*], srovnatelno/srovnatelný [AC.*], dělitelno/dělitelný [AC.*], slučitelno/slučitelný [AC.*], přijatelno/přijatelný [AC.*]). V korpusu je doloženo poměrně značně velké množství tvarů na telno, které a) jsou označkovány jako substantiva, přičemž v některých případech jde o jasně predikativní užití,61 a b) nejsou rozpoznány automatickou morfologickou analýzou.62 Pro případy ambiguitní interpretace (adjektivum v adverbiálním významu) bude využit [POS=D] (viz více v kapitole Adverbia # 08-06, § 3.1.2c).


3.5 Slova z číslovkových kořenů s výjimkou adjektivně skloňovaných číslovek řadových

[POS=A & SUB=C & VRB=- & NOM=-]

[POS=A & SUB=C & VRB=- & NOM=-] budou mít slova (deriváty jako dvojkový, dvojitý,… a zejména kompozita jako dvojsečný, dvojstranný, dvouhodinový, tříletý, čtyřprocentní) z číslovkových kořenů s výjimkou adjektivně skloňovaných číslovek řadových (první, druhý, třetí, pátý, stý…), číslovek vztažených k celku (paterý, šesterý, desaterý…) a kompozitních číslovek násobných (dvojnásobný, osminásobný, dvacetinásobný...). Podrobnější rozbor viz kapitola Číslovky # 08-04.

[POS=A & SUB=C & VRB=- & NOM=-] budou mít tvary (nej)prvnější.


3.6 Ostatní adjektiva

[POS=A & SUB=0 & VRB=- & NOM=[-J]]

[POS=A & SUB=0 & VRB=- & NOM=[-J]] budou mít ve značce uvedena všechna ostatní přídavná jména (např. mladý, dobrý, chudý, myší, vlčí, stropní). [POS=A & SUB=0 & VRB=- & NOM=J] budou mít odpovídající varianty – jmenné tvary, pokud existuje kompletní soubor tvarů rozvinutý ve všech rodech a obou číslech (například mlád, mláda, mládo, mládi, mlády, mláda).

V případě jakkoli redukovaného počtu tvarů je třeba věnovat patřičnou pozornost rozgenerování jmenných tvarů na rovině slovníku,63 přičemž je třeba věnovat velkou pozornost tomu, aby slovník nebyl přegenerován.64

a. Problematika jmenných tvarů a jejich desambiguace

Celkově máme za to, že v současné češtině jsou jmenné tvary (s výjimkou tvarů pasivních příčestí, viz výše § 3.4.1 i níže § 7.1) na ústupu. Nicméně jsou dosud zachovány v adverbiálních/predikativních užitích. Nabízela se tudíž možnost značkovat je jako adverbia. Takový postup naráží ovšem na některé problémy, neboť proces adverbializace není zcela dovršen a jmenný charakter je částečně zachován65. Navíc homonymní užití v substantivní platnosti je důsledkem procesu substantivizace adjektiv. Tento proces je striktně vzato otevřený, takže definovat seznam lemmat výčtem je obtížné a domníváme se, že jde o úkol, který přesahuje hranice možností automatické morfologické analýzy.

Pro ilustraci uveďme několik příkladů:

a. Bylo velké sucho. (substantivum → POS=N)

b. Bylo velmi sucho. (adverbium → POS=D)

c. Bylo sucho. (adverbium → POS=D)

d. Dítě bylo sucho. (adjektivum – jmenný tvar → POS=A)

e. Chlapi seděli v hospodě na sucho. (adverbium → POS=D)

f. Chlapi si v hospodě stěžovali na sucho. (substantivum → POS=N)

g. Do sucha, které ničilo úrodu v roce 1947, jsem hroznější počasí nezažil. (substantivum → POS=N)

h. Utři se do sucha. (adverbium → POS=D)

i. Jsem už zcela such, manželka je sucha i dítka jsou již sucha, ale šaty nejsou dosud zcela suchy. (adjektivum – jmenný tvar → POS=A)

j. Tolik such nebylo ani v minulém století. (substantivum → POS=N)

k. Tak to by bylo v suchu. (adverbium → POS=D)

l. V takovém dlouhotrvajícím suchu dojde snadno k požáru. (substantivum → POS=N)

m. Nevěděli jsme si rady s velkými suchy. (substantivum → POS=N)

Pro podobné případy, které jsou podrobně probrány v kapitole věnované příslovcím (# 08-06, § 3.1.2, bod k), navrhujeme v co největší míře využít [POS=D].

Desambiguaci POS=A u jmenných tvarů, které se ve většině užití adverbializovaly, navrhujeme maximálně potlačit ve prospěch [POS=D].

Výjimkou nebudou ani jmenné tvary adjektiv na .*telno, které navrhujeme interpretovat jako [POS=D].66 Substantivizovaná užití67 s ohledem na raritnost68 některých z nich navrhujeme desambiguovat pouze v případě lexémů: nedýchatelno, neviditelno, nepoznatelno, nedotknutelno, nesrozumitelno, měřitelno, dýchatelno, nevyslovitelno (seznam viz kapitola Substantiva # 08-01, § 8.2.2). Naopak tvary lemmat na .*ično navrhujeme (s výjimkou slično)69 interpretovat jako [POS=N], viz více kapitola Substantiva # 08-01, § 8.2.4.

Desambiguaci [POS=N] u substantivizovaných užití navrhujeme zachovat výběrově, a to v následujících případech: dusno, horko, chladno, mokro, parno, prázdno, sucho, temno, teplo, ticho, vedro, vlhko, a dále také jasno, světlo, volno, jakož i v případě proprií na .*sko/.*cko (Německo, Burgundsko,...), u nichž o substantivním užití svědčí (pokud je dodržena) pravopisná norma (velké počáteční písmeno), takže je není třeba desambiguovat.70

b. Značení slovnědruhové přesažnosti mezi adjektivním, adverbiálním a substantivním významem

Slovnědruhová přesažnost mezi adjektivním a adverbiálním (ale i substantivním) významem bude patrná jednak z podoby lemmat, jednak z podob značek (přítomnost hodnot CAS u [POS=D], které následují po předložce, s níž tvoří následující původně jmenný tvar adjektiva jednotku):

(1)

(lc=sucho & [lemma=sucho & POS=N & GEN=N & CAS=[145] & NUM=S & NOM=-])|

(lc=sucho & [lemma=suchý & POS=A & GEN=N & CAS=[14] & NUM=S & NOM=J])|

(lc=sucho & [lemma=sucho & POS=D & GEN=- & CAS=[-4] & NUM=- & NOM=J])

(2)

(lc=sucha & [lemma=sucho & (POS=N & GEN=N & CAS=2 & NUM=S & NOM=-)|(POS=N & GEN=N & CAS=[14] & NUM=P & NOM=-)])|

(lc=sucha & [lemma=sucha & POS=D & GEN=- & CAS=2 & NUM=- & NOM=J])|

(lc=sucha & [lemma=suchý & (POS=A & GEN=F & CAS=1 & NUM=S & NOM=J)|(POS=A & GEN=N & CAS=1 & NUM=P & NOM=J)])

(3)

(lc=suchy & [lemma=sucho & POS=N & GEN=N & CAS=7 & NUM=P & NOM=-])|

(lc=suchy & [lemma=suchý & POS=A & GEN=[IF] & CAS=[14] & NUM=P & NOM=J])

(4)

(lc=such & [lemma=sucho & POS=N & GEN=N & CAS=2 & NUM=P & NOM=-])|

(lc=such & [lemma=suchý & POS=A & GEN=[MI] & CAS=1 & NUM=S & NOM=J])

(5)

(lc=suchu & [lemma=sucho & POS=N & GEN=N & CAS=[36] & NUM=S & NOM=-])|

(lc=suchu & [lemma=suchu & POS=D & GEN=- & CAS=6 & NUM=- & NOM=J])

Desambiguace jmenných adjektivních tvarů a substantivizovaných adjektiv není triviální a nemusí mít dobré výsledky. Proto nabídneme uživateli korpusů seznamy jednotek, kterých se uvedený problém týká (viz více kapitoly Adverbia # 08-06, § 3.1.2, a Substantiva # 08-01, § 8.2.1).


4 Značkování dalších kategorií adjektiv – kategorie stupně a negace

4.1 Hodnoty kategorie stupně (DEG)

Všechna adjektiva v pozitivu bez ohledu na sémantické rysy, které bývají uváděny jako rozhodující pro pravidelné (víceméně paradigmatické) odvozování tvarů komparativu sufixy -í/-ší/-[eě]jší a superlativu prefixem nej-, budou mít hodnotu [DEG=1], pravidelně i nepravidelně odvozené tvary komparativu, resp. superlativu a tvaru na sebe- budou mít hodnotu [DEG=[23s]], viz výše § 2.2.

Je to změna oproti dosavadní praxi, která považovala některé typy adjektiv za implicitně nestupňovatelné.71


4.2 Hodnoty kategorie negace (NEG)

Lemmatizace tvaru derivovaného negativním prefixem ne- tvarem bez tohoto prefixu je praxe, která má svá pro i proti. V pojetí NovaMorf bude zachována u sloves.72 U adjektiv tuto praxi navrhujeme změnit.

1. Je-li [POS=A & SUB=[VGM] & lc=ne.*], přičemž počáteční řetězec ne- má negující význam, pak bude lemmatem tvar s ne- a hodnota [NEG=N]. Nemá-li počáteční řetězec negující význam, bude pochopitelně lemmatem tvar s ne- a [NEG=A] (např. neurotizovaný, neurotizující).

2. Je-li [POS=A & SUB=[U0] & lc=ne.*], přičemž počáteční řetězec ne- má negující význam, pak bude lemmatem tvar s ne- a hodnota [NEG=N] (nedobrý, nerad, nešťastný, nekuřákův). Nemá-li počáteční řetězec negující význam, pak bude pochopitelně lemmatem tvar s ne- a hodnota [NEG=A] (jednak adjektiva typu newyorský, nehtový, neurotický, neteřin, negroidní, neutronový, neon(k)ový,…, jednak negativa tantum, přičemž máme na zřeteli, že vymezení této kategorie výčtem na rovině morfologického slovníku není triviální73). Problematické případy jsou jednak homonyma neurologický (vedle adjektiva vztahového utvořeného ze substantiva označujícího neurovědu (neuro-logický) lze interpretovat jako opozitum k urologický (ne-urologický)) a nesmyslný (desubstantivum od základového slova nesmysl, jehož opozitem je rozumný/smysluplný – patrně kalk něm. sinnvoll, nebo negace adjektiva smyslný). Hraniční případ představuje také dvojice místný/nemístný.74


5 Podklady pro úpravy slovníku automatického morfologického analyzátoru I

5.1 Adjektiva na -in od feminin

V IJP (http://prirucka.ujc.cas.cz/?id=756) je uvedeno, že (citát): „Při tvoření přídavných jmen se koncová samohláska většinou odsouvá a uplatňují se změny kořenové souhlásky v češtině obvyklé (r se mění v ř, k v č, h v ž): Jana – Janin, Petra – Petřin, Veronika – Veroničin, Olga – Olžin, Anna – Annin, Anička – Aniččin, Venuše – Venušin, AliceAlicin, Maria – Mariin, Mária – Máriin, Marie – Mariin, Sophia – Sophiin, Penelope – Penelopin, Kalipso – Kalipsin, Lulu – Lulin.

Pražský systém automatické morfologické analýzy počítá na úrovni slovníku s možností tvoření posesiv na -in od substantiv na -ice. Problém spatřujeme v tom, že u některých (nikoli u všech) substantiv na -ice se připouští alternace c-č souhlásky v sufixu -ic(e) (např. výtvarnice/výtvarničin). Tento stav je v souladu s rozkolísaným územ odvozování adjektiv na -in od substantiv na -ice.

5.1.1 Příklady vybrané z korpusu SYN, czTenTen12 a z internetu

... <Aliciny> otázky stále zůstávaly bez odpovědi...

... dopadalo na prosté dubové dřevo <Beatriciny> rakve...

... Vlastimil Kříha, <výtvarničin> manžel, nechá zhlédnout ukázky některých svých mistrovských rukodělných kovářských prací...

... Janáčka k tomuto kroku vedl fakt nelogičnosti <Kostelničina>75 jednání...

Ale pravda je, pane, že ten <Beatricin> mládenec z garáží, s kterým chodí, dostal taky anonymní dopis a prý vyváděl, hrůza povídat...

... On a jeho otec a <Janicin> otec a ceremoniář odnesou bílou truhlu k pohřebnímu automobilu...

... strašné a je to čím dál tím horší,“ říká Slavica a hlas se jí chvěje slzami, když po telefonu hovoří se zbytkem světa z bělehradského předměstí, kde žije se svou rodinou, napsala agentura DPA. <Slavičina> rodina si položila do sklepa koberec a zapojila malá elektrická kamínka, aby zahnala chlad nadcházející noci...

... Ale <Alicin> pokus o sebevraždu nebyl nadarmo...

... Ludvík IV., <Aličin> otec a hesenský vládce, se oženil s Alicí, dcerou anglické královny Viktorie...

... za sebou <Aličin> dramatický přejezd s celým ansámblem přes hory Tottori do Ósaky...

... Mijoko Kawaharová byla zadržena pro podezření, že je příčinou zranění 64leté sousedky, které prokázali i lékaři. Přenosný kazeťák s hlasitou muzikou zatčená své kolegyni od vedle, jejíž dům je vzdálen pouhých šest metrů od „<hříšničina>“, pouštěla téměř 24 hodin denně a reproduktory...

... Nevím, z jakého důvodu se Ferstová rozhodla překládat <čarodějnicin> dům jako zámek. V originále se téměř vždy mluví o jejím sídle jako o domu (house)...

... kolem ní se o chviličku později prohnal kamenící paprsek. Vyběhla z místnosti na chodbu a pelášila pryč slyšíc za sebou <čarodějnicin> dusot...

... Ty se naplno přihlásily o slovo, když nedaleko zaslechl <čarodějnicin> hlas.

... Vy máte nějaký certifikát, nějakou specializaci, co je hezké, co ještě ano, co už ne? Vy to víte přesně? (s pohledem na <kadeřnicin> nečesaný asi týden rozcuch na hlavě...).

... Já vás najdu!“ Rozezněl se místností <knihovnicin> hlas....

... Isteran, druhý <kouzelnicin> miláček, byl opět u svých upírských příbuzných...

... Nikdy jsem nemohl prohlédnout hvězdici zespodu. Ani tetu. Nesměl jsem ji sejmout ze zdi. Hvězdici. Tak, jakmile ji Adolf chytil, rybářsky řečeno podsekl, podrobil jsem <hvězdičin> rub prohlídce a zjistil jsem, že je tam vyzbrojena milionem drápečků...

V korpusu SYN lze ovšem najít také řadu případů, u nichž připuštění v úzu doložené alternace c-č vede ke generování homonymních tvarů (viz níže). V důsledku toho pak vznikají problémy s desambiguací:

... vysoko nad unavené úředníky deptané úředničinou /úředničin [AUFS7F.*], unavené účastníky propagačních žranic...

... Libor Pauk, jehož přivedly ke kadeřničině/kadeřničin [AUFS3F.*] klikaté cesty...

... výpovědní valeur jeho výtvarničiny/výtvarničin [AUFS2F.*] je téměř nulový...

... autor založil Divadlo Řezničina/řezničin [AUNS2F.*] ...

Homonym je poměrně hodně a jen zřídkakdy se mezi nimi najdou skutečné doklady adjektiv na -in (např. skutečný poměr výtvarničin/výtvarničina je 6:245 v korpusu SYN v8, 18 případů je ovšem chybně desambiguováno).

Rozkolísanost úzu je, jak se domníváme, důsledkem působení analogie, kdy substantiva rodu ženského s kmenovou finálou k, u nichž při odvozování sufixem -in dochází k alternaci k-č (výtvarník → výtvarničina), působí jako „vzor“ pro neústrojné tvoření s alternací c-č u adjektiv tvořených od substantiv na -ice (kadeřnice → kadeřničina/kadeřnicina). S obdobným působením analogie (Systemzwang) se v češtině ve slovotvorbě setkáváme v případě, kdy adjektiva pravidelně tvořená konverzí ke vzoru jarní od substantiv skloňovaných podle vzoru kuře mají vedle pravidelné alternace t-c (kuřecí, zvířecí, knížecí...) i tvary s neústrojnou alternací t-č (prasečí, jehněčí...), kterou lze vysvětlit právě analogií s alternací k-č, c-č u adjektiv od maskulin a feminin s kmenovou finálou k, c (dobytčí, králičí, trpasličí, lysčí, ovčí, kamzičí, samčí, samičí...).76 Připomeňme, že stejná analogie působí v případě odvozování sufixem -ina od neuter podle kuře (teletina, ale prasečina, kozlečina podle kamzičina77).

5.1.2 Návrh řešení

Rozhodně se stavíme za to, aby v případě, že na úrovni slovníku budou adjektiva na -in od substantiv na -ice s alternací c-č generována, aby byl ve slovníku zároveň obsažen popis pro rozgenerování slovotvorných dublet (globální mutace viz Hlaváčová 2009), tedy dublety Ali[cč]in, kadeřni[cč]in, výtvarni[cč]in, řezni[cč]in...78 Za vhodnější bychom ovšem pokládali řešení, při kterém by byla adjektiva na -in od substantiv na -ice generována pouze bez alternace c-č. Důvodem je masivní přegenerování. Tvary posesivních adjektiv na -in od substantiv na -ice se v úzu reprezentovaném korpusy vyskytují sporadicky a i podíl dublet s alternací c-č není závratně velký (řada výše uvedených dokladů pochází z webového korpusu czTenTen12 a z internetu). Pomiňme to, jak tyto dublety hodnotíme z hlediska případné „kodifikace“ (viz výše IJP) a zaměřme se na praxi automatické morfologické analýzy. Řada substantiv na -ina (názvy profesí, ale i jiné) má některé tvary homonymní s adjektivy automaticky generovanými od feminin sufixem -in od substantiv na -ice s alternací c-č. Výsledky desambiguace v korpusu SYN nejsou, jak jsme naznačili několika příklady výše, uspokojivé. Pro přehlednost jsme sestavili co nejúplnější seznam dvojic substantivum na -ina / adjektivum na -in s homonymními tvary. K tomuto účelu jsme použili seznam substantiv na -ičina získaný za pomoci nástroje Deriv (Šmerk 2009) z brněnského morfologického slovníku. Seznam zahrnuje 28 feminin, z nichž 19 by mohlo mít v případě automatického rozgenerování adjektiv od feminin označujících živé bytosti s těmito femininy homonymní tvary (horničina, jalovičina, kamzičina,?králičina,?krtičina, nádeničina, opičina, ouředničina, právničina, rolničina, řezničina, slepičina, úderničina, úředničina,?velkořezničina, zahradničina, zámečničina, zedničina, zlatničina). Lze ovšem předpokládat, že jich bude více, jak o tom svědčí chybně desambiguované tvary v korpusu SYN. Seznam lze na základě analýzy chyb v desambiguaci rozšířit o další dvojice derivované od substantiv na -ice a -ík. Domníváme se ovšem, že některá substantiva tvořená od maskulin na -ík vůbec ve slovníku pražského morfologického analyzátoru zaznamenána nejsou. Je-li náš předpoklad oprávněný, pak by nešlo jen o problém desambiguace, ale rovněž o problém podgenerování slovníku.

Dvojice lemmat s homonymními tvary mohou být následující:79

hornice/horník> horni[cč]in/horničina

kamzice/kamzík> kamzi[cč]in/kamzičina

nádenice/nádeník> nádeni[cč]in/nádeničina

řeznice/řezník> řezni[cč]in/řezničina

právnice/právník> právni[cč]in/právničina

údernice/úderník> úderni[cč]in/úderničina

úřednice/úředník> úředni[cč]in/úředničina

zahradnice/zahradník> zahradni[cč]in/zahradničina

zámečnice/zámečník> zámečni[cč]in/zámečničina

zednice/zedník> zedni[cč]in/zedničina

zlatnice/zlatník> zlatni[cč]in/zlatničina

výtvarnice/výtvarník> výtvarni[cč]in/výtvarničina

kamenice/kameník> kameni[cč]in/kameničina

kominice/kominík> komini[cč]in/kominičina

drátenice/dráteník> dráteni[cč]in/dráteničina

ochotnice/ochotník> ochotni[cč]in/ochotničina

?zbrojnice/?zbrojník> zbrojni[cč]in/zbrojničina

poustevnice/poustevník> postevni[cč]in/poustevničina

lakýrnice/lakýrník> lakýrni[cč]in/lakýrničina

kostelnice/kostelník> kostelni[cč]in/kostelničina

kadeřnice/kadeřník> kadeřni[cč]in/kadeřničina

hrobnice/hrobník> hrobni[cč]in/hrobničina

školnice/školník> školni[cč]in/školničina

čalounice/čalouník> čalouni[cč]in/čalouničina

rolnice/rolník> rolni[cč]in/rolničina

převoznice(převozník> převozni[cč]in/převozničina

námořnice/námořník> námořni[cč]in/námořničina

loupežnice/loupežník> loupežni[cč]in/loupežničina

lazebnice/lazebník> lazebni[cč]in/lazebničina

galejnice/galejník> galejni[cč]in/galejničina

celnice/celník> celni[cč]in/celničina

řemeslnice/řemeslník> řemeslni[cč]in/řemeslničina

číšnice/číšník> číšni[cč]in/číšničina

čarodějnice/čarodějník> čarodějni[cč]in/čarodějničina

účetnice/účetník> účetni[cč]in/účetničina

výzkumnice/výzkumník> výzkumni[cč]in/výzkumničina

trpaslice/trpaslík> trpasli[cč]in/trpasličina

stavebnice/stavebník> stavebni[cč]in/stavebničina

soustružnice/soustružník> soustružni[cč]in/soustružničina

skladnice/skladník> skladni[cč]in/skladničina

sekernice/sekerník> sekerni[cč]in/sekerničina

pokladnice/pokladník> pokladni[cč]in/pokladničina

obuvnice/obuvník> obuvni[cč]in/obuvničina

obchodnice/obchodník> obchodni[cč]in/obchodničina

muzejnice/muzejník> muzejni[cč]in/muzejničina

montážnice/montážník> montážni[cč]in/montážničina

lékárnice/lékárník> lékárni[cč]in/lékárničina

lodnice/lodník> lodni[cč]in/lodničina

lesnice/lesník> lesni[cč]in/lesničina

kozlice/kozlík> kozli[cč]in/kozličina

komornice/komorník> komorni[cč]in/komorničina

hutnice/hutník> hutni[cč]in/hutničina

domovnice/domovník> domovni[cč]in/domovničina

dobrovolnice/dobrovolník> dobrovolni[cč]in/dobrovolničina

bubenice/bubeník> bubeni[cč]in/bubeničina

králice/králík> králi[cč]in/králičina

krtice/krtek> krti[cč]in/krtičina

jalovice> jalovi[cč]in/jalovičina

slepice> slepi[cč]in/slepičina

opice> opi[cč]in/opičina

ovce> ov[cč]in/ovčina

Nehomonymní jsou pouze tvary:

.*ičini [AUMP[15].*]

.*ičiných [AUXP[26].*]

.*ičiným [AU[MIN]S7.*]

.*ičiným [AUXP3.*]

.*ičiným[ia] [AUPXP7.*]

.*ičinám [NNFP3.*]

.*ičinách [NNFP6.*]

.*ičinam[ia] [NNFP7.*.]

Homonymní jsou tvary:

.*ičin [AUMS[15].* | AUIS[145].* | NNFP2.*]

.*ičina [AUMS[24].* | AUIS2.* | AUNP[145].* | NNFS[15].*]

.*ičinu [AU[MIN]S3.* | AUFS4.* | NNFS4.*]

.*ičino [AUF5.*80 | AUNS[145].* | NNFS5.*]

.*ičině [AU[MINF]S[36].* | NNFS[36].*]

.*ičinou [AUFS7.* | NNFS7.*]

.*ičiny [AU[IF]P[145].* | NNFS2.* | NNFP[145].*]


Tyto tvary jsou (a patrně zůstanou) předmětem desambiguace. Stejný problém může nastat např. i u substantiva myšina a potenciálních tvarů adjektiva myšin (v korpusu SYN v6 jsou ovšem doloženy pouze výskyty substantiva a všechny jsou správně desambiguovány, takže patrně ve slovníku morfologického analyzátoru vůbec neexistuje možnost adjektivní – AU.* interpretace tvarů jako myšin, myšiny, myšina, myšině, myšinou, myšinu).


5.2 Adjektiva na -ův od maskulin

Rozgenerování adjektiv na -ův od maskulin je omezeno na maskulina životná (v pražském značkování tag=NNM.*). Toto omezení je možno mírně revidovat, vezmeme-li v úvahu personifikovaná užití maskulin neživotných. Problém volně souvisí s případy výskytu koncovek životných maskulin v akuzativu sg. maskulin neživotných. Podíváme-li se podrobněji na seznam jednotek získaných z korpusu SYN v6 dotazem [word=".*ův*" | word=".*ov*" & tag="X.*"], zjišťujeme, že nerozpoznané jednotky mohou patřit k pravidelně tvořeným adjektivům od personifikovaně užitých substantiv (maskulin neživotných).81


6 Podklady pro úpravy slovníku automatického morfologického analyzátoru II

Cílem tohoto textu je podrobný popis stavu interpretace adjektiv na -[(ou)|í]cí a na -ší na úrovni morfologického značkování v pražském systému a především návrh změn, které by měly přispět k tomu, aby popis byl konzistentnější a jeho výsledky transparentní jak pro uživatele morfologického značkování korpusů, tak pro údržbu slovníku.

Následující tabulky zahrnují seznamy dvojic adjektiv (slovotvorných synonym / slovotvorných dublet), která se tvoří paradigmaticky od sloves. Automatická morfologická analýza je zpravidla, nikoli vždy (viz níže), interpretuje na úrovni morfologického tagu jako AG.*/AM.*, tedy jako adjektiva tvořená z přechodníku přítomného/minulého. Předpokládáme, že nějaké propojení mezi popisem sloves a popisem adjektiv označkovaných jako AG.*/AM.* existuje i na úrovni morfologického slovníku.82 Z následujících tabulek, zahrnujících dvojice adjektiv vybrané z korpusů řady SYN i dalších zdrojů, jsou patrné nekonzistence v gramatickém značkování,83 které jsou způsobeny nekonzistentními řešeními na úrovni slovníku použitého morfologického analyzátoru. (Je také vidět, že některé řídké/řidší tvary adjektiv zůstávají nerozpoznány – X.*). Snažíme se zdokumentovat maximum, neboť se domníváme, že tím sice nijak výrazně nezvýšíme pokrytí slovníku, nicméně vylepšíme popis systému tvarů tvořených paradigmaticky (bez omezení). Zaměříme se především na adjektiva od sloves, která patří do uzavřených tříd a vzorů, neboť se u nich vyskytuje větší počet nerozpoznaných variant, což nelze přičíst na vrub náhodě (nepravidelnost na rovině tvarosloví se odráží na rovině slovotvorné). Adjektiva tvořená od sloves produktivních (otevřených) tříd a vzorů nelze popsat vyčerpávajícím způsobem (produktivita slovesného slovotvorného typu podmiňuje produktivitu adjektiv tvořených paradigmaticky od těchto sloves), nicméně v rámci tvoření těchto adjektiv se nevyskytuje tak velké množství nepravidelností, že lze spíše uvažovat o jejich automatickém rozpoznávaní (např. prostřednictvím guesserů).

V příloze níže se snažíme formálně zachytit vztahy mezi slovesy a adjektivy na -[(ou)|í]cí a -ší od nich paradigmaticky tvořenými.


6.1 Adjektiva na [(ou)|í]cí tvořená (generovaná) od sloves

Požadavek 1: Ve slovníku morfologického analyzátoru sjednotit popis generování adjektiv od sloves tak, aby adjektiva na -[(ou)|í]cí formálně odvoditelná od slovesných základů byla konzistentně interpretována jako POS=A & SUB=G. K diskusi lze ponechat některé drobnosti, celkově je ale směr úprav jednoznačný.

Následující popis má formu tabulkových přehledů a komentářů. Komentáře se snaží:

a) dokumentovat současný stav na úrovni lemmatizace a značkování;

b) na základě korpusů i dalších zdrojů zdokumentovat celkovou situaci odvozování adjektiv na -[(ou)|í]cí jakožto produktivního až paradigmatického způsobu tvoření adjektiv v češtině tak, aby úpravy na úrovni morfologického slovníku vedly k optimalizaci nástrojů, které s ním pracují a

c) lingvisticky glosovat případy okrajového tvoření adjektiv na -[(ou)|í]cí.

Tabulky zaznamenávají téměř čtyři sta adjektivních lemmat, z nichž více než polovina není v pražském systému správně označkována.

6.1.1 Tabulky a komentáře

chtějící/chtící (klanící/klanějící)

Tabulka 4 zachycuje adjektiva derivovaná od sloves, která patří ke vzoru sázet, případně kolísají mezi vzory prosit/trpět a sázet. V důsledku tohoto kolísání, ať už je stav současné kodifikace jakýkoliv, existují slovotvorné dublety procesuálních adjektiv na - odpovídající dubletám opěrného tvaru (tvar 3. osoby pl./přechodníku přítomného). Jedná se o 47 dvojic slovotvorných synonym (dublet), v jejichž značkování je rozpor v tom smyslu, že jeden člen dvojice má značku AG.* a druhý buď AA.*, nebo X.*. U dvou dvojic je značkování ve shodě (obě adjektiva mají značku AA.*), nicméně konzistentním řešením je, aby obě měla značku AG.*. Celkem 13 dvojic je označkováno správně. Varianty budou ve značce odlišeny pomocí globální mutace. Varianty na -ící budou mít [GMU=i], varianty na ‑oucí budou mít [GMU=u] a varianty na -[eěa]jící budou mít [GMU=C]. Varianty budou mít vícenásobné lemma, např. {bdící,bdějící}.

Tabulka 4:84 ící/[eě]jící

bdít

bdící

AG.*

bdějící

X.*

bytnět

bytnící

AG.*

bytnějící

X.*

civět

civící

AG.*

civějící

AA.*

čnít

čnící

AG.*

čnějící

AA.*

čumět

čumící

AG.*

čumějící

AA.*

dřevnatět

dřevnatící

AG.*

dřevnatějící

AA.*

fičet

fičící

AG.*

fičející

X.*

hanět

hanící

AG.*

hanějící

X.*

hladovět

hladovící

X.*

hladovějící

AG.*

hovět (si)

hovící

AG.*

hovějící

X.*

hřmít/hřmět

hřmící/hřmoucí85

AG.*/X.*

hřmějící

AG.*

chtít

chtící/

?chcoucí

AG.*/

czTenTen1286

chtějící

X.*

chvít/chvět

chvící

X.*

chvějící

AG.*

churavět

churavící

X.*

churavějící

AG.*

chybět

chybící87

AA.*

chybějící

AG.*

kálet

kálící

X.*

kálející

AG.*

kamenět

kamenící

X.*

kamenějící

AG.*

klanět (se)

klanící

AG.*

klanějící

AA.*

koulet/koulet (se)

koulící

X.*

koulející

AG.*

kráčet

kráčící

X.*

kráčející

AG.*

kvílet

kvílící

X.*

kvílející

AG.*

kypět

kypící

AG.*

kypějící

X.*

lpět

lpící

AG.*

lpějící

X.*

míjet

míjící

AA.*

míjející

AG.*

mizet

mizící

AG.*

mizející

AA.*

mohutnět

mohutnící

AG.*

mohutnějící

AA.*

náležet

náležící

AG.*

náležející

AG.*

nenávidět

nenávidící

AA.*

nenávidějící

AA.*

pelášit

pelášící

AG.*

pelášející

X.*

plešatět

plešatící

AG.*

plešatějící

X.*

pouštět

pouštící

X.*

pouštějící

AG.*

přináležet

přináležící

AG.*

přináležející

AG.*

příslušet

příslušící

AG.*

příslušející

AG.*

rezavět88

rezavící

X.*

rezavějící

AG.*

růžovět

růžovící

X.*

růžovějící

AG.*

řeřavět

řeřavící

AG.*

řeřavějící

AG.*

slzet

slzící

AG.*

slzející

AG.*

souviset

souvisící

AG.*

související

AG.*

souznít/souznět

souznící

AA.*

souznějící

AA.*

stavět

stavící

AG.*

stavějící

X.*

strmět/strmit

strmící

AA.*

strmějící

X.*

supět

supící

AG.*

supějící

AA.*

svádět

svádící

X.*

svádějící

AG.*

svářet (se)

svářící

AG.*

svářející

AG.*

svrbět

svrbící

AG.*

svrbějící

AG.*

šedivět

šedivící

X.*

šedivějící

AG.*

šílet

šílící

X.*

šílející

AA.*/AG.*

šumět

šumící

AG.*

šumějící

X.*

šupět

šupící

X.*

šupějící

X.*

temnět

temnící

AG.*

temnějící

X.*

úpět

úpící

AG.*

úpějící

AG.*

válet

válící

X.*

válející

AG.*

večeřet

večeřící

AG.*

večeřející

X.*

viset

visící

AA.*

visející

AG.*

vjíždět

vjíždící

X.*

vjíždějící

AG.*

vláčet

vláčící

AG.*

vláčející

AG.*

vonět

vonící

AG.*

vonějící

X.*

záležet

záležící

AG.*

záležející

AG.*

závidět

závidící

AG.*

závidějící

X.*

záviset

závisící

AG.*

závisející

AG.*

znít/znět

znící

AG.*

znějící

AG.*

želet

želící

AG.*

želející

X.*

tlející/tlící

Tabulka 4a zachycuje adjektiva derivovaná od sloves, která mohou patřit jak ke vzoru krýt, tak ke vzorům sázet/trpět. Tvary od kmene minulého (infinitiv, příčestí l-ové, příčestí trpné, přechodník minulý) jsou tvořeny identicky (tvarová homonyma, která jsou ovšem synonymní) podle obou vzorů, a identické jsou i některé tvary od kmene přítomného, mj. může, ale nemusí nastat tvarová homonymie právě v případě tvaru 3. os. pl. / přechodníku přítomného (může být jak podle vzorů krýt/sázet – oni tlejí/tleje, tlejíc..., tak podle trpět/sázet89 oni tlí/?tle, tlíc,...). Následkem tohoto kolísání, ať už je stav současné kodifikace jakýkoliv, existují slovotvorné dublety procesuálních adjektiv na - odpovídající dubletám opěrného tvaru (tvar 3. osoby pl./ přechodníku přítomného).

Tabulka 4a

skvít/skvět

skvící/skvoucí90

AA.*/X.*

skvějící

AG.*

tlít/tlet91

tlící

AG.*

tlející

AG.*

dštít/dštět

dštící

AG.*

dštijící

?92

chčít/chcát

ščít/scát

chčící

ščící

internet93

chčijící/chcající

ščijící/scající

X.*/czTenTen1294

dlít/dlet

dlící

AG.*

dlející

czTenTen1295

tkvít/tkvět

tkvící

AG.*

tkvějící

X.*

Tvary registrované v tabulce 4 představují neúplný seznam sloves, kterých by se měly změny na úrovni slovníku automatického morfologického analyzátoru týkat. Tento seznam se snažíme dále rozšířit. Z důvodu otevřenosti seznamu jsme připravili podklady pro sledování dalších adjektiv, která by měla být konzistentně označkována jako AG.*. Na základě údajů v IJP jsme vytvořili seznam sloves, která podle IJP tvoří tvary podle vzoru sázet. Tento seznam je v úplnosti uložen v příloze (slovesa_sazet_2.docx).

Ručně jsme z něj vytřídili slovesa, ke kterým lze tvořit adjektiva registrovaná v tabulce 4, a dokonavá slovesa, od nichž by se (pravděpodobně viz níže) adjektiva na -[(ou)|í]cí tvořit neměla. Takto jsme získali následující seznam sloves.

malátnět

mužnět

tučnět

kapalnět

temnět

zelenět

bujet

malomyslnět

krásnět

bubřet

špičatět

cukernatět

kostnatět

košatět

krabatět

kudrnatět

moučnatět

dužnatět

ledovatět

fialovět

černět

bělet

rdít se

topornět

myslet

divočet

dětinštět

bolet

bydlet

puchřet

pyšnět

Předpokládáme, že pro část z nich lze najít doklady slovotvorných dublet na -ící/[eě]jící (např. rdící se/ rdějící se, bydlící / bydlející). Hledání dokladů v korpusech a na internetu je poměrně pracné a nevede vždy ke kýženému cíli, takže jako východisko pro rozhodnutí zůstává intuice rodilého mluvčího. Z tohoto důvodu jsme pro tuto chvíli upustili od shromažďování dokladů evidujících výskyt adjektiv a navrhujeme při úpravách slovníku předpokládat, že od těchto sloves se adjektivní dublety tvořit mohou. Lze také prověřit možnost tvoření adjektiv i od sloves dokonavých, od kterých se za jistých okolností adjektiva na -[(ou)|í]cí tvořit mohou (viz níže).

Další podklady by bylo možné získávat z korpusů, např. prověřováním adjektiv generovaných jako doplňkové množiny (Vzor 1 Vzor 2) při práci s aplikací Morfio (Cvrček, Vondřička 2012). V této fázi je ovšem naším cílem spíše celkově zpracovat adjektiva od sloves neproduktivních tříd a vzorů (ta by totiž měla představovat uzavřenou množinu) a z adjektiv tvořených od sloves produktivních tříd a vzorů se zaměřit především na opravy nekonzistentních řešení.

klepoucí/klepající

Tabulka 5 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru brát,96 případně kolísají mezi vzory brát a dělat. V důsledku tohoto kolísání, ať už je stav současné kodifikace jakýkoliv, existují slovotvorné dublety procesuálních adjektiv na - odpovídající dubletám opěrného tvaru (tvar 3. osoby pl./přechodníku přítomného). Jedná se 33 dvojic slovotvorných synonym (dublet), v jejichž značkování je rozpor v tom smyslu, že jeden člen dvojice má značku AG.* a druhý buď AA.*, nebo X.*. Některá adjektiva nejsou doložena v korpusu SYN, nicméně se vyskytují v jazyce a jsou doložena např. v korpusu czTenTen12 nebo na internetu. Je tedy na zvážení, zda a jak je zachytit na úrovni slovníku pro automatickou morfologickou analýzu.97 Tvary, které z hlediska rodilého mluvčího pokládáme za přijatelné (vyšší míru přijatelnosti naznačujeme znakem „?“ ve sloupci určeném pro poznámky o značkování v korpusu SYN a o výskytu v korpusu czTenTen a na internetu), k nimž jsme ale nenašli doklady ani v existujících korpusech, ani na internetu, jsou označeny „*“. Tvary, které pokládáme za nepřijatelné, nevypisujeme a v příslušném okénku tabulky uvádíme „0“. Varianty na ‑oucí budou mít [GMU=u] a varianty na -ající budou mít [GMU=C].

Tabulka 5: oucí/ající


oucí


ající


klepat

klepoucí

X.*

klepající

AG.*

plavat

plavoucí

AA.*

plavající

AG.*

sypat

sypoucí

X.*

sypající

AG.*

tepat

tepoucí

X.*

tepající

AG.*

šlapat

šlapoucí

X.*

šlapající

AG.*

škrabat

škraboucí

X.*

škr[áa]bající

AG.*

lámat

lámoucí

X.*

lámající

AG.*

hrabat

hraboucí

X.*

hrabající

AG.*

dlabat

dlaboucí

internet98

dlabající

AG.*

hýbat

hýboucí

czTenTen1299

hýbající

AG.*

drbat

drboucí

czTenTen12100

drbající

AG.*

klubat (se)

kluboucí

czTenTen12101

klubající

AG.*

škubat (se)

škuboucí

czTenTen12102

škubající

AG.*

dupat

dupoucí

czTenTen12103

dupající

AG.*

kopat

kopoucí

czTenTen12104

kopající

AG.*

koupat (se)

koupoucí

czTenTen12105

koupající

AG.*

sápat (se)

sápoucí

czTenTen12106

sápající

AG.*

tápat

tápoucí

czTenTen12107

tápající

AG.*

kašlat

kašloucí

czTenTen12108

kašlající

AG.*

chrápat

chrápoucí

internet109

chrápající

AG.*

klamat (se)

klamoucí

czTenTen12110

klamající

AG.*

klapat

*klapoucí

?

klapající

AG.*

cpát

cpoucí

AG.*

cpající

czTenTen111

štvát

štvoucí

AG.*

štvající

czTenTen12112

rvát

rvoucí

AG.*

rvající

czTenTen12113

řvát

řvoucí

AG.*

řvající

czTenTen12114

zvát

zvoucí/zovoucí

AG.*/X.*

zvící/zvající

X.*/czTenTen12115

hnát

ženoucí

AG.*

hnající

czTenTen12116

brát

beroucí

AG.*

brající

czTenTen12117

drát

deroucí

AG.*

drající

czTenTen12118

prát

peroucí

AG.*

*prající


srát

seroucí

AG.*

srající

czTenTen12119

žrát

žeroucí

AG.*

žrající

czTenTen12120

mažoucí/mažící/mazající

Tabulka 6 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru mazat,121 případně kolísají mezi vzory mazat a dělat. Některá (nikoli všechna) z těchto sloves mají podle vzoru mazat dubletu ve 3. os. pl. (např. píšou/píší). V důsledku tohoto kolísání a existence zmíněných tvarových dublet/triplet, ať už je stav současné kodifikace jakýkoliv, existují slovotvorné dublety/triplety procesuálních adjektiv na - odpovídající zpravidla (ne vždy doloženým) dubletám/tripletám opěrného tvaru (tvar 3. osoby pl./přechodníku přítomného). Jedná se o 22 dvojic/trojic slovotvorných synonym (dublet/triplet), v jejichž značkování je rozpor v tom smyslu, že jeden člen dvojice má značku AG.* a druhý buď AA.*, nebo X.*. Tvary, které z hlediska rodilého mluvčího pokládáme za přijatelné (vyšší míru přijatelnosti naznačujeme znakem „?“ ve sloupci určeném pro poznámky o značkování v korpusu SYN a o výskytu v korpusu czTenTen a na internetu), k nimž jsme ale nenašli doklady ani v existujících korpusech, ani na internetu, jsou označeny „*“. Tvary, které pokládáme za nepřijatelné, nevypisujeme a v příslušném okénku tabulky uvádíme „0“. Varianty na -ící budou mít [GMU=i], varianty na ‑oucí budou mít [GMU=u] a varianty na -[eěa]jící budou mít [GMU=C].

Tabulka 6: oucí/ící/ající


oucí


ící


ající


plakat

pláčoucí

/*plačoucí

internet122/?

plačící

/pláčící

AA.*/

X.*

plakající

AG.*

mazat

mažoucí

internet123

mažící

czTenTen12124

mazající

AG.*

vázat

vážoucí

internet125

vážící126

/vížící

AG.*/

AA.*

vázající

X.*

kázat

kážoucí

internet127

kážící

X.*

kázající

AG.*

psát

píšoucí

czTenTen12128

píšící

AG.*

*psající


páchat

pášoucí

czTenTen12129

pášící

X.*

páchající

AG.*

lhát

lhoucí/

lžoucí

AG.*/

czTenTen12130

*lžící

czTenTen12131

lhající

X.*

skákat

*skáčoucí

?

skáčící

X.*

skákající

AG.*

dýchat

*dýšoucí


dýšící

X.*

dýchající

AG.*

tázat (se)

*tážoucí


tážící

X.*

tázající

AG.*

kysat

*kyšoucí

?

kyšící

internet132

kysající

AG.*

párat

párat (se)

*pářoucí

?

pářící133

AG.*

párající

AG.*

řezat

řežoucí

czTenTen12134

0


řezající

AG.*

česat (se)

češoucí

czTenTen12135

0


česající

AG.*

kousat

koušoucí

internet136

0


kousající

AG.*

stlát

steloucí

AG.*

0


0


orat

*ořoucí

?

0


orající

AG.*

klusat

*klušoucí

?

0


klusající

AG.*

křesat

*křešoucí


0


křesající

AG.*

tesat

*tešoucí

?

0


tesající

AG.*

vrzat

*vržoucí

?

0


vrzající

AG.*

hrýzt/

hryzat (se)137

*hryžoucí/

hryzoucí

?/

X.*

hryžící

AG.*

hryzající

AG.*

troucí/třoucí/třící

Tabulka 7 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru umřít. Některá slovesa, jejichž tvary se tvoří podle vzoru umřít, mají dubletu ve 3. os. pl. i ve tvaru přechodníku přítomného (oni trou/třou). V důsledku existence tvarových dublet, ať už je stav současné kodifikace jakýkoliv, existují slovotvorné dublety/triplety procesuálních adjektiv na - odpovídající dubletám opěrného tvaru (tvar 3. osoby pl./přechodníku přítomného). Jedná se o 6 dvojic/trojic slovotvorných synonym (dublet/triplet), v jejichž značkování je rozpor v tom smyslu, že jeden člen dvojice/trojice má značku AG.* a druhý buď AA.*, nebo X.*. Tvary, které z hlediska rodilého mluvčího pokládáme za přijatelné (vyšší míru přijatelnosti naznačujeme znakem „?“ ve sloupci určeném pro poznámky o značkování v korpusu SYN a o výskytu v korpusu czTenTen12 a na internetu), k nimž jsme ale nenašli doklady ani v existujících korpusech, ani na internetu, jsou označeny „*“. Tvary, které pokládáme za nepřijatelné, nevypisujeme a v příslušném okénku tabulky uvádíme „0“. Varianty na ‑ící budou mít [GMU=i], varianty na ‑ř-oucí budou mít [GMU=1u] a varianty na -r-oucí budou mít [GMU=u].

Tabulka 7: [rř]oucí/řící


.*roucí


.*řoucí


.*řící


dřít

droucí

AG.*

dřoucí

X.*

dřící

AG.*

mřít

mroucí

AG.*

mřoucí

czTenTen12138

mřící

czTenTen12139

přít (se)

proucí

czTenTen12140

přoucí

X.*

přící

czTenTen12141

třít (se)

troucí

AG.*

třoucí

X.*

třící

X.*

vřít

vroucí

AA.*/AG.*

vřoucí

czTenTen12142

vřící

X.*

zřít

zroucí

czTenTen12143

*zřoucí


zřící

X.*

pekoucí/pečoucí/pečící

Tabulka 8 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru péci. Některá slovesa, jejichž tvary se tvoří podle vzoru péci, mají dubletu ve 3. os. pl. i ve tvaru přechodníku přítomného. V důsledku existence tvarových dublet, ať už je stav současné kodifikace jakýkoliv, existují slovotvorné dublety/triplety procesuálních adjektiv na - odpovídající dubletám opěrného tvaru (tvar 3. osoby pl./přechodníku přítomného). Jedná se 7 dvojic/trojic slovotvorných synonym (dublet/triplet), v jejichž značkování je rozpor v tom smyslu, že jeden člen dvojice má značku AG.* a druhý buď AA.*, nebo X.*. Tvary, které z hlediska rodilého mluvčího pokládáme za přijatelné (vyšší míru přijatelnosti naznačujeme znakem „?“ ve sloupci určeném pro poznámky o značkování v korpusu SYN a výskytu v korpusu czTenTen12 a na internetu), k nimž jsme ale nenašli doklady ani v existujících korpusech, ani na internetu, jsou označeny „*“. Tvary, které pokládáme za nepřijatelné, nevypisujeme a v příslušném okénku tabulky uvádíme „0“. Varianty na -ící budou mít [GMU=i], varianty na ‑[kh]-oucí budou mít [GMU=u] a varianty na -[čž]-oucí budou mít [GMU=1u].

Tabulka 8: [kčhž]oucí/čící


.*[kh]oucí


.*[čž]oucí


.*čící


péci

pekoucí

AG.*

pečoucí

internet144

pečící

AG.*

síci/séci

sekoucí

czTenTen12145

sečoucí

int.146

sečící

AG.*

tlouci

tlukoucí

AG.*

tlučoucí

czTenTen12147

tlučící

AG.*

vléci

vlekoucí148

AG.*

vlečoucí

czTenTen12149

vlečící

AG.*

moci

mohoucí

AG.*

můžoucí

internet150

0


stříci (s)

střehoucí151

AA.*

0


0152


říci

řkoucí153

AG.*

0


0


padnoucí/tnoucí/jmoucí

Tabulka 9 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru tisknout, popř. začít, a kolísající od vzorů nést (bříst) a péci (říci, stříci se). Při procházení seznamů adjektiv .*[nm][(ou)|í]cí jsme zaznamenali poměrně nezanedbatelný počet adjektiv, která lze vztáhnout ke slovesům a interpretovat je jako procesuální, která nicméně nejsou označkována jako AG.*. Důvodem je patrně to, že základová slovesa těchto adjektiv jsou většinou dokonavá, a neměla by tudíž podle platných omezení tvořit tvary přechodníku přítomného. Otázka je, zda a jak blokace tvoření tvarů přechodníku přítomného (málo frekventovaný tvar) blokuje reálné tvoření příslušných adjektiv. Jedná se o 26 adjektiv, v jejichž značkování je rozpor v tom smyslu, že mají ve své menšině značku AA.*, většinou jsou nerozpoznány a mají značku X.*. Nicméně se vztahují ke slovesům. Varianty na -[nm]-oucí budou mít [GMU=u] a ostatní varianty na -oucí budou mít [GMU=Bu]154.

Tabulka 9: noucí

blýsknout (se)

blýsknoucí

X.*

břednout/bříst

břednoucí

X.*

hryznout155

hryznoucí

X.*

chl[aá]dnout

chl[aá]dnoucí

X.*

klesnout

klesnoucí

X.*

mihnout (se)

mihnoucí

X.*

padnout

padnoucí

AA.*

pnout (se)

pnoucí

X.*

prchnout

prchnoucí

X.*

ř[ií]dnout

ř[ií]dnoucí

X.*

sednout

sednoucí

X.*

smrádnout

smrádnoucí

X.*

stárnout

stárnoucí

X.*

střetnout (se)

střetnoucí

X.*

stanoucí??stanout

stanoucí

X.*

svitnout

svitnoucí

X.*

šlehnout

šlehnoucí

X.*

*temnout

temnoucí156

X.*

tnout/tít

tnoucí

X.*

troufnout (si)

troufnoucí

X.*

vrhnout (se)

vrhnoucí

X.*

vzniknout

vzniknoucí

X.*

vzplanout

vzplanoucí

AA.*

zablesknout (se)

zablesknoucí

X.*

(z)řeknout/

(z)říci (se)

(z)řeknoucí157

X.*

žnout/žít158

žnoucí

AA.*

Od slovesa padnout je kromě adjektiva padnoucí (dobře <padnoucí> oblek) nepravidelně utvořeno též adjektivu padoucí.159

Zatímco adjektivum dmoucí je běžné a správně označkované jako AG.*, adjektivum jmoucí v korpusu SYN doloženo není. Tabulka 9a níže zachycuje 4 adjektiva derivovaná od slovesa jmout/vzít. Na internetu se pak objevují řídké doklady adjektiva jmoucí, přičemž jde patrně o okazionální spojení, která napodobují kompozita (dech jmoucí, srdce jmoucí patrně aktualizace dechberoucí, srdcervoucí). Otázka je, zda a jak blokace tvoření tvarů přechodníku přítomného (málo frekventovaný tvar) blokuje reálné tvoření příslušných adjektiv.160

Tabulka 9a: moucí

jmout

jmoucí

internet161

vzít

vezmoucí

internet162

pojmout

pojmoucí

czTenTen12163

přijmout

přijmoucí

czTenTen12164

prohlubující

Tabulka 10 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru kupovat. Při procházení seznamů adjektiv na .*ující jsme zaznamenali poměrně nezanedbatelný počet adjektiv, která lze vztáhnout ke slovesům a interpretovat je jako procesuální. Ta ovšem nejsou označkována jako AG.*. Podle vzoru kupovat se tvoří velká část nově tvořených českých sloves (produktivní typ). Od nich se pak pravidelně odvozují adjektiva mj. procesuální na -ující. Seznam je tedy nutně otevřený. V tabulce jsou zpracovány doklady z korpusu SYN, které mají vyšší frekvenci (vyšší a rovnu 5), nikoli všechny nalezené. Úplný seznam lze získat z korpusu SYN dotazem [lemma=".*ující.*" & tag="[AX][AX@].*"].165 Do tabulky jsme záměrně nezařadili kompozita ani deriváty tvořené prefixoidy (např. sebe.*ující.*), neboť máme za to, že otázka kompozit se bude řešit jednotně na jiné úrovni (bylo by asi dobré uvažovat o spolehlivých pravidlových guesserech).

Důvod nezařadit tato adjektiva (jejich značkování jako AA.*) může souviset s tím, že řada z nich jsou adjektiva od sloves cizího původu, která bývají interpretována jako obouvidová (viz výše k souvislosti mezi videm a blokací tvoření adjektiv na -[(ou)|í]cí). Jedná se o 54 adjektiv, v jejichž značkování je rozpor v tom smyslu, že buď mají značku AA.*, nebo X.*, ačkoliv se vztahují ke slovesům. V některých případech se ovšem zdá, že sloveso je pouze potenciální (není v úzu obvyklé), adjektiva mají význam napodobující to, co vyjadřuje základové substantivum.

Tabulka 10: ující

okouzlovat

okouzlující166

AA.*

zničit

zničující167

AA.*

prohlubovat

prohlubující

AA.*

doskakovat

doskakující

AA.*

psychologizovat

psychologizující

AA.*

stísňovat

stísňující168

AA.*

dynamizovat

dynamizující

AA.*

zajišťovat

zajišťující

X.*

sociologizovat

sociologizující

AA.*

rockovat

rockující

AA.*

jazzovat

jazzující

X.*

znejisťovat

znejisťující

AA.*

erotizovat

erotizující

AA.*

euforizovat

euforizující

AA.*

naivizovat

naivizující

AA.*

monumentalizovat

monumentalizující

AA.*

demytizovat

demytizující

AA.*

zpracovat

zpracující169

AA.*

agonizovat

agonizující

AA.*

přepracovat

přepracující

X.*

plynovat

plynující

AA.*

denervovat

denervující

X.*

pauzírovat

pauzírující

X.*

hysterizovat

hysterizující

AA.*

přenocovat

přenocující

AA.*

fibrotizovat

fibrotizující

X.*

utěsňovat

utěsňující

X.*

punkovat

punkující

X.*

komunizovat

komunizující

X.*

demystifikovat

demystifikující

AA.*

znicotňovat

znicotňující

AA.*

subsistovat

subsistující

X.*

odosobňovat

odosobňující

AA.*

adoptovat

adoptující

X.*

remontovat

remontující

X.*

proliferovat

proliferující

X.*

italianizovat

italianizující

X.*

dokumentarizovat

dokumentarizující

AA.*

remizovat

remizující

X.*

skriptovat

skriptující

X.*

nektarovat

nektarující

X.*

joggovat

joggující

X.*

bluesovat

bluesující

X.*

anoncovat

anoncující

X.*

abscedovat

abscedující

X.*

kompetovat

kompetující

X.*

sklerozovat

sklerozující

X.*

nihilizovat

nihilizující

AA.*

klasizovat

klasizující

X.*

hladovkovat

hladovkující

X.*

egyptizovat

egyptizující

X.*

dovolenkovat

dovolenkující

X.*

disentovat

disentující

X.*

bulvarizovat

bulvarizující

X.*

předčící

Tabulka 11 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru prosit/trpět. Při procházení seznamů adjektiv .*ící ([lemma=".*ící.*" & lemma!=".*[eěua]jící.*ů]) jsme zaznamenali několik adjektiv, která lze vztáhnout ke slovesům a interpretovat je jako procesuální, která nicméně nejsou označkována jako AG.* Podle vzorů prosit/trpět se tvoří část nově tvořených českých sloves. Od nich se pak pravidelně odvozují adjektiva mj. procesuální na -ící. Seznam je tedy nutně otevřený (produktivní typy). V tabulce jsou zpracovány doklady z korpusu SYN, které mají vyšší frekvenci (vyšší a rovnu 5), nikoli všechny nalezené. Úplný seznam lze získat z korpusu SYN dotazem [lemma=".*ící.*" & lemma!=".*[eěua]jící.*" & tag="[AX][AX@].*"]. Do tabulky jsme záměrně nezařadili kompozita ani deriváty tvořené prefixoidy (např. sebe.*ící), neboť máme za to, že otázka kompozit se bude řešit jednotně na jiné úrovni (bylo by asi dobré uvažovat o spolehlivých pravidlových guesserech).

Jedná se o 10 adjektiv, v jejichž značkování je rozpor v tom smyslu, že buď mají značku AA.*, nebo X.*, ačkoliv se vztahují ke slovesům.

Tabulka 11: ící

?smrtit

smrtící170

AA.*

strážit

strážící

AA.*

říjet

říjící

AA.*

čmoudit

čmoudící

X.*

slušet

slušící

X.*

předčít

předčící

X.*

prázdnit

prázdnící

X.*

dýmit

dýmící

X.*

týčit (se)171

týčící

X.*

mátořit (se)

mátořící

X.*

zříkající

Tabulka 12 níže zachycuje adjektiva derivovaná od sloves, která patří ke vzoru dělat. Při procházení seznamů adjektiv .*ající jsme zaznamenali několik adjektiv, která lze vztáhnout ke slovesům a interpretovat je jako procesuální, která nicméně nejsou označkována jako AG.* Podle vzorů dělat se tvoří část nově vznikajících českých sloves (produktivní typ). Od nich se pak pravidelně odvozují adjektiva mj. procesuální na -ající. Seznam je tedy nutně otevřený. V tabulce jsou zpracovány doklady z korpusu SYN, které mají vyšší frekvenci (vyšší než 5 a rovnu 5), nikoli všechny nalezené. Úplný seznam lze získat z korpusu SYN dotazem [lemma=".*ající.*" & tag="[AX][AX@].*"]. Do tabulky jsme záměrně nezařadili kompozita ani deriváty tvořené prefixoidy (např. sebe.*ající), neboť máme za to, že otázka kompozit se bude řešit jednotně na jiné úrovni (zdá se, že by bylo dobré uvažovat o spolehlivých pravidlových guesserech).

Jedná se o 4 adjektiva, v jejichž značkování je rozpor v tom smyslu, že mají značku AA.* (některá vedle značky AG.*), ačkoliv se vztahují ke slovesům.

Tabulka 12: ající

stávat

stávající172

AG.*/ AA.*

přelétat

přelétající173

AG.*/AA.*

zříkat (se)

zříkající (se)

AA.*

přitakat

přitakající

AA.*


6.1.2 Adjektiva od nepravidelných sloves

Vedle pravidelně tvořeného jsoucí a poněkud anomálního budoucí se od slovesa být tvoří anomálně okrajový „filozofický“ termín bytoucí. Adjektivum budoucí (tvořené od „budoucího“ kmene) i další synchronně „nepravidelně“ tvořená adjektiva užívaná též v dezaktualizovaných174 významech (horoucí, živoucí, žádoucí) jsou označkována jako AA.*. Některá navrhujeme značkovat jako [POS=A & SUB=0], viz výše § 3.2. Procesuální adjektivum od slovesa dát se tvoří buď synchronně nepravidelně (dadoucí), nebo pravidelně (dající). Nepravidelně se tvoří adjektiva na [(ou)|í]cí také od sloves vědět a vidět. Nepravidelné tvoření adjektiv od slovesa chtít je uvedeno výše. Varianty na -ící budou mít [GMU=i], varianty na ‑oucí budou mít [GMU=u]. U adjektiv od tří kořenů slovesa být se domníváme, že řadit příslušná adjektiva pod několikanásobné lemma {bytoucí, jsoucí, budoucí} a odlišit je pomocí [VRB=[FPB]] by bylo poněkud násilné. Navrhujeme je lemmatizovat jako tři samostatná lemmata.

Přehled tvarů adjektiv od nepravidelných sloves být, dát, vědět, vidět uvádíme v tabulce 13.

Tabulka 13

být

jsoucí

AG.*

budoucí/

bytoucí

AA.*/

czTenTen12175

dát

dadoucí

czTenTen12176

dající

X.*177

vědět

vědoucí

AG.*

vědící

czTenTen12178

vidět

vidoucí

AG.*

vidící

AG.*

Tabulka 13a zahrnuje výjimečné dublety adjektiv na -[(ou)|í]cí, kde adjektiva na oucí jsou starší varianty v dnešním jazyce většinou používané v dezaktualizovaných významech. Varianty na -ící jsou synchronně pravidelně utvořené a užívané. Nicméně u každé z dvojic je možné sledovat trochu odlišné vztahy. Dvojice slovoucí/slující je synonymní, adjektivum živoucí má většinou význam adjektiva živý, ale někdy i žijící. Užití adjektiva horoucí je silně vázáno na kolokace se substantivy láska, srdce, touha, vášeň… a ve srovnání s adjektivem hořící má význam metaforický. Adjektivum žádoucí má význam pasivní (žádaný) a aktivní význam má adjektivum žádající. S ohledem na míru dezaktualizace a sémantických posunů by u adjektiv horoucí, žádoucí a živoucí měla být interpretace [POS=A & SUB=0], viz výše § 3.2. Odlišit dvojici slovoucí/slující by měla vyřešit příslušná globální mutace.

Tabulka 13a

hořet

horoucí

AA.*

hořící

AG.*

žádat

žádoucí

AA.*

žádající

AG.*

žít

živoucí

AA.*

žijící

AG.*

slout

slovoucí

czTenTen12179

slující

AG.*180

6.1.3 Slovotvorná homonyma

Procesuální adjektiva na [(ou)|í]cí jsou tvary dosti výrazné (zakončení není homonymní se zakončeními produktivního typu účelových adjektiv, formálně shodná zakončení má pouze několik desítek většinou hapaxových desubstantivních adjektiv v etymologické figuře hebrejského superlativu jako např. tma tmoucí (Osolsobě 2013). Tvarová homonymie se týká především obecnější vnitroparadigmatické homonymie společné všem adjektivům skloňovaným podle vzoru jarní. Přesto se v této skupině objevují vedle slovotvorných synonym (dublet, triplet) i slovotvorná homonyma, jak jsme se o nich zmínili výše v textu i v poznámkách. Na závěr uvedeme jejich přehled v tabulce 14.

Tabulka 14

dát/ dát (se)

dající 1 (a/b)181

dát (se)

(=dít (se))

dající 2182

chybit

chybící 1183

chybět

chybící 2184

/chybějící

pářit/pářit (se)

pářící 1(a/b)185

párat/párat (se s)

pářící 2186

smát (se)

smějící 1187

smět

smějící 2188

stávat/

stávat (se)

stávající 1 (a/b)189

?

stávající190

vážit/vážit (si)

vážící 1191

vázat/ vázat (se)

vážící 2192

Je otázka, jak se bude s těmito slovotvornými homonymy zacházet a) na úrovni lemmatizace (zlaté pravidlo morfologie, srov. Hlaváčová 2009) a b) desambiguace (sémantická desambiguace). Zkušenost s ručním vyhledáváním dokladů pro méně frekventované významy ukazuje, že negativně v některých (nikoli ve všech) případech by bylo možné se opřít o morfosyntaktická pravidla souvýskytu se/si a adjektiv od reflexivních sloves a za využití valence193 (Petkevič 2013).

6.1.4 Substantivizace adjektiv na -[(ou)|í]cí zaznamenaná na úrovni slovníku

Běžné výkladové slovníky zaznamenávají nejrůznější slovnědruhové přechody, přičemž lze dosti dobře vysledovat řadu nekonzistencí.194 Tato praxe je do velké míry přenesena do praxe slovníků pro aplikace automatické morfologické analýzy, kde je příčinou řady problémů na úrovni desambiguace.195

S ohledem na fakt, že slovnědruhová transpozice adjektiv obecně a adjektiv na -[(ou)|í]cí zvláště představuje otevřený proces, navrhujeme tuto víceznačnost ve slovníku automatického morfologického analyzátoru zaznamenávat pouze ve vybraných (frekventovaných) případech a na ostatní případy rezignovat. Kromě lexikalizovaných a frekventovaných transpozic jako cestující, vedoucí... existuje totiž široké pásmo táhnoucí se až k okazionalismům. Domníváme se, že pokud by se měla užití ve funkci substantiva odlišit od užití ve funkci adjektiva, pak by se tak mělo dít až na základě desambiguačních pravidel. Přegenerování interpretací (POS=[NA]) na úrovni morfologického slovníku by bez vyřešení desambiguace bylo kontraproduktivní.

V tabulce 15 níže uvádíme přehled lemmat adjektiv na -[(ou)|í]cí, která mají (podle výsledků desambiguace, jak ji lze sledovat v korpusu SYN) na úrovni morfologického slovníku zaznamenánu možnost transponovaného užití ve funkci substantiva. Výsledky desambiguace nejsou zcela uspokojivé. Navíc lze na základě drobných sond do korpusu zjistit, že substantivizovaná užití se týkají i adjektiv, pro která tato možnost není na úrovni morfologického slovníku zaznamenána.

Lemmata jsme získali z korpusu SYN za použití dotazu [lemma=".*[(ou)|í]cí.*" & tag="NN.*"]. Řadu dalších kompozit je možné získat, projdeme-li seznamy získané dotazem [lemma=".*[(ou)|í]cí.*" & tag="[AX].*"], jak jsme uvedli výše.

Z tabulky 12 níže je patrné, že ve slovníku jsou jako substantiva interpretována většinou kompozita (2. sloupec), většina z nich má ovšem také užití adjektivní.

K problematice zaznamenávání kompozit bude třeba na úrovni slovníku přistupovat jednotně. Návrh jak je uveden výše.

Tabulka 15

vedoucí

kolemjdoucí

cestující

protijedoucí

pracující

okolostojící

věřící

okolojdoucí

přísedící

vševědoucí


spolutrpící


protijdoucí


vševidoucí


místopředsedající


délebydlící


okolojedoucí


spolubydlící


spolucestující


strojvedoucí


stavbyvedoucí


vlakvedoucí


dílovedoucí


obchodvedoucí


6.2 Adjektiva na -[bdfghkmpstvz]ší tvořená (generovaná) od sloves

Nesrovnatelně méně dokladů nekonzistencí, s nimiž se setkáváme u značkování adjektiv od sloves na -[(ou)|í]cí, je u adjektiv na -ší od sloves, která mají zpravidla značku AM.*.

Požadavek 2: Ve slovníku morfologického analyzátoru sjednotit popis adjektiv od sloves tak, aby adjektiva na -ší/vší formálně odvoditelná od slovesných základů byla konzistentně interpretována jako AM.*. K diskusi lze ponechat některé drobnosti, celkově je ale směr úprav jednoznačný.

Nejdříve jsme na základě korpusu SYN vytvořili seznam lemmat, která splňují formální podmínky (mohou být tvary adjektiv od přechodníku minulého), a sice pomocí dotazu [lemma=".*[szdtbfvmpghk]ší" & tag="[AX][AX@].*"].

Z poměrně rozsáhlého seznamu jsme ručně vybrali adjektiva, která lze pokládat za správně utvořená a vztahující se ke slovesům. Opěrným tvarem adjektiv z přechodníku minulého je tvar l-ového příčestí/přechodník minulý zpravidla dokonavých sloves. Je patrné, že v seznamu se objevují většinou adjektiva tvořená od sloves, která mají v opěrném tvaru dubletu.

Seznam dále obsahuje kromě překlepů řadu hapaxových adjektiv a) nesprávně utvořených od nedokonavých sloves,196 b) nesprávně utvořených197 od sloves, jejichž infinitiv je na -[eě]t – měla by mít tvar adjektiva na -[eě]vší – a nesprávně jsou utvořena adjektiva na -ivší, c) kombinace a+b.198

Tabulka 16 níže zahrnuje 10 dvojic synonymních adjektiv (slovotvorné dublety), přičemž jeden člen dvojice je označkován jako AM.* a druhý je označkován buď jako AA.*, nebo většinou jako X.*, pouze ve dvou případech jsou oba členy dvojice správně označkovány jako AM.*. Tabulka je doplněna i v případě, že méně obvyklý tvar není doložen v korpusu SYN, ale lze jej najít jinde, popř. odpovídá intuici rodilého mluvčího.

Varianty by měly být ve značce odlišeny pomocí globální mutace. Varianty na -([nm]u|[eě])-vší budou mít [GMU=0], varianty na -[ai]v-ší budou mít [GMU=C] a varianty na -C199-ší budou mít [GMU=B]. Varianty budou mít několikanásobné lemma např. {přijmuvší, přijavší}, {zešílevší, zešílivší}, {vzkypěvší, vzkypivší}, {proniknuvší, pronikší}.

Tabulka 16

vzniknout

vznikší200

X.*

vzniknuvší

AM.*

proniknout

pronikší201

X.*

proniknuší

AM.*

povstat

povstanuvší

X.*

povstavší

AM.*

začít

začnuvší

X.*

začavší

czTenTen12202

započít

započnuvší

X.*

započavší

AM.*

nastat

nastavší

AA.*

nastanuvší

czTenTen12203

ujmout (se)

ujavší

X.*

ujmuvší

AM.*

přijmout

přijavší

AM.*

přijmuvší

AM.*

zešílet

zešílevší

AM*

zešílivší

AM.*

vzkypět

vzkypěvší

AM.*

vzkypivší

X.*

zmizet

zmizevší

AM.*

zmizivší

AA.*

V tabulce 16a uvádíme 4 správně utvořená adjektiva: zaspavší a konvertovavší (od obouvidového slovesa konvertovat) a prefixálně tvořené pozůstavší. Všechna mají vztah ke slovesu a měla by mít značku AM.*. Otázkou k diskusi je interpretace kompozita nanebevstoupivší.

Tabulka 16a

zaspat

zaspavší

X.*

konvertovat

konvertovavší

X.*

zůstat

pozůstavší

X.*

vstoupit na nebe

nanebevstoupivší

X.*

Obecně lze předpokládat, že pokud má být popis na rovině slovníku konzistentní, měla by se pozornost zaměřit

a) na adjektiva od sloves, která mohou mít ve tvaru l-ového příčestí/přechodníku minulého dubletu a

b) na obouvidová slovesa.

Pod a) spadají obecně slovesa II. třídy vzorů tisknout (tiskl/tisknul) a začít (pojal/pojmul). Z drobných sond do korpusu SYN je patrné, že značkování adjektiv od prefigovaných variant slovesa jmout je nejednotné. Např. tvar adjektiva neujavší (se) má značku X.*, kdežto adjektiva přijavší, přijmuvší i ujmuvší (se) jsou správně lemmatizována a mají značku AM.* stejně jako např. vzňavší (se). Nejde patrně nikterak o rozdíl mezi tvary více/méně frekventovanými. Spíše jsou varianty (slovotvorná synonyma) popsány nekonzistentně. Zejména v případě sloves typu začít se jedná o uzavřenou množinu základů,204 od nichž se adjektiva mohou tvořit. V případě adjektiv od vzoru tisknout je situace poněkud problematičtější. Dostupné popisy v mluvnicích neposkytují formální pravidla pro tvoření dubletních tvarů l-ových příčestí (pravidla jsou vágní). Domníváme se, že by nemělo být zcela nepřípustné, aby ve strojovém popisu byla zahrnuta pravidla pro generování dublet ve všech případech s výjimkou sloves lnout, mnout, hrnout...205 (všech jejich prefigovaných variant – prolnout, přilnout, vymnout, nahrnout...). Drobné nedostatky jsou ve značkovaní adjektiv od slovesa jít (tvary sšedší206 a odšedší jsou nerozpoznány, mají značku X.*, zatímco tvary jako přišedší, vyšedší, vešedší mají příslušné lemma a jsou označkovány správně jako AM.*). Adjektiva od prefigovaných variant slovesa jíst mohou být homonymní s adjektivy od slovesa jet, přestože se žádné doklady v korpusu SYN nevyskytly (např. vyjedší, dojedší). Navrhujeme slovník nepřegenerovávat.


6.3 Shrnutí

Uvedené seznamy207 a komentáře pokládáme za podklady pro správce slovníku budoucího morfologického analyzátoru, který by měl vzniknout v rámci projektu NovaMorf. Je možné, že něco bude ještě doplněno, nicméně předpokládáme, že by se na základě námi navržených úprav:

a) měla zvýšit konzistence morfologického značkování,

b) měly opravit některé drobné chyby ve značkování i v lemmatizaci adjektiv na .*[(ou) |í]cí.* a .*ší,

c) mělo rozšířit pokrytí slovníku a

d) neměl by narůst (až na několik drobností uvedených výše) počet homonymních tvarů nabízených k desambiguaci.

Nadále je třeba zvážit podíl guesserů související se slovotvornou produktivitou. Máme na mysli téměř paradigmatické tvoření procesuálních adjektiv od sloves, která tvoří tvary podle vzorů produktivních tříd (viz výše otevřené seznamy).

K další diskusi zůstává řešení otázek a) slovotvorných homonym, b) slovnědruhových transpozic a c) kompozit. K diskusi je třeba rovněž předložit otázku, jak zacházet s ústrojně utvořenými adjektivy od substandardních (nekodifikovaných) opěrných tvarů (např. brající, hnající, ...). Obdobně je třeba zamyslet se nad tvary adjektiv na -[(ou)|í]cí od dokonavých sloves a adjektiv na -ší od sloves nedokonavých. Ke značkování obojího navrhujeme využít konceptu globální mutace.


6.4 Příloha

Následující přehled obsahuje pokus formálně zaznamenat vztahy mezi slovesnými tvary a lemmaty adjektiv od nich odvozenými/odvoditelnými. Ve stávajících slovnících (brněnském i pražském) nejsou zachyceny všechny varianty tvarů sloves a všechny varianty adjektiv na [(ou)|í]cí a ší od těchto tvarů odvoditelných (veškeré potence tvarosloví a slovotvorby). Z tohoto důvodu není možné níže uvedená pravidla mechanicky „napasovat“ na stávající data uložená ve slovnících.208 Je třeba postupovat po jednotlivých slovních tvarech/lemmatech, jak je to naznačeno v předchozím textu. Nicméně pokládáme za užitečné pokusit se naznačit vztahy na obecnější rovině a nějak je formálně popsat.209

6.4.1 Pravidla vzájemných vztahů mezi slovesnými tvary a lemmaty adjektiv na [(ou)|í]cí/AG.*

chtějící/chtící (klanící/klanějící)

tlející/tlící

[word=".*í" & word!=".*[aui]jí" & tag="VB-P---3.*"]

pak

lemma=".*ící" & tag="AG.*"

klepoucí/klepající

[word=".*ou" & tag="VB-P---3.*"]

[word=".*ají" & tag="VB-P---3.*"]

pak

lemma=".*oucí" & tag="AG.*"

lemma=".*ající" & tag="AG.*"

mažoucí/mažící/mazající

[word=".*ou" & tag="VB-P---3.*"]

[word=".*í" & tag="VB-P---3.*"]

[word=".*ají" & tag="VB-P---3.*"]

pak

lemma=".*oucí" & tag="AG.*"

lemma=".*ící" & tag="AG.*"

lemma=".*ající" & tag="AG.*"

troucí/třoucí/třící

[word=".*rou" & tag="VB-P---3.*"]

[word=".*řou" & tag="VB-P---3.*"]

pak

lemma=".*roucí" & tag="AG.*"

lemma=".*řoucí" & tag="AG.*"

lemma=".*řící" & tag="AG.*"

pekoucí/pečoucí/pečící

[word=".*kou" & tag="VB-P---3.*"]

[word=".*čou" & tag="VB-P---3.*"]

pak

lemma=".*koucí" & tag="AG.*"

lemma=".*čoucí" & tag="AG.*"

lemma=".*čící" & tag="AG.*"

lhoucí/lžoucí

[word=".*hou" & tag="VB-P---3.*"]

[word=".*žou" & tag="VB-P---3.*"]

pak

lemma=".*houcí" & tag="AG.*"

lemma=".*žoucí" & tag="AG.*"

padnoucí/tnoucí

[word=".*nou" & tag="VB-P---3.*"]

pak

lemma=".*noucí" & tag="AG.*"

jmoucí

[word=".*mou" & tag="VB-P---3.*"]

pak

lemma=".*moucí" & tag="AG.*"

prohlubující

[word=".*ují" & tag="VB-P---3.*"]

pak

lemma=".*ující" & tag="AG.*"

předčící

[word=".*í" & word!=".*[eěaui]jí" & tag="VB-P---3.*"]

pak

lemma=".*ící" & tag="AG.*"

zříkající

[word=".*ají" & tag="VB-P---3.*"]

pak

lemma=".*ající" & tag="AG.*"

Výjimky:

[word=".*jsou" & tag="VB-P---3.*"]

pak

lemma="jsoucí" & tag="AG.*"

lemma="budoucí" & tag="A0.*"

lemma="bytoucí" & tag="A0.*"

[word=".*dají" & tag="VB-P---3.*"]

pak

lemma=".*dadoucí" & tag="AG.*"

lemma=".*dající" & tag="AG.*"

[word=".*vidí" & tag="VB-P---3.*"]

pak

lemma=".*vidoucí" & tag="AG.*"

lemma=".*vidící" & tag="AG.*"

[word=".*vědí" & tag="VB-P---3.*"]

pak

lemma=".*vědoucí" & tag="AG.*"

lemma=".*vědící" & tag="AG.*"

[word=".*hoří" & tag="VB-P---3.*"]

pak

lemma=".*hořící" & tag="AG.*"

lemma=".*horoucí" & tag="A0.*"

[word=".*žádají" & tag="VB-P---3.*"]

pak

lemma=".*žádající" & tag="AG.*"

lemma=".*žádoucí" & tag="A0.*"

[word=".*žijí" & tag="VB-P---3.*"]

pak

lemma=".*žijící" & tag="AG.*"

lemma=".*živoucí" & tag="A0.*"

[word=".*slují" & tag="VB-P---3.*"]

pak

lemma=".*slující" & tag="AG.*"

lemma=".*slovoucí" & tag="AG.*"

6.4.2 Pravidla vzájemných vztahů mezi slovesnými tvary a lemmaty adjektiv na ší/AM.*

[word=".*[szdtkh|(ch)]l" & tag="VpMS.*"]

pak

lemma=".*[szdtkh|(ch)]ší" & tag="AM.*"

[word=".*mul" & word=".*jal" & tag="VpMS.*"]

pak

lemma=".*muvší" & tag="AM.*"

lemma=".*javší" & tag="AM.*"

[word=".*mul" & word=".*ňal" & tag="VpMS.*"]


pak

lemma=".*muvší" & tag="AM.*"

lemma=".*ňavší" & tag="AM.*"

[word=".*tnul" & word=".*ťal" & tag="VpMS.*"]

pak

lemma=".*tnuvší" & tag="AM.*"

lemma=".*ťavší" & tag="AM.*"

[word=".*pnul" & word=".*pjal" & tag="VpMS.*"]

pak

lemma=".*pnuvší" & tag="AM.*"

lemma=".*pjavší" & tag="AM.*"

[word=".*[aeěiuy]l" & tag="VpMS.*"]

pak

lemma=".*[aeěiuy]vší" & tag="AM.*"

[word=".*ál" & tag="VpMS.*"]

pak

lemma=".*avší" & tag="AM.*"

Výjimka:

[word=".*šel" & tag="VpMS.*" & lemma=".*jít"]

pak

lemma=".*šedší" & tag="AM.*"


7 Podklady pro úpravy slovníku automatického morfologického analyzátoru III

7.1 Pasivní (n-ová/t-ová) příčestí a jmenné tvary adjektiv tvořené (generované) pravidelně od sloves

Tato kapitola si klade za cíl v návaznosti na navrhované úpravy popisu jmenných tvarů adjektiv a tvarů participií n-ových a t-ových (Hlaváčová 2009, s. 121n.) především upozornit na některé nekonzistence, které se objevují ve značkování tvarů, jichž by se uvedené změny měly týkat.

Změna dosavadního způsobu značkování tvarů pasivních (n-ových/t-ových) příčestí (generovaných od pasivního slovesného kmene) – a to tak, že stávající značka (Vs.*) bude nahrazena značkou, v níž bude zakódováno, že jde o tvar od slovesa, nicméně na pozici slovní druh bude uvedeno, že jde o adjektivum [POS=A & SUB=V & VRB=T & NOM=J] – je popsána výše.210

Problém spatřujeme v tom, že a) některé tvary (substandardní, ale i standardní) n-ových/t-ových příčestí, které lze pravidelně tvořit od sloves, mají ve stávajícím značkování značku AC.* a b) některé (především substandardní) tvary nejsou rozpoznány automatickou morfologickou analýzou. Naším cílem bude podat přehled tvarů, o které se jedná, a návrh pravidel pro úpravu slovníku.

Navrhované úpravy by měly přispět k tomu, aby popis tvarů pasivních příčestí (krátkých tvarů deverbativních adjektiv n-ových/t-ových) i tvarů adjektiv od nich tvořených (dlouhých tvarů deverbativních adjektiv n-ových/t-ových) byl konzistentní.

7.1.1 Tvary označené AC.* (X.*), které lze vztáhnout ke slovesným pasivním kmenům

Předběžný seznam tvarů jsme získali tak, že jsme ze všech tvarů, které mají v korpusu SYN značku AC.* (tag=“AC.*“) pomocí p-filtru vybrali lemmata, která splňují formální podmínky „být adjektivizovaným českým participiem n-ovým/t-ovým ([lemma=".*[eěa]ný" | lemma=".*[aeiuy]tý"]). Z celkového počtu 44 lemmat jsme ručně odstranili 10 (ženatý, sytý, bohatý, přirozený, důležitý, mrzutý, svatý, zkušený, šílený, roztržitý) lemmat, která sice splňovala formální podmínky, ale nevztahovala se ke slovesným kmenům pasivních příčestí. Získali jsme tak seznam 34 lemmat, z nichž 2 (polozapomenutý, polozadušený) pokládáme za diskutabilní, pokud jde o možnost interpretace vztahu k pasivním příčestím, protože jde o kompozita, která by se na úrovni slovníku měla patrně řešit jednotně guessery.

Nalezené tvary jsme dále analyzovali a zjistili jsme, že je lze roztřídit do 4 skupin:

a) nestandardní tvary, které jsou tvořeny analogicky jako standardní tvary interpretované jako Vs.*;

b) standardní tvary, které jsou tvořeny analogicky jako standardní tvary interpretované jako Vs.*;

c) standardní tvary, které jsou tvořeny analogicky jako standardní tvary interpretované jako Vs.*, ve slovníku mají jak interpretaci Vs.*, tak AC.*, nebo X.*, přičemž desambiguační pravidla nejsou patrně stanovena ani nejsou stanovitelná;

d) sporné případy.

Skupina (a)

Do skupiny a) řadíme 12 lemmat, a to: unešen/unešený [AC.*] (nestandardní alternace s-š), stížen/stížený [AC.*] (pravopisná chyba v prefixu, správně je ztížen), zamčíno/zamčený [AC.*], zatopíno/zatopený [AC.*], otevříno/otevřený [AC.*], našetříno/našetřený [AC.*], políčíno/políčený [AC.*], naložíno/naložený [AC.*], postavíno/postavený [AC.*], nakouříno/nakouřený [AC.*], povolíno/povolený [AC.*], narafičíno/narafičený [AC.*] (nestandardní teritoriální varianty na .*íno).

Navrhujeme, aby tyto tvary byly vztaženy jak na úrovni lemmatu, tak morfologické značky k adjektivům [POS=A & SUB=V & VRB=T & NOM=[J-]]. Od standardních tvarů je lze na úrovni morfologické značky odlišit prostřednictvím mutací (viz Hlaváčová 2009, s. 121–128). Podrobný popis mutací tvarů příčestí trpných viz kapitola Slovesa # 08-05, § 4.6.

Navrhujeme, aby se na úrovni morfologického slovníku pamatovalo i na další (potenciálně tvořené) tvary tohoto typu.211 Na základě analýzy tvarů, které jsou doloženy v korpusu SYN (nejsou rozpoznány automatickou morfologickou analýzou), lze předpovědět, že varianta na íno se může tvořit od sloves s krátkými tvary na [eě]n, tedy od sloves I. třídy vzorů nést (vynešíno), péci (napečíno, posečíno, pomožíno, pečíno), umřít (povotevříno), sloves II. třídy vzoru tisknout, která mají příslušnou variantu n-ového příčestí (stažíno, odemčíno) a od sloves IV. třídy. Je třeba také uvážit, jak mohou vypadat alternace finální souhlásky kmene (srov. zaplacíno, přeplacíno, ale i předplatíno, uklizíno, naklizíno, ale i naklidíno, uklidíno212).

Tvary s nestandardní alternací s-š se týkají variant tvarů od slovesa nést (alternace lze synchronně interpretovat jako analogie k derivátům od slovesa nosit (srov. unesen(ý), ale unošen(ý), a tedy patrně i unešen(ý)). Obdobně nestandardní varianty existují i od slovesa vézt (vedle pravidelného .*vezen nestandardní .*vežen viz tvary přiveženy [X.*], zaveženo [X.*] atd.). Substandardní tvary se nevyskytují u derivací od slovesa lézt, příčinou zde nemusí být potenciální homonymie s existujícími tvary od slovesa ležet, ale intranzitivnost slovesa.

Shrnutí doložených nestandardních variant včetně stávajících interpretací je uvedeno v tabulce 17. Je možné, že se nestandardní varianty netvoří od všech prefigovaných variant uvedených sloves.

Tabulka 17

.*nést

.*nesen [Vs.*]

nešena [Vs.*]

unešen [AC.*]

[(před)| (od)| (za)| (povz)| (vy)| (s)|(do)| (pro)| (us)| (roz)]nešen [X.*]

.*vézt

.*vezen [Vs.*]



[(na)| (za)| (od)| (do)| (při)| (pře)]vežen [X.*]

Skupina (b)

Do skupiny b) řadíme 9 lemmat, a to spjat/spjatý [AC.*], napjat/napjatý [AC.*], uvozen/uvozený [AC.*], netknut/netknutý|tknutý [AC.*], předjat/předjatý [AC.*], vyšetřen/vyšetřený [AC.*], oprostěn/oprostěný [AC.*], přepadnut/přepadnutý [AC.*], denudován/denudovaný [AC.*]. Ve všech případech jde o pravidelně utvořené tvary od slovesného kmene. V některých případech jde patrně o nekonzistentní „rozgenerování“ příslušných tvarů od sloves, která mají dubletní tvary (tabulka 18).

Tabulka 18

spjat/spjatý [AC.*]

sepnut/sepnout [Vs.*] sepjat/sepnout [Vs.*]

napjat/napjatý [AC.*]

napnut/napnout [Vs.*]

předjat/předjatý [AC.*]

213odňat/odejmout [Vs.*]

odejmut/odejmout [Vs.*]

netknut/netknutý|tknutý [AC.*]

.*tčen/.*tknout [Vs.*]

přepadnut/přepadnutý [AC.*]

přepaden/přepadnout [Vs.*]

uvoděn/uvoděný [AC.*]

uvozen/uvodit [Vs.*]

oprostěn/oprostěný [AC.*]

oproštěn/oprostit [Vs.*]

Obecně můžeme říci, že se v češtině vyskytují dublety (triplety) tvarů adjektiv/pasivních příčestí u následujících tříd a vzorů:

Slovesa II. třídy vzorů tisknout a začít, mívají dubletní tvary, a sice bez kmenotvorné přípony [nm]u, nebo s ní. Ke slovesům II. třídy přecházejí i slovesa původně patřící do I. třídy. Ty pak mají kromě variantních infinitivů (např. obléci/obléknout, viz více kapitola Lemmatizace # 04, § 2.3 a kapitola Slovesa # 08-05, § 4.3) také variantní tvary pasivních příčestí (krátké i adjektivizované dlouhé tvary). Kromě toho mohou mít tvary od sloves II. třídy vzoru začít rozličné varianty vokalizovaných/nevokalizovaných prefixů, jimiž se liší tvary a lemmata (vokalizace prefixu je u nich vlastností tvaru, nikoli lemmatu, což není v češtině jinde běžné, viz více Osolsobě 2011, s. 40nn.).214 Dále existují variantní alternace na švu prefix/kořen u prefigovaných variant slovesa jmout a pravidelných derivací (adjektiv a dějových jmen), viz více Osolsobě 2011, s. 35).

Slovesa III. třídy vzoru krýt mohou mít dubletní tvary, a sice kořenný vokál í (sít, klít) má variantu krátké e (set, klet).215 I další tvary od kmene minulého, tedy tvary tvořené příponami t/n jako pasivní příčestí v krátké (přesit/přeset/přesát, proklet/proklat) i adjektivizované (přesitý/přesetý/přesátý, prokletý/proklatý) variantě a verbální substantivumpodstatné jméno slovesné na ní/tí, jsou variantní. Doklady pro tři varianty e, i a překvapivě i dlouhé á v kořeni jsme v korpusech zaznamenali u slovesa .*sít.216 V korpusech jsou zcela okrajově doloženy dlouhé adjektivní tvary ositý217 vedle častějšího osetý218 a zcela běžné přesátý219 vedle občasného přesetý220 i hapaxového přesitý.221 Objevují se i tvary krátké (prosát,222 přesát223). Na tuto anomálii upozorňujeme pro pořádek. Doklady dvou variant kořenné samohlásky mají slovesa .*klít ((pro)klet(ý)/(pro)klat(ý)) a .*dít ((na)ditý/(o)dětý), viz níže. Slovesa III. třídy vzoru krýt mohou mít ovšem také dubletní tvary s tvarovou příponou t (zakletý,224 odětý225) i n (zaklený,226 oděný227). Zcela okrajově jsme na analogickou variantu narazili také u derivovaných tvarů slovesa mlít I. třídy vzoru umřít (vedle běžného omletý je v korpusu hapaxově doloženo i omlený228).

Více se tento typ variantnosti promítá do někdy významově diferencovaných (zakletí/zaklení, osetí/osení) variant dějových jmen229 (zahřátí/zahřání,.*plení/.*pletí,.*sání/.*sátí,230 pookřání/pookřátí,…), a to opět jak dějových jmen od sloves III. třídy vzoru krýt, tak i od slovesa mlít (mletí/mlení231), které se řadí k I. třídě vzoru umřít.

Slovesa IV.. třídy vzorů prosit, trpět mívají dubletní tvary závislé na různých alternacích kořenové finály (konsonantu před koncovkou pasivního příčestí / kmenotvornou příponou e ve tvarech pasivního příčestí) viz více Osolsobě 2011, s. 32nn.).

Uvedená nekonzistentní řešení ve stávajícím slovníku morfologického analyzátoru se týkají pravidel pro rozgenerování tvarů od slovesných kmenů v případě sloves, která mohou mít dublety ve tvaru pasivního příčestí. Jedná se o uzavřené skupiny sloves, takže lze uvést kompletní výčty. V tabulce 19 uvádíme přehled lemmat všech sloves II. třídy vč. variantních tvarů příslušných příčestí n-ových/t-ových.

Tabulka 19

[(na)|(vy)]řknout (říci)

[(na)|(vy)]řčen (řečen)

[(na)|(vy)]řknut

.*[vb]léknout (.*[bv]léci)

.*[vb]lečen

.*[vb]léknut

.*střehnout (.*stříci)

(.*střežen232)

.*střehnut

.*bodnout

.*boden

.*bodnut

[(na)|(do)|(pře)]padnout

[(na)|(do)|(pře)]paden

[(na)|(do)|(pře)]padnut

[(za)|(vy)]přáhnout

[(za)|(vy)]přažen

[(za)|(vy)]přáhnut

.*stihnout

.*stižen

.*stihnut

.*střihnout

.*střižen

.*střihnut

.*táhnout

.*tažen

.*táhnut

.*trhnout

.*tržen

.*trhnut

.*zdvihnout

.*zdvižen

.*zdvihnut

.*sáhnout

.*sažen

.*sáhnut

.*vrhnout

.*vržen

.*vrhnut

oblehnout

obležen

oblehnut

[(ode)|(obe)|(za)]mknout

[(ode)|(obe)|(za)]mčen

[(ode)|(obe)|(za)]mknut

.*tisknout

.*tištěn

.*tisknut

.*tknout

.*tčen

.*tknut

nadchnout

nadšen

nadchnut

.*čít/.*čnout

.*čat

.*čnut

.*tít/.*tnout

.*ťat

.*tnut

stít/setnout

sťat

setnut

vtít/vetnout

vťat

vetnut

.*pnout

.*pjat

.*pnut

sepnout

spjat/sepjat

sepnut

žít/žnout

žat

žnut

jmout

jat

jmut

[(na)|(za)|(do)(po)|(pro)|(při) |u)|(obe) jmout

[(na)|(za)|(do)(po233)|(pro)|(při) |(u)|(ob)]jat

[(na)|(za)|(do)(po)|(pro)|(při)|(u)|(obe)]jmut

[(ode)|(se)| (vy)] jmout

[(od)|(s234)|(vy)]ňat

[(ode)| (se)|(vy)]jmut

předejmout

před[jň]at235

předejmut

Velké množství variant mají tvary lemmatu rozžehnout/rožnout236 (viz Osolsobě 2011, s. 43).

Slovesa IV. třídy, která mají varianty v důsledku hláskových alternací kořenové finální souhlásky, uvádíme v tabulce 20. V řadě případů jsou tvary doložené v korpusech označkovány jako X.*. Tvary doložené v korpusech často odporují údajům ve starších příručkách (Šmilauer 1972, s. 217nn., Komárek a kol. 1986, s. 473nn.); máme tím na mysli, že v korpusech se objevují dubletní tvary, které příručky neuvádějí.

Tabulka 20

.*mrazit

.*mrazen

.*mražen

.*hrozit

.*hrozen

.*hrožen

.*mísit

.*mísen

.*míšen

.*brousit

.*brousen

.*broušen

.*dusit

.*dusen

.*dušen

.*hasit

.*hasen

.*hašen

.*hlásit

.*hlásen

.*hlášen

zhnusit

zhnusen

zhnušen

.*křísit

.*křísen

.*kříšen

(vy)věsit

(vy)věsen

(vy)věšen

kvasit

kvasen

kvašen

.*krásit

.*krásen

.*krášen

.*čadit

.*čaděn

.*čazen

.*čoudit

.*čouděn

.*čouzen

.*řadit

.*řaděn

.*řazen

zostudit

zostuděn

zostuzen

.*vodit

.*voděn

.*vozen

nakrabatit

nakrabatěn

nakrabacen

rozpoltit

rozpoltěn

rozpolcen

.*hatit

.*hatěn

.*hacen

.*lopotit

.*lopotěn

.*lopocen

.*lakotit

.*lakotěn

.*lakocen

.*chutit

.*chutěn

.*chucen

.*tekutit

.*tekutěn

.*tekucen

.*žlutit

.*žlutěn

.*žlucen

.*bortit

.*bortěn

.*borcen

.*hyzdit

.*hyzděn

.*hyžděn

.*jezdit

.*jezděn

.*ježděn

.*pozdit

.*pozděn

.*požděn

.*čistit

.*čistěn

.*čištěn

.*klestit

.*klestěn

.*kleštěn

.*prostit

.*prostěn

.*proštěn

.*hostit

.*hostěn

.*hoštěn

.*hustit

.*hustěn

.*huštěn

.*jistit

.*jistěn

.*jištěn

.*mastit

.*mastěn

.*maštěn

.*pustit

.*pustěn

.*puštěn

.*věstit

.*věstěn

.*pvěštěn

.*sedět

.*seděn

.*sezen

.*vrtět

.*vrtěn

.*vrcen

.*povědět

.*pověděn

.*povězen

Navrhujeme, aby s využitím mutací byl na úrovni slovníku automatického morfologického analyzátoru zaznamenán maximální počet variant doložených v korpusech (popř. jinde – na internetu, přijatelných pro rodilého mluvčího). V přehledu uvádíme potenciální „krátké tvary“ adjektiv, počítáme ovšem s rozgenerováním a) dlouhých tvarů (viz Hlaváčová 2009, s. 26) a b) dějových jmen na -ní/-tí (viz Hlaváčová 2009, s. 25n). U všech by se mělo pamatovat na uvedené mutace (alternující finální konsonant kořene – více Hlaváčová (2009, s. 35n.), alternující kořenová samohláska, alternativní tvarová přípona n/t). Lemmatem bude adjektivní (dlouhý tvar), popřípadě tvar nominativu singuláru dějového jména na ní/tí, mutace se tedy bude týkat vždy celého paradigmatu (globální mutace).

Skupina (c)

Do skupiny c) řadíme 3 lemmata, a to otřesen/otřesený [Vs.*|AC.*], tknuto/tknutý [AC.*|X.*], znefunkčněn/znefunkčněný [AC.*|X.*].

Domníváme se, že jde o okrajové záležitosti, které je třeba sjednotit na úrovni morfologického slovníku.

Skupina (d)

Do skupiny d) řadíme 8 lemmat, a to osamocen237/osamocený [AC.*], spokojen238/spokojený [AC.*], dbán/dbaný [AC.*], podroušen/podroušený [AC.*], zkroušen/zkroušený [AC.*], vyspán/vyspaný [AC.*], odjet/odjetý [AC.*], ujet/ujetý [AC.*]. Jedná se

a) o tvary napodobující tvoření pasivních příčestí od sloves, která na základě svých syntaktických vlastností netvoří opisné pasívum. Nicméně úzus (korpus) tyto tvary dokládá v okazionálních a rodilému mluvčímu srozumitelných konstrukcích;

b) o případy, v nichž je vztah k fundujícímu slovesu (podroušit se, zkroušit se) oslaben.

O této skupině lze dále diskutovat.


7.2 Poznámka k přídavným jménům od sloves na telný

Hlaváčová 2009, s. 121n.) navrhuje rozgenerování adjektiv na telný od sloves. V souvislosti s tímto návrhem připomínáme jmenné varianty (pochopitelno/pochopitelný [AC.*], myslitelno/myslitelný [AC.*], uvěřitelno/uvěřitelný [AC.*], srovnatelno/srovnatelný [AC.*], dělitelno/dělitelný [AC.*], slučitelno/slučitelný [AC.*], přijatelno/přijatelný [AC.*]). Řešení těchto případů jsme navrhli výše a je jim věnována pozornost také v textu o adverbiích.


7.3 Shrnutí

„Rozgenerování“ tvarů označkovaných dosud jako Vs.* od sloves je na úrovni morfologického slovníku vcelku uspokojivé. V rámci navrhovaných změn (Hlaváčová 2009) by se měly vzít v úvahu opravy nekonzistentních řešení tvarů označkovaných dosud jako AC.* a tvarů nerozpoznaných automatickou morfologickou analýzou (označkovaných jako X.*). Je třeba

a) zahrnout příslušné mutace u substandardních tvarů

b) zahrnout příslušné mutace v případě dubletních standardních tvarů

c) rozhodnout, kam zařadit jednotlivé sporné případy a

d) rozgenerovat adjektiva na telný od slovesných základů a jednotně zpracovat jmenné/adverbiální a substantivizované tvary na telno (viz kapitola Adverbia # 08-06, § 3.1.2c).

Jednotně by se mělo naložit také s variantními tvary na íno (zamčíno, nakoupíno, uvaříno). Jde o ustrnulé tvary; přikláníme se k tomu, aby u nich byla uvedena interpretace [POS=A & SUB=V & NOM=J] a aby byly od tvarů na .*eno odlišeny pomocí kategorie flektivní mutace.


Literatura

Bauer, J. – Lamprecht, A. – Šlosar, D. (1986): Historická mluvnice češtiny. Praha: SPN.

Cvrček, V. – Vondřička, P. (2012): Morfio. Dostupný z WWW: <http://morfio.korpus.cz/>.

Danielová, Z. (2009): Pravidelné a nepravidelné tvary sloves typu začít v Českém národním korpusu. Brno: FF MU. (Nepublikovaná bakalářská práce.)

Dokulil, M. a kol. (1986): Mluvnice češtiny 1. Praha: Academia.

Hajič, J. (2004): Desambiguation of Rich Inflection (Computational Morphology of Czech). Vol. 1. Praha: Karolinum Charles University Press. pdf verze??

Hajič, J. – Hlaváčová, J. (2013): MorfFlex CZ. LINDAT/CLARIN digital library at Institute of Formal and Applied Linguistics, Charles University in Prague. <http://hdl.handle.net/11858/00-097C-0000-0015-A780-9>.

Hájková, V. (2013): Analýza jmenných tvarů adjektiv a pasivních příčestí ve slovníku morfologického analyzátoru ajka. Brno: FF MU. (Nepublikovaná bakalářská práce.)

Hlaváčová, J. (2001): Morphological Guesser of Czech Words. In: Matoušek, V. (ed.), Text, Speech and Dialogue. Berlin: Springer-Verlag, s. 70–75.

Hlaváčová, J. (2009): Formalizace systému české morfologie s ohledem na automatické zpracování českých textů. Praha: UK. (Disertační práce.) Dostupná z: <http://utkl.ff.cuni.cz/phpBB3/viewtopic.php?f=11&t=1>

Hlaváčová, J. (2017): Golden Rule of Morphology and Variants of Word Forms. Jazykovedný časopis, roč. 68, č. 2, s. 136–144.

Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): The SYN-series corpora of written Czech. In: Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), s. 160–164. Reykjavík: ELRA. ISBN: 978-2-9517408-8-4. <http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf>

IJP (Internetová jazyková příručka). Dostupná z WWW: <http://prirucka.ujc.cas.cz/>

Jelínek, T. (2008): Nové značkování v Českém národním korpusu. Naše řeč, roč. 91, č. 1, s. 13–20.

Komárek, M. a kol. (1986): Mluvnice češtiny 2. Praha: Academia.

Kopáčková, L. (2013): Ke tvoření posesivních adjektiv na -ův a -in v češtině. CD z konference Gramatika a korpus 2012. Dostupné z: <http://www.ujc.cas.cz/miranda2/export/sitesavcr/data.avcr.cz/humansci/ujc/zakladni-informace/oddeleni/oddeleni-gramatiky/konferencni-sbornik/KopackovaL>.

Kott, F. (1878): Česko-německý slovník. Dostupný z WWW: <http://kott.ujc.cas.cz/>.

Najbrtová, K. (2012): Zavolal jsem si taxík/taxíka – životná koncovka neživotných maskulin v akuzativu singuláru. Mladí lingvisté. Olomouc.

Osolsobě, K. (1996): Algoritmický popis české formální morfologie a strojový slovník češtiny. Brno: MU (Disertační práce.).

Osolsobě, K. (2011): Morfologie českého slovesa a tvoření deverbativ jako problém strojové analýzy češtiny. Brno: MU.

Osolsobě, K. (2009): Deriváty na -čí: gramatika, slovník a korpus. Linguistica Brunensia roč. 57, s. 115–127.

Osolsobě, K. (2015): Korpusy jako zdroje dat pro úpravy nástrojů automatické morfologické analýzy (Slovotvorné varianty adjektiv na [(ou)|í]cí z hlediska morfologického značkování). Časopis pro moderní filologii, roč. 97, č. 2, s. 136–145.

Osolsobě, K. – Hlaváčová, J. – Petkevič, V. – Šimandl, J. – Svášek, M. (2017): Nová automatická morfologická analýza češtiny. Naše řeč, roč. 17, č. 4, s. 225–234.

Petkevič, V. (2006): Reliable Morphological Desambiguation of Czech: Rule-Based Approach is Necessary. In: Šimková, M. (ed.), Insight into the Slovak and Czech Corpus Linguistics). Bratislava: Veda, s. 26–44.

Richterová, O. (2017): Od slovesa ke jménu a předložkám. Departicipiální formy v češtině. Praha: UK. (Disertační práce.) Dostupná z: <http://hdl.handle.net/20.500.11956/94103>

Spoustová, D. – Hajič, J. – Votrubec, J. – Krbec, P. – Květoň, P. (2007): The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In: Proceedings of the Workshop on Balto-Slavonic Natural Language Processing. Praha: ACL, s. 67–74.

Šmerk, P. (2009): Deriv – webové rozhraní. Dostupné z: <http://deb.fi.muni.cz/deriv.>.

Šmilauer, V. (1972): Nauka o českém jazyku. Praha: SPN.

Šulc, M.: Životná koncovka -a v akuzativu singuláru neživotných maskulin. Dostupné z: WWW: <http://ucnk.ff.cuni.cz/stahni.php#sulc.>.

Žižková, H. (2019): Slovnědruhové přechody a přesahy jako problém automatické morfologické analýzy. Brno: MU. (Disertační práce.) Dostupná z: <https://is.muni.cz/auth/th/gomfh/?vysl=106245>.

Korpusy řady SYN:

Český národní korpus – SYN v6:

Křen, M. – Cvrček, V. – Čapka, T. – Čermáková, A. – Hnátková, M. – Chlumská, L. – Jelínek, T. – Kováříková, D. – Petkevič, V. – Procházka, P. – Skoumalová, H. – Škrabal, M. – Truneček, P. – Vondřička, P. – Zasina, A.: Korpus SYN, verze 6 z 18. 12. 2017. Ústav Českého národního korpusu FF UK, Praha 2017. Dostupný z WWW: http://www.korpus.cz

doplnit SYN v8

czTenTen12:

FI MU – czTenTen12. Centrum zpracování přirozeného jazyka FI MU, Brno. Cit. 21. 11. 2013, dostupný z WWW: <http://ske.fi.muni.cz/bonito>.



1 Je třeba upozornit uživatele, že slovník bude z hlediska úplnosti seznamů substantivizovaných adjektiv podgenerován, takže výsledky automatické morfologické analýzy je třeba brát s jistou rezervou. Podrobnější informace viz níže v § 3.2 a § 6.1 a také kapitola Substantiva # 08-01, § 8.1.

2 Podrobnější informace o adjektivně skloňovaných číslovkách viz kapitola Číslovky # 08-04.

3 Podrobnější informace o adjektivně skloňovaných zájmenech viz kapitola Zájmena # 08-03.

4 Je třeba pečlivě zvážit, které tvary to budou, neboť mezi ustrnulými jmennými tvary adjektiv používanými v adverbiálních významech se vyskytují jak tvary na o (na sucho, na měkko, na tvrdo, na ležato...), tak tvary na u (na krátku) a na a (do kulata, do modra, do hněda, do sucha, do ruda...). Jde o slovnědruhovou přesažnost, která se řeší ve prospěch [POS=D] pro tyto tvary. Nicméně v některých případech bude třeba zachovat více interpretací ([AD]) a pak mohou nastat problémy s desambiguací. Příklady uvádíme níže v § 3.6 a také v kapitole Adverbia # 08-06, § 3.1.2.

5 Jedná se o výraznou změnu oproti dosavadní tradici. Navrhované úpravy by měly přispět k tomu, aby popis tvarů pasivních příčestí (krátkých tvarů deverbativních adjektiv n-ových/t-ových dosud značkovaných jako tag=Vs.*, popř. tag=AC.*) i tvarů adjektiv od nich tvořených (dlouhých tvarů deverbativních adjektiv n-ových/t-ových dosud značkovaných jako tag=AA.*) byl konzistentní.

6 Není problém dogenerovat do slovníku nejrůznější substandardní varianty a označkovat je pomocí kategorie flektivní mutace. Prakticky byl obdobný postup aplikován v brněnském slovníku a příslušná varianta slovníku byla použita při značkování korpusu soukromé korespondence, který obsahoval nejrůznější substandardní morfologické varianty (desambiguace probíhala ručně). Je ovšem třeba upozornit na to, že takový přístup má za následek zmnohonásobení případů, které je třeba desambiguovat a výsledky automatické desambiguace nemusí být uspokojivé. Proto je třeba takový postup pečlivě zvážit.

7 Je třeba upozornit uživatele, že slovník bude z hlediska úplnosti seznamů substantivizovaných adjektiv podgenerován, takže výsledky automatické morfologické analýzy je třeba brát s jistou rezervou. Podrobnější informace viz níže v § 3.2 a § 6.1 a také kapitola Substantiva # 08-01, § 8.1.

8 Podrobnější informace o adjektivně skloňovaných číslovkách viz kapitola Číslovky # 08-04.

9 Podrobnější informace o adjektivně skloňovaných zájmenech viz kapitola Zájmena # 08-03.

10 Je třeba pečlivě zvážit, které tvary to budou, neboť mezi ustrnulými jmennými tvary adjektiv používanými v adverbiálních významech se vyskytují jak tvary na o (na sucho, na měkko, na tvrdo, na ležato...), tak tvary na u (na krátku) a na a (do kulata, do modra, do hněda, do sucha, do ruda...). Jde o slovnědruhovou přesažnost, která se řeší ve prospěch [POS=D] pro tyto tvary. Nicméně v některých případech bude třeba zachovat vícero interpretací ([AD]), a pak mohou nastat problémy s desambiguací. Příklady uvádíme níže v § 3.6 a také v kapitole Adverbia # 08-06, § 3.1.2.

11 Jedná se o výraznou změnu oproti dosavadní tradici. Navrhované úpravy by měly přispět k tomu, aby popis tvarů pasivních příčestí (krátkých tvarů deverbativních adjektiv n-ových/t-ových dosud značkovaných jako tag=Vs.* popř. tag=AC.*) i tvarů adjektiv od nich tvořených (dlouhých tvarů deverbativních adjektiv n-ových/t-ových dosud značkovaných jako tag=AA.*) byl konzistentní.

12 V případě adjektiv skloňovaných podle vzoru mladý bude touto podobou standardní podoba na .*ý, varianta na .*ej (ideálně i další varianty: Už jen <moravské> Ministr zemědělství Marian Jurečka plánuje zakázat prodej zahraničního vína ze sudů) bude popsána pomocí kategorie flektivní mutace.

13 Bude tomu tak i v případě, že sémantika adjektiva zpravidla odkazuje k nositeli vlastnosti jiného rodu (takže například lemma tvaru těhotná bude těhotný).

14 Hodný1 člověk × bude hodný1/*hoden1, když mu dáš najíst.

15 Bude hoden2/hodný2 pokárání.

16 Na rovině automatického morfologického značkování nebude možné desambiguovat sémantické rozdíly tohoto typu. Do této skupiny by mohla patřit adjektiva, u nichž se v příslušných kontextech (většinou se jedná o kolokace) objevují v korpusech doložené dlouhé tvary, přestože krátké tvary působí dosud patřičněji, viz následující poznámka.

17 Uvádíme podrobný rozpis všech případů adjektiv, která měla v dosavadní praxi automatické morfologické analýzy lemma krátký tvar a značku tag=AC.*. Jedná se o 20 případů, které můžeme rozdělit (na základě pozorování korpusových dat) do těchto skupin: a) 4 adjektiva bez odpovídajících dlouhých tvarů (rád, milerád, monokolokabilní práv a patrně i jakživ); b) 8 adjektiv, u nichž se v příslušných kontextech (většinou se jedná o kolokace) objevují v korpusech doložené dlouhé tvary, přestože krátké tvary působí dosud patřičněji (kolokace: být <radno/radný>, být <vidno/vidný>, být <hrd/hrdý>, být někomu <svato/svatý>, být <zajímavo/zajímavý>, být <vysvětlitelno/vysvětlitelný> být <žádoucno/žádoucný> a lemma kompozita <jaktěživ/jaktěživý>); c) 4 adjektiva, jejichž tvary lze vztáhnout ke slovesným základům a způsobem tvoření odpovídají tvarům n/t participií, opět se alespoň ve frekventovaných dokladech objevují v kolokacích (mít <spadeno/spadený>, být <povinován/povinovaný>, ojedinělé doklady tvaru vyspáno lemmatizované tvarem adjektiva vyspaný, přičemž jde o chyby – překlepy, jimž automatická analýza přidělí interpretaci Vs.*; d) 1 lemma potřeba v predikativním monokolokabilním užití být <potřeba>; e) 1 lemma <všecken>, přičemž jde o tvarovou variantu zájmena všechen, f) 2 lemmata překlepů <rádi-rád> a <2rád>. Z výše uvedeného tedy plyne, že kandidáty na lemmatizaci tvarem krátkým jsou případy a). Případy b) budou mít vícenásobné lemma, tedy {radno, radný}, {vidno, vidný}, {svato, svatý}, {zajímavo, zajímavý}, {vysvětlitelno, vysvětlitelný}, {žádoucno, žádoucný}, {hrd, hrdý}, {jaktěživ, jaktěživý}. Lemmatem bude dlouhý/složený tvar maskulina životného v singuláru a krátký/jmenný tvar, a to buď rovněž maskulina v singuláru, nebo neutra v singuláru, pokud se tvar maskulina v singuláru netvoří. Je třeba dbát na to, aby do slovníku byly doplněny pokud možno všechny jmenné tvary. Otázka, jak případy c) interpretovat na rovině kategorie SUB a VRB, viz níže § 3.4.1. Případy d) spadají do slovnědruhového přesahu/přechodu substantivum/adverbium a jsou probrány v příslušných kapitolách Substantiva # 08-01, § 8.2.5 a Adverbia # 08-06, § 4.3. Případ e) spadá mezi zájmena a je probrán v příslušné kapitole Zájmena # 08-03, § 3.4.1. Případ f) je možno ponechat, jak je, popř. vynechat.

18 Tento seznam lze podle potřeby doplňovat, a to především o krátké tvary pasivních participií, která netvoří dlouhé tvary. Typ je hojně zastoupen v textech z 19. století. Lemmatem bude tvar na -o, který je zároveň mnohdy jediným užívaným tvarem (tvary pro ostatní rodové podoby nejsou doloženy a není třeba je do slovníku přegenerovávat, dlouhé tvary se ovšem, byť zřídka, vyskytují, viz níže § 3.4.1). Jde o lemmata jako rokováno, přikročeno, vyhověno, hleděno, záleženo, překáženo, láno, potýkáno, vyspíláno, odpomoženo, reptáno, hřešeno, zápaseno, křivděno, věříváno, poshověno, doslaveno, sočeno...

19 Okrajové substandardní tvary, například otcovej, matčinej (<Matčinej> šátek vlál ve větru...), budou popsány pomocí kategorie flektivní mutace.

20 Jediným kandidátem na výjimku z tohoto pravidla jsou tvary v kolokaci (mít <spadeno/spadený>). V těchto případech by lemmatem mělo být {spadeno, spadený}. Přestože se v naprosté většině případů doložených v korpusech vyskytuje pouze ustrnulý tvar spadeno, jsou v korpusu – byť nesprávně užité – příslušné tvary flektivní zřídka doloženy a nejsou rozpoznány automatickou morfologickou analýzou (např.:… to spíš by měli mít na orla mořského <spadeni> rybáři…,… má na tyto ceny <spadena> také stáj Red Bull…,… Právě na tyto instituce mají totiž <spadeny> všemožné anarchistické i další bojovně naladěné skupiny z různých koutů světa...). Je ovšem na zvážení, nakolik je třeba tímto směrem slovník automatického analyzátoru přegenerovat. Pokládáme za adekvátní, aby vícenásobné lemma bylo {spadeno, spadený} a aby tvary (doložené, leč nesprávně užité) byly na rovině slovníku rozgenerovány, přestože užití (jako například nůžky byly celou tu dobu, co jsme je marně hledali, <spadeny/spadený/spadlý> za kamny) v korpusech doložena nejsou.

21 Seznam je sice podložen korpusovými analýzami, nicméně si neklade nárok na úplnost. Lze předpokládat, že existují i další případy frazeologických užití podobného typu, které lze vzít v úvahu a doplnit je. Stanovit hranici mezi tvary, které budou zahrnuty mezi adjektiva, a tvary na o, které budou patřit mezi adverbia (POS=D), nebude jednoduché. Uživatel by měl mít k dispozici seznamy, aby si mohl utvořit představu o zvoleném řešení.

22 Pro dodržení této tradice hovoří to, že je to tradice běžná ve výkladových slovnících. Následující návrh ji ctí všude tam, kde technicky nevzniká výrazný problém spojený s tím, že existuje více tvarů pozitivu, k nimž lze vztahovat jeden tvar komparativu/superlativu. Nicméně situace se komplikuje při zpracování starších a archaizujících textů. Není tudíž zcela nepatřičné uvažovat i o změně přístupu k lemmatizaci, a to v tom smyslu, že tvary komparativu a superlativu spolu s tvary sebe.*[šč]í budou spadat pod lemma, jímž bude nominativ singuláru (maskulina) komparativu, a to vždy, kdežto tvary pozitivu budou lemmatizovány samostatně a nebudou jimi lemmatizovány tvary komparativu/superlativu spolu s tvary sebe.*[šč]í nikdy.

23 V tomto směru není třeba slovník zbytečně přegenerovávat. (Nepokládáme za vhodné do morfologického slovníku, který je používán morfologickým analyzátorem, násilně doplňovat tvary jako velkejší, malejší, přestože obdobné doklady jazykové tvořivosti lze okrajově najít, například na internetu.)

24 Internetová jazyková příručka (IJP) popisuje varianty adjektiv na .*ký, která tvoří druhý stupeň sufixem , přičemž k alternuje v kontextu í na č, jako vzácné, přesto jsou v korpusech okrajově doloženy.

25 <Brzčí> konec školního roku se poštěstil žákům Základní školy Dukelská ve Strakonicích.

26 V co <nejbrzčejším> termínu zkusí vyjednat, aby se Karel Jarolím ujal reprezentace...

27 Domníváme se, že jako flektivní mutace by měly být zahrnuty rovněž substandardní v korpusu okrajově doložené varianty (Čím <sladčí> víno, tím větší bolest hlavy druhý den… Za pozdní příchody <kratčí> dovolená… a snad ideálně i… Jeden strašně dlouhej a druhej vo moc <kračí>...). Je ovšem třeba zvážit, nakolik zatěžovat morfologický slovník řídce se vyskytujícími případy, neboť čím kratší slovo, tím vyšší pravděpodobnost, že půjde o překlep (Branov po dlouhých letech čekání zatím úspěšně <kračí> okresním přeborem za vysněným cílem.). Jedná se o adjektiva: hladší/hladčí, kratší/kratčí/kračí, krotší/krotčí, mladší/mladčí/mlačí, sladší/sladčí, vratší/vratčí, řidší/řidčí.

28 Existují-li dva pozitivy, k nimž lze vztáhnout jeden jediný komparativ/superlativ, pak lze postupovat buď tak, že pozitivní lemma bude několikanásobné, nebo že technicky zvolíme jednu (pravidelnou) řadu. Volíme technické řešení, přestože není jediné hajitelné.

29 Seznam synonymních/ částečně synonymních lemmat na .*cí/.*cný je zde: budoucí/budoucný, horoucí/horoucný, (ne)jsoucí/(ne)jsoucný, kající/kajícný, (ne)mohoucí/(ne)mohoucný, (ne)pomíjející/(ne)pomíjejícný, (ne)přející/(ne)přejícný, přehoroucí/přehoroucný, srdcervoucí/srdcervoucný, (ne)vědoucí/(ne)vědoucný, (ne)věřící/(ne)věřícný, (ne)vidoucí/(ne)vidoucný, vroucí/vroucný, všemohoucí/všemohoucný, vševědoucí/vševědoucný, zlolající/zlolajícný, (ne)žáducí/(ne)žádoucný, žhoucí/žhoucný, (ne)živoucí/(ne)živoucný.

30 Vzhledem k tomu, že se variantnost týká všech tvarů paradigmatu rozvinutých od příslušného lemmatu: lepší/lepčí, lepšího/lepčího…, půjde o globální mutaci.

31 Tvary (nej)prvnější budou mít značku [POS=A & SUB=C & VRB=- & NOM=-], viz níže § 3.5.

32 Podrobná argumentace k tomu, proč nelze tvary dřívější/nejdřívější lemmatizovat lemmatem brzký, je uvedena v kapitole Adverbia # 08-06, § 3.5.3.

33 Mohla by to být lemmata pro guessing.

34 Interpretovat tato slova jako tvary pozitivu je volba, kterou lze napadnout, neboť po významové stránce jsou užívána spíše jako expresivně zabarvená synonyma s komparativy (jinší, jinačí = lepší), viz definice v SSJČ i PSJČ, ale i evidence v korpusech: Je přece super svézt se s rodinkou hipíků, kteří vezou svoji malou dcerušku na tábor, bavit se s pěkným klukem o muzice anebo poslouchat historky pána v kravatě (taky býval mladý a stopoval, ale tehdá to bylo <jinší>, auta víc stavěla, řidiči byli milejší...). Jde tedy o technické řešení, které zdůvodňujeme tak, že k těmto tvarům se pravidelně netvoří tvary třetího stupně prefixem nej-. Jsme si vědomi toho, že jde o jisté zjednodušení.

35 Netrváme na změně dosavadní praxe, která tvary raději/nejraději interpretuje jako adverbia, což je v souladu s tištěnými slovníky, a to přesto, že tvary raději/nejraději plní stejné syntaktické funkce jako tvary rád/ráda/rádo…, takže jediným důvodem pro adverbiální interpretaci je formant, jímž jsou tvary utvořeny, kterým se v češtině tvoří komparativ a superlativ adverbií a který není nositelem informace o rodě a čísle (gramatických kategorií jmen).

36 Dvojice horní/hořejší a dolní/dolejší nelze chápat jako tvary pozitivu a komparativu. Jedná se o adjektiva tvořená paralelně z adverbií, která svým lexikálním významem vyjadřují vztah k pomyslnému středu vertikální osy (není pojmenován jedním konkrétním adjektivem), takže je lze chápat jako slova vyjadřující stupeň. Navíc jsou ovšem v korpusu SYN doloženy i komparativy a superlativy utvořené pravidelně od adjektiv dolní/(nej)dolnější, horní/(nej)hornější. Takové varianty nejsou rozgenerovány na rovině slovníku automatického morfologického analyzátoru (tvary mají v korpusu SYN značku X.*), je třeba je doplnit.

37 Zařazení tvarů adjektiva (nej)dřívější pod lemma brzký pokládáme za technické řešení, které je třeba odstranit (viz argumentace v kapitole Adverbia # 08-06, § 3.5.3). Lemma brzký zahrnuje pravidelně tvořené (málo užívané, viz výše § 2.2.1) tvary komparativu a superlativu ((nej)brzčí/(nej)brzčejší).

38 Adjektiva dolejší/hořejší jsou od původu adjektiva z adverbií (dole/(na)hoře). Pojmenovávají vlastnost ve vztahu k prostorové okolnosti (bodu na vertikální ose). Součástí jejich lexikálního významu je vyjádření vztahu k pomyslnému středu oné vertikální osy. Navíc jsou ovšem tvořena sufixem -ejší, tedy formantem užívaným v češtině typicky pro tvoření tvarů komparativu. Obě skutečnosti patrně ústí do situace, s níž se snaží vypořádat popisy na úrovni slovníků výkladových i slovníku automatického morfologického analyzátoru.

Pokusme se nejdříve na základě pozorování korpusových dat popsat užití uvedených adjektiv. Adjektiva hořejší/dolejší se užívají většinou ve významu horní/dolní. V celém korpusu SYN se nevyskytuje ani jediný kontext <hořejší než>/<dolejší než>. Spojitelnost s prefixem nej- je dána stupňovatelností komparativního lexikálního významu (srovnání se středem osy) adjektiv hořejší/dolejší. Přestože jsme si vědomi jistého zjednodušení, navrhujeme tvary (nej)hořejší/(nej)dolejší lemmatizovat lemmaty hořejší/dolejší. S ohledem na inherentní význam stupně (vzhledem k pomyslnému středu vertikální osy) nepokládáme za velkou chybu interpretovat je jako tvary II./III. stupně a přiřadit je tak ke skupině jednotek typu dříve, prve, teprve, spíše a více, méně, viz kapitola věnovaná adverbiím. Přestože jde o technické řešení, není to řešení zcela ad hoc. Jiné řešení (uznání synonymie horní/hořejší a dolní/dolejší) by vedlo k více tvarům pozitivu – viz též kapitola Adverbia # 08-06, § 3.5.

39 Tvary jmenné (všechny standardní tvary singuláru kromě instrumentálu a tvary [145] plurálu) budou mít [NOM=J]. Všechny ostatní tvary, a to jak substandardní varianty složené flexe ke standardním jmenným tvarům (pokud existují: V roce 1942 byli téměř všichni členové rodiny z <matčiné> strany odvlečeni do koncentračních táborů…), tak substandardní varianty složené flexe ke standardním složeným tvarům (asi to bylo něco z <otcovejch> zásob) budou mít [NOM=-]. Je na zvážení, zda dublovat informaci ještě i zvláštní hodnotou flektivní mutace ve všech případech (i v případech složených tvarů ke jmenným, které budou od standardních jmenných odlišeny hodnotou [NOM=-]: <matčinej> šátek, z <matčiné> strany… to byl drzej kluk, já byl takovej <maminčinej>… Přijde k <Vodrážkovýmu> lesu a na louce vidí plamen...), nebo jen v případě variantních tvarů složené flexe, k nimž jmenné tvary neexistují (asi to bylo něco z <otcovejch> zásob… Vorčestr se eště tak akorát stačil přitáhnout po břiše k <Tomovejm> nohám…,… jak by to se mnou dopadlo, kdybych mezi těma <dědovejma> a <tátovejma> knihovnama seděl ve čtrnácti u počítačových her nebo před DVD přehrávačem...,… Lída by s <Ritinejma> nohama vypadala jako slon a Rita s <Lídinejma> jako na chůdách...).

40 V Česko-německém slovníku Fr. Kotta (http://kott.ujc.cas.cz/index.php?vstup=&idHeslo=89448&zpusob=error&hledat=&popis=&heslo=) se ovšem dočteme, že: „Adj. possessívní tvoří se obyčejně od jmen osobních. Na Litomyšlsku říká se také: kravin (roh) a p. Ale připíná se jen ke jménům rodu ženského, ale také děvčetin, poněvadž jest děvče rodu ženského aspoň svým významem.“ Srov. k tomu též derivaci posesiva od propria Hrabě/Hrabětův, které je v korpusu SYN rozpoznáno automatickou morfologickou analýzou, stejně jako lemma knížetův. Z hlediska distribuce slovotvorných variant je zajímavé užití adjektiva [Bb]oží ve významu bohův.

41 Návrh úprav na rovině slovníku podrobně popisuje § 5 Podklady pro úpravy slovníku automatického morfologického analyzátoru I.

42 Jedním z testů, který dokládá, že proces prepozicionalizace není ani zdaleka dokončen, je test na chování tvarů zájmena on po předložce (práce týkající se jeho/*něho × práce o něm).

43 Přestože jsou procesuální významy (V polovině sedmdesátých let klade stále větší důraz na prvek vidění: jak on spatřuje krajinu, světlo, vzduch <stávající> se jeho tělem. Původně zdobila tato opona velký oltář <stávající> na místě, kde dnes v čele synagogy vidí návštěvníci oltář menší.) patrně méně frekventované, nepokládáme za nutné desambiguaci natahovat na skřipec a navrhujeme, aby adjektivum stávající mělo pouze jedinou interpretaci, a sice [POS=A & SUB=G].

44 Také u tohoto adjektiva patrně převažují užití s významem vroucí=vroucný/niterný/zapálený, a to zejména v kolokaci se substantivy láska a modlitba. Ani v tomto případě nepokládáme za nutné oba významy desambiguovat a navrhujeme dát přednost formě, tedy interpretaci [POS=A & SUB=G].

45 Návod na doplnění slovníku obsahuje § 6 Podklady pro úpravy slovníku automatického morfologického analyzátoru II.

46většina volajících, anebo <mailujících> na včerejší horkou linku vidí...

47 Např. slova jako lyžující, hádající, konzumující, okolojdoucí (s frekvencí pod 200 výskytů v korpusu SYN (verze 2013)) se vyskytují i v platnosti substantiv:… <lyžující> se ale rozptýlili ke všem pěti vlekům…,… aby právě v této poslední finesse měli <hádající> jakousi kontrolu kvality…,… přestože <konzumující> vypadají na první pohled mladě, limit plnoletosti splnili…,… bylo horší, že <okolojdoucí> se jen dívali.

48 Je třeba vyřešit praktickou otázku automatické morfologické analýzy, zda počítat při substantivizaci s oběma rody [GEN=[MF]]. Ve všech uvedených případech jde o substantivizaci, jejímž výsledkem je pojmenování osoby. Gramaticky může jít v češtině jak o substantivum rodu mužského životného (ten/oba/chladnokrevný/chladnokrevní/cizí cestující/vedoucí…), tak o substantivum rodu ženského(ta/obě/chladnokrevná/chladnokrevné/cizí cestující/vedoucí…). Tuto otázku je třeba řešit konzistentně a buď uvádět ve všech případech rody oba, nebo dát uživateli k dispozici argumenty, které vyjasní použití jiné strategie. V manuálu by měl být uživatel upozorněn na to, že značkování tohoto typu slovnědruhového přechodu (adjektivum na oucí/ící → substantivum pojmenovávající osobu [GEN=[MF]]) se omezuje na seznam jmen osob tohoto slovotvorného typu (konverze), který si neklade nárok na úplnost a zohledňuje pouze jednotky vybrané na základě korpusově podložených frekvenčních analýz. Není tudíž vyloučeno, ba je naopak pravděpodobné, že v korpusu se ve všech frekvenčních pásmech vyskytují další doklady této slovnědruhové transpozice, na které současný stav automatické morfologické analýzy nebere zřetel.

49 Domníváme se, že přegenerovat masivně slovník by mohlo být kontraproduktivní; zbytečně by se tak přetížila desambiguace a výsledky by patrně neodpovídaly vynaloženému úsilí. Tento stav se ovšem může měnit. Disertační práce H. Žižkové (2019) obsahuje návrhy pro desambiguační praxi substantivizovaných adjektiv opřenou o analýzu kolokací.

50 § 6 Podklady pro úpravy slovníku automatického morfologického analyzátoru II podrobně popisuje návrh úprav na rovině slovníku.

51 A jakou vládu my polistopadoví <doživší> se vůbec máme. Mohlo by v něm být sto procent <přeživších>...,... že by tito nově <přišedší> třeba nechtěli vzdychat jejich způsobem. Znenáhla pak první <přebrodivší> se podají si ruce a hoši přecházejí zachycujíce se živého provazu.

52 S ohledem na fakt, že adjektiva tohoto typu nejsou celkově frekventovaná a není jisté, jak by vypadala desambiguace, domníváme se, že není třeba v tomto případě „přepínat možnosti automatické morfologické analýzy“. Patrně jediným kandidátem na obojí (adjektivní i substantivní) interpretaci je adjektivum přeživší. Opět je třeba počítat u substantivní interpretace s oběma rody [GEN=[MF]].

53 Za zatím jedinou odůvodnitelnou výjimku pokládáme vícenásobné lemma {spadeno, spadený}. Máme za to, že takovým postupem technicky odstraníme potřebu desambiguovat významy spadeno1/spadený1 = mít <spadeno/spadený> na a *spaden2/spadený2 -… Luxace čočky je závažnější stav, oční čočka není ve své typické pozici za zornicí, nejčastěji je „<spadená>“ na dno sklivcového prostoru…,… ke <spadenému> sloupu vyjížděli hasiči. Dále sem budou patřit lemmata na -o krátkých tvarů pasivních participií, která netvoří dlouhé tvary. Typ je hojně zastoupen v textech z 19. století. Jde o lemmata jako rokováno, přikročeno, vyhověno, hleděno, záleženo, překáženo, láno, potýkáno, vyspíláno, odpomoženo, reptáno, hřešeno, zápaseno, křivděno, věříváno, poshověno, doslaveno, sočeno… U některých se ovšem najdou doklady svědčící o progresi dlouhých tvarů:… reklamaci nebylo <vyhověné>…… Důvodem je <vyhověná> žádost hostů o dřívější začátek z důvodu oslav. Je tudíž třeba zvážit, zda dlouhé tvary „nepřegenerovat“.

54 Například ve větě: A je <zavříno> bude tvar zavříno lemmatizován lemmatem zavřený a od tvaru zavřeno se bude lišit hodnotou flektivní mutace; Mám <nastavíno> na pětibrokový dávky… bude tvar nastavíno lemmatizován lemmaty nastavený|nastavěný; pokud se desambiguace zdaří, bude mít lemma nastavený a od tvaru nastaveno se bude lišit hodnotou flektivní mutace.

55 Zaznamenáno z parlamentní debaty: Otázky, které tu byly <vznešený>...

56 Viz např. tvar pnutí desambiguovaný jako AAMP1.*, tedy jakožto tvar lemmatu pnutý.

57 Je tomu tak v brněnském i pražském slovníku.

58 § 7 Podklady pro úpravy slovníku automatického morfologického analyzátoru III podrobně popisuje návrh úprav na rovině slovníku.

59 Viz též kapitola Adverbia # 08-06, § 3.1.2c.

60 Podobně jako frekventované čitelný se nepravidelně tvoří adjektiva na -telný od sloves s uzavřeným kmenem minulým (jsou to slovesa I. třídy vzorů nést, péci a některá slovesa II. třídy vzoru tisknout, která navíc mohou mít variantní synonymní deriváty) a i deriváty od nepravidelných sloves. Jde o adjektiva jako neodvezitelný, unesitelný, nepostižitelný, ustojitelný,?jitelný<jíst,..., u nichž se za uzavřený kmen minulý končící na konsonant vkládá vokál, který nelze interpretovat jako kmenotvornou příponu. Jde o vokál (i) v případech jako unés-0-t/unes-0-l> unes-i-telný, odvéz-0-t/odvez-0-l> odvez-i-telný, postih-nou-t/postih-0-l> postiž-i-telný, dosáh-nou-t/dosáh-nu-l/dosáh-0-l> dosaž-i-telný/dosáh-nu-telný, dojís-t/dojed-l> nedojed-i-telný a jen zcela výjimečně dochází k haplologii: čís-0-t/čet-0-l> čit-0-telný,?jís-t/jed-l> jid-0-telný. V korpusech jsme narazili i na hapax obejí-t/obeše-l> neobejd-i-telný, kde je za základ derivace použit základ shodný s kmenem přítomným. Podobně výjimečný se jeví doklad ustá-t/ustá-l> ustoj-i-telný, kde základ je opět shodný s kmenem přítomným. Analogií je v uvedeném případě ovšem také adjektivum stojací (lampa) utvořené od téže podoby kmene, přičemž jde o adjektivum účelové na , kterýžto typ se pravidelně derivuje od kmene minulého.

Při rozgenerování na rovině slovníku by se měla v případě derivací od sloves patřících do uzavřených tříd a od sloves nepravidelných věnovat pozornost různým nepravidelnostem. Upozorňujeme na dublety např. od sloves typu jmout (např. odnímatelný / odjímatelný...). Ty je třeba řešit pomocí konceptu globální mutace. K mutacím slovesných tvarů viz podrobně kapitola Slovesa # 08-05, § 3 a # 08-05, § 4.

61 Tvary jako dýchatelno, nedýchatelno, sic! vysvětlitelno/vysvětlit [NN.*], neviditelno, viditelno, nepoznatelno, nedotknutelno, nesrozumitelno mají značku N.*. Přesto užití tvarů dýchatelno, nedýchatelno, vysvětlitelno a některá užití tvaru viditelno jsou jasně užití predikativní. Není zřejmé, zda jde o nedostatek na úrovni morfologického slovníku, nebo o chyby v desambiguaci. Zachování interpretace [POS=N] navrhujeme redukovat pouze na vybrané případy, viz níže § 3.4.2 a také kapitola Substantiva # 08-01, § 8.1.2.

62 Jedná se o tvary jako nepochopitelno, snesitelno, nevyhnutelno, neopakovatelno, nečitelno, nepopíratelno, vyslovitelno, srozumitelno, smrtelno, představitelno, poživatelno, postřehnutelno, nevysvětlitelno, nevyslovitelno, nesnesitelno, nerozpojitelno, hmatatelno, zřetelno, zavržitelno, zabydlitelno, uskutečnitelno, slyšitelno, razitelno..., které nejsou rozpoznány automatickou morfologickou analýzou (mají značku X.*). Jde o řídká užití (několik desítek lemmat většinou s frekvencí 1 – hapaxy) těchto tvarů s jmennou/predikativní (někdy i i substantivní platností). Navrhujeme substantivní interpretace omezit a v kapitole Substantiva # 08-01, § 8.1.2 upozornit na toto omezení. Tvary na .*telno doplňované do slovníku by měly mít s ohledem na korpusově podloženou evidenci [POS=D], výjimečně i [POS=N] k desambiguaci („Svět začíná šednout, všechno se mění v <neviditelno>,“ vzpomíná v knize Keep Floating. Peníze by podle něj měly jít do všech tří oblastí, které jsou zdrojem zdejšího „<nedýchatelna>“. Lidé mají matematiku zařazenou ve škatulce <nepochopitelno>...). Kombinace POS=D nikoli POS=A vychází z toho, že tvary na -telno nelze v pozici predikátu vždy nahradit dlouhým tvarem (např. je nedýchatelno → *je nedýchatelné/nedýchatelný). To ovšem neplatí v řadě jiných případů jako je (ne)myslitelno/(ne)myslitelné, je (ne)pochopitelno/(ne)pochopitelné,.... Tyto případy budou mít interpretaci [POS=A], viz výše.

63 V řadě případů (typicky u adjektiv na telný) chybějí relevantní tvary pro maskulina v singuláru. Výskyty jako V sezonním programu táborských cyklokrosařů <pochopitelen> hraje významnou roli domácí závod Světového poháru jsou překlepy, jediný doklad v korpusu synv6 je genitiv plurálu substantiva nepředstavitelno: Ty nejvyšší mocněnče součtu všech <nepředstavitelen>. Tvary na o jsou doloženy v predikativním užití (není myslitelno...), nicméně se objevují i další jmenné tvary (skutečnost nebyla <myslitelna>, jak bychom bez nich byli <myslitelni>).

64 Vyskytují-li se například v úzu především ustrnulé jmenné tvary, navrhujeme pro jejich interpretaci použít [POS=D] a není třeba násilně do slovníku doplňovat další interpretace [POS=A]. V tomto bodě by bylo dobré vzít v úvahu požadavky na slovník ze strany diachronního oddělení Ústavu Českého národního korpusu, neboť v textech z 19. století bude situace s užíváním jmenných tvarů adjektiv poněkud odlišná od současné.

65 Adverbiální charakter lze sledovat především v případech, kdy v úzu paralelně funguje adverbiální spřežka a synonymní grafické vyjádření tvořené předložkou, za níž (bez možnosti vložení dalšího slovního tvaru) následuje jmenný tvar především na o, a, u. Adverbiální charakter mají i užití v predikativní funkci, přičemž nezřídka právě v těchto užitích nelze vést přesnou hranici mezi substantivním (rozvinutelným adjektivem) a nesubstantivním (rozvinutelným adverbiem) užitím: je velké (dusno|horko|chladno|mokro|parno|prázdno|sucho, temno|teplo|ticho|vedro|vlhko) × je velmi (dusno|horko|chladno|mokro|parno|prázdno|sucho, temno|teplo|ticho|vedro|vlhko) × je (dusno|horko|chladno|mokro|parno|prázdno|sucho, temno|teplo|ticho|vedro|vlhko). V posledním případě je rozlišení toho, jedná-li se o substantivizaci, čili nic, nerozhodnutelné. Z toho důvodu dáváme přednost technickému řešení, které ač uměle rozhoduje ve prospěch interpretace [POS=D].

66 Příklady, které svědčí o tom, že i tyto jmenné tvary lze najít v adverbiálním užití, se v korpusu dají najít:… vostravské kotlině bude opět velmi <nedýchatelno>…,… Je tu velmi <dýchatelno>…

67 Osoby zemdlelé veletržním <nedýchatelnem> si kousek opodál mohly dopřát masážní kúru…,… výsledkem je až několikatýdenní toxické <nedýchatelno>…,… ze světa atomového <neviditelna>…,… na onom humanitním krásném <nepoznatelnu>…

68 Řada rarit doložených v synv6 pochází z básnické tvořivosti Z. Rotrekla:… Podstatná jména (ženský a střední rod) <neobydlitelno> šťastnosti <bydlitelno> v <hledatelnu> bezmocno <hmatatelno> <obydlitelno> překráčivosti Hřebelcárna v iluzionárně tokaniště krváciva zítřství v zauzlovatelnosti včerejškárna trestárna dneškárna hoblovárna vězeňství sobědárnosti kráčenství očistiště sliniště beznadějství <vysvoboditelno vymknutelna> statečnoství v sebepřekročenství <stoupatelno> v krvácno bezmocenství leč neuhybatelnost potřebovatelna dýchatelniště potřebárna <stoupatelna> <zoufatelno> v štěstství pastýřství zranitelnosti vepřoviště odpočiniště <smytelno> hříšství pečovatelství o nezhojenskost dojniště nadzemství účastenství… Taková tvořivost jistě dobře ilustruje možnosti češtiny v celé její kráse. Její zachycení ovšem, jak se domníváme, přesahuje možnosti automatické morfologické analýzy.

69 Užití doložená v korpusu diakorp6: Poněvadž ale pálení dle živlů odstrkavě mlunných jest <rozlično>…, proč by nebylo <slično> slušno řéci toho…,Dále může býti znamení jednak <slično> (vhodno, passend), jednak <neslično> se v synchronních korpusech vyskytují zcela okrajově: Když je třiadvacet a <slično> až k pláči, lidé zase žasnou nad dokonalostí světa a štve je, jak si zkazili život…,… Je mi tak <slično>, tak nebetyčno... Tvar slično by měl mít [POS=D].

70 Máme na mysli rozdíl mezi případy typu vepřové po <německu> × cestovat po <Německu>. V prvním případě navrhujeme interpretaci [POS=D], ve druhém [POS=N]. Spolehlivost desambiguace bude záviset na dodržení pravopisné normy. Obě interpretace by měly být v relevantních případech doplněny do slovníku. Viz více kapitoly Adverbia # 08-06, § 3.1.3 a Substantiva # 08-01, § 8.1.15.

71 Za implicitně nestupňovatelná byla pokládána adjektiva tagovaná v dosavadní praxi tag=A[CGMU].*. Oporou pro tuto praxi je neexistence syntetických (afixálně pravidelně tvořených) tvarů komparativu a superlativu jak pro jmenné tvary (s výjimkou tvaru raději, který byl tudíž dosud značkován tag=D.*), tak pro relační adjektiva posesivní a patrně i pro adjektiva z přechodníků minulých. U relačních adjektiv procesuálních je situace poněkud komplikovanější. V procesuálních významech je stupňovat nelze (vyjadřují relaci ke slovesu), v dezaktualizovaných významech stupňovatelná jsou, nicméně mezi sufix -íc/-ouc- a stupňovací sufix -[eě]jš- se v těchto případech vkládá sufix -n-, který běžně v derivacích od těchto adjektiv ruší konec derivační řady a umožňuje další derivaci (derivaci názvů vlastností pojmenovaných základovým adjektivem sufixy -o/-ost: jsoucno/jsoucnost, přejícnost, pomíjejícno/pomíjejícnost a pravidelné odvozování adverbií od adjektiv tohoto typu: matoucně, odzbrojujícně, šokujícně, uklidňujícně, strhujícně, vzrušujícně, ucházejícně, odstrašujícně, ohromujícně, následujícně, fascinujícně, zneklidňujícně, ohlušujícně, žalujícně, deprimujícně, odpovídajícně, omračujícně, zavádějícně, vysvětlujícně, neutuchajícně, zarážejícně, osvěžujícně, osvobozujícně, ponižujícně, okouzlujícně, udivujícně, znevažujícně, oslňujícně, alarmujícně, sebezničujícně, skličujícně, všeobjímajícně, odpouštějícně, zničujícně, zdrcujícně, zkreslujícně, nevyhovujícně, odhalujícně, slibujícně...). Důležité je, že potenciální dotvoření adjektiv na -ouc-ný/-íc-ný nelze vždy doložit a i tam, kde doložit lze, neplatí pravidlo, kterým by se řídila distribuce tak, že tvary na -oucí/-ící by se užívaly v aktuálních významech (procesuálních), kdežto tvary na -ouc-ný/-íc-ný ve významech lexikalizovaných/dezaktualizovaných. Z tohoto důvodu nepokládáme za nutné přegenerovávat morfologický slovník a násilně dotvářet lemmata na.*cný viz výše § 3.2. Naopak dogenerování a snad i přegenerování slovníku směrem k paradigmatickému tvoření adverbií od těchto adjektiv pokládáme za žádoucí. V korpusu SYN nejsou automatickou morfologickou analýzou rozpoznána adverbia paradigmaticky tvořená od adjektiv, a to: srdcervoucně, matoucně, nevidoucně, vidoucně, plovoucně, čistoskvoucně, vševidoucně, zvoucně, nehynoucně, vynikajícně, všeříkajícně, odzbrojujícně, znervózňujícně, šokujícně, strhujícně, uklidňujícně, ohromujícně, následujícně, odstrašujícně, ucházejícně, ohlušujícně, fascinujícně, deprimujícně, žalujícně, zavádějícně, zneklidňujícně, omračujícně, odpovídajícně, alarmujícně, zarážnějícně?okouzlujícně, sebezničujícně, osvobozujícně, skličujícně, zajímajícně, znevažujícně, odpouštějícně, oslňujícně, udivujícně, zničujícně, neutuchajícně, ponižujícně, osvěžujícně, vysvětlujícně, všeobjímajícně, deprimujícně, demotivujícně, slibujícně, zdrcujícně, obohacujícně, chtějícně, zpytujícně, zjednodušujícně, milujícně, fungujícně, nevyhovujícně, rozhodujícně, nechápajícně, ubíjejícně, překvapujícně, nicneříkajícně, nervydrásajícně, stresujícně, dostačujícně, neschvalujícně, otřásajícně, zatěžujícně, všeodpouštějícně, dlouhotrvajícně, zkreslujícně, povznášejícně, přináležejícně, odhalujícně, vzrušujícně, znevažujícně, následujícně, ucházejícně). Je třeba je do slovníku doplnit.

72 Není to ovšem jediné možné řešení, neboť například Slovenský národní korpus (SNK) lemmatizuje tvary sloves s prefixem ne- tvarem negativního infinitivu.

73 Příslušný seznam bude k dispozici uživatelům, aby bylo patrné, že jde o napadnutelné rozhodnutí autorů slovníku. Předběžně navrhujeme zařadit tato adjektiva: nerudný, nemocný, neřestný, neduživý, nestvůrný, nezbedný, nehorázný, nerostný, nenasytný, nebožčin, nebožtíkův, nevolnický, nešťastníkův, nezdarův, nebojsův, nedoukův, nevolníkův... Naopak adjektiva s převahou tvarů s ne- a byť jen (o)krajově doloženými tvary bez ne- (kalý/nekalý, stoudný/nestoudný,...) za negativa tantum nepovažujeme, stejně tak jako za negativa tantum nepovažujeme případy, kdy dvojice s/bez ne- od jednoho základu nejsou sice striktně vzato opozity (přátelský/nepřátelský, přítelův/nepřítelův je protiklad jiného typu než třeba dobrý/nedobrý, v obou případech lze však prefix ne- intuitivně vydělit a spojuje se s široce pojatým negujícím významem).

74 V korpusech se adjektivum místný vyskytuje většinou jako příklad odděleného psaní adjektiva v kontextu číslovky, takže jde fakticky o grafický úzus zachycení kompozit typu n-místný. Dosti značný je výskyt překlepů, kde je z kontextu patrné, že jde ve skutečnosti o záměr použít tvar adjektiva místní. Některé doklady svědčí ovšem i o užití ve významu nepatřící se/nepatřičný ve spojení s negativním slovesem (při oficielních přijímáních diplomatických není <místným>, aby byla přítomna dcera presidenta).

75 Dovolujeme si tvrdit, že ojedinělý doklad alternace c/č v případě tvaru Kostelničin není kontaminace, nýbrž překlep. Postava Janáčkovy opery Jenůfa je totiž Kostelnička, nikoli kostelnice. Pro překlep (vynechání č) v regulérně utvořeném tvaru Kostelniččin) hovoří řada dokladů příslušného adjektiva na internetu.

76 K přegenerování v případě mechanického aplikování formálních pravidel na slovotvorbu viz Osolsobě 2009.

77 Všechny tři doklady substantiva kamzičina nalezené v korpusu SYN jsou chybně desambiguovány jako adjektiva AU.* od substantiva kamzice.

78 Seznam feminin/živých bytostí na -ice vygenerovaný z dat brněnského morfologického slovníku je v příloze (ice_fem_ziv.docx). Seznam obsahuje 868 feminin. Jejich anotace jakožto jmen živých bytostí byla provedena ručně. Je založena na datech uvedených ve zdroji (SSJČ), z něhož pocházejí většinou data strojového slovníku češtiny (Osolsobě 1996), a na intuici rodilého mluvčího. Může tudíž obsahovat a) zastaralé interpretace (zvonice jako fem. protějšek ke zvoník je čerpáno ze SSJČ, interpretace je z hlediska dnešního úzu naprosto nepravděpodobná) a b) chyby (obvyklá opomenutí, která jsou běžným důsledkem každé ruční analýzy rozsáhlých dat). Podobné seznamy lze dodat pro všechna feminina (i maskulina, ta jsou ovšem selektována na životná/neživotná kategorií rodu). Seznam dalších feminin podle vzoru růže označující živé bytosti je v příloze (e_e_yne.docx), seznam feminin podle vzorů píseň a kost a nepravidelně skloňovaných označující živé bytosti je: máť, pramáť, laň, saň, labuť, myš, veš. Seznam feminin podle vzoru žena označujících živé bytosti je natolik rozsáhlý, že je nesnadné jej uložit jako wordovský soubor. Všechna feminina otagovaná v brněnském slovníku jako feminina označující živé bytosti jsou k dispozici na adrese: http://deb.fi.muni.cz/deriv v souboru žena_G.

79 Viz také kapitola věnovaná substantivům # 08-01.

80 Zcela hypoteticky jde o aktualizaci podle vzoru: „Vítám tě, <dcero Evino>. pronesl někdo za mými zády.

81 O nedostatcích na rovině slovníkového popisu svědčí např. značkování adjektiva <fordův/fordův [X.*]> motor v porovnání se značkováním adjektiva <Fordovy/Fordův [AU.*]> závody. O personifikaci neživotných maskulin v souvislosti s flexí viz např. M. Šulc nebo K. Najbrtová (2012). Z uvedených studií lze získat korpusově podložený seznam maskulin, kterých se „personifikace“ na úrovni tvarosloví týkají. Z nich je možné vycházet, protože taková maskulina se mohou jako životná chovat i na rovině slovotvorby (srov. např. personifikace jmen automobilů). Tyto úpravy se ovšem nebudou týkat mnoha lemmat ve slovníku. Víceméně tu jde o okrajovou záležitost, na niž upozorňujeme jen pro pořádek.

82 V systému „brněnského“ značkování (Osolsobě 1996) je popis tvoření adjektiv na -[(ou)|í]cí a na -ší propojen s popisem sloves. Nicméně také nejsou zohledněny všechny varianty tvoření, které jsou na základě korpusových dat popsány níže.

83 V následujících tabulkách jsou u adjektiv na -[(ou)|í]cí a -ší uvedeny značky, které tato adjektiva mají v korpusech řady SYN. Pokud mají značku AG.*/AM.*, není třeba nic opravovat. Pokud mají značku AA.*, je třeba značkování opravit; pokud mají značku X.*, popř. jsou doložena z jiných zdrojů (czTenTen12/internet/intuice rodilého mluvčího), je třeba udělat patřičné úpravy ve slovníku, které by měly být v souladu s tím, jak jsou „rozgenerována“ tato adjektiva od sloves. Ve sloupci nejvíce vlevo uvádíme infinitivy sloves, která by měla být prověřena ve slovníku automatického morfologického analyzátoru z hlediska pravidel pro generování adjektiv na -[(ou)|í]cí. Slovotvorné varianty by se měly ve značce v budoucnu shodovat a měly by tvořit vícenásobné lemma. Zároveň by měla být ze slovníku automatického morfologického analyzátoru odstraněna adjektiva, která jsou nyní ve slovníku uložena jako AA.* a která budou nahrazena adjektivy označkovanými jako [POS=A & SUB=G]. V případě, že by ve slovníku zůstaly obě interpretace (AA.* i AG.*), docházelo by k nesmyslné „nabídce“ k desambiguaci. Tato situace u některých adjektiv patrně už nastala (případy, kdy jedno lemma má jak značku AA.*, tak AG.*).

84 Uvedené dvojice adjektiv jsme získali vesměs automaticky prostřednictvím nástroje Morfio (Cvrček, Vondřička 2012) http://morfio.korpus.cz/ba2PBDTG a http://morfio.korpus.cz/pISbe460. Mapují tudíž situaci na datech z korpusů SYN2010 a SYN2005. Značkování některých tvarů níže uvedených adjektiv v korpusu SYN2005 se odlišuje od značkování těchže tvarů v korpusu SYN, a to tak, že v korpusu SYN2005 je značka AA.* nebo AG.* a v korpusu SYN je značka X.*. Máme za to, že značkování v korpusu SYN2005 se nezakládá na úpravě slovníku, ale na práci guesserů, a tudíž na ně upozorňujeme. Některé dvojice jsme získali ruční analýzou dat z celého korpusu SYN.

85 Tvar hřmoucí jsme našli doložen v korpusu CzTenTen12 (... Po kilometru slyším v dálce <hřmoucí> lavinu...). Může jít o analogii k tvarům jako skvoucí, horoucí, žádoucí... Diachronně souvisí některé slovotvorné dublety (horoucí/hořící, žádoucí/žádající) s historickým vývojem slovesných tříd a vzorů (z původních čtyř se vyvinulo současných pět, více Bauer, Lamprecht, Šlosar 1986, s. 202). Kromě historického vývoje a stavu v dialektech může spolupůsobit i „tlak systému“ (Systemzwang) projevující se různými analogiemi.

86 Okrajově se objevují i doklady jako např.… se jenom tak od oslavy na chvilku ztratila mezi dav <chcoucí> podpisy a fotky…, které sice porušují současnou kodifikaci, ale lze je zdůvodnit jak historicky (srov. též dnešní slovenské chcúci), tak analogií (dublety na -oucí/ící u dalších nepravidelných sloves jako vidět, vědět, dát, viz níže).

87 Např.… Křížová cesta by vyžadovala postavení pomníčku a doplnění <chybících> obrazů u několika zastavení… Adjektivum chybící od slovesa chybět je ovšem homonymní s adjektivem tvořeným pravidelně od slovesa chybit:… deset hlavní ručnic, nikdy <nechybících>, hledí na ně... Takových případů není mnoho a zmíníme se o nich souhrnně v závěru tohoto textu v oddíle věnovaném slovotvorným homonymům.

88 V korpusu SYN je doloženo adjektivum rezivějící/AG.*, máme však za to, že správně lze utvořit též rezivící (... Přeju si, aby jsem byl tak dobrý jako ty,/ starající se a věřící, /přeju si, abych byl mladý, ale jsem starý /a <rezivící>....) podobně jako k děravějící/AG.* je utvořeno děravící.

89 Viz změna v PČP z roku 1993.

90 Adjektivum skvoucí je ze synchronního hlediska nepravidelně utvořeno (viz výše poznámka k adjektivu hřmoucí), nicméně jde o derivát od slovesa skvít/skvět (se)/stkvít (se) (též var. stkvoucí). Kolísání mezi vzory krýt a trpět/sázet je patrně na úrovni slovníku zachyceno (tvary skvím, skvíš… i skvěji, skvěješ… jsou správně interpretovány na úrovni lemmatu i morfologické značky).

91 Toto kolísání nepostihuje slovník automatického morfologického analyzátoru na úrovni rozgenerování slovesných tvarů slovesa tlít/tlet. Tento stav je důvodem chyb na úrovni morfologického značkování. Tvary podle vzoru krýt jsou a) nerozpoznány (zasažení chlorem opadalo, nyní <zetleje/zetleje/X.*> a chlor se dostane do půdy) a b) chybně interpretovány jako tvary přechodníku (na vrcholu pořád ještě stojí a úspěšně <tleje/tlít/Ve.*> Česká bouda). Doplněním tvarů podle krýt do slovníku by se rozšířila schopnost analyzátoru interpretovat správně tvary.*tlej[uie|(ou)|(eš)], .*tleje[mt]e. Tvar 3. osoby sg. (tleje) by byl i nadále homonymní s tvarem mask. sg. přechodníku přítomného. Tato homonymie by se musela řešit na úrovni desambiguace tak, jak je tomu ve všech případech sloves III. třídy slovesné (všechna mají tuto tvarovou homonymii).

92 Sloveso dštít kolísá podobně jako tlít (dštím/dštiji/dštiju). Doklad adjektiva dštijící se nám ovšem nepodařilo najít, ačkoliv je pokládáme za správně utvořené.

93 ... v pohledu za panáčky seroucí, <chčící>, oběšené, opilé...

94... Třeba hlídku válející se u ohníčku anebo třeba na <chcajícího> ho-či-minha u malebného vodopádu ...

95 jaké mají andělé <dlející> u Boha...

96 Abecední seznam sloves podle vzoru brát, která často kolísají mezi vzorem brát a dělat, viz Šmilauer 1972, s. 211. Šmilauerův seznam lze pokládat za úplný. Nově utvořená slovesa se v češtině neohýbají podle vzorů nést, péci, brát, mazat, umřít, začít, krýt. V porovnání s tímto seznamem není tabulka 3 úplná, neobsahuje všechny potenciální deriváty. Tabulku lze dle seznamu doplnit a příslušné tvary „rozgenerovat“. Doklady o jejich existenci nelze ovšem získat z dostupných korpusů.

97 V některých případech se jedná o starší varianty, které jsou nahrazovány novějšími v důsledku kolísání sloves mezi vzory mazat/brát a dělat (případy jako lámoucí a lámající). Toto kolísání se na úrovni tvarosloví netýká některých sloves, nicméně vidíme, že působí ve smyslu „tlaku systému“ na úrovni slovotvorby. Tvary adjektiv na -ající doložené v korpusu czTenTen12 pocházejí převážně z internetových diskusí a dokládají pronikání odvozenin od tvarů analogických tvarům podle vzoru dělat i u sloves, u nichž bychom případné opěrné tvary jako *cpají, *štvají, *zvají... atd. nepředpokládali.

98 flákači chodící si jen pro peníze a <dlaboucí> na cokoliv toto zvládnout nemohou a nechtěj...í

99 Žiju ve světě peněz, peníze a krása jsou dvě síly, <hýboucí> materiálním a mentálním světem...

100 Ať už jste Veleknězem Klimatologické církve, nebo nějakým hlavu si <drboucím> Kanaďanem, otázka zní, zda jste schopni dát věci nějaký smysl...

101 Teď je to o hodně lepší, ale s každým dalším <kluboucím> se zubem...

102 pokud máte dost trpělivosti několikrát denně absolvovat omotávání <škuboucí> se nohy suchým zipem...

103 a tím pádem žijete permanentně s <dupoucím> stádem slonů nad hlavami...

104 Nám je však pochybnými existencemi <kopoucími> asi za jiné ismy do hlavy vtloukán opak.

105 <koupoucí> se žena v paláci Quseir Amra...

106 Pokud se podle toho chová celá politická strana, <sápoucí> se po moci a po vedení státu, je to trochu laciné.

107 Další návštěvy trénuješ, případně poradíš <tápoucím>…

108 V Evropě, která je zbabělá, plná šílenců chránících motýly a úředníky, ale <kašloucí> na lidi…

109 Což prudce kontrastuje s místní zažitou pověrou, že líní Brňáci chrápó do poledne (pro detailisty: <chrápoucí> Bajů není přímo z Brna), zatímco pilný Lhoťan...

110 Pozor na <klamoucí> reklamy o zdravotních matracích…

111 týrání Hanzlíka, když on hladov a žízniv kouká na <cpajícího> se Donutila...

112 mnoha pobavenými pohledy mých přemilých, čím dál více mne <štvajících> spolužáků...

113 zmateně pobíhajících lidiček <rvajících> si vlasy bude povícero...

114 nabízela obrazy srdcervoucně <řvajících> dětí kopajících do učitelky, která se je snažila odvést do třídy...

115 nevíte-li, jak zkrotit vlastní potomky <zvající> si domů kamarády z širého okolí...

116 Lidi jsou totiž lidi... jsou hloupí, nepoučitelní, sobečtí, stereotypní smečka <hnající> se za několika tzv. vůdci...

117 Neznám důchodce <brajícího> léky nadmíru...

118 vodopády ukryté ve skalách i mocně se <drající> na povrch...

119 Hned zkraje jsme se přimotali mezi stádo <srajících> krav.

120 čemuž sekunduje taktéž velice málo <žrající> paměti...

121 Abecední seznam sloves podle vzoru mazat, která často kolísají mezi vzorem mazat a dělat, viz Šmilauer 1972, s. 212. Šmilauerův seznam lze pokládat za úplný. Nově utvořená slovesa se v češtině neohýbají podle vzorů nést, péci, brát, mazat, umřít, začít, krýt.

122 a TV Hamás posílá AL Jazire záběry <pláčoucích> žen a dětí. Vím, je to tam hrozné...

123 http://de.wiktionary.org/wiki/mazat_%28Konjugation%29

124… Nojo, jenže dokavaď se <mažící> hošíci nevzpamatují a nezačnou zcela vážně a seriozně jednat (a neinvestují do toho nějaký ten čas a práci), tak se nic dít nebude…;… Tím pádem, je opatření zbytečné – troufl bych si odhadnout, že uživatelé <mažící> po sobě jednotlivé příspěvky jsou naprostou menšinou…

125 A potřebné výrazy <vážoucí> se k tomuto neobvyklému druhu podnikání...

126 Potenciální homonymum s adjektivem tvořeným pravidelně od slovesa vážit. Doklady od slovesa vázat (se) na jsou např. ... mnohostranné výzkumy <vážící> se na problematiku kooperace...

127 Vykladači pijící víno a <kážoucí> vodu...

128 Různí koordinátoři (vytvořené umělé místa, aby nemuseli mezi sebe rovné) a nic nedělající pacholci v kanclích (<píšoucí> pověsti a báje o činnosti)...

129 privatizátor v bílém límečku a úspěšný vážený člověk způsobil státu možná větší škodu jako všichni nepracující, kriminalitu (vedle bílých a jiných menšin) <pášoucí> Romové dohromady...

130 Podívej se na roty <lžoucích> českých historiků v zájmu národního státu…

131 Vy mi to berete z pusy, jakoby odska byla jedinou <lhající(lžoucí, lžící>:o))))) stranou...

132 Vtom spatřím, an teď k nim všelijaké vnitř i zevnitř poraněné, hnijící a <kyšící> nosí a vodí: k nimž oni přistupujíc, do shnilin jim nahlédali, puchu od nich jdoucího ...

133 Potenciální homonymum s adjektivem tvořeným pravidelně od slovesa pářit se. Doklady adjektiv od slovesa párat (se s čím) jsme přese všechnu snahu nenalezli, ačkoliv intuice rodilého mluvčího pokládá transpozici spojení jako… politici, kteří se s nikým <nepářou>…… s nikým se <nepářící> politici… za přijatelné, přestože je víceznačné.

134 Středoevropánka z rozmaru se <řežoucího> žiletkami a kňučícího, jak ho nikdo nechápe

135 Někdy stačí jen ruka držící hřebínek <češoucí> vlasy – jen drobný barevný detail.

136 Potvory! <Koušoucí> potvory!

137 Sloveso hrýzt patří ke vzoru nést, sloveso hryzat ke vzoru mazat. Tvary od slovesa hrýzt se v současné češtině nevyskytují (jsou nahrazeny tvary tvořenými pravidelně podle tisknout – hryznout, viz níže), nicméně je doloženo adjektivum pravidelně od nich utvořené (hryzoucí jako lezoucí vedle nedoloženého hryžoucí jako mažoucí a doloženého hryznoucí jako tisknoucí).

138 Představa ovšem hladem <mřoucího> děcka, jemuž bez kusu pečiva není lze spočinout spánkem spravedlivých...

139 a pod nohama by mi tančila rudá barva <mřícího> sluníčka.

140 Stejný zřetel rozhoduje pro postavení stran k <proucím> se frakcím v táboře chartistů.

141 Hobbes má malý čas na různé <přící> se sekty filozofů a objekty k jakým lidem braly From Aristotle je civilní filozofie...

142 Správnej fanda VF by měl mít odvahu jít do <vřoucího> kotle přímo pod kluky a tam si užíít

143 že u stínidla houstne světlo od kadidla že se bezpochyby anděl v <zroucích> z nebe propadne

144 Táborák, pivko, pohodička, vůně <pekoucího> se masa.

145 ještě skřípějí fůry s úrodou, ještě zvoní kosy <sekoucí> otavu...

146 osamocení zaměstnanci <sečoucí> trávu křovinořezem nebo motorovou sekačkou...

147 lidé typu Vlka, bijící se za práva občanů a <tlučoucí> politiky...

148 Mimoto se v korpusu SYN sporadicky vyskytují tvary adjektiva vleknoucí, které jsou asi analogicky utvořené jako rovněž řídce doložený tvar adjektiva řeknoucí ke kodifikovanému řkoucí (viz níže).

149 A mám výhled na lidi <vlečoucí> tašky z Alberta...

150 no jako já čumím i nemohoucí může to co <můžoucí> překvapil...

151 V korpusu czTenTen jsou doloženy tvary adjektiva střehnoucí (A rádoby zkormoucený výraz na <střehnoucí> manželku).

152 Adjektivum střežící se tvoří pravidelně od slovesa střežit. Sloveso střežit je ovšem samozřejmě příbuzné se slovesem stříci (se).

153 Viz níže adjektivum zřeknoucí (se).

[154] [GMU=Bu] by měla mít adjektiva padnoucí, řeknoucí, střehnoucí, [GMU=u] by měla mít adjektiva padoucí, řkoucí, střehoucí.

155 Viz výše poznámka k adjektivům od sloves hryzat/hrýzt.

156 Infinitiv *temnout není doložen. Může jít i o kontaminaci s adjektivem od substantiva tma v etymologické figuře hebrejského superlativu tma tmoucí, nebo o kontaminaci s řídce se vyskytujícími synchronními výjimkami, kdy slovesa podle IV. třídy (tmít se/temnět) mají adjektiva odvoditelná z historických tvarů sloves (skvoucí, horoucí, žádoucí, živoucí…).

157 Viz výše adjektivum řkoucí.

158 Jde o variantu slovesa infinitivu žít – žnu homonymní se slovesem žít – žiji (srov. lid. píseň sil jsem proso na souvrati, nebudu je žíti). Tato homonymie by neměla mít na adjektiva žádný vliv. (Pokud by ovšem někoho nenapadlo tvořit adjektivum žící jakožto synonymum ke žnoucí, což by nebylo synchronně ústrojné.) Tokeny žící jsou vesměs v korpusech překlepy (rozdělená slova).

159 Toto adjektivum prokazatelně souvisí se slovesem padnout. Jde o monokolokát ve spojení padoucí nemoc tj. padoucnice. Adjektivum má značku AA.*. Otázka je, zda v tomto případě má být interpretováno jako AG.* na úrovni morfologické značky.

160 Místo adjektiva vezmoucí by mělo být patrně správně beroucí, místo přijmoucí by mělo být patrně přijímající, nicméně adjektivum pojmoucí od slovesa pojmout, které může vyjadřovat neaktuální prézens, je evidentně v pořádku.

161… Tohle byl srdce <jmoucí> a překvapivě dobře zformulovaný argument…… Jumper, ne obrovskou dech <jmoucí> loď…

162… fanatik a tupec, <vezmoucí> do ruky štětec…

163… oratorium <pojmoucí> 100 lidí, bylo rychle postaveno…

164 Odbojníků <přijmoucích> za svůj fakt, že označil-li je někdo za třídního nepřítele a chystá se je likvidovat, je jejich právem a povinností se bránit...

165 Celkem se jedná o 3760 položek, v nižších frekvenčních pásmech převažují překlepy.

166 Adjektivum se sice patrně používá téměř výlučně dezaktualizovaně, přesto je podle našeho názoru lze užít i v procesuálním významu (okouzlující dívka okouzlující jej svými půvaby). Snažíme se nezanášet sémantickou desambiguaci na úroveň morfologického slovníku, je třeba přijmout víceméně technické řešení (viz výše návrh značkovat adjektivum okouzlující a několik dalších jemu podobných jako [POS=A & SUB=0]).

167 Toto adjektivum je tvořeno nepravidelně, vztahuje se sice významově ke slovesu zničit, to je však dokonavé, což je možným zdůvodněním anomálního tvoření od nedoloženého slovesa ?zničovat. Navrhujeme u něj značkování [POS=A & SUB=0], viz výše.

168 Navrhujeme u něj značkování [POS=A & SUB=0], viz výše.

169 Na rozdíl od zničující se význam vztahuje k nedokonavému slovesu zpracovávat. Navrhujeme u něj značkování [POS=A & SUB=0], viz výše.

170 Navrhujeme u něj značkování [POS=A & SUB=0], viz výše.

171 Podle SSJČ poněkud zastaralá varianta infinitivu tyčiti se.

172 Navrhujeme u něj pouze značkování [POS=A & SUB=G], viz výše.

173 Navrhujeme u něj pouze značkování [POS=A & SUB=G].

174 O „dezaktualizaci“ aktivních verbálních adjektiv se hovoří v Mluvnici češtiny I. (Dokulil 1986, s. 322, 330), kde jsou uvedena adjektiva tvořená sufixem - od aktivních slovesných adjektiv na -c(í). Citujeme: „Patří sem adj. z prézentních kmenů sloves jako kajícný, přejícný, mohoucný, pomíjejícný, vroucný, vědoucný, jsoucný, horoucný, živoucný. Pasívní význam má žádoucný, anomálně je tvořeno bojácný.“ S tímto citátem si dovolíme polemizovat. K adjektivům horoucný, živoucný nejsme schopni najít pravidlo, podle něhož by se synchronně tvořila od „(!) prézentního kmene slovesa“. Podobně by synchronně pravidelně tvořeným adjektivem od prézentního slovesného kmene bylo *žádajícný, nikoli žádoucný. Pasivní význam má nejen adjektivum žádoucný, ale i adjektivum žádoucí. Anomálně tedy není dle našeho názoru tvořeno jenom adjektivum bojácný, ale i horoucný, živoucný, žádoucný. Formální anomálie adjektiva bojácný je ovšem zvýrazněna absencí příslušné varianty na -cí (*bojácí).

175 také pregnantní a kalkulované <bytoucí> jádro vymezovaného ens…

176 prýští se mléko život <dadoucí> novému zrozeňátku...

177 Veselá partička, <dající> se přirovnat k českému Děda Mládek Illegal Bandkonstrukce. Mezi doklady v korpusu SYN převládají ovšem překlepy. Také se nevyskytl doklad od slovesa dát se synonymního s dít se.

178 Jde snad o kliku lidí na sebe vzájemně něco <vědících>…

179… Kochan se rozjel za mužem z lesů <slovoucím> jménem Vintíř…

180 Naprostá většina tvarů označovaných v korpusu SYN jako slující/AG.* jsou překlepy substantiva sluj, nicméně se objeví i několik málo případů správně lemmatizovaných a označkovaných adjektiv jako např.… dokonávaje a proškrtávaje nový kus, <slující> Adam, stvořitel…

181 ... Veselá partička, <dající> se přirovnat k českému Děda Mládek Illegal Bandkonstrukce...

182 Vhodný příklad jsme nenašli, rozhodně je ale třeba na tuto nepravděpodobně se vyskytující, ale možnou homonymii upozornit. Odstranění frapantních chyb v desambiguaci tvaru dál (SYN2000) svědčí o tom, že problémy s homonymií tvarů od slovesa dát již byly řešeny.

183… deset hlavní ručnic, nikdy <nechybících>, hledí na ně...

184… Křížová cesta by vyžadovala postavení pomníčku a doplnění <chybících> obrazů u několika zastavení…

185… <pářící> se zvěř,…,… <pářící> kotel…

186 Ačkoli se nepodařilo v dostupných korpusech najít potřebný doklad, intuice rodilého mluvčího pokládá např.… s nikým se <nepářící> politici… za přijatelné, přestože je víceznačné.

187… <smějící> se tvář…

188… polednice, nevěstka <nesmějící> vycházet před polednem…;… jedná se o produkty <smějící> používat značku CE…

189… hrála banda <stávající> dřív na Staroměstském náměstí…;… chátrající budova, <stávající> se terčem vandalů a zlodějů…

190… <stávající> situace

191… <vážící> šedesát kilo…

192 ... mnohostranné výzkumy <vážící> se na problematiku kooperace...

193 Například: vážící si někoho × vážící se na něco.

194 Tištěné slovníky zaznamenávají slovnědruhové transpozice pouze u tzv. „lexikalizovaných“ případů. I u nich ovšem zaznamenávají buď možnost, že substantivum je maskulinum životné, nebo maskulinum životné i femininum. Porovnáme-li ovšem údaje ve slovnících s korpusovými doklady zjistíme, že v korpusech se vyskytují užití ve významu maskulinum i femininum i v případě, že slovníky uvádějí pouze maskulinum. Nelexikalizovaných transpozic je v korpusech velké množství a je zajímavé sledovat, že se vyskytují ve všech frekvenčních pásmech „formálních adjektiv“. Je tedy patrné, že jde o otevřenou množinu. Z tohoto důvodu výše uvádíme návrh na zařazení několika substantivizovaných adjektiv na oucí/ící do slovníku, viz výše § 3.2. Ostatní navrhujeme ponechat pouze s adjektivní interpretací u vědomí toho, že slovník bude podgenerován. Viz více výše a kapitola Substantiva # 08-01, § 8.1.

195 Lemmata mají značky AG.*, někdy i AA.*, nebo NN.*. Výsledky desambiguace nejsou příliš uspokojivé.

196 který začal podporovat <rodivší> se teroristické organizace...

197 Otázku, jak nakládat na úrovni nástrojů automatické morfologické analýzy s popisem tvarů, které jsou z hlediska kodifikace substandardní, je třeba řešit na úrovni globální mutace.

198 <Přicházivší> ze sna...;... Šesté místo je určeno pro <příletivší> televizní reportéry...

199 C - konsonant.

200 Dům Müllerův, <vznikší> na konci tohoto období, je vyvrcholením prostorotvorných zásad Loosových...

201 rozuměj naprosto svévolné interpretace, <pronikší> až na církevní pole

202 dokonávala se bitva, <začavší> od 8. z rána...

203 ... k objasnění <nastanuvší> situace...

204 Jde o slovesa jmout, najmout, zajmout, vyjmout, odejmout, obejmout, ujmou (se), přijmout, projmout, dojmout, vyjmout, pnout (+ prefigované varianty), tnout (+ prefigované varianty), žnout/žít, žhnout (problematické je sloveso rozžehnout), vznít/vzejmout (se) a o slovesa začít, započnout, načnout, počnout.

205 Sloveso zalnout uvádí jak PSJČ, tak SSJČ jako zastaralé ve významu přilnout, sloveso přemnout uvádějí oba slovníky ve významu „jemně promnout“. Možnost interpretovat tvar zally jako tvar slovesa zalnout spadá na vrub přegenerovávání automatické morfologické analýzy, resp. pravidlu uplatněnému při sestavování slovníku pro automatickou morfologickou analýzu. Toto pravidlo připouští, že slovesa vzoru tisknout mohou tvořit tvary l-ového příčestí (n-ového příčestí) jak s kmenotvornou příponou nu-, tak bez ní (tedy tiskl/tištěn i tisknul/tisknut), což je sporné zejména pro sloveso lnout (ale např. také pro mnout) i jejich prefigované deriváty. Pro ostatní slovesa (např. hnout, schnout, usnout.…) neexistují v mluvnických popisech pravidla, která by bylo možné jednoduše zobecnit a především formálně popsat. To byl zřejmě důvod pro zařazení zjednodušujícího pravidla do popisu pro automatickou morfologickou analýzu. V korpusu SYN jsou tudíž tvary Zally/zalnout (mužské jm., nom. je Zalla, nebo ženské jm. nesklonné) a Zalli/zalnout (ženské jm. patrně nesklonné, nejde-li ovšem o překlep) interpretovány jako l-ová příčestí slovesa zalnout. Vlastní jména se ve slovnících automatických morfologických analyzátorů uvádějí více méně ad hoc. Předpokládáme, že tvar tudíž nebyl nabídnut k desambiguaci. (Srov. též lemmatizaci a značkování překlepu přemlo/přemnout <přemlouval.)

206 Stejně tak i z ruštiny přejaté kompozitum sumasšedší.

207 Celkem se jedná o cca 400 adjektiv. Seznam není úplný, leccos je možné doplnit ze seznamu, který přikládáme v souboru (slovesa_sázet_2.docx). Rozdělení do tabulek sleduje adjektiva od sloves podle slovesných tříd a vzorů. Lingvistické poznámky představují zároveň síť podkladů pro případné úpravy popisu morfologie sloves na úrovni strojového slovníku (viz např. poznámka k adjektivu tlící/tlející).

208 Všechny opěrné tvary nejsou ve slovníku zachyceny a adjektiva někdy odpovídají pouze potenciálním (nikoli reálně doloženým) opěrným tvarům (historický vývoj + tlak systému + různé analogie).

209 Za všechny nedostatky formálního popisu se omlouváme a budeme vděčni za upozornění na chyby.

210 Průčelí bylo částečně <kryto/krýt [Vs.*]> divokým vínem. Nebyl to vlastně posed, ale <krytá/krytý [AA.*]>, zateplená kazatelna s malou terasou.

211 Srov. tvary jako vydivíno, navaříno, povědíno, odzvoníno, nasněžíno, namíříno, zaplacíno, uklizíno, napečíno, vodevříno, rozsvícíno, uvaříno, vidíno, sbalíno, odsloužíno, nahulíno, nabančíno, dovolíno, zabalíno, zaprášíno, vyšpulíno, vystřílíno, vaříno, splníno, rozsvícíno, posečíno, podojíno, odsezíno, odemčíno, nalesbíno, nakročíno, naježdíno, dotočíno, završíno, zatemníno, zatažíno, zasněžíno, zarybníno, zapaříno, zamíříno, zamokříno, zachmuříno, vyžehlíno, vyčasíno, vyzlacíno, vystřelíno, vynešíno, vykročíno, vyhvězdíno, vodzvoníno, vodtroubíno, vodsloužíno, vodsedíno, vobsazíno, ušetříno, upravíno, ujedíno, stažíno, spatříno, přihrazíno, přidělíno, přetopíno, přeplníno, přeplacíno, provázíno, prostříno, pověšíno, povotevříno, pomožíno, pokoušíno, pochválíno, pečíno, odcvičíno, obsazíno, nespatříno, naprášíno, naměříno, naleštíno, nakrmíno, naklizíno, nakadíno, naježíno, naházíno, nahozíno, nadělíno, nabruslíno, boříno, nerozpoznané automatickou morfologickou analýzou.

212 Srov. doklady z korpusu czTenTen12: ... Měli jste něco <předplatíno>...,... vždyť jsem měl přece <uklidíno>...,... měla tam <naklidíno>....

213 Tvary předňat nebo předejmut nejsou v korpusu SYN doloženy, nicméně máme k dispozici interpretace jiných prefigovaných variant a předpokládáme, že tyto interpretace mohou naznačit směr konzistentního řešení i v případě absence konkrétních tvarů v úzu prezentovaném korpusem. Tutéž zásadu můžeme aplikovat i v případě absence dublety bez kmenotvorné přípony (*tčen) u derivátů od slovesa tknout.

214 Dublety typu sepjat/spjat bude třeba řešit jako globální mutace. Dublety tohoto typu se vyskytují také u tvarů od sloves I. třídy vzorů brát (drát, prát, srát, žrát, hnát, stlát) a umřít (mlít). Jedná se mj. o varianty jako sedrán/sdrán/sedraný/sdraný. Srov. značkování v korpusu SYN: ... žebra polámaná, <sedrán/sedrat [Vs.*]> a odrán stejnou děvkou větrem... ale..., lana a řetězy <sdrány/sdrány [X.*]>.... Obecně jde o slovesa s prefixy nad(e)-, ob(e)-, od(e)-, pod(e)-, před(e)-, s(e)-, z(e)-.

215 Variantní infinitivy nemohou mít všechna slovesa s kořenným í. Variabilitu vykazují slovesa .*sít/.*set,.*klít/.*klet,.*plít/.*plet,.*tlít/.*tlet,.*dít/.*dět, ale i sloveso I. třídy vzoru umřít (.*mlít/mlet). Viz také kapitola Lemmatizace # 04, § 2.3 a kapitola Slovesa # 08-05, § 3 a # 08-05, § 4.

216 Překvapivý je fakt, že dlouhý kořenný vokál se u sloves III. třídy vzoru krýt pravidelně váže na infinitiv. Tím lze patrně vysvětlit i zpětné pronikání tvaru s dlouhým kořenným vokálem do infinitivu a vznik nepříjemné homonymie variantního infinitivu slovesa přesít (jejíž pracovníci museli kompost na rotačním sítu <přesát>) a infinitivu slovesa přesát s významem „přečerpat sáním“ (Přiznám se, že jsem pln vzteku vážně zamýšlel hadicí <přesát> obsah nádrže do nějakého lesního zdroje pitné vody) a příčestí/krátkého tvaru adjektiva maskulina v singuláru obou sloves (Na vzduchu vysušený vzorek je <přesát> přes síto o velikost ok (2 mm) a pomlet v kulovém mlýnku… × U sloves <přesát>, přisát zní trpné příčestí <přesát>, přisát i přesán, přisán (v ŠP u základního slovesa sát je uvedeno trpné příčestí jen sát, ale slovesné substantivum je sátí i sání). Z hlediska potenciální homonymie jsme v korpusech ověřovali výskyt tvaru prosit ve významu „prositý“, který jsme ovšem nenašli.

217… kobylky veliké po houfech létajíce, též a tím obyčejem, jako za císaře Karla; a potom z Uher letěly do Rakous a Moravy, též i do Čech a kdežkoli připadly, buď na luky nebo dědiny aneb <ositá> obilí, také i na lesy, tu všechno zelené, buď trávu nebo listí z kořen pojedly a usušily, že po nich neměli co žíti, ani sen sekati...

218 EU nutí zemědělce snižovat <oseté> plochy...

219 Do <prosáté> mouky nastrouháme tuk...

220moučkový cukr dobře <přesetý>...

221 Lokality jsou rozkopané, <přesité> přes síta a nemají již žádnou archeologicky vypovídající hodnotu.

222 Kakaové boby – tedy zrna z plodů kakaovníku – jsou nejprve <prosáty>, očištěny a osušeny

223 Podle automatického analytického programu byly vzorky několikrát <přesáty> až na velikost zrna 150 mikronů.

224… kterému se říká <Zakletý> zámek...

225 Menší hrnec ‚namšený‘ a vměstnaný do hrnce většího je v něm jako <naděný> (tento tvar u slovesa nadíti, stč. nadieti doložen není, ale původně asi býval, jako je <oděný> a stč. i uděný = udělaný &lt;g /&gt;. a j.; v. Gebauer, Hist. ml. 3, 22 223), nebo, pozdějším novotvarem, <nadětý> (jako je <odětý> t.), anebo s přenesením samohl. i z tvarů jako nadíti novotvarem nejpozdějším <naditý> (jako je také <oditý>, v. Gebauer t.); a tyto novotvary slovesa nadíti mohly působiti pro blízkost významu i na starý správný tvar namšený. Tak bychom také nejlépe porozuměli Frantově variantě namšetý.

226 Roku 1784 vydává pro české čtenáře Krameriovo vlastenecké nakladatelství knížku Rybrcol na horách Krkonošských aneb <Zaklený> a vysvobozený princ.

227 Byl s ním už letitý, ale mladistvě <oděný> domorodec s nakulmovanými licousy a s bourákem...

228 Jméno Omlenice vzniklo příponou -ice z přídavného jména <omlená>. Toto slovo se vztahuje k říčce nebo potoku, kde voda během času břehy značně omlela.

229 Viz též kapitola Substantiva # 08-01, § 2.1.

230 V brněnském slovníku jsou přegenerovány potenciální variantní tvary adjektivizovaných příčestí na n/t i dějových jmen. Negativní důsledky přegenerování adjektivizovaných tvarů jsou vidět na výsledcích desambiguace slovních tvarů jako sání, ssání, nasání v korpusu czTenTen12. U těchto tvarů je desambiguována adjektivní interpretace, přestože jde o tvary dějových substantiv, které jsou homonymní s tvary adjektiva (životného maskulina v nominativu plurálu). Nepravděpodobné tvary přegenerované ve slovníku mají za následek i to, že jsou skrze ně přiřazeny interpretace četným překlepům (například ve zmíněném korpusu czTenTen12 jde o překlepy jako zasánou namísto zasáhnou, zasánou je interpretováno jako tvar adjektiva zasáný, nevysání namísto nevyspání je interpretováno jako tvar adjektiva vysáný, usáná na místo usíná je interpretováno jako tvar adjektiva usáný atd.). Jsme tudíž toho názoru, že slovník by neměl být v budoucnu zbytečně přegenerován.

231… avšak mlynář působil velmi sebejistě a očividně mu <mlení> vynášelo...

232 Tvary .*střežen(ý) se patrně nevztahují ke slovesu .*stříci/.*střehnout, ale ke slovesu střežit. Totéž platí i pro substantivum slovesné (.*střežení). Výjimka ovšem potvrzuje pravidlo:… poněvadž pro jazyk jako systém znaků nerozhodují všechny možné slyšené nebo jinak <postřežené> varianty hlásek, nýbrž jen hlásky jako jednotky celého hláskového systému se schopností diferenciace (slovní nebo tvarové),… V uvedeném kontextu je adjektivum postřežený bezpochyby synonymní variantou adjektiva postřehnutý.

233 O možnosti dublet (patrně pod vlivem slovenštiny) v případě prefixu po- svědčí doklady z korpusu czTemTen12: Školení bylo <poňato> jako pilotní projekt, na základě kterého se posoudí efektivita nového modulu.

234 O historické rozkolísanosti úzu svědčí např. tvary odjat, odjatý v korpusu Diakorp (38 výskytů ze 4 různých dokumentů z časového rozpětí 1565–1792) oproti odňat, odňatý (19 výskytů ze 3 různých dokumentů z časového rozpětí 1565–1939) nebo též tvary sjat, sjatý (srov. např. Sládkův překlad verše z Romea a Julie 1.5... tak tvými rty má vina s mých je <sjata>. / Toť na mých rtech jest jimi <sjatý> hřích...).

235 Srv. czTenTen12 (všechna odtržení dvacátého století byla už jednou na obou stranách <předjata>) a tvary předňat viz http://www.rymy.cz.

236 Nestandardní moravská varianta s významem rozsvítit.

237 SSJČ uvádí sloveso osamotit i s příslušným tvarem osamocen.

238 Existuje sice sloveso spokojit se, pasivní příčestí se od něj ovšem netvoří. Pokud ovšem v novém slovníku nebude explicitně řečeno, že jde výhradně o tvary pasivní, pak je možné uvažovat o rozgenerování krátkých adjektivních tvarů s méně přísnými omezeními. Strojový slovník češtiny (Osolsobě 1996) má v tomto ohledu poměrně silné přegenerování (více Hájková 2013).