The Richness of Ivan Franko’s Language: a Case of Long Prose Fiction

Additional information

Author Information:

Solomija Buk is Doctor of Sciences in Philology (Doctor Habilitated), Associate Professor (Docent), Associate Professor of Department for General Linguistics, Ivan Franko National University of Lviv. Research interests include corpus, statistical, computational linguistics, linguistic semantics and pragmatics, lexicography, philosophy of science, psychology of happiness.



Buk S. The Richness of Ivan Franko’s Language: a Case of Long Prose Fiction [Text] // Linhvistychni Studiyi / Linguistic Studies : collection of scientific papers / Vasyl' Stus Donetsk National University; Ed. by Anatoliy Zahnitko. Vinnytsia : Vasyl' Stus DonNU, 2022. Vol. 43. Pp. 121-128. ISBN 966-7277-88-7


Publication History:

Volume first published online: June 01, 2022

Article received: April 07, 2022, accepted: April 22, 2022 and first published online: June 01, 2022


Статтю присвячено поняттю багатства мови (мовлення, тексту) – це відношення між кількістю різних слів у тексті до довжини тексту (кількості слововживань). Багатство словника вперше обчислено на прикладі електронного корпусу текстів великої прози Івана Франка. Його зіставлено з аналогічним показником частотного словника сучасної української художньої прози (укладеного на матеріалі 24 творів 22 різних письменників) і виявлено передбачувано нижчий показник багатства словника у корпусі великої прози І. Франка. Аналіз показав, що індекс різноманітності залежить не тільки від обсягу тексту, а й від інших параметрів, як-от редакція твору, пряме чи авторське мовлення.

Ключові слова: багатство словника (індекс різноманітності), частотний словник, лінгво­статистична параметризація, обсяг словника і тексту, корпус текстів, лінгвостатистика, прикладна лінгвістика, українська мова.

© The Editorial Council and Editorial Board of Linguistic Studies Linguistic Studies

Volume 43, 2022, pp. 121-128

The Richness of Ivan Franko’s Language: a Case of Long Prose Fiction

Buk Solomija

Article first published online: June 01, 2022



Buk Solomija

Department for General Linguistics Ivan Franko National University of Lviv.


Background: Reseach is a part of the wider project of statistical parametrization of Ivan Franko’s long prose fiction (FLPF). Vocabulary richness is an important element of it. It is calculated as the TTR (ratio of lexical items to the total number of words). It has some tradition in both Ukrainian and world linguistics, being measured for a lot of the writers and texts.

Purpose: 1) to identify the original features of vocabulary richness for FLPF, 2) to compare vocabulary richness of FLPF with the frequency dictionary of modern Ukrainian long prose fiction; 3) potentially to find out the other parameters of the text which could influence on the vocabulary richness.

Results: The frequency dictionary were compiled for all the Ukrainian novels by I. Franko: Boryslav Laughs; Zakhar Berkut; Without Asking a Wade; For the Hearth; Pillars of Society; The Cross-paths; Boa constrictor, 1907; The Great Noise; Petrii y Dovbushchuky. The highest index of variety was found for «Boa constrictor» (0,181), the lowest was found for «The Cross-Paths» (0,106), which confirms the inverse dependence of the vocabulary richness on the text size. It is expected that there are fewer different tokens in the FLPF dictionary then in general Ukrainian long prose fiction (0,052: 0,067 respectively). Also, with the increase of the text size, its lexical richness decreases; for texts with the same volume the index of diversity is higher for the author’s scheech compared to the direct speech. Different versions of the same text have different vocabulary richness (Boa constrictor 1884 and 1905–1907).

Discussion: Big potential has comparison the vocabulary richness of FLPF with similar charac­teristics of his other works of different genres and with other authors.

Keywords: vocabulary richness (Type Token Ratio (TTR), index of diversity), frequency dictionary, linguistic statistical parameterization of text, vocabulary size, text size, text corpus, linguistic statistics, applied linguistics, Ukrainian language, Ivan Franko.


Solomija Buk is Doctor of Sciences in Philology (Doctor Habilitated), Associate Professor (Docent), Associate Professor of Department for General Linguistics, Ivan Franko National University of Lviv. Research interests include corpus, statistical, computational linguistics, linguistic semantics and pragmatics, lexicography, philosophy of science, psychology of happiness.






Бук С. Велика проза Івана Франка: електронний корпус, частотні словники та інші міждисциплінарні контексти: монографія. Львів: ЛНУ імені Івана Франка, 2021. 421 с.

[Buk S. Velyka proza Ivana Franka: elektronnyi korpus, chastotni slovnyky ta inshi mizh­dystsyplinarni konteksty: monohrafiia. Lviv: LNU imeni Ivana Franka, 2021. 421 p.]

Бук С. Частотний словник повісті Івана Франка «Boa constrictor» (редакція 1884 р.). Стеж­ками Франкового тексту (комунікативні, лінгвосеміотичні, когнітивні та лінгвостатистичні виміри прози). Львів: ЛНУ імені Івана Франка, 2013. С. 202–501.

[Buk S. Chastotnyi slovnyk povisti Ivana Franka «Boa constrictor» (redaktsiia 1884 r.). Stezhka­my Frankovoho tekstu (komunikatyvni, linhvosemiotychni, kohnityvni ta linhvostatystychni vymiry prozy). Lviv: LNU imeni Ivana Franka, 2013. S. 202–501]

Занько Д. О. Статистична структура твору Софії Яблонської «Чар Марока». Актуальні проблеми філології. Одеса. 2015. С. 18–20.

[Zanko D. O. Statystychna struktura tvoru Sofii Yablonskoi «Char Maroka». Aktualni problemy filolohii. Odesa. 2015. S. 18–20]

Перебийніс В. С., Муравицька М. П., Дарчук Н. П. Частотні словники та їх використання. Київ: Наукова думка, 1985. 204 с.

[Perebyinis V. S., Muravytska M. P., Darchuk N. P. Chastotni slovnyky ta yikh vykorystannia. Kyiv: Naukova dumka, 1985. 204 s.]

Цьох Л. Квантитативний профіль ідіостилю М. Яцкова (на матеріалі повісті «В лабетах» та новелістики). V Міжнародна науково-практична конференція «Modern directions of scientific research development» (24–26 жовтня 2021 р.). Чикаго, США. С. 757–765.

[Tsokh L. Kvantytatyvnyi profil idiostyliu M. Yatskova (na materiali povisti «V labetakh» ta novelistyky)]. V International Scientific and Practical Conference «Modern directions of scientific research development» (October 28–30, 2021). Chicago, USA. P. 757–765.

ЧС СУХП – Частотний словник сучасної української художньої прози / за ред. В. C. Пере­бийніс. Київ: Наукова думка, 1981. Т. 1, 2.

[ChS SUKhP – Chastotnyi slovnyk suchasnoi ukrainskoi khudozhnoi prozy / za red. V. C. Pere­byinis. Kyiv: Naukova dumka, 1981. T. 1, 2]

Шевельов Ю. У кого з українських письменників багатша мова. Земля (Плауен), ч. 6 (22.10.1944, 6), ч. 7 (29.10.1944, 5–6). URL.: (20.04.22).

[Shevelov Yu. U koho z ukrainskykh pysmennykiv bahatsha mova. Zemlia (Plauen), ch. 6 (22.10.1944, 6), ch. 7 (29.10.1944, 5–6).URL.: (20.04.22)]

Guiraud P. Les caractères statistiques du vocabulaire. Essai de méthodologie. Paris: Presses universitaires de France, 1954. 111 p.

Kuraszkiewicz W. Obfitość słownictwa w kilku dużych tekstach polskich («Postylla», «Wizerunek», «Worek Judaszów», «Pan Tadeusz», «Beniowski», «Lalka», «Popioły», «Kwiaty polskie»). Studia Polonistyczne (Poznań) IV, 1973. S. 45–63.

Pawłowski A. O problemie atrybycji tekstu w ligwistyce kwantytatywnej (na przykładzie tekstu Romaina Gary). J. Linde-Usiekniewicz, R. Huszcza (red.). Prace językoznawcze dedykowane Profesor Jadwidze Sambor. Warszawa: nakładem Wydziału Polonistyki Un. Warszawskiego, 2003. S. 169–190.

Skubalanka T. Słownictwo poezji miłosnej Juliusza Słowackiego na tle tradycji. Toruń, 1966. 414 s.

Stachurski E. Słownictwo «Pana Tadeusza» Adama Mickiewicza na tle tekstów innych poema­tów romantycznych. Kraków: Wydawnictwo Naukowe Akademii Pedagogicznej, 2005. 262 s.

SKC – Slovník Karla Čapka / Hl. ed. Fr. Čermák. Praha: Nakladatelstv í Lidové noviny; Ústav Českého národního korpusu, 2007. 715 s.