Mozhi

1.0

Overview

Transliteration scheme used by Varamozhi is called Mozhi. It uses a unique English character sequence for each Malayalam letter.

Most confused conjuncts

Using ~ for chandrakkala

A tilde ('~') after the letters n, l, L, N, r, R and m avoids a ചില്ല്‌ (or അനുസ്വാരം) and forces the letter followed by a chandrakkala. You need not put "~" after other letters, or any കൂട്ടക്ഷരം ending in these letters; but putting it doesn't harm. Examples:

    • avan~ = അവന്

    • avan = അവന്

വാക്കുകള്‍‍ക്കിടയില്‍‍ ചില്ലക്ഷരമെഴുതുവാന്‍‍...

ഒരു വാക്കിനിടയ്ക്ക്‌ ചില്ലക്ഷരം എഴുതേണ്ടിവരുമ്പോഴാണ്‌ '_' ഉപയോഗിക്കാറുള്ളത്‌.

'പിന്‍‍നിലാവ്‌' എന്ന വാക്കു ശ്രദ്ധിക്കൂ. മംഗ്ലീഷില്‍‍ pinnilaav~ എന്നാണെഴുതേണ്ടത്‌ എന്നാവും ആദ്യം തോന്നുക. പക്ഷെ, കമ്പ്യൂട്ടറിനൊരു സംശയമുണ്ടാവും; അതിനെ 'പിന്നിലാവ്‌' എന്ന്‌ വായിച്ചാലെന്തെന്ന്‌. സംശയം ന്യായമാണ്‌. ഈയൊരു ആശയക്കുഴപ്പത്തിനിടയാക്കാത്ത വിധം പ്രശ്നം തീര്‍‍ക്കുന്നതിനാണ്‌ '_' (underscore) എന്ന Zero Width Space (ZWS) - വലിപ്പമില്ലാ ചിഹ്നം.

ശ്രദ്ധിച്ചു നോക്കിയാല്‍‍ ഒരു കാര്യം മനസ്സിലാവും - 'ന്ന' എന്നുള്ള ഉച്ചാരണമല്ല 'ന്‍ന' എന്നതിന്റെ. 'ന്‍ന' എന്നതിന്‌ 'ന്‍'-ഉം 'ന'-ക്കും ഇടയ്ക്ക്‌ സൂക്ഷ്മമായൊരു നിറുത്തുണ്ട്‌. ആ നിറുത്താണ്‌ Zero Width Space അഥവാ '-' കൊണ്ട്‌ കാണിക്കുന്നത്‌.

ഈ ചിഹ്നം ഉപയോഗിക്കേണ്ടി വരുന്നതിന്‌ കുറച്ചുദാഹരണങ്ങളിതാ:

കണ്‍‌‍‍വെട്ടം = kaN_vettam

കല്‍‌‍‍വിളക്ക്‌ = kal_viLakk~

പൊന്‍‌‍നാളം = pon_naaLam

'-' ഉപയോഗിക്കാതെ, തെറ്റായരീതിയില്‍‍ എഴുതിയാലുണ്ടാവുന്ന വാക്കുകള്‍‍ നോക്കുക:

കണ്വെട്ടം = kaNveTTam

കല്വിളക്ക്‌ = kalviLakk~

പൊന്നാളം = ponnaaLam

വിസര്‍‍ഗം

When using വിസര്‍‍ഗം, use 'H', and not ':'. For example, "നാരായണായ നമഃ" = "naaraayaNaaya namaH". We use ":" also to denote a colon, so it is necessary to distinguish the two.

Keeping some words in English itself

Put those words in curly braces - {}. Then Varamozhi will not do any transliteration on the text inside the curly braces and will remove those curly braces. So if the input is ente {school} the output will be എന്റെ school.

Use of '@' character

An at character ('@') can be used where you need an "empty consonant". Like, when you need to show the symbol of a vowel instead of the vowel itself. Example : 'ാ‍' ദീര്‍‍ഘത്തിന്റെ ചിഹ്നം = "@aa deerghatthinte chihnam".

ദീര്‍‍ഘസ്വരം

The long forms of swarams "a", "i" and "u" can be created by either capitalizing (A, I, U) or by doubling (aa, ii, uu). For "e" and "o", only capitalization will work (E and O). "ee" and "oo" are equivalent to "I" and "U" respectively, due to our historical usage of these combinations.

Old style of chillus in Unicode

Use two underscores after the letter. For example, 'n__' gets 'ന്‍' in old representation using ZWJ.

Escaping advanced conversion rules by '#'

Varamozhi has got advanced conversion rules along with basic transliteration key sequences. They help to write common English words like 'school' or 'bus' as it is, rather than writting them as 'skooL' or 'bas'. These rules are also used to define more than one key sequence for one character. Example 'ngka' = 'nka'.

But sometimes this rules will prevent you from writting some rare words the way you want. A pound (sharp/hash) character ('#') at the end of a word (or part of word) will tell Varamozhi not to be too smart for translating the previous word - means, it turns off all the "special rules".

For example, 'van' = 'vaan' = വാന്‍ in Varamozhi. But, say in a poem stanza, you need വന്‍. Then write it as 'van#'.

Note that this will turn off all rules - Not only English/Malayalam conversion. To see what I mean, try the following:

thanguka thanguka# thangnguka#

samyamam samyamam# sam_yamam#

patti patti#

Rationale behind Mozhi scheme

My primary principle behind the scheme is this: The most intuitive scheme for Malayalees. As you can see this principle is different from phonetically accurate scheme. Traditionally our transliteration habits are different from that of North. For example, consider the characters ത, റ്റ & ച.

To simplify the things, Mozhi uses the rule was to append 'h' after the letters for ഖരം and മൃദു to get അതിഖരം and ഘോഷം.

Also, I didn't want to give different sequence for conjunct letters other than their component letters. So, if 'Ta' is ട then 'TTa' should be 'ട്ട'. This simplifies what the user needs to remember.

With these rules in mind, we have following Malayalam letters: ട, ഡ, ത, ദ, റ്റ and just two English letters: d, t to spare (I am not considering അതിഖരം and ഘോഷം now, because they can be produced by the 'h' rule).

Since malayalees are very adamant about 'ത = tha', we cannot use 't' for 'ട', because, then 'th' will become 'ഠ' by the h-rule. So, 't' was given to 'റ്റ' which does not have aspiration.

'ത വര്ഗ്ഗം' letters are more used in the language than the 'ട വര്ഗ്ഗം'. So 'ട വര്ഗ്ഗം' had to be compromised with uppercase letters which was the only available choice left.

If you look at the scheme there is one more symmetry. That is, 'ത വര്ഗ്ഗം' is all small case and 'ട വര്ഗ്ഗം' is just the corresponding uppercase. This also help people to memorize the scheme.