Mozhi - Overview‎ > ‎

Mozhi - Detailed specification

Basic mapping

ManglishMalayalam
Unicode Name
 Example
 a അ A അല
 aa ആ AA ആല
 i ഇ I ഇല
 ii ഈ II ഈറ
 u ഉ U
 ഉമ
 uu ഊ UU ഊമ
 R ഋ VOCALIC R
 ഋതു

 e എ
 E
 എലി
 E
 ഏ EE ഏലം
 ai ഐ AI ഐക്യം
 o ഒ O ഒരു
 O ഓ OO ഓരം
 au ഔ AU
 ഔഷധം

 H ഃ VISARGA ദുഃഖം

 ka ക
 KA
 കല
 kha
 ഖ KHA നഖം
 ga ഗ GA ഗരം
 gha ഘ GHA മേഘം
 nga ങ NGA ങ്യാവൂ

 cha ച
 CA
 ചരം
 chha
 ഛ CHA ഛായ
 ja ജ JA ജലം
 jha ഝ JHA ഝാൻസി
 nja ഞ NYA ഞാൻ

 Ta ട
 TTA
 ടിപ്പു
 Tha
 ഠ
 TTHA പാഠം
 Da ഡ DDA ഡപ്പി
 Dha ഢ  DDHA ദൃഢം
 Na ണ NNA മണം

 tha ത
 TA
 തത്ത
 thha
 ഥ THA കഥ
 da ദ DA ദയ
 dha ധ DHA ധനം
 na ന NA നന്ന്

 pa പ
 PA
 പല
 pha
 ഫ PHA ഫലം
 ba ബ BA ബലം
 bha ഭ BHA ഭയം
 ma മ MA മയം

 ya യ
 YA
 യതി
 ra
 ര RA രണ്ട്
 la ല LA ലത
 va വ VA വരം

 Sa ശ
 SHA
 ശരം
 sha
 ഷ SSA ഷാരം
 sa സ SA സാരം
 ha ഹ HA ഹാരം

 La ള
 LLA
 ഇള
 zha
 ഴ LLLA ഇഴ
 rra റ RRA പറ

 ta റ്റ RRA, VIRAMA, RRA
പാറ്റ 

 $
U+20B9
 INDIAN RUPEE SIGN
 ₹100

Semi-vowel signs

Described by examples:

 sya
 സ്യ SA, VIRAMA, YA
 സസ്യം
 sra
 സ്ര  SA, VIRAMA, RA
 സ്രാവം
 sla സ്ല SA, VIRAMA, LA സ്ലാവിക്
 sLa സ്ല SA, VIRAMA, LA 
 sva സ്വ SA, VIRAMA, VA സ്വരം


Separate two words without space

Using '_' (underscore), we can stop combining and start a new word without using space. It is useful in many scenarios:
  • Get chillu letter in contexts where it would otherwise form a conjunct.
  • Get a full vowel in-between a word
If just '_' alone is typed, then that will appear to the user and will be consumed only when a valid letter is typed after it.

 pon_ പൊൻ_ PA, SIGN O, CHILLU N, _
 pon_naaNyam പൊൻനാണ്യം  PA, SIGN O, CHILLU N, NA, SIGN AA ...
 m_adani മ്അദനി MA, VIRAMA, A, DA, NA, SIGNI 
 in_ka ഇൻക
 I, CHILLU N, KA

Cluster

Let us define a cluster in a word to be sequence of English letters ending with a letter standing for vowel or at the word end. As an example, the Manglish word, 'Sruthiyil' is split into clusters as: Sru-thi-yi-l. This definition is used in sections below. A cluster is trivial if it represents only one Malayalam character. In the above example 'l' is a trivial cluster. The non-vowel part of these clusters will be: Sr, th, y, l.

Chillus

Word ending trivial clusters N, n, m, r, l and L will form a chillu. Word beginning with those letters will not form a chillu. Anuswara(ം) is considered as a chillu of 'മ'.

 svam
 സ്വം
 SA, VIRAMA, VA, ANUSVARA
 avan
 അവൻ A, VA, CHILLU N
 Sr ശ്ര്
 SHA, VIRAMA, RA, VIRAMA
 n ന് NA, VIRAMA

Chillu or conjunct

A chillu-capable letter in a cluster will not form a chillu if:
  1. The cluster is in the beginning of a word; or
  2. The non-vowel part of a cluster starts with the following sequence (except for the ending 'a'):
 NTa
 ണ്ട  NNA, VIRAMA, TA
 മണ്ട
 NTha ണ്ഠ  NNA, VIRAMA, THA കുണ്ഠിതം
 NDa ണ്ഡ  NNA, VIRAMA, DDA പാണ്ഡു
 NDha ണ്ഢ  NNA, VIRAMA, DDHA കണ്ഢം
 NNa ണ്ണ  NNA, VIRAMA, NNA
 കണ്ണ്
 Nma
 ണ്മ  NNA, VIRAMA, MA
 വെണ്മ
 Nya ണ്യ  NNA, VIRAMA, YA
 നാണ്യം
 Nva
 ണ്വ 
 NNA, VIRAMA, VA
 കണ്വൻ

 ntha
 ന്ത  NA, VIRAMA, TA തന്ത
 nthha
 ന്ഥ  NA, VIRAMA, THA
 പാന്ഥൻ
 nda ന്ദ  NA, VIRAMA, DA
 നന്ദി
 ndha
 ന്ധ  NA, VIRAMA, DHA
 അന്ധൻ
 nna ന്ന  NA, VIRAMA, NA
പിന്നെ
 nma ന്മ  NA, VIRAMA, MA
 നന്മ
 nya ന്യ  NA, VIRAMA, YA
 അന്യം
 nra ന്ര  NA, VIRAMA, RA
 ന്രസ്ഥി
 nva ന്വ  NA, VIRAMA, VA
 അന്വയം

 mpa
 മ്പ  MA, VIRAMA, PA
 കമ്പം
 mma
 മ്മ  MA, VIRAMA, MA
 അമ്മ
 mya മ്യ  MA, VIRAMA, YA
 രമ്യം
 mra
 മ്ര
 MA, VIRAMA, RA
 കമ്രം
 mla മ്ല  MA, VIRAMA, LA
 അമ്ലം

 rya
 ര്യ
 RA, VIRAMA, YA ഭാര്യ

 lpa ല്പ
 LA, VIRAMA, PA
 അല്പം
 lma ല്മ
 LA, VIRAMA, MA
 കല്മഷം
 lya
 ല്യ
 LA, VIRAMA, YA അഹല്യ
 lva ല്വ  LA, VIRAMA, VA വില്വാദ്രി
 lla ല്ല  LA, VIRAMA, LA ഇല്ല

 Lya
 ള്യ
 LLA, VIRAMA, YA ജാള്യം
 LLa ള്ള  LLA, VIRAMA, LLA ഉള്ള

Examples when there are more than two consonants in a cluster.

 ..NDya
 ണ്ഡ്യ
 NNA, VIRAMA, DDA, VIRAMA, YA പാണ്ഡ്യൻ
 ..nthrya ന്ത്ര്യ
 NA, VIRAMA, TA, VIRAMA, RA, VIRAMA, YA
 സ്വാതന്ത്ര്യം

Please note that, no cluster at the beginning of a word will yield chillu. Example:

 arka
 അർക
 A, CHILLU R, KA
 
 rka ര്ക
 RA, VIRAMA, KA
 

Exceptions to above rule

A cluster in the non-initial position of a word starts as <chill-capable consonant A><consonant B><consonant B> then consonant A will form chillu. Example:

 alppam
 അൽപ്പം
 A, CHILLU L, PA, VIRAMA, PA, ANUSVARA

The 'മ്യ' and 'മ്ര' conjuncts are not formed if they come after 'സം'. Example:

 samyOgam
 സംയോഗം
 SA, ANUSVARA, YA, SIGN OO, ...
 samrambham സംരംഭം SA, ANUSVARA, RA, ANUSVARA, ...

If 'മ്യ' and 'മ്ര' conjuncts are required, use '_' to effectively put that as the word initial cluster. Example:

 sa_myak
 സമ്യക്
 SA, MA, VIRAMA, YA, ...
 sa_mraaTT സമ്രാട്ട് SA, MA, VIRAMA, RA, SIGN AA, ...

Chandrakkala instead of Chillu

To make sure we get chandrakkala instead of a chillu or after U-sign use '~' (tilda).

 avan~
 അവന്
 A, VA, NA, VIRAMA
 avanu~ അവനു് A, VA, NA, SIGN U, VIRAMA
 vaalmeeki വാല്മീകി   ..., LA, VIRAMA, MA, ...  
 vaal_meeki വാൽമീകി  ..., CHILLU L, MA, ...  
 vaal~meeki വാല്മീകി  ..., LA, VIRAMA, MA, ...  
 vaal~_meeki വാല്‌മീകി  ..., LA, VIRAMA, ZWNJ, MA, ...  

Sometimes users type '~' even when it is not required at the word endings. Those '~'s are always consumed.

 ath അത് A, TA, VIRAMA
 ath~
 അത് 
 A, TA, VIRAMA


Doubling of ങ and ഞ

The letters 'nga' produces 'ങ്ങ' (and 'nja' produces 'ഞ്ഞ'), iff it is typed after any of the following:
  1. a vowel
  2. a vowel sign
  3. a consonant
At the same time, 'ngnga' also should produce 'ങ്ങ' (and 'njnja' produces 'ഞ്ഞ').
To produce singular form in those cases, use underscore '_', by putting it effectively at word initial position.

Examples:

 ang
 അങ്ങ്
 A, NGA, VIRAMA, NGA, VIRAMA
 angng അങ്ങ് A, NGA, VIRAMA, NGA, VIRAMA
 njaan ഞാൻ NYA, SIGN AA, CHILLU N
 Saarngga ശാർങ്ഗ  SHA, CHILLU RR, NGA, VIRAMA, GA
 ga_ngga ഗ‌ങ്ഗ
 GA, NGA, VIRAMA, GA

Shortcuts for conjuncts

 nka
 ങ്ക
 NGA, VIRAMA, KA
 മങ്ക
 ncha
 ഞ്ച
 GYA, VIRAMA, CA
 പുഞ്ച
 nchha ഞ്ഛ
 GYA, VIRAMA, CHA വാഞ്ഛ
 ccha ച്ച CA, VIRAMA, CA പച്ച
 cchha ച്ഛ
 CA, VIRAMA, CHA പുച്ഛം
 tta ട്ട
 TTA, VIRAMA, TTA
 പട്ട
 Tta ട്ട TTA, VIRAMA, TTA 
 tTa ട്ട TTA, VIRAMA, TTA 
 nTa ണ്ട NNA, VIRAMA, TTA പണ്ടു്
 Nta ണ്ട NNA, VIRAMA, TTA 
 ttha ത്ത  TA, VIRAMA, TA തത്ത
 tthha ത്ഥ  TA, VIRAMA, THA അർത്ഥം
 nta
 ന്റ
 NA, VIRAMA, RRA
 എന്റെ
 nrra ൻറ CHILLU N, RRA  എൻറോൾ

Error correction in conjuncts

 Tta ട്ട TTA, VIRAMA, TTA
 tTa ട്ട TTA, VIRAMA, TTA
 nTa ണ്ട NNA, VIRAMA, TTA
 Nta ണ്ട NNA, VIRAMA, TTA

Mapping for unmapped keys

 ea ഈ II
 ee ഈ II
 ie ഈ II
 ei ഐ AI
 oo ഊ UU
 ou ഔ AU

 ca
 ച  CA
 fa
 ഫ  PHA
 qa ഖ  KHA
 wa വ  VA
 xa ക്സ  KA, VIRAMA, SA
 za ശ SHA

 A
 ആ  AA
 Ba
 ബ്ബ  BA, VIRAMA, BA
 Ca ച്ച CA, VIRAMA, CA
 Fa
 ഫ  PHA
 Ga ഗ്ഗ  GA, VIRAMA, GA
 I ഈ  II
 Ja ജ്ജ  JA, VIRAMA, JA

 Ka
 ക്ക  KA, VIRAMA, KA
 Ma
 മ്മ  MA, VIRAMA, MA
 Pa പ്പ  PA, VIRAMA, PA
 Qa
 ഖ  KHA
 U ഊ  UU
 Va വ്വ  VA, VIRAMA, VA
 Wa വ്വ  VA, VIRAMA, VA

 Xa
 ക്സ KA, VIRAMA, SSA
 Ya
 യ്യ
 YA, VIRAMA, YA
 Za
 ശ്ശ
 SHA, VIRAMA, SHA

Extra elongation for vowel signs

('..' denotes that the last letter can be repeated to get last Malayalam vowel sign repeated)
 aaa.. ആാ..
 AA, SIGN AA, ..
 aaaaa ആാാാ AA, SIGN AA, SIGN AA, SIGN AA
 kaaa കാാ KA, SIGN AA, SIGN AA
 iii.. ഈൗ.. II, AU LENGTH MARK, ..
 kiii.. കീീ.. KA, SIGN II, SIGN II, ..
 uuu.. ഊൗ.. UU, AU LENGTH MARK, ..
 kuuu.. കൂൂ.. KA, SIGN UU, SIGN UU, ..
 OO.. ഓാ.. AU, SIGN AA, ..
 auu.. ഔൗ.. AU, AU LENGTH MARK, ..

Not all vowel sign producing letters shown. However, all vowel producing letters have this property. For example:

 eee.. ഈൗ.. II, AU LENGTH MARK, ..
 ooo.. ഊൗ.. UU, AU LENGTH MARK, ..

Stand-alone vowels signs

The character '@' (at) will work as a consonant with zero size. Using this we can get stand-alone vowel signs.

 @
 ് VIRAMA
 @aa ാ SIGN AA
 @i
 ി SIGN I
 @an ൻ CHILLU N

Stand-alone chillus

The '_' (underscore) character is overloaded to request chillu form even if that is not the default.

 n_
 ൻ CHILLU N
 m_ ം ANUSWARA

Archaic letters

To get the archaic form of a letter or a cluster, the symbol '#' is used after it.

 അ#
 a# ऽ
 AVAGRAHA
 അസോഽസൗ
 ക്# k# ൿ CHILLU K
 ആമ്പിൿ
 റ്റ്#
 t# U+0D3A TTTA
 അഺ്
 ന്# n# U+0D29 NNNA
 അഩ്
 നു# nu# ൹ DATE MARK
 17-൹
 ർ# r# U+0D4E
 DOT REPH ഭാൎയ്യ
 ₹# $# ₨  RUPEE SIGN 

 ഋഋ# RR# ൠ VOCALIC RR ൠന്ന്
 കൃൃ# kRR# കൄ* KA, SIGN VOCALIC RR കൄന്ന്
 ള്‌#
 L# ഌ VOCALIC L
 ഌകാരം
 ക്ല്# kL# കൢ* KA, SIGN VOCALIC L കൢപ്തം
 ള്ള്#
 LL# ൡ VOCALIC LL ൡതം
 ക്ല്ല്# kLL# കൣ* KA, SIGN VOCALIC LL കൣതം
 കൗ# kau# കൌ*
 KA, SIGN AU
 കൌതുകം
* The consonant 'k' is just an example to show the vowel sign.

 1# ...
 ൧ ...
 ONE ...
 10#
 U+0D70 TEN
 100# U+0D71 HUNDRED
 1000# U+0D72 THOUSAND
 1/4# U+0D73 ONE QUARTER
 1/2# U+0D74 ONE HALF
 3/4# U+0D75 THREE QUARTERS

Since some digits does not get displayed in any popular fonts, corresponding Unicode codepoint is shown - for example: U+0D70.

Digits after a Malayalam digit will be a converted to Malayalam digit.

 1#210 ൧൨൧൦ ONE, TWO, ONE, ZERO

Escape by word

Transliteration is not attempted if it is preceded by '\'.

 \a  a

Keys after an English letter will be kept as it is. This escape is broken by space or newline. Example:

 \abc@example.com enna  abc@example.com എന്ന

Compatibility mapping

Previous versions of Mozhi had 'Ra' stands for റ. Since vowel (ഋ) and consonant(റ) come at two different contexts this can be honoured. Following examples demonstrate this:

 pR
 പൃ PA, SIGN VOCALIC R
 pRa
 പ്ര PA, VIRAMA, RA
 R ഋ VOCALIC R
 Ra റ RRA
 aR അർ
 A, CHILLU R

Non-standard pre-existing Chillus

Prexisting chillus are produced by putting ^ after a standard chillu-letter is formed.

 ..N^
 ൺ^  ണ്‍
 NA, VIRAMA, ZWJ
 
 ...    മോഹന്‍ലാല്‍

Backspace

On backspace, use the OS's backspace operation. However, next key would use the context of the existing input. Example:

 nna
 ന്ന NA, VIRAMA, NA
 nna<backspace>
 ന് NA, VIRAMA
 nna<backspace>ka ങ്ക NGA, VIRAMA, KA
Comments