Unicode

Contents

  1. 1 Setting up your Windows PC for reading Unicode
    1. 1.1 For Malayalam in all applications
    2. 1.2 For AnjaliOldLipi in Application Titles
    3. 1.3 Browsers other than IE
      1. 1.3.1 FireFox
      2. 1.3.2 Chrome
      3. 1.3.3 Opera
    4. 1.4 Manually set default system font for Malayalam
    5. 1.5 More information
  2. 2 Available Malayalam Unicode fonts
    1. 2.1 Windows Vista & XP fonts for Unicode 5.1
      1. 2.1.1 AnjaliOldLipi
      2. 2.1.2 Rachana
      3. 2.1.3 Meera
      4. 2.1.4 Raghu
    2. 2.2 Windows Vista & XP fonts without Unicode 5.1 support
      1. 2.2.1 Kartika
        1. 2.2.1.1 Issue: Odd letter shapes
    3. 2.3 Windows XP fonts
      1. 2.3.1 Karumbi
      2. 2.3.2 Thoolika
      3. 2.3.3 Nila
      4. 2.3.4 MLU-Panini
      5. 2.3.5 e-Malayalam OT
      6. 2.3.6 Kartika
        1. 2.3.6.1 Issue: Odd letter shapes
        2. 2.3.6.2 Issue: Some conjuncts not displayed correctly
    4. 2.4 Decorative fonts from TDIL
      1. 2.4.1 Arial Unicode MS
    5. 2.5 GNU/Linux fonts
    6. 2.6 MAC fonts
      1. 2.6.1 Free
      2. 2.6.2 Paid
    7. 2.7 For Android
    8. 2.8 Useful Links
  3. 3 Writing Malayalam in Unicode
    1. 3.1 Web based intelligent conversion
      1. 3.1.1 Google Transliteration service
      2. 3.1.2 Quillpad
    2. 3.2 Chat based intelligent conversion
    3. 3.3 Firefox plugin for intelligent conversoin
    4. 3.4 Web based transliteration scheme conversion
      1. 3.4.1 Mozhi Online
      2. 3.4.2 ഇളമൊഴി
      3. 3.4.3 Varamozhi Online
    5. 3.5 Web based keyboard for ISM
    6. 3.6 Web Based Combination Keyboard
    7. 3.7 Microsoft Windows
      1. 3.7.1 Mozhi Keyman
      2. 3.7.2 Using Varamozhi Editor
      3. 3.7.3 Baraha
    8. 3.8 Inscript
      1. 3.8.1 Enhanced Inscript
      2. 3.8.2 Inscript by Nila keyboard
      3. 3.8.3 Inscript by TypeIt
    9. 3.9 Mac
    10. 3.10 Linux
      1. 3.10.1 Evooran's Mozhi scim-m17n
      2. 3.10.2 Lalitha
      3. 3.10.3 Swanalekha
      4. 3.10.4 Links
    11. 3.11 Links
  4. 4 Embedding Malayalam writing tools in your page
    1. 4.1 Inscript + Mozhi combination keyboard
    2. 4.2 Malayalam Wikipedia style Mozhi input textarea
  5. 5 Adding Malayalam editor in your browser
  6. 6 Chatting in Malayalam
  7. 7 Unicode to Manglish conversion
    1. 7.1 For short text
    2. 7.2 For longer text
  8. 8 യുണീക്കോഡിനെ പറ്റി കൂടുതല്‍
    1. 8.1 ബിറ്റ്
    2. 8.2 UTF-8
    3. 8.3 Status of Chillu Letters in Unicode
  9. 9 Malayalam rendering in MAC
  10. 10 Reph
  11. 11 Mixing Arabic and Malayalam
  12. 12 Internationalized Domain Names (IDN)
  13. 13 Malayalam in J2EE applicaiton
  14. 14 Troubleshooting
    1. 14.1 Even after all the configuraiton, Malayalam is not shown in AnjaliOldLipi
    2. 14.2 Can't read Malayalam in Varamozhi Yahoo! Group
    3. 14.3 Why are the unicode fonts like Rachana missing?
    4. 14.4 Works in IE, but not in other applications
    5. 14.5 Varamozhi Editor in Win98 hangs on Unicode conversion
    6. 14.6 Letters disappear below the baseline in Firefox
    7. 14.7 Some Unicode blogs viewed in Firefox have lots of doted circles
    8. 14.8 ചില്ലും ചതുരവും!
    9. 14.9 Square boxes in place of Unicode chillu
    10. 14.10 Consonant + chandrakkala in place of chillu
    11. 14.11 /nta/ is displayed as /nra/
    12. 14.12 Updating Unicode rendering engine
    13. 14.13 Unreadable text with lot of a's or sequence of numbers
    14. 14.14 Copy from IE to MSWord spoils the Chillu letters
    15. 14.15 Linux: Meera font is too small
    16. 14.16 Keyman is unsuable in MSWord and Excel (2003 and like versions)
    17. 14.17 Font selection and Chillu display problems in MS Word
      1. 14.17.1 Solution
        1. 14.17.1.1 Language settings
        2. 14.17.1.2 Use styles instead of font change
    18. 14.18 Keyman produces weird words
    19. 14.19 Keyman does not work in Vista
    20. 14.20 എന്തുകൊണ്ടാണു Microsoft IIS 6.0 error ASP 0239 (0x80004005) തരുന്നത് ?
Computer operates by assigning a code number for each English character. For example, letter A has the number 65. Now we have separate code numbers for all Malayalam characters - in fact, for all languages of the world. This numbering scheme is called Unicode. In Unicode, Malayalam first letter 'a' (അ) is given the number 3333. Simillarly different different numbers for rest of Malayalam alphabets. The fonts that understand these new code numbers are called Unicode fonts.

Fonts like ML-TTKarthika, Thoolika etc are not Unicode fonts. They used the code numbers assigned for English alphabets for Malayalam. That is not any standards based. So a document written in ML-TTkarthika can not be processed by other applications like google search.

 

Setting up your Windows PC for reading Unicode


Please run Anjali Font Installer from the left sidebar of this page. This will set AnjaliOlLipi as the default Malayalam Unicode font for Internet Explorer.

If you just need the font, get it thru more downloads page.

For Malayalam in all applications

For correct Malayalam display in applications other than Internet Explorer, please make sure, Install files for complex script... is checked in Control Panel > Regional and Language Options > Languages tab. This may require the Windows Installation CD. In MS Word, you might want to enable 'Complex Script' in 'Styles and Formatting' menu.

For AnjaliOldLipi in Application Titles

Right click on Desktop > properties > Appearance tab > Advanced button > Active Title Bar item > set font AnjaliOldLipi > OK button > OK button.

For visually pleasing rendering

  • Goto Start > setting> controlpannel> Display > Appearance > Effects...
  • Check Use the following method to smooth edges of screen fonts:
  • Select ClearType
  • OK > OK

    more...

Browsers other than IE

Do following additional steps for browsers other than IE:

FireFox

  • Click Tools
  • Select Options
  • Click on the Content Tab
  • Click Advanced button in Fonts & Colors section.
  • Select Western in 'Fonts for'
  • Choose Proportional as 'Sans Serif'
  • Choose Serif as 'Garamond'
  • Choose Sans-Serif as 'Verdana'
  • Select Malayalam in 'Fonts for'
  • Choose Proportional as 'Sans Serif'
  • Choose Serif as 'AnjaliOldLipi'
  • Choose Sans-Serif as 'AnjaliOldLipi'
  • Choose Monospace as 'AnjaliOldLipi'
  • Choose Default Character Encoding as 'Unicode(UTF-8)'
  • Click OK
  • Click OK in Options window

If you prefer a different Malayalam Unicode font, say Kartika, run above instructions replacing AnjaliOldLipi with Kartika.

Chrome

  1. Download and install NotoSansMalayalam.
  2. Exit all applications and uninstall AnjaliOldLipi
  3. Open Chrome and install the Advanced Font Settings extension.
  4. Open the extension by going to: 
    • chrome-extension://caclkomlalccbpcdllchkeecicepbmbm/options.html
  5. Choose NotoSansMalayalam for Sans-Serif.
  6. Click on Script pull down menu and select Malayalam.
  7. Choose NotoSansMalayalam for Sans-Serif.
  8. Click on 'Apply settings' button and close the extension tab.

To see rest of the Malayalam text in boxes for search, address using NotoSansMalayalam, in the Windows system, get to Desktop properties > Appearance tab > Advanced button > Message box item > set font NotoSansMalayalam > OK button > OK button.

For completeness one could set rest of the fonts in the desktop properties(like Palette title) to be NotoSansMalayalam as well.

Opera

  • Click Tools menu
  • Select Preferences
  • Click Advanced tab
  • From the left sidebar select Fonts
  • Click International Fonts button
  • Choose Malayalam in Writing Section
  • Select desired Malayalam Unicode font as Normal font
  • If available choose a Monospace font also
  • Click OK two times and restart Opera

Manually set default system font for Malayalam

  1. Click Start, Control Panel

  2. Double click on Internet Options, click on Fonts and Select Language Script Malayalam. Then select Web page font as AnjaliOldLipi.

  3. Press OK and OK.
Following steps for editing registry directly:
  1. Goto/open Registry Editor
  2. Find the branch HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\International\Scripts\18 (The ScriptID for Malayalam is 18)
  3. You will find at least two string values under this keyname: IEFixedFontName and IEPropFontName
  4. Double Click on each of these two and type in AnjaliOldLipi
  5. Close registry editor and restart IE.

More information

Available Malayalam Unicode fonts

Windows Vista & XP fonts for Unicode 5.1

Fonts that work in Microsoft's Vista and XP systems. Only those fonts capable of displaying common conjuncts and chillus are listed. Visual comparison of most open source fonts.

AnjaliOldLipi

Download
  • An traditional lipi font
  • Typographed like Arial which is the very essential web English font
  • Hinted for small font sizes
  • Not so attractive in printed documents
  • The only public domain font available for Malayalam. This means, you can do whatever you wanted to do with this font - commercial or non-commercial.

Rachana

Download
  • An traditional lipi font
  • San-serif font that looks like a serifed one. Optima may be the Closest one
  • Since it is not hinted for small font sizes, it is not so suited for web
  • It is an excellent font for printing
  • Licensed under GPL; if the font is modified, that also should be made available free under GPL.
  • This font does not have Font exception clause of GNU public license. That means, if you are embedding this font (say a PDF file), you have to attach GNU license copy to that document and share it as per its terms.

Meera

Download
  • Even Thickness
  • GNU GPL font with Font Exception for embedding

Raghu

Download
  • Title font
  • Not so good in smaller font sizes
  • Designed by famous typographer R. K. Joshi
  • GNU GPL font with specific clause for embedding

Windows Vista & XP fonts without Unicode 5.1 support

Kartika

  • A new lipi font
  • Default Malayalam Unicode font in Microsoft Vista
  • Does not have conjunct problems visible in XP
Issue: Odd letter shapes
  • Looks like designed without consulting a Malayalam native

Windows XP fonts

Fonts that work in Microsoft's XP system; not in Vista. Only those fonts capable of displaying common conjuncts and chillus are listed.

Karumbi

  • An old lipi font
  • This is a script Typeface.

Thoolika

  • Seperate fonts for modified lipi and traditional lipi.
  • Free download for non-commercial personal use.

Nila

  • Modified lipi only
  • Varying width pen

MLU-Panini

  • Modified lipi only
  • Varying width pen

e-Malayalam OT

  • Modified lipi only.
  • Uniform width pen

Kartika

  • A new lipi font
  • Default Malayalam Unicode font in Microsoft XP
Issue: Odd letter shapes
  • Looks like designed without consulting a Malayalam native
Issue: Some conjuncts not displayed correctly
  • ന്റ്ര
  • ന്റ
  • സ്റ്റ്ര
  • ക്ഷ്യ
  • ണ്ട
  • ല്ലു്

Decorative fonts from TDIL


Arial Unicode MS

  • Don't use it - it does not put vowel signs correctly.

GNU/Linux fonts

For the windows fonts to work in Linux, apply following patche thru package manager.

Get the public key:

cd
wget http://download.savannah.nongnu.org/releases/smc/praveen.key.asc
sudo apt-key add ~/praveen.key.asc (give your password, when asked for)

For synaptic in Ubundu add following repository URI details:

http://download.savannah.nongnu.org/releases/smc/debian
etch
main

For more details and options visit SMC.

MAC fonts

Free

Mac version of Rachana font: http://sites.google.com/site/macmalayalam/

Paid


For Android

Android does not support Malayalam natively. So you would need to rely on serverside rendering. It has some occasional problems, however, it is good enough to live with.

Opera supports server-side rendering. Download Opera Mini browser from the Android Market.

Type config: in the address bar. Scroll down to very bottom of the settings. Put Yes for Use bitmap fonts for complex scripts. Then press Save.

To verify, go to mathrubhumi.com in Opera Mini browser.

Useful Links

Writing Malayalam in Unicode

Web based intelligent conversion

In case, you cannot install anything, please try one of the following online editors:

Google Transliteration service

Please go to Google's innovative transliteration page. You don't have to follow any keyboard layout or transliteration scheme. Just type as if you type Manglish in a chat session.

You can avail the same service at Orkut as well. Select Malayalam as your language you speak in your profile (not in settings). Once that is updated, you will see an extra option list above the scarp writing place.


If you need to use this service in any website, please use its bookmarklet version.

Quillpad

http://quillpad.in/malayalam/

Chat based intelligent conversion

Include en2ml.translit@bot.talk.google.com in your group chat. It converts what ever anybody types to Malayalam.

If you want to convert any previously written manglish, please send to this bot as a chat message. It would reply back what you wrote in Malayalam.

Firefox plugin for intelligent conversoin

Install gIndic plugin. Details here.

Web based transliteration scheme conversion

Mozhi Online

Mozhi Online by Raj Nair

ഇളമൊഴി

Anthony Deign's ഇളമൊഴി has a online interface for basic Mozhi scheme. It instantaneously converts manglish text to Unicode while you type.

Varamozhi Online

Varamozhi editor is available online at any of the following mirrors. It has the complete rule-set of the Varamozhi Editor. However, the conversion is not instantaneous. You need to press convert for the manglish text to be converted to Unicode.

Web based keyboard for ISM

Indic Web input by One India.

It is very simple to use. Just type the matter in the window and copy the matter and paste in your blog or where ever you want. 


Web Based Combination Keyboard

See the demo. You could choose between Mozhi and Inscript.

To include this in your webpage, just copy paste following line anywhere in your html code.

<script src="http://mw1.google.com/staticfiles/keyboard/bin/d_ml_002.js"/>

Correspondingly, the code to include in a .js file is:

document.write('<script type="text/javascript" src="http://mw1.google.com/staticfiles/keyboard/bin/d_ml_002.js"></scr' + 'ipt>');

This keyboard could be used thru a bookmark (bookmarklet). For that, please drag and drop the bookmarklet link in the above demo page to the bookmark bar of your browser. In Internet explorer, you have to right click on the link and Add to Favorites in Favorites Bar. Click Yes for the confirmation. You could click on this bookmark to get the keyboard in any web page you want. 

Essentially, you need following code as the URL of the bookmark:

javascript:(function(){ var d=document; var s=d.createElement('script'); s.onreadystatechange=s.onload=function() { window.onload()}; s.src='http://mw1.google.com/staticfiles/keyboard/bin/d_ml_002.js'; d.body.appendChild(s);})();

Microsoft Windows

Mozhi Keyman

Use Mozhi Keyman to type Malayalam directly in any application.

  1. Go to the download page
  2. Wait 15 seconds for the download to start
  3. Save the file to Desktop
  4. Open/run the downloaded file and complete the installation
  5. You will notice on the right side of the task bar, a diamond shaped icon with the letter 'K'
  6. Now installation is complete.

To verify everything is proper,

  1. go to Google.com
  2. Click on K icon and select 'Mozhi Keymap' to write in Malayalam. The icon will turn to 'ക'.
  3. Start writing in the search area in Manglish as per Mozhi scheme
  4. When you are done, click on the 'ക' icon and select 'No Keyman'

Using Varamozhi Editor

Install the editor first. After typing in what you wanted to write, just click File menu and select Export to UTF8 (unicode).

Baraha

http://www.baraha.com/BarahaIME.htm

Inscript

Enhanced Inscript

To type in using a Malayalam keyboard, use the Inscript Keyboard enhanced by including Alt keys. Inscript is a common keyboard layout for Indic Languages by CDAC.

Inscript by Nila keyboard

Download Nila keyboard. Select Tools> Keyboard > Unicode > Inscript. Please see Kannooraan's blog post for further details.

Inscript by TypeIt

Download TypeIt.

Mac

1. Head over to http://keymagic.net/installation-on-macosx and follow the instruction

2. Download http://code.google.com/p/naaraayam/downloads/detail?name=KeyMagic-1.5.1-64bit.zip&can=2&q= (its a keymap file developed by +Junaid P V )

3. Unzip the file and grab the two .km2 files and copy them to ~/.keymagic

4. Just to be safe logout from your system and login back again

5. Head over to System Preferences -> Languages and Text -> Input Methods and select Keymagic.

6. When you select Keymagic from the language menubar item you can choose the appropriate scheme too (Mozhi or inscript)

Linux

Evooran's Mozhi scim-m17n

You can use advanced Mozhi rules used Varamozhi. Details here:

Lalitha

Lalitha phonetic keyboard layout.

Swanalekha

This Swanalekha input method comes with flexible key-mappings and typing suggestion features.

 It has 

Links

  1. Wikipedia Help section
  2. Peringodan's Linux 'n Malayalam blog
  3. http://malayalam.web4all.in
  4. http://smc.org.in

Links

  1. മലയാളം യൂണീകോഡ് എങ്ങനെ റ്റൈപ്പ് ചെയ്യാം?

Embedding Malayalam writing tools in your page

Inscript + Mozhi combination keyboard

Example: http://malayalam.usvishakh.net/blog/archives/324

Just copy paste following code in your page:
<script src="http://mw1.google.com/staticfiles/keyboard/bin/d_ml_002.js"></script>

Malayalam Wikipedia style Mozhi input textarea

Required code is marked in yellow and the names of the fields that developer can change are marked in orange.

<HEAD> 
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/> 
<script src="mozhi.js"></script>
</HEAD> 
<BODY> 
<input id="toggle" type="checkbox"/> മലയാളം എഴുതുവാന്‍ ഈ ഉപാധി സ്വീകരിക്കുക - Use Ctrl + M to Toggle.
<br> 
<textarea id="inputarea" rows="25" cols="80"></textarea> 
<script>if (window.runOnloadHook) runOnloadHook("toggle", "inputarea");</script>
</BODY> 

Adding Malayalam editor in your browser

Please drag and drop the swanalekha bookmarklet to your links bar. Details here.

Chatting in Malayalam

In Gtalk and MSN one could use Mozhi Keyman directly. But that method does not work in Yahoo ! messenger. Use a third party IM client (eg: Miranda) to connect to yahoo! IM network.

Now It's Possible In Yahoo Messenger All You Need Is Get Yahoo Indic Plugin. Go To This Link And Download It. http://gallery.yahoo.com/apps/2047/locale/en and Read The Instructions.

Unicode to Manglish conversion

For short text

Here are the steps to edit already existing Unicode Malayalam text. This works only if the text is only couple of sentences. For longer sentences try method described after this.

  1. Do Options > Unlock Malayalam pane in Varamozhi Editor for editing in Malayalam window
  2. Copy paste Malayalam in the set font by Control-v to Malayalam window
  3. Corresponding manglish will appear in the Manglish window
  4. Now switch the Font to an ASCII fonts like 'Matweb'
  5. Complete your editing

For longer text

  1. In IE click File > Save As...
  2. Set Save type as Text File .txt
  3. Encoding as Unicode(UTF-8)
  4. Save it in My Documents as text-unicode.txt
  5. Run cmd

In the command console

  1. cd "My Documents"
  2. "C:\Program Files\Varamozhi Editor\bin\lamvi_unicode.exe" < text-unicode.txt > text-manglish.txt
  3. "C:\Program Files\Varamozhi Editor\bin\malvi_mozhi_mathrubhumi.exe" -h < text-manglish > text-mathrubhumi.html
text-manglish.html in My Documents contains converted text in Manglish. text-mathrubhumi.html would have the text in desired font - Mathrubhumi(Matweb) font in this example.

യുണീക്കോഡിനെ പറ്റി കൂടുതല്‍

ബിറ്റ്

പടിഞ്ഞാറ്‌ തിരി താഴ്ത്തിയ സൂര്യന്‍‍. പടര്‍‌‍ന്നൊഴുകുന്ന നിലാവു്‌. നിറഞ്ഞുയരുന്ന മുല്ലമണം. ഉമ്മറത്തു് കത്തിനില്‍‌ക്കുന്ന വൈദ്യുതി വിളക്കു്. ആളകത്തുണ്ടെന്നു് അനുമാനിക്കാം. ഇങ്ങനെ, ഒരു സ്വിച്ച്‌ കൊണ്ടു് ഒരു സമയം വിനിമയം ചെയ്യാവുന്ന ഏറ്റവും കുറഞ്ഞ വിവരമാണു് ഒരു ബിറ്റ്‌.

ഒരു സ്വിച്ച്‌ കൊണ്ട്‌ ആകെ രണ്ടു സന്ദേശങ്ങള്‍ കൈമാറാം. ഉദാ: വിളക്കു തെളിഞ്ഞാണെങ്കില്‍ ആളകത്തുണ്ടു്. വിളക്കു കെട്ടാണെങ്കില്‍ ആളകത്തില്ല.

രണ്ടു സ്വിച്ച്‌ ഉണ്ടെങ്കില്‍ നാലാകാം സന്ദേശം. ഉദാ: രണ്ടു വിളക്കും തെളിഞ്ഞാണെങ്കില്‍ ആളകത്തുണ്ട്‌. രണ്ടും കെട്ടാണെങ്കില്‍ ആളകത്തില്ല. ഒന്നാം വിളക്കു തെളിഞ്ഞാണെങ്കില്‍ ഇന്നുണ്ട്‌ നാളെയില്ല. രണ്ടാം വിളക്കു തെളിഞ്ഞാണെങ്കില്‍ ഇന്നില്ല, നാളെയുണ്ട്‌.

രണ്ടിനു പകരം എട്ടാണ്‌ സ്വിച്ചുകളെങ്കിലോ? എട്ട്‌ വിളക്കുകളുടെ കൂട്ടത്തെ 256 വിവിധ രീതികളില്‍ കത്തിച്ചും കെടുത്തിയും കാണിക്കാം. ഉദാ: എട്ടു വിളക്കും ഒരുമിച്ചു കത്തിയാല്‍ ആളകത്തുണ്ട്‌. ഇതില്‍ ഓരോ വിളക്കും ഒരു ബിറ്റിനെ പ്രതിനിധാനം ചെയ്യുന്നു. ഇങ്ങനെയുള്ള എട്ടു ബിറ്റുകളുടെ കൂട്ടത്തെ ഒരു ബൈറ്റ്‌ എന്നു പറയുന്നു.

കൈകൊണ്ട്‌ സ്വിച്ച്‌ പ്രവര്‍ത്തിപ്പിക്കാന്‍ സമയമെടുക്കും. വൈദ്യുതി ഉപയോഗിച്ച്‌ മിന്നല്‍ വേഗത്തില്‍ പ്രവര്‍ത്തിപ്പിക്കാവുന്ന സ്വിച്ചുകളുണ്ട്‌. ഇവയെ ട്രാന്‍സിസ്റ്ററുകള്‍ എന്നു പറയുന്നു. മിന്നല്‍വേഗത്തില്‍ പ്രവര്‍ത്തിക്കുന്ന ലക്ഷക്കണക്കിന്‌ സ്വിച്ചുകള്‍ ഉപയോഗിച്ചാണ്‌ കമ്പ്യൂട്ടറുകള്‍ പ്രവര്‍ത്തിക്കുന്നത്‌.

UTF-8

യുണീക്കോഡ് ഒരു നമ്പറിംഗ് സ്കീം മാത്രമാണ്. അതായത്‌, മലയാളം ‘അ’-ക്ക്‌ 3333 എന്ന സംഖ്യ. ഒരു സംഖ്യയെ ഈ പറഞ്ഞ ബിറ്റുകള്‍ വച്ച്‌ അവതരിപ്പിക്കുന്ന (representation) ഒരു രീതിയാണ് UTF-8. യുണീക്കോഡ് സ്റ്റാന്റേഡ്, റപ്രസെന്റേഷനെ പറ്റി ഒന്നും പറയുന്നില്ല. ASCII-ടെ 7 ബിറ്റ് റപ്രസെന്റേഷനു പ്രശ്നമൊന്നും ഉണ്ടാക്കാത്തതിനാല്‍ UTF-8 ഇന്റര്‍നെറ്റില്‍ വളരെ പോപ്പുലറായി. എന്നാല്‍ വിവിധ ഓപറേറ്റിങ് സിസ്റ്റങ്ങളുടെ API-കള്‍ യുണീക്കോഡ്‌ ടെക്സ്റ്റ് സംസാരിക്കാന്‍ UTF-8 ഉപയോഗിച്ചുകൊള്ളണമെന്നില്ല. ഉദാഹരണത്തിന് മൈക്രോസോഫ്റ്റ് UTF-32 ആണ് ഉപയോഗിക്കുന്നത്‌.

Status of Chillu Letters in Unicode

In mid-2005, Unicode consortium had decided to have special encoding for Malayalam chillus. Accordingly Anjali, Varamozhi, Mozhi Keyman (ക) and Vamozhi softwares have adopted that scheme early. After couple of months, Unicode consortium reverted that decision. Correspondingly all the above softwares had to be reverted. The latest versions of all these softwares support current standard (without special encoding) for Chillus. The versions onwhich current standard chillu encoding is available:

Anjali 0.730
Varamozhi 1.3.3
Mozhi Keyman 1.1.0
Karthika keyboard in Vamozhi 2.6.0
Rachana any version
Karthika any version

Update: Last week, UTC has decided to encode Chillu letters for ന, ണ, ല, ള/ഴ, റ/ര, ക

-Cibu 21:04, 2 June 2006 (UTC)

Malayalam rendering in MAC

As of today it does not work. With AnjaliOldLipi or Rachana, Safari displays Malayalam characters; but not conjuncts or reordering. So it is very difficult to read Malayalam text. Firefox won't even do that. It will display array of question marks.

The problem could be with the font or rendering engine. The Microsoft's Malayalam specific tables in an opentype font may not be read by the rendering engine. Or the rendering engine does not have the implementation for Malayalam. I don't know which one is the case.

Reph

Reph: <KA, AA-sign, Dot Reph, YA, Virama, YA> would give you കാൎയ്യം. In Mozhi, you would write it as 'kaar#yyam'. Fonts like Kaumudi, NotoSansMalayalam has it.


Kaumudi: http://news.keralakaumudi.com/info/Kaumudi.ttf

Mixing Arabic and Malayalam

സാധാരണ യുണികോഡ് ഗദ്യത്തില് അറബിയും മലയാളവും (അല്ലെങ്കില് ഇംഗ്ലീഷോ മറ്റേതെങ്കിലും ഭാഷയോ) ഇടകലര്ത്തിയെഴുതാന് പ്രശ്നമൊന്നുമില്ല. വരികള്, വാചകങ്ങള് എന്നു നോക്കാതെ അറബിയിലുള്ള ഓരോ വാക്കുകളിലും ഈ നിബന്ധന പാലിച്ചാല് മതിയല്ലോ!

ഉദാഹരണത്തിന് “അറബിയില് السلام عليكم (അസ്സലാമു അലൈക്കും) എന്നെഴുതിയാല് Peace to you എന്നാണര്ത്ഥം” എന്ന വാചകത്തില് മൂന്നു ഭാഷകളും നിങ്ങളുടെ സ്ക്രീനില് കാണാമെന്നു പ്രതീക്ഷിക്കുന്നു!

എന്നാലും തുടക്കക്കാര്ക്ക് ഇത് സ്വല്പം ആശയക്കുഴപ്പം ഉണ്ടാക്കാതില്ല. ഇത്തരം വാചകങ്ങള് എഡിറ്റു ചെയ്യുമ്പോള് cursor behaviour സാധാരണ നാം ശീലിച്ചപോലെയാവില്ല. ഉദാഹരണത്തിന് മേല്ക്കാണിച്ച വാചകം ഒരു Editable text field-ലേക്ക് കോപ്പി പേസ്റ്റു ചെയ്തു കര്സര് അതിലൂടെ ഓടിച്ചുനോക്കൂ! അറബി വാക്ക് എത്തുമ്പോള് പെട്ടെന്നു കര്സര് ഒരു right-to-left ചാട്ടം ചാടുന്നതു കാണാം! അതു കഴിയുമ്പോള് തിരിച്ചും!

എന്തായാലും ഈ cursor management യുണികോഡ് അറബിഫോണ്ടുകളും ഓപ്പറേറ്റിങ് സിസ്റ്റവും കൂടി നോക്കിക്കോളും. സാധാരണ ഉപയോക്താവിനേയും ടാവുല്ടെസോഫ്റ്റ് കീമാന് പോലത്തെ പ്രോഗ്രാമുകളേയും സംബന്ധിച്ചിടത്തോളം, ഇതൊരു വലിയ പ്രശ്നമല്ല.

വരമൊഴി തല്ക്കാലം മലയാളം യുണികോഡ് സൃഷ്ടിക്കാനുള്ള പ്രോഗ്രാം ആയി നിലകൊള്ളട്ടെ. വരമൊഴി ഉപയോഗിച്ച് മലയാളം യുണികോഡിലേക്ക് എക്സ്പോര്ട് ചെയ്തതിനു ശേഷം അതില് ആവശ്യമുള്ള അറബി വാക്കുകള് (അല്ലെങ്കില് വരികള് /ഖണ്ഡികകള്) ഏതെങ്കിലും എഡിറ്റര് (ഉദാ: നോട്ട് പാഡ്, വേര്ഡ് പാഡ്, വേര്ഡ് , ഫ്രന്റ്പേജ്, IE ഫോമുകള് തുടങ്ങിയവ...) ഉപയോഗിച്ച് ഇടകലര്ത്തിയെഴുതാവുന്നതാണ്. പക്ഷേ സുഗമമായ, compatibility ഉറപ്പായ ഫലം കിട്ടാന്, എഴുതിച്ചേര്ക്കുന്ന അറബിവാക്കുകളും യുണികോഡില് തന്നെയാണെന്നുറപ്പു വരുത്തുക.

പഴയതരം എന്കോഡിംഗ് ഉപയോഗിക്കുന്ന ഫോണ്ടുകള്‍ (Encoding=Arabic Windows) ഉപയോഗിക്കുമ്പോള്‍ പ്രശ്നങ്ങളുണ്ടാവാം.

യുണികോഡ് വാസ്തവമായും ഒരു യൂണിവേര്സല് സെറ്റ് ആണ്. യുണികോഡില് എഴുതിയിരിക്കുന്ന ഓരോ അക്ഷരത്തിനും അതിന്റെ സ്വന്തം ഭാഷ തിരിച്ചറിയാം. അതുകൊണ്ട് എത്ര ഭാഷ വേണമെങ്കിലും ഒരേ ഖണ്ഡികയില് ഇടകലര്ത്തി ഉപയോഗിക്കാം. വെവ്വേറെയോ ഒരുമിച്ചോ ആ ഭാഷകളൊക്കെ ഉള്പ്പെട്ടിട്ടുള്ള യുണികോഡ് ഫോണ്ട് ഫയലുകള് കമ്പ്യൂട്ടറില് വേണമെന്നു മാത്രം.

ഉപയോഗിക്കുന്ന ആളെ സംബന്ധിച്ചിടത്തോളം അറബിയുടെ പഴയ എന്കോഡിംഗും യുണികോഡ് എന്കോഡിംഗുമായി പ്രകടമായ വ്യത്യാസങ്ങളൊന്നുമില്ല. Windows 3.11 മുതല് ഉപയോഗിച്ചുവരുന്ന അതേ കീബോര്ഡ് തന്നെ യുണികോഡിനും ഉപയോഗിക്കാം. കൂടാതെ Arial, Tahoma, Times New Roman തുടങ്ങിയ മിക്ക വിന്ഡോസ് യുണികോഡ് ഫോണ്ടുകളിലും അറബി, ഗ്രീക്, സിറില്ലിക്, ഹെബ്ര്യൂ, തായ് തുടങ്ങിയ അക്ഷരങ്ങള് സാധാരണനിലയില് തന്നെ ഉള്പ്പെട്ടിട്ടുണ്ട്. അറബിയിലെ Simple, Naskh, Koufi തുടങ്ങിയ കാലിഗ്രാഫി വകഭേദങ്ങള്ക്കും ‘അള്അഃ’ (ﷲ), സജ്ദ (۩), റുബ് എല്ഹിസ്ബ് (۞) , അയാ ഒടുക്കം (۝ ) തുടങ്ങിയ കുര്-ആന് ചിഹ്നങ്ങള്ക്കും ഇതേ ഫോണ്ടുകളില് തന്നെ പ്രത്യേകം സ്ഥാനങ്ങള് കൊടുത്തിട്ടുമുണ്ട്!) (Unicode Arabic Presentation Forms 1 &2) . ഇതൊന്നും പോരാതെ മനോഹരമായി രൂപകല്പന ചെയ്തിട്ടുള്ള നൂറുകണക്കിനു അറബിക് യുണികോഡ് ഫോണ്ടുകളും ഇന്റര്നെറ്റില് തന്നെ ലഭ്യമാണ്.

Internationalized Domain Names (IDN)

Internationalized Domain Names means displaying web address in Malayalam. Ex: http://കൈപ്പള്ളി.blogspot.com. IE7 can display it in Malayalam itself. You will need to add Malayalam as the first entry in the Internationalized Website Address configuration. This is found near the refresh button. Otherwise, the status bar would show the punycode form of the same website: http://xn--bwc6ba0ba6ewczbc.blogspot.com/.

Malayalam in J2EE applicaiton

ഒരു J2EE ആപ്ലിക്കേഷനു പൊതുവെ മൂന്നു ഭാഗങളാണുള്ളതു. ഇവ മൂന്നും സുരക്ഷിതമായീ യൂണിക്കോഡ് കൈകാര്യം ചെയ്താല്‍ ആപ്ലിക്കേഷന്‍ പൂര്‍ണ്ണമായും യൂണിക്കോഡ് റെഡി ആയീ എന്നു പറയാം.

  • content കാണിക്കുന്ന പേജുകള്‍
  • content സൂക്ഷിക്കുന്ന ഡാറ്റാബേസ്
  • ഡാറ്റാബേസില്‍ നിന്നും പേജിലേക്കു ഡാറ്റ എത്തിക്കുന്ന ആപ്പളിക്കേഷന്‍ കോഡ്

ഒന്നാമതായീ jsp പേജുകള്‍ യൂണീക്കോടില്‍ സേവ് ചെയ്യുക. എക്ലിപ്സ് എഡിറ്ററില്‍ ഇതു നിസ്സാരമായീ സാധിക്കും. രണ്ടാമതായീ ദാ ഇത്രേം പേജില്‍ ഇടുക:

<%@page pageEncoding="UTF-8"%> <%@page language="java" contentType="text/html;charset=UTF-8"%> 

ഇത്രയുമായാല്‍ പേജ് റെഡി ആയീ. ഇനി പല ഭാഷകളേ സപ്പോര്‍ട് ചെയ്യുന്ന പോര്‍ട്ടലുകള്‍ പൊതുവേ സ്റ്റാ‍റ്റിക് കണ്ടന്റ് property ഫയലുകളില്‍ സൂക്ഷിക്കുക ആണു പതിവു. ഇങനെ ചെയ്യുമ്പോള്‍ യൂണീക്കോട് ഫയലുകളെ അവയുടെ തത്തുല്യ കോടുകളായീ സൂക്ഷിച്ചാലേ jstl പോലെയുള്ള റ്റാഗ് ലൈബ്രറികള്‍ക്കു അതു യൂണിക്കോഡ് ആണെന്നു മനസ്സിലാവൂ. അപ്പോള്‍ പ്രോപര്‍ട്ടി ഫയല്‍ ഉപയോഗിക്കുന്നവര്‍ native2ascii java ടൂള്‍ ഉപയോഗിച്ചു മലയാള‍ത്തിലുള്ള പ്രൊപര്‍ടി ഫയലിനേ ഒരു ascii ഫയല്‍ ആയീ മാറ്റണം. ഇത്രയുമാ‍യാല്‍‍ പേജ് യൂണിക്കൊഡ് കമ്പാറ്റിബിള്‍ ആയീ എന്നു പറയാം. ആപ്ലിക്കേഷന്‍ കോഡും ഡാറ്റാബേസും കൂടി യൂണിക്കോഡ് കമ്പാറ്റിബിള്‍ ആക്കിയാലേ യൂണീക്കോഡ് സപ്പോര്‍ട് പൂര്‍ണ്ണമാവൂ.

Troubleshooting

Basic instructions: Chintha.com
Detailed instructions: Malayalam Wikipedia
Most comprehensive instruction set: by Viswaprabha

My favourite Malayalam Unicode font is AnjaliOldLipi by Kevin

Even after all the configuraiton, Malayalam is not shown in AnjaliOldLipi

Please remove AnjaliOldLipi font from the Control Panel > Fonts. Reboot. Then Install AnjaliOldLipi using the installer from the left bar of this page.

Can't read Malayalam in Varamozhi Yahoo! Group

In yahoo mail and groups, you need to select encoding as unicode. In Internet Explorer, it can be done by either Right mouse click->Encoding->Unicode(UTF-8) or by Menu->View->Encoding->Unicode (UTF-8).

Why are the unicode fonts like Rachana missing?

Unicode fonts like Rachana, Anjali, Nila or ThoolikaUnicode does not have proprietary encoding of Malayalam characters or symbols like ASCII fonts like Matweb or ML-TTKarthika have. For example, അ is encoded with the same code in all these Unicode fonts. So, convert to Unicode (UTF8) menu action is good enough for anyone of them.

Works in IE, but not in other applications

Please do following steps:

  • Click on Start > Control Panel
  • Open Regional and Language options
  • Click on Languages tab
  • Check/enable install files for complex script. It might ask for Windows Installation CD.
  • Reboot the system

Varamozhi Editor in Win98 hangs on Unicode conversion

Problem

Varamozhi Editor in Windows 98 hangs when File > Export to Unicode(UTF8) is clicked.

Cause

There are some problems with Varamozhi in Windows 98. Unfortunately, they cannot fixed since there is no developer access to a Windows 98 PC.

Workaround

Once you have typed in the text in Varamozhi Editor, copy paste it to Online Varamozhi Editor for conversion to Unicode.

Letters disappear below the baseline in Firefox

Symptom

Symptom

Workaround

Please install AnjaliOldLipi font and set it as the default font in Firefox.

Some Unicode blogs viewed in Firefox have lots of doted circles

  • Solution for the viewer: View that in IE or use Firefox 3.0 beta version. Firefox beta is available from http://ftp.mozilla.org/pub/mozilla.org/firefox/nightly/latest-trunk. Get the file with win32.zip extension and unzip it in a convenient location. Close the existing firefox window and navigate to the unziped directory locate the firefox.exe to execute.
  • Solution for the blogger: This issue happens when the text is formatted with align="justify" or letter-spacing:..em;. Either remove justfy or change that to something else like left/right/center.

ചില്ലും ചതുരവും!

എല്ലാ ബൂലോഗകാരന്മാരുടേയും കാരികളുടേയും ശ്രദ്ധയ്ക്ക്,


ഇപ്പോള്‍ മലയാളം യുണികോഡ് ഉപയോഗിച്ച് ബ്ലോഗുകള്‍ എഴുതുന്ന ചിലരുടെ ഒന്നോ അതിലധികമോ കമ്പ്യൂട്ടറുകളില്‍ മലയാളം യുണികോഡ് ഘടിപ്പിച്ചിരിക്കുന്നതില്‍ ഒരു ചെറിയ പിശകുണ്ട്.

കഴിഞ്ഞ ജൂലായില്‍(2005) യുണികോഡുകാര്‍ മലയാളത്തിലെ ചില്ലുകള്‍ക്കു വേണ്ടി പ്രത്യേക കോഡ്‌ സ്ഥാനങ്ങള്‍ അനുവദിക്കാന്‍ ആലോചിച്ച് അങ്ങനെ ഭേദഗതി ചെയ്ത ഒരു പുതിയ കോഡുമാപ്പു കൊണ്ടുവന്നിരുന്നു. ഉത്സാഹശാലികളായ നമ്മുടെ കൂട്ടുകാര്‍ ഒട്ടും കാലതാമസമില്ലാതെ ഈ പുതിയ മാറ്റത്തിനനുസരണമായി അഞ്ജലി ഫോണ്ട്, (കെവിന്‍ & സിജി), വാമൊഴി കീമാപ്പ് ( സൂപ്പര്‍ VHS സാം-വറുഗീസ് സാമുവല്‍), ‘ക’ മൊഴി കീമാപ്പ് ( പെരിങ്ങോടന്‍ -രാജ് നായര്‍), വരമൊഴി പ്രോഗ്രാം (സിബു) എന്നിവ പുതുക്കിയെഴുതി.

ഇതനുസരിച്ച് പുതുതായി അന്നു വന്ന വേര്‍ഷനുകള്‍: (2005 July)

KevinSiji's AnjaliOldLipi 0.72 ( ഇതില്‍ OldLipi എന്നത് ഫോണ്ട്ഫയലിന്റെ പഴക്കമല്ല, 'മലയാളത്തിലെ പഴയ ലിപി' എന്നാണര്‍ത്ഥമാക്കുന്നതെന്നു പ്രത്യേകം ശ്രദ്ധിക്കുമല്ലോ)

Sam's Vaamozhi (For Anjali)

Raj's 'Ka' mozhi 1.0.2

Cibu's Varamozhi 1.3.2

നിര്‍ഭാഗ്യവശാലെന്നു പറയാം, രണ്ടുമൂന്നു മാസത്തിനുള്ളില്‍ ചില്ലുകളുടെ ഈ ഭേദഗതി സാങ്കേതികമായ ചില കാരണങ്ങളാല്‍, യുണികോഡ് ഇനിയൊരറിയിപ്പുണ്ടാവുന്നതുവരെ പിന്‍‌വലിച്ചു. അതായത് കാര്യങ്ങള്‍ മുന്‍പുള്ള അതേ അവസ്ഥയിലേക്കു തിരിച്ചുമാറ്റി എന്നര്‍ത്ഥം.

ഇങ്ങനെ വന്നപ്പോള്‍ മേല്‍പ്പറഞ്ഞ പ്രോഗ്രാമുകളും ഇതുപോലെത്തന്നെ തിരിച്ചുമാറ്റാന്‍ നാം നിര്‍ബന്ധിതരായി. അങ്ങനെ ചെയ്തില്ലെങ്കില്‍ ഈ 'വേര്‍ച്ചില്ലു' വേര്‍ഷനില്‍ നാം തയ്യാ‍റാക്കുന്ന മലയാളവാക്കുകളൊക്കെ കാലാകാലത്തോളം വികടമായി അവശേഷിക്കുവാനുള്ള സാദ്ധ്യതയുണ്ടായിരുന്നു.

അങ്ങനെ 2005 സെപ്റ്റംബറില്‍ താഴെ പറയുന്ന വേര്‍ഷനുകള്‍ നിലവില്‍ വന്നു.

KevinSiji's AnjaliOldLipi 0.73

Raj's 'Ka' mozhi 1.1.0 Beta

Cibu's Varamozhi 1.3.3

എങ്കിലും സണ്ണിച്ചായന്റെ Anjaliക്കു വേണ്ടിയുള്ള കീമാപ്പു മാത്രം സ്വന്തം ജോലിത്തിരക്കുമൂലം അദ്ദേഹത്തിനു മാറ്റിയെഴുതാന്‍ കഴിഞ്ഞില്ല. വാസ്തവത്തില്‍ അതിന്റെ ആവശ്യമുണ്ടായിരുന്നില്ല. കാരണം അദ്ദേഹത്തിന്റെ തന്നെ 'കാര്‍ത്തിക' ഫോണ്ടിനുള്ള മറ്റൊരു കീമാപ്പ് ഈ മാറ്റങ്ങള്‍ക്കു പകരമായി ഉപയോഗിച്ചാലും ഇതേ ഫലമുണ്ടാക്കുമായിരുന്നു.

മറ്റുള്ളവരാകട്ടെ, ( കെവിനും സിബുവും രാജും), പുതിയ (2005 സെപ്റ്റംബര്‍) വേര്‍ഷനുകളില്‍ സമര്‍ത്ഥമായ ഒരുപായം ചെയ്തു. ചില്ലുകള്‍ക്ക് അവര്‍ പഴയതും പുതിയതും ആയ രണ്ടു സ്ഥാനങ്ങളും നിലനിര്‍ത്തി. ഇതനുസരിച്ച്, ഇനി നാളെ വീണ്ടും ചില്ലുകള്‍ക്ക് പ്രത്യേക സ്വരസ്ഥാനം കൊടുത്താലും പ്രശ്നമുണ്ടാകുകയില്ല എന്നതായിരുന്നു ഇതിലെ നല്ല വശം.

**** **** ****

ഇത്രയും എഴുതിയത് Technical Reasons.

ശരി,ശരി. ഇതിലെ ഭാരിച്ച കാര്യങ്ങളൊന്നും മനസ്സിലാവുന്നില്ല എന്നു തോന്നുന്നുവെങ്കില്‍ ഇനി ‘വെറും കാര്യം‘ പറയാം.

നിങ്ങളില്‍ ചിലര്‍ ഇതിനിടയ്ക്കുള്ള ('വേര്‍ച്ചില്ലു' വേര്‍ഷനുള്ള) ഏതോ പ്രോഗ്രാം ഇപ്പോഴും ഉപയോഗിക്കുന്നുണ്ട്. അതുകൊണ്ട് നിങ്ങള്‍ തയ്യാറാക്കുന്ന മലയാളത്തില്‍ ചില്ലുകള്‍ക്ക് ഒരു ന്യൂനതയും വരുന്നുണ്ട്.

എന്താണെന്നുവെച്ചാല്‍,

അഞ്ജലി ഒഴികെയുള്ള, കാര്‍ത്തികയും മറ്റു യുണികോഡ് ഫോണ്ടുകളും ഉപയോഗിച്ചു കമ്പ്യൂട്ടറുകളില്‍ വായിക്കുന്നവര്‍ക്ക്, നിങ്ങള്‍ എഴുതുന്ന വാക്കുകളില്‍ ചില്ലുകള്‍ക്കു പകരം വെറും ചതുരങ്ങളാണു കാണുക.

അതായത് ‘ര്‍’,‘ല്‍’,‘ള്‍,‘ന്‍’,‘ണ്‍’ - ഈ അക്ഷരങ്ങള്‍ അവര്‍ക്ക് തിരിച്ചറിഞ്ഞു വായിക്കാനാവില്ല!

പക്ഷേ ‘അഞ്ജലി’ ഫോണ്ടുപയോഗിച്ചു വായിക്കുന്ന നിങ്ങളുടെ സ്വന്തം കമ്പ്യൂട്ടറില്‍ ഇവയൊക്കെ ശരിക്കു കണ്ടെന്നും വരാം. അതിനാല്‍ നിങ്ങള്‍ക്കു സ്വയം ഈ തെറ്റു കണ്ടു മനസ്സിലാക്കാനും തിരിച്ചറിയാനും പറ്റുകയുമില്ല!

**** **** ****

എങ്ങനെ സ്വയം പരിശോധിക്കാം?

നിങ്ങളുടേ കമ്പ്യൂട്ടറില്‍ ഈ ന്യൂനതയുണ്ടോ എന്നെങ്ങനെയറിയാം?

തത്കാലത്തേക്ക് Internet Explorer: Tools: Internet Options:General Tab: Fonts: Language Scripts എന്നതില്‍ Malayalam എന്നതു തെരഞ്ഞെടുത്ത്, അതില്‍ വലതുഭാഗത്തുവരുന്ന ലിസ്റ്റില്‍ അഞ്ജലി ഫോണ്ടിനു പകരം കാര്‍ത്തികയോ, രചനയോ, തൂലികയുണികോഡോ ആക്കി OK; OK ക്ലിക്കു ചെയ്ത് തിരിച്ചുവരിക. വേണമെങ്കില്‍ Internet Explorer അടച്ച് വീണ്ടും തുറക്കാവുന്നതാണ്. എന്നിട്ട് നിങ്ങളുടെ തന്നെ ഏതെങ്കിലും ബ്ലോഗ് പോസ്റ്റോ കമന്റോ വായിച്ചുനോക്കുക. ചില്ലുകളുടെ സ്ഥാനത്ത് ചതുരക്കട്ടകളാണു വരുന്നതെങ്കില്‍, പെട്ടു എന്നര്‍ത്ഥം!

നിങ്ങളുടെ തന്നെ പോസ്റ്റു വേണം വായിച്ചുനോക്കാന്‍. വേറെ ആളുകള്‍ എഴുതിയ മലയാളത്തില്‍ ഇതു കണ്ടേക്കാം. അതു നിങ്ങളുടെ പ്രശ്നമല്ല.

ഉറപ്പിനു വേണ്ടി കുറച്ചു ദിവസത്തേക്ക് അഞ്ജലിഫോണ്ടിനെ ഒഴിവാക്കി വെക്കാം. കാരണം അഞ്ജലിഫോണ്ടിന്റെ മിടുക്കു മൂലമാണ് ഈ ഒരു കുറവു നാമറിയാതെ പോകുന്നത്.

*** **** ****



പ്രശ്നം എന്തുകൊണ്ടുണ്ടാവുന്നു?

1. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത് AnjaliOldLipi 0.72 ആയിരിക്കാം.

ഇതറിയാന്‍ ഉള്ള വഴി നിങ്ങളുടെ \Windows\Fonts ഫോള്‍ഡറില്‍ പോയി നോക്കുകയാണ്. അവിടെ ചെന്ന് ഫയലിന്റെ പേര് AnjaliOldLipi-0.730.ttf എന്നുതന്നെയല്ലേ എന്നു നോക്കുക. ഈ ഫയലിന്റെ പുറത്ത് Right-Click ചെയ്താല്‍ 423 KB (433,556 bytes) എന്നു വലിപ്പവും Modified :Saturday, September 24, 2005, 02:12:40 PM എന്നു തീയതിയും കാണിക്കണം.

ഇങ്ങനെതന്നെയാണു കാണുന്നതെങ്കില്‍, പ്രശ്നമില്ല, രണ്ടാമത്തെ സ്റ്റെപ്പിലേക്കു പോകാം.

അതല്ല, ഇതില്‍ എന്തെങ്കിലും വ്യത്യാസമുണ്ടെങ്കില്‍ ഉടനെ തന്നെ ആ ഫോണ്ട് Delete ചെയ്തു കളയുകയോ, ആ ഫോള്‍ഡറില്‍ നിന്നു മാറ്റിയിടുകയോ ചെയ്യണം. എന്നിട്ട് ശരിയായ വേര്‍ഷന്‍ http://varamozhi.sourceforge.net/fonts എന്ന സൈറ്റില്‍ പോയി Download ചെയ്ത് ഈ ഫോള്‍ഡറിലേക്കു തന്നെ ( \Windows\Fonts) കോപ്പി ചെയ്തിടണം.

ഇവിടെ ചിലപ്പോള്‍ ഒരു പ്രശ്നം ഉണ്ടായേക്കാം. പഴയ ഫോണ്ട് ഫയല്‍ ഒരുപക്ഷേ നിങ്ങള്‍ക്ക് Delete ചെയ്യാന്‍ Windows സമ്മതിച്ചില്ലെന്നു വരാം. ഇതിനു കാരണം ആ ലിപി ഇപ്പോഴും കമ്പ്യൂട്ടറിന്റെ മെമ്മറിയിലെ ഒരത്യാവശ്യ ഫോണ്ടായി ഇരിക്കുന്നതുകൊണ്ടാകാം. അതുകൊണ്ട് Delete ചെയ്യുന്നതിനു മുന്‍പ് Internet Explorerല്‍ മുന്നെ പറഞ്ഞ പോലെ മലയാളം ഫോണ്ട് മാറ്റിയിടണം. കൂടാതെ IE യുടെയും തല്‍ക്കാലം ആവശ്യമില്ലാത്ത മറ്റു പ്രോഗ്രാമുകളുടേയും എല്ലാ Window കളും ക്ലോസ് ചെയ്യുകയും വേണം. എന്നിട്ട് വീണ്ടും Delete ചെയ്യാന്‍ ശ്രമിക്കുക.

ഇതു കഴിഞ്ഞാല്‍ അടുത്ത സ്റ്റെപ്പിലേക്കു കടക്കുക.



2. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത് വരമൊഴിയുടെ ഏതെങ്കിലും പഴയ വേര്‍ഷന്‍ ആയിരിക്കാം. (അതായത് 1.3.3 നു മുന്‍പുള്ള ഏതെങ്കിലും വേര്‍ഷന്‍)

വരമൊഴി പ്രോഗ്രാം തുറന്ന് മെനുവില്‍ നിന്നും Help:About എടുത്തു നോക്കിയാല്‍ 1.3.3 എന്നു കാണുന്നുണ്ടോ? ഉണ്ടെങ്കില്‍ അടുത്ത സ്റ്റെപ്പിലേക്കു (3) പോകാം.



അതല്ല, അതിലും കുറഞ്ഞ വേര്‍ഷന്‍ ആണെങ്കിലോ?

ഇതെന്തായാലും പാടില്ല. ഓരോ പുതിയ വേര്‍ഷനിലും വരമൊഴിയില്‍ നാമറിയാത്ത ഒട്ടനവധി മേന്മകള്‍ ചേര്‍ത്തിട്ടുണ്ട്. അതുകൊണ്ട് വരമൊഴിയുടെ പുതിയ പുതിയ വേര്‍ഷനുകള്‍ അപ്പോഴപ്പോള്‍ install ചെയ്യുക എന്നുള്ളത് സാമാന്യയുക്തി മാത്രമാണ്.

ഇതെഴുതുന്ന സമയത്തെ വരമൊഴി വേര്‍ഷന്‍ 1.3.3 ആണ്. മാസങ്ങളോളം രാത്രിയും പകലും അരിച്ചും പെറുക്കിയും നോക്കിയിട്ട് പറയത്തക്ക ഒരു പിശകും കണ്ടിട്ടില്ല ഈ വേര്‍ഷനില്‍. ( അഥവാ എന്തെങ്കിലും പിശകു (Bug) കാണുകയാണെങ്കില്‍ ഉടനെത്തന്നെ varamozhi@yahoogroups.com അല്ലെങ്കില്‍ http://vfaq.blogspot.com അതുമല്ലെങ്കില്‍ cibu@യാഹൂ.കോം വിശദമായ ലക്ഷണങ്ങളോടെ അറിയിക്കേണ്ടത് നിങ്ങളുടെ അവകാശമല്ല, ചുമതലയാണ്). അതിനാല്‍ വരമൊഴി ഉപയോഗിക്കുന്ന ആരും, ഇതു വായിക്കുന്ന ആരും, ഉടനെത്തന്നെ http://varamozhi.sourceforge.net/download എന്ന സൈറ്റില്‍ നിന്നും 1.3.3 വേര്‍ഷന്‍ തന്നെ ശ്രദ്ധയോടെ download ചെയ്യേണ്ടതാണ്.


3. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത് പെരിങ്ങോടന്റെ 'ക' (മൊഴി) കീമാപ്പിന്റെ ഒരു പഴയ വേര്‍ഷന്‍ ആയിരിക്കാം. (1.1.0 നു മുന്‍പുള്ളത്)

വരമൊഴിയ്ക്കു പകരം നേരിട്ട് കമ്പ്യൂട്ടരിലേക്കു ടൈപ്പു ചെയ്യാവുന്ന ഒരു സംവിധാനമാണ് ടാവുല്‍ടെസോഫ്റ്റിന്റെ കീമാന്‍ എന്ന പ്രോഗ്രാം. കീമാന്‍ പ്രവര്‍ത്തിക്കുന്ന ഒരു കമ്പ്യൂട്ടറിന്റെ സ്ക്രീനില്‍ വലതുവശത്ത്‌ ഏറ്റവും കീഴെ TaskBar എന്ന ഭാഗത്ത്‌ ഒരു ഡയമണ്ട്‌ ആകൃതിയില്‍ ഒരു ചെറിയ ഐക്കണ്‍ കാണാം. അതില്‍ മൌസിന്റെ ഇടത്തേ ബട്ടണ്‍ അമര്‍ത്തിയാല്‍ "No Keyman" എന്നും 'ക' Mozhi Keymap എന്നും (ചിലപ്പോള്‍ കൂടുതല്‍ ഓപ്ഷന്‍സും കണ്ടേക്കാം) കാണാം.
ഈ ഐക്കണില്‍ ശ്രദ്ധിച്ചാല്‍ 'ക' കീമാപ്പിന്റെ വേര്‍ഷന്‍ മനസ്സിലാക്കാം. ഇത്‌ Mozhi Keymap 1.1.0 എന്നാണെങ്കില്‍ നിങ്ങള്‍ ഭാഗ്യവാന്‍. അടുത്ത സ്റ്റെപ്പിലേക്കു (4) കടക്കാം.

അതല്ലെങ്കിലോ? ഉടനെത്തന്നെ ഇപ്പോഴുള്ള വേര്‍ഷന്‍ നീക്കം ചെയ്ത്‌ ശരിയായ ഫയല്‍ വരമൊഴി സൈറ്റില്‍ നിന്നും ഇറക്കുമതി ചെയ്ത്‌ കീമാന്‍ പുനസ്ഥാപിക്കുക.

(ഒരു പക്ഷേ ഇക്കാര്യം ചെയ്യാന്‍ windows ഷട്ട്‌ ഡൌണ്‍ ചെയ്ത്‌ Restart ചെയ്യേണ്ടി വന്നേക്കും. അങ്ങനെയെങ്കില്‍ Restart ചെയ്തതിനു ശേഷം വീണ്ടും കീമാന്‍ installation തുടരുക.)



4. നിങ്ങള്‍ ഉപയോഗിക്കുന്നത്‌ സണ്ണിയുടെ 'അഞ്ജലി' കീമാപ്പ്‌ ആയിരിക്കാം.

സണ്ണിയുടെ അഞ്ജലി കീമാപ്പ്‌ (വേര്‍ഷന്‍ 2.6) ആണു നിങ്ങള്‍ ഉപയോഗിക്കുന്നതെങ്കില്‍ ഉടന്‍ തന്നെ ആ രീതി മാറ്റുക. സണ്ണിയുടെ തന്നെ 'കാര്‍ത്തിക' കീമാപ്പ്‌ ഇതിനു പകരം ഉപയോഗിക്കാവുന്നതാണ്‌.


'ചില്ലുകള്‍ക്കു പകരം ചതുരക്കള്ളികളുടെ' പ്രശ്നത്തിന്‌ ഇപ്പറഞ്ഞ നാലു കാരണങ്ങളേ സാധാരണ ഗതിയില്‍ ഉണ്ടാവാന്‍ സാദ്ധ്യത കാണുന്നുള്ളൂ. ഇനി അഥവാ ഈ നാലു കാര്യങ്ങളും ശരിയായിരുന്നിട്ടും നിങ്ങളുടെ സ്ക്രീനില്‍ ഈ വിഷമം കാണുന്നുണ്ടെങ്കില്‍ ദയവുചെയ്ത്‌ ആ വിവരം ഞങ്ങളെ ആരെയെങ്കിലും ( വിശ്വം, സിബു, പെരിങ്ങോടന്‍) അറിയിക്കുവാന്‍ മറക്കരുത്‌.

Square boxes in place of Unicode chillu

This happens because you are using an old Unicode font without specific encoding for chillu letters. Please uninstall AnjaliOldLipi font, if you have, and follow these instructions.

Consonant + chandrakkala in place of chillu

Following could be the reasons:

  1. Your Malayalam Unicode font is an old version which does not follow the latest Unicode standard on Chillus. Please install new Unicode malayalam font.
  2. Your Windows PC does not have the latest Uniscribe DLL (usp10.dll). Please see the section on updating Unicode rendering engine below.
  3. Your PC's operating system is older than Windows 2ooo.
  4. You are using alternate browsers like FireFox whose ability to interact with Uniscribe is slightly limited compared to that of Internet Explorer.

Chillus in previous Unicode encoding standard can be converted to current standard using Varamozhi Editor. Convert old Unicode text to Manglish. Then convert it to Unicode again by clicking File->Convert to Unicode(UTF8).

/nta/ is displayed as /nra/

ന്റ problem example
ന്റ problem example

Microsoft and others follow differing interpretations of the Unicode 5.0 to produce /nta/ conjunct. The text created by an input tool (example: Mozhi Keyman, Varamozhi Editor), that follows non-microsoft interpretation, will be displayed in Microsoft's Kartika font as /nra/. Today, most of the Malayalam text is written this way.

The work around is to use Rachana or AnjaliOldLipi fonts instead of Kartika. Rachana and AnjaliOldLipi fonts use non-microsoft interpretation.

Updating Unicode rendering engine

The Unicode rendering engine for Windows is called Uniscribe. It is present in your system as usp10.dll. Microsoft frequently corrects this file for various problems. Installing latest usp10.dll could solve following issues:

  • Dotted circle in front of Chillu letters
    Problem examples
    Problem examples
  • Chillu letters appearing as consonant + chandrakkala
  • AU sign appears separately with dotted circle
  • The word സ്നേഹം appearing as സ്നഹേം

Follow these steps to download and install usp10.dll:

  1. Make sure Install files for complex script... is checked in Control Panel > Regional and Language Options > Languages tab
  2. For some of the readers, the chillu letters will appear as letter+chandrakkala, instead of the proper chillu. If this happens, make sure that you deleted any old AnjaliOldLipi font from the Windows font folder and installed the latest one.
  3. If step 1 did not solve the problem, it could be because you have an older version of usp10.dll file in the Windows/System32 folder. If you have Microsoft Office 2003 or later installed, you need not to proceed further. It comes witha a proper usp10.dll file. Else, proceed to step 3.
  4. Download and unzip this file. Eventhough, this is an exe file you can unzip it. You will find a usp10.cab file. Unzip that too to get the usp10.dll file. Remember the location you saved it.
  5. Download and run this program. You will be asked the location of the new usp10.dll file.
  6. After installation cancel the Windows warning and choose to keep the new file
  7. For MS Office, copy the usp10.dll to C:\Program Files\Common Files\Microsoft Shared\OFFICE11
  8. Restart the computer

Unreadable text with lot of a's or sequence of numbers

Symptom: The text is displayed as either െയാണെന്നു പ്രഖ്യാപിക്കുകയുഠor &# 3385;&# 3378;&# 3405;&# 3378;&# 3402;&# 3342;&# 3381;&# 3376;&# 3391;&# 3372;

Solution: Make sure the View->Encoding is Unicode(UTF-8). If it is so and the problem persists, follow these steps:

  1. Open 'notepad' by Start->Run->type 'notepad'->OK
  2. Copy and paste the unreadable text in notepad
  3. Click File->Save As
  4. In the 'Save As' window, click on Desktop
  5. Give File name test.html, Save as type All files and Encoding ANSI. Click 'Save'.
  6. On your Desktop, double click on test.html and a browser window will open up.
  7. Make sure the View->Encoding is Unicode(UTF-8)

Copy from IE to MSWord spoils the Chillu letters

This happens because the format control characters ZWJ, ZWNJ are getting stripped of the text. To solve this do:

On the MSWord Tools menu, click Options, and then click the Complex Scripts tab. Select the Add control characters in Cut and Copy check box.

Linux: Meera font is too small

Please see Suresh's blog.

Keyman is unsuable in MSWord and Excel (2003 and like versions)

നാം ടൈപ്പ് ചെയ്യുന്നതിനെ വേര്‍ഡ് അതിന്റെ സ്വന്തം നിലയ്ക്ക് രണ്ടാമതും തിരുത്താന്‍ നോക്കും. വേര്‍ഡിനുള്ളില്‍ മൈക്രോസോഫ്റ്റ് തന്നെ ചേര്‍ത്തിട്ടുള്ള, എങ്കിലും അപര്യാപ്തമായ, മലയാളം ടൈപ്പിങ്ങ് റൂളുകള്‍ ആണ് ഈ ഉപദ്രവം ചെയ്യുന്നത്. ഓപ്‌ഷന്‍സില്‍ പോയി ചില പ്രത്യേക സെറ്റിങ്ങുകള്‍ ചെയ്താല്‍ ചിലപ്പോള്‍ ഇതു മാറിക്കിട്ടാറുണ്ട്. എന്നാലും ഏതൊക്കെ സെറ്റിങ്ങുകള്‍ എന്ന് നോക്കി കണ്ടുപിടിക്കുക സാധാരണ യൂസറെ സംബന്ധിച്ചിടത്തോളം എളുപ്പമല്ല. (ഇതേ പ്രശ്നം എക്സലിലും ഉണ്ട്.)

ഒരു എളുപ്പവഴിയുള്ളത് വേറെ ഏതെങ്കിലും പ്രോഗ്രാം വിന്‍ഡോയില്‍ ടൈപ്പുചെയ്തു തയ്യാറാക്കി വേര്‍ഡിലേക്ക് കോപ്പി/പേസ്റ്റ് ചെയ്യുകയാണ്. ഒരിക്കല്‍ അങ്ങനെ പേസ്റ്റു ചെയ്ത ടെക്സ്റ്റിനെ എന്തായാലും വേര്‍ഡ് സ്വയം തിരുത്തുകയില്ല. ആവശ്യം പോലെ നമുക്ക് ഫോര്‍‌മാറ്റ് ചെയ്തെടുക്കാം.

വിന്‍ഡോസിലെ റൈറ്റ്പാഡ് പ്രോഗ്രാമും ഉപയോഗിക്കാം. അതുമല്ലെങ്കില്‍ ഇന്റര്‍‌നെറ്റ് എക്സ്പ്ലോററിലെ ഒരു ടെക്സ്റ്റ് വിന്‍‌ഡോയും പറ്റും. എങ്കിലും ഇങ്ങനെ ടൈപ്പ് ചെയ്തെടുക്കാന്‍ ഒരു യോജിച്ച പ്രോഗ്രാം മൈക്രോസോഫ്റ്റിന്റെ തന്നെ ഔട്ട്‌ലുക്ക് ആണ്. ഭാഗ്യവശാല്‍ അതില്‍ ഇത്തരം (അനഭിലഷണീയമായ) സ്മാര്‍ട്ട് റൂളുകള്‍ ഇല്ല.

ഒരു New Mail വിന്‍ഡോ തുറക്കുക. അതില്‍ കീമാന്‍ ഉപയോഗിച്ച് ടൈപ്പ് ചെയ്യുക. എന്നിട്ട് ആവശ്യം പോലെ വേര്‍ഡിലേക്ക് കോപ്പി/പേസ്റ്റു ചെയ്യുക.

Font selection and Chillu display problems in MS Word

Symptoms
  • While using Mozhi Keyman in MSWord, the Malayalam Unicode font is always selected as Kartika. Even when, the font is changed to AnjaliOldLipi through toolbar, it remains Kartika. OR
  • MS Word does not display Chillus even after adding complex script support.

Solution

Language settings
  1. go to Start > All Programs > Microsoft Office > Office Tools > Language Settings
  2. Add Malayalam also into the list of enabled languages
Use styles instead of font change
  1. Click on Format->Styles and Formatting. A right pane, listing all formatting appears.
  2. Click on the Malayalam text in Kartika. The style used will be highlighted on the right pane.
  3. Place mouse on the highligted style. A right pulldown menu will appear on the right side of the style name.
  4. Click on the pulldown menu arrow and select Modify Style
  5. Under Formatting change Kartika to AnjaliOldLipi font
  6. Change Latin to Complex Script
  7. Press OK

Keyman produces weird words

Symptom:

Text looks like: അത് വേറെ ഒരു ന്ആയയാണെന്നു കരുതി. അതിന്റെ ന്ഏര്ക്കു ക്ഉരച്ചു.

Workaround:

Reboot the PC.

Keyman does not work in Vista

Vista needs Keyman 7.1 from http://www.tavultesoft.com/70/download.php. However, that is 30 day trial version. Start installing it. Later it would ask whether you want to uninstall version 6.0 coming with the mozhi keyman package. Ask 7.1 to uninstall. However, keep the supporting files for 7.1. Now onwards Mozhi keyman which uses version 6.0 of keyman would work correctly. Details: http://urumbukadikal.blogspot.com/2009/06/blog-post_18.html#comment-5361469082037227442

എന്തുകൊണ്ടാണു Microsoft IIS 6.0 error ASP 0239 (0x80004005) തരുന്നത് ?

Active Server Pages, ASP 0239 (0x80004005)
Cannot process file
UNICODE ASP files are not supported.

Micrsosoft Knowledge Baseല്‍ നിര്‍ദേശിക്കുന്നത് IIS Unicode file നിര്‍മിക്കില്ല എന്നുതന്നെയാണെങ്കിലും, UNICODE IIS നിര്‍മിക്കാന്‍ വഴിയുണ്ട്.

  • 1) ASP ഫയലുകള്‍ UTF-8 ആയി Save ചെയ്യണം. UNICODE ആയി save ചെയ്താല്‍ പ്രവര്‍ത്തിക്കില്ല.
  • 2) ASP pageന്റെ ആദ്യത്തെ വരി ഇതായിരിക്കണം.
<%@ CodePage=65001 %>
Subpages (1): Unicode Concepts
Comments