32
கககககககககககக கககக கக கககக .கக. www.valavu.blogspot.com

A critique on tamil unicode 1

Embed Size (px)

Citation preview

Page 1: A critique on tamil unicode 1

கருத்தா�க்கம் முனைவர் இரா�ம.க�.

www.valavu.blogspot.com

Page 2: A critique on tamil unicode 1

• சி�ந்துவெவளி� எழுத்னைதா வ�லக்க�ப்பா�ர்த்தா�ல், இந்தா�யா�வ�ல்

எழுத்துத் வெதா�டங்க�யாது வெதான்புலத்தா�ல் என்றே% இற்னை%த்

வெதா�ல்லியால் நி�றுவுக�%து. [ பாத்தா�ராபா�கு வெதான்புலம் வந்தாபா�ன் க�.மு. 365/150 இல் எழுந்தா னைசி

சிமயாச் சிராசுவதா� இயாக்கத்தா�ன் பா�ன்தா�ன் வடபுலத்தா�ல் எழுத்தா�ன் முகன்னைம புரா�ந்தாது. இன்னும்

” ” அறேசி�கன் பா�ரா�ம� முதால் என்று வெசி�ல்வதா�ற் வெபா�ருளி�ல்னைல.

தாம�ழி�றேயா பா�ரா�ம�க்குஅடிப்பானைடயா�கல�ம்.]

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 2

Page 3: A critique on tamil unicode 1

• தாம�னைழித் தாம�ழி�யா�ல் எழுதா�யாவனைரா தாம�ழி�ன் வெமய்மயாக்க இயால்பா�ல்,

”அகரா/ஆக�ரா/ வெமய்களி�ன் உருவ” ஒற்றுனைம என்பாது

வெபாருஞ்சி�க்கல�ய்த் றேதா�ன்%வ�ல்னைல. மகதா- தாம�ழிக உ%வ�டல்களி�ன்தூண்டுதால�ல், வணி�கம், சிமயாம், கல்வ�, இலக்க�யாம் ஆக�யா

துனை%களி�ற் பா�கதாச் வெசி�ற்கள் தாம�ழி�வணிங்களுள் நுனைழிந்து இங்கு

புழிங்க�யா பா�ன்�ற்%�ன் இச் சி�க்கல் தாம�ழிர்க்குப் புரா�ந்தாது. [ பாடத்தா�ன்

வ�ளிக்கம்]

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 3

Page 4: A critique on tamil unicode 1

• பாட்டிப்றேபா�றேரா�லு எழுத்து முனை%னையா தாம�ழிர் ஏற்%�ருந்தா�ல்

புள்ளி�யா�ல�த் தீர்வு தாம�ழி�க்குக்க�னைடத்தா�ருக்கும். ஒன்%�ன் கீழ்

மற்வெ%�ன்று வெதா�ங்க� றேமவெலழுத்னைதா வெமய்வெயான்றும்,

கீவெழிழுத்னைதா உயா�ர்வெமய்வெயான்றுஞ் வெசி�ல்லும் வடபுலத் தீர்வும், வெமய்க்குப் புள்ளி� னைவக்கும் வெதான்புலத் தீர்வும் அடிப்பானைட

அடவ�ல் (design) றேவறுபாட்டனைவ .

• தாம�ழி� எழுத்து அபுக�ட� (abugida) எழுத்து அல்லறேவ அல்ல. அது தா�%ந்தா அனைசிகளி�ல் ஆ எழுத்து.

(open syllables.)

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 4

Page 5: A critique on tamil unicode 1

நிம்ம�டம் உயா�ர், வெமய், சி�ர்வெபாழுத்து, உயா�ர்வெமய் எ 4 வனைக எழுத்துக்களுண்டு. உயா�னைராயும்,

வெமய்னையாயும் மட்டுறேம எழுத்தா�ய்க் வெக�ள்ளுதால் தாம�ழி�லக்கணிப்பாடி சிரா�யா�ல்னைல. ஆ�லும் சி�லர்

வெக�ள்ளுக�%�ர். தாம�ழி%�ஞருக்குள் இதுபாற்%�க்குழிப்பாமுண்டு. ஆளுக்க�ள் தா�க் கருத்துச்வெசி�ல்வ�ர்.

• உயா�ர்வெமய் ஒலிப்பு: [ வெதா�ல்க�ப்பா�யாம் எழுத்தாதா�க�ராம் 17 ஆம் நூற்பா�]

புள்ளி�யா�ல்ல� எல்ல� வெமய்யும் உருவுரு வ�க� அகராறேம�டு உயா�ர்த்தாலும்

ஏனை உயா�வெரா�டு உருதா�ரா�ந்து உயா�ர்த்தாலும் ஆய் ஈரா�யால உயா�ர்த்தாவ�றே%

• கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 5

Page 6: A critique on tamil unicode 1

• ” எல்ல� வெமய்யும் அகராறேம�டு றேசிரும் றேபா�து தான்னுருவ�ல் இருந்து ம�%� புள்ளி�யா�ல� உருப்

வெபாற்று உயா�ர்க்கும்.

• ஏனை உயா�வெரா�டு றேசிரும் றேபா�து, தான்னுருவ�லிருந்து புள்ளி� வ�லக்க� உருவு

தா�ரா�ந்து றேவற்றுருப் வெபாற்று உயா�ர்க்கும்.

• இவ்வ�று இரு றேவறுபாட்ட முனை%களி�ல் தாம�ழி�ல் உயா�ர்வெமய்கள் உயா�ர்க்கும்.”

1. புள்ளி� வ�லகல்; 2. புள்ளி� வ�லக� உருத்தா�ரா�தால்

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 6

Page 7: A critique on tamil unicode 1

• உயா�ர்வெமய்க் வெக�த்து வெவறும் வெபாருக்கற் வெக�த்து(product set) மட்டுறேமயால்ல. அனைவ தா�த்தா

இருப்புக் வெக�ண்டனைவ. தாம�ழி�க்கும் வெபாரும�க்கும் இந்தாத் தா�த்தா இருப்பு வெபா�துவ�து.

•உயா�ர், வெமய், சி�ர்வெபாழுத்துக்கள், உயா�ர்வெமய் என்% நி�ல்றேவறு வெக�த்துகளும் தாம�ழி�க்

கு%�றேயாற்%த்தா�ற்குக் கட்ட�யாந் றேதானைவ. ( வெபாரும�க்குந்தா�ன்.)

• இவற்னை% மறுக்குங் கு%�றேயாற்%ம் தாம�னைழி( தாம�ழில்ல�தா மற்% வெதான்புல, வடபுலவெம�ழி�கனைளியும்) வெவளி�ப்பாடுத்தாத் தாடும�றும். ( ஒருங்கு%�றேயாற்%ம் அப்பாடிப் பாட்டதுதா�ன்.)

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 7

Page 8: A critique on tamil unicode 1

• வெமய்ப்புள்ளி�னையா வ�லக்க�, மீதும் உருவ�ல் ஒற்னை%ச்சி�றுறேக�ட்னைடறேயா�, இராட்னைடச் சி�றுறேக�டுகனைளிறேயா�,

றேமலும் கீழும் ஒட்டியும், வெதா�குத்தும், இருபாக்கம் பாராத்தா�யும் தா�ன் பாழிங்க�லத்தா�ல் உயா�ர்வெமய்கள் உணிர்த்தாப் வெபாற்%.

• க�லறேவ�ட்டத்தா�ல் இனைவ உரும�%�க் க�ல், வெக�க்க�, சுழி�க்வெக�க்க�, உகரா/ ஊக�ராக் கு%�கள், வெக�ம்பு, சி�%கு ஆக�.

• அனைவ வடிவ ம�ற்%ங்கறேளி ஒழி�யா இலக்கணிப் வெபா�ருள் வெக�ண்டனைவயால்ல; எந்தாத் தாம�ழ்

இலக்கணி நூலும் நி�%�ந்தாவனைரா இக்கு%�யீடுகனைளி வ�ளிக்க�யாதா�ல்னைல.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 8

Page 9: A critique on tamil unicode 1

•2700 ஆண்டுகளி�ல் இவ்வுருக்களுக்கு இலக்கணிஅனைடயா�ளிம�ல்னைல; “ ” உயா�ர் ம�த்தா�னைராகள் என்று

வெசி�ல்ல�ல் எந்தா இலக்கணி�யா�ரும் இவற்னை%க்கு%�க்கவ�ல்னைல.

•(There are no so-called vowel maathras recognized by the Tamil Grammer. The word vowel maathra has a different meaning in Tamil Grammer)

• இல்ல�தா தாம�ழ் இலக்கணித்னைதா ஒருங்கு%�றேயாற்%ம்வெசி�ல்லி, உயா�ர்ம�த்தா�னைராகளுக்குத் தா�யா�ருப்பும்,

அனைடயா�ளிமும் வெக�டுக்க�%து. இதா�ல் ஏற்பாடும் சி�க்கல்கள் ம�க ம�கப் பால.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 9

Page 10: A critique on tamil unicode 1

• கணி�தாத்தா�ல் பாதா�ன்ம எண்ம�த்தா�ற்கு 0, 1, 2, 3, 4, 5, 6,7,8,9 ஆக�யானைவ எப்பாடி அடிம�ங்கறேளி�, அறேதா றேபா�ல

தாம�ழ் எழுத்துகளுக்கு உயா�ரும், வெமய்யுறேமஅடிம�ங்களி�கும்.

• அகராறேம%�யா வெமய்களும், உயா�ர்ம�த்தா�னைராகளும் தாம�ழ் எழுத்துக்களுக்கு எக்க�லத்தும் அடிம�ங்களில்ல.

( அப்பாடிச் வெசிய்வது முற்%�லும் மூடத்தாம�கும்.)

• அறேதாவெபா�ழுது அடிம�ங்களி�ன் வெபாருக்கலில் உருவ� உயா�ர்வெமய்களி�ன் இருப்னைபா மறுப்பாதும் சிரா�யால்ல.

எழுத்வெதாளி�னைம கருதா� அவற்னை% ஏற்பாறேதாஅ%�வுனைடனைமயா�ம்.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 10

Page 11: A critique on tamil unicode 1

• க் (1/2 ம�)+ ஆ (2 ம�) = க� (2 ம�) + ½ ம�(ஆற்%ல்)• ” ” இதுறேவ�ர் ஆற்%ல் வெவளி�யுறும் றேவதா�வ�னைறேபா�ன்%து. தாம�ழி�ல் ஒவ்வெவ�ர் உயா�ர்வெமய் ஒலிப்புச்

றேசிர்க்னைகயும் இழுனைச் வெசிலுத்தாம் (linear process) அல்ல. இழு�ச் வெசிலுத்தாம�கும் (non-linear process).

•” ” வெமய்யா�ன் வழி�யாது உயா�ர்றேதா�ன்றும் நி�னைலறேயா எனும் வெதா�ல்க�ப்பா�யா எழுத்தாதா�க�ராம் 18 ஆம் நூற்பா�வுக்கு ,

“ வெமய்யும் உயா�ரும் முன்னும் பா�ன்னும் வெபா%நி�ற்குவெமன்%னைமயா�ன், அக்கூட்டம் பா�லும் நீரும் றேபா�ல

உடன் கலந்தாதான்%�, வ�ரால்நு�கள் தானைலப்வெபாய்தா�ற் ” றேபா�ல றேவறுநி�ன்று கலந்தாவல்ல என்பாது வெபாறுதும்

என்றுனைராப்பா�ர் உனைராயா�சி�ரா�யார் இளிம்பூராணிர். •”

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 11

Page 12: A critique on tamil unicode 1

•” ’ இதா�றே ம�த்தா�னைரா வெக�ள்ளுங்க�ல் உப்பும் ’ நீரும் றேபா�ல ஒன்றே%யா�ய் நி�ற்%லும்,

‘ றேவறுபாடுத்துக் க�ணுங்க�ல் வ�ராலும் வ�ராலுஞ் றேசிரா ’ நி�ன்%�ற் றேபா�ல றேவ%�ய் நி�ற்%லும் வெபாற்%�ம். நீர்

உப்பா�ன் குணிறேம ஆயாவ�று றேபா�ல, உயா�ரும் வெமய்யா�ன் குணிறேமயா�ய் வன்னைம, வெமன்னைம, ” இனைடனைம எய்தா� நி�ற்%ல் வெக�ள்க என்பா�ர்

நிச்சி��ர்க்க��யார். அடிம�ஞ் சிரா�யா�ல� ஒருங்கு%� இனைதா எப்வெபா�ழுது உணிரும்?

•Wrong bases ( பா�னைழி அடிம�ங்கள்) would never allow advanced word processing functions. Purpose of encoding is not only to show characters on a computer screen but to carry out word processing including morphological analysis.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 12

Page 13: A critique on tamil unicode 1

•சிரா�, ( ஒருங்கு%�யா�ருக்கு வ�ளிங்கும்பாடி) உறேரா�மன் எழுத்தா�ற்குப் பா�னைழி அடிம�ம் ஒன்னை%க் கற்பானையா�ற் வெசிய்து பா�ர்ப்றேபா�ம�?

•uniscribe என்% எந்தா�ராத்னைதா (engine) னைவத்து அகராறேம%�யா வெமய்றேயா�டு உயா�ர்ம�த்தா�னைராகனைளி ஓட்டி

தாம�ழ் உயா�ர்வெமய் எழுத்துக்கனைளி கணி�த்தா�னைராயா�ல், அச்சி�யா�ல், னைமக்றேரா�சி�வ்ட் உருவ�க்குக�%து. [ இது

றேபா�ல றேவறு எந்தா�ராங்கனைளிக் வெக�ண்டு மற்% நி�றுவங்களும் வெசிய்யாக் கூடும்.]

• இறேதா முனை%னையா உறேரா�மனுக்கும் வெசிய்துபா�ர்க்கல�றேம?

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 13

Page 14: A critique on tamil unicode 1

• ஒரு o (a, b, d, g, o, p, q) , ஒரு v (v, w, y) இன்னும் சி�ல வடிவங்கனைளி உறேரா�மன் அடிம�ம�கக்

வெக�ண்டு, தாம�ழி�ல் வரும் உயா�ர்ம�த்தா�னைராகள் றேபா�ல் துனைணிக் கு%�யீடுகள் உருவ�க்க� , uniscribe மூலம்

இவற்னை%ப் வெபா�ருத்தா�, கணி�த்தா�னைராயா�ல்உருவ�க்கல�றேம? ஏன் ஒருங்கு%�யா�ர்வெசிய்யா�தா�ருக்க�%�ர்? உறேரா�மனுக்கு ஓர் அடிப்பானைட,

இந்தா�யா வெம�ழி�களுக்கு றேவறே%�ர் அடிப்பானைடயா�? ஏன்ஓராவஞ்சினை? • • உறேரா�மன் எழுத்தா�ன் அடிப்பானைடனையா alphabet என்று

னைவத்தா�ருப்பாதா�ல் எந்தாச் வெசி�ற்வெசியாலியும் எளி�தா�ற் இயாங்க முடிக�%து. இல்னைலவெயா�ல் எளி�னைம

இயாலுறேம�? தாம�ழி�க்கு மட்டும் abugida என்% பா�னைழியாடிப்பானைடனையா ஏன் தாருக�%�ர்?

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 14

Page 15: A critique on tamil unicode 1

13/04/23 கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 15

• இன்வெ�ரு வனைகயா�ற் வெசி�ன்�ல், வெபா�துவ�க ஒருங்கு%�யா�ல் எந்தாத்

தாம�வெழிழுத்தும் 2 புனைட (byte) / 32 மனைடத் (bits) வெதா�குதா�யா�கறேவ வெக�ள்ளிப் பாடுக�%து.

•2 புனைடத் வெதா�குதா�யா�ல் ஒழுங்க� வெதா�குதா�, ஒழுங்க�ல�த் வெதா�குதா� எப் பா�ரா�த்து, ஏற்க இயால�தானைவ எனைவ? எக் கணி�க்கு நி�ரால்வழி�றேயா வெசி�ல்லறேவண்டும்.

• – இதாற்க�க வ�தா�வ�லக்குப் பாட்டியால் table of exceptions – இன்%�யானைமயா�த் றேதானைவ.

Page 16: A critique on tamil unicode 1

13/04/23 கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 16

• ஆவணிம�க்கும் நி�ராறேல�, றேசினைவ வழிங்குநிறேரா� இப்பாட்டியானைல ஒழுங்க�கச்

வெசிய்யா� வ�ட்ட�ல் கட்டகங்கள் (systems) தா�ண்டியா ஆவணி ம�ற்%த்தா�ல்

தாம�வெழிழுத்துக்கள் தாப்பும் தாவறும�ய்” ” ஈ வெயா இளி�க்கும்.

• இப்வெபா�ழுது 3.4 றேசினைவயார் (servers) தா�ண்டி�றேல, தாம�ழி�ல் எழுத்துக்கள்

ஒடிந்துறேபா�வது க�ட்டத்தாட்ட வழிக்கம�து. (வெக�ம்புகளும், க�ல்களும் பா�ழிழ்வது

எத்தானைவெயாத்தானை ஆவணிங்களி�ல்நிடக்க�%து, வெதாரா�யும�?)

• கு%�ப்பா�க 2,3 கு%�றேயாற்%ங்கள் ம�%� ஒருங்கு%�க்கு வந்தா�ல், பா�னைழிகள் றேமலும்

ம�குந்து றேபா�க�ன்%.

Page 17: A critique on tamil unicode 1

13/04/23 கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 17

• பாடியா�ற்% நி�ரானைலத் (application programme) தாவவெ%ன்று வெசி�ல்லி கு%�றேயாற்%ப் பா�னைழியா�ல்

இருந்து தாப்பா�ப்பாறேதா ஒருங்கு%�யா�ளிரா�ன் பாழிக்கம�ய்ப் றேபா�து. [They keep saying that

this is application fault and not the inadequacy of unicode.] ” ஆடத்வெதாரா�யா�தா

” ஆடல்மகள் வெதாருக்றேக�ணில் என்%�ளி�ம்.

• முதாற் றேக�ணில் முற்றுங் றேக�ணில். எழுத்துக்கனைளி உனைடத்து கு%�றேயாற்%ம்

வெசிய்தாறேதா ஒருங்கு%�யா�ன் முதாற்றேக�ணில்ஆகும். ஒருங்கு%� வெசிய்றேதா�ர், ஆதாரா�ப்றேபா�ர்,

இனைதா உணிரா மறுக்க�%�ர்கள்.

Page 18: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 18

Use of “Find and Replace ( அவன் என்பனைத இவன் என்றுமி�ற்று)” in the same word processor [here Microsoft Word 2007] gives different results for two different script encodings.

இவன் Ivan

அவனைனி Ivanai

அவசெனி�டு, அவனுடன், அவனி�ல்

Ivanotu, Ivanutan, Ivanaal

அவனுக்கு Ivanukku

அவனி�ன் Ivanin

அவனிது Ivanathu

Two different problems of “find and replace” – one without the need for grammer intervention (pure veeRRumai induced changes) and the second with the need for grammer intervention (aththu – caariyai)

Page 19: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 19

• ஒரு தாம�ழி�வணித்தா�ல், எழுதுறேவ�ரா�ன் உகப்பா�ற்குத் தாக்கச் சி�லறேபா�து றேதானைவப்

பாட்டும், சி�லறேபா�து வ�லக்க�யும் எழுத்துப் புணிர்ச்சி� அனைமயும்.

• எல்ல�ச் வெசி�ற் வெசியாலிகளும் இனைதாத் தா�%ம்பாடச் வெசிய்யா றேவண்டும்.

• இலக்கணிவழி� உணிராப்பாடும் புணிர்ச்சி�கள் இங்கு றேபாசிப்பாடவ�ல்னைல. அவற்னை%ப்

வெபா�துவ� வெசி�ற்வெசியாலிகள் னைகயா�ளி இயால�து தா�ன்.

• இதாற்குக் கு%�றேயாற்%ம் உதாவ றேவண்டும்.

Page 20: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 20

• கு%�ப்பா�ட்ட உயா�ர்வெமய்யுள் என் உயா�ர்இருக்க�%து, என் வெமய் இருக்க�%து

என்பானைதாத் தாராப்பாடுத்தாப் பாட்ட வெசிய்முனை%யா�ல் சிட்வெடன்று க�ணும் தா�%ன் எந்தாக்

கு%�றேயாற்%த்தா�ற்கும் இருக்கறேவண்டும்.

• ஒரு கு%�றேயாற்%த்தா�ற்கு இது இல்னைலறேயால், வெசி�ற்வெசியாலியா�ன் பாயான்பா�ட்டுத் தா�%ன்

வெபாரா�தும் குனை%யும். இன்னை%க்கு இருக்கும் ஒருங்கு%�றேயாற்%த்தா�ல் அத் தா�%�ல்னைல.

• ஏவெ�ல் அது அகராறேம%�யா வெமய்னையாயும், உயா�ர் ம�த்தா�னைராகனைளியும் உயா�ர்வெமய்க்

கூறுகளி�கக் கருதுக�%து.

Page 21: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 21

• தாம�னைழிக் னைகயா�ளும் றேபா�து, புணிர்ச்சி�னையாத் தான்�யால்பா�ய்க் வெக�ள்ளும் கு%�றேயாற்%றேம

நில்ல கு%�றேயாற்%ம�கும்.

• ஒருங்கு%�றேயாற்%ம் தாம�ழ்ப் புணிர்ச்சி�னையா ஒழுங்க�ய்க் னைகயா�ளிவ�ல்னைல.

• புணிர்ச்சி� பாழிக�தா கு%�றேயாற்%ம் றேதாடி ம�ற்றும்சி�க்கனைலயும், (search and replace problem)

வரா�னைசிவெயா�ழுங்குச் சி�க்கனைலயும் (row order problem) சிரா�யா�ய்க் னைகயா�ளி�து.

Page 22: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 22

• ஒவ்றேவ�ர் ஆவணித்தா�ன் புள்ளி� வ�வராங்களி�ல் வரா�னைசிவெயா�ழுங்கும் ஒன்%�கும்.

அகராமுதாலிகள் மட்டும�ன்%�, எத்தானைறேயா� ஆவணிங்களி�ல் அத்றேதானைவ உருவ�கும்.

•ஒருங்கு%�றேயாற்%ம், தாம�ழி� எழுத்னைதா அதான்

வரா�னைசிப்பாடி கு%�றேயாற்%வ�ல்னைல.

•” இந்தா�யா வெம�ழி�களி�ல் எழுத்துப் வெபாயார்ப்னைபா ” எளி�தா�ற் வெசிய்யால�ம் என்% கருதுறேக�ளி�ல்

ஆங்க�ங்கு இனைடவெவளி� வ�ட்டுக் கு%�றேயாற்% வரா�னைசினையாச் வெசிய்து, பா�ன்�ல், “ ” அணி�முனை%

எ collation order - னையாப் பாரா�ந்துனைராத்து ஒருங்கு%�றேயாற்%ம் தாடும�றுக�%து. இது

தும்னைபா வ�ட்டு வ�னைலப் பா�டிக்கும் வெசியால�கும்.

Page 23: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 23

• இதா�ல் நி�ரால் எழுதுவது சி�க்கல�க�ப் றேபா�ய், குழிப்பாங்கனைளித் தீர்ப்பாதாற்கு வரா�னைசிவெயா�ழுங்கு

முனை% ஏற்பாட்டு பாலக்க�யா முனை%கனைளி (complex methods) இப்வெபா�ழுது நி�டுக�றே%�ம்.

• எளி�யாமுனை%யா�ல் தாம�ழுக்கு மட்டும் கு%�றேயாற்%ம் வெசிய்தா�ருந்தா�ல் இக் குழிப்பாங்கள்

குனை%ந்தா�ருக்கும். அடிப்பானைடயா� றேதாடி ம�ற்றும்சி�க்கலுக்கும், வரா�னைசிவெயா�ழுங்குச் சி�க்கலுக்கும்

கூட uniscribe உள்வந்து றேவனைலவெசிய்யாறேவண்டும��ல், அந்தாக் கு%�றேயாற்%ம்

ஒரு குனை%ப்பாட்ட கு%�றேயாற்%ம் தா�ன்.

• தாம�ழ் ஒருங்கு%�யா�ல் இருக்கும் சி�ல இனைடவெவளி�களி�ல் இது தா�ன் சி�க்வெகன்று

றேமலும் பால க�ராந்தா எழுத்துக்கனைளி நுனைழிக்கவும் சி�லர் முயாலுக�%�ர்.

Page 24: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 24

• மற்% இந்தா�யா வெம�ழி�களி�ல் நிகரா� எழுத்னைதா ஆளும் றேபா�து ஓவெராழுத்து ஓவெரா�லி. Sound of a Nagari character = function of (Shape of the character). ஒன்%�ற்கு ஒன்று எனும் வெபா�ருத்தாம் வெக�ண்டது.

•தாம� ழி�ல் தாம�ழி� எழுத்னைதா ஆளும் றேபா�து, ஓவெராழுத்துப் பால்வெல�லி. அந்தா எழுத்து வெசி�ல்லில் வரும் இடத்னைதாயும்,

அண்னைமவெயா�லிகனைளியும் வெபா�றுத்து கு%�ப்பா�ட எழுத்தா�ன் ஒலி ம�றும்.

•Sound of a Tamizi character = function of (Shape of the character, the place of occurrence in a word, nearby sounds). ஒன்%�ற்குப் பால என்னும் வெபா�ருத்தாம் வெக�ண்டது.

Page 25: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 25

•நிகரா�/சிங்கதாம் றேபா�ன்% கட்டகங்களி�ன் (systems) அடிப்பானைட தாம�ழி�/தாம�ழ் றேபா�ன்% கட்டகங்களி�ன் அடிப்பானைடயா�லிருந்து முற்%�லும் றேவறுபாட்டது.

• எழுத்துப் வெபாயார்ப்பு றேவண்டுறேவ�ர் ஒருங்கு%�றேயாற்%த்தா�ன் மூலம், நிகரா�/சிங்கதாக்

கட்டகத்னைதாத் தாம�ழி�/தாம�ழ் கட்டகத்துள் புகுத்தா நி�னைக்க�%�ர். இது வட்டத்னைதாச் சிதுராம�க்கும் முயாற்சி�.

•There cannot be a common encoding for all Indian scripts. There have to be at least two different encodings meeting respective requirements of Tamil and those of non-Tamil.

Page 26: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 26

• மற்% இந்தா�யா வெம�ழி�களி�லிருந்து தாம�ழுக்கு எழுத்துப் வெபாயார்ப்புச் வெசிய்யால�ம். many to one

என்பாதா�ல் இது எளி�து.

• ஆ�ற் தாம�ழி�லிருந்து மற்% வெம�ழி�களுக்கு எழுத்துப் வெபாயார்ப்பு வெசிய்வது one to many என்பாதா�ற் வெபாருஞ்சி�க்கல்.

• இந்தாச் சி�க்கல�ல், தாம�ழ்க் கு%�றேயாற்%த்தா�ற்கு எழுத்துப் வெபாயார்ப்பு என்பானைதாக் கு%�க்றேக�ளி�ய்

வெக�ள்ளிறேவண்டியா றேதானைவறேயாயா�ல்னைல.

• குமளி�ப் (apple) பாழித்னைதாயும், நி�ராங்னைகப்(orange) பாழித்னைதாயும் ஒன்றே%�வெட�ன்று

ஒப்பா�டுவதா�ற் வெபா�ருளி�ல்னைல. இராண்டும் வெவவ்றேவறு சுனைவ; வெவவ்றேவறு வளிர்ச்சி�

Page 27: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 27

• ஒருங்கு%�றேயாற்%க் குனை%கனைளிப் வெபாரா�தும் உணிர்ந்து ஒரு ம�ற்றுப் பாரா�ந்துனைராயா�க 10

ஆண்டுகள் முன்றே தாம�ழ் அனைத்வெதாழுத்துக் கு%�றேயாற்%ம் [Tamil All

Character Encoding - TACE] எடுத்துனைராக்கப்பாட்டது.

• அப் பாரா�ந்துனைரா, க�ணிற்%�ல் வீழ்ந்தா கல் றேபா�ற் பாரா�ந்துனைரா வெபாற்%வரா�டறேம வெசியாற்பா�டு ஏதும�ன்%� வீறேணி க�டக்க�%து.

• இற்னை% நி�னைலயா�ல் ஒருங்கு%�யும், தாம�ழ் அனைத்வெதாழுத்துக் கு%�றேயாற்%மும்

அருகருறேக இனைணிப்பா�கச் வெசியாற்பாட முடியும்.

Page 28: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 28

• ஆ�ல் இதுவனைரா வந்தா தாம�ழிக ஆறேல�சிகர் யா�ருறேம எம்முடிவும் தாரா�து, மீண்டும் மீண்டும்

புதுப்புதுக் குழுக்கனைளிப் புனைவ�த்து வெவற்%லசிலிறேல வெபாருங்க�லந் தாள்ளி��ர்.

”ஏன்?” என்று தா�ன் யா�ருக்கும்புரா�யாவ�ல்னைல.

• அதாற்குள் ஒருங்கு%�ச் றேசிர்த்தா�யாத்தா�ல் வெவற்றுவெவளி�க் கு%�ப்புள்ளி�கள் (blank code

points) குனை%ந்து றேபா�யா�. ” நீங்கள் என்தூங்க�னீர்களி�?” என்று அவர் றேகட்ட�ரா�ம்.

• இப்பாடி எந் நிடவடிக்னைகயும் எடுக்க�து தாம�ழிக அராசு வெவறுறேம இருப்பாதும், வீண் ஆனைணிகள்

பா�%ப்பா�ப்பாதும் நிமக்கு வ�ளிங்கவ�ல்னைல. [Tamil IT Policy என்பாறேதா இல்ல�தா தாம�ழிக

அராசு என் வெசிய்யும் என்று வெசி�ல்லுங்கள்?]

Page 29: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 29

• ஒருங்கு%�ச் றேசிர்த்தா�யாத்தா�ன் நி�னைலப்புக் வெக�ள்னைக (stability policy), தாம�ழிக அராசி�ன்

வெசியாலின்னைம, உத்தாமம் றேபா�ன்% அனைமப்புக்களி�ன் இம்புரா�யா�த் தாயாக்கம்,

தாம�னைழிப் பாயான்பாடுத்தும் ம�னைடயாக்க�ரார்(media), பாதா�ப்பாகத்தா�ர் (publishing houses)

ஆக�றேயா�ரா�ன் வெமத்தாம் எப் பாலவும் நிமக்குவ�ளிங்கவ�ல்னைல.

•” ஒருபாக்கம் ஒருங்கு%� இருந்துவ�ட்டுப்றேபா�கட்டும்; இன்வெ�ரு பாக்கம் இராண்ட�ம்

தாராம�க TACE னையா ஏன் ஏற்கக் கூட�து?” – என்று கூடப் பாலரும் சி�ந்தா�க்க மறுக்க�%�ர்.

தானைடகள் றேபா�டப்பாடுவதும், சுணிக்கம் ஏற்பாடுத்துவதும் ஏன்? ஒருங்கு%�யா�ர் ஒப்புதால்

இன்னும் க�னைடயா�தா�ருப்பாது ஏன்?

Page 30: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்

30

1.The present Unicode is very good in document transfer across computers, networks (internal and external), and through internet. This is mainly because of the excellent support by the providers of browser service, e-mail service and local internet service.

2.Publishing software providers do not find money in providing support to Unicode, when the language script is other than the alphabet based. In essence, They are providing support to only Roman Script based languages. They won't appear to support Indic Scripts even in future. This may not happen even for another 5 to 10 years.

3.With the present Unicode, all Indic script handlers have to spend atleast three times the cost a Roman script handler has to spend on sending any short message through networks (whether mobile or internet). Mobile messaging is a major market waiting to be explored. Using Unicode, Indic script handlers are going to be permanently handicapped due to cost factors.

Page 31: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 31

1.If TACE is used, publishing software providers do not have to provide any additional support . The present versions can straight away be used for Indic Script publishing.

2.Absolutely, there is no support for TACE from the providers of browser service, e-mail service and local service. For example, if I write a mail in TACE encoding, hotmail, yahoo groups, google groups, rediffmail or even VSNL do not support. So even if the sender and receiver have TACE fonts installed in their computers, there is no guarantee that the mail will go undistorted  and the receiver read it properly. There could garbling in-between.

3.If these service providers provide support, then any messaging thru’ TACE will be similar to that of Roman script message. The costs will be similar. You would compare apple to an apple.  

 

Page 32: A critique on tamil unicode 1

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்

32

ஒருங்குறி'ப் பூனைனிக்கு

யா�ர் மிணி�

கட்டுவ�ர்கள்? தமி�செழலி

ஓடிக்செக�ண்டேட இருக்க டேவண்டுமி�?