A critique on tamil unicode 1

Preview:

Citation preview

கருத்தா�க்கம் முனைவர் இரா�ம.க�.

www.valavu.blogspot.com

• சி�ந்துவெவளி� எழுத்னைதா வ�லக்க�ப்பா�ர்த்தா�ல், இந்தா�யா�வ�ல்

எழுத்துத் வெதா�டங்க�யாது வெதான்புலத்தா�ல் என்றே% இற்னை%த்

வெதா�ல்லியால் நி�றுவுக�%து. [ பாத்தா�ராபா�கு வெதான்புலம் வந்தாபா�ன் க�.மு. 365/150 இல் எழுந்தா னைசி

சிமயாச் சிராசுவதா� இயாக்கத்தா�ன் பா�ன்தா�ன் வடபுலத்தா�ல் எழுத்தா�ன் முகன்னைம புரா�ந்தாது. இன்னும்

” ” அறேசி�கன் பா�ரா�ம� முதால் என்று வெசி�ல்வதா�ற் வெபா�ருளி�ல்னைல.

தாம�ழி�றேயா பா�ரா�ம�க்குஅடிப்பானைடயா�கல�ம்.]

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 2

• தாம�னைழித் தாம�ழி�யா�ல் எழுதா�யாவனைரா தாம�ழி�ன் வெமய்மயாக்க இயால்பா�ல்,

”அகரா/ஆக�ரா/ வெமய்களி�ன் உருவ” ஒற்றுனைம என்பாது

வெபாருஞ்சி�க்கல�ய்த் றேதா�ன்%வ�ல்னைல. மகதா- தாம�ழிக உ%வ�டல்களி�ன்தூண்டுதால�ல், வணி�கம், சிமயாம், கல்வ�, இலக்க�யாம் ஆக�யா

துனை%களி�ற் பா�கதாச் வெசி�ற்கள் தாம�ழி�வணிங்களுள் நுனைழிந்து இங்கு

புழிங்க�யா பா�ன்�ற்%�ன் இச் சி�க்கல் தாம�ழிர்க்குப் புரா�ந்தாது. [ பாடத்தா�ன்

வ�ளிக்கம்]

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 3

• பாட்டிப்றேபா�றேரா�லு எழுத்து முனை%னையா தாம�ழிர் ஏற்%�ருந்தா�ல்

புள்ளி�யா�ல�த் தீர்வு தாம�ழி�க்குக்க�னைடத்தா�ருக்கும். ஒன்%�ன் கீழ்

மற்வெ%�ன்று வெதா�ங்க� றேமவெலழுத்னைதா வெமய்வெயான்றும்,

கீவெழிழுத்னைதா உயா�ர்வெமய்வெயான்றுஞ் வெசி�ல்லும் வடபுலத் தீர்வும், வெமய்க்குப் புள்ளி� னைவக்கும் வெதான்புலத் தீர்வும் அடிப்பானைட

அடவ�ல் (design) றேவறுபாட்டனைவ .

• தாம�ழி� எழுத்து அபுக�ட� (abugida) எழுத்து அல்லறேவ அல்ல. அது தா�%ந்தா அனைசிகளி�ல் ஆ எழுத்து.

(open syllables.)

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 4

நிம்ம�டம் உயா�ர், வெமய், சி�ர்வெபாழுத்து, உயா�ர்வெமய் எ 4 வனைக எழுத்துக்களுண்டு. உயா�னைராயும்,

வெமய்னையாயும் மட்டுறேம எழுத்தா�ய்க் வெக�ள்ளுதால் தாம�ழி�லக்கணிப்பாடி சிரா�யா�ல்னைல. ஆ�லும் சி�லர்

வெக�ள்ளுக�%�ர். தாம�ழி%�ஞருக்குள் இதுபாற்%�க்குழிப்பாமுண்டு. ஆளுக்க�ள் தா�க் கருத்துச்வெசி�ல்வ�ர்.

• உயா�ர்வெமய் ஒலிப்பு: [ வெதா�ல்க�ப்பா�யாம் எழுத்தாதா�க�ராம் 17 ஆம் நூற்பா�]

புள்ளி�யா�ல்ல� எல்ல� வெமய்யும் உருவுரு வ�க� அகராறேம�டு உயா�ர்த்தாலும்

ஏனை உயா�வெரா�டு உருதா�ரா�ந்து உயா�ர்த்தாலும் ஆய் ஈரா�யால உயா�ர்த்தாவ�றே%

• கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 5

• ” எல்ல� வெமய்யும் அகராறேம�டு றேசிரும் றேபா�து தான்னுருவ�ல் இருந்து ம�%� புள்ளி�யா�ல� உருப்

வெபாற்று உயா�ர்க்கும்.

• ஏனை உயா�வெரா�டு றேசிரும் றேபா�து, தான்னுருவ�லிருந்து புள்ளி� வ�லக்க� உருவு

தா�ரா�ந்து றேவற்றுருப் வெபாற்று உயா�ர்க்கும்.

• இவ்வ�று இரு றேவறுபாட்ட முனை%களி�ல் தாம�ழி�ல் உயா�ர்வெமய்கள் உயா�ர்க்கும்.”

1. புள்ளி� வ�லகல்; 2. புள்ளி� வ�லக� உருத்தா�ரா�தால்

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 6

• உயா�ர்வெமய்க் வெக�த்து வெவறும் வெபாருக்கற் வெக�த்து(product set) மட்டுறேமயால்ல. அனைவ தா�த்தா

இருப்புக் வெக�ண்டனைவ. தாம�ழி�க்கும் வெபாரும�க்கும் இந்தாத் தா�த்தா இருப்பு வெபா�துவ�து.

•உயா�ர், வெமய், சி�ர்வெபாழுத்துக்கள், உயா�ர்வெமய் என்% நி�ல்றேவறு வெக�த்துகளும் தாம�ழி�க்

கு%�றேயாற்%த்தா�ற்குக் கட்ட�யாந் றேதானைவ. ( வெபாரும�க்குந்தா�ன்.)

• இவற்னை% மறுக்குங் கு%�றேயாற்%ம் தாம�னைழி( தாம�ழில்ல�தா மற்% வெதான்புல, வடபுலவெம�ழி�கனைளியும்) வெவளி�ப்பாடுத்தாத் தாடும�றும். ( ஒருங்கு%�றேயாற்%ம் அப்பாடிப் பாட்டதுதா�ன்.)

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 7

• வெமய்ப்புள்ளி�னையா வ�லக்க�, மீதும் உருவ�ல் ஒற்னை%ச்சி�றுறேக�ட்னைடறேயா�, இராட்னைடச் சி�றுறேக�டுகனைளிறேயா�,

றேமலும் கீழும் ஒட்டியும், வெதா�குத்தும், இருபாக்கம் பாராத்தா�யும் தா�ன் பாழிங்க�லத்தா�ல் உயா�ர்வெமய்கள் உணிர்த்தாப் வெபாற்%.

• க�லறேவ�ட்டத்தா�ல் இனைவ உரும�%�க் க�ல், வெக�க்க�, சுழி�க்வெக�க்க�, உகரா/ ஊக�ராக் கு%�கள், வெக�ம்பு, சி�%கு ஆக�.

• அனைவ வடிவ ம�ற்%ங்கறேளி ஒழி�யா இலக்கணிப் வெபா�ருள் வெக�ண்டனைவயால்ல; எந்தாத் தாம�ழ்

இலக்கணி நூலும் நி�%�ந்தாவனைரா இக்கு%�யீடுகனைளி வ�ளிக்க�யாதா�ல்னைல.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 8

•2700 ஆண்டுகளி�ல் இவ்வுருக்களுக்கு இலக்கணிஅனைடயா�ளிம�ல்னைல; “ ” உயா�ர் ம�த்தா�னைராகள் என்று

வெசி�ல்ல�ல் எந்தா இலக்கணி�யா�ரும் இவற்னை%க்கு%�க்கவ�ல்னைல.

•(There are no so-called vowel maathras recognized by the Tamil Grammer. The word vowel maathra has a different meaning in Tamil Grammer)

• இல்ல�தா தாம�ழ் இலக்கணித்னைதா ஒருங்கு%�றேயாற்%ம்வெசி�ல்லி, உயா�ர்ம�த்தா�னைராகளுக்குத் தா�யா�ருப்பும்,

அனைடயா�ளிமும் வெக�டுக்க�%து. இதா�ல் ஏற்பாடும் சி�க்கல்கள் ம�க ம�கப் பால.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 9

• கணி�தாத்தா�ல் பாதா�ன்ம எண்ம�த்தா�ற்கு 0, 1, 2, 3, 4, 5, 6,7,8,9 ஆக�யானைவ எப்பாடி அடிம�ங்கறேளி�, அறேதா றேபா�ல

தாம�ழ் எழுத்துகளுக்கு உயா�ரும், வெமய்யுறேமஅடிம�ங்களி�கும்.

• அகராறேம%�யா வெமய்களும், உயா�ர்ம�த்தா�னைராகளும் தாம�ழ் எழுத்துக்களுக்கு எக்க�லத்தும் அடிம�ங்களில்ல.

( அப்பாடிச் வெசிய்வது முற்%�லும் மூடத்தாம�கும்.)

• அறேதாவெபா�ழுது அடிம�ங்களி�ன் வெபாருக்கலில் உருவ� உயா�ர்வெமய்களி�ன் இருப்னைபா மறுப்பாதும் சிரா�யால்ல.

எழுத்வெதாளி�னைம கருதா� அவற்னை% ஏற்பாறேதாஅ%�வுனைடனைமயா�ம்.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 10

• க் (1/2 ம�)+ ஆ (2 ம�) = க� (2 ம�) + ½ ம�(ஆற்%ல்)• ” ” இதுறேவ�ர் ஆற்%ல் வெவளி�யுறும் றேவதா�வ�னைறேபா�ன்%து. தாம�ழி�ல் ஒவ்வெவ�ர் உயா�ர்வெமய் ஒலிப்புச்

றேசிர்க்னைகயும் இழுனைச் வெசிலுத்தாம் (linear process) அல்ல. இழு�ச் வெசிலுத்தாம�கும் (non-linear process).

•” ” வெமய்யா�ன் வழி�யாது உயா�ர்றேதா�ன்றும் நி�னைலறேயா எனும் வெதா�ல்க�ப்பா�யா எழுத்தாதா�க�ராம் 18 ஆம் நூற்பா�வுக்கு ,

“ வெமய்யும் உயா�ரும் முன்னும் பா�ன்னும் வெபா%நி�ற்குவெமன்%னைமயா�ன், அக்கூட்டம் பா�லும் நீரும் றேபா�ல

உடன் கலந்தாதான்%�, வ�ரால்நு�கள் தானைலப்வெபாய்தா�ற் ” றேபா�ல றேவறுநி�ன்று கலந்தாவல்ல என்பாது வெபாறுதும்

என்றுனைராப்பா�ர் உனைராயா�சி�ரா�யார் இளிம்பூராணிர். •”

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 11

•” ’ இதா�றே ம�த்தா�னைரா வெக�ள்ளுங்க�ல் உப்பும் ’ நீரும் றேபா�ல ஒன்றே%யா�ய் நி�ற்%லும்,

‘ றேவறுபாடுத்துக் க�ணுங்க�ல் வ�ராலும் வ�ராலுஞ் றேசிரா ’ நி�ன்%�ற் றேபா�ல றேவ%�ய் நி�ற்%லும் வெபாற்%�ம். நீர்

உப்பா�ன் குணிறேம ஆயாவ�று றேபா�ல, உயா�ரும் வெமய்யா�ன் குணிறேமயா�ய் வன்னைம, வெமன்னைம, ” இனைடனைம எய்தா� நி�ற்%ல் வெக�ள்க என்பா�ர்

நிச்சி��ர்க்க��யார். அடிம�ஞ் சிரா�யா�ல� ஒருங்கு%� இனைதா எப்வெபா�ழுது உணிரும்?

•Wrong bases ( பா�னைழி அடிம�ங்கள்) would never allow advanced word processing functions. Purpose of encoding is not only to show characters on a computer screen but to carry out word processing including morphological analysis.

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்13/04/23 12

•சிரா�, ( ஒருங்கு%�யா�ருக்கு வ�ளிங்கும்பாடி) உறேரா�மன் எழுத்தா�ற்குப் பா�னைழி அடிம�ம் ஒன்னை%க் கற்பானையா�ற் வெசிய்து பா�ர்ப்றேபா�ம�?

•uniscribe என்% எந்தா�ராத்னைதா (engine) னைவத்து அகராறேம%�யா வெமய்றேயா�டு உயா�ர்ம�த்தா�னைராகனைளி ஓட்டி

தாம�ழ் உயா�ர்வெமய் எழுத்துக்கனைளி கணி�த்தா�னைராயா�ல், அச்சி�யா�ல், னைமக்றேரா�சி�வ்ட் உருவ�க்குக�%து. [ இது

றேபா�ல றேவறு எந்தா�ராங்கனைளிக் வெக�ண்டு மற்% நி�றுவங்களும் வெசிய்யாக் கூடும்.]

• இறேதா முனை%னையா உறேரா�மனுக்கும் வெசிய்துபா�ர்க்கல�றேம?

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 13

• ஒரு o (a, b, d, g, o, p, q) , ஒரு v (v, w, y) இன்னும் சி�ல வடிவங்கனைளி உறேரா�மன் அடிம�ம�கக்

வெக�ண்டு, தாம�ழி�ல் வரும் உயா�ர்ம�த்தா�னைராகள் றேபா�ல் துனைணிக் கு%�யீடுகள் உருவ�க்க� , uniscribe மூலம்

இவற்னை%ப் வெபா�ருத்தா�, கணி�த்தா�னைராயா�ல்உருவ�க்கல�றேம? ஏன் ஒருங்கு%�யா�ர்வெசிய்யா�தா�ருக்க�%�ர்? உறேரா�மனுக்கு ஓர் அடிப்பானைட,

இந்தா�யா வெம�ழி�களுக்கு றேவறே%�ர் அடிப்பானைடயா�? ஏன்ஓராவஞ்சினை? • • உறேரா�மன் எழுத்தா�ன் அடிப்பானைடனையா alphabet என்று

னைவத்தா�ருப்பாதா�ல் எந்தாச் வெசி�ற்வெசியாலியும் எளி�தா�ற் இயாங்க முடிக�%து. இல்னைலவெயா�ல் எளி�னைம

இயாலுறேம�? தாம�ழி�க்கு மட்டும் abugida என்% பா�னைழியாடிப்பானைடனையா ஏன் தாருக�%�ர்?

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 14

13/04/23 கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 15

• இன்வெ�ரு வனைகயா�ற் வெசி�ன்�ல், வெபா�துவ�க ஒருங்கு%�யா�ல் எந்தாத்

தாம�வெழிழுத்தும் 2 புனைட (byte) / 32 மனைடத் (bits) வெதா�குதா�யா�கறேவ வெக�ள்ளிப் பாடுக�%து.

•2 புனைடத் வெதா�குதா�யா�ல் ஒழுங்க� வெதா�குதா�, ஒழுங்க�ல�த் வெதா�குதா� எப் பா�ரா�த்து, ஏற்க இயால�தானைவ எனைவ? எக் கணி�க்கு நி�ரால்வழி�றேயா வெசி�ல்லறேவண்டும்.

• – இதாற்க�க வ�தா�வ�லக்குப் பாட்டியால் table of exceptions – இன்%�யானைமயா�த் றேதானைவ.

13/04/23 கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 16

• ஆவணிம�க்கும் நி�ராறேல�, றேசினைவ வழிங்குநிறேரா� இப்பாட்டியானைல ஒழுங்க�கச்

வெசிய்யா� வ�ட்ட�ல் கட்டகங்கள் (systems) தா�ண்டியா ஆவணி ம�ற்%த்தா�ல்

தாம�வெழிழுத்துக்கள் தாப்பும் தாவறும�ய்” ” ஈ வெயா இளி�க்கும்.

• இப்வெபா�ழுது 3.4 றேசினைவயார் (servers) தா�ண்டி�றேல, தாம�ழி�ல் எழுத்துக்கள்

ஒடிந்துறேபா�வது க�ட்டத்தாட்ட வழிக்கம�து. (வெக�ம்புகளும், க�ல்களும் பா�ழிழ்வது

எத்தானைவெயாத்தானை ஆவணிங்களி�ல்நிடக்க�%து, வெதாரா�யும�?)

• கு%�ப்பா�க 2,3 கு%�றேயாற்%ங்கள் ம�%� ஒருங்கு%�க்கு வந்தா�ல், பா�னைழிகள் றேமலும்

ம�குந்து றேபா�க�ன்%.

13/04/23 கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம்

ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 17

• பாடியா�ற்% நி�ரானைலத் (application programme) தாவவெ%ன்று வெசி�ல்லி கு%�றேயாற்%ப் பா�னைழியா�ல்

இருந்து தாப்பா�ப்பாறேதா ஒருங்கு%�யா�ளிரா�ன் பாழிக்கம�ய்ப் றேபா�து. [They keep saying that

this is application fault and not the inadequacy of unicode.] ” ஆடத்வெதாரா�யா�தா

” ஆடல்மகள் வெதாருக்றேக�ணில் என்%�ளி�ம்.

• முதாற் றேக�ணில் முற்றுங் றேக�ணில். எழுத்துக்கனைளி உனைடத்து கு%�றேயாற்%ம்

வெசிய்தாறேதா ஒருங்கு%�யா�ன் முதாற்றேக�ணில்ஆகும். ஒருங்கு%� வெசிய்றேதா�ர், ஆதாரா�ப்றேபா�ர்,

இனைதா உணிரா மறுக்க�%�ர்கள்.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 18

Use of “Find and Replace ( அவன் என்பனைத இவன் என்றுமி�ற்று)” in the same word processor [here Microsoft Word 2007] gives different results for two different script encodings.

இவன் Ivan

அவனைனி Ivanai

அவசெனி�டு, அவனுடன், அவனி�ல்

Ivanotu, Ivanutan, Ivanaal

அவனுக்கு Ivanukku

அவனி�ன் Ivanin

அவனிது Ivanathu

Two different problems of “find and replace” – one without the need for grammer intervention (pure veeRRumai induced changes) and the second with the need for grammer intervention (aththu – caariyai)

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 19

• ஒரு தாம�ழி�வணித்தா�ல், எழுதுறேவ�ரா�ன் உகப்பா�ற்குத் தாக்கச் சி�லறேபா�து றேதானைவப்

பாட்டும், சி�லறேபா�து வ�லக்க�யும் எழுத்துப் புணிர்ச்சி� அனைமயும்.

• எல்ல�ச் வெசி�ற் வெசியாலிகளும் இனைதாத் தா�%ம்பாடச் வெசிய்யா றேவண்டும்.

• இலக்கணிவழி� உணிராப்பாடும் புணிர்ச்சி�கள் இங்கு றேபாசிப்பாடவ�ல்னைல. அவற்னை%ப்

வெபா�துவ� வெசி�ற்வெசியாலிகள் னைகயா�ளி இயால�து தா�ன்.

• இதாற்குக் கு%�றேயாற்%ம் உதாவ றேவண்டும்.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 20

• கு%�ப்பா�ட்ட உயா�ர்வெமய்யுள் என் உயா�ர்இருக்க�%து, என் வெமய் இருக்க�%து

என்பானைதாத் தாராப்பாடுத்தாப் பாட்ட வெசிய்முனை%யா�ல் சிட்வெடன்று க�ணும் தா�%ன் எந்தாக்

கு%�றேயாற்%த்தா�ற்கும் இருக்கறேவண்டும்.

• ஒரு கு%�றேயாற்%த்தா�ற்கு இது இல்னைலறேயால், வெசி�ற்வெசியாலியா�ன் பாயான்பா�ட்டுத் தா�%ன்

வெபாரா�தும் குனை%யும். இன்னை%க்கு இருக்கும் ஒருங்கு%�றேயாற்%த்தா�ல் அத் தா�%�ல்னைல.

• ஏவெ�ல் அது அகராறேம%�யா வெமய்னையாயும், உயா�ர் ம�த்தா�னைராகனைளியும் உயா�ர்வெமய்க்

கூறுகளி�கக் கருதுக�%து.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 21

• தாம�னைழிக் னைகயா�ளும் றேபா�து, புணிர்ச்சி�னையாத் தான்�யால்பா�ய்க் வெக�ள்ளும் கு%�றேயாற்%றேம

நில்ல கு%�றேயாற்%ம�கும்.

• ஒருங்கு%�றேயாற்%ம் தாம�ழ்ப் புணிர்ச்சி�னையா ஒழுங்க�ய்க் னைகயா�ளிவ�ல்னைல.

• புணிர்ச்சி� பாழிக�தா கு%�றேயாற்%ம் றேதாடி ம�ற்றும்சி�க்கனைலயும், (search and replace problem)

வரா�னைசிவெயா�ழுங்குச் சி�க்கனைலயும் (row order problem) சிரா�யா�ய்க் னைகயா�ளி�து.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 22

• ஒவ்றேவ�ர் ஆவணித்தா�ன் புள்ளி� வ�வராங்களி�ல் வரா�னைசிவெயா�ழுங்கும் ஒன்%�கும்.

அகராமுதாலிகள் மட்டும�ன்%�, எத்தானைறேயா� ஆவணிங்களி�ல் அத்றேதானைவ உருவ�கும்.

•ஒருங்கு%�றேயாற்%ம், தாம�ழி� எழுத்னைதா அதான்

வரா�னைசிப்பாடி கு%�றேயாற்%வ�ல்னைல.

•” இந்தா�யா வெம�ழி�களி�ல் எழுத்துப் வெபாயார்ப்னைபா ” எளி�தா�ற் வெசிய்யால�ம் என்% கருதுறேக�ளி�ல்

ஆங்க�ங்கு இனைடவெவளி� வ�ட்டுக் கு%�றேயாற்% வரா�னைசினையாச் வெசிய்து, பா�ன்�ல், “ ” அணி�முனை%

எ collation order - னையாப் பாரா�ந்துனைராத்து ஒருங்கு%�றேயாற்%ம் தாடும�றுக�%து. இது

தும்னைபா வ�ட்டு வ�னைலப் பா�டிக்கும் வெசியால�கும்.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 23

• இதா�ல் நி�ரால் எழுதுவது சி�க்கல�க�ப் றேபா�ய், குழிப்பாங்கனைளித் தீர்ப்பாதாற்கு வரா�னைசிவெயா�ழுங்கு

முனை% ஏற்பாட்டு பாலக்க�யா முனை%கனைளி (complex methods) இப்வெபா�ழுது நி�டுக�றே%�ம்.

• எளி�யாமுனை%யா�ல் தாம�ழுக்கு மட்டும் கு%�றேயாற்%ம் வெசிய்தா�ருந்தா�ல் இக் குழிப்பாங்கள்

குனை%ந்தா�ருக்கும். அடிப்பானைடயா� றேதாடி ம�ற்றும்சி�க்கலுக்கும், வரா�னைசிவெயா�ழுங்குச் சி�க்கலுக்கும்

கூட uniscribe உள்வந்து றேவனைலவெசிய்யாறேவண்டும��ல், அந்தாக் கு%�றேயாற்%ம்

ஒரு குனை%ப்பாட்ட கு%�றேயாற்%ம் தா�ன்.

• தாம�ழ் ஒருங்கு%�யா�ல் இருக்கும் சி�ல இனைடவெவளி�களி�ல் இது தா�ன் சி�க்வெகன்று

றேமலும் பால க�ராந்தா எழுத்துக்கனைளி நுனைழிக்கவும் சி�லர் முயாலுக�%�ர்.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 24

• மற்% இந்தா�யா வெம�ழி�களி�ல் நிகரா� எழுத்னைதா ஆளும் றேபா�து ஓவெராழுத்து ஓவெரா�லி. Sound of a Nagari character = function of (Shape of the character). ஒன்%�ற்கு ஒன்று எனும் வெபா�ருத்தாம் வெக�ண்டது.

•தாம� ழி�ல் தாம�ழி� எழுத்னைதா ஆளும் றேபா�து, ஓவெராழுத்துப் பால்வெல�லி. அந்தா எழுத்து வெசி�ல்லில் வரும் இடத்னைதாயும்,

அண்னைமவெயா�லிகனைளியும் வெபா�றுத்து கு%�ப்பா�ட எழுத்தா�ன் ஒலி ம�றும்.

•Sound of a Tamizi character = function of (Shape of the character, the place of occurrence in a word, nearby sounds). ஒன்%�ற்குப் பால என்னும் வெபா�ருத்தாம் வெக�ண்டது.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 25

•நிகரா�/சிங்கதாம் றேபா�ன்% கட்டகங்களி�ன் (systems) அடிப்பானைட தாம�ழி�/தாம�ழ் றேபா�ன்% கட்டகங்களி�ன் அடிப்பானைடயா�லிருந்து முற்%�லும் றேவறுபாட்டது.

• எழுத்துப் வெபாயார்ப்பு றேவண்டுறேவ�ர் ஒருங்கு%�றேயாற்%த்தா�ன் மூலம், நிகரா�/சிங்கதாக்

கட்டகத்னைதாத் தாம�ழி�/தாம�ழ் கட்டகத்துள் புகுத்தா நி�னைக்க�%�ர். இது வட்டத்னைதாச் சிதுராம�க்கும் முயாற்சி�.

•There cannot be a common encoding for all Indian scripts. There have to be at least two different encodings meeting respective requirements of Tamil and those of non-Tamil.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 26

• மற்% இந்தா�யா வெம�ழி�களி�லிருந்து தாம�ழுக்கு எழுத்துப் வெபாயார்ப்புச் வெசிய்யால�ம். many to one

என்பாதா�ல் இது எளி�து.

• ஆ�ற் தாம�ழி�லிருந்து மற்% வெம�ழி�களுக்கு எழுத்துப் வெபாயார்ப்பு வெசிய்வது one to many என்பாதா�ற் வெபாருஞ்சி�க்கல்.

• இந்தாச் சி�க்கல�ல், தாம�ழ்க் கு%�றேயாற்%த்தா�ற்கு எழுத்துப் வெபாயார்ப்பு என்பானைதாக் கு%�க்றேக�ளி�ய்

வெக�ள்ளிறேவண்டியா றேதானைவறேயாயா�ல்னைல.

• குமளி�ப் (apple) பாழித்னைதாயும், நி�ராங்னைகப்(orange) பாழித்னைதாயும் ஒன்றே%�வெட�ன்று

ஒப்பா�டுவதா�ற் வெபா�ருளி�ல்னைல. இராண்டும் வெவவ்றேவறு சுனைவ; வெவவ்றேவறு வளிர்ச்சி�

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 27

• ஒருங்கு%�றேயாற்%க் குனை%கனைளிப் வெபாரா�தும் உணிர்ந்து ஒரு ம�ற்றுப் பாரா�ந்துனைராயா�க 10

ஆண்டுகள் முன்றே தாம�ழ் அனைத்வெதாழுத்துக் கு%�றேயாற்%ம் [Tamil All

Character Encoding - TACE] எடுத்துனைராக்கப்பாட்டது.

• அப் பாரா�ந்துனைரா, க�ணிற்%�ல் வீழ்ந்தா கல் றேபா�ற் பாரா�ந்துனைரா வெபாற்%வரா�டறேம வெசியாற்பா�டு ஏதும�ன்%� வீறேணி க�டக்க�%து.

• இற்னை% நி�னைலயா�ல் ஒருங்கு%�யும், தாம�ழ் அனைத்வெதாழுத்துக் கு%�றேயாற்%மும்

அருகருறேக இனைணிப்பா�கச் வெசியாற்பாட முடியும்.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 28

• ஆ�ல் இதுவனைரா வந்தா தாம�ழிக ஆறேல�சிகர் யா�ருறேம எம்முடிவும் தாரா�து, மீண்டும் மீண்டும்

புதுப்புதுக் குழுக்கனைளிப் புனைவ�த்து வெவற்%லசிலிறேல வெபாருங்க�லந் தாள்ளி��ர்.

”ஏன்?” என்று தா�ன் யா�ருக்கும்புரா�யாவ�ல்னைல.

• அதாற்குள் ஒருங்கு%�ச் றேசிர்த்தா�யாத்தா�ல் வெவற்றுவெவளி�க் கு%�ப்புள்ளி�கள் (blank code

points) குனை%ந்து றேபா�யா�. ” நீங்கள் என்தூங்க�னீர்களி�?” என்று அவர் றேகட்ட�ரா�ம்.

• இப்பாடி எந் நிடவடிக்னைகயும் எடுக்க�து தாம�ழிக அராசு வெவறுறேம இருப்பாதும், வீண் ஆனைணிகள்

பா�%ப்பா�ப்பாதும் நிமக்கு வ�ளிங்கவ�ல்னைல. [Tamil IT Policy என்பாறேதா இல்ல�தா தாம�ழிக

அராசு என் வெசிய்யும் என்று வெசி�ல்லுங்கள்?]

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 29

• ஒருங்கு%�ச் றேசிர்த்தா�யாத்தா�ன் நி�னைலப்புக் வெக�ள்னைக (stability policy), தாம�ழிக அராசி�ன்

வெசியாலின்னைம, உத்தாமம் றேபா�ன்% அனைமப்புக்களி�ன் இம்புரா�யா�த் தாயாக்கம்,

தாம�னைழிப் பாயான்பாடுத்தும் ம�னைடயாக்க�ரார்(media), பாதா�ப்பாகத்தா�ர் (publishing houses)

ஆக�றேயா�ரா�ன் வெமத்தாம் எப் பாலவும் நிமக்குவ�ளிங்கவ�ல்னைல.

•” ஒருபாக்கம் ஒருங்கு%� இருந்துவ�ட்டுப்றேபா�கட்டும்; இன்வெ�ரு பாக்கம் இராண்ட�ம்

தாராம�க TACE னையா ஏன் ஏற்கக் கூட�து?” – என்று கூடப் பாலரும் சி�ந்தா�க்க மறுக்க�%�ர்.

தானைடகள் றேபா�டப்பாடுவதும், சுணிக்கம் ஏற்பாடுத்துவதும் ஏன்? ஒருங்கு%�யா�ர் ஒப்புதால்

இன்னும் க�னைடயா�தா�ருப்பாது ஏன்?

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்

30

1.The present Unicode is very good in document transfer across computers, networks (internal and external), and through internet. This is mainly because of the excellent support by the providers of browser service, e-mail service and local internet service.

2.Publishing software providers do not find money in providing support to Unicode, when the language script is other than the alphabet based. In essence, They are providing support to only Roman Script based languages. They won't appear to support Indic Scripts even in future. This may not happen even for another 5 to 10 years.

3.With the present Unicode, all Indic script handlers have to spend atleast three times the cost a Roman script handler has to spend on sending any short message through networks (whether mobile or internet). Mobile messaging is a major market waiting to be explored. Using Unicode, Indic script handlers are going to be permanently handicapped due to cost factors.

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம் 31

1.If TACE is used, publishing software providers do not have to provide any additional support . The present versions can straight away be used for Indic Script publishing.

2.Absolutely, there is no support for TACE from the providers of browser service, e-mail service and local service. For example, if I write a mail in TACE encoding, hotmail, yahoo groups, google groups, rediffmail or even VSNL do not support. So even if the sender and receiver have TACE fonts installed in their computers, there is no guarantee that the mail will go undistorted  and the receiver read it properly. There could garbling in-between.

3.If these service providers provide support, then any messaging thru’ TACE will be similar to that of Roman script message. The costs will be similar. You would compare apple to an apple.  

 

13/04/23

கணி�னி�த்தமி�ழ் - பன்னி�ட்டுக் கருத்தரங்கம் ப�ப் 24-26, 2010, செ�ன்னைனிப் பல்கனை�க்கழகம்

32

ஒருங்குறி'ப் பூனைனிக்கு

யா�ர் மிணி�

கட்டுவ�ர்கள்? தமி�செழலி

ஓடிக்செக�ண்டேட இருக்க டேவண்டுமி�?

Recommended