ထား၀ယ္ IT ဆိုက္မွအားလံုးကိုၾကိဳဆိုပါတယ္(က်ေနာ္မအားမလပ္ျဖစ္ေနေသာေၾကာင့္ဒီ ဆိုက္ကိုအေကာင္းဆံုးမလုပ္ႏိုင္တာခြင့္လႊတ္ၾကပါခင္ဗ်ား)Admin ထား၀ယ္သား ေရခ်မ္း

Serial key နဲ key Generater ေမ်ားရယူႏိုင္ေသာေ

Serial key နဲ key Generater မ်ားရယူႏိုင္ေသာ ဆိုက္ပါ

http://keygenguru.com/
software နာမည္ နဲ ့version ေရးျပီးရွာပါ ေတာ္ေတာ္ကိုစံုလင္စြာရွိပါတယ္

Dawei IT Search(ရွာေဖြရန္)

Translate ဘာသာျပန္ၾကမယ္

Wednesday, 26 October 2011

ယူနီကုဒ္ ရွင္းတမ္း

ဒီရက္ပိုင္း ယူနီကုဒ္ကို လူေတာ္ေတာ္မ်ားမ်ား စိတ္ဝင္စားလာၾကၿပီး ေထာက္ျပေဝဖန္ေမးျမန္းတာေတြ ရွိတဲ့အထဲမွာ ညီလင္းဆက္ေရးခဲ့တဲ့ Review on Myanmar Unicode 5.1 & Suggestion ကို ျပတဲ့ၿပီး ဒါေတြရွင္းၿပီးၿပီလားလို႔ ေမးတဲ့လူေတြ ရွိလာလို႔ ဒီစာကို ေရးျဖစ္ပါတယ္။ ယူနီကုဒ္လုပ္ခဲ့တဲ့ ပညာရွင္ေတြ၊ Developer ေတြက ကိုယ္စီ ရွင္းထားၾကေပမဲ့ အဂၤလိပ္လိုျဖစ္တာရယ္၊ ျမန္မာလိုေရးထားတာဆိုရင္လည္း တစ္စုတစ္စည္းတည္း မရွိတာေၾကာင့္  တစ္ေနရာတည္းမွာ စုစည္းၿပီး ေျဖေပးလိုက္ပါတယ္။


.::Download this article in PDF format here::.


၁။

ယူနီကုဒ္မွာ ပုံသဏၭာန္ ထပ္တူထပ္မၽွတူရင္ သုံးတဲ့ေနရာ မတူေပမဲ့ ကုဒ္ပြိဳင့္တစ္ခုတည္း ယူပါတယ္။


ဥပမာ -
玍 - (738D)
To be born
Birth, origin

To live, to exist, to survive
To revive, to bring to life
Raw, uncooked, crude
Pure, neat, genuine
unfamiliar, strange

untamed, barbarian
a student

ះ - (17C7)
KHMER SIGN REAHMUK

srak ah
visarga

Screen shot 2011-01-22 at 2
Khmer O, AU


ေရွ႕ထိုး (​ေ-ာ္)ကိုသီးျခားခြဲထုတ္မရပါ။ ဒါ့အျပင္ Split Vowel (ခမာတြင္သုံးသည္, 17C4, 17C5) ဟုသတ္မွတ္၍ ​ေ-ာ္အတြက္ တစ္ကြက္ထည့္ပါက ​ေ-ာ၊ -ံ့ ၊ -ို အတြက္ပါ ထည့္ရပါမယ္။ အဲဒီအတြက္  Split Vowel ကိုမသုံးပဲ အသတ္ကိုသာ ေရွ႕ထိုးအတြက္ ပုံေဖာ္ျခင္းမွာ သုံးပါတယ္။ အဲလိုမၽွေဝသုံးစြဲျခင္းအတြက္ အကၡရာစဥ္ျခင္းႏွင့္ ရွာေဖြျခင္းတြင္ မည္သို႔မၽွေျပာင္းလဲျခင္းမရွိပါ။ Split Vowel လို႔ထည့္ရင္ ျပင္မယ္ဆိုရင္ အသတ္ကိုဖ်က္တာ၊ ေရးခ်ကို ဖ်က္တာခက္သြားမယ္။ ေကာ္ ကေန ေကာ၊ ေက ကိုျပင္မယ္ဆိုရင္ ေရးခ်၊ ေရွ႕ထိုးဖ်က္႐ုံနဲ႔မရဘဲ တစ္ခုလုံးဖ်က္ရပါမယ္။

၂။



မြန္ဘာသာ ေရွးစာေတြမွာ “ပႆ” အသုံးရွိသလို “လသ္သ” အသုံးလည္း ရွိပါတယ္။ ယူနီကုဒ္ အေရွ႕ပိုင္းဗားရွင္းေတြမွာ ႆႀကီး မပါပါဘူး။ ေနာက္မွ လိုလို႔ အေၾကာင္းအက်ိဳး သက္ေသသာဓကေတြ ျပၿပီး ေတာင္းထားတာ ျဖစ္ပါတယ္။ ေနာက္ထပ္ code point မေပးရင္ အဲဒီ ၂ခုလုံးကို ေဖာ္ျပဖို႔ မျဖစ္နိုင္ပါ။ disunification လုပ္ရပါတယ္။ Database မွာ De-normalization ကို ျမန္ဖို႔ အဆင္ေျပဖို႔ သုံးရသလိုပါပဲ။


၃။



ခုေခတ္မွာ ဗမာစာတစ္ခုတည္း ႐ုံးသုံးျဖစ္ေနေပမဲ့ တူညီတဲ့ အကၡရာေတြ ယူသုံးတဲ့ တျခားသာသာစကား အမ်ားအျပားလည္း ရွိပါတယ္။ ယူနီကုဒ္မွာ ဗမာ၊ မြန္၊ ရခိုင္၊ ရွမ္း၊ ပိုးကရင္၊ စေကာကရင္၊ ပေလာင္၊ ပအို႔ဝ္ စတဲ့ တိုင္းရင္းသားစာ အမ်ားအျပားအတြက္ပါ ထည့္ေပးထားတဲ့အတြက္ ဗမာစာတစ္ခုတည္း ကြက္ၾကည့္လို႔ မျဖစ္ေတာ့ပါဘူး။ ဗမာစာကိုယ္တိုင္ကိုက မြန္အကၡရာေတြမွာ အေျခခံထားတဲ့အတြက္ မြန္ဘာသာရယ္၊ သူနဲ႔ယွဥ္ၿပီးသုံးတဲ့ ေရွးထုံးဗမာစာရယ္ကိုပါ ထည့္စဥ္းစားရပါတယ္။ မြန္စာေရးထုံးအရ မသတ္ (မ္) ကို အတိုေရးခ်င္တဲ့အခါ ဗ်ည္းေပၚ အစက္တင္ (Superscripted) ေရးပါတယ္။ (အခုထိ ခမာမွာ အဲဒီအတိုင္းသုံးပါတယ္)။ အမွန္ေတာ့ ဗ်ည္းေပၚတင္ေရးတဲ့ အဲဒီအစက္ ကိုယ္တိုင္ကိုက ဗ်ည္း(အံ) ျဖစ္ပါတယ္။ အဲဒါေၾကာင့္ အ နဲ႔ေပါင္းၿပီး အ ေသးေသးတင္ ျဖစ္တဲ့အခါ သရလို႔ မယူဆပါဘူး။ ေနာက္ပိုင္း ျမန္မာသင္ပုန္းႀကီးက ဗ်ည္းမွာ အံ မထည့္ေတာ့ဘဲ ဗ်ည္းလြတ္ေနတဲ့ သရေတြကို စီတဲ့အထဲ သြားထည့္လိုက္တဲ့အခါ သရအျဖစ္ သတ္မွတ္လိုက္ပါေတာ့တယ္။ အဲဒါေၾကာင့္ ေသးေသးတင္ကို သရအျဖစ္ေရာ ဗ်ည္းအျဖစ္ပါ သတ္မွတ္တဲ့အတြက္ Various Sign ထဲထည့္ပါတယ္။ ခမာနဲ႔ ထိုင္းဘာသာေတြမွာပါ Various Sign ထဲ ဝင္ပါတယ္။

၄။



ေရွးက ျမန္မာစာေရးတဲ့အခါမွာ ေက်ာက္စာေပစာေတြမွာ ေရးရတဲ့အတြက္ ေနရာဆံ့ေအာင္ အတိုေရးရတဲ့ နည္းေတြ ရွိပါတယ္။ အု က ဥ ျဖစ္တာေတြက အဲဒီထုံးပါပဲ။ ၎ ကိုယ္၌ကိုက လည္းေကာင္းကို ခ်ဳံ႕တာပါ။ ၎ ကို ထပ္ခ်ဳံ႕ခ်င္တဲ့အခါမွာေတာ့ ၎ သေကၤတေပၚ ကင္းစီးတင္ၿပီး ၎ ၤရယ္လို႔ ေရးပါတယ္။ အဲဒါေၾကာင့္ ၎ သေကၤတမွာ ငသတ္ဝစၥေပါက္ ျဖဳတ္ထားတာ ျဖစ္ပါတယ္။ ယူနီကုဒ္ 1.0 မူၾကမ္းမွာ ၎ သေကၤတနဲ႔ ႆႀကီး 5.1 မူအတိုင္း ပါပါတယ္။



၅။


အေပၚက သေဝထိုးကို ေရွးက ဗမာစာ၊ မြန္စာေတြမွာ သုံးပါတယ္။ ခုေခတ္လည္း မြန္စာေတြမွာ သုံးေနတုန္းပါပဲ။ ဥပမာ - “ယဵု”။ အသုံးလိုတိုင္းယူနီကုဒ္မွာ လိုက္ထည့္ေနရမလားဆိုေတာ့ ဟုတ္ပါတယ္ လိုက္ထည့္ရမွာပါ။ သုံးတဲ့အသုံး၊ ဘယ္ေနရာမွာသုံးတယ္၊ ဘယ္ခုႏွစ္က ဘယ္တိုင္းရင္းသားရဲ့ ဘယ္စာမွာသုံးတယ္ဆိုတာ ျပနိုင္ရင္ ယူနီကုဒ္ကြန္ဆိုတီယမ္မွာ ထပ္တိုးေတာင္းလို႔ ရပါတယ္။ ကုဒ္ပြိဳင့္တစ္ခုခ်င္းစီဟာ ရဖို႔ အင္မတန္ခက္ခဲတဲ့အတြက္ အသစ္ရမယ္ဆိုရင္ ဒါဟာ ဝမ္းသာအားရ ႀကိဳဆိုရမယ့္ အခ်က္ ျဖစ္ပါတယ္။


၆။


Normalization အတြက္လားဆိုရင္ ဟုတ္ပါတယ္လို႔ ေျဖရပါမယ္။ Alternate rule for normalization ဆိုတာ ရွိရင္ ပိုအက်ိဳးရွိပါတယ္။ ရဖို႔လည္း ခက္ပါတယ္။ ဥလုံးႀကီးတင္ဆန္ခတ္နဲ႔ မွားနိုင္စရာ တျခားစာလုံးမရွိတာရယ္၊ ေရွာင္ဖို႔ခက္တဲ့ သာဓကအမ်ားအျပားရယ္ေၾကာင့္ ထည့္ေပးလိုက္တာပါ။ လက္ကြက္မွတ္မိရင္ 1025+102E အစား 1026 အကၡရာ ဦ ကိုသာသုံးဖို႔ တိုက္တြန္းပါတယ္။


၇။


ဪ သရအတြက္ မြန္စာမွာ ေရွ႕ပစ္သုံးၿပီး ျပပါတယ္ - “အဴ”။ ဗမာစာမွာ ေရွ႕ပစ္မသုံးေတာ့ဘဲ ဝသတ္နဲ႔ ျပပါတယ္ - “ဝ္”။ သေဝထိုးနဲ႔ ေရးခ်သုံးတဲ့ ေအာ္သံမွာ ေရွ႕ပစ္နဲ႔ဆင္တဲ့ ေရွ႕ထိုးကို သုံးၿပီး ပုံစံအသစ္ေရးပါတယ္။ ကုန္းေဘာင္ေခတ္ ေတာင္တြင္းဆရာေတာ္ ခင္ႀကီးေဖ်ာ္ရဲ့ သဒၵဗ်ဴဟာက်မ္းမွာေတာ့ ေအာ္သရအတြက္ အကၡရာဩမွာ သေဝထိုးေရးခ် ေရွ႕ထိုးကပ္ၿပီး အကၡရာဪကို စထြင္ပါတယ္။ ဒါေပမဲ့ အကၡရာဩ အကၡရာဪေတြကို သ ရရစ္ လို႔ မေရးပါ။ မြန္စာမွာ အကၡရာဩ ေရာ သ ရရစ္ အသုံးပါ ရွိတဲ့အတြက္ေၾကာင့္ ျဖစ္ပါတယ္။ ဥပမာ - “ၾသန္” (သကို ရရစ္ကပ္ရင္ ဆလိမ္+ေအာသံထြက္ပါတယ္)။




၈။


၁၉၉၈ ယူနီကုဒ္(၃) ျမန္မာစာ Proposal မွာ ေအာ နဲ႔ ေအာ္ သရႏွစ္လုံးပါပါတယ္။ ဒါေပမဲ့ သရလို႔ဆိုတဲ့ အ ကိုယ္၌က ဗ်ည္းထဲဝင္ေနတဲ့အခ်က္ေၾကာင့္ရယ္ အို အုံ အံ အသုံးေတြ အတြက္ေၾကာင့္နဲ႔ အ ကိုသုံးၿပီး ရွိၿပီးသားသရေတြျဖစ္တဲ့ သေဝထိုး၊ ေရးခ်တို႔နဲ႔ ေရးလို႔ျဖစ္တယ္ဆိုၿပီး ေနာက္ပိုင္းမွာ ျပန္ျဖဳတ္ပါတယ္။ ဗ်ည္းမွာ အ မပါတဲ့ ခမာကိုေတာ့ ေအာ ေအာ္ ႏွစ္လုံး ေပးပါတယ္။ ယူနီကုဒ္ပြိဳင့္ေလး တစ္လုံးတစ္ပါဒအတြက္ ျမန္မာစာပညာရွင္၊ ကြန္ပ်ဴတာပညာရွင္ေတြ ျဖစ္နိုင္ေခ်ရွိတဲ့ နည္းလမ္းေပါင္းစုံသုံးၿပီး အႀကိမ္ႀကိမ္ ေခါင္းခ်င္းဆိုင္ေဆြးေႏြး၊ ျပည္ပကိုအခါခါထြက္၊ ဆုံးျဖတ္ခ်က္ကို လည္တရွည္ရွည္နဲ႔ေစာင့္ဖူးခဲ့ပါၿပီ။




၉။


ယူနီကုဒ္အကၡရာေတြမွာ ျမန္မာအကၡရာေတြအတြက္ ဘေလာ့ခ္ အစုအေဝးႀကီးတစ္ခု ထားေပးၿပီး ပုံစံက်ေအာင္ စီပါတယ္။ ဗားရွင္းတစ္ခုခ်င္းစီ သြားတိုင္း မလိုတာပယ္ လိုတာျဖည့္လုပ္ပါတယ္။ အဲဒီအခါမွာ အရင္ဗားရွင္းေတြနဲ႔ အတတ္နိုင္ဆုံးတူေအာင္ ျပန္ခ်န္ထားရပါတယ္။ ဗမာစာဟာ မြန္စာကို ယူသုံးထားပါတယ္။ မြန္စာမွာလည္း ဗမာစာမွာမရွိတဲ့ အကၡရာေတြ ပါပါတယ္။ ရွမ္းစာ မြန္စာ ရခိုင္စာ ကရင္စာ မွာလည္း ဗမာအကၡရာကို သုံးပါတယ္။ က်ီးျဖဴဒီမွာေန၊ က်ီးမည္းဒီကိုသြားဆိုၿပီး ခြဲထုတ္လို႔မရနိုင္ပါဘူး။

၁၀။




ယူနီကုဒ္ေဖာင့္ေတြျဖစ္တဲ့ ျမန္မာ၃၊ မိုင္ျမန္မာ၊ ပိေတာက္၊ ပုရပိုက္၊ ယြန္းခ်ိဳ၊ မာစတာပိယူနီစံေတြမွာ ရွားရွားပါးပါး ပါဠိသက္ တစ္ေနရာ ႏွစ္ေနရာကလြဲလို႔ အားလုံးအတူတူ အလုပ္လုပ္ပါတယ္။ အခုဒီစာကိုလည္း Mac မွာ မာစတာပိယူနီစံနဲ႔ ရိုက္ၿပီး မြန္စာေတြ ျမင္ရေအာင္ Windows မွာ ပိေတာက္နဲ႔ PDF ျပန္ထုတ္ပါတယ္။

၁၁။ ဒါကေတာ့ ညီလင္းဆက္ထဲမွာ မပါေပမဲ့ ယူနီကုဒ္က ပါဠိသုံးထပ္ဆင့္ မရဘူးလို႔ ကတ္ကတ္သတ္သတ္ ေျပာသူေတြ ရွိလာတာေၾကာင့္ တစ္လက္စတည္း ထည့္ေရးျဖစ္ပါတယ္။ ယူနီကုဒ္ Encoding မွာ ျမန္မာဘာသာအတြက္ Encode လုပ္လို႔မရဘူးဆိုတာ မရွိ​သေလာက္ ျဖစ္ေနပါၿပီ။ ေဖာင့္အေနနဲ႔ အမွန္မျပနိုင္တာေတြ ရွိေကာင္းရွိပါမယ္။ ဥပမာ -

န + ဝိရာမ + တ + ဝဆြဲ ဆိုတဲ့ ပါဠိသုံးထပ္ဆင့္ စာလုံးပါ။


သူ႔ကို အခု ျမန္မာ၃နဲ႔ အမွန္မျမင္ရေပမဲ့ သုံးမွျဖစ္မယ္ဆိုၿပီးလိုအပ္လာခဲ့လို႔ ရွိရင္ ယူနီကုဒ္ Encoding စာလုံးစီပုံ ရွိၿပီးသား ျဖစ္တဲ့အတြက္ ေဖာင့္မွာ Glyph တစ္ခုနဲ႔ Rule တစ္ခု ေပါင္းထည့္လိုက္႐ုံနဲ႔ ရပါၿပီ။


Encoding ဆိုတာနဲ႔ တစ္ဆက္တည္း ေျပာလိုက္ပါဦးမယ္။ ယူနီကုဒ္ Encoding Model မွာ ဘယ္အကၡရာက ေရွ႕ကေနၿပီး ဘယ္အကၡရာက ေနာက္ကေနမယ္ဆိုတာ အတိအက် ေဖာ္ျပထားတဲ့ စည္းမ်ဥ္းေတြ ရွိပါတယ္။ Encoding ဆိုတာ ျမန္မာစာ သင္ရိုး မဟုတ္ပါဘူး။ တျခားတိုင္းရင္းသားအကၡရာေတြနဲ႔ အဆင္ေျပေအာင္၊ ကြန္ပ်ဴတာမွာ တြက္ခ်က္ရ လြယ္ကူေအာင္ ေနာင္အရွည္မွာ အဆင္ေျပလြယ္ကူေအာင္ ဘာသာေဗဒနည္း အရ ကြန္ပ်ဴတာမွာ Syllable ဝဏၰအဆင့္ သိမ္းတဲ့နည္း ျဖစ္ပါတယ္။ အလြယ္မွတ္ရင္ေတာ့ ဗ်ည္း၊ ဗ်ည္းတြဲ၊ သရ လို႔ မွတ္နိုင္ပါတယ္။ စိတ္ဝင္စားရင္ ဒီေနရာမွာ အလြယ္မွတ္နည္း အဆင့္ဆင့္ကို သြားၾကည့္နိုင္ပါတယ္။ အက်ယ္ကိုေတာ့ ဒီမွာ ၾကည့္ပါ။

ေနာက္ဆုံးတစ္ခုေျပာခ်င္တာက ယူနီကုဒ္ဟာ ျမန္မာစာ ေကာင္းေကာင္းမတတ္တဲ့ ကြန္ပ်ဴတာသမားေတြ လုပ္ခ်င္ရာ လုပ္ထားၾကတာ မဟုတ္ဘူး ဆိုတာပါပဲ။ ျမန္မာစာပညာရွင္ေတြ၊ တိုင္းရင္းသားစာေပ ပညာရွင္ေတြ၊ ဘာသာေဗဒကို အထူးျပဳ ေလ့လာေနတဲ့ လူေတြ၊ ကြန္ပ်ဴတာပညာရွင္ေတြ အားလုံး ဝိုင္းဝန္းၿပီး လုပ္ထားၾကတာပါ။ လုပ္တိုင္းလည္း ျမန္မာေတြ စိတ္ႀကိဳက္ အားလုံး မရပါ။ အေရွ႕ေတာင္အာရွဘာသာစကားေတြကို အထူးျပဳေလ့လာထားတဲ့ ယူနီကုဒ္ကြန္ဆိုတီယမ္က ပညာရွင္ေတြရဲ့ အဆင့္ဆင့္ စိစစ္မွုကို ခံၾကရပါေသးတယ္။ ယူနီကုဒ္ Proposal တစ္ခုတင္ဖို႔ နဲ႔ တင္ၿပီးရင္ အတည္ျပဳဖို႔ တစ္ႏွစ္ၾကာပါတယ္။ အဲဒီကာလေတြအတြင္းမွာ အေၾကာင္းျပခ်က္ခိုင္လုံရင္ ျပင္ခြင့္ ကန႔္ကြက္ခြင့္ ရွိပါတယ္။ အဲဒါေတြအားလုံး ၿပီးသြားေတာ့မွ အတည္ျပဳတဲ့ ဗားရွင္းတစ္ခုရပါတယ္။ အခု ဗားရွင္း 5.2 မွာ ဗမာစာအတြက္ ျပင္စရာ ကုန္သေလာက္ျဖစ္သြားပါၿပီ။ ဒါေၾကာင့္ စိတ္ခ်သုံးလို႔ ရပါၿပီလို႔ ေျပာေနၾကတာပါ။ လူသိနည္းတဲ့ တိုင္းရင္းသားစာေတြ ထည့္ဖို႔ရွိလာတယ္ဆိုလည္း အခုရွိၿပီးသားအကၡရာေတြရဲ့ ေနာက္မွာ ထပ္ထည့္သြား႐ုံပါပဲ။ ဒီေလာက္ဆိုရင္ ဒြိဟျဖစ္ေနသူ အေတာ္မ်ားမ်ား ရွင္းသြားေလာက္ၿပီ ထင္ပါတယ္။

@=={Lionslayer>
22/01/2011

Ref:


·    All Myanmar Unicode Proposals and revisions (1996-2008)
·    A HISTORY OF THE MYANMAR ALPHABET (1994)
·    Khmer - Unicode Consortium

·    Myanmar - The Unicode Standard (6.0)
·    Han Unification in the Unicode Standard
·    Sealang Mon Lexicon

·    http://www.mrc-usa.org/
·    Proposed PDAM for ISO/IEC 10646-1: 1993/Amd. xx: 1998 (E)
·    Myanmar Unicode Research Papers & Reference Documents

·    http://unicode.org/notes/tn11/UTN11_3.pdf
·    http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3043.pdf

Credit to http://www.myanmarlanguage.org/unicode/unicode-Q-n-A

No comments:

Post a Comment

daweiit@gmail.com