ယူနီကုဒ်

^{[good 1]}ကွန်ပျူတာတွင် ယူနီကုဒ်သည် ကမ္ဘာပေါ်ရှိ စာရေးစနစ် (writting system) အားလုံးနီးပါး ပါရှိပြီး ကွန်ပျူတာများနှင့် လိုက်ရောညီထွေ ရှိစေရေးအတွက် သက်မှတ်ထားသော စက်မှုစံ (industry standard) တစ်ခုဖြစ်သည်။ Universal Character Set စံနှင့်အတူ ယူနီကုဒ်စံသည် အက္ခရာပေါင်း ၁၀၀ ၀၀၀ ကျော်ပါသော စာအုပ် ထုတ်ဝေခဲ့သည်။ ထိုစံစာအုပ်တွင် ကိုးကားရန် ဇယားများ၊ encoding နည်းစဉ်များ၊ character encoding စံများ၊ အက္ခရာ၏ သဘောသဘာဝများ (ဥပမာ စာလုံးကြီး၊ စာလုံးသေး)၊ အထောက်အကူပြု computer file များ၊ အခြား သက်ဆိုင်ရာများ (အက္ခရာသဘော၊ normalization ဥပဒေ၊ ခွဲခြင်း၊ ပေါင်းခြင်း၊ rendering နှင် နှစ်ဖက်သွား စာများ၏ အစဉ်၊ ဘယ်ညာ သဘောများ၊ စသည့်) ပါရှိသည်။^[1]

အမြတ်မယူ အသင်းအဖွဲ့ ဖြစ်သော Unicode Consortium သည် ယူနီကုဒ် ရှင်သန်တိုးတက်ရေးအတွက် ကြိုးစားမှုတွင် ရှိပြီး character encoding အားလုံးကို ယူနီကုဒ် ဖြင့်အစားထိုးသွားရန် ရည်ရွယ်သည်။ ယူနီကုဒ် ၏ Unicode Transformation Format (UTF) scheme များတွင် ရှိပြီး encoding နည်းများသည် ဘာသာစုံ (multilingual) အတွက် လိုအပ်လျက်ရှိသည်။

ဘာသာစုံ ပါဝင်သော ယူနီကုဒ် ၏ အောင်မြင်မှုကြောင့် computer software ကို internationalization and localization လုပ်ရာတွင် များစွာ အသုံးချလျက်ရှိသည်။ ယူနီကုဒ်စံစနစ်ကို ယခု ပေါ်ပေါက်နေသော XML၊ Java programming language၊ Microsoft .NET Framework နှင့် ခေတ်ပေါ် Operating System များတွင် အသုံးချလျက်ရှိသည်။

ယူနီကုဒ်စံစနစ်ကို အသုံးပြုရာတွင် character encoding မျိုးစုံ အသုံးပြုနိုင်သည်။ အသုံးအများဆုံးမှာ UTF-8 (1 byte ကို ASCII အက္ခရာ အတွက် နှင့် ၄ byte အထိ ကျန် နေများကို အခြား အက္ခရာ အတွက်)၊ မသုံးတော့သော UCS-2 (2 bytes ကို အက္ခရာ အားလုံးအတွက် သို့သော် ယူနီကုဒ် အက္ခရာ အားလုံးမပါ) နှင့် UTF-16 (၄ bytes သုံးပြီး UCS-2 ကို ထက်ဆင့်၍ ကျန်ရှိနေသေးသော ယူနီကုဒ် အက္ခရာ များကို ထည့်သွင်း) ဖြစ်ကြသည်။

[good 1]

[1]