|
Kompyuter tizimlari kafedrasi
|
bet | 56/154 | Sana | 08.01.2024 | Hajmi | 5,29 Mb. | | #131939 |
Bog'liq Majmua11-ma’ruza. Satrlar.
Reja:
1. Belgi va satrlar
2. Satr qurilishi va ular ustida amallar
3. Satrlarni formatlash
4. Satrlarda sonlarni va sanalarni formatlash
Belgi va satrlar
C# tili Unicode belgilar majmuasini qo‘llab-quvvatlaydi. Til kutubxonasida har bir guruh belgilari uchun maxsus funksiyalar to‘plami aniqlangan. Satr char turidagi belgilar massivi sifatida qaraladi va bu belgilar ketma-ketligi satr terminatori deb nomlanuvchi 0 kodli belgi bilan tugaydi (‘\0’). Odatda, nol-terminator bilan tugaydigan satrlarni Unicode-satrlar deyiladi.
Unicode haqida
Unicode belgilarni kodlashning tavsifi: Kompyuterda odamlar tushunadigan matn va sonlarni saqlash imkoniyatiga ega bo‘lish uchun, belgilarni sonlarga aylantiradigan kod bo‘lishi kerak. Unicode standarti bunday kodni belgili kodlash yordamida belgilaydi.
Maxsus belgilar kodlash sxemasi bir kompyuterda yorqin tarzda ishlashi mumkin, ammo o‘sha matnni boshqasiga yuborganda muammolar paydo bo‘ladi.
Belgili kodlash
Barcha belgilar kodirovkasi foydalanilishi mumkin bo‘lgan har bir belgi uchun sonni belgilaydi.
ASCII (ma’lumot almashish uchun Amerika standart kodi) birinchi keng tarqalgan kodlash sxemasi hisoblanadi. Lekin faqat 256 ta belgilar bilan cheklangan. Bu eng keng tarqalgan inglizcha harflar, raqamlar va tinish belgilariga mos keladi, ammo butun dunyo uchun biroz cheklangan.
Tabiiyki, dunyoning qolgan qismi ham o‘z belgilariga nisbatan bir xil kodlash sxemasini talab qilmoqda.
Keyinchalik dunyoning boshqa joylari ham o‘zlarining kodlash sxemalarini yaratishga kirishdi. Qaysi kodlash sxemasidan foydalanish kerakligini aniqlash uchun faqat turli xil uzunlikdagi kodlash sxemalari, dasturlari kerak bo‘ladi.
Unicode standarti yaratilganda, yangi belgili kodlash sxemasiga ehtiyoj sezildi.
Unicode ning maqsadi barcha turdagi kodlash sxemalarini birlashtirish, ya’ni kompyuterlar o‘rtasidagi chalkashlik imkon qadar cheklangan bo‘lishi kerak.
Bugungi kunda Unicode standarti 128000 dan ortiq belgilarni aniqlaydi va Unicode Consortium9 da ko‘rish mumkin. Bir nechta belgili kodlash shakllari mavjud:
UTF-8: Ingliz belgilarni kodlash uchun faqat bitta baytni (8 bit) ishlatadi. Boshqa belgilarni kodlash uchun baytlar ketma-ketligini ishlatishi mumkin. UTF-8 elektron pochta tizimlarida va internetda keng qo‘llaniladi.
UTF-16: eng ko‘p ishlatiladigan belgilarni kodlash uchun ikkita baytni (16 bit) ishlatadi. Agar kerak bo‘lsa, qo‘shimcha belgilar 16 bitli juftlik bilan ifodalanishi mumkin.
UTF-32: belgilarni kodlash uchun to‘rtta baytni (32 bit) ishlatadi. Unicode standarti rivojlanganligi sababli, 16-bitli son barcha belgilarni aks ettirish uchun juda kichik. UTF-32 har bir Unicode belgilarini bitta son sifatida ko‘rsatishga qodir.
|
| |