37
Professional masalalar: slayd va negativ fotoplyonkalar
uchun 1200 dpi va yuqori;
Kulrang gradiatsiyali tasvirlar (masalan, oq-qora surat)
uchun 150 – 200 dpi.
Matnni tanish dasturlari koʻp, ulardan ayrimlari:
ABBYY FineReader;
Cuneiform;
Tesseract;
Free OCR;
Img2txt;
NewOCR.
FineReader dasturida quyidagicha ishlanadi:
Skanerlangan tasvirdan matnni tanish uchun maydon
(parcha) ajratiladi. Dastur ajratilgan
parchani avval qatorlarga, keyin
qatorni esa belgilarga ajratadi.
Alohida ajratilgan belgini tanlangan tilga (tillarga) koʻra
tanishga oʻtadi.
Tanib olish amalga oshirilgach, aksincha jarayon boshlanadi –
hujjat sintezlanadi: belgilardan soʻz, soʻzdan qator, qatordan kolonka va
hujjat hosil qilinadi. Natija, odatda, RTF yoki Microsoft Word
formatida asl hujjatga yaqinlashgan koʻrinishdagi fayl sifatida
saqlanadi.
FineReader da hujjatni ishlash tartibi (3.1-rasm):
1.
hujjatni skanerlash – Scan (Skanerlash) tugmasi;
2.
hujjatni segmentatsiyalash (bloklarga ajratish);
3.
hujjatni tanish - knopka Read (Oʻqish) tugmasi;
4.
natijani tahrirlash va tekshirish - Check Spelling
(Tekshirish) tugmasi;
5.
hujjatni saqlash tugmasi – chiquvchi fayl formati (doc, pdf).
Matn bilan ishlovchi dasturiy vositalar:
elektron bloknotlar;
matn muharrirlar;
matn protsessorlari;
tahririy-matbaa tizimlari;
tarjimon-dasturlari va b.
Matn muharriri – matnlarni yaratish (kiritish), tahrirlash va
bezash dasturiy vositasidir (misol uchun «Leksikon», «Slovo i delo»,
39
Har bir hujjat sahifadan tashkil topadi.
Shuning uchun,
avvalo, sahifa parametri (formati, koʻrinish /kitob, albom/, maydon
oʻlchami va b.) oʻrnatiladi.
Abzats
matn
hujjatning
asosiy
obyektlaridan
biri.
Kompyuter hujjatlarida abzats deb maxsus «abzats oxiri» boshqaruvchi
belgisi bilan tugagan matn qismi tushuniladi. Bu belgini kiritish
tugmasini bosish bilan erishiladi.
Hujjat belgilardan tashkil topadi. Belgilar – bu harflar,
sonlar, probel (boʻsh joy), tinish belgilari, maxsus belgilar.
Belgilarning asosiy xususiyatlari: shrift, oʻlchami, shakli va
rangi.
Shrift – bu ma‘lum shakldagi belgilarning toʻliq toʻplami.
Shrift oʻlchami birligi punkt (1 pt = 0,376 mm). Shrift
oʻlchami katta diapozonda oʻzgarishi mumkin (odatda 1 dan 1638
punktgacha).
Matnda turli roʻyxatlarni keltirish uchun roʻyxat turi keltiriladi:
-
Raqamli roʻyxat. Elementlari arab va rim raqamlari hamda
harflar bilan beriladi.
-
Markerli roʻyxat. Elementlari maxsus belgi - marker bilan
belgilanadi.
Jadval qator
va
ustundan,
ular
kesishmasida katakdan
(yacheykadan) iborat. Jadval yordamida abzatslarni qatorlarga ajratish,
matn bilan tasvirlarni moslikda keltirish kabilarni amalga oshirish
mumkin. Sonlardan iborat jadvallarda hisoblashlarni (jamlash,
koʻpaytirish, maksimal va minimal sonni qidirish kabilarni) bajarish
mumkin.
Tahririy-matbaa tizimlari:
Ularda matn protsessorlarining barcha funksiyalari bajarilgan
holda quyidagi qoʻshimcha imkoniyatlar boʻlishi lozim:
Turli matn muharrirlarida tayyorlangan matnlarni qabul
qilishi;
Turli platformali kompyuterlarda tayyorlagan skanerlangan
yoki chizilgan tasvirlarni qabul qilishi va ularning ranglarini
oʻzgartirishi;
Katta shriftlar toʻplami va ularni grafik qayta oʻzgartirishi;
Tasvirni matn bilan har xil oʻrash imkoniyati;
40
Sahifada matnni optimal joylashtirish va sahifani avtomatik
ravishda qoʻyish;
Har xil chop etish vositasiga moslashish va b.
Tarjimon-dasturlar yoki kompyuter lugʻatlari:
Ular har xil tillardagi minglab soʻz va soʻz birikmalar tarjimasini
saqlaydi. Ular foydalnuvchiga quyidagi imkoniyatlarni yaratishi zarur:
Tilni va tarjima yoʻnalishini tanlash;
Nafaqat umumiy, balki maxsus soʻzlarni ham berish;
Lugʻatdan tezkor qidirishni amalga oshirish;
Multimediali xizmat (diktor ovozi) taklif etish.
Matn koʻrinishidagi axborot fayl sifatida saqlanadi. Fayl formati
matnning faylda saqlanish usulini belgilaydi. Matnli faylning oddiy
formatida faqat belgilarni (belgining sonli kodini),
boshqalari esa
qoʻshimcha boshqaruvchi kodlarni, ya‘ni matn formatlanishini
saqlaydi.
Hozirda 250 ta matnli fayl formatlari mavjud. Koʻp ishlatiladigan
formatlar:
TXT. Universal format. Matn formatlanmagan koʻrinishda
(faqat abzats oxiri belgisi qoʻyilgan holda saqlanadi). Bu format har xil
operatsion tizimda foydalanadigan dasturlar (ishlanmalar) tomonidan
oʻqiy olinadi.
RTF (Rich Text Format) (RTF). Barcha formatlashlarni
oʻzida saqlab qolgan umumiy format. Saqlab qolingan boshqarish
kodlari buyruqlarga aylantirilgan holda koʻpchilik ishlanmalar
tomonidan oʻqilishi ta‘minlanadi. Bu formatda
matn fayli hajmi katta
boʻladi.
Word hujjat (DOC). Word matn protsessorida matnlarni
saqlash formati. Formatlashni toʻliq oʻzida saqlaydi. 16-bitli belgi
kodirovkasini ishlatadi, uning uchun Unicode shriftlari boʻlishi lozim.
Word 2007/2010 hujjati (DOCX). XML (web-sahifalar
uchun til) elementlarni oʻzida saqlaydigan Word formati. U oldingi
Word hujjatlarni oʻziga butunlay oʻtkaza oladi. DOCX formatidagi
faylning hajmi DOC formatidagi fayl hajmidan ancha kichik boʻladi.
Works 4.0 hujjati (WPS) . Works 4.0 tizimini uchun format.
Unga Word hujjatlari formatlanishi toʻliq oʻtmaydi.