|
Mikrofondan matnga tezkor nutq ilovasi
|
bet | 156/182 | Sana | 19.05.2024 | Hajmi | 5,69 Mb. | | #244351 |
Bog'liq Python sun\'iy intellekt texnologiyasi Dasrlik 20242. Mikrofondan matnga tezkor nutq ilovasi
Ushbu ilovada biz kompyuter mikrofoni yordamida Real vaqtda tovushlarni matnga aylantirishga harakat qilamiz. Buning uchun biz yana Speech Recognition kutubxonasidan foydalanamiz. Shuningdek, biz yangi pyaudio modulidan foydalanamiz. Bu audio kirishni boshqarish uchun kerak.
Kod yozishni boshlaymiz!
Modullarni o‘rnatish:
pip install SpeechRecognition
pip install pyaudio
Agar siz Mac-da bo‘lsangiz, portaudio-ni o‘rnatishingiz kerak bo‘ladi. Buning uchun brew-dan foydalaning:
brew install portaudio
pip install pyaudio
Biz kutubxonani ulaymiz va ma’lumotlarni aniqlash usulini tayinlaymiz:
import speech_recognition as sr
r = sr.Recognizer()
Shunga qaramay, agar siz ushbu amallarni avvalgi ilovada bajargan bo‘lsangiz, ularni takrorlashingiz shart emas.
Ovozni matnga aylantirish.
with sr.Microphone() as source:
r.adjust_for_ambient_noise(source)
data = r.record(source, duration=5)
print(“Sesinizi Tanımlıyor…”)
text = r.recognize_google(data,language=’tr’)
print(text)
Oldingi dasturda biz audio faylni audio manba sifatida ishlatganmiz. Ushbu dastur uchun manba mikrofondir, ovozni olish uchun biz sr usulidan foydalanamiz. Microphone(). Xuddi shunday, biz kuzatilayotgan til turkcha ekanligini ko‘rsatamiz. Agar xohlasangiz, audio tinglash vaqtini sozlashingiz mumkin. Ushbu misolda u besh soniyani tashkil qiladi. Ammo, agar kerak bo‘lsa, vaqtni uzaytirish mumkin.
4. Biz kodni bajaramiz.
“Merhaba Dünya” (turkcha) tsiklini besh soniya davomida takrorladik va quyidagi natijaga erishdik. Dastur uzoqroq takliflar bilan ham shug’ullanadi:
Modul qanday ishlashini tushunish uchun show_all = True parametridan foydalanib kod qanday qilib muqobil chiqishni ishlab chiqarishini ko‘rib chiqamiz.
text = r.recognize_google(data,show_all=True,language=’tr’)
Bu audio konvertatsiya qanday sodir bo‘lishini aniq ko‘rsatadigan ikkita oddiy dasturni ishlab chiqdik. Biz buni Google Cloud Speech API yordamida qildik.
Ushbu ilovalarni sezilarli darajada yaxshilash mumkin. Agar siz loyihalaringizda tovushlarni biron bir tarzda qo‘llamoqchi bo‘lsangiz, ushbu modullardan foydalanishni xohlaysiz, chunki ular bilan ishlash oson. Ular, ayniqsa, audio fayllarni qayta ishlashlari va ularni mashinali o‘qitish bilan bog’liq loyihalarda ishlatishlari kerak bo‘lsa, ushbu kutubxonalardan ma’lumotlarni oldindan qayta ishlash bosqichlarida foydalanishi mumkin bo‘lgan ma’lumotlar bo‘yicha mutaxassislar uchun foydali bo‘lishi mumkin.
|
| |