
Tasavvur qiling: bir stol atrofida besh kishi besh xil tilda gapirmoqda – siz ularning hammasini bemalol tushunasiz. Aynan shu g‘oya Vashington Universiteti tadqiqotchilarini ilhomlantirdi va ular Spatial Speech Translation deb nomlangan inqilobiy sun’iy intellekt tizimini yaratishdi.
Innovatsiya
An’anaviy tarjima vositalari bir nechta odam bir vaqtda gapirganda, faqat bitta ovozni ajrata oladi, qolganlari esa orqa fon shovqiniga aylanadi. Ammo yangi tizim bu cheklovni yo‘q qiladi: u bir vaqtning o‘zida bir nechta ovozlarni real vaqtda aniqlaydi, tarjima qiladi va eshittiradi.
Bundan ham ajabtovur tomoni – tizim har bir kishining ovozini klonlaydi va ovozning qayerdan kelayotganini saqlab qoladi. Shunday qilib, tarjimani eshitganingizda, har kim o‘z ohangi va yo‘nalishi bilan gapirayotgandek bo‘ladi.
“Bu xuddi ovozli real vaqtdagi subtitrlar kabi — va har kim o‘z ovozida qoladi,” — deydi tadqiqot guruhi.
Qanday ishlaydi?
Ushbu innovatsion tizim sun’iy intellekt yordamida murakkab va ustma-ust gaplarni ajratadi, gapiruvchilarni tanib oladi, ovozlarni klonlaydi va tarjimani spatial audio orqali uzatadi – ovozlar tabiiy, qayerdan gapirgan bo‘lsa, o‘sha yo‘nalishda eshitiladi.
Bularning barchasi Apple’ning M2 chipi o‘rnatilgan noutbuklar yoki Apple Vision Pro kabi yuqori unumli qurilmalarda ishlaydi. Eng muhimi — bu jarayon to‘liq lokal tarzda, ya’ni qurilmaning o‘zida amalga oshadi. Bu sizning ovoz ma’lumotlaringiz xavfsiz saqlanishini ta’minlaydi va hech narsa bulutga (cloud) yuborilmaydi.
Qanchalik tez ishlaydi?
Tezlik bo‘yicha tizim juda yaxshi natija ko‘rsatmoqda. Tarjimalar atigi 2–4 soniyalik kechikish bilan yetkaziladi — bu esa suhbatlar tabiiy davom etishi uchun yetarli. Sinovlar davomida foydalanuvchilar, hatto orqa fon shovqini yoki bir nechta odam bir vaqtning o‘zida gapirganda ham, tizim aniq va tushunarli tarjima taqdim etganini aytishgan.
Bunday murakkab jarayonda — bir nechta ovozni tanib olish, tarjima qilish va ularni klonlab qayta eshittirish — bunday kichik kechikish muammo sifatida qabul qilinmagan. Mavjud bir ovozli tarjima vositalari bilan solishtirganda, bu tezlik va samaradorlik borasida katta qadam hisoblanadi.
Nega bu muhim
Bu texnologiya bizning quyidagi sohalardagi tajribamizni tubdan o‘zgartirishi mumkin:
- Chet elga sayohat qilish va turli tillardagi odamlar bilan muloqot qilish tarzimiz
- Ko‘p tilli uchrashuvlarda ishtirok etishimiz
- Xalqaro jamoalarda ishlashimiz
- Turli madaniyatli va tilga ega auditoriyalarda ta’lim olishimiz
Yangi tizim til to‘siqlarini deyarli sezilmas darajaga tushirishi mumkin.
Keyingi qadam
Hozircha bu faqat prototip bo‘lsa-da, tadqiqotchilar uni tez orada tijoratlashtirish mumkinligiga ishonishmoqda. Bu nafaqat tarjima qilish, balki real vaqtdagi muloqotni tabiiy va insoniy his qilinadigan darajaga olib chiqishda katta qadam hisoblanadi.
Tayyorladi: Navro‘zaxon Bo‘riyeva
Fikr bildirish