Pivot
  • Bozor ma’lumotlari va hisobotlari
  • Podkastlar
  • Voqealar
  • Uzbek
    • English
No Result
View All Result
  • Login
  • Yangiliklar
  • Moliyalashtirish va bitimlar
  • Startaplar
  • Venchur kapitali
  • AI
  • Asoschilar hikoyalari
  • O’zbek Startaplar
Pivot
  • Bozor ma’lumotlari va hisobotlari
  • Podkastlar
  • Voqealar
  • Uzbek
    • English
No Result
View All Result
Pivot

OpenAI’ning yangi “reasoning” modellari ko‘proq xato qiladi

by Gulnoza Sobirova
Aprel 19, 2025
in Yangiliklar
Reading Time: 2 mins read
A A
OpenAI’ning yangi “reasoning” modellari ko‘proq xato qiladi
Share on FacebookShare on TwitterShare on Telegram

Eng zo‘r, lekin eng chalkashtiruvchi?

OpenAI yaqinda taqdim etgan o3 va o4-mini sun’iy intellekt modellarining hisob-kitob va kod yozishda ajoyib natijalarga erishgani ta’kidlanmoqda. Biroq bitta katta muammo bor — ular avvalgi modellariga qaraganda ko‘proq “hallucinatsiya” qiladi, ya’ni ma’lumotlarni to‘qib chiqaradi.

Avvalgi progress to‘xtadimi?

Odatda har yangi model ilgari chiqarilganidan aniqroq bo‘lardi. Ammo OpenAI’ning ichki testlariga ko‘ra, o3 va o4-mini modellari avvalgi reasoning modellari — o1, o3-mini hamda hatto GPT-4o kabi “an’anaviy” modellar bilan solishtirganda yomonroq natija ko‘rsatgan.

Qanday qilib? Nega?

Masalan, OpenAI’ning “PersonQA” testida:

  • o1 – 16% hallucinatsiya qilgan
  • o3-mini – 14.8%
  • o3 – 33%
  • o4-mini esa 48% hollarda to‘qib chiqargan!

Bunga sabab, bu yangi modellarning ko‘proq mulohaza yuritishga urinishidir. Ko‘proq mulohaza — ko‘proq to‘g‘ri fikrlar bilan birga, ko‘proq noto‘g‘ri xulosalarga ham olib keladi.

Mustaqil tadqiqotlar ham shuni tasdiqlayapti

Transluce nomli nodavlat laboratoriya o3 modelining hattoki “men MacBook Pro’da kodni ishga tushirdim” kabi mutlaqo yolg‘on jarayonlarni uydirib topganini aniqladi. Aslida esa, modelning bunday imkoniyati yo‘q.

Nima qilish mumkin?

Ba’zi yechimlar mavjud:

  • GPT-4o kabi modellar web qidiruv bilan ishlaganda ancha aniq natijalar beradi — SimpleQA testida 90% aniqlik!
  • Ammo bunday yondashuv doim ham ishlamaydi, ayniqsa maxfiylik muhim bo‘lgan sohalarda.

Aql ko‘paydi, aniqlik kamaydi

OpenAI bu muammoni tan oldi va “yana tadqiqot kerak” deya bildirdi. Ammo bu muammo ayniqsa huquq, tibbiyot yoki boshqa yuqori aniqlik talab qilinadigan sohalarda sun’iy intellektdan foydalanishni xavf ostiga qo‘yadi.

Shunday ekan, AI imkoniyatlari kengaygan sari, uning ishonchliligi masalasi ham shunchalik dolzarb bo‘lib bormoqda.

Previous Post

Burger King O‘zbekiston bozoriga kiradi

Next Post

Meta maxfiy AI tajribalari

Gulnoza Sobirova

Related Posts

UzNIF IPO’si $600 milliondan ortiq mablag‘ jalb qildi

UzNIF IPO’si $600 milliondan ortiq mablag‘ jalb qildi

May 13, 2026
Markaziy Osiyoda $30 millionlik yangi GIG Fund ochildi

Markaziy Osiyoda $30 millionlik yangi GIG Fund ochildi

May 13, 2026
Yevropada Yandex’ning sho‘ba korxonasi Yango taksi xizmati foydalanuvchilari ma’lumotlarini Rossiyaga berganlikda gumonlanib, 100 million yevro miqdorida jarimaga tortildi

Yevropada Yandex’ning sho‘ba korxonasi Yango taksi xizmati foydalanuvchilari ma’lumotlarini Rossiyaga berganlikda gumonlanib, 100 million yevro miqdorida jarimaga tortildi

May 11, 2026
Qozog‘iston «Bayterak» majmuasidan «Soyuz-5» raketasining ilk parvozini muvaffaqiyatli amalga oshirdi

Qozog‘iston «Bayterak» majmuasidan «Soyuz-5» raketasining ilk parvozini muvaffaqiyatli amalga oshirdi

May 2, 2026
Next Post
Meta maxfiy AI tajribalari

Meta maxfiy AI tajribalari

Tuz bilan ishlaydigan muzlatkich: Hindistonlik o‘smirlarning hayotni saqlab qoluvchi ixtirosi

Tuz bilan ishlaydigan muzlatkich: Hindistonlik o‘smirlarning hayotni saqlab qoluvchi ixtirosi

Please login to join discussion
  • Trending
  • Comments
  • Latest

Maktabni tashlab, $6,2 million yig‘gan yigit: Nozomio hikoyasi

Oktabr 2, 2025
Juniorlar inqirozi: IT o‘quv markazlari ishsizlar armiyasini tayyorlayaptimi?

Juniorlar inqirozi: IT o‘quv markazlari ishsizlar armiyasini tayyorlayaptimi?

Yanvar 6, 2026
San-Fransiskodan xalqaro bozorga: Airbnbning muvaffaqiyatli startap yo‘li

San-Fransiskodan xalqaro bozorga: Airbnbning muvaffaqiyatli startap yo‘li

Yanvar 4, 2025
Alipos startup received a $200,000 investment offer on the “Taqdimot” TV show

AliPos startapi Taqdimot ko’rsatuvida investorlardan $200,000 lik taklif oldi

Noyabr 25, 2025
Startaplar va ilmiy-tadqiqot loyihalari uchun taniqli o‘zbek grantlari

Startaplar va ilmiy-tadqiqot loyihalari uchun taniqli o‘zbek grantlari

«Har bir rad javobi mening zaif tomonlarimni aniqlashga yordam berdi» — Uzum kompaniyasining timlidi Sardor Xo’jayev IT’dagi faoliyati haqida

«Har bir rad javobi mening zaif tomonlarimni aniqlashga yordam berdi» — Uzum kompaniyasining timlidi Sardor Xo’jayev IT’dagi faoliyati haqida

Quvaytlik investorlar Oʻzbekiston bozoriga qiziqish bildirmoqda

Quvaytlik investorlar Oʻzbekiston bozoriga qiziqish bildirmoqda

2025 yilda NATOning 1 milliard evrolik innovatsion jamg’armasi qo’llab-quvvatlamoqchi bo’lgan VK turlari NATOning 24 ittifoqdoshi tomonidan qo’llab-quvvatlangan jamg’arma hozirgacha oltita VC fondiga sarmoya kiritilishini e’lon qildi.

2025 yilda NATOning 1 milliard evrolik innovatsion jamg’armasi qo’llab-quvvatlamoqchi bo’lgan VK turlari NATOning 24 ittifoqdoshi tomonidan qo’llab-quvvatlangan jamg’arma hozirgacha oltita VC fondiga sarmoya kiritilishini e’lon qildi.

«SaaS o‘ldi» — AQSh armiyasining asosiy dasturiy ta’minot yetkazuvchisi nima uchun bunday demoqda?

«SaaS o‘ldi» — AQSh armiyasining asosiy dasturiy ta’minot yetkazuvchisi nima uchun bunday demoqda?

May 19, 2026
Imzolashdan oldin har bir shartnomani AI o’qisa-chi?

Imzolashdan oldin har bir shartnomani AI o’qisa-chi?

May 15, 2026
UzNIF IPO’si $600 milliondan ortiq mablag‘ jalb qildi

UzNIF IPO’si $600 milliondan ortiq mablag‘ jalb qildi

May 13, 2026
Markaziy Osiyoda $30 millionlik yangi GIG Fund ochildi

Markaziy Osiyoda $30 millionlik yangi GIG Fund ochildi

May 13, 2026

Pivot

We are the Intelligence Platform for Founders & Investors in Emerging Markets — combining news, data, and community to unlock opportunities across GCC, Central Asia, and frontier ecosystems.

Follow us

Categories

  • Yangiliklar
  • Moliyalashtirish va bitimlar
  • Startaplar
  • Venchur kapitali
  • AI
  • Asoschilar hikoyalari
  • O’zbek Startaplar

Pages

  • Bozor ma’lumotlari va hisobotlari
  • Podkastlar
  • Voqealar
  • Uzbek
    • English

Recent Post

  • «SaaS o‘ldi» — AQSh armiyasining asosiy dasturiy ta’minot yetkazuvchisi nima uchun bunday demoqda?
  • Imzolashdan oldin har bir shartnomani AI o’qisa-chi?
  • UzNIF IPO’si $600 milliondan ortiq mablag‘ jalb qildi
  • Privacy policy

© 2025 Pivot

Welcome Back!

Sign In with Google
Sign In with Linked In
OR

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Yangiliklar
  • Moliyalashtirish va bitimlar
  • Startaplar
  • Venchur kapitali
  • AI
  • Asoschilar hikoyalari
  • O’zbek Startaplar
  • Login
  • Cart
  • uz Uzbek
  • en English

© 2025 Pivot

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?