Pivot
  • Bozor ma’lumotlari va hisobotlari
  • Podkastlar
  • Voqealar
  • Uzbek
    • English
No Result
View All Result
  • Login
  • Yangiliklar
  • Moliyalashtirish va bitimlar
  • Startaplar
  • Venchur kapitali
  • AI
  • Asoschilar hikoyalari
  • O’zbek Startaplar
Pivot
  • Bozor ma’lumotlari va hisobotlari
  • Podkastlar
  • Voqealar
  • Uzbek
    • English
No Result
View All Result
Pivot

OpenAI’ning yangi “reasoning” modellari ko‘proq xato qiladi

by Gulnoza Sobirova
Aprel 19, 2025
in Yangiliklar
Reading Time: 2 mins read
A A
OpenAI’ning yangi “reasoning” modellari ko‘proq xato qiladi
Share on FacebookShare on TwitterShare on Telegram

Eng zo‘r, lekin eng chalkashtiruvchi?

OpenAI yaqinda taqdim etgan o3 va o4-mini sun’iy intellekt modellarining hisob-kitob va kod yozishda ajoyib natijalarga erishgani ta’kidlanmoqda. Biroq bitta katta muammo bor — ular avvalgi modellariga qaraganda ko‘proq “hallucinatsiya” qiladi, ya’ni ma’lumotlarni to‘qib chiqaradi.

Avvalgi progress to‘xtadimi?

Odatda har yangi model ilgari chiqarilganidan aniqroq bo‘lardi. Ammo OpenAI’ning ichki testlariga ko‘ra, o3 va o4-mini modellari avvalgi reasoning modellari — o1, o3-mini hamda hatto GPT-4o kabi “an’anaviy” modellar bilan solishtirganda yomonroq natija ko‘rsatgan.

Qanday qilib? Nega?

Masalan, OpenAI’ning “PersonQA” testida:

  • o1 – 16% hallucinatsiya qilgan
  • o3-mini – 14.8%
  • o3 – 33%
  • o4-mini esa 48% hollarda to‘qib chiqargan!

Bunga sabab, bu yangi modellarning ko‘proq mulohaza yuritishga urinishidir. Ko‘proq mulohaza — ko‘proq to‘g‘ri fikrlar bilan birga, ko‘proq noto‘g‘ri xulosalarga ham olib keladi.

Mustaqil tadqiqotlar ham shuni tasdiqlayapti

Transluce nomli nodavlat laboratoriya o3 modelining hattoki “men MacBook Pro’da kodni ishga tushirdim” kabi mutlaqo yolg‘on jarayonlarni uydirib topganini aniqladi. Aslida esa, modelning bunday imkoniyati yo‘q.

Nima qilish mumkin?

Ba’zi yechimlar mavjud:

  • GPT-4o kabi modellar web qidiruv bilan ishlaganda ancha aniq natijalar beradi — SimpleQA testida 90% aniqlik!
  • Ammo bunday yondashuv doim ham ishlamaydi, ayniqsa maxfiylik muhim bo‘lgan sohalarda.

Aql ko‘paydi, aniqlik kamaydi

OpenAI bu muammoni tan oldi va “yana tadqiqot kerak” deya bildirdi. Ammo bu muammo ayniqsa huquq, tibbiyot yoki boshqa yuqori aniqlik talab qilinadigan sohalarda sun’iy intellektdan foydalanishni xavf ostiga qo‘yadi.

Shunday ekan, AI imkoniyatlari kengaygan sari, uning ishonchliligi masalasi ham shunchalik dolzarb bo‘lib bormoqda.

Previous Post

Burger King O‘zbekiston bozoriga kiradi

Next Post

Meta maxfiy AI tajribalari

Gulnoza Sobirova

Related Posts

Oʻzbekiston kapital bozori burilish nuqtasida: $1 mlrd investitsiya, dual listing va Bazel III nimani anglatadi?

Oʻzbekiston kapital bozori burilish nuqtasida: $1 mlrd investitsiya, dual listing va Bazel III nimani anglatadi?

Dekabr 15, 2025
Perplexity AI va Kristiano Ronaldo: “Elite hamkorlik” texnologiya va sport birlashmoqda

Perplexity AI va Kristiano Ronaldo: “Elite hamkorlik” texnologiya va sport birlashmoqda

Dekabr 6, 2025
Nvidia Synopsys’ga $2 milliard investitsiya kiritdi

Nvidia Synopsys’ga $2 milliard investitsiya kiritdi

Dekabr 2, 2025
O‘zbekistonda yangi bank ochilishi kutilmoqda

O‘zbekistonda yangi bank ochilishi kutilmoqda

Dekabr 1, 2025
Next Post
Meta maxfiy AI tajribalari

Meta maxfiy AI tajribalari

Tuz bilan ishlaydigan muzlatkich: Hindistonlik o‘smirlarning hayotni saqlab qoluvchi ixtirosi

Tuz bilan ishlaydigan muzlatkich: Hindistonlik o‘smirlarning hayotni saqlab qoluvchi ixtirosi

Please login to join discussion
  • Trending
  • Comments
  • Latest

Maktabni tashlab, $6,2 million yig‘gan yigit: Nozomio hikoyasi

Oktabr 2, 2025
San-Fransiskodan xalqaro bozorga: Airbnbning muvaffaqiyatli startap yo‘li

San-Fransiskodan xalqaro bozorga: Airbnbning muvaffaqiyatli startap yo‘li

Yanvar 4, 2025
Alipos startup received a $200,000 investment offer on the “Taqdimot” TV show

AliPos startapi Taqdimot ko’rsatuvida investorlardan $200,000 lik taklif oldi

Noyabr 25, 2025
Chanel brendi tarixi: moda, atir va innovatsiyaga boy safar

Chanel brendi tarixi: moda, atir va innovatsiyaga boy safar

Fevral 17, 2025
Startaplar va ilmiy-tadqiqot loyihalari uchun taniqli o‘zbek grantlari

Startaplar va ilmiy-tadqiqot loyihalari uchun taniqli o‘zbek grantlari

«Har bir rad javobi mening zaif tomonlarimni aniqlashga yordam berdi» — Uzum kompaniyasining timlidi Sardor Xo’jayev IT’dagi faoliyati haqida

«Har bir rad javobi mening zaif tomonlarimni aniqlashga yordam berdi» — Uzum kompaniyasining timlidi Sardor Xo’jayev IT’dagi faoliyati haqida

Quvaytlik investorlar Oʻzbekiston bozoriga qiziqish bildirmoqda

Quvaytlik investorlar Oʻzbekiston bozoriga qiziqish bildirmoqda

2025 yilda NATOning 1 milliard evrolik innovatsion jamg’armasi qo’llab-quvvatlamoqchi bo’lgan VK turlari NATOning 24 ittifoqdoshi tomonidan qo’llab-quvvatlangan jamg’arma hozirgacha oltita VC fondiga sarmoya kiritilishini e’lon qildi.

2025 yilda NATOning 1 milliard evrolik innovatsion jamg’armasi qo’llab-quvvatlamoqchi bo’lgan VK turlari NATOning 24 ittifoqdoshi tomonidan qo’llab-quvvatlangan jamg’arma hozirgacha oltita VC fondiga sarmoya kiritilishini e’lon qildi.

Oʻzbekiston kapital bozori burilish nuqtasida: $1 mlrd investitsiya, dual listing va Bazel III nimani anglatadi?

Oʻzbekiston kapital bozori burilish nuqtasida: $1 mlrd investitsiya, dual listing va Bazel III nimani anglatadi?

Dekabr 15, 2025
YouTube: hazildan boshlangan startap 2026 yilda janrga asoslangan TV obunalarini ishga tushiradi

YouTube: hazildan boshlangan startap 2026 yilda janrga asoslangan TV obunalarini ishga tushiradi

Dekabr 11, 2025
Pitch yoki failure: pitchdan oldin startap asoschilari uchun yakuniy tayyorlik cheklisti

Pitch yoki failure: pitchdan oldin startap asoschilari uchun yakuniy tayyorlik cheklisti

Dekabr 11, 2025
O‘zbekiston farmatsevtika sektori: tizimli muammolar va ularni yechishi mumkin bo‘lgan startaplar bozori

O‘zbekiston farmatsevtika sektori: tizimli muammolar va ularni yechishi mumkin bo‘lgan startaplar bozori

Dekabr 8, 2025

Pivot

We are the Intelligence Platform for Founders & Investors in Emerging Markets — combining news, data, and community to unlock opportunities across GCC, Central Asia, and frontier ecosystems.

Follow us

Categories

  • Yangiliklar
  • Moliyalashtirish va bitimlar
  • Startaplar
  • Venchur kapitali
  • AI
  • Asoschilar hikoyalari
  • O’zbek Startaplar

Pages

  • Bozor ma’lumotlari va hisobotlari
  • Podkastlar
  • Voqealar
  • Uzbek
    • English

Recent Post

  • Oʻzbekiston kapital bozori burilish nuqtasida: $1 mlrd investitsiya, dual listing va Bazel III nimani anglatadi?
  • YouTube: hazildan boshlangan startap 2026 yilda janrga asoslangan TV obunalarini ishga tushiradi
  • Pitch yoki failure: pitchdan oldin startap asoschilari uchun yakuniy tayyorlik cheklisti
  • Privacy policy

© 2025 Pivot

Welcome Back!

Sign In with Google
Sign In with Linked In
OR

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Yangiliklar
  • Moliyalashtirish va bitimlar
  • Startaplar
  • Venchur kapitali
  • AI
  • Asoschilar hikoyalari
  • O’zbek Startaplar
  • Login
  • Cart
  • uz Uzbek
  • en English

© 2025 Pivot

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?