راه ترقی

آخرين مطالب

مدل‌های هوش مصنوعی استدلالی جدید «اوپن‌ای‌آی» بیشتر توهم می‌زنند دانش

مدل‌های هوش مصنوعی استدلالی جدید «اوپن‌ای‌آی» بیشتر توهم می‌زنند
  بزرگنمايي:

راه ترقی - ایسنا /بررسی‌ها حاکی از آن هستند که امکان بروز توهم و تولید محتوای نادرست در مدل‌های هوش مصنوعی استدلالی جدید «اوپن‌ای‌آی» بیشتر است.
مدل‌های هوش مصنوعی «o3» و «o4-mini» شرکت «اوپن‌ای‌آی»(OpenAI) که اخیرا عرضه شده‌اند، از بسیاری جهت‌ها پیشرفته هستند. با وجود این، مدل‌های جدید هنوز هم به توهم دچار می‌شوند یا محتوا را از خود می‌سازند. در واقع، آنها بیش از چندین مدل قدیمی اوپن‌ای‌آی توهم دارند.
به نقل از تک کرانچ، توهم در حوزه هوش مصنوعی به تولید محتوای نادرست یا غیر منطقی توسط یک مدل گفته می‌شود. ثابت شده است که توهمات یکی از بزرگ‌ترین و دشوارترین مشکلات برای حل کردن در حوزه هوش مصنوعی هستند و حتی بر سیستم‌های با بهترین عملکرد امروزی نیز تأثیر می‌گذارند. همه مدل‌های جدید معمولا کمی در بخش توهم بهبود یافته‌اند و کمتر از مدل پیشین خود توهم ایجاد می‌کنند، اما به نظر نمی‌رسد که این در مورد o3 و o4-mini صدق کند.
آزمایش‌های داخلی شرکت اوپن‌ای‌آی نشان می‌دهند o3 و o4-mini که «مدل‌های استدلالی» هستند، بیشتر از مدل‌های استدلالی پیشین شرکت شامل «o1»، «o1-mini» و «o3-mini» و همچنین، مدل‌های سنتی و غیر استدلالی آن مانند «GPT-4o» دچار توهم می‌شوند.
موضوع نگران‌کننده‌تر این است که سازنده «چت‌جی‌پی‌تی»(ChatGPT) واقعا نمی‌داند چرا این اتفاق رخ می‌دهد. اوپن‌ای‌آی در گزارش فنی خود برای o3 و o4-mini نوشت: هنوز به بررسی‌های بیشتری نیاز است تا بفهمیم چرا توهمات با افزایش مدل‌های استدلالی بدتر می‌شوند. مدل‌های O3 و o4-mini در برخی زمینه‌ها از جمله وظایف مربوط به کدنویسی و ریاضی عملکرد بهتری دارند، اما از آنجا که آنها در کل ادعاهای بیشتری دارند، اغلب به سمت ادعاهای دقیق‌تر و ادعاهای نادرست و توهم بیشتر می‌روند.
اوپن‌ای‌آی دریافت o3 در پاسخ به 33 درصد از پرسش‌ها پیرامون «PersonQA» که معیار داخلی شرکت برای سنجش دقت دانش یک مدل درباره افراد است، توهم ایجاد می‌کند. این تقریبا دو برابر میزان توهم مدل‌های استدلال پیشین اوپن‌ای‌آی شامل o1 و o3-mini است که به ترتیب به 16 و 14.8 درصد پرسش‌ها پاسخ داده‌اند. مدل O4-mini حتی درباره PersonQA بدتر عمل کرد و 48 درصد مواقع توهم‌زدگی داشت.
بررسی انجام‌شده در آزمایشگاه پژوهشی غیرانتفاعی هوش مصنوعی «Transluce» نیز شواهدی یافت مبنی بر این که o3 تمایل دارد اقدامات صورت‌گرفته در فرآیند رسیدن به پاسخ را جبران کند.
«نیل چاودری»(Neil Chowdhury)، پژوهشگر Transluce و کارمند سابق اوپن‌ای‌آی در ایمیلی به تک کرانچ نوشت: فرضیه ما این است که نوع یادگیری تقویت‌یافته مورد استفاده برای مدل‌های سری o ممکن است مشکلات کاهش‌یافته پس از آموزش را تقویت کند.
«سارا شوتمن»(Sarah Schwettmann) یکی از بنیان‌گذاران Transluce اضافه کرد که میزان توهم o3 ممکن است آن را کمتر از آنچه می‌توانست باشد، سودمند کند.
«کیان کتان‌فروش»، استاد کمکی «دانشگاه استنفورد» و مدیرعامل استارت‌آپ ارتقاء مهارت «Workera» به تک کرانچ گفت که گروه او در حال حاضر در حال آزمایش o3 در گردش کار کدگذاری خود هستند و دریافته‌اند که آن را یک گام جلوتر از رقبا قرار داده‌اند. با وجود این، کتان‌فروش معتقد است که o3 به توهم تمایل دارد. این مدل، پیوندهایی را ارائه می‌دهد که وقتی روی آنها کلیک شود، کار نمی‌کند.
توهمات ممکن است به مدل‌ها کمک کنند تا به ایده‌های جالبی برسند و در تفکر خود خلاق باشند، اما فروش برخی از مدل‌ها را در بازارهایی که دقت در آنها مهم است، به کار سختی تبدیل می‌کنند. به عنوان مثال، یک شرکت حقوقی احتمالا از مدلی که خطاهای واقعی زیادی را در قراردادهای مشتری وارد می‌کند، راضی نخواهد بود.
یکی از روش‌های امیدوارکننده برای افزایش دقت مدل‌ها، دادن قابلیت‌های جست‌وجوی وب به آنهاست. مدل GPT-4o با جست‌وجوی وب، دقت 90 را در SimpleQA به دست می‌آورد که یکی دیگر از معیارهای دقت اوپن‌ای‌آی است. به طور بالقوه، جست‌وجو می‌تواند نرخ توهم مدل‌های استدلالی را نیز بهبود ببخشد.
اگر گسترش مدل‌های استدلالی واقعا به تشدید توهم ادامه دهد، جست‌وجو برای یافتن راه‌ حل را بیش از پیش ضروری می‌کند. «نیکو فلیکس»(Niko Felix)، سخن‌گوی اوپن‌ای‌آی در یک ایمیل به تک کرانچ نوشت: رسیدگی به توهمات در همه مدل‌های ما یک حوزه تحقیقاتی مداوم است و ما پیوسته برای بهبود دقت و قابلیت اطمینان آنها تلاش می‌کنیم.

لینک کوتاه:
https://www.rahetaraghi.ir/Fa/News/1064452/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

توتونچی: در چندهفته چه بلایی سر سپاهان آمد؟

سیاست مذاکراتی جدید آمریکا؛ به مرگ بگیر تا به تب راضی شود/ صحبت‌های ویتکاف جنجالی شد

تیم ملی چوگان ایران راهی جام جهانی شد

مومنی: به ارکان قضایی پاسخگو هستیم نه باشگاه نساجی

سیف‌الله‌پور: چون یک سال گذشته مس نباید مجازات شود؟

قلعه‌نویی: به‌عنوان سرگروه صعود کنیم تا در سید 2 باشیم

نساجی هنوز زنده‌ است!

توتونچی: دنبال‌ چه هستید که استقلال نتیجه نمی‌گیرد؟

گل زیبای ریکاردو اورسولینی به میلان؛ میلان 0_1 بولونیا

جشن قهرمانی تیم شباب الاهلی در جام ریاست جمهوری امارات

انتقاد مهدی توتونچی به صحبت‌های آذری جهرمی، درباره پخش بازی استقلال و چادرملو در شبکه نسیم

گزارشی از پیام رهبر انقلاب به همایش یکصدمین سالگرد تاسیس حوزه علمیه

عمان: دور چهارم مذاکرات ایران و آمریکا یکشنبه در مسقط برگزار می شود

ویتکاف: موضع ما درباره ایران نداشتن غنی‌سازی است

سقوط 8 تن از اعضای یک خانواده در چاه کشاورزی؛ 7 نفر جان باختند

پیش بینی قیمت طلا و سکه 20 اردیبهشت 1404

صیادمنش با گل غیبت شد!

امسال یکی از بدترین سال های فوتبالی استقلال بود

علیدوستی، پیشکسوت تیم ملی فوتبال: مطالعه میکنم، مینویسم و از فوتبال گذر کردم

صحبت رییس معاون ورزشی جزیره کیش در حاشیه دیدار خیریه تیم ملی پیشکسوتان و منتخب جزیره کیش

صحبت های رییس سازمان منطقه آزاد کیش در حاشیه دیدار خیریه تیم ملی پیشکسوتان و منتخب جزیره کیش

ضیایی، مدیر سابق آکادمی استقلال: تا آخر برج 3 با استقلال قرارداد دارم

اخراج مردی که آخرین حذف تراکتور را رقم زد!

انفجار دیرهنگام مهاجم مشهور فوتبال ایران!

جواد خیابانی استاد دانشگاه شد

تیم منتخب بوندسلیگا در تسخیر شاگردان کمپانی!

دانشجوی ایرانی پس از 40 روز بازداشت، تصمیم به ترک آمریکا گرفت

نماینده ترامپ: ایران نه می‌تواند غنی‌سازی کند، نه سانتریفیوژ داشته باشد

کاخ سفید: ترامپ هنوز تصمیمی برای تغییر نام «خلیج فارس» نگرفته است

از بلاتکلیفی سینماهای قدیمی تا یادآوری خلیج همیشه پارس در سینما

درخواست شلاق برای هانیه توسلی و ترانه علیدوستی توسط تهیه کننده معروف!

رضا بابک و بهرام شاه محمدلو به اکران یک فیلم آمدند

استوری بی نظیر محسن چاوشی درباره خلیج‌فارس

قطعه «گل سنگم» استاد انوشیروان روحانی با پیانوی سامان احتشامی

اجرای احساسی قطعه «اسکله» از محسن یگانه در کنسرت اروپا

بدون تعارف امشب با حاج علی ملائکه مداح و خادم حرم مطهر رضوی

جشن بزرگ امام رضایی ها در تهران

مریخ، ثبت شده توسط Curiosity

امواج گرانشی زیبا

تو شبی تنگ در آغوشم کش!

این درخت کهن منم

رالی بیت کوین به اوج؛ هدف بعدی 105 هزار دلار؟

طارمی برای مهار یامال تمرین کرده بود

حواشی هفته بیست و نهم لیگ برتر ایران

حمایت بهتاش فریبا از جباری در صورت قهرمانی جام حذفی

مهدوی: حق تراکتور قهرمانی بود چون خداداد را داشت

پوکر قهرمانی 2 ستاره تیم ملی در کنار خلیج فارس!

بیرانوند، شجاع و حالا علی علیپور؛ کافی است!

برتری تیم هندبال ساحلی ایران مقابل اردن و صعود به دور بعد

پرسپولیس از باشگاه خیبر شکایت کرد