OpenAI مدل CriticGPT را با قابلیت تشخیص خطاهای تولید کد GPT-4 توسعه می دهد

OpenAI مطالعه ای را در مورد یک مدل هوش مصنوعی جدید (AI) در روز پنجشنبه منتشر کرد که می تواند اشتباهات GPT-4 در تولید کد را تشخیص دهد. این شرکت هوش مصنوعی اعلام کرد که چت بات جدید با استفاده از چارچوب یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش داده شده و توسط یکی از مدل‌های GPT-4 طراحی شده است. چت ربات در حال توسعه برای بهبود کیفیت کدهای تولید شده توسط هوش مصنوعی که کاربران از مدل های زبان بزرگ دریافت می کنند، طراحی شده است. در حال حاضر، این مدل در دسترس کاربران یا آزمایش کنندگان نیست. OpenAI همچنین چندین محدودیت مدل را برجسته کرده است.

OpenAI جزئیات مربوط به CriticGPT را به اشتراک می گذارد

این شرکت هوش مصنوعی جزئیات مدل جدید CriticGPT را در یک پست وبلاگ به اشتراک گذاشت و بیان کرد که این مدل مبتنی بر GPT-4 است و برای شناسایی خطاهای کد تولید شده توسط ChatGPT طراحی شده است. این شرکت ادعا می‌کند: «ما دریافتیم که وقتی افراد برای بررسی کد ChatGPT از CriticGPT کمک می‌گیرند، ۶۰ درصد مواقع از کسانی که کمک نمی‌کنند بهتر عمل می‌کنند.» این مدل با استفاده از چارچوب RLHF توسعه داده شده است و یافته‌ها در یک مقاله منتشر شده است.

RLHF یک تکنیک یادگیری ماشینی است که خروجی ماشین را با انسان برای آموزش سیستم های هوش مصنوعی ترکیب می کند. در چنین سیستمی، ارزیاب های انسانی بازخورد عملکرد هوش مصنوعی را ارائه می دهند. این برای تنظیم و بهبود رفتار مدل استفاده می شود. به افرادی که به هوش مصنوعی بازخورد می دهند، مربیان هوش مصنوعی می گویند.

CriticGPT روی حجم زیادی از داده‌های کد که حاوی خطا بودند آموزش داده شد. وظیفه مدل هوش مصنوعی یافتن این اشتباهات و نقد کدها بود. برای این کار، از مربیان هوش مصنوعی خواسته شد تا اشتباهات را در کد روی اشتباهات طبیعی بنویسند و سپس بازخورد نمونه بنویسند که گویی آن خطاها را دریافت کرده اند.

هنگامی که CriticGPT انواع مختلف نقد خود را به اشتراک گذاشت، از مربیان خواسته شد تا تشخیص دهند که آیا خطاهایی که درج کرده اند توسط هوش مصنوعی در کنار خطاهای طبیعی رخ می دهد یا خیر. OpenAI در تحقیقات خود دریافت که CriticGPT 63 درصد بهتر از ChatGPT در کشف خطاها عمل می کند.

با این حال، این مدل هنوز محدودیت های خاصی دارد. CriticGPT بر روی رشته های کوتاه کد تولید شده توسط OpenAI آموزش دیده است. این مدل هنوز روی مجموعه های طولانی و پیچیده از وظایف آموزش داده نشده است. شرکت هوش مصنوعی همچنین دریافت که چت ربات جدید همچنان به توهم زدن (تولید پاسخ های واقعی نادرست) ادامه می دهد. علاوه بر این، این مدل در سناریوهایی که چندین خطا در کد پراکنده شده است، آزمایش نشده است.

بعید است که این مدل عمومی شود، زیرا برای کمک به OpenAI در درک بهتر تکنیک‌های آموزشی که می‌توانند خروجی‌های با کیفیت بالاتری تولید کنند، طراحی شده است. اگر CriticGPT آن را در دسترس عموم قرار دهد، اعتقاد بر این است که در ChatGPT یکپارچه شده است.

برای آخرین اخبار و بررسی‌های فنی، Gadgets 360 را دنبال کنید ایکس، فیس بوک، واتس اپ، موضوعات و اخبار گوگل. برای آخرین ویدیوها در مورد ابزارها و فناوری، در کانال YouTube ما مشترک شوید. اگر می خواهید همه چیز را در مورد تأثیرگذاران برتر بدانید، Who’sThat360 داخلی ما را در اینستاگرام و یوتیوب دنبال کنید.

بولیوی ممنوعیت بیت کوین را معکوس می کند، تراکنش های رمزنگاری را برای بانک ها قانونی می کند

منبع