با این حال، این ممکن است تأثیر محدودی بر Claude 2 داشته باشد. استرلینگ به TechNewsWorld گفت: «بیشتر مردم تفاوتهای عمدهای را مشاهده نمیکنند مگر اینکه از همه این برنامهها در کنار هم استفاده کنند. تفاوتهایی که افراد ممکن است درک کنند در درجه اول در رابطهای کاربری است.
آنتروپیک در بیانیه ای گفت: “کلود را به عنوان یک همکار دوستانه، مشتاق یا دستیار شخصی در نظر بگیرید که می تواند به زبان طبیعی آموزش ببیند تا در بسیاری از وظایف به شما کمک کند.”
آنتروپیک اضافه کرد که کلود اکنون میتواند اسناد طولانیتری نیز بنویسد – از یادداشتها گرفته تا نامهها و داستانها تا چند هزار کلمه.
تبلیغات
به گفته آنتروپیک، Claude 2 نسبت به مدلهای قبلی در زمینههای کدنویسی، ریاضی و استدلال بهبود یافته است.
حتی اگر Claude 2 بتواند به قول خود مبنی بر اینکه یک چت ربات هوش مصنوعی «مفید، بی ضرر و صادق» باشد عمل کند، باید بجنگد تا در بازاری که در حال تبدیل شدن به یک بازار بسیار پر سر و صدا است، مورد توجه قرار گیرد.
اندرل خاطرنشان کرد: «ما از تعداد چیزهای اعلام شده غرق شدهایم و بالا رفتن از سر و صدا را سختتر میکند.
آنتروپیک همچنین از پیشرفتهای ایمنی انجامشده در کلود 2 حمایت کرد. توضیح داد که یک «تیم قرمز» داخلی دارد که مدلهای خود را بر اساس مجموعهای از پیامهای مضر امتیاز میدهد. تست ها خودکار هستند، اما نتایج به طور مرتب به صورت دستی بررسی می شوند. در آخرین ارزیابی خود، Anthropic اشاره کرد که Claude 2 در ارائه پاسخ های بی ضرر دو برابر بهتر از Claude 1.3 بود.
روز سهشنبه توسط توسعهدهنده آن، آنتروپیک، یک چت ربات جدید هوش مصنوعی که بهعنوان «مفید، بیضرر و صادقانه» نامگذاری شده بود، جمعآوری شد.
علاوه بر این، مجموعهای از اصول به نام قانون اساسی در سیستم تعبیه شده است که میتواند پاسخهای آن را بدون نیاز به استفاده از ناظم انسانی تعدیل کند.
کاهش آسیب
پنجره زمینه کلود 2 می تواند تا 75000 کلمه را مدیریت کند. این بدان معناست که کلود می تواند صدها صفحه از اسناد فنی یا حتی یک کتاب را هضم کند. در مقایسه، حداکثر ورودی ChatGPT 3000 کلمه است.
با این حال، آن را تنها کمی بهتر از سلف خود در GSM8K، که شامل مجموعه بزرگی از مسائل ریاضی کلاس مدرسه، کسب امتیاز 88.0٪، در مقایسه با 85.2٪ برای Claude 1.3 بود.
تاخیر دانش
مانند ChatGPT، کلود به اینترنت متصل نیست. بر روی دادههایی که بهطور ناگهانی در دسامبر 2022 به پایان میرسند آموزش داده شده است. این به آن برتری جزئی نسبت به ChatGPT میدهد، که دادههای آن در حال حاضر در سپتامبر 2021 قطع میشود – اما از بینگ و بارد عقبتر است.
او به TechNewsWorld گفت: «در حالی که مایکروسافت میتواند بینگ را به مجموعه بهرهوری خود بیاورد، کلود میخواهد دستیار شخصی مفیدتر از بقیه باشد.
نمرات استدلال بهبود یافته
در امتحانات خواندن و نوشتن GRE برای دانشجویان کالج متقاضی تحصیلات تکمیلی، کلود 2 بالاتر از صدک 90 را کسب کرد. در استدلال کمی، به خوبی متقاضیان بود.