Moshi AI Chatbot با ویژگی های صدای بلادرنگ توسط Kyutai Labs به عنوان رقیب GPT-4o راه اندازی شد

آزمایشگاه Kyutai روز چهارشنبه Moshi AI را راه اندازی کرد، یک ربات چت هوش مصنوعی (AI) که به صورت شفاهی در زمان واقعی پاسخ می دهد. شرکت فرانسوی هوش مصنوعی اعلام کرده است که کل مدل زبان صوتی Moshi در داخل توسعه داده شده است. همچنین می تواند صدا را برای بیان احساسات و پاسخ به سبک های مختلف گفتاری تعدیل کند. مدل هوش مصنوعی برای عموم به صورت رایگان قابل دسترسی است. در حال حاضر، مدل هوش مصنوعی مکالمات را به پنج دقیقه محدود می کند. جالب اینجاست که OpenAI نیز با انتشار GPT-4o ویژگی های گفتاری مشابهی را اعلام کرد، اما هنوز منتشر نشده است.

ویژگی های موشی هوش مصنوعی

این شرکت بیان می کند که مدل هوش مصنوعی در مدت شش ماه با یک تیم هشت نفره توسعه یافته است. آزمایشگاه Kyutai هنگام رونمایی از مدل هوش مصنوعی در رویدادی در پاریس گفت که موشی یک دستیار هوش مصنوعی نیست، بلکه یک نمونه اولیه است که می تواند برای توسعه ابزارهایی برای موارد مختلف استفاده شود. همچنین ربات چت را در اینجا در دسترس عموم قرار داده است. کاربران می‌توانند ایمیل خود را وارد کرده و به صف بپیوندند، اما کارکنان Gadgets 360 می‌توانند بدون هیچ زمان انتظاری به پلتفرم دسترسی فوری داشته باشند.

رابط پلتفرم کاملاً مینیمالیستی است. یک طراحی هوش مصنوعی ساده وجود دارد که در آن کاربران می توانند بلندی صدای خود را هنگام صحبت کردن بررسی کنند. یک کادر متنی وجود دارد که در آن فقط پاسخ های هوش مصنوعی ظاهر می شود. جعبه دیگری نزدیک بالا جزئیات فنی مانند مدت زمان صدا، تأخیر و صدای از دست رفته را نشان می دهد.

در بالا، دکمه ای برای قطع تماس وجود دارد. در حال حاضر، حداکثر مدت تماس می تواند پنج دقیقه باشد. صفحه توضیحات نشان می دهد که موشی می تواند همزمان فکر کند، صحبت کند و گوش دهد تا جریان مکالمه را به حداکثر برساند.

گجت‌های 360 دریافتند که تأخیر بسیار کم است و هوش مصنوعی اغلب فوراً پاسخ می‌دهد. با این حال، چند مورد وجود دارد که تاخیر در زمان پاسخ می تواند از 10 تا 15 ثانیه بیشتر شود. اما این می تواند به دلیل بار زیاد سرور باشد. با این حال، گاهی اوقات حتی پس از پر شدن سه چهارم حجم سنج، پیام های شفاهی اصلاً ثبت نمی شد.

صدای موشی آی آی موشی

رابط هوش مصنوعی موشی
اعتبار عکس: آزمایشگاه کیوتای

گجت 360 همچنین دریافت که مدل هوش مصنوعی می تواند با صدایی احساسی پاسخ دهد و می تواند به سبک های مختلف و با استفاده از مدولاسیون های صوتی مختلف صحبت کند. مدل هوش مصنوعی همچنین به اینترنت متصل است و می‌تواند به پرسش‌هایی که نیاز به جستجو در وب دارند، پاسخ دهد. قابل ذکر است که ربات چت اجازه پیام های متنی را نمی دهد و صدا تنها رسانه ای است که با آن ارتباط برقرار می کند.

آزمایشگاه Kyutai اعلام کرده است که مدل هوش مصنوعی منبع باز خواهد بود. با این حال، شرکت هوش مصنوعی هنوز وزن و کد مدل را در یک پورتال میزبانی نکرده است. پس از در دسترس قرار گرفتن، کاربران می توانند آن را به صورت محلی دانلود و نصب کنند، و می توان آن را در دستگاه غیر متصل اجرا کرد.

برای آخرین اخبار و بررسی‌های فنی، Gadgets 360 را دنبال کنید ایکس، فیس بوک، واتس اپ، موضوعات و اخبار گوگل. برای آخرین ویدیوها در مورد ابزارها و فناوری، در کانال YouTube ما مشترک شوید. اگر می خواهید همه چیز را در مورد تأثیرگذاران برتر بدانید، Who’sThat360 داخلی ما را در اینستاگرام و یوتیوب دنبال کنید.

محدوده قیمت Lava Blaze X 5G قبل از عرضه در هند فاش شد. به ویژگی MediaTek Dimensity 7050 SoC اشاره شده است

منبع