آزمایشگاه Kyutai روز چهارشنبه Moshi AI را راه اندازی کرد، یک ربات چت هوش مصنوعی (AI) که به صورت شفاهی در زمان واقعی پاسخ می دهد. شرکت فرانسوی هوش مصنوعی اعلام کرده است که کل مدل زبان صوتی Moshi در داخل توسعه داده شده است. همچنین می تواند صدا را برای بیان احساسات و پاسخ به سبک های مختلف گفتاری تعدیل کند. مدل هوش مصنوعی برای عموم به صورت رایگان قابل دسترسی است. در حال حاضر، مدل هوش مصنوعی مکالمات را به پنج دقیقه محدود می کند. جالب اینجاست که OpenAI نیز با انتشار GPT-4o ویژگی های گفتاری مشابهی را اعلام کرد، اما هنوز منتشر نشده است.
ویژگی های موشی هوش مصنوعی
این شرکت بیان می کند که مدل هوش مصنوعی در مدت شش ماه با یک تیم هشت نفره توسعه یافته است. آزمایشگاه Kyutai هنگام رونمایی از مدل هوش مصنوعی در رویدادی در پاریس گفت که موشی یک دستیار هوش مصنوعی نیست، بلکه یک نمونه اولیه است که می تواند برای توسعه ابزارهایی برای موارد مختلف استفاده شود. همچنین ربات چت را در اینجا در دسترس عموم قرار داده است. کاربران میتوانند ایمیل خود را وارد کرده و به صف بپیوندند، اما کارکنان Gadgets 360 میتوانند بدون هیچ زمان انتظاری به پلتفرم دسترسی فوری داشته باشند.
دیروز ما Moshi را معرفی کردیم، کمترین تأخیر هوش مصنوعی مکالمهای که تاکنون منتشر شده است. موشی می تواند صحبت های کوچک انجام دهد، مفاهیم مختلف را توضیح دهد، در بسیاری از احساسات و سبک های گفتاری نقش آفرینی کند. اینجا https://t.co/a4EbAQiih7 با موشی صحبت کنید و در مورد روش زیر بیشتر بدانید 🧵. pic.twitter.com/NkJRybTRLQ
— kyutai (@kyutai_labs) 4 جولای 2024
رابط پلتفرم کاملاً مینیمالیستی است. یک طراحی هوش مصنوعی ساده وجود دارد که در آن کاربران می توانند بلندی صدای خود را هنگام صحبت کردن بررسی کنند. یک کادر متنی وجود دارد که در آن فقط پاسخ های هوش مصنوعی ظاهر می شود. جعبه دیگری نزدیک بالا جزئیات فنی مانند مدت زمان صدا، تأخیر و صدای از دست رفته را نشان می دهد.
در بالا، دکمه ای برای قطع تماس وجود دارد. در حال حاضر، حداکثر مدت تماس می تواند پنج دقیقه باشد. صفحه توضیحات نشان می دهد که موشی می تواند همزمان فکر کند، صحبت کند و گوش دهد تا جریان مکالمه را به حداکثر برساند.
گجتهای 360 دریافتند که تأخیر بسیار کم است و هوش مصنوعی اغلب فوراً پاسخ میدهد. با این حال، چند مورد وجود دارد که تاخیر در زمان پاسخ می تواند از 10 تا 15 ثانیه بیشتر شود. اما این می تواند به دلیل بار زیاد سرور باشد. با این حال، گاهی اوقات حتی پس از پر شدن سه چهارم حجم سنج، پیام های شفاهی اصلاً ثبت نمی شد.
گجت 360 همچنین دریافت که مدل هوش مصنوعی می تواند با صدایی احساسی پاسخ دهد و می تواند به سبک های مختلف و با استفاده از مدولاسیون های صوتی مختلف صحبت کند. مدل هوش مصنوعی همچنین به اینترنت متصل است و میتواند به پرسشهایی که نیاز به جستجو در وب دارند، پاسخ دهد. قابل ذکر است که ربات چت اجازه پیام های متنی را نمی دهد و صدا تنها رسانه ای است که با آن ارتباط برقرار می کند.
آزمایشگاه Kyutai اعلام کرده است که مدل هوش مصنوعی منبع باز خواهد بود. با این حال، شرکت هوش مصنوعی هنوز وزن و کد مدل را در یک پورتال میزبانی نکرده است. پس از در دسترس قرار گرفتن، کاربران می توانند آن را به صورت محلی دانلود و نصب کنند، و می توان آن را در دستگاه غیر متصل اجرا کرد.
برای آخرین اخبار و بررسیهای فنی، Gadgets 360 را دنبال کنید ایکس، فیس بوک، واتس اپ، موضوعات و اخبار گوگل. برای آخرین ویدیوها در مورد ابزارها و فناوری، در کانال YouTube ما مشترک شوید. اگر می خواهید همه چیز را در مورد تأثیرگذاران برتر بدانید، Who’sThat360 داخلی ما را در اینستاگرام و یوتیوب دنبال کنید.
محدوده قیمت Lava Blaze X 5G قبل از عرضه در هند فاش شد. به ویژگی MediaTek Dimensity 7050 SoC اشاره شده است