مدل های زبان کوچکتر برای دستگاه های موبایل

در حالی که مدل‌های هوش مصنوعی با زبان بزرگ همچنان سرفصل خبرها هستند، مدل‌های زبان کوچک جایی هستند که عمل می‌کنند. طبق مقاله ای که اخیرا توسط تیمی از دانشمندان تحقیقاتی منتشر شده است، حداقل، به نظر می رسد متا روی آن شرط بندی کرده است.

مدل‌های زبان بزرگ مانند ChatGPT، Gemini و Llama می‌توانند از میلیاردها و حتی تریلیون‌ها پارامتر برای به دست آوردن نتایج خود استفاده کنند. اندازه این مدل‌ها باعث می‌شود که آن‌ها برای اجرا در دستگاه‌های تلفن همراه بسیار بزرگ باشند. بنابراین، دانشمندان متا در تحقیقات خود خاطرنشان کردند، نیاز روزافزونی به مدل‌های زبان بزرگ کارآمد در دستگاه‌های تلفن همراه وجود دارد – نیازی که ناشی از افزایش هزینه‌های ابری و نگرانی‌های مربوط به تأخیر است.

در تحقیقات خود، دانشمندان توضیح دادند که چگونه مدل‌های زبان بزرگ با کیفیت بالا با کمتر از یک میلیارد پارامتر ایجاد کردند که به گفته آنها اندازه خوبی برای استقرار تلفن همراه است.

برخلاف باور رایج که بر نقش محوری داده ها و کمیت پارامتر در تعیین کیفیت مدل تاکید می کند، دانشمندان با مدل زبان کوچک خود به نتایجی دست یافتند که در برخی زمینه ها با Llama LLM متا قابل مقایسه است.

نیک دی جیاکومو، مدیرعامل Bucephalus، یک پلتفرم زنجیره تامین تجارت الکترونیک مبتنی بر هوش مصنوعی مستقر در شهر نیویورک، گفت: «الگوی غالب وجود دارد که «بزرگ‌تر، بهتر است، اما این نشان می‌دهد که واقعاً به نحوه استفاده از پارامترها مربوط می‌شود.

او به TechNewsWorld گفت: «این راه را برای پذیرش گسترده‌تر هوش مصنوعی روی دستگاه هموار می‌کند.

گامی حیاتی

داریان شیمی، مدیر عامل و موسس FutureFund، یک شرکت سرمایه گذاری خطرپذیر در سانفرانسیسکو، توضیح داد که تحقیقات متا بسیار مهم است زیرا هنجار فعلی هوش مصنوعی متکی به ابر را به چالش می کشد، که اغلب می بیند که داده ها در مراکز داده دور افتاده خرد می شوند.

متا با وارد کردن پردازش هوش مصنوعی به خود دستگاه، اسکریپت را تغییر می‌دهد – به طور بالقوه ردپای کربن مرتبط با انتقال و پردازش داده‌ها در مراکز داده عظیم و پرمصرف را کاهش می‌دهد و هوش مصنوعی مبتنی بر دستگاه را به یک بازیگر کلیدی در اکوسیستم فناوری تبدیل می‌کند. او به TechNewsWorld گفت.

یاشین منراج، مدیرعامل Pvotal Technologies، یک توسعه‌دهنده نرم‌افزار امنیتی سرتاسر، در ایگل پوینت، اوری، افزود: «این تحقیق اولین تلاش جامع و مشترک عمومی با این بزرگی است.

او به TechNewsWorld گفت: «این اولین گام مهم در دستیابی به یک رویکرد هماهنگ SLM-LLM است که در آن توسعه دهندگان می توانند تعادل مناسب بین پردازش داده های ابری و روی دستگاه را پیدا کنند. این زمینه را ایجاد می‌کند که در آن وعده‌های برنامه‌های کاربردی مبتنی بر هوش مصنوعی می‌توانند به سطح پشتیبانی، اتوماسیون و کمکی برسند که در سال‌های اخیر به بازار عرضه شده‌اند، اما فاقد ظرفیت مهندسی برای پشتیبانی از این دیدگاه‌ها هستند.»

دانشمندان متا نیز گام مهمی در کوچک کردن مدل زبان برداشته‌اند. Nishant Neekhra، مدیر ارشد بازاریابی تلفن همراه در Skyworks Solutions، یک شرکت نیمه هادی در Westlake Village در کالیفرنیا، گفت: «آنها یک مدل کوچک شدن را به ترتیب بزرگی پیشنهاد می کنند که آن را برای ابزارهای پوشیدنی، شنیدنی و تلفن های همراه قابل دسترس تر می کند.

او به TechNewsWorld گفت: «آنها در حال ارائه مجموعه جدیدی از برنامه های کاربردی برای هوش مصنوعی هستند و در عین حال راه های جدیدی را برای تعامل هوش مصنوعی در دنیای واقعی ارائه می دهند. آنها همچنین با کوچک شدن، چالش بزرگی را که LLM ها را درگیر کرده است، حل می کنند، که توانایی آنها برای استقرار در دستگاه های لبه است.

تاثیر زیاد بر مراقبت های بهداشتی

یکی از حوزه‌هایی که مدل‌های زبانی کوچک می‌توانند تأثیر معناداری داشته باشند، پزشکی است.

دانیل کلواس، مشاور پزشک در IT Medical، یک شرکت توسعه نرم‌افزار پزشکی جهانی، گفت: «تحقیق نوید قفل پتانسیل هوش مصنوعی مولد برای برنامه‌های کاربردی مربوط به دستگاه‌های تلفن همراه را می‌دهد که در چشم‌انداز مراقبت‌های بهداشتی امروزی برای نظارت از راه دور و ارزیابی‌های بیومتریک در همه جا حاضر هستند». به TechNewsWorld گفت.

او ادامه داد: با نشان دادن اینکه SLM های موثر می توانند کمتر از یک میلیارد پارامتر داشته باشند و همچنان در کارهای خاص عملکرد قابل مقایسه با مدل های بزرگتر داشته باشند، محققان در را برای پذیرش گسترده هوش مصنوعی در نظارت بر سلامت روزمره و مراقبت شخصی از بیمار باز می کنند.

کلواس توضیح داد که استفاده از SLM ها همچنین می تواند تضمین کند که داده های حساس سلامت می توانند به طور ایمن در دستگاه پردازش شوند و حریم خصوصی بیمار افزایش یابد. آنها همچنین می توانند نظارت و مداخله در زمان واقعی سلامت را تسهیل کنند، که برای بیماران مبتلا به بیماری های مزمن یا کسانی که نیاز به مراقبت مداوم دارند بسیار مهم است.

او اضافه کرد که این مدل‌ها همچنین می‌توانند موانع تکنولوژیکی و مالی برای استقرار هوش مصنوعی در محیط‌های مراقبت‌های بهداشتی را کاهش دهند و به طور بالقوه فناوری‌های پیشرفته نظارت بر سلامت را برای جمعیت‌های گسترده‌تر دموکراتیک کنند.

منعکس کننده روندهای صنعت

Caridad Muñoz، استاد فناوری رسانه جدید در کالج اجتماعی CUNY LaGuardia توضیح داد که تمرکز متا بر مدل‌های کوچک هوش مصنوعی برای دستگاه‌های تلفن همراه، نشان‌دهنده گرایش گسترده‌تر صنعت به سمت بهینه‌سازی هوش مصنوعی برای کارایی و دسترسی است. او به TechNewsWorld گفت: «این تغییر نه تنها به چالش‌های عملی می‌پردازد، بلکه با نگرانی‌های فزاینده درباره تأثیرات زیست‌محیطی عملیات‌های هوش مصنوعی در مقیاس بزرگ همسو می‌شود».

مونوز افزود: «متا با حمایت از مدل‌های کوچک‌تر و کارآمدتر، سابقه‌ای برای توسعه پایدار و فراگیر هوش مصنوعی ایجاد می‌کند.

مدل‌های زبان کوچک نیز در روند محاسبات لبه‌ای قرار می‌گیرند، که تمرکز آن بر نزدیک‌تر کردن قابلیت‌های هوش مصنوعی به کاربران است. دیجیاکومو می‌گوید: «مدل‌های زبان بزرگ OpenAI، Anthropic و دیگران اغلب بیش از حد هستند – وقتی تنها چیزی که دارید یک چکش است، همه چیز شبیه یک میخ است».

وی خاطرنشان کرد: مدل های تخصصی و تنظیم شده می توانند برای کارهای خاص کارآمدتر و مقرون به صرفه تر باشند. بسیاری از برنامه‌های کاربردی تلفن همراه به هوش مصنوعی پیشرفته نیاز ندارند. برای ارسال پیامک نیازی به ابر رایانه ندارید.»

وی افزود: «این رویکرد به دستگاه اجازه می‌دهد تا روی مسیریابی بین مواردی که با استفاده از SLM پاسخ داده می‌شود و موارد استفاده تخصصی، مشابه رابطه بین پزشکان عمومی و متخصص تمرکز کند».

تأثیر عمیق بر اتصال جهانی

شیمی اظهار داشت که پیامدهایی که SLM ها می توانند بر اتصال جهانی داشته باشند بسیار عمیق است.

او مشاهده کرد: «با توانمندتر شدن هوش مصنوعی روی دستگاه، نیاز به اتصال مداوم به اینترنت کاهش می‌یابد، که می‌تواند چشم‌انداز فناوری را در مناطقی که دسترسی به اینترنت ناسازگار یا پرهزینه است، به‌طور چشمگیری تغییر دهد.» این می‌تواند دسترسی به فناوری‌های پیشرفته را دموکراتیک کند و ابزارهای پیشرفته هوش مصنوعی را در بازارهای مختلف جهانی در دسترس قرار دهد.»

در حالی که متا در توسعه SLM ها رهبری می کند، منراج خاطرنشان کرد که کشورهای در حال توسعه به شدت وضعیت را زیر نظر دارند تا هزینه های توسعه هوش مصنوعی خود را کنترل کنند. او گفت: «به نظر می‌رسد چین، روسیه و ایران علاقه زیادی به توانایی به تعویق انداختن محاسبات محاسباتی در دستگاه‌های محلی پیدا کرده‌اند، به‌ویژه زمانی که تراشه‌های سخت‌افزاری پیشرفته هوش مصنوعی تحریم شده‌اند یا به راحتی قابل دسترسی نیستند».

او پیش‌بینی کرد: «ما انتظار نداریم که این یک تغییر یک شبه یا شدید باشد، زیرا پرس‌و‌جوهای پیچیده و چند زبانه همچنان به LLM‌های مبتنی بر ابر نیاز دارند تا ارزشی پیشرفته برای کاربران نهایی ارائه دهند. با این حال، این تغییر به سمت اجازه دادن به مدل «آخرین مایل» روی دستگاه می‌تواند به کاهش بار LLM برای انجام وظایف کوچک‌تر، کاهش حلقه‌های بازخورد و غنی‌سازی داده‌های محلی کمک کند.

او ادامه داد: «در نهایت، کاربر نهایی به وضوح برنده خواهد بود، زیرا این امکان را به نسل جدیدی از قابلیت‌ها در دستگاه‌های آن‌ها می‌دهد و بازنگری امیدوارکننده‌تری در برنامه‌های فرانت‌اند و نحوه تعامل مردم با جهان».

وی افزود: «در حالی که مظنونان معمولی نوآوری را در این بخش با تأثیر بالقوه امیدوارکننده بر زندگی روزمره همه هدایت می‌کنند. قادر به جمع آوری داده ها و ابرداده ها در سطحی بی سابقه است. ما امیدواریم که با تدابیر مناسب، بتوانیم این تلاش‌ها را به یک نتیجه سازنده هدایت کنیم.»

منبع