متا، مالک فیس بوک، مدل هوش مصنوعی را روز چهارشنبه منتشر کرد که می تواند اشیاء منفرد را از داخل یک تصویر به همراه مجموعه داده ای از حاشیه نویسی های تصویری که به گفته او بزرگترین در نوع خود بوده است، تشخیص دهد.
با استفاده از SAM، اشیا را می توان با کلیک کردن بر روی آنها یا نوشتن دستورات متنی انتخاب کرد. در یکی از نمایشها، نوشتن کلمه «گربه» باعث شد این ابزار جعبههایی را در اطراف هر یک از چندین گربه در یک عکس بکشد.
متا در حال حاضر از فناوری مشابه SAM به صورت داخلی برای فعالیت هایی مانند برچسب گذاری عکس ها، تعدیل محتوای ممنوعه و تعیین پست هایی که به کاربران فیس بوک و اینستاگرام توصیه می شود استفاده می کند.
شرکت های بزرگ فناوری از زمانی که چت ربات ChatGPT OpenAI تحت حمایت مایکروسافت در پاییز به هیجان آمد و موجی از سرمایه گذاری ها و رقابت برای تسلط بر فضا را به راه انداخت، پیشرفت های هوش مصنوعی خود را در بوق و کرنا کردند.
بخش تحقیقاتی این شرکت در یک پست وبلاگی اعلام کرد که Segment Anything Model یا SAM میتواند اشیاء را در تصاویر و ویدیوها شناسایی کند، حتی در مواردی که در آموزش خود با آن موارد مواجه نشده باشد.
مدل SAM و مجموعه داده تحت مجوز غیرتجاری برای دانلود در دسترس خواهد بود. کاربرانی که تصاویر خود را در یک نمونه اولیه همراه آپلود می کنند نیز باید موافقت کنند که از آن فقط برای اهداف تحقیقاتی استفاده کنند.
متا چندین ویژگی را به نمایش گذاشته است که از نوع هوش مصنوعی مولد محبوب ChatGPT استفاده می کند که به جای شناسایی یا دسته بندی داده ها مانند سایر هوش مصنوعی، محتوای کاملاً جدیدی ایجاد می کند، اگرچه هنوز محصولی را منتشر نکرده است.
© تامسون رویترز 2023
مارک زاکربرگ، مدیر اجرایی، گفته است که استفاده از چنین «کمکهای خلاقانه» هوش مصنوعی در برنامههای متا در اولویت امسال است.
به عنوان مثال میتوان به ابزاری اشاره کرد که ویدیوهای سورئالیستی را از پیامهای متنی میچرخاند و ابزاری دیگر که تصاویر کتاب کودکان را از نثر ایجاد میکند.
این شرکت گفت انتشار SAM دسترسی به این نوع فناوری را گسترش می دهد.