نخستین ربات متفکر جهان معرفی شد

شرکت دیپمایند با رونمایی از پروژه Gemini Robotics نسل تازهای از رباتها را به نمایش گذاشته است؛ رباتهایی که پیش از انجام هر عمل، توانایی «فکر کردن» دارند.
پژوهشگران این شرکت بر این باورند که این نوآوری سرآغاز عصری تازه در عرصه رباتیک هوشمند است.
هوش مصنوعی مولد که پیشتر در تولید متن، تصویر، صدا و ویدئو مورد استفاده قرار گرفته، اکنون پایهای برای کنترل و تصمیمگیری در رباتها شده است. ایده اصلی پروژه جمنای رباتیک استفاده از همین قابلیت برای ایجاد کنش در رباتهاست. دیپمایند در این پروژه از دو مدل تازه پردهبرداری کرده که بهطور مشترک نخستین رباتهای متفکر جهان را تشکیل میدهند. این دو مدل با نامهای Gemini Robotics ۱.۵ و Gemini Robotics-ER ۱.۵ معرفی شدهاند.
مدل نخست، یک مدل دیداری-زبانی-کنشی است که ورودیهای تصویری و متنی را دریافت کرده و بر اساس آن کنشهای رباتیک تولید میکند. مدل دوم که «ER» نام دارد و مخفف «استدلال تجسمیافته» است، توانایی دارد ورودیها را تحلیل کرده و گامهای لازم برای انجام وظایف پیچیده را طراحی کند. به گفته دیپمایند، این مدل نوعی «تفکر» شبیهسازیشده دارد که آن را از رباتهای پیشین متمایز میسازد.
برای نمونه، اگر از ربات بخواهید لباسها را به دو گروه سفید و رنگی تفکیک کند، مدل ER دادهها و تصاویر محیط را پردازش کرده و دستورالعملی به زبان طبیعی تولید میکند. سپس مدل Gemini Robotics ۱.۵ این دستورالعمل را اجرا کرده و حرکات لازم برای انجام وظیفه را تولید میکند. پژوهشگران میگویند این مدل افزون بر اجرا، فرآیندی درونی برای تصمیمگیری دارد که شبیه «فکر کردن» پیش از عمل است.
کارولینا پارادا، رئیس بخش رباتیک دیپمایند، تأکید کرده است که رباتهای امروزی بسیار اختصاصی هستند و آمادهسازی آنها برای یک وظیفه خاص ماهها زمان میبرد. اما با این رویکرد تازه، رباتها انعطافپذیرتر خواهند شد و بدون نیاز به آموزش دوباره میتوانند با محیطهای تازه تطبیق پیدا کنند.
مدل Gemini Robotics-ER ۱.۵ در آزمایشهای داخلی و دانشگاهی امتیازات بالایی کسب کرده و نشان داده قادر است تصمیمهای دقیقی در تعامل با محیط بگیرد. با وجود این، مدل اجرایی Gemini Robotics ۱.۵ هنوز تنها در دسترس گروه کوچکی از آزمایشکنندگان قرار دارد. در مقابل، مدل ER در Google AI Studio ارائه شده و به توسعهدهندگان امکان میدهد برای پروژههای رباتیک خود دستورالعملهای دقیق طراحی کنند.
به گفته پژوهشگران دیپمایند، هر دو مدل بر پایه نسخههای اصلی جمنای ساخته شده و با دادههای ویژه برای فعالیت در دنیای فیزیکی سازگار شدهاند؛ قابلیتی که امکان اجرای وظایف چندمرحلهای و پیچیده را در اختیار رباتها قرار میدهد.