تراهن جوجل على أن الروبوتات التي تعمل بالذكاء الاصطناعي ستكون لا غنى عنها في حياتنا المنزلية يومًا ما، حيث يمكنهم تنظيم منازلنا والتعرف على كيفية إعداد الوجبات لهذا الأسبوع، وربما سيطبخون لنا تلك الوجبات أيضًا.
ومع ذلك، يعرف عملاق البحث أن هذا المستقبل لن يظهر إلا إذا تصرفت الروبوتات بشكل صحيح، ولهذا السبب، قدم فريق Google DeepMind، مجموعة من التطورات التي تهدف إلى ضمان أن الروبوتات التي تعمل بالذكاء الاصطناعي تعمل كما يفعل البشر بشكل مثالي عند القيام بأنشطتهم اليومية.
وقالت الشركة إن المهام مثل الأعمال المنزلية واضحة جدًا بالنسبة للبشر، ومع ذلك، تحتاج الروبوتات إلى أن يكون لديها "فهم عالي المستوى للعالم" لتكون قادرة على أدائها.
ولعل أول تقدم جديد يهدف إلى منح الروبوتات هذا الفهم عالي المستوى يسمى AutoRT، حيث يقول باحثو DeepMind أن هذا "نظام يستغل إمكانات النماذج التأسيسية الكبيرة" لجعل الروبوتات أكثر ذكاءً.
وتقوم هذه النماذج، وفقًا لـ DeepMind، بجمع مجموعة من بيانات التدريب التجريبي التي تسمح للروبوتات بمعرفة المزيد عن بيئتها بسرعة، وهي تشمل أنواع نماذج اللغات الكبيرة (LLMs) التي تدعم أدوات الذكاء الاصطناعي التوليدية مثل ChatGPT أو Gemini من Google.
وتتضمن استخدامات AutoRT في الروبوت اقتراح "قائمة من المهام الإبداعية التي يمكن للروبوت تنفيذها، مثل وضع الوجبة الخفيفة على سطح العمل"، ويتم أيضًا تضمين نماذج اللغة المرئية، يتم استخدامها جنبًا إلى جنب مع الكاميرا لمساعدة الروبوتات على تحديد الأشياء من حولها.
وإذا تم إطلاق الروبوتات في المنزل أو المكتب، فإن هذه القدرة مهمة لأسباب تتعلق بالسلامة؛ قد تنشأ مواقف جديدة تتطلب من الروبوتات التكيف، على سبيل المثال، مع الأشخاص الجدد الذين قد يكونون حولهم أو مع التغيرات في مواقع الأشياء.
وقال فريق DeepMind إن نظام AutoRT تم تقييمه على مدار سبعة أشهر في مواقف مختلفة من العالم الحقيقي، ووجدوا أنها "نظمت بأمان ما يصل إلى 20 روبوتًا في وقت واحد" وما يصل إلى 52 روبوتًا فريدًا.
ويبدو أن هذه السلامة هي نتيجة "لدستور الروبوت" الذي كتبته الشركة، وكانت مستوحاة من "قوانين الروبوتات الثلاثة"، وهي مجموعة من القواعد التي ابتكرها كاتب الخيال العلمي إسحاق أسيموف، والتي تتضمن التعليمات: "لا يجوز للروبوت أن يؤذي إنسانًا".
من الناحية العملية، يهدف هذا الدستور إلى إعطاء حاملي ماجستير إدارة الأعمال للروبوتات "مجموعة من المطالبات التي تركز على السلامة للالتزام بها عند اختيار المهام".
وهناك تقدمان آخران من Google يدوران حول جعل الروبوتات أكثر كفاءة مما هي عليه اليوم، حيث يهدف نظام جديد يسمى SARA-RT، وهو اختصار لعبارة "الانتباه القوي للتكيف الذاتي للمحولات الآلية"، إلى تسريع عمليات صنع القرار المتعلقة بالشبكات العصبية التي تقوم عليها نماذج محولات الذكاء الاصطناعي.
وكتبت ديب مايند في إحدى المدونات: "على الرغم من أن المحولات قوية، إلا أنها يمكن أن تكون مقيدة بالمتطلبات الحسابية التي تبطئ عملية اتخاذ القرار"، ويتضمن التقدم الآخر نموذجًا يسمى RT-Trajectory. ويهدف هذا إلى منح الروبوتات طريقة أوضح لفهم الإجراءات الجسدية التي يجب اتخاذها باتباع مجموعة من التعليمات.
ويتم تغطية مقاطع الفيديو الموجودة في مجموعة بيانات التدريب برسومات تخطيطية ثنائية الأبعاد لكيفية أداء الروبوت لمهمة ما، مما يوفر "تلميحات مرئية عملية منخفضة المستوى" في هذه العملية.
في حين أن المكانس الكهربائية الروبوتية مثل Roombas تحظى بشعبية كبيرة بالفعل، فإن التقدم الذي حققته DeepMind قد يأخذنا خطوة أقرب إلى الواقع حيث تتعامل روبوتات الذكاء الاصطناعي مع جميع الأعمال المنزلية التي نكرهها بطرق كنا نتخيلها فقط.