طور باحثون في جامعة " كارنيجي ميلون" برنامجًا يترجم النصوص التي تصف التحركات المادية إلى رسوم متحركة بسيطة مباشرةً، وتمهد هذه الخطوة لإنتاج أفلام من النصوص دون الحاجة إلى وسيط.
وحقق العلماء قفزات هائلة في تعليم الحواسيب اللغات البشرية، وتصميم سلسلة من الأشكال المادية لإنشاء رسوم متحركة واقعية، لكن المشكلة تكمن في وجود فجوة بين اللغات البشرية والحركات المادية.
ويعمل كل من لويس فيليب مورنسي، الأستاذ المعاون في معهد تقنيات اللغة، وشيتانيا أهوجا، طالب الدكتوراه في في معهد تقنيات اللغة، على إغلاق الفجوة اللغوية باستخدام بنية شبكات عصبونية اسمها جوينت لانجويدج تو بوز (التموضع بالأوامر اللغوية). ويتيح النموذج الحاسوبي الجديد ربط الجمل اللغوية بالتموضع المادي، لتعليم الحواسيب كيفية ربط اللغة بالأفعال والإيماءات والحركات.
وقال مورنسي «ما زال البحث في بدايته، ولكن من منظور النمذجة الحاسوبية والذكاء الاصطناعي والتصاميم النظرية، يعد ذلك بداية مدهشة. ونعمل اليوم على تحريك شخصيات افتراضية، لكن التطبيق المستقبلي لهذا الربط بين اللغة والإيماءات سيكون على الروبوتات مستقبلًا، وقد نستطيع إخبار الروبوتات يومًا ما نريدها أن تفعله.»
وأضاف «بإمكاننا أيضًا استخدام هذا الربط بين اللغة والرسوم المتحركة ليصف الحاسوب لنا ما يحدث في مقطع فيديو.»وسيقدم أهوجا هذا النموذج الجديد في 19 سبتمبر 2019 في المؤتمر الدولي للرؤية ثلاثية الأبعاد في مدينة كيبيك الكندية.
واستخدم أهوجا في تصميم النموذج الحاسوبي نهجًا يشبه المناهج الدراسية، ويركز على نموذج تعلم جمل قصيرة وسهلة في البداية، مثل «شخص يمشي إلى الأمام،» ثم جمل أطول بتسلسل أصعب «شخص يتقدم إلى الأمام، ثم يلتف إلى الوراء، ويمشي إلى الأمام مجددًا،» أو «شخص يركض، يقفز فوق حاجز.»
يصف كل من الفعل والحال (ظرف الحال) الأفعال وسرعة حدوثها، ويصف كل من الاسم والصفة الموقع والتوجه. ووفقًا لأهوجا، فالهدف تحريك الأجسام بجمل مترابطة وعدة إجراءات تحدث في الوقت ذاته أو بصورة متعاقبة.
ويستطيع البرنامج اليوم تحريك الرسوم البسيطة فحسب ويرى مورنسي أن ما يجعل الأمر أكثر تعقيدًا حدوث أشياء كثيرة في الوقت ذاته، حتى عندما يكون تسلسل الأحذاث بسيطًا.
وقال مورنسي «تزامن حركة أجزاء الجسم مهم جدًا؛ عندما تحرك ساقيك، يتحرك ذراعاك وجذعك وربما رأسك. وعلينا التنسيق بين أجزاء الجسم المختلفة في الرسوم المتحركة، بالإضافة إلى جعل الشخصيات تنفذ أعمالًا معقدة في الوقت ذاته. وسيكون استخدام السرد اللغوي في بيئة الرسوم المتحركة المعقدة تحديًا مشوقًا.»