حواسيب أبحاث " AI" الخارقة ..التقنية الأكثر تقدماً لدى ميتا" 1- 2 "

  •  

    بقلم: كيفين لي، وشوبو سينجوبتا

     شركة " ميتا "

    يتطلب تطوير الجيل التالي من الذكاء الاصطناعي المتقدم أجهزة حاسوب قوية قادرة على إجراء كميات هائلة (كوينتيليون) من العمليات الحسابية في الثانية الواحدة. واليوم، تعلن "ميتا" تصميم وبناء الكتلة الحاسوبية الخارقة لأبحاث الذكاء الاصطناعي AI Research SuperCluster  (RSC) والتي نعتقد أنها من بين أسرع أجهزة الحواسيب الخارقة التي تعمل بالذكاء الاصطناعي اليوم، وذلك  عند اكتمال بنائه في منتصف عام 2022. وقد بدأ باحثونا بالفعل في استخدام أبحاث الذكاء الاصطناعي لتدريب النماذج الكبيرة في معالجة اللغة الطبيعية (NLP) وتعزيز رؤية الحاسوب لإجراء البحوث، بهدف يوما تطوير النماذج التدريبية  مع تريليونات المعاملات.

    وستساعد الحواسيب الخارقة التي تعمل بالذكاء الاصطناعي(RSC) الباحثين في مجال الذكاء الاصطناعي لدى "ميتا" على بناء نماذج ذكاء اصطناعي جديدة وبشكل أفضل، يمكنها التعلم من تريليونات الأمثلة مثل؛ العمل عبر مئات اللغات المختلفة وتحليل النصوص والصور والفيديو معًا بسلاسة. وتطوير أدوات جديدة للواقع المعزز وغيرها الكثير. وسيتمكن الباحثون من تدريب أكبر النماذج اللازمة لتطوير الذكاء الاصطناعي المتقدم وتعزيز قدرات الرؤية لدى الحاسوب ومعالجة اللغات الطبيعية (NLP) والتعرف على الأحاديث المنطوقة والمزيد. ونأمل أن تساعدنا RSC في بناء أنظمة ذكاء اصطناعي جديدة تمامًا يمكنها على سبيل المثال؛ تشغيل ترجمات صوتية في الوقت الأصلي لمجموعات كبيرة من الأشخاص يتحدث كل منهم لغة مختلفة، حتى يتمكنوا من التعاون بسلاسة في مشروع بحث أو المشاركة في لعبة واقع افتراضي معًا. وفي نهاية المطاف، سيمهد العمل المنجز على الحواسيب الخارقة التي تعمل بالذكاء الاصطناعي (RSC) الطريق نحو بناء تقنيات لمنصة الحوسبة الرئيسية التالية الخاصة بالميتافيرس، حيث ستلعب التطبيقات والمنتجات التي تعتمد على الذكاء الاصطناعي دورًا مهمًا.

    ما هي الحاجة إلى حاسوب خارق  يعمل بالذكاء الاصطناعي بهذا الحجم؟ 

    التزمت "ميتا" بالاستثمار طويل الأجل في الذكاء الاصطناعي منذ عام 2013، وذلك عندما أنشأنا "مختبر فيسبوك لأبحاث الذكاء الاصطناعي". وفي السنوات الأخيرة، قطعنا خطوات كبيرة في مجال الذكاء الاصطناعي بفضل ريادتنا لعدد من المجالات من بينها التعلم بالإشراف الذاتي. حيث يمكن للخوارزميات التعلم من عدد كبير من الأمثلة والمحولات غير المعرّفة، والتي تسمح لنماذج الذكاء الاصطناعي التفكير بشكل أكثر فاعلية، من خلال التركيز على مجالات معينة وفق المدخلات.

    ولتحقيق فوائد التعلم بالإشراف الذاتي والنماذج القائمة على المحولات بشكل كامل، فإن المجالات المختلفة سواء كانت الرؤية أو الكلام أو اللغة أو حالات الاستخدام الحرج مثل تحديد المحتوى الضار، ستتطلب تدريبًا متزايدًا على نماذج كبيرة ومعقدة وقابلة للتكيف. وتحتاج رؤية الحاسوب على سبيل المثال إلى معالجة مقاطع فيديو أكبر وأطول بمعدلات أعلى لأخذ عينات البيانات. كما يحتاج التعرف على المحادثات المنطوقة إلى العمل بشكل جيد حتى في السيناريوهات الصعبة التي تتخللها الكثير من الضوضاء في الخلفية مثل التجمعات أو الحفلات الموسيقية. وتحتاج البرمجة اللغوية العصبية إلى فهم المزيد من اللغات واللهجات. وسيساعد ذلك أيضاً على التقدم في مجالات أخرى، من بينها الروبوتات والذكاء الاصطناعي المتجسد والذكاء الاصطناعي متعدد الوسائط وكذلك الأشخاص على إنجاز مهام مفيدة في العالم الحقيقي. 

    تعد البنية التحتية للحوسبة عالية الأداء عنصرًا حاسمًا في تدريب مثل هذه النماذج الكبيرة وقد قام فريق أبحاث الذكاء الاصطناعي في "ميتا" ببناء هذه الأنظمة ذات القدرات المتفوقة لسنوات عديدة. ويحتوي الجيل الأول من هذه البنية التحتية المصممة في عام 2017 على 22 ألف وحدة معالجة رسومات NVIDIA V100 Tensor Core GPUs في مجموعة واحدة تؤدي 35 ألف وظيفة تدريبية يوميًا. وحتى الآن، وضعت هذه البنية التحتية المعايير للباحثين لدى "ميتا" من حيث الأداء والموثوقية والإنتاجية.

    وفي أوائل عام 2020، قررنا أن أفضل طريقة لتسريع التقدم في هذا المجال، تكمن في تصميم بنية أساسية جديدة للحوسبة من شريحة أثببت خلوها من الشوائب للاستفادة من وحدة معالجة الرسومات GPU الجديدة وتقنية نسيج الشبكة. وأردنا لهذه البنية التحتية أن تكون قادرة على تدريب النماذج التي تحتوي على أكثر من تريليون معامل ضمن مجموعات كبيرة من البيانات كإكسابايت. والتي توفر إحساساً بالحجم يعادل 36 ألف عام من مقاطع الفيديو عالية الجودة. 

    وبينما كان مجتمع الحوسبة عالية الأداء يتعامل مع قضية الحجم لعقود من الزمن، كان علينا أيضًا التأكد من توفر جميع ضوابط الأمان والخصوصية اللازمة لحماية أي بيانات تدريبية نستخدمها. وعلى عكس البنية التحتية السابقة لبحوث الذكاء الاصطناعي والتي استفادت فقط من مجموعات البيانات المفتوحة المصدر وغيرها من مجموعات البيانات المتاحة للجمهور. ستساعدنا الحواسيب الخارقة العاملة بالذكاء الاصطناعي (RSC) أيضًا على ضمان تحويل بحثنا إلى ممارسة عملية من خلال السماح لنا بتضمين أمثلة واقعية ناتجة عن أنظمة "ميتا" في تدريب النموذج. ومن خلال القيام بذلك، سنتمكن من المساعدة في تحقيق التقدم البحثي وأداء المهام النهائية، مثل تحديد المحتوى الضار على منصاتنا وكذلك أبحاث الذكاء الاصطناعي المتجسد والذكاء الاصطناعي متعدد الوسائط، للمساعدة في تحسين تجارب المستخدم على مجموعة تطبيقاتنا. ونعتقد أن هذه هي المرة الأولى التي يتم فيها التعامل مع مواضيع الأداء والموثوقية والأمان والخصوصية بهذا الحجم الضخم.

    ويتم إنشاء الحواسيب الخارقة العاملة بالذكاء الاصطناعي من خلال الجمع بين العديد من وحدات معالجة الرسومات في العقد الحوسبة والتي يتم توصيلها بعد ذلك بواسطة نسيج شبكي متفوق الأداء، يسمح بالاتصال السريع بين وحدات معالجة الرسومات. وتضم الحواسيب الخارقة العاملة بالذكاء الاصطناعي اليوم ما مجموعه 760 نظامًا من أنظمة NVIDIA DGX A100 كعقد حسابية، ليصبح المجموع 6080 وحدة معالجة رسومات GPUs، مع الأخذ بعين الاعتبار أن كل وحدة معالجة رسومات A100 أقوى من V100 المستخدمة في نظامنا السابق. وتتواصل وحدات معالجة الرسومات عبر نسيج NVIDIA Quantum 200 Gb / s InfiniBand ثنائي المستوى والذي لا يعاني من الحمولات الزائدة. وتحتوي طبقة تخزين الحواسيب الخارقة العاملة بالذكاء الاصطناعي على 175 بيتابايت من Pure Storage FlashArray و46 بيتابايت من ذاكرة التخزين المؤقت في أنظمة Penguin Computing Altus و10 بيتابايت من Pure Storage FlashBlade



    حمّل تطبيق Alamrakamy| عالم رقمي الآن