- تقديم عروض متكاملة تمتد من نماذج الذكاء الاصطناعي إلى تطوير مؤهلات الوكلاء ومنصات التطبيقات والبنية التحتية المحدّثة خلال مؤتمر أبسارا 2025
كتب : اسلام توفيق
كشفت "علي بابا كلاود" عن أحدث ابتكاراتها في مجال الذكاء الاصطناعي الشامل خلال مؤتمرها التكنولوجي السنوي الرائد "أسبارا 2025". ويغطي الإعلان كلًا من نماذج اللغة الكبيرة من الجيل التالي من عائلة Qwen3، والنماذج المقبلة من الجيل البصري Wan 2.5، والمنصات المحسّنة الخاصة بتطوير مؤهلات الوكلاء والتطبيقات، إلى جانب تحديثات رئيسية مخصصة لبنية الذكاء الاصطناعي، مما يعزز مكانة الشركة عالمياً في عصر الذكاء الاصطناعي الجديد.
وقال إدي وو، رئيس مجلس الإدارة والرئيس التنفيذي لشركة علي بابا كلاود للذكاء الاصطناعي: "سيجري في المستقبل دمج نماذج الذكاء الاصطناعي الكبيرة بشكل عميق في مجموعة واسعة من الأجهزة، لتؤدي دور أنظمة التشغيل - مزودة بذاكرة دائمة، وتنسيق سلس بين السحابة وأجهزة التشغيل النهائية، والقدرة على التطور المستمر. نحن لا نزال ملتزمين بفتح مصدر Qwen وتشكيله ليصبح بمثابة نظام تشغيل عصر الذكاء الاصطناعي، الأمر الذي يمكّن المطورين في مختلف أنحاء العالم من بناء تطبيقات تحويلية للذكاء الاصطناعي".
وأضاف وو: "بموازاة ذلك، تتمتع علي بابا كلاود بمكانة استراتيجية كمزود شامل لخدمات الذكاء الاصطناعي، بجهد مكرّس لتقديم حوسبة قوية ذات كفاءة قصوى لتدريب نماذج الذكاء الاصطناعي الكبيرة على السحابة ونشرها. ولإبراز التزامنا طويل الأمد بدفع الذكاء الاصطناعي قدماً، سنمضي في خطة استثماراتنا التي تبلغ قيمتها 380 مليار يوان صيني في مجال الذكاء الاصطناعي والبنية التحتية السحابية على مدى السنوات الثلاث المقبلة".
ومنذ إطلاق الجيل الأول من Qwen في العام 2023، عمدت علي بابا إلى فتح مصدر أكثر من 300 نموذج ذكاء اصطناعي مبني على نموذجيها الأساسيين: نموذج اللغة الكبير Qwen ونموذج التوليد البصري Wan. وفي ظلّ أكثر من 600 مليون عملية تنزيل وأكثر من 170 ألف نموذج مشتق تم إنشاؤه، أصبحت نماذج علي بابا للذكاء الاصطناعي من أكثر سلاسل الذكاء الاصطناعي مفتوحة المصدر استخداماً على مستوى العالم، حيث أن أكثر من مليون شركة وفرد استخدموا Qwen على منصة Model Studio، منصة تطوير الذكاء الاصطناعي التابعة لشركة علي بابا.
الكشف عن Qwen3-Max: أقوى نماذج اللغة الكبيرة والواسعة النطاق من علي بابا حتى تاريخه
أطلقت علي بابا رسمياً Qwen3-Max، الذي يعدّ أكبر نموذج لديها خاص باللغات الكبيرة والواسعة النطاق، مع أكثر من تريليون عامل متغيّر. وبفضل وضعيتي التشغيل Instruct و Thinking، يحقق النموذج أداءً مذهلًا على امتداد مجموعة واسعة من المقارنات المعيارية، خاصة على صعيد توليد الشيفرة البرمجية والقدرات الوكيلة. وبالنسبة إلى وضعية Instruct، حصل النموذج على 69.6 على معيار SWE-Bench، وهو عبارة عن مقارنة معيارية مرجعية موثوقة لتقييم نماذج اللغات الكبيرة والواسعة النطاق عند مواجهة مشكلات واقعية ملموسة على مستوى البرامج، إلى جانب بعض النماذج الرائدة ذات المصدر المغلق. كما تم تسجيل أداء رائع على معيار Tau2-Bench، وهو عبارة عن مقارنة معيارية مرجعية لتقييم الوكلاء التخاطبيين، مظهرًا كفاءة استثنائية في استخدام الأدوات، وهي قدرة أساسية من أجل بناء مؤهلات وكلاء أذكياء بتوجيه مركّز نحو العمل.
يحقق نموذج Qwen3-Max أداءً مذهلاً على امتداد المقارنات المعيارية المختلفة
كما تم خلال المؤتمر الكشف عن سلسلة من نماذج Qwen3 التي تغطي اللغة البصرية والمعالجة متعددة الوسائط.
Qwen3-VL: يعد النموذج الأكثر قدرة في مجال اللغة البصرية ضمن عائلة Qwen حتى تاريخه، حيث تتيح بنيته الهندسية المكونة من خليط من الخبراء Mixture-of-Experts (MoE) نشراً مرناً من أجهزة التشغيل النهائية (أجهزة الحافة) إلى بيئات السحابة عالية الأداء. ومن خلال وظيفته التشغيلية كوكيل بصري، يمكن لنموذج Qwen3-VL العمل على واجهات الكمبيوتر والهواتف المحمولة على حد سواء، وهو رائد في مجال البرمجة البصرية عبر توليد شيفرات برمجية مباشرة من الصور أو مقاطع الفيديو، مما يؤدي وبشكل فعال إلى تحويل التصميمات البصرية إلى تطبيقات تشغيلية. كما تدعم قدرته على الفهم المكاني القاعدة الأساس ثلاثية الأبعاد بموازاة تحسين الإدراك للاتجاه والمسافة على نحو يرسي الأساس الحيوي لصالح الذكاء الاصطناعي المجسّد والملاحة المكانية في العالم الحقيقي. ويتوفر نموذج Qwen3-VL-235B-A22B في وضعيتي Instruct وThinking، محققاً أداءً ملفتاً في المقارنات المعيارية للإدراك البصري والتفكير الاستدلالي متعدد الوسائط.
Qwen3-Omni: نموذج شامل متعدد اللغات قادر على معالجة المدخلات النصية والصور والملفات الصوتية وملفات الفيديو، بالتزامن مع تقديم استجابة فورية على صعيد كل من النص والكلام المحكي الطبيعي. ويقدم نموذج Qwen3-Omni، مدعوماً بالبنية الهيكلية المبتكرة للتفكير والتحدث بواسطة خليط من الخبراء Thinker–Talker MoE، ومستفيداً من تدريب مسبق على 20 مليون ساعة من البيانات الصوتية، أداءً استثنائياً في فهم المدخلات الصوتية (حتى 30 دقيقة) والمحادثات القائمة على الفيديو، كل ذلك من دون المساومة على قدراته القوية في معالجة النصوص والصور. كما يحقق تفاعلاً متعدد الوسائط في الوقت الفعلي، مع تحقيق زمن انتقال منخفض جداً – مما يجعله حلاً مثالياً للتفاعل البديهي من دون استخدام اليدين في مقصورات القيادة الذكية، والنظارات الذكية، والهواتف المحمولة. وقد أصبح نموذج Qwen3-Omni-30B-A3B متاحاً حالياً كمصدر مفتوح على Hugging Face ومجتمع ModelScope التابع لشركة علي بابا. وبإمكان المستخدمين أيضاً الوصول إلى Qwen3-Omni-Flash على Qwen Chat، وهو عبارة عن تطبيق على الشبكة المعلوماتية يتيح للمستخدمين تجربة نماذج Qwen المختلفة.
بالإضافة إلى ما سبق، تمّ تحديث نموذج رمز التشفير Qwen3-Coder ونموذج التصحيح Qwen3-Image-Edit بشكل كبير. يحقق نموذج Qwen3-Coder الجديد سرعة استدلال أسرع، وأماناً محسّناً على صعيد الرموز المشفرة، بينما تم تحديث نموذج Qwen3-Image-Edit بغرض دعم تعديل الصور المتعددة، بموازاة اعتماد تحسين كبير في الاتساق البصري.
كما كشفت علي بابا عن Fun، وهي عبارة عن عائلة من نماذج اللغة المحكية الكبيرة والواسعة النطاق والتي جرى تزويدها بقدرات متقدمة للتعرف على الكلام بلغات متعددة. وتتضمن هذه السلسلة Fun-ASR، وهو نموذج شامل للتعرف التلقائي على الكلام (ASR)، تم تطويره للاستخدام الفعلي في المؤسسات، و Fun-CosyVoice، وهو نموذج عالي الجودة لتوليف الكلام التعبيري، وقد جرى تصميمه لتوليد مخرجات صوتية طبيعية بلغات متعددة.
لمحة عامة عن Wan2.5: يرفع مستوى إنشاء محتوى الوسائط المتعددة
استعرضت علي بابا كذلك أربعة نماذج من Wan2.5، بما في ذلك أحدث نماذجها لتوليد ملفات الفيديو، ونموذجاً لتوليد الصور، ونموذجاً آخر لتحرير الصور. وتدعم نماذج توليد الفيديو بشكل أساسي توليد صوت يتميز بدقة عالية لصالح ملف الفيديو، مما يضاعف المدة من 5 إلى 10 ثوانٍ، بشكل يؤمّن سرداً أكثر اكتمالاً وتماسكاً بموازاة جودة بصرية معززة. وتتميز النماذج ببنية هيكلية متعددة الوسائط مدمجة في الأساس، حيث تخضع للتدريب بشكل مشترك على التعامل مع البيانات النصية والصوتية والمرئية. وهذا يتيح توليداً متوافقاً ومتعدد الوسائط، الأمر الذي يضمن المزامنة ما بين المحتوى الصوتي والمحتوى المرئي، وتحسين فهم التعليمات من أجل متابعة مطالبات المستخدم عن كثب.
إطار عمل تطويري جديد لتفعيل نشر الوكلاء بشكل معزز
من أجل تحسين الكفاءة على صعيد توزيع وكلاء الذكاء الاصطناعي على نطاق واسع، تم أخيراً إضافة إطار عمل تطويري إلى منصة Model Studio، أي إلى منصة تطوير الذكاء الاصطناعي من علي بابا كلاود. ويتميز إطار العمل الجديد بتضمّنه Model Studio-ADK (مجموعات أدوات تطوير الوكلاء)، وهو إطار عمل تطويري يتميز برمز مشفّر عالي الدقة للمهنيين المحترفين لدى المؤسسات والذي يفك ألغاز الاحتياجات التجارية المعقدة، ويحوّلها إلى منطق وكيلي قابل للتنفيذ من أجل تمكين التطوير السريع لصالح وكلاء الذكاء الاصطناعي المتمرسين ورفيعي المستوى، عبر مدّهم بقدرات اتخاذ القرار بشكل مستقل، واعتماد التفكير الديناميكي، والتمتع بقدرات تنفيذ المهمات. كما يمكن للمستخدمين إنشاء مشروع للبحث المعمق DeepResearch أو الاسترجاع المعزز بالتوليد Agentic RAG (Retrieval-Augmented Generation) في غضون ساعة من الوقت، باستخدام هذه المجموعة القوية من الأدوات. كما استفادت منصة Model Studio من تحديث منصة التطوير ذات الرمز المشفّر المنخفض Model Studio-ADP (منصة تطوير الوكلاء)، مما يتيح للمستخدمين من ذوي الخلفية المحدودة في البرمجة، القيام بسهولة بإنشاء وكلاء ذكاء اصطناعي مبسّطين من مختلف النواحي.
وبغرض التعامل مع التحديات الرئيسية التي تواجهها الشركات، مثل معالجة البيانات من مصادر متعددة، والقيود على الموارد، والنشر على امتداد بيئات مختلفة، يقدم نموذج Model Studio Agent مجموعة من الميزات على مستوى المؤسسات، وتشمل تأمين سلاسة الاتصال عبر اعتماد بروتوكول سياق النموذج (MCP)، والاسترجاع المعزز بالتوليد RAG، وجدولة الاستدلال الديناميكي، وخدمة "الصندوق الرملي" ضمن بيئة معزولة وآمنة، بشكل يسمح للشركات بتسريع اعتماد وكلاء الذكاء الاصطناعي.
وبإمكان المستخدمين حالياً الوصول إلى أكثر من 200 نموذج رائد في الصناعة عبر منصة Model Studio، بما في ذلك نماذج Qwen و Wan التي طورتها شركة علي بابا بنفسها. وقد تمّ إنشاء أكثر من 800 ألف وكيل على منصة Model Studio، بما يضمن دعم سيناريوهات متنوعة تتراوح ما بين إنشاء المحتوى والتسويق الذكي وصولًا إلى إدارة المنزل الذكي وتحسين الإنتاج. وعلى مدار الأشهر الاثني عشر الماضية، زاد عدد استدعاءات النماذج عبر منصة Model Studio بمقدار 15 ضعفاً، الأمر الذي يعكس الطلب المتنامي على حلول الذكاء الاصطناعي القوية والقابلة للتطوير.
منصات ذكاء اصطناعي مبتكرة لدعم الشركات والمخترعين المبدعين
بعد إطلاقها في يوليو، عمدت علي بابا لإدخال تحديثات كبيرة على AgentBay، وهي عبارة عن بيئة تشغيل متعددة الوسائط قائمة على السحابة، ومنصة للوكلاء الخبراء، لصالح المؤسسات والمطورين وشركاء الذكاء الاصطناعي. وتساعد الميزات الجديدة - المحرك الذاتي التطور، وصور الحاويات المخصّصة، وضوابط السلامة والامتثال المدمجة – في تحويل الوكلاء، من مساعدين بسيطين مدعومين بنموذج ذكاء اصطناعي واحد، إلى عمّال متعددي الوسائط يشبهون الإنسان، بحيث يمكنهم إنجاز المهام المطلوبة من الألف إلى الياء.
وبهدف تلبية الطلب المتزايد من قبل الشركات على النمو المدفوع بالذكاء الاصطناعي، أطلقت علي بابا كلاود أيضاً Lingyang AgentOne، وهي عبارة عن منصة تطبيقات ذكاء اصطناعي شاملة للشركات، تتيح للمؤسسات الانتقال من الاستجابة التفاعلية إلى تطبيق مبدأ الذكاء الاستباقي. وتقدّم Lingyang AgentOne، مدعومة بنماذج Qwen من علي بابا، وهي متكاملة بشكل كبير مع منظومة عمل علي بابا، مساحة عمل شاملة من أجل تطوير مؤهلات الوكلاء بشكل يتيح التواصل مع الأنظمة الحالية وتسريع الوقت اللازم لتحقيق القيمة. ومن خلال حلول قائمة على السيناريوهات على امتداد مجالات التسويق والتحليلات وخدمة العملاء والعمليات التشغيلية، تربط منصة Lingyang AgentOne سلسلة القيمة الكاملة، قبل مرحلة البيع، وفي أثنائها، وبعدها، بغرض تقديم نتائج قابلة للقياس، وجاهزة للإنتاج لصالح قطاعات عمل مثل تحسين المنازل، والتجارة الإلكترونية.
بالإضافة إلى ذلك، قامت منصة تطبيقات الذكاء الاصطناعي الموجهة للمستهلكين التابعة لشركة علي بابا، Quark، بإطلاق منصة Zaodian، وهي منصة متكاملة لإنشاء الصور والفيديوهات باستخدام تقنية الذكاء الاصطناعي، تدمج نماذج الذكاء الاصطناعي الرائدة في الصناعة على غرار نموذج Wan الرائد من علي بابا لتوليد الفيديوهات، من أجل تقديم تجربة احترافية وفعّالة لصالح المخترعين المبدعين. وبصرف النظر عن وظائف تحويل النص المكتوب إلى فيديو بصري، وتحويل الصورة الجامدة إلى فيديو متحرّك، والتي يدعمها نظام Wan، تُوفر Zaodian أيضًا وظائف إنشاء الصور، وتعديلها باستخدام الذكاء الاصطناعي مع أفضل الخيارات من النماذج الرائدة. وبإمكان المخترعين المبدعين تجربة خدمة المنصة على الموقع الإلكتروني zaodian.quark.cn أو عبر إدخال "صورة مولّدة بالذكاء الاصطناعي" (AI Image) في إصدار Quark المخّصّص للعمل المكتبي.
البنية التحتية للذكاء الاصطناعي من الجيل التالي للذكاء الاصطناعي الوكيل
خلال المؤتمر، كشفت الشركة الرائدة في مجال الحوسبة السحابية أيضًا عن مجموعة شاملة ومتكاملة من التحسينات المبتكرة للبنية التحتية المصممة خصيصًا لدعم المشهد العام الناشئ للذكاء الاصطناعي الوكيل.
التخزين: عززت علي بابا كلاود خدمتها المخصّصة لتخزين الكائنات (OSS) بواسطة "Vector Bucket"، وهي ميزة مدعومة بالذكاء الاصطناعي تتيح تخزين البيانات المتجهة والواسعة النطاق واسترجاعها، بتكلفة فعّالة – وهي ميزة محسّنة انطلاقًا من تطبيقات الاسترجاع المعزز بالتوليد RAG والذكاء الاصطناعي. وهي توحّد إدارة البيانات الأولية والمتجهة في خدمة تخزين الكائنات، والتي يمكن الوصول إليها عبر واجهات برمجة التطبيقات القياسية، بشكل يُبسّط تطوير منصة الاسترجاع المعزز بالتوليد القابلة للتطوير، وتنظيم أصول الوسائط المتعددة. وهي تساعد كذلك على خفض تكلفة تطوير الذكاء الاصطناعي عبر السماح لشركات الأعمال بإدارة البيانات الأولية والمتجهة في موقع واحد - ممّا يُخفّض من التعقيدات ويُسرّع نشر تطبيقات الاسترجاع المعزز بالتوليد.
الترابط الشبكي: كشفت علي بابا كلاود عن أحدث بنياتها الهندسية المخصّصة للشبكات عالية الأداء - HPN8.0، وهي شبكة مصمّمة خصيصًا لصالح نماذج الذكاء الاصطناعي. يُتيح هذا الابتكار تأمين سلاسة تدريب النماذج، والاستدلال، والتعلم المعزّز (RL)، على امتداد أحمال العمل الحسابية المختلطة، بالتزامن مع دعم عمليات النشر على نطاق واسع جدًا. توفّر البنية الهندسية سرعة نقل بيانات تبلغ 800 جيجابت في الثانية، بشكل يضاعف القدرة مقارنة بالجيل السابق.
الأمان: من ضمن التحديثات المهمة الأخرى برزت إضافة وظيفة وكيلة مدعومة بالذكاء الاصطناعي إلى حل الاستجابة للكشف عن التهديدات السحابية (CTDR) الخاص بها. يعزّز هذا التحسين الأمني السحابي الأصلي قدرات الكشف والتحليل والاستجابة، ممّا يؤمّن نهجًا أكثر ذكاءً واستباقية لمكافحة التهديدات الأمنية. ستعمل خمسة عوامل ذكاء اصطناعي، مدعومة من Qwen، على أتمتة عمليات الأمان – من مرحلة تقييم التنبيهات إلى مرحلة التنفيذ – في ظلّ التحليل الذكي، والربط ما بين الأحداث، وإعداد التقارير القابلة للتنفيذ، من أجل إدارة التهديدات من البداية إلى النهاية. وقد أسفرت الوظيفة الجديدة عن زيادة معدّل نجاح نظام التحقيق الآلي في الحوادث بشكل فعّال، وتحديدًا من 59% إلى 74%، بموازاة معالجة 70% من إجراءات الاستجابة الآلية من دون أي تدخّل بشري.
الحاوية: قامت علي بابا كلاود بتحديث خدمات حوسبة الحاويات (ACS) من أجل تعزيز قدراتها على التوسع التلقائي بواسطة تقنيات الجدولة المحسّنة، وتقنيات تسريع ذاكرة التخزين الموَقّت لصور الحاويات. ويضمن هذا الأمر المرونة، مع دعم التوسع إلى ما يبلغ 15 ألف وحدة في الدقيقة من أجل التعامل مع طلبات الوكلاء الضخمة والمتزامنة. وبالإضافة إلى ذلك، توفر خدمة حوسبة الحاويات العزل القوي عبر فصل مساحة المستخدم عن بيئة التشغيل، بشكل يحول دون أن يطال تأثير مواجهة ثغرات أمنية أو حصول تسرّب للبيانات لدى أحد الوكلاء، المُستخدمين الآخرين.
قاعدة البيانات: قامت علي بابا كلاود بتحديث قاعدتها الخاصة بالبيانات PolarDB، الأمر الذي فعّل أداء البيانات المدمجة وأحمال عمل الذكاء الاصطناعي. وقد أدخل التحديث ابتكارًا على الأجهزة مدعومًا بتقنية Compute Express Link (CXL)، وهي تقنية ربط واتصال بين الذاكرة والحوسبة تتميّز بكفاءة عالية، حيث تُقلّل زمن الاستجابة بنسبة 72.3%، بموازاة تحسين قابلية توسيع الذاكرة بمقدار 16 ضعفًا، وترسي أساساً متيناً لأحمال عمل البيانات والذكاء الاصطناعي. كما أدخلت PolarDB المحدّثة بنية هندسية جديدة باسم Lakebase تتمتّع بتخزين هجين يشمل نظام التخزين المعلوماتي المركزي (lake)، وقاعدة بيانات تشغيلية وبيانات وصفية لتخزين تنسيقات البيانات المفتوحة الشائعة، بما في ذلك Lance و Iceberg و Apache Hudi وخفض تكلفة التخزين، بشكل يُتيح تخزين وإدارة البيانات متعددة الوسائط بكفاءة.
منصة الذكاء الاصطناعي (PAI): قدمت منصة علي بابا كلاود للذكاء الاصطناعي تحسينات بغرض دعم تطوير النماذج الكبيرة في عصر الذكاء الاصطناعي الوكيل. وتعمل تقنية MoE المبتكرة لتسريع التدريب عبر خليط من الخبراء، على تحسين تدريب سلسلة Qwen بنسبة تزيد عن 300%، بينما يقلل محرك التدريب DiT المحدّث من الوقت اللازم للتدريب على عينة واحدة لسلسلة Wan بنسبة 28.1%. ويوفر الاستدلال المحسّن إنتاجية أعلى في الثانية TPS بنسبة 71%، ووقت استجابة للزمن المطلوب لكل رمز إنتاج TPOT أقل بنسبة 70.6%، مع توسيع نطاق البنية التحتية بوتيرة أسرع بنسبة 97.6%.