يتيح تعامل افضل مع الصوت والصور : "أوبن إيه آي" تؤجل إطلاق المساعد الصوتي لمعالجة مشكلات السلامة

  • كتب : ساره نور الدين

     

     

    قررت شركة "أوبن إيه آي" (OpenAI) تأجيل إصدار ميزة المساعد الصوتي المرتقبة لبرنامج "تشات جي بي تي" (ChatGPT) لضمان قدرتها على معالجة طلبات ملايين المستخدمين بأمان وكفاءة.

     

    كشفت شركة الذكاء الاصطناعي الناشئة النقاب عن خيار الصوت في مايو خلال حدث إطلاق "جي بي تي-4 أو" (GPT-4o)، وهو نسخة محدثة من "جي بي تي-4" (GPT-4) ويتميز بقدرة أفضل على التعامل مع النصوص والصوت والصور في الوقت الفعلي. وأوضحت "أوبن إيه آي" في بيان أنها كانت تعتزم طرح ميزة الصوت لمجموعة صغيرة من المشتركين في الخدمات المدفوعة لـ"تشات جي بي تي بلس" (ChatGPT Plus) في أواخر يونيو، لكنها قررت تأجيل هذه الخطوة شهر آخر "لضمان تلبية معايير الجودة المطلوبة".

     

    قالت الشركة أمس الثلاثاء: "نعمل على تحسين قدرة النموذج على اكتشاف ورفض المحتويات غير الملائمة، ونسعى أيضاً لتحسين تجربة المستخدم وتوسيع البنية التحتية لتلبية احتياجات الملايين مع الحفاظ على الاستجابات في الوقت الفعلي".

     

    يمثل هذا التأجيل انتكاسة محتملة لمساعي "أوبن إيه آي" للبقاء في صدارة ميدان الذكاء الاصطناعي شديد التنافسية. قدمت الشركة خلال العام الماضي خياراً محدوداً لتفاعل "تشات جي بي تي" مع المستخدمين، لكن الميزة الجديدة تعد بأن تكون أسرع وتقترن بقدرات قوية للتعرف على الصور لتحويل روبوت الدردشة إلى شريك محادثة أكثر فائدة وديناميكية.

     

    خلال حفل الإطلاق، استعرض موظفو "أوبن إيه آي" استجابة "تشات جي بي تي" الفورية لطلبات مثل حل مسألة رياضية على ورقة موضوعة أمام كاميرا هاتف ذكي خاص بأحد الباحثين. وشبه بعض المشاهدين الأداة بالمساعد الافتراضي الذي يعمل بالذكاء الاصطناعي في فيلم "هي" (Her) لعام 2013، والذي قامت بأداء صوته سكارليت جوهانسون. وطالبت الممثلة لاحقاً بإزالة أحد أصوات "تشات جي بي تي" لتشابهه الكبير مع صوتها.

     

    أعلنت "أوبن إيه آي" أمس أنها تخطط لطرح الميزة الصوتية لكافة المشتركين في الخريف. وأشارت إلى أنها "تعمل أيضاً" على إطلاق ميزات الفيديو ومشاركة الشاشة التي عرضتها خلال حدث مايو، موضحة أنها ستُعلم المستخدمين بتفاصيل أكثر حول توقيت إطلاق هذه الميزات في المستقبل.

     

    نتيجة لذلك، من المحتمل أن تكون قدرات خيار الصوت محدودة أكثر مما جرى استعراضه في حفل الإطلاق عندما يجري توفيرها لمجموعة من المستخدمين المدفوعين الشهر المقبل.

     

    فعلى سبيل المثال، لن يتمكن روبوت الدردشة من الوصول إلى ميزة الرؤية الحاسوبية لتقديم تعليقات منطوقة حول حركات الرقص المستعرضة عبر كاميرا الهاتف الذكي.

    حمّل تطبيق Alamrakamy| عالم رقمي الآن