مركز الذكاء الاصطناعي “إنسبشن” التابع لـ “G42” يطلق نموذج لغوي عربي عالي الجودة
أعلن “إنسبشن”، مركز الذكاء الاصطناعي التابع لمجموعة “جي 42” (G42)، عن إطلاق الإصدار مفتوح المصدر من نموذج “جيس”، النموذج اللغوي الكبير للغة العربية الأعلى جودة على مستوى العالم. يستند “جيس” إلى 13 مليار مؤشر، وتم تدريبه على مجموعة بيانات جرى تطويرها حديثاً وتضم 395 مليار رمز باللغتين العربية والإنجليزية.
سيسخر نموذج “جيس”، وجاء تسميته تيمناً بأعلى قمة في دولة الإمارات العربية المتحدة، مزايا الذكاء الاصطناعي التوليدي في العالم العربي. ويعد هذا النموذج ثمرة تعاون بين مركز “إنسبشن”؛ وجامعة محمد بن زايد للذكاء الاصطناعي، أول جامعة للدراسات العليا المتخصصة ببحوث الذكاء الاصطناعي على مستوى العالم؛ وشركة “سيريبراس سيستمز”. وتم تدريب النموذج باستخدام “كوندور جالاكسي”، الحاسوب الفائق المدعوم بالذكاء الاصطناعي بقدرة حوسبة متعددة الإكسافلوبس (مليون ترليون عملية حسابية في الثانية)، والذي تم تصميمه بالتعاون بين “جي 42″ و”سيريبراس سيستمز”.
ويعد إطلاق “جيس” محطة بالغة الأهمية في مضمار الذكاء الاصطناعي في العالم العربي؛ ذلك أن هذا النموذج، الذي تم تطويره في العاصمة الإماراتية أبوظبي، يتيح لأكثر من 400 مليون متحدث باللغة العربية فرصة مهمة لاستكشاف القدرات الكامنة للذكاء الاصطناعي التوليدي، كما يعزز مكانة دولة الإمارات باعتبارها مركزاً رائداً للذكاء الاصطناعي، والابتكار، وصون الثقافة، والتعاون الدولي.
ويسعى مركز “إنسبشن”، من خلال فتح مصدر نموذج “جيس”، إلى حفز مشاركة المجتمعات العلمية والأكاديمية والمطورين في تسريع نمو منظومة حيوية للذكاء الاصطناعي باللغة العربية والارتقاء بمستوى االابتكار في هذا المجال، فقد يشكّل “جيس” نموذجاً يحتذى به للغات أخرى لا تحظى حالياً بدرجة كافية من التمثيل في بيئات الذكاء الاصطناعي الرائجة.
وفي هذا الصدد، علّق الرئيس التنفيذي لمركز “إنسبشن” للذكاء الاصطناعي، “أندرو جاكسون”: “نؤمن في ’إنسبشن‘ بأن التعاون هو أساس الازدهار. ونرسي اليوم معياراً جديداً لتقدم الذكاء الاصطناعي في منطقة الشرق الأوسط مع ضمان مكانة متميزة للغة العربية بكل ثرائها وإرثها في مشهد الذكاء الاصطناعي. ويعكس ’جيس‘ التزامنا الراسخ بالتميز والابتكار ونشر منظومة الذكاء الاصطناعي على نطاق أوسع”.
يبين تقييم أداء “جيس” تفوقه على النماذج اللغوية العربية الحالية بهامش كبير، ومنافسته للنماذج اللغوية الإنجليزية المشابهة على الرغم من تلقيه تدريباً أقل على بيانات اللغة الإنجليزية. وتُظهر هذه النتائج أن جزء اللغة الإنجليزية من النموذج تعلّم من بيانات اللغة العربية والعكس صحيح، مما يفتح آفاق حقبة جديدة في تطوير وتدريب النماذج اللغوية الكبيرة.
من جانبه، قال رئيس جامعة محمد بن زايد للذكاء الاصطناعي والبروفيسور الجامعي، البروفيسور “إيريك زينغ”: “تطلّب تطوير نموذج لغوي كبير للغة العربية من هذا المستوى إجراء أبحاث متقدمة في مجال الذكاء الاصطناعي، واكتساب فهم عميق للغة العربية بتنوعها وإرثها الغني وللأهمية المتنامية للنماذج اللغوية الكبيرة في مختلف جوانب المجتمع. وستواصل جامعة محمد بن زايد للذكاء الاصطناعي ريادة النماذج اللغوية الكبيرة التي تتميز بالكفاءة والفاعلية والدقة”.