الإمارات تطلق “فالكون 3”.. سلسلة نماذج لغوية صغيرة تتفوق في الأداء على النماذج العالمية

0 تعليق ارسل طباعة تبليغ حذف

أعلن معهد الابتكار التكنولوجي الإماراتي، اليوم إطلاق (فالكون 3) Falcon 3، وهي سلسلة مبتكرة ورائدة من النماذج اللغوية الصغيرة (SLMs)، ليحدث نقلة نوعية في إتاحة تقنيات الذكاء الاصطناعي المتقدمة للجميع.

وتمثل سلسلة نماذج (فالكون 3) نقلة نوعية في عالم نماذج اللغوية الصغيرة، إذ دُربت على مجموعة بيانات تتكون من 14 تريليون رمز (token)، وهو ما يمثل أكثر من ضعف حجم البيانات التي استخدمت في تدريب الجيل السابق من هذه نماذج فالكون، مما مكنها من تحقيق مستويات أداء وكفاءة غير مسبوقة.

وتتميز نماذج (فالكون 3) بقدرتها الفائقة على العمل بكفاءة عالية على بنى تحتية خفيفة الوزن، مما يتيح استخدامها في مجموعة واسعة من الأجهزة، بما يشمل الحواسيب المحمولة، وحتى الأنظمة التي تعتمد على وحدة معالجة رسومات (GPU) واحدة. ويساهم هذا التوافق مع الأجهزة المحدودة الموارد في إتاحة تقنيات الذكاء الاصطناعي المتقدمة لشريحة أوسع من المستخدمين والباحثين.

مواصفات نماذج  (فالكون 3):

تتكون سلسلة (فالكون 3) من أربعة نماذج ذكاء اصطناعي بأحجام مختلفة لتلبية احتياجات متنوعة، وهي: (Falcon3-1B)، و(Falcon3-3B)، و(Falcon3-7B)، و(Falcon3-10B)، مع توفر متغيرات أساسية ومتخصصة في التعليمات.

ويهدف هذا التنوع إلى تلبية احتياجات مختلفة للمطورين والباحثين والشركات، وتمكينهم من الاستفادة من قوة الذكاء الاصطناعي في تطبيقاتهم.

مزايا نماذج (فالكون 3):

تتميز سلسلة نماذج (فالكون 3) بتقنيات متطورة تساهم في رفع كفاءتها وأدائها بشكل ملحوظ، فقد خضعت النماذج لتدريب مكثف على 14 تريليون رمز (توكين)، أي أكثر من ضعف حجم التدريب الذي خضعت له نماذج (فالكون 2)، والذي اعتمد على 5.5 تريليونات رمز فقط.

وتُترجم هذه الزيادة الكبيرة في حجم البيانات التدريبية إلى تفوق ملحوظ في مختلف معايير الأداء، مثل: دقة فهم اللغة، والقدرة على توليد نصوص متسقة وذات جودة عالية، والقدرة على الإجابة عن الأسئلة بشكل دقيق، وغيرها من المهام اللغوية.

كما تعتمد النماذج على بنية فك التشفير مع استخدام تقنيات متقدمة، مما يساهم في تقليل استخدام الذاكرة، خاصة ذاكرة التخزين المؤقت للقيمة الرئيسية (KV cache) أثناء عملية الاستدلال، وتؤدي هذه التحسينات التقنية إلى تسريع العمليات وزيادة الكفاءة عند التعامل مع مجموعة متنوعة من المهام النصية.

كما أنها مُجهزة بنافذة سياق (context window) واسعة تبلغ 32 كيلوبايت، وهو ما يمكنها من معالجة المدخلات النصية الطويلة والمعقدة بكفاءة عالية، مثل: المستندات والتقارير والكتب. كما تتيح هذه النافذة السياقية الواسعة للنموذج الاحتفاظ بسياق أطول للنص، مما يحسن فهمها للنص وتوليدها لنصوص أكثر دقة واتساقًا.

وقد أشار معهد الابتكار التكنولوجي عبر موقعه الإلكتروني إلى أن نماذج (فالكون 3) تتميز بتعدد الاستخدامات، إذ صُممت للتعامل مع المهام العامة والمتخصصة، مما يوفر مرونة كبيرة للمستخدمين.

ويُعدّ النموذج الأساسي (base model) مثاليًا للتطبيقات التوليدية، مثل إنشاء النصوص والترجمة والتلخيص، بينما يتفوق النموذج المتغير التعليمات (instruction-tuned variant) في المهام الحوارية والتفاعلية، مثل خدمة العملاء وروبوتات الدردشة (chatbots).

تفوق في الأداء على النماذج العالمية:

تُظهر نتائج نماذج (فالكون 3) في لوحة المتصدرين في منصة (Hugging Face) أداءً جيدًا لجميع النماذج الأربعة. ومع ذلك، تُعدّ إصدارات 10B و 7B هي الأبرز والأكثر تميزًا، إذ حققت نتائج متطورة في مجموعة متنوعة من المهام، تشمل: التفكير، وفهم اللغة، واتباع التعليمات، ومهام البرمجة، والرياضيات.

كما تفوقت على نماذج أخرى مماثلة في الحجم، فقد تتفوق إصدارات 10B و 7B من فالكون 3 على منافسين بارزين مثل: (Gemma 2-9B) من جوجل، و(Llama 3.1-8B) من ميتا، بالإضافة إلى نموذج (Qwen 2.5-7B) من علي بابا، الذي يُعدّ رائدًا في فئته، في معظم المعايير المرجعية.

أهمية نماذج (فالكون 3) في سوق نماذج اللغوية الصغيرة:

يأتي إطلاق سلسلة (فالكون 3) في وقت يشهد فيه سوق النماذج اللغوية الصغيرة المفتوحة المصدر نموًا سريعًا، وذلك نظرًا  إلى كفاءتها وقدرتها على تحمل التكاليف وإمكانية نشرها عبر الأجهزة ذات الموارد المحدودة.

وتُعدّ هذه النماذج مثالية لمجموعة واسعة من التطبيقات في مختلف القطاعات، مثل: خدمة العملاء والرعاية الصحية وتطبيقات الهاتف المحمول وإنترنت الأشياء.

لذلك تمثل سلسلة (فالكون 3) إضافة قيمة إلى هذا السوق، إذ توفر أداءً قويًا وكفاءة عالية، مما يسهل  تطوير تطبيقات ذكاء اصطناعي مبتكرة وفعالة.

وقد عبّر معالي فيصل البناي، الأمين العام لمجلس أبحاث التكنولوجيا المتطورة ومستشار رئيس الدولة لشؤون الأبحاث الإستراتيجية والتكنولوجيا المتقدمة عن أهمية هذا إطلاق هذا النموذج قائلًا: “لا يمكن إنكار الأثر التحويلي الكبير للذكاء الاصطناعي، واليوم نعزز ريادتنا في مجتمع الذكاء الاصطناعي، لا سيما في مجال المصادر المفتوحة، من خلال إطلاق سلسلة النماذج النصية (فالكون 3)، ويمثل هذا الإصدار امتدادًا طبيعيًا لما بدأناه مع فالكون 2، وخطوة أساسية نحو عصر جديد من الابتكار في الذكاء الاصطناعي. ويعكس التزامنا بجعل هذه التقنيات المبتكرة متاحة للجميع رؤيتنا لتحقيق المساواة العالمية ودفع عجلة الابتكار للجميع”.

ومن جانبها، أكدت الدكتورة نجوى الأعرج، الرئيس التنفيذي لمعهد الابتكار التكنولوجي، التزام المعهد بالتميز العلمي قائلة: “قد أثر تفانينا في البحث العلمي المتقدم وجذب الكفاءات المتميزة عن إطلاق فالكون 3، الذي يجسد رؤيتنا في تحقيق التميز العلمي، مع تعزيز الكفاءة ووضع معايير جديدة في مجال الذكاء الاصطناعي”.

نسخ الرابط تم نسخ الرابط

إخترنا لك

أخبار ذات صلة

0 تعليق