نموذج فالكون العربي من معهد الابتكار التقني: مكانه في منظومة الذكاء الاصطناعي السيادي
نموذج Falcon العربي هو النموذج الذي تَلجَأ إليه جهةٌ سياديّة عُمانية حين تكون صحّةُ اللغة العربية هي المتطلَّبَ المُهيمن، وحين تُريد المؤسسةُ منشأً إقليمياً لأوزان النموذج. بناه معهد الابتكار التقني في أبوظبي وأصدره ضمن عائلة فالكون LLM، وهو يتصدّر اليوم لوحة النماذج العربية المفتوحة في فئته، بترخيص متساهل، وعتادٍ تستطيع المؤسسةُ شراؤه فعلاً. هذا دليلٌ عمليّ لموقعه ضمن النشر السيادي مقارنةً بـQwen 3.6 وGemma 4، وما الذي ينبغي التخطيط له حين تُدخله إلى داخل محيطك المؤسسي.
قصّة معهد الابتكار التقني وأهمّية نموذج إقليمي سيادي
معهد الابتكار التقني هو الذراع البحثيّ التطبيقيّ لمجلس البحوث التكنولوجية المتقدّمة في أبوظبي. افتتح مختبره للذكاء الاصطناعي عام 2021، وأطلق أوّل نموذج فالكون LLM برخصة متساهلة عام 2023، حين كانت معظم الأوزان المفتوحة من المستوى الحدودي محبوسةً خلف شروطٍ بحثيّة. ومنذ ذلك الحين أنتج المختبر Falcon 7B و40B و180B، ثمّ Falcon Mamba، ثمّ عائلة Falcon-H1 الهجينة، وأخيراً نموذج Falcon-Arabic-7B-Instruct المخصّص. هذا التدرُّج ليس عرضياً: فأحد الخيوط الاستراتيجية في تكليف المعهد هو ضمان ألّا تعتمد المؤسسات الناطقة بالعربية على نماذجَ دُرِّبت أساساً في معامل أنجلوسكسونية أو صينية في اللغة التي تكتب بها كلّ يوم.
الأثر العمليّ على جهةٍ عُمانية مشترية واضحٌ: ثلاثٌ من أربع عائلات الأوزان المفتوحة الرائدة (Gemma من Google، وLlama من Meta، وQwen من Alibaba) بُنيت خارج دول مجلس التعاون، ودُرِّبت على العربية بوصفها لغةً ضمن لغات. أمّا فالكون العربي فهو الوحيد الذي بَنَتْه مؤسسةٌ مَنْطَقِيّة (شرق-أوسطية) جعلت العربية متطلَّباً من الدرجة الأولى، على بنيةٍ تحتية تعمل داخل دول الخليج، وعلى يد فِرَقٍ تقرأ وتكتب اللهجات والمستويات التي يُراد للنموذج خدمتها. هذا لا يجعله تلقائياً الأفضل لكلّ مهمّة، لكنّه يجعله ذا أوضح منشأ إقليمي، وهو معيارٌ يَطلُبه عادةً مجالسُ المشتريات السياديّة حين تسأل: من أين جاءت هذه الأوزان؟
السياق الإقليمي الأوسع مهمٌّ كذلك. وجود فالكون جزءٌ من القوس نفسه الذي ينتمي إليه مشروع جيس السعودي بقيادة G42 وInception، واستثمارات Stargate الإماراتية في الحوسبة، وتحرّكات عُمان نحو قُدرة وطنية للذكاء الاصطناعي. للوزارات والجهات التنظيميّة والبنوك السياديّة التي تُؤطِّر قرار الشراء بمنطق بناء القُدرة الإقليمية، تَزِنُ هذه التزكية ما يَزِنُ الرَّقم القياسي.
نظرة تقنية: المتغيّرات والبنية
عائلة فالكون في 2026 أوسعُ من نموذج واحد، وتسمياتها قد تربك المشتريَ لأوّل مرّة. المتغيّرات التي تَهمّ النشرَ السياديَّ العربي هي الأربع التالية.
- Falcon-Arabic-7B-Instruct. محوّل كثيف بسبعة مليارات معامل، مُهَيَّأ بالتعليمات للعربية تحديداً، مُشتقّ من قاعدة Falcon 3. هذا النموذج هو الذي يحمل صدارة لوحة النماذج العربية المفتوحة في فئته. ثنائي اللغة قَدْرَ المُسْتطَاع، لكنّه عربيّ-أوّلاً، وهو الخيار الافتراضي الصحيح للمراسلات الوزارية والنصوص الموجَّهة للجهات التنظيمية وكلّ حملٍ تكون فيه صحّة العربية هي المتطلَّب المُهيمن.
- Falcon-H1 7B and 34B. بنية هجينة تجمع طبقات الانتباه مع طبقات فضاء الحالة الانتقائيّة بأسلوب Mamba، صدرت في أحجام متعدّدة. التصميم الهجين يمنحها سلوكاً أفضلَ في السياق الطويل من محوّلٍ صرفٍ بحجم مماثل، مع تكلفة ذاكرة أقلّ. النسخة 34ب هي الرائد المؤسسيّ العمليّ، وتتعامل مع التبديل اللغوي العربي-الإنجليزي تعاملاً أصيلاً. للاستزادة راجع التقرير التقني لفالكون-إتش1.
- Falcon Mamba 7B. نسخة فضاء الحالة الصرفة، مفيدة للسياقات الطويلة جداً حيث تكون التكلفة التربيعية للانتباه باهظة. ورقة فالكون مامبا تشرح البنية بالتفصيل.
- عائلة Falcon 3. النسخ القاعدية والتعليميّة 1ب و3ب و7ب و10ب التي تقوم عليها Falcon-Arabic-7B. مفيدة للنشر الطرفيّ والمساعدين المُضمَّنين حيث يَهمّ زمنُ الاستجابة أكثرَ من أعلى نقاط لوحة الأداء.
معمارياً، يستخدم خطّ فالكون تقنيات محوّل قياسية مع فروقات عمليّة قليلة. الانتباه متعدّد الاستعلام (multi-query attention) يُقلّل ذاكرة مخبأ KV أثناء الاستدلال. الترميز الموضعي الدوّار (RoPE) مُعَايَر لكلّ متغيّر. وفي Falcon-H1 تتبادل كتلُ فضاء الحالة الانتقائي مع كتل الانتباه بنسبة قريبة من واحدٍ إلى واحد. لا شيء غريبٌ على مهندسٍ سبق له العمل مع Llama أو Qwen أو Gemma. الدعم في يوم الإطلاق على Hugging Face يعني أنّ الأدوات القياسية (Transformers، PEFT، TRL، vLLM، llama.cpp، MLX) تعمل دون إضافات.
شروط الرخصة للاستخدام السيادي
تطوّر تاريخ رخصة فالكون. صدر فالكون 7ب و40ب عام 2023 بموجب Apache 2.0. أمّا فالكون 180ب فحمل سياسة استخدام مقبول أكثر تقييداً، أوقفت بعض المسارات التجارية وأَلْزَمَت الفِرَقَ القانونية السياديّة بمراجعة منفصلة. النسخ الحالية Falcon 3 وFalcon-H1 وFalcon-Arabic-7B تَصدُر تحت رخصة TII Falcon LLM، التي قبلتها Free Software Foundation بوصفها رخصة برمجيات حرّة، وهي متساهلةٌ بما يكفي لمعظم الأحمال السياديّة والتجارية.
الالتزامات القائمة موازية لـApache 2.0 عملياً. الاستخدام التجاري والتعديل وإعادة التوزيع، بما في ذلك في صورة معدَّلة، مسموحٌ بها مع الإبقاء على الإشعار الأصلي. تَزكِيَةُ منتجات مشتقّة باسم فالكون مقيَّدة. لا توجد copyleft، ولا اشتراط بنشر الموائمات أو بيانات التدريب، ولا بندٌ يمنح المعهدَ أو طرفاً ثالثاً حقَّ تدقيق نسخةٍ منشورة.
للجهات السياديّة والمالية في عُمان، المراجعة القانونية قصيرة. الفِرَقُ التي اعتمدت Apache 2.0 ستعتمد رخصة فالكون الحالية دون عناء. الاستثناء الوحيد هو فالكون 180ب بسياسته الأقدم، ولا نوصي به افتراضياً للنشر السيادي الجديد ما لم يكن للمؤسسة سببٌ خاصّ يُرجِّحه.
نقاط القوة العربية: اللهجة، الفصحى، التبديل اللغوي، نصوص التعرّف الضوئي
دُرِّب فالكون العربي على نسبة بياناتٍ عربية أعلى بكثير من العائلات العامّة، ويظهر ذلك في المواضع التي تَهمّ المؤسسةَ أكثر.
العربية الفصحى المعاصرة الرسمية. هذه أرضُه. على مستوى الفصحى التي تُكتَب بها الرسائلُ الوزاريةُ وإشعاراتُ الجهات التنظيميّة والملخّصاتُ القضائية ومحاضرُ مجلس الشورى، يُنتج Falcon-Arabic-7B صرفاً وتطابقاً وأسلوباً اصطلاحياً أنظفَ من Qwen 3.6 أو Gemma 4 بحجمٍ مماثل. صحّةُ الجملة على مستوى التركيب هي الفارق الأهمّ، وفالكون أقلّ ميلاً إلى الانزلاق نحو سجلٍّ شامي أو مصري حين يكون الموجَّهُ بنبرة عُمانية رسميّة.
سعةُ اللهجات. يضمّ فالكون العربي اللهجاتِ الكبرى في خليط التدريب، مع تغطية قويّة للخليجية والمصرية والشاميّة. أمّا الخصائصُ العُمانية تحديداً (أنماط النفي، المفردات الخليجية، بعض التعبيرات العُمانية) فأداؤه فيها جيّد لا مُتقَن، ويستفيد من تخصيص خفيف على عيّنات مؤسسيّة. سعةُ كوين 3.6 المُطْلَقة في اللهجات أوسع، لكنّ جودة فالكون على الطرف الرسميّ من الطيف اللهجي عادةً أنظف.
التبديل اللغوي العربي-الإنجليزي. تتعامل نُسَخُ Falcon-H1 مع النمط العُماني المؤسسيّ الشائع الذي تحمل فيه جملةٌ عربيةٌ اختصاراً إنجليزياً (PDPL، NCSI، OQ) أو اسماً لاتينياً، دون فقدِ السياق أو كَسْرِ اتّجاه الكتابة. أمّا Falcon-Arabic-7B فأكثرُ تركّزاً على العربية، ويُفضَّل إقرانه بنموذج إنجليزي منفصل للمهام الإنجليزية. لمعظم حالات الاستخدام السياديّة في عُمان، Falcon-H1 7ب أو 34ب هو الخيار العمليّ.
نصوصُ التعرّف الضوئي على الحروف. مجموعةُ بيانات مؤسسيّة في الواقع نادراً ما تكون يونيكود نظيفاً، بل هي مُخرَجاتُ OCR من رسائل ممسوحة وملفّات قضائيّة وفواتير وأرشيفات وزارات، ما يعني وجودَ حروفٍ لاتينية شاردة وتشكُّلاتٍ عربيّةٍ مُتعرَّف عليها خاطئةً وتشكيلاً مكسوراً. فالكون العربي متينٌ بشكل معقول أمام ضجيج OCR العربي، لأنّ خليطَ التدريب احتوى محتوًى من هذا النوع. للمؤسسات التي معظمُ أرشيفها PDF ممسوح، يَفُوقُ فالكون العربي وكوين 3.6 معاً نموذجاً عامّاً مُخصَّصاً على نصوصٍ نظيفة.
مقارنة فالكون العربي بكوين 3.6 على العربية العُمانية
المقارنةُ العمليّة التي يحتاجها معظمُ المشترين العُمانيين هي بين فالكون العربي وكوين 3.6، فهما العائلتان المفتوحتان اللتان تتعاملان مع العربية بجدّيّة وبجودة إنتاج. للمزيد من جانب كوين راجع تحليلنا المعمّق معايير كوين 3.6 للمعالجة الطبيعية للعربية. والصيغة الموجزة لمقارنةٍ سياديّة عُمانية:
- جودة الفصحى الرسميّة. فالكون العربي يفوز في التطابق والصرف وثبات السجلّ. كوين 3.6 منافسٌ، لكنّه أَمْيَلُ إلى السجلّ الشامي في التكميل الطويل.
- سعة اللهجات. كوين 3.6 يفوز في السعة المُطْلَقة وفي المرونة العامّيّة. فالكون يفوز في جودة الطرف الرسميّ من الطيف.
- التبديل اللغوي. Falcon-H1 7ب و34ب يُضاهيان أو يتقدّمان على كوين 3.6 في التبديل العربي-الإنجليزي داخل الجملة. Falcon-Arabic-7B وحده أضعفُ على الجانب الإنجليزي.
- استخدامُ الأدوات والاستدعاء الوظيفي. يتقدّم كوين 3.6 بلس النماذجَ المفتوحة في معايير العملاء الذكيّين واستخدام الأدوات (SWE-Bench Verified، Terminal-Bench، MCPMark) بفارقٍ واسع. فالكون العربي يدعم الاستدعاء الوظيفي، لكنّه ليس الخيار الأمثل حين يكون النموذج مُنسِّقاً لعشرات الأدوات.
- طول السياق. كوين 3.6 بلس يحمل في طبقته العُليا حتى 256 ألف رمز. Falcon-H1 يصل إلى 64 إلى 128 ألفاً بحسب المتغيّر، وسلوكُ السياق الطويل جداً أفضلُ في Falcon Mamba. للأحمال الوثائقيّة الكثيفة، الأَفْضَلِيّةُ لكوين.
- تكلفةُ الاستدلال. Falcon-Arabic-7B هو الأكفأ حين يكون الحملُ عربياً صرفاً. يعمل على مسرّع محطّة عمل واحد بدقّة مكمَّمة ويخدم فريقاً مؤسسياً صغيراً دون آلة من فئة البرج.
الإجابةُ الناضجة هي تشغيلُ النموذجَين معاً. يستضيف جهاز حصن فالكون العربي (أو Falcon-H1) وكوين 3.6 جنباً إلى جنب، مع طبقة توجيه تُرسل المراسلات الفصيحة الرسمية إلى فالكون، والمحادثات اللهجية أو المُستدعِية للأدوات إلى كوين، والملخّصات الثنائية الطويلة إلى أيٍّ من المتغيّرات يَملِك السَّعَة. توحيد نموذج عربي واحد للاستخدام السيادي وَسَامَة شراء، لا أمثليّة تقنية.
تحجيم العتاد والتكميم لفالكون العربي
فالكون العربي ألطفُ على العتاد الصغير من معظم النماذج الرائدة، لأنّ أقوى متغيّراته 7ب و34ب لا 70ب فأكثر. الأرقام التالية تفترض موجَّهات مؤسسية واقعية (متوسط طول 4 إلى 32 ألف رمز)، أهدافَ زمن استجابة تفاعلي، وتزامناً معقولاً.
طبقة محطّة العمل (النواة). جهاز Apple M3 Ultra Mac Studio بذاكرة موحَّدة 128 إلى 256 جيجابايت يُشغّل Falcon-Arabic-7B-Instruct بتكميم 4-بت أو 8-بت عبر MLX، ويخدم من 1 إلى 4 مستخدمين متزامنين بزمن استجابة أقلّ من ثانيتين للرمز الأوّل. الجهازُ نفسه يَخدم Falcon-H1 7B بتزامن مماثل. هذه الطبقة المناسبة لمكتب وزير، أو فريق مختصّ صغير لدى جهة تنظيمية، أو نشر تجريبي.
الطبقة القسميّة (البرج). مسرّع NVIDIA H100 80 GB أو RTX 6000 Blackwell 96 GB يَخدم Falcon-Arabic-7B بدقّة BF16 لمن 50 إلى 100 مستخدم متزامن، بزمن تكميل أقلّ بكثير من حدود التفاعليّة. المسرّعُ نفسه يتعامل مع Falcon-H1-34B بتكميم 4-بت GPTQ أو AWQ لـ30 إلى 50 مستخدماً. للسياق المستدام بطول 256 ألف رمز عبر متغيّر Falcon-H1 الأكبر، الترقيةُ إلى H100 ثانٍ أو إلى H200 هي الخطوة الصحيحة.
الطبقة المؤسسيّة (الرفّ). رفٌّ يحوي مسرّعَين إلى أربعة من H100 أو H200 يُشغّل فالكون العربي وجيمّا 4 وكوين 3.6 معاً، ويحتفظ بسَعَةٍ لجولات التخصيص، ويتعامل مع مئات المستخدمين عبر نشرٍ متعدّد الأقسام أو متعدّد المستأجرين. تخزين NVMe بعشرات التيرابايتات يكفي للأوزان الخامّ ومجموعات الموائمات وأرشيف الموجَّهات.
التكميم. يعمل فالكون العربي بنظافة عبر سلاسل التكميم القياسية. صيغة GGUF Q4_K_M و Q5_K_M عبر llama.cpp تُنتج فقدَ جودةٍ طفيفاً مقابلَ توفير ذاكرة ملموس. AWQ وGPTQ في نطاق 4-بت تُنتج جودةً أعلى قليلاً ضمن البصمة نفسها. MLX 4-بت هو الخيار الصحيح على Apple Silicon. تجنّب التكميم العدوانيّ 2-بت أو 3-بت على العربية حتى تتحقّق من نتائجه على توزيع الموجَّهات لديك، فصرفُ العربية أكثرُ حساسيّةً لضجيج التكميم من الإنجليزية.
التخصيص للنبرة المؤسسية العُمانية
يُنتج فالكون العربي فصحى نظيفة جاهزاً. أمّا إنتاج فصحى مؤسسيّة عُمانيّة محدّدة، بألقابها وافتتاحياتها الوزاريّة وأنماط الإحالة والاقتباس، فيتطلّب التخصيص على متن المؤسسة نفسها. الوصفات مباشرة.
LoRA على Falcon-Arabic-7B وFalcon-H1 7B. يُجمِّد التكييف مُنخفضُ الرتبة الأوزانَ القاعديّة ويتعلّم موائمات صغيرة من رتبة 16 إلى 64. مسرّعُ H100 واحد يُدرّب موائمَ LoRA على بضعة آلاف عيّنة مؤسسيّة في ساعات لا أيّام. هذه الوصفة لاعتماد نبرة المؤسسة وأسلوبها في الإحالة دون مَسٍّ بالسلوك القاعديّ.
QLoRA على Falcon-H1 34B. يُكمّم LoRA المكمّم القاعدةَ المجمَّدة إلى 4-بت، ما يُسقط ذاكرة التدريب بما يكفي لتخصيص نموذج 34ب على مسرّع محطّة عمل. مهمٌّ للمؤسسات التي تريد التكرار السريع داخل المحيط دون شراء جهاز تدريبٍ من فئة البرج.
التخصيص الخاضع الكامل (SFT) على متغيّرات Falcon 3 الصغيرة. النسخ القاعديّة 1ب و3ب تَقبل تخصيصاً كاملاً على مسرّع راقٍ واحد. هذا المسارُ الصحيح حين تريد المؤسسة مساعداً متخصّصاً ضيّق النطاق (مساعدُ صياغة تقارير داخليّة، مولِّد شهادات بصيغة ثابتة) وهي مستعدّة لصيانة نسخة مخصَّصة بالكامل.
الأدوات والعمل خارج الشبكة. Hugging Face PEFT وTRL، وbitsandbytes للتكميم 4-بت، وUnsloth Studio لتدفّقٍ بواجهة، كلّها تدعم متغيّرات فالكون منذ الإطلاق. تُشحَن أجهزة حصن بهذه الأدوات مهيَّأةً للعمل دون اتّصال خارجي. يجري التخصيص بأكمله داخل المؤسسة. لا تشترط الرخصةُ نشرَ الموائمات الناتجة.
متى يُنشر فالكون العربي إلى جانب جيمّا 4
إقرانُ فالكون العربي بـجيمّا 4 هو النمطُ الذي تنتهي إليه معظم الجهات السياديّة العُمانية بعد أشهرٍ من الاستخدام الفعلي. النموذجان متكاملان في ما يَهمّ.
- فالكون العربي للأحمال التي تَهيمن فيها صحّة العربية. المراسلاتُ الوزاريةُ، إشعاراتُ الجهات التنظيمية، الملخّصاتُ الشرعية والقضائية، الصياغة العربية الداخلية، وكلُّ ما تكون كُلْفَةُ سُوْءِ العربية فيه عالية.
- جيمّا 4 للسياق الطويل والوسائط المتعدّدة. تحليلُ ملفّات المشتريات (200 إلى 600 صفحة من ردود مزايدين متفرّقة)، استدلالُ كاملِ شفرة المصدر، تركيبُ السياسات متعدّد الوثائق، وكلّ ما تستحقّ نافذةُ 256 ألف رمز فيه قيمتها، وسير الأعمال متعدّدُ الوسائط (صورة، فيديو، نصّ). راجع تحليلنا المعمّق لجيمّا 4.
- كوين 3.6 ضمن المنظومة للمحادثة اللهجيّة الكثيفة واستخدام الأدوات الذكيّ، فيكتمل الثلاثيّ.
شكلُ النشر داخل الجهاز مباشرٌ. تُحمَّل عائلاتُ النماذج الثلاث مرّة واحدة عند النشر، تَستقرّ على NVMe المؤسسة، وتُقدَّم عبر طبقة استدلالٍ موحَّدة (vLLM لطبقة GPU، MLX لطبقة Apple Silicon). طبقةُ توجيهٍ أمامها تختار، حسب كلّ طلب، أيُّ نموذجٍ يتولّاه، اعتماداً على كشف اللغة وطول الموجَّه ودلالات المهمّة. تجربةُ المستخدم: مساعدٌ واحد. وأمّا البنيةُ التحتية فتحتها: متعدّدةُ النماذج، متعدّدةُ المستأجرين، ولا تُرسل رمزاً واحداً خارج المحيط. للمؤسسات التي تشغّل أحجاماً أصغر، يغطّي مقالنا نشر فالكون العربي على الأطراف بَصْمَةَ الحاسوب المحمول والخادم الصغير.
هذا هو الشكل العمليّ للذكاء الاصطناعي السيادي في 2026. ليس نموذجاً واحداً، بل محفظةٌ صغيرة من ثلاث أو أربع عائلات أوزان مفتوحة، اخْتِيرَت كلٌّ منها لِما تُجِيد، وكلُّها تعمل داخل المؤسسة، وكلّها قابلةٌ للاستبدال متى تحرّك الميدان. يحجز فالكون العربي مكاناً دائماً في تلك المحفظة لأيّ جهةٍ عُمانية تأخذ صحّة العربية على محملِ الجدّ، ولأيّ لجنةٍ سياديّة تريد منشأً إقليمياً في قلب منظومتها.
إن كانت مؤسستكم تُقَيِّم فالكون العربي، أو تُقَارِنه بكوين 3.6 أو جيمّا 4، أو تخطّط لجهاز سياديّ متعدّد النماذج، فالخطوة التالية بسيطة. راسلونا على [email protected] أو على واتساب +968 9889 9100 لإحاطةٍ مدّتها ساعةٌ في مسقط أو في أيّ مكانٍ بدول مجلس التعاون. سنستعرض النموذج والبنية وخطّة قابلة للتنفيذ ضمن جدولكم. التسعير بحسب الطلب، مُحَجَّمٌ على متطلّباتكم العربية والتزامنية تحديداً.
أسئلة شائعة
هل فالكون العربي أفضل من كوين 3.6 للعربية العُمانية؟
في اللغة العربية الفصحى المعاصرة الرسمية، يتصدّر فالكون العربي من معهد الابتكار التقني لوحة النماذج العربية المفتوحة، ويُنتج صرفاً وتراكيب أنظف من كوين 3.6 على نمط الكتابة الذي تتطلّبه المراسلات الوزارية وإشعارات الجهات التنظيمية والملخّصات القضائية. أمّا في اللهجات الخليجية والعُمانية والتبديل اللغوي مع الإنجليزية وسعة استخدام الأدوات، فإنّ كوين 3.6 بلس هو الخيار الأوسع لأنّه دُرِّب على خليط متعدّد اللغات أكبر. الإجابة الناضجة هي تشغيل النموذجَين معاً داخل جهاز حصن نفسه وتوجيه كل مهمة بحسب طبيعتها.
هل فالكون العربي مجّاني للاستخدام التجاري والحكومي؟
نعم، مع ملاحظة واحدة. الإصدارات الحديثة بما فيها Falcon 3 وFalcon-H1 وFalcon-Arabic-7B تصدر برخصة TII Falcon LLM، وقد قبلتها مؤسسة البرمجيات الحرّة بوصفها رخصة برمجيات حرّة، مع السماح بالاستخدام التجاري والتعديل وإعادة التوزيع شريطة الإبقاء على الإشعار الأصلي وعدم استخدام اسم النموذج للتزكية. أمّا فالكون 180ب فيحمل سياسة استخدام مقبول أكثر تقييداً. للجهات السيادية في عُمان، الرخصة الحالية قريبة من Apache 2.0 من حيث الروح.
ما العتاد المطلوب لتشغيل فالكون العربي داخل المؤسسة؟
يعمل Falcon-Arabic-7B وFalcon-H1 7B بسهولة على Apple M3 Ultra Mac Studio بذاكرة موحّدة 128 إلى 256 جيجابايت بتكميم 4-بت، ويخدم من 1 إلى 4 مستخدمين بزمن استجابة تفاعلي. لعشرين إلى خمسين مستخدماً متزامناً، يكفي مسرّع NVIDIA H100 80 GB أو RTX 6000 Blackwell 96 GB. للنشر المؤسسي بمئات المستخدمين، يكفي رفّ يحوي مسرّعَين إلى أربعة من H100 أو H200. تسمّي حصن هذه الطبقات: النواة، البرج، والرفّ.
لماذا تشحن حصن أكثر من نموذج عربي بدلاً من توحيد النموذج الواحد؟
لأنّه لا يوجد نموذج مفتوح واحد هو الأفضل لكلّ مهمّة عربية، ولأنّ الجهاز السيادي أصلٌ طويل العمر لا ينبغي ربطه بعائلة واحدة. فالكون العربي هو الأفضل للعربية الفصحى الرسمية وللجهات التي تُقدِّر المنشأ الإقليمي. كوين 3.6 يتقدّم في سعة اللهجات واستخدام الأدوات. جيمّا 4 يتقدّم في طول السياق (256 ألف رمز) وفي الوسائط المتعدّدة. تشغيل الثلاثة داخل جهاز حصن نفسه يُتيح التوجيه بحسب المهمّة، والاستبدال عند تغيُّر لوحات الأداء، والاستمرارية عبر الأجيال دون إعادة شراء.
هل يتعامل فالكون العربي مع التبديل بين العربية والإنجليزية؟
نعم. درّبت متغيّرات Falcon-H1 7B و34B صراحةً بوصفها نماذج ثنائية اللغة عربي-إنجليزي، وهي تتعامل مع التبديل اللغوي داخل الجملة بنظافة، بما في ذلك النمط العُماني الشائع الذي يحمل اختصاراً إنجليزياً مثل PDPL أو NCSI أو OQ ضمن جملة عربية. Falcon-Arabic-7B أكثر تركّزاً على العربية، ويُفضَّل إقرانه بنموذج إنجليزي منفصل للمهام الإنجليزية. لمعظم حالات الاستخدام السيادية في عُمان، Falcon-H1 هو الخيار العملي.
هل يمكن تخصيص فالكون العربي على بيانات مؤسسية مصنّفة؟
نعم. تُحمَّل أوزان النموذج مرّة واحدة عند النشر، وتعيش بالكامل داخل المؤسسة بعد ذلك. يجري التخصيص على مسرّعات المؤسسة وبياناتها دون أن تخرج أيّ معلومة من المحيط. يُدعَم كلٌّ من LoRA وQLoRA والتخصيص الكامل عبر مجموعة Hugging Face PEFT وTRL القياسية. تُشحَن أجهزة حصن بهذه الأدوات مُهيّأةً للعمل خارج الشبكة، حتى يستطيع فريق البيانات التكرار دون اتّصال خارجي. لا تشترط الرخصة نشر الموائمات الناتجة.