الذكاء الاصطناعي السيادي مقابل نماذج اللغة في السحابة العامة: مقارنة شاملة للتكلفة والمخاطر للحكومة العُمانية
سأل وكيل وزارة عُماني المدير المالي سؤالاً بسيطاً: "إذا اعتمدنا نموذج لغة سحابياً عاماً للوزارة، ما تكلفته على مدى ثلاث سنوات، وما الذي يُعرّضنا له؟" الإجابة الصادقة ليست رقماً واحداً، بل رقمان، أحدهما بالريال العُماني والآخر بمعيار التعرّض القضائي، مع رؤية واضحة لأيّهما يَغلب عند كل حجم استعلامات. يُعالج هذا المقال المقارنة كما ينبغي للمشتري السيادي معالجتها: بأسعار المزوّدين العامة لعام 2026 في كفة، وبالتكلفة الفعلية لعتاد النشر الداخلي ومُشغّليه في الكفة المقابلة، إضافةً إلى البنود التي تُغفلها أغلب جداول التكاليف بصمت.
سؤال التكلفة الإجمالية للملكية من منظور المشتري السيادي
لا يشتري المشتري السيادي الذكاء الاصطناعي كما تشتريه شركة ناشئة. الأفق ثلاث سنوات لا ثلاثة أشهر. والمعيار المرجعي ليس "مهندس واحد يجرّب التوجيهات"، بل "ملف العمل الكامل للوزارة، كل يوم عمل، طوال دورة الموازنة". وللجهات العُمانية يقع النطاق الواقعي بين 100,000 و500,000 استعلام يومياً، تبعاً لما إذا كان الذكاء الاصطناعي يخدم مديرية واحدة أو وزارة كاملة أو قناةً موجّهة للمواطنين.
الاستعلام المفيد ليس استكمالاً تلقائياً برمز واحد. السمة الواقعية لعبء العمل الوزاري متوسط مدخلات قدره 4,000 رمز (فقرة إحاطة وسياق مُسترجَع من مكتبة المستندات) ومتوسط مخرجات قدره 600 رمز (تلخيص بنيوي، صياغة أوّلية، إعادة صياغة ثنائية اللغة). عند 200,000 استعلام يومياً، يُترجَم ذلك إلى 800 مليون رمز إدخال و120 مليون رمز إخراج يومياً، أي قرابة 24 مليار رمز إدخال و3.6 مليار رمز إخراج شهرياً. تثبيت هذه السمة يتيح المقارنة العادلة بين السحابة والنشر الداخلي على عبء العمل ذاته، لا على افتراضات بلاغية.
لسؤال التكلفة إجابتان. الأولى الفاتورة، والثانية ما لا تتضمّنه الفاتورة: التعرّض القانوني، الارتباط بمزوّد، تكلفة الخروج، خطر إيقاف النموذج، والعبء التشغيلي لإدارة سلسلة إمداد أجنبية. التكلفة الإجمالية الحقيقية مجموع الاثنين.
نموذج تكلفة نماذج اللغة في السحابة
أسعار نماذج اللغة في السحابة العامة لعام 2026 موثّقة جيداً. تُعلن شركة Anthropic عن سعر Claude Opus 4.7 بـ 5 دولارات لكل مليون رمز إدخال و25 دولاراً لكل مليون رمز إخراج، وClaude Sonnet 4.6 بسعر 3 و15، وClaude Haiku 4.5 بسعر 1 و5. وتُكرّر منصة AWS Bedrock هذه الأسعار تقريباً لعائلة Anthropic، مع زيادة قرابة عشرة بالمائة على الاستدلال عبر المناطق. وتقع أسعار OpenAI في الصف الأمامي ضمن نطاق مماثل، فيما تُسعّر متغيّرات المستوى المتوسط بأقل، والمتغيّرات ذات التفكير المُعمّق بأعلى. أما الإنتاجية المخصّصة على Bedrock فتُحاسَب بالساعة بنطاق يتراوح بين 40 و200 دولاراً لكل ساعة لكل وحدة نموذج.
لنُدخل عبء العمل البالغ 200,000 استعلام يومياً ضمن أسعار من فئة Sonnet. أربعة وعشرون مليار رمز إدخال بـ 3 دولارات لكل مليون يساوي 72,000 دولار. وثلاثة فاصل ستة مليار رمز إخراج بـ 15 دولاراً لكل مليون يساوي 54,000 دولار. الإجمالي 126,000 دولار شهرياً على الاستدلال وحده، قبل أي بند آخر تحمله الفاتورة.
وهذه البنود الأخرى ليست هيّنة. أكثرها تجاهلاً تكلفة الخروج. تتقاضى AWS رسماً قدره 0.09 دولار لكل جيجابايت لأول عشرة تيرابايت من الخروج إلى الإنترنت، مع إضافة 0.045 دولار لكل جيجابايت لمعالجة بوابة NAT الخاصة بالشبكات الفرعية المُغلقة. وبنية استرجاعية تُرسل التضمينات وقطع المستندات وتُخرج الأدوات ذهاباً وإياباً بين المناطق تُنتج بسهولة من 5 إلى 20 تيرابايت من الخروج الشهري لعبء عمل بحجم 200 ألف استعلام يومياً، أي ما بين 450 و1,800 دولار شهرياً. ويُضيف النقل بين المناطق بسعر 0.02 دولار لكل جيجابايت طبقة مماثلة.
ثم يأتي مُضاعِف التكرار. لا يُشغّل أي وزارة جادة نشراً سحابياً من منطقة واحدة. والتشغيل النشط في منطقتين يُضاعِف التكلفة الجارية بنحو 1.6 إلى 1.8 ضعف بعد إدراج تكاليف نسخ البيانات وأدوات الصلاحية والاستدلال بين المناطق. كذلك يُضيف العبء الحوكمي، اتحاد الهوية، شحن سجلات التدقيق، أدوات FinOps، إدارة العقود مع ممثل المزوّد المحلي، والمراجعة القانونية المطلوبة لوضع النقل عبر الحدود وفق المادة 23 من المرسوم السلطاني 6/2022، ما بين 5,000 و15,000 دولار شهرياً عند هذا الحجم.
التجميع المسؤول لهذه البنود يضع عبء عمل سحابي بحجم 200 ألف استعلام يومياً عند جودة Sonnet في حدود 220,000 إلى 280,000 دولار شهرياً، أي ما بين 2.6 و3.4 مليون دولار سنوياً، قبل أي خصم على الحجم وقبل أي نمو.
نموذج التكلفة للنشر الداخلي
يَهيمن على جانب النشر الداخلي رأس المال واقتصاديات وحدة عتاد الاستدلال. المرجع الصحيح في 2026 هو خزانة 4U أو 8U فيها من اثنين إلى ثمانية مسرّعات NVIDIA H100 أو H200. يقع سعر خادم بثمانية بطاقات H100 كاملاً في نطاق 200,000 إلى 450,000 دولار، شاملاً الهيكل وذاكرة NVMe بعشرات التيرابايت والطاقة المُكرّرة وجهاز الشبكة. وتقع البطاقة الواحدة بين 25,000 و40,000 دولار حسب الشكل، فيما يزيد الخادم القائم على H200 بنسبة 10 إلى 25 بالمائة.
ماذا يُقدّم هذا العتاد؟ تُظهر اختبارات vLLM على بطاقة H100 واحدة إنتاجية ثابتة بين 2,400 و2,780 رمز في الثانية للنماذج الكثيفة من فئة 70B تحت تحميل واقعي بحمل متزامن، تتسلق إلى 12,000 رمز في الثانية وأكثر للنماذج الأصغر من فئة 8B. وثمانية بطاقات H100 في هيكل واحد ترفع هذا السقف بمقدار شبه خطّي للأعمال المُجمَّعة. وعند 920 مليون رمز يومياً (عبء 200 ألف استعلام)، يعمل خادم بثمانية H100 بأقل من نصف طاقته، مُتيحاً متّسعاً للضبط الدقيق وإعادة ترتيب الاسترجاع وتشغيل نماذج متخصّصة بالتوازي.
التكلفة التشغيلية صغيرة. استهلاك الطاقة لخادم بثمانية H100 تحت حمل ثابت يتراوح بين 6 و10 كيلوواط، أي بين 4,500 و7,500 كيلوواط ساعة شهرياً. وبالتعرفة العُمانية التجارية، يتجاوز ذلك بقليل 250 إلى 450 ريالاً عُمانياً شهرياً للخادم الواحد. ومساحة الخزانة داخل قاعة بيانات الوزارة شبه مجانية على الهامش. والصيانة، ومعها قطع غيار وتجديد سنوي لأقراص NVMe، تقع بين 3 و5 بالمائة من رأس المال سنوياً. وأما العمالة، فهي أكبر التكاليف الناعمة وتُناقَش لاحقاً.
أما لمستوى محطة العمل، أي جهاز Apple M3 Ultra Mac Studio، فالصورة مختلفة. تُظهر القياسات الواقعية ما بين 30 و41 رمزاً في الثانية على نموذج بحجم Gemma-3-27B، وهو ملائم لواحد إلى أربعة مُشغّلين متزامنين، برأس مال أقل من 15,000 دولار وبصمة طاقة دون 200 واط. هذا المستوى يخدم رئيس ديوان وزير أو خلية استخبارات صغيرة، لا وزارة بحجم 200 ألف استعلام يومياً، لكنه أرخص نقطة دخول جادة لنشر سيادي.
نقطة التعادل بحسب حجم الاستعلامات
حساب نقطة التعادل هو ما يُجسِّد النقاش. يستخدم الجدول التالي أسعار المزوّدين المنشورة لعام 2026 للسحابة، وافتراضاً متوسطاً لرأس مال النشر الداخلي، مُستهلَكاً على ثلاث سنوات شاملاً الطاقة والعمالة وتجديد عتاد واحد.
| حجم الاستعلامات اليومي | تكلفة السحابة لثلاث سنوات (فئة Sonnet، دولار) | تكلفة النشر الداخلي لثلاث سنوات (دولار) | الخيار الأرخص |
|---|---|---|---|
| 10,000 يومياً | ~470,000 | ~520,000 (مستوى البرج) | السحابة بفارق طفيف |
| 50,000 يومياً | ~2.4 مليون | ~720,000 (مستوى البرج) | النشر الداخلي |
| 100,000 يومياً | ~4.7 مليون | ~1.1 مليون (مستوى الخزانة، أربع بطاقات) | النشر الداخلي |
| 200,000 يومياً | ~9.5 مليون | ~1.4 مليون (مستوى الخزانة، ثماني بطاقات) | النشر الداخلي |
| 500,000 يومياً | ~23.7 مليون | ~2.6 مليون (مستوى الخزانة، هيكلان) | النشر الداخلي |
تقع نقطة التعادل عند أسعار فئة Sonnet للسمة المفترضة بين 12,000 و18,000 استعلام يومياً لمستوى البرج، وبين 30,000 و45,000 استعلام يومياً لمستوى الخزانة. تحت هذا الحدّ تربح السحابة نقدياً. وفوقه ينبسط منحنى تكلفة النشر الداخلي بينما تنمو فاتورة السحابة طردياً. وعلى المستوى الوزاري تكون الفجوة بمرتبة عشرة أضعاف.
أبعاد المخاطر التي لا تُسعّرها فاتورة السحابة
النقد محور واحد فقط. والأبعاد التي لا تُظهرها فاتورة السحابة هي ما يَعني المشتري السيادي.
الأول التعرّض القضائي. يمنح قانون السحابة الأمريكي السلطاتِ الأمريكية حقّ إلزام المزوّدين الذين يقع مقرهم في الولايات المتحدة بالإفصاح عن البيانات، بصرف النظر عن المكان الفعلي لتخزينها. أيّ نشر على Bedrock أو Foundry في أي منطقة كانت يخضع لهذا النظام. ويُنشئ قانون أمن البيانات الصيني التزاماً مرآةً على المزوّدين الصينيين. ولا تذكر أي صفحة تسعير أيّاً من القانونين، ومع ذلك فهذه التكلفة المهيمنة لوزارة دفاع أو بنك مركزي.
الثاني الارتباط بمزوّد. تشمل عقود نماذج اللغة السحابية بصورة متزايدة سعةً محجوزة وضبطاً دقيقاً مخصّصاً وأدواتٍ خاصة بالمنصة لا يمكن نقلها. تكلفة الخروج، إعادة تدريب الموظفين، إعادة كتابة شيفرة التكامل، سداد التزامات السعة المحجوزة المتبقية، تقع في نطاق ستة إلى اثني عشر شهراً وبضع مئات آلاف الدولارات لأي نشر غير عابر. والمشتري السيادي الذي وحّد على مزوّد واحد قد سعّر نفسه ضمنياً في مفاوضة عقدية لا يستطيع الانسحاب منها.
الثالث إيقاف النماذج. يُحيل المزوّدون نماذجهم إلى التقاعد بجدولهم لا بجدول العميل. والوزارة التي بَنت سير عمل وتوجيهات وضبطاً دقيقاً على جيل واحد يمكن أن تُجبر على هجرة مكلفة عند سحب ذلك الجيل. أما النشر الداخلي فيحتفظ بأوزان النماذج القديمة طالما أرادت الجهة، وهو الافتراض الصحيح للأرشفة وقابلية تدقيق القرارات الماضية.
الرابع تسرّب القياسات. كل طلب لنموذج لغوي سحابي يُسجّل عند المُشغّل. وحتى مع ضوابط الاحتفاظ التعاقدية، تتسرّب البيانات الوصفية، من استعلم ومتى وبأي تواتر وأي مكتبة مستندات، إلى مُشغّل أجنبي ويصبح قابلاً للقراءة من جهة تنظيمية أجنبية بأمر قضائي. أما الأنظمة السيادية الداخلية فتحفظ هذه القياسات داخل المحيط بحكم البناء.
البنود الخفية التي تُغفلها أغلب تحليلات التكلفة
تغيب خمسة بنود عادةً عن مقارنات السحابة مقابل النشر الداخلي.
تكلفة التدقيق الامتثالي. يستلزم النشر السحابي عبر الحدود وفق المرسوم السلطاني 6/2022 مراجعةً قانونية دورية لنظام النقل عبر الحدود وشهادات امتثال المزوّد وتقييم أثر حماية البيانات للجهة. ويتراوح هذا بين 25,000 و75,000 دولار سنوياً لوزارة جادة، وأغلبه مخفي ضمن ميزانية الإدارة القانونية.
عبء الحوكمة. اتحاد الهوية بين دليل الجهة العُمانية ونظام إدارة الوصول لدى المزوّد ليس بسيطاً. ويُضيف شحن سجلات التدقيق والاحتفاظ والقدرة الدفاعية بين الاختصاصات هندسةً مستمرّة. ولا يظهر شيء من هذا على فاتورة الاستدلال.
الخروج بالحجم. البنية الاسترجاعية أو عبء العمل المتعدّد الوسائط (رؤية، صوت) يُرسل حجماً حقيقياً عبر السلك. سعر 0.09 دولار لكل جيجابايت يبدو رخيصاً حتى تَشحن مديرية دفاع فهرس قضاياها ليلياً إلى خدمة تضمين عبر منطقة أخرى.
تكاليف الضبط الدقيق السحابي. الضبط الدقيق على المزوّد أعلى تكلفة من الاستدلال بمرّات، وتعيش الأوزان المضبوطة على تخزين المزوّد. ونسخ هذه الأوزان إلى مزوّد ثانٍ للصمود يستلزم عادةً إعادة الضبط من الصفر، فتتضاعف التكلفة.
بند الخروج. تتضمّن أغلب عقود نماذج اللغة السحابية شرطَ تطهير بيانات خلال تسعين يوماً عند الإلغاء، لكنها لا تتضمّن بنداً لاسترداد أوزان النموذج المضبوط. والجهة التي ضبطت نموذجاً بمليار معلمة على مراسلات داخلية مُصنّفة لا تستطيع عملياً اصطحابه عند الخروج.
متى تكون السحابة العامة هي الإجابة الصحيحة فعلاً
نموذج اللغة السحابي خيار جدير بالنظر لعدة أعباء عمل سيادية عُمانية. وتغطّي منصة "مُعين" المشتركة سلفاً حالات الاستخدام الحكومية المشتركة التي يكون فيها النشر الوطني هو الأساس الصحيح. والمحادثات الموجّهة للجمهور حول مواد منشورة سابقاً (بيانات مفتوحة، أنظمة عامة، أسئلة وزارية شائعة) لا تحمل خطراً سيادياً، لأن مدخلاتها بحدّ ذاتها عامة. وإنشاء النصوص التسويقية والمواد التدريبية الداخلية للموظفين والترجمة الموجّهة للمواطنين لمستندات منشورة وإكمال الشيفرة لمستودعات غير مُصنّفة، كلّها أعباء سحابية معقولة. كما تُرجِّح تحليلات نقطة التعادل أعلاه السحابةَ تحت قرابة 15,000 استعلام يومياً، حيث يَعجز رأس مال النشر الداخلي عن الاستهلاك.
الخط بيّن حيث يجب أن يكون. إذا كان مُدخل الاستعلام أو مخرجه يُعدّ مصنّفاً أو مقيّداً أو حسّاساً تجارياً في أي سياق آخر، فلا يصلح أن يكون على سحابة يُشغّلها طرف أجنبي، بصرف النظر عن مسمّى المنطقة، وبصرف النظر عن الوعود التعاقدية، وبصرف النظر عن السعر.
الصورة الواقعية على مدى ثلاث سنوات بحجم 200 ألف استعلام يومياً
وزارة عُمانية تعتمد نموذجاً لغوياً سحابياً من فئة Sonnet لعبء عمل بحجم 200,000 استعلام يومياً على مدى ثلاث سنوات تدفع نحو 9 إلى 10 ملايين دولار على الفاتورة، إضافةً إلى ما يُقدَّر بـ 600,000 إلى 1.2 مليون دولار على الخروج والصمود والحوكمة وتدقيق الامتثال. وتحمل تعرّض قانون السحابة الأمريكي على كل بايت إدخال وإخراج، وتتراكم لديها قيود التزامية بالسعة المحجوزة وأدوات خاصة بالمنصة، وتشحن قياساتها التشغيلية الكاملة إلى مُشغّل أجنبي.
والوزارة ذاتها إذا نشرت جهازاً سيادياً بمستوى الخزانة فيه خادمان من فئة H100، مع قدرة ضبط دقيق مؤسّسي ومنظومة استرجاع كاملة داخلية، تدفع نحو 1.4 إلى 1.7 مليون دولار في تكلفة شاملة لثلاث سنوات، تتضمّن العتاد والطاقة وعمالة بدوام كامل لموظف واحد وتجديداً نصف دوري للعتاد. ولا تحمل أي تعرّض قضائي، وتحتفظ بكل عملية ضبط دقيق أصلاً سيادياً، وتخرج كلياً من نقاش الإجراءات القانونية الأجنبية.
الوفر النقدي قرابة 7 إلى 8 ملايين دولار على ثلاث سنوات. وخفض المخاطر فئوي لا تدريجي. وسؤال التوريد ليس "أيّهما أرخص"، بل "ما الأداة المناسبة لكل عبء عمل"، والإجابة لأي عمل وزاري حسّاس هي الجهاز السيادي بلا التباس. تَشحن "حصن" هذا النمط في ثلاثة مستويات مرجعية، مُحجَّمة بحسب التزامن والتصنيف، والسعر بحسب الطلب وفق عبء العمل الفعلي.
إذا كانت وزارتكم تُجري هذه المقارنة وتودّون لقاءً تعريفياً بمدّة ساعة مفصّلاً على متطلبات التزامن والتصنيف والتكامل لديكم، فالخطوة التالية بسيطة. راسلونا على [email protected] أو عبر واتساب +968 9889 9100. سنستعرض البنية والنماذج وخطة عمل واقعية مع جدولكم الزمني.
أسئلة شائعة
ماذا عن الحجوزات المسبقة وخدمات الإنتاجية المخصّصة؟
تُخفّض الحجوزات المسبقة وخدمات الإنتاجية المخصّصة على منصات AWS Bedrock وAzure Foundry وGoogle Vertex التكلفة لكل رمز بنحو ثلاثين إلى خمسين بالمائة، لكنها تستلزم التزاماً بسنة أو ثلاث سنوات وحدّاً أدنى للسعر بالساعة يتراوح بين 40 و200 دولاراً لكل وحدة نموذج. هذا يضيّق الفجوة لكنه لا يُلغي التعرّض القانوني تحت قانون السحابة الأمريكي أو قانون أمن البيانات الصيني، كما أنه يُعمّق الارتباط بمزوّد بعينه.
كيف نبني نموذجاً لنمو الاستعلامات على مدى ثلاث سنوات؟
نعتمد ثلاثة سيناريوهات. سيناريو ثابت يفترض أن الجهة تخدم منسوبيها الحاليين. سيناريو نمو سنوي بمعدّل 1.5 ضعف يفترض انتشار الاستخدام عبر الإدارات. سيناريو 2.5 ضعف يفترض تحوّل الذكاء الاصطناعي إلى واجهة رئيسية للمواطنين والمراسلات بين الوزارات. النموذج الداخلي يستوعب النمو بإضافة عتاد، أما النموذج السحابي فيتضاعف فيه الحساب طردياً مع عدد الاستعلامات، فينتقل سقف 100 ألف استعلام يومياً إلى 1.5 مليون يومياً بحلول السنة الثالثة.
ما الجهد البشري لتشغيل منظومة سيادية داخلية؟
يستلزم النشر الإداري أو المؤسسي عادةً ما بين نصف وظيفة وموظف ونصف بدوام كامل، حسب نضج الفريق التقني القائم في الجهة. التشغيل اليومي خفيف ويشمل تحميل النماذج ومراجعة السجلات والتحديثات الدورية ورصد الطاقة الاستيعابية. الحمل الأكبر عند النشر الأوّلي وعند ترقيات النماذج الكبرى. وتستوعب أغلب الجهات العُمانية هذا الجهد ضمن مديريات تقنية المعلومات أو الأمن السيبراني القائمة دون الحاجة إلى توظيف جديد.
هل يمكن اعتماد نموذج هجين؟ سيادي للبيانات الحسّاسة وسحابي لما عداها؟
نعم، وكثيراً ما يكون هذا هو النمط الصحيح. المحتوى العام والنسخ التسويقية والمحادثات مع المواطنين حول معلومات منشورة سابقاً وبيانات الاختبار التركيبية يمكن تشغيلها على نموذج لغوي سحابي. أما المراسلات الداخلية والإحاطات الوزارية والمراجعات السرّية والتحليل المصرفي وكل ما تشمله المادة الثالثة من المرسوم السلطاني 6/2022 فيبقى داخل الحصن. القاعدة المعمارية أن قرار التوجيه يجب أن يحدث داخل المحيط، لا عند مزوّد السحابة، حتى لا يُسرّب خطأ في الإعدادات بياناتٍ حسّاسة إلى المسار الخارجي.
هل مناطق GovCloud الحكومية أرخص من المناطق التجارية؟
لا. تَفرض مناطق GovCloud وما يماثلها من مناطق سيادية لدى AWS وAzure وGoogle عادةً علاوة بنسبة 10 إلى 25 بالمائة فوق المناطق التجارية، إضافةً إلى تأخير في الوصول وتغطية محدودة للنماذج. هي تخفّف بعض الاحتكاك القانوني للعملاء الفيدراليين الأمريكيين، لكنها لا تُزيل تعرّض قانون السحابة الأمريكي عن العملاء غير الأمريكيين، لأن المُشغّل يبقى شركة أمريكية. لذلك لا تقدّم منطقة GovCloud أي ميزة قضائية لوزارة عُمانية مقارنةً بالمنطقة التجارية.
ما تكلفة الخطأ في هذا القرار؟
ثمّة وضعا فشل. اختيار النشر الداخلي لعبء عمل كان يستحق السحابة يعني دفع تكلفة عتاد يعمل بطاقة منخفضة، والهدر مقيّد بقيمة العتاد، وعادةً ما يكون بضع مئات الآلاف من الدولارات لمستوى مؤسسي، ويمكن استرداده بإعادة توجيه العتاد. أما اختيار السحابة لعبء عمل كان يجب أن يبقى سيادياً، فيعرّض بياناتٍ مصنّفة أو حسّاسة تجارياً لاختصاص قضائي أجنبي، بنتائج تتراوح بين الإجراء التنظيمي بموجب المرسوم السلطاني 6/2022 والإفصاح بأمر قانوني أجنبي. الخطأ الأول بند ميزانية، أما الثاني فحادثة سيادية.