الاختيار بين 2U و4U والشكل البرجي لنشر الذكاء الاصطناعي السيادي

شكل الخادم هو القرار الأول والأكثر التزاماً في أي شراء عتاد للذكاء الاصطناعي السيادي. الشكل الخاطئ لن يبدو غريباً على الخزانة فحسب، بل سيُحدّد سقف عدد وحدات GPU لديك، ويفرض أعمال تجهيزات لم تكن في الحسبان، أو يترك صندوقاً يهمهم تحت مكتب مدير لسنوات. يستعرض هذا المقال الفئات الحيّة الثلاث: خوادم 2U المدمجة، وخوادم الذروة 4U إلى 6U بثماني وحدات GPU، ومحطات العمل البرجية، ويُحدّد متى يفوز كل شكل في النشر السيادي العُماني والخليجي.

شكل الخادم بوصفه قراراً استراتيجياً

تعامل مع شكل الخادم باعتباره قيداً على ثلاثة أبعاد في آنٍ واحد: سقف الحوسبة (الحد الأقصى لـGPU لكل عقدة)، وغلاف المنشأة (الخزانة، الطاقة، التبريد، الوزن، الضوضاء)، والواقع التشغيلي (من يصونه ومتى وبأي أدوات). بمجرد أن تلتزم بهيكل، يُصبح كل قرار لاحق (حجم النموذج، ميزانية زمن الاستجابة، التكرار، دورة التحديث) محصوراً به.

للصورة الأشمل لكيفية اندراج هذا القرار ضمن تخطيط السعة، راجع دليل sovereign AI appliance sizing for users and latency. الخلاصة: اختر الشكل بعد أن تعرف عدد المستخدمين وهدف زمن الاستجابة، لا قبلهما.

  • جهة تنظيمية بثمانين مستخدماً داخلياً وزمن استجابة دون الثانية تتسع تماماً في عقدة 2U بـPCIe. لا تشترِ عقدة ذروة بحجم 6U.
  • بيئة تدريب ذات طابع دفاعي بـ1.2k مستخدم متزامن وضبط دقيق شهري تحتاج إلى ثماني وحدات GPU في صندوق واحد، أي إلى منطقة 4U أو 6U أو 8U هواء.
  • مديرية عامة بمحلّل واحد وباحثين اثنين وبدون غرفة خوادم تحتاج إلى برج، نقطة.

2U لخوادم GPU المدمجة (1 إلى 4 وحدات)

فئة 2U هي الموطن الفعلي لمعظم النشر السيادي في عُمان. الهيكل بارتفاع 89 ملم تقريباً، يتسع لـ1 إلى 4 وحدات GPU من شكل PCIe (مثل NVIDIA L40S، RTX 6000 Ada، A100 PCIe، أو H100 PCIe)، ويقرنها بمعالجين مضيفين، وستة إلى عشرة منافذ NVMe، ومزوّدات طاقة مزدوجة. التصاميم المرجعية العامة تشمل Dell PowerEdge R760xa، وHPE ProLiant DL380a Gen12، وSupermicro AS-2125HS-TNR.

لماذا تُعدّ 2U الفئة العاملة في الذكاء الاصطناعي السيادي:

  • كثافة بلا أعباء الذروة. عقدة واحدة بـ2U تستضيف حتى أربع وحدات L40S بنحو 350 واط لكل منها، إجمالي حمل تقني 2.0 إلى 2.5 كيلوواط، يتسع تحت ميزانية خزانة 5 كيلوواط.
  • هندسة قاعة بيانات قياسية. خزائن بعمق 800 ملم، وفصل ممرات حار/بارد، ومزوّدات 1600 واط مزدوجة، ومنافذ NVMe أمامية تجعل العقدة سهلة الإدارة لفرق المرافق القائمة.
  • ملاءمة لـ50 إلى 400 مستخدم استدلال متزامن. المؤسسات المتوسطة (مديرية وزارية، شبكة مستشفيات، فريق مخاطر مصرفي) تعيش في هذا النطاق.

السقف حقيقي. حالما تتجاوز أربع وحدات PCIe أو تحتاج إلى نسيج NVLink/NVSwitch للاستدلال الموازي على نماذج الذروة، تخرج 2U من المعادلة. هنا تدخل 4U. راجع Dell, HPE, Supermicro AI servers GCC لمواصفات شراء أدق.

4U و5U لخوادم الذروة بثماني وحدات GPU (Dell XE9680 وHPE Cray XD670)

ثماني وحدات GPU من فئة SXM داخل صندوق واحد هي العقدة الكلاسيكية لتدريب الذكاء الاصطناعي. الشكل الذي يحملها لا يكون 2U أبداً. المنصّتان المرجعيتان في 2026:

  • Dell PowerEdge XE9680 بحجم 6U مبرّد بالهواء، 8 وحدات NVIDIA HGX H100 أو H200 SXM5 مع NVSwitch ومعالجَي Sapphire Rapids، إجمالي الحمل الاسمي نحو 10.2 كيلوواط. مواصفات الهيكل عند PowerEdge XE9680.
  • HPE Cray XD670 بحجم 5U مبرّد بالهواء، 8 وحدات H100 أو H200 SXM5 على لوحة قاعدة HGX مماثلة، هيكل أضيق قليلاً، وخيارات معالج EPYC أو Xeon. راجع HPE Cray XD670.
  • مرجع NVIDIA HGX بحجم 8U مبرّد بالهواء، التصميم المرجعي المحايد للمصنّعين الذي تطبّقه أنواع Supermicro وQuanta حين يُطلب أقصى هامش لتدفق الهواء، وهو الكلمة المفتاحية المفيدة لفرق الشراء التي تبحث عن 8U GPU server form factor.

الحجم يشتري أشياء حقيقية: فصل المناطق الحرارية بين GPU والمعالج، لوحة NVSwitch أمامية، ومزوّدات طاقة قابلة للتبديل الساخن بـ4 × 3000 واط، وتمديد كابلات قابل للصيانة. لا شيء من ذلك ترف عند 10 كيلوواط للعقدة. توقّع وزناً يتراوح بين 80 و100 كغم، ورفعاً بشخصين، وخزانة تتحمّل 28 وحدة معدّات مع 12 وحدة فراغ تدفق هواء لكل صف. تتوفّر متغيّرات تبريد سائل (XE9680L وXD675) لمن يملك حلقة ماء مبرّد جاهزة، لكن التبريد الهوائي يبقى الافتراضي للمواقع العُمانية.

الأبراج للفروع والحافة

محطات العمل البرجية هي الجواب الصحيح لأي نشر بلا غرفة خوادم. التركيب البرجي السيادي النموذجي، كما نصفه في RTX 6000 Ada tower deployment، يضم بطاقة أو بطاقتين RTX 6000 Ada (300 واط لكل منهما)، ومعالج محطة عمل (Threadripper Pro أو Xeon W)، و256 جيجابايت ذاكرة، و4 إلى 8 تيرابايت NVMe داخل هيكل Lian Li أو Fractal. السحب الإجمالي يبقى دون 1.4 كيلوواط على مقبس جداري واحد بـ13 أمبير.

هذا الشكل يفوز في:

  • الفروع والسفارات حيث لا توجد خزانة ولا CRAC، وفنّي تقنية واحد يزور شهرياً.
  • النشر التجريبي قبل شراء خزانة سيادية كاملة، غالباً لاستضافة نقطة استدلال Falcon Arabic أو Qwen 3.6 لفريق واحد.
  • المكاتب المعزولة للأعمال السرّية حيث لا يغادر الصندوق غرفة واحدة، والحراسة المادية هي الحدّ الأمني.

المقايضات واضحة: لا مزوّد طاقة قابل للتبديل الساخن، مزوّد واحد فقط، دقّة هيكلية على مستوى المستهلك، وضوضاء لا تليق بمكتب مفتوح. على المشتري الذي يبحث عن tower workstation AI sovereign أن يخطّط لبرج لكل فريق محلّلين، لا لكل مؤسسة.

شكل الخادم أرخص خطأ يُصلَح في عرض شرائح، وأغلى خطأ يُصلَح في شاحنة توصيل. راسلنا عبر [email protected] لجلسة إحاطة لمدة ساعة نطابق فيها عدد المستخدمين وهدف زمن الاستجابة وقيود المنشأة لديك مع وحدة 2U أو 4U أو برج محدّدة قبل توقيع أمر الشراء.

أسئلة شائعة

هل اختيار شكل الخادم قرار استراتيجي فعلاً؟

نعم، فهو يحدّد الحد الأقصى لعدد وحدات المعالجة الرسومية لكل عقدة، ويفرض ما إذا كان النشر داخل خزانة سيرفرات أو غرفة خدمة، ويحدّد ما إذا كانت الصيانة الدورية عملية تبديل بسرعة أم رفعاً ميكانيكياً. الخطأ في الشكل لا يُصلَح إلا بشراء صندوق ثانٍ.

متى يكون 2U هو الخيار المناسب للذكاء الاصطناعي السيادي؟

2U هو النقطة المثلى لـ1 إلى 4 وحدات GPU بشكل PCIe (مثل L40S أو RTX 6000 Ada أو A100 PCIe). الأنسب للضبط الدقيق على مستوى الفريق، أو الاستدلال لـ50 إلى 200 مستخدم متزامن، أو نشر الفروع حيث الكثافة وتوفّر مزوّدات الطاقة المزدوجة أهم من الذروة المطلقة.

لماذا تأتي خوادم 8 GPU دائماً بحجم 4U أو 5U أو 6U؟

ثماني وحدات GPU من فئة SXM بقدرة 700 إلى 1000 واط لكل وحدة، مع نسيج NVSwitch ومعالجين عاليي الأداء وتخزين NVMe، لا يمكن أن تتسع داخل 2U بتدفق هواء آمن. Dell PowerEdge XE9680 يأتي بحجم 6U، وHPE Cray XD670 بحجم 5U، ومرجع NVIDIA HGX H200 بحجم 8U هواء عادةً.

هل البرج خيار صحيح للذكاء الاصطناعي السيادي؟

نعم، للفروع والسفارات والمحاكم الإقليمية أو لنشر تجريبي بلا غرفة خوادم. برج بـ بطاقتي RTX 6000 Ada يعطي عقدة استدلال لـ50 مستخدماً بدون خزانة ولا CRAC ولا أرضية مرتفعة. المقابل: كثافة أقل، ميزات خدمة أقل، ودقّة هيكلية على مستوى المستهلك.