الاختيار بين 2U و4U والشكل البرجي لنشر الذكاء الاصطناعي السيادي
شكل الجهاز هو القرار الثاني الذي يتخذه مشتري الذكاء الاصطناعي السيادي بعد اختيار النموذج، وهو القرار الأكثر عرضة للخطأ. كثير من الجهات تكتفي بما يقترحه المُكامِل، ثم تكتشف بعد ستة أشهر أن الجهاز الرائد 4U لا يسعه الموقع، أو أن خادم 2U الذي اشترته لا يستوعب النموذج الذي يحتاجه المحلّلون فعلاً. هذا الدليل يربط الأشكال الثلاثة الفاعلة (2U و4U/5U والبرجي) بعدد المسرّعات ونوع الغرفة وحجم التزامن ودورة التحديث، حتى يصل ضابط المشتريات إلى الهيكل الصحيح من المحاولة الأولى.
لماذا شكل الجهاز قرار استراتيجي لا شكلي
الهيكل يحدّد كل ما يلي: نوع وحدات GPU القابلة للتركيب، ومظروف التبريد، ودائرة الطاقة المطلوبة، والغرفة التي يمكن النشر فيها، وزمن الاستجابة لكل مستخدم، ومسار الترقية بعد خمس سنوات. خادم 2U وبرج محترف قد يحملان أربع بطاقات على الورق، لكن واقعهما التشغيلي مختلف تماماً. 2U يسكن خزانة ويفترض قاعة بيانات بممرّين ساخن وبارد، أمّا البرج فيقف بجانب طاولة في مكتب فني ويعمل على دائرة كهرباء مكتبية عادية. اختيار خاطئ يعني إمّا تعطّل المشروع في مرحلة تجهيز الموقع، أو وصول جهاز يفوق احتياج الغرفة.
المتغيّرات الحاكمة ثلاثة: التزامن، وحجم النموذج، والموقع الفعلي للجهاز. تحجيم هذه الأبعاد الثلاثة معاً موضوع الدليل الجامع حول شكل خادم الذكاء الاصطناعي 2U 4U برج بحسب عدد المستخدمين وزمن الاستجابة. اختيار الشكل هو التعبير المادي عن تلك الأرقام.
- التزامن يفرض ذاكرة GPU. كل مستخدم متزامن يستهلك ذاكرة KV-cache بمقدار يتناسب مع طول سياقه. أربعون مستخدماً على سياق 32 ألفاً يحتاجون ذاكرة مختلفة جداً عن خمسة مستخدمين على سياق 256 ألفاً.
- حجم النموذج يفرض إجمالي عدد GPU. نموذج كثيف 30B بدقّة FP8 يسع وحدة احترافية واحدة، و70B يحتاج وحدتين، أمّا الرائد 405B فيحتاج ثماني وحدات بربط NVLink.
- نوع الغرفة يفرض الهيكل. قاعة بيانات مرفوعة الأرضية تستوعب أيّ شيء، لكن غرفة مكتبية عادية تكتفي بـ6 إلى 8 كيلوواط لكل خزانة وتستثني المنصّات الرائدة SXM.
2U: خوادم GPU مدمجة من واحدة إلى أربع
خادم 2U هو حصان العمل في النشر السيادي على الأرض. يستوعب من واحدة إلى أربع وحدات GPU بشكل PCIe (مثل RTX 6000 Ada وRTX PRO 6000 Blackwell وL40S وH100 NVL)، ومعالجَين بعدد أنوية مرتفع، وذاكرة نظام تتراوح بين 1 و2 تيرابايت، وتخزيناً NVMe في الهيكل ذاته. استهلاك الطاقة تحت الحمل الكامل عادة بين 2.5 و4 كيلوواط، أي ضمن خزانة قياسية بقدرة 7.5 كيلوواط.
المنطقة الذهبية لـ2U هي إدارة واحدة أو دائرة أو جهة تنظيمية فرعية: من 50 إلى 200 مستخدم متزامن على نموذج فئة 30B إلى 70B، مع إمكانية تخصيص دقيق على العتاد ذاته خارج ساعات الذروة. كما يتيح وضع وحدتي 2U في غرفتين متباعدتين صموداً نشطاً نشطاً بتكلفة أدنى من جهاز 4U رائد واحد. الهيكل يدخل أيّ خزانة 42U بتبريد عادي، فينشر داخل خزائن مراكز بيانات الحكومة الحالية بلا أعمال مدنية.
متى يخفق 2U؟ مع النماذج الكبيرة جداً (فئة 405B)، أو التزامن المرتفع جداً (أكثر من 500 مستخدم على نموذج واحد)، أو أعباء العمل التي تتطلّب عرض نطاق NVLink بين الوحدات بمستوى SXM، كالتدريب المستمر. لتلك الأعباء، ارتقِ.
4U/5U للمنصّات الرائدة بثماني وحدات
الفئة من 4U إلى 6U هي موطن المنصّات الرائدة. توثّق ورقة مواصفات Dell PowerEdge XE9680 هيكلاً 6U يحمل ثماني مسرّعات من فئة HGX H100 أو H200 أو AMD MI300X أو Intel Gaudi3 على لوحة موصولة كاملياً عبر NVLink، ومعالجَي Intel Xeon من الجيل الخامس بعدد أنوية يصل إلى 64 لكل معالج، وذاكرة DDR5 تبلغ 4 تيرابايت، وستّ مزوّدات طاقة Titanium 2,800 واط متكرّرة. يزن الجهاز نحو 114 كجم ويستهلك نحو 10 كيلوواط تحت الحمل المستديم. تقترب منصّات HPE Cray Supercomputing XD من المظروف ذاته، مع توجّه نحو التوسّع العنقودي.
المنصّات الرائدة هي الإجابة الصحيحة حين يحتاجها عبء عمل واحد فعلاً: نموذج وطني بحجم 405B، أو عنقود تدريب سيادي، أو خدمة استدلال عالية التزامن لجهة تنظيمية بعشرات آلاف المستخدمين الداخليين. وهي إجابة خاطئة حين تُشترى تكهّنياً، إذ يفرض الهيكل غرفة مرفوعة الأرضية بقدرة 12 كيلوواط لكل خزانة، واحتواء ممر ساخن، ومسار N+1. الجهات التي تفتقر إلى هذه الغرفة تواجه أعمال تأهيل تستغرق ستة إلى اثني عشر شهراً قبل تشغيل الجهاز.
قاعدة عملية: لا تشترِ منصّة 4U/5U رائدة دون مسح موقعي مؤكَّد للغرفة المستقبلة. ينبغي أن تجمع المشتريات الهيكل والغرفة وعقد التشغيل، لا الهيكل وحده.
البرجي للفروع والحافة، بلا أرضية مرفوعة
الجهاز البرجي هو الشكل الأكثر بخساً في تقدير المشتريات السيادية. برج محترف حديث (Dell Precision 7960، Lenovo ThinkStation PX، HP Z8 Fury) يحمل من وحدتين إلى أربع وحدات NVIDIA RTX 6000 Ada أو RTX PRO 6000 Blackwell الاحترافية، في هيكل يعمل على دائرة مكتبية عادية 16 أمبير وعلى تكييف اعتيادي. استهلاك برج بأربع وحدات يبقى دون 2.5 كيلوواط، ومستوى الضجيج، وإن لم يكن صامتاً، أقرب إلى آلة تصوير منه إلى غرفة خوادم.
النمط الفائز للفرع والحافة هو برج لكلّ موقع. جهة تنظيمية بخمسة مكاتب إقليمية تشتري خمسة أبراج، يخدم كلّ منها 30 إلى 80 موظفاً محلياً، بينما يشغّل المقر الرئيسي جهاز 4U رائداً مع مهمّة مزامنة دورية تدفع الأوزان المضبوطة إلى الفروع. دائرة دفاعية في موقع نائي بلا قاعة بيانات تشغّل برجاً خلف عزل تام. بلدية تريد ذكاءً اصطناعياً في مركز الاتصال دون إنشاء مركز بيانات تشغّل برجاً في خزانة تقنية. يتناول الدليل المخصّص حول نشر RTX 6000 Ada البرجي التهيئة بالتفصيل.
يتفوّق البرج على الخزانة في ثلاثة محاور سيادية: قابلية النشر في غرف قائمة بالفعل، وكلفة التحديث (تبديل وحدات GPU كل ثلاث سنوات مع الإبقاء على الهيكل)، وقابلية النقل المادي للمنشأة. ويخسر أمام الخزانة في الكثافة الخام وفي أعباء العمل التي تستلزم NVLink بثماني وحدات.
اختصار للقرار
ثلاثة أسئلة سريعة توصل معظم الجهات إلى الهيكل الصحيح من المحاولة الأولى.
- هل لديك قاعة بيانات مرفوعة الأرضية بقدرة 12 كيلوواط لكل خزانة؟ إن كانت الإجابة لا، استبعد المنصّات الرائدة 4U/5U. الغرفة تُجهض المشروع قبل الجهاز.
- هل سيتطلّب عبء عمل واحد أكثر من أربع وحدات GPU في هيكل واحد؟ إن كانت الإجابة لا، يفوز 2U أو البرج بالتكلفة والمرونة. وإن كانت نعم (نموذج رائد، تدريب، تزامن مرتفع جداً)، فلا بديل عن 4U/5U.
- هل ستنشر في موقع واحد أم في مواقع متعدّدة؟ المواقع المتعدّدة تفضّل الأبراج (رخيصة، صامدة، قابلة للصيانة محلياً). موقع مركزي ناضج التشغيل يفضّل خزائن 2U أو 4U.
إن كانت مؤسستكم تحجّم جهاز ذكاء اصطناعي سيادياً وتوازن بين أشكال الأجهزة والموقع والتزامن ودورة التحديث، فالخطوة التالية لقاء مفصَّل لمدّة ساعة. راسلونا على [email protected] أو عبر +968 9889 9100. نأتي إليكم في مسقط أو في أيّ مكان بدول الخليج، ونستعرض خيارات الهيكل وجاهزية الغرفة وخطّة موثوقة على جدولكم الزمني. التسعير بحسب الطلب، مُحجَّم على المتطلّب الفعلي.
أسئلة شائعة
هل يكفي الجهاز البرجي فعلاً لتشغيل عبء عمل ذكاء اصطناعي سيادي؟
نعم لفرع واحد أو دائرة وزارية أو مكتب جهة تنظيمية في محافظة، يخدم بين 30 و80 مستخدماً متزامناً على نموذج من فئة 30B. فأربع وحدات معالجة رسومية احترافية بذاكرة إجمالية تتراوح بين 384 و768 جيجابايت تستوعب نموذجاً مكمَّماً 70B بذاكرة سياق طويلة لهذا العدد من المستخدمين. القيد ليس الطاقة الحسابية الخام، بل حجم ذاكرة KV المتزامنة. النشر نفسه على خادم 4U يكلف أكثر ويستلزم غرفة مرفوعة الأرضية قد لا تتوفر.
لماذا قد يختار أحد شكل 2U بدلاً من القفز مباشرة إلى 4U الرائد؟
لثلاثة أسباب. أولاً، يندرج 2U في خزائن 42U القياسية بتبريد عادي، فيدخل غرف بيانات الجهات الحكومية القائمة دون أعمال تأهيل. ثانياً، أربع وحدات GPU في 2U هي المقاس الصحيح لنموذج إنتاجي 30B إلى 70B يخدم دائرة واحدة مع هامش للنمو. ثالثاً، يمكن شراء وحدتي 2U في غرفتين منفصلتين لتوفير صمود نشط نشط بتكلفة إجمالية أقل من 4U رائد واحد.
هل تحتاج المنصات الرائدة بثماني وحدات GPU إلى مركز بيانات خاص؟
نعم. خادم Dell PowerEdge XE9680 بشكله 6U يستهلك نحو 10 كيلوواط تحت الحمل، ويزن قرابة 114 كجم، ويتطلّب تبريداً يفوق ما توفّره غرف الخوادم المكتبية. يفرض دفتر مواصفات Dell ظروف فئة A1 إلى A2 لمراكز البيانات. عملياً تحتاج إلى غرفة مرفوعة الأرضية بقدرة 12 كيلوواط لكل خزانة، واحتواء ممر ساخن، ومسار طاقة N+1.
كيف يؤثّر شكل الجهاز على مسار الترقية؟
الأبراج الاحترافية هي الأسهل تجديداً، إذ يحتمل الهيكل أجيالاً جديدة من بطاقات GPU الاحترافية حين تطرح، غالباً دون استبدال بقية النظام. خوادم 2U تسمح بترقية وحدات GPU والتخزين داخل الهيكل نفسه، لا المنصة بكاملها. منصّات 4U/5U الرائدة بألواح SXM أصعب في الترقية الموضعية لأن لوحة GPU مدمجة، فالترقية العملية تعني هيكلاً جديداً.