حسابات الطاقة والتبريد لخزانة بأربع وحدات معالجة رسومية في مناخ مسقط

تصميم خزانة ذكاء اصطناعي سيادية بأربع وحدات معالجة رسومية في مسقط ليس المسألة الهندسية ذاتها التي تواجهها في فرانكفورت. الهواء الخارجي يلهب جدران المبنى، والرطوبة الساحلية الحاملة للأملاح تهاجم زعانف المبادلات، والغبار القادم من ممر وادي الكبير يكسو كل فلتر داخل القاعة خلال ربع سنة. يستعرض هذا المقال حسابات الحرارة لعقدة 4x H100 SXM5، ويقارن طوبولوجيات التبريد المناسبة لهذا الحمل، ثم يضع خطة UPS منطقية تحترم واقع الشبكة العُمانية.

المناخ في مسقط: 35 إلى 48 درجة، غبار وتآكل بحري

مسقط موقع ساحلي حار جاف، وأي تصميم لقاعة بيانات يجب أن يحترم ثلاثة ضغوط محلية:

  • درجة الحرارة الجافة. تتراوح فترات الظهيرة الصيفية بين 38 و42 درجة. وموجات الحر، خصوصاً في يونيو ويوليو، تبلغ 45 إلى 48 درجة في مناطق داخلية مثل العامرات وبوشر. صمّم جداول البحث الخارجية على افتراض 45 درجة مستدامة، لا على المتوسط المناخي.
  • تحميل الغبار. يدفع جريان الأودية ورياح الشمال جسيمات PM10 فوق هدف منظمة الصحة العالمية في عدة أيام سنوياً. مرشحات MERV 13 الأولية مع استبدال ربع سنوي هي الحدّ الأدنى لأي قاعة ضمن خمسة كيلومترات من الساحل أو من وادٍ.
  • التآكل البحري. المواقع ضمن كيلومترين من الشاطئ تواجه هجوماً كلورياً على زعانف الألمنيوم وأنابيب النحاس. اشترط ملفات مكثّف مطلية بالإيبوكسي، وشبكات تهوية من الفولاذ المقاوم للصدأ، وافحص محطة الطرد الحراري كل ستة أشهر.

الهدف الحراري داخل القاعة هو نطاق ASHRAE A2 thermal envelope، الذي يسمح بدخول الهواء البارد بين 10 و35 درجة برطوبة نسبية حتى 80 بالمئة. ننشر حلول حصن ضمن النطاق الموصى به الأضيق 22 إلى 27 درجة، وهو ما يقدّم مقايضة معقولة بين تكلفة التشغيل وسلامة السيليكون على المدى الطويل.

الحساب الحراري لعقدة H100 رباعية

نقطة البداية هي قدرة التصميم الحراري على مستوى السيليكون. تنشر NVIDIA أن H100 SXM5 يستهلك 700 واط تحت حمل مستدام (صحيفة بيانات NVIDIA H100). فاتورة الحرارة لعقدة HGX واحدة:

  • 4 وحدات H100 SXM5 بـ700 واط لكل منها: 2,800 واط.
  • معالجان مضيفان (مثل Sapphire Rapids 56 نواة)، 350 واط لكل منهما: 700 واط.
  • تخزين NVMe، ذاكرة DRAM، اللوحة، المراوح: ~250 واط.
  • محوّل قمة الخزانة (واحد 400 GbE): ~150 واط.
  • خسائر تحويل مزوّد الطاقة بكفاءة 92 بالمئة: ~330 واط.

المجموع نحو 4.2 كيلوواط ذروة سحب عند وحدة التوزيع، تتحوّل منها 3.6 كيلوواط إلى حرارة يجب طردها من الخزانة. أي ما يعادل قرابة 12,280 وحدة حرارية بريطانية في الساعة. الإرشادات الصناعية الموثوقة في data center hot climate cooling توصي بنحو 160 قدماً مكعباً في الدقيقة لكل كيلوواط بفارق 12 درجة، أي 580 قدماً مكعباً في الدقيقة لخزانتنا.

خيارات التبريد: CRAC وCRAH ومبادل الباب الخلفي

ثلاث طوبولوجيات تغطّي النطاق الواقعي لخزانة سيادية رباعية وحيدة في مسقط:

  1. CRAC محيطي بتمدّد مباشر. وحدة 5 إلى 7 طن على محيط الغرفة، تغذّي ممراً بارداً محتوى تحت أرضية مرتفعة أو عبر مجاري علوية. أقل تكلفة رأسمالية وأبسط تشغيلاً، لكن أقل كفاءة عند الأحمال الجزئية. مناسبة لخزانة واحدة مع توسعة محتملة.
  2. CRAH على ماء مبرّد. إذا كان المبنى يشغّل محطة ماء مبرّد (وهو حال معظم مقرّات الوزارات والبنوك)، فإن وحدة CRAH تعمل بماء عند 10 درجات تمنح كفاءة PUE أفضل بنسبة 30 إلى 40 بالمئة. تستحق الجهد فوق 8 إلى 10 كيلوواط للخزانة، أو حين يكون الماء المبرّد متاحاً مجاناً عند الجدار.
  3. مبادل الباب الخلفي. ملف يثبّت على الباب الخلفي للخزانة، يُغذّى من حلقة الماء المبرّد، يطرد الحرارة من المصدر فتبقى الغرفة عند درجة المبنى المحيطة. الأنسب للحوسبة الكثيفة (فوق 15 كيلوواط للخزانة) أو لإعادة التهيئة. مبالغة لعقدة 3.6 كيلوواط، لكنه الجواب الصحيح حين تتوسّع لأربع عقد في صفّ واحد.

في معظم نشر برج حصن نعتمد CRAC محيطي مع احتواء الممر البارد، ثم نراجع الخيار عند الخزانة الثانية. لجان ASHRAE الفنية تحذّر تحديداً من التبريد بالغرفة المفتوحة لأي حمل ذكاء اصطناعي يتجاوز 2 كيلوواط للخزانة في مناخ صيفي عند 45 درجة.

حجم UPS والتكرار للشبكة العُمانية

تُغذّى عُمان البرّية من شبكة نقل OETC المستقرة عموماً، لكنها تشهد انخفاضات جهد دون الثانية في ذروة الصيف وانقطاعات نادرة بضع ثوانٍ. الأحمال السيادية لا تحتمل أياً من هذه الأحداث دون حماية. القاعدة المعتمدة:

  • السعة. حمل صافٍ 3.6 كيلوواط مع طبقة التبريد ضمن الغلاف المحمي ذاته. نستهدف UPS تحويل مزدوج 6 إلى 8 kVA بمعامل قدرة 0.9، تاركاً نحو 30 بالمئة هامشاً للعابرات وزحف استهلاك الوحدات.
  • زمن التشغيل. 10 إلى 15 دقيقة عند الحمل الكامل. تكفي لمولّد ديزل مصان لتشغيل وتحقيق التزامن وتسلّم الحمل. لا تطارد بطاريات تعطي 30 دقيقة، طارد مولّداً يعمل مع وقود 24 ساعة وجدول اختبار ربع سنوي.
  • الطوبولوجيا. تحويل مزدوج عبر الإنترنت، لا تفاعلية الخط، لعتاد الذكاء الاصطناعي. أضف وحدة N+1 لأي خزانة تخدم حملاً تنظيمياً أو دفاعياً أو مصرفياً.
  • جودة الكهرباء. اقرن UPS بمفتاح نقل ساكن ومولّد ذي تزامن سليم. الحماية بالمولّد وحده تفوّت أحداث الانخفاض التي تُفسد جلسات التدريب فعلياً.

كيمياء البطاريات تهمّ في مسقط: LiFePO4 يحتفظ بسعته عند درجة محيطة 30 إلى 35 في غرفة UPS، بينما تتدهور بطاريات الرصاص VRLA سريعاً. علاوة الرأسمال تعود في ثلاث إلى أربع سنوات على مواقع مسقط.

حسابات الحرارة وطوبولوجيا التبريد وحجم UPS ثلاثة من الإجابات التي يتوقّع دليل AI rack power cooling airgap الأشمل من كل مشترٍ سيادي أن يحضّرها قبل توقيع أمر شراء العتاد. راسلنا عبر [email protected] لجلسة إحاطة لمدة ساعة نستعرض فيها مع فريق المرافق لديك الأرقام الفعلية لموقعك.

أسئلة شائعة

ما درجة الحرارة الخارجية التي يجب التصميم عليها في مسقط؟

تتراوح ذروة درجات الحرارة الجافة في مسقط بين 35 و48 درجة مئوية. صمّم منظومة التبريد على افتراض حالة قصوى مستدامة عند 45 درجة خارجياً مع هامش أمان لا يقل عن 5 درجات. داخل القاعة، حافظ على درجة دخول الهواء البارد بين 22 و27 درجة لتبقى ضمن النطاق الموصى به في معايير ASHRAE A2.

كم تنتج خزانة H100 رباعية من حرارة فعلياً؟

تستهلك وحدة H100 SXM5 الواحدة نحو 700 واط تحت حمل تدريب مستدام، أي 2.8 كيلوواط لأربع وحدات. مع خسائر مزوّدات الطاقة، ومعالجات المضيف، والتخزين، والشبكة، يضاف ما بين 25 و35 بالمئة لتصل الخزانة إلى نحو 3.6 كيلوواط حمل صافٍ، أي ما يعادل 12.3 ألف وحدة حرارية بريطانية في الساعة.

هل مبادل الباب الخلفي مبالغة لخزانة واحدة؟

بالنسبة لخزانة واحدة بحمل 3 إلى 4 كيلوواط، يكفي عادةً نظام CRAC محيطي مع احتواء الممر البارد. يصبح مبادل الباب الخلفي ضرورياً فوق 8 كيلوواط للخزانة، أو حين يتعذّر احتواء الممرات. في معظم نشر برج حصن نعتمد التبريد المحيطي ونحجز مبادل الباب الخلفي للتوسعات الكثيفة.

كم يجب أن يصمد جهاز UPS على الشبكة العُمانية؟

تشهد الشبكة العُمانية انخفاضات جهد دون الثانية وانقطاعات نادرة بضع ثوانٍ، خصوصاً في ذروة الصيف. نحدد حجم UPS من نوع التحويل المزدوج لتشغيل كامل الحمل عند 3.6 كيلوواط لمدة 10 إلى 15 دقيقة، وهو ما يكفي لتشغيل المولّد الديزل ومزامنته. للأحمال السيادية الحرجة نوصي بوحدات N+1 ومولّد مع وقود لـ24 ساعة على الأقل.