تدفقات معالجة الوثائق المصنّفة باستخدام نماذج اللغة المحلية

لا تشتري البيئات المصنَّفة الذكاء الاصطناعي للانبهار، بل لاختصار زمن قراءة وثائق لا يجوز أن يخرج محتواها من الغرفة. القسم الصعب ليس النموذج، بل توصيله بسير عمل وثائقي يحترم حدود التصنيف وضوابط الوصول الإلزامية وسلسلة تدقيق تصمد أمام زيارة المفتّش العام. يستعرض هذا المقال النمط الذي نراه فاعلاً، من مصفوفة التصنيف نزولاً إلى الخزانة معزولة الشبكة، في وزارات الدفاع وأجهزة الأمن الداخلي عبر دول الخليج.

مصفوفة التصنيف ومكافئاتها الخليجية

ترث معظم منظومات التصنيف الحديثة بنية رباعية المستويات تتطابق منطقياً عبر الأطلسي وداخل الخليج. تختلف المسمّيات؛ ولا يختلف المنطق.

  • غير مصنّف / عام. مادّة لا ضرر من إفصاحها. في الممارسة العُمانية هي الأصل في البيانات الصحفية والمشتريات المنشورة والمصادر المفتوحة. المكافئ الخليجي: Public.
  • سرّي / CONFIDENTIAL. الإفصاح يضرّ بالعمليات أو العلاقات لكنه قابل للاستدراك. أعمال الموظّفين الاعتيادية، مذكرات داخلية، مسوّدات عقود.
  • سرّي للغاية / SECRET. الإفصاح يُحدث ضرراً جسيماً بالأمن الوطني. الخطط العملياتية، هويّات المصادر، ملفّات تقييم العطاءات للأصول السيادية.
  • سرّي للغاية مشدّد / TOP SECRET. الإفصاح يُحدث ضرراً بالغاً وخطيراً. الاستخبارات الاستراتيجية، أوراق القرار على مستوى مجلس الوزراء، جمع الإشارات.

فوق التصنيف الأشدّ تأتي البرامج المُجزَّأة (يسمّيها الغرب SCI، وتعتمد وزارات الخليج أسماء غطاء خاصة بالبرنامج) فتُضيف اشتراط الحاجة إلى المعرفة فوق المستوى. تُهندَس برامج الذكاء الاصطناعي داخل هذه التجزئات بنفس أسلوب التصنيف الأشدّ، مع قاعدة إضافية: تطبيق العضوية في التجزئة على مستوى الصفّ داخل الفهرس، لا فقط على حدّ الشبكة.

أين يُسهم الذكاء الاصطناعي وأين لا يُسمح له

الحوار الأول مع أيّ مشترٍ من بيئة مصنَّفة لا يدور حول أداء النموذج، بل حول النطاق. يكسب الذكاء الاصطناعي مكانه في أربع مهام، ويُرفض في خامسة.

  • الصياغة. إنتاج مسوّدة أوّلية لمذكرة أو تقرير اعتيادي من نقاط يقدّمها المحلّل. يعدّل الكاتب المُصرَّح ويوقّع. يُسرّع النموذج عملاً كان الكاتب سيؤدّيه على أيّ حال.
  • اقتراح التصنيف. قراءة مسوّدة واقتراح مستوى تصنيف مع استشهادات بالمصفوفة. يقبل أو يردّ المراجع المُصرَّح. يُسجَّل الاقتراح، ويُسجَّل الردّ، ويبقى القرار للبشر.
  • التنقيح. تأشير المقاطع التي تطابق أنماط الكيانات المسمّاة وهويّات المصادر والتجزئات لمراجعة تخفيض التصنيف. تُراجَع الوثيقة المنقَّحة مقابل الأصل من ضابط مُصرَّح قبل أيّ إفراج.
  • التلخيص والإجابة. ضغط الملفّات الطويلة في أدوات قراءة، مع استشهادات موثَّقة بمقاطع المصدر. الملخّص أداة قراءة لا قرار.

أمّا المهمّة الخامسة فهي تخفيض التصنيف بشكل مستقلّ، ويجب ألّا يُسمح للذكاء الاصطناعي بالاقتراب منها. تخفيض تصنيف الوثيقة قرار سيادي بتبعات قانونية لاحقة. يستطيع النموذج عرض مرشَّح وكتابة مسوّدة تبرير وعرض الفرق. يوقّع ضابط مُصرَّح ومسمّى. يُظهر السجلّ التدقيقي المرشَّح والتوقيع وأيّ طعن لاحق. لا استثناء.

التصريح وضبط الوصول: الأمن متعدّد المستويات بلا أساطير

عملت تدفقات الوثائق المصنَّفة على فكرة الأمن متعدّد المستويات (MLS) لخمسين عاماً. يُقدّم نموذج Bell-LaPadula، الموثَّق في NIST، القاعدتين المهمّتين للذكاء الاصطناعي: لا قراءة صعوداً (لا تستطيع عملية سرّية للغاية أن تقرأ سرّياً للغاية مشدّد) ولا كتابة نزولاً (لا تستطيع عملية سرّية للغاية مشدّد أن تكتب في تخزين سرّي للغاية). مُترجَمةً إلى منظومة تشغيل النماذج:

  1. يعمل كل مستوى تصنيف على عزلِه الخاصّ بنسخة نموذج خاصّة وفهرس استرجاع خاصّ وسجلّ تدقيق خاصّ. لا توجد تجمّعات معالجة رسومية مشتركة تلامس أكثر من مستوى.
  2. تنتشر تسميات ضبط الوصول الإلزامي عبر كل طبقة، نظام التشغيل ونظام الملفات وفهرس الاسترجاع والقالب والردّ. لا يرى النموذج إلّا ما يُصرَّح به للمستخدِم المنادي، تُفرضه المنصّة لا قوالب القرار.
  3. تكون التحويلات بين المستويات (محلّل سرّي للغاية مشدّد يقتبس مصدراً سرّياً للغاية صعوداً) صريحة ومسجَّلة ومُراجَعة. لا ترقية ضمنية عبر التخزين المؤقّت أو التضمينات أو المتجهات المشتركة.

عملياً، هذا الموقف نفسه الذي تحقّقه أنظمة وزارة الدفاع الأمريكية وفق NIST SP 800-171 الإصدار الثالث للمعلومات غير المصنَّفة الخاضعة للضبط، والضوابط المعزَّزة في SP 800-172 للأصول عالية القيمة. تُحقّق وزارات الخليج موقفاً مكافئاً بأطر سيادية، بنفس التزامات التدقيق.

نمط سير العمل: الاستيعاب، التصنيف، التوجيه، التلخيص، التدقيق

يتبع النشر القابل للدفاع عنه للذكاء الاصطناعي المصنَّف خطّ أنابيب من خمس مراحل بصرف النظر عن المستوى. لا تتغيّر المراحل؛ تتشدّد الضوابط المحيطة بها مع ارتفاع المستوى.

  • الاستيعاب. تدخل الوثائق إلى العزل عبر صمّام بيانات أحادي الاتجاه أو حلّ عبور-المجالات مضبوط. تطبع خدمة الاستيعاب على كل سجلّ المنشأ وبصمته ومستوى تصنيف مبدئي. لا شيء يصل إلى الفهرس دون فهرسة.
  • التصنيف. يقترح النموذج تصنيفاً وفق المصفوفة وأنماط الكيانات المسمّاة الخاصّة بالمؤسسة. يقبل المراجع المُصرَّح أو يخفّض أو يرفع. يكون القرار نهائياً ومسجَّلاً.
  • التوجيه. يَنزل السجلّ المصنَّف في فهرس الاسترجاع الخاصّ بمستواه. تُوجّه وسوم التجزئات أبعد إلى عُزلٍ على مستوى الصفّ حيث ينطبق. تُقيّد تسميات وصول المستخدِم ما يستطيع استرجاعه.
  • التلخيص. عند الطلب، يُنتج النموذج ملخّصات موثَّقة، أو مسوّدات مذكرات، أو جداول مقارنة، باستشهادات بمقاطع المصدر يُعيد المحلّل قراءتها. يرث المخرج أعلى تصنيف لامسه أيّ مصدر.
  • التدقيق. كل إجراء (استيعاب، اقتراح تصنيف، استبدال، استرجاع، استدعاء نموذج، مخرج، تخفيض) يَنزل في سجلّ غير قابل للتعديل مفهرَس بالمستخدِم وبصمة الوثيقة وإصدار النموذج وقالب القرار. هذا السجلّ هو أوّل ما يطلبه المفتّش العام، وأقوى دفاع للمؤسسة.

واقع النشر معزول الشبكة

تشغيل هذه المنظومة داخل منشأة مكافئة لـSCIF يعني قبول جملة من حقائق التشغيل لا تنطبق على ذكاء اصطناعي السحابة العامة. يُعالج نمط حصن، الموصوف في مقالنا الجامع حول الذكاء الاصطناعي معزول الشبكة للدفاع والأمن الداخلي، هذه الحقائق مدخلات تصميمية.

أوّلاً، لا نبضة مع المورّد. تعيش أوزان النموذج وفهرس الاسترجاع ومخزن التدقيق ونظام التشغيل بالكامل على عتاد المؤسسة. تصل التحديثات عبر وسائط موقّعة في خطٍّ يدوي موثَّق، تُفحص بأدوات المؤسسة الخاصّة، ثم تُنشر تحت إدارة التغيير. لا تتصل حصن للخارج، ولا تبثّ قياسات عن بُعد، ولا تتطلّب خادم تراخيص.

ثانياً، نسخ احتياطي مدرك للتصنيف. ترث النسخ الاحتياطية تصنيف مصدرها. يُنسَخ فهرس استرجاع سرّي للغاية إلى تخزين سرّي للغاية في العزل ذاته. لا نسخ احتياطي عبر المستويات، ولا تعافٍ سحابي من الكوارث، ولا تكرار في موقع آخر إلّا داخل منشأة معتمدة عند المستوى نفسه تحت السلطة نفسها.

ثالثاً، إيواء وفق ICD 705 أو ما يكافئه سيادياً. تعيش الحوسبة في خزائن داخل منشآت معتمدة وفق معايير مماثلة لـتوجيه مجتمع الاستخبارات ICD 705 (تحصين TEMPEST، ضبط محيطي، قواعد سلامة الشخصين). تُورّد حصن الطبقة الذكية، وتُورّد المنشأة المصنَّفة أو المكافئ السيادي ما تبقّى. خطّة التكامل جزء من كل لقاء، لا أمر مؤجَّل.

إن كنتم تُحدّدون نطاق سير عمل ذكاء اصطناعي على مادّة مصنَّفة في عُمان أو الخليج الأوسع، فالخطوة التالية لقاء مدّته ساعة مفصَّل على مصفوفة تصنيفكم وبنية تجزئاتكم واعتماداتكم القائمة. راسلونا على [email protected] أو عبر +968 9889 9100. سنستعرض مراحل سير العمل وضوابط الأمن متعدّد المستويات وخطّة موثوقة وفق منشأتكم القائمة. التسعير بحسب الطلب وفق متطلّباتكم.

أسئلة شائعة

هل يمكن منح نموذج لغوي تصريحاً لقراءة مادة سرّية للغاية مشدّد؟

النموذج برمجية ولا يحمل تصريحاً، البيئة التي يعمل فيها هي التي تحمله. النموذج المُحمَّل في عزلٍ سرّي للغاية مشدّد يرث اعتماد تلك العزلة، بنفس الضوابط المادية والشخصية والتدقيقية المطبَّقة على أيّ أداة أخرى على تلك الشبكة. يبقى التصريح مع النظام والأشخاص لا مع الأوزان.

ما الأمن متعدّد المستويات ولماذا يهمّ في الذكاء الاصطناعي؟

الأمن متعدّد المستويات منهج تشغيل عدّة مستويات تصنيف على بنية تحتية مشتركة بضمانات رياضية تمنع تدفّق المعلومات نزولاً. في الذكاء الاصطناعي، يعني ذلك أنّ نموذجاً في عزلٍ سرّي للغاية لا يجوز أن يكتب في تخزين غير مصنّف ولا أن يقتبس نصاً سرّياً للغاية في ردٍّ غير مصنّف. قاعدة Bell-LaPadula في منع الكتابة نزولاً هي أبسط صياغة لذلك.

هل ينبغي للنموذج نفسه أن يقرّر تصنيف الوثيقة؟

يقترح ولا يقرّر. التصنيف الآلي توصية يقبلها أو يردّها مراجع بشري مُصرَّح قبل حفظ الوثيقة. يُظهر السجلّ التدقيقي اقتراح النموذج وقرار المراجع وأيّ اختلاف بينهما، وهو خط الدفاع التتبّعي الذي تحتاجه الوزارة عند التفتيش.

هل تتوافق حصن مع متطلبات SCIF وفق ICD 705؟

صُمّمت أجهزة حصن للعمل داخل منشآت معتمدة وفق معايير مكافئة لـICD 705 أو NIST SP 800-171 / 800-172. تورّد حصن طبقة الحوسبة الذكية وخطّافات التدقيق، وتورّد المنشأة المصنَّفة الضوابط المادية والكهرومغناطيسية والشخصية. تُغطّي اللقاءات خطّة التكامل بالتفصيل.