فهرسة المدوّنة القانونية العُمانية باستخدام الذكاء الاصطناعي داخل المكتب
كلّ تطبيق جادّ للذكاء الاصطناعي في البحث القانوني بعُمان يَنطلق من النقطة ذاتها: فهرس نظيف ومُحدَّث وقابل للاستشهاد لِما تَقوله القاعدة القانونية فعلًا. بالنسبة لمكتب محاماة عُمانيّ أو إدارة قانونية في وزارة أو فريق داخليّ سياديّ، يُبنى هذا الفهرس فوق المراسيم السلطانية، والقرارات الوزارية التي تُفصّلها، ومبادئ النقض التي تُصدرها المحكمة العليا، والمنشورات التي يُصدرها المنظّمون أسبوعًا بعد أسبوع. لا يأتي أيّ من هذه المصادر بقاعدة بيانات مرتّبة. تَستعرض هذه المقالة الأنبوب داخل المكتب الذي يُحوّل المدوّنة العامّة إلى فهرس بدرجة استرجاع، دون أن يُرسل استفسار المكتب أو ملفّ الوزارة إلى سحابة أجنبية أبدًا.
ما الذي تَحويه المدوّنة القانونية العُمانية فعلًا
أربعة أصناف من المستندات تُؤدّي معظم العمل في الاستدلال القانوني العُماني، والفهرس القابل للدفاع يُعامل كلّ صنف بأنبوبه الخاصّ.
- المراسيم السلطانية. المصدر الأوّل للقاعدة الملزِمة. يُصدرها جلالة السلطان، وتُنشر في الجريدة الرسمية، ويَستنسخها على البوّابات العامّة موقع qanoon.om وموقع decree.om. تقريبًا مئة إلى مئتي مرسوم جديد سنويًّا، إضافةً إلى الأرشيف الممتدّ منذ 1970.
- القرارات والّلوائح الوزارية. يُصدرها مجلس الوزراء وفرادى الوزارات لتنفيذ المراسيم. تَنشر وزارة العدل والشؤون القانونية ملفّات الجريدة الرسمية المعتمدة.
- أحكام النقض. تُصدر المحكمة العليا مبادئ منتقاة تَلتزم بها المحاكم الأدنى في تسبيبها. تَتاح عبر بوّابة المحكمة الرسمية وعدد محدود من الخدمات المُفهرسة.
- منشورات المنظّمين. يَنشر البنك المركزي العُماني وهيئة سوق المال وهيئة الضرائب والهيئة العامّة للتعدين ووزارة العمل وهيئة حماية البيانات الشخصية منشورات وتعميمات إرشادية ملزِمة فعلًا للجهات المنظَّمة.
شكل الفهرس يَتبع شكل القاعدة. مُحمِّل مستندات يُعامل حكم نقض كقرار وزاري سيُضيع وزن السابقة في الاسترجاع. القاعدة الأولى في التصميم أن نَحفظ صنف المصدر حقلًا أوّليًّا في كلّ مقطع.
أنبوب الفهرسة من البداية إلى النهاية
خمس مراحل تَعمل جميعها على جهاز المكتب أو الوزارة.
- الالتقاط. استطلاع يوميّ على qanoon.om و decree.om وتغذية الجريدة الرسمية لوزارة العدل وصفحة المنشورات لكلّ منظّم. تَنزل المستندات الجديدة بصيغة PDF في مخزن مُصدَّر بسجلّ يَلتقط رابط المصدر وزمن الجلب وبصمة SHA256 للتدقيق لاحقًا.
- كشف طبقة النصّ، والتعرّف الضوئي عند اللزوم. فحص صفحة بصفحة يَفصل ملفّات PDF الرقمية الأصل عن صور ممسوحة. تَمرّ الصفحات الممسوحة عبر مكدّس تعرّف ضوئيّ مضبوط على العربية (Tesseract بنموذج ara، أو surya-ocr، أو نموذج رؤية من فئة Qwen-VL أو Gemini يَعمل محلّيًّا) ويُطابق المخرج مع رقم العدد وتاريخه في ترويسة الجريدة.
- استخراج الاستشهادات بالمراسيم. طبقة من التعابير المنتظمة وكيانات مسمّاة تَسحب الصيغة المعتمدة للاستشهاد (مرسوم سلطاني رقم/سنة، قرار وزاري رقم/سنة، طعن نقض رقم، مرجع منشور) من المتن. تُصبح كلّ إحالة حافّة في رسم بياني تَربط المقطع المُستشهِد بالمستند المُستشهَد به، فيستطيع المسترجِع أن يَخطو خطوة واحدة ليُحمّل النصّ الكامل لأيّ إحالة متقاطعة.
- التقطيع الدلالي. تُقطَّع المراسيم على مستوى المادّة لا على مستوى عدد الرموز، لأنّ كلّ محامٍ عُمانيّ يَستشهد برقم المادّة. تُقطَّع أحكام النقض بالمبدأ. تُقطَّع منشورات المنظّمين بالبند. يَحمل كلّ مقطع صنف مصدره ورقم مستنده ورقم مادّته وتاريخ صدوره ومُعرِّف مقطع ثابتًا.
- التضمين والفهرسة. يَكتب نموذج تضمين متعدّد اللغات المتّجهات في مخزن محلّي (FAISS أو Qdrant أو Milvus، الكلّ ذاتي الاستضافة). يُجاور الفهرسَ الكثيف فهرسٌ متناثر BM25 لاسترجاع هجين، وقد وَجدت دراسة arXiv على RAG القانوني العربي أنّه يَتفوّق على أيّ من المقاربتَين منفردةً في مهامّ السوابق.
التضمينات الثنائية اللغة والبحث المتقاطع
بيئة العمل العُمانية ثنائية اللغة افتراضًا. يُصاغ النصّ بالإنجليزية، ويَجيء المرسوم الأصل بالعربية، ومبدأ النقض بالعربية، ومذكّرة العميل بالإنجليزية. على الفهرس أن يُجيب سؤالًا إنجليزيًّا بالمادّة العربية الصحيحة وبالعكس. ثلاث عائلات تضمين مفتوحة متعدّدة اللغات تُؤدّي ذلك جيّدًا على عتاد محلّي: BGE-M3 من BAAI، و multilingual E5 من Microsoft Research، ونقطة فحص Cohere Embed Multilingual حين تَتاح نسخة ذاتية الاستضافة. كلّها تَضع المقاطع العربية والإنجليزية في فضاء دلالي مشترك، فلا يَحتاج السؤال ومقاطعه المسترجَعة أن يَتشاركا اللغة. النمط البنيويّ الأعمق، بما في ذلك استراتيجية التقطيع واختيار المُعيد ترتيبًا، هو موضوع المقالة المرافقة عن التضمينات الثنائية اللغة RAG للعربية والإنجليزية.
على طبقة الاسترجاع كذلك أن تُسوّي الصيغ العربية قبل التضمين (تنويعات الألف والهمزة، التاء المربوطة، الياء والألف المقصورة) وتُزيل التشكيل. دون التسوية، تَهبط مادّتان لا تَختلفان إلّا بالتشكيل في نقطتَين متباعدتَين في الفضاء المتّجهيّ، فيَضعف المسترجِع بصمت.
إيقاع التحديث ووضعية التدقيق
يَعمل الأنبوب يوميًّا، لكنّ إيقاع التدقيق مدفوع بالأحداث. كلّ مرسوم سلطانيّ جديد يُطلق أربع خطوات تَتبُّع: الالتقاط، والتعرّف الضوئي (إن لزم)، والتضمين، والفهرسة. يَستلم مسؤول إدارة المعرفة موجزًا بالمستندات الجديدة، وحوافّ الإحالة المضافة، وأيّ صفحات تعرّف ضوئيّ نَزلت تحت عتبة الثقة وتَحتاج مراجعة بشرية. يُقارن تقرير فرق أسبوعيّ الفهرس المحلّي بروابط المصدر العامّ ليَلتقط أيّ تعديل صامت أو سحب. تُقتطف لقطة شهرية للفهرس بكامله ولأوزان النموذج ولنموذج التضمين إلى نسخة احتياطية معزولة شبكيًّا، فيستطيع المكتب أو الوزارة أن يُعيد إنتاج أيّ إجابة سَطّرها قبل ستّة أشهر.
الناتج فهرس قانونيّ عُمانيّ يَعيش داخل المحيط، ويُحدَّث خلال ساعات من الجريدة الرسمية، ويَدعم البحث الثنائي اللغة، ويُنتج مسار تدقيق يستطيع المكتب أو الوزارة تسليمه لمنظّم دون تنقيح. لتصميم بناء فهرس لمكتبك أو وزارتك، راسلنا على [email protected] لجلسة إحاطة لمدّة ساعة. سنَضبط نطاق المدوّنة وطابور التعرّف الضوئي وطبقة التضمين الثنائي اللغة بحجم فريقك ووضعية سرّيتك.
الأسئلة الشائعة
أين تَعيش المدوّنة القانونية العُمانية العامّة على الإنترنت؟
تَنشر وزارة العدل والشؤون القانونية النصّ الرسمي للمراسيم السلطانية في الجريدة الرسمية. ويُفهرس مرآتان عامّتان كبيرتان المدوّنة نفسها للبحث: qanoon.om و decree.om. وتَنشر المحكمة العليا مبادئ النقض المختارة، فيما يَنشر منظّمو القطاعات كهيئة سوق المال والبنك المركزي العُماني وهيئة الضرائب منشوراتهم على بوّاباتهم. الفهرس السيادي يَستنسخ هذه المصادر محلّيًّا، ثمّ يُحافظ على فرق يومي مع المصدر العامّ ليَنزل التحديث داخل المحيط دون أن يُغادر أحد المكتب أو الوزارة.
هل نَحتاج التعرّف الضوئي إذا كان النصّ منشورًا أصلًا بصيغة PDF؟
غالبًا نعم. حصّة معتبرة من المراسيم السلطانية، خصوصًا المجلّدات الأقدم من السبعينيات حتّى مطلع الألفية، تَعيش بصيغة PDF صور مسحوبة لا بطبقة نصّ. الأنبوب الموثوق يَكشف وجود طبقة النصّ عند الاستيعاب، ويُمرّر الصفحات الممسوحة عبر مكدّس تعرّف ضوئيّ مضبوط على العربية مثل Tesseract بنموذج ara أو surya-ocr أو نموذج رؤية مضبوط محلّيًّا، ثمّ يُطابق المخرج مع رقم العدد وتاريخه في ترويسة الجريدة. تَخطّي هذه الخطوة يعني أنّك لا تُفهرس شيئًا من نصف الأرشيف التاريخي.
كيف يُعالَج البحث الثنائي اللغة حين تكون المدوّنة عربية في معظمها؟
نَستخدم نموذج تضمين متعدّد اللغات يَضع المقاطع العربية والإنجليزية في فضاء دلالي مشترك. تَعمل خيارات مفتوحة مثل BGE-M3 و multilingual E5 و Cohere Embed Multilingual على وحدات معالجة محلّية دون إرسال نصّ خارج المحيط. يَطرح المحامي السؤال بالإنجليزية، فيُرتّب المسترجِع المقاطع العربية بالتشابه الدلالي، ويُجيب المولّد بأيّ لغة مع إرفاق الاستشهاد العربي الأصلي. البحث الكلميّ وحده يَنهار على الصرف العربي، فالاسترجاع الدلالي هو الأرضية لا السقف.
كم تَتغيّر المدوّنة القانونية العُمانية فعلًا؟
تَصدر الجريدة الرسمية أسبوعيًّا. في سنة نموذجية تُصدر عُمان بين 100 و 200 مرسوم سلطاني، ومئات القرارات الوزارية، وعشرات مبادئ النقض، ودفقًا متّصلًا من منشورات المنظّمين. تَكفي مهمّة استطلاع يومية على qanoon.om و decree.om إضافةً إلى ملفّات الجريدة. تَدخل المستندات الجديدة طابور التعرّف الضوئي، ثمّ تُقطّع وتُضمَّن وتُفهرس خلال ساعات من النشر، مع إشعار يَصل مسؤول إدارة المعرفة في المكتب أو الوزارة.