دراسات وأبحاث
البيانات الحكومية المفتوحة
العدد 147 | حزيران (يونيو)-2019

بقلم غسان سابا
مدير بحوث

الملخص

يهدف هذا المقال إلى نشر الوعي بمفهوم البيانات الحكومية المفتوحة، والتركيز على الفوائد العائدة على المجتمع الأهلي أو على المواطنين من جراء إتاحة هذه البيانات على الإنترنت (الشابكة)، وفتح إمكانات استعمالها وإعادة استعمالها أو نشرها. ويبين معايير جودة البيانات الحكومية المفتوحة حسب (مؤسسة صن لايت) وآليات تقييم البيانات المفتوحة، ويحدد أساليب فتح البيانات ونوع البيانات المراد فتحها والتحديات التي نواجهها عند تطبيق ونشر البيانات الحكومية على البوابات الإلكترونية.

البيانات المفتوحة

تعرَّف البيانات المفتوحة بأنها البيانات التي يمكن الوصول اليها بحريّة، واستعمالها وإعادة استعمالها وإعادة توزيعها من قبل أي شخص وفي أي مكان ولأي غرض، والمتاحة في شبكة الإنترنت دون عوائق قانونية، ولا تحتوي على معلومات حساسة أو محمية بموجب القانون. أما البيانات الحكومية المفتوحة فهي البيانات الصادرة عن الحكومة والمتاحة للجميع والخاضعة للنشر بموجب قانون حق الوصول إلى المعلومات وقانون حماية البيانات الشخصية.

الهدف من إتاحة البيانات الحكومية مجانًا

يمكننا تلخيص الأهداف من إتاحة البيانات المفتوحة بما يلي:

  • السماح للمجتمع الأهلي وقطاع الأعمال والأفراد وأصحاب المصلحة المعنيين بإعادة استعمال هذه البيانات ودمجها لأغراضٍ متعددة
  • توفير العديد من الفرص للمجتمع للمشاركة في عملية اتخاذ القرارات ورسم السياسات، وتحقيق الكفاءة والشفافية والمساءلة وتعزيز الثقة في الأداء الحكومي والقطاع العام والتوعية بالإجراءات الحكومية
  • توفير الفرصة للأفراد والرياديين لإظهار طاقات الإبداع والابتكار لديهم في تطوير خدمات مختلفة
  • توفير فرص عمل وموارد مالية جديدة

ولكي نستفيد من البيانات المفتوحة الاستفادة القصوى، يجب أن تحقق هذه البيانات مجموعة من الخصائص، وأن تلتزم بمجموعة من المعايير التي وضعت جزءًا كبيرًا منها مؤسسةُ صن لايت Sunlight المعتمَدة من هيئة الأمم المتحدة. وقد عرَّفت هذه المؤسسة 10 معايير للبيانات الحكومية المفتوحة المتاحة للعموم، هي:

1) الاكتمال Completeness

يجب أن تكون مجموعات البيانات Datasets التي تفصح عنها الحكومة مكتملة إلى أقصى حد ممكن، وتعطي صورة كاملة عما هو مسجل عن موضوع معين. ويجب الإفصاح عن جميع المعلومات الأولية من مجموعة البيانات للمواطنين، باستثناء الحد اللازم للالتزام بالقوانين المعمول بها فيما يتعلق بالإفصاح عن المعلومات التي تكشف عن المعلومات الشخصية.

2) أولوية المصدر Primacy

يجب أن تكون مجموعات البيانات التي تفصح عنها الحكومة هي بيانات المصدر الأول. ويشمل ذلك المعلومات الأصلية التي جمعتها الحكومة، والتفاصيل المتعلقة بكيفية جمع تلك البيانات ووثائق المصدر الأصلي التي تسجل جمع البيانات. وسوف يسمح النشر العام للمستعملين بالتحقق من أن المعلومات قد جمعت كما ينبغي وسجلت بدقة.

3) الحينية (أو في الوقت المناسب) Timeliness

يجب أن تكون مجموعات البيانات التي تفصح عنها الحكومة متاحة للمواطنين في الوقت المطلوب. كما يجب الإفصاح عن البيانات التي تجمعها الحكومة بأسرع ما يمكن فور جمعها وترتيبها عندما يكون ذلك ممكنًا. ويجب أن تعطى الأولوية للبيانات التي يعتبر عنصر الوقت حساسًا بالنسبة لاستعمالها. وسوف تحسن التحديثات الآنية للبيانات من الفائدة التي يمكن أن يحققها المواطن من هذه البيانات.

4) النفاذ      Accessibility

يجب أن تتميز مجموعات البيانات التي تفصح عنها الحكومة بسهولة الوصول إليها، سواءً بالوسائل المادية أو الإلكترونية. تشمل عوائق الوصول المادي متطلبات زيارة دائرة معينة، أو متطلبات الالتزام بإجراءات محددة (مثل إكمال بيانات نماذج أو تقديم طلبات معلومات). أما عوائق الوصول الإلكتروني فتشمل إتاحة البيانات عن طريق تقديم نماذج أو أنظمة تتطلب تكنولوجيا تتعلق بالمتصفح (مثل برنامج فلاش Flash أو جافاسكربت Javascript أو الكوكيز Cookies أو تطبيقات مصغرة بلغة الجافا Java applets). وفي المقابل، فإن توفير واجهة للمستعملين لتحميل كافة البيانات المخزنة في أية قاعدة بيانات مرة واحدة (بما يعرف بالوصول "الشامل")، ووسائل إجراء طلبات معينة للبيانات باستعمال واجهة برمجة تطبيقات API تجعل الوصول إلى البيانات أكثر سهولة. أضف إلى ذلك، "إمكان العثور" التي تعني القدرة على تحديد مكان المحتوى وتحميله بسهولة.

5) القراءة الآلية Machine Readability

تستطيع الآلات معالجة بعض أنواع المدخلات أكثر من غيرها. على سبيل المثال، تعتبر معالجة الملاحظات المدونة بخط اليد على الورق صعبة للغاية بالنسبة للآلات. كما أن المسح الضوئي للنصوص بالاستعانة بتعرُّف الحروف ضوئيًّا OCR نتج عنه الكثير من أخطاء المطابقة والتنسيق. وكذلك تحليل المعلومات المتداولة بصيغة الوثائق المتنقلة PDF على سبيل المثال؛ المستعملة على نطاق واسع، يعتبر أمرًا صعبًا للغاية. لذا، يجب تخزين المعلومات في صيغ ملفات واسعة الانتشار يسهل معالجتها آليًّا. ويجب أن تكون هذه الملفات مصحوبة بتوثيق يتعلق بالصيغة وكيفية استعمالها فيما يتعلق بالبيانات.

6) عدم التمييزية Non-Discriminatory

يشير مصطلح "عدم التمييز" إلى الذين يمكنهم الوصول إلى البيانات وكيفية الوصول إليها. ويمكن أن تشمل عوائق استعمال البيانات: متطلبات التسجيل أو العضوية، والحالات التي يقتصر فيها الوصول إلى البيانات على بعض الطلبات فحسب. ويقصد بالوصول إلى البيانات دون تمييز - بوجه عام - أن أي شخص يمكنه الوصول إلى البيانات في أي وقت دون اشتراط تعريف نفسه أو تقديم تبرير للقيام بذلك.

7) ليست ملكية خاصة Non-Proprietary

أي يجب أن تستعمل معايير مشتركة أو مفتوحة تشير إلى من يملك الصيغة التي تخزن بها البيانات. على سبيل المثال، إذا كانت هناك شركة واحدة فقط تصنع البرنامج الذي يمكن أن يقرأ الملف الذي تخزن عليه البيانات، فإن الوصول إلى تلك البيانات سيتوقف على استعمال برنامج المعالجة لتلك الشركة. وفي بعض الأحيان قد يكون ذلك البرنامج غير متوفر للمواطن، أو قد يكون متوفرًا ولكن مقابل كلفة مادية. على سبيل المثال، يعتبر برنامج مايكروسوفت إكسل Microsoft Excel من أشهر البرامج المستعملة في البيانات المجدولة ولكن هناك تكلفة لاستعماله. وغالبًا ما توجد صيغ بديلة متوفرة دون تكلفة يمكن الوصول من خلالها إلى البيانات المختزنة دون حاجة لترخيص برامج. إن إزالة تلك التكلفة يجعل البيانات متوفرة لقطاع أوسع من المستعملين المحتملين.

8) الترخيص Licensing

إن فرض "شروط الخدمة" ومتطلبات التنسيب والقيود على النشر وغير ذلك يمثل عوائق على استعمال المواطن للبيانات. ويشمل الفتح بحده الأقصى تصنيف المعلومات العامة بوضوح أحد أعمال الحكومة، وأن تكون تلك المعلومات متوفرة دون قيود كجزء من الملكية العامة.

9) الاستمرارية Permanence

أي القدرة على العثور على المعلومات مع مرور الوقت. يجب أن تكون المعلومات التي تفصح عنها الحكومة ثابتة: أي يجب أن تكون متوفرة على شبكة الإنترنت على الدوام. وفي غالب الأحيان يتم تحديث المعلومات أو تغييرها أو حذفها دون أي إشارة إلى ذلك، أو يعلن عن ذلك التعديل كتدفق للبيانات دون أن يتم أرشفته في مكان ما. ولتحقيق أفضل استعمال للمواطن، يجب أن تظل البيانات التي تتاح على شبكة الإنترنت موجودة على تلك الشبكة، مع المتابعة الملائمة لتغير النسخ والأرشفة مع مرور الوقت.

10) تكاليف الاستعمال Usage Costs

تعد التكلفة المفروضة على الجمهور للوصول إلى البيانات أحد أكبر عوائق الوصول إلى المعلومات التي تكون متاحة للمواطنين ظاهريًّا، ولو كانت تلك التكلفة بسيطة. تستعمل الحكومات عددًا من الأسس لفرض رسوم على المواطنين مقابل النفاذ إلى الوثائق التي هي أصلًا وثائقهم؛ نعدد من هذه التكاليف على سبيل المثال لا الحصر: تكاليف توليد البيانات، ومبدأ استرداد التكلفة، وتكلفة استرداد المعلومات، وتكلفة الصفحة الواحدة أو الاستفسار الواحد، وتكلفة المعالجة، وتكلفة النسخ... إلخ.

تُجمع معظم بيانات الحكومة لأغراض حكومية، ووجود رسوم على المستعملين له تأثير ضئيل أو غير موجود مطلقًا. ثم إن فرض رسوم على الوصول إلى البيانات يحد من شريحة الراغبين أو القادرين على الوصول إلى المعلومات، وقد يؤدي إلى استعمالات تحويلية للبيانات، وهذا من شأنه أن يحقق نموًّا في الأعمال وإيرادات الضرائب.

يضاف إلى المعايير السابقة مجموعة من الخصائص الأخرى التي تؤخذ بالحسبان عند حساب مؤشرات الانفتاح للبيانات الحكومية، مثل:

  • متوافرة على الخط ومجانية Online & Free
  • متاحة بكميات كبيرة Available in bulk
  • موثوقة Trusted  (موقعة رقميًّا مثلًا)
  • موثقة Documented (مثل تعريف صيغ البيانات ومعانيها)
  • آمنة Safe to Open

جودة البيانات الحكومية المفتوحة

يستعمل عادةً نموذج "النجوم الخمسة" الذي عرفه مبتكر الوب "تيم  بيرنرز لي" المبين في الجدول الآتي:

*

البيانات متاحة على شبكة الإنترنت بترخيص مفتوح

* *

البيانات متاحة في جدول منظم قابل للمعالجة الآلية ( إكسل Excel، وليس صورة ممسوحة ضوئيًّا(

* * *

عدم استعمال صيغ خاصة (مثل:  CSV و XML)

* * * *

استعمال مسارات URIs ومعايير لوصف البيانات (RDF  و SPARQL) بحيث يمكن للآخرين الإشارة إلى بياناتك

* * * * *

البيانات مرتبطة ببيانات من مصادر أخرى أو من مجموعات بيانات أخرى لتزويد السياق

 

الجدول 1 – نموذج تقييم النجوم الخمسة لجودة البيانات المفتوحة

الشكل 2 – مثال عن جودة البيانات المفتوحة

لاحظ أنه ليس كل البيانات تحتاج إلى تحقيق متطلبات نظام الخمس نجوم المبين آنفًا. ويمكن للجهات الحكومية خلق القيمة عن طريق نشر البيانات فورًا بترخيص مفتوح فحسب. وفي حين أن نشر البيانات في صيغ مقروءة آليًّا يعد أمرًا مرغوبًا، إلا أنه يجب على مسؤولي الحكومة ألا ينسوا أن تنقيح وتنظيف البيانات للتوصل إلى بيانات مقروءة آليًّا يمكن إجراؤه من أطراف أخرى.

كيفية إتاحة البيانات للعموم

  • جرد البيانات: وهي عملية حصر لمخزون البيانات المتوفرة لدى كل جهة حكومية بكافة تصنيفاتها. ويفضل أيضًا أن تقوم الجهة الحكومية بفهرسة البيانات وإعطائها رموزًا معرفة لكل مجموعة بيانات تسهل عملية البحث عنها.
  • ضمان جودة البيانات المتاحة  كما شاهدنا في البند السابق.
  • الرقمنة والأرشفة ونشر البيانات على بوابة مركزية أو مجموعة من البوابات الفرعية.
  • الإدارة والتقييم: تحتاج البيانات المفتوحة والمنشورة على البوابة المركزية إلى إدارة دائمة وتحسين جودتها باستمرار ومتابعة الشكاوى والآراء المتعلقة بها.

ما هي البيانات التي يمكن فتحها؟

يجب التركيز عند فتح البيانات الحكومية ونشرها على أهمية البيانات المراد نشرها، إذ تظهر الإحصائيات أن 20% فقط من البيانات تهم 80% من المواطنين̣ نذكر من أهم البيانات الممكن نشرها:

  • الموازنة Budget
    • رؤية عالية المستوى
    • المصروفات الحكومية المخطط لها للسنوات القادمة
  • الإنفاق Spending
    • الإنفاق العام للسنة الحالية والسنوات السابقة على مستوى تفصيلي
    • العقود المبرمة
  • المشتريات Procurement
    • المناقصات الحكومية
  • معلومات عن الانتخابات ونتائجها
  • سجلات الشركات
  • ملكيات الأراضي
  • الخرائط الوطنية
    • الشوارع العادية والسريعة
    • الأنهار
    • الجبال
  • الحدود الإدارية
  • المواقع البريدية
  • الإحصائيات الوطنية
    • التعداد السكاني
    • المؤشرات الاقتصادية مثل GDP
    • نسبة البطالة
  • مقترحات القوانين والتشريعات
  • القوانين الصادرة
  • جودة الهواء موزعة حسب المناطق
  • جودة الماء موزعة حسب المناطق

تحديات البيانات الحكومية المفتوحة

نذكر من أهم تحديات نجاح مبادرات البيانات الحكومية المفتوحة:

  • جَسْر الهوة التشريعية
  • الممانعة في مشاركة البيانات الحكومية
  • صعوبة تحديد البيانات الممكن إتاحتها
  • عدم إدراك أهمية البيانات الموجودة كأصول، ونقص الوعي بمزايا انفتاح البيانات الحكومية
  • دعم مشاركة الأطراف غير الحكومية
  • تحسين جودة البيانات المنشورة وحداثتها
  • زيادة الوعي لدى المواطنين والعاملين في القطاع العام
  • بناء قدرات الطاقم الوظيفي في القطاع العام لتنفيذ مبادرات البيانات الحكومية المفتوحة.
قد ترغب كذلك بقراءة
تسخير التكنولوجيا لإدارة النُّفايات في المدن الذكية
تحديد الهوية بموجات الراديو: أساسيات وتطبيقات
الخدمات الحكومية والهوية الرقمية