دعم مختبر البيانات النظام الإحصائي للمنظمة من خلال مواجهة التحديات الخاصة المتصلة بحسن التوقيت، ومستوى التفصيل، والثغرات في البيانات، وأتمتة التحليل لتوفير معلومات أسرع.

 


وتعد البيانات سلعة غير ملموسة في غاية الأهمية، ولكن البيانات الرسمية ليست دائمًا متوافرة؛ ويعزى ذلك في غالب الأحيان إلى ضعف القدرات الإحصائية، وقلّة التمويل الخاص بالبيانات والإحصاءات، وضعف نشر البيانات وثقافة استخدامها، ودخول جهات منافسة جديدة إلى السوق، الأمر الذي يؤدي إلى ثغرات في البيانات. وتتسع هذه الثغرات في سياق حالات الطوارئ التي يكون فيها الحصول على المعلومات في الوقت المناسب أمرًا بالغ الأهمية.

ولمعالجة أزمة نظم جمع البيانات التقليدية، يتعيّن على الجهات الفعالة الوطنية والدولية أن تعمل مع مصادر جديدة للبيانات وتتبع أساليب جديدة وتجد حلولًا مبتكرة لتوليد المعلومات التي تكون ذات صلة بالأمن الغذائي والتغذية وتحويل النظم الغذائية.

ومن هذا المنطلق، أنشأت منظمة الأغذية والزراعة في عام 2019 "مختبر البيانات للابتكار في مجال الإحصاءات" لسدّ هذه الثغرات عبر تحسين عملية جمع البيانات في الوقت المناسب ومستوى تفصيلها وزيادة استخدام الأساليب والتكنولوجيات التي تسمح باستخراج البيانات من مصادر غير منظمة بهدف توفير المعلومات في الوقت المناسب دعمًا لعمليات صنع القرارات.

اسـتخراج البيانات من شبكة الإنترنت

توفر شبكة الإنترنت نطاقًا واسعًا من الوقائع ومصادر البيانات التي تتكوّن من مجموعة هائلة من البيانات المتباينة والمنظمة بشكل سيء. وينطوي اسـتخراج البيانات من شبكة الإنترنت على البحث عن هذه البيانات في الصفحات الإلكترونية واستخلاصها لتهيئة معلومات منظمة بشكل صحيح. وقد وضع مختبر البيانات إجراءات مختلفة لجمع المعلومات المنظمة من الصفحات الإلكترونية التي تحتوي على بيانات إحصائية أو من مواقع التواصل الاجتماعي (تويتر)/شبكات تجميع الأخبار (غوغل نيوز).

تحليل النصوص

يشير تحليل النصوص (أو استخلاص النصوص) إلى عملية استخراج المعلومات بصورة تلقائية من موارد مكتوبة مختلفة. وهو ينطوي على التحليل المعجمي لدراسة توزّع تكرار الكلمات، والتعرّف على الأنماط، والتوسيم/التعليق التوضيحي، وتحليل الرأي العام، واستخراج المعلومات، وتقنيات استخلاص البيانات (بما في ذلك تحليل الروابط والصلات)، وعرض البيانات، والتحليلات التنبؤية بهدف تحويل النصوص إلى بيانات قابلة للتحليل عن طريق تطبيق عمليات معالجة اللغات الطبيعية. وباستخدام الأدوات المناسبة (وجميعها مجانية ومتاحة من دون قيود)، يطبق مختبر البيانات مختلف خطوات معالجة اللغات الطبيعية تبعًا للموارد المستخدمة أو الأهداف المحددة للتحليل.

التحقق من صحة البيانات

التحقق من صحة البيانات هو عملية التأكد من جودة البيانات المستخرجة. وينطوي ذلك على تنفيذ استراتيجية تتحقق من دقة المعلومات المنتجة وصحتها من خلال الرجوع إلى مصادر أخرى. ويمكن لمختبر البيانات أن يصل إلى جميع نظم بيانات المنظمة للتحقق من القيم المنتجة على ضوء "المصادر الرسمية" الأحدث.

النمذجة الإحصائية

إن إضفاء الطابع الرسمي على ظاهرة معيّنة بطريقة حسابية يسمح بتحديد كيفية مساهمة مختلف المكوّنات في تحديد قيم هذه الظاهرة. ويمكن استخدام ذلك للحصول على القيم الخاصة بالظاهرة عندما لا تتوافر أية ملاحظات بشأنها. ويضع مختبر البيانات، انطلاقًا من البيانات المستخرجة وبالنظر أيضًا إلى مصادر أخرى، نماذج تنتج إحصاءات وصفية ومؤشرات مناسبة تكون مفيدة لدعم تحقيق الأهداف الرئيسية للمنظمة.