×
يُعد عِلم البيانات مهمًا لأنه يجمع بين الأدوات والأساليب والتكنولوجيا للوصول إلى معلومات ذات مغزى من خلال البيانات. وتتوفر البيانات بوفرة كبيرة لدى المنظمات الحديثة، وتنتشر الأجهزة التي يمكنها جمع المعلومات وتخزينها تلقائيًا. تجمع الأنظمة وبوابات الدفع عبر الإنترنت كمًا أكبر من البيانات في مجالات التجارة الإلكترونية والطب والمال وكل أوجه الحياة البشرية الأخرى. تتوفر لدينا بيانات من النصوص والأصوات ومقاطع الفيديو والصور بكميات هائلة.  

في حين أن مصطلح عِلم البيانات ليس جديدًا، فإن المعاني والدلالات حوله شهدت تغيرات بمرور الوقت. ظهرت هذه الكلمة لأول مرة في الستينيات باعتبارها اسمًا بديلاً للإحصاء. وفي أواخر التسعينيات، وضع المتخصصون في عِلم الحاسوب صياغة لهذا المصطلح. وأشار تعريف مقترح إلى عِلم البيانات بأنه مجال منفصل ذو ثلاثة أوجه: تصميم البيانات وجمعها وتحليلها. واستغرق الأمر عقدًا آخر من الزمان ليُستخدم هذا المصطلح خارج الأوساط الأكاديمية.

يُستخدم عِلم البيانات لدراسة البيانات بأربع طرق رئيسة:

1. التحليل الوصفي

يفحص التحليل الوصفي البيانات من أجل اكتساب رؤى حول ما حدث وما يحدث في بيئة البيانات. وهو يتصف بمؤثرات عرض بيانات، مثل المخططات الدائرية أو المخططات الشريطية أو المخططات الخطية أو الجداول أو الأشكال السردية الوصفية المنشئة. فمثلاً، تستطيع شركة حجز تذاكر الطيران تسجيل بيانات مثل عدد التذاكر المحجوزة كل يوم. وسيكشف التحليل الوصفي أوقات ذروة الحجز، وأوقات ركود الحجز والأشهر عالية الأداء لهذه الخدمة.

2. التحليل التشخيصي

التحليل التشخيصي هو فحص بيانات عميق ومفصل الهدف منه فهم سبب حدوث أمر ما. وهو يتصف بتقنيات مثل التعمّق واستكشاف البيانات وتنقيب البيانات والارتباطات. يمكن إجراء عدد من عمليات البيانات وتحويلاتها على مجموعة بيانات معينة لاستكشاف أنماط فريدة في كل من هذه التقنيات. فمثلاً، تستطيع خدمة حجز تذاكر الطيران استخدام تقنية التعمّق على شهر عالي الأداء تحديدًا لفهم أوقات ذروة الحجز. وقد يؤدي ذلك إلى اكتشاف أن العديد من العملاء يزورون مدينة معينة لحضور حدث رياضي شهري.

3. التحليل التنبئي

يستخدم التحليل التنبئي البيانات السابقة لإنشاء توقعات دقيقة حول أنماط البيانات التي قد تحدث في المستقبل. وهو يتصف بتقنيات مثل التعلم الآلي والتوقع ومطابقة الأنماط وبناء النماذج التنبئية. وفي كل من هذه التقنيات، يتم تدريب الحواسيب لعكس هندسة العلاقات السببية في البيانات. فمثلاً، يمكن أن يستخدم فريق شركة حجز تذاكر الطيران عِلم البيانات للتنبؤ بأنماط حجز الرحلات للعام الجديد في بداية كل عام. يمكن أن يفحص برنامج الحاسوب أو اللوغاريتم البيانات السابقة والتنبؤ بأوقات ذروة الحجز لوجهات معينة في شهر مايو. ومع توقع متطلبات السفر المستقبلية لعملاء الشركة، تستطيع البدء في عرض إعلانات موجهة لتلك المدن بداية من فبراير.

4. التحليل التوجيهي

ترتقي التحليلات التوجيهية بالبيانات التنبئية إلى المستوى التالي. وهو لا يتنبأ بالأمر محتمل الحدوث فحسب، بل يقترح أيضًا استجابة مثلى لهذه النتيجة المتوقعة. ويستطيع التحليل التوجيهي تحليل الآثار المحتملة للاختيارات المختلفة والتوصية بأفضل مسار عمل. وبإمكانه استخدام التحليل الرسومي والمحاكاة ومعالجة الأحداث المعقدة والشبكات العصبونية ومحركات التوصيات من التعلم الآلي.  

يستطيع عالِم البيانات استخدام مجموعة متنوعة من التقنيات والأدوات والتكنولوجيات باعتبارها جزءًا من عملية عِلم البيانات. واستنادًا إلى المشكلة، يختار عالِم البيانات أفضل مجموعات مركبة من العناصر للحصول على نتائج أكثر دقة بصورة أسرع.

يختلف الدور الوظيفي والعمل اليومي لعالِم البيانات حسب حجم المنظمة ومتطلباتها. على الرغم من أنه يتبع عملية عِلم البيانات، فإن التفاصيل ربما تكون مختلفة. في الفرق الكبيرة المعنية بعِلم البيانات، يمكن أن يعمل عالِم البيانات مع غيره من المحللين والمهندسين وخبراء التعلم الآلي والإحصائيين لضمان اتباع عملية عِلم البيانات بشكل متكامل وتحقيق أهداف الأعمال. 

أما في الفرق الصغيرة، فقد يؤدي عالِم البيانات أكثر من دور. قد يؤدي عالِم البيانات أدوارًا وظيفية متعددة أو أدوارًا وظيفية متداخلة، ويعتمد ذلك على ما لديه من خبرة ومهارات وخلفية تعليمية. وفي هذه الحالة، ربما تتضمن مسؤولياته اليومية الهندسة والتحليل والتعلم الآلي إلى جانب منهجيات عِلم البيانات الأساسية.