انضم إلينا
اغلاق
الوظيفة الأكثر جاذبية في عصرنا.. أين يمكن أن تدرس "علوم البيانات"؟

الوظيفة الأكثر جاذبية في عصرنا.. أين يمكن أن تدرس "علوم البيانات"؟

هالة أبو لبدة

محررة تعليم وجامعات
  • ض
  • ض

"البيانات هي النفط الحديث، ومن المهم أن تتوفر لدينا القدرة على استخراج هذا النفط وتكريره وتحويله من صورته الخام إلى شيء يفيد المستهلك"

(ديفيد بوكينغام)(1)

  

يعد "علم البيانات" (Data science) أحد أهم العلوم الحديثة في هذا العصر، والوظيفة في هذا المجال باتت الأكثر جاذبية في عصرنا، ورقم واحد في دول كالولايات المتحدة(2)، بل يتوقع أن يرتفع عدد الوظائف المتاحة لها إلى أكثر من 4 ملايين وظيفة في الولايات المتحدة فقط. وبحسب دراسة حديثة فإن عددا كبيرا من برامج علوم الحاسوب لا تؤهل الطلبة للعمل في هذا المجال (3)، وهنا يأتي دور المبادرات والمساقات التعليمية التي تقدمها الشركات ومؤسسات التعليم العالي في مختلف أنحاء العالم، في هذا التقرير سنسلط الضوء على مجموعة منها.

    

برنامج مايكروسوفت لتتعلّم علم البيانات

تقدم شركة مايكروسوفت الشهيرة برنامجا مهنيا متخصصا في علم البيانات، يتضمن عشرة مساقات إلكترونية مقدمة عبر منصة "edX" يُدرّسها مجموعة من الخبراء والأساتذة الأكاديميين المتخصصين، ويهدف إلى تطوير مهارات محددة لطلبته لتمكينهم من العمل في هذا المجال، أبرز ما يميز هذه المساقات هو توفرها بشكل مجاني عبر المنصة، أي إنها متاحة لكافة الأشخاص الذين تتوفر لديهم متطلبات دراسة هذا البرنامج، كما أن الملتحقين بالبرنامج يمكنهم الحصول على شهادة معتمدة من الشركة لدى إكمالهم أيًّا من المساقات المدرجة ضمن خطة البرنامج أو بعد انتهائهم منه، لكنهم سيدفعون مقابل الحصول عليها، وسنستعرض هنا هذه المجموعة.

    

    

مقدمة في علم البيانات

هذا هو أول المساقات في البرنامج المهني، وهو مساق تمهيدي يؤسس لدى الطلبة معرفة بعلم البيانات وتحديدا فيما يتعلق بالعمل مع البيانات في إكسل، واسكتشافها، وتصوير البيانات في إكسل، ثم ينتقل بهم إلى موضوعات مهمة في الإحصاء كالنزعة المركزية والتباين وتحليل الانحدار، ويتعرف الطالب أيضا على قصص مجموعة من علماء البيانات ودوافعهم لاختيار هذا المجال، ويُقدّم المساق على مدار ستة أسابيع، بواقع ساعتين إلى أربع ساعات تعلّم أسبوعية. للالتحاق بالمساق من هنا.

  

الاستعلام عن البيانات

المساق الثاني في المجموعة، ويركز على الاستعلام عن البيانات باستخدام لغة البرمجة "إس كيو إل" (SQL)، ويتعرف الطالب خلال المساق على أنواع البيانات، وكيفية استخدام لغة البرمجة "تي- سكيول" (Transact SQL) وإنشاء استعلامات بواسطتها، وبناء جداول الاستعلامات، واستخدام الوظائف وتجميع البيانات، وتنظيم وتعديل البيانات، وكيفية التعرف على رسائل الأخطاء ومعالجتها، يمتد المساق لنحو ستة أسابيع، ويحتاج أربع إلى خمس ساعات أسبوعيا. هنا.

  

تحليل وتصوير البيانات

ثالث مساقات المجموعة، ويعد جزءا من مساقات برنامج آخر مقدم من مايكروسوفت أيضا حول البيانات الضخمة (Big Data)، وهو مقدم بمسارين لكلٍّ منهما مساق خاص، أي إن الطالب أمام خيارين لدراسة تحليل وتصوير البيانات، وهما: مسار تحليل وتصوير البيانات باستخدام إكسل، حيث سيتعلّم كيفية استيراد البينات من قواعد البيانات والملفات المتعددة، وتحويل البيانات، وكيفية نمذجتها، وطرق استكشافها وتحليلها وتصويرها باستخدام إكسل، وسيتعرف على نسخة إكسل التي يجب التعامل معها، وبعض التعليمات المتعلقة بالتعامل مع البرنامج، إضافة إلى بعض الأدوات مثل: تعبيرات تحليل البيانات (DAX)، ويتطلب هذا المسار الدراسة لنحو ساعتين إلى أربع ساعات أسبوعيا لمدة ستة أسابيع، أما المسار الثاني فهو تحليل وتصوير البيانات باستخدام "باور بي آي" (Power BI حيث يتعلّم الطالب كيف يستخدم البرنامج في استيراد البيانات من قواعد البيانات، وتحويل البيانات، وبناء الاستعلامات، وتغيير أنواع البيانات، واستخدام البرنامج في إدارة البينات ونمذجتها، وتحليلها وتصويرها باستخدام أدوات مختلفة، ويتطلب ستة أسابيع لدراسته بمعدل ثلاث ساعات لكل أسبوع.

    

    

الإحصاء الأساسية لتحليل البيانات باستخدام إكسل

هذا هو رابع مساقات المجموعة، ويركز على تعليم الطلبة بعض موضوعات الإحصاء المتعلقة بتحليل البينات كالإحصاء الوصفي، والمتغيرات العشوائية، ونظرية الاحتمالات، والعينات ومجالات الثقة، واختبار الفرضيات الإحصائية، إضافة إلى تزويدهم بمصادر للقراءة، وعمل مناقشات حول الموضوعات المدروسة، ومدة هذا المساق ستة أسابيع كالمساقات السابقة، ويحتاج إلى ساعتين إلى أربع ساعات دراسة أسبوعية. هنا.

  

استكشاف البيانات باستخدام الشيفرة

سيتعلّم الطالب في خامس مساقات المجموعة كيفية استكشاف البيانات باستخدام الشيفرة، وهو هنا أمام خيارين أيضا تماما كما في المساق الثالث، وعليه أن يختار إما أن يدرس استكشاف البيانات باستخدام لغة البرمجة "آر" (R)، وفي هذه الحالة عليه الالتحاق بمساق "مقدمة في لغة آر لعلم البينات"، وهو مساق مدته أربعة أسابيع ويتطلب ثلاث ساعات تعلّم أسبوعية، وسيتعلّم خلاله أساسيات لغة "آر" وكيفية استخدامها في تحليل البيانات وتصويرها، وإذا لم يرغب في تعلّم لغة "آر" فيمكنه اختيار تعلّم لغة البرمجة "بايثون" (Python)، فيمكنه اختيار المساق الثاني وهو "مقدمة في لغة بايثون لعلم البيانات" ومدته ستة أسابيع، وسيتدرب الشخص في هذا المساق على أساسيات لغة بايثون، وكيفية إنشاء قوائم بايثون، واستخدام الوظائف، ولغة "نمباي" (Numpy) وكيفية إنشاء مصفوفات نمباي، وتصوير البيانات باستخدام لغة بايثون.

  

فهم المفاهيم الأساسية في علم البيانات

سيصل الطالب في هذا المساق وهو السادس ضمن المجموعة إلى مرحلة استكشاف عمليات علوم البيانات، وتطبيق نظرية الاحتمالات والإحصاء في علم البيانات، والمفاهيم المهمة في اكتساب البيانات، وتحضيرها، واستكشافها وتصويرها، مع دراسة نماذج عملية تطبيقية ككيفية بناء البيانات السحابية باستخدام إحدى لغات البرمجة التي تعلّمها أو أدوات أخرى، وسيدرس موضوعات حول التعلّم الذاتي للآلة مثل: التصنيفات وتقييم نماذج الانحدار، والتحليل العنقودي، وسيحتاج الطالب إلى ستة أسابيع لدراسة المساق، بواقع ثلاث إلى أربع ساعات أسبوعيا. هنا.

    

    

فهم التعلّم الذاتي للآلة

سيدرس الطلبة هذا المساق على مدار ستة أسابيع ولمدة ثلاث إلى أربع ساعات يوميا، وهو السابع في المجموعة، وسيتعلّم الطلبة فيه نظرية التعلّم العميق وسيتدرّبون على تطبيقها عمليا في بناء نماذج تعلّم ذاتي للآلة، وسيتدرّبون أيضا على كيفية استخدام لغة البرمجة "آر" وبايثون وخدمة "آزور" (Azure) في موضع تعلّم الآلة، وتشمل الموضوعات التي سيتناولها المساق التصنيفات، والانحدار ونماذجه والانحدار اللوجيستي، وأسس تطوير نماذج التعلّم الذاتي للآلة، والتحليل العنقودي، وأنظمة التوصية، وأشجار القرار ونماذجها. هنا

  

استخدام الشيفرة (الكود) لنمذجة البيانات

سيركّز المساق الثامن على استخدام البرمجة في نمذجة البيانات، ويتوفر لدى الطلبة خياران لدراسة ذلك بحسب اللغة التي يُفضّلونها، فإما أن يختار الطالب مساق "البرمجة بلغة آر لعلوم البيانات"، وسيتعلّم خلال فترة الدراسة وهي أربع إلى ثماني ساعات أسبوعيا ولمدة ستة أسابيع، أساسيات لغة "آر"، وكيفية بناء الوظائف واستخدام تدفق السيطرة، وسيتدرّب على قراءة وكتابة البيانات المستخرجة باستخدام هذه اللغة، إضافة إلى استخدام اللغة في تحليل البيانات وتصويرها، أو يمكنه اختيار مساق "البرمجة بلغة بايثون لعلوم البيانات"، الذي يتطلب مدة أطول لدراسته وهي ثماني إلى تسع ساعات أسبوعيا لمدة ستة أسابيع، حيث سيتعرف الطالب على أنواع التحديات التي تواجه التعلّم الذاتي للآلة، وكيفية إعادة عرض البيانات بطريقة تُمكّن من اشتقاق المعلومات المهمة، كما سيتدرّب على التقنيات المستخدمة لتصوير البيانات، وتطبيق الخوارزميات والمفاهيم المهمة كاختيار النموذج للتطبيق على النماذج الواقعية.

    

   

علم البيانات التطبيقي

يُترك المجال للطالب لاختيار آخر مساقات المجموعة على أن يكون متخصصا في علم البيانات التطبيقي، ولديه قائمة بثلاثة مساقات اختيارية، المساق الأول "التعلّم الذاتي للآلة التطبيقي"، ومدته ستة أسابيع بواقع ثلاث إلى أربع ساعات تعلّم أسبوعيا، وسيتعلّم الطالب في هذا المساق تطبيقات البيانات المتخصصة، مع التركيز على البيانات غير المهيكلة، وسيتدرّب على مراجعة تحليل الصور، وتحليلات النصوص، واستخدام لغات البرمجة وخدمة آزور لإيجاد حلول للمشكلات الصعبة التي تواجه علوم البيانات.

  

أما المساق الثاني فهو "تطبيق التحليلات التنبؤية باستخدام سبارك"، يتطلب ثلاث إلى أربع ساعات أسبوعيا لمدة ستة أسابيع، حيث سيتعلّم الطالب كيفية استخدام برنامج سبارك لاستكشاف البيانات، وبناء نماذج تعلّم ذاتي للآلة وتقييمها وتحسينها، وبناء نماذج تعلّم ذاتي للآلة غير خاضعة للرقابة، لكن المساق الثالث "تحليل البيانات الضخمة باستخدام مايكروسوفت آر" يركز على تعليم الطلبة كيفية استخدام خادم آر من مايكروسوفت (Microsoft R Server) لتطبيق لغة آر في تحليل قواعد البيانات الضخمة، وسيتدرّب الطالب على كيفية قراءة البيانات وتخزينها وتحويلها وتطبيق الإحصاء في تصوير البيانات وكتابة الوظائف، وبناء نماذج تنبؤية وتقييمها، وهو مساق أقصر من المساقين السابقين فمدته أربعة أسابيع ويتطلب ساعتين إلى أربع ساعات أسبوعيا.

  

المشروع النهائي

تُختتم المجموعة بمساق عملي (كابستون) يشبه مشروع التخرج، ومدته أربعة أسابيع ويتطلب ثلاث إلى أربع ساعات أسبوعيا، يعتمد على إنهاء الطالب لكافة المساقات السابقة، وسيفرض عليهم تطبيق ما تعلّموه في حل إحدى المشكلات الواقعية التي يواجهها علم البيانات في مشاريعهم، أي إنه مساق للمستوى المتقدم، وسيتاح للطلبة بعده الحصول على شهادة من مايكروسوفت بإكمال البرنامج.

     

    

المسار التعليمي الشامل لتصبح خبير بيانات في 2018

بدأ موقع "أنلاتيكس فيديا" (Analytics Vidhya) عام 2016 بتخصيص مسار كامل لتعليم علم البيانات، وحصل المسار على زيارة ربع مليون شخص، وزاد هذا العدد إلى الضعف في مساره الذي قدمه عام 2017 للتخصص نفسه4، ويستمر الموقع في تقديم هذا المسار مع إضفاء بعض التحسينات والتعديلات لجعله أكثر ملاءمة وفعالية للملتحقين به، يتسم المساق بالتسلسل والشمولية وبجدول زمني مرن يمتد على مدار عام كامل لينتقل بك إلى منطقة متقدمة في علم البيانات وبمساعدة أدوات ومصادر تعليمية متنوعة، ولن تتعلّم بمفردك، فهناك مجتمع كبير بانتظارك، حيث يتبادل فيه المهتمون والطلبة والمتخصصون آراءهم ويشاركون تجاربهم ويبحثون عن إجاباتهم فيما يتعلق بعلم البيانات.

  

ولن يتوقف الأمر على مجرد التعلّم، ففي نهاية المساق وتحديدا خلال الشهرين الأخيرين ستكون مؤهلا للبحث عن وظيفة وصنع نموذج ملف شخصي يساعدك في تحقيق ذلك. إذا كنت تفكر الآن ما إذا كنت ستتمكّن من دفع تكلفة المساق فهذا الأمر ليس مهما، لأن المساق مفتوح للجميع مجانا، وكل ما عليك فعله هو الاشتراك في الموقع هنا ومتابعة الدروس التي ستنشر تباعا على مدار أشهر السنة.

  

يعتمد المسار التعليمي للمساق على استخدام لغة بايثون، ويتطلب أن تتوفر لدى الطالب معرفة بالرياضيات وعلوم الحاسوب، ولا يشترط معرفة سابقة لعلم البيانات فهو مُقدَّم للمبتدئين فيه، ويبدأ بتوضيح مفهوم علم البيانات وأهميته الحالية وطبيعة عمل علماء البيانات، وسبب استخدام لغة بايثون هنا، سيتعلّم الطالب حول الإحصاء الوصفي والاستنتاجي وبرنامج "Pandas" وكيفية تصوير البيانات، سينتقل بعد ذلك لتعلّم أسس التعلّم الذاتي للآلة وإلى جانب ذلك سيتدرب على نظرية الاحتمال وعلى هندسة الميزة (Feature Engineering) مما يؤهله لدخول فعاليات الهاكاثون(5).

     

  

وبعد أن يصبح الطالب قادرا على بناء نماذج البيانات، عليه أن يتدرب على كيفية عرضها للجمهور غير المتخصص في التكنولوجيا، الأمر مرتبط بشخصيته ومهاراته في عرض ما لديه معلومات وهذا سيؤهّله للتميز في عرض أفكاره في كافة المنافسات التي سيود الانضمام إليها، وللبحث عن تدريب عملي (Internship) لدى إحدى الشركات المتخصصة، سينتقل الطالب إلى تعلّم موضوعات متعمقة في التعلّم الآلي وسيتدرّب على نمذجة السلاسل الزمنية، وسيتدرّب بشكل عملي على كيفية التعامل مع البيانات غير المهيكلة(6).

    

بعد ذلك يبدأ الطالب بتعلّم التعلّم العميق، أحد أهم موضوعات علم البيانات، وسيطبّق ما تعلّمه بشكل عملي لتوظيف مهاراته في حل أيٍّ من المشكلات التي تواجه الشبكات العصبونية الاصطناعية (Artificial Neural Network)، ثم ستبدأ مرحلة جديدة في هذا المسار، ففي المرحلة التالية سيتدرب الطالب على تطبيق كافة ما تعلّمه سابقا، وسيتعرف على موضوعات جديدة كطرق التوصية والتعليم المعزز (Reinforced Learning)، أما الشهران الأخيران فهما محطة الانطلاق نحو الحصول على وظيفة، سيستفيد الطالب من التزامه بالخطة وممارسة التدرب على ما تعلّمه، ومن منصة النقاشات المتاحة حيث يمكنه أن يطرح أسئلته وسيجد العديد من الإجابات المفيدة(7).

   

نختم هنا بمجموعة من الموضوعات والمسارات التعليمية التي يقدمها الموقع والتي ستفيدك إذا رغبت في معرفة وتعلّم المزيد حول علم البيانات:

المسار الشامل لتعلّم علم البيانات باستخدام بايثون.

مسار تعلّم "Qlikview" من البداية وحتى الاحتراف.

دليلك لتصبح خبيرا في أداة تابلو (Tableau).

خطوة بخطوة لتتعلّم "Tableau" المتقدم للعاملين في علم البيانات وذكاء الأعمال.

تقارير متصدرة


آخر الأخبار