ورشة عمل علم البيانات

السلام عليكم ومرحبا بكم في ورشة العمل المقامة بالتعاون مع المجموعة السعودية للبيانات بعنوان

تحليل الآراء الاجتماعية على منصات التواصل الاجتماعي:

قيادة المرأة للسيارة كحالة اجتماعية

والتي اقيمت بتاريخ 21/1/2019-22 في قاعة المؤتمرات في مدينة الملك عبدالعزيز للعلوم والتقنية في الرياض

*جميع ما تمت مشاركته هنا في الدورة من اكواد لا يحتوي على حقوق فهو للمنفعة العامة، ما عدى البيانات التي تمت مشاركتها، اتمنى من هم بصدد استخدامها التواصل معي على ايميلي وذكر المصدر بناء على ماتنصه شروط تويتر. واذا كان تحليل البيانات سيتم نشره في احد الاوراق العلمية الرجاء الاستشهاد بهذا البحث :

Addawood, A., Alshamrani, A., Alqahtani, A., Diesner, J. & Broniatowski, D. (2018). Women's Driving in Saudi Arabia – Analyzing the Discussion of a Controversial Topic on Twitter. In International Conference on Social Computing, Behavioral-Cultural Modeling & Prediction and Behavior Representation in Modeling and Simulation (SBP-BRiMS 2018). Washington, DC. Link

اذا لم تقم بتحميل البياثون والادوات المصاحبة. فبإمكانك اتباع الخطوات التالية لعمل ذلك

يمكنك ايضاً مشاهدة هذا الفيديو لمعرفة طريقة التحميل

اولاً: نحتاج لتحميل ادوات البايثون

ما هو Jupyter Notebook؟

تطبيق ويب مفتوح المصدر يتيح لك إنشاء ومشاركة المستندات التي تحتوي على رموز حية ومعادلات ومرئيات ونصوص سرديّة.


إن أسهل طريقة لتثبيت تطبيق Jupyter Notebook هي تثبيت توزيع python علمي يتضمن أيضًا حزم python علمية. يسمى التوزيع الأكثر شيوعًا Anaconda. للتحميل (قم بتحميل النسخة 3.7)

اذا كان لديك Python3 يمكنك تحميل Jupyter عن طريق التالي:

python3 -m pip install --upgrade pip
python3 -m pip install jupyter

عند اكتمال تحميل Jupyter يمكنك الان الذهاب الى الخطوة التالية.

ثانياً: انشاء ملف ليحتوي على جميع ملفات الورشة

قم بإنشاء مجلد في سطح المكتب الخاص بك. ثم قم بتسميته DSTutorial، او اي اسم تفضله.

ثالثاً: تشغيل Jupyter Notebook

في الterminal قم بكتابة:

cd /desktop/DSTutorial
jupyter notebook

فوالا!

سيفتح معك المتصفح نافذة متصفح جديدة (أو علامة تبويب جديدة) تعرض لوحة تحكم تسمح (من بين أشياء أخرى) بتحديد دفتر الملاحظات المطلوب فتحه والذي يمكنك من خلاله انشاء صفحات خاصة بالاكواد.

رابعاً: تحميل المكتبات المطلوبة

في نافذة المتصفح الجديدة ومن القائمة على اليسار (New)، قم بانشاء ملف بايثون جديد. سيقوم ذلك بانشاء صفحة جديدة فارغه ومن خلالها يمكنك كتابة الاكواد الخاصة بك وتشغليها مباشرة في المتصفح.

لتحميل المكتبات المطلوبة قم بقص ولصق الكود التالي في الصفحة الفارغة ومن ثم تشغيل الصفحة للتحميل.

# Install a pip package in the current Jupyter kernel
import sys
!{sys.executable} -m pip install numpy
!{sys.executable} -m pip install nltk
!{sys.executable} -m pip install pandas
!{sys.executable} -m pip install matplotlib
!{sys.executable} -m pip install sklearn

انت الآن جاهز !

اليوم الأول

جدول ورشة العمل سيتضمن التالي

  1. مقدمة عن علم البيانات
  2. كيف تصبح عالم بيانات
  3. إعداد بيئة العمل
  4. استراحة لمدة 10 دقائق
  5. دورة علوم البيانات:
    • جمع البيانات
    • استراحة لمدة 10 دقائق
    • تصنيف البيانات
  6. اخر 30 دقيقة للأسئلة

أرجو منكم تحميل هذه الملفات قبل الحضور لورشة العمل

ملف الاكواد:

  • محتوى الدورة. (الرابط)
  • جمع الداتا من تويتر. (الرابط)
    • هذا الملف يحتوى على طريقة تحميل البيانات من تويتر، و لإمكانية عمل ذلك يتطلب منكم الحصول على معلومات الدخول لAPI. ويمكنكم عمل ذلك من خلال هذا الموقع.

ملف البيانات:

  • بناء على ما تنصه اتفاقية الاستخدام في منصة تويتر فإنه لا يمكن مشاركة البيانات في الانترنت كاملة. لذلك قمت بمشاركة الروابط لكل تغريدة ويمكن استرجاع كامل النص من خلال Twitter API. (الرابط للبيانات).

اليوم الثاني

جدول ورشة العمل سيتضمن التالي

  1. مراجعة لما سبق
  2. اعداد بيئة العمل
  3. دورة علوم البيانات:
    • استكشاف البيانات
    • تنظيف البيانات
    • استراحة لمدة 10 دقائق
    • بناء نماذج تصنيف باستخدام تعلم الآلة
    • تصوير البيانات
  4. اخر 30 دقيقة للأسئلة

أرجو منكم تحميل هذه الملفات قبل الحضور لورشة العمل

ملف الاكواد:

  • محتوى الورشة (الرابط)
  • ملف البيانات سيتم مشاركته وقت الورشه


لتصوير البيانات تحتاج الى انشاء حساب في موقع plotly

مصادر اخرى

  • Pandas Cheat Sheet for Data Science in Python. (link)


تقييم الورشة

نشكر لكم مشاركتكم بالورشة ونرجو منكم تقييمها عن طريق الرابط التالي.