מבוא למדעי הנתונים

מר איגור קליינר

3-5.07.2022

10:00-13:00

היום קיימת כמות אדירה של דאטה מסוגים שונים. היכולת לדבר עם נתונים היא מיומנות נחוצה וחשובה גם לחוקרים וסטודנטים וגם לאנשי תעשיה. לפי תחזיות ב-5 שנים הקרובות יהיה מחסור במדעני הנתונים.

בסדנה המשתתפים ילמדו "לדבר עם נתונים" בעזרת מערכת חדשה Orange data mining. המערכת בנויה בצורה המאפשרת לאנשים ללא ידע בתחום, להתחיל לעבוד ולחקור את הדאטה החל מהשיעור הראשון, וללא צורך בתכנות.

עיקרה של הסדנה הוא בפתרון משותף של בעיות מעניינות וחשובות תחומים שונים: ביולוגיה, משפט, ספורט, בורסה, בתי סוהר, אתרי הכרויות, אסון מעבורת החלל צ'לנג'ר. בנוסף המשתתפים יוכלו להשתמש בדאטה סטים שלהם לצורך תרגול.

הסדנה מבוססת באופן חלקי על הקורסים: מבוא למדעי הנתונים, מבוא לחקר ביצועים וחיזוי ועל קורס מערכות לומדות, הנלמדים באוניברסיטת חיפה.

קהל יעד: סגל החוקרים והסטודנטים לתואר שלישי עם מוטיבציה להיכנס לעולם המדעי הנתונים.

שימוש במחשבים: על כל משתתף להצטייד במחשב נייד עם תוכנת Orange

הסדנה תעובר דרך ZOOM. כדאי גם להתקין תוכנה AI.LOBE

בסוף הסדנה המשתתפים יוכלו "לדבר עם DATA", להכין DATA, לעבד DATA, לבחור מודל למידה מתאים, להעריך איכות המודל בסוף התהליך ולדעת האם ומתי צריך לפנות למדעי הנתונים.

תוכן עניינים:

1. היכרות עם עולם מדעי הנתונים.

2. עבודה עם תוכנת Orange.

3. סוגים של נתונים, הצגה גרפית של נתונים ומדדים חשובים.

4. תהליך העבודה של מדעי נתונים CRISP DM.

5. עיבוד מקדים של נתונים.

6. שיטות ניבוי: רגרסיה וקלסיפיקציה.

7. קלסטרינג.

8. בדיקת איכות של מודל.

9. עקרונות עבודה של מדעי נתונים, טעויות ומלכודות נפוצות.

10. עבודה עם דאטה טקסטואלי

11. עבודה עם תמונות

דאטה של הסדנה:

1. חיזוי מחיר עתידי של יין מבוסס על מחקר של Orley Ashenfelter.

2. אסון מעבורת החלל צ'לנג'ר.

3. רפואה: Framingham study .

4. ספורט: Moneyball.

5. אתר הכרויות: EHarmony .

6. גילוי סרטן.