מה מאפיין מומחה ביג-דאטה ומה מצופה ממנו או ממנה לדעת. ובכן, בראש ובראשונה הוא צריך לאהוב נתונים. בעוד מרבית בני האנוש נרתעים מנתונים כמו מאש, הוא דווקא נמשך אליהם כפרפר לאש. בכל פעם שמאגר נתונים מענין יקרה בדרכו, למשל תוצאות הבחירות האחרונות, הוא ישמח לנתח אותו ולהפיק תובנות. מומחה יתחיל כל מחקר ביג-דאטה במספר פעולות בסיסיות על הנתונים כדי להעריך את איכותם ומה ניתן להפיק מהם. מקצוען אמיתי לעולם לא יסתפק בכך וגם ישקיע זמן להבין את תחום העיסוק הרלוונטי לנתונים. עבודה עם נתונים מבלי להבין מהיכן הגיעו ומה המשמעות שלהם, משולה בעיני לבהייה בספר בישול שכתוב בסינית. אפשר להתרשם מיופי האותיות ואולי מהתמונות (אם יש כאלו). אבל אם אתה לא מבין סינית, אל תזמין אותי לאכול מתכונים שבשלת ממנו. לכתבה המלאה

דוגמה פשוטה זו ממחישה שלא כדאי להסתפק רק בתכונות המידיות שקל מאוד לחשוב עליהן, אלא תמיד מומלץ לחשוב על תכונות נוספות שעשויות לסייע. מומחה ביג-דאטה מנוסה ישאף להתחיל עם הרבה מאוד תכונות. יש שיטות טובות, כחלק מתהליך הלמידה, לצמצם ולהתמקד רק בתכונות שמסייעות למטרה. בד"כ אפשר גם ליצור תכונות חדשות על ידי כל מיני חישובים ותרגילים אחרים, שקצרה כאן היריעה מלהסביר. יש גם שיטות ביג-דאטה, למשל מלכת הכיתה החדשה שנקראת "למידה עמוקה", שמסוגלות להצביע לבד על תכונות שימושיות. גם כאן הדברים יותר מורכבים לכתבה המלאה

נשאלתי מספר פעמים כיצד נכון להתניע ולנהל פרויקט ביג-דאטה. מגוון האפשרויות השונות גדול, אין מתכון אחיד, אבל אנסה לתת קווים מנחים להתנהלות נכונה עם מומחי הביג-דאטה (להלן המומחה). ראשית, צריך להגדיר את מטרות הפרויקט. שיחה ראשונה עם המומחה צריכה לנתח את האפשרויות השונות ולדון האם הנתונים שקיימים (לפחות לפי דעתך) אכן עשויים לסייע להשגת המטרות. אם בשלב הזה המומחה רק מהנהן ולא שואל אותך שאלות קשות, כנראה שכדאי לעבור למומחה הבא. ואם כבר בשלב הזה הוא מבטיח ש"יהיה בסדר" ושכל המטרות יושגו, כדאי לסכם מראש על מחיר שיותנה בהצלחה (מדידה!). תוצאות כנראה לא תקבלי, אבל לפחות לא תצטרכי לשלם על זה. לכתבה המלאה