נועה היא עובדת חרוצה בחברה שלך, והיא עובדת בד"כ שעות רבות, במשרד או מהבית. אם נבחן את לוג הפעולות שלה, נראה שהיא מבצעת פעולות רבות במהלך ימי העבודה הרגילים, בשעות 9:00 עד 18:30 (כנראה שאז היא נוסעת הביתה), ובערב בין השעות 20:00 ל 22:30 (כנראה שאין לה חיים...). אבל פתאום, החל מלפני יומיים, מופיעות פעולות גם סביב 19:00 ולפעמים גם באמצע הלילה. במילים אחרות, לנועה יש שגרת עבודה יומית קבועה, ולפני יומיים החלו להופיע חריגות מהשגרה הזו. כבר אמרנו שלנועה אין חיים, ואולי היא החליטה לקחת את זה לקצה. יתכן גם שהיא בנסיעה לחו"ל מטעם החברה ולכן שעות העבודה שלה השתנו. אבל בירור מהיר עם נועה לימד שהיא עדיין (לצערה?) בארץ, ב 19:00 היא עדיין (לצערה!) תקועה עמוק בפקקים, ובלילה אפילו עובדת מורעלת שכמותה ישנה. נשמע חשוד. זו הייתה דוגמא פשוטה לתהליך שנקרא גילוי אנומליות, במקרה הזה ע"פ שעות הפעילות של העובד (ציר הזמן). התהליך לומד את שגרת העבודה של כל עובד מתוך המידע שנאסף בעבר (לוגים) וללא צורך בהנחיה או דוגמאות, הוא מסוגל להצביע על חריגות מהשגרה (כלומר אנומליות). לכתבה המלאה

יש עשרות אלגוריתמים לאישכול, ולכולם אותה מטרה – לחלק את פריטי המידע לקבוצות בעלות איברים דומים. למה זה טוב? כי פעמים רבות, בייחוד בעולם הביג דאטה, מרוב עצים לא רואים את היער. חלוקה לקבוצות מאפשרת לקבל תובנות חדשות מהנתונים מעצם חלוקתם לקבוצות. לדוגמא, אם נחפש בגוגל את המילה "ברק" נקבל תשובות רבות מאוד. אם נבצע אישכול על התשובות, הן יתחלקו לקבוצות בעלות מכנה משותף. למשל: מסמכים שעוסקים במזג אוויר, מסמכים שעוסקים בפוליטיקה (בגלל אהוד ברק), מסמכים הקשורים לעיר בני ברק, מסמכים שעוסקים בחוק ומשפט (בגלל השופט אהרון ברק), וכו'. עצם החלוקה לימדה אותנו יותר על המילה "ברק", וגם תאפשר לנו להתמקד מהר יותר במה שאנחנו מחפשים. לכתבה המלאה

המוטיבציה הבסיסית של השיטה היא למצוא אירועים שבד"כ מתרחשים ביחד. למה זה טוב? יש לכך מספר שימושים, המוכר ביותר מגיע מעולם המכירות. מי שקונה באינטרנט, נתקל כנראה יותר מפעם אחת במשפט "אנשים שקנו את... קנו גם...". כלומר, האתר מציע לך מוצרים נוספים שעשויים לעניין אותך על סמך המוצר שבחרת. איך הוא עושה את זה? בכל פעם שאנחנו קונים, בחנות אמיתית או וירטואלית, אנחנו ממלאים את הסל במוצרים ומשלמים עליהם בקופה. המוכר יכול להשתמש במידע של תכולת הסלים כדי ללמוד אילו מוצרים נרכשים בד"כ יחד. למשל, הרבה אנשים שקונים דיו למדפסת קונים גם נייר למדפסת. לכן כדאי להציע למי שקונה דיו לקנות גם נייר. נשמע הגיוני לא? לכתבה המלאה