מה לגבי סקרים ואיסוף טרנדים מהאינטרנט? גם שני אלו עמוסים בעיות כרימון. למתעניינים, קל למצוא כתבות של אנשי מקצוע שמסבירים היטב מדוע הסקרים של הבחירות הן הבל. אני אסתפק בהצבעה על מספר בעיות שורש. קושי מרכזי בסקרי בחירות הוא היכולת לפלח את האוכלוסייה המאוד הטרוגנית של מדינת ישראל. זהו תנאי הכרחי כדי לבנות מדגם של נסקרים שייצג נאמנה את כל גווני הציבור. מדובר במשימה קשה עד בלתי אפשרית. אם בעבר ניתן היה לבצע ניחוש "מושכל" של אופי אוכלוסייה לפי כתובות מגורים בספר הטלפונים של בזק, היום כידוע זה ממש לא רלוונטי. בנוסף, קיימות אוכלוסיות שאינן מוכנות לשתף פעולה עם סקרים מלכתחילה, בעוד נסקרים רבים (מאוד) סתם מסרבים לענות. וגם אלו שכבר עונים, לפעמים עונים "לא יודע" או משקרים. לכתבה המלאה

חלומו הרטוב של כל מפרסם הוא לפלח את האוכלוסייה ולהתאים את המסר השיווקי לכל קהל. המידע הרב ברשתות החברתיות שאנשים מוסרים על עצמם מרצון, מגשים היטב את החלום הזה. כל עוד נמשיך להנות משירותים חינמיים, אנחנו והנתונים שלנו נהיה מוצרים של החברות שמחזיקות בנתונים האלו. יהיו אנשים שינצלו אותם כדי למכור לנו מוצרים ושירותים. אחרים יפעילו שיטות ביג-דאטה כדי לזהות את הקהל שהם רוצים להשפיע עליו פוליטית. לגיטימי? נשאיר את הדיון לפורום אחר. לכתבה המלאה

מהי סדרה עתית? רצף של אירועים מסודרים שקורים בזה אחר זה, כשמניחים שקיימת תלות כלשהוא בין האירועים האלו. יש הרבה מאוד דוגמאות לסדרות עיתיות, למשל שערי מניות בבורסה, תצפיות של מזג אוויר או נתוני בקרה של מכונות תעשייתיות. אפשר לנסות להפעיל שיטות שונות על סדרות עתיות. למשל, לנסות לזהות שגרה וחריגות משגרה, כפי שהמחשתי בנושא הגנת סייבר. לחילופין, לנסות לחזות מה האירוע הבא בסדרה, למשל הצפיות הבאות שלכם בנטפליקס, וקיימות עוד שיטות ויישומים רבים. לכאורה, ניתן להשתמש בשיטות כאלו כדי לחזות את תוצאות הבחירות הקרבות. אבל כפי שנאמר בפוסט הראשון, רק לכאורה. לכתבה המלאה