#חלק שני
מה גיליתי כשביקשתי גם מ-Gemini 2.0 DeepResearch, לנתח ולסכם את אותו נושא שנתתי ל-Perplexity Pro Deep Research, GPT-4 Deep Research ו-Grok-3?
#חלק שני
מה גיליתי כשביקשתי גם מ-Gemini 2.0 DeepResearch, לנתח ולסכם את אותו נושא שנתתי ל-Perplexity Pro Deep Research, GPT-4 Deep Research ו-Grok-3?
שרון גונן
בפוסט הראשון, ביקשתי משלושה מודלי בינה מלאכותית (Perplexity Pro Deep Research, GPT-4 Deep Research ו-Grok-3) לסכם ולנתח את הנושא: "דיפ סטייט בישראל". בעזרת Claude (Anthropic) יצרתי ניתוח השוואתי מקיף שחושף הטיות סמויות. התוצאות? מפתיעות ומלמדות.
כל מודל הציג את הנושא באופן שונה. מה שהפתיע אותי במיוחד, הוא כיצד כל מודל "דוחף" את הקורא לכיוון חשיבה מסוים - לעתים באופן סמוי ותחת מעטה של אובייקטיביות.
ההשוואה מתמקדת באספקטים שונים של הסיכומים, כגון מבנה, תוכן, סגנון, נקודת מבט ושימוש במקורות.
...........
זה הזמן להוסיף למחקר ההשוואתי גם את Gemini 2.0 DeepResearch.
בהשוואה לשלושת הסיכומים האחרים (Perplexity, GPT-4, Grok), המחקר חושף מספר הבדלים בין Gemini Deep Research למודלים האחרים:
ביחס למבנה
קרוב יותר לסגנון של GPT-4, עם מבנה מסודר ושיטתי, אך פחות מובנה מסיכום Perplexity שהיה יותר פורמלי ומספרי.
ביחס לתוכן ועומק
פחות מעמיק מכל הסיכומים האחרים. בעוד GPT-4 בלט בעושר דוגמאות ספציפיות וציטוטים, ו-Perplexity בלט בנתונים כמותיים, סיכום Gemini נשאר ברמה כללית יותר.
ביחס לנקודות מבט
דומה לגישת Grok במובן שאינו נוקט עמדה חד-משמעית, אך פחות מאוזן מ-GPT-4 שהציג מגוון רחב של עמדות.
ביחס למקורות
איכות המקורות נמוכה יחסית לכל הסיכומים האחרים, עם הסתמכות יתר על ויקיפדיה. מספר המקורות (23) גבוה מ-GPT-4 ו-Grok אך נמוך מ-Perplexity (63).
השורה התחתונה: גישה פדגוגית בסיסית
נראה שסיכום Gemini מייצג גישה פדגוגית בסיסית - מתאים להצגה ראשונית של הנושא, אך חסר את העומק וההיבטים הביקורתיים המאפיינים את הסיכומים האחרים.