סטטיסטיקה עירומה
רק מזכירים לך שלא שופטים ספר לפי הכריכה שלו 😉
סטטיסטיקה עירומה
מכר
מאות
עותקים
סטטיסטיקה עירומה
מכר
מאות
עותקים

סטטיסטיקה עירומה

ספר דיגיטלי
2954מקורי
ספר מודפס
67.278.4מקורי מחיר מוטבע על הספר 112
תאריך לסיום המבצע 01/05/2025

עוד על הספר

תקציר

איך תופסים בתי-ספר ש"מבלפים" במבחני מיצג? איך נטפליקס יודעת איזה סרטים להציע לנו? מה גורם לעלייה באבחון אוטיזם?

צ'ארלס וילן מראה לנו איך אפשר לענות על השאלות האלה, ורבות אחרות, בעזרת נתונים וכלים סטטיסטיים נכונים. 

הסטטיסטיקה הולכת ונעשית כלי הכרחי כמעט בכל תחום בחיינו. ממחקרים רפואיים וסקרים פוליטיים, ועד ספורט, כלכלה וחינוך, השימוש בסטטיסטיקה רק הולך ומתעצם.

אבל הוא מגלה לנו איך הסטטיסטיקה יכולה גם לעוות נתונים והחלטות, לפעמים בגלל שימוש לא נכון בכלים סטטיסטיים, ולפעמים בכוונה להטעות. מדינאי מפורסם אמר פעם כי "ישנם שלושה סוגים של שקרים – שקרים, שקרים גסים, וסטטיסטיקה". וילן מלמד אותנו מתי לחשוד במסקנות, ומתי הסטטיסטיקה היא פשוט עלה תאנה המכסה על שקר. 

סטיית תקן, שונוּת, חציון, מקדם מֽתאם – וילן מצליח להפוך את כל הג'יבריש הזה לכלים ברורים ומובנים, ועושה זאת בהומור, עם דוגמאות מאלפות ומפתיעות, ובעיקר מקפיד לא לשעמם אף פעם. 

"וילן הוא המורה למתמטיקה הכי טוב שאף פעם לא היה לכם." San Francisco Chronicle

"הדוגמאות המאלפות בסטטיסטיקה עירומה יאלצו גם את הפחדן המתמטי הגדול ביותר להבין." New York Times

פרק ראשון

מבוא
למה שנאתי מתמטיקה ובכל זאת אני אוהב סטטיסטיקה

מאז ומעולם היחסים שלי עם מתמטיקה לא היו פשוטים. מִספרים כשלעצמם לא עושים לי את זה. נוסחאות מתוחכמות שאין להן יישומים בעולם האמיתי לא מרשימות אותי. בייחוד שנאתי שיעורי חדו"א (חשבון דיפרנציאלי ואינטגרלי, או "אינפי") בתיכון, מהסיבה הפשוטה שאף אחד לא טרח להסביר לי למה אני צריך ללמוד את החומר הזה. מה השטח מתחת לפָּרַבּוּלָה? למי אכפת?

ובאמת, אחד הרגעים הכי מופלאים בחיי התרחש בשנה האחרונה של התיכון, בסוף סמסטר א' בקורס מתמטיקה לתלמידים מצטיינים. נבחנתי בבחינת הגמר, ואני מודה שלא ממש הייתי מוכן למבחן כמו שצריך (כמה שבועות קודם לכן כבר התקבלתי לאוניברסיטה שבחרתי בעדיפות ראשונה, וככה התנדפו להן שאריות המוטיבציה הנמוכה שהיתה לי לקורס הזה מלכתחילה). כשהתחלתי לעבור על השאלות במבחן, לא היה בהן שום דבר שנראה לי מוכר. זאת אומרת, אפילו לא הבנתי מה שואלים. זאת לא היתה הפעם הראשונה שבאתי לא מוכן למבחן, אבל בפרפרזה על האמירה המפורסמת של דונלד רַמְסְפֶלד, שר ההגנה האמריקאי בזמן המלחמה בעיראק, בדרך כלל ידעתי מה אני לא יודע. הבחינה הזאת נראתה לי כמו סינית, אפילו יותר מהרגיל. דפדפתי קצת בדפי המבחן, ואז די נכנעתי. ניגשתי לקִדמת הכיתה אל המקום שבו המורָה שלי למתמטיקה, שנקרא לה כאן קרול סמית, עמדה והשגיחה על הנבחנים. "המורה", אמרתי, "אני לא מזהה חלק גדול מהשאלות בבחינה".

בואו נגיד שגברת סמית לא אהבה אותי הרבה יותר משאני אהבתי אותה. אני מודה שבכמה הזדמנויות השתמשתי בהשפעה המוגבלת שהיתה לי כנשיא מועצת התלמידים כדי לקבוע כינוס של כל בית הספר כדי שהשיעור שלה יבוטל. אני מודה גם שחברי ואני שלחנו לה פעם פרחים מ"מעריץ אלמוני" במהלך השיעור ואז התגלגלנו מצחוק בירכְּתי הכיתה בזמן שהיא התבוננה סביבה במבוכה. ואני מודה גם שהפסקתי לגמרי להכין שיעורים ברגע שהתקבלתי לאוניברסיטה.

אז כשניגשתי לגברת סמית באמצע המבחן ואמרתי שהחומר לא מוכר לי, היא לא היתה נחמדה במיוחד. "צ'ארלס", אמרה בקול, כאילו אלי אבל בעצם פנתה אל טורי השולחנות כדי לוודא שכל הכיתה שומעת, "אם היית לומד, החומר היה נראה לך הרבה יותר מוכר". זה נשמע משכנע.

חמקתי בבושה בחזרה אל הכיסא שלי. כעבור כמה דקות ניגש לקדמת הכיתה בריאן אַרבְּטר, שהיה תלמיד הרבה יותר טוב ממני באינפי, ולחש משהו באוזנה של גברת סמית. היא לחשה לו בחזרה, ואחר כך קרה דבר מדהים. "אני מבקשת את תשומת לבכם", קראה גברת סמית, "מתברר שנתתי לכם בטעות את הבחינה של סמסטר ב'". חלק גדול מזמן הבחינה כבר עבר, והיא נאלצה לבטל אותה ולקבוע מועד חדש.

אין לי מילים לתאר את השמחה העילאית שאחזה בי. במהלך חיי התחתנתי עם אישה נפלאה ויש לנו שלושה ילדים בריאים. כתבתי ספרים וביקרתי במקומות כמו טאג' מהאל ואנגקור ואט. ועדיין, היום שבו המורה למתמטיקה קיבלה את מה שמגיע לה מדורג בין חמשת הרגעים הטובים ביותר בחיי (העובדה שכמעט נכשלתי במועד ב' של הבחינה לא ממש העיבה על החוויה המרגשת).

המקרה הזה יכול ללמד אתכם הרבה על היחס שלי למתמטיקה - אבל לא את התמונה המלאה. מעניין שאהבתי פיזיקה בבית הספר התיכון, אף על פי שפיזיקה מסתמכת במידה רבה בדיוק על אותו חשבון דיפרנציאלי ואינטגרלי שסירבתי ללמוד בשיעורים של גברת סמית. למה? כי לפיזיקה יש מטרה ברורה. אני זוכר בבירור איך בזמן אליפות הבייסבול המורה לפיזיקה הראה לנו איך אפשר להשתמש בנוסחאות התאוצה הבסיסיות כדי להעריך לאיזה מרחק הכדור נחבט. זה היה מגניב - ולאותה נוסחה יש עוד הרבה יישומים חברתיים חשובים.

באוניברסיטה נהניתי מאוד ללמוד על תורת ההסתברות, כי גם היא עזרה לי להבין מצבים במציאות. במבט לאחור אני מבין עכשיו שלא המתמטיקה הרגיזה אותי בתיכון, אלא עצם העובדה שאף אחד לא טרח להסביר לנו בשביל מה אנחנו לומדים אותה. אם האלגנטיות של הנוסחאות לא מדליקה אתכם כשלעצמה - ואותי היא בהחלט לא מדליקה - נשארתם עם הרבה נוסחאות מייגעות ומכניות, או לפחות ככה לימדו אותן אז.

וזה מביא אותנו לסטטיסטיקה (שכוללת את תורת ההסתברות, למטרות הספר הזה). אני אוהב סטטיסטיקה. בעזרת סטטיסטיקה אפשר להסביר כל דבר, מבדיקות דנ"א ועד האיוולת שבמילוי לוטו. סטטיסטיקה יכולה לעזור לנו לזהות גורמים שקשורים למחלות כמו סרטן ומחלות לב. היא יכולה לעזור לנו למנוע העתקות במבחנים משווים. סטטיסטיקה יכולה אפילו לעזור לכם לנצח בשעשועוני טלוויזיה. כשהייתי ילד היתה תוכנית טלוויזיה מפורסמת שקראו לה עשינו עסק (Let's Make a Deal), עם מנחה מפורסם לא פחות, מוֹנְטי הוֹל (Monty Hall). בסוף כל תוכנית המתחרה הכי מצליח היה עומד עם המנחה מול שלוש דלתות גדולות: דלת 1, דלת 2 ודלת 3. מונטי הול היה מסביר לו שמאחורי אחת הדלתות נמצא פרס נחשק במיוחד - למשל מכונית חדשה - ומאחורי שתי הדלתות האחרות נמצאות עזים. הרעיון היה פשוט: המתחרה היה בוחר באחת הדלתות, ומקבל את מה שנמצא מאחורי אותה דלת.

כשהמתחרה עמד מול שלוש הדלתות עם מונטי הול, היה לו סיכוי של אחד לשלושה לבחור בדלת שמאחוריה מסתתר הפרס הנחשק. אבל בעשינו עסק היה מִפנֶה מעניין, שגורם מאז עונג רב לסטטיסטיקאים ומבלבל את כל מי שאין לו הכשרה בסטטיסטיקה. אחרי שהמתחרה בחר באחת הדלתות, מונטי הול היה פותח אחת משתי הדלתות האחרות, שמאחוריה התגלתה תמיד עז. לדוגמה, נניח שהמתחרה בחר בדלת מספר 1. מונטי היה פותח את דלת מספר 3, ועל הבמה היתה מתגלה עז חיה. שתי דלתות עדיין היו סגורות: דלת מספר 1 ודלת מספר 2. אם הפרס מאחורי דלת מספר 1, המתחרה עתיד לזכות. אם הוא מאחורי דלת מספר 2, הוא עתיד להפסיד. אבל אז העניינים הסתבכו: מונטי היה פונה אל המתחרה ושואל אותו אם הוא רוצה לשנות את דעתו ולהחליף דלת (במקרה הזה, ממספר 1 למספר 2). זכרו, שתי הדלתות עדיין סגורות, והמידע החדש היחיד שהמתחרה קיבל הוא שיש עז מאחורי אחת הדלתות שהוא לא בחר בהן.

האם כדאי לו להחליף דלת?

התשובה היא כן. למה? את זה נראה בפרק ½5.

זה הפרדוקס בסטטיסטיקה: היא נמצאת בכל מקום - מבייסבול ועד סקרי בחירות - אבל התחום עצמו נחשב משעמם ולא נגיש. הרבה קורסים וספרים בסטטיסטיקה עמוסים במתמטיקה ובמונחים מקצועיים. תאמינו לי, הפרטים הטכניים הכרחיים (ומעניינים), אבל אם לא הבנתם את זה באינטואיציה, זה פשוט סינית. ואם לא השתכנעתם שיש סיבה טובה ללמוד סטטיסטיקה, האינטואיציה אולי בכלל לא מעניינת אתכם. כל אחד מהפרקים בספר הזה יענה על השאלה הבסיסית ששאלתי (לשווא) את המורה שלי למתמטיקה בתיכון: מה הטעם בכל זה?

הספר הזה מתמקד בָּאינטואיציה. אין בו הרבה מתמטיקה, משוואות וגרפים. כשהם בכל זאת מופיעים, אני מבטיח שתהיה להם מטרה ברורה ומאירת עיניים. לעומת זאת יש בספר הרבה דוגמאות כדי לשכנע אתכם שיש סיבות נפלאות ללמוד את החומר הזה. סטטיסטיקה יכולה להיות מעניינת מאוד, ובדרך כלל היא לא קשה בכלל.

הרעיון לספר נולד זמן די קצר אחרי החוויה המכוננת באותו קורס מתמטיקה למתקדמים של גברת סמית. נרשמתי לתואר בכלכלה ומדיניות ציבורית. עוד לפני שהתחילה שנת הלימודים שיבצו אותי (לא במפתיע) למכינה במתמטיקה עם רוב חברי לכיתה, כדי להכין אותנו לאתגרים המספריים שחיכו לנו. במשך שלושה שבועות למדנו מתמטיקה כל היום, במרתף נטול חלונות (ממש ככה).

באחד הימים ההם חוויתי משהו שהיה קרוב מאוד להארה מקצועית. המורה ניסה ללמד אותנו מה הנסיבות שבהן סכום של סדרה אינסופית מתכנס למספר סופי. תנו לי שנייה להבהיר לכם את המושג הזה (כי בינתיים אתם בטח מרגישים כמו שאני הרגשתי במרתף האפלולי ההוא). סדרה אינסופית היא דפוס של מספרים שנמשך לנצח, לדוגמה: ...⅛ + ¼ + ½ + 1. שלוש הנקודות מסמנות שהדפוס הזה ממשיך עד אינסוף.

זה החלק שלא הצלחנו להבין. המורה ניסה לשכנע אותנו, באמצעות הוכחה שמזמן שכחתי, שסדרה של מספרים יכולה להימשך לנצח ובכל זאת להסתכם (פחות או יותר) במספר סופי. אחד התלמידים בכיתה, בחור ששמו ויל, סירב להשתכנע (אני מודה שגם אני הייתי קצת ספקן). איך משהו שהוא אינסופי יכול להסתכם לכדי משהו סופי?

פתאום נחתה עלי השראה, או ליתר דיוק הבנה אינטואיטיבית של מה שהמורה ניסה להגיד. פניתי לוויל והסברתי לו את מה שהצלחתי להסביר לעצמי בראש. תאר לעצמך שאתה עומד בדיוק במרחק שני מטרים מהקיר.

עכשיו תתקדם מחצית מהמרחק אל הקיר (מטר אחד), ככה שאתה עומד במרחק של מטר מהקיר.

ממרחק מטר תתקדם שוב מחצית מהמרחק אל הקיר (חצי מטר). וממרחק חצי מטר תתקדם שוב מחצית המרחק (רבע מטר). ואז שוב (שמינית מטר). ושוב.

בהדרגה תהיה קרוב בטירוף אל הקיר (לדוגמה, כשתהיה במרחק 1/1024 מטרים מהקיר תתקרב מחצית המרחק, כלומר עוד 1/2048 מטרים). אבל לעולם לא תיתקל בקיר, כי בהגדרה כל מהלך מקרב אותך רק במחצית מהמרחק שנשאר. במילים אחרות, אתה תתקרב אל הקיר באופן אינסופי, אבל לעולם לא תגיע אליו. אם נמדוד את ההתקדמות שלך במטרים, נוכל לתאר את הסדרה בצורה כזאת: ...⅛ + ¼ + ½ + 1

כאן נמצאת התובנה: אף על פי שתמשיך להתקדם לנצח - כשכל מהלך מקרב אותך אל הקיר במחצית המרחק שנשאר - המרחק הכולל שתעבור לעולם לא יהיה גדול משני מטרים, שהם המרחק ההתחלתי שלך מהקיר. מבחינה מתמטית, המרחק הכולל שתעבור הוא שני מטרים בקירוב, ומתברר שזה נוח מאוד למטרות חישוביות. בשפה של מתמטיקאי, סכום הסדרה האינסופית 1 מטר + ½ מטר + ¼ מטר + ⅛ מטר... מתכנס לשני מטרים, וזה מה שהמורה ניסה ללמד אותנו ביום ההוא.

העניין הוא ששכנעתי את ויל. שכנעתי את עצמי. אני לא זוכר את ההוכחה המתמטית שסכום של סדרה אינסופית יכול להתכנס למספר סופי, אבל אני תמיד יכול למצוא אותה ברשת, והיא כנראה תיראה לי הגיונית. מהניסיון שלי, ההבנה האינטואיטיבית עוזרת להבין את המתמטיקה ואת שאר הפרטים הטכניים - אבל לא בהכרח להפך.

המטרה של הספר הזה היא להפוך את המושגים הסטטיסטיים החשובים ביותר לאינטואיטיביים ונגישים יותר, לא רק לאלה מאתנו שנאלצים ללמוד אותם במרתפים נטולי חלונות, אלא לכל מי שמתעניין בכוחם המופלא של מספרים ונתונים.

 

ועכשיו, אחרי שטענתי שכלי הסטטיסטיקה הבסיסיים חסרים את האינטואיטיביות ואת הנגישות שהיינו רוצים שתהיה להם, אטען טענה לכאורה הפוכה: סטטיסטיקה יכולה להיות נגישה מדי, מבחינה זו שכל אדם עם נתונים ומחשב יכול לבצע פרוצדורות סטטיסטיות מתוחכמות בכמה הקשות במקלדת. הצרה היא שאם הנתונים גרועים, או אם עושים שימוש לא נכון בטכניקות סטטיסטיות, המסקנות עלולות להיות מוטעות ומטעות, לפעמים אפילו מסוכנות. קחו לדוגמה מבזק חדשות אינטרנטי דמיוני: אנשים שעושים הפסקות קצרות בזמן העבודה נוטים יותר למות מסרטן. תארו לעצמכם שהכותרת הזאת צצה מולכם באינטרנט. לפי מחקר מרשים לכאורה שנערך בקרב 36,000 עובדים משרדיים (מִדגם עצום!), לאותם עובדים שדיווחו שהם יוצאים מהמשרד ולוקחים הפסקות קבועות של עשר דקות במהלך יום העבודה יש סיכוי גבוה ב-41 אחוזים לחלות בסרטן בחמש השנים הקרובות בהשוואה לעובדים שלא יצאו מהמשרד במהלך יום העבודה. ברור שצריך לעשות משהו לאור ממצא כזה - למשל להשיק מסע הסברה לאומי נגד הפסקות קצרות בעבודה.

או שאולי צריך לחשוב רגע מה עושים הרבה עובדים במהלך אותן הפסקות של עשר דקות. מהניסיון המקצועי שלי אני יודע שהרבה מהעובדים שמדווחים שהם יוצאים מהמשרד להפסקות קצרות מתגודדים יחד מחוץ לכניסת הבניין ומעשנים סיגריות (ויוצרים ענן עשן ששאר העובדים נאלצים לעבור דרכו כשהם יוצאים או נכנסים). הייתי מסיק שהסיגריות, ולא ההפסקות הקצרות, הן שגורמות לסרטן.

המצאתי את הדוגמה הזאת בכוונה ככה שתיראה מגוחכת במיוחד, אבל אני יכול להבטיח לכם שהרבה עיווּתים סטטיסטיים שמתפרסמים במציאות נראים מגוחכים כמעט באותה מידה ברגע שמפרקים אותם למרכיבים פשוטים. סטטיסטיקה היא כמו נשק חם: היא מועילה מאוד כשמשתמשים בה כמו שצריך, אבל עלולה להיות קטלנית בידיים הלא נכונות. הספר הזה לא יהפוך אתכם למומחים בסטטיסטיקה, אבל הוא כן ילמד אתכם לנהוג בתחום בזהירות ובכבוד כדי שלא תירו לאף אחד בראש.

הספר הזה הוא לא ספר לימוד, ולכן הוא משוחרר מאוד מבחינת הנושאים שצריך לעבור עליהם והדרכים שבהן אפשר להסביר אותם. הספר מיועד להציג את המושגים הסטטיסטיים בצורה הרלוונטית ביותר לחיי היום־יום. איך מדענים מסיקים שדבר מסוים מסרטן? איך סקרים עובדים (ומה עשוי להשתבש)? מי "משקר באמצעות סטטיסטיקה", ואיך? איך חברת האשראי משתמשת בנתוני הרכישות שלכם כדי לחזות אם אתם עלולים לפגר בתשלומים? (זה לא צחוק, הם באמת יכולים לעשות את זה).

אם אתם רוצים להבין את המספרים שעומדים מאחורי החדשות ולהעריך את הכוח המדהים (וההולך וגובר) של נתונים, זה סוג הדברים שאתם צריכים לדעת. בסופו של דבר אני מקווה לשכנע אתכם עד כמה נכונה האמירה של המתמטיקאי השוודי אנדרייס דונקלס (Dunkels): קל לשקר באמצעות סטטיסטיקה, אבל קשה להגיד את האמת בלעדיה.

אבל יש לי שאיפות מרחיקות לכת עוד יותר. אני חושב שאולי תוכלו אפילו ליהנות מסטטיסטיקה. הרעיונות שהיא מבוססת עליהם מעניינים ורלוונטיים להפליא. השיטה היא להפריד את הרעיונות החשובים מהפרטים הטכניים העלומים שעלולים להפריע. זאת הסטטיסטיקה העירומה.

עוד על הספר

סטטיסטיקה עירומה צ'ארלס וילן

מבוא
למה שנאתי מתמטיקה ובכל זאת אני אוהב סטטיסטיקה

מאז ומעולם היחסים שלי עם מתמטיקה לא היו פשוטים. מִספרים כשלעצמם לא עושים לי את זה. נוסחאות מתוחכמות שאין להן יישומים בעולם האמיתי לא מרשימות אותי. בייחוד שנאתי שיעורי חדו"א (חשבון דיפרנציאלי ואינטגרלי, או "אינפי") בתיכון, מהסיבה הפשוטה שאף אחד לא טרח להסביר לי למה אני צריך ללמוד את החומר הזה. מה השטח מתחת לפָּרַבּוּלָה? למי אכפת?

ובאמת, אחד הרגעים הכי מופלאים בחיי התרחש בשנה האחרונה של התיכון, בסוף סמסטר א' בקורס מתמטיקה לתלמידים מצטיינים. נבחנתי בבחינת הגמר, ואני מודה שלא ממש הייתי מוכן למבחן כמו שצריך (כמה שבועות קודם לכן כבר התקבלתי לאוניברסיטה שבחרתי בעדיפות ראשונה, וככה התנדפו להן שאריות המוטיבציה הנמוכה שהיתה לי לקורס הזה מלכתחילה). כשהתחלתי לעבור על השאלות במבחן, לא היה בהן שום דבר שנראה לי מוכר. זאת אומרת, אפילו לא הבנתי מה שואלים. זאת לא היתה הפעם הראשונה שבאתי לא מוכן למבחן, אבל בפרפרזה על האמירה המפורסמת של דונלד רַמְסְפֶלד, שר ההגנה האמריקאי בזמן המלחמה בעיראק, בדרך כלל ידעתי מה אני לא יודע. הבחינה הזאת נראתה לי כמו סינית, אפילו יותר מהרגיל. דפדפתי קצת בדפי המבחן, ואז די נכנעתי. ניגשתי לקִדמת הכיתה אל המקום שבו המורָה שלי למתמטיקה, שנקרא לה כאן קרול סמית, עמדה והשגיחה על הנבחנים. "המורה", אמרתי, "אני לא מזהה חלק גדול מהשאלות בבחינה".

בואו נגיד שגברת סמית לא אהבה אותי הרבה יותר משאני אהבתי אותה. אני מודה שבכמה הזדמנויות השתמשתי בהשפעה המוגבלת שהיתה לי כנשיא מועצת התלמידים כדי לקבוע כינוס של כל בית הספר כדי שהשיעור שלה יבוטל. אני מודה גם שחברי ואני שלחנו לה פעם פרחים מ"מעריץ אלמוני" במהלך השיעור ואז התגלגלנו מצחוק בירכְּתי הכיתה בזמן שהיא התבוננה סביבה במבוכה. ואני מודה גם שהפסקתי לגמרי להכין שיעורים ברגע שהתקבלתי לאוניברסיטה.

אז כשניגשתי לגברת סמית באמצע המבחן ואמרתי שהחומר לא מוכר לי, היא לא היתה נחמדה במיוחד. "צ'ארלס", אמרה בקול, כאילו אלי אבל בעצם פנתה אל טורי השולחנות כדי לוודא שכל הכיתה שומעת, "אם היית לומד, החומר היה נראה לך הרבה יותר מוכר". זה נשמע משכנע.

חמקתי בבושה בחזרה אל הכיסא שלי. כעבור כמה דקות ניגש לקדמת הכיתה בריאן אַרבְּטר, שהיה תלמיד הרבה יותר טוב ממני באינפי, ולחש משהו באוזנה של גברת סמית. היא לחשה לו בחזרה, ואחר כך קרה דבר מדהים. "אני מבקשת את תשומת לבכם", קראה גברת סמית, "מתברר שנתתי לכם בטעות את הבחינה של סמסטר ב'". חלק גדול מזמן הבחינה כבר עבר, והיא נאלצה לבטל אותה ולקבוע מועד חדש.

אין לי מילים לתאר את השמחה העילאית שאחזה בי. במהלך חיי התחתנתי עם אישה נפלאה ויש לנו שלושה ילדים בריאים. כתבתי ספרים וביקרתי במקומות כמו טאג' מהאל ואנגקור ואט. ועדיין, היום שבו המורה למתמטיקה קיבלה את מה שמגיע לה מדורג בין חמשת הרגעים הטובים ביותר בחיי (העובדה שכמעט נכשלתי במועד ב' של הבחינה לא ממש העיבה על החוויה המרגשת).

המקרה הזה יכול ללמד אתכם הרבה על היחס שלי למתמטיקה - אבל לא את התמונה המלאה. מעניין שאהבתי פיזיקה בבית הספר התיכון, אף על פי שפיזיקה מסתמכת במידה רבה בדיוק על אותו חשבון דיפרנציאלי ואינטגרלי שסירבתי ללמוד בשיעורים של גברת סמית. למה? כי לפיזיקה יש מטרה ברורה. אני זוכר בבירור איך בזמן אליפות הבייסבול המורה לפיזיקה הראה לנו איך אפשר להשתמש בנוסחאות התאוצה הבסיסיות כדי להעריך לאיזה מרחק הכדור נחבט. זה היה מגניב - ולאותה נוסחה יש עוד הרבה יישומים חברתיים חשובים.

באוניברסיטה נהניתי מאוד ללמוד על תורת ההסתברות, כי גם היא עזרה לי להבין מצבים במציאות. במבט לאחור אני מבין עכשיו שלא המתמטיקה הרגיזה אותי בתיכון, אלא עצם העובדה שאף אחד לא טרח להסביר לנו בשביל מה אנחנו לומדים אותה. אם האלגנטיות של הנוסחאות לא מדליקה אתכם כשלעצמה - ואותי היא בהחלט לא מדליקה - נשארתם עם הרבה נוסחאות מייגעות ומכניות, או לפחות ככה לימדו אותן אז.

וזה מביא אותנו לסטטיסטיקה (שכוללת את תורת ההסתברות, למטרות הספר הזה). אני אוהב סטטיסטיקה. בעזרת סטטיסטיקה אפשר להסביר כל דבר, מבדיקות דנ"א ועד האיוולת שבמילוי לוטו. סטטיסטיקה יכולה לעזור לנו לזהות גורמים שקשורים למחלות כמו סרטן ומחלות לב. היא יכולה לעזור לנו למנוע העתקות במבחנים משווים. סטטיסטיקה יכולה אפילו לעזור לכם לנצח בשעשועוני טלוויזיה. כשהייתי ילד היתה תוכנית טלוויזיה מפורסמת שקראו לה עשינו עסק (Let's Make a Deal), עם מנחה מפורסם לא פחות, מוֹנְטי הוֹל (Monty Hall). בסוף כל תוכנית המתחרה הכי מצליח היה עומד עם המנחה מול שלוש דלתות גדולות: דלת 1, דלת 2 ודלת 3. מונטי הול היה מסביר לו שמאחורי אחת הדלתות נמצא פרס נחשק במיוחד - למשל מכונית חדשה - ומאחורי שתי הדלתות האחרות נמצאות עזים. הרעיון היה פשוט: המתחרה היה בוחר באחת הדלתות, ומקבל את מה שנמצא מאחורי אותה דלת.

כשהמתחרה עמד מול שלוש הדלתות עם מונטי הול, היה לו סיכוי של אחד לשלושה לבחור בדלת שמאחוריה מסתתר הפרס הנחשק. אבל בעשינו עסק היה מִפנֶה מעניין, שגורם מאז עונג רב לסטטיסטיקאים ומבלבל את כל מי שאין לו הכשרה בסטטיסטיקה. אחרי שהמתחרה בחר באחת הדלתות, מונטי הול היה פותח אחת משתי הדלתות האחרות, שמאחוריה התגלתה תמיד עז. לדוגמה, נניח שהמתחרה בחר בדלת מספר 1. מונטי היה פותח את דלת מספר 3, ועל הבמה היתה מתגלה עז חיה. שתי דלתות עדיין היו סגורות: דלת מספר 1 ודלת מספר 2. אם הפרס מאחורי דלת מספר 1, המתחרה עתיד לזכות. אם הוא מאחורי דלת מספר 2, הוא עתיד להפסיד. אבל אז העניינים הסתבכו: מונטי היה פונה אל המתחרה ושואל אותו אם הוא רוצה לשנות את דעתו ולהחליף דלת (במקרה הזה, ממספר 1 למספר 2). זכרו, שתי הדלתות עדיין סגורות, והמידע החדש היחיד שהמתחרה קיבל הוא שיש עז מאחורי אחת הדלתות שהוא לא בחר בהן.

האם כדאי לו להחליף דלת?

התשובה היא כן. למה? את זה נראה בפרק ½5.

זה הפרדוקס בסטטיסטיקה: היא נמצאת בכל מקום - מבייסבול ועד סקרי בחירות - אבל התחום עצמו נחשב משעמם ולא נגיש. הרבה קורסים וספרים בסטטיסטיקה עמוסים במתמטיקה ובמונחים מקצועיים. תאמינו לי, הפרטים הטכניים הכרחיים (ומעניינים), אבל אם לא הבנתם את זה באינטואיציה, זה פשוט סינית. ואם לא השתכנעתם שיש סיבה טובה ללמוד סטטיסטיקה, האינטואיציה אולי בכלל לא מעניינת אתכם. כל אחד מהפרקים בספר הזה יענה על השאלה הבסיסית ששאלתי (לשווא) את המורה שלי למתמטיקה בתיכון: מה הטעם בכל זה?

הספר הזה מתמקד בָּאינטואיציה. אין בו הרבה מתמטיקה, משוואות וגרפים. כשהם בכל זאת מופיעים, אני מבטיח שתהיה להם מטרה ברורה ומאירת עיניים. לעומת זאת יש בספר הרבה דוגמאות כדי לשכנע אתכם שיש סיבות נפלאות ללמוד את החומר הזה. סטטיסטיקה יכולה להיות מעניינת מאוד, ובדרך כלל היא לא קשה בכלל.

הרעיון לספר נולד זמן די קצר אחרי החוויה המכוננת באותו קורס מתמטיקה למתקדמים של גברת סמית. נרשמתי לתואר בכלכלה ומדיניות ציבורית. עוד לפני שהתחילה שנת הלימודים שיבצו אותי (לא במפתיע) למכינה במתמטיקה עם רוב חברי לכיתה, כדי להכין אותנו לאתגרים המספריים שחיכו לנו. במשך שלושה שבועות למדנו מתמטיקה כל היום, במרתף נטול חלונות (ממש ככה).

באחד הימים ההם חוויתי משהו שהיה קרוב מאוד להארה מקצועית. המורה ניסה ללמד אותנו מה הנסיבות שבהן סכום של סדרה אינסופית מתכנס למספר סופי. תנו לי שנייה להבהיר לכם את המושג הזה (כי בינתיים אתם בטח מרגישים כמו שאני הרגשתי במרתף האפלולי ההוא). סדרה אינסופית היא דפוס של מספרים שנמשך לנצח, לדוגמה: ...⅛ + ¼ + ½ + 1. שלוש הנקודות מסמנות שהדפוס הזה ממשיך עד אינסוף.

זה החלק שלא הצלחנו להבין. המורה ניסה לשכנע אותנו, באמצעות הוכחה שמזמן שכחתי, שסדרה של מספרים יכולה להימשך לנצח ובכל זאת להסתכם (פחות או יותר) במספר סופי. אחד התלמידים בכיתה, בחור ששמו ויל, סירב להשתכנע (אני מודה שגם אני הייתי קצת ספקן). איך משהו שהוא אינסופי יכול להסתכם לכדי משהו סופי?

פתאום נחתה עלי השראה, או ליתר דיוק הבנה אינטואיטיבית של מה שהמורה ניסה להגיד. פניתי לוויל והסברתי לו את מה שהצלחתי להסביר לעצמי בראש. תאר לעצמך שאתה עומד בדיוק במרחק שני מטרים מהקיר.

עכשיו תתקדם מחצית מהמרחק אל הקיר (מטר אחד), ככה שאתה עומד במרחק של מטר מהקיר.

ממרחק מטר תתקדם שוב מחצית מהמרחק אל הקיר (חצי מטר). וממרחק חצי מטר תתקדם שוב מחצית המרחק (רבע מטר). ואז שוב (שמינית מטר). ושוב.

בהדרגה תהיה קרוב בטירוף אל הקיר (לדוגמה, כשתהיה במרחק 1/1024 מטרים מהקיר תתקרב מחצית המרחק, כלומר עוד 1/2048 מטרים). אבל לעולם לא תיתקל בקיר, כי בהגדרה כל מהלך מקרב אותך רק במחצית מהמרחק שנשאר. במילים אחרות, אתה תתקרב אל הקיר באופן אינסופי, אבל לעולם לא תגיע אליו. אם נמדוד את ההתקדמות שלך במטרים, נוכל לתאר את הסדרה בצורה כזאת: ...⅛ + ¼ + ½ + 1

כאן נמצאת התובנה: אף על פי שתמשיך להתקדם לנצח - כשכל מהלך מקרב אותך אל הקיר במחצית המרחק שנשאר - המרחק הכולל שתעבור לעולם לא יהיה גדול משני מטרים, שהם המרחק ההתחלתי שלך מהקיר. מבחינה מתמטית, המרחק הכולל שתעבור הוא שני מטרים בקירוב, ומתברר שזה נוח מאוד למטרות חישוביות. בשפה של מתמטיקאי, סכום הסדרה האינסופית 1 מטר + ½ מטר + ¼ מטר + ⅛ מטר... מתכנס לשני מטרים, וזה מה שהמורה ניסה ללמד אותנו ביום ההוא.

העניין הוא ששכנעתי את ויל. שכנעתי את עצמי. אני לא זוכר את ההוכחה המתמטית שסכום של סדרה אינסופית יכול להתכנס למספר סופי, אבל אני תמיד יכול למצוא אותה ברשת, והיא כנראה תיראה לי הגיונית. מהניסיון שלי, ההבנה האינטואיטיבית עוזרת להבין את המתמטיקה ואת שאר הפרטים הטכניים - אבל לא בהכרח להפך.

המטרה של הספר הזה היא להפוך את המושגים הסטטיסטיים החשובים ביותר לאינטואיטיביים ונגישים יותר, לא רק לאלה מאתנו שנאלצים ללמוד אותם במרתפים נטולי חלונות, אלא לכל מי שמתעניין בכוחם המופלא של מספרים ונתונים.

 

ועכשיו, אחרי שטענתי שכלי הסטטיסטיקה הבסיסיים חסרים את האינטואיטיביות ואת הנגישות שהיינו רוצים שתהיה להם, אטען טענה לכאורה הפוכה: סטטיסטיקה יכולה להיות נגישה מדי, מבחינה זו שכל אדם עם נתונים ומחשב יכול לבצע פרוצדורות סטטיסטיות מתוחכמות בכמה הקשות במקלדת. הצרה היא שאם הנתונים גרועים, או אם עושים שימוש לא נכון בטכניקות סטטיסטיות, המסקנות עלולות להיות מוטעות ומטעות, לפעמים אפילו מסוכנות. קחו לדוגמה מבזק חדשות אינטרנטי דמיוני: אנשים שעושים הפסקות קצרות בזמן העבודה נוטים יותר למות מסרטן. תארו לעצמכם שהכותרת הזאת צצה מולכם באינטרנט. לפי מחקר מרשים לכאורה שנערך בקרב 36,000 עובדים משרדיים (מִדגם עצום!), לאותם עובדים שדיווחו שהם יוצאים מהמשרד ולוקחים הפסקות קבועות של עשר דקות במהלך יום העבודה יש סיכוי גבוה ב-41 אחוזים לחלות בסרטן בחמש השנים הקרובות בהשוואה לעובדים שלא יצאו מהמשרד במהלך יום העבודה. ברור שצריך לעשות משהו לאור ממצא כזה - למשל להשיק מסע הסברה לאומי נגד הפסקות קצרות בעבודה.

או שאולי צריך לחשוב רגע מה עושים הרבה עובדים במהלך אותן הפסקות של עשר דקות. מהניסיון המקצועי שלי אני יודע שהרבה מהעובדים שמדווחים שהם יוצאים מהמשרד להפסקות קצרות מתגודדים יחד מחוץ לכניסת הבניין ומעשנים סיגריות (ויוצרים ענן עשן ששאר העובדים נאלצים לעבור דרכו כשהם יוצאים או נכנסים). הייתי מסיק שהסיגריות, ולא ההפסקות הקצרות, הן שגורמות לסרטן.

המצאתי את הדוגמה הזאת בכוונה ככה שתיראה מגוחכת במיוחד, אבל אני יכול להבטיח לכם שהרבה עיווּתים סטטיסטיים שמתפרסמים במציאות נראים מגוחכים כמעט באותה מידה ברגע שמפרקים אותם למרכיבים פשוטים. סטטיסטיקה היא כמו נשק חם: היא מועילה מאוד כשמשתמשים בה כמו שצריך, אבל עלולה להיות קטלנית בידיים הלא נכונות. הספר הזה לא יהפוך אתכם למומחים בסטטיסטיקה, אבל הוא כן ילמד אתכם לנהוג בתחום בזהירות ובכבוד כדי שלא תירו לאף אחד בראש.

הספר הזה הוא לא ספר לימוד, ולכן הוא משוחרר מאוד מבחינת הנושאים שצריך לעבור עליהם והדרכים שבהן אפשר להסביר אותם. הספר מיועד להציג את המושגים הסטטיסטיים בצורה הרלוונטית ביותר לחיי היום־יום. איך מדענים מסיקים שדבר מסוים מסרטן? איך סקרים עובדים (ומה עשוי להשתבש)? מי "משקר באמצעות סטטיסטיקה", ואיך? איך חברת האשראי משתמשת בנתוני הרכישות שלכם כדי לחזות אם אתם עלולים לפגר בתשלומים? (זה לא צחוק, הם באמת יכולים לעשות את זה).

אם אתם רוצים להבין את המספרים שעומדים מאחורי החדשות ולהעריך את הכוח המדהים (וההולך וגובר) של נתונים, זה סוג הדברים שאתם צריכים לדעת. בסופו של דבר אני מקווה לשכנע אתכם עד כמה נכונה האמירה של המתמטיקאי השוודי אנדרייס דונקלס (Dunkels): קל לשקר באמצעות סטטיסטיקה, אבל קשה להגיד את האמת בלעדיה.

אבל יש לי שאיפות מרחיקות לכת עוד יותר. אני חושב שאולי תוכלו אפילו ליהנות מסטטיסטיקה. הרעיונות שהיא מבוססת עליהם מעניינים ורלוונטיים להפליא. השיטה היא להפריד את הרעיונות החשובים מהפרטים הטכניים העלומים שעלולים להפריע. זאת הסטטיסטיקה העירומה.