פתח דבר
התודעה מעוררת בנו פליאה (למרות שעוד לא הגדרתי בדיוק למה אני מתכוון כשאני משתמש במילה תודעה). כוחות על טבעיים (אלוהיים) מגויסים לעיתים כדי להסביר את התופעה הזאת, בעיקר בשל מצב הפליאה הזה. עם זאת, אתחיל את הדיון שלנו באנלוגיה בין ההשתאות מהתודעה לבין ההשתאות מהתנהגותן יוצאת הדופן של מערכות בעלות מספר רב של פרמטרים, אשר מייצגות משפטים מתמטיים מדויקים. מכיוון שכל מערכת חיה תלויה במספר עצום של פרמטרים, אני רואה דימיון בין התנהגות מערכות גדולות לבין תהליך התהוות של התודעה.
בטקסט המרכזי של הספר אני מתחיל דווקא עם העובדות המתמטיות המדויקות האלה, אבל הן לא יוצגו עבור מומחים במתמטיקה. כל קורא בר דעת יבין הכל, ואני מקווה שגם יופתע מהתוצאות. עבור מומחים, כלומר מתמטיקאים, הטקסט יהיה פשוט מאוד, וניתן יהיה להרחיב אותו בקלות בעזרת עבודות מקצועיות. אבל גם אותם מומחים שלא ידעו את העובדות האלו יהיו מופתעים. לאחר שנבין בדיוק מה מפתיע אותנו, נמשיך לחלק הבא בספר ונדון בתודעה. ראשית, נבחן למה אנו מתכוונים במילה תודעה, ובנוסף, נדבר על רמות שונות של תודעה, טרום-תודעה, התפתחות של תודעה, תת-מודע, והאם יש הבדל בין תודעה לבין מודעות עצמית.
ברצוני להבהיר מראש שאינני מומחה לחקר התודעה, תחום שבו מתפרסמים כיום מאות ואף אלפי מאמרים מדעיים. עם זאת, ברצוני להוסיף נקודה מתמטית אחת לנושא, ובתחום זה אני ללא ספק מומחה.
בהמשך הטקסט אתן דוגמאות להתנהגות מודעת בצורה יוצאת דופן אצל בעלי חיים מסוימים. אני אישית ראיתי זאת בציפורים ואשתף דוגמאות שצפיתי בהן בעצמי. דוגמאות נוספות שלמדתי מהספרות יינתנו בנספחים. לדוגמה, אסביר מדוע ניתן לטעון שלחלק מהתאים של אורגניזם רב-תאי יש מודעות/תודעה. אני מבין שזה עשוי להיתפס כמעורר מחלוקת ואולי אפילו מיסטי בעיני קוראים רבים. עם זאת, נסו לקרוא על מה שהתאים שלנו מסוגלים לעשות וכיצד הם מקריבים את עצמם כאשר אנו, האורגניזמים הרב-תאיים, עומדים בפני סכנה, ומוטב לאורגניזם שחלקם מהתאים שמרכיבים אותו ימותו.
על פי המודל שאציג, התודעה אינה מוגבלת לתודעה של פרט בודד. היא נוצרת בקהילות של מין מסוים, שאני קורא להן חמולות, וכן בקהילות גדולות מאוד, שאני קורא להן סופר-חמולות. חשבו על אוהדים של קבוצת כדורגל, או על אזרחים בעלי גישה פטריוטית למדינה שלהם; דוגמה נוספת תהיה תומכים נלהבים של מפלגה פוליטית. כל אלו הם דוגמאות טובות לסופר-חמולות.
אצלנו, בני האדם, המודעות לסופר-חמולות שאליהן אנו שייכים היא חלק מתת-המודע שלנו. היא שולטת בהתנהגות שלנו, במחשבות שלנו. היא מסוגלת להוביל את האבולוציה של הקבוצה או של כל המין. נציג כיצד זה יכול להסביר את האבולוציה הדארוויניסטית, המתקדמת במרווחי זמן סבירים.
אני חייב לומר שהבנת כל הרעיונות הללו, שחלקם נראים טריוויאליים בדיעבד, הייתה תהליך ארוך עבורי. מגפת הקורונה החלה בדיוק כשחגגתי את יום הולדתי השמונים, והיא כבלה אותנו לדירותינו למשך יותר משנה. במהלך התקופה הזו התחלתי לתעד את התצפיות שלי על התנהגות בעלי חיים, שהיה לי המזל לצפות בהן. היה ברור שכל בעל חיים מבין מה קורה סביבו, ובפועל יש לו תודעה — מודעות שהיא שונה משלנו, וקשורה לסביבתו, להמשך חייו ולצרכיו.
במקרים מסוימים התודעה הזו לא הייתה שונה בפועל מהתודעה האנושית שלנו. לדוגמה, בעורבים. כתבתי ספר על זה – “על חיים ותודעה”. על מנת לחזק את הטיעון שלי ולאשר חלק מרעיונותי, אחזור על חלק מהדוגמאות הללו בספר זה. עם זאת, תהליך ההתבוננות במשמעות האמיתית של התודעה נמשך. כתוצאה מכך הגעתי למסקנה שאידיאה מתמטית מסוימת, בעיניי, מקבילה לתהליך התודעה. על כך כתבתי ספר נוסף – “הרהורים על תודעה: מודל מתמטי שמחקה תודעה” (Reflections on Consciousness: Mathematical Model Mimicking Consciousness).
המודל המתמטי הזה הרחיב את ההבנה של התודעה. עתה היו אלו ישויות (שבמתמטיקה אנו מכנים ‘מערכות’) עם מספר רב מאוד של פרמטרים חופשיים, המובילות להתנהגות מקבילה למודעות. והספר הבא – “דמיסטיפיקציה של ארבעה ניסים קשורים זה לזה” – שיקף את ההבנה הזו.
הדלת שנפתחה בפניי לעולם ולהבנה חדשה ממשיכה להיפתח עוד ועוד. הבנת תת-המודע מובילה להבנת התנהגותם של אנשים שלפעמים אומרים ועושים דברים בלתי נתפסים בטיפשותם, למרות שהם בעצם אנשים אינטליגנטים. (זכרו את הנאציזם, הקומוניזם של סטלין, והרבה מאירועי העשורים האחרונים.) תת-המודע שולט בהתנהגות שלנו בעוצמה רבה יותר ממה שאנו יכולים לדמיין, ומשפיע באופן משמעותי על הכיוון של מחשבותינו.
השאלה היא, איך נוצר תת-המודע הזה? אני דן בכך בפרק הרלוונטי.
חלקים 2 ו-3 של הספר חוזרים ומרחיבים על שני הספרים על התודעה שהזכרתי למעלה. שני הספרים הללו, “הרהורים על תודעה” ו”דמיסטיפיקציה של ארבעה ניסים קשורים זה לזה”, למעשה שולבו בספר הזה ואני מפסיק את הפצתם.
בנספח א’ אחזור על כמה דוגמאות לא סטנדרטיות של תודעה שלקחתי מהספר הראשון שהזכרתי, “על חיים ותודעה”.
חלק 1
ממדים גדולים מאד מפתיעים אותנו
כבר ציינתי קודם שחלק מהעובדות לגבי ממדים גדולים מאוד מפתיעות אותנו. הן אינן אינטואיטיביות כלל, וכשאנו שומעים עליהן לראשונה, קשה להאמין להן. הן נובעות מחישובים מתמטיים ולא מאינטואיציה ראשונית. גם אנחנו, המתמטיקאים, מצאנו את החישובים הללו מפתיעים בהתחלה. עם זאת, רבים מהם ניתנים לביצוע על ידי כל סטודנט למתמטיקה שסיים קורס באנליזה.
אני עומד להציג כמה דוגמאות כאלה. הדוגמאות הללו אינן רלוונטיות ישירות למטרת הספר הזה. אני מציג אותן כדי להרגיל את הקורא לכך שבממדים גדולים עשויות להתרחש תופעות בלתי צפויות.
כל מה שאדבר עליו כאן הוא תוצאה של חישובים מתמטיים, ואני חוזר ואומר, החישובים הללו פשוטים מספיק כך שכל מתמטיקאי מוסמך יכול לאמת אותם ללא צורך בעיון במקורות נוספים.
תחילה מעט טרמינולוגיה וניסוח.
נסמן ב-x או x(i) מספרים, חיוביים או שליליים, אשר לעיתים כוללים את האינדקס שלהם, כמו x(i). מערך של מספרים x = (x(1), x(2), ..., x(n)) נקרא וקטור, ואנו מגדירים את סדרת המספרים הללו כוקטור מממד n. אנו כותבים: {x = (x(1), x(2)) | |x(i)| ≤ 1 for i = 1, 2} לכל קבוצת הווקטורים x כך שהתנאי הבא מתקיים: הערך המוחלט של x(i) הוא פחות, או שווה, לאחד. זהו ריבוע, שאנו קוראים לו קובייה דו-ממדית. אם i = 1, 2, 3 — כלומר אם הממד של הווקטור הוא שלוש — אז מדובר בקובייה רגילה, קובייה תלת-ממדית. באופן דומה, נדבר על קובייה מממד n כאשר הווקטור x מורכב מ-n מספרים.
נדבר על נפח של קוביות, ונשתמש במילה “נפח” עבור כל הממדים n. לכן, הנפח של קובייה דו-ממדית הוא השטח שלה, והוא שווה לארבע. הנפח של קובייה תלת-ממדית שווה לשמונה, והנפח של קובייה מממד n שווה ל-.
כעת נכניס כדור יחידה לתוך הקובייה. במקרה הדו-ממדי, זהו מעגל בתוך ריבוע. במקרה התלת-ממדי, זהו כדור בתוך קובייה. וכן הלאה — כדור מממד n בתוך קובייה מממד n.
כמה מקום תופס הכדור בתוך הקובייה אם n גדול מאוד? התשובה: כמעט שום מקום. לדוגמה, נניח n = 15. ניקח נקודה אקראית בתוך קובייה בת 15 ממדים. מה ההסתברות שגם היא תהיה בתוך הכדור? ההסתברות תהיה פחות מ-1 ל-64,000. המשמעות היא שתוכלו להמר בקלות על $10,000 שהנקודה לא תיפול בתוך הכדור.
האם זה אינטואיטיבי? אם נסתמך על האינטואיציה שמבוססת על שלושה ממדים, כאשר אנו רואים כדור בתוך קובייה, לא היינו מנחשים זאת. אוסיף שאם הייתם לוקחים n שווה לעשרים, הייתם יכולים להמר בקלות אפילו על מיליון דולר שנקודה אקראית לא תיפול בתוך הכדור.
כיצד משתנה נפחו של כדור ברדיוס 1 עם הגדלת הממד n?
עבור n = 2 (מעגל), הנפח הוא π, בקירוב 3.142,
עבור n = 3 (כדור), הנפח הוא 4/3π, בקירוב 4.189,
עבור n = 4, בקירוב 4.935,
עבור n = 5, בקירוב 5.264.
מספיק כדי לקבל תחושה אינטואיטיבית, לא כן? הנפח של הכדור עולה חמש פעמים ברציפות. עבור כל פיזיקאי, זה מספיק כדי לטעון שזה ימשיך כך. עם זאת, בהמשך, בממדים גדולים מאד n, הנפח, מתחיל לרדת. עבור n = 15, הוא כבר 0.381, ולאחר מכן, הוא יורד במהירות, בצורה מעריכית (אקספוננציאלית), ומתקרב לאפס.
בדוגמה הבאה אדבר על שטח השפה של כדור — כלומר, ספֵירה (Sphere). נסמן אותה ב-Sn עבור ספֵירה במרחב מממד n. המשמעות היא שהווקטור x, המורכב ממערך של מספרים x(i), i = 1 ..., n, שייך לספֵירה הזו — כלומר, סכום כל המספרים x(i)² שווה בדיוק ל-1.
פונקציה f(x) נתונה על ספֵירה אם עבור כל נקודה x על הספֵירה נתון מספר f(x). אנו רוצים לשקול פונקציות שאינן “רעות” מדי, ולכן, לדוגמה, נגביל את עצמנו לתנאי שעבור כל שתי נקודות x ו-y על הספֵירה, ערכי הפונקציה f(x) ו-f(y) לא שונים ביותר מ-10 פעמים המרחק בין הנקודות x ו-y. (אנו קוראים לפונקציות כאלה פונקציות ליפשיץ עם קבוע 10). לשם הפשטות נניח גם שהערך המוחלט של הפונקציה שלנו, |f(x)|, קטן מ-10.
ועכשיו אנו מוכנים לערוך משחק שאני חושב שיפתיע אתכם. נניח ש-n הוא מספר גדול, אם כי לא חייב להיות גדול מדי, לדוגמה 100,000. רשמו לעצמכם כל פונקציה כזו. אני לא צריך לדעת איזו פונקציה בחרתם- כל פונקציה. עכשיו קחו נקודה אקראית x על הספֵירה. תגידו לי את הערך של f(x). אני לא יכול לדעת מהו. אני לא יודע מה הפונקציה שלכם.
עכשיו קחו וקטור אקראי נוסף y. אתם לא צריכים לספר לי את הערך של f(y). אני אגיד לכם את הערך הזה בדיוק של שתי ספרות אחרי הנקודה העשרונית (כלומר, אם זה היה, נגיד, 4.56783, אני אגיד לכם 4.56). איך אני אדע את הערך? פשוט מפני שבהסתברות כמעט שווה לאחד (כלומר, כמעט בוודאות), הערך החדש יהיה זהה לערך הישן בדיוק של עד לשתי הספרות העשרוניות הראשונות. זהו משפט מתמטי שאינו אינטואיטיבי כלל, הקובע כי פונקציה כזו, בהסתברות קרובה מאוד לאחד, מקבלת כמעט את אותו ערך. זוהי תוצאה של הממד הגבוה שאנו מתייחסים אליו (בדוגמה שלנו מדובר במרחב מממד 100,000). הפונקציה נראית ומתנהגת כמו פונקציה כמעט קבועה.
גם אם תנסו להטעות אותי ולשנות את הפונקציה הזו במעט, הערך שלה יישאר זהה. התכונה של שמירת הערך הזהה יציבה מאוד עבור פונקציות מסוג זה. כמובן שעליי להבהיר אילו סוגי שינויים מותר לבצע. דרך אגב, אותו עיקרון נכון גם, לדוגמה, עבור 20 פונקציות הנבחנות בו זמנית.
הדוגמה האחרונה הזו – התנהגותן של פונקציות על פני הספֵירה – נקראת “ריכוז מידה” (concentration of measure). תכונה זו מאפיינת מערכות בממדים גדולים מאוד. היא מהווה חלק מרכזי במודל המתמטי של התודעה שלנו, שתואר בהרחבה בספר “הרהורים על תודעה”, ונמשיך לתאר אותו בפרק “מודל המתמטי של התודעה” בספר הנוכחי.
כדי לשמור על הדיוק והפשטות, פרק זה נכתב בהתייחסות לאובייקטים מסוימים ופשוטים יחסית – כדוגמת קוביות, כדורים וספֵירות. עם זאת, אנו יודעים שהצהרות דומות נכונות עבור מגוון עצום של אובייקטים שונים בממדים גדולים. אפשר לומר שהתנהגות מסוג זה, כפי שהדגמתי קודם לכן, היא טיפוסית.
אחזור ואומר: מה שראינו בדוגמה למעלה נקרא במתמטיקה “תופעת הריכוז בספֵירה מממד n”. זה מאד חשוב שנבין זאת נכון, ולכן אסביר את הרעיון הזה שוב (תופעת הריכוז) באמצעות משחק פשוט שהמצאתי.
המשחק מוצג לשני שחקנים, A ו-B. כל אחד מהם בוחר באופן אקראי 50 מספרים, שאותם נסמן כך: x = [x(1), x(2), …, x(50)] עבור השחקן A, ו-y = [y(1), y(2), …, y(50)] עבור השחקן B.
המספרים הללו יכולים להיות חיוביים או שליליים, אך אנו דורשים שסכום הריבועים שלהם יהיה שווה לאחד. כלומר, סכום x(i)2 (על כל i) וסכום y(i)2 (על כל i) צריכים להיות שווים ל-1. במתמטיקה, אנו קוראים ל-x ו-y נקודות על הספֵירה S50; למעשה, הייתי אמור לכתוב 49 במקום 50, אך נתעלם מההבדל הזה בסימונים שלנו. לאחר מכן אנו מחשבים את המספר הבא: סכום המכפלות x(i)y(i) (על כל i). נסמן סכום זה ב-Z. כלומר, Z היא פונקציה:
f(x(1),x(2),...,x(50),y(1),y(2),…,y(50));
פונקציה של קבוצה נתונה של מספרים במתמטיקה היא מספר המתקבל לפי כלל מסוים מהמספרים הללו.
עכשיו, אם Z הוא חיובי, השחקן A מנצח; אם Z הוא שלילי, השחקן B מנצח. אם Z=0, אז אני מנצח. ייתכן שתחשבו שהמשחק הזה הוגן מדי – שאני אף פעם לא אנצח. עם זאת, המחשב שמחשב את Z לא עושה זאת בדיוק אינסופי; הוא עוצר לאחר מספר מסוים של מקומות עשרוניים. נניח שהוא עוצר לאחר שתי ספרות עשרוניות, ולכן מספר כמו 0.438 יעוגל ל-0.43.
ייתכן שעדיין תחשוב בנאיביות שהמשחק הוגן ושאני אנצח לעיתים רחוקות מאוד. אך אתה טועה. למעשה, אנצח ביותר מרבע מהמשחקים. יתרה מזאת, אם במקום 50 מספרים ניקח 10,000 מספרים x(i) ו-y(i) (כאשר i נע בין אחד לעשרת אלפים), אני אנצח כמעט בכל משחק. התוצאה הזו היא לגמרי לא אינטואיטיבית.
העובדה היא שבסבירות קרובה מאוד ל-1 (או, במינוח שלנו, “בסבירות גבוהה מאד”), כאשר בוחרים את המספרים x(i) ו-y(i), עבור ...i=1,2, הערך של Z קרוב מאוד לאפס. (זוהי תוצאה של חישוב, ולא משהו שניתן להבין בקלות בצורה אינטואיטיבית). אנו אומרים שהפונקציה Z “מתרכזת” סביב הערך אפס. וככל שמספר הפרמטרים גדול יותר (כלומר, ככל שלוקחים יותר מספרים x(i) ו-y(i)), כך עולה הסבירות שהתוצאה תהיה קרובה מאוד לאפס. ככל שמספר הפרמטרים גדל, הערך של Z יתקרב יותר ויותר לאפס.
זוהי בדיוק תופעת הריכוז של פונקציות התלויות במספר רב מאוד של משתנים. זו לא הייתה תכונה ייחודית של הפונקציה Z שהוזכרה למעלה. מה שחשוב הוא, שהפונקציה מוגדרת על הספֵירה Sn עבור n גדול. בדוגמה שלנו, התייחסנו ל-n=50 ואז הזכרנו n=10,000. כל פונקציה “טובה” (במובן מסוים) על ספֵירה בממד גדול תקבל, בהסתברות גבוהה, ערכים קרובים לאותו מספר.
אם נתעלם מאירועים לא סבירים במיוחד, נוכל לומר שפונקציות כאלה הן כמעט קבועות. סוגי הפונקציות ה”טובות” שאנו בוחנים כוללות את אלה שאינן מתנודדות במידה רבה ברמה המקומית. לדוגמה, אם שתי נקודות על הספֵירה אינן רחוקות יותר מיחידה אחת זו מזו, אז ערכי הפונקציה בנקודות אלו צריכים להיבדל בלא יותר מ-10 יחידות. כבר כתבתי שפונקציות כאלה נקראות פונקציות ליפשיץ (או בקיצור פונקציות Lip) עם קבוע C, ובדוגמה שלנו C=10.
בפועל, קבוצה רחבה בהרבה של פונקציות מעבר לפונקציות Lip תענה על אותה תכונה. יתר על כן, תכונת הריכוז היא יציבה מאוד. אם הפונקציה f על ספֵירה Sn מקבלת, בהסתברות גבוהה, ערך סביב, נגיד, 5, אז לשנות זאת, אפילו באמצעות שינויים משמעותיים (הפרעות), זה כלל לא פשוט.
קחו לדוגמה כל פונקציית g(x) LIP , עם קבוע Lip קטן מ-100. (כאשר x הוא נקודה על אותה ספירה Sn). פונקציה זו תלויה במספר מוגבל של משתנים, לדוגמה, g(x(1),x(2),…,x(√n)) ואינה תלויה בשאר המשתנים x(i) . בנוסף מתקיים g(0)= 0 , כלומר כאשר המשתנים הראשונים (√n) שווים לאפס, גם הפונקציה שווה לאפס. במקרה כזה, הפונקציה המופרעת f + g עדיין תקבל, בהסתברות גבוהה, ערך קרוב מאוד ל-5. לצורך כך, חשוב רק שמספר הפרמטרים n (אנו קוראים לו ממד) יהיה גדול מספיק.
כפי שאמרתי קודם, סוג התנהגות כזה הוא טיפוסי. בהמשך, כאשר נתאר את האובייקטים שנחקור, נניח שהם מגלים את אותן תכונות.
עד כה השתמשנו בכח של שיטת הריכוז בפחות ממלוא הפוטנציאל שלה. אני חושש שאפילו קורא מעוניין מאוד, שאינו מתמטיקאי, לא יוכל “לעמוד” בשימוש בשיטה זו במלוא הפוטנציאל שלה, וייתכן שלא יצליח להשקיע את המאמץ הדרוש כדי להבין את הרעיון המרכזי של השימוש בשיטת הריכוז עבור המודל שמחקה את התודעה, אותו אנו מתכוונים להציג בהמשך. עם זאת, מצד שני, דווקא הפישוט הזה מפחית באופן משמעותי את התפיסה שהמודל מתאים לתודעה. המודל שלנו נתפס כמשהו הרבה פחות שלם ממה שאנו בדרך כלל מבינים כתודעה. כעת אנסה לצמצם מעט את פישוט היתר הזה על ידי הסבר של כמה תכונות נוספות של שיטת הריכוז והצגת השימוש בהן.
יחד עם זאת, אפשר לדלג על המשך קריאת פרק זה עד סופו בקריאה הראשונה.
עד כה דנו בתופעת הריכוז של פונקציות התלויות במספר רב מאוד של משתנים. כל פונקציה “טובה” (במובן מסוים — לדוגמה, פונקציות ליפשיץ) על ספֵירה Sn בממד גבוה n, תשמור בהסתברות גבוהה מאוד על ערכים הקרובים לאותו מספר. נסמן עבור פונקציה f את ערך הריכוז הזה כ-C(f).
כדאי לציין כאן שאותו אפקט יתקבל גם אם נבחן לא פונקציה אחת f, אלא מספר פונקציות {fi(x),i=1,2, ..., k} בו-זמנית. בדוגמה שלנו של ספֵירה Sn, אזי x היא נקודה על הספֵירה, ובהסתברות קרובה מאוד ל-1, כל הפונקציות fi(x), עבור כל i=1,2,…,k, יהיו בקירוב שוות לערכי הריכוז המתאימים С(fi) באותה נקודה x.
כמובן, לא ציינתי עד כמה יכול להיות גדול המספר k, כלומר כמה פונקציות ניתן לקחת בו-זמנית. עבור ספֵירה, מספר זה יכול להיות גדול בהרבה, בסדר גודל שלם, מהממד n. לא ארחיב על כך כאן. רק אציין שזה נכון גם עבור כל הדוגמאות שאנו בוחנים במתמטיקה. שוב, מהעבודות המפורטות בנספח ב’, מספר זה ברור לכל מתמטיקאי.
נסמן את קבוצת הפונקציות {fi} ב-f ונקרא לה “פונקציה וקטורית”. לקבוצת הערכים המתאימה {C(fi),i=1,2,…,k} נקרא “וקטור הריכוז” של המשפחה הזו, ונסמן אותו כ-C(f).
נוסיף ונציין שהספֵירה שבה השתמשנו כמודל עיקרי מייצגת את הדוגמה הפשוטה ביותר. ישנן קבוצות X שבהן פונקציות “טובות” יכולות לקבל יותר מערך ריכוז אחד — לדוגמה, שני ערכים או יותר, ואף קבוצה מסוימת של ערכים בעלי מבנה מסוים. לדוגמה, קל להגדיר קבוצה X שעבורה הטענה תהיה כזו: כל פונקציה “טובה” f (כגון פונקציית ליפשיץ) המוגדרת על X, תקבל, בהסתברות קרובה מאוד ל-1, לכל היותר שני ערכים: C1(f) או C2(f). בנספח ב’ נכללת הפניה לרשימה ארוכה של אובייקטים מתמטיים שעבורם אלו הם משפטים מוכחים.