יחידה 3 המתודה המדעית
שאלה 1¶
א. אם יצור הוא בן אדם, אז הוא בן תמותה ב. אם מופיע ברק, אז לאחריו נשמע רעם ג. אם גוף מעל מסה m נע בתאוצה a, הכוח הפועל עליו הוא F=ma
שאלה 2¶
"וזה בגלל שרק אחרי השעה 10 בבוקר, החומר הופך לגמיש יותר וניתן להקפיא אותו מבלי שיסדק
שאלה 3¶
טענתו של אריסטו: "עצמים כבדים נופלים בקצב מהיר יותר מעצמים קלים" - הפותזה H נגזור פסוק תנאי עבור תצפית פרטית: "אם עצמים כבדים נופלים בקצב מהיר יותר מעצמים קלים, אז פסנתר שיזרק מגובה מסוים יגיע לקרקע מהר יותר מעיפרון שיזרק מאותו הגובה" (אם H אז e) פסוק תצפית: עיפרון ופסנתר שנזרקו מאותו הגובה הגיעו לקרקע באותו הזמן (לא e) טיעון דדוקטיבי המפריך את ההיפותזה: עיפרון ופסנתר שנזרקו מאותו הגובה הגיעו לקרקע באותו הזמן (לא e), לכן עצמים כבדים אינם נופלים מהר יותר מעצמים קלים (לכן לא h).
שאלה 4¶
טענתו של אריסטו: "עצמים כבדים נופלים בקצב מהיר יותר מעצמים קלים" - הפותזה H הנחות הרקע: פסנתר הוא כבד יותר מעיפרון (H) נגזור פסוק תנאי עבור תצפית פרטית: "אם עצמים כבדים נופלים בקצב מהיר יותר מעצמים קלים (H), ופסנתר הוא כבד יותר מעיפרון (H) אז פסנתר שיזרק מגובה מסוים יגיע לקרקע מהר יותר מעיפרון שיזרק מאותו הגובה (e)" (אם H וגם H* אז e) פסוק תצפית: עיפרון ופסנתר שנזרקו מאותו הגובה הגיעו לקרקע באותו הזמן (לא e) מסקנה: לכן, לא H וגם H* - כלומר, או שעצמים כבדים אינם נופלים בקצב מהיר יותר מעצמים קלים, או שפסנתר אינו כבד יותר מעיפרון אם פסנתר אינו כבד יותר מעיפרון - הרי ש-H עדיין יכולה להיות היפותזה נכונה (לא הופרכה).
שאלה 5¶
א. נכנה את התצפית 'אשכולית שהיא צהובה' בשם e נכנה את ההיפותזה 'כל העורבים שחורים' בשם H נכנה את ההיפותזה השקולה ל-H, 'כל הלא-שחורים הם לא-עורבים' בשם T לפי עיקרון C1, תצפית e מאששת את היפותזה T, מאחר שהיא מקרה פרטי שלה (האשכולית היא לא-שחורה והיא גם לא-עורבת). לפי עיקרון D1, מאחר ש-e מאששת את T, ו-T שקולה ל-H, ניתן להסיק ש-e מאששת גם את H
ב. אותו דבר רק עם "כל הלא-ירוקים הם לא-עורבים", כאשר הנעל היא לא ירוקה ולא עורבת
שאלה 8¶
שאלה 9¶
שאלה 10¶
גיבוש תאוריות מדעיות¶
מונחי בסיס¶
-
תצפיות ותאוריות: המרכיבים הבסיסיים של השיטה המדעית הם התצפיות והתאוריה. התאוריה היא הסיפור השלם, שמסביר את התצפיות. על התצפיות שלנו להתחייב מהתאוריה. היחס בין התאוריה לתצפיות הוא במרכז הפרק השלישי.
תפקיד המתודה המדעית הוא לקבוע שיטה וקריטריונים לבניה של תאוריה מהימנה. אלה הן למעשה ההוראות והעקרונות. המתודה השולטת במדה כיום היא הפוזיטיביזם הלוגי שהכרנו כבר.
-
הסבר וחיזוי שני תפקידיה של התאוריה המדעית הם הסבר של תצפיות קיימות (ראינו שקרה x ואז y - מה הגורם לכך?), וחיזוי של תופעות שלא נצפו. תופעות שלא נצפו הן לא רק תופעות עתידיות, אלא כוללות גם תופעות שקרו בעבר ואין לו תצפית שלהן, או תופעות שקורות במקום אחר בהווה. באנגלית אנו מבדילים בין redrodiction ו-prediction, אבל בעברית, כשנאמר חיזוי הכוונה היא גם להווה ולעבר.
-
היפותזות: הכלי המרכזי של המדע להסבר ולחיזוי הוא היפותזות כלליות - כלומר, שהן הכללה מדעית משוערת, או במילים אחרות השערה לגבי חוקיות בטבע. יש להבחין בין היפותזות פרטיות - "הכדור הזה יקפוץ כשינחת" ובין היפותזות כלליות - "כדורים קופצים כשהם נוחתים". היפותזה היא למעשה פסוק לוגי מסוג A (טענה כללית חיובית בשיטת הסילוגיזמים), וכך, ניתן לנסח אותן בצורה של התניה - כמו שלמדנו בתחשיב הפרדיקטים עם כמתים - היפותזה כמו "כל a הוא b" ניתן להציג גם כ-"כל פריט, אם הוא a, אז הוא b. ובמינוח של הקורס הזה: את ההיפותזה "נפח המים עולה כשהם קופאים" אפשר להציג גם כ-"אם המים קופאים, הנפח שלהם עולה.
הקשר בין תאוריה להיפותזה הוא שהתאוריה מורכבת מהיפותזות. התאוריה היא תמונה שלמה של תחום מסוים בעולם, על החוקים המושלים בו. ההיפותזה היא הכללה בודדה, שמהווה ביחד עם עוד היפותזות תקפות את אבני הבניין של התאוריה.
גיבוש היפותזות מתצפיות¶
-
כיצד לנסח היפותזות נכונות: אנחנו מעוניינים במתודה ליצירת היפותזות מאחר שניתן להעלות על הדעת כל מיני הכללות ביחס לתצפיות שברשותנו, ורובן יהיו שגויות ולא יאפשרו הסבר נכון או חיזוי מוצלח. השאלה היא כיצד עלינו לנסח היפותזות כך שיהיו מוצלחות.
-
"מהתצפיות אל התאוריה" הנחה שגויה של מרבית האוכלוסיה, ובמשך הרבה זמן גם של מרבית המדענים, היא שעל המדע האמפירי להתחיל מתצפיות ולהתקדם אל התאוריה. קרל פופר הלין ב-1963 על הבעיה הזו.
עם זאת, ישנה בעיה קשה בהכללה מתוך תצפיות: המדע האמפירי יוצא מהנחה שהמידע החושי שזמין לנו הוא רובו ככללו מהימן ומשקף את המציאות החיצונית. עם זאת, הכללה היא לעולם לא מידע חושי - אנחנו לא יכולים להסתכל על עובדה כללית בשום אופן. אנחנו יכולים להתבונן באוסף גדול של תצפיות, ואפילו תצפיות על אותו הפריט או אותו סוג של פריט - עם זאת, אנחנו לעולם צופים במקרה פרטי שמצטרף למדגם של תצפיות - תמיד ישנה אפשרות שהמדגם שלנו איננו מייצג. לכן, לעולם לא נוכל לאמת באופן אמפירי את הטענה כל ה-a הם b, מבלי לראות את כל ה-b (כך שלא נדרש לחיזוי).
יש היגידו שאנחנו יכולים לצפות בעובדות כלליות של תחום מוגבל - למשל להסתכל על ערימת גרביים ירוקות ולהגיד "כל הגרביים בערימה הן ירוקות" - אבל אנחנו מתכוונים להכללות של חתום רחב שאינו זמין לנו כולו. לא על "הכללה מוגבלת".
היפותזות מתצפיות: באמצעות דדוקציה¶
-
הבעיה בדדוקציה: ישנו קושי גם בהכללה של היפותזה מתוך התצפיות על דרך הדדוקציה. הדדוקציה משתמשת כידוע בכללי היסק על מנת להגיע מהנחות אל מסקנה מתחייבת, באופן שהוא משמר אמת - כך שאם ההנחות אמתיות, גם המסקנה אמתית בהכרח. השיטה האמפירית מניחה שהתצפיות הן אמת - ולכן, על פניו, לו יכולנו להסיק מהתצפיות להיפותזה על דרך הדדוקציה היינו יכולים להגיע להיפותזה נכונה בהכרח.
אך מתברר שהבעיה היא בעיה לוגית עקרונית - גם חוקי הדדוקציה לא מאפשרים להסיק ממדגם חלקי אל כלל האוכלוסיה הרלוונטית. תמיד קיימת אפשרות שהמדגם שלנו לא מייצג, כך שלא ניתן לבצע את ההיסק. הדדוקציה עובדת רק בכיוון ההפוך: היא מסיקה מסקנות פרטיות מתוך כללים. (נתון לה כלל, והיא מסיקה את המשמעות שלו ביחס למקרה מסוים). זאת בניגוד למשוואה: כמו שאנחנו יודעים, במ"מ כל צד של המשוואה שקול לשני כך שניתן "לזוז בשני הכיוונים". זה לא כך בלוגיקה מאחר שיש חשיבות לכרונולוגיה: רצף של A ואז B הוא שונה מאוד מרצף של B ואז A...
היפותזות מתצפיות: באמצעות אינדוקציה¶
-
חוזק אינדוקטיבי: ההיגיון הבריא מלמד אותנו שבכל זאת אפשר להכליל ממכלול רב של תצפיות דומות על חוקיות כלשהי שככל הנראה קיימת... לכן, ניתן להשתמש בדרך של היסק אינדוקטיבי - שאינו נדרש להגיע למסקנה הכרחית אלא רק למסקנה מסתברת, כך שאינו צריך להיות תקף אלא חזק אינדוקטיבית. אופן ההיסק (האינדוקטיבי) שהולך ממדגם לכלל האוכלוסיה נקרא היסק מונה (מתוך 'משפחת ההיסקים האינדוקטיבים' - לראות בפרק 2). היסק אינדוקטיבי לא פוסל את האפשרות העקרונית שהקביעה שלו שגויה.
ברטנארד ראסל כפרה עליו תיאר את מחיר הוודאות שאנחנו משלמים "בתמורה" להיסק אינדוקטיבי מאוד יפה: "האדם, שמאכיל את התרנגולת כל יום במהלך חייה ולבסוף מולק את גרונה, מראה כי דעות מתוחכות יותר בנוגע לאחידות הטבע היו משמות את התרנגולת ביתר הצלחה... האינסטינקטים שלנו גורמים לנו להאמין שהשמש תזרח מחר, אך ייתכן שמצבנו אינו טוב ממצבה של התרנגולת שגרונה נמלק במפתיע"
-
אינדוקציה במתמטיקה: לצורך השוואה, במתמטיקה, הוכחה על דרך האינדוקציה היא דווקא כן וודאית במסקנה שלה, וזאת מכיוון שהיא כוללת שלב נוסף וחשוב שלא זמין לנו במדע אמפירי: הצעד הרקורסיבי (recursive step). בלוגיקה:
- ראינו שכל A הוא B
- הנחנו שכל A הוא B במתמטיקה:
- הראנו שכל A הוא B
- הראנו שאם A הוא B, אז גם A+1 הוא B
- הסקנו שכל A הוא B
אין לנו דרך לייצר 'שלב רקורסיבי' בתצפית מדעית (באמת? לחשוב על זה...)
-
שיטת 'שני השלבים' מסתמן, אם ככה, שאנחנו צריכים לחלק את הדרך אל היפותזה מדעית מוצדקת לשני שלבים:
- שלב הגילוי - שבו נשער היפותזה כלשהי, גם אם לא מוצלחת.
- שלב הצידוק' שבו נבחן את ההיפותזה באמצעות תצפיות, וכך נסנן רק היפותזות מוצלחות.
שני השלבים מתבססים על תצפיות - גם ההיפותזה הראשונית צריכה לנבוע מתוך תצפיות, היא לא אקראית.
-
זו השיטה שהתקבלה כסנטנדרט לפחות במשך רוב השנים של המדע המודרני. ניוטון ממש ניסח ארבעה "כללים סדורים לגיבוש היפותזות בדרך של אינדוקציה מתצפיות, וטען שהוא מוכיח את חוק הכבידה באמצעות הכללים. אנחנו נראה שהשיטה שלו לא ישימה, ושהוא בעצמו חרג ממנה בהוכחת הכבידה...
בעיות במתודה האינדוקטיבית¶
- ארבעת השלבים של המתודה (בניסוח המלא שלה):
- איסוף תצפיות - רבות ככל הניתן
- תאור של התצפיות באמצעות פסוקי תצפית
- מיון של הפסוקים לפי דומות ותוצאות
-
שימוש בהיסק אינדוקטיבי כדי לייצר היפותזה על דרך ההכללה.
-
הגעה להיפותזה ראשונית: לצורך השוואה, במתמטיקה, הוכחה על דרך האינדוקציה היא דווקא כן וודאית במסקנה שלה, וזאת מכיוון שהיא כוללת שלב נוסף וחשוב שלא זמין לנו במדע מ זוהי למעשה הבעיה בשלב האיסוף - הבעיה היא שניתן לאסוף אינסוף תצפיות בנוגע לאינסוף פריטים והיבטים של הפריטים. כיצד עלינו להחליט אילו תצפיות הן רלוונטיות? נדמה שהשרירותיות אינה מתקבלת כאן על הדעת.
-
בעיות בשלב התיאור (שלב 2):
- פרדוקס העורבים:
פרדוקס שהציג קרל המפל - פילוסוף המדע החשוב בן המאה ה-20.
הטענה היא שניתן לתאר כל תצפית במונחים שליליים: כך למשל, ראיתי מלא פריטים, אבל אף עורב, בכל מיני צבעים, אבל אף אחד מהם לא היה צהוב - וכך ניתן לתאר את התצפית:
"כל הלא עורבים הם לא צהובים."
פסוק כזה יהיה שקול לוגית לפסוק כמו כל העורבים הם צהובים /// באמת??? לא בטוח בכלל??
טוב, בעצם ברור שכן. אני התייחסתי בראש שלי ל-"לא שחורים" כמו "קבוצה a", כלומר כאיזושהי כותרת שאין לה משמעויות סמנטיות. עם זאת, השימוש כאן הוא ב-"לא-עורבים" כמו "not-a", במובן שכל מה שלא שייך לקבוצה "לא-עורבים" שייך בהכרח לקבוצה 'עורבים' (הקבוצה 'לא-עורבים' נובעת ממנה על דרך השלילה). אפשר לדמיין מעגל ואן יחיד שבו יש "לא-שחורים + לא עורבים" - כל מה שנמצא מחוץ לו, שייך בהכרח לשתי הקבוצות כך שהביטויים באמת שקולים לוגית. בתחתית השורה המפל הראה שאם אנחנו משתמשים בתיאור שלנו במונחים של שלילה - דבר שעשוי לקרות אפילו בעקיפין, אנחנו פוגעים בתוקף של ההיסקים שלנו...
באותו אופן ניתן להסיק אינספור היפותזות שאינן רלוונטיות לתצפית שלנו, מתוך אותה התצפית. חלקן גם יהיו סותרות - כמו למשל ההיפותזה "כל העורבים הם כתומים".
- בעיית האינדוקציה החדשה: זוהי הבעיה שלמדנו בפרק הקודם, של נלסון גודמן. בפשטות, גודמן מראה שבכל מצב שבו הסקנו מתצפית הכללה אינדוקטיבית מסוג א' - ניתן להשתמש באותה התצפית ובאותה כמות של הנחות נוספות על מנת להגיע להכללה מסוג ב' - שכמו הרעיון של 'grue', היא תלושה מהמציאות ובלתי מתקבלת על השכל הישר. הבעיה היא כמובן שאין חוק צורני להבנחה בין היסקים רלוונטיים ולא-רלוונטיים (ברי השלכה ושאינם ברי השלכה!).
שתי הבעיות הופכות את ההיסק האינדוקטיבי לבלתי-מתודי: לא נוכל לתת למחשב לבצע היסקים אינדוקטיביים, כי הוא לעולם לא יבין מדוע מתקיים פרדוקס העורבים (מדוע לא ניתן להמיר פסוקי תצפית בפסוקים השקולים להם מבחינה לוגית, אך בצורת שלילה?) ומדוע 'ירוק' הוא רלוונטי ככפרדיקט אך 'ירול' איננו.
- פרדוקס העורבים:
פרדוקס שהציג קרל המפל - פילוסוף המדע החשוב בן המאה ה-20.
הטענה היא שניתן לתאר כל תצפית במונחים שליליים: כך למשל, ראיתי מלא פריטים, אבל אף עורב, בכל מיני צבעים, אבל אף אחד מהם לא היה צהוב - וכך ניתן לתאר את התצפית:
"כל הלא עורבים הם לא צהובים."
פסוק כזה יהיה שקול לוגית לפסוק כמו כל העורבים הם צהובים /// באמת??? לא בטוח בכלל??
-
בעיות בשלב המיון (ג): בשלב המיון אנחנו 'אוספים' את התצפיות שלנו לפי דמיון - כלומר: "תצפיות הקשורות לגופי מים", "התנהגות של חתולים", "תגובות של אנשים לגסות רוח" וכו', כך אנחנו בעצם מזהים דפוסים משותפים בתצפיות שמהם ניתן לכאורה לגזור עקרונות כלליים. הביקורת על המיון הזה היא למעשה הביקורת של פופר על מושג הדמיון: כמו שלמדנו עוד באסתטיקה, 'דמיון' הוא מושג לא קונקרטי. הוא תלוי בנקודת המבט של המתבונן ובמושגים שהוא רואה בהם את העולם. פופר אומר יפה: "חיה רעבה רואה אוכל ולא-אוכל, חיה עייפה רואה מקומות מסתור לשינה". כשזה מגיע למדע, המשמעות היא שאנחנו קובעים את ה-'חוקים' טרם שאנו מגלים אותם - אנחנו החלטנו שכל הגופים שראינו רודפים אחרי לביאות הם 'נמרים', ולכן כל הנמרים רודפים אחרי לביאות. למעשה, יתכן שההיסק שלנו הפוך - החלטנו לתת את השם 'נמר' לכל מה שרודף אחרי לביאות, בעוד שהפרטים שונים לגמרי מבחינת האופן שבו הם ישנים או משחקים...
-
בעיות בשלב ההסקה האינדוקטיבית (ד): הביקורת העיקרית היא בעיית האינדוקציה של יום: שאם נקבל אותה כבעיה, נטען שהיא למעשה מוצדקת בטיעון מעגלי: האינדוקציה עובדת משום שכל האינדוקציות שנוסו הצליחו (זהו שימוש בעקרון האינדוקציה על מנת להוכיח את העיקרון).
לכל הבעיות הוצאו פתרונות שונים, אך אין פתרון משכנע מספיק על מנת להקבל כקונצנזוס.
-
מגבלות מעשיות של השיטה האינדוקטיבית: הקושי של השיטה האינדוקטיבית לגיבוש היפותזות הוא לא רק אל מול הביקורת, אלא גם במגבלות שלה. השיטה האינדוקטיבית יכולה לבצע רק הכללה פשוטה של פסוקי תצפית, והיא לא מסוגלת לבצע את מרבית ההיסקים שהמדע נעזר בהם בפועל:
- משוואות מדעיות ויחסים מתמטיים
- תופעות שלא ניתן לצפות בהן (אלקטרונים, כוח הכבידה)
- מונחים החורגים מן הנתון בתצפית (לא ניתן להגיד כלום על "מוליך", רק על "מוט מתכת".
המשותף לכל השלושה היא היותם ישים תאורטיים, או במונחים של הקורס - הם היסקים בעלי מטען תאורטי (שלא עובדים באינדוקציה).
היפותזה מתצפיות: באמצעות אבדוקציה¶
-
האבדוקציה מתגברת על המגבלות של האינדוקציה: המגבלות המעשיות של השיטה האינדוקטיבית לא מאפשרות יצירה של היפותזות בעלות מטען תאורטי, ובכך לא מאפשרת באמת להגיע להיפותזות מהן ניתן להרכיב תאוריות. תאוריה היא מעין 'סיפור' או אוסף של עקרונות שמציירים יחד מערכת שלמה. האבדוקציה מתייחסת בדיוק להיסק שבו התצפית מקבלת משמעות תאורטית: המפל מסביר: "אין כללי אינדוקציה שניתן ליישם באופן כללי; על מנת לבצע מעבר מנתונים לתאוריה דרוש דמיון יוצר - תאוריות והיפותזות אינן נזגרות אלא מומצאות כדי להסביר את התצפיות. הן למעשה ניחושים מוצלחים שדורשים כושר המצאה, בעיקר אם כרוכה בהם התנערות מהנחות קודמות של המדע - למשל במקרה של תאוריות היחסות והקוואנטים.
-
עקרונות לאבדוקציה: החוברת משווה את המדען העוסק באבדוקציה לבלש - הוא מחפש תרחיש מסוים, שאם קרה, הוא מוביל בין היתר לראיות. המדען מחפש תאוריה, שאם היא אמתית, היא מחייבת את התצפיות. (כהיסק דדוקטיבי)!. המהלך של מעבר מתצפיות להיפותזה שהתצפיות הן תולדה אפשרית שלה נקרא אבדוקציה (abduction) ובשם אחר - היסק להסבר הטוב ביותר (inference to the best explanation).
הדגש שנרמז בשם השני הוא שעלינו לבחור בניחוש שמסביר בצורה הטובה ביותר את התצפיות. הצורה הכללית של ההיסק האבדוקטיבי היא: 1. תצפית e 2. ההסבר הטוב ביותר ל-e הוא... (נגיד: היפותזה H) 3. לכן, H
האבדוקציה אינה מוגבלת למונחי התצפית כמו האידנוקציה, אלא יכולה להשתמש במונחים בעלי מטען תאורטי. עם זאת, גם במקרה של האבדוקציה, המסקנה מסתברת אך אינה וודאית - וזאת משום שמכל אוסף של תצפיות ניתן לגזור מגוון אבדוקציות, כולל כאלה סותרות, וההיסק אינו כולל אימות שלהן.
סיכום די חשוב¶
-
המעבר הדו-שלבי הגישה שלנו בהיסק אינדוקטיבי כוללת למעשה שני מעברים:
- מעבר מתצפיות לפסוקי תצפית
- מעבר מפסוקי תצפית להיפותזה
-
הפערים במעבר:
- במעבר מתצפיות לפסוקי תצפית:
פער התיאור: ניתן לתאר כל תצפית במגוון מונחים, ישנם חוקים שרירותיים לגבי התיאור, פרדוקסים והחלטת שלא ניתן לנסח עבורן מתודה - במעבר מפסוקי תצפית להיפותזה: פער הכלליות: תחום ההחלה של ההיפותזה תמיד גדול מפסוקי התצפית (ההיסק אינו וודאי אלא רק חזק פערק המטען התאורטי: להיפותזה יש מטען תאורטי (אם היא טובה), שהוא לא חלק מהתוכן התצפיתי.
- במעבר מתצפיות לפסוקי תצפית:
-
התגברות על הפערים: ממש בקצרה: האינדוקציה מאפשרת להתגבר על הכלליות, כך שאנחנו יכולים להניב היסק בעל משמעות גם מבלי שמתאפשרת לנו הוודאות הדרושה מהיסק אינדוקטיבי. האבדוקציה מתגברת על המגבלה של האינדוקציה, שיכולה להסיק הכללות של התוכן התצפיתי בלבד, ולא יכולה לנסח היפותזות בעלות מטען תאורטי. היא דורשת כושר המצאה והיא למעשה סיפור שנמציא על בסיס התצפיות.
טבלה איכותית:
בעיית התיחום¶
-
מה מבדיל בין מדע לפסאודו-מדע? למדנו איך ניתן לגבש היפותזה, אבל בעיקר למדנו שיש מעט מאוד מתודה - אז איך נבדיל בין היפותזה של הפיזיקה, להיפותזה של האסטרולוגיה?
ההנחה הרווחת היא שהמדע הוא אמיתי בעוד שהפסאודו-מדע שקרי. אבל זה כמובן לא נכון - הרבה תאוריות מדעיות הסתברו כשקריות - למשל האסטרונמיה התלמאית (פרה-קופרניקוס).
השאלה היא אם כן איזה חלק בתהליך גיבוש התאוריה המדעית הוא זה שהופך אותה למדע.
-
תשובה אפשרית: אופן גיבוש ההיפותזה ניתן להציע את התיחום הבא: "גוף ידע מסוים הוא מדע רק אם ההיפותזות שעליהן הוא מתבסס הן תוצר של המתודה המדעית לגיבוש היפותזות, אחרת הוא אינו מדע". אם נסכם את דיוננו לעיל, המשמעות היא שגוף ידע מסוים הוא מדע אם הוא מגבש היפותזות באמצעות אבדוקציה. אבל הבעיה היא ברורה - מה היא אבדוקציה? יש מעט מאוד מתודה שמעורבת בהיסק כזה. מדובר בהמצאה אמנותית-כמעט של סיפור שיתאים לתצפיות, וזה בדיוק מה שעושה האסטרולוג או הקורא בקלפים! גם הניסוח של הפסאודו-מדען מתיימר לחייב את התצפיות. אם כך, נסיק שהמדע לא מתייחד באופן הגיבוש של היפותזות, אלא באופן הצידוק - באופן בו הוא בוחן את אמיתותן...
הפרכת תאוריות מדעיות¶
-
לאחר שגיבשנו היפותזה, עלינו להעמיד אותה במבחן: כפי נאמר, זהו השלב שמייחד את המתודה המדעית.
-
אימות היפותזות: המסקנה העולה מדיוננו עד כה היא שלא ניתן לאמת באופן וודאי את ההיפותזות הכלליות - משום שהן תמיד מסתמכות על מדגם חלקי, ותמיד ישנה אפשרות עקרונית ששאר האוכלוסיה הרלוונטית שונה ממנו. המשמעות היא שתאוריות מדעיות לא ניתנות לאימות על סמך תצפיות - לא משנה כמה פרטים נבחן כדי לחזק את ההיסק שלנו, זה רק מחזק אותו, ולא מוודא אותו.
הציבור בטוח לעתים שהמדע מאשר תאוריה ע"י תצפיות, אבל זה לא נכון, וגם אם היפותזה היא למעשה נכונה - יתכן שלעולם לא נדע זאת בוודאות. (היעדר היכולת להוכיח היפותזה לא שוללת את אמיתותה).
כמו שנלמד, תצפיות כן מאפשרות לנו להפריך תאוריות מדעיות.
-
האסימטריה בין אימות להפרכה: לעומת תצפית שמאשרת את ההיפותזה, שתשאיר לנו תמיד אפשרות עקרונית לפיה ההיפותזה שגויה או לא מדויקת, תצפית שסותרת את ההיפותזה היא מספיקה כדי להפריך אותה. זאת מכיוון שההיפותזה מנוסחת כטענה כללית, ולכן מספיקה דוגמה נגדית אחת על מנת להפריך אותה. (הטענה עדיין יכולה להיות "מרבית ה-a הם b", אבל אין סיכוי שהטענה "כל a הוא b" תשאר אמתית).
הסיבה היא שעל התצפיות לנבוע דדוקטיבית מההיפותזה! הצורה הכללית של פסוקי תצפית פרטיים הנגזרים מהיפותזה היא כלהלן: 1. H (היפתוזה) 2. אם H, אז e 3. e או לא e 4. לכן H או שלא-H
ברגע שיש לנו הפרכה, הנביעה הדדוקטיבית חדלה להתקיים. ההבדל הזה בין הדרישות להוכחה והפרכה מכונה האסימטריה (asymmetry) בין אימות להפרכה. לסיכום, עד כה נוכחנו שאינדוקציה אינה מספיקה על מנת לגבש או להוכיח היפותזות, אך שבכוחה להפריך אותן.
פופר ובעיית האינדוקציה¶
-
קרל פופר טען שהאסימטריה בין אימות להפרכה היא הפתרון לבעיית האינדוקציה הקלסית של יום: כזכור, פופר נמצא בעמדה הייחודית לפיה על המדע להימנע משימוש באינדוקציה - הוא שואף לבסס מתודה מדעית רציונלית. פופר האמין שעלינו לחלק את המדע להיפותזות שהופרכו באופן דדוקטיבי וודאי ולהיפותזות שעדיין לא הצלחנו להפריך - כאשר התוצאה היא שיטה של אלימינציה המאפשרת להיפטר בהדרגה מכל ההיפותזות השגויות. לעולם לא נשאר עם היפותזות אמתיות בהכרח, אבל נשאר עם היפותזות שהן אולי-אמתיות עד כה.
-
קריטריון ההפרכתיות הוא גם קריטריון תיחום: המתודה המדעית שפופר מציע היא למעשה העלאה של היפותזות ובחינה שלהן כנגד תצפיות שבכוחן להפריך אותך - ומחקר שאינו פועל באופן זה פשוט אינו מדעי. על מנת שנוכל לבחון היפותזה מול תצפיות, נדרש שיהיו לה השלכות תצפיתיות - חיזויים המתחייבים ממנה, שניתן לבחון. אחרת, זוהי אינה היפותזה מדעית. קריטריון זה נקרא criterion of falsifiability, 'קריטריון ההפרכה' - והוא קובע כך: היפותזה היא מדעית רק אם היא ניתנת להפרכה על ידי תצפיות. כלומר, רק אם ניתן לשלול את ההיפותזה הכללית על ידי תצפיות המנוגדות לה; אחרת היא אינה מדעית
ההבחנה איננה רק בין המדעי והלא-מדעי, אלא גם בין 'המדעי יותר והמדעי פחות' - ככל שהתאוריה מציעה לגזור חיזויים מסתכנים יותר (פחות סבירים אלמלא התאוריה נכונה, פחות צפויים) - כך היא מדעית יותר. פופר אומר: "כל תאוריה מדעית טובה היא בגדר איסור; היא אוסרת על דברים מסוימים לקרות" (על ההפרכה...).
פופר מתח ביקורת על 'תאוריות גדולות' כמו המרקסיזם, הפסיכואנליזה והפסיכולוגיה האדלריאנית. הטענה שלו הייתה שהן נכשלות דווקא ביכולת שלהן, לכאורה, להסביר יותר מדי תופעות. הוא רואה בכך השתקפות של מדע מבוסס אישוש, במקום מבוסס הפרכה. לטענתו, הדוגמות הללו מאפשרות להסביר "כל דבר אפשרי ובנוסף לכך את הסתירה שלו" (לא ציטוט שלו) - וכך הן למעשה פסאודו-תאוריות שרק הולכות וצוברות לעצמן אישושים...
ביקורת על קריטריון ההפרכתיות¶
- קריטריון המדע הפך לבולט מאוד בפיל' של המדע והוא מהעקרונות שהתקבלו באופן הכי נרחב ע"י הציבור וע"י הקהילה המדעית. זאת בדיוק הסיבה שהוא זכה גם לביקורות חריפות במיוחד:
-
היפותזות שאינן כלליות: השאלה המתבקשת מול הקריטריון היא האם קיימות היפותזות שברור לנו שהן מדעיות אך אינן ניתנות להפרכה. נכיר שלושה סוגים של היפותזות כאלה:
-
היפותזות הסתברותיות: מדבור בטענה לגבי הסתברות, מהסוג: 1) 90% מהמדגם היה כחול; 2) לכן לגבי כל פריט באוכלוסיה, יש הסתברות של 90% שהוא כחול טענה כזו לא ניתנת להפרכה וודאית - ניתן שחיזוי שגוי (פריט שהסתבר כאדום) מחליש את הסבירות שלה, אבל תמיד ישנה אפשרות עקרונית שלאוכלוסיה מסוימת יש 90% להיות כחולה, ולמרות זאת, במדגם כלשהו זיהינו אנומליה סטטיסטית ומצאנו 50% כחולים בלבד. מובן שגם לא ניתן לאמת הפיתזות הסברותיות באמצעות תצפיות, מאותן סיבות: ייתכן שזיהינו 90% הסתברות במדגם, וכך גם במדגם נוסף שביצענו, ועם זאת, שניהם היו בגדר אנומליה סטטיסטית, כאשר ההסתברות האמתית להיותו של פריט כחול היא 50%.
-
היפותזות ישיות: באנגלית existential hypothesis. טענות מהסוג: "יש a" ("יש יונק שהוא מעופף"). הבעיה היא שלא משנה כמה ניכשל בחיפוש אחר פריט המתאים לתיאור - כל עוד לא בדקנו את כל האוכלוסיה הרלוונטית, תמיד תשאר אפשרות עקרונית שפריט כזה קיים - ולכן לא ניתן להפריך את ההיפותזה. היפותזה כזו דווקא ניתן להוכיח באמצעות תצפיות בקלות רבה! ברגע שצפינו בפריט מתאים, הוכחנו את הטענה לפיה יש לפחות פריט אחד כזה...
-
-
היפותזות פרטיות: מדובר בטענות שאינן טענות כלליות לגבי האוכלוסיה אלא דווקא לגבי פריט יחיד. כלומר, טענות מהצורה "השלולית הזו מכילה חול". היפותזה כזו היא היחידה שניתנת הן לאימות הן להפרכה ע"י תצפיות. אם צפינו בחול בשלולית - הרי שהיא הוכחה! אם בדקנו ולא צפינו בחול - הרי שהיא הופרכה! בהיפותזה פרטית, אין לנו את הבעיה של הכללת פסוק התצפית ולכן התצפית לבדה מספיקה. היפותזה פרטית יכולה גם להתייחס לאירועים בעבר - אמנם אין לנו אפשרות לייצר תצפית שתבדוק מה הכחיד את הדינזאורים, אבל בתאוריה - תצפית כזו היא אפשרית. כלומר - השאלה בכל המקרים היא לא האם יש לנו אפשרות לייצר תצפית - אלא האם תצפית היא אפשרית באופן עקרוני.
-
אחלה טבלה שמסכמת את סוגי ההיפותזות מול קריטריון ההפרכה:
-
מה נעשה לגבי ההיפותזות שלא ניתן להפריך? ניתן לראות שהיפותזות הסתברותיות וישיות אינן מתאימות לקריטריון ההפרכה. ניתן לוותר עליהן, אבל הן מהותיות למדע. ניתן לוותר על הקריטריון, אבל נדמה שהוא דווקא משרת היטב את הכלליות והפרטיות. לכן, הקהילה המדעית והפילוסופית נוטה לאפשרות של מציאת קריטריון נוסף שיחול עבור היפותזות ישיות והסתברותיות.
ביקורת שניה: תזת דוהם-קווין¶
-
ביקורת חשובה נוספת היא של הצרפתי בן המאה ה-19 פייר דוהם היא מכונה כיום 'תזת דוהם-קווין' משום שהפילוסוף האמריקאי קווין עשה בה שימוש ותרם להפצתה. עקרון התזה הוא שלא ניתן להעמיד למבחן תצפיתי היפותזה יחידה. במקום, התזה מציעה שניתן לבחון באמצעות תצפיות רק תזה בצירוף הנחות הרקע שלה. הטענה המובלעת היא שלכל תזה נלוות הנחות רקע, שלא ניתן לנסח תזה בלי הנחות כאלו. כאשר אנחנו מזהים תצפית שאינה מתיישבת עם ההיפותזה - המשמעות היא לא סתירה בין התצפית להיפותזה אלא בין התצפית למכלול של הנחות הרקע + ההיפותזה. הנחות הרקע הן בעצם "ההנחות" בטיעון הדדוקטיבי של ההיסק שלנו. המשמעות במקרה כזה (של תצפית המפריכה) היא שעלינו לבחור: "לוותר" על אחת מההנחות, או על ההיפותזה עצמה. אם ההיפותזה וההנחות הן כולן 'טענות' בטיעון דדוקטיבי - הרי שלפחות אחת מההנחות שקרית במקרה שהמסקנה שקרית, ועלינו להחליט "איפה הבעיה".
-
דוגמאות מפורסמות: ישנן שתי דוגמאות בולטות מההיסטוריה של המדע הממחישות את ההבדל:
- הגילוי של נפטון: כאשר גילו את נפטון, גילו שגורמי שמיים אחרים נעים באופן שלא מתאים למסלול שהתאוריה הניוטונית הסיקה עבורם. לפי התזה, המשמעות היא אחת משתיים: או שהתאוריה הניוטונית (ההיפותזה) שגויה, או שהנחות הרקע שגויות. הנחות הרקע היו הקיום של גורמי שמיים נוספים, שמשפיעים על התנועה זה של זה. במקרה של גילוי נפטון, התברר שהתאוריה דווקא מתאימה, אלא שהטעות הייתה בחישוב גורמי השמיים - ישנו עוד כוכב!. כלומר, ההיפותזה הניוטונית דווקא נשארה אמתית, בעוד הנחת הרקע לפיה יש n גורמי שמיים ו-m תכונות שלהם - התבררה כלא נכונה.
-
ההפרכה של וולקן: אותו המדען שגילה את נפטון גילה גם בעיות במסלול של החמה לעומת החישובים הניוטונים, והציע שיש עוד כוכב נסתר בשם וולקן. לבסוף, התברר שוולקן דווקא לא קיים - ושעל מנת להסביר את העיוותים שהוא מדד בתנועת השמש יש להיעזר בתורת היחסות הכללית. כלומר, במקרה הזה דווקא הנחות הרקע בדבר גורמי השמיים הקיימים התבררו כנכונות, בעוד ההיפותזה התגלתה כשקרית.
-
המחשה פורמלית של התזה: הפורמליזציה של הקריטריון המקורי של פופר היא:
- מתחילים מהיפוזה - H
- גוזרים פסוק תנאי עבור תצפית פרטית - אם H אז e
- אם התצפית סותרת את ההיפותזה נכנה אותה - לא-e
- לכן (בנביעה דדוקטיבית) - אם לא-H, אז לא-e בעוד התזה מציעה שיש להשתמש בצורה הזו:
- מתחילים מהיפותזה - H
- נצרף אליה הנחות רקע - H-B (בדרך כלל זה H* אבל זה מזיין לי את הפרמוט).
- נגזור פסוק תנאי, אך עבור קוניונקציה של ההיפותזה והנחות הרקע: אם (H וגם H-B) אז e
- אם ראינו הפרכה נכנה אותה - לא-e
- המסקנה הדדוקטיבית שלנו תהיה שונה והיא תהיה שלילת הקוניונקציה: "לכן, לא (H וגם H-B) כמו שאנחנו יודעים, אם הקוניונקציה שלילית, זה אומר שאו H או H-B שקריים, אבל לא מתחיייב איזה אחד!
-
סיכום והשלכות: הבחירה השגורה בהיסטוריה, לפחות בהתחלה, היא לדחות דווקא את הנחות הרקע ולנסות לשמור על התאוריה. המסקנה של תזת דוהם-קווין היא שתצפית לא יכולה לאמת היפותזה, וגם אינה יכולה להפריך אותה! אלא רק את הצירוף שלה עם הנחות הרקע (כך שלא ניתן לבודד אותה). מדגישים שוב שעבור פופר, התנאי למדעיות הוא אפשרות כלשהי, תאורטית של תצפית שתפריך את התאוריה (גם אם היא לא אפשרית במציאות שלנו). דוהם-קווין שוללים אפילו את זה המשמעות היא שאף היפותזה כללית אינה ניתנת להפרכה באמצעות תצפיות בלבד - ולכן, לפי הקריטריון של פופר, אף היפותזה אינה מדעית.
עם זאת, יש גם משותף לפופר ולתזה של דוהם-קווין: שתי הגישות מסכימות שתצפית שאינה מתיישבת עם ההיפותזה שוללת את ההיפותזה באופן של טיעון דדוקטיבי (הטיעון הדדוקטיבי המתנה את התצפית בהיפותזה מופרך, ולכן ההיפותזה מופרכת - עניינים של אימפליקציה מטריאלית...). חשוב להבין שהביקורת של דוהם-דווין אינה על ההיסק הדדוקטיבי עצמו, בשונה מהביקורות שהכרנו על ההיסק האינדוקטיבי. הביקורת שלהם היא על האפשרות להשתמש בהיסק דדוקטיבי כדי להפריך היפותזות על סמך תצפיות. (אם ניתן היה לבחון היפותזה בלי הנחות רקע - הכל היה סבבה). מהותית לתזה שלהם ההנחה שלא ניתן להפריד הנחות רקע מהיפותזות.
התגובה של איינשטיין לתצפית של סר אדינגטון הייתה המחשה משעשעת של המצב בפועל - התצפיות של אדינגטון חיזקו את התאוריה של איינשטיין לגבי היחסות הכללית, וכשאיינשטיין נשאל איך היה מגיב אם זה היה הפוך, הוא העיד שהוא היה מצטער עבור אדינגטון ודבק בתאוריה שלו.. (אנחנו פופריאניים כשזה לטובתנו...)
ביקורת שלישית: חיזוי רציונלי¶
-
הבעיה הפרגמטית של האינדוקציה: זהו השם שנתן פופר לבעיה הקשורה לבחירה בין שתי היפותזות שלא הופרכו. נשתמש בדוגמה: כואב לנו הראש. האם נשתמש באספירין, או בתרופה טבעית שלא מצאנו עדויות עבורה כלל? על פניו, יש לנו ולאחרים ניסיון ארוך וחיובי של שימוש באספירין, אבל הסתמכות על ניסיון זה תהיה למעשה היסק דדוקטיבי ואנחנו, כפופריאניים טובים, מתנגדים. במקום, כפופוריאניים, נעדיף תמיד את התאוריה שעמדה בהכי הרבה נסיונות הפרכה. לכן, בעוד שתי ההיפותזות המתחרות ('פרחים אקראיים יעזרו לכאב' ו-'אספירין יעזור לכאב') - למעשה, אין לנו קריטריון לבחירה בין היפותזות מתחרות שלא הופרכו - גם כאשר יש אחת שברור לנו שהיא חזקה ובדוקה הרבה יותר.
-
נסיון ההתמודדות של פופר: בתגובה לבעיה, פופר טען משהו פשוט לכאורה: כל ניסיון מוצלח הוא ניסיון הפרכה שנכשל - כלומר, אם השתמשנו באספירין הרבה פעמים וזה עבד, אמנם לא הוכחנו שאספירין עוזר, אבל לכל הפחות, העמדנו אותו בהרבה יותר נסיונות הפרכה ביחס לתרופה לא מוכרת. פופר מכנה את התכונה של 'עמידה בנסיונות הפרכה' בשם 'קורובורציה' (corroboration), והוא מציע שעלינו תמיד להעדיף את ההיפותזה המתחרה שהקורובורציה שלה רבה יותר.
-
הבעיה בפתרון של פופר: הבעיה המובלעת בפתרון של פופר היא שהוא מסתמך למעשה על היסק אינדוקטיבי - היסק שהוא מבקש להתנער ממנו לחלוטין... הוא הרי טוען: "ההיפותזה שהקורובורציה שלה רבה, עמדה בנסיונות הפרכה רבים בעבר, ולכן היא תמשיך ותעמוד בנסיונות הפרכה גם בעתיד." כלומר, פופר צריך לבחור: האם הוא מוותר על עקרון הקורובורציה, במחיר של היכולת לברור בין היפותזות מתחרות, או שהוא מוותר על ההצמדות שלו להיסקים דדוקטיביים בלבד? שתי הבחירות יהיו הרסניות..
רגע, מה? פופר לא אומר שבגלל שמשהו הצליח בעבר, הוא יצליח שוב, אלא שבגלל שהוא לא הופרך עדיין - הוא ימשיך ולא יהיה מופרך גם בעתיד בסבירות גבוהה יותר. עכשיו הבנתי... פופר מנסה לטעון שניסיון חיובי הוא למעשה נסיון שלילה שנכשל. אבל אנחנו לא עוסקים בנסיונות שנכשלו אלא רק ביכולת החד-משמעית של ההיסק הדדוקטיבי מהיפותזה לתצפית להפריך את התאוריה. אם כן, השאלה הנכונה היא כיצד היפותזה יכולה לצבור איזשהו כוח בכלל בשיטה של פופר. כי אם נסיון חיובי לא מחזק תאוריה, אז גם העובדה שלא הופרכה 1,000 פעם לא מחזק אותה כלל. היא רק או מופרכת או לא-מופרכת.
-
סיכום: נוכחנו לגלות שהעיקרון של פופר חזק מדי, ולכן לא יכול להיות נכון או לפחות להוות תשובה מלאה לשאלת ההפרכה של תאוריות מדעיות.
נדמה שנדרש לנו קריטריון למדידת רמת הביסוס של היפותזות מתחרות. לשם כך, עלינו לחרוג אל מעבר לוודאות, ולעסוק בחוזק אינדוקטיבי. בראיות שאינן מוכיחות או מפריכות, אלא מחזקות או מחלישות.
אישוש תאוריות מדעיות¶
קריטריונים לאישוש¶
-
מעבר למעמד הבינארי: בשיטה של פופר, נוכחנו שהמעמד של היפותזה הוא בינארי: או שהיא הופרכה, או שהיא לא. שיטה זו לא מאפשרת לנו להבחין בין היפותזות עם המון עדויות תומכות, לכאלה שאין להן בכלל. כדי שנוכל להתקדם, עלינו להגדיר תחילה מה היא בעצם עדות תומכת - כלומר, אילו תצפיות יכולות לאשש היפותזה. אישוש (confirmation) היא תמיכה של תצפית בהיפותזה. אימות (verification) היא מקרה קצה של אישוש, בו התמיכה היא מלאה (אין אפשרות עקרונית לשגיאה).
-
עקרונות אישוש רווחים: ישנם לא מעט עקרונות אישוש הרווחים בחיים ובמדע, משום שהם אינטואיטיביים. כזה הוא למשל העיקרון לפיו "אם e הוא מקרה פרטי של היפותזה H, אז התצפית e מאשרת את היפותזה H" - למעשה, ההנחה שתצפית שמתאימה להיות מקרה פרטי של היפותזה מחזקת את ההיפותזה. זהו למעשה עקרון ניקו שהכרנו כבר. צורה נוספת, תגיד "אם מתקיים תנאי C (הקשר בין e ל-H) אז e מאששת את H" (למשל: אם e מתרחשת אחרי a כלשהו... ההבדל פה הוא שיש תנאי שמבטיח ש-e תהיה רלוונטית בהקשר שלה ל-H).
אלו היו תנאי אישוש ישירים - ישנם גם תנאי אישוש עקיפים: הקובעים שאם תצפית e מאששת את היפותזה H, והיפותזה H היא שקולה לוגית להיפותזה T - אז e מאששת גם את T.
פרדוקסים של אישוש¶
-
פרדוקס העורבים: פגשנו כבר את פרדוקס העורבים, אלא שבמקור, הוא לא נוסח כדי להמחיש את הבעיה בהקשר הגילוי של היפותזות (כפי שלמדנו) אלא דווקא בהקשר הצידוק (אישוש של היפותזות). גודמן אמר יפה, שהפרדוקס מאפשר לנו לעסוק ב-'צפרות משרדית' ולמעשה להסיק על עורבים מבלי שראינו עורבים כלל. התוצאה בלתי מתקבלת על הדעת כי היא לא סבירה, לא רלוונטית לתצפיות, מאפשרת אישוש של אינסוף היפותזות בכל תצפית וגם אישוש של היפותזות סותרות! (הנעל מוכיחה שכל דבר שהיא לא הוא משהו שרירותי שהיא לא..., וגם שהדבר הזה הוא תכונה נוספת שסותרת את הראשון).
ההבדל בין הגרסה המקורית לזו שלמדנו כבר הוא שבמקרה של אישוש היפותזה, כבר יש לנו היפותזה ואנחנו מחפשים דרך לבחון אותה. בהקשר הגילוי, הרי שהבעיה היא שהפרדוקס מעמיד אותנו בפני אוסף אינסופי של היפותזות אפשריות.
-
בעיית האינדוקציה החדשה: אותו סיפור למעשה, למדנו עליה בהקשר הגילוי, אלא שבמקור היא נוסחה לגבי הקשר הצידוק - הפרנציפ הוא אותו פרנציפ - אותה התצפית תתן לנו את אותה הרמה של אישוש, לגבי שתי היפותזות שונות, כאשר הן סותרות, וכאשר אחת היא אבסורדית בבירור בעוד השניה מתקבלת על הדעת.
חשוב לשים לב שפתרון ה-'השתרשות' שהציע גודמן, אילו היה מנומק דיו, פותר למעשה את שני הפרדוקסים: זאת מכיוון שגם מונחים כמו "לא-עורב" ו-"לא-שחור" הם מונחים שאינם מושרשים, וודאי לא כמו המקבילים החיוביים שלהם, ולכן הפתרון קובע שהם אינם ברי-השלכה. (או לפחות - לא כמו המקבילים החיוביים). בכל אופן, אל לנו לשכוח את הביקורת החזקה מול הפיתרון.
ניתן להוסיף שגם הפתרון שהציע קווין מתאים לשני הפרדוקסים: המונחים "לא-עורב" ו-"לא-שחור" אינם אקסטנציות שאנחנו חווים באופן טבעי וישיר. (דיוק של המינוח שלי: הם אינם סוגים טבעיים שאנחנו מזהים כנבדלים בלי ללמוד מושגים... לכל הפחות עלינו ללמוד על שלילה). אלה **מושגים תאורטיים הנגזרים מהמושגים החיוביים המתאימים להם.
-
סיכום המשמעויות של הפרדוקסים:
- הן עורב שחור הן נעל לבנה תומכים בחיזוי שהעורב הבא יהיה שחור
- הן עורב שחור הן נעל לבנה תומכים בחיזוי שעל פיו העורב הבא יהיה ירוק (יחד - הם ממש דופקים את האפשרות לאשש...)
ובטבלה יפה:
-
הפיתרון של המפל לפרדוקס העורבים: הפרדוקס משאיר שלוש אפשרויות: דחיית עקרון האישוש הישיר, דחיית עקרון האישוש העקיף ,או דחיית הקביעה שהפרדוקס הוא אבסורד. למרבה ההפתעה, המפל בוחר באפשרות השלישית, בטענה שזהו אבסורד פסיכולוגי ולא אבסורד לוגי. לטענתו, הטענה "כל העורבים הם שחורים" ניתנת לניסוח גם כ-"אם אובייקט הוא עורב אז הוא שחור" (מסכים, סילוגיזם A הוא גם התניה) - כאשר המשמעות היא שהפסוק אינו חל על עורבים בלבד אלא על כל הפריטים עולם - כך שזה לא מעוות כ"כ שכל פריט בעולם יכול לאשש או להפריך את הטענה. אנחנו טועים לחשוב שהפסוק הוא רק לגבי עורבים. אם כן, כל תצפית של דבר שאינו עורב ואינו שחור היא אישוש ישיר ואלמנטרי של ההיפותזה.
שתי דוגמאות של מרק סיינסבורי ממחישות את המורכבות של הפיתרון: סיינסבורי מסביר שלו היינו מחזיקים בהיפותזה ורואים ממרחק עוף כחול - היינו מתפללים שהוא לא עורב, כי רק עורב לא-שחור מפריך את הטענה שלנו. כלומר: דבר שאינו שחור ואינו עורב אכן מאשש את ההיפותזה (זה "פחות פריט אחד לבדוק"). ולעומת זאת, אם היינו רואים מרחוק שחף שצבעו לא ברור - לא היינו מתפללים שהוא לא-שחור, שכן שחף שחור לא מסכן את ההיפותזה כל השחורים הם עורבים. המשמעות היא שלפי קו מחשבה זה, הסדר בו אנחנו מתוודעים לתכונות האובייקט מהותי לאפשרות שיסכן את ההיפותזה שלנו.
זה בתכלס גם הגיוני לדעתי. אם אני יודע שהוא שחף אני כבר למעשה בדקתי אותו, ואני יודע שהוא לא פריט רלוונטי. לפני שיש לי סיווג של הפריט, עדיין נותר לי "פריט אחד לבדוק".
פרדוקס אישוש שני: הצמדה ע"י קוניונקציה¶
-
עד כה היו לנו את עקרונות האישוש האינטואיטיביים C1 ו-D1 הראינו באמצעות פרדוקס העורבים ובעיית האינדוקציה שאלה מביאים לתוצאות אבסורדיות. גם בפרדוקס זה משתתפים שני עקרונות אישוש - אחד ישיר ואחד עקיף. וגם פה הם מביאים לאבסורד.
-
עקרון האישוש C2 - תנאי הנביעה ההופכי קובע שאם מה שנובע דדוקטיבית מהיפותזה אכן מתאמת בתצפית, אז תצפית זו מאששת את ההיפותזה. _אם פסוק תצפית e נובע לוגית מהיפותזה H, אז התצפית e מאששת את H".
-
עקרון האישוש D2 - תנאי התולדה המיוחד אם תצפית e מאששת את היפותזה H, ואפ היפותזה T נובעת מ-H, אז e מאששת את T
זהו למעשה עיקרון דומה ל-D1 מלבד ההחלפה של 'שקולה' ב-'נובעת'. והטענה היא שכאשר תצפית מאששת הפיותזה, גם ההיפותזה הנובעת מקבלת אישוש. ההבדל בין שקילות לנביעה הוא שהיפותזות שקולות תמיד חולקות ערך אמת זהה בכל מצב עניינים, בעוד שהיפותזה הנובעת מהיפותזה היא כזו שאמתית בהכרח אם ההיפותזה המנביעה אמתית (כלומר: יכול להיות שהנובעת אמתית והמנביעה שקרית).
האבסורד: מכונה גם פרדוקס ההצמדה ע"י קוניונקציה (tacking paradox) נבחן טיעון כזה: e - זוהי נעל ל H - זוהי נעל לבנה, וגם חוק אוהם קנכון נכון T - חוק אוהם נכון
ניתן לראות ש: 1. תצפית e נובעת דדוקטיבית מהיפותזה H 2. לכן תצפית e מאששת את היפותזה H 3. היפותזה T נובעת מהיפותזה H 4. לכן תצפית e מאששת את היפותזה H
הבעיה אם כן, היא שאת היפותזה H תמיד ניתן להרכיב כקוניונקציה כך שהקוניונקט הראשון יהיה ההיפותזה שהתצפית שלנו איששה, והקוניונקט השני יהיה היפותזה כלשהי - גם אם לחלוטין לא-רלוונטית לתצפית. כך, נעל לבנה מאששת את חוק אוהם... והמשמעות הסופית היא שכל תצפית מאששת כל היפותזה (זאת בניגוד לפרדוקס העורבים המוגבל להיפותזה מסוג כל ה-Fים הם Gים בלבד)
פרדוקס אישוש שלישי: הצמדה ע"י דיסיונקציה¶
-
עקרון האישוש הישיר C3 - תנאי הנביעה: קובע שאם היפותזה H נובעת לוגית מפסוק תצפית e, אז e מאששת את H אם מטענה Q נובעת טענה P - זה אומר שאם Q נכונה, אז P נכונה בהכרח. כלומר - אם H נובעת מ-e, אז אז e מאמתת את H. כזכור, אימות הוא סוג מיוחד ומושלם של אישוש. לכן - כל תנאי לאימות וודאי של טענה בוודאי גם מאשש אותה.
היפוזתה יכולה לנבוע לוגית מתצפית כאשר היא אינה הכללה (כזכור, כל הבעיה היא שאין מעבר דדוקטיבי מתצפית להכללה) - כלומר, למשל, היפותזה ישית - התצפית "הציפור היא לבנה" מאמתת את ההיפותזה "יש ציפורים לבנות".
-
עקרון האישוש העקיף D3: - תנאי התולדה ההופכי קובע שאם תצפית e מאששת את היפותזה H, ואם H נובעת מהיפותזה T, אז e מאששת את T. במילים פשוטות: אם משהו נובע מההיפותזה, אז הוא מקבל אישוש בכל מקרה שהיא מקבלת אישוש. דוגמת אדינגטון שנלמדה איששה למעשה גם את היפותזת סטיית הקרניים וגם את תורת היחסות הכללית (שממנה נבעה ההיפותזה).
חשוב לציין שהעיקרון לא חל על אימות אלא לגבי אישוש בלבד! כן הכוח של הפרדוקסים הוא בקוניונקציה ודיסיונקציה שהן מספיק בלתי-חד-משמעית...
-
מקרה בוחן:
- e נעל לבנה
- T חוק אוהם
- H זוהי נעל לבנה או שחוק אוהם נכון
ניתן לראות ש: 1. מהיפותזה T נובע ש-H (כלל Add.מדדוקציה טבעית) 2. מפסוק התצפית e נובע ש-H 3. לכן לפי D3, ההתצפית מאשרת אף את היפותזה T
וכך שוב, מתצפית על נעל הגענו לאישוש לא-רלוונטי ובלתי מתקבל על הדעת.
**פרדוקס זה מכונה 'ההצמדה על-ידי דיקסיונקציה'
סיכום הפרדוקסים¶
- על ההיפותזות להתבסס על תצפיות
- תצפיות פרטיות לעולם לא יוכלו אמת היפותזות כלליות מעל לכל ספק
- הן כן יכולות לאשש אותן - לספק להן תמיכה
- ההיפותזה המאוששת יותר היא הטדובה יותר
- דרושים עקרונות ברורים לאישוש
עקרונות אישוש ישיר: ![[משאבים/Pasted image 20250317172411.png]] ![[משאבים/Pasted image 20250317172501.png]] עקרונות אישוש עקיף"
![[משאבים/Pasted image 20250317172601.png]]
- כל עקרון הוא תנאי מספיק אך לא הכרחי - על מנת שתצפית תאשש.
-
כלומר, היפותזה יכולה להיות מאוששת אינטואיטיבית - אין הכרח שאחד העקרונות יתקיים כדי שתהיה אמתית, אך אם ההיפתזה היא מדעית, היא מתקיימת בהכרח כאשר אחד מהם מתקיים.
-
שלושה זוגות של פרדוקסים: למעשה, כל זוג של עקרונות שלמדנו פותח פרדוקס אחד - בהתחלה זה עורבים ואינדוקציה (מאוחדים) בשני זה הצמדה על ידי קוניונקציה בשלישי זה הצמדה על ידי דיסיונקציה ![[משאבים/Pasted image 20250317172914.png]]
עוד טבלה נהדרת: ![[משאבים/Pasted image 20250317173112.png]]
-
הבעיה בפרדוקסים: היא כנאמר, שהם מאפשרים לכל תצפית לאשש כל היפותזה. כולל כזו שתלושה ממנה לגמרי... לכן, הם מבטלים את ההפרדה ביו פסאודו-מדע למדע - נומרולוג יכול להגיד שכל התצפיות בעולם מאששות את התורה שלו...
סיכום למתודה המדעית¶
-תמונה פשוטה של המדע, בלי להעמיק בבעיות: - מטרת המדע היא להסביר ולחזות תופעות בטבע באמצעות היפותזות - מהותיות לכך היפותזות מהימנות, ועל מנת לגבשן יש צורך במתודה שתבתטיח הפקה של היפותזות מהימנות - המתווה הכללי של המתודה המקובלת: מתחילים מתצפיות, ומגבשים היפותזה כללית שתסביר אותן באמצעות אבדוקציה - על מנת להעמיד את ההיפותזה במבחן אמפירי - עלינו לחלץ מההיפותזה פסוקי תצפית המתחייבים ממנה דדוקטיבית (אם היא אמתית). - לאחר מכן נבדוק אם תצפיות חדשות הן כאלה שניתן היה להסיק ממנה דדוקטיבית* - אם כן, ההיפותזה מקבלת אישוש (מתחזקת כסברה), בעוד תפצית סותרת מפריכה את ההיפותזה באופן חד משמעי. - שלב גיבוש ההיפותזה הוא הקשר הגילוי - שלב בחינת ההיפותזה נקרא הקשר הצידוק
בעיות: - אין שיטה של ממש לגיבוש היפותזות מתצפיות, מלבד אבדוקציה שהיא דרך יפה להגיד יצירתיות וקצת היגיון בריא, ומזל! (לבחור את ההיפותזה הנכונה ללא מתודה...) - הפרכת היפותזה מתקשה בכך שתמיד נבחן את ההיפותזה בצירוף הנחות הרקע שלה (דוהם-קווין), כך שאין לנו מתודה להפרכה וודאית של ההיפותזה. - אישוש היפותזה מתקשה בכך שכל עקרונות האישוש שסקרנו מובילים למסקנות אבסורדיות, ולא מאפשרים אישוש 'אוטומטי' או 'פורמלי' (דרוש שיקול דעת שלא ניתן להגדיר). - החוברת מוצאת לנכון לציין שעל אף הבעיות המדע הוא אחושלוקי זיין
הגישה הבייסיאנית¶
-
העמדה הבייסיאנת מציגה עקרון אישוש הסתברותי: העקרונות שדנו בהם עד כה הם איכותניים - הם עוסקים ב-'אישוש/הפרכה' ולא במידת האישוש. לעומתם, הגישה ההסתברותית היא כמותנית ומפרטת כמה אישוש תצפית נתונה מעניקה.
העמדה מכונה על שם תומס בייס שניסח את החוק שבבסיסה.
-
יתרונות הגישה:
- יכולה לשמש לא רק לאישוש, אלא גם למדידת ההיחלשות של היפותזה בעקבות תצפית.
- מבהירה כיצד יש לעדכן היפותזות לפי תצפיות חדשות
- נותנת כלים להבנת העבודה המדעית בפועל
- מציעה פתרונות לשלושת הפרדוקסים של האישוש.
ככלל מדובר בגישה פופולרית בקהילה הפילוסופית.
- גישת שני השלבים: שלב א' הוא פיתוח מודל הסתברותי לאישוש שלב ב' הוא פרשנות של הסתברויות כסובייקטיביות - כלומר, תלויות בדרגת ההאמנה של הסובייקט (ולא מאפיין אובייקטיבי של הטענה). נתחקה אחרי פיתוח הגישה.
אישוש והחלשה:¶
-
עקרון האישוש ההסתברותי - PC יש עיקרון אישוש נוסף שהוא מאוד אינטואיטיבי: "תצפית e מאששת את ההיפותזה H, אם e מעלה את ההסתברות של H. זהו למעשה לא רק תנאי מספיק לאישוש, אלא גם תנאי הכרחי שמתקיים בכל מקרה של אישוש.
במילים אחרות, אפשר להגיד שתצפית e מאששת את היפותזה H אם ההסתברות של היפותזה H להיות אמתית בהינתן e גדולה מההסתברות של H באופן שאינו תלוי ב-e. נסמן את ההסתברות של H כ- P(H) ואת ההסתברות של H בהינתן e כ-P(H/e), הנוסחה המתקבלת היא:
באותו אופן, תצפית יכולה להחליש את ההיפותזה אם היא מורידה את ההסתברות שתהיה נכונה, ביחס להסתברות הבלתי-תלויה שלה. כך, מעבר ליחסים מוחלטים של אימות והפרכה - יש לנו גם שני סוגים של יחסים לא-מוחלטים - אישוש (יחס לא מוחלט חיובי) והחלשה (יחס לא מוחלט שלילי). היכולת למדוד החלשה היא מהיתרונות של הגישה הבייסיאנית. כמו כן, כמו שנאמר, היתרון הגדול הוא שאישוש והחלשה הם גם איכותניים וגם כמותניים (גם אומרים האם יש חיזוק או החלשה, וגם עד כמה, באיזו עצמה).
-
חישובי הסתברות: את ההסתברות נמדוד במספר בין 0 ל-1 (כאשר 0 זה אין מצב, ו-1 זה וודאות). על כל פנים ההסתברות היא תמיד מספר חיובי. החלוקה של ההסתברות המותנית וההסתברות העצמאית (בהינתן e וללא e) של היפותזה היא בעצם חלוקה של שני מספרים חיוביים. אם תצפית e מאששת את ההיפותזה אז תוצאת החלוקה תהיה גדולה מ-1 (ההסתברות המותנית גדולה מהעצמאית). אם תצפית e מחלישה את ההיפותזה אז תוצאת החלוקה תהיה קטנה מ-1 (ההסתברות העצמאית של ההיפותזה גדולה יותר). במילים אחרות:
-
שימוש בעיקרון האישוש ההסתברותי בפועל: נניח ואנחנו מדענים שרוצים להשתמש בעיקרון. נראה שעלינו למצוא את P(H/e) חלקי P(H). אבל כיצד נוכל לדעת מה ההסתברות של ההיפותזה, בעצמה או לנוכח תצפית e? זה לא דבר שמתגלה לנו חושית...
כאן נכנסת לתמונה פריצת הדרך של בייס - מדובר בחוק הסתברקותי המכונה חוק בייס (bayes theorem)
הסתברות מותנית¶
- כאשר אנחנו מחפשים את ההסתברות של a בהינתן b 'הסתברות מותנית': החוברת מסבירה ככה: נדמיין עיגול גדול הכולל את כל התרחישים האפשריים בתוכו יש עיגול קטן יותר של דברים שאינם ידועים לנו - למשל, האם ירד גשם (ירד גשם = H) ההסתברות שירד גשם היא החלק היחסי של העיגול H בתוך העיגול הגדול נוח לסמן את העיגול הגדול כ-1 כדי ששטח העיגול הקטן H יהיה ההסתברות שלו כעת נסמן עוד עיגול, של האפשרות שהלחות תעלה (e) - ההסתברות שלה הוא שטח העיגול שלה. כמו בדיאגרמת ון, לעיגולים יש שטח חפיפה - נקרא לו D לשאול מה הסיכוי שהגשם ירד בהינתן שהלחות עולה הוא החלק היחסי של D מתוך המעגל e (כלומר: יש לנו את ההסתברות של e מתוך המעגל הכללי; ההסתברות של D היא השטח היחסי שלו מתוך המעגל e - ירדנו "עוד שלב"). מאחר שהמעגלים מבטאים משוואת הסתברותיות ולא ערכים מוחלטים, נקבל את המשוואה הבאה:
ובמילים: ההסתברות שהיפוטתזה H נכונה בהינתן שתצפית e תתרחש היא המנה המתקבלת מחלוקת ההסתברות שהן ההיפותזה נכונה והן התצפית תתרחש - בהסתברות של התצפית להתרחש ללא ההיפותזה.
זוהי נוסחה כללית המתקייימת בין כל עובדה a לעובדה b
-
חוק בייס: ראינו כיצד מחשבים את ההסתברות המותנית. עוד ראינו כיצד היא מתקיימת בין כל עובדה a לעובדה b בנוסף לזה, אפשר להחליף בין e ל-H בנוסחה - וכך נקבל משוואה שונה:
ואם אנחנו יודעים קצת מתמטיקה, שתי הנוסחאות יחד מייצרות את המשוואה הבאה:
זוהי משוואה המכונה חוק בייס - יש לה השלכות מרחיקות לכת.
-
חוק בייס ואישוש: נזכור שאנחנו מחפשים את המנה של ההסתברות המותנית של H ו-e בהסתברות העצמאית של H. לא ברור כיצד נדע את ערך המונה (ההסתברות המותנית). (מה ההסתברות שתאוריית היחסות נכונה לאור תצפית אדינגטון?)
הפתרון הוא בכך שהחלפת e ו-H בנוסחת ההסתברות המותנית מאפשרת לנו לגזור את העקרון הבא:
העקרון הוא בעצם חיבור של עקרון האישוש ההסתברותי עם חוק בייס (החלפנו את המנה במנה שהתגלתה כשקולה לה). מדוע צורה זו שימושית? כי בכל מקרה שבו התצפית היא תולדה לוגית של ההיפותזה (נגזרת ממנה דדוקטיבית) - נוכל לדעת בוודאות שהמחלק בנוסחה לעיל הוא 1 (ההסתברות של התצפית בהינתן הנוסחה היא 1 - וודאית). במקרה כזה, התצפית תחליש או תאשש את הטענה ב-אחת חלקי ההסתברות הבלתי תלויה של התצפית. (המחולק בנוסחה).
- הנוסחה של בייס לעדכון הסתברויות: כעת נראה מדוע חוק בייס + עקרון האישוש ההסתברותי הם שימושיים במדע. כמו שאנחנו יודעים, לאחר בחינה של היפותזה כנגד תצפית, עלינו לעדכן את ההסתברות שלה בהתאם להחלשה או לאישוש שהתצפית הניבה. אם תצפית e העלתה את ההסתברות של H בפי 2 - אז יש להכפיל את ההסתברות של H ב-2 לאחריה. עקרון BP (השני) של נוסחת בייס מראה לנו שהמכפלה הרלוונטית היא תמיד המנה של חלוקת ההסתברות המותנית של ההיפותזה בהסתברות הלא מותנית של התצפית.
כמו שלמדנו, בכל מצב שבו התצפית היא תולדה לוגית (נגזרת דדוקטיבית) של ההיפותזה, זה אומר פשוט 1 חלקי ההסתברות הלא מותנית.
עבור הגישה הבייסיאנית, נוסחת העדכון של בייס היא חלק מהמתודה המדעית: פעילות היא מדעית רק אם היא מתנהלת לפי נוסחת העדכון.
עוד כלל חשוב שניתן לגזור הוא:
אופן הגזירה מעניין - זוהי בעצם הנוסחה P שכבר למדנו (עקרון האישוש הכמותי), כאשר אנחנו משתמשים בעובדה שהיא מתארת יחס בין כל a וכל b. על מנת להגיע ל-P** מתבצעים שני מהלכים: 1. נחליף את משתני הנוסחה P ב-a ו-b 2. נחליף אותם ב-e ו-H שוב, אבל בסדר הפוך למעשה, כמו שהחלפנו את e ו-H בתוך מנת החלוקה - אנחנו מחליפים את איברי הטיעון.
החלק המעניין עוד יותר הוא שמנות החלוקה בנוסחה P ובנוסחה P** הן שוות כפי שהוכיח בייס - כך שהחוק הוא בסופו של דבר: "המידה שבה ההתרחשות של e משנה את ההסתברות של H זהה למידה שבה ההתאמתות של אותה היפותזה H משנה את הסבירות של תצפית e להתרחש" (בעצם - מידת ההשפעה של תצפית על הסתברותה של תאוריה, שווה בעצמתה למידת ההשפעה של התאמתות התאוריה על הסבירות של התצפית!)
- לסיכום
חוק בייס חושף שתי נקודות חשובות על היחס בין תצפית להיפותזה:
- יש לעדכן את ההסתברות של H בהתאם לתצפית חדשה e (לפי המשוואות שפותחו)
- השוויון בין השפעת e על H ו-H על e
חשוב לזכור: חוק בייס, עקרון האישוש הכמותי P, עקרון האישוש הבייסיאני P**, נוסחת בייס לעדכון ההסתברויות
את כל זה להבין בהזדמנות:
ממש בגדול... ההסתברות שיהיה חולה היא נמוכה מאוד כי שיעור טעות של 1% הוא גבוה מאוד ביחס לזיהוי של תכונה בשכיחות של 1:1,000. ההתניה כאן היא בהיפותזה - שיוסי חולה. (מה הדיוק של הבדיקה, בהינתן שיוסי חולה?) הבדיקה מאששת את ההיפותזה בהתאם ליחס בין הייתכנות שיוסי חולה, ובין הדיוק של הבדיקה. ניסיתי לחשב מהראש ולא הצלחתי... לנסות עם הנוסחה של החוברת מחר ולהבין למה.
הסתברות סובייקטיבית¶
-
הגישה הבייסיאנית היא שילוב של הנוסחאות של בייס עם פרשנות סובייקטיבית של הסתברויות כדי להשתמש בנוסחת עדכון ההסתברויות, עלינו לדעת את ההסתברות הבלתי תלויה של ההיפותזה (P של H). וגם את ההסתברות הבלתי תלויה של התצפית (P של e). הבעיה היא שבמקרים רבים - אין לנו איך לדעת את ההסתברויות האלה.
הפרשנות הסובייקטיבית להסתברות דוגלת בהערכה משוערת וסובייקטיבית של ההסתברות של H ושל p, כאשר אנחנו מנסים להיצמד לחוקי ההיגיון הבריא (למשל שלהסתברות לתצפית גבוהה מההסתברות להיפותזה כמעט תמיד, משום שלתצפית ייתכנו עוד הסברים...).
לאחר הערכה משוערת זו, המדען בוחן את ההיפותזה כנגד תצפיות, וכך מאשש או מחליש את ההיפותזה מנקודת מבטו הסובייקטיבית - כלומר, הוא מעדכן "את הרישום שלו" בדבר ההסתברות שלה בהתאם לתצפיות שהוא באופן אישי מכיר.
כך, ניתן לחלק את ההסתברויות להסתברויות אובייקטיביות וסובייקטיביות - ההסתברות האובייקטיבית היא תכונה של האירועים עצמם - ההסתברות של הטלת מטבע להראות פאלי, כתכונה של המטבע ושל חוקי הפיזיקה. המונחים בהסתברות כזו הם של שכיחות יחסית. הסתברות סובייקטיבית היא מידת הביטחון של סובייקט מסוים ביחס לתוצאה מסוימת.
ניתן לתת לכל הסתברות פרשנות אובייקטיבית וסובייקטיבית, שהן נפרדות ובלתי תלויות. העקרונות הבייסיאניים של חישוב האישוש וההפרכה, ועדכון ההסתברות - חלים על שתי הפרשנויות, אבל כנפרדות. בכל אופן יש לזכור שבמקרים רבים אין לנו גישה להסתברות האובייקטיבית. (ושאם יש לנו גישה - אין טעם במציאת ההסתברות הסובייקטיבית... השימוש בסובייקטיבית הוא בלית ברירה...) (יש בייסיאניים שחושבים שיש רק הסתברות סובייקטיבית... עמדה מעניינת)
-
סיכום ביניים: כמו שאמרנו, הגישה הבייסיאנית היא שילוב של
- הגדרת האישוש במונחים הסתברותיים (עקרון האישוש הכמותי, חוק בייס, נוסחת עדכון ההסתברויות)
- מתן פרשנות סובייקטיביתך להסתברות למען היסר ספק: הוגים את זה 'בייס' כמו 'base'.
**והאמונה המתודית שלה:** "נוסחת בייס לעדכון הסתברויות מתארת את האופן שבו מדענים צריכים לעדכן את מידת הביטחון שלהם בהיפותזות לאור תצפיות חדשות".
החומר פה נראה מפחיד... אבל בגדול יש רק מעט טריקים: 1. יצירת 'חלוקות' (מנות) של ההסתברות המותנית של e או H בהסתברות הלא-מותנתי של e או H - כדי לחשב את האישוש או ההחלשה 2. הצגת הנוסחאות כמתקיימות עבור כל a ו-b - ולא רק e ו-H 3. החלפת הסדר של e ו-H בנוסחאות "באמצעות" a ו-b - כי ניתן להציב במקומן כל איבר 4. שימוש בנוסחה BP על מנת לעבוד בנוחות עם כל תצפית e הנובעת לוגית מהיפותזה H 4. שימוש במתמטיקה שאין לי כוח אליה - שמראה לנו לבסוף ששתי צורות של חלוקה כזו הן שוות ערך - ונקראת חוק בייס. 5. יצירת נוסחת עדכון ההסתברויות בהתאם לשוויון הזה... וביסוס השוויון בין ההשפעה ההסתברותית של e על H ולהיפך.
מושגים:
עקרונות האישוש ההסתברותיים -
אלה העקרונות שקודמים לעקרון האישוש הכמותי, הם חלק מהגישה ההסתברותית (שהיא מרכיב אחד בגישה הבייסיאנית).
העקרונות הם PC ו-PD
זוהי הגרסה האיכותנית יש להם גרסאות נוספות, שנובעות מהעובדה במצב של אישוש המנה גדולה מ-1, ובמצב של החלשה היא קטנה מ-1. הם נקראים PD* ו-PC*:
כפי שניתן לראות, בצורה הזו הם עקרונות כמותניים שמראים מה מידת האישוש או ההחלשה. לכן קראנו לעקרון P הנגזר מהם עקרון האישוש הכמותי.
עקרון האישוש הכמותי P -הוא למעשה פשוט שילוב של עקרונות PC* עם PD*
חוק בייס - השוויון השימושי בין שתי נוסחאות של הסתברות מותנית
עקרון האישוש הבייסיאני BP (חיבור חוק בייס עם עקרון האישוש הכמותי)
מאפשר להשתמש במחלק=1 בכל מצב של e שנגזרת דדוקטיבית מ-H - כאשר התצפית וודאית אם ההיפותזה נכונה...
נוסחת עדכון ההסתברויות הנשענת על BP
רגע, האם אלה אותו הדבר?
עקרון האישוש הכמותי P**
- שהוא 'מראה' לעקרון P ומבסס את השוויון בשפעה בין H ל-e (במידת ההפרכה/אישוש של אחת בהינתן השניה). 1
בתכלס של התכלס: האמירה היא שתצפית e משפיעה על הסבירות של H ביותר עצמה, ככל ש-H מנבאת את e ביותר וודאות - במקרה של תצפית שלילית. ושהיא משפיעה על H ביותר עצמה ככל שהיא פחות סבירה מבלי ש-H מתקיימת - במקרה של תצפית חיובית.
(הניסוחים האלה, שלי, כוללים בתוכם את העובדה שהאימות של H משליך על הסבירות של e, וגם את העובדה הפשוטה יותר, שהתצפית ב-e משליכה על הסבירות של H).
(CHATGPT מסכים איתי, אפשר לשאול אותו שוב אם זה סיכום נכון כי התמונה תחרבן את הדף)
העצמה של חוק בייס היא בכך שהשוויון בין ההשפעה של e ו-H הוא לא הנחה ממוצאת - אלא נובע מתמטית מעקרון האישוש הכמותי הבסיסי P, שהוא אינטואיטיבי, ופשוט קובע שתצפית מאששת היפותזה בהתאם ליחס בין הסבירות של ההיפותזה בהינתן התצפית, לסבירות של ההיפותזה כשלעצמה (בלי תלות בתצפית).
לבסוף ניתן להגיד שהשיטה הבייסיאנית מאפשרת לפעול או על תצפיות הנגזרות דדוקטיבית מההיפותזה (כך שהנוסחה BP מקבלת מחלק 1) או על תצפיות שההסתברות הבלתי תלויה שלהן ידועה לנו. אחרת אין לנו את הפרמטרים הדרושים להפעלת נוסחת עדכון ההסתברויות (שהיא החלק החשוב באמת בגישה).
הסתברות סובייקטיבית והימורים¶
-
כיצד נקבע מה היא ההסתברות הסובייקטיבית של עובדה כלשהי? בעיה שעולה מרעיון ההסתברות הסובייקטיבית הוא מציאת ההסתברות הסובייקטיבית שנתחיל ממנה. ראשית, הסובייקט לאו דווקא יודע זאת על עצמו - אני לא יודע מה ההסתברות הסובייקטיבית מבחינתי לנפילה של אסטרואיד, למשל. בנוסף, מדובר במצב מנטלי שאינו פומבי, ולכן, לא נוכל לפקח על השימוש של אחרים בעקרון עדכון ההסתברויות. הם יכולים "לרמות" אותנו וכו'.
פריצת הדרך של הגישה הבייסיאנית באשר להגדרת ההסתברות הסובייקטיבית היא ההנחה לפיה מידת הביטחון של אדם בטענה מסוימת מתבטאת באופן שיהיה מוכן להמר על הטענה. לדוגמה אם יש הטלת מטבע, ויציעו לנו להמר עליה בתמורה לזכיה של 100 ש"ח - ההימור המירבי שנהיה מוכנים לו הוא 50 ש"ח. מכך ניתן ללמוד שאנחנו מעריכים את ההסתברות של כל צד במטבע כ-0.5. בעצם, האופן בו אנחנו מחשבים לעצמנו מה משתלם בהימור משקף את ההסתברות הסובייקטיבית. הנוסחה היא למעשה חלוקה של הסכום המירבי שאנחנו מוכנים לשלם בסכום הזכייה המירבי.
(כמובן שניתן לשאול האם אנחנו מאמינים בהימורים, האם הסיכון להישאר בלי 50 ש"ח שווה לנו את זה מבחינה אישית, והאם באמת הגענו להחלטה שקולה והגיונית לגבי תקרת ההימור שלנו. הכוונה היא לא להחלטה ממשית להמר אלא לתקרת ההימור הרציולנית שלנו בעולם אידאלי.)
איך הנכונות להמר 50 בשביל 100 משקפת את ההסתברות כאן? אני לא לגמרי בטוח שהבנתי. נגיד שאני מאמין שזה 50-50, למה שאהמר דווקא 50? אפשר להגיד ש-50 הוא הסכום המק'קסימלי שאוכל להחשיב כהימור טוב, או לפחות כהימור שהוא לא דבילי.
בעיות רציונליות בהסתברות סובייקטיבית¶
- טיעון משאבת הכסף הבעיה העיקרית בהסתברות סובייקטיבית היא שאת הערך הראשוני שלה כל אחד יכול לקבוע, לפי העולה על רוחו, באופן שעשוי להיות בלתי רציונלי. טיעון משאבת הכסף בא לטעון שגם הסתברות סובייקטיבית, כמו אובייקטיבית, צריכה להיות כפופה לאקסיומות ההסתברות כפי שניסח אותן אנדרקיי קולמוגורוב.
דוגמת משאבת הכסף ממחישה מדוע הסתברות סובייקטיבית חייבת לציית לאלה. בדוגמה, ההסתברות הסובייקטיבית שאני מעניק ל-'ירד מחר גשם' היא 0.6, וההסתברות הסובייקטיבית שאני מעניק ל-'לא ירד מחר גשם' היא 0.7. זוהי כמובן הפרה של כלל 4 - ההסתברות המשותפת צריכה להיות השילוב של 'ירד מחר גשם' והשלילה של 'ירד מחר גשם' - כלומר 1.0. אלא שפה אנחנו מגיעים להסתברות משותפת של יותר מ-1, עבור מצב וודאי...
'הימור' על ההסתברות עולה לי 60 ש"ח ו-70 ש"ח בהתאם ל-0.6 ו-0.7 (אנחנו בתחום של הימור שאינו דבילי, לפי תפישת ההימורים). כך, תמיד אזכה ב-100 ש"ח עבור אחד הכרטיסים, ותמיד אוציא 130 ש"ח בעבור שני הכרטיסים, בעוד לכאורה, ההימור שלי רציונלי בהתאם לשיטה הבייסיאנית.
מדוגמה זו אנחנו למדים שכדי שהימורים 'נכונים' לא ירששו אותנו - אנחנו חייבים לשער את ההסתברות הסובייקטיבית בהתאם לאקסיומות ההסתברות. האקסיומות הן בגדר אילוץ רציונלי.
- פערים בהסתברויות תחיליות: בעיה נוספת שקשורה לחופש של הסובייקט לקבוע את ההסתברות הסובייקטיבית - מה אם מדענים שונים יתנו לאותה ההיפותזה ערכי הסתברות ראשוניים שונים מאוד? אנחנו ניווכח שהנוסחאות של בייס 'מאזנות את עצמן' כך שלמעשה אין בעיה גדולה.
מהחוברת:
-
אני לא ממש רואה טעם להקליד את זה... העיקרון ברור, ככל שעבור המדען, ההסתברות הבלתי מותנית של התצפית סבירה יותר, עדכון ההסתברות של ההיפותזה בהתאם לתצפית יהיה נמוך יותר, ולהפך.
כך, מתברר שאם מדען מתחיל מהערכת הסתברות סובייקטיבית גבוהה, תצפיות שליליות יפגעו בה מהר יותר, ותצפיות חיוביות יחזקו אותה לאט יותר - וכל זה הופכי לגבי מדען שהעריך הסתברות ראשונית נמוכה.
כך, ההסתברויות הסובייקטיביות שלהם יתקרבו במהרה לנוכח תצפיות דומות או זהות.
פתרונות בייסיאנים לפרדוקסים של אישוש¶
- השיטה הבייסיאנית מבטאת את כוחה ביכולת להתמודד עם פרדוקסי אישוש שלמדנו.
-
פרדוקס העורבים: התשובה הבייסיאנית לאבסורד, לכאורה, היא גישה שכבר נגענו בה - הטענה "כל העורבים שחורים" היא קביעה סטטיסטית שמתייחסת לכל הדברים בעולם בצורה של התניה: "אם דבר הוא עורב, הוא שחור".
אם נעריך הסתברות סובייקטיבית עבור: 1. היתקלות בעצם שחור 2. היתקלות בעצם לא שחור 3. היתקלות בעצם שהוא עורב 4. התקלות בעצם שהוא לא עורב 5. היתקלות בעצם שהוא גם עורב וגם שחור 6. היתקלות בעצם שהוא לא עורב ולא שחור הכל לפי האקסיומות של ההסתברות נוכל לגזור טבלה כזו:
ברור שלפי הנוסחאות של בייס, תצפית של עורב שחור תאשש את H - כל העורבים שחורים ולפי אותן נוסחאות, ההסתברות המותנית של אובייקט לא-עורב ולא-שחור, בהנחה שכל העורבים שחורים מחייבת אותנו לצמצם מעט את ההסתברות ביחס להסתברות העצמאית של אובייקט לא עורב-לא שחור, מכיוון שאם כל העורבים שחורים, מכיוון שבזכות ההיפותזה, "ירדה האפשרות" של עורבים שאינם שחורים.
התוצאה שנגיע אליה היא שתצפית של עורב שחור מאששת את ההסתברות של H במידה ניכרת, (פחות עורב לבדוק), בעוד שתצפית של לא-עורב לא-שחור מאששת את ההסתברות של H במידה זניחה ביותר (פחות פריט בעולם לבדוק...).
פתרונות לפרדוקסי ההצמדה ע"י קוניונקציה ודיסיונקציה¶
-
הגישה הבייסיאנית מחויבת לעקרונות האישוש הישירים C2 ו-C3 נזכור שהפרדוקסים קשורים לשילוב בין עקרונות האישוש הישירים C2 ו-C3 עם הצורות 'העקיפות' שלהם - D2 ו-D3. לכאורה, שלילה של C2 ו-C3 תפתור את הפרדוקסים, אלא שהשיטה הבייסיאנית מחוייבת להם:
בגדול, הכוונה היא שלפי עקרון האישוש ההסתברותי, עקרון האישוש C2 מתחייב כי הוא נובע/מתחייב ממנו. וכך גם לגבי C3:
> הסבר: טוב, זה לא כזה מורכב. גישה הסתברותית לאישוש מחייבת שנרכיב נוסחה של 'הסתברות מותנית חלקי הסתברות בלתי מותנית'. בכל מצב שבו H או e יכולה להיגזר דדוקטיבית מהשניה, המחלק שלנו הוא 1. חוק בייס קובע שנוסחת החלוקה עבור ההסתברויות של H בעצמה ובבהינתן e שווה לנוסחת החלוקה עבור הסתברויות של e כשלעצמה ובהינתן H. עבור שני ה-Cים, ההחלפה הזו אומרת שבכל מצב בו המחלק יכול להיות 1 (כשיש גזירה דדוקטיבית), עקרון האישוש ההסתברותי PC* מביא אותנו בדיוק למסקנה של C2 או של C3. זאת מכיוון ש-PC* קובע שאישוש מתקיים אם תוצאת החלוקה גדולה מ-1. ומכיוון ש-C2 ו-C3 קובעים שאישוש מתקיים כאשר מתקיימת נביעה או נביעה הופכית (נביעה לוגית מהסוג שמקנה לנו מחלק של 1). כך שלמעשה, כאשר מדובר בנביעה לוגית, העקרון הבייסיאני PC* שקול במשמעות שלו לעקרונות האישוש C2 ו-C3. אז אפשר להגיד שהגישה הבייסיאנית חייבת אותם עבור יחסים של נביעה לוגית בין H ל-e... אבל האם זה אומר שהם חלים ללא הגבלות? אולי יש סייג לפיו הם לא חלים במקרה שאין נביעה? זו לא הטענה של החוברת בשום צורה, אני סתם תוהה.
-
עם זאת, הגישה שוללת את העקרונות העקיפים D2 ו-D3 הסיבה היא שהנוסחאות ההסתברותיות של בייס מפריכות את העקרונות - אין לי כוח להקליד או אפילו להבין כרגע, אבל אצלם את הפרנציפ מהחוברת:
לגבי D2:
לגבי D3:
בשני המקרים - התוצאה שהגענו אליה היא שאם עקרון האישוש ההסתברותי נכון, אז עקרונות האישוש העקיפים D2 ו-D3 אינם נכונים מאחר שהפרדוקסים דורשים שילוב של C2/3 עם D2/3 - למעשה פתרנו את הפרדוקסים...
אוקיי אוקיי, אם אני מבין נכון, ראינו שבמקרה שתצפית e מאששת את היפותזה H, הגישה הבייסיאנית אכן מגיעה למסקנה הזו באמצעות נוסחאות ההסתברות. אבל אם נחיל את אותן נוסחאות על היפותזה T שנובעת לוגית מ-H, נראה שההסתברות המותנית דווקא נמוכה מההסתברות הלא-מותנית. כלומר - חוקי האישוש העקיפים D2 ו-D3 הם הנחה רציונלית, או אפילו הנחה של היגיון בריא, אבל כאשר אנחנו ניגשים לאישוש לפי מודל ההסתברות הבייסיאני אנחנו רואים שהמתמטיקה אינה תומכת בעקרונות אלה. (זה הסבר עבור ההפרכה של D2, עבור D3 זה אותו דבר בהיפוך של e ושל H...).
-
הבעיה של C2 לבדו: כמו שלמדנו, את עקרון האישוש C2 הגישה הבייסיאנית חייבת לקבל, אם ברצונה להאמין בעקרון האישוש ההסתברותי. הבעיה היא שעקורון האישוש C2 לבדו עדיין קובע שתצפית e המתאימה לביטוי a, עדיין תאשש את הביטוי a&b - (פשוט מבלי שנוכל לגזור אישוש של b לבדה באמצעות הכלל D2). איך יכול להיות שתצפית מאששת דבר שכלל אינו קשור לה? בייסיאנים יפתרו את הקושי בטענה שיש הבדל בין דרגות האישוש - כלומר, תצפית המתאימה להיפותזה a, אכן תאשש את היפותזה a&b, אבל במידה פחותה מאשר שהיא תאשש את ההפותזה a בלבד - לכן ההיפותזה a בלבד תהיה העדיפה מבין השתיים (לנוכח התצפית).
באשר ל-C3 לבדו - הרי שאין לנו בעיה... האישוש של דיסיונקציה הכוללת את a ו-b דווקא אינו אבסורדי, מכיוון שאנחנו לא מאששים את האפשרות "שגם וגם" (שאינה נראתה בתצפית), אלא רק את האפשרות של "או-או". נוכל לטעון שהצורה של a בלבד מדויקת יותר, אבל האישוש של "a או b" לנוכח תצפית המתאימה ל-a אינו בעייתי מבחינה לוגית.
אני צריך לעשות לעצמי סדר: מה ההבדל בין עקרון האישוש הכמותי וההסתברותי? ולהבין קצת את המתמטיקה מאחורי הטענה ש-C2 ו-C3 מתחייבות, ובמיוחד מאחורי הטענה שהגישה הסטטיסטית שולל את עקרונות האישוש העקיפים (D2 ו-D3). האם היא מקיימת את אותם היחסים עם C1 ו-D1? // רוב השאלות נפתרו. אני חושב שכדי באמת להבריג את הנושא הזה, עליי להבין את המתמטיקה מאחורי חוק בייס עצמו. (זה אמור להיות מאוד קל, ברמה של משוואה בין שתי מנות חלוקה).
יש עוד דבר אחד שאני צריך לבער לעצמי כאן. החשיבות בחוק בייס היא היכולת להעביר את נוסחת עדכון ההסתברות לצורה שדורשת לדעת רק את ההסתברות של התצפית, במקרה שהיא נגזרת דדוקטיבית מההיפותזה. זה חשוב כי קצת קשה לדעת מה ההסתברות של ההיפותזה שלנו בהינתן התצפית... ועוד בנושא הזה: יש שני "היפוכים" - אחד הוא חוק בייס, ואחד הוא ההחלפה של e ו-hים. האם זה ברור לי? לדעתי כן - ההחלפות באמצעות a ו-b הן כדי להחליף את האיברים שבתוך הביטויים של המחלק והמחולק, וחוק בייס הוא כדי לבסס שיחס השפעה של התצפית על ההיפותזה שווה ערך ליחס ההשפעה של ההיפותזה על התצפית. (מודגש כי זה תמצות טוב).
ביקורות על העמדה הבייסיאנית¶
- הגישה הבייסיאנית היא חזקה אבל לא חפה מביקורות
-
ביקורת ראשונה: הגדרת האישוש במונחי הסתברות הטענה היא כזו: נניח שיש תחרות שחמט עם 20 שחקנים, כאשר שחקן מס' 2 טוב יותר משחקן מס' 1. לפתע, כל השחקנים מלבד שחקנים מס' 1 ו-2 פורשים מהתחרות (טרם שהתקיים משחק אחד). החוברת טוענת: זה ברור שהסיכוי של שחקן מס' 1 לנצח בתחרות עולה. ועם זאת, אינטואיטיבית עדיין ברור ששחקן מס' 1 הולך להפסיד לשחקן מס' 2, ולכן אי אפשר להגיד שהפרישה של שאר השחקנים מאששת את ההשערה ששחקן מס' 1 ינצח בתחרות. אם זה מערער את הגישה ההסתברותית לאישוש, הרי שזה מערער את הגישה הבייסיאנית בכללה.
חייב להגיד שאני לא מבין את זה בכלל... איזה מודל לא-הסתברותי לחוזק אינדוקטיבי קיים באופן כללי? אני מאוד סקרן לקרוא על גישה כזו. עבורי, אינטואיטיבית, ברגע שאנחנו מדברים על "חוזק של השערה", מברור מאליו שאנחנו מדברים במונחים של הסתברות. אם יש איזושהי תפישה של 'חוזק אינדוקטיבי' שהמשמעות שלה היא לא פשוט 'הסתברות סטטיסטית' אני חייב להבין את העמדה הזו. לגבי הדוגמה: השאלה היא אם אנחנו חושבים שיש לשחקן מס' 1 איזשהו סיכוי לנצח את שחקן מס' 2, וכמו כן אם אנחנו חושבים שיש לו איזשהו סיכוי להפסיד למישהו מהשחקנים שפרשו. כל עוד שתי התשובות הן כן - אז הרי שצמצמנו את הסיכוי שלו להפסיד לפני שהוא מגיע לשחק מול מס' 2, והסיכוי שלו לנצח את מס' 2 נשאר זהה, אז הסיכוי שלו לנצח בתחרות כן עלה. אם התשובות הן לא, אז זה לא מאשש, אבל גם לא מעלה את ההסתברות שינצח... מבחינתי זה סינונימי. (צריך להגיד שיש סיכוי שבו שחקן מס' 2 מפסיד למישהו אחר - אבל הדירוג שלנו היררכי ופשטני וכך אם 1 לא יכול להפסיד לאחרים אז ברור ש-2 לא).
-
ביקורת שניה: 'בעיית התצפית הידועה' הביקורת נוגעת למצבים בהם ידוע לנו כבר שתצפית התרחשה, ולכן ההסתברות שלה היא P(e)=1; מכאן נגזר שגם ההסתברות המותנית שלה (e/H - בהנחה שההיפותזה נכונה, כל היפותזה) - היא 1. כך, אם נציב את החלוקה הזו בנוסחת עדכון ההסתברויות הבייסיאנית נראה שההשפעה של תצפית שהתרחשה כבר על ההיפותזה היא בהכרח 'פי 1' - כלומר ללא השפעה.
הבעיה היא שהמדע מאשש את עצמו לפי תצפיות ידועות כל הזמן, ואינטואיטיבית נראה לנו ברור שאם היפותזה יכולה הייתה לחזות התרחשות שאכן קרתה, זה מחזק אותה. לצורך העניין, תורת היחסות היא הראשונה שהצליחה לנבא תנועות ידועות של השמש. וכך להציע להן הסבר. התוצאה הזו היא לא אינטואיטיבית והיא מערערת על עקרון האישוש הבייסיאני, או לפחות מגבילה את היעילות שלו באשר לתצפיות ידועות.
גם פה יש מורכבות. קודם כל אני רוצה להגיד שאני מבין את הגישה הבייסיאנית בתור 'מתודה', מעין 'מכשיר', ולא אצטלה על האמת. במובן הזה, המכונה עובדת עם תצפיות עתידיות. ברור שתצפית עבר הורסת את המתמטיקה, אבל אפשר "להאכיל את המכונה" בתצפית הזו באמצעות חישוב ההשפעה שלה כעתידית, על המצב שבו ההיפותזה הייתה כאשר התצפית התרחשה. אבל מעבר לזה, אני לא בטוח אם הדוגמה של החוברת - הצלחה בניבוי של תצפיות ידועות - היא באמת דוגמה טובה. אם כן, אולי אני לא מסכים עם כל הביקורת. הסיבה היא שלהצליח לנבות תצפית ידועה זה פשוט לעשות אבדוקציה - אני יכול להמציא ממבו ג'מבו שלם שלכאורה יסביר את מהלכי מלחמת העצמאות. השאלה היא על מה זה מבוסס מלבד אישוש של כרונינקה ידועה... אני חשבתי יותר על מצב שבו אנחנו מגלים דבר חדש, כלומר מגלים אותו לאחר ההיפותזה, אבל לפני שחשבנו על ההסתברות שנגלה אותו (לא חשבנו עליו כמסתבר, למשל). נניח: חשבנו שכל הפרות אדומות, לא חיפשנו פרה סגולה אבל מצאנו בכל זאת. עכשיו הוודאות שלה היא 100%. אבל אני לא בטוח שזה חד מספיק - יש מצב שאני פשוט לא מסכים עם הביקורת.
-
נקודות נבחרות מסיכום הפרק:
-
חשוב לזכור עקרון האישוש הבייסיאני, אם התצפית מתחייבת לוגית מההיפותזה, המחלק של הנוסחה הוא 1, וכך צריך לדעת רק את ההסתברות של התצפית על מנת לדעת את ההשפעה שלה על הסתברות ההיפותזה. זה כלי פרקטי קריטי - ברוב המקרים לא נדע מה הסתברויות ההיפותזה, אבל נדע מה הסתברות התצפית (ש לנו אפשרות למדידה מקדימה של ההסתברות הכללית שלה) - וכך נוכל להשתמש בעקרון הבייסיאני עבור כל תצפית המתחייבת בוודאות מההיפותזה שלנו.
-
הבוטום ליין זה שכדי להשתמש בהסתברות סובייקטיבית חייבים להיצמד לאקסיומות ההסתברות
- לעמדה בייסיאנית יש שני מרכיבים
- ההתמודדות עם פרדוקס העורבים היה ע"י כימות, ועם פרדוקסי ההצמד ע"י דחיה של אישוש עקיף
-
לא לשכוח לחזור לשאלות 8-10