מדיאציה: כשהקשר עובר דרך משתנה אחר

המנחה מסתכל לרגע במודל שלך ואומר: "תראי, יש קשר ברור בין שעות החונכות לבין האקלים הכיתתי, אבל אני לא משוכנע שזה הקשר עצמו. אולי המסוגלות העצמית של המורות היא מה שמתווך פה."
ואת מנסה להבין מה הוא בעצם ביקש. כבר נתקלת במשתנה שלישי בקשר בין X ל-Y. אז הוא נקרא ממתן (אינטראקציה). מתווך זה משהו אחר.
שניהם משתנים שלישיים בקשר בין X ל-Y. אבל הם עונים על שתי שאלות שונות לגמרי.
שתי שאלות שונות, אותו "משתנה שלישי"
ממתן עונה על השאלה: למי הקשר חזק יותר. הוא שואל אם הקשר בין X ל-Y תלוי בערך של משתנה אחר, ומשנה את עוצמתו או כיוונו אצל קבוצות שונות.
מתווך עונה על שאלה אחרת: איך הקשר עובד. הוא שואל אם X משפיע על Y דרך משתנה אחר באמצע. מנגנון, לא חלוקה לקבוצות.
במחקר על חונכות, ממתן יישמע ככה: "האם הקשר בין שעות החונכות לאקלים שונה אצל מורות חדשות לעומת ותיקות." מתווך יישמע ככה: "האם החונכות מעלה את המסוגלות העצמית, ודרכה מעלה את האקלים."
שתי שאלות לגיטימיות. שני מבחנים שונים.
המודל: שלושה משתנים, שלושה נתיבים
נסמן את המשתנים שלך:
- X = שעות חונכות פדגוגית בחודש
- M = מסוגלות עצמית של המורה
- Y = אקלים כיתתי מדווח
במודל מדיאציה יש שלושה נתיבים, וכל אחד הוא רגרסיה נפרדת.
נתיב c (סך-הכל): הקשר הגולמי בין X ל-Y, בלי לקחת בחשבון את M. כמה האקלים משתנה ביחידת חונכות אחת, לפני שניכנס לשאלת המנגנון.
נתיב a: כמה X משפיע על M. שעות החונכות מעלות את המסוגלות בכמה?
נתיב b: כמה M משפיע על Y, אחרי שמנטרלים את ההשפעה הישירה של X. שאלת המפתח: בקרב מורות שקיבלו אותו מספר שעות חונכות, האם המסוגלות מנבאת אקלים?
נתיב c' (ישיר): כמה X משפיע על Y אחרי שכבר נטרלנו את M. מה שנשאר מהקשר הישיר, אחרי שהמתווך לקח את חלקו.
השאלה המרכזית: כמה מהקשר c עובר דרך M, וכמה נשאר בנתיב הישיר c'.
הנתונים: 120 מורות
נדגמו 120 מורות מתוכנית M.Ed. דיווחו על מספר שעות חונכות פדגוגית בחודש (טווח 0 עד כ-11), מילאו שאלון מסוגלות עצמית בהוראה (סולם 1 עד 7), ודיווחו על אקלים כיתתי (סולם 1 עד 5).
קורלציות גולמיות:
| חונכות (X) | מסוגלות (M) | אקלים (Y) | |
|---|---|---|---|
| חונכות (X) | 1.00 | 0.66 | 0.62 |
| מסוגלות (M) | 0.66 | 1.00 | 0.77 |
| אקלים (Y) | 0.62 | 0.77 | 1.00 |
שלושת הקשרים חזקים. כעת השאלה היא איך הם מתחברים.
הערה לפני שממשיכים. הנתונים פה נקיים יחסית, וההבדל בין c ל-c' יוצא ברור. במחקרים אמיתיים הקשרים רועשים יותר, וההפרש לבדו לא מספיק כדי לקבוע אם יש תיווך. למבחן עצמו נגיע בשלב 4.
שלב 1: הקשר הסך-הכל (c)
רגרסיה פשוטה: climate ~ mentoring.
התוצאה: c = 0.18, p < .001, R² = 0.38.
כל שעת חונכות נוספת בחודש מנבאת עלייה של 0.18 נקודה באקלים. הקשר ברור. אבל זה לא אומר לנו דרך מה הוא עובד.
שלב 2: נתיב a (חונכות מנבאת מסוגלות?)
רגרסיה: efficacy ~ mentoring.
התוצאה: a = 0.27, p < .001.
כל שעת חונכות נוספת מנבאת עלייה של 0.27 נקודה במסוגלות. החצי הראשון של המסלול מתקיים.
שלב 3: נתיבים b ו-c' (יחד, במודל אחד)
זה הצעד החשוב. אנחנו מריצים רגרסיה שכוללת את שני המנבאים יחד: climate ~ mentoring + efficacy.
התוצאה:
b = 0.47, p < .001c' = 0.055, p = .016R² = 0.62
נתיב b אומר: בקרב מורות שקיבלו אותו מספר שעות חונכות, כל נקודה נוספת במסוגלות מנבאת 0.47 נקודה באקלים. זה מקדם רגרסיה חלקי, כלומר ההשפעה של M על Y כשמשתנה X מנוטרל.
נתיב c' אומר: אחרי שניטרלנו את המסוגלות, מה שנשאר מהקשר הישיר בין חונכות לאקלים הוא 0.055. עדיין מובהק סטטיסטית, אבל קטן בהרבה מהקשר הסך-הכל של 0.18.
הנתיב הישיר התכווץ. זה רמז לתיווך, לא הוכחה. כדי להגיד שיש מנגנון מתווך צריך לבדוק את האפקט העקיף עצמו, וזה השלב הבא.
שלב 4: האפקט העקיף a×b
האפקט העקיף הוא a כפול b. ההשפעה של X על Y שעוברת דרך M.
a × b = 0.273 × 0.468 = 0.128
בדיקת תקינות במודל הליניארי הזה: a×b צריך לצאת שווה ל-c פחות c'.
c − c' = 0.182 − 0.055 = 0.128 ✓
בדוגמה הזאת זאת זהות מתמטית: כשהמודלים נאמדים על אותו מדגם בשלוש רגרסיות OLS, האפקט העקיף שווה בדיוק להפרש בין הקשר הסך-הכל לקשר הישיר. במודלים מתוחכמים יותר (לוגיסטיים, מתווכים מקבילים, אומדים אחרים) הזהות כבר לא בהכרח מדויקת, אבל ב-OLS פשוט היא תקפה ושימושית לבדיקת חישוב.
האם 0.128 שונה מאפס?
מקדם של 0.128 בפני עצמו לא מספיק. צריך לדעת אם הוא שונה מאפס באופן מובהק. בדיקת המובהקות של אפקט עקיף לא נעשית עם t-test רגיל, כי a×b הוא מכפלה של שני מקדמים, וההתפלגות שלו לא בהכרח נורמלית.
השיטה המקובלת היום היא bootstrap. דוגמים שוב ושוב, עם החזרה, מתוך המדגם המקורי. כל פעם בונים מדגם חדש בגודל זהה (אותה N), מריצים עליו את שלוש הרגרסיות, ומחשבים a×b. אחרי 5,000 איטרציות יש לנו התפלגות אמפירית של 5,000 אומדנים שונים של האפקט העקיף, וממנה נגזר רווח הסמך 95%.
אם הטווח לא כולל אפס, האפקט העקיף מובהק.
בדוגמה שלנו, 5,000 איטרציות עם pingouin.mediation_analysis():
a×b = 0.128, 95% CI [0.092, 0.168]
הטווח לא כולל אפס. האפקט העקיף מובהק.
מדיאציה מלאה לעומת מדיאציה חלקית
הצעד האחרון הוא פירוש התמונה הכוללת. השאלה הראשונה היא תמיד על האפקט העקיף ורווח הסמך שלו, ורק אחר כך מסתכלים מה נשאר בנתיב הישיר.
- מדיאציה מלאה: רווח הסמך של a×b לא כולל אפס, ובמקביל c' נאמד קרוב לאפס ולא מובחן ממנו סטטיסטית. מתיישב עם ההנחה שכל הקשר עובר דרך המתווך, אם כי לא מוכיח זאת בוודאות.
- מדיאציה חלקית: רווח הסמך של a×b לא כולל אפס, אבל c' עדיין שונה מאפס במידה משמעותית. חלק מהקשר עובר דרך המתווך, חלק נשאר ישיר.
- אין עדות סטטיסטית לתיווך: רווח הסמך של a×b כולל אפס. במדגם הזה אין עדות ברורה לאפקט עקיף, גם אם תיאורטית המנגנון אפשרי.
בדוגמה שלנו, רווח הסמך של האפקט העקיף הוא [0.092, 0.168] ולא כולל אפס. האפקט העקיף ברור. ובמקביל, c' = 0.055 עדיין מובהק (p = 0.016), כלומר נשאר רכיב ישיר קטן. הפרשנות הסטטיסטית: מדיאציה חלקית, אפקט עקיף ברור ויחד איתו אפקט ישיר קטן ושיורי.
גודל יחסי: a×b חלקי c נותן כ-69.9% (0.128 חלקי 0.182). זה אומר שבמודל הזה, כ-70% מהאומדן של האפקט הכולל עבר במסלול העקיף. זה חישוב אומדן, לא אמירה סיבתית.
בדיווח כתבת: "האפקט העקיף של שעות חונכות על האקלים הכיתתי, דרך מסוגלות עצמית, היה מובהק (a×b = 0.128, 95% CI [0.09, 0.17]). האפקט הישיר שנותר לאחר הכללת המתווך היה קטן אך מובהק (c' = 0.055, p = .016). זאת תבנית של מדיאציה חלקית."
שלוש מלכודות מעשיות
מלכודת ראשונה: לבלבל בין מדיאציה לממתן. אם המנחה אומר "תבדקי מתווך", אל תרוצי לתפעל אינטראקציה. ממתן בודקים עם מכפלה במודל. מתווך בודקים עם שלוש רגרסיות ובדיקה של a×b. שני מבחנים שונים, שתי שאלות מחקריות שונות.
מלכודת שנייה: מדיאציה לא מוכיחה סיבתיות. גם אם a×b מובהק וה-CI לא כולל אפס, זה לא אומר שהוכחת מנגנון סיבתי. מדיאציה היא טענה סטטיסטית, לא טענה סיבתית. כדי לטעון סיבתיות צריך גם תכנון מחקר שמאפשר את זה (ניסוי, מדידה לאורך זמן). כשכותבים, אפשר לומר "תואמת מדיאציה" או "האפקט העקיף היה מובהק", לא "המסוגלות גורמת לאקלים".
מלכודת שלישית: כיוון של M. שאלי את עצמך אם הגיוני ש-X גורם ל-M ולא להפך. אם המסוגלות נמדדה לפני החונכות, או אם תיאורטית היא קודמת לה, המודל הפוך. הסטטיסטיקה תעבוד באותו האופן בשני הכיוונים, אבל ההגיון של הסיפור יקרוס.
בקיצור
מתווך הוא איך הקשר עובד, ממתן הוא אצל מי הקשר חזק יותר. שניהם משתנים שלישיים, שאלות שונות.
מבחן מדיאציה הוא בעצם שלוש רגרסיות: c, a, ו-(b עם c' יחד). מחשבים את האפקט העקיף כ-a×b, ובודקים מובהקות עם bootstrap CI שלא כולל אפס.
בדוגמה שלנו, האפקט העקיף היה 0.128 עם CI של [0.092, 0.168]. כ-70% מהאומדן הכולל עבר במסלול העקיף דרך המסוגלות. השאר נשאר ישיר וקטן.