רגרסיה עם אינטראקציה: כשהקשר תלוי במישהו

הראית למנחה את הרגרסיה המרובה. ותק, עומס, שחיקה. הוא הסתכל בטבלה ואמר: "טוב. ועכשיו תבדקי שהקשר הזה דומה לכל המורות. אולי לחדשות, עומס גבוה פוגע הרבה יותר מאשר לוותיקות שכבר למדו להתמודד."

זאת לא בקשה לעוד מנבא. זאת בקשה לבדוק האם הקשר עצמו תלוי במשתנה אחר. השם הסטטיסטי לזה הוא אינטראקציה. השם המהותי הוא מודרציה.

הדוגמה: עומס מנבא שחיקה, אבל אצל מי?

60 מורות בתכנית M.Ed לחינוך. חצי "חדשות" (עד 5 שנות ותק), חצי "ותיקות" (מעל 5 שנים). כולן מילאו את אותו שאלון: עומס עבודה סובייקטיבי בסולם 1 עד 7, ושחיקה בציון 0 עד 100.

השאלה של המנחה במילים אחרות: האם השיפוע של עומס על שחיקה זהה בשתי הקבוצות, או שעבור החדשות הוא תלול יותר?

ניסיון ראשון: רגרסיה עם שני מנבאים

הצעד הטבעי הראשון הוא להכניס את הקבוצה כמשתנה דמה (0 ותיקות, 1 חדשות) ולהריץ רגרסיה רגילה:

burnout = a + β₁ · workload + β₂ · group_new

הרצת. קיבלת:

מקדם	ערך	SE	t(57)	p
חיתוך	25.05	2.66	9.43	< .001
β(עומס)	5.70	0.61	9.40	< .001
β(חדשות)	8.14	1.95	4.17	< .001

R² = 0.649, R²_adj = 0.637. שני המקדמים מובהקים. הפירוש הזה ("כל נקודה נוספת של עומס מוסיפה 5.7 לשחיקה, והקו של החדשות גבוה ב-8.14 נקודות מזה של הוותיקות") תקף רק בתוך מודל שמניח שהשיפוע של עומס זהה לשתי הקבוצות.

זאת הנחה. שקטה ונסתרת בתוך עצם הבחירה במודל הזה.

ההנחה הנסתרת: שיפוע אחד לכולן

המודל הזה אומר: יש קו אחד שמתאר את הקשר של עומס עם שחיקה, וההבדל בין הקבוצות הוא רק בגובה. החדשות יושבות גבוה יותר על הציר, הוותיקות נמוכות יותר. אבל שני הקווים מקבילים. אותו שיפוע.

זה בדיוק מה שהמנחה ביקש לבדוק. אולי הקווים לא מקבילים. אולי לחדשות הקו תלול יותר.

הוספת איבר אינטראקציה

הפתרון הוא להכניס למודל מנבא חדש: המכפלה של עומס וקבוצה.

burnout = a + β₁ · workload + β₂ · group_new + β₃ · (workload · group_new)

בגלל ש-group_new הוא 0 או 1, המכפלה מתנהגת בצורה פשוטה. אצל הוותיקות (group_new = 0) כל איבר שמוכפל ב-group_new נופל, ונשאר השיפוע β₁. אצל החדשות (group_new = 1) השיפוע הוא β₁ + β₃. כלומר β₃ בדיוק זה: הפרש השיפועים בין הקבוצות.

הרצת מחדש:

מקדם	ערך	SE	t(56)	p
חיתוך	33.47	2.78	12.04	< .001
β(עומס)	3.45	0.68	5.11	< .001
β(חדשות)	-11.14	4.16	-2.68	.010
β(עומס × חדשות)	5.17	1.02	5.04	< .001

R² = 0.759, R²_adj = 0.746.

שלוש תופעות ששווה להתעכב עליהן

ראשונה: β(עומס) ירד מ-5.70 ל-3.45. זו לא טעות ולא רעש. במודל הקודם, β(עומס) היה השיפוע המשותף שהמודל כפה על שתי הקבוצות, שיפוע פשרה אחד לכל המדגם. במודל החדש, β(עומס) הוא השיפוע רק עבור קבוצת הייחוס, כלומר הוותיקות. ברגע שיש אינטראקציה, "המקדם של עומס" כבר לא מדבר על כולן. הוא מדבר על הקבוצה שמקודדת באפס.

שנייה: β(חדשות) התהפך מ-8.14 ל-11.14 מינוס. זו הקפיצה הכי מבלבלת בפלט. לפני רגע ראית שחדשות הן מעל הוותיקות בשחיקה. עכשיו הפלט אומר שחדשות הן 11.14 נקודות מתחת. מה קרה?

מודל	β(חדשות)	מה זה אומר
בלי אינטראקציה	+8.14	הפרש הקבוצות הממוצע, בהנחה שהשיפוע זהה
עם אינטראקציה	-11.14	הפרש הקבוצות בנקודה ש-workload = 0 (מחוץ לסולם)

גם זו לא טעות. β(חדשות) במודל עם אינטראקציה הוא ההפרש בין הקבוצות בנקודה ש-workload = 0. נקודה שלא קיימת בסולם 1-7. זו אקסטרפולציה מתמטית הכרחית לחישוב, אבל לא ערך שמפרשים מהותית. כשיש אינטראקציה, הפרש הקבוצות נע לאורך הציר: הוא -11.14 + 5.17 · workload, וחוצה אפס סביב workload ≈ 2.16. אם רוצים פירוש משמעותי לאפקט הקבוצה, ממרכזים את העומס סביב הממוצע לפני ההרצה ואז המקדם משקף את ההפרש בנקודה ההיא. בלי מירכוז (כמו כאן) הסימן תלוי בנקודת ההתייחסות.

מירכוז (centering): טריק קטן שמסדר את הפלט. כשהמנבא רציף, שווה לחסר ממנו את הממוצע לפני ההרצה, כך שאפס מייצג את הממוצע ולא ערך שנמצא מחוץ לסולם. המכפלה לא משתנה ומבחן האינטראקציה עצמו נשאר זהה, אבל המקדמים הראשיים הופכים לבני-פירוש: כל אחד מהם משקף את האפקט בנקודת הממוצע במקום בנקודה ש-workload = 0. זה גם מפוגג את הבלבול סביב החיתוך והאיברים מסדר נמוך (כמו β(חדשות) שהתהפך פה לסימן מינוס). זאת בקשה נפוצה של מנחים, ולרוב פשוט כדאי לעשות את זה מראש כשעובדים עם מנבאים רציפים.

שתי המשוואות המותאמות מהמודל עם אינטראקציה:

ŷ(וותיקות) = 33.47 + 3.45 · workload
ŷ(חדשות) = 22.33 + 8.62 · workload

הקווים מצטלבים סביב workload ≈ 2.16, כלומר קרוב לחלק התחתון של הסולם. מעליה החדשות בשחיקה גבוהה יותר. רוב הנתונים שלך נמצאים מעל הנקודה הזאת, וזה בדיוק מה שאת רואה בגרף.

שלישית: β(עומס × חדשות) = 5.17, מובהק. זה ההפרש בשיפועים. עבור הוותיקות, השיפוע הוא 3.45. עבור החדשות, השיפוע הוא 3.45 + 5.17 = 8.62. עלייה של נקודה אחת בעומס קשורה בקרב הוותיקות לעלייה של 3.45 נקודות שחיקה, ובקרב החדשות לעלייה של 8.62. זאת המודרציה שהמנחה שאל עליה.

איך לבדוק אם האינטראקציה תרמה

שתי דרכים, ושתיהן אומרות אותו דבר. הן זהות כאן כי הוספנו רק פרמטר אחד למודל, את איבר האינטראקציה.

הראשונה: ה-t של מקדם האינטראקציה. t(56) = 5.04, p < .001. מובהק. כלומר יש עדות סטטיסטית לכך שהפרש השיפועים שונה מאפס, בכפוף להנחות המודל.

השנייה: מבחן F-change בין שני המודלים. ההפרש ב-R²:

ΔR² = 0.7586 - 0.6489 = 0.1097

זה תורגם ל-F-change(1, 56) = 25.44, p < .001. אינטראקציה תורמת 11 נקודות אחוז של שונות מוסברת מעבר למה שהמודל בלי אינטראקציה כבר הסביר.

(אם זה נראה מוכר מהמאמר על רגרסיה מרובה, זה לא במקרה. בדיוק כמו שראינו שם: כשמוסיפים מנבא יחיד, F-change זהה ל-t² של אותו מנבא. כאן 5.044² ≈ 25.44. שני המספרים אומרים אותו דבר.)

לראות את זה בעיניים

ההסבר המתמטי ייתפס טוב יותר אחרי שמסתכלים בגרף. שתי קבוצות, שני קווים, שיפועים שונים.

Two regression lines: experienced teachers (gentle slope) vs new teachers (steep slope)

הקו של הוותיקות (כחול) קרוב לאופקי יחסית. הקו של החדשות (אדום) תלול. הם מצטלבים סביב workload = 2.16 כפי שחישבנו למעלה. מתחת לנקודה הזאת, הוותיקות בשחיקה גבוהה יותר. מעליה, החדשות. זה בדיוק מה שהמספרים אמרו, פשוט גרפית.

איך לכתוב בפרק הממצאים

על מנת לבחון האם הקשר בין עומס עבודה לשחיקה ממותן על ידי ותק בהוראה (חדשות לעומת ותיקות), נערכה רגרסיה היררכית. בשלב הראשון נכללו עומס וקבוצה כמנבאים עיקריים, ובשלב השני נוסף איבר האינטראקציה. תוספת האינטראקציה הסבירה 11.0 נקודות אחוז נוספות של שונות, ΔR² = .110, F-change(1, 56) = 25.44, p < .001. מקדם האינטראקציה היה β = 5.17, SE = 1.02, t(56) = 5.04, p < .001. השיפוע של עומס על שחיקה היה תלול יותר אצל המורות החדשות (β = 8.62) מאשר אצל הוותיקות (β = 3.45).

שלושה משפטים. המסגור התאורטי, תוצאת מבחן F-change, פירוט השיפועים הנפרדים. את לא חייבת לדווח את כל ארבעת המקדמים של המודל המרובה אם איבר האינטראקציה הוא מה שעניין את השאלה. השיפועים הנפרדים בכל קבוצה ידברו לקורא ישירות יותר.

סייגים

שלוש הערות לפני שאת מריצה את זה על הנתונים שלך.

הדוגמה כאן היא סימולציה דידקטית. שתי הקבוצות בגודל זהה (30 לכל אחת), והעומס מתפזר באותה צורה בשתיהן (r = -0.004). זה מבודד את ההבדל בשיפועים מכל הטיה אחרת. נתוני מחקר אמיתיים כמעט אף פעם לא יהיו כל כך מאוזנים, וייתכן שתידרשי לבחון גם הבדלי התפלגות לפני שאת מסיקה על האינטראקציה.

הדוגמה כאן עם משתנה דמה בינארי. זה המקרה הנקי ביותר, כי הקווים מצטיירים בצורה ישירה ומקדם המכפלה הוא בדיוק הפרש השיפועים. כשהמשתנה הממתן הוא רציף (למשל ותק בשנים במקום קבוצה בינארית), מקדם המכפלה מתאר משהו אחר: כמה השיפוע של עומס משתנה לכל יחידת ותק נוספת. הדרך המקובלת להציג תוצאה כזאת היא לבחור שלוש רמות ייצוגיות של הממתן (ממוצע, ממוצע מינוס סטיית תקן, ממוצע פלוס סטיית תקן) ולשרטט שלושה קווים. מקובל גם למרכז את המנבא הרציף לפני יצירת המכפלה. זה לא משנה את מבחן האינטראקציה עצמו אלא משפר את הפירוש של האפקטים הראשיים ולעתים מצמצם קולינאריות לא-מהותית בין המכפלה למרכיביה. נושא לפוסט אחר.

אינטראקציה מובהקת לא בהכרח אומרת קשר חזק. במדגם גדול גם הפרש קטן בשיפועים יוצא מובהק. תמיד צריך להסתכל גם על גודל ההפרש בשיפועים עצמם, לא רק על ה-p.

הוספת איבר אינטראקציה משכפלת מספר מקדמים. כל מנבא נוסף שאת רוצה לבדוק את תפקידו הממתן דורש איבר אינטראקציה משלו, ומספר הצירופים האפשריים גדל מהר. כלל אצבע סביר: לבדוק אינטראקציה רק כשיש תאוריה או שאלת מנחה שמצדיקה אותה, לא לזרוק את כל הצירופים האפשריים ולקוות שמשהו ייצא מובהק. הגישה השנייה מובילה לדיווח של ממצא שהוא בעיקר הטיית בחירה.

בקיצור

אינטראקציה בודקת האם הקשר של מנבא אחד עם המשתנה התלוי תלוי בערך של מנבא אחר. מוסיפים את המכפלה שלהם למודל, ובודקים אם המקדם שלה מובהק (או, שקול, אם F-change מובהק). בקבוצה בינארית מקדם המכפלה הוא הפרש השיפועים. עבור ממתן רציף, הוא קצב השינוי של השיפוע לכל יחידת ממתן.

השלב הבא, שיהיה רלוונטי כשתעבדי על מודלים מורכבים יותר: מה קורה כשהממתן הוא רציף, איך לפרש את המקדמים אז, ומתי כדאי לעבור למודל היררכי לגמרי. זה לפוסט אחר.