ANOVA מעורבת: התערבות מול ביקורת, לפני ואחרי

הגעת לפרק הממצאים של עבודת התזה. את לא משווה הפעם בין שלוש קבוצות, כמו אצל המורות מהפוסט על גודל אפקט ל-ANOVA, ולא בין ארבעה תאי גיל × שיטה כמו בדו-כיווני של אתמול. את עושה התערבות.

30 מורות. 15 בקבוצת ההתערבות, 15 בקבוצת ביקורת. מילאת שאלון שחיקה לפני, העברת את התוכנית, ואז שאלון שחיקה אחרי. ציון שחיקה גבוה = יותר שחיקה; ירידה בציון = שיפור. שני גורמים: קבוצה (בין-נבדקיות), זמן (תוך-נבדקיות). שאלה אחת בלב המחקר: האם ההתערבות באמת עזרה.

המנחה אמר: "תריצי ANOVA במודל מעורב."

שאלה ראשונה. למה לא פשוט שני מבחני t מזווגים, אחד לכל קבוצה.

למה לא שני מבחני t מזווגים

שני מבחני t מזווגים יענו לך על שתי שאלות נפרדות. "האם בקבוצת ההתערבות השחיקה השתנתה מלפני לאחרי?" ו"האם בקבוצת הביקורת השחיקה השתנתה מלפני לאחרי?". כל אחת בנפרד. ובדוגמה שלך, אם תריצי את שני המבחנים, תקבלי תוצאות שממש מפתה לקפוץ מהן למסקנות: בקבוצת ההתערבות t(14) = 6.67, p < 0.001, ירידה דרמטית. בקבוצת הביקורת t(14) = 1.24, p = 0.24, לא מובהקת.

הקריאה האינטואיטיבית: "ההתערבות ירדה, הביקורת לא ירדה, אז ההתערבות עבדה." אבל זו לא טענה קפדנית.

אם השאלה היא "האם הירידה בקבוצת ההתערבות גדולה יותר מהירידה בקבוצת הביקורת באופן מובהק?", אף אחד משני המבחנים האלה לא בודק את זה. הם בודקים כל קבוצה לחוד, מתייחסים לקבוצה השנייה כאילו היא לא קיימת. וכשלא משווים ישירות, אי אפשר לקבוע שההפרש בין הירידות מובהק.

ועוד דבר. כל מבחן ב-α = 0.05 מוסיף סיכון מצטבר לטעות. שני מבחנים נפרדים על אותם נתונים, באותו הקשר תיאורטי, מעלים את ההסתברות לטעות מסוג ראשון לפחות באחד מהם. לא הרבה. אבל לא 5%.

למה לא מבחן t עצמאי על ציוני השינוי

גישה חכמה יותר: תחשבי לכל מורה את ההפרש post פחות pre. את ציון השינוי שלה. אחר כך תריצי מבחן t עצמאי בין שתי הקבוצות על השינויים. בדיוק שאלה אחת, נקייה: "האם השינוי הממוצע בהתערבות שונה מהשינוי הממוצע בביקורת?". במספרים שלך: שינוי ממוצע בהתערבות -13.81, שינוי ממוצע בביקורת -3.15.

זה עובד. ויתרה מזו, התוצאה יוצאת בדיוק זהה למבחן האינטראקציה ב-ANOVA המעורבת. במקרה הזה t(28) = -3.251, ו-t² = 10.57, וזה אותו F של האינטראקציה. לא צירוף מקרים. במערך עם שתי נקודות זמן בדיוק, אלה אותם חישובים.

אז למה בכל זאת ANOVA מעורבת. שתי סיבות.

הראשונה: ברגע שיהיו לך שלוש נקודות זמן או יותר (pre, mid, post), הגישה של ציוני השינוי מאבדת תוקף. אין יותר שינוי יחיד לחשב, כי "השינוי" יכול להיות pre→mid, pre→post או mid→post. ANOVA מעורבת מטפלת בזה באופן טבעי.

השנייה: ANOVA מעורבת נותנת לך גם את האפקטים הראשיים יחד עם האינטראקציה, במבחן אחד מאורגן. הדוח שלך נראה כמו דוח של מערך מעורב, לא כמו תיקון אד-הוק.

מה ANOVA מעורבת עושה

היא מפרקת את השונות הכוללת לרכיבים. בדיוק כמו בדו-כיווני, אבל עכשיו אחד הגורמים הוא בין-נבדקיות (קבוצה) והשני הוא תוך-נבדקיות (זמן). כל מורה תורמת שתי נקודות לניתוח, לפני ואחרי, וזה משנה את החישוב של השגיאה.

שלושה אפקטים נבדקים:

אפקט ראשי של קבוצה: האם ההתערבות והביקורת שונות בממוצע, כשמאחדים את שתי נקודות הזמן.
אפקט ראשי של זמן: האם pre ו-post שונים בממוצע, כשמאחדים את שתי הקבוצות.
אינטראקציה group × time: האם דפוס השינוי בזמן שונה בין הקבוצות.

כל אחד מהם מקבל F משלו, p משלו, וגודל אפקט משלו (partial η²). שלושה מבחנים, מודל אחד.

קודם המספרים

הממוצעים בכל תא:

	Pre (M, SD)	Post (M, SD)	שינוי
Intervention (n=15)	62.46 (9.96)	48.65 (8.51)	-13.81
Control (n=15)	59.59 (7.76)	56.45 (9.03)	-3.15
שולי (זמן)	61.03	52.55	-8.48

שני דברים בולטים. הירידה הממוצעת בזמן, על שתי הקבוצות יחד, היא 8.48 נקודות. וההפרשים בירידה התיאורית בין הקבוצות גדולים: −13.81 בקבוצת ההתערבות לעומת −3.15 בקבוצת הביקורת. האם הפער הזה מובהק סטטיסטית, או שהוא יכול להתקבל גם בלי השפעת התערבות אמיתית. זו השאלה שמבחן האינטראקציה עונה עליה.

טבלת ה-F

מקור	SS	df	MS	F	p	partial η²
קבוצה	91.22	1, 28	91.22	0.78	0.384	0.027
זמן	1077.95	1, 28	1077.95	26.72	< 0.001	0.488
קבוצה × זמן	426.47	1, 28	426.47	10.57	0.003	0.274

מכיוון שהאינטראקציה מובהקת, היא השאלה המרכזית בקריאת הטבלה. את האפקטים הראשיים נסקור בקצרה, רק כדי להראות איך הם לא שאלת המחקר, ואיך הם יכולים להטעות אם קוראים אותם בלי הקשר.

אפקט הזמן מובהק וגדול, partial η² = 0.488. זה גודל אפקט גדול, ולכן מפתה לומר "כל המורות יחד ירדו בשחיקה". אבל הירידה הזו נובעת ברובה מקבוצת ההתערבות. הביקורת בקושי זזה. האפקט הראשי של זמן מאחד את שתי הקבוצות לממוצע אחד, ובכך מסתיר בדיוק את ההבדל שמעניין אותך.

אפקט הקבוצה: לא מובהק, partial η² = 0.027. הממוצע השולי של קבוצת ההתערבות, על פני pre ו-post יחד, הוא 55.56. של הביקורת, 58.02. די דומים. וזה הגיוני: הקבוצות התחילו דומות, ההתערבות הורידה את הקבוצה שלה ב-post, אבל כשמאחדים pre ו-post יחד, הירידה מתפזרת על שתי נקודות והפער הממוצע מתקטן.

וכאן הנקודה שצריך לשים לב אליה. אסור להסיק מאפקט הקבוצה הלא-מובהק "ההתערבות לא עבדה, אין הבדל בין הקבוצות". זו קריאה שגויה. האפקט הראשי של קבוצה מתעלם מציר הזמן. הוא לא בודק את שאלת המחקר. שאלת המחקר נמצאת באינטראקציה.

האינטראקציה

F(1, 28) = 10.57, p = 0.003, partial η² = 0.274. אינטראקציה מובהקת ובסדר גודל ניכר. דפוס השינוי בזמן שונה באופן מובהק בין שתי הקבוצות.

הגרף משקף את זה. שני קווים, התחלה דומה, סיום שונה. הקו של ההתערבות צולל; הקו של הביקורת כמעט אופקי. הם לא מצולבים, אבל הם בבירור לא מקבילים. אינטראקציה לא חייבת להיות צולבת כדי להיות מובהקת. מספיק שהמרחקים בין הקבוצות נפתחים או נסגרים לאורך הזמן.

אחרי שהאינטראקציה התבססה, אפשר לרדת לפירוק שלה. מבחני ה-t המזווגים שדיברנו עליהם בהתחלה משמשים כעת כ-simple effects: בתוך קבוצת ההתערבות, t(14) = 6.67, p < 0.001, ירידה מובהקת מאוד. בתוך קבוצת הביקורת, t(14) = 1.24, p = 0.24, לא התקבלה עדות מספקת לשינוי מובהק. שני המבחנים האלה מפרקים את האינטראקציה למרכיביה. הם לא יכולים להחליף אותה: דפוס של "מובהק כאן ולא שם" אינו, כשלעצמו, הוכחה שהקבוצות שונות זו מזו בדפוס השינוי. זה תפקיד מבחן האינטראקציה.

הנחות שכדאי לבדוק לפני

לפני שכותבים את הטענה לפרק הממצאים, נהוג לוודא שלוש הנחות. נורמליות של ההפרשים בתוך-נבדקיים בכל קבוצה. היעדר חריגים מובהקים שמעקמים את הממוצעים. ושוויון שונויות של ציוני השינוי בין הקבוצות, מבחן Levene על וקטור ההפרשים post פחות pre. במדגם של 30, סטיות מתונות מהנורמליות בדרך כלל לא הופכות את הניתוח לפסול, אבל חריג בודד יכול לעקם את הממוצעים מספיק כדי להפוך את התמונה. שווה לבדוק לפני שמסיקים.

איך לכתוב את זה בפרק הממצאים

ניתוח שונות במודל מעורב נערך לבחינת השפעת ההתערבות על השחיקה, עם קבוצה (התערבות, ביקורת) כגורם בין-נבדקיות וזמן (pre, post) כגורם תוך-נבדקיות. נמצא אפקט ראשי מובהק לזמן, F(1, 28) = 26.72, p < 0.001, partial η² = 0.488. האפקט הראשי של קבוצה לא היה מובהק, F(1, 28) = 0.78, p = 0.384, partial η² = 0.027. האינטראקציה קבוצה × זמן הייתה מובהקת, F(1, 28) = 10.57, p = 0.003, partial η² = 0.274, מה שמעיד על דפוס שינוי שונה בין הקבוצות. ניתוח אפקטים פשוטים הראה ירידה מובהקת בשחיקה בקבוצת ההתערבות, t(14) = 6.67, p < 0.001, ולא בקבוצת הביקורת, t(14) = 1.24, p = 0.24.

זהו. שלוש שורות של נתונים, וטענה אחת קפדנית שמגובה בהן.

הערה אחת על ספריות וכדוריות

ספרים על ANOVA חוזרת ידברו על מבחן Mauchly לכדוריות (sphericity), ועל תיקוני Greenhouse-Geisser ו-Huynh-Feldt. במודל המעורב הזה, עם שתי נקודות זמן בלבד, הסוגיה לא רלוונטית. כדוריות נדרשת רק כשיש שלוש רמות או יותר לגורם תוך-נבדקיות. עם שתיים בדיוק, ההנחה מתקיימת אוטומטית. SPSS עדיין יציג שורת Mauchly בפלט, אבל היא תהיה ריקה או תציג ערכים בנאליים.

זה משתנה אם המחקר שלך כולל pre, mid ו-post. שלוש נקודות זמן או יותר על אותם נבדקים פותחות עולם של בדיקות הנחות שצריך לעמוד בהן. נגיע לזה מחר, בANOVA חוזרת חד-כיוונית: אותם נבדקים, גורם תוך-נבדקיות אחד, שלוש רמות או יותר. שם Mauchly נכנס לעניינים באמת.