עצמאי או מזווג: איזה מבחן t עשית בפועל

אחיה בוטמן
אחיה בוטמן
3 דקות קריאה

שלחת למנחה את ה-t-test, והוא חזר עם שאלה: "זה מבחן עצמאי או מזווג?" את חושבת רגע, מנסה להיזכר. שני השמות האלה קיימים בראש שלך כשני שמות, בלי הבדל ברור. בחרת אחד כי SPSS הציע אותו ראשון, או כי כך עשתה החברה שהריצה ניתוח דומה. עכשיו את צריכה לדעת אם הבחירה היתה נכונה.

זו לא שאלה דקדוקית. הבחירה יכולה להפוך מסקנה מובהקת ללא מובהקת, על אותם נתונים בדיוק.

ההבדל

מבחן t עצמאי משווה שתי קבוצות שונות של אנשים. כיתה א' מול כיתה ב'. בנים מול בנות. קבוצת ניסוי מול קבוצת ביקורת. כל תלמידה מופיעה בקבוצה אחת בלבד.

מבחן t מזווג משווה זוגות מקושרים. לרוב אותה תלמידה בשתי נקודות זמן: לפני התערבות מול אחריה, שאלון בתחילת הסמסטר מול סופו. כל שורה בעמודה הראשונה מקושרת לשורה ספציפית בעמודה השנייה.

השאלה שמכריעה: האם השורות מקושרות בקישור מחקרי אמיתי, וההפרש בתוך זוג הוא בעצמו מספר משמעותי? אם כן, מזווג. אם לא, עצמאי.

הדוגמה

נניח שאת מורה לקריאה בכיתה ה', ועשית עבודת תזה על תוכנית התערבות בת שש שבועות. דגמת 25 תלמידות מהכיתה שלך, בדקת את כל אחת בתחילת ההתערבות, העברת את התוכנית, ובדקת אותן שוב בסוף. אותן תלמידות, אותו מבחן, פעמיים. זה תכנון של מדידות חוזרות.

עשרים וחמישה קווים, כל קו מחבר את הציון של תלמידה לפני ההתערבות לציון שלה אחרי. בנתוני הדוגמה רוב התלמידות השתפרו.

הציון הממוצע לפני ההתערבות: M = 69.64, SD = 8.99. אחרי: M = 74.52, SD = 8.80. הפרש ממוצע של 4.88 נקודות.

הניתוח הנכון: מבחן t מזווג

הוא בודק לכל תלמידה את ההפרש בין הציון שלה אחרי לציון שלה לפני, ושואל אם ממוצע ההפרשים האישיים שונה משמעותית מאפס.

t(24) = 9.10, p < .001, 95% CI [3.77, 5.99].

במילים: ההפרש הממוצע, 4.88 נקודות, רחוק מאוד מאפס ביחס לטעות התקן שלו. כל כך רחוק שהסיכוי לקבל אותו במקרה, אם בעצם אין שינוי באוכלוסייה, קטן מאחד מאלף.

אותו דבר עם המבחן הלא נכון

נניח שעל אותם נתונים בדיוק היית מריצה מבחן t עצמאי, כאילו "לפני" ו"אחרי" הן שתי קבוצות נפרדות של תלמידות זרות. אותם 50 ציונים, אותו פער ממוצע של 4.88 נקודות, רק בלי לקשר בין הזוגות.

אותם ציונים מפוזרים בשתי קבוצות נפרדות. הקווים שחיברו תלמידה לעצמה נעלמו.

t(48) = 1.94, p = .058.

אותו פער. אותם נתונים. ה-p-value קופץ מ-< .001 ל-.058 וחוצה את סף המובהקות לצד הלא מובהק. אם תדווחי את הניתוח הזה, את כותבת שלא נמצאה עדות מובהקת לשיפור. לפי הנתונים שלך, זאת החמצה.

שני סרגלים אופקיים. מבחן עצמאי מגיע ל-t=1.94. מבחן מזווג מגיע ל-t=9.10. אותם נתונים, ערכי t שונים בסדר גודל.

למה זה קורה

כשאת משווה את הציונים של 25 תלמידות שונות לפני, ואת אותם 25 הציונים אחרי, חלק גדול מהשונות בין הציונים הוא בעצם הבדלים בין תלמידות. תלמידה חזקה תקבל 85 לפני ו-89 אחרי. תלמידה חלשה תקבל 55 לפני ו-60 אחרי. שתיהן השתפרו ב-4-5 נקודות, אבל הן נראות שונות לגמרי אחת מהשנייה.

המבחן העצמאי "רואה" את ההבדלים בין התלמידות ומפרש אותם כרעש. הוא מתקשה למצוא הבדל ממוצע של 4.88 בתוך פיזור של עשרות נקודות בין התלמידות.

המבחן המזווג עושה משהו אחר. ברגע שכל תלמידה משמשת ביקורת לעצמה, השונות בין התלמידות יוצאת מהמשוואה. נשארת רק השונות בתוך התלמידה: כמה הציון שלה השתנה. בנתונים האלה, המתאם בין לפני לאחרי גבוה מאוד (r = 0.955), כך שההפרשים האישיים מקובצים בצמוד סביב הממוצע, וטעות התקן של ההפרש קטנה מאוד.

בשני המבחנים המונה זהה: 4.88. ההבדל הוא במכנה. במבחן המזווג, טעות התקן היא 0.54. במבחן העצמאי, 2.52. כמעט פי 5 גדולה. זה כל הסיפור.

איך לבחור

שאלה אחת מכריעה את ההחלטה: אם הייתי מערבבת באקראי את הסדר באחת העמודות, האם הניתוח עדיין תקף?

אם הערבוב לא משנה כלום, הקבוצות באמת בלתי תלויות. עצמאי. אם הערבוב הורס את משמעות הנתונים, יש קישור בין השורות, ואסור לאבד אותו. מזווג.

בתזה שלך, אם יש לך לפני ואחרי, או שאלון שניתן פעמיים לאותם משתתפים, את במזווג. אם יש לך קבוצות שונות לחלוטין שמושוות אחת לשנייה, את בעצמאי. הבחירה היא לא טכנית, היא נובעת מאיך שהמדידה נעשתה. אם המנחה שאל "עצמאי או מזווג", הוא בודק אם הניתוח שלך תואם את התכנון שתיארת בפרק השיטה. ברגע שאת יודעת איזה תכנון יש לך, התשובה ברורה.

רוצה את זה כבר מאחורייך?

שולחים נתונים ומתודולוגיה, מקבלים דוח ממצאים מלא תוך 48 שעות.