מה זה p-value? הסבר פשוט עם דוגמה אמיתית
הסבר פשוט ומעמיק על p-value עם דוגמה אמיתית, גרפים, ותובנה שתשנה את הדרך שבה את/ה קורא/ת תוצאות סטטיסטיות.
מאמרים קצרים על ניתוח נתונים, שיטות מחקר וסטטיסטיקה. בעברית פשוטה.
הסבר פשוט ומעמיק על p-value עם דוגמה אמיתית, גרפים, ותובנה שתשנה את הדרך שבה את/ה קורא/ת תוצאות סטטיסטיות.
גודל אפקט, Cohen d, וסטיית תקן. הסבר עם גרפים על למה "מובהק" ו"גדול" הם שני דברים שונים, ולמה שניהם צריכים להופיע בדוח התזה.
הסבר על מקדם המהימנות הפנימית: מה α מודדת, איזה ערך נחשב מספיק, ואיך לזהות פריט שמושך את הציון כלפי מטה.
ההבדל בין מהימנות לתוקף, עם דוגמה אחת שמראה איך שאלון יכול להיות עקבי לחלוטין ועדיין למדוד דבר אחר ממה שכתוב על השער.
דוגמה אחת מההתחלה ועד הסוף שמראה איך נקודה אחת חריגה הופכת מתאם של פירסון לאפס, וספירמן ממשיך לספר את הסיפור הנכון.
דוגמה אחת מההתחלה ועד הסוף שמראה איך אותם נתונים בדיוק יכולים להפוך מ-p < .001 ל-p = .058, רק כי בחרת את המבחן הלא נכון.
ההבדל בין p-value לרווח סמך, באמצעות דוגמה מההתחלה ועד הסוף. p-value אומר אם הנתונים רחוקים מאפס, רווח סמך אומר באיזה תחום של ערכים.
מה אומרת תוצאה גבולית של Shapiro-Wilk לפני מבחן t-מזווג, מתי המבחן עדיין תקף בקירוב, איך מצרפים בדיקת רגישות באמצעות Wilcoxon, ואיך לדווח על כל זה בעבודה.
מה זה כוח סטטיסטי, איך הוא מתקשר ל-N ולגודל האפקט, ומה לעשות כשמגלים שהמחקר שלך לא חזק מספיק כדי לזהות את ההשפעה שאת מחפשת.
תוצאה לא מובהקת היא לא "אין אפקט". איך לקרוא אותה, איך לדווח על רווח סמך וניתוח רגישות, ואיך לכתוב משפט בדיון שמסביר בדיוק מה הראית ומה היה ביכולת המדידה שלך לראות.
מבחן t עושה דבר אחד פשוט: סיגנל חלקי רעש. איך בונים את t צעד-צעד, איך שלושה גורמים (ההפרש, הפיזור, גודל המדגם) מזיזים אותו, ולמה דרגות החופש קובעות מול מה משווים את הערך שיצא.
איך עובד מבחן ANOVA, למה לא רצים שלושה מבחני t במקום, ומה זה אומר כשה-F יצא מובהק. דוגמה עם נתונים אמיתיים של תחושת מסוגלות של מורות בשלוש שכבות גיל.
אחרי ANOVA מובהק, צריך לדעת בין אילו קבוצות יושב ההבדל. הסבר על מבחני post-hoc, על תיקון Bonferroni ועל Tukey HSD, עם דוגמה ממשיכה של מורות יסודי, חט"ב ותיכון.
η² מנפח את האפקט במדגמים קטנים. ω² מתקן את ההטיה הזאת. וכשהמנחה מבקש Cohen's d לזוגות, איך מחשבים אותו וכיצד הוא מתייחס לתוצאת ה-post-hoc. דוגמה ממשיכה של מורות יסודי, חט"ב ותיכון.
שני גורמים, שלושה מבחני F, ואינטראקציה צולבת שמשנה לחלוטין איך לקרוא את האפקטים הראשיים. כאן partial η² נפרד מ-η² לראשונה, וסכום ה-partial η²-ים יכול לעבור 1 בלי שזה טעות.
קבוצת התערבות מול ביקורת, מדידה לפני ואחרי. למה שני מבחני t מזווגים לא עונים על שאלת המחקר, למה t עצמאי על ציוני השינוי כן עונה אבל מאבד תוקף ב-3 נקודות זמן, ואיך ANOVA מעורבת מאחדת את הכול. אינטראקציה group × time כשאלה המרכזית.
אותן 25 מורות נמדדו בשלוש נקודות זמן לאורך הסמסטר. למה לא שלושה מבחני t מזווגים, מה הניתוח מנכה משונות השגיאה, ולמה כדוריות חשובה. מבחן Mauchly, תיקון Greenhouse-Geisser, וההבדל בין לתעד את בדיקת ההנחה לבין לדווח את התוצאה המתוקנת.
40 מורות, ותק והוראה לעומת שחיקה. הקורלציה אומרת שיש קשר וכמה הוא חזק. רגרסיה הופכת את הקשר למשוואה: שיפוע ביחידות מקוריות, חיתוך, R², ותחזית מספרית לכל ערך של X. למה β המעוגל לא מייצר תחזית מדויקת, ומה השארים אומרים על תקפות המודל.
אותן 40 מורות מאתמול, עכשיו עם עומס עבודה סובייקטיבי כמנבא שני. למה β של ותק זז מ--1.19 ל--1.32, איך לקרוא מקדם "כשמחזיקים את האחר קבוע", מה ΔR² ומבחן F-change באמת אומרים (ומתי הם זהים ל-t), למה צריך β מתוקנן כשהסקאלות שונות, ואיך לבדוק מולטיקולינאריות עם VIF.
המנחה אומר "טוב, אבל זה אותו דבר אצל מורות חדשות וגם אצל ותיקות?". זאת שאלה של מודרציה. הפוסט מפרק את זה ב-60 מורות עם עומס סובייקטיבי ושחיקה, מראה למה β של עומס יורד מ-5.70 ל-3.45 כשמכניסים אינטראקציה, למה β של קבוצה מתהפך מ-+8.14 ל--11.14, איך לחשב את נקודת ההצטלבות בין שני הקווים, ואיך לבדוק את האינטראקציה דרך ה-t או דרך F-change.
המנחה אומר "אולי המסוגלות מתווכת את הקשר" ואת לא בטוחה מה זה אומר ומה ההבדל בין מתווך לממתן. הפוסט מפרק את זה ב-120 מורות עם שעות חונכות, מסוגלות עצמית, ואקלים כיתתי, מראה איך c יורד מ-0.18 ל-c' = 0.055 כשמוסיפים את המתווך, מחשב a*b = 0.128 עם bootstrap CI של [0.092, 0.168], ומסביר למה הסיווג של מלא/חלקי/אין מדיאציה מתחיל מה-CI של האפקט העקיף ולא מהירידה ב-c.
המנחה אמר "תבדקי Cook's D". הפוסט מסביר את שלושת המדדים שחשוב להבדיל ביניהם, leverage, שארית מתוקננת ו-Cook's distance, עם דוגמה של 50 מורות ושלוש נקודות מסומנות שכל אחת חורגת באופן שונה. למה X קיצוני לבדו לא בעיה, למה שארית גדולה לבדה לא בעיה, ולמה רק בצירוף שלהם נוצרת תצפית שמזיזה את β פי 50.
המנחה כתב "בדקת הנחות?". הפוסט לוקח דוגמה של 60 מורות שבה הטבלה כאילו אומרת שוותק לא מנבא שביעות רצון, ומראה איך VIF חושף מולטיקולינאריות חמורה בין גיל לוותק שמסתירה אפקט אמיתי. עובר על חמש בדיקות אבחון (מולטיקולינאריות, לינאריות, נורמליות השאריות, הומוסקדסטיות, עצמאות), עם שתי בעיות חבויות ושתי דרכי תיקון: הורדת מנבא מתואם ו-HC3 להטרוסקדסטיות.