ניתוח נתיבים

ניתוח נתיבים מהווה הרחבה של מודל הרגרסיה ומשמש לבחון את התאמת טבלת הקורלציות עם 2 או יותר מודלים אחרים. הרגרסיה מבוצעת לכל משתנה בנפקד במודל כתלוי באחרים שהמודל מאתר כסיבות. משקלי הרגרסיה מושווים עם טבלת הקורלציות למשתנה ומדדי התאמת המודל (קרי שונות מוסברת ומובהקות). המודל הטוב ביותר נבחר לקידום התיאוריה.

מודל נתיבים (Path model.) – דיאגרמה המציגה משתנים בלתי תלויים, מתווכים ותלויים. חיצים בודדים מסמנים קשרים סיבתיים בין משתנים חיצוניים או  מתווכים. לעיתים עובי החץ מעיד על עוצמת המקדמים של הנתיב

נתיבים סיבתיים למשתנה מסויים – הללו כוללים: 1. נתיב ישיר ע"י חיצים המובלים אל המשתנה 2. נתיבים תואמים ממשתנים חיצוניים, בעלי קורלציה עם משתנים אחרים, שיש להם חיצים המובלים למשתנה  מסויים. לדוגמה הציור הבא:



למודל ישנם שלושה משתנים חיצוניים הקשורים בינהם A,B,C , ומשתנים פנימיים D,E. נתיבים רלבנטיים: הנתיבים הסיבתיים הרלבנטיים ל- D הם הנתיבים A>>D B>>D והנתיבים המבטאים קשר מקדים סיבתי הדדי: מ- B>>A>>D, C>>A>>D ו – C>>B>>D נתיבים לא רלבנטיים: נתיבים בעלי שתי קורלציות C>>B>>A>>D אינם רלבנטיים          נתיבים בכיוון ההפוך (E>>B>>D, E>>B>>A>>D) אינם רלבנטיים

 משתנים חיצוניים (. Exogenous): משתנים ללא סיבתיות גלויה המסבירה אותם במודל (אין חיצים המגיעים עליהם). קורלציה בין משתנים חיצוניים תסומן באמצעות חצים דו ראשיים.

משתנים פנימיים (. Endogenous): אלו הם משתנים להם יש חיצים הבאים עליהם – כלומר מושפעים ממשתנים אחרים. המשתנים הפנימיים כוללים משתנים מתווכים (intervening) ותלויים. למתווכים יש חיצי כניסה ויציאה לתלויים רק חיצי כניסה.

מקדמי נתיב\משקלי נתיב – אלו הם מקדמי רגרסיה מנורמלים (beta) המראים השפעה ישירה של הבלתי תלוי על התלוי בנתיב.>>> מצביע על היקף ההשפעה של משתנה אחד על השני כאשר שולטים במשתנים אחרים. ניתן להעזר במקדמים מנורמלים או בטבלת קורלציות לקבוע אותו. (עבור רגרסיה לניארית דו משתנית המקדם הוא למעשה r – מקדם הקורלציה השווה לבטא).  

דוגמה, המודל הבא:  

מודל זה מאופיין בשלושת המשוואות הבאות:

משוואה 1: b11(age) + b12(autonomy) + b13( income) + e1 = סיפוק

משוואה 2: = b21(age) + b22(autonomy) + e2 הכנסה

משוואה 3:  = b31(age) + e3עצמאות

ה- b הם המקדמי הרגרסיה המתוקננים (beta). המספרים מציינים את מספר המשוואה והמשתנה (b21 = משוואה 2, משתנה 1). מוכנסים רק המקדמים הישירים של המשתנים הפנימיים (תלויים). במקרה של חיצוניים בעלי תלות הדדית משתמשים במתאמים משותפים.

בדוגמה שלנו מקדמי הבטא הם:

מרכיב השגיאה (הפרעה) – שונות בלתי מוסברת(1 – R2),

כלל ההכפלה – הערך המצרפי של כל נתיב הוא תוצר של הכפלת המקדמים שלו.למשל: לכל שנת השכלה ההכנסה השנתית עולה ב- 1000$מקדם השמרנות הוא על כל דולק הכנסה השמרנות עולה ב- 0.0002 (בסולם 5 דרגות)אזי משקל ההכנסה בנתיב הוא: 1000*.0002 = .2אותו דבר לגבי בטאות אבל אז זה במונחים סטנדרטיים.  

אפקט הפירוק:למציאת ההשפעה הבלתי ישירה של משתנה חיצוני על התלוי שנבחר אנו נכפיל את המקדמים שלו בנתיבים השונים. למשל כאשר התלוי הוא סיפוק:

age -> income -> satisfaction is .57*.47 = .26

age -> autonomy -> satisfaction is .28*.58 = .16
age -> autonomy -> income -> satisfaction is .28*.22 x .47 = .03
total indirect effect = .45

הסיכום של כל ההשפעות הלא ישירות מבטא את ההשפעה הבלתי ישירה הכוללת של גיל על סיפוק. ניתן להשוות זאת להשוואה הישירה של המשתנה החיצוני (באם קיים לה נתיב). בדוגמה שלפננו השפעה לא ישירה מצרפית היא 0.45 וההשפעה הישירה היא 0.8- בלבד.עבור רגרסיה דו משתנית ניתן לחלק את ההשפעה להשפעה מלאכותית והשפעה סיבתית. חישוב סוגי ההשפעות מבוצע ביחס למודל קודם בעל נתונים גולמיים (ראה אנגלית בסוף).משתנים חיצוניים בעלי מתאם הדדי – משתנים אלו נכנסים לחישוב נתיבים עקיפים עם זאת אסור שייווצר המצב הבא: נתיב ישיר המורכב מנתיבים של שני משתנים חיצוניים בעלי תלות\מתאם הדדים (חייב שיהיה בינהם משתנה מתווך).

מובהקות ומידת התאמת המודל של ניתוח הנתיבים:

  • בחינת הנתיב האינדיבידואלי מבוצעת ע"י מבחן F מפלט הרגרסיה.

  • בחינת התאמת המודל – מדדים מתוכנת SEM (structural equation modeling) כמו AMOS או LISREL. ניתן להשוות בעזרתם להשוות את הקורלציה החזויה לנתיב מול הקורלציה המתקבלת (כנראה בדומה ללוגיסטית).

הנחות המודל (התנאים בהם ניתוח הנתיבים חייב לעמוד):

  • לינאריות

  • תוספתיות – אין השפעות הדדיות בנתיב (למעט במשתנים חיצוניים התלויים אחד בשני).

  • משתנים אינטוואלים – או סולמות אורדינלים מייצגים אינטרבליות בקירוב. משתני דמי יסומנו כבלוק, כלומר חץ המסומן אל ערך דמי אחד חייב להיות מכוון גם לכל ערכי הדמי האחרים בסט)

  • אין תלות בין הטעויות.

  • שעורי ההפרעה אינם בעלי התאמה הדדית – אסור ששיעור הפרעה מסויים יהיה תלוי בכל משתנה פנימי הקיים במודל. הנחה זו היא חיונית והפרתה עשויה להגרם מטעויות מדידה במדידת המשתנה הפנימי, כאשר קיימת אנדוגניות (כלומר משתנה פנימי מסביר למעשה את החיצוני – בניגוד לכיווני החיצים במודל), או כאשר משתנה מחוץ למודל מהווה הסבר למשתנה פנימי במודל, ובמודל קיים משתנה אחר המיועד להסבירו.

  • מולטיקולינריות נמוכה – אינדיקציה למו"ק גבוהה הם טעויות מנורמלות גבוהות של ה- b בניתוח רגרסיה.

  • ללא זיהוי חסר או הגדרת חסר (No underidentification or underdetermination). במודל ישנן פחות מידי משוואות מבניות לפתרון הבלתי ידוע.

  • רקורסיביות – כל החיצים מופיעים בכיוון אחד ללא מעגליות של היזון חוזר.

  • ספסיפיקציה – כל המשתנים הנדרשים נכללים במודל. טעות בספסיפיקציה – כאשר משתנה מובהק סיבתי נמצא מחוץ למודל. כמו כן הקשר בין המשתנים אכן מתאים למודל – אם ישנו קשר הפוך (אנדוגניות) – קיימת בעיה קשה.

  • שימוש בקורלציות מתאימות – כאשר משתמשים בטבלת מתאמים ראוי להשתמש במתאמי פרסון לשני משתנים אינטרוואלים, מתאמים פוליכורים למשתנים אורדינלים, ומתאמים טטרכים למשתנים דיכוטומיים, פולסיירלים לאינטרוולי ואורדינלי וביסיריילי לאינטרוולי ודיכוטומי.

  • גודל מדגם מתאים – המלצה (Kline, 1998) – על כל פרמטר לפחות 10 מקרים (עדיף 20). 5 מקרים לפרמטר או פחות אינה כמות מספקת לבדיקת מובהקות המודל.

  • שימוש באותו מדגם לכל הרגרסיות

שאלות :

האם ניתוח נתיבים מאשש סיבתיות במודל?

לא- יכולים להיות מודלים תיאורטים רבים התואמים לסט הנתונים. הוא משמש להאיר מתוך 2 או יותר מודלים תיאורטים הכי תואם לסט הנתונים.

 האם ניתוח נתונים יכול לשמש למטרה מגששת (מסבירה) חוץ מאישוש מודל תיאורטי?

רצוי לצור היפותזה תאורטית קודם לשימוש בניתוח נתיבים. כמינימום נדרש ציון הכיוונים קודם להרצת המודל.

 כיצד אפשר לדעת עם המודל הוא בעל הגדרת חוסר?

בעזרת תוכנות SEM כמו AMOS

כיצד משווים מובהקות של מקדם הנתיב עם המובהקות של מקדם הרגרסיה?

הם אותו דבר! המובהקות של הבטא היא מובהקות מקדם הנתיב

כיצד מעריכים מובהקות של כל השפעת המשתנים החיצוניים על הפנימיים?

הרצת רגרסיה עם Y (פנימי) כתלוי וכל שאר הבלתי תלויים ללא משתנים מתווכים. מובהקות הבטא של ה- X היא המובהקות הכוללת (לצרף לסולם את הב"ת)

מה הקשר בין טבלת קורלציות לבין מקדמי הנתיב באשר לבדיקת המודל? חישוב הקורצליות החזויות במודל יבוצע באמצעות תוכנה ייעודית ושימוש בהשוואת מדדי התאמת המודל  goodness-of-fit למקדמים החזויים (הקורלציות הנראות).

איך מחשבים מקדמי נתיב ב- SPSS?

בהנחה ש – A>>B, A>>C, B>>Cיש לערוך סדרת רגרסיות לכל משתנה שאינו חיצוני כך שהוא יחשב כתלוי. כאשר מדובר בקשר בין שני משתנים: רגרסיה דו משתנית. כאשר מדובר על קשר בין שלושה (A>>B>>C) תורץ רגרסיה עם שני ב"ת.

חישוב מקדם הרגרסיה משיעור הטעות?1 – r2

 . לא להשתמש ב r2 מותאם.

איך לבצע השוואה בין קבוצות?

הרצת ניתוח נתיבים נפרד לכל קבוצה והשוואה בין המודלים

האם ניתן להשתמש ברגרסיה לוגיסטית לפירוק?

לא!