מֵידָע

איך לקרוא למידות המתקבלות בין הבדיקה הטרום לבדיקה שלאחר?

איך לקרוא למידות המתקבלות בין הבדיקה הטרום לבדיקה שלאחר?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

אנו מכנים בדיקה מוקדמת כאיסוף/מדידות נתונים לפני עריכת ניסוי ואחרי בדיקה היא איסוף/מדידות נתונים לאחר הניסוי. כיצד אנו מתייחסים לתהליך איסוף הנתונים/האמצעים במהלך הניסוי (כגון מדדים פיזיולוגיים)? אני מחפש "מונח" ספציפי לתיאור אירוע "במהלך המבחן".


אנשים משתמשים במגוון רחב של שפות כדי לתאר נקודות מדידה בתכנון מדדים חוזרים.

לדוגמה, אם מדדת משתנה תלוי במספר הזדמנויות, ייתכן שיהיה לך משהו כמו:

  1. קו הבסיס (ב)
  2. שבוע טיפול 1 (T1)
  3. שבוע טיפול 2 (T2)
  4. לאחר טיפול (F0)
  5. מעקב שישה חודשים (F6)
  6. שנה אחת עקוב (F12)

ברור שלעיצוב כזה יש היבטים שעולים בקנה אחד עם עיצוב לפני בדיקה, אבל יש לו יותר נקודות זמן מאשר רק זה. לכן ההצעה שלי היא שיהיו רק תוויות תיאור ברורות לנקודות המדידה.


אני מאמין שהקידומת שאתה מחפש היא לְכָל. בלטינית, מִרֹאשׁ פירושו "מול", לְכָל פירושו "דרך" ו- הודעה פירושו מאחור.


תוכן

החלק הראשון ביצירת עיצוב מעין ניסיוני הוא זיהוי המשתנים. המשתנה המעיין בלתי תלוי יהיה משתנה x, המשתנה שעובר מניפולציה על מנת להשפיע על משתנה תלוי. "X" הוא בדרך כלל משתנה קיבוץ בעל רמות שונות. קיבוץ פירושו שתי קבוצות או יותר, כגון שתי קבוצות המקבלות טיפולים אלטרנטיביים, או קבוצת טיפול וקבוצה ללא טיפול (שניתן להעניק פלצבו - פלצבו משמש לעתים קרובות יותר בניסויים רפואיים או פיזיולוגיים). התוצאה החזויה היא המשתנה התלוי, שהוא משתנה ה-y. בניתוח סדרת זמן, המשתנה התלוי נצפה לאורך זמן עבור כל שינוי שעלול להתרחש. לאחר זיהוי והגדרת המשתנים, יש ליישם נוהל ולבחון הבדלים בקבוצה. [3]

בניסוי עם הקצאה אקראית, ליחידות לימוד יש סיכוי זהה להקצות למצב טיפול נתון. ככזה, הקצאה אקראית מבטיחה ששתי קבוצות הניסוי והביקורת שוות ערך. בתכנון מעין ניסוי, הקצאה למצב טיפול נתון מבוססת על משהו אחר מאשר הקצאה אקראית. בהתאם לסוג התכנון הכמו-ניסוי, ייתכן שלחוקר יש שליטה על ההקצאה למצב הטיפול, אך ישתמש בקריטריונים מסוימים מלבד הקצאה אקראית (למשל, ציון חתך) כדי לקבוע אילו משתתפים מקבלים את הטיפול, או שלחוקר אין שליטה על הקצאת מצב הטיפול והקריטריונים המשמשים להקצאה עשויה להיות בלתי ידועה. גורמים כגון עלות, כדאיות, דאגות פוליטיות או נוחות עשויים להשפיע על האופן שבו או אם המשתתפים מוקצים לתנאי טיפול נתון, וככאלה, ניסויים מעין כפופים לחששות לגבי תוקף פנימי (כלומר, האם תוצאות הניסוי יכולות להיות משמש כדי להסיק מסקנות סיבתיות?).

מעין ניסויים יעילים גם מכיוון שהם משתמשים ב"בדיקה לפני פוסט". המשמעות היא שיש בדיקות שנעשות לפני איסוף נתונים כלשהם כדי לראות אם יש בלבול בין אנשים או אם למשתתפים יש נטיות מסוימות. אז הניסוי בפועל נעשה עם תוצאות שלאחר הבדיקה מתועדות. ניתן להשוות נתונים אלו כחלק מהמחקר או לכלול את הנתונים שלפני הבדיקה בהסבר לנתוני הניסוי בפועל. לניסויים כמעט יש משתנים עצמאיים שכבר קיימים כגון גיל, מין, צבע עיניים. משתנים אלה יכולים להיות רציפים (גיל) או שהם יכולים להיות קטגוריים (מגדר). בקיצור, משתנים המתרחשים באופן טבעי נמדדים בתוך ניסויים מעין. [4]

ישנם מספר סוגים של עיצובים כמעט ניסיוניים, לכל אחד מהם נקודות חוזק, חולשות ויישומים שונים. עיצובים אלה כוללים (אך אינם מוגבלים ל): [5]

    (קדם פוסט עם-בלי השוואה)
  • עיצוב קבוצות בקרה לא שוות ערך
    • עיצובים של קבוצת ביקורת ללא טיפול
    • עיצובי משתנים תלויים לא שווה ערך
    • הוסרו עיצובים של קבוצות טיפול
    • עיצובי טיפול חוזרים
    • טיפול הפוך בעיצובים של קבוצות ביקורת לא שוות
    • עיצובים לאחר בדיקה בלבד
    • עיצובים של המשכיות רגרסיה
    • עיצובי סדרות זמן
    • עיצוב סדרות זמן מרובות

    מבין כל התכנונים הללו, עיצוב אי המשכיות הרגרסיה מגיע הכי קרוב לתכנון הניסוי, שכן הנסיין שומר על שליטה על הקצאת הטיפול וידוע שהוא "מניב אומדן בלתי משוחד של השפעות הטיפול". [5] : 242, עם זאת, זה דורש מספר רב של משתתפי מחקר ומודלים מדויקים של הצורה הפונקציונלית בין המשימה למשתנה התוצאה, על מנת להניב את אותו הכוח כמו עיצוב ניסוי מסורתי.

    אף על פי שלעתים ניסויים מעין נמנעים מאנשים המחשיבים את עצמם כפוריסטים ניסיוניים (מה שמוביל את דונלד ט. קמפבל להטביע עבורם את המונח "ניסויים מבולבלים"), [6] הם שימושיים במיוחד באזורים שבהם זה לא ריאלי או רצוי. לבצע ניסוי או ניסוי ביקורת אקראי. מקרים כאלה כוללים הערכת ההשפעה של שינויים במדיניות ציבורית, התערבויות חינוכיות או התערבויות בריאות בקנה מידה גדול. החיסרון העיקרי של עיצובים מעין ניסויים הוא שהם לא יכולים לבטל את האפשרות של הטיה מבלבלת, מה שיכול להפריע ליכולתו של האדם להסיק מסקנות סיבתיות. חיסרון זה משמש לעתים קרובות להנחות תוצאות מעשיות-ניסיוניות. עם זאת, ניתן לשלוט בהטיה כזו באמצעות טכניקות סטטיסטיות שונות כגון רגרסיה מרובה, אם ניתן לזהות ולמדוד את המשתנים המבלבלים. ניתן להשתמש בטכניקות כאלה כדי להמחיש ולחלק את ההשפעות של טכניקות משתנים מבלבלים, ובכך לשפר את הדיוק של התוצאות המתקבלות מניסויים מעין. יתרה מכך, השימוש המתפתח בהתאמת ציוני נטייה כדי להתאים את המשתתפים במשתנים החשובים לתהליך בחירת הטיפול יכול גם לשפר את הדיוק של תוצאות מעין ניסויים. למעשה, נתונים הנגזרים מניתוחים מעשיים-ניסיוניים הוכחו כמתאימים באופן הדוק לנתוני ניסוי במקרים מסוימים, גם כאשר נעשה שימוש בקריטריונים שונים. [7] לסיכום, מעין ניסויים הם כלי רב ערך, במיוחד עבור החוקר היישומי. בכוחות עצמם, עיצובים כמעט ניסיוניים אינם מאפשרים לאדם להסיק מסקנות סיבתיות סופיות, אולם הם מספקים מידע הכרחי ויקר ערך שלא ניתן להשיג אותו בשיטות ניסוי בלבד. חוקרים, במיוחד אלו המעוניינים לחקור שאלות מחקר יישומיות, צריכים לעבור מעבר לתכנון הניסוי המסורתי ולנצל את האפשרויות הגלומות בעיצובים כמו-ניסויים. [5]

    ניסוי אמיתי יקצה ילדים באופן אקראי למלגה, כדי לשלוט בכל שאר המשתנים. ניסויים מעין משמשים בדרך כלל במדעי החברה, בריאות הציבור, חינוך וניתוח מדיניות, במיוחד כאשר לא מעשי או סביר לאקראי את משתתפי המחקר למצב הטיפול.

    כדוגמה, נניח שאנו מחלקים משקי בית לשתי קטגוריות: משקי בית שבהם ההורים מלקים את ילדיהם, ומשקי בית בהם ההורים אינם מלקים את ילדיהם. אנו יכולים להפעיל רגרסיה ליניארית כדי לקבוע אם יש מתאם חיובי בין הלקאות של הורים להתנהגות התוקפנית של ילדיהם. עם זאת, פשוט לעשות אקראי להורים להכות או לא להרביץ לילדיהם אולי לא מעשי או אתי, מכיוון שחלק מההורים עשויים להאמין שזה לא נכון מבחינה מוסרית להכות את ילדיהם ולסרב להשתתף.

    יש מחברים המבחינים בין ניסוי טבעי ל"מעין ניסוי". [1] [5] ההבדל הוא שבמעין ניסוי הקריטריון להקצאה נבחר על ידי החוקר, בעוד שבניסוי טבעי ההקצאה מתרחשת 'באופן טבעי', ללא התערבות החוקר.

    לדוגמא-ניסויים יש מדדי תוצאה, טיפולים ויחידות ניסוי, אך לא משתמשים בהקצאה אקראית. ניסויים מעין הם לרוב העיצוב שרוב האנשים בוחרים על פני ניסויים אמיתיים. זה בדרך כלל מתנהל בקלות בניגוד לניסויים אמיתיים, מכיוון שהם מביאים תכונות מעיצובים ניסיוניים ולא ניסיוניים כאחד. ניתן להביא משתנים נמדדים, כמו גם משתנים מניפולציות. בדרך כלל ניסויים מעין נבחרים על ידי נסיינים מכיוון שהם ממקסמים תוקף פנימי וחיצוני. [8]

    מכיוון שמשתמשים בעיצובים מעין ניסויים כאשר האקראיות אינה מעשית ו/או לא אתית, הם בדרך כלל קל יותר להגדרה מאשר עיצובים ניסויים אמיתיים, הדורשים [9] הקצאה אקראית של נבדקים. בנוסף, שימוש בעיצובים כמעט ניסיוניים ממזער את האיומים על התוקף האקולוגי מכיוון שסביבות טבעיות אינן סובלות מאותן בעיות של מלאכותיות בהשוואה למסגרת מעבדה מבוקרת היטב. [10] מאחר שכעין ניסויים הם ניסויים טבעיים, ממצאים באחד מהם עשויים להיות מיושמים על נושאים ומסגרות אחרות, מה שמאפשר לעשות הכללות לגבי האוכלוסייה. כמו כן, שיטת ניסוי זו יעילה במחקר אורך הכולל פרקי זמן ארוכים יותר שניתן לעקוב אחריהם בסביבות שונות.

    יתרונות נוספים של ניסויים מעין כוללים את הרעיון של כל מניפולציות שהנסיין בוחר. בניסויים טבעיים, על החוקרים לתת למניפולציות להתרחש בכוחות עצמם ואין להם שליטה עליהם כלל. כמו כן, שימוש בקבוצות שנבחרו עצמית בניסויים מעין גם לוקח את הסיכוי לחששות אתיים, מותנים וכו 'בעת ביצוע המחקר. [8]

    אומדנים כמעט ניסיוניים של ההשפעה כפופים לזיהום על ידי משתנים מבלבלים. [1] בדוגמה שלמעלה, שונות בתגובת הילדים למכות מושפעת באופן סביר מגורמים שלא ניתן למדוד ולשלוט בקלות, למשל הפראות הפנימית של הילד או עצבנותו של ההורה. היעדר הקצאה אקראית בשיטת התכנון הכמו-ניסוי עשוי לאפשר למחקרים להיות מעשיים יותר, אך הדבר גם מציב בפני החוקר אתגרים רבים מבחינת תוקף פנימי. חוסר זה באקראי מקשה על שלילת משתנים מבלבלים ומציג איומים חדשים על התוקף הפנימי. [11] מכיוון שאין אקראי, ניתן להעריך ידע מסוים לגבי הנתונים, אך קשה לקבוע מסקנות של קשרים סיבתיים בשל מגוון משתנים זרים ומבלבלים הקיימים בסביבה חברתית. יתרה מכך, גם אם האיומים הללו על התוקף הפנימי יוערכו, עדיין לא ניתן לקבוע את הסיבתיות במלואה מכיוון שלנסיין אין שליטה מוחלטת על משתנים זרים. [12]

    החסרונות כוללים גם קבוצות המחקר עשויות לספק ראיות חלשות יותר בגלל היעדר אקראיות. אקראיות מביאה הרבה מידע שימושי למחקר מכיוון שהיא מרחיבה את התוצאות ולכן נותנת ייצוג טוב יותר של האוכלוסייה כולה. שימוש בקבוצות לא שוות יכול גם להוות איום על התוקף הפנימי. אם הקבוצות אינן שוות, מה שקורה לפעמים בניסויים מעין, ייתכן שהנסיין לא בטוח מה הסיבות לתוצאות. [4]

    תוקף פנימי הוא האמת המשוערת לגבי מסקנות לגבי סיבה-תוצאה או קשרים סיבתיים. זו הסיבה שתקפות חשובה לניסויים מעין כי כולם עוסקים בקשרים סיבתיים. זה מתרחש כאשר הנסיין מנסה לשלוט בכל המשתנים שעלולים להשפיע על תוצאות הניסוי. רגרסיה סטטיסטית, היסטוריה והמשתתפים הם כולם איומים אפשריים על התוקף הפנימי. השאלה שהיית רוצה לשאול תוך כדי ניסיון לשמור על תוקף פנימי גבוה היא "האם יש עוד סיבות אפשריות לתוצאה מלבד הסיבה שאני רוצה שהיא תהיה?" אם כן, יתכן שהתוקף הפנימי לא יהיה כל כך חזק. [8]

    תוקף חיצוני הוא המידה שבה ניתן להכליל את התוצאות המתקבלות ממדגם מחקר "ל"לאוכלוסיית עניין מסויימת היטב ו"על פני" תת-אוכלוסיות של אנשים, זמנים, הקשרים ושיטות מחקר. [13] לינץ' טען שהכללה "ל" אוכלוסייה כמעט אף פעם אינה אפשרית מכיוון שהאוכלוסיות אליהן נרצה להקרין הן מדדים של התנהגות עתידית, שבהגדרה לא ניתן לדגום. [14] לכן, השאלה הרלוונטית יותר היא האם השפעות הטיפול מכללות "על פני" תת-אוכלוסיות המשתנות על פי גורמי רקע שאולי אינם בולטים לחוקר. תוקף חיצוני תלוי בשאלה האם למחקרי הטיפולים יש השפעות הומוגניות על פני תת -קבוצות שונות של אנשים, זמנים, הקשרים ושיטות לימוד או שהסימן והעוצמה של כל השפעות הטיפול משתנות בין קבוצות משנה בדרכים שלא יכירו או יובנו על ידי החוקרים. . [15] Athey ו-Imbens ו-Athey ו-Wager היו חלוצים בטכניקות למידת מכונה להבנה אינדוקטיבית של השפעות טיפול הטרוגניות. [16] [17]

    עיצובים של "אדם לפי טיפול" הם הסוג הנפוץ ביותר של עיצוב מעין ניסוי. בתכנון זה, הנסיין מודד לפחות משתנה בלתי תלוי אחד. יחד עם מדידת משתנה אחד, הנסיין יתמרן גם משתנה בלתי תלוי אחר. מכיוון שיש מניפולציה ומדידה של משתנים בלתי תלויים שונים, המחקר נעשה בעיקר במעבדות. גורם חשוב בהתמודדות עם עיצובים של אדם אחר טיפול הוא שיהיה צורך להשתמש בהקצאה אקראית על מנת לוודא שלנסיין יש שליטה מלאה על המניפולציות הנעשות במחקר. [18]

    דוגמה לעיצוב מסוג זה בוצעה באוניברסיטת נוטרדאם. המחקר נערך כדי לראות אם הדרכה לתפקידך הובילה לעלייה בסיפוק בעבודה. התוצאות הראו שאנשים רבים שכן היה להם מנטור הראו שביעות רצון גבוהה מאוד בעבודה. עם זאת, המחקר גם הראה שלמי שלא קיבל את המנטור היה גם מספר גבוה של עובדים מרוצים. סייברט הגיע למסקנה שלמרות שהעובדים שהיו להם חונכים היו מרוצים, הוא לא יכול היה להניח שהסיבה לכך היא המנטורים עצמם בגלל המספרים הגבוהים של העובדים שאינם חונכים שאמרו שהם מרוצים. זו הסיבה מדוע ההקרנה מראש היא מאוד חשובה, כך שתוכל למזער את כל הפגמים במחקר לפני שהם נראים. [19]

    "ניסויים טבעיים" הם סוג אחר של עיצוב מעין ניסוי המשמש חוקרים. זה שונה מאדם אחר טיפול באופן שאין משתנה שעובר מניפולציות על ידי הנסיין. במקום לשלוט במשתנה אחד לפחות כמו התכנון של אדם אחר טיפול, הנסיינים אינם משתמשים בהקצאה אקראית ומשאירים את הבקרה הניסויית למקרה. זה המקום שבו השם "טִבעִימקור הניסוי. המניפולציות מתרחשות באופן טבעי, ולמרות שזו עשויה להיראות כמו טכניקה לא מדויקת, היא למעשה הוכחה כמועילה במקרים רבים. אלו הם המחקרים שנעשו לאנשים שקרה להם משהו פתאומי. זה יכול להיות טוב או רע, טראומטי או אופורי. דוגמה לכך יכולה להיות מחקרים שנעשו על אלה שעברו תאונת דרכים ואלו שלא. תאונות דרכים מתרחשות באופן טבעי, כך שזה לא יהיה מוסרי לביים ניסויים כדי לגרום טראומה לנבדקים במחקר אירועים טבעיים אלו הוכחו כמועילים לחקר מקרים של הפרעת דחק פוסט טראומטית [18]


    3.4.3 - רגרסיה ליניארית פשוטה

    רגרסיה משתמשת במשתנים מסבירים אחד או יותר ((x)) כדי לחזות משתנה תגובה אחד ((y)). בקורס זה נלמד במיוחד על רגרסיה לינארית פשוטה. החלק ה"פשוט" הוא שאנו נשתמש רק במשתנה מסביר אחד. אם יש שני משתנים מסבירים או יותר, יש צורך ברגרסיה ליניארית מרובה. החלק ה"ליניארי" הוא שאנו נשתמש בקו ישר כדי לחזות את משתנה התגובה באמצעות המשתנה המסביר. שלא כמו בקורלציה, ברגרסיה זה משנה איזה משתנה נקרא (x) ואיזה נקרא (y). ברגרסיה, המשתנה המסביר הוא תמיד (x) ומשתנה התגובה הוא תמיד (y). הן (x ) והן (y ) חייבים להיות משתנים כמותיים.

    אתה עשוי להיזכר ממעמד אלגברה כי הנוסחה לקו ישר היא (y = mx+b ), כאשר (m ) היא השיפוע ו- (b ) היא יירוט יי. ה מִדרוֹן הוא מדד למידת התלול של הקו באלגברה, זה מתואר לפעמים כ"שינוי ב-y על פני שינוי ב-x," ((frac)), או "עלייה מעל לָרוּץ." שיפוע חיובי מציין קו נע משמאל למטה לימין למעלה. שיפוע שלילי מציין קו נע מלמעלה משמאל לימין למטה. ה יירוט y הוא המיקום על ציר ה-y שבו עובר הקו. במילים אחרות, כאשר (x=0) אז (y=y - יירוט).

    בסטטיסטיקה אנו משתמשים בנוסחאות דומות:

    (widehat) = ערך צפוי של (y ) עבור ערך נתון של (x )
    (a ) = (y )-יירוט
    (b) = שיפוע

    באוכלוסיה, חיתוך ה-y מסומן כ-(eta_0) ("בטא תת 0") או (alpha) ("אלפא"). השיפוע מסומן כ-(eta_1) ("בטא תת 1") או רק (eta) ("בטא").

    רגרסיה ליניארית פשוטה משתמשת בנתונים ממדגם כדי לבנות את הקו המתאים ביותר. אבל מה הופך קו ל"מתאים ביותר "? השיטה הנפוצה ביותר לבניית קו רגרסיה לינארית פשוטה, והשיטה היחידה בה נשתמש בקורס זה, היא שיטת הכיכר הפחות ריבועים. שיטת הריבועים הקטנים מוצאת את הערכים של חיתוך y והשיפוע שהופכים את סכום השאריות בריבוע (הידוע גם כסכום השגיאות בריבוע או SSE) קטן ככל האפשר.

    (y ) = ערך בפועל של (y )
    (widehat) = ערך צפוי של (y )


    3.4.3 - רגרסיה ליניארית פשוטה

    רגרסיה משתמשת במשתנה הסבר אחד או יותר ( (x )) לחיזוי משתנה תגובה אחד ( (y )). בקורס זה נלמד במיוחד על רגרסיה לינארית פשוטה. החלק ה"פשוט "הוא שנשתמש במשתנה הסבר אחד בלבד. אם יש שני משתנים מסבירים או יותר, יש צורך ברגרסיה ליניארית מרובה. החלק ה"ליניארי" הוא שאנו נשתמש בקו ישר כדי לחזות את משתנה התגובה באמצעות המשתנה המסביר. שלא כמו בקורלציה, ברגרסיה זה משנה איזה משתנה נקרא (x) ואיזה נקרא (y). ברגרסיה, המשתנה המסביר הוא תמיד (x) ומשתנה התגובה הוא תמיד (y). גם (x) ו-(y) חייבים להיות משתנים כמותיים.

    אתה אולי זוכר ממחלקת אלגברה שהנוסחה לישר היא (y=mx+b), כאשר (m) הוא השיפוע ו-(b) הוא חיתוך ה-y. ה מִדרוֹן הוא מדד למידת התלול של הקו באלגברה, זה מתואר לפעמים כ"שינוי ב-y על פני שינוי ב-x," ((frac)), או "עלייה מעל לָרוּץ." שיפוע חיובי מציין קו נע משמאל למטה לימין למעלה.שיפוע שלילי מציין קו נע מלמעלה משמאל לימין למטה. ה יירוט y הוא המיקום על ציר ה-y שבו עובר הקו. במילים אחרות, כאשר (x=0) אז (y=y - יירוט).

    בסטטיסטיקה אנו משתמשים בנוסחאות דומות:

    (widehat) = ערך צפוי של (y ) עבור ערך נתון של (x )
    (a ) = (y )-יירוט
    (b) = שיפוע

    באוכלוסיה, חיתוך ה-y מסומן כ-(eta_0) ("בטא תת 0") או (alpha) ("אלפא"). השיפוע מסומן כ-(eta_1) ("בטא תת 1") או רק (eta) ("בטא").

    רגרסיה ליניארית פשוטה משתמשת בנתונים ממדגם כדי לבנות את הקו המתאים ביותר. אבל מה הופך קו ל"מתאים ביותר "? השיטה הנפוצה ביותר לבניית קו רגרסיה לינארית פשוטה, והשיטה היחידה בה נשתמש בקורס זה, היא שיטת הכיכר הפחות ריבועים. שיטת הריבועים הקטנים מוצאת את הערכים של חיתוך y והשיפוע שהופכים את סכום השאריות בריבוע (הידוע גם כסכום השגיאות בריבוע או SSE) קטן ככל האפשר.

    (y ) = ערך בפועל של (y )
    (widehat) = ערך צפוי של (y )


    תוכן

    החלק הראשון ביצירת עיצוב מעין ניסיוני הוא זיהוי המשתנים. המשתנה המעיין בלתי תלוי יהיה משתנה x, המשתנה שעובר מניפולציה על מנת להשפיע על משתנה תלוי. "X" הוא בדרך כלל משתנה קיבוץ בעל רמות שונות. קיבוץ פירושו שתי קבוצות או יותר, כגון שתי קבוצות המקבלות טיפולים אלטרנטיביים, או קבוצת טיפול וקבוצה ללא טיפול (שניתן להעניק פלצבו - פלצבו משמש לעתים קרובות יותר בניסויים רפואיים או פיזיולוגיים). התוצאה החזויה היא המשתנה התלוי, שהוא משתנה ה-y. בניתוח סדרת זמן, המשתנה התלוי נצפה לאורך זמן עבור כל שינוי שעלול להתרחש. לאחר זיהוי והגדרת המשתנים, יש ליישם נוהל ולבחון הבדלים בקבוצה. [3]

    בניסוי עם הקצאה אקראית, ליחידות לימוד יש סיכוי זהה להקצות למצב טיפול נתון. ככזה, הקצאה אקראית מבטיחה ששתי קבוצות הניסוי והביקורת שוות ערך. בתכנון מעין ניסוי, הקצאה למצב טיפול נתון מבוססת על משהו אחר מאשר הקצאה אקראית. בהתאם לסוג התכנון הכמו-ניסוי, ייתכן שלחוקר יש שליטה על ההקצאה למצב הטיפול, אך ישתמש בקריטריונים מסוימים מלבד הקצאה אקראית (למשל, ציון חתך) כדי לקבוע אילו משתתפים מקבלים את הטיפול, או שלחוקר אין שליטה על הקצאת מצב הטיפול והקריטריונים המשמשים להקצאה עשויה להיות בלתי ידועה. גורמים כגון עלות, כדאיות, דאגות פוליטיות או נוחות עשויים להשפיע על האופן שבו או אם המשתתפים מוקצים לתנאי טיפול נתון, וככאלה, ניסויים מעין כפופים לחששות לגבי תוקף פנימי (כלומר, האם תוצאות הניסוי יכולות להיות משמש כדי להסיק מסקנות סיבתיות?).

    מעין ניסויים יעילים גם מכיוון שהם משתמשים ב"בדיקה לפני פוסט". המשמעות היא שיש בדיקות שנעשות לפני איסוף נתונים כלשהם כדי לראות אם יש בלבול בין אנשים או אם למשתתפים יש נטיות מסוימות. אז הניסוי בפועל נעשה עם תוצאות שלאחר הבדיקה מתועדות. ניתן להשוות נתונים אלו כחלק מהמחקר או לכלול את הנתונים שלפני הבדיקה בהסבר לנתוני הניסוי בפועל. לניסויים כמעט יש משתנים עצמאיים שכבר קיימים כגון גיל, מין, צבע עיניים. משתנים אלה יכולים להיות רציפים (גיל) או שהם יכולים להיות קטגוריים (מגדר). בקיצור, משתנים המתרחשים באופן טבעי נמדדים בתוך ניסויים מעין. [4]

    ישנם מספר סוגים של עיצובים כמעט ניסיוניים, לכל אחד מהם נקודות חוזק, חולשות ויישומים שונים. עיצובים אלה כוללים (אך אינם מוגבלים ל): [5]

      (קדם פוסט עם-בלי השוואה)
  • עיצוב קבוצות בקרה לא שוות ערך
    • עיצובים של קבוצת ביקורת ללא טיפול
    • עיצובי משתנים תלויים לא שווה ערך
    • הוסרו עיצובים של קבוצות טיפול
    • עיצובי טיפול חוזרים
    • טיפול הפוך בעיצובים של קבוצות ביקורת לא שוות
    • עיצובים לאחר בדיקה בלבד
    • עיצובים של המשכיות רגרסיה
    • עיצובי סדרות זמן
    • עיצוב סדרות זמן מרובות

    מבין כל התכנונים הללו, עיצוב אי המשכיות הרגרסיה מגיע הכי קרוב לתכנון הניסוי, שכן הנסיין שומר על שליטה על הקצאת הטיפול וידוע שהוא "מניב אומדן בלתי משוחד של השפעות הטיפול". [5] : 242, עם זאת, זה דורש מספר רב של משתתפי מחקר ומודלים מדויקים של הצורה הפונקציונלית בין המשימה למשתנה התוצאה, על מנת להניב את אותו הכוח כמו עיצוב ניסוי מסורתי.

    אף על פי שלעתים ניסויים מעין נמנעים מאנשים המחשיבים את עצמם כפוריסטים ניסיוניים (מה שמוביל את דונלד ט. קמפבל להטביע עבורם את המונח "ניסויים מבולבלים"), [6] הם שימושיים במיוחד באזורים שבהם זה לא ריאלי או רצוי. לבצע ניסוי או ניסוי ביקורת אקראי. מקרים כאלה כוללים הערכת ההשפעה של שינויים במדיניות ציבורית, התערבויות חינוכיות או התערבויות בריאות בקנה מידה גדול. החיסרון העיקרי של עיצובים מעין ניסויים הוא שהם לא יכולים לבטל את האפשרות של הטיה מבלבלת, מה שיכול להפריע ליכולתו של האדם להסיק מסקנות סיבתיות. חיסרון זה משמש לעתים קרובות להנחות תוצאות מעשיות-ניסיוניות. עם זאת, ניתן לשלוט בהטיה כזו באמצעות טכניקות סטטיסטיות שונות כגון רגרסיה מרובה, אם ניתן לזהות ולמדוד את המשתנים המבלבלים. ניתן להשתמש בטכניקות כאלה כדי להמחיש ולחלק את ההשפעות של טכניקות משתנים מבלבלים, ובכך לשפר את הדיוק של התוצאות המתקבלות מניסויים מעין. יתרה מכך, השימוש המתפתח בהתאמת ציוני נטייה כדי להתאים את המשתתפים במשתנים החשובים לתהליך בחירת הטיפול יכול גם לשפר את הדיוק של תוצאות מעין ניסויים. למעשה, נתונים הנגזרים מניתוחים מעשיים-ניסיוניים הוכחו כמתאימים באופן הדוק לנתוני ניסוי במקרים מסוימים, גם כאשר נעשה שימוש בקריטריונים שונים. [7] לסיכום, מעין ניסויים הם כלי רב ערך, במיוחד עבור החוקר היישומי. בכוחות עצמם, עיצובים כמעט ניסיוניים אינם מאפשרים לאדם להסיק מסקנות סיבתיות סופיות, אולם הם מספקים מידע הכרחי ויקר ערך שלא ניתן להשיג אותו בשיטות ניסוי בלבד. חוקרים, במיוחד אלו המעוניינים לחקור שאלות מחקר יישומיות, צריכים לעבור מעבר לתכנון הניסוי המסורתי ולנצל את האפשרויות הגלומות בעיצובים כמו-ניסויים. [5]

    ניסוי אמיתי יקצה ילדים באופן אקראי למלגה, כדי לשלוט בכל שאר המשתנים. ניסויים מעין משמשים בדרך כלל במדעי החברה, בריאות הציבור, חינוך וניתוח מדיניות, במיוחד כאשר לא מעשי או סביר לאקראי את משתתפי המחקר למצב הטיפול.

    כדוגמה, נניח שאנו מחלקים משקי בית לשתי קטגוריות: משקי בית שבהם ההורים מלקים את ילדיהם, ומשקי בית בהם ההורים אינם מלקים את ילדיהם. אנו יכולים להפעיל רגרסיה ליניארית כדי לקבוע אם יש מתאם חיובי בין הלקאות של הורים להתנהגות התוקפנית של ילדיהם. עם זאת, פשוט לעשות אקראי להורים להכות או לא להרביץ לילדיהם אולי לא מעשי או אתי, מכיוון שחלק מההורים עשויים להאמין שזה לא נכון מבחינה מוסרית להכות את ילדיהם ולסרב להשתתף.

    יש מחברים המבחינים בין ניסוי טבעי ל"מעין ניסוי". [1] [5] ההבדל הוא שבמעין ניסוי הקריטריון להקצאה נבחר על ידי החוקר, בעוד שבניסוי טבעי ההקצאה מתרחשת 'באופן טבעי', ללא התערבות החוקר.

    לדוגמא-ניסויים יש מדדי תוצאה, טיפולים ויחידות ניסוי, אך לא משתמשים בהקצאה אקראית. ניסויים מעין הם לרוב העיצוב שרוב האנשים בוחרים על פני ניסויים אמיתיים. זה בדרך כלל מתנהל בקלות בניגוד לניסויים אמיתיים, מכיוון שהם מביאים תכונות מעיצובים ניסיוניים ולא ניסיוניים כאחד. ניתן להביא משתנים נמדדים, כמו גם משתנים מניפולציות. בדרך כלל ניסויים מעין נבחרים על ידי נסיינים מכיוון שהם ממקסמים תוקף פנימי וחיצוני. [8]

    מכיוון שמשתמשים בעיצובים מעין ניסויים כאשר האקראיות אינה מעשית ו/או לא אתית, הם בדרך כלל קל יותר להגדרה מאשר עיצובים ניסויים אמיתיים, הדורשים [9] הקצאה אקראית של נבדקים. בנוסף, שימוש בעיצובים כמעט ניסיוניים ממזער את האיומים על התוקף האקולוגי מכיוון שסביבות טבעיות אינן סובלות מאותן בעיות של מלאכותיות בהשוואה למסגרת מעבדה מבוקרת היטב. [10] מאחר שכעין ניסויים הם ניסויים טבעיים, ממצאים באחד מהם עשויים להיות מיושמים על נושאים ומסגרות אחרות, מה שמאפשר לעשות הכללות לגבי האוכלוסייה. כמו כן, שיטת ניסוי זו יעילה במחקר אורך הכולל פרקי זמן ארוכים יותר שניתן לעקוב אחריהם בסביבות שונות.

    יתרונות נוספים של ניסויים מעין כוללים את הרעיון של כל מניפולציות שהנסיין בוחר. בניסויים טבעיים, על החוקרים לתת למניפולציות להתרחש בכוחות עצמם ואין להם שליטה עליהם כלל. כמו כן, שימוש בקבוצות שנבחרו עצמית בניסויים מעין גם לוקח את הסיכוי לחששות אתיים, מותנים וכו 'בעת ביצוע המחקר. [8]

    אומדנים כמעט ניסיוניים של ההשפעה כפופים לזיהום על ידי משתנים מבלבלים. [1] בדוגמה שלמעלה, שונות בתגובת הילדים למכות מושפעת באופן סביר מגורמים שלא ניתן למדוד ולשלוט בקלות, למשל הפראות הפנימית של הילד או עצבנותו של ההורה. היעדר הקצאה אקראית בשיטת התכנון הכמו-ניסוי עשוי לאפשר למחקרים להיות מעשיים יותר, אך הדבר גם מציב בפני החוקר אתגרים רבים מבחינת תוקף פנימי. חוסר זה באקראי מקשה על שלילת משתנים מבלבלים ומציג איומים חדשים על התוקף הפנימי. [11] מכיוון שאין אקראי, ניתן להעריך ידע מסוים לגבי הנתונים, אך קשה לקבוע מסקנות של קשרים סיבתיים בשל מגוון משתנים זרים ומבלבלים הקיימים בסביבה חברתית. יתרה מכך, גם אם האיומים הללו על התוקף הפנימי יוערכו, עדיין לא ניתן לקבוע את הסיבתיות במלואה מכיוון שלנסיין אין שליטה מוחלטת על משתנים זרים. [12]

    החסרונות כוללים גם קבוצות המחקר עשויות לספק ראיות חלשות יותר בגלל היעדר אקראיות. אקראיות מביאה הרבה מידע שימושי למחקר מכיוון שהיא מרחיבה את התוצאות ולכן נותנת ייצוג טוב יותר של האוכלוסייה כולה. שימוש בקבוצות לא שוות יכול גם להוות איום על התוקף הפנימי. אם הקבוצות אינן שוות, מה שקורה לפעמים בניסויים מעין, ייתכן שהנסיין לא בטוח מה הסיבות לתוצאות. [4]

    תוקף פנימי הוא האמת המשוערת לגבי מסקנות לגבי סיבה-תוצאה או קשרים סיבתיים. זו הסיבה שתקפות חשובה לניסויים מעין כי כולם עוסקים בקשרים סיבתיים. זה מתרחש כאשר הנסיין מנסה לשלוט בכל המשתנים שעלולים להשפיע על תוצאות הניסוי. רגרסיה סטטיסטית, היסטוריה והמשתתפים הם כולם איומים אפשריים על התוקף הפנימי. השאלה שהיית רוצה לשאול תוך כדי ניסיון לשמור על תוקף פנימי גבוה היא "האם יש עוד סיבות אפשריות לתוצאה מלבד הסיבה שאני רוצה שהיא תהיה?" אם כן, יתכן שהתוקף הפנימי לא יהיה כל כך חזק. [8]

    תוקף חיצוני הוא המידה שבה ניתן להכליל את התוצאות המתקבלות ממדגם מחקר "ל"לאוכלוסיית עניין מסויימת היטב ו"על פני" תת-אוכלוסיות של אנשים, זמנים, הקשרים ושיטות מחקר. [13] לינץ' טען שהכללה "ל" אוכלוסייה כמעט אף פעם אינה אפשרית מכיוון שהאוכלוסיות אליהן נרצה להקרין הן מדדים של התנהגות עתידית, שבהגדרה לא ניתן לדגום. [14] לכן, השאלה הרלוונטית יותר היא האם השפעות הטיפול מכללות "על פני" תת-אוכלוסיות המשתנות על פי גורמי רקע שאולי אינם בולטים לחוקר. תוקף חיצוני תלוי בשאלה האם למחקרי הטיפולים יש השפעות הומוגניות על פני תת -קבוצות שונות של אנשים, זמנים, הקשרים ושיטות לימוד או שהסימן והעוצמה של כל השפעות הטיפול משתנות בין קבוצות משנה בדרכים שלא יכירו או יובנו על ידי החוקרים. . [15] Athey ו-Imbens ו-Athey ו-Wager היו חלוצים בטכניקות למידת מכונה להבנה אינדוקטיבית של השפעות טיפול הטרוגניות. [16] [17]

    עיצובים של "אדם לפי טיפול" הם הסוג הנפוץ ביותר של עיצוב מעין ניסוי. בתכנון זה, הנסיין מודד לפחות משתנה בלתי תלוי אחד. יחד עם מדידת משתנה אחד, הנסיין יתמרן גם משתנה בלתי תלוי אחר. מכיוון שיש מניפולציה ומדידה של משתנים בלתי תלויים שונים, המחקר נעשה בעיקר במעבדות. גורם חשוב בהתמודדות עם עיצובים של אדם אחר טיפול הוא שיהיה צורך להשתמש בהקצאה אקראית על מנת לוודא שלנסיין יש שליטה מלאה על המניפולציות הנעשות במחקר. [18]

    דוגמה לעיצוב מסוג זה בוצעה באוניברסיטת נוטרדאם. המחקר נערך כדי לראות אם הדרכה לתפקידך הובילה לעלייה בסיפוק בעבודה. התוצאות הראו שאנשים רבים שכן היה להם מנטור הראו שביעות רצון גבוהה מאוד בעבודה. עם זאת, המחקר גם הראה שלמי שלא קיבל את המנטור היה גם מספר גבוה של עובדים מרוצים. סייברט הגיע למסקנה שלמרות שהעובדים שהיו להם חונכים היו מרוצים, הוא לא יכול היה להניח שהסיבה לכך היא המנטורים עצמם בגלל המספרים הגבוהים של העובדים שאינם חונכים שאמרו שהם מרוצים. זו הסיבה מדוע ההקרנה מראש היא מאוד חשובה, כך שתוכל למזער את כל הפגמים במחקר לפני שהם נראים. [19]

    "ניסויים טבעיים" הם סוג אחר של עיצוב מעין ניסוי המשמש חוקרים. זה שונה מאדם אחר טיפול באופן שאין משתנה שעובר מניפולציות על ידי הנסיין. במקום לשלוט במשתנה אחד לפחות כמו התכנון של אדם אחר טיפול, הנסיינים אינם משתמשים בהקצאה אקראית ומשאירים את הבקרה הניסויית למקרה. זה המקום שבו השם "טִבעִימקור הניסוי. המניפולציות מתרחשות באופן טבעי, ולמרות שזו עשויה להיראות כמו טכניקה לא מדויקת, היא למעשה הוכחה כמועילה במקרים רבים. אלו הם המחקרים שנעשו לאנשים שקרה להם משהו פתאומי. זה יכול להיות טוב או רע, טראומטי או אופורי. דוגמה לכך יכולה להיות מחקרים שנעשו על אלה שעברו תאונת דרכים ואלו שלא. תאונות דרכים מתרחשות באופן טבעי, כך שזה לא יהיה מוסרי לביים ניסויים כדי לגרום טראומה לנבדקים במחקר אירועים טבעיים אלו הוכחו כמועילים לחקר מקרים של הפרעת דחק פוסט טראומטית [18]


    תוכן

    הראשון שהדגיש את חשיבות השחזור במדע היה הכימאי האירי רוברט בויל, באנגליה במאה ה-17. משאבת האוויר של בויל תוכננה לייצר וללמוד ואקום, שהיה אז מושג שנוי במחלוקת. ואכן, פילוסופים מכובדים כמו רנה דקארט ותומס הובס הכחישו את עצם האפשרות של קיום ואקום. היסטוריונים של המדע סטיבן שאפין וסיימון שפר, בספרם משנת 1985 לויתן ומשאבת האוויר, לתאר את הוויכוח בין בויל להובס, לכאורה על מהות הוואקום, כוויכוח ביסודו כיצד יש להשיג ידע שימושי. בויל, מחלוצי שיטת הניסוי, טען כי יסודות הידע צריכים להיות מורכבים על ידי עובדות שהופקו בניסוי, שניתן להפוך אותן לאמינות לקהילה מדעית על ידי שכפולן. על ידי חזרה על אותו ניסוי שוב ושוב, טען בויל, תתברר וודאות העובדה.

    משאבת האוויר, שבמאה ה -17 הייתה מנגנון מסובך ויקר לבנייה, הובילה גם לאחת המחלוקות המתועדות הראשונות בנוגע לשחזור של תופעה מדעית מסוימת. בשנות ה-60, המדען ההולנדי כריסטיאן הויגנס בנה את משאבת האוויר שלו באמסטרדם, הראשונה מחוץ לניהול הישיר של בויל ועוזרו בזמנו רוברט הוק. הויגנס דיווח על אפקט שהוא כינה "תרחיף חריג", שבו נראה שהמים מרחפים בצנצנת זכוכית בתוך משאבת האוויר שלו (למעשה תלויים מעל בועת אוויר), אבל בויל והוק לא יכלו לשחזר את התופעה הזו במשאבות שלהם. כפי שמתארים שאפן ושפר, "התברר שאם לא ניתן לייצר את התופעה באנגליה עם אחת משתי המשאבות הזמינות, אז אף אחד באנגליה לא יקבל את הטענות שהוייגנס העלה, או את יכולתו בעבודת המשאבה". הויגנס הוזמן לבסוף לאנגליה ב-1663, ותחת הנחייתו האישית הוק הצליח לשחזר תרחיף חריג של מים. בעקבות זאת הויגנס נבחר לחבר זר בחברה המלכותית. עם זאת, שפין ושפר גם מציינים כי "השגת השכפול הייתה תלויה בפעולות שיפוט תלויות. אי אפשר לרשום נוסחה האומרת מתי השכפול הושג או לא הושג". [1]

    פילוסוף המדע קארל פופר ציין בקצרה בספרו המפורסם משנת 1934 ההיגיון של גילוי מדעי ש"התרחשויות בודדות שאינן ניתנות לשחזור הן חסרות משמעות למדע". [2] הסטטיסטיקאי רונלד פישר כתב בספרו משנת 1935 עיצוב הניסויים, אשר קבע את היסודות לפרקטיקה המדעית המודרנית של בדיקת השערות ומובהקות סטטיסטית, כי "נוכל לומר שתופעה ניתנת להדגמה ניסויית כאשר אנו יודעים כיצד לבצע ניסוי אשר לעיתים רחוקות לא יצליח לתת לנו תוצאות מובהקות סטטיסטית". [3] קביעות כאלה מבטאות דוגמה נפוצה במדע המודרני לפיה שחזור היא תנאי הכרחי (אם כי לא בהכרח מספיק) לקביעת עובדה מדעית, ובפועל לביסוס סמכות מדעית בכל תחום ידע. עם זאת, כפי שצוינו לעיל על ידי שפין ושפר, דוגמה זו אינה מנוסחת היטב מבחינה כמותית, כמו מובהקות סטטיסטית למשל, ולכן לא נקבע במפורש כמה פעמים יש לשכפל עובדה כדי להיחשב לניתנת לשחזור.

    שני שלבים עיקריים מובחנים באופן טבעי בקשר לשחזור של מחקרים ניסויים או תצפיתיים: כאשר מתקבלים נתונים חדשים בניסיון להשיג אותם, המונח שכפול משמש לעתים קרובות, והמחקר החדש הוא א שכפול אוֹ לשכפל של המקורית. בהשגת אותן תוצאות כאשר מנתחים שוב את מערך הנתונים של המחקר המקורי באותם נהלים, מחברים רבים משתמשים במונח שחזור במובן צר וטכני הנובע מהשימוש בו במחקר חישובי. הֲדִירוּת קשור ל חזרה של הניסוי בתוך אותו מחקר של אותם חוקרים. שכפול במובן המקורי, הרחב מוכר רק אם שכפול מבוצע על ידי א צוות חוקרים עצמאי מצליח.

    למרבה הצער, המונחים שחזור ושכפול מופיעים בספרות גם במשמעות הפוכה. [4] [5]

    בכימיה משתמשים במונחים שחזור וחזרה במשמעות כמותית ספציפית: בניסויים בין מעבדתיים, ריכוז או כמות אחרת של חומר כימי נמדדת שוב ושוב במעבדות שונות כדי להעריך את השונות של המדידות. לאחר מכן, סטיית התקן של ההפרש בין שני ערכים המתקבלים באותה מעבדה נקראת חזרה. סטיית התקן להפרש בין שתי מדידות ממעבדות שונות נקראת יכולת שחזור. [6] מדדים אלו קשורים לתפיסה הכללית יותר של רכיבי שונות במטרולוגיה.

    שיטת מחקר ניתנת לשחזור עריכה

    התנאי מחקר שניתן לשחזר מתייחס לרעיון שתוצאות מדעיות צריכות להיות מתועדות בצורה כזו שהמסקנה שלהן תהיה שקופה מלאה. זה דורש תיאור מפורט של השיטות המשמשות להשגת הנתונים [7] [8] והפיכת מערך הנתונים המלא והקוד לחישוב התוצאות לנגישים בקלות. [9] [10] [11] [12] [13] [14] זהו החלק המהותי של המדע הפתוח.

    כדי להפוך כל פרויקט מחקר לשחזור חישובי, הפרקטיקה הכללית כוללת את כל הנתונים והקבצים מופרדים, מתויגים ומתועדים בבירור. כל הפעולות צריכות להיות מתועדות במלואן ואוטומטיות ככל האפשר, תוך הימנעות מהתערבות ידנית במידת האפשר. יש לעצב את זרימת העבודה כרצף של שלבים קטנים יותר המשולבים כך שתפוקות הביניים משלב אחד מוזנות ישירות כקלט לשלב הבא. יש להשתמש בבקרת גרסאות מכיוון שהיא מאפשרת לעיין בקלות בהיסטוריה של הפרויקט ומאפשרת תיעוד ומעקב אחר שינויים באופן שקוף.

    זרימת עבודה בסיסית למחקר שניתן לשחזר כוללת רכישת נתונים, עיבוד נתונים וניתוח נתונים. רכישת נתונים מורכבת בעיקר מהשגת נתונים ראשוניים ממקור ראשי כגון סקרים, תצפיות בשטח, מחקר ניסיוני או השגת נתונים ממקור קיים. עיבוד נתונים כרוך בעיבוד ובסקירה של הנתונים הגולמיים שנאספו בשלב הראשון, וכולל הזנת נתונים, מניפולציה וסינון נתונים ועשוי להיעשות באמצעות תוכנה. יש לבצע דיגיטציה של הנתונים ולהכינם לניתוח נתונים. ניתן לנתח נתונים באמצעות תוכנה כדי לפרש או להמחיש נתונים סטטיסטיים או נתונים כדי להפיק את התוצאות הרצויות של המחקר, כגון תוצאות כמותיות כולל דמויות וטבלאות. השימוש בתוכנה ובאוטומציה משפר את יכולת השחזור של שיטות מחקר. [15]

    ישנן מערכות המאפשרות תיעוד כזה, כמו שפת R Markdown [16] או מחברת Jupyter. [17] מסגרת המדע הפתוחה מספקת פלטפורמה וכלים שימושיים לתמיכה במחקר שניתן לשחזור.

    מחקר שניתן לשחזור בפועל עריכה

    הפסיכולוגיה ראתה חידוש של חששות פנימיים לגבי תוצאות בלתי ניתנות לייצור (ראו ערך בנושא משבר שכפול לתוצאות אמפיריות על אחוזי הצלחה של שכפולים). חוקרים הראו במחקר משנת 2006 שמתוך 141 מחברי פרסום מאמרים אמפיריים של איגוד הפסיכולוגיה האמריקאית (APA), 103 (73%) לא הגיבו עם הנתונים שלהם במשך תקופה של שישה חודשים. [18] במחקר המשך שפורסם ב-2015, נמצא כי 246 מתוך 394 יצרו קשר עם מחברי מאמרים בכתבי עת של APA לא שיתפו את הנתונים שלהם לפי בקשה (62%). [19] במאמר משנת 2012 הוצע כי חוקרים יפרסמו נתונים יחד עם עבודותיהם, ומערך נתונים שוחרר לצד הדגמה. [20] בשנת 2017, מאמר שפורסם ב נתונים מדעיים הציע שאולי זה לא מספיק ושיש לחשוף את כל הקשר הניתוח. [21]

    בכלכלה הועלו חששות ביחס לאמינות והאמינות של מחקר שפורסם. במדעים אחרים, רפרודוקטיביות נחשבת כבסיסית ולעתים קרובות היא תנאי מוקדם לפרסום מחקר, אולם במדעי הכלכלה היא לא נתפסת כעדיפות בעלת חשיבות גדולה ביותר. רוב כתבי העת הכלכליים שנבדקו על ידי עמיתים אינם נוקטים באמצעים מהותיים על מנת להבטיח שהתוצאות שפורסמו ניתנות לשחזור, אולם כתבי העת הכלכליים המובילים עברו לאמץ נתונים חובה וארכיוני קוד. [22] יש תמריצים נמוכים או ללא תמריצים לחוקרים לשתף את הנתונים שלהם, והמחברים יצטרכו לשאת בעלויות של איסוף נתונים לצורות לשימוש חוזר. לעתים קרובות לא ניתן לשחזר מחקר כלכלי מכיוון שרק לחלק מכתבי העת יש מדיניות גילוי נאותה עבור מערכי נתונים וקוד תוכניות, וגם אם כן, המחברים לרוב אינם מצייתים להם או שהם אינם נאכפים על ידי המוציא לאור. מחקר של 599 מאמרים שפורסמו ב-37 כתבי עת שנבדקו עמיתים גילה כי בעוד שכמה כתבי עת השיגו שיעורי ציות משמעותיים, חלק ניכר צייתם רק באופן חלקי, או לא עמד בכלל. ברמת מאמרים, שיעור הציות הממוצע היה 47.5% וברמת כתב העת, שיעור הציות הממוצע עמד על 38%, נע בין 13% ל-99%. [23]

    מחקר משנת 2018 שפורסם בכתב העת PLOS ONE מצא כי 14.4% ממדגם של חוקרי בריאות הציבור שיתפו את הנתונים או הקוד שלהם או שניהם. [24]

    היו יוזמות לשיפור הדיווח ומכאן לשחזוריות בספרות הרפואית במשך שנים רבות, החל מיוזמת CONSORT, המהווה כיום חלק מיוזמה רחבה יותר, רשת EQUATOR. קבוצה זו הפנתה לאחרונה את תשומת לבה לאופן שבו דיווח טוב יותר עשוי להפחית בזבוז במחקר, [25] במיוחד מחקר ביו-רפואי.

    מחקר שניתן לשחזור הוא המפתח לתגליות חדשות בפרמקולוגיה. תגלית שלב I תגרור רפרודוקציות שלב II כאשר תרופה מתפתחת לקראת ייצור מסחרי. בעשורים האחרונים הצלחת שלב ב' ירדה מ-28% ל-18%. מחקר שנערך בשנת 2011 מצא כי 65% ממחקרי הרפואה לא היו עקביים כאשר נבדקו מחדש, ורק 6% ניתנים לשחזור מלא. [26]

    Hideyo Noguchi התפרסם בזיהוי נכון של הגורם החיידקי של עגבת, אך גם טען שהוא יכול לטפח את הסוכן הזה במעבדתו. אף אחד אחר לא הצליח להפיק את התוצאה האחרונה הזו. [27]

    במרץ 1989 דיווחו הכימאים מאוניברסיטת יוטה סטנלי פונס ומרטין פליישמן על ייצור עודפי חום שאפשר להסביר רק בתהליך גרעיני ("היתוך קר"). הדיווח היה מדהים בהתחשב בפשטות הציוד: זה היה בעצם תא אלקטרוליזה המכיל מים כבדים וקתודה פלדיום שספגה במהירות את הדאוטריום שנוצר במהלך האלקטרוליזה. כלי התקשורת דיווחו על הניסויים בהרחבה, וזה היה אייטם בעמוד הראשון בעיתונים רבים ברחבי העולם (ראה מדע לפי מסיבת עיתונאים). במהלך החודשים הקרובים אחרים ניסו לשחזר את הניסוי, אך לא הצליחו. [28]

    ניקולה טסלה טען כבר ב-1899 כי השתמש בזרם בתדר גבוה כדי להדליק מנורות מלאות גז ממרחק של יותר מ-40 ק"מ מבלי להשתמש בחוטים. בשנת 1904 הוא בנה את מגדל ורדנקליף בלונג איילנד כדי להדגים אמצעים לשליחת וקבלת חשמל ללא חיבור חוטים. המתקן מעולם לא פעל במלואו ולא הושלם עקב בעיות כלכליות, ולכן מעולם לא בוצע ניסיון לשחזר את התוצאה הראשונה שלו. [29]


    תכנון הניתוחים שלך

    תאר לעצמך שאתה חושב על שאלת המחקר המושלמת לעבודה שלך. זה חשוב לתחום שלך, ואתה נדהמת לגלות שאף אחד לא פרסם מחקר בנושא. אתה דנה ברעיון שלך עם היועצת שלך, והיא אוהבת אותו. שניכם מתכננים מחקר כדי לבדוק את ההשערות הנובעות משאלת המחקר שלכם ואתם מבלים את השנה הבאה באיסוף נתונים. לאחר איסוף הנתונים, אתה מתייעץ עם חבר סגל הבקיא בסטטיסטיקה לעזרה בניתוחים שלך. חבר הסגל מודיע לך שעיצוב המחקר שלך לא היה מתאים להשערות שלך. יהיה עליך לבצע מחדש את איסוף הנתונים בעזרת עיצוב מחקר חדש, שייקח שנה נוספת.

    מצב היפותטי זה אולי נראה לא מציאותי, אך אי תכנון תקיף של הניתוחים במהלך תכנון מחקר יכול לגרום לאכזבה וכאבי ראש. בעיות שנתקלות בהן בעקבות איסוף נתונים עשויות לכלול: (1) אתה מבין שעיצוב המחקר אינו הולם (2) אינך יודע את הניתוח המתאים (3) הניתוחים אינם בעלי עוצמה נמוכה.

    עיצוב המחקר אינו הולם. עיצוב מחקר עשוי להיות מתויג כלא הולם אם לא ניתן להשתמש בתוצאותיו לבדיקת השערות החוקר. עיצוב מחקר לא הולם הוא לרוב תוצאה של אי -תכנון המחקר של האדם סביב השערות ספציפיות הניתנות לבדיקה. לדוגמה, סטודנט לתואר שני שמתכנן מחקר המבוסס על שאלת מחקר מעורפלת (למשל, "טיפול א 'טוב יותר מטיפול ב' לטיפול בהפרעת דחק פוסט טראומטית") עשוי להיתקל בבעיות. במקום זאת, על התלמיד ליצור השערות ספציפיות (למשל, "בין טרום מבחן לאחר מבחן, משתתפים שמקבלים טיפול א' יציגו ירידה גדולה יותר בחרדה מאשר משתתפים שמקבלים טיפול ב'"). כאשר לתלמיד יש קבוצה של השערות ספציפיות הניתנות לבדיקה, היא יכולה לעצב מחקר בהתאם.

    אתה לא יודע את הניתוח המתאים. איסוף נתונים לפני יצירת תוכנית ניתוח יכול להשאיר לחוקר נתונים שהוא לא יכול לנתח. כדי להימנע מבעיה זו, חשוב ליצור תוכנית ניתוח לפני איסוף הנתונים. יצירת תוכנית ניתוח יכולה לחשוף בעיות ניתוח אפשריות (למשל, השערה הדורשת שיטות סטטיסטיות שהחוקר אינו מכיר). אם תלמיד יודע שאין ביכולתו לבצע ניתוח לפני איסוף הנתונים, הוא יכול לשנות את עיצוב הלימודים לכזה שדורש ניתוחים פשוטים יותר. אם עיצוב לימוד מורכב הוא בלתי נמנע, הסטודנט יכול להיעזר ביועץ סטטיסטי. אם אתה קובע שאתה זקוק לעזרה בנתונים הסטטיסטיים שלך, עליך לפנות ליועץ סטטיסטי לפני איסוף הנתונים שלך. פרופסורים וסטודנטים במחלקה שלך עשויים להציע ייעוץ חינם. לאוניברסיטאות רבות יש מרכזי ייעוץ סטטיסטי המציעים תעריפים נמוכים לסטודנטים במוסדותיהם. אם אינך יכול לקבל עזרה באוניברסיטה שלך, מספר רב של יועצים סטטיסטיים עצמאיים ניתן למצוא באינטרנט.

    הניתוחים חסרי כוח. בעת ביצוע מחקר, חשוב לוודא שתכנון המחקר ומספר התצפיות יספקו כוח מספיק עבור כל ניתוח. למרבה הצער, תלמידים מחליטים לעתים קרובות על עיצוב המחקר ומספר התצפיות מבלי לבצע ניתוח כוח. זה יכול להוביל לתוצאות מלאות בשלילי שווא (שגיאות סוג II). כדי להימנע מבעיה זו, חשוב להפעיל ניתוח כוח עבור כל ניתוח מתוכנן לפני איסוף נתונים. נהלי ניתוח כוח זמינים בחבילות תוכנה סטטיסטיות עיקריות רבות (למשל, SAS ®, SPSS ו-R) וגם בתוכנות עצמאיות (למשל, PASS ו-G*Power). החביב עלי האישי הוא G*Power, שהוא חינמי וקל לשימוש.

    נקיטת כמה צעדים פשוטים יכולים להבטיח שהמחקר הבא שלך יצליח. צור השערות ספציפיות הניתנות לבדיקה. כתוב תוכנית ניתוח המפרטת את הניתוח הספציפי שיש להפעיל עבור כל השערה. הפעל ניתוח כוח לכל ניתוח. התייעץ עם מומחה סטטיסטיקה כדי לסקור את תוכנית הניתוח שלך לפני איסוף הנתונים. התייעץ שוב עם מומחה סטטיסטיקה לאחר איסוף הנתונים.


    השוואה בין אסטרטגיות ניתוח הכוונה לטיפול לטיפול במחקרים טרום פוסטיים עם אובדן מעקב

    במחקרים קדם-פוסטים כאשר כל התוצאות נצפות לחלוטין, מחקרים קודמים הראו שניתוח שיתוף פעולה (ANCOVA) חזק יותר מניתוח ציון שינוי בבדיקת השפעת הטיפול. עם זאת, היו מעט מחקרים שהשוו כוח תחת ערכים חסרים לאחר הבדיקה. מאמר זה הונע על ידי מחקר התנהגות ופעילות גופנית להתערבות בבריאות גופנית (BePHIT), מחקר טרום-פוסט שנועד להשוות בין שתי התערבויות על זמן ההליכה של נשים לאחר גיל המעבר. מטרת מחקר זה הייתה להשוות את כוחן של שתי שיטות המתאימות לעקרון הכוונה לטיפול (ITT) כאשר חסרים נתונים לאחר הבדיקה: ANCOVA לאחר זקיפה מרובה (MI) והמודל המעורב המיושם על כל הזמינים נתונים (AA). כמו כן, השווינו את שתי אסטרטגיות הניתוח של ITT לשתי שיטות שאינן תואמות לעקרונות ITT: ANCOVA עם מקרה מלא (CC) והמודל המעורב של CC. השוואות בוצעו באמצעות ניתוחים של נתוני BePHIT ומחקרי סימולציה שנערכו תחת גדלי מדגם שונים, שיעורי חסר ותרחישי חסר. בניתוח נתוני BePHIT, ANCOVA אחרי MI היה הקטן ביותר עמ-ערך לבדיקת השפעת הטיפול של ארבע השיטות. תוצאות סימולציה הוכיחו כי המודל המעורב של AA היה בדרך כלל חזק יותר מ-ANCOVA לאחר MI. הכוח של ANCOVA לאחר MI ירד הכי מהר ככל ששיעור החסר עלה ברוב התרחישים המדומים, ANCOVA לאחר MI היה בעל ההספק הקטן ביותר כאשר 50% מהתוצאות שלאחר הבדיקה היו חסרים.


    משחקי וידאו אקשן פופולריים מאוד כמקור בידור. מצד אחד, יש חששות שהמשחקים הללו מקדמים אלימות. מצד שני, עבודה אחרונה העלתה שלמשחק משחקי וידאו פעולה עשוי להיות יתרונות קוגניטיביים ותפיסתיים. יכולות להיות לכך השלכות חשובות: מכיוון שמשחקים אלה מהנים לשחק, הם יכולים להיות התערבויות אידיאליות למתן ירידה קוגניטיבית אצל מבוגרים, לקדם התאוששות בחולי שבץ, או להגביר את היכולות של תלמידים עם צרכים חינוכיים מיוחדים.

    שני מחקרים שנערכו לאחרונה בדקו מחדש האם משחק משחקי וידאו אקשן יכול להיות תפיסתי (van Ravenzwaaij et al., 2014, כתב עת לפסיכולוגיה נסיונית: כללי) (PDF, 215KB) או קוגניטיבי (Blacker et al., 2014, כתב עת לפסיכולוגיה ניסויית: תפיסה וביצועים אנושיים) (PDF, 159KB) תועלת בשימוש במחקרי הדרכה עם משתתפים שדיווחו על ניסיון מועט עד ללא ניסיון במשחקי וידאו.

    בשני המחקרים, קבוצה אחת של משתתפים שיחקה משחק וידאו אקשן של יריות מגוף ראשון (למשל, Call of Duty), וקבוצה אחרת שיחקה במשחק וידאו בקרה (הסימס).

    ב-van Ravenzwaaij וחב', המשתתפים השלימו משימת מבחן שנועדה למדוד מהירות עיבוד תפיסתית פשוטה לפני כל אחד מחמישה מפגשי משחק וידאו בני שעתיים ואחרי הפגישה האחרונה. במשימת הבדיקה, המשתתפים צפו בתצוגות נקודות נעות שבהן שליש מהנקודות זזו באופן קוהרנטי, והשאר זזו באקראי. תצוגות כאלה מייצרות אשליה שכל מערך הנקודות נע באופן שיטתי בכיוון אחד. על המשתתפים לציין את הכיוון הכולל של התנועה הנתפסת במהירות האפשרית.

    בסך הכל, הביצועים במשימת הנקודה הנעה הפכו מהר יותר במפגשים, מה שמצביע על השפעה כללית של תרגול על מהירות המשימה. באופן קריטי, לא היה הבדל בביצועים בין משתתפים שהתאמנו על משחק וידאו הפעולה לעומת משחק הבקרה, מה שמרמז שלא היה שום יתרון נוסף במשחקי וידאו פעולה על מהירות עיבוד תפיסתי פשוט.

    ב-Blacker et al., המשתתפים שיחקו במשחק הווידאו הפעולה או השליטה במשך 30 שעות במשך כ-30 ימים. זיכרון העבודה הוערך לפני ואחרי האימון תוך שימוש במשימה שבה המשתתפים היו צריכים לציין אם שני מערכים המופיעים ברצף של ריבועים צבעוניים זהים או שונים (בניסויים "שונים" אחד הריבועים הוצג בצבע אחר).

    הביצועים השתפרו ממבחן לפני בדיקה לאחר מבחן עבור קבוצת משחקי וידאו פעולה, אך לא קבוצת משחקי וידאו בקרה. חשוב לציין, הקבוצות לא היו שונות במוטיבציה או מעורבות עצמית במהלך אימון משחקי וידאו, וגם לא בציפיות שלהן לגבי האופן שבו הן חשבו שהאימון במשחק הווידאו ישפיע על ביצועי זיכרון העבודה שלהן.

    יחד, מחקרים אלו מצביעים על כך שמשחק משחקי וידאו אקשן משפר את זיכרון העבודה, אך לא את מהירות העיבוד התפיסתית.


    איך קוראים למדדים שהושגו בין טרום מבחן לאחר מבחן? - פסיכולוגיה

    במחקר חינוכי, לעולם לא ניתן לדגום את כל האנשים שאנו רוצים להסיק לגביהם. לדוגמה, מטרת מחקר מחקר עשויה להיות לקבוע אם דרך חדשה של הוראת מתמטיקה משפרת את ההישגים המתמטיים של כל הילדים בבית הספר היסודי 1. עם זאת, זה יהיה בלתי אפשרי לבדוק את כל ילדים ביסודי 1 בגלל זמן, משאבים וגורמים לוגיסטיים אחרים. במקום זאת, החוקר בוחר מדגם של האוכלוסייה לביצוע מחקר. עם זאת, החוקרת אינה רוצה להגביל את מסקנותיה רק ​​לילדים המעטים שהשתתפו במחקר. במקום זאת, היא רוצה לומר שמכיוון שדרכה החדשה ללמד מתמטיקה שיפרה את ההישגים המתמטיים של הילדים במדגם שלה, היא גם תשפר את ההישג המתמטי של כל הילדים ביסודי 1. לפיכך, החוקר רוצה להסיק מסקנות - או מסקנות - על כלל האוכלוסייה בהתבסס על תוצאות המדגם.

    מטרת הסטטיסטיקה ההסקתית היא לקבוע האם ניתן להכליל - או ליישם את הממצאים מהמדגם על כלל האוכלוסייה. תמיד יהיו הבדלים בציונים בין קבוצות במחקר מחקר. לדוגמה, דמיינו את הציונים הבאים ב-WAEC מתלמידים שלמדו בבית ספר ממשלתי או פרטי. (שים לב שהנתונים נוצרו על ידי מחולל מספרים אקראיים ולכן אינם משקפים ציונים בפועל.)

    בכל הקורסים המפורטים בטבלה 5 קיים הבדל בממוצע הציונים בין בתי הספר הממשלתיים לבתי הספר הפרטיים. עם זאת, אילו הבדלים גדולים מספיק כדי להיות משמעותיים? במתמטיקה, יש הבדל ברור בציונים הממוצעים. מצד שני, ההבדל בין בתי ספר ממשלתיים לבתי ספר פרטיים ב- CRK/IRK הוא פחות מנקודה אחת. ברור שזה לא מייצג הבדל משמעותי בין שני סוגי בתי הספר. עד כמה ההבדל חייב להיות גדול כדי להסיק שיש הבדל משמעותי בביצועים הלימודיים בין בתי הספר הממשלתיים לבתי הספר הפרטיים?

    יש להשתמש בסטטיסטיקות מסקנות כדי לקבוע אם ההבדל בין שתי הקבוצות במדגם גדול מספיק כדי שניתן יהיה לומר שהממצאים הם משמעותי. אם הממצאים אכן משמעותיים, ניתן ליישם או להכליל את המסקנות על כלל האוכלוסייה. מצד שני, אם ההבדל בין הקבוצות קטן מאוד, אז הממצאים כן לא משמעותי ולכן היו פשוט תוצאה של מקרה.

    אם נחזור להמחשה של WAEC, מחקר זה מצא שיש הבדל בביצועי CRK/IRK במדגם שלנו: לבתי ספר ממשלתיים היה ציון ממוצע גבוה מעט יותר מבתי ספר פרטיים. עם זאת, לאחר עריכת סטטיסטיקות מסקנות, נגלה שההבדל אינו משמעותי.המשמעות היא שההבדל בין בתי ספר ממשלתיים לפרטיים במדגם שלנו היה קטן מכדי להסיק שקיים הבדל ממשי בכל אוכלוסיית בתי הספר הממשלתיים והפרטיים. ההבדל הזעיר הזה בביצועי CRK/IRK נבע פשוט ממקרי. אם נאסוף נתונים ממדגם אחר של בתי ספר ממשלתיים ופרטיים, סביר להניח שנמצא את ההיפך מההבדל הקטן הזה.

    מצד שני, לאחר עריכת סטטיסטיקות מסקנות, דמיינו שאנו מגלים שההבדל בביצועים במתמטיקה הוא משמעותי. לכן, את התוצאות מהמדגם שלנו - לבתי ספר ממשלתיים יש ביצועים גבוהים יותר במתמטיקה מבתי ספר פרטיים - ניתן ליישם גם על כלל האוכלוסייה. לפיכך, אנו מסיקים שבאופן כללי, בתי ספר ממשלתיים עולים על בתי ספר פרטיים במתמטיקה. המשמעות היא שאם נאסוף נתונים ממדגם אחר, כמעט מובטח לנו למצוא את אותה תוצאה בדיוק.

    בעת חישוב סטטיסטיקה מסקנתית, נתון המפתח הוא עמ סטטיסטיקה. ערך p זה הוא ההסתברות שהתוצאה נובעת מקריות. ערך ה- p יכול לנוע בין 0.000 ל- 1.000. ככל ש-p גדול יותר, כך גדל הסיכוי שהתוצאות נובעות מקריות. אם p הוא 0.500, ההסתברות שהתוצאה נובעת מקריות היא 5 מתוך 10. זה אומר שיש הסתברות שווה שהתוצאה מובהקת באוכלוסיה או שהתוצאה נובעת מקריות. P של 0.850 פירושו שההסתברות שהתוצאה נובעת ממקרה היא 85 מתוך 100, כלומר הממצא ככל הנראה נובע מסיכוי. p של 0.050 פירושו שההסתברות שהתוצאה נובעת מקריות היא 5 מתוך 100.

    חוקרים רוצים להיות בטוחים למדי במסקנותיהם, אז הם החליטו שההסתברות שהתוצאה נובעת מקריות צריכה להיות קטנה מאוד - פחות מ-5 מתוך 100. זו הסיבה שהסטנדרט במחקר הוא שה-p חייב להיות הוא פחות מ-0.05 כדי שהתוצאות יהיו משמעותיות. (נקודת חיתוך זו עבור p נקראת לעתים קרובות אלפא, לפעמים נאמר שאלפא קטן מ-05.)

    נזכיר מכתיבת השערות מחקר שהשערות מחקר מוצהרות בדרך כלל כהשערות אפס: אין הבדל משמעותי בין בתי ספר ממשלתיים לפרטיים בביצועים במתמטיקה. אם ערך ה-p המחושב קטן מ-0.050, אז השערת האפס היא נִדחֶה. אם האמירה "אין הבדל משמעותי" נדחתה, זה אומר שיש הבדל משמעותי. ניתן אפוא להסיק שקיים הבדל בין שתי הקבוצות באוכלוסייה, ולא רק המדגם. מצד שני, אם p גדול מ-0.050, זה אומר שהשערת האפס היא שמור. המשמעות היא שהשערת האפס, כאמור, מדויקת: באוכלוסייה, אין הבדל משמעותי

    חישוב סטטיסטיקות מסקנות

    בשלב זה, יש לקודד את הנתונים ולחשב את הציונים הכוללים עבור כל משתנה. הגיע הזמן לחשב את הנתונים הסטטיסטיים. אני ממליץ בחום להשתמש ב- VassarStats, אתר חינמי שמחשב נתונים סטטיסטיים עבור כל המחקרים המורכבים ביותר. הנתון הספציפי לחישוב עבור כל השערת מחקר היה צריך להיות מזוהה כבר בשלב שיטת ניתוח הנתונים. אם זה נעשה, ניתוח הנתונים אמור להימשך פחות משעה. כל סוג נתון הסקה שונה במקצת, לכן קרא להלן כיצד לחשב כל נתון.

    ט-מִבְחָן
    ה טיש להשתמש במבחן כאשר משווים בין שתי קבוצות על משתנה תלוי. לפיכך, א ט-מבחן ישמש להשוואה בין קבוצת טיפול לקבוצת ביקורת או להשוואה בין גברים ונקבות. לשם המחשה, עיין בהשוואה בין בתי ספר ממשלתיים ופרטיים על ציוני WAEC. כדי לחשב את מבחן ה-t, יש למיין את הנתונים לפי המשתנה הבלתי תלוי, במקרה זה סוג בית ספר. במילים אחרות, כל ציוני בתי הספר הממשלתיים מקובצים יחד, וכל ציוני בית הספר הפרטי מקובצים יחדיו. ב- VassarStats, לחץ על מבחן t ולאחר מכן על בדיקת t דו-דוגמית לדגימות עצמאיות או מתואמות. במסך החדש, לחץ על דגימות עצמאיות. (דגימות מתואמות יהיו עבור מחקרים שבהם שתי הקבוצות הותאמו על משתנה רלוונטי אחר, כגון אינטליגנציה, או כאשר שני הציונים הגיעו מאותה קבוצת אנשים, כגון השוואת ציוני אנגלית ומתמטיקה בתוך בתי הספר הממשלתיים.) לאחר מכן הזן את ציוני מתמטיקה עבור כל תלמיד בקבוצת בית הספר הממשלתי באזור מדגם אחד (מדגם א') וציוני המתמטיקה עבור כל תלמיד בקבוצת בית הספר הפרטי בשני. לחץ על חשב והתוצאות אמורות לצוץ.

    גלול למטה במסך. הנתון הראשון שיש להסתכל עליו הוא ה-p: דו-זנב. אם p זה גדול מ-0.050, אז השערת האפס נשמרת והתוצאה אינה מובהקת. אם התוצאה אינה משמעותית, הניתוח והפרשנות מסתיימים מכיוון שאין הבדל משמעותי בין הקבוצות.

    אם p זה קטן מ-0.050, אזי השערת האפס נדחית והתוצאה משמעותית. אם זה משמעותי, אז השלב הבא הוא להסתכל על הציון הממוצע עבור כל קבוצה (גלול בחזרה למעלה בעמוד בשביל זה). בהתבסס על הציונים הממוצעים הללו, לאיזו קבוצה היו הציונים הגבוהים יותר במתמטיקה: בתי ספר ממשלתיים או פרטיים? לעתים קרובות מתעלמים מהשלב האחרון של בחינת הציונים הממוצעים בניתוח הנתונים, אך חשוב מאוד לזהות לאיזו קבוצה היה את הציון הממוצע הגבוה ביותר. חשוב לרשום את האמצעים וסטיות התקן עבור שתי הקבוצות, ה-t, df וה-p הדו-זנבתי. לחץ על הלחצן איפוס ועבור להשערת המחקר הבאה.

    ניתוח שונות (ANOVA)
    כאשר משווים שלוש קבוצות או יותר על משתנה תלוי אחד, א ניתוח שונות הוא הסטטיסטיקה לשימוש. ישנם שני סוגים בסיסיים של ANOVAs שניתן להשתמש בהם.

    ANOVA חד כיווני: ANOVA חד כיווני משווה מספר קבוצות על אותו משתנה. למשל, אולי החוקר מחליט לחלק את בתי הספר הפרטיים לדתיים פרטיים וחילוניים פרטיים. כעת, יש להשוות בין שלוש קבוצות: בתי ספר ממשלתיים, פרטיים דתיים וחילוניים פרטיים. כעת נחוצה ANOVA חד כיוונית. כדי לחשב את ה-ANOVA החד כיווני, יש למיין את הנתונים לפי המשתנה הבלתי תלוי - שוב, סוג בית ספר. ב-VassarStats, לחץ על ANOVA ולאחר מכן על ANOVA חד כיווני. לאחר מכן הזן את מספר הדגימות (הידוע גם במספר הקבוצות בדוגמה זו, 3). לאחר מכן לחץ על דוגמאות עצמאיות. הזינו את ציוני המתמטיקה של כל תלמיד בעמודה המתאימה. לדוגמה, הזינו את ציוני התלמידים הממשלתיים במדגם א', את ציוני התלמידים הפרטיים הדתיים במדגם ב' וציוני התלמידים הפרטיים החילוניים במדגם ג'. לאחר מכן לחץ על חשב.

    גלול למטה במסך. שוב, הנתון הראשון שצריך להסתכל עליו הוא ה-p בטבלת הסיכום של ANOVA. שוב, אם p זה גדול מ- 0.050, אז השערת האפס נשמרת והתוצאה אינה משמעותית. אם התוצאה אינה משמעותית, הניתוח והפרשנות מסתיימים מכיוון שאין הבדל משמעותי בין הקבוצות.

    אם p זה קטן מ- 0.050, אז התוצאה היא משמעותית. אבל זה רק אומר שיש הבדל משמעותי בין קבוצות איפשהו, לא שיש הבדל משמעותי בין כל הקבוצות. ייתכן שסטודנטים ממשלתיים היו גבוהים משמעותית מסטודנטים פרטיים דתיים וחילונים, אך אין הבדלים משמעותיים בין סטודנטים פרטיים דתיים לחילונים פרטיים. למטה בתחתית המסך נמצאת התוצאה של מבחן HSD (הבדל משמעותי בכנות) של Tukey. מבחן זה מזהה אילו הבדלים באמת משמעותיים. חשוב לרשום את האמצעים וסטיות התקן לכל הקבוצות, את טבלת סיכום ANOVA ואת תוצאות ה-HSD של Tukey. לחץ על כפתור איפוס ועבור להשערת המחקר הבאה.

    פקטוריאל ANOVA: ה-ANOVA הפקטוריאלי משווה את ההשפעה של מספר משתנים בלתי תלויים על משתנה תלוי אחד. לדוגמה, ANOVA פקטוריאלי של 2x3 יכולה להשוות את ההשפעות של מגדר וסוג בית ספר על ביצועים אקדמיים. למשתנה הבלתי תלוי הראשון, מגדר, יש שתי רמות (זכר ונקבה) ולמשתנה הבלתי תלוי השני, סוג בית ספר, יש שלוש רמות (ממשלתי, פרטי דתי ופרטי חילוני), ומכאן 2x3 (קראו "שתיים על שלוש"). ניתן לחשב פקטורי ANOVAs גם ב- VassarStats (לחץ על ANOVA ואז על ANOVA פקטורי דו-כיווני לדגימות עצמאיות). עם זאת, פרשנות זו היא קצת יותר מורכבת אז אנא פנה לסטטיסטיקאי מומחה שיעזור בפענוח התוצאות.

    ניתוח של שיתוף פעולה (ANCOVA)
    בעת שימוש בתכנון מחקר לפני מבחן, ניתוח שיתוף פעולה מאפשר השוואה של ציונים שלאחר מבחן עם ציוני טרום מבחן שנלקחו בחשבון. לדוגמה, אם משווים בין קבוצת טיפול וביקורת על מוטיבציה להישגים עם עיצוב טרום-פוסט מבחן, ה-ANCOVA ישווה את הציונים לאחר המבחן של קבוצות הטיפול והביקורת על ידי התאמה סטטיסטית לציוני טרום המבחן. עבור ANCOVA, עליך לקבל ציונים לפני ואחרי המבחן עבור כל אדם במדגם, והציונים הללו חייבים להיות ממוינים לפי הקבוצה (המכונה גם קבוצת טיפול וביקורת).

    כדי לחשב ANCOVA עם VassarStats, לחץ על ANCOVA. ואז VassarStats יבקש את ה-k. ה-k הוא מספר הקבוצות. אם יש רק טיפול אחד וקבוצת ביקורת אחת, אז k=2. לחץ על ה-k הנכון לייבוא ​​נתונים. יש לזכור שני דברים בעת ביצוע ANCOVA עם VassarStat. הוא יבקש את המשתנה הנלווה ואת המשתנה התלוי. המשתנה המקביל (CV) הוא המשתנה שיש לשלוט עליו. במקרה של עיצוב טרום-פוסט בדיקה, המשתנה הנלווה הוא הבדיקה הקדם. המשתנה התלוי (DV) הוא המשתנה שלדעתך הושפע מהמשתנה הבלתי תלוי. במקרה של עיצוב טרום-פוסט-בדיקה, המשתנה התלוי הוא ה-post-test. כדי להשתמש ב- VassarStats, חשוב שה- CV וה- DV יהיו זה לצד זה לכל אחת משתי הקבוצות. לאחר מכן הזן את קורות החיים וה- DV בעמודות הנכונות ולחץ על חישוב.

    גלול למטה במסך. בדיוק כמו קודם, הנתון הראשון שצריך להסתכל עליו הוא ה-p בטבלת הסיכום של ANCOVA. אם p זה קטן מ-0.050, אזי השערת האפס נדחית והתוצאה משמעותית. ישנן שתי קבוצות של אמצעים שחשוב להבין ב-ANCOVA. ראשית, האמצעים הנצפים הם האמצעים בפועל עבור המשתנה התלוי (אחרי מבחן). אז האמצעים המתואמים הם האמצעים שעברו מניפולציה סטטיסטית בהתבסס על ציוני טרום המבחן. דרך פשוטה לדמיין זאת היא ש- ANCOVA מכריחה סטטיסטית את ציוני המבחן שווים בין שתי הקבוצות (כלומר ששתי הקבוצות שוות כעת בתחילת המחקר) ולאחר מכן מחשבת מחדש את הבדיקה לאחר הבדיקה ציונים המבוססים על הציונים המותאמים לפני המבחן. חשוב לרשום את הממוצעים הנצפים, הממוצעים המותאמים וסטיות התקן עבור כל הקבוצות ואת טבלת הסיכום של ACNOVA. בעת יצירת הטבלאות בשלב הבא, דווח על האמצעים הנצפים והמתואמים. עם זאת, בצע את כל הנתונים המבוססים על האמצעים המתואמים. הוסף הערה לדמות כדי שלקוראים יהיה ברור שמדובר באמצעים מותאמים. לחץ על הלחצן איפוס ועבור להשערת המחקר הבאה.

    מתאם
    יש לחשב מתאמים כדי לבחון את הקשר בין שני משתנים בתוך אותה קבוצת משתתפים. לדוגמה, המתאם יכמת את הקשר בין הישגים אקדמיים למוטיבציה להישגים. כדי לחשב מתאם, עליך להיות בעל ציונים לשני משתנים עבור כל משתתף במדגם. כדי לחשב מתאם ב-VassarStats, לחץ על מתאם ורגרסיה, ולאחר מכן על מתאם ורגרסיה ליניארי בסיסי, גרסה לייבוא ​​נתונים. הזן את הציונים הכוללים של שני המשתנים ולחץ על חשב.

    גלול למטה במסך. שוב, הנתון הראשון שצריך להסתכל עליו הוא ה-p: דו-זנב. השערות האפס עבור מתאמים קובעות, אין קשר משמעותי בין מתמטיקה להישגים באנגלית. אם ה-p גדול מ-0.050, אז השערת האפס נשמרת, אין קשר מובהק בין משתנים. אם התוצאה אינה משמעותית, הניתוח והפרשנות מסתיימים מכיוון שאין קשר משמעותי.

    אם p זה קטן מ-0.050, אזי השערת האפס נדחית והמתאם מובהק. אם המתאם משמעותי, אז השלב הבא הוא להסתכל על המתאם עצמו, המסומל על ידי ר. למידע נוסף על איך לפרש את המתאם, לחץ על שיטת ניתוח נתונים. חשוב לרשום את האמצעים וסטיות התקן עבור שני המשתנים, ה-t, df, p דו-זנבתי ו-r. לחץ על כפתור "איפוס" ועבור להשערת המחקר הבאה.

    לפי הנתונים הסטטיסטיים שזוהו משיטת ניתוח הנתונים, חשב את הנתון המסקנתי הנכון עבור כל השערת מחקר. לאחר חישוב הנתונים הסטטיסטיים, הסטטיסטיקה תאורגן בטבלאות ובאיורים כמתואר בפרק הבא. השלב האחרון בניתוח הנתונים הוא לפרש את ממצאי הסטטיסטיקה בעת כתיבת סעיף התוצאות.


    הכללת שאלות "אז-מבחן" בשאלונים שלאחר המבחן משנה את התשובות שלאחר המבחן: מחקר אקראי של הטיה בהערכת תוכניות בריאות

    הערכות התוכנית מתבססות לעתים קרובות על נתוני 'מבחן אז', כלומר, מבחן קדם שנאסף בדיעבד. בעוד שליישום המבחן אז יש יתרונות מעשיים, מעט ידוע על תקפותם של נתוני המבחן אז. בגלל האוסף של מבחן אז בסמיכות לשאלות שלאחר המבחן, מחקר זה נועד לבחון האם נוכחותן של שאלות לאחר המבחן בשאלונים שלאחר המבחן השפיעה על תגובות הנבדקים לאחר המבחן.

    חולים ושיטות

    כדי לבדוק את השפעתן של שאלות שנבדקו לאחר מכן, תכננו מחקר אקראי בן שלוש קבוצות בהקשר של תוכניות לניהול עצמי של מחלות כרוניות. להתערבויות היו מטרות ופילוסופיות דומות, וכל 949 משתתפי המחקר מילאו שאלונים זהים לחינוך בריאותי (heiQ) במבחן המקדים. לאחר המבחן, המשתתפים חולקו אקראית לאחת משלוש הקבוצות הבאות: קבוצה א' הגיבה לשאלות שלאחר המבחן בלבד (נ = 331) קבוצה ב' מילאה שאלות מעבר בנוסף לאחר המבחן (נ = 304) וקבוצה ג' מילאה שאלות לאחר המבחן בנוסף לאחר המבחן (נ = 314).

    תוצאות

    הבדלים משמעותיים לאחר המבחן נמצאו בשישה מתוך שמונה סולמות heiQ, כאשר נשאלים שמילאו שאלות לאחר המבחן דיווחו על ציונים גבוהים משמעותית לאחר המבחן מאשר נשאלים משאר הקבוצות.

    מסקנות

    מחקר זה מספק הוכחות לכך שהכללת שאלות לאחר המבחן משנה את התגובות שלאחר המבחן, מה שמציע כי ציוני שינוי המבוססים על נתוני המבחן יתפרשו בזהירות.


    איך קוראים למדדים שהושגו בין טרום מבחן לאחר מבחן? - פסיכולוגיה

      Gravetter, F. J., Wallnau, L. B. (1996). סטטיסטיקה למדעי ההתנהגות:
      קורס ראשון לסטודנטים לפסיכולוגיה וחינוך, מהדורה רביעית.
      ניו יורק: West Publishing.
      פרק 11: מבחני השערה עם דגימות קשורות

    בפרק הקודם בחנו כיצד להשתמש במבחן t עם שני מדגמים בלתי תלויים. למשל, השוואה בין גברים לבין נשים. עם זאת, עיצוב מסוג זה אינו תמיד אפשרי ו/או רצוי.

    שקול את הדוגמאות הבאות:

    1) נניח שאתה רוצה להשוות דעות של זוגות נשואים לגבי מה שגורם למערכת יחסים לעבוד. אז אתה מחליט לבקש מהבעלים והנשים לדרג, בסולם מ-1 עד 10, כמה חשובה התקשורת. בסנריו זה, למרות שיש לך שתי קבוצות (בעלים ונשים), שתי הקבוצות אינן עצמאיות. החברים בכל קבוצה קשורים זה לזה ("קשורים" לגבי נושאי בחירה סטטיסטית, לא דתיים או בעיות חוקיות). אז מבחן ה-t שעליו דיברנו בפרק האחרון אינו המבחן המתאים.

    2) נניח שאתה רוצה לברר האם ויאגרה פוגעת בראייה. במקום להשוות בין שתי קבוצות נפרדות, אתה מחליט לבדוק את אותה קבוצה של אנשים. בשלב הראשון של הניסוי אתה נותן למשתתפים שלך פלצבו (כדור סוכר שלא אמור להשפיע על הראייה), ולאחר מכן בודקים את הראייה שלהם. בשלב השני נותנים להם ויאגרה ואז בודקים את הראייה שלהם. אז עכשיו יש לך אותם אנשים בשני התנאים. ברור שהדוגמאות שלך קשורות, אז שוב מבחן ה-t מהפרק האחרון אינו מתאים.

    3) נניח שאתה מתעניין בהשפעת הלימוד על ביצועי הבדיקה. אז אתה מחליט להשתמש בשתי קבוצות של אנשים ללימוד שלך. עם זאת, אתה גם מחליט שאתה רוצה ששתי קבוצות האנשים יהיו כמה שיותר דומות, אז אתה מתאים לכל פרט בשתי הקבוצות לפי כמה שיותר מאפיינים חשובים. שוב, שתי הדוגמאות קשורות, כך שמבחן ה-t מהפרק האחרון אינו מתאים.

    במקרה הראשון, המצב הוכרע עבורך, קיים קשר קיים בין שני הדגימות.

    במקרה השני והשלישי, אתה, בתור הנסיין, מקבל החלטה לעשות את שתי הדגימות קשורות. למה אי פעם תרצה לעשות את זה? כדי לשלוט על הבדלים בודדים שעלולים להוסיף עוד רעש (שגיאה) לנתונים שלך. במצב 2, כל פרט פועל כשליטתו. במצב 3, קבוצת הביקורת מורכבת מאנשים הדומים לאנשים בקבוצת הניסוי כפי שניתן להשיג אותם. שני העיצובים הללו משמשים כדי לנסות להפחית שגיאות הנובעות מהבדלים אינדיבידואליים.

    מחקר של מדידות חוזרות הוא מחקר שבו נעשה שימוש במדגם בודד של נבדקים כדי להשוות בין שני (או יותר) מצבי טיפול שונים. כל פרט נמדד בטיפול אחד, ואז אותו פרט נמדד שוב בטיפול השני. לפיכך, מחקר של מדידות חוזרות מייצר שני קבוצות (או יותר) של ציונים, אך כל קבוצה מתקבלת מאותו מדגם של נבדקים. לפעמים סוג זה של מחקר נקרא עיצוב בתוך נושאים.

    במחקר נבדקים מותאמים, כל פרט במדגם אחד מותאם לנבדק במדגם השני. ההתאמה נעשית כך ששני הפרטים יהיו שווים (או כמעט שווים) ביחס למשתנה ספציפי שהחוקר היה רוצה לשלוט בו. לפעמים סוג זה של styd נקרא עיצוב דגימות קשורות.

    אוקיי, אז עכשיו אנחנו יודעים שעבור מדידות חוזרות ועיצובים של נושאים מותאמים אנחנו צריכים מבחן t חדש. אז מה הוא סטטיסטיקת t עבור דגימות קשורות?

    שקול את הדוגמה הבאה: מדריך מבקש משיעור הסטטיסטיקה שלו, ביום הראשון של השיעורים, לדרג כמה הם אוהבים סטטיסטיקה, בסולם של 1 עד 10 (1 שונא את זה, 10 אוהב את זה). ואז, בסוף הסמסטר, המדריך שואל את אותם תלמידים, את אותה שאלה. המדריך רוצה לדעת אם ללימוד הקורס הסטטיסטיקה הייתה השפעה על תחושות התלמידים לגבי סטטיסטיקה.

    התוצאות של שני הדירוגים מוצגות להלן. D מייצג את ההבדל בין הדירוג הקדם והאחרי עבור כל אדם.

    הפרש ממוצע = = 10/10 = 1.0

    שלב 1: ציין את H0 ו-H1 שלך ומצא את הקריטריונים שלך: a = ?

      מבחינה קונספטואלית זה דומה לפרק האחרון, אבל במקום שתי אוכלוסיות נפרדות של פרטים, יש לנו אוכלוסייה אחת של הבדלים.
      במילים אחרות, ההתפלגות שאנו מעוניינים בה היא התפלגות D, התפלגות הציונים שלפני המבחן מופחתים מהציונים שלאחר המבחן.
      אז H0 שלנו יהיה משהו כזה, לקיחת נתונים סטטיסטיים אין השפעה על העדפה של אנשים לסטטיסטיקה.
        H0: mD = 0 H1 = mD 0

      שלב 3: מצא את ה-DF עבור המבחן שלך

      שלב 4: מצא את ציון ה-t הקריטי מהטבלה

      שלב 5: חשב את ציון ה-t שלך עבור המדגם שלך

      בסדר, כפי שהיה בפרק האחרון, הצורה הכוללת של המשוואה הסטטיסטית t זהה, אבל הפרטים שונים.

      טובס =
      אז כבר חישבנו את שלנו, ואנחנו יודעים mD = 0 (עבור H0), אז אנחנו רק צריכים להבין למה שווה. זוהי טעות התקן המשוערת של התפלגות ההפרשים.

      אז ראשית עלינו להבין את השונות.

      SSD = (D2 - ((D) 2 = 28 - 102 = 28 - 10 = 18 n 10

      כעת אנו יכולים להבין את טעות התקן המשוערת

      עכשיו קוראים לנו כדי לחשב את הטובים שלנו

      שלב 7: הסק את המסקנות שלך לגבי ה-H0

        אנו מגבירים את הכוח של הבדיקה שלנו כדי לזהות הבדל (מכיוון שאנו מסתכלים על 0.05 בזנב אחד בלבד, במקום 0.025 בשני זנבות). ה-tcrit שלנו = 1.833. הטובים שלנו עדיין יהיו זהים (2.24), אז עכשיו בשלב 7 בסופו של דבר היינו דוחים את ה- H0.

      אוקיי, מה לגבי בדיקת השערות עם עיצוב מותאם לנושא?

      אז, בתור נסיין, איך אנחנו יודעים מתי להשתמש בעיצובי מדגם קשורים או בעיצובי מדגם עצמאיים?

      הערה: ציין את מארגן הנתונים הסטטיסטיים בעמוד a-60 (קרוב לסוף הטקסט) מפות החלטות נחמדות