Информации

Пресметување на статистичко значење во промената на однесувањето

Пресметување на статистичко значење во промената на однесувањето


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Направив студија на група од 158 лица за да видам дали наставната интервенција може да ги промени нивните перцепции за научниците.

Пред интервенцијата, од сите деца во студијата беше побарано да изберат 6 зборови за да опишат научник. Ова собирање податоци се повтори на крајот од 5-неделната интервенција, а потоа повторно 3 месеци по завршувањето на интервенцијата.

Почнав да ги обработувам податоците и ги категоризирав сите зборови што децата ги користеа. Кога ќе ги погледнам податоците за групата, можам да видам дека има промена во видовите зборови што се користат за опишување на научниците (Пред 128 деца користеа еден стереотипен збор, објавите дека ова падна на 67 и 64 во следењето).

Кои статистички тестови треба да ги користам за да ја покажам значајноста на овие промени? Сите податоци се следат така што имам индивидуални податоци за промената на употребата на јазикот за секој учесник, имам и податоци за групата.


Овој одговор треба да обезбеди разумна дискусија за тоа како да се споредат двата резултати за статистичко значење.

Имаме n1 = n2 = n3 = 158. Имаме p1 = 128/158, p2 = 67/158 и p3 = 64/168. Само извршете го тестот за хипотеза на секој пар за да видите дали има значително поместување.

Сепак, тука има поголем проблем. На ова прашање требаше да се одговори пред да започнете да собирате податоци. Првото нешто што треба да направите е да излезете со вашата теорија за тестирање. Потоа го дизајнирате вашиот експеримент. И само тогаш треба да ги собирате податоците, освен ако вашата цел е само да соберете големи количини на податоци за идно тестирање на теоријата, што се чини дека не е случај овде (Најдобри истражувачки практики).


Подобрување по бихевиорален третман за несоница: Клиничко значење, долгорочно одржување и предвидувачи на исходот

Податоци од седум исходни студии (н=216) од различни кратки бихејвиорални третмани за хронична несоница беа повторно анализирани за да се утврдат индивидуалните стапки на статистички и клинички значајно подобрување. Резултатите беа оценети и за долгорочно одржување на придобивките од третманот и за предвидувачите за поволен исход. Севкупно, 39% од учесниците покажале статистички значајно подобрување по 4 недели од третманот, 47% при краткорочно следење (1 до 3 месеци по третманот) и 49% после една година следење. Стапките на влошување беа ниски: помалку од 1% во секој од истите временски периоди. Околу 23% од несониците покажале клинички значително подобрување, односно станале добри спијачи до крајот на третманот, при што 33% го постигнале овој статус со краткорочно следење, бројка која се одржувала на 1 година. Помладите индивидуи со подоцнежна оригинална возраст на почеток и подолго времетраење, кои покажале помала психопатологија и примале третман за контрола на стимулот, имале предност во почетниот третман која исчезнала некаде во текот на краткорочниот период на следење.

Поддршка за оваа студија беше обезбедена од BRSG SO7 RR07054-20 доделена од Програмата за грантови за поддршка на биомедицински истражувања, Оддел за истражувачки ресурси, Национален здравствен институт.

Кимберли Поулишта сега е на Катедрата за психологија на Универзитетот Стенфорд.


Содржина

Во квантитативното истражување, податоците се анализираат преку тестирање на значајност на нулта хипотеза или тестирање на хипотеза. Ова е формална процедура за проценка дали врската помеѓу променливите или разликата меѓу групите е статистички значајна.

Нулта и алтернативни хипотези

За почеток, истражувачките предвидувања се преформулираат во две главни хипотези:

  • А нулта хипотеза0) секогаш не предвидува вистински ефект, нема врска помеѓу променливите или нема разлика помеѓу групите.
  • Ан алтернативна хипотезаа или Х1) го наведува вашето главно предвидување за вистински ефект, врска помеѓу променливите или разлика помеѓу групите.

Тестирањето на хипотезата секогаш започнува со претпоставка дека нултата хипотеза е вистинита. Користејќи ја оваа постапка, можете да ја процените веројатноста (веројатноста) за добивање на вашите резултати според оваа претпоставка. Врз основа на исходот од тестот, можете да ја одбиете или задржите нултата хипотеза.

Клиничко значење е релевантен за студии за интервенција и третман. Третманот се смета за клинички значаен кога значително или суштински го подобрува животот на пациентите.


МОДЕЛ ЕДЕН ПОСРЕДНИК

Медијација регресивни равенки

Експерименталните студии во психологијата ретко вклучуваат и манипулација со медијаторот и мерење на посредничките променливи. Ако истражувачката студија вклучува мерки на медијаторска променлива, како и независна и зависна променлива, медијацијата може да се испита статистички (Fiske et al. 1982). На овој начин, анализата на медијацијата е метод за зголемување на информациите добиени од истражувачка студија кога се достапни мерки за медијаторскиот процес.

Постојат три главни пристапи за анализа на статистичката медијација: (а) причински чекори, (б) разлика во коефициентите и (в) производ на коефициенти (MacKinnon 2000). Сите овие методи користат информации од следните три регресивни равенки:

каде јас1 и јас2 и јас3 се пресретнувања, Y е зависна променлива, X е независна променлива, М е медијатор, в е коефициентот што ги поврзува независната променлива и зависната променлива, в′ е коефициентот што ја поврзува независната променлива со зависната променлива прилагодена за медијаторот, б е коефициентот што го поврзува медијаторот со зависната променлива прилагоден за независната променлива, а е коефициентот што ја поврзува независната променлива со медијаторот и д1, д2, и д3 се остатоци. Равенките 2 и 3 се прикажани на слика 1. Забележете дека равенките за посредување може да се променат за да вклучат линеарни, како и нелинеарни ефекти и интеракцијата на X и M во равенката 2, како што е опишано подоцна во овој преглед.

Најшироко користен метод за проценка на медијацијата е пристапот со причинско-последични чекори наведен во класичното дело на Барон & Кени (1986, исто така, Кени и сор. 1998) и Џад & Кени (1981a, 1981b). Четири чекори се вклучени во пристапот на Барон и Кени за воспоставување медијација. Прво, значајна врска на независната променлива со зависната променлива е потребна во равенката 1. Второ, значајна врска на независната променлива со претпоставената посредувачка променлива е потребна во Равенката 3. Трето, посредувачката променлива мора да биде значително поврзана со зависна променлива кога и независната променлива и медијаторната променлива се претскажувачи на зависната променлива во равенката 2. Четврто, коефициентот што ја поврзува независната променлива со зависната променлива мора да биде поголем (во апсолутна вредност) од коефициентот што ја поврзува независната променлива со зависната променлива во регресиониот модел со независната променлива и посредувачката променлива која ја предвидува зависната променлива. Овој пристап на причинско -последични чекори за проценка на медијацијата беше најкористениот метод за проценка на медијацијата. Како што беше дискутирано подолу, постојат неколку ограничувања на овој пристап.

Посредуваниот ефект во моделот со еден посредник (види Слика 1) може да се пресмета на два начина, како или â b ̂ или ĉĉ′ (MacKinnon & Dwyer 1993). Вредноста на посредуваниот или индиректниот ефект проценета со земање на разликата во коефициентите, ĉĉ′, од равенките 1 и 2 одговара на намалувањето на ефектот на независната променлива на зависната променлива кога се прилагодува за медијаторот. За тестирање на значењето, разликата потоа се дели со стандардната грешка на разликата и односот се споредува со стандардна нормална распределба.

Методот на производ на коефициенти вклучува проценка на равенките 2 и 3 и пресметување на производот на â и b ̂ , â b ̂ , за да се формира посредуван или индиректен ефект (Alwin & Hauser 1975). Образложението зад овој метод е дека медијацијата зависи од степенот до кој програмата го менува медијаторот, аи степенот до кој медијаторот влијае на променливата на исходот, б. За да се тестира значајноста, производот потоа се дели со стандардната грешка на производот и односот се споредува со стандардна нормална дистрибуција.

Алгебарската еквиваленција на â b ̂ и ĉĉ′ мерките на медијација беа прикажани од МекКинон и сор. (1995) за нормална теорија обични најмали квадрати и максимална веројатност за проценка на трите регресивни равенки на медијација. За моделите на повеќе нивоа (Krull & MacKinnon 1999), логистичка или пробитна регресија (MacKinnon & Dwyer 1993) и анализа на преживување (Tein & MacKinnon 2003), â b ̂ и ĉĉ′ проценувачите на посредуваниот ефект не се секогаш еквивалентни и потребна е трансформација за двете да дадат слични резултати (MacKinnon & Dwyer 1993).

Исцртување на равенките за посредување

Количините во равенките 1 𠄳, исто така, можат да бидат претставени геометриски, како што е прикажано на слика 2 (MacKinnon 2007 R. Merrill, необјавена дисертација). Вештачките податоци се прикажани на Слика 2, каде што независната променлива, X, е дихотомна (за да се поедностави заплетот), медијаторот M е на хоризонталната оска, а зависната променлива Y е на вертикалната оска. Двете искосени линии на заплетот ја претставуваат врската на M со Y во секоја X група, една линија за контролната група и една линија за групата за третман. Двете прави се паралелни (забележете дека ако има XM интеракција во равенката 2, тогаш наклоните не би биле паралелни), при што наклонот на секоја права е еднаков на б коефициент ( b ̂ = 0.91, s e b ̂ = 0,18). Растојанието помеѓу хоризонталните линии во парцелите е еднакво на целокупниот ефект на X врз Y, в (ĉ = 1.07, s eĉ = 0,27), а растојанието помеѓу вертикалните линии е еднакво на ефектот на Х врз М, а (â = 0.87, s eâ = 0,23). Посредуваниот ефект е промената на линијата на регресија што го поврзува M со Y за промена на M од а единици како што е прикажано на графиконот. Индиректниот ефект, â b ̂ , е еднакво на ĉĉ′ (ĉ′ = 0,23, с еĉ = 0,24). Парцелите на посредуваниот ефект може да бидат корисни за да се истражат дистрибуциите на податоците за оддалечените и да се подобри разбирањето на односите меѓу променливите во моделот на медијација.

Заплет на посредуваниот ефект. За да се поедностави бројката, не се вклучени капи над проценките на коефициентот.

Стандардна грешка на посредуваниот ефект

Собел (1982, 1986) ја изведе асимптотичната стандардна грешка на индиректниот ефект користејќи го методот на мултиваријантна делта (Bishop et al. 1975) во равенката 4. Ова е најчесто користената формула за стандардната грешка на посредуваниот ефект.

Симулациските студии покажуваат дека проценувачот на стандардната грешка во равенката 4 покажува мала пристрасност за големини на примероци од најмалку 50 во моделите со еден посредник (MacKinnon et al. 1995, 2002a). Во моделите со повеќе од еден посредник, стандардната грешка е точна за минимални големини на примероци од 100� (Stone & Sobel 1990). Слични резултати беа добиени за стандардни грешки на негативни и позитивни вредности на патеката и поголеми модели со повеќе посреднички, независни и зависни променливи (MacKinnon et al. 2002a, 2004 J. Williams, необјавена дисертација).

Ограничувања на доверба за посредуваниот ефект

Стандардната грешка на â b ̂ може да се користи за да се тестира неговата статистичка значајност и да се конструираат граници на доверба за посредуваниот ефект како што е прикажано во равенката 5:

Ограничувањата на довербата засновани на нормалната дистрибуција за посредуваниот ефект често се неточни како што е откриено во симулационите студии (MacKinnon et al. 1995, 2002a Stone & Sobel 1990) и од анализата на bootstrap на посредуваниот ефект (Bollen ʐ,11 Локвуд & МекКинон 1998). Овие интервали на доверба со посредни ефекти имаат тенденција да лежат лево од вистинската вредност на посредуваниот ефект за позитивни посредувани ефекти и надесно за негативни посредувани ефекти (Bollen & Stine 1990, MacKinnon et al. 1995, Stone & Sobel 1990 година). Асиметричните граници на доверба засновани на дистрибуцијата на производот и проценката на bootstrap имаат подобра покриеност од овие тестови (MacKinnon et al. 2004).

Тестирање на значење

Студијата за симулација на 14 методи за проценка на посредуваниот ефект покажа дека моќта за откривање посредувани ефекти со користење на најшироко користените методи на причинско-последични чекори е многу мала, како и стапките на грешка од типот I (MacKinnon et al. 2002a, 2004). Ниска моќност беше забележана и за тестови базирани на нормална распределба за проценители на посредувани ефекти (т.е. â b ̂ и ĉĉ′) поделено со нивните соодветни стандардни грешки (Хојл & Кени 1999). Заеднички тест за значењето на â и b ̂ беше добар компромис помеѓу грешките од типот I и II.

Постојат неколку објаснувања за малата моќност на повеќето тестови за медијација. Пред сè, барањето да има значајна врска X до Y во тестот за каузални чекори Барон и Кени сериозно ја намалува моќта за откривање на медијација, особено во случај на целосна медијација (т.е., директниот ефект е нула). Има многу случаи каде што постои значајна медијација, но барањето за значајна врска од X до Y не е добиено. Неодамнешна студија која користи емпириски пристапи за да ја одреди потребната големина на примерокот за моќност од 0,8 за да открие посредуван ефект со мали вредности на големината на ефектот на а и б патеката бараше приближно 21.000 субјекти за тестот за каузални чекори (Fritz & MacKinnon 2007). Како што големината на директниот ефект станува се поголема, моќта за откривање на медијацијата користејќи го пристапот на причинско-последичните чекори ја приближува моќта за откривање на медијацијата со тестирање дали и двете а и б патеките се статистички значајни. Важно е да се забележи дека целокупната релација на X и Y претставува важна информација за истражувачка студија, а во некои студии може да биде корисно да се бара целокупна врска X и Y. Поентата е дека барањето врска X до Y значително ја намалува моќта за откривање вистински ефекти на медијација. Објаснување за малата моќ на тестовите за медијација врз основа на делење на проценувач â b ̂ или ĉĉ′, на посредуваниот ефект од неговата соодветна стандардна грешка е дека добиениот сооднос не секогаш следи нормална дистрибуција (MacKinnon et al. 2004). Методи и методи на преземање примероци засновани на дистрибуција на производот на ab решавање на овие проблеми со земање примероци и се опишани подолу.

Дистрибуција на Производот

Производот на две нормално распределени случајни променливи нормално се дистрибуира само во посебни случаи (Springer 1979), што ја објаснува неточноста на методите за проценка на статистичката значајност на медијацијата врз основа на нормалната дистрибуција. На пример, за две стандардни нормални случајни променливи со средна вредност од нула, вишокот на куртоза е еднаков на шест (Meeker et al. 1981) во споредба со вишок куртоза од нула за нормална распределба. Мекинон и сор. (2002а MacKinnon et al. (2004a) покажаа дека во споредба со најчесто користените методи, тестовите за значење за посредуваниот ефект врз основа на дистрибуцијата на производот имале попрецизни стапки на грешки од типот I и статистичка моќ. Нова програма, PRODCLIN (MacKinnon et al., 2006a преземање програма достапно на http://www.public.asu.edu/

davidpm/ripl/Prodclin/), сега може да се користи за да се најдат критични вредности за дистрибуцијата на производот и да се пресметаат границите на доверба за посредуваниот ефект.

Компјутерска интензивна анализа

Компјутерски интензивните методи ги користат набљудуваните податоци за да генерираат референтна дистрибуција, која потоа се користи за проценка на интервалот на доверба и тестирање на значајност (Manly 1997, Mooney & Duval 1993, Noreen 1989). Програмите за пресметување на границите на доверба на посредуваниот ефект за методите за подигање се опишани во Preacher & Hayes (2004) и Lockwood & MacKinnon (1998) the AMOS (Arbuckle 1997), EQS (Bentler 1997), LIS- Програмите #x000f6reskog & Sörbom 1993 година и Mplus (Muthén & Muthén 1998�) исто така спроведуваат повторно засилување на медиумот.

Компјутерски интензивните методи, исто така наречени методи на преземање примероци, за медијација се важни од најмалку две причини (Bollen & Stine 1990, MacKinnon et al. 2004, Shrout & Bolger 2002). Прво, овие методи обезбедуваат општ начин за тестирање на значењето и конструирање интервали на доверливост во широк спектар на ситуации каде што аналитичките формули за количините можеби не се достапни. Второ, методите не бараат толку многу претпоставки како другите тестови, што веројатно ќе ги направи попрецизни од традиционалната анализа на медијација.

Претпоставки на моделот со еден посредник

Постојат неколку важни претпоставки за тестови на медијација. За â b ̂ проценувач на посредуваниот ефект, моделот претпоставува дека резидуалите во равенките 2 и 3 се независни и дека М и резидуалот во равенката 2 се независни (McDonald 1997 R. Merrill, необјавена дисертација). Исто така, се претпоставува дека нема XM интеракција во равенката 3, иако ова може и треба рутински да се тестира.Претпоставките за правилно наведен модел не вклучуваат погрешна спецификација на причинскиот ред (на пр., Y → M → X наместо X → M → Y), без погрешна спецификација на каузалната насока (на пр., постои реципрочна каузалност помеѓу медијаторот и зависната променлива), без погрешна спецификација поради немерени променливи кои предизвикуваат променливи во анализата на медијацијата и без погрешна спецификација поради несовршено мерење (Holland 1988, James & Brett 1984, McDonald 1997). Овие претпоставки може да бидат тешки за тестирање и може да бидат непроверливи во повеќето ситуации, така што доказот за односот на посредување е невозможен. Пореален пристап е да се вклучат дополнителни информации од претходните истражувања, вклучувајќи рандомизирани експериментални студии, теорија и квалитативни методи за да се зајакне пробниот заклучок дека постои врска со медијација.

Целосно наспроти делумно посредување

Истражувачите често тестираат дали постои целосно или делумно посредување со тестирање дали вКоефициентот ′ е статистички значаен, што е тест за тоа дали поврзаноста помеѓу независната и зависната променлива е целосно опишана од медијаторот (види etејмс и сор. 2006). Ако в′ коефициентот е статистички значаен и има значајна медијација, потоа има докази за делумна медијација. Бидејќи психолошките однесувања имаат различни причини, често е нереално да се очекува дека еден медијатор ќе биде целосно објаснет со независна променлива до зависна променлива врска (Judd & Kenny 1981a).

Конзистентни и неконзистентни модели

Неконзистентни модели на медијација се модели каде што барем еден посредуван ефект има различен знак од другите посредувани или директни ефекти во моделот (Blalock 1969, Davis 1985, MacKinnon et al. 2000). Иако знаењето за значајноста на врската на X и Y е важно за толкувањето на резултатите, постојат неколку примери во кои севкупниот однос X до Y може да биде незначителен, но сепак постои медијација. На пример, Мекфатер (1979) го опиша хипотетичкиот пример на работници што прават виџети, каде што Х е интелигенција, М е досада, а Ј е производство на виџети. Интелигентните работници имаат тенденција да се досадуваат и да произведуваат помалку, но попаметните работници исто така имаат тенденција да прават повеќе графички контроли. Затоа, целокупната врска помеѓу интелигенцијата и произведените графички контроли всушност може да биде нула, но сепак постојат два спротивставени медијациски процеси. Голем број други ресурси даваат примери за овие неконзистентни ефекти (Paulhus et al. 2004, Sheets & Braver 1999). Неконзистентната медијација е почеста кај повеќе модели на медијатори каде посредуваните ефекти имаат различни знаци. Неконзистентните ефекти на медијаторот може да бидат особено критични при оценувањето на контрапродуктивните ефекти на експериментите, каде што манипулацијата може да доведе до спротивставени посредувани ефекти.

Мерки за големина на ефект на медијација

Суровата корелација за а пат и делумна корелација за б патеката се мерки за големината на ефектот за моделите на медијација. Стандардизираните коефициенти на регресија исто така може да послужат како мерки за големината на ефектот за поединечни патеки во посредуваниот ефект. Постојат и други мерки за големината на ефектот на целиот посредуван ефект наместо поединечни патеки. Пропорцијата посредувана, 1 − ( c ^ ′ c ^ ) = a ^ b ^ ( a ^ b ^ + c ^ ′ ), често се користи, но вредностите на пропорцијата со посредство често се многу мали и фокусирањето на севкупниот дел со посредство може да ги занемари дополнителните механизми за посредување (Fleming & DeMets 1996). Пропорцијата посредувана е исто така нестабилна освен ако големината на примерокот не е најмалку 500 (Freedman 2001, MacKinnon et al. 1995). Alwin & Hauser (1975) предлагаат да се земат апсолутните вредности на директните и индиректните ефекти пред да се пресмета пропорцијата посредувана за неконзистентни модели. Потребна е повеќе работа на мерките за големината на ефектот за медијација.


Што може да тргне наопаку во експериментите за софтверско инженерство?

Не потпирајте се само на статистичкото значење

Сите експерименти известуваат за статистичка значајност. Сепак, статистичка значајност е веројатноста за набљудување на ефектот со оглед на тоа дека нултата хипотеза е вистинита. Со други зборови, мери дали набљудуваниот ефект навистина е предизвикан од карактеристиките на популацијата или е само резултат на грешка при земање примероци. Но, тоа не дава индикации за тоа колку е голема разликата во третманите. За релативно големи големини на примероци, дури и многу мали разлики може да бидат статистички значајни. На оваа основа ни треба мерка од практично значење. Прашањето е дали разликите помеѓу третманите се доволно големи за да бидат навистина значајни. Ова генерално се оценува со помош на мерка за големината на ефектот. Има широк опсег од преку 70 мерки за големината на ефектот, способни да известуваат за различни видови ефекти.


Освежување: Што е статистичка значајност?

Што значи наодите од истражувањето да бидат „статистички значајни? “

Едноставно кажано, статистичкото значење е начин за истражувачите да квантифицираат колку е веројатно дека нивните резултати се должат на случајност. Статистички значајни наоди се оние во кои истражувачот има доверба дека резултатите се реални и веродостојни бидејќи шансите за добивање на резултатите случајно се мали.

Тестирањето на статистичка значајност вклучува неколку апстрактни концепти. Значи, ние се обидуваме да ги направиме работите конкретни со пример за тоа како можете да спроведете тест со статистичка значајност.


Што е големина на ефектот?

Мерката за големината на ефектот е индикатор за поврзаноста што постои помеѓу две или повеќе променливи. Исклучок од ова е оној на Коен г што е мерка за растојание помеѓу средствата. Овие дефиниции се преведуваат во колкава варијанса во една променлива е пресметана со знаење за друга променлива. Како што е забележано од некои (на пример, Коен, 1968 Керлингер и засилувач Педазур, 1973), зголемувањето на интересот за мерки за големина кај психолозите е поврзано со нивната зголемена свест за сличноста помеѓу ANOVA и регресијата (Haase, Waechter, & amp; Solomon, 1982) . Оттука, сфаќањето дека проценувањето на групните разлики е само еден начин за користење на основните корелациски техники може да предизвика интерес за индикаторите за големината на ефектот.

Определувањето на тоа што претставува “голем” ефект е вознемирувачко за работата во општествените науки. Како што е забележано од Haase et al. (1982), одговарајќи на прашањето колку е големо? ” не е толку тешко во природните науки како што е за психолошката наука:

Значи, што претставува “голем” ефект во просечниот психолошки експеримент? Коен (1977), без сомнение, еден од најсилните застапници на известувањето за статистиката за големината на ефектот, издаде упатства за тоа што претставува мали, средни и големи димензии на ефектот. Според Коен, за г, 0,20, 0,50 и 0,80 сочинуваат мали, средни и големи ефекти соодветно.


Пресметување на статистичка значајност

Математичарите можат лесно да ја пресметаат статистичката значајност, но повеќето маркетери не се во индустријата поради нивните математички вештини. И покрај ова, тие с can уште можат да користат статистичко значење во нивниот маркетинг со калкулатор за статистичко значење.

Калкулаторот за статистичка важност им дава на маркетерите начин да знаат дали промените во кампањите биле успешни, за да можат да ги максимизираат конверзиите. Со едноставно внесување на променливите во калкулаторот, маркетерите можат да пресметаат статистичка значајност за нивната големина на примерокот и големината на ефектот за да ја докажат својата хипотеза со статистички значаен процент за да покажат доверба дека промените ја направиле разликата наспроти резултатите што настанале случајно.


Сила на докази од П вредности

При тестирање на точка нулта хипотеза Х 0 против алтернативна хипотеза Х 1 врз основа на податоци x опс, на П вредноста е дефинирана како веројатност, пресметана според нултата хипотеза, дека тест статистиката е подеднакво екстремна или поекстремна од нејзината набљудувана вредност. Нултата хипотеза обично се отфрла - и наодот е прогласен за статистички значаен - ако П вредноста паѓа под (тековниот) праг на грешка од типот I α = 0.05.

Од баезијанска перспектива, подиректна мерка за силата на доказите за Х 1 во однос на Х 0 е односот на нивните веројатности. Според Бајсовото правило, овој однос може да се напише како:

каде што BF е факторот Бејс кој ги претставува доказите од податоците, а претходните шанси може да се информираат со верувањата на истражувачите, научниот консензус и потврдените докази од слични истражувачки прашања во истото поле. Тестирање на повеќе хипотези, П-Хакирањето и пристрасноста за објавување сето тоа го намалува кредибилитетот на доказите. Некои од овие практики ги намалуваат претходните шанси за Х 1 во однос на Х 0 со промена на популацијата на тестови за хипотеза што се пријавени. Пазарите за предвидување 3 и анализите на резултатите од репликацијата 4 сугерираат дека за психолошки експерименти, претходните шанси за Х 1 во однос на Х 0 може да биде само околу 1:10. Сличен број е предложен во клиничките испитувања за рак, а бројот веројатно ќе биде многу помал во претклиничките биомедицински истражувања 5 .

Не постои единствено мапирање помеѓу П вредност и Bayes факторот, бидејќи факторот Bayes зависи од Х 1. Сепак, врската помеѓу двете количини може да се процени за одредени тест статистики под одредени класи на веродостојни алтернативи (сл. 1).

Бејсовиот фактор (BF) е дефиниран како (frac<>_<< m>> лево |_<1>десно.десно)><>_<< m>>лево|_<0>десно.десно)>) . Сликата претпоставува дека набљудувањата се независни и идентично распределени (i.i.d.) според x

Н(μ,σ 2 ), каде што средната вредност μ е непозната и варијансата σ 2 е познато. На П вредноста е од двострана z-тест (или еквивалентно едностран (_<1>^<2>) -тест) на нултата хипотеза Х 0: μ = 0. Моќност (црвена крива): BF добиена со дефинирање Х 1 како ставање на ½ веројатност μ = ±м за вредноста на м што дава 75% моќност за тестирање на големината α = 0,05. Ова Х 1 претставува големина на ефектот типична за онаа што имплицитно ја претпоставуваат истражувачите за време на експерименталниот дизајн. Однос на веројатност поврзан (црна крива): BF добиен со дефинирање Х 1 како ставање на ½ веројатност μ = ± ( капа) , каде (шапка) е приближно еднаква на средната вредност на набљудувањата. Овие BF се горните граници меѓу класата на сите Х 1 термини кои се симетрични околу нула, но тие се несоодветни бидејќи податоците се користат за дефинирање Х 1. UMPBT (сина крива): BF добиен со дефинирање Х 1 според униформно најмоќниот Бајезов тест 2 што ја става ½ веројатноста на μ = ±w, каде w е алтернативната хипотеза која одговара на едностран тест со големина 0,0025. Оваа крива не се разликува од кривата „Моќ“ што би се добила доколку моќноста што се користи во нејзината дефиниција била 80% наместо 75%. Локално-Х 1 врзана (зелена крива): (< m> = frac <1> <-ep phantom < правило <0em> <0ex>> ln phantom < правило <0em> <0ex>> p> ), каде стр е П вредност, е горна граница со голем примерок на BF од сите унимодални алтернативни хипотези кои имаат режим на нула и задоволуваат одредени услови за регуларност 15. Црвените бројки на y оската го означува опсегот на Bayes фактори кои се добиени за П вредности од 0,005 или 0,05. За повеќе детали, видете ги Дополнителните информации.

Двострана П вредноста од 0,05 одговара на факторите на Бејс во корист на Х 1 кои се движат од околу 2,5 до 3,4 под разумни претпоставки за Х 1 (Слика 1). Ова е слаб доказ од најмалку три перспективи. Прво, конвенционалните категоризации на Bayes фактор 6 го карактеризираат овој опсег како „слаб“ или „многу слаб“. Второ, се сомневаме дека многу научници би го погодиле тоа П ≈ 0,05 имплицира посилна поддршка за Х 1 отколку Бејсов фактор од 2,5 до 3,4. Трето, користејќи ја равенката (1) и претходниот коефициент 1:10, а П вредноста од 0,05 одговара на шансите за најмалку 3:1 (односно реципроцитет на производот (frac<1><10>пати 3,4)) во корист на нултата хипотеза!


Референци

Jakobsen JC, Gluud C: Потребата од рандомизирани клинички испитувања. Br J Med Res. 2013, 3 (4): 1453-1468.

Џонсон В.Е.: Ревидирани стандарди за статистички докази. Proc Natl Acad Sci САД. 2013, 110 (48): 19313-19317. 10.1073/pnas.1313476110.

Фишер Р: Статистички методи и научна индукција. J R Stat Soc Ser B. 1955, 17 (1): 69-78.

Gigerenzer G: Безумни статистики. J Socio Econ. 2004, 33 (5): 587-606. 10.1016/j.socec.2004.09.033.

Халд А: Историја на математичка статистика од 1750 до 1930 година. 1998 година, Newујорк: Wон Вајли и засилувачите

Гудман С: Валкана дузина: дванаесет заблуди со p-вредности. Семин Хематол. 2008, 45: 135-140. 10.1053/j.seminhematol.2008.04.003.

Oliveri RS, Gluud C, Wille-Jørgensen PA: Самооценети вештини на болничките лекари во и употребата на медицина базирана на докази - анкета со прашалник. J Eval Clin Pract. 2004, 10 (2): 219-226. 10.1111/j.1365-2753.2003 година.00477.х.

Баслер Д, Бриел М, Монтори В.М., Лејн М, Глазиу П, Џоу Кју, Хелс-Ансдел Д, Волтер СД, Гајат ГХ, Флин ДН, Еламин М.Б., Мурад М.Х., Абу Елнур НО, Лампропулос Џ.Ф., Соод А, Мулан Р.Џ. , Erwin PJ, Bankhead CR, Perera R, Ruiz Culebro C, You JJ, Mulla SM, Kaur J, Nerenberg KA, Schunemann H, Cook DJ, Lutz K, Ribic CM, Vale N, Malaga G, Akl EA, et al: Рано прекинување на рандомизираните испитувања заради корист и проценка на ефектите од третманот: систематски преглед и мета-регресивна анализа. ЈАМА. 2010, 303: 1180-1187. 10.1001/jama.2010 година.310.

Thorlund K, Devereaux PJ, Wetterslev J, Guyatt G, Ioannidis JP, Thabane L, Gluud LL, Als-Nielsen B, Gluud C: Дали границите на пробното секвенцијално следење можат да ги намалат лажните заклучоци од мета-анализите?. Int J Епидемиол. 2009, 38 (1): 276-286. 10.1093/ije/dyn179.

Јоанидис ЈП: Зошто повеќето објавени наоди од истражувањето се лажни. PLoS Med. 2005, 2 (8): e124-10.1371/journal.pmed.0020124.

Garattini S, Bertele V: Испитувањата за неинфериорност се неетички бидејќи ги игнорираат интересите на пациентите. Лансет. 2007, 370 (9602): 1875-1877. 10.1016/S0140-6736(07)61604-3.

Sterne JA: Тестови за наставни хипотези – време за значителна промена?. Stat Med. 2002, 21: 985-999. 10.1002/sim.1129.

Ранстам Ј: Зошто културата на P-вредност е лоша, а интервалите на доверба е подобра алтернатива. Артроза 'Рскавица. 2012, 20: 805-808. 10.1016/j.joca.2012.04.001.

Williamson PR, Altman DG, Blazeby JM, Clarke M, Gargon E: The COMET (Core Outcome Measures in Effectiveness Trials) иницијатива. Испитувања. 2011, 12 (Дополнување 1): A70-10.1186/1745-6215-12-S1-A70.

Altman DG, Bland JM: Како да се добие интервалот на доверба од вредноста P. БМЈ. 2011, 343: d2090-10.1136/bmj.d2090.

Chow S-C, Shao J, Wang H: Sample Size Calculations in Clinical Research, второ издание. 2008 година, Бока Ратон, Флорида: Чепмен и Хол/ЦРЦ

Schulz KF, Altman DG, Moher D: CONSORT 2010 изјава: ажурирани упатства за известување паралелни групни рандомизирани испитувања. Ен Инт Мед. 2010, 152 (11): 726-732. 10.7326/0003-4819-152-11-201006010-00232.

Скали DC, Rubenfeld GD: Проценка на големината на примерокот во клиничките испитувања за критична нега. J Crit Care. 2005, 20 (1): 6-11. 10.1016/j.jcrc.2005.02.002.

Myles DJS, Keith RA, Jonathan P: Bayesian пристапи кон клиничките испитувања и евалуацијата на здравствената заштита (Статистика во пракса). 2004 година, Западен Сасекс, Англија: Џон Вајли и синови

Roloff V, Higgins JP, Sutton AJ: Планирање на идни студии врз основа на условната моќ на мета-анализа. Stat Med. 2013, 32 (1): 11-24. 10.1002/sim.5524.

Гудман С.Н.: Вовед во баесовските методи I: мерење на силата на доказите. Clin Trials. 2005, 2: 282-378. 10.1191/1740774505cn098oa.

Гудман СН: Кон медицинска статистика заснована на докази. 2: Факторот Бејс. Ен Инт Мед. 1999, 130 (12): 1005-1013. 10.7326/0003-4819-130-12-199906150-00019.

Pogue JM, Yusuf S: Кумулирање на докази од рандомизирани испитувања: користење на секвенцијални мониторинг граници за кумулативна мета-анализа. Контрола на Clin Trials. 1997, 18 (6): 580-593. 10.1016/S0197-2456(97)00051-2.

Хигинс ЈП, Вајтхед А: Позајмување сила од надворешни испитувања во мета-анализа. Stat Med. 1996, 15 (24): 2733-2749. 10.1002/(SICI)1097-0258(19961230)15:24<2733::AID-SIM562>3.0.CO2-0.

Fayers PM, Cuschieri A, Fielding J, Craven J, Uscinska B, Freedman LS: Пресметка на големината на примерокот за клинички испитувања: влијанието на верувањата на лекарите. Br J Рак. 2000, 82 (1): 213-219. 10.1054/bjoc.1999.0902.

Thorlund K, Imberger G, Walsh M, Chu R, Gluud C, Wetterslev J, Guyatt G, Devereaux PJ, Thabane L: Број на пациенти и настани потребни за да се ограничи ризикот од преценување на ефектите од интервенцијата во мета-анализа-симулација проучување. PLoS One. 2011, 6: e25491-10.1371/journal.pone.0025491.

Pereira TV, Horwitz RI, Ioannidis JP: Емпириска евалуација на многу големи ефекти од третманот на медицинските интервенции. ЈАМА. 2012, 308: 1676-1684. 10.1001/jama.2012 година.13444.

Mehta CR, Pocock SJ: Приспособливо зголемување на големината на примерокот кога привремените резултати се ветувачки: практичен водич со примери. Stat Med. 2011, 30 (28): 3267-3284. 10.1002/sim.4102.

Jennison C, Turnbull BW: Ефикасни групни последователни дизајни кога се разгледуваат неколку големини на ефекти. Stat Med. 2005, 25: 917-932.

О'Хаган А, Стивенс Џ.В., Кембел МЈ: Уверување во дизајнот на клиничките испитувања. Фарма Стат. 2005, 4 (3): 187-201. 10.1002/pst.175.

Тарнер РМ, Бирд СМ, Хигинс ЈП: Влијанието на големината на студијата врз мета-анализите: испитување на недоволно моќни студии во прегледите на Кокрајн. PLoS One. 2013, 8 (3): e59202-10.1371/journal.pone.0059202.

Сали Б. Испитувања. 2013, 14: 166-10.1186/1745-6215-14-166.

Левин ГП, Емерсон СЦ, Емерсон СС: Адаптивни дизајни на клинички испитувања со однапред одредени правила за измена на големината на примерокот: разбирање ефикасни типови на адаптација. Стат Мед. 2012, 32 (8): 1259-1275.

DeMets DL, Lan KK: Привремена анализа: пристапот на функцијата за алфа -трошење. Stat Med. 1994, 13 (13-14): 1341-1356.

Bassler D, Montori VM, Briel M, Glasziou P, Walter SD, Ramsay T, Guyatt G: Рефлексиите за мета-анализите кои вклучуваат испитувања престанаа рано заради корист: дали има проблем и ако има, што е тоа?.Статистички методи Med Res. 2013, 22 (2): 159-168. 10.1177/0962280211432211.

Линдли ДВ: Статистички парадокс. Биометрика. 1957, 44 (1/2): 187-192. 10.2307/2333251.

Guyatt GH, Briel M, Glasziou P, Bassler D, Montori VM: Проблеми со рано прекинување на судењата. БМЈ. 2012, 344: e3863-10.1136/bmj.e3863.

Волд А: Секвенцијални тестови за статистички хипотези. Ен математика статистика. 1945, 16: 117-186. 10.1214/aoms/1177731118.

Hanанг Ј, Куан Х, Нг Ј, Степанавеж МЕ: Некои статистички методи за повеќекратни крајни точки во клиничките испитувања. Контрола на Clin Trials. 1997, 18: 204-221. 10.1016/S0197-2456(96)00129-8.

Имбергер Г, Вејлби АД, Хансен СБ, Милер АМ, Ветерслев Ј: Статистичка разновидност во систематски прегледи на интервенции за анестезија: квантификација и споредба помеѓу прегледите на Кохран и не Кохран. PLoS One. 2011, 6: e28422-10.1371/journal.pone.0028422.

Pocock SJ: Кога да се прекине клиничкото испитување. БМЈ. 1992, 305 (6847): 235-240. 10.1136/bmj.305.6847.235.

Jennison C, Turnbull BW: Повторени интервали на доверба за групни секвенцијални клинички испитувања. Контрола на Clin Trials. 1984, 5 (1): 33-45. 10.1016/0197-2456 (84) 90148-Х.

Todd S, Whitehead J, Facey KM: Точка и интервална проценка по секвенцијално клиничко испитување. Биометрика. 1996, 83 (2): 453-461. 10.1093/biomet/83.2.453.

Џенисон Ц, Турнбул БВ: Групни секвенцијални методи со апликации за клинички испитувања (Интердисциплинарна статистика на Чепмен и засилувач Хол/ЦРЦ). 1999, : Чепмен и Хол/ЦРЦ

Thorlund K, Engstrøm J, Wetterslev J, Brok J, Imberger G, Gluud C: Упатство за употреба за пробна секвенцијална анализа (TSA). 2011 година, Копенхаген, Данска: Пробна единица во Копенхаген, Центар за истражување на клиничка интервенција, 1-115. Достапно од http://www.ctu.dk/tsa

Екваторска мрежа: Подобрување на квалитетот и транспарентноста на здравствените истражувања. Достапно на: http://www.equator-network.org/ 2014 година

Јанг Кју, Куи Ј, Чазаро И, Купплс ЛА, Демиси С: Стапката на грешка на моќност и тип I на пристапи на стапката на лажно откривање во студиите за асоцијација на геномот. BMC Genet. 2005, 6 (Дополнување 1): S134-10.1186/1471-2156-6-S1-S134.

Bretz F, Hothorn T, Westfall P: Multiple Comparisons Using R. 2010, Boca Raton, Флорида: Chapman and Hall/CRC

Altman DG, Bland JM: Како да се добие вредноста P од интервал на доверба. БМЈ. 2011, 343: d2304-10.1136/bmj.d2304.

Абди Х: Енциклопедија за мерење и статистика. Корекциите на Bonferonni и Šidák за повеќекратни споредби. Во N.J. Salkind (Ed.) страница 103–107. 2007, Thousand Oaks (CA): Sage

Holm S: Едноставна процедура за повеќекратно отфрлање последователно. Scand J Statist. 1979, 6: 65-70.

Dmitrienko A, Ajit C, Tamhane AC, Bretz F: Повеќекратни проблеми со тестирањето во фармацевтската статистика (Capman & Hall/CRC Biostatistics Series). 2009 година, Бока Ратон, Флорида: Чепмен и Хол/ЦРЦ

Tu YH, Cheng B, Cheung YK: Забелешка за границите на доверба по повеќекратни тестови со фиксна низа. Заклучок на J Stat Plan. 2012, 142 (11): 2993-2998. 10.1016/j.jspi.2012.05.002.

Wiens BL, Dmitrienko A: Резервната постапка за евалуација на едно семејство хипотези. J Biopharm Стат. 2005, 15 (6): 929-942. 10.1080/10543400500265660.

Korn EL, Li MC, McShane LM, Simon R: Истражување на два мултиваријантни пермутациски методи за контролирање на пропорцијата на лажно откритие. Stat Med. 2007, 26 (24): 4428-4440. 10.1002/sim.2865.

Westfall PH, Young S: Повеќекратно тестирање засновано на преземање примероци: примери и методи за прилагодување на p-вредноста (серија Wiley во веројатност и статистика). 1993 година, Њујорк: Wiley-Interscience

Yu J, Hutson AD, Siddiqui AH, Kedron MA: Групна секвенцијална контрола на севкупните инциденти на токсичност во клиничките испитувања - не-бајзиски и бајески пристапи. Статистички методи Med Res. 2012 година, Epub пред печатење

Thall PF, Simon RM, Shen Y: Приближна евалуација на Бајес за повеќекратни ефекти од третманот. Биометрика. 2000, 56: 213-219. 10.1111/j.0006-341X.2000.00213.х.

Zhang X, Cutter G: Баезијанска привремена анализа во клиничките испитувања. Испитувања на Contemp Clin. 2008, 29: 751-755. 10.1016/j.cct.2008.05.007.

Jakobsen JC, Lindschou Hansen J, Storebø OJ, Simonsen E, Gluud C: Ефектите од когнитивната терапија наспроти „третманот како и обично“ кај пациенти со големо депресивно растројство. PLoS One. 2011, 6 (8): e22890-10.1371/journal.pone.0022890.

Кнор У, Винберг М, Кесинг ЛВ, Ветерслев Ј: Плунковен кортизол кај депресивни пациенти наспроти контролни лица: систематски преглед и мета-анализа. Психоневроендокринол. 2010, 35: 1275-1286. 10.1016/j.psyneuen.2010 година.04.001.

Downs JR, Clearfield M, Weis S, Whitney E, Shapiro DR, Beere PA, Langendorfer A, Stein EA, Kruyer W, Gotto AM: Примарна превенција на акутни коронарни настани со ловастатин кај мажи и жени со просечни нивоа на холестерол: резултати од AFCAPS /TexCAPS. Студија за превенција на коронарна атеросклероза на воздухопловните сили/Тексас. ЈАМА. 1998, 279 (20): 1615-1622. 10.1001/jama.279.20.1615.

Stovring H, Harmsen CG, Wisloff T, Jarbol DE, Nexoe J, Nielsen JB, Kristiansen IS: Конкурентски пристап на ризик за европскиот модел на срцев резултат заснован на смртност специфична и од сите причини. Eur J Prev Cardiol. 2012, 20 (5): 827-836.

Прасад V, Вандрос А: Кардиоваскуларна примарна превенција: колку високо треба да ја поставиме лентата?. Arch Int Med. 2012, 172: 656-659. 10.1001/archinternmed.2012.812.

Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, Norris S, Falck-Ytter Y, Glasziou P, DeBeer H, Jaeschke R, Rind D, Meerpohl J, Dahm P, Schunemann HJ: GRADE упатства: 1. Вовед-ОДДЕЛЕНИЕ Профили на докази и резиме на наодите Табели. Џеј Клин епидемиол. 2011, 64 (4): 383-394. 10.1016/j.jclinepi.2010.04.026.

Гајат Г, Оксман АД, Султан С, Брозек Ј, Глазиу П, Алонсо-Коело П, Аткинс Д, Кунц Р, Монтори В, Јаешке Р, Ринд Д, Дам П, Акл ЕА, Мерпол Ј, Вист Г, Берлинер Е, Norris S, Falck-Ytter Y, Schunemann HJ: GRADE упатства: 11. Изработка на севкупна оцена за доверба во проценките на ефектот за еден исход и за сите исходи. Џеј Клин епидемиол. 2013, 66 (2): 151-157. 10.1016/j.jclinepi.2012.01.006.

Jüni P, Nartey L, Reichenbach S, Sterchi R, Dieppe PA, Egger M: Ризик од кардиоваскуларни настани и рофекоксиб: кумулативна мета-анализа. Лансет. 2004, 364 (9450): 2021-2029. 10.1016/S0140-6736(04)17514-4.

Higgins JPT, Green S: The Cochrane Handbook for Systematic Reviews of Interventions, верзија 5.1.0. 2011, The Cochrane Collaboration, Достапно од http://www.cochrane-handbook.org

Џонстон BC, Thorlund K, Schunemann HJ, Xie F, Murad MH, Montori VM, Guyatt GH: Подобрување на толкувањето на доказите за квалитетот на животот во мета-анализите: примена на минимални важни единици за разлика. Резултати за квалитетен живот на здравјето. 2010, 8: 116-10.1186/1477-7525-8-116.

Halvorsen PA, Kristiansen IS: Одлуки за терапии со лекови по бројки потребни за лекување: рандомизирано испитување. Arch Int Med. 2005, 165: 1140-1146. 10.1001/archinte.165.10.1140.

Chalmers I, Milne I, Trohler U, Vandenbroucke J, Morabia A, Tait G, Dukan E: The James Lind Library: објаснување и илустрирање на еволуцијата на правичните тестови на медицински третмани. J R Coll Лекарите Единб. 2008, 38 (3): 259-264.

Одделот за библиотека и информациски услуги, Кралскиот колеџ на лекари од Единбург: библиотека Џејмс Линд. Достапно онлајн на: http://www.jameslindlibrary.org/ 2003

Соработка во Кохран: Соработка во Кохран. http://www.cochrane.org,

Garthwaite P, Kadane JB, O'Hagan A: Статистички методи за предизвикување на распределби на веројатност. J Am Stat Доц. 2012, 100 (470):

Јоанидис Ј: Контрадикторни и првично посилни ефекти во високо цитираните клинички истражувања. ЈАМА. 2005, 294 (2): 218-228. 10.1001/jama.294.2.218.

Ветерслев Ј, Торлунд К, Брок Ј, Глуд Ц: Пробната секвенцијална анализа може да утврди кога ќе се постигне цврст доказ во кумулативната мета-анализа. Џеј Клин епидемиол. 2008, 61 (1): 64-75. 10.1016/j.jclinepi.2007.03.013.

Хигинс ЈП, Вајтхед А, Симондс М: Секвенцијални методи за мета-анализа со случајни ефекти. Stat Med. 2011, 30 (9): 903-921. 10.1002/сим.4088.

Keus F, Wetterslev J, Gluud C, van Laarhoven CJ: Доказ на прв поглед: пристап на матрица на грешки за преглед на достапни докази. BMC Med Res Methodol. 2010, 10: 90-10.1186/1471-2288-10-90.

Џонсон В.Е.: Еднообразно најмоќните бајзиски тестови. Ен Стат. 2013, 41: 1716-1741. 10.1214/13-AOS1123.

Хигинс Ј.П., Диџеј на Шпигелхалтер: Да се ​​биде скептичен за мета-анализите: Бајесова перспектива за испитувањата на магнезиум при миокарден инфаркт. Int J Епидемиол. 2002, 31 (1): 96-104. 10.1093/ije/31.1.96.

Корн ЕЛ, Фрајдлин Б: Веројатноста како статистички доказ во повеќе споредби во клиничките испитувања: без бесплатен ручек. Biom J. 2006, 48 (3): 346-355. 10.1002/bimj.200510216.

Lunn D, Spiegelhalter D, Thomas A, Best N: Проектот BUGS: Еволуција, критика и идни насоки. Stat Med. 2009, 28 (25): 3049-3067. 10.1002/sim.3680.

Gaziano JM, Sesso HD, Christen WG, Bubes V, Smith JP, MacFadyen J, Schvartz M, Manson JE, Glynn RJ, Buring JE: Мултивитамини во превенцијата од рак кај мажите: Студија за здравје на лекарите II. ЈАМА. 2012, 308 (18): 1871-1880. 10.1001/jama.2012 година.14641.

Christen WG, Gaziano JM, Hennekens CH: Design of Physicians' Health Study II – рандомизирано испитување на бета-каротен. Ен епидемиол. 2000, 10 (2): 125-134. 10.1016/S1047-2797(99)00042-3.

Bjelakovic G, Nikolova D, Gluud LL, Simonetti RG, Gluud C: Антиоксидантни додатоци за превенција од смртност кај здрави учесници и пациенти со различни болести. Cochrane Database Syst Rev. 2012, 3: CD007176

Bjelakovic G, Nikolova D, Simonetti RG, Gluud C: Антиоксидантни додатоци за спречување на гастроинтестинални карциноми. Cochrane база на податоци на Syst Rev. 3: CD004183-

Cortés-Jofré M, Rueda JR, Corsini-Muñoz G, Fonseca-Cortés C, Caraballoso M, Bonfill Cosp X: Лекови за спречување на рак на белите дробови кај здрави луѓе. Cochrane база на податоци на Syst Rev. 10: CD002141-

Шакур Х, Робертс И, Баутиста Р, Кабалеро Ј, Коутс Т, Деван И, Ел-Сајед Х, Гогичаишвили Т, Гупта С, Херера Ј, Хант Б, Ирибхогбе П, Изуриета М, Камис Х, Комолафе Е, Мареро МА, Mejia-Mantilla J, Miranda J, Morales C, Olaomi O, Olldashi F, Perel P, Peto R, Ramana PV, Ravi RR, Yutthakasemsunt S: Ефекти на транексамична киселина врз смртта, васкуларни оклузивни настани и трансфузија на крв кај пациенти со траума со значителна хеморагија (CRASH-2): рандомизирана, плацебо-контролирана студија. Лансет. 2010, 376 (9734): 23-32.

Perner A, Haase N, Guttormsen AB, Tenhunen J, Klemenzson G, Aneman A, Madsen KR, Moller MH, Elkjaer JM, Poulsen LM, Bendtsen A, Winding R, Steensen M, Berezowicz P, Soe-Jensen P, Bestle M, Strand K, Wiis J, White JO, Thornberg KJ, Quist L, Nielsen J, Andersen LH, Holst LB, Thormar K, Kjaeldgaard AL, Fabritius ML, Mondrup F, Pott FC, Moller T, et al: Hydroxyethyl starch 130/0.42 наспроти Рингер-ов ацетат кај тешка сепса. N Eng J Med. 2012, 367 (2): 124-134. 10.1056/NEJMoa1204242.

Perner A, Haase N, Wetterslev J, Aneman A, Tenhunen J, Guttormsen AB, Klemenzson G, Pott F, Bodker KD, Badstolokken PM, Bendtsen A, Soe-Jensen P, Tousi H, Bestle M, Pawlowicz M, Winding R, Bulow HH, Kancir C, Steensen M, Nielsen J, Fogh B, Madsen KR, Larsen NH, Carlsson M, Wiis J, Petersen JA, Iversen S, Schoidt O, Leivdal S, Berezowicz P, et al: Споредување на ефектот на хидроксиетил скроб 130/0,4 со избалансиран кристалоиден раствор за морталитет и бубрежна инсуфициенција кај пациенти со тешка сепса (6S--Скандинавски скроб за тешка сепса/проба со септичен шок): протокол на студија, дизајн и образложение за двојно слепа, рандомизирана клиничка студија. Испитувања. 2011, 12 (1): 24-10.1186/1745-6215-12-24.


МОДЕЛ ЕДЕН ПОСРЕДНИК

Медијација регресивни равенки

Експерименталните студии во психологијата ретко вклучуваат и манипулација со медијаторот и мерење на посредничките променливи. Ако истражувачката студија вклучува мерки на медијаторска променлива, како и независна и зависна променлива, медијацијата може да се испита статистички (Fiske et al. 1982). На овој начин, анализата на медијацијата е метод за зголемување на информациите добиени од истражувачка студија кога се достапни мерки за медијаторскиот процес.

Постојат три главни пристапи за анализа на статистичката медијација: (а) причински чекори, (б) разлика во коефициентите и (в) производ на коефициенти (MacKinnon 2000). Сите овие методи користат информации од следните три регресивни равенки:

каде јас1 и јас2 и јас3 се пресретнувања, Y е зависна променлива, X е независна променлива, М е медијатор, в е коефициентот што ги поврзува независната променлива и зависната променлива, в′ е коефициентот што ја поврзува независната променлива со зависната променлива прилагодена за медијаторот, б е коефициентот што го поврзува медијаторот со зависната променлива прилагоден за независната променлива, а е коефициентот што ја поврзува независната променлива со медијаторот и д1, д2, и д3 се остатоци. Равенките 2 и 3 се прикажани на слика 1. Забележете дека равенките за посредување може да се променат за да вклучат линеарни, како и нелинеарни ефекти и интеракцијата на X и M во равенката 2, како што е опишано подоцна во овој преглед.

Најшироко користен метод за проценка на медијацијата е пристапот со причинско-последични чекори наведен во класичното дело на Барон & Кени (1986, исто така, Кени и сор. 1998) и Џад & Кени (1981a, 1981b). Четири чекори се вклучени во пристапот на Барон и Кени за воспоставување медијација. Прво, значајна врска на независната променлива со зависната променлива е потребна во равенката 1. Второ, значајна врска на независната променлива со претпоставената посредувачка променлива е потребна во Равенката 3. Трето, посредувачката променлива мора да биде значително поврзана со зависна променлива кога и независната променлива и медијаторната променлива се претскажувачи на зависната променлива во равенката 2. Четврто, коефициентот што ја поврзува независната променлива со зависната променлива мора да биде поголем (во апсолутна вредност) од коефициентот што ја поврзува независната променлива со зависната променлива во регресиониот модел со независната променлива и посредувачката променлива која ја предвидува зависната променлива. Овој пристап на причинско -последични чекори за проценка на медијацијата беше најкористениот метод за проценка на медијацијата. Како што беше дискутирано подолу, постојат неколку ограничувања на овој пристап.

Посредуваниот ефект во моделот со еден посредник (види Слика 1) може да се пресмета на два начина, како или â b ̂ или ĉĉ′ (MacKinnon & Dwyer 1993). Вредноста на посредуваниот или индиректниот ефект проценета со земање на разликата во коефициентите, ĉĉ′, од равенките 1 и 2 одговара на намалувањето на ефектот на независната променлива на зависната променлива кога се прилагодува за медијаторот. За тестирање на значењето, разликата потоа се дели со стандардната грешка на разликата и односот се споредува со стандардна нормална распределба.

Методот на производ на коефициенти вклучува проценка на равенките 2 и 3 и пресметување на производот на â и b ̂ , â b ̂ , за да се формира посредуван или индиректен ефект (Alwin & Hauser 1975). Образложението зад овој метод е дека медијацијата зависи од степенот до кој програмата го менува медијаторот, аи степенот до кој медијаторот влијае на променливата на исходот, б. За да се тестира значајноста, производот потоа се дели со стандардната грешка на производот и односот се споредува со стандардна нормална дистрибуција.

Алгебарската еквиваленција на â b ̂ и ĉĉ′ мерките на медијација беа прикажани од МекКинон и сор. (1995) за нормална теорија обични најмали квадрати и максимална веројатност за проценка на трите регресивни равенки на медијација. За моделите на повеќе нивоа (Krull & MacKinnon 1999), логистичка или пробитна регресија (MacKinnon & Dwyer 1993) и анализа на преживување (Tein & MacKinnon 2003), â b ̂ и ĉĉ′ проценувачите на посредуваниот ефект не се секогаш еквивалентни и потребна е трансформација за двете да дадат слични резултати (MacKinnon & Dwyer 1993).

Исцртување на равенките за посредување

Количините во равенките 1 𠄳, исто така, можат да бидат претставени геометриски, како што е прикажано на слика 2 (MacKinnon 2007 R. Merrill, необјавена дисертација). Вештачките податоци се прикажани на Слика 2, каде што независната променлива, X, е дихотомна (за да се поедностави заплетот), медијаторот M е на хоризонталната оска, а зависната променлива Y е на вертикалната оска. Двете искосени линии на заплетот ја претставуваат врската на M со Y во секоја X група, една линија за контролната група и една линија за групата за третман. Двете прави се паралелни (забележете дека ако има XM интеракција во равенката 2, тогаш наклоните не би биле паралелни), при што наклонот на секоја права е еднаков на б коефициент ( b ̂ = 0.91, с е b ̂ = 0,18). Растојанието помеѓу хоризонталните линии во парцелите е еднакво на целокупниот ефект на X врз Y, в (ĉ = 1.07, с еĉ = 0,27), а растојанието помеѓу вертикалните линии е еднакво на ефектот на Х врз М, а (â = 0.87, с еâ = 0,23). Посредуваниот ефект е промената на линијата на регресија што го поврзува M со Y за промена на M од а единици како што е прикажано на графиконот. Индиректниот ефект, â b ̂ , е еднакво на ĉĉ′ (ĉ′ = 0,23, с еĉ = 0,24). Парцелите на посредуваниот ефект може да бидат корисни за да се истражат дистрибуциите на податоците за оддалечените и да се подобри разбирањето на односите меѓу променливите во моделот на медијација.

Заплет на посредуваниот ефект. За да се поедностави бројката, не се вклучени капи над проценките на коефициентот.

Стандардна грешка на посредуваниот ефект

Собел (1982, 1986) ја изведе асимптотичната стандардна грешка на индиректниот ефект користејќи го методот на мултиваријантна делта (Bishop et al. 1975) во равенката 4. Ова е најчесто користената формула за стандардната грешка на посредуваниот ефект.

Симулациските студии покажуваат дека проценувачот на стандардната грешка во равенката 4 покажува мала пристрасност за големини на примероци од најмалку 50 во моделите со еден посредник (MacKinnon et al. 1995, 2002a). Во моделите со повеќе од еден посредник, стандардната грешка е точна за минимални големини на примероци од 100� (Stone & Sobel 1990). Слични резултати беа добиени за стандардни грешки на негативни и позитивни вредности на патеката и поголеми модели со повеќе посреднички, независни и зависни променливи (MacKinnon et al. 2002a, 2004 J. Williams, необјавена дисертација).

Ограничувања на доверба за посредуваниот ефект

Стандардната грешка на â b ̂ може да се користи за да се тестира неговата статистичка значајност и да се конструираат граници на доверба за посредуваниот ефект како што е прикажано во равенката 5:

Ограничувањата на довербата засновани на нормалната дистрибуција за посредуваниот ефект често се неточни како што е откриено во симулационите студии (MacKinnon et al. 1995, 2002a Stone & Sobel 1990) и од анализата на bootstrap на посредуваниот ефект (Bollen ʐ,11 Локвуд & МекКинон 1998). Овие интервали на доверба со посредни ефекти имаат тенденција да лежат лево од вистинската вредност на посредуваниот ефект за позитивни посредувани ефекти и надесно за негативни посредувани ефекти (Bollen & Stine 1990, MacKinnon et al. 1995, Stone & Sobel 1990 година). Асиметричните граници на доверба засновани на дистрибуцијата на производот и проценката на bootstrap имаат подобра покриеност од овие тестови (MacKinnon et al. 2004).

Тестирање на значење

Студијата за симулација на 14 методи за проценка на посредуваниот ефект покажа дека моќта за откривање посредувани ефекти со користење на најшироко користените методи на причинско-последични чекори е многу мала, како и стапките на грешка од типот I (MacKinnon et al. 2002a, 2004). Ниска моќност беше забележана и за тестови базирани на нормална распределба за проценители на посредувани ефекти (т.е. â b ̂ и ĉĉ′) поделено со нивните соодветни стандардни грешки (Хојл & Кени 1999). Заеднички тест за значењето на â и b ̂ беше добар компромис помеѓу грешките од типот I и II.

Постојат неколку објаснувања за малата моќност на повеќето тестови за медијација. Пред сè, барањето да има значајна врска X до Y во тестот за каузални чекори Барон и Кени сериозно ја намалува моќта за откривање на медијација, особено во случај на целосна медијација (т.е., директниот ефект е нула). Има многу случаи каде што постои значајна медијација, но барањето за значајна врска од X до Y не е добиено. Неодамнешна студија која користи емпириски пристапи за да ја одреди потребната големина на примерокот за моќност од 0,8 за да открие посредуван ефект со мали вредности на големината на ефектот на а и б патеката бараше приближно 21.000 субјекти за тестот за каузални чекори (Fritz & MacKinnon 2007). Како што големината на директниот ефект станува се поголема, моќта за откривање на медијацијата користејќи го пристапот на причинско-последичните чекори ја приближува моќта за откривање на медијацијата со тестирање дали и двете а и б патеките се статистички значајни. Важно е да се забележи дека целокупната релација на X и Y претставува важна информација за истражувачка студија, а во некои студии може да биде корисно да се бара целокупна врска X и Y. Поентата е дека барањето врска X до Y значително ја намалува моќта за откривање вистински ефекти на медијација. Објаснување за малата моќ на тестовите за медијација врз основа на делење на проценувач â b ̂ или ĉĉ′, на посредуваниот ефект од неговата соодветна стандардна грешка е дека добиениот сооднос не секогаш следи нормална дистрибуција (MacKinnon et al. 2004). Методи и методи на преземање примероци засновани на дистрибуција на производот на ab решавање на овие проблеми со земање примероци и се опишани подолу.

Дистрибуција на Производот

Производот на две нормално распределени случајни променливи нормално се дистрибуира само во посебни случаи (Springer 1979), што ја објаснува неточноста на методите за проценка на статистичката значајност на медијацијата врз основа на нормалната дистрибуција. На пример, за две стандардни нормални случајни променливи со средна вредност од нула, вишокот на куртоза е еднаков на шест (Meeker et al. 1981) во споредба со вишок куртоза од нула за нормална распределба. Мекинон и сор. (2002а MacKinnon et al. (2004a) покажаа дека во споредба со најчесто користените методи, тестовите за значење за посредуваниот ефект врз основа на дистрибуцијата на производот имале попрецизни стапки на грешки од типот I и статистичка моќ. Нова програма, PRODCLIN (MacKinnon et al., 2006a преземање програма достапно на http://www.public.asu.edu/

davidpm/ripl/Prodclin/), сега може да се користи за да се најдат критични вредности за дистрибуцијата на производот и да се пресметаат границите на доверба за посредуваниот ефект.

Компјутерска интензивна анализа

Компјутерски интензивните методи ги користат набљудуваните податоци за да генерираат референтна дистрибуција, која потоа се користи за проценка на интервалот на доверба и тестирање на значајност (Manly 1997, Mooney & Duval 1993, Noreen 1989). Програмите за пресметување на границите на доверба на посредуваниот ефект за методите за подигање се опишани во Preacher & Hayes (2004) и Lockwood & MacKinnon (1998) the AMOS (Arbuckle 1997), EQS (Bentler 1997), LIS- Програмите #x000f6reskog & Sörbom 1993 година и Mplus (Muthén & Muthén 1998�) исто така спроведуваат повторно засилување на медиумот.

Компјутерски интензивните методи, исто така наречени методи на преземање примероци, за медијација се важни од најмалку две причини (Bollen & Stine 1990, MacKinnon et al. 2004, Shrout & Bolger 2002). Прво, овие методи обезбедуваат општ начин за тестирање на значењето и конструирање интервали на доверливост во широк спектар на ситуации каде што аналитичките формули за количините можеби не се достапни. Второ, методите не бараат толку многу претпоставки како другите тестови, што веројатно ќе ги направи попрецизни од традиционалната анализа на медијација.

Претпоставки на моделот со еден посредник

Постојат неколку важни претпоставки за тестови на медијација. За â b ̂ проценувач на посредуваниот ефект, моделот претпоставува дека резидуалите во равенките 2 и 3 се независни и дека М и резидуалот во равенката 2 се независни (McDonald 1997 R. Merrill, необјавена дисертација). Исто така, се претпоставува дека нема XM интеракција во равенката 3, иако ова може и треба рутински да се тестира. Претпоставките за правилно наведен модел не вклучуваат погрешна спецификација на причинскиот ред (на пр., Y → M → X наместо X → M → Y), без погрешна спецификација на каузалната насока (на пр., постои реципрочна каузалност помеѓу медијаторот и зависната променлива), без погрешна спецификација поради немерени променливи кои предизвикуваат променливи во анализата на медијацијата и без погрешна спецификација поради несовршено мерење (Holland 1988, James & Brett 1984, McDonald 1997). Овие претпоставки може да бидат тешки за тестирање и може да бидат непроверливи во повеќето ситуации, така што доказот за односот на посредување е невозможен. Пореален пристап е да се вклучат дополнителни информации од претходните истражувања, вклучувајќи рандомизирани експериментални студии, теорија и квалитативни методи за да се зајакне пробниот заклучок дека постои врска со медијација.

Целосно наспроти делумно посредување

Истражувачите често тестираат дали постои целосно или делумно посредување со тестирање дали вКоефициентот ′ е статистички значаен, што е тест за тоа дали поврзаноста помеѓу независната и зависната променлива е целосно опишана од медијаторот (види etејмс и сор. 2006). Ако в′ коефициентот е статистички значаен и има значајна медијација, потоа има докази за делумна медијација. Бидејќи психолошките однесувања имаат различни причини, често е нереално да се очекува дека еден медијатор ќе биде целосно објаснет со независна променлива до зависна променлива врска (Judd & Kenny 1981a).

Конзистентни и неконзистентни модели

Неконзистентни модели на медијација се модели каде што барем еден посредуван ефект има различен знак од другите посредувани или директни ефекти во моделот (Blalock 1969, Davis 1985, MacKinnon et al. 2000). Иако знаењето за значајноста на врската на X и Y е важно за толкувањето на резултатите, постојат неколку примери во кои севкупниот однос X до Y може да биде незначителен, но сепак постои медијација. На пример, Мекфатер (1979) го опиша хипотетичкиот пример на работници што прават виџети, каде што Х е интелигенција, М е досада, а Ј е производство на виџети. Интелигентните работници имаат тенденција да се досадуваат и да произведуваат помалку, но попаметните работници исто така имаат тенденција да прават повеќе графички контроли. Затоа, целокупната врска помеѓу интелигенцијата и произведените графички контроли всушност може да биде нула, но сепак постојат два спротивставени медијациски процеси. Голем број други ресурси даваат примери за овие неконзистентни ефекти (Paulhus et al. 2004, Sheets & Braver 1999). Неконзистентната медијација е почеста кај повеќе модели на медијатори каде посредуваните ефекти имаат различни знаци. Неконзистентните ефекти на медијаторот може да бидат особено критични при оценувањето на контрапродуктивните ефекти на експериментите, каде што манипулацијата може да доведе до спротивставени посредувани ефекти.

Мерки за големина на ефект на медијација

Суровата корелација за а пат и делумна корелација за б патеката се мерки за големината на ефектот за моделите на медијација. Стандардизираните коефициенти на регресија исто така може да послужат како мерки за големината на ефектот за поединечни патеки во посредуваниот ефект. Постојат и други мерки за големината на ефектот на целиот посредуван ефект наместо поединечни патеки. Пропорцијата посредувана, 1 − ( c ^ ′ c ^ ) = a ^ b ^ ( a ^ b ^ + c ^ ′ ), често се користи, но вредностите на пропорцијата со посредство често се многу мали и фокусирањето на севкупниот дел со посредство може да ги занемари дополнителните механизми за посредување (Fleming & DeMets 1996). Пропорцијата посредувана е исто така нестабилна освен ако големината на примерокот не е најмалку 500 (Freedman 2001, MacKinnon et al. 1995). Alwin & Hauser (1975) предлагаат да се земат апсолутните вредности на директните и индиректните ефекти пред да се пресмета пропорцијата посредувана за неконзистентни модели. Потребна е повеќе работа на мерките за големината на ефектот за медијација.


Пресметување на статистичка значајност

Математичарите можат лесно да ја пресметаат статистичката значајност, но повеќето маркетери не се во индустријата поради нивните математички вештини. И покрај ова, тие с can уште можат да користат статистичко значење во нивниот маркетинг со калкулатор за статистичко значење.

Калкулаторот за статистичка важност им дава на маркетерите начин да знаат дали промените во кампањите биле успешни, за да можат да ги максимизираат конверзиите. Со едноставно внесување на променливите во калкулаторот, маркетерите можат да пресметаат статистичка значајност за нивната големина на примерокот и големината на ефектот за да ја докажат својата хипотеза со статистички значаен процент за да покажат доверба дека промените ја направиле разликата наспроти резултатите што настанале случајно.


Сила на докази од П вредности

При тестирање на точка нулта хипотеза Х 0 против алтернативна хипотеза Х 1 врз основа на податоци x опс, на П вредноста е дефинирана како веројатност, пресметана според нултата хипотеза, дека тест статистиката е подеднакво екстремна или поекстремна од нејзината набљудувана вредност. Нултата хипотеза обично се отфрла - и наодот е прогласен за статистички значаен - ако П вредноста паѓа под (тековниот) праг на грешка од типот I α = 0.05.

Од баезијанска перспектива, подиректна мерка за силата на доказите за Х 1 во однос на Х 0 е односот на нивните веројатности. Според Бајсовото правило, овој однос може да се напише како:

каде што BF е факторот Бејс кој ги претставува доказите од податоците, а претходните шанси може да се информираат со верувањата на истражувачите, научниот консензус и потврдените докази од слични истражувачки прашања во истото поле. Тестирање на повеќе хипотези, П-Хакирањето и пристрасноста за објавување сето тоа го намалува кредибилитетот на доказите. Некои од овие практики ги намалуваат претходните шанси за Х 1 во однос на Х 0 со промена на популацијата на тестови за хипотеза што се пријавени. Пазарите за предвидување 3 и анализите на резултатите од репликацијата 4 сугерираат дека за психолошки експерименти, претходните шанси за Х 1 во однос на Х 0 може да биде само околу 1:10. Сличен број е предложен во клиничките испитувања за рак, а бројот веројатно ќе биде многу помал во претклиничките биомедицински истражувања 5 .

Не постои единствено мапирање помеѓу П вредност и Bayes факторот, бидејќи факторот Bayes зависи од Х 1. Сепак, врската помеѓу двете количини може да се процени за одредени тест статистики под одредени класи на веродостојни алтернативи (сл. 1).

Бејсовиот фактор (BF) е дефиниран како (frac<>_<< m>>лево|_<1>десно.десно)><>_<< m>>лево|_<0>десно.десно)>) . Сликата претпоставува дека набљудувањата се независни и идентично распределени (i.i.d.) според x

Н(μ,σ 2 ), каде што средната вредност μ е непозната и варијансата σ 2 е познато. На П вредноста е од двострана z-тест (или еквивалентно едностран (_<1>^<2>) -тест) на нултата хипотеза Х 0: μ = 0. Моќност (црвена крива): BF добиена со дефинирање Х 1 како ставање на ½ веројатност μ = ±м за вредноста на м што дава 75% моќност за тестирање на големината α = 0,05. Ова Х 1 претставува големина на ефектот типична за онаа што имплицитно ја претпоставуваат истражувачите за време на експерименталниот дизајн. Однос на веројатност поврзан (црна крива): BF добиен со дефинирање Х 1 како ставање на ½ веројатност μ = ± ( капа) , каде (шапка) е приближно еднаква на средната вредност на набљудувањата. Овие BF се горните граници меѓу класата на сите Х 1 термини кои се симетрични околу нула, но тие се несоодветни бидејќи податоците се користат за дефинирање Х 1. UMPBT (сина крива): BF добиен со дефинирање Х 1 според униформно најмоќниот Бајезов тест 2 што ја става ½ веројатноста на μ = ±w, каде w е алтернативната хипотеза која одговара на едностран тест со големина 0,0025. Оваа крива не се разликува од кривата „Моќ“ што би се добила доколку моќноста што се користи во нејзината дефиниција била 80% наместо 75%. Локално-Х 1 врзана (зелена крива): (< m> = frac <1> <-ep phantom < правило <0em> <0ex>> ln phantom < правило <0em> <0ex>> p> ), каде стр е П вредност, е горна граница со голем примерок на BF од сите унимодални алтернативни хипотези кои имаат режим на нула и задоволуваат одредени услови за регуларност 15. Црвените бројки на y оската го означува опсегот на Bayes фактори кои се добиени за П вредности од 0,005 или 0,05. За повеќе детали, видете ги Дополнителните информации.

Двострана П вредноста од 0,05 одговара на факторите на Бејс во корист на Х 1 кои се движат од околу 2,5 до 3,4 под разумни претпоставки за Х 1 (Слика 1). Ова е слаб доказ од најмалку три перспективи. Прво, конвенционалните категоризации на Bayes фактор 6 го карактеризираат овој опсег како „слаб“ или „многу слаб“. Второ, се сомневаме дека многу научници би го погодиле тоа П ≈ 0,05 имплицира посилна поддршка за Х 1 отколку Бејсов фактор од 2,5 до 3,4. Трето, користејќи ја равенката (1) и претходниот коефициент 1:10, а П вредноста од 0,05 одговара на шансите за најмалку 3:1 (односно реципроцитет на производот (frac<1><10>пати 3,4)) во корист на нултата хипотеза!


Што е големина на ефектот?

Мерката за големината на ефектот е индикатор за поврзаноста што постои помеѓу две или повеќе променливи. Исклучок од ова е оној на Коен г што е мерка за растојание помеѓу средствата. Овие дефиниции се преведуваат во колкава варијанса во една променлива е пресметана со знаење за друга променлива. Како што е забележано од некои (на пример, Коен, 1968 Керлингер и засилувач Педазур, 1973), зголемувањето на интересот за мерки за големина кај психолозите е поврзано со нивната зголемена свест за сличноста помеѓу ANOVA и регресијата (Haase, Waechter, & amp; Solomon, 1982) . Оттука, сфаќањето дека проценувањето на групните разлики е само еден начин за користење на основните корелациски техники може да предизвика интерес за индикаторите за големината на ефектот.

Определувањето на тоа што претставува “голем” ефект е вознемирувачко за работата во општествените науки. Како што е забележано од Haase et al. (1982), одговарајќи на прашањето колку е големо? ” не е толку тешко во природните науки како што е за психолошката наука:

Значи, што претставува “голем” ефект во просечниот психолошки експеримент? Коен (1977), без сомнение, еден од најсилните застапници на известувањето за статистиката за големината на ефектот, издаде упатства за тоа што претставува мали, средни и големи димензии на ефектот. Според Коен, за г, 0,20, 0,50 и 0,80 сочинуваат мали, средни и големи ефекти соодветно.


Што може да тргне наопаку во експериментите за софтверско инженерство?

Не потпирајте се само на статистичкото значење

Сите експерименти известуваат за статистичка значајност. Сепак, статистичка значајност е веројатноста за набљудување на ефектот со оглед на тоа дека нултата хипотеза е вистинита. Со други зборови, мери дали набљудуваниот ефект навистина е предизвикан од карактеристиките на популацијата или е само резултат на грешка при земање примероци. Но, тоа не дава индикации за тоа колку е голема разликата во третманите. За релативно големи големини на примероци, дури и многу мали разлики може да бидат статистички значајни. На оваа основа ни треба мерка од практично значење. Прашањето е дали разликите помеѓу третманите се доволно големи за да бидат навистина значајни. Ова генерално се оценува со помош на мерка за големината на ефектот. Има широк опсег од преку 70 мерки за големината на ефектот, способни да известуваат за различни видови ефекти.


Референци

Jakobsen JC, Gluud C: Потребата од рандомизирани клинички испитувања. Br J Med Res. 2013, 3 (4): 1453-1468.

Џонсон В.Е.: Ревидирани стандарди за статистички докази. Proc Natl Acad Sci САД. 2013, 110 (48): 19313-19317. 10.1073/pnas.1313476110.

Фишер Р: Статистички методи и научна индукција.J R Stat Soc Ser B. 1955, 17 (1): 69-78.

Gigerenzer G: Безумни статистики. J Socio Econ. 2004, 33 (5): 587-606. 10.1016/j.socec.2004.09.033.

Халд А: Историја на математичка статистика од 1750 до 1930 година. 1998 година, Newујорк: Wон Вајли и засилувачите

Гудман С: Валкана дузина: дванаесет заблуди со p-вредности. Семин Хематол. 2008, 45: 135-140. 10.1053/j.seminhematol.2008.04.003.

Oliveri RS, Gluud C, Wille-Jørgensen PA: Самооценети вештини на болничките лекари во и употребата на медицина базирана на докази - анкета со прашалник. J Eval Clin Pract. 2004, 10 (2): 219-226. 10.1111/j.1365-2753.2003 година.00477.х.

Баслер Д, Бриел М, Монтори В.М., Лејн М, Глазиу П, Џоу Кју, Хелс-Ансдел Д, Волтер СД, Гајат ГХ, Флин ДН, Еламин М.Б., Мурад М.Х., Абу Елнур НО, Лампропулос Џ.Ф., Соод А, Мулан Р.Џ. , Erwin PJ, Bankhead CR, Perera R, Ruiz Culebro C, You JJ, Mulla SM, Kaur J, Nerenberg KA, Schunemann H, Cook DJ, Lutz K, Ribic CM, Vale N, Malaga G, Akl EA, et al: Рано прекинување на рандомизираните испитувања заради корист и проценка на ефектите од третманот: систематски преглед и мета-регресивна анализа. ЈАМА. 2010, 303: 1180-1187. 10.1001/jama.2010 година.310.

Thorlund K, Devereaux PJ, Wetterslev J, Guyatt G, Ioannidis JP, Thabane L, Gluud LL, Als-Nielsen B, Gluud C: Дали границите на пробното секвенцијално следење можат да ги намалат лажните заклучоци од мета-анализите?. Int J Епидемиол. 2009, 38 (1): 276-286. 10.1093/ije/dyn179.

Јоанидис ЈП: Зошто повеќето објавени наоди од истражувањето се лажни. PLoS Med. 2005, 2 (8): e124-10.1371/journal.pmed.0020124.

Garattini S, Bertele V: Испитувањата за неинфериорност се неетички бидејќи ги игнорираат интересите на пациентите. Лансет. 2007, 370 (9602): 1875-1877. 10.1016/S0140-6736(07)61604-3.

Sterne JA: Тестови за наставни хипотези – време за значителна промена?. Stat Med. 2002, 21: 985-999. 10.1002/sim.1129.

Ранстам Ј: Зошто културата на P-вредност е лоша, а интервалите на доверба е подобра алтернатива. Артроза 'Рскавица. 2012, 20: 805-808. 10.1016/j.joca.2012.04.001.

Williamson PR, Altman DG, Blazeby JM, Clarke M, Gargon E: The COMET (Core Outcome Measures in Effectiveness Trials) иницијатива. Испитувања. 2011, 12 (Дополнување 1): A70-10.1186/1745-6215-12-S1-A70.

Altman DG, Bland JM: Како да се добие интервалот на доверба од вредноста P. БМЈ. 2011, 343: d2090-10.1136/bmj.d2090.

Chow S-C, Shao J, Wang H: Sample Size Calculations in Clinical Research, второ издание. 2008 година, Бока Ратон, Флорида: Чепмен и Хол/ЦРЦ

Schulz KF, Altman DG, Moher D: CONSORT 2010 изјава: ажурирани упатства за известување паралелни групни рандомизирани испитувања. Ен Инт Мед. 2010, 152 (11): 726-732. 10.7326/0003-4819-152-11-201006010-00232.

Скали DC, Rubenfeld GD: Проценка на големината на примерокот во клиничките испитувања за критична нега. J Crit Care. 2005, 20 (1): 6-11. 10.1016/j.jcrc.2005.02.002.

Myles DJS, Keith RA, Jonathan P: Bayesian пристапи кон клиничките испитувања и евалуацијата на здравствената заштита (Статистика во пракса). 2004 година, Западен Сасекс, Англија: Џон Вајли и синови

Roloff V, Higgins JP, Sutton AJ: Планирање на идни студии врз основа на условната моќ на мета-анализа. Stat Med. 2013, 32 (1): 11-24. 10.1002/sim.5524.

Гудман С.Н.: Вовед во баесовските методи I: мерење на силата на доказите. Clin Trials. 2005, 2: 282-378. 10.1191/1740774505cn098oa.

Гудман СН: Кон медицинска статистика заснована на докази. 2: Факторот Бејс. Ен Инт Мед. 1999, 130 (12): 1005-1013. 10.7326/0003-4819-130-12-199906150-00019.

Pogue JM, Yusuf S: Кумулирање на докази од рандомизирани испитувања: користење на секвенцијални мониторинг граници за кумулативна мета-анализа. Контрола на Clin Trials. 1997, 18 (6): 580-593. 10.1016/S0197-2456(97)00051-2.

Хигинс ЈП, Вајтхед А: Позајмување сила од надворешни испитувања во мета-анализа. Stat Med. 1996, 15 (24): 2733-2749. 10.1002/(SICI)1097-0258(19961230)15:24<2733::AID-SIM562>3.0.CO2-0.

Fayers PM, Cuschieri A, Fielding J, Craven J, Uscinska B, Freedman LS: Пресметка на големината на примерокот за клинички испитувања: влијанието на верувањата на лекарите. Br J Рак. 2000, 82 (1): 213-219. 10.1054/bjoc.1999.0902.

Thorlund K, Imberger G, Walsh M, Chu R, Gluud C, Wetterslev J, Guyatt G, Devereaux PJ, Thabane L: Број на пациенти и настани потребни за да се ограничи ризикот од преценување на ефектите од интервенцијата во мета-анализа-симулација проучување. PLoS One. 2011, 6: e25491-10.1371/journal.pone.0025491.

Pereira TV, Horwitz RI, Ioannidis JP: Емпириска евалуација на многу големи ефекти од третманот на медицинските интервенции. ЈАМА. 2012, 308: 1676-1684. 10.1001/jama.2012 година.13444.

Mehta CR, Pocock SJ: Приспособливо зголемување на големината на примерокот кога привремените резултати се ветувачки: практичен водич со примери. Stat Med. 2011, 30 (28): 3267-3284. 10.1002/sim.4102.

Jennison C, Turnbull BW: Ефикасни групни последователни дизајни кога се разгледуваат неколку големини на ефекти. Stat Med. 2005, 25: 917-932.

О'Хаган А, Стивенс Џ.В., Кембел МЈ: Уверување во дизајнот на клиничките испитувања. Фарма Стат. 2005, 4 (3): 187-201. 10.1002/pst.175.

Тарнер РМ, Бирд СМ, Хигинс ЈП: Влијанието на големината на студијата врз мета-анализите: испитување на недоволно моќни студии во прегледите на Кокрајн. PLoS One. 2013, 8 (3): e59202-10.1371/journal.pone.0059202.

Сали Б. Испитувања. 2013, 14: 166-10.1186/1745-6215-14-166.

Левин ГП, Емерсон СЦ, Емерсон СС: Адаптивни дизајни на клинички испитувања со однапред одредени правила за измена на големината на примерокот: разбирање ефикасни типови на адаптација. Stat Med. 2012, 32 (8): 1259-1275.

DeMets DL, Lan KK: Привремена анализа: пристапот на функцијата за алфа -трошење. Stat Med. 1994, 13 (13-14): 1341-1356.

Bassler D, Montori VM, Briel M, Glasziou P, Walter SD, Ramsay T, Guyatt G: Рефлексиите за мета-анализите кои вклучуваат испитувања престанаа рано заради корист: дали има проблем и ако има, што е тоа?. Статистички методи Med Res. 2013, 22 (2): 159-168. 10.1177/0962280211432211.

Линдли ДВ: Статистички парадокс. Биометрика. 1957, 44 (1/2): 187-192. 10.2307/2333251.

Guyatt GH, Briel M, Glasziou P, Bassler D, Montori VM: Проблеми со рано прекинување на судењата. БМЈ. 2012, 344: e3863-10.1136/bmj.e3863.

Волд А: Секвенцијални тестови за статистички хипотези. Ен математика статистика. 1945, 16: 117-186. 10.1214/aoms/1177731118.

Hanанг Ј, Куан Х, Нг Ј, Степанавеж МЕ: Некои статистички методи за повеќекратни крајни точки во клиничките испитувања. Контрола на Clin Trials. 1997, 18: 204-221. 10.1016/S0197-2456(96)00129-8.

Имбергер Г, Вејлби АД, Хансен СБ, Милер АМ, Ветерслев Ј: Статистичка разновидност во систематски прегледи на интервенции за анестезија: квантификација и споредба помеѓу прегледите на Кохран и не Кохран. PLoS One. 2011, 6: e28422-10.1371/journal.pone.0028422.

Pocock SJ: Кога да се прекине клиничкото испитување. БМЈ. 1992, 305 (6847): 235-240. 10.1136/bmj.305.6847.235.

Jennison C, Turnbull BW: Повторени интервали на доверба за групни секвенцијални клинички испитувања. Контрола на Clin Trials. 1984, 5 (1): 33-45. 10.1016/0197-2456 (84) 90148-Х.

Todd S, Whitehead J, Facey KM: Точка и интервална проценка по секвенцијално клиничко испитување. Биометрика. 1996, 83 (2): 453-461. 10.1093/biomet/83.2.453.

Џенисон Ц, Турнбул БВ: Групни секвенцијални методи со апликации за клинички испитувања (Интердисциплинарна статистика на Чепмен и засилувач Хол/ЦРЦ). 1999, : Чепмен и Хол/ЦРЦ

Thorlund K, Engstrøm J, Wetterslev J, Brok J, Imberger G, Gluud C: Упатство за употреба за пробна секвенцијална анализа (TSA). 2011 година, Копенхаген, Данска: Пробна единица во Копенхаген, Центар за истражување на клиничка интервенција, 1-115. Достапно од http://www.ctu.dk/tsa

Екваторска мрежа: Подобрување на квалитетот и транспарентноста на здравствените истражувања. Достапно на: http://www.equator-network.org/ 2014 година

Јанг Кју, Куи Ј, Чазаро И, Купплс ЛА, Демиси С: Стапката на грешка на моќност и тип I на пристапи на стапката на лажно откривање во студиите за асоцијација на геномот. BMC Genet. 2005, 6 (Дополнување 1): S134-10.1186/1471-2156-6-S1-S134.

Bretz F, Hothorn T, Westfall P: Multiple Comparisons Using R. 2010, Boca Raton, Флорида: Chapman and Hall/CRC

Altman DG, Bland JM: Како да се добие вредноста P од интервал на доверба. БМЈ. 2011, 343: d2304-10.1136/bmj.d2304.

Абди Х: Енциклопедија за мерење и статистика. Корекциите на Bonferonni и Šidák за повеќекратни споредби. Во N.J. Salkind (Ed.) страница 103–107. 2007, Thousand Oaks (CA): Sage

Holm S: Едноставна процедура за повеќекратно отфрлање последователно. Scand J Statist. 1979, 6: 65-70.

Dmitrienko A, Ajit C, Tamhane AC, Bretz F: Повеќекратни проблеми со тестирањето во фармацевтската статистика (Capman & Hall/CRC Biostatistics Series). 2009 година, Бока Ратон, Флорида: Чепмен и Хол/ЦРЦ

Tu YH, Cheng B, Cheung YK: Забелешка за границите на доверба по повеќекратни тестови со фиксна низа. Заклучок на J Stat Plan. 2012, 142 (11): 2993-2998. 10.1016/j.jspi.2012.05.002.

Wiens BL, Dmitrienko A: Резервната постапка за евалуација на едно семејство хипотези. J Biopharm Стат. 2005, 15 (6): 929-942. 10.1080/10543400500265660.

Korn EL, Li MC, McShane LM, Simon R: Истражување на два мултиваријантни пермутациски методи за контролирање на пропорцијата на лажно откритие. Stat Med. 2007, 26 (24): 4428-4440. 10.1002/sim.2865.

Westfall PH, Young S: Повеќекратно тестирање засновано на преземање примероци: примери и методи за прилагодување на p-вредноста (серија Wiley во веројатност и статистика). 1993 година, Њујорк: Wiley-Interscience

Yu J, Hutson AD, Siddiqui AH, Kedron MA: Групна секвенцијална контрола на севкупните инциденти на токсичност во клиничките испитувања - не-бајзиски и бајески пристапи. Статистички методи Med Res. 2012 година, Epub пред печатење

Thall PF, Simon RM, Shen Y: Приближна евалуација на Бајес за повеќекратни ефекти од третманот. Биометрика. 2000, 56: 213-219. 10.1111/j.0006-341X.2000.00213.х.

Zhang X, Cutter G: Баезијанска привремена анализа во клиничките испитувања. Испитувања на Contemp Clin. 2008, 29: 751-755. 10.1016/j.cct.2008.05.007.

Jakobsen JC, Lindschou Hansen J, Storebø OJ, Simonsen E, Gluud C: Ефектите од когнитивната терапија наспроти „третманот како и обично“ кај пациенти со големо депресивно растројство. PLoS One. 2011, 6 (8): e22890-10.1371/journal.pone.0022890.

Кнор У, Винберг М, Кесинг ЛВ, Ветерслев Ј: Плунковен кортизол кај депресивни пациенти наспроти контролни лица: систематски преглед и мета-анализа. Психоневроендокринол. 2010, 35: 1275-1286. 10.1016/j.psyneuen.2010 година.04.001.

Downs JR, Clearfield M, Weis S, Whitney E, Shapiro DR, Beere PA, Langendorfer A, Stein EA, Kruyer W, Gotto AM: Примарна превенција на акутни коронарни настани со ловастатин кај мажи и жени со просечни нивоа на холестерол: резултати од AFCAPS /TexCAPS. Студија за превенција на коронарна атеросклероза на воздухопловните сили/Тексас. ЈАМА. 1998, 279 (20): 1615-1622. 10.1001/jama.279.20.1615.

Stovring H, Harmsen CG, Wisloff T, Jarbol DE, Nexoe J, Nielsen JB, Kristiansen IS: Конкурентски пристап на ризик за европскиот модел на срцев резултат заснован на смртност специфична и од сите причини. Eur J Prev Cardiol. 2012, 20 (5): 827-836.

Прасад V, Вандрос А: Кардиоваскуларна примарна превенција: колку високо треба да ја поставиме лентата?. Arch Int Med. 2012, 172: 656-659. 10.1001/archinternmed.2012.812.

Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, Norris S, Falck-Ytter Y, Glasziou P, DeBeer H, Jaeschke R, Rind D, Meerpohl J, Dahm P, Schunemann HJ: GRADE упатства: 1. Вовед-ОДДЕЛЕНИЕ Профили на докази и резиме на наодите Табели. Џеј Клин епидемиол. 2011, 64 (4): 383-394. 10.1016/j.jclinepi.2010.04.026.

Гајат Г, Оксман АД, Султан С, Брозек Ј, Глазиу П, Алонсо-Коело П, Аткинс Д, Кунц Р, Монтори В, Јаешке Р, Ринд Д, Дам П, Акл ЕА, Мерпол Ј, Вист Г, Берлинер Е, Norris S, Falck-Ytter Y, Schunemann HJ: GRADE упатства: 11. Изработка на севкупна оцена за доверба во проценките на ефектот за еден исход и за сите исходи. Џеј Клин епидемиол. 2013, 66 (2): 151-157. 10.1016/j.jclinepi.2012.01.006.

Jüni P, Nartey L, Reichenbach S, Sterchi R, Dieppe PA, Egger M: Ризик од кардиоваскуларни настани и рофекоксиб: кумулативна мета-анализа. Лансет. 2004, 364 (9450): 2021-2029. 10.1016/S0140-6736(04)17514-4.

Higgins JPT, Green S: The Cochrane Handbook for Systematic Reviews of Interventions, верзија 5.1.0. 2011, The Cochrane Collaboration, Достапно од http://www.cochrane-handbook.org

Џонстон BC, Thorlund K, Schunemann HJ, Xie F, Murad MH, Montori VM, Guyatt GH: Подобрување на толкувањето на доказите за квалитетот на животот во мета-анализите: примена на минимални важни единици за разлика. Резултати за квалитетен живот на здравјето. 2010, 8: 116-10.1186/1477-7525-8-116.

Halvorsen PA, Kristiansen IS: Одлуки за терапии со лекови по бројки потребни за лекување: рандомизирано испитување. Arch Int Med. 2005, 165: 1140-1146. 10.1001/archinte.165.10.1140.

Chalmers I, Milne I, Trohler U, Vandenbroucke J, Morabia A, Tait G, Dukan E: The James Lind Library: објаснување и илустрирање на еволуцијата на правичните тестови на медицински третмани. J R Coll Лекарите Единб. 2008, 38 (3): 259-264.

Одделот за библиотека и информациски услуги, Кралскиот колеџ на лекари од Единбург: библиотека Џејмс Линд. Достапно онлајн на: http://www.jameslindlibrary.org/ 2003

Соработка во Кохран: Соработка во Кохран. http://www.cochrane.org,

Garthwaite P, Kadane JB, O'Hagan A: Статистички методи за предизвикување на распределби на веројатност. J Am Stat Доц. 2012, 100 (470):

Јоанидис Ј: Контрадикторни и првично посилни ефекти во високо цитираните клинички истражувања. ЈАМА. 2005, 294 (2): 218-228. 10.1001/jama.294.2.218.

Ветерслев Ј, Торлунд К, Брок Ј, Глуд Ц: Пробната секвенцијална анализа може да утврди кога ќе се постигне цврст доказ во кумулативната мета-анализа. Џеј Клин епидемиол. 2008, 61 (1): 64-75. 10.1016/j.jclinepi.2007.03.013.

Хигинс ЈП, Вајтхед А, Симондс М: Секвенцијални методи за мета-анализа со случајни ефекти. Stat Med. 2011, 30 (9): 903-921. 10.1002/сим.4088.

Keus F, Wetterslev J, Gluud C, van Laarhoven CJ: Доказ на прв поглед: пристап на матрица на грешки за преглед на достапни докази. BMC Med Res Methodol. 2010, 10: 90-10.1186/1471-2288-10-90.

Џонсон В.Е.: Еднообразно најмоќните бајзиски тестови. Ен Стат. 2013, 41: 1716-1741. 10.1214/13-AOS1123.

Хигинс Ј.П., Диџеј на Шпигелхалтер: Да се ​​биде скептичен за мета-анализите: Бајесова перспектива за испитувањата на магнезиум при миокарден инфаркт. Int J Епидемиол. 2002, 31 (1): 96-104. 10.1093/ije/31.1.96.

Корн ЕЛ, Фрајдлин Б: Веројатноста како статистички доказ во повеќе споредби во клиничките испитувања: без бесплатен ручек. Biom J. 2006, 48 (3): 346-355. 10.1002/bimj.200510216.

Lunn D, Spiegelhalter D, Thomas A, Best N: Проектот BUGS: Еволуција, критика и идни насоки. Stat Med. 2009, 28 (25): 3049-3067. 10.1002/sim.3680.

Gaziano JM, Sesso HD, Christen WG, Bubes V, Smith JP, MacFadyen J, Schvartz M, Manson JE, Glynn RJ, Buring JE: Мултивитамини во превенцијата од рак кај мажите: Студија за здравје на лекарите II. ЈАМА. 2012, 308 (18): 1871-1880. 10.1001/jama.2012 година.14641.

Christen WG, Gaziano JM, Hennekens CH: Design of Physicians' Health Study II – рандомизирано испитување на бета-каротен. Ен епидемиол. 2000, 10 (2): 125-134. 10.1016/S1047-2797(99)00042-3.

Bjelakovic G, Nikolova D, Gluud LL, Simonetti RG, Gluud C: Антиоксидантни додатоци за превенција од смртност кај здрави учесници и пациенти со различни болести. Cochrane Database Syst Rev. 2012, 3: CD007176

Bjelakovic G, Nikolova D, Simonetti RG, Gluud C: Антиоксидантни додатоци за спречување на гастроинтестинални карциноми. Cochrane база на податоци на Syst Rev. 3: CD004183-

Cortés-Jofré M, Rueda JR, Corsini-Muñoz G, Fonseca-Cortés C, Caraballoso M, Bonfill Cosp X: Лекови за спречување на рак на белите дробови кај здрави луѓе. Cochrane база на податоци на Syst Rev. 10: CD002141-

Шакур Х, Робертс И, Баутиста Р, Кабалеро Ј, Коутс Т, Деван И, Ел-Сајед Х, Гогичаишвили Т, Гупта С, Херера Ј, Хант Б, Ирибхогбе П, Изуриета М, Камис Х, Комолафе Е, Мареро МА, Mejia-Mantilla J, Miranda J, Morales C, Olaomi O, Olldashi F, Perel P, Peto R, Ramana PV, Ravi RR, Yutthakasemsunt S: Ефекти на транексамична киселина врз смртта, васкуларни оклузивни настани и трансфузија на крв кај пациенти со траума со значителна хеморагија (CRASH-2): рандомизирана, плацебо-контролирана студија. Лансет. 2010, 376 (9734): 23-32.

Perner A, Haase N, Guttormsen AB, Tenhunen J, Klemenzson G, Aneman A, Madsen KR, Moller MH, Elkjaer JM, Poulsen LM, Bendtsen A, Winding R, Steensen M, Berezowicz P, Soe-Jensen P, Bestle M, Strand K, Wiis J, White JO, Thornberg KJ, Quist L, Nielsen J, Andersen LH, Holst LB, Thormar K, Kjaeldgaard AL, Fabritius ML, Mondrup F, Pott FC, Moller T, et al: Hydroxyethyl starch 130/0.42 наспроти Рингер-ов ацетат кај тешка сепса. N Eng J Med. 2012, 367 (2): 124-134. 10.1056/NEJMoa1204242.

Perner A, Haase N, Wetterslev J, Aneman A, Tenhunen J, Guttormsen AB, Klemenzson G, Pott F, Bodker KD, Badstolokken PM, Bendtsen A, Soe-Jensen P, Tousi H, Bestle M, Pawlowicz M, Winding R, Bulow HH, Kancir C, Steensen M, Nielsen J, Fogh B, Madsen KR, Larsen NH, Carlsson M, Wiis J, Petersen JA, Iversen S, Schoidt O, Leivdal S, Berezowicz P, et al: Споредување на ефектот на хидроксиетил скроб 130/0,4 со избалансиран кристалоиден раствор за морталитет и бубрежна инсуфициенција кај пациенти со тешка сепса (6S--Скандинавски скроб за тешка сепса/проба со септичен шок): протокол на студија, дизајн и образложение за двојно слепа, рандомизирана клиничка студија. Испитувања. 2011, 12 (1): 24-10.1186/1745-6215-12-24.


Содржина

Во квантитативното истражување, податоците се анализираат преку тестирање на значајност на нулта хипотеза или тестирање на хипотеза. Ова е формална процедура за проценка дали врската помеѓу променливите или разликата меѓу групите е статистички значајна.

Нулта и алтернативни хипотези

За почеток, истражувачките предвидувања се преформулираат во две главни хипотези:

  • А нулта хипотеза0) секогаш не предвидува вистински ефект, нема врска помеѓу променливите или нема разлика помеѓу групите.
  • Ан алтернативна хипотезаа или Х1) го наведува вашето главно предвидување за вистински ефект, врска помеѓу променливите или разлика помеѓу групите.

Тестирањето на хипотезата секогаш започнува со претпоставка дека нултата хипотеза е вистинита. Користејќи ја оваа постапка, можете да ја процените веројатноста (веројатноста) за добивање на вашите резултати според оваа претпоставка.Врз основа на исходот од тестот, можете да ја одбиете или задржите нултата хипотеза.

Клиничко значење е релевантен за студии за интервенција и третман. Третманот се смета за клинички значаен кога значително или суштински го подобрува животот на пациентите.


Подобрување по бихевиорален третман за несоница: Клиничко значење, долгорочно одржување и предвидувачи на исходот

Податоци од седум исходни студии (н=216) од различни кратки бихејвиорални третмани за хронична несоница беа повторно анализирани за да се утврдат индивидуалните стапки на статистички и клинички значајно подобрување. Резултатите беа оценети и за долгорочно одржување на придобивките од третманот и за предвидувачите за поволен исход. Севкупно, 39% од учесниците покажале статистички значајно подобрување по 4 недели од третманот, 47% при краткорочно следење (1 до 3 месеци по третманот) и 49% после една година следење. Стапките на влошување беа ниски: помалку од 1% во секој од истите временски периоди. Околу 23% од несониците покажале клинички значително подобрување, односно станале добри спијачи до крајот на третманот, при што 33% го постигнале овој статус со краткорочно следење, бројка која се одржувала на 1 година. Помладите индивидуи со подоцнежна оригинална возраст на почеток и подолго времетраење, кои покажале помала психопатологија и примале третман за контрола на стимулот, имале предност во почетниот третман која исчезнала некаде во текот на краткорочниот период на следење.

Поддршка за оваа студија беше обезбедена од BRSG SO7 RR07054-20 доделена од Програмата за грантови за поддршка на биомедицински истражувања, Оддел за истражувачки ресурси, Национален здравствен институт.

Кимберли Поулишта сега е на Катедрата за психологија на Универзитетот Стенфорд.


Освежување: Што е статистичка значајност?

Што значи наодите од истражувањето да бидат „статистички значајни? “

Едноставно кажано, статистичкото значење е начин за истражувачите да квантифицираат колку е веројатно дека нивните резултати се должат на случајност. Статистички значајни наоди се оние во кои истражувачот има доверба дека резултатите се реални и веродостојни бидејќи шансите за добивање на резултатите случајно се мали.

Тестирањето на статистичка значајност вклучува неколку апстрактни концепти. Значи, ние се обидуваме да ги направиме работите конкретни со пример за тоа како можете да спроведете тест со статистичка значајност.


Погледнете го видеото: Lyndon Johnson tells Richard Russell to serve on Warren Commission (Јуни 2022).


Коментари:

  1. Zolosida

    Колку талентирана мисла

  2. Shilah

    Мислам дека не си во право. Јас нудим да разговарам за тоа.

  3. Vudotilar

    Few are able to make believe.

  4. Yozshuramar

    Јас сум апсолутно уверен во тоа.

  5. Williams

    What words ... great, a wonderful idea

  6. Eadbert

    I congratulate you, the simply excellent thought has visited you

  7. Cochise

    and where is the logic with you?



Напишете порака