Biografier Kjennetegn Analyse

Hvorfor statistisk signifikans har essaynivåer. Forberedelse til arbeid

Oppgaven til statistisk forskning er å identifisere mønstre som ligger til grunn for naturen til fenomenene som studeres. Indikatorer og gjennomsnittsverdier skal tjene som en refleksjon av virkeligheten, som det er nødvendig å bestemme graden av pålitelighet for. Riktig representasjon av utvalgspopulasjonen av populasjonen kalles representativitet . Et mål på nøyaktigheten og påliteligheten til utvalgets statistiske verdier er gjennomsnittsfeilene for representativitet (representativitet), som avhenger av utvalgsstørrelsen og graden av mangfold av utvalgspopulasjonen i henhold til egenskapen som studeres.

Derfor, for å bestemme graden av pålitelighet av resultatene av en statistisk studie, er det nødvendig for hver slektning og gjennomsnittlig størrelse beregne den tilsvarende gjennomsnittsfeilen. Den gjennomsnittlige feilen til indikatoren m p beregnes ved å bruke formelen:

Når antall observasjoner er mindre enn 30, hvor

P - verdien av indikatoren i prosent, ppm, etc.

q - tillegg av denne indikatoren til 100 hvis det er en prosentandel, til 1000 hvis % 0, etc. (dvs. q = 100–P, 1000–P, osv.)

For eksempel er det kjent at 224 personer ble syke av dysenteri i regionen i løpet av året. Befolkning: 33 000 Dysenteriforekomst pr

Den gjennomsnittlige feilen til denne indikatoren

For å løse problemet med graden av pålitelighet til en indikator, bestemmes en konfidensfaktor (t), som er lik forholdet mellom indikatoren og dens gjennomsnittlige feil, dvs.

I vårt eksempel

Jo høyere t, jo større grad av tillit. Ved t=1 er sannsynligheten for indikatorens pålitelighet 68,3%, ved t=2 - 95,5%, ved t=3 - 99,7%. I medisinske statistiske studier brukes vanligvis et konfidensnivå (reliabilitet) på 95,5 %–99,0 %, og i de mest kritiske tilfellene – 99,7 %. I vårt eksempel er derfor insidensraten pålitelig.

Hvis antallet observasjoner er mindre enn 30, bestemmes verdien av kriteriet ved hjelp av Elevens tabell. Hvis den resulterende verdien er høyere eller lik tabellverdien, er indikatoren pålitelig. Hvis den er lavere, er den ikke pålitelig.

Hvis det er nødvendig å sammenligne to homogene indikatorer, bestemmes påliteligheten til forskjellene deres av formelen:

(fra det større tallet trekkes det minste fra)

hvor P 1 – P 2 er forskjellen mellom de to sammenlignede indikatorene,

gjennomsnittlig feil forskjellen mellom to indikatorer.

For eksempel i region B ble 270 personer syke av dysenteri i løpet av året. Befolkningen i regionen er 45 000. Derfor er forekomsten av dysenteri:

de. insidensraten er pålitelig.

Som du kan se, er forekomsten i område B lavere enn i område A. Vi bruker formelen for å bestemme påliteligheten av forskjellen mellom de to indikatorene:

Hvis det er et stort antall observasjoner (mer enn 30), er forskjellen i indikatorer statistisk signifikant hvis t = 2 eller mer. Således, i vårt eksempel, er forekomsten i region A betydelig høyere, fordi konfidens koeffisient (t) er større enn 2.

Når du kjenner verdien av gjennomsnittsfeilen til indikatoren, er det mulig å bestemme konfidensgrensene for denne indikatoren avhengig av påvirkningen av årsakene tilfeldig. Konfidensgrenser bestemmes av formelen:

P – indikator;

m er dens gjennomsnittlige feil;

t - konfidens koeffisient velges avhengig av nødvendig pålitelighetsverdi: t=1 tilsvarer påliteligheten til resultatet i 68,3 % av tilfellene, t=2 – 95,5 %, t=2,6 – 99 %, t=3 – 99,7 %, t=3,3 – 99,9 Verdien kalles maksimal feil.

For eksempel, i region B, kan forekomsten av dysenteri med en nøyaktighet på 99,7 9% svinge på grunn av tilfeldige faktorer innenfor området, dvs. fra 49,1 til 70,9.

Hypoteser testes vha statistisk analyse. Statistisk signifikans finner man ved å bruke P-verdien, som tilsvarer sannsynligheten for en gitt hendelse forutsatt at en påstand (nullhypotese) er sann. Hvis P-verdien er mindre enn et spesifisert nivå av statistisk signifikans (vanligvis 0,05), kan eksperimentatoren trygt konkludere med at nullhypotesen er falsk og fortsette med å vurdere den alternative hypotesen. Ved hjelp av Studentens t-test kan du beregne P-verdien og bestemme signifikans for to datasett.

Trinn

Del 1

Sette opp eksperimentet

    Definer hypotesen din. Det første trinnet i å vurdere statistisk signifikans er å velge spørsmålet du vil svare på og formulere en hypotese. En hypotese er et utsagn om eksperimentelle data, deres fordeling og egenskaper. For ethvert eksperiment er det både en null og en alternativ hypotese. Generelt sett må du sammenligne to sett med data for å finne ut om de er like eller forskjellige.

    • Nullhypotesen (H 0) sier typisk at det ikke er noen forskjell mellom to sett med data. For eksempel: de elevene som leser stoffet før timen får ikke høyere karakterer.
    • Den alternative hypotesen (H a) er motsatt nullhypotese og representerer et utsagn som må bekreftes ved hjelp av eksperimentelle data. For eksempel: de elevene som leser stoffet før timen får høyere karakterer.
  1. Angi signifikansnivået for å bestemme hvor mye datadistribusjonen må avvike fra normalen før det kan betraktes som et signifikant resultat. Signifikansnivå (også kaltα (\displaystyle \alpha )

    • -nivå) er terskelen du definerer for statistisk signifikans. Hvis P-verdien er mindre enn eller lik signifikansnivået, anses dataene som statistisk signifikante. Signifikansnivå (også kalt Som regel er signifikansnivået (verdi ) tas lik 0,05, og i dette tilfellet er sannsynligheten for å oppdage en tilfeldig forskjell mellom forskjellige sett
    • data er bare 5 %. Jo høyere grad av betydning (og følgelig, mindre P-verdi
    • ), jo mer pålitelige resultatene.
    • Hvis du vil ha mer pålitelige resultater, senk P-verdien til 0,01. Vanligvis brukes lavere P-verdier i produksjonen når det er nødvendig å identifisere defekter i produkter. I dette tilfellet kreves høy pålitelighet for å sikre at alle deler fungerer som forventet.
  2. For de fleste hypoteseeksperimenter er et signifikansnivå på 0,05 tilstrekkelig. Bestem hvilket kriterium du vil bruke: ensidig eller tosidig. En av forutsetningene i Studentens t-test er at dataene er normalfordelt. Normalfordelingen er en klokkeformet kurve med maksimalt antall resultater i midten av kurven. Elevens t-test er matematisk metode datasjekk, som lar deg finne ut om dataene faller utenfor grensene normalfordeling

    • (mer, mindre eller i "halene" av kurven).
    • Hvis du ikke er sikker på om dataene er over eller under kontrollgruppeverdiene, bruk en tosidig test. Dette vil tillate deg å bestemme betydningen i begge retninger.
  3. Hvis du vet i hvilken retning dataene kan falle utenfor normalfordelingen, bruk en ensidig test. I eksemplet ovenfor forventer vi at elevenes karakterer øker, så en ensidig test kan brukes. Bestem prøvestørrelsen ved hjelp av statistisk styrke. Den statistiske kraften til en studie er sannsynligheten for at prøver vil gi det forventede resultatet. En vanlig effektterskel (eller β) er 80 %. Å analysere statistisk kraft uten noen forutgående data kan være utfordrende fordi det krever litt informasjon om de forventede middelverdiene i hver gruppe data og deres standardavvik. Bruk en nettbasert strømanalysekalkulator for å bestemme den optimale prøvestørrelsen for dataene dine.

    • Vanligvis utfører forskere en liten pilotstudie som gir data for statistisk kraftanalyse og bestemmer prøvestørrelsen som trengs for en større, mer fullstendig studie.
    • Hvis du ikke klarer å gjennomføre en pilotstudie, prøv å estimere mulige gjennomsnitt basert på litteraturen og andres resultater. Dette kan hjelpe deg med å finne den optimale prøvestørrelsen.

    Del 2

    Kalkulere standardavvik
    1. Skriv ned formelen for standardavvik. Standardavviket viser hvor stor spredning det er i dataene. Den lar deg konkludere med hvor nære dataene som er hentet fra en bestemt prøve er. Ved første øyekast virker formelen ganske komplisert, men forklaringene nedenfor vil hjelpe deg å forstå den. Formelen har neste visning: s = √∑((x i – µ) 2 /(N – 1)).

      • s - standardavvik;
      • tegnet ∑ indikerer at alle data innhentet fra prøven skal legges til;
      • x i tilsvarer den i-te verdien, det vil si et separat resultat oppnådd;
      • µ er gjennomsnittsverdien for en gitt gruppe;
      • N- totalt antall data i prøven.
    2. Finn gjennomsnittet i hver gruppe. For å beregne standardavviket må du først finne gjennomsnittet for hver studiegruppe. Middelverdien er angitt med den greske bokstaven µ (mu). For å finne gjennomsnittet legger du ganske enkelt sammen alle de resulterende verdiene og deler dem med mengden data (prøvestørrelse).

      • For eksempel å finne gjennomsnittlig vurdering I gruppen av de elevene som studerer materialet før timen, vurder et lite sett med data. For enkelhets skyld bruker vi et sett med fem punkter: 90, 91, 85, 83 og 94.
      • La oss legge alle verdiene sammen: 90 + 91 + 85 + 83 + 94 = 443.
      • La oss dele summen på antall verdier, N = 5: 443/5 = 88,6.
      • Dermed er gjennomsnittet for denne gruppen 88,6.
    3. Trekk fra hver verdi oppnådd fra gjennomsnittet. Neste trinn er å beregne differansen (x i – µ). For å gjøre dette, trekk fra hver verdi oppnådd fra den funnet gjennomsnittsverdien. I vårt eksempel må vi finne fem forskjeller:

      • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) og (94 – 88,6).
      • Som et resultat får vi følgende verdier: 1,4, 2,4, -3,6, -5,6 og 5,4.
    4. Kvadrer hver oppnådd verdi og legg dem sammen. Hver av mengdene som nettopp er funnet, skal kvadrateres. På dette trinnet vil alle forsvinne negative verdier. Hvis etter dette trinnet du vil ha litt til overs negative tall, som betyr at du glemte å sette dem i rute.

      • For vårt eksempel får vi 1,96, 5,76, 12,96, 31,36 og 29,16.
      • Vi legger sammen de resulterende verdiene: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Del på prøvestørrelse minus 1. I formelen deles summen på N – 1 på grunn av at vi ikke tar hensyn generell befolkning, og ta et utvalg av alle elevene for evaluering.

      • Trekk fra: N – 1 = 5 – 1 = 4
      • Divide: 81,2/4 = 20,3
    6. Fjerne kvadratrot. Etter at du har delt summen med prøvestørrelsen minus én, tar du kvadratroten av verdien som er funnet. Dette er det siste trinnet i beregningen av standardavviket. Spise statistiske programmer, som, etter å ha lagt inn de første dataene, utfører alle nødvendige beregninger.

      • I vårt eksempel er standardavviket for karakterene til de elevene som leste stoffet før timen s =√20,3 = 4,51.

      Del 3

      Bestem betydning
      1. Beregn variansen mellom de to gruppene med data. Før dette trinnet så vi på et eksempel for bare én gruppe data. Hvis du vil sammenligne to grupper, bør du selvsagt ta data fra begge gruppene. Beregn standardavviket for den andre gruppen med data, og finn deretter variansen mellom de to eksperimentelle gruppene. Variansen beregnes ved hjelp av følgende formel: s d = √((s 1 /N 1) + (s 2 /N 2)).

BETALT FUNKSJON. Den statistiske signifikansfunksjonen er bare tilgjengelig på utvalgte planer. Sjekk om den er i .

Du kan finne ut om det er statistisk signifikante forskjeller i svarene som mottas fra ulike grupper av respondenter på spørsmål i en spørreundersøkelse. For å bruke funksjonen for statistisk signifikans i SurveyMonkey, må du:

  • Aktiver funksjonen for statistisk signifikans når du legger til en sammenligningsregel til et spørsmål i undersøkelsen. Velg grupper av respondenter som skal sammenlignes for å sortere undersøkelsesresultatene i grupper for visuell sammenligning.
  • Undersøk datatabellene for undersøkelsesspørsmålene dine for å finne ut om det er statistisk signifikante forskjeller i svarene mottatt fra ulike grupper respondenter.

Se statistisk signifikans

Ved å følge trinnene nedenfor kan du lage en undersøkelse som viser statistisk signifikans.

1. Legg til lukkede spørsmål i undersøkelsen

For å vise statistisk signifikans når du analyserer resultater, må du bruke en sammenligningsregel på ethvert spørsmål i undersøkelsen.

Du kan bruke sammenligningsregelen og beregne statistisk signifikans i svar hvis du bruker en av følgende typer spørsmål i undersøkelsesdesignet ditt:

Det er nødvendig å sørge for at de foreslåtte svaralternativene kan deles inn i komplette grupper. Svaralternativene du velger for sammenligning når du oppretter en sammenligningsregel, vil bli brukt til å organisere dataene i krysstabeller gjennom hele undersøkelsen.

2. Samle svar

Når du har fullført undersøkelsen, oppretter du en samler for å distribuere den. Det er flere måter.

Du må motta minst 30 svar for hvert svaralternativ du planlegger å bruke i sammenligningsregelen for å aktivere og se statistisk signifikans.

Eksempel på undersøkelse

Du ønsker å finne ut om menn er betydelig mer fornøyd med produktene dine enn kvinner.

  1. Legg til to flervalgsspørsmål til undersøkelsen din:
    Hva er kjønnet ditt? (mann, kvinne)
    Er du fornøyd eller misfornøyd med produktet vårt? (fornøyd, misfornøyd)
  2. Sørg for at minst 30 respondenter velger «mann» for kjønnsspørsmålet OG minst 30 respondenter velger «kvinne» som kjønn.
  3. Legg til en sammenligningsregel på spørsmålet "Hva er kjønnet ditt?" og velg begge svaralternativene som dine grupper.
  4. Bruk datatabellen under spørsmålstabellen "Er du fornøyd eller misfornøyd med produktet vårt?" for å se om noen svaralternativer viser en statistisk signifikant forskjell

Hva er en statistisk signifikant forskjell?

En statistisk signifikant forskjell betyr at statistisk analyse har fastslått at det er signifikante forskjeller mellom svarene til en gruppe respondenter og svarene til en annen gruppe. Statistisk signifikans betyr at de oppnådde tallene er vesentlig forskjellige. Slik kunnskap vil i stor grad hjelpe deg med dataanalyse. Du bestemmer imidlertid viktigheten av de oppnådde resultatene. Det er du som bestemmer hvordan du skal tolke undersøkelsesresultatene og hvilke handlinger som skal iverksettes basert på dem.

For eksempel får du flere klager fra kvinnelige kunder enn fra mannlige kunder. Hvordan kan vi avgjøre om en slik forskjell er reell og om det må iverksettes tiltak angående den? En fin måte å teste observasjonene dine på er å gjennomføre en undersøkelse som viser deg om mannlige kunder er betydelig mer fornøyd med produktet ditt. Ved å bruke statistisk formel Den statistiske signifikansfunksjonen vi tilbyr vil gi deg muligheten til å avgjøre om produktet ditt faktisk appellerer betydelig mer til menn enn kvinner. Dette vil tillate deg å handle basert på fakta i stedet for gjetting.

Statistisk signifikant forskjell

Hvis resultatene dine er uthevet i datatabellen, betyr det at de to gruppene med respondenter er vesentlig forskjellige fra hverandre. Begrepet "signifikant" betyr ikke at de resulterende tallene har noen spesiell betydning eller signifikans, bare at det er en statistisk forskjell mellom dem.

Ingen statistisk signifikant forskjell

Hvis resultatene dine ikke er uthevet i den tilsvarende datatabellen, betyr dette at selv om det kan være forskjell på de to tallene som sammenlignes, er det ingen statistisk forskjell mellom dem.

Svar uten statistisk signifikante forskjeller viser at det ikke er noen signifikant forskjell mellom de to elementene som sammenlignes gitt prøvestørrelsen du bruker, men dette betyr ikke nødvendigvis at de ikke er signifikante. Kanskje ved å øke utvalgsstørrelsen vil du kunne identifisere en statistisk signifikant forskjell.

Prøvestørrelse

Hvis du har en veldig liten prøvestørrelse, bare veldig store forskjeller mellom to grupper. Hvis du har en veldig stor utvalgsstørrelse, vil både små og store forskjeller bli regnet som signifikante.

Men bare fordi to tall er statistisk forskjellige, betyr det ikke at forskjellen mellom resultatene gjør noen forskjell for deg. praktisk betydning. Du må selv bestemme hvilke forskjeller som er meningsfulle for undersøkelsen din.

Beregning av statistisk signifikans

Vi beregner statistisk signifikans ved å bruke et standard 95 % konfidensnivå. Hvis et svaralternativ vises som statistisk signifikant, betyr det at det ved en tilfeldighet alene eller på grunn av prøvetakingsfeil er mindre enn 5 % sannsynlighet for at forskjellen mellom de to gruppene oppstår (ofte vist som: p<0,05).

For å beregne statistisk signifikante forskjeller mellom grupper bruker vi følgende formler:

Parameter

Beskrivelse

a1Prosentandelen av deltakere fra den første gruppen som svarte på spørsmålet på en bestemt måte, multiplisert med utvalgsstørrelsen til denne gruppen.
b1Prosentandelen av deltakere fra den andre gruppen som svarte på spørsmålet på en bestemt måte, multiplisert med utvalgsstørrelsen til denne gruppen.
Samlet prøveandel (p)Kombinasjonen av to aksjer fra begge grupper.
Standardfeil (SE)En indikator på hvor mye din andel avviker fra den faktiske andelen. En lavere verdi betyr at brøken er nær den faktiske brøken, en høyere verdi betyr at brøken er vesentlig forskjellig fra den faktiske brøken.
Teststatistikk (t)Teststatistikk. Antall standardavvik som en gitt verdi avviker fra gjennomsnittet med.
Statistisk signifikansHvis den absolutte verdien av teststatistikken er større enn 1,96* standardavvik fra gjennomsnittet, anses det som en statistisk signifikant forskjell.

*1,96 er verdien brukt for 95 % konfidensnivå fordi 95 % av området som håndteres av studentens t-fordelingsfunksjon ligger innenfor 1,96 standardavvik fra gjennomsnittet.

Regneeksempel

Fortsetter med eksemplet som er brukt ovenfor, la oss finne ut om prosentandelen menn som sier de er fornøyde med produktet ditt er betydelig høyere enn prosentandelen kvinner.

La oss si at 1000 menn og 1000 kvinner deltok i undersøkelsen din, og undersøkelsesresultatene viste at 70 % av mennene og 65 % av kvinnene sier de er fornøyde med produktet ditt. Er 70 %-nivået betydelig høyere enn 65 %-nivået?

Bytt ut følgende data fra undersøkelsen med de gitte formlene:

  • p1 (% av mennene er fornøyd med produktet) = 0,7
  • p2 (% av kvinnene fornøyd med produktet) = 0,65
  • n1 (antall undersøkte menn) = 1000
  • n2 (antall kvinner som ble intervjuet) = 1000

Siden den absolutte verdien av teststatistikken er større enn 1,96, betyr det at forskjellen mellom menn og kvinner er signifikant. Sammenlignet med kvinner er det mer sannsynlig at menn er fornøyde med produktet ditt.

Skjuler statistisk signifikans

Hvordan skjule statistisk signifikans for alle spørsmål

  1. Klikk på nedoverpilen til høyre for sammenligningsregelen i venstre sidefelt.
  2. Velg et element Rediger regel.
  3. Deaktiver funksjonen Vis statistisk signifikans ved hjelp av en bryter.
  4. Klikk på knappen Søke.

For å skjule statistisk signifikans for ett spørsmål, må du:

  1. Klikk på knappen Melodi over diagrammet for dette problemet.
  2. Åpne fanen Visningsalternativer.
  3. Fjern merket i boksen ved siden av Statistisk signifikans.
  4. Klikk på knappen Spare.

Visningsalternativet aktiveres automatisk når statistisk signifikansvisning er aktivert. Hvis du fjerner dette visningsalternativet, vil visningen av statistisk signifikans også bli deaktivert.

Slå på funksjonen for statistisk signifikans når du legger til en sammenligningsregel til et spørsmål i undersøkelsen din. Undersøk datatabellene for undersøkelsesspørsmålene dine for å finne ut om det er statistisk signifikante forskjeller i svarene mottatt fra ulike grupper av respondenter.

Statistisk signifikans

Resultatene oppnådd ved hjelp av en bestemt forskningsprosedyre kalles statistisk signifikant, hvis sannsynligheten for deres tilfeldige forekomst er svært liten. Dette konseptet kan illustreres med eksemplet med å kaste en mynt. Anta at mynten kastes 30 ganger; Hoder kom opp 17 ganger og hale kom opp 13 ganger. Er betydelig avvik på dette resultatet fra det forventede (15 hoder og 15 haler), eller er dette avviket tilfeldig? For å svare på dette spørsmålet kan du for eksempel kaste den samme mynten mange ganger, 30 ganger på rad, og samtidig legge merke til hvor mange ganger forholdet mellom "hoder" og "haler" på 17:13 gjentas. Statistisk analyse redder oss fra denne kjedelige prosessen. Med dens hjelp, etter de første 30 kastene med en mynt, kan du anslå det mulige antallet tilfeldige forekomster av 17 "hoder" og 13 "haler". En slik vurdering kalles en sannsynlighetserklæring.

I den vitenskapelige litteraturen om industriell-organisasjonspsykologi er en sannsynlighetserklæring i matematisk form betegnet med uttrykket r(sannsynlighet)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (s< 0,01). Dette faktum er viktig for å forstå litteraturen, men skal ikke oppfattes som at det er meningsløst å gjennomføre observasjoner som ikke oppfyller disse standardene. Såkalte ikke-signifikante forskningsresultater (observasjoner som kan oppnås ved en tilfeldighet) flereén til fem ganger av 100) kan være svært nyttig for å identifisere trender og som en guide til fremtidig forskning.

Det bør også bemerkes at ikke alle psykologer er enige i tradisjonelle standarder og prosedyrer (f.eks. Cohen, 1994; Sauley & Bedeian, 1989). Spørsmål knyttet til måling er i seg selv et stort arbeidstema for mange forskere, med å studere nøyaktigheten av målemetoder og forutsetningene som ligger til grunn for eksisterende metoder og standarder, samt utvikling av nye klinikere og instrumenter. Kanskje en gang i fremtiden vil forskning i denne kraften føre til endringer i tradisjonelle standarder for å vurdere statistisk signifikans, og disse endringene vil få bred aksept. (Den femte avdelingen av American Psychological Association er en gruppe psykologer som spesialiserer seg på studiet av vurdering, måling og statistikk.)

I forskningsrapporter er en sannsynlighetserklæring som f.eks r< 0,05, på grunn av noen statistikk, det vil si et tall som oppnås som et resultat av et visst sett med matematiske beregningsprosedyrer. Probabilistisk bekreftelse oppnås ved å sammenligne denne statistikken med data fra spesielle tabeller som er publisert for dette formålet. I industrielt-organisatorisk psykologisk forskning Det er ofte statistikk som f.eks r, F, t, r>(les "chi square") og R(les "flertall" R"). I hvert tilfelle kan statistikken (ett tall) oppnådd fra analysen av en serie observasjoner sammenlignes med tall fra en publisert tabell. Etter dette kan du formulere en sannsynlighetserklæring om sannsynligheten for å oppnå dette tallet tilfeldig, det vil si trekke en konklusjon om betydningen av observasjonene.

For å forstå studiene beskrevet i denne boken er det tilstrekkelig å ha en klar forståelse av begrepet statistisk signifikans og ikke nødvendigvis vite hvordan statistikken nevnt ovenfor beregnes. Det vil imidlertid være nyttig å diskutere én antagelse som ligger til grunn for alle disse prosedyrene. Dette er antakelsen om at alle observerte variabler er fordelt tilnærmet normal lov. I tillegg, når man leser rapporter om industriell-organisasjonspsykologisk forskning, kommer ofte tre andre konsepter over det skuespillet viktig rolle- for det første, korrelasjon og korrelasjon, for det andre, determinant/prediktiv variabel og "ANOVA" ( variansanalyse), for det tredje gruppen statistiske metoder under vanlig navn"metaanalyse".

I dag er det egentlig for enkelt: du kan gå bort til en datamaskin og, med liten eller ingen kunnskap om hva du gjør, skape intelligens og tull med virkelig forbløffende hastighet. (J. Box)

Grunnleggende termer og begreper for medisinsk statistikk

I denne artikkelen vil vi presentere noen nøkkelbegreper statistikk som er relevant for medisinsk forskning. Begrepene er nærmere omtalt i de aktuelle artiklene.

Variasjon

Definisjon. Graden av spredning av data (attributtverdier) over verdiområdet

Sannsynlighet

Definisjon. Sannsynlighet er graden av mulighet for at en bestemt hendelse skal inntreffe under visse forhold.

Eksempel. La oss forklare definisjonen av begrepet i setningen "Sannsynlighet for gjenoppretting ved bruk legemiddel Arimidex er 70 %." Hendelsen er "gjenoppretting av pasienten", tilstanden "pasienten tar Arimidex", graden av mulighet er 70 % (grovt sett, av 100 personer som tar Arimidex, blir 70 friske).

Kumulativ sannsynlighet

Definisjon. Den kumulative sannsynligheten for å overleve på tidspunkt t er den samme som andelen pasienter i live på det tidspunktet.

Eksempel. Hvis det sies at den kumulative sannsynligheten for overlevelse etter et femårig behandlingsforløp er 0,7, betyr dette at 70 % av pasientgruppen som vurderes forble i live. innledende mengde, og 30 % døde. Med andre ord, av hver hundre mennesker døde 30 i løpet av de første 5 årene.

Tid før arrangementet

Definisjon. Tiden før en hendelse er tiden, uttrykt i noen enheter, som har gått fra et første tidspunkt til en hendelse inntreffer.

Forklaring. Som tidsenheter i medisinsk forskning dager, måneder og år vises.

Typiske eksempler innledende øyeblikk tid:

    begynne å overvåke pasienten

    kirurgisk behandling

Typiske eksempler på hendelsene som er vurdert:

    sykdomsprogresjon

    forekomst av tilbakefall

    pasientens død

Prøve

Definisjon. Den delen av en populasjon oppnådd ved seleksjon.

Basert på resultatene av prøveanalysen trekkes konklusjoner om hele populasjonen, som kun er gyldig dersom utvalget var tilfeldig. Siden det er praktisk talt umulig å velge tilfeldig fra en populasjon, bør det tilstrebes at utvalget minst er representativt for populasjonen.

Avhengige og uavhengige utvalg

Definisjon. Prøver der studieobjekter ble rekruttert uavhengig av hverandre. Et alternativ til uavhengige prøver er avhengige (sammenkoblede, sammenkoblede) prøver.

Hypotese

Tosidige og ensidige hypoteser

La oss først forklare bruken av begrepet hypotese i statistikk.

Hensikten med det meste av forskning er å teste sannheten til et utsagn. Hensikten med medikamenttesting er oftest å teste hypotesen om at ett medikament er mer effektivt enn et annet (for eksempel er Arimidex mer effektivt enn Tamoxifen).

For å sikre strengheten til studien, uttrykkes påstanden som verifiseres matematisk. For eksempel, hvis A er antall år som en pasient som tar Arimidex vil leve, og T er antall år som en pasient som tar Tamoxifen vil leve, kan hypotesen som testes skrives som A>T.

Definisjon. En hypotese kalles tosidig hvis den består i likheten mellom to størrelser.

Et eksempel på en tosidig hypotese: A=T.

Definisjon. En hypotese kalles ensidig (1-sidig) hvis den består i ulikheten mellom to størrelser.

Eksempler på ensidige hypoteser:

Dikotome (binære) data

Definisjon. Data uttrykt med bare to gyldige alternative verdier

Eksempel: Pasienten er "frisk" - "syk". Ødem "er" - "nei".

Konfidensintervall

Definisjon. Konfidensintervallet for en mengde er området rundt verdien av mengden den ligger i sann mening denne verdien (med en viss grad av selvtillit).

Eksempel. La mengden som studeres være antall pasienter per år. I gjennomsnitt er tallet deres 500, og 95% - konfidensintervall- (350, 900). Dette betyr at mest sannsynlig (med en sannsynlighet på 95%), vil minst 350 og ikke mer enn 900 personer kontakte klinikken i løpet av året.

Betegnelse. En svært vanlig brukt forkortelse er: CI 95 % er et konfidensintervall med et konfidensnivå på 95 %.

Reliabilitet, statistisk signifikans (P - nivå)

Definisjon. Den statistiske signifikansen til et resultat er et mål på tillit til dets "sannhet".

Eventuell forskning utføres kun på grunnlag av en del av objektene. En studie av effektiviteten til et medikament utføres ikke på grunnlag av alle pasienter på planeten, men bare på en viss gruppe pasienter (det er rett og slett umulig å utføre en analyse på grunnlag av alle pasienter).

La oss anta at som et resultat av analysen ble det gjort en viss konklusjon (for eksempel er bruken av Arimidex som en adekvat terapi 2 ganger mer effektiv enn Tamoxifen).

Spørsmålet som må stilles er: "Hvor mye kan du stole på dette resultatet?"

Tenk deg at vi utførte en studie basert på kun to pasienter. Selvfølgelig bør resultatene i dette tilfellet behandles med forsiktighet. Hvis et stort antall pasienter ble undersøkt (numerisk verdi " stor mengde"avhenger av situasjonen), så kan konklusjonene som er trukket allerede stole på.

Så graden av konfidens bestemmes av p-nivåverdien (p-verdi).

Et høyere p-nivå tilsvarer mer lavt nivå tillit til resultatene oppnådd fra analysen av prøven. For eksempel indikerer et p-nivå lik 0,05 (5%) at konklusjonen trukket fra analysen av en bestemt gruppe kun er et tilfeldig trekk ved disse objektene med en sannsynlighet på bare 5%.

Med andre ord, med svært høy sannsynlighet (95%) kan konklusjonen utvides til alle objekter.

Mange studier anser 5 % som en akseptabel p-nivåverdi. Dette betyr at hvis for eksempel p = 0,01, så kan resultatene stoles på, men hvis p = 0,06, kan du ikke.

Studere

Prospektiv studie er en studie der prøver velges ut på grunnlag av en initial faktor, og noen resulterende faktor analyseres i prøvene.

Retrospektiv studie er en studie der prøver velges ut på grunnlag av en resulterende faktor, og en initial faktor analyseres i prøvene.

Eksempel. Den første faktoren er en gravid kvinne yngre/over 20 år. Den resulterende faktoren er at barnet er lettere/tyngre enn 2,5 kg. Vi analyserer om barnets vekt avhenger av mors alder.

Hvis vi rekrutterer 2 prøver, en med mødre under 20 år, den andre med mødre eldre, og deretter analyserer massen av barn i hver gruppe, så er dette en prospektiv studie.

Hvis vi rekrutterer 2 prøver, i den ene - mødre som fødte barn som er lettere enn 2,5 kg, i den andre - tyngre, og deretter analyserer alderen til mødrene i hver gruppe, så er dette en retrospektiv studie (naturligvis en slik studie kan bare utføres når eksperimentet er fullført, det vil si at alle barn er født).

Exodus

Definisjon. Et klinisk signifikant fenomen, laboratorieindikator eller tegn som tjener som et objekt av interesse for forskeren. Når du utfører kliniske studier, fungerer utfall som kriterier for å vurdere effektiviteten av en terapeutisk eller forebyggende intervensjon.

Klinisk epidemiologi

Definisjon. Vitenskap som gjør det mulig å forutsi et bestemt utfall for hver spesifikk pasient basert på å studere det kliniske forløpet av sykdommen i lignende tilfeller ved bruk av strenge vitenskapelige metoder studerer pasienter for å sikre nøyaktige prognoser.

Kohort

Definisjon. En gruppe studiedeltakere forent av noen fellestrekk på tidspunktet for dannelsen og studert over lang tid.

Kontroll

Historisk kontroll

Definisjon. En kontrollgruppe ble dannet og undersøkt i perioden før studien.

Parallell kontroll

Definisjon. En kontrollgruppe ble dannet samtidig med dannelsen av hovedgruppen.

Korrelasjon

Definisjon. Statistisk forhold mellom to egenskaper (kvantitativ eller ordinær), som viser det høyere verdi En egenskap i en viss del av tilfellene tilsvarer en større verdi - ved en positiv (direkte) korrelasjon - verdien av en annen egenskap, eller en mindre verdi - ved en negativ (invers) korrelasjon.

Eksempel. Det ble funnet en signifikant sammenheng mellom nivåene av blodplater og leukocytter i pasientens blod. Korrelasjonskoeffisienten er 0,76.

Risikokoeffisient (RR)

Definisjon. Risikoforholdet er forholdet mellom sannsynligheten for forekomsten av en ("dårlig") hendelse for den første gruppen av objekter og sannsynligheten for at den samme hendelsen inntreffer for den andre gruppen av objekter.

Eksempel. Hvis sannsynligheten for å utvikle lungekreft hos ikke-røykere er 20%, og hos røykere - 100%, vil CR være lik en femtedel. I dette eksemplet er den første gruppen av gjenstander ikke-røykere, den andre gruppen er røykere, og forekomsten av lungekreft anses som en "dårlig" hendelse.

Det er åpenbart at:

1) hvis KR = 1, så er sannsynligheten for at en hendelse skjer i grupper den samme

2) hvis KP>1, så skjer hendelsen oftere med objekter fra den første gruppen enn fra den andre

3) hvis KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analyse

Definisjon. MED statistisk analyse som oppsummerer resultatene fra flere studier som undersøker det samme problemet (vanligvis effektiviteten av behandling, forebygging, diagnostiske metoder). Sammenslåing av studier gir et større utvalg for analyse og større statistisk kraft for de kombinerte studiene. Brukes for å øke bevisene eller tilliten til en konklusjon om effektiviteten til metoden som studeres.

Kaplan-Meier metode (Kaplan-Meier multiplikator estimater)

Denne metoden ble oppfunnet av statistikerne E.L. Kaplan og Paul Meyer.

Metoden brukes til å beregne ulike mengder knyttet til observasjonstiden til en pasient. Eksempler på slike mengder:

    sannsynlighet for bedring innen ett år ved bruk av stoffet

    sjanse for tilbakefall etter operasjonen innen tre år etter operasjonen

    kumulativ sannsynlighet for overlevelse ved fem år blant pasienter med prostatakreft etter organamputasjon

La oss forklare fordelene ved å bruke Kaplan-Meier-metoden.

Verdiene til verdiene i "konvensjonell" analyse (ikke ved bruk av Kaplan-Meier-metoden) beregnes basert på å dele det aktuelle tidsintervallet i intervaller.

For eksempel, hvis vi studerer sannsynligheten for en pasients død innen 5 år, kan tidsintervallet deles inn i 5 deler (mindre enn 1 år, 1-2 år, 2-3 år, 3-4 år, 4- 5 år), så og i 10 (seks måneder hver), eller for et annet antall intervaller. Resultatene for forskjellige partisjoner vil være forskjellige.

Å velge den mest passende partisjonen er ikke en lett oppgave.

Estimater av verdier oppnådd ved bruk av Kaplan-Meier-metoden avhenger ikke av inndelingen av observasjonstiden i intervaller, men avhenger kun av levetiden til hver enkelt pasient.

Derfor er det lettere for forskeren å gjennomføre analysen, og resultatene er ofte bedre enn resultatene fra «konvensjonell» analyse.

Kaplan-Meier-kurven er en graf over overlevelseskurven oppnådd ved bruk av Kaplan-Meier-metoden.

Cox modell

Denne modellen ble oppfunnet av Sir David Roxby Cox (f. 1924), en berømt engelsk statistiker, forfatter av mer enn 300 artikler og bøker.

Cox-modellen brukes i situasjoner der mengdene som studeres i overlevelsesanalysen avhenger av funksjoner av tid. For eksempel kan sannsynligheten for tilbakefall etter t år (t=1,2,...) avhenge av logaritmen til tidslog(t).

En viktig fordel med metoden foreslått av Cox er anvendeligheten av denne metoden i et stort antall situasjoner (modellen legger ikke strenge begrensninger på arten eller formen på sannsynlighetsfordelingen).

Med utgangspunkt i Cox-modellen kan det utføres en analyse (kalt Cox-analyse), hvis resultat er verdien av risikokoeffisienten og konfidensintervallet for risikokoeffisienten.

Ikke-parametriske statistiske metoder

Definisjon. En klasse av statistiske metoder som primært brukes til analyse av kvantitative data som ikke danner en normalfordeling, samt for analyse av kvalitative data.

Eksempel. For å identifisere betydningen av forskjeller i det systoliske trykket til pasienter avhengig av type behandling, vil vi bruke den ikke-parametriske Mann-Whitney-testen.

Tegn (variabel)

Definisjon. X egenskaper ved studieobjektet (observasjon). Det er kvalitative og kvantitative egenskaper.

Randomisering

Definisjon. En metode for tilfeldig fordeling av forskningsobjekter i hoved- og kontrollgruppene ved bruk av spesielle midler (tabeller eller tilfeldig tallteller, myntkast og andre metoder for tilfeldig å tildele et gruppenummer til en inkludert observasjon). Randomisering minimerer forskjeller mellom grupper på kjente og ukjente egenskaper som potensielt påvirker resultatet som studeres.

Fare

Attributiv- ytterligere risiko for et ugunstig utfall (for eksempel sykdom) på grunn av tilstedeværelsen av en viss karakteristikk (risikofaktor) i emnet for studien. Dette er den delen av risikoen for å utvikle en sykdom som er assosiert med, forklart av og kan elimineres hvis risikofaktoren elimineres.

Relativ risiko- forholdet mellom risikoen for en ugunstig tilstand i en gruppe og risikoen for denne tilstanden i en annen gruppe. Brukes i prospektive og observasjonsstudier når grupper dannes på forhånd og forekomsten av tilstanden som studeres ennå ikke har inntruffet.

Rullende eksamen

Definisjon. En metode for å sjekke stabiliteten, reliabiliteten, ytelsen (validiteten) til en statistisk modell ved å sekvensielt fjerne observasjoner og beregne modellen på nytt. Jo mer like de resulterende modellene er, jo mer stabil og pålitelig er modellen.

Hendelse

Definisjon. Det kliniske resultatet observert i studien, slik som forekomsten av en komplikasjon, tilbakefall, bedring eller død.

Stratifisering

Definisjon. M en prøvetakingsteknikk der populasjonen av alle deltakerne som oppfyller inklusjonskriteriene for en studie først deles inn i grupper (strata) basert på en eller flere egenskaper (vanligvis kjønn, alder) som potensielt kan påvirke resultatet av interessen, og deretter fra hver av disse gruppene (stratum) deltakerne rekrutteres uavhengig inn i eksperimentelle og kontrollgruppene. Dette gjør at forskeren kan balansere viktige egenskaper mellom forsøks- og kontrollgruppen.

Beredskapstabell

Definisjon. En tabell med absolutte frekvenser (tall) av observasjoner, hvis kolonner tilsvarer verdiene til en karakteristikk, og radene - til verdiene til en annen karakteristikk (i tilfelle av en todimensjonal beredskapstabell). Absolutte frekvensverdier er plassert i celler i skjæringspunktet mellom rader og kolonner.

La oss gi et eksempel på en beredskapstabell. Aneurismeoperasjon ble utført hos 194 pasienter. Alvorlighetsgraden av ødem hos pasienter før operasjon er kjent.

Ødem\ Utfall

ingen hevelse 20 6 26
moderat hevelse 27 15 42
uttalt ødem 8 21 29
m j 55 42 194

Av 26 pasienter uten ødem overlevde således 20 pasienter etter operasjonen, og 6 pasienter døde. Av de 42 pasientene med moderat ødem overlevde 27 pasienter, 15 døde osv.

Chi-kvadrattest for beredskapstabeller

For å bestemme betydningen (pålitelighet) av forskjeller i ett tegn avhengig av et annet (for eksempel utfallet av en operasjon avhengig av alvorlighetsgraden av ødem), brukes kjikvadrattesten for beredskapstabeller:


Sjanse

La sannsynligheten for en hendelse være lik p. Da er sannsynligheten for at hendelsen ikke skal inntreffe 1-p.

For eksempel, hvis sannsynligheten for at en pasient forblir i live etter fem år er 0,8 (80 %), så er sannsynligheten for at han dør i løpet av denne tidsperioden 0,2 (20 %).

Definisjon. Sjanse er forholdet mellom sannsynligheten for at en hendelse skal inntreffe og sannsynligheten for at hendelsen ikke vil inntreffe.

Eksempel. I vårt eksempel (om en pasient) er sjansen 4, siden 0,8/0,2=4

Dermed er sannsynligheten for bedring 4 ganger større enn sannsynligheten for død.

Tolkning av verdien av en mengde.

1) Hvis Chance=1, så er sannsynligheten for at en hendelse inntreffer lik sannsynligheten for at hendelsen ikke vil inntreffe;

2) hvis sjanse >1, så er sannsynligheten for at hendelsen inntreffer større enn sannsynligheten for at hendelsen ikke vil inntreffe;

3) hvis sjanse<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Oddsforhold

Definisjon. Oddsforhold er oddsforholdet for den første gruppen av objekter og oddsforholdet for den andre gruppen objekter.

Eksempel. La oss anta at både menn og kvinner gjennomgår en viss behandling.

Sannsynligheten for at en mannlig pasient forblir i live etter fem år er 0,6 (60 %); sannsynligheten for at han dør i løpet av denne tidsperioden er 0,4 (40%).

Lignende sannsynligheter for kvinner er 0,8 og 0,2.

Oddsforholdet i dette eksemplet er

Tolkning av verdien av en mengde.

1) Hvis oddsforholdet = 1, er sjansen for den første gruppen lik sjansen for den andre gruppen

2) Hvis oddsforholdet er >1, er sjansen for den første gruppen større enn sjansen for den andre gruppen

3) Hvis oddsforholdet<1, то шанс для первой группы меньше шанса для второй группы