• Shuffle
    Toggle On
    Toggle Off
  • Alphabetize
    Toggle On
    Toggle Off
  • Front First
    Toggle On
    Toggle Off
  • Both Sides
    Toggle On
    Toggle Off
  • Read
    Toggle On
    Toggle Off
Reading...
Front

Card Range To Study

through

image

Play button

image

Play button

image

Progress

1/237

Click to flip

Use LEFT and RIGHT arrow keys to navigate between flashcards;

Use UP and DOWN arrow keys to flip the card;

H to show hint;

A reads text to speech;

237 Cards in this Set

  • Front
  • Back
Case
Analyseenhet(er) i en undersøkesle (individer, familier, organisasjoner, land). Brukes spesielt i forskningsopplegg med få enheter, casestudier.
Design
En design eller et forskningsopplegg er en grov skisse til hvordan en konkret undersøkelse skal utformes.
Enheter (forskningsobjekter
De analyseenheter som studeres i en undersøkelse (individer, familier, organisasjoner, land).
Feltobservasjon:
Innsamling av data i felten ved hjelp av deltakende observasjon og andre datainnsamlingsteknikker.
Hypotese
En påstand som direkte eller indirekte gjelder saksforhold i virkeligheten.
Problemstilling (forskningsspørsmål)
Er utgangspunkt for vitenskapelige undersøkelser og kan formes som spørsmål eller som hypoteser.
Samtaleintervju
En liten standardisert og fleksibel intervjuteknikk som brukes i kvalitative opplegg.
Spørreundersøkelse (survey)
En systematisk og strukturert utspørring av et (stort) utvalg personer om et hvilket som helst tema.
Talldata (kvantitative data)
Data som registreres som tall, oftest fra vanitative datainnsamlingsteknikker.
Tekstdata (kvalitative data)
Data som registreres som tekst, oftes fra kvalitative datainnsamlingsteknikker.
Variablene
(analyse)enhetene (forskningsobjektene) beskrives ved hjelp av variabler. Hvis enhetene er mennesker, er kjønn, utdanning, yrke eksempler på variabler. Hver variabel har et sett verdier, for eksempel har kjønn verdiene mann og kvinne.
Avhengig variabel (Y)
Den variabelen vi vil forklare variasjonen i. I en årsaksanalyse er dette virksnings- eller effektvariabelen.
Deduksjon
(logistiske) slutninger fra en generell regel eller lovmessighet til enkeltilfeller.
Direkte effekter (i årsaksmodeller):
X påvirker Y direkte, i et diagram (X *pil til*Y).
Empirisk vitenskap (erfaringsvitenskap)
Bygger kunnskap og innsikt på grunnlag av observasjoner og testing av påstander om virkeligheten.
Falsifiserbarhet
En teori eller hypotese er falsifiserbar hvis det kan tenkes observasjonsutsagn som strider mot teorien.
Forklaringer
Gir svar på hvorfor-spørsmålene. Det viktigste typene er årsaksforklaringer og formålsforklaringer.
Formålsforklaringer (intensjonale forklaringer)
En handling forstås eller tolkes ved å knytte den til en hensikt, en intensjon, en plan, et prodjekt hos den handlede (aktøren).
Forskningsprogram (lakatos)
Har likheter med et paradigme, og består av en hard kjerne av grunnleggende ideer og prinsipper som det ikke stilles spørsmål ved, samt et beskyttende belte av hjelpeteori som kan endres. Normal vitenskap skjer innenfor et forskningsprogram.
Holisme
Holisme
Vil si å legge vekt på makrofenomener som sosiale systemer og samfunn.
Hypotetisk-deduktiv metode
En abstrakt vitenskapsmodell som bygger på prøving og feiling ved hjelp av både induksjon og deduksjon.
Ideografiske (singulære) utsagn (hypoteser)
Gjelder ett enkelt tilfelle, for eksempel en observasjon.
Indirekte effekter (I årsaksmodeller)
Indirekte effekter (I årsaksmodeller)
(X Z  Y). En effekt via en mellomliggende variabel.
Individualisme (metodologisk):
Individuelle aktører skaper samfunn og kollektiver gjennom handling og samhandlingen.
Induksjon:
(Logistiske) slutninger fra enkelttilfeller til en generell regel eller lovmessighet.
Intersubjektivitet:
Har flere betydninger. Intersubjektivitet i vitenskapsteori innebærer at vår forskning dokumenteres, slik at den i prinsippet skal kunne kontrolleres av andre.
Mellomliggende variabel (i årsaksmodeller):
(X  Z  Y). Z er her mellomliggende.
Objektivitet:
Verdifri i forskning. Brukes også videre i forstand om partsnøytralitet og intersubjektivitet.
Paradigme (KUHN):
Omfatter så vel teori som oppskrifter på metoder og teknikker i et felt eller et fag. Paradigme brukes også om skoleretninger innenfor fag. Normal vitenskapelig aktivitet består av forskning innenfor et paradigme.
Relativistisk kunnskapssyn:
Det finnes ingen allmenngyldige sannheter. Sannheter er relative i tid og rom.
Sosial konstruktivisme:
Omfatter både at den sosiale virkeligheten er konstruert, og at vitenskapelige data og funn også er skapt av mennesker, og derfor konstruert.
Spuriøs sammenheng (effekt):
En skinnsammenheng eller en tilsyndelatende årsakssammenheng mellom X og Y som skyldes en bakenforliggende variabel Z.
Teori: (vid betydning): Idé, forklaring. (snever betydning):
Byggverk av hypoteser av ulik generalitet. Teorier kan være helt generelle, eller de kan ha avgrenset gyldighet i tid og rom.
Teoretiske modeller:
Skjematiserte teoretiske resonnementer framstilt i et diagram.
Uavhengig variabel (X):
Forklaringsvariabel.
Universelle utsagn (hypoteser):
Har ubegrenset gyldighet i tid og rom.
Vitenskap:
Et fagområde som er gjenstand for systematisk forskning.
Vitenskapelige revolusjoner:
Et viktig trinn i Kuhns vitenskapsteori (previtenskap – normal vitenskap – krise – revolusjon – normalvitenskap) der et nytt paradigme fortrenger det dominerende paradigmet.
Årsaksforklaringer:
Består av en robust sammenheng mellom X og Y som kan forklares gjennom én eller flere årsaksmekanismer. En sammenheng er robust hvis årsaksrekkefølgen mellom X og Y er spesifisert og sammenhengen er kontrollert for andre relevante forklaringsvariabler.
Årsaksmodeller:
En framstilling i et diagram der årsaksrelasjonene mellom et sett variabler illustreres av piler.
Begrepsvaliditet:
Går på om en faktisk måler det en vil måle. Begreper benyttes der det er mulig for sammenblanding med andre former for validitet.
Definisjoner:
Teoretiske definisjoner er språklige avgrensninger av ett begrep i forhold til andre begreper. Operasjonelle definisjoner angir hvordan det teoretiske begrepet skal måles.
Måling:
Å knytte tall til egenskaper ved analyseenheter etter en regel, eller: Å knytte empiriske indikatorer til teoretiske begreper.
Måleprosessen:
Trinnene fra teoretisk definisjon av et begrep til et anvendbart mål som kan benyttes i analyser.
Operasjonalisering (måling):
Å knytte tall til egenskaper ved analyseenheter etter en regel, eller: Å knytte empiriske indikatorer til teoretiske begreper.
Talldata (kvantitative data):
Data som registreres som tall, oftest fra kvanitative datainnsamlingsteknikker.
Tekstdata (kvalitative data):
Data som registreres som tekst, oftes fra kvalitative datainnsamlingsteknikker.
Validitet:
Går på om en faktisk måler det en vil måle.
Variabelens målenivåer: .
avgjør hvor mye informasjon som ligger i tallkodene. Det er vanlig å skille mellom nominal-, ordinal-, intervall- og forholdstallsnivået
Besøksintervju:
Intervju som utføres ansikt til ansikt, oftest ved at intervjueren besøker respondenten.
Deltakende observatør:
Forskeren foretar åpen observasjon av et avgrenset felt.
Eksperiment (kontrollert forsøk):
Det klassiske opplegget for å undersøke årsakssammenhenger der forskeren eksponerer forsøkspersonene for en årsaksfaktor (X) for å studere effekten på utfallet (Y). I et ekte eksperiment kontrolleres det for andre variabler gjennom randomisering.
Feltobservasjon:
Innsamling av data i felten ved hjelp av deltakende observasjon og andre datainnsamlingsteknikker.
Flermetodedesign (triangulering):
bruk av flere metoder i en undersøkelse, for eksempel ved å kombinere spørreskjema (kvantitativ) og samtaleintervju (kvalitativ).
Fullstendig deltaker:
En rolle der forskeren foretar skjult observasjon fra sin posisjon som deltaker.
Fullstendig observatør:
En rolle der forskeren obeserverer utenfra.
Informanter:
De som blir spurt i samtaleintervju og feltsamtaler.
Innholdsanalyse:
Systematisk analyse av dokumenter og tekster. Innholdsanalyser kan være både kvalitative og kvantitative.
Intervju:
En samtale med et formål.
Komparativ design:
Sammenlikninger av to eller flere caser i rom eller tid, oftes land.
Langsgående (longitudinell) design:
Tidsdesign med målinger på minst to tidspunkter for hver analyseenhet.
Primærdata:
Alle typer data som er spesielt samlet inn for et prosjekt, oftes ved hjelp av intervjuer eller observasjon
Prospektiv design:
Tidsdesign der analyseenhetene følges framover i tid, for eksempel panelundersøkelser.
Randomisering (i eksperimentell design):
Tilfeldig fordeling av forsøkspersoner på eksperiment- og kontrollgruppe. Dette kontrollerer for andre variabler enn årsaksvariablene (X).
Respondenter (intervjuobjekter, intervjupersoner):
De som deltar i en spørreundersøkelse.
Retrospektiv design:
Tidsdesign der en registrerer data om fortiden.
Samtaleintervju:
En liten standardisert og fleksibel intervjuteknikk som brukes i kvalitative opplegg.
Sekundærdata:
Er alle typer foreliggende data.
Skjult observasjon:
Forskeren skjuler sin identitet for dem som observeres.
Spørreundersøkelse (survey):
En systematisk og strukturert utspørreing av et (stort) utvalg personer om et hvilket som helst tema.
Standardisering:
At datainnsamlingen skjer på samme måte for alle analyseenheter, for eksempel at alle respondenter får samme spørsmål stilt på samme måte i en undersøkelse.
Tidsdesign: Tverrsnittdesing og langsgående (longitudinell) design:
Forskningsopplegg etter tidsdimensjonen.
Tverrsnittundersøkelser:
Data som registreres bare én gang (på ett tidspunkt) for hver analyseenhet.
Åpen observasjon:
Forskeren opptrer åpent som observatør.
Analoge skalaer:
Spørsmål der holdningsobjekter blir vurdert etter en skala angitt på en linje. I intervjuer må skalaen presenteres på et kort.
Besøksintervju:
Intervju som utføres ansikt til ansikt, oftest ved at intervjueren besøker respondenten.
Capi (computer-assisted personal interviewing):
Besøksintervju der spørsmål leses opp fra en dataskjerm og svarene registreres direkte I datamaskinen.
Cati (computer-assisted telephone interviewing):
Telefonintervjuing der spørsmål leses opp fra en dataskjerm og svarene registreres direkte I datamaskinen.
Designeffekt:
Økningen i utvalgsfeil ved bruk av klyngeutvelgning.
Enkel tilfeldig trekkning (ett), (simple random sampling(SRS)):
Illustrerer det grunnleggende prinsipp i sannsynlighetsutvelging. Fra en populasjon på N enheter trekkes et utvalg på n enheter tilfeldig. Hver enhet har en sannsynlighet på n/N til å kommer med i utvalget. ETT krever en liste over populasjonen.
Flernivåutvalg:
Er egentlig et klyngeutvalg der klyngene blir betraktet som enheter på nivå 2, mens individer som trekkes i det andre trinnet, utgjør enhetene på nivå 1.
Fokusgrupper:
er fokuserte gruppesamtaler med en møteleder som definerer hva som skal diskuteres.
Frafall:
Forskjellen mellom det justerte bruttoutvalget og nettoutvalget.
Gjentatte tverrsnittundersøkelser:
(Spørre)undersøkelser over minst to tidspunkter med samme spørsmål. Skiller seg fra paneler ved at det ikke er de samme som intervjues.
Holdninger:
Positive, nøytrale eller negative vurderinger av holdningsobjekter, som kan være saker eller personer.
Intervjuereeffekten:
Feilkilder knyttet til intervjueren.
Klyngeutvelgning:
Skjer i to eller flere trinn. Først trekkes et utvalg av klynger eller primære utvalgsområder. Deretter trekkes et utvalg av enheter fra hver av disse klyngene ved enkel tilfeldig trekkning. Teknikken krever en liste over populasjonen i de primære utvalgsområdene.
Kvoteutvelgning (ikke-sannsynlighetsutvelgning):
Utvalget trekkes ved at kvoter oppfylles på en eller annen måte. Et enkelt eksempel på kvoter er at et utvalg på 200 skal bestå av 100 menn og 100 kvinner.
Likert-formatet:
Et format for svar på spørsmål basert på en gradvis vurderingsskala med 3-7.
Nettverksutvalg eller snøballutvalg:
Først trekkes et personutvalg. Utvalget spørres om sitt kontaktnett. Disse inkluderes så i utvalget i neste trinn. På denne måten kan en få et utvalg som bygger på sosiale nettverk.
Panelundersøkelse:
En spørreundersøkelse med to eller flere målinger i det samme utvalget.
Populasjon:
Den mengden enheter (personer, hushold, organisasjoner, land) en vil at undersøkelsen skal ha gyldighet for. Hvis populasjonen er stor, trekkes det gjerne utvalg til bruk i konkrete undersøkelser.
Rekkefølgeeffekter:
Feilkilder som har sin bakgrunn i rekkefølge av spørsmål eller av svaralternativer.
Representasjonsfeil:
Feilkilder knyttet til trekking av utvalget.
Representative utvalg:
Et utvalg er representativt med hensyn til for eksempel kjønn hvis det er like stor andel menn i utvalget som i populasjonen. Sannsynlighetsutvelging er den beste teknikken for å sikre representativitet på alle variabler.
Slumpmessig utvelging:
For eksempel velger de som står i en kinokø. Teknikken er enkel, men både definisjon av populasjon og representativitet knyttet til denne er problematisk.
Spørsmål:
Åpne spørsmål er uten faste svaralternativer; lukkede har faste svaralternativer.
Alternativ hypotese (H1) (statistiske tester):
Den hypotesen om populasjonen i en statistisk test som vi normalt ønsker å få stryket ved at dens rival, nullhypotesen, forkastes.
Datamatrise:
Kvantitative data lagres i en datamatrise (regneark) der enhetene utgjør linjene og variablene utgjør kolonnene. Datamatriser lagres elektronisk som datafiler i statistikkprogrammer som SPSS.
Datamatrise:
Kvantitative data lagres i en datamatrise (regneark) der enhetene utgjør linjene og variablene utgjør kolonnene. Datamatriser lagres elektronisk som datafiler i statistikkprogrammer som SPSS.
Estimator:
En statistisk størrelse i et utvalg som brukes til å estimere en tilsvarende parameter i populasjonen. Utvalgsgjennomsnittet er en estimator for populasjonsgjennomsnittet (µ).
Estimere:
Anslå en parameter i populasjonen ved hjelp av en estimator for utvalget.
Faktor:
I en faktoranalyse er en faktor en av de latente dimensjonene som kan ligge til grunn for en observert korrelasjonsmatrise. I en variasjonsanalyse er en faktor en uavhengig kategorivariabel.
Faktoranalyse:
en statistisk teknikk for å finne antall dimensjoner som ligger til grunn for en korrelasjonsmatrise.
Faktoranalyse:
en statistisk teknikk for å finne antall dimensjoner som ligger til grunn for en korrelasjonsmatrise.
Indeks: (vid betydning):
Sammensatte mål. (snever betudning): Sammensatt mål som bygger på årsaksindikatorer.
Kjikvadratet (X2):
Måler grad av avvik mellom en teoretisk modell og observerte data. Benyttes i kjikvadrattesten og til å beregne mål på statistisk sammenheng i bivariate krysstabeller.
Kjikvadratfordelingen:
Sannsynlighetsfordelingen for kjikvadratet (X2).
Kjikvadrattesten:
En statistisk test som benyttes for å teste hypoteser om statistisk sammenheng mellom to variabler i populasjonen basert på en krysstabell fra et utvalg. Testobservatoren er kjikvadratet (X2).
Kritisk verdi(er):
I statistiske tester avgrenser en eller to kritiske verdier forkastningsområder, dvs. hvilke verdier av testobservatoren som skal gi forkastning av nullhypotesen.
Konfidensintervall (95%):
Et intervall rundt den estimerte verdien av en parameter der vi med stor (95 %) sikkerhet kan si at den sanne verdien befinner seg.
Korrelasjon:
(vid betydning). Statistisk sammenheng mellom to variabler. (snever betydning): Pearsons korrelasjonsmål r.
Kovariater:
Betegner kontinuerlige uavhengige variabler i noen statistiske teknikker slik som variansanalyse.
Krysstabeller (contigency tables):
To- eller flerveis fordelinger av kategorivariabler. I det engelske begrepet ligger det at fordelingen av en av variablene (Y) sees som avhengig av én eller flere X-variabler.
Listevis utelating (liswise deletion):
Alle enheter som mangler data (informasjon) på minst en variabel i en analyse, blir utelukket fra denne.
Nullhypotese (H0) (statistiske tester):
En statistisk hypotese om populasjonen, som vi ofte ønsker å få forkastet til fordel for den alternative hypotesen (H). Den oppfattes som sann inntil den eventuelt blir forkastet i den statistiske testen.
Parameter:
En statistisk størrelse i populasjonen, slik som populasjonsgjennomsnittet. Betegnes med greske bokstaver.
Parametrisk statistikk:
Statistiske teknikker som er fokusert på parametrer i populasjonsfordelinger, og basert på forutsetninger om estimatorens fordeling.
Parametriske tester:
Statistiske tester der hypotesene går på parametrer i en populasjonsfordeling, slik som t-fordelingen for gjennomsnittstestene.
Regresjonsanalyse:
Er basert på at sammenhengen mellom en avhengig variabel Y og et sett uavhengige variabler (X), kan framstilles i forma v en lineær funksjon.
Sammensatte mål:
Mål som er basert på to eller flere indikatorer. To hovedtyper er skalaer og indekser.
Signifikansnivået (α):
I en statistisk test er signifikansnivået sannsynligheten for å forkaste en sann nullhypotese (type I-feil). Et vanlig valg av signifikansnivå er α = 0,05, eller 5 prosent.
Statistisk test:
En form for statistisk generalisering basert på at hypoteser om populasjonen prøves mot data fra et utvalg. Konklusjonen går på om nullhypotesen skal forkastes eller beholdes.
Statistisk sammenheng:
Omfatter alle former for samvariasjon og korrelasjon mellom to variabler.
Variansanalyse (anova):
En generalisering av t-testen for to utvalg som gjør det mulig å teste hypoteser om forskjeller mellom flere enn to gruppegjennomsnitt samtidig.
Boksdiagram (Box and whiskers plot):
Beskriver fordelingen av en kontinuerlig variabel. Diagrammet består av en boks som inneholder 50 prosent av fordelingen med medianen i midten. På toppen og bunn i boksen er det uteriggerne (whiskers) som markerer grensene mellom vanlig og uvanlige vardier i en fordeling.
Datamatrise:
Kvantitative data lagres i en datamatrise (regneark) der enhetene utgjør linjene og variablene utgjør kolonnene. Datamatriser lagres elektronisk som datafiler i statistikkprogrammer som SPSS.
Frekvensfordeling:
Frekvensfordeling til kategorivariabel er en ordnet liste over variabelens verdier (verdisettet) og de tilhørende frekvenser.
Gjennomsnitt:
Et mål på tyngdepunkt i fordelingen av en kontinuerlig variabel. Det er summen av alle verdiene i en fordeling dividert med antall enheter.
Histogram:
Likner nesten til forveksling på et stolpediagram, men stolpene ligger tett sammen for å markere at x-aksen er kontinuerlig. Prinsippet er at flatevidden i stolpene angir frekvensen eller prosenten i hvert intervall.
Høyreskjev fordeling:
En fordeling av en (kontinuerlig variabel) som har en hale til høyre (ved høye verdier)
Kakediagram (pie-chart):
Ser ut som en kake der stykkenes størrelse angir frekvensene til et sett verdier i en frekvensfordeling.
Kvartiler:
De tre variabelverdiene som splitter en rangert fordeling i fire like store mengder av enheter. Den første kvartilen, K1, har 25 prosent av fordelingene under seg, Den andre kvartilen, K2, er lik medianen, og den tredje kvartilen, K3, har 75 prosent av fordelingen under seg.
Median:
Et mål på tyngdepunkt for variabler som minst er på ordinalnivå. Medianen er den verdi som splitter en ordnet fordeling i to like store mengder enheter.
Modus:
Et mål på tyngdepunkt for nominalvariabler. Modus er den hyppigst forekommende verdien eller verdiklassen (kategori) i en fordeling.
Normalfordeling:
Alle normalfordelinger er symmetriske og klokkeformede og kan omgjøres til den standardiserte normalfordelingen ved hjelp av formelen for z-skårer. Den standardiserte normalfordelingen har et gjennomsnitt på 0 og et standardavvik på 1,0. Den benyttes i en del statistiske tester fordi flere testobservatorier er normalfordelte.
Posisjonsmål:
Viser en enhets relative posisjon i en variabels fordeling (kvartiler, prosentiler, Z-skårer).
Prosentiler:
De 99 variabelverdiene som splitter en ordnet fordeling i 100 like mengder av enheter. Prosentilen PK, er den variabelverdien som har k prosent av enhetene i en ragenrt fordeling under seg.
Standardavviket:
Et mål på spredning for kontinuerlige variabel. Det beregnes som kvadratroten til variansen.
Standardskårer (z-skårer):
Et posisjonsmål for kontinuerlige variabler. Z-skårer beregnes ved å trekke gjennomsnittet fra den originale variabelverdien og dividere med standardavviket.
Stolpediagram:
Beskriver en frekvensfordeling ved at hver verdi er representert ved like brede stolper. Høyden på stoplene angir frekvensen eller prosentene.
Total kvadratsum:
Teller i formelen for variansen som er lik summen av de kvadrerte avvikene fra gjennomsnittet for en variabel.
Variansen:
Et mål på spredning for kontinuerlige variabler. Det bygger på summen av de kvadrerte avvikene fra gjennomsnittet for alle enheter i et utvalg eller en populasjon.
Variasjonsbredden:
Et enkelt mål på spredning for ordinale og kontinuerlige variabler. Det beregnes som differansen mellom den høyeste og den laveste verdien i en fordeling.
Cramers V:
Et korrelasjonsmål beregnet på å måle statistisk sammenheng mellom to nominalvariabler i krysstabeller. Det er normering av kjikvadratet (X2).
Korrelasjon (vid betydning):
Statistisk sammenheng mellom to variabler (snever betydning): Pearsons korrelasjonsmål r.
Pearsons R:
Det mest kjente korrelasjonsmålet. Krever kontinuerlige variabler, men kan anvendes også i andre situasjoner.
FI(phi), ϕ:
Et spesialtilfelle av r som benyttes for å finne korrelasjon mellom to dikotome (0-1) variabler. Strengt tolket gjelder dette bare for naturlige dikotomier som kjønn. Sagt på en annen måte kan fi måle korrelasjonen i en krysstabell der begge variablene har to verdier.
Punkt-biseriell korrelasjonskoeffisient, rpb:
Benyttes når vi ønsker å finne korrelasjonen mellom en kontinuerlig variabel og en dikotom variabel (med verdiene 0 og 1).
Spearmans rho:
Måler rangkorrelasjon, det vil si korrelasjon mellom to ordinale variabler der de fleste analyseenhetene har unike ranger.
Tau-c:
Korrelasjonsmål beregnet på ordinale variabler, som også fungerer selv om det er sammenfallende rangert.
Alternativ hypotese (H1) (statistiske tester):
Den hypotesen om populasjonen i en statistisk test som vi normalt ønsker å få stryket ved at dens rival, nullhypotesen, forkastes.
Avhengig variabel (Y):
Den variabelen vi vil forklare variasjonen i. I en årsaksanalyse er dette virksnings- eller effektvariabelen.
Forventede frekvenser (E):
Bergenede frekvenser fra en teoretisk modell som innebærer at det ikke er sammenheng (statistisk avhengighet) mellom de to variablene i en krysstabell. E inngår i formelen for kjikvadratet.
Frihetsgrader (DF):
Kjikvadrat-, t- og F-fordelingene varierer alle etter antall frihetsgrader.
Kjikvadratet (X2):
Måler grad av avvik mellom en teoretisk modell og observerte data. Benyttes i kjikvadrattesten og til å beregne mål på statistisk sammenheng i bivariate krysstabeller.
Kjikvadratfordelingen:
Sannsynlighetsfordelingen for kjikvadratet (X2).
Kjikvadrattesten:
En statistisk test som benyttes for å teste hypoteser om statistisk sammenheng mellom to variabler i populasjonen basert på en krysstabell fra et utvalg. Testobservatoren er kjikvadratet (X2).
Krysstabeller (contigency tables):
To- eller flerveis fordelinger av kategorivariabler. I det engelske begrepet ligger det at fordelingen av en av variablene (Y) sees som avhengig av én eller flere X-variabler.
Loglinære analyse (modeller):
Er en generalisering av kjikvadrattesten til flere uavhnegige variabler, som også bygger på frekvenser i krysstabeller.
Missing values:
Gjelder for enheter som er med i datamatrisen, men som mangler verdier på minst en variabel. Store mengder manglende data skaper problemer i dataanalysen.
Marginalfordeling (i krysstabeller):
De to fordelingene langs margene i en toveis (bivariat) krysstabell er univariate fordelinger av de to variablene som inngår i tabellen.
Multivariant analyse: (vid betydning): variabler.
Statistiske analyser med en Y og flere enn to X-variabler. (Snever betydning): Statistiske analyser med minst to Y-
Nullhypotese (H0) (statistiske tester):
En statistisk hypotese om populasjonen, som vi ofte ønsker å få forkastet til fordel for den alternative hypotesen (H). Den oppfattes som sann inntil den eventuelt blir forkastet i den statistiske testen.
Observerte frekvenser (O):
De observerte frekvensene i en krysstabell mellom to variabler. O inngår i formelen for kjikvadratet.
Prosentueringsregel (krysstabeller):
Tabellen skal prosentueres med basis i de uavhengige variablene.
Samspill (statistisk interaksjon):
Effekten av én X-variabel er betinget av en annen, for eksempel at effekten av utdanning på timelønn er sterkere for menn enn for kvinner (betinget av kjønn).
Signifikansnivået (α):
I en statistisk test er signifikansnivået sannsynligheten for å forkaste en sann nullhypotese (type I-feil). Et vanlig valg av signifikansnivå er α = 0,05, eller 5 prosent.
Signifikanssannynlighet (P-verdien i en statistisk test):
Sannsynligheten for å få en minst like stor testobservator som den observerte, gitt at nullhypotesen er sann.
Statistisk sammenheng:
Omfatter alle former for samvariasjon og korrelasjon mellom to variabler.
Statistisk signifikans:
Et statistisk signifikant utfall av en test vil si at nullhypotesen (H0) må forkastes. I moderne varianter betyr statistisk signifikans at for eksmepl en korrelasjon har en signifikanssannsynlighet (p-verdi) som er mindre eller lik signifikansnivået, oftest 0,05.
Statistisk test:
En form for statistisk generalisering basert på at hypoteser om populasjonen prøves mot data fra et utvalg. Konklusjonen går på om nullhypotesen skal forkastes eller beholdes.
Statistisk uavhengighet (krysstabeller):
Hvis de prosentuerte betingede fordelingene er like og lik marginalfordelingen, er de to variablene i en toveis (bivariat) tabell statistisk uavhengige. Hvis fordelingene er ulike, er det statistisk avhengighet eller statistisk sammenheng (korrelasjon) mellom variablene.
Testobservator (statistisk test):
Statistisk størrelse med en kjent sannsynlighetsfordeling. Beregnet for et utvalg og benyttes til å avgjøre utfallet av en statistisk test.
Teststyrken:
Sannsynligheten for å forkaste en falsk nullhypotese, gitt alternative verdier av den parameter som testes.
Type I-feil:
Består i å forkaste en sann hypotese i en statistisk test. Sannsynligheten for type I-feil er lik signifikansnivået.
Type II-feil:
Består i å unnlate å forkaste en falsk nullhypotese i en statistisk test. Teststyrken er definert som 1- β (beta).
Uavhengig variabel (X):
Forklaringsvariabel.
Cronbachs alfa (α):
Måler intern konsistens og er det mest benyttede målet på reliabilitet.
Effektindikatorer:
Indikatorer som danner en skala.
Enighetssyndromet:
Eller «Ja»-effekten, er tendensen til å si seg enig i ethvert spørsmål.
Faktoranalyse:
en statistisk teknikk for å finne antall dimensjoner som ligger til grunn for en korrelasjonsmatrise.
Indeks: (vid betydning):
Sammensatte mål. (snever betydning): Sammensatt mål som bygger på årsaksindikatorer.
Intern konsistens:
En type reliabilitet som oftest måles med Combach alfa.
Klassisk testteori:
Det tidligste måleteoretiske grunnlaget for psykologiske tester.
Psykometri:
Hjelpevitenskap knyttet til måling av psykologiske egenskaper, utvikling av psyologiske tester og andre sammensatte mål.
Sammensatte mål:
Mål som er basert på to eller flere indikatorer. To hovedtyper er skalaer og indekser.
Skala:
Et sammensatt mål som bygger på effektindikatorer.
Summert vurderingsskala:
Skala som er laget som en sum (eller gjennomsnitt) av tallkoder som representerer svaralternativer på et sett spørsmål som er ment å måle en latent variabel.
Sosial ønskelighet (intervjuundersøkelser):
Tendensen til å dreie svarene i retning av sosialt akseptable svar.
Splitt- i-to-reliabilitet:
Baseres på korrelasjon mellom to skalaer som dannes ved å splitte et sett indikatorer som er ment å måle en latent variabel i to.
Test-retest-reliabilitet:
Reliablitet som måles med korrelasjonen mellom en variabel målt på to tidspunkter med kort mellomrom.
Årsaksindikatorer:
Indikatorer som danner en indeks (snever betydning).
Alternativ hypotese (H1) (statistiske tester):
Den hypotesen om populasjonen i en statistisk test som vi normalt ønsker å få stryket ved at dens rival, nullhypotesen, forkastes.
Ensidig test:
Statistisk test der nullhypotesen forkastes enten ved høye eller lave verdier av testobservatoren.
Estimator:
En statistisk størrelse i et utvalg som brukes til å estimere en tilsvarende parameter i populasjonen. Utvalgsgjennomsnittet er en estimator for populasjonsgjennomsnittet (µ).
Estimere:
Anslå en parameter i populasjonen ved hjelp av en estimator for utvalget.
Konfidensintervall (95%):
Et intervall rundt den estimerte verdien av en parameter der vi med stor (95 %) sikkerhet kan si at den sanne verdien befinner seg.
Nullhypotese (H0) (statistiske tester):
En statistisk hypotese om populasjonen, som vi ofte ønsker å få forkastet til fordel for den alternative hypotesen (H). Den oppfattes som sann inntil den eventuelt blir forkastet i den statistiske testen.
Populasjonsfordeling:
En sannsynlighetsfordeling, som for en kategorivariabel består av variabelens verdisett og tilhører sannsynligheter.
Post-hoc-tester:
I variansanalysen benyttes post-hoc-tester til å finne hvilke av K grupper som har ulike gjennomsnitt på en variabel. Teknikker for flergruppesammenlikning benyttes for å holde et samlet signifikansnivå på for eksempel 0,05 selv om en utførte tester mellom alle par av grupper i det samme utvalget.
Samplingsfordeling:
En teoretisk sannsynlighetsfordeling for en statistisk størrelse som utvalgsgjennomsnittet.
Sentralgrenseteoremet:
Innebærer at samplingsfordelingen til utvalgsgjennomsnittet vil nærme seg en normalfordeling når utvalgsstørrelsen n øker.
Signifikansnivået (α):
I en statistisk test er signifikansnivået sannsynligheten for å forkaste en sann nullhypotese (type I-feil). Et vanlig valg av signifikansnivå er α = 0,05, eller 5 prosent.
Signifikanssannynlighet (P-verdien i en statistisk test):
Sannsynligheten for å få en minst like stor testobservator som den observerte, gitt at nullhypotesen er sann.
Standardfeil (standard error):
Standardavviket til en statistisk størrelse. Beskriver spredningen i en samplingsfordeling, for eksempel gjennomsnittets standardavvik.
Statistiske hypoteser:
Nullhypotesen (H0) og den alternative hypotesen (H1) i en statistisk test.
Statistisk test:
En form for statistisk generalisering basert på at hypoteser om populasjonen prøves mot data fra et utvalg. Konklusjonen går på om nullhypotesen skal forkastes eller beholdes.
T-fordelingen:
En symmetrisk statistisk sannsynlighetsfordeling som har nært slektskap med normalfordelingen, men er litt flatere i små utvalg. I store utvalg er den identisk med normalfordelingen.
T-testen (for gjennomsnitt):
Finnes i en rekke varianter for ett og to utvalg. I to-utvalgstester testes forskjellen mellom to gjennomsnitt, for eksempel i timelønn mellom menn og kvinner.
Tosidig test:
Statistisk test der nullhypotesen forkastes både ved høye og lave verdier av testobservatoren.
Utvalgsfordelinger:
Frekvensfordelinger i et utvalg, som for en kategorivariabel består av variabelens verdisett og de tilhørende frekvenser.
Variansanalyse (anova):
En generalisering av t-testen for to utvalg som gjør det mulig å teste hypoteser om forskjeller mellom flere enn to gruppegjennomsnitt samtidig.
Additivitet:
Forutsetningen om at effektene av her enkelt variabel i en multippel regresjon kan beskrives hver for seg. Dette vil si at det ikke er samspill. (statistisk interaksjon) mellom X-variablene.
Bivariant regresjon (enkel regresjon):
Regresjon med bare én Y- og én X-variabel.
Dummy-variabel:
Har to verdier, 0 og 1. Kan brukes til å representere kategorivariabeler slik som kjønn i regresjonsanalyser
Konfidensintervall (95%):
Et intervall rundt den estimerte verdien av en parameter der vi med stor (95 %) sikkerhet kan si at den sanne verdien befinner seg.
Lineær funksjon:
Y = b0 + b1 X. Funksjonen beskriver en rett linje i et diagram.
Minste kvadraters metode (OLS):
En teknikk for å estimere regresjonskoeffisientene basert på å finne verdiene av regresjonskonstanten (b0) og regresjonskoeffisinten (b1) som gjør summen av de kvadrerte residualene minst mulig.
Multippel korrelasjon:
Den multiple korrelasjonskoeffisienten (R2) beskriver modellens samlende forklaringskraft. Den er variansen i Y som forklares av modellen over total varians i Y: R2 = SSM/SST
Multippel regresjon:
Regresjon med én Y- og minst to X-variabler.
Regresjonsanalyse:
Er basert på at sammenhengen mellom en avhengig variabel Y og et sett uavhengige variabler (X), kan framstilles i forma v en lineær funksjon.
Regresjonskoeffisienten (b1):
Viser endringer i Y når x endres med en måleenhet, kontrollert for de andre variablene i modellen.
Regresjonskonstanten (b0):
Er predikert verdi når x-variablene settes til null.
Residual(ledd):
I en regresjonslikning er residualen forskjellen mellom observert og predikert verdi av Y, eller mer presist (bivariant regresjon): ei = Yi – (b0+b1Xi).
Samspill (statistisk interaksjon):
Effekten av én X-variabel er betinget av en annen, for eksempel at effekten av utdanning på timelønn er sterkere for menn enn for kvinner (betinget av kjønn).
Signifikanssannynlighet (P-verdien i en statistisk test):
Sannsynligheten for å få en minst like stor testobservator som den observerte, gitt at nullhypotesen er sann.
Ekstremverdier:
Enheter som har verdier på én eller flere variabler som skiller seg sterkt fra resten av fordelingen. Slike enheter kan påvirke regresjonen i uønsket grad.
Homoskedastisitet (lik varians):
En forutsetning i regresjonsanalysen som innebærer at spredningen i residualene skal være de samme for alle x-verdier.
Kurvelinearitet:
En bøyet regresjonslinje som kan framstilles ved hjelp av andregradsledd.
Logistisk regresjon:
regresjon basert på en logit-transformasjon av Y. Koeffisientene kan ikke estimeres med minste kvadrerts metode.
Logit:
Logiten (L) er den naturlige logaritmen av oddsen. L = ln [P/(1-P)].
Multikolinearitet:
Går på sterk lineær sammenheng mellom x-variabler. For sterk multikolinearitet bryter med forutsetningene for regresjonsanalysen.
Odds:
O = P/(1-P), der P er P(Y=1) og 1-P er P(Y=0).
Oddsration:
OR = O1/O2 er forholdet mellom odds.
Stianalyse (stimodell):
Modellbygging ved hjelp av et sett likninger som her kan estimeres ved hjelp av multippel regresjon.
Stikoeffisient:
Stianalyser er oftest basert på standardiserte regresjonskoeffisenter.