• Shuffle
    Toggle On
    Toggle Off
  • Alphabetize
    Toggle On
    Toggle Off
  • Front First
    Toggle On
    Toggle Off
  • Both Sides
    Toggle On
    Toggle Off
  • Read
    Toggle On
    Toggle Off
Reading...
Front

Card Range To Study

through

image

Play button

image

Play button

image

Progress

1/50

Click to flip

Use LEFT and RIGHT arrow keys to navigate between flashcards;

Use UP and DOWN arrow keys to flip the card;

H to show hint;

A reads text to speech;

50 Cards in this Set

  • Front
  • Back

Is statistiek objectief?

Niet altijd...

Wat houdt statistiek in?

Dataverzameling, bewerkingen op data en hoe de data te analyseren (de wetenschap erachter)

Waarom wordt statistiek gebruikt?

1. Beschrijven


2. Verklaren


3. Voorspellen


Wordt enkel gebruikt als we te maken hebben met onvoorspelbare elementen

Wat is data?

Informatie- eenheden verkregen via observatie (meten)

Wat is een constante?

Als het geobserveerd kenmerk slechts 1 waarde aanneemt

Wat is 'meten'?

Observeren, info uitpuren en opslaan

Welke 2meetniveaus van variabelen zijn er en leg uit

Kwantitatief: cijfers met betekenis


Kwalitatief: nummers zonder betekenis of in woorden categoriseren (categorisch)

Welke 2 vormen van kwalitatieve variabelen ken je en leg uit

1. Ordinale variabele; categorieën met ordening (bv beoordelingsschaal, aantal sterren resto)


2. Nominale variabele; categorieën zonder ordening (vb geslacht, woonplaats)

Welke kwantitatieve variabelen ken je en leg uit

Dit is numeriek


1. Variabelen met ratioschaal; hebben een avsoluut nulpunt (bv leeftijd, gewicht)


2. Variabelen met intervalschaal; geen absoluut nulpunt (bv temperatuur)

Hoe bepaal je het meetniveau van een variabele?

1. Is er sprake van totale orde?


(Is er rangorde)


2. Is er sprake van een meeteenheid?


(Verschillen zelfde intensiteit)


3. Is er sprake van een absoluut nulpunt?


(Ontbreken van kenmerk =0)

Geef de tabel om het meetniveau van een variabele te bepalen

Wat is het verschil tussen discrete en continue variabelen?

Uit continue variabelen kan je tussen 2 verschillende meetpunten een waarde vinden (bv lengte, verschillen in meetpunten blijven hetzelfde)


Bij discrete variabelen kan dit niet

In r wordt numeric enfactor gebruikt voor welke meetniveaus?

Numeric:


Interval en ratio


Factor:


Nominaal en ordinaal

Wat is het verschil tussen discrete en continue variabelen?

Wat is een datamatrix?

Een tabel waarbij we kolommen van variabelen hebben. Dan wordt er per rij een case (respondent) gemaakt

Welke objecten kennen we in R gelinkt aan data en databeheer?

-Dat data(vectoren) numeriek of categorisch zijn


-dat parallelvectoren in dataframes worden gegoten

Wat is een vector?

Een kolom met verschillende waarden in (variabelen)

Welke vormen van vectoren kennen we in r?(3)

1. Cijfers als gegevens


Leeftijd<-c(2, 6, 15)


2. Letters als gegevens


Voornaam<-c("Jan", "Piet")


3. Logische waarde als gegevens (waarde waar of niet waar)


Werkstudent<-c(T, F, F, T)

Welke functie in R gebruiken we om een variabele aan te maken?

Leeftijd<-c(2,25,4,6)

Waarvoor gebruiken we de functie seq()

Om een rij van cijfers te laten opvullen


Bvb idnummer


ID<-seq(1,5)


WE KUNNEN HET OOK ALS (A,B,C) OPBOUWEN, waarbij a laagste is, b hoogste, en c stapgrootte

Waarvoor gebruiken we in R de functie rep()?

Replicate staat voor herhalingen


Bvb


Landcode<- c(rep(1,3), rep(2,2))


1 1 1 2 2


Landnaam<-rep(c('Vla','Ned'), c(3,2))


Vla vla vla ned ned

Hoe maak je een dataframe/databestand (datamatrix bevat) in r?

Data.frame(alle vectoren)



Of specifieker


Naam<-data.frame(id, leeftijd)

Welke functie gebruik je om iets in een dataftame aan te passen?

fix(Studenten)

Attach/detach in r??? P.63/64

...

Wat is de absolute frequentie?

Het aantal keer dat een bepaalde meetwaarde of score voorkomt


Ni=...


N staat voor number


i staat voor Welke waarde in de geordende rij


... is het aantal keren dat het voorkomt


Wat versta je onder de relatieve frequentie?

Absolute frequentie uitgedrukt in percentage

Waarvoor wordt een histogram gebruikt?

Voor de gegevens uit een frequentietabel van een variabele van interval or ratio


Wanneer alle meetwaarden op de x as mogelijk zijn

Hoe wissel je in een histogram naar de relatieve frequenties?

In een histogram worden automatisch de absolute frequenties gebruikt, voor relatieve moet je toevoegen aan commando:


freq=FALSE

Wat zijn de grafische voorstellingen voor categorische variabelen?

Cat=factor=nominaal of ordinaal


Staafdiagram


Taartpuntdiagram


Puntendiagram

Wat is een parameter of kengetal?

Een cijfer dat op zich een samenvatting geeft van de verschillende waarnemingen


-> adhv 1 cijfer vat je bepaalde eigenschappen van de variabelen samen

Geef 2 synoniemen voor de parameters van ligging

Centrale tendentiematen


Centrummaten

Wat is een modus?

Hoort bij parameter van ligging


De ligging van een nominale variabele


=de categorie die het meeste voorkomt in de waarnemingen

Wat is het verschil tussen multimodaal en unimodaal? (Modus)

Multimodaal wil zeggen dat er meerdere categorieën het meest voorkomen


Unimodaal wil zeggen als er maar 1 modus is

Wat is een mediaan?

Wordt gebruikt bij ordinale variabelen


=de waarde van de variabele waarvoor we de geordende antwoorden in 2 gelijke groepen kunnen verdelen

Wat is het gemiddelde?


Wordt enkel gebruikt voor intervalvatiabelen


Ltl zoals rekenkundig gemiddelde



De waarde die we verkrijgen als we alle waargenomen meetwaarden voor een variabele optellen en dan delen door het aantal waarnemingen

Welke andere kengetallen worden ook gebruikt voor ordinale variabelen?

Kwartielen; in 4 gelijke delen verdeeld


(Berekening k1 k2 en k3)


Decielen; in 10


Percentielen; in 100

wat houdt spreiding in?

Het in kaart brengen van de grootte van de verschillen in de geobserveerde meetwaarden


Ordinaal of hoger meetniveau

Wat houdt de reikwijdte/variatiebreedte in?

Het versvhil tuusen de grootste en de kleinste waargenomen meetwaarde


V= max(x) -min(x)


Zinvol bij interval en ratio

Wat en waarvoor dient de interkwattielafstand

Niet gevoelig voor uitschieters


Gaan kijken naar verschil K1 enK3 om zo beter beeld te krijgen van de spreiding

Wat houdt de gemiddelde absolute afwijking in?

De absolute waarde nemen van de afstand tot het rekenkundig gemiddelde

Wat houdt de variantie in?

Het kwadraat van de afstand tot het gemiddelde



Rekening houden, uitkomst is altijd ^2

Wat houdt de standaardafwijking in?

Dit is een herleiding van de variantie terug naar de spreidingsmaat in de oorspronkelijke maateenheid



Vierkantswortel van de variantie

Boxplot uitleggen +mee kunnen rekenen

....

Wat zijn de parameters van vorm?

Scheefheid en kurtosis

Wat versta je onder de de scheefheid binnen een variabele van een histogram

Een variabele kan:


-rechts scheef verdeeld zijn, dan is de mediaan kleiner dan het gemiddelde en komen we bij skewness op een negatief getal


-symmetrisch verdeeld, de mediaan = het gemiddelde en de scheefheid =0


-links scheef verdeeld, de mediaan is groter dan het gemiddelde, skewness positief

Wat kan je vertellen over de platheid (kurtosis) van een variabele in een histogram?

-bepaalt de platheid


-platykurtisch=plat en kurtosis is kleiner dan 3


-mesokurtisch= als waarde 3 is


-leptokurtisch= gepiekt en de kurtosis is groter dan 3

Wat is de definitie van een normaalverdeling?

Een normale verdeling is symmetrisch, unimodaal en klokvormig


=een theoretische kansverdeling (zie aparte vraag)

Wat is een theoretische kansverdeling?(normaalverdeling)

Verdeling van de kan dat een bepaalde waarde in een variabele voorkomt


=kansverdeling die gebaseerd is op oneindig veel denkbeeldige kansexperimenten, w meestal samengevat in een wiskundige formule of procedure.

Wat is een empirische kansverdeling?

Is gebaseerd op de concrete frequentieverdeling van een variabele, relatieve frequenties bepalen


Som van alle kansen in kansverdeling= 1

Waarom is de normaalverdeling belangrijk?

1. Het is een goed model voor de verdeling van werkelijke data


2. De meerderheid van de statistische technieken die we in inferentiële statistiek zullen hanteren gaan uit van de veronderstelling dat d3 variabelen waarop we ze willen toepassen normaal verdeeld zijn