Use LEFT and RIGHT arrow keys to navigate between flashcards;
Use UP and DOWN arrow keys to flip the card;
H to show hint;
A reads text to speech;
50 Cards in this Set
- Front
- Back
Is statistiek objectief? |
Niet altijd... |
|
Wat houdt statistiek in? |
Dataverzameling, bewerkingen op data en hoe de data te analyseren (de wetenschap erachter) |
|
Waarom wordt statistiek gebruikt? |
1. Beschrijven 2. Verklaren 3. Voorspellen Wordt enkel gebruikt als we te maken hebben met onvoorspelbare elementen |
|
Wat is data? |
Informatie- eenheden verkregen via observatie (meten) |
|
Wat is een constante? |
Als het geobserveerd kenmerk slechts 1 waarde aanneemt |
|
Wat is 'meten'? |
Observeren, info uitpuren en opslaan |
|
Welke 2meetniveaus van variabelen zijn er en leg uit |
Kwantitatief: cijfers met betekenis Kwalitatief: nummers zonder betekenis of in woorden categoriseren (categorisch) |
|
Welke 2 vormen van kwalitatieve variabelen ken je en leg uit |
1. Ordinale variabele; categorieën met ordening (bv beoordelingsschaal, aantal sterren resto) 2. Nominale variabele; categorieën zonder ordening (vb geslacht, woonplaats) |
|
Welke kwantitatieve variabelen ken je en leg uit |
Dit is numeriek 1. Variabelen met ratioschaal; hebben een avsoluut nulpunt (bv leeftijd, gewicht) 2. Variabelen met intervalschaal; geen absoluut nulpunt (bv temperatuur) |
|
Hoe bepaal je het meetniveau van een variabele? |
1. Is er sprake van totale orde? (Is er rangorde) 2. Is er sprake van een meeteenheid? (Verschillen zelfde intensiteit) 3. Is er sprake van een absoluut nulpunt? (Ontbreken van kenmerk =0) |
|
Geef de tabel om het meetniveau van een variabele te bepalen |
|
|
Wat is het verschil tussen discrete en continue variabelen? |
Uit continue variabelen kan je tussen 2 verschillende meetpunten een waarde vinden (bv lengte, verschillen in meetpunten blijven hetzelfde) Bij discrete variabelen kan dit niet |
|
In r wordt numeric enfactor gebruikt voor welke meetniveaus? |
Numeric: Interval en ratio Factor: Nominaal en ordinaal |
|
Wat is het verschil tussen discrete en continue variabelen? |
|
|
Wat is een datamatrix? |
Een tabel waarbij we kolommen van variabelen hebben. Dan wordt er per rij een case (respondent) gemaakt |
|
Welke objecten kennen we in R gelinkt aan data en databeheer? |
-Dat data(vectoren) numeriek of categorisch zijn -dat parallelvectoren in dataframes worden gegoten |
|
Wat is een vector? |
Een kolom met verschillende waarden in (variabelen) |
|
Welke vormen van vectoren kennen we in r?(3) |
1. Cijfers als gegevens Leeftijd<-c(2, 6, 15) 2. Letters als gegevens Voornaam<-c("Jan", "Piet") 3. Logische waarde als gegevens (waarde waar of niet waar) Werkstudent<-c(T, F, F, T) |
|
Welke functie in R gebruiken we om een variabele aan te maken? |
Leeftijd<-c(2,25,4,6) |
|
Waarvoor gebruiken we de functie seq() |
Om een rij van cijfers te laten opvullen Bvb idnummer ID<-seq(1,5) WE KUNNEN HET OOK ALS (A,B,C) OPBOUWEN, waarbij a laagste is, b hoogste, en c stapgrootte |
|
Waarvoor gebruiken we in R de functie rep()? |
Replicate staat voor herhalingen Bvb Landcode<- c(rep(1,3), rep(2,2)) 1 1 1 2 2 Landnaam<-rep(c('Vla','Ned'), c(3,2)) Vla vla vla ned ned |
|
Hoe maak je een dataframe/databestand (datamatrix bevat) in r? |
Data.frame(alle vectoren) Of specifieker Naam<-data.frame(id, leeftijd) |
|
Welke functie gebruik je om iets in een dataftame aan te passen? |
fix(Studenten) |
|
Attach/detach in r??? P.63/64 |
... |
|
Wat is de absolute frequentie? |
Het aantal keer dat een bepaalde meetwaarde of score voorkomt Ni=... N staat voor number i staat voor Welke waarde in de geordende rij ... is het aantal keren dat het voorkomt |
|
Wat versta je onder de relatieve frequentie? |
Absolute frequentie uitgedrukt in percentage |
|
Waarvoor wordt een histogram gebruikt? |
Voor de gegevens uit een frequentietabel van een variabele van interval or ratio Wanneer alle meetwaarden op de x as mogelijk zijn |
|
Hoe wissel je in een histogram naar de relatieve frequenties? |
In een histogram worden automatisch de absolute frequenties gebruikt, voor relatieve moet je toevoegen aan commando: freq=FALSE |
|
Wat zijn de grafische voorstellingen voor categorische variabelen? |
Cat=factor=nominaal of ordinaal Staafdiagram Taartpuntdiagram Puntendiagram |
|
Wat is een parameter of kengetal? |
Een cijfer dat op zich een samenvatting geeft van de verschillende waarnemingen -> adhv 1 cijfer vat je bepaalde eigenschappen van de variabelen samen |
|
Geef 2 synoniemen voor de parameters van ligging |
Centrale tendentiematen Centrummaten |
|
Wat is een modus? |
Hoort bij parameter van ligging De ligging van een nominale variabele =de categorie die het meeste voorkomt in de waarnemingen |
|
Wat is het verschil tussen multimodaal en unimodaal? (Modus) |
Multimodaal wil zeggen dat er meerdere categorieën het meest voorkomen Unimodaal wil zeggen als er maar 1 modus is |
|
Wat is een mediaan? |
Wordt gebruikt bij ordinale variabelen =de waarde van de variabele waarvoor we de geordende antwoorden in 2 gelijke groepen kunnen verdelen |
|
Wat is het gemiddelde? |
Wordt enkel gebruikt voor intervalvatiabelen Ltl zoals rekenkundig gemiddelde De waarde die we verkrijgen als we alle waargenomen meetwaarden voor een variabele optellen en dan delen door het aantal waarnemingen |
|
Welke andere kengetallen worden ook gebruikt voor ordinale variabelen? |
Kwartielen; in 4 gelijke delen verdeeld (Berekening k1 k2 en k3) Decielen; in 10 Percentielen; in 100 |
|
wat houdt spreiding in? |
Het in kaart brengen van de grootte van de verschillen in de geobserveerde meetwaarden Ordinaal of hoger meetniveau |
|
Wat houdt de reikwijdte/variatiebreedte in? |
Het versvhil tuusen de grootste en de kleinste waargenomen meetwaarde V= max(x) -min(x) Zinvol bij interval en ratio |
|
Wat en waarvoor dient de interkwattielafstand |
Niet gevoelig voor uitschieters Gaan kijken naar verschil K1 enK3 om zo beter beeld te krijgen van de spreiding |
|
Wat houdt de gemiddelde absolute afwijking in? |
De absolute waarde nemen van de afstand tot het rekenkundig gemiddelde |
|
Wat houdt de variantie in? |
Het kwadraat van de afstand tot het gemiddelde Rekening houden, uitkomst is altijd ^2 |
|
Wat houdt de standaardafwijking in? |
Dit is een herleiding van de variantie terug naar de spreidingsmaat in de oorspronkelijke maateenheid Vierkantswortel van de variantie |
|
Boxplot uitleggen +mee kunnen rekenen |
.... |
|
Wat zijn de parameters van vorm? |
Scheefheid en kurtosis |
|
Wat versta je onder de de scheefheid binnen een variabele van een histogram |
Een variabele kan: -rechts scheef verdeeld zijn, dan is de mediaan kleiner dan het gemiddelde en komen we bij skewness op een negatief getal -symmetrisch verdeeld, de mediaan = het gemiddelde en de scheefheid =0 -links scheef verdeeld, de mediaan is groter dan het gemiddelde, skewness positief |
|
Wat kan je vertellen over de platheid (kurtosis) van een variabele in een histogram? |
-bepaalt de platheid -platykurtisch=plat en kurtosis is kleiner dan 3 -mesokurtisch= als waarde 3 is -leptokurtisch= gepiekt en de kurtosis is groter dan 3 |
|
Wat is de definitie van een normaalverdeling? |
Een normale verdeling is symmetrisch, unimodaal en klokvormig =een theoretische kansverdeling (zie aparte vraag) |
|
Wat is een theoretische kansverdeling?(normaalverdeling) |
Verdeling van de kan dat een bepaalde waarde in een variabele voorkomt =kansverdeling die gebaseerd is op oneindig veel denkbeeldige kansexperimenten, w meestal samengevat in een wiskundige formule of procedure. |
|
Wat is een empirische kansverdeling? |
Is gebaseerd op de concrete frequentieverdeling van een variabele, relatieve frequenties bepalen Som van alle kansen in kansverdeling= 1 |
|
Waarom is de normaalverdeling belangrijk? |
1. Het is een goed model voor de verdeling van werkelijke data 2. De meerderheid van de statistische technieken die we in inferentiële statistiek zullen hanteren gaan uit van de veronderstelling dat d3 variabelen waarop we ze willen toepassen normaal verdeeld zijn |