Afhankelijk van het meetniveau van een variabele, kan van elke variabele iets gezegd worden over het centrum en eventueel de spreiding. De mogelijke centrummaten zijn de modus, de mediaan en het (rekenkundig) gemiddelde. Naast centrummaten zijn er ook zogenoemde spreidingsmaten. Allereerst zullen de drie centrummaten worden toegelicht met kort wat informatie over bijbehorende centrummaten.
Modus
De modus is niets meer dan het meest voorkomende getal of waarneming. Deze centrummaat is vooral relevant voor variabelen van het nominale meetniveau zoals merken van een bepaald product. De uitspraak over het meeste verkochte type bestelbus in 2011 is bijvoorbeeld één die gaat over de modus.
Mediaan
De mediaan is het middelste getal. Dit betekent dat wanneer alle getallen op volgorde van laag naar hoog worden gezet de mediaan het getal in het midden is. Bij een oneven aantal waarnemingen is de mediaan dus precies het middelste getal. Bij een even aantal waarnemingen is de mediaan het gemiddelde van de omliggende getallen. De mediaan is altijd de waarneming op positie (n + 1) / 2. Met deze formule kom je bij een even aantal getallen van bijvoorbeeld 20, dus uit op de positie 10,5. Dit betekent dat de mediaan het gemiddelde van het tiende en het elfde getal is. Een veelgebruikte bijbehorende spreidingsmaat is de vijf-getallen-samenvatting. Wanneer deze getallen grafisch worden weergegeven, vormt zich een boxplot. Op de volgende pagina is meer te lezen over de boxplot.
Gemiddelde
Dit is de centrummaat die het meest gebruikt wordt. Dit komt omdat deze centrummaat hoort bij variabelen van het meetniveau interval of ratio, waar veel variabelen als inkomen, lengte en gewicht onder vallen. Het gemiddelde wordt berekend door alle waardes bij elkaar op te tellen en te delen door het aantal waarden. De bijbehorende formule is: x̄ = 1⁄n • Σxi De spreidingsmaat die veel gebruikt wordt in combinatie met het gemiddelde is de variantie en standaarddeviatie. Op de volgende pagina is meer te lezen over de variantie.
Voorbeeld
Stel dat de volgende 10 getallen de lengtes zijn van de eerste 10 mannen die je op straat tegenkomt. Van laag naar hoog: 169, 172, 172, 175, 178, 180, 181, 185, 190 en 191. De modus is het vaakst voorkomende getal en is dus 172 centimeter. De mediaan is het getal op positie (10 + 1) / 1 = 5,5. Dit betekent dat we het gemiddelde moeten berekenen van getal 5 en getal 6. De mediaan is dus het gemiddelde van 178 en 180, oftewel 179 centimeter. Om het gemiddelde moeten wij alle getallen bij elkaar optellen en deze delen door het aantal waarnemingen van 10. De som van de 10 lengtes is 169 + 172 + 172 + 175 + 178 + 180 + 181 + 185 + 190 + 191 = 1793. Dit betekent dat de gemiddelde lengte van de tien mannen 1793 / 10 = 179,3 centimeter is.
Een combinatie van een centrummaat en spreidingsmaat wordt vaak gebruikt om een samenvatting te geven van een verdeling van getallen. Wanneer een verdeling normaal verdeeld is, zijn het gemiddelde en de variantie of standaardafwijking de beste samenvattingsmaten. Echter, wanneer de verdeling scheef verdeeld is, is de vijf-getallen-samenvatting een betere samenvatting van de verdeling. Hieruit kan namelijk opgemaakt worden dat de variabele niet symmetrisch verdeeld is en dit kan niet worden opgemaakt uit een gemiddelde in combinatie met een standaardafwijking.
Contact: Voor vragen en/of opmerkingen mail naar: mail@statistiekles.nl
A person who never made a mistake, never tried anything new.
Albert Einstein |