Boxplot in Excel

Excel Box-plot

Een boxplot in Excel is een grafische weergave of een grafiek die wordt gebruikt om de verdeling van getallen in een dataset weer te geven. Het geeft aan hoe de waarden in de dataset zijn verspreid. In een boxplot worden de numerieke gegevens weergegeven met vijf getallen als samenvatting: minimum, maximum, eerste kwartiel, tweede kwartiel (mediaan), derde kwartiel.

Tussen het eerste en derde kwartiel wordt een kader getekend samen met een extra lijn die langs het tweede kwartiel wordt getrokken om de mediaan te markeren. Buiten het eerste en derde kwartiel worden verlengde lijnen getekend om het minimum en maximum weer te geven. Deze verlengde lijnen worden in de boxplot snorharen genoemd.

Het kader van de boxplot toont het eerste tot en met het derde kwartiel met een lijn op het tweede kwartiel, dwz mediaan. De uiteinden van de snorharen geven het minimum en maximum weer.

De vijf nummers vertegenwoordigd door de boxplot:

  • Minimum: kleinste / minste waarde van de gegevensset.
  • Eerste kwartiel: middenwaarde van minimum en mediaan.
  • Tweede kwartiel / mediaan: middenwaarde van de gegevensset.
  • Derde kwartiel: middenwaarde van mediaan en maximum.
  • Maximum: de grootste waarde van de gegevensset.

Hoe maak je een boxplot in Excel? (met een voorbeeld)

U kunt deze Box Plot Excel-sjabloon hier downloaden - Box Plot Excel-sjabloon

Laten we zeggen dat we een dataset hebben van een klas die het totaal aantal punten van zijn studenten in alle vakken bevat (van de 500, max. Punten: 100 voor elk onderwerp), en we willen een boxplot in Excel maken voor hetzelfde.

We hebben de volgende cijfergegevens van studenten in een Excel-sheet:

Nu kunnen de volgende stappen worden gebruikt om een ​​boxplot te maken voor de bovenstaande gegevens (in principe in Excel 2013):

Het is heel eenvoudig om een ​​boxplot te maken met Excel 2016, aangezien het standaard een 'Box and Whisker'-diagram heeft onder de statistische diagrammen in het diagramgedeelte. Excel 2013 heeft echter standaard geen grafieksjabloon voor boxplots, dus we moeten deze maken door de onderstaande stappen te volgen:

Bereken de vijf statistieken uit de dataset die nodig zijn voor boxplots: minimum, drie kwartielen en maximum, met behulp van de volgende functies:

Bereken nu minimale statistieken uit de dataset.

Bereken nu quantile1-statistieken uit de dataset.

Berekening van vijf statistieken voor de boxplot is -

We gaan nu een finaletafel maken (zeg maar de tabel met verschillen) die we zullen gebruiken om de boxplot in Excel te maken. In deze finaletafel zullen we de minimumwaarde kopiëren en dat is de eerste deelname aan onze finaletafel. De rest van de inzendingen voor deze finaletafel zijn de verschillen tussen elke statistiek, zoals hieronder:

Nu gaan we een gestapeld kolomdiagram maken met deze finaletafel en deze omzetten in een boxplot.

Laten we dus eerst een gestapeld kolomdiagram maken in Excel:

Selecteer verschillen en waarde en klik vervolgens op 'Invoegen' -> Alle grafieken -> Gestapelde kolomdiagrammen:

Als we dit doen, krijgen we een gestapeld diagram zoals hieronder:

We kunnen zien dat dit niet vergelijkbaar is met een boxplot, omdat Excel met dit gestapelde diagram standaard gestapelde kolommen uit horizontaal trekt en niet uit een verticale gegevensset. We zullen dus de kaartassen moeten omkeren.

Klik hiervoor met de rechtermuisknop op het diagram en klik op 'Gegevens selecteren'.

Klik nu op Wissel rij / kolom '.

We krijgen een gestapelde grafiek zoals hieronder:

We zullen dit gestapelde diagramtype nu als volgt naar boxplot converteren:

Selecteer het onderste deel van de kolom (blauw gebied) en klik op 'Gegevensreeks opmaken'.

Vouw in het paneel 'Gegevensreeks opmaken' de optie 'Opvullen' uit en selecteer de knop 'Geen opvulling', en in de vervolgkeuzelijst 'Rand', vouwt u deze uit en selecteert u de knop 'Geen lijn':

We krijgen de volgende boxplot-grafiek zoals hieronder:

De volgende stap is het maken van snorharen door de bovenste en tweede van de onderste segmenten, dwz rode en oranje gebieden (zoals we de onderste hebben verwijderd), te vervangen door lijnen / snorharen.

Om de bovenste whisker te tekenen, selecteren we de bovenste regio / segment (rood) en vouwen we het tabblad 'Vullen' uit.

En selecteer de knop 'Geen opvulling'.

Klik nu op 'Ontwerp' -> 'Grafiekelementen toevoegen' -> 'Foutbalken' -> 'Standaarddeviatie':

Nu klikken we op de plusknop rechtsboven in de grafiek, en selecteren en uitvouwen 'Foutbalken in Excel' en selecteren vervolgens 'Meer opties'.

Dit opent het paneel 'Formaatfoutbalken' en stelt het volgende in:

Stel: richting in op 'Plus'

Eindstijl naar 'Cap'

Percentage tot '100%'

Dus we zullen nu een bovenste snorhaar laten trekken zoals hieronder:

Op dezelfde manier om de onderste snorhaar te tekenen, selecteren we de tweede van de onderste regio (oranje die nu als laatste zichtbaar is) en herhalen we dezelfde stappen als hierboven. De enige verandering zou zijn dat de 'richting' in foutbalken 'wordt ingesteld op' min '.

Dus we zullen nu een lagere whisker laten trekken zoals hieronder:

We kunnen dus in de bovenstaande schermafbeelding zien dat het gestapelde kolomdiagram nu lijkt op een boxplot. Boxplots hebben over het algemeen overal dezelfde kleur, dus we kunnen er één vulkleur voor gebruiken met een lichte rand.

Laten we nu eens kijken hoe een boxplot wordt geïnterpreteerd of bekeken:

We kunnen in de bovenstaande schermafbeelding zien dat:

  • Verlaag de eindpunten van de whisker op 300, wat de minimumwaarde weergeeft.
  • De eindpunten van de top whisker op ergens onder de 500, wat precies 492 is, geeft het maximum weer.
  • De bovenste regel van het groene vak toont kwartiel3, waarvan we punten zien op 480,5.
  • De middellijn van het groene vak geeft mediaan / kwartiel2 weer, die we punten op 450 zien.
  • De laatste regel van het groene vak geeft kwartiel1 weer, waarvan we punten op 392 zien.

Dus de boxplot voor de gegeven dataset is correct getekend met de vijf statistieken (minimum, drie kwartielen en maximum) berekend zoals hierboven.

Dingen om te onthouden

  • Een boxplot is een grafische weergave van een numerieke dataset die een samenvatting van vijf cijfers gebruikt om de distributie van de dataset weer te geven.
  • Boxplots ook wel box- en whiskerplot genoemd.
  • Het wordt over het algemeen gebruikt voor verklarende gegevensanalyse.
  • Ze worden over het algemeen gebruikt wanneer we enkele voorbeelden moeten vergelijken en moeten testen of de gegevens symmetrisch zijn verdeeld.
  • Boxplots nemen minder ruimte in beslag in vergelijking met densiteitsplots of histogrammen.
  • Het wordt gebruikt om de vorm van een distributie, centrale waarde en zijn variabiliteit te tonen.
  • Het is niet nodig dat de mediaan zich in het midden van de doos bevindt.
  • De snorharen kunnen verschillende lengtes hebben.
  • Boxplot kan worden gebruikt om uitschieters te detecteren.