Uitbijterformule

De uitbijterformule biedt een grafisch hulpmiddel om de gegevens te berekenen die zich buiten de gegeven set van distributie bevinden, die binnen of buiten kan zijn, afhankelijk van de variabelen.

Wat is de uitbijterformule?

Een uitbijter is het gegevenspunt van de gegeven steekproef of gegeven waarneming of in een verdeling die buiten het algemene patroon moet liggen. Een veelgebruikte regel die zegt dat een datapunt als een uitbijter wordt beschouwd als het meer dan 1,5 IQR onder het eerste kwartiel of boven het derde kwartiel heeft.

Anders gezegd, lage uitschieters zullen onder Q1-1.5 IQR liggen en hoge uitschieters zullen Q3 + 1.5IQR liggen

Men moet mediaan berekenen, kwartielen inclusief IQR, Q1 en Q3.

De uitbijterformule wordt als volgt weergegeven,

De formule voor Q1 = ¼ (n + 1) de term De formule voor Q3 = ¾ (n + 1) de term De formule voor Q2 = Q3 - Q1

Stapsgewijze berekening van de uitbijter

De onderstaande stappen moeten worden gevolgd om de uitbijter te berekenen.

  • Stap 1: Bereken eerst de kwartielen, dwz Q1, Q2 en interkwartiel
  • Stap 2: Bereken nu de waarde Q2 * 1.5
  • Stap 3: Trek nu de Q1-waarde af van de waarde die in stap 2 is berekend
  • Stap 4: Voeg hier Q3 toe met de waarde berekend in stap2
  • Stap 5: Creëer het bereik van de waarden die zijn berekend in Stap 3 en Stap 4
  • Stap 6: Rangschik de gegevens in oplopende volgorde
  • Stap 7: Controleer of er waarden zijn die onder of hoger liggen dan het bereik dat in stap 5 is gemaakt

Voorbeeld

Beschouw een gegevensset met de volgende getallen: 10, 2, 4, 7, 8, 5, 11, 3, 12. U moet alle uitschieters berekenen.

Oplossing:

Eerst moeten we de gegevens in oplopende volgorde rangschikken om de mediaan te vinden die voor ons Q2 zal zijn.

2, 3, 4, 5, 7, 8, 10, 11, 12

Aangezien het aantal waarnemingen oneven is, namelijk 9, zou de mediaan op een 5e positie liggen, wat 7 is en hetzelfde zal Q2 zijn voor dit voorbeeld.

Daarom is de berekening van Q1 als volgt -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 zal zijn - 

Q1 = 2,5 termijn

Dit betekent dat Q1 het gemiddelde is van de 2e en 3e positie van de waarnemingen, wat hier 3 & 4 is en een gemiddelde van hetzelfde is (3 + 4) / 2 = 3,5

Daarom is de berekening van Q3 als volgt -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 zal zijn - 

Q3 = 7,5 termijn

Dit betekent dat Q3 het gemiddelde is van de 7e en 8e positie van de waarnemingen, wat hier 10 & 11 is en een gemiddelde van hetzelfde is (10 + 11) / 2 = 10,5

Nu zullen lage uitschieters onder Q1-1.5IQR liggen en hoge uitschieters zullen Q3 + 1.5IQR liggen

De waarden zijn dus 3,5 - (1,5 * 7) = -7 en het hogere bereik is 10,5 + (1,5 * 7) = 110,25.

Aangezien er geen waarnemingen zijn die hoger of lager liggen dan 110,25 en -7, hebben we geen uitschieters in deze steekproef.

Voorbeeld van uitschieterformule in Excel (met Excel-sjabloon)

U kunt deze Excel-sjabloon voor uitschietersformule hier downloaden - Excel-sjabloon voor uitschietersformule

Creatieve coachinglessen overwegen om studenten die in de top 25% zitten te belonen. Ze willen echter uitschieters vermijden. De gegevens zijn voor de 25 studenten. Gebruik de uitbijtervergelijking om te bepalen of er een uitbijter is?

Oplossing:

Hieronder vindt u gegevens om de uitbijter te berekenen

Het aantal waarnemingen hier is 25 en onze eerste stap zou zijn om de bovenstaande onbewerkte gegevens in oplopende volgorde om te zetten.

Mediaan zal zijn -

De mediaanwaarde = ½ (n + 1)

= ½ = ½ (26)

= 13e termijn

De Q2 of mediaan is 68,00

Dat is 50% van de bevolking.

Q1 zal zijn -

Q1 = ¼ (n + 1) de term

= ¼ (25 + 1)

= ¼ (26)

= 6.5e term die gelijk is aan de 7e term

De Q1 is 56,00 wat de onderste 25% is

Q3 zal zijn -

Ten slotte, Q3 = ¾ (n + 1) de term

= ¾ (26)

= 19,50 termijn

Hier moet het gemiddelde worden genomen van de 19e en 20e termen, die 77 en 77 zijn en het gemiddelde van hetzelfde is (77 + 77) / 2 = 77,00

 De Q3 is 77, wat de beste 25% is

Laag bereik

Nu zullen lage uitschieters onder Q1-1.5IQR liggen en hoge uitschieters zullen Q3 + 1.5IQR liggen

Hoog bereik -

De waarden zijn dus 56 - (1,5 * 68) = -46 en het hogere bereik is 77 + (1,5 * 68) = 179.

Er zijn geen uitschieters.

Relevantie en toepassingen

De formule voor uitschieters is erg belangrijk om te weten, omdat er gegevens kunnen zijn die door een dergelijke waarde zouden worden vertekend. Neem een ​​voorbeeld van waarnemingen 2, 4, 6, 101 en als iemand nu een gemiddelde van deze waarden neemt, zal het 28,25 zijn, maar 75% van de waarnemingen ligt onder de 7 en daarom zou men een onjuiste beslissing zijn met betrekking tot waarnemingen van deze steekproef.

Hier kan worden opgemerkt dat 101 duidelijk lijkt te schetsen en als dit wordt verwijderd, zou het gemiddelde 4 zijn, wat over de waarden of waarnemingen zegt dat ze binnen het bereik van 4 liggen. Daarom is het erg belangrijk om deze berekening uit te voeren om te vermijden elk misbruik van leidende informatie van de gegevens. Deze worden veel gebruikt door statistici over de hele wereld wanneer ze onderzoek doen.