Chi Square-test in Excel

Chi-Square-test met Excel

Chi-Square-test in Excel is de meest gebruikte niet-parametrische test die wordt gebruikt om twee of meer variabelen voor willekeurig geselecteerde gegevens te vergelijken. Het is een soort test die wordt gebruikt om de relatie tussen twee of meer variabelen te achterhalen, dit wordt gebruikt in statistieken die ook bekend staan ​​als Chi-Square P-waarde, in Excel hebben we geen ingebouwde functie, maar we kunnen wel gebruiken formules om de chikwadraattoets in Excel uit te voeren met behulp van de wiskundige formule voor de chikwadraattoets.

Soorten

  1. Chi-Square-test voor een goede pasvorm
  2. Chi-kwadraattest voor onafhankelijkheid van twee variabelen.

# 1 - Chi-Square-test voor een goede pasvorm

Het wordt gebruikt om de nabijheid van een steekproef waar te nemen die bij een populatie past. Het symbool van de Chi-Square-test is (2). Het is de som van alle ( waargenomen telling - verwachte telling) 2 / verwachte telling.

  • waarbij k-1 vrijheidsgraden of DF.
  • Waar Oi de waargenomen frequentie is, k is categorieën en Ei is de verwachte frequentie.

Opmerking: - Goodness of fit van een statistisch model verwijst naar het begrip van hoe goed steekproefgegevens passen bij een reeks observaties.

Toepassingen

  • De kredietwaardigheid van kredietnemers op basis van hun leeftijdsgroep en persoonlijke leningen
  • De relatie tussen de prestaties van verkopers en de genoten training
  • Rendement op één aandeel en op aandelen van een sector zoals de farmacie of het bankwezen
  • Categorie kijkers en de impact van een tv-campagne.

# 2 - Chi-kwadraattest voor onafhankelijkheid van twee variabelen

Het wordt gebruikt om te controleren of de variabelen autonoom van elkaar zijn of niet. Met (r-1) (c-1) vrijheidsgraden

Waar Oi de waargenomen frequentie is, r is het aantal rijen, c is het aantal kolommen en Ei is de verwachte frequentie

Opmerking: - Twee willekeurige variabelen worden onafhankelijk genoemd als de kansverdeling van de ene variabele niet wordt beïnvloed door de andere.

Toepassingen

Onafhankelijkheidstest is geschikt voor de volgende situaties:

  • Er is één categorische variabele.
  • Er zijn twee categorische variabelen en u moet de relatie tussen deze variabelen bepalen.
  • Er zijn kruistabellen en de relatie tussen twee categorische variabelen moet worden gevonden.
  • Er zijn niet-kwantificeerbare variabelen (bijvoorbeeld antwoorden op vragen als: kiezen werknemers in verschillende leeftijdsgroepen verschillende soorten gezondheidsplannen?)

Hoe doe je de Chi-Square-test in Excel? (met voorbeeld)

U kunt deze Chi Square Test Excel-sjabloon hier downloaden - Chi Square Test Excel-sjabloon

De manager van een restaurant wil de relatie vinden tussen klanttevredenheid en de salarissen van de wachtende mensen. Hierin zullen we de hypothese opstellen om de Chi-Square te testen

  • Ze neemt een willekeurige steekproef van 100 klanten en vraagt ​​of de service uitstekend, goed of slecht was.
  • Vervolgens categoriseert ze de salarissen van de wachtende mensen als laag, gemiddeld en hoog.
  • Stel dat het significantieniveau 0,05 is. Hier duiden H0 en H1 de onafhankelijkheid en afhankelijkheid van de servicekwaliteit van de salarissen van wachttafels aan.
  • H 0 - servicekwaliteit is niet afhankelijk van de salarissen van mensen die op de tafels wachten.
  • H 1 - servicekwaliteit is afhankelijk van de salarissen van mensen die op de tafels wachten
  • Haar bevindingen worden weergegeven in de onderstaande tabel:

Hierin hebben we 9 datapunten, we hebben 3 groepen die elk een ander bericht over salaris hebben gekregen en de uitkomst wordt hieronder weergegeven.

Nu gaan we de som van alle rijen en kolommen tellen. We zullen dit doen met behulp van formule dwz SOM. Om de Excellent in de totaalkolom te Totaal hebben we = SUM (B4: D4) geschreven en druk vervolgens op enter.

Dit geeft ons 26 . We zullen hetzelfde doen met alle rijen en kolommen.

Om de mate van vrijheid (DF) te berekenen gebruiken we (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Er zijn 3 servicecategorieën en 3 salariscategorieën
  • We hebben 27 respondenten met een gemiddeld salaris (onderste rij, midden)
  • We hebben 51 respondenten met een goede service (laatste kolom, midden)

Nu moeten we de verwachte frequenties berekenen : -

Verwachte frequenties kunnen worden berekend met behulp van een formule: -

  • Om de Excellent te berekenen, vermenigvuldigen we het totaal van Low met het totaal van Excellent gedeeld door N.

Stel dat we moeten rekenen voor de 1e rij en 1e kolom (= B7 * E4 / B9 ) . Dit geeft het verwachte aantal klanten dat op Uitstekende service heeft gestemd voor de salarissen van de wachtende mensen, namelijk 8,32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Evenzo moeten we hetzelfde doen en de formule wordt toegepast in het onderstaande diagram.

We krijgen de verwachte frequentie-tabel zoals hieronder weergegeven: -

Opmerking: - Neem aan dat het significantieniveau 0,05 is. Hier duiden H0 en H1 de onafhankelijkheid en afhankelijkheid aan van de servicekwaliteit van de salarissen van wachttafels.

Na het berekenen van de verwachte frequentie, berekenen we de chikwadraatgegevenspunten met behulp van een formule

Chi-Square-punten = (waargenomen-verwacht) ^ 2 / verwacht

Om het eerste punt te berekenen, schrijven we = (B4-B14) ^ 2 / B14. 

We zullen de formule kopiëren en in andere cellen plakken om de waarde automatisch te vullen.

Hierna berekenen we de chi-waarde (Berekende waarde) door alle waarden boven de tabel op te tellen

We kregen de Chi-waarde als 18.65823 .

Om de kritische waarde hiervoor te berekenen gebruiken we een chi-kwadraat kritische waardetabel of we kunnen onderstaande formule gebruiken.

Deze formule bevat 2 parameters CHIKW.INV.RECHTS (waarschijnlijkheid, vrijheidsgraad).

De kans is 0,05, het is een significante waarde die ons zal helpen bepalen of we de nulhypothese (H 0 ) accepteren of niet.

De kritische waarde van chikwadraat is 9.487729037.

Nu zullen we de waarde van de chikwadraat of (P-waarde) = CHITEST (actueel_bereik, verwacht_bereik) vinden

Bereik van = CHITEST (B4: D6, B14: D16) .

Zoals we hebben gezien is de waarde van de chi-test of P-waarde = 0,00091723.

Zoals we hebben gezien, hebben we alle waarden berekend. De chikwadraatwaarden (berekende waarde) zijn alleen significant als de waarde ervan gelijk is aan of hoger is dan de kritische waarde 9,48, dwz de kritische waarde (getabelleerde waarde) moet hoger zijn dan 18,65 om de nulhypothese (H 0 ) te accepteren .

Maar hier Berekende waarde > Getabelleerde waarde

X2 (berekend)> X2 (in tabelvorm)

18,65> 9,48

In dit geval zullen we de nulhypothese (H 0 ) afwijzen en wordt Alternatief (H 1 ) geaccepteerd.

  • We kunnen ook P-waarde gebruiken om hetzelfde te voorspellen, dwz als P-waarde <= α (significante waarde 0,05), wordt de nulhypothese verworpen
  • Als de P-waarde> α , verwerp de  nulhypothese dan niet .

Hier P-waarde (0.0009172) < α (0,05) verwerpen H 0 Accepteer H 1

Uit het bovenstaande voorbeeld concluderen we dat de kwaliteit van de service afhankelijk is van de salarissen van de wachtenden.

Dingen om te onthouden

  • Beschouwt het kwadraat van een standaard normaalvariaat.
  • Evalueert of de frequenties die in verschillende categorieën worden waargenomen significant afwijken van de frequenties die worden verwacht onder een gespecificeerde set aannames.
  • Bepaalt hoe goed een veronderstelde verdeling bij de gegevens past.
  • Gebruikt kruistabellen (in marktonderzoeken worden deze tabellen kruistabellen genoemd).
  • Ondersteunt metingen op nominaal niveau.