Analyse ToolPak in Excel

Excel-gegevensanalyse ToolPak

Data-analyse toolpak in Excel is een add-in in Excel waarmee we data-analyse en verschillende andere belangrijke berekeningen kunnen uitvoeren, deze add-in is standaard niet ingeschakeld in Excel en we moeten het handmatig inschakelen via het tabblad Bestanden in de sectie Opties en vervolgens in in de add-ins-sectie klikken we op add-ins beheren en controleren vervolgens op analyse toolpak om het in Excel te gebruiken.

Stappen om de invoegtoepassing Data Analysis Toolpak te laden

  • Stap 1 - Klik op 'Bestand'.

  • Stap 2 -  Klik op 'Opties' in de lijst.

  • Stap 3 -  Klik op 'Add-ins' en kies vervolgens 'Excel Add-ins' voor 'Manage' . Klik op 'Go'.

  • Stap 4 -  Het dialoogvenster 'Excel-invoegtoepassingen' wordt weergegeven met de lijst met invoegtoepassingen. Controleer voor 'Analysis ToolPak'  en klik op 'OK' .

  • Stap 5 - Het commando 'Gegevensanalyse' verschijnt onder het tabblad 'Gegevens' in Excel uiterst rechts op het lint, zoals hieronder weergegeven.

Lijst met beschikbare functies in Excel Data Analysis ToolPak

Hieronder staat de lijst met beschikbare functies in de Analysis Toolpak Excel Add-in:

  1. ANOVA: enkele factor in Excel
  2. Correlatie in Excel
  3. Rang en percentiel in Excel
  4. Beschrijvende statistieken in Excel

Laten we nu elk van hen in detail bespreken -

# 1 - ANOVA: enkele factor in Excel

ANOVA staat voor Analysis of Variance en is de eerste set opties die beschikbaar is in Analysis Toolpak Excel Add-in. In zekere zin ANOVA analyseren we of er statistische verschillen zijn tussen de gemiddelden van drie of meer onafhankelijke groepen. De nulhypothese stelt voor dat er geen statistische significantie bestaat in een reeks gegeven waarnemingen. We testen deze hypothese door de p-waarde te controleren.

Laten we dit begrijpen aan de hand van een ANOVA Excel-voorbeeld.

Voorbeeld

Stel dat we de volgende gegevens hebben van het uitgevoerde experiment om te controleren 'Kan de zelfbeheersing worden hersteld tijdens intoxicatie?' We hebben 44 mannen onderverdeeld in 4 gelijke groepen, bestaande uit 11 mannen in elke groep.

  • Groep A ontving 0,62 mg / kg alcohol.
  • Groep AC kreeg alcohol plus cafeïne.
  • Groep AR ontving alcohol en een geldelijke beloning voor prestaties.
  • Groep P kreeg een placebo.

Scores op de voltooiingstaak van de gunningstam met 'gecontroleerde (moeiteloze) geheugenprocessen' werden geregistreerd en het resultaat is als volgt:

We moeten de nulhypothese testen die stelt dat alle middelen gelijk zijn (er is geen significant verschil).

Hoe de ANOVA-test uitvoeren?

Om de ANOVA-eenrichtings-test uit te voeren, moeten we de volgende stappen uitvoeren:

  • Stap 1: Klik op het commando 'Gegevensanalyse' dat beschikbaar is in het tabblad 'Gegevens' onder 'Analyse'.

  • Stap 2: Selecteer 'Anova: Single Factor' uit de lijst en klik op 'OK'.

  • Stap 3: We krijgen het dialoogvenster 'Anova: Single Factor' . We moeten Invoerbereik selecteren als onze gegevens met kolomkop.

  • Stap 4: Omdat we in onze selectie kolomkoppen hebben genomen, moeten we het selectievakje 'Labels in de eerste rij' inschakelen.

  • Stap 5: Voor het uitvoerbereik hebben we F1 geselecteerd. Klik op 'OK' .

We hebben nu ANOVA-analyse.

Hoe groter de F-statistiekwaarde in Excel, hoe waarschijnlijker het is dat de groepen verschillende middelen hebben, wat de nulhypothese verwerpt dat alle middelen gelijk zijn. Een F-statistiek groter dan de kritische waarde is equivalent aan een p-waarde in Excel kleiner dan alfa en beide betekenen dat we de nulhypothese verwerpen. Daarom wordt geconcludeerd dat er een significant verschil is tussen groepen.

# 2 - Correlatie in Excel

Correlatie is een statistische maat die beschikbaar is in de Analysis Toolpak Excel Add-in en het toont de mate waarin twee of meer variabelen samen fluctueren. Een positieve correlatie in Excel geeft aan in hoeverre die variabelen parallel toenemen of afnemen en een negatieve correlatie geeft aan in welke mate de ene variabele toeneemt naarmate de andere afneemt.

U kunt deze Analysis ToolPak Excel-sjabloon hier downloaden - Analysis ToolPak Excel-sjabloon
Voorbeeld

We hebben de volgende gegevens met betrekking tot advertentiekosten en verkopen voor een bedrijf. We willen de relatie tussen beide ontdekken, zodat we ons budget dienovereenkomstig kunnen plannen en verkopen kunnen verwachten (stel het doel ook rekening houdend met andere factoren).

Hoe de correlatie tussen twee sets variabelen te vinden?

Om de correlatie tussen deze twee sets variabelen te achterhalen, volgen we de onderstaande stappen:

  • Stap 1: Klik op 'Data Analyse' onder de 'Analyse' groep beschikbaar in 'Data'.

  • Stap 2: Kies 'Correlation' uit de lijst en klik op 'OK' .

  • Stap 3: Kies bereik '$ A $ 1: $ B $ 16' als invoerbereik en $ F $ 1 als uitvoerbereik. Vink het selectievakje voor 'Labels in de eerste rij' aan, aangezien we kolomkoppen in ons invoerbereik hebben en omdat we verschillende koppen in een andere kolom hebben. We hebben gekozen voor 'Columns' voor 'gegroepeerd op' .

  • Stap 4: Selecteer het uitvoerbereik en klik op 'OK'.

  • We krijgen het resultaat.

Zoals we kunnen zien, is de correlatie tussen advertentiekosten (kolomkop) en verkoop (rijkop) ongeveer +0,86274. wat aangeeft dat ze een positieve correlatie hebben en tot 86,27% omvang. Nu kunnen we dienovereenkomstig een beslissing nemen over het advertentiebudget en de verwachte verkopen.

# 3 - Rang en percentiel in Excel

Percentiel in Excel verwijst naar een getal waarbij een bepaald percentage scores onder dat getal valt en is beschikbaar in de Analysis Toolpak Excel Add-in. Als een bepaalde score bijvoorbeeld in het 90e percentiel valt, betekent dit dat de student beter heeft gescoord dan 90% van de mensen die de test hebben gemaakt. Laten we dit begrijpen met een voorbeeld.

Voorbeeld

We hebben de volgende gegevens voor de scores behaald door een leerling van een klas.

We willen voor elke student de rang en het percentiel weten.

Hoe rang en percentiel te vinden?

De stappen zouden zijn:

  • Stap 1: Klik op 'Data Analyse' onder de 'Analyse' groep beschikbaar in 'Data'.

  • Stap 2: Klik op 'Rang en percentiel' in de lijst en klik vervolgens op 'OK' .

  • Stap 3: Selecteer '$ B $ 1: B $ B $ 17' als invoerbereik en '$ D $ 1' als uitvoerbereik.

  • Stap 4: Omdat we gegevensveldkoppen in kolommen hebben, dwz de gegevens zijn gegroepeerd in kolommen, moeten we 'Kolommen' selecteren voor 'Gegroepeerd op' .

  • Stap 5: We hebben kolom gekozen rubriek ook in onze input range, dat is de reden waarom we nodig hebben om te controleren op 'Labels in de eerste rij' vervolgens klik op 'OK'.

  • We kregen het resultaat als de volgende afbeelding.

# 4 - Beschrijvende statistieken in Excel

Beschrijvende statistieken in de Analysis Toolpak Excel Add-in bevatten de volgende informatie over een voorbeeld:

  1. Algemene drang
    1. Gemiddelde: het wordt gemiddeld genoemd.
    2. Mediaan: dit is het middelpunt van de distributie.
    3. Modus: dit is het meest voorkomende nummer.
  2. Maatregelen van variabiliteit
    1. Bereik: dit is het verschil tussen de grootste en de kleinste variabelen.
    2. Variantie: dit geeft aan hoe ver de cijfers zijn verspreid.
    3. Standaarddeviatie: hoeveel variatie bestaat er van het gemiddelde / gemiddelde
  3. Skewness: dit geeft aan hoe symmetrisch de verdeling van een variabele is.
  4. Kurtosis: dit duidt op een piek of vlakheid van een distributie.
Voorbeeld

Hieronder staan ​​de cijfers die zijn gescoord door studenten in het vak Economie. We willen beschrijvende statistieken achterhalen.

Om hetzelfde te doen, zijn de stappen:

  • Stap 1: Klik op het 'Data Analyse' commando dat beschikbaar is in de 'Analyse' groep in 'Data'.

  • Stap 2: Kies 'Beschrijvende statistieken' uit de lijst en klik op 'OK'.

  • Stap 3: Kies '$ A $ 1: $ A $ 15' als invoerbereik, kies 'Columns' voor ' Grouped By' , vink voor 'Labels in the first row' aan ,

  • Stap 4: Kies '$ C $ 1' als uitvoerbereik en zorg ervoor dat we het vakje voor 'Summary Statistics' hebben aangevinkt . Klik op 'OK'.

Nu hebben we onze beschrijvende statistieken voor de gegevens.