Centrale limietstelling

Definitie van centrale limietstelling

De centrale limietstelling stelt dat de willekeurige steekproeven van een willekeurige populatievariabele met een willekeurige verdeling een normale kansverdeling zullen benaderen naarmate de omvang van de steekproef toeneemt en het veronderstelt dat als de omvang van de steekproef in de populatie groter is dan 30, het gemiddelde van de steekproef waarvan het gemiddelde van alle waarnemingen voor de steekproef bijna gelijk zal zijn aan het gemiddelde van de populatie.

Formule centrale limietstelling

We hebben al besproken dat wanneer de steekproefomvang groter is dan 30, de verdeling de vorm aanneemt van een normale verdeling. Voor het bepalen van de normale verdeling van een variabele is het belangrijk om het gemiddelde en de variantie te kennen. Een normale verdeling kan worden vermeld als

X ~ N (µ, α)

Waar

  • N = aantal waarnemingen
  • µ = gemiddelde van de waarnemingen
  • α = standaarddeviatie

In de meeste gevallen onthullen de waarnemingen niet veel in hun ruwe vorm. Het is dus erg belangrijk om de waarnemingen te standaardiseren om dat te kunnen vergelijken. Het wordt gedaan met behulp van de z-score. Voor een waarneming moet de Z-score worden berekend. De formule om de z-score te berekenen is

Z = (X- µ) / α / √n

Waar

  • Z = Z-score van de waarnemingen
  • µ = gemiddelde van de waarnemingen
  • α = standaarddeviatie
  • n = steekproefomvang

Uitleg

De centrale limietstelling stelt dat de willekeurige steekproeven van een willekeurige populatie-variabele met een willekeurige verdeling een normale kansverdeling zullen benaderen naarmate de omvang van de steekproef toeneemt. De centrale limietstelling gaat ervan uit dat als de omvang van de steekproef in de populatie groter is dan 30, het gemiddelde van de steekproef waarvan het gemiddelde van alle waarnemingen voor de steekproef bijna gelijk zal zijn aan het gemiddelde van de populatie. Ook zal de standaarddeviatie van de steekproef wanneer de omvang van de steekproef groter is dan 30 gelijk zijn aan de standaarddeviatie van de populatie. Aangezien de steekproef willekeurig uit de hele populatie wordt gekozen en de omvang van de steekproef meer dan 30 is, helpt het bij het testen van hypothesen en het construeren van het betrouwbaarheidsinterval voor de hypothesetest.

Voorbeelden van centrale limietstellingformule (met Excel-sjabloon)

U kunt dit Excel-sjabloon voor formule voor centrale limietstelling hier downloaden - Excel-sjabloon voor formule voor centrale limietstelling

Voorbeeld 1

Laten we het concept van een normale verdeling begrijpen met behulp van een voorbeeld. Het gemiddelde rendement van een beleggingsfonds is 12% en de standaarddeviatie van het gemiddelde rendement voor de belegging in beleggingsfondsen is 18%. Als we aannemen dat de verdeling van het rendement normaal verdeeld is, laten we dan de verdeling interpreteren voor het rendement in de investering van het beleggingsfonds.

Gegeven,

  • Het gemiddelde rendement van de investering is 12%
  • De standaarddeviatie is 18%

Dus om het rendement voor een betrouwbaarheidsinterval van 95% te achterhalen, kunnen we het achterhalen door de vergelijking op te lossen als

  • Bovenste bereik = 12 + 1,96 (18) = 47%
  • Onderste bereik = 12 - 1,96 (18) = -23% 

Het resultaat geeft aan dat 95% van de keren dat het rendement van het beleggingsfonds in het bereik van 47% tot -23% ligt. In dit voorbeeld zal de steekproefomvang, die het resultaat is van een willekeurige steekproef van meer dan 30 waarnemingen van rendement, ons het resultaat opleveren voor het populatierendement van het onderlinge fonds, aangezien de steekproefverdeling normaal verdeeld zal zijn.

Voorbeeld # 2

Laten we doorgaan met hetzelfde voorbeeld, laten we bepalen wat het resultaat zal zijn bij een betrouwbaarheidsinterval van 90%

Gegeven,

  • Het gemiddelde rendement van de investering is 12%
  • De standaarddeviatie is 18%

Dus om het rendement voor een betrouwbaarheidsinterval van 90% te achterhalen, kunnen we het achterhalen door de vergelijking op te lossen als

  • Bovenste bereik = 12 + 1,65 (18) = 42%
  • Onderste bereik = 12 - 1,65 (18) = -18%

Het resultaat geeft aan dat 90% van de keren dat het rendement van het beleggingsfonds tussen 42% en -18% ligt.

Voorbeeld # 3

Laten we doorgaan met hetzelfde voorbeeld, laten we bepalen wat het resultaat zal zijn bij een betrouwbaarheidsinterval van 99%

Gegeven,

  • Het gemiddelde rendement van de investering is 12%
  • De standaarddeviatie is 18%

Dus om het rendement voor een betrouwbaarheidsinterval van 90% te achterhalen, kunnen we het achterhalen door de vergelijking op te lossen als

  • Bovenste bereik = 12 + 2,58 (18) = 58%
  • Onderste bereik = 12 - 2,58 (18) = -34% 

Het resultaat geeft aan dat 99% van de keren dat het rendement van het beleggingsfonds in het bereik van 58% tot -34% ligt.

Relevantie en gebruik

De centrale limietstelling is buitengewoon nuttig omdat het de onderzoeker in staat stelt om het gemiddelde en de standaarddeviatie van de hele populatie te voorspellen met behulp van de steekproef. Aangezien de steekproef willekeurig wordt gekozen uit de hele populatie en de omvang van de steekproef meer dan 30 is, zal elke willekeurige steekproefomvang uit de populatie bijna normaal worden verdeeld, wat zal helpen bij het testen van hypothesen en het construeren van het betrouwbaarheidsinterval voor de hypothese. testen. Op basis van de centrale limietstelling,de onderzoeker kan een willekeurige steekproef uit de hele populatie kiezen en wanneer de omvang van de steekproef groter is dan 30, kan hij de populatie voorspellen met behulp van de steekproef aangezien de steekproef een normale verdeling zal volgen en ook als het gemiddelde en de standaarddeviatie van de steekproef zal hetzelfde zijn als het gemiddelde en de standaarddeviatie van de populatie.