Aangepaste R-kwadraat

Wat is Aangepaste R-kwadraat?

Aangepast R-kwadraat verwijst naar de statistische tool die investeerders helpt bij het meten van de omvang van de variantie van de variabele die afhankelijk is en die kan worden verklaard met de onafhankelijke variabele, en houdt rekening met de impact van alleen die onafhankelijke variabelen die een impact hebben op de variatie van de afhankelijke variabele.

Aangepaste R-kwadraat of gemodificeerde R ^ 2 bepaalt de mate van variantie van de afhankelijke variabele die kan worden verklaard door de onafhankelijke variabele. De specialiteit van de gemodificeerde R ^ 2 is dat het niet de impact van alle onafhankelijke variabelen meetelt, maar alleen die welke de variatie van de afhankelijke variabele beïnvloeden. De waarde van de gewijzigde R ^ 2 kan ook negatief zijn, hoewel deze meestal niet negatief is.

Aangepaste formule R-kwadraat

De formule om het aangepaste R-kwadraat van regressie te berekenen, wordt als volgt weergegeven,

R ^ 2 = {(1 / N) * Σ [(xi - x) * (yi - y)] / (σx * σy)} ^ 2

Waar

  • R ^ 2 = aangepast R-kwadraat van de regressievergelijking
  • N = aantal waarnemingen in de regressievergelijking
  • Xi = onafhankelijke variabele van de regressievergelijking
  • X = gemiddelde van de onafhankelijke variabele van de regressievergelijking
  • Yi = afhankelijke variabele van de regressievergelijking
  • Y = gemiddelde van de afhankelijke variabele van de regressievergelijking
  • σx = standaarddeviatie van de onafhankelijke variabele
  • σy = standaarddeviatie van de afhankelijke variabele.

Houd er rekening mee dat

Om het in Excel te berekenen, moeten de variabelen y en x in Excel worden opgegeven en wordt de hele uitvoer samen met Aangepaste R ^ 2 gegenereerd door Excel. Dit is een speciaal geval waarbij het moeilijk is om de uitvoer in tekstformaat aan te bieden, in tegenstelling tot andere formules.

Interpretatie

Aangepast R-kwadraat, bepaalt de omvang van de variantie van de afhankelijke variabele die kan worden verklaard door de onafhankelijke variabele. Door naar de aangepaste R ^ 2-waarde te kijken, kan men beoordelen of de gegevens in de regressievergelijking goed passen. Hoe hoger de aangepaste R ^ 2, hoe beter de regressievergelijking, aangezien dit impliceert dat de onafhankelijke variabele die is gekozen om de afhankelijke variabele te bepalen, de variatie in de afhankelijke variabele kan verklaren.

De waarde van de gewijzigde R ^ 2 kan ook negatief zijn, hoewel deze meestal niet negatief is. In het geval van een aangepast R-kwadraat, zal de waarde van het aangepaste R-kwadraat alleen stijgen met de toevoeging van een onafhankelijke variabele wanneer de variatie van de onafhankelijke variabele de variatie in de afhankelijke variabele beïnvloedt. Dit is niet van toepassing in het geval van R ^ 2, alleen van toepassing op de waarde van gecorrigeerde R ^ 2.

Voorbeelden

U kunt deze aangepaste R-kwadraatformule Excel-sjabloon hier downloaden - Aangepaste R-kwadraatformule Excel-sjabloon

Voorbeeld 1

Laten we proberen het concept van aangepaste R ^ 2 te begrijpen met behulp van een voorbeeld. Laten we proberen te achterhalen wat de relatie is tussen de afstand die de vrachtwagenchauffeur aflegt en de leeftijd van de vrachtwagenchauffeur. Iemand doet eigenlijk een regressievergelijking om te valideren of wat hij van de relatie tussen twee variabelen vindt, ook gevalideerd wordt door de regressievergelijking.

In dit specifieke voorbeeld zullen we zien welke variabele de afhankelijke variabele is en welke variabele de onafhankelijke variabele is. De afhankelijke variabele in deze regressievergelijking is de afstand die de vrachtwagenchauffeur aflegt en de onafhankelijke variabele is de leeftijd van de vrachtwagenchauffeur. Door een regressie uit te voeren met de variabelen, is het aangepaste R-kwadraat 65%. De onderstaande momentopname toont de regressie-uitvoer voor de variabelen. De dataset en de variabelen worden gepresenteerd in het bijgevoegde Excel-blad.

De aangepaste R ^ 2-waarde van 65% voor deze regressie houdt in dat 65% van de variatie in de afhankelijke variabele wordt verklaard door de onafhankelijke variabele. Idealiter zoekt een onderzoeker naar de determinatiecoëfficiënt die het dichtst bij 100% ligt.

Voorbeeld # 2

Laten we proberen het concept van aangepast R-vierkant te begrijpen met behulp van een ander voorbeeld. Laten we proberen erachter te komen wat de relatie is tussen de lengte van de studenten van een klas en het GPA-cijfer van die studenten. In dit specifieke voorbeeld zullen we zien welke variabele de afhankelijke variabele is en welke variabele de onafhankelijke variabele is. De afhankelijke variabele in deze regressievergelijking is de GPA van de studenten en de onafhankelijke variabele is de lengte van de studenten.

Door een regressie uit te voeren met de variabelen, kregen we de aangepaste R ^ 2 verwaarloosbaar of negatief. De onderstaande momentopname toont de regressie-uitvoer voor de variabelen. De dataset en de variabelen worden gepresenteerd in het bijgevoegde Excel-blad.

De aangepaste R ^ 2-waarde is verwaarloosbaar voor deze regressie, wat inhoudt dat de variatie in de afhankelijke variabele niet wordt verklaard door de onafhankelijke variabele. Idealiter zoekt een onderzoeker naar de determinatiecoëfficiënt die het dichtst bij 100% ligt.

Interpretatie

Aangepaste R-kwadraat is een zeer belangrijke output om erachter te komen of de dataset goed past of niet. Iemand doet eigenlijk een regressievergelijking om te valideren of wat hij van de relatie tussen twee variabelen vindt, ook gevalideerd wordt door de regressievergelijking. Hoe hoger de waarde, hoe beter de regressievergelijking, aangezien dit impliceert dat de onafhankelijke variabele die is gekozen om de afhankelijke variabele te bepalen, correct wordt gekozen. Idealiter zoekt een onderzoeker naar de determinatiecoëfficiënt die het dichtst bij 100% ligt.