Scheefheid

Scheefheid Betekenis

Skewness beschrijft hoeveel statistische gegevensverdeling asymmetrisch is ten opzichte van de normale verdeling, waarbij de verdeling gelijkelijk is verdeeld aan elke kant. Als een verdeling niet symmetrisch of normaal is, dan is hij scheef, dwz het is ofwel de frequentieverdeling scheef naar links of naar rechts.

Soorten scheefheid

Als de verdeling symmetrisch is, heeft deze een scheefheid van 0 & zijn gemiddelde = mediaan = modus.

Dus eigenlijk zijn er twee soorten -

  • Positief : de distributie is positief scheef wanneer de meeste distributiefrequentie aan de rechterkant van de distributie ligt en een langere en dikkere rechterstaart heeft. Waarbij de verdeling Gemiddelde> mediaan> Modus is.
  • Negatief : de distributie is negatief scheef wanneer de meeste distributiefrequentie aan de linkerkant van de distributie ligt en een langere en dikkere linkerstaart heeft. Waarbij de verdeling Gemiddelde <Mediaan <Modus.

Formule

Skewness-formule wordt weergegeven zoals hieronder -

Er zijn verschillende manieren om de scheefheid van de gegevensverdeling te berekenen. Een daarvan zijn de eerste en tweede coëfficiënten van Pearson.

  • Pearson's eerste coëfficiënten (Mode Skewness): Het is gebaseerd op de gemiddelde, modus en standaarddeviatie van de verdeling.

Formule: (gemiddelde - modus) / standaarddeviatie.

  • Pearson's tweede coëfficiënten (Median Skewness): Het is gebaseerd op de gemiddelde, mediaan en standaarddeviatie van de verdeling.

 Formule: (gemiddelde - mediaan) / standaarddeviatie.

Zoals je hierboven kunt zien, heeft de eerste scheefheidscoëfficiënt van Pearson de modus als de enige variabele om het te berekenen en het is alleen nuttig wanneer gegevens een meer herhalend getal in de gegevensset hebben, zoals wanneer er maar een paar Repetitieve gegevens in de gegevensset zijn naar modus, dan is Pearson's tweede scheefheidscoëfficiënt een meer betrouwbare maatstaf voor de centrale tendens, aangezien het de mediaan van de dataset beschouwt in plaats van de modus.

Bijvoorbeeld:

Gegevensverzameling (a): 7,8,9,4,5,6,1,2,2,3.

Gegevensverzameling (b): 7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,2,3.

Voor beide datasets kunnen we concluderen dat de modus 2 is. Maar het heeft geen zin om Pearson's eerste scheefheidscoëfficiënt voor dataset (a) te gebruiken, aangezien nummer 2 slechts twee keer voorkomt in de dataset, maar het kan worden gebruikt om voor dataset (b) omdat deze een meer repetitieve modus heeft.

Een andere manier om scheefheid te berekenen door de onderstaande formule te gebruiken:

  • = Willekeurige variabele.
  • X = distributiegemiddelde.
  • N = Totale variabele in de distributie.
  • α = standaarddeviatie.

Voorbeeld van scheefheid

Laten we, om dit concept in meer detail te begrijpen, naar het onderstaande voorbeeld kijken:

U kunt deze Skewness Excel-sjabloon hier downloaden - Skewness Excel-sjabloon

In XYZ management college overweegt 30 laatstejaars student een baan bij het QPR-onderzoeksbureau en hun compensaties zijn gebaseerd op de academische prestaties van de student en eerdere werkervaring. Hieronder staan ​​de gegevens van de vergoeding van de student in onderzoeksbureau PQR.

Oplossing

Gebruik onderstaande gegevens

Berekening van distributiegemiddelde 

  • = ($ 400 * 12 + $ 500 * 8 + $ 700 * 5 + $ 850 * 3 + $ 1000 * 2) / 30
  • Distributiegemiddelde = 561,67

Berekening van standaarddeviatie

  • Standaarddeviatie = √ {(Som van het deviatiekwadraat * Aantal leerlingen) / N}.
  • Standaarddeviatie = 189,16

Berekening van scheefheid kan als volgt worden gedaan -

  • Scheefheid: (som van de deviatie-kubus) / (N-1) * Standaard deviatie-kubus.
  • = (106374650.07) / (29 * 6768161.24)
  • = 0,54

Daarom vertelt de waarde van 0,54 ons dat distributiegegevens enigszins scheef staan ​​ten opzichte van de normale distributie.

Voordelen

  • Skewness is beter om de prestatie van het beleggingsrendement te meten.
  • De belegger gebruikt dit bij het analyseren van de dataset, aangezien hij rekening houdt met het uiterste van de distributie in plaats van alleen te vertrouwen op de
  • Het is een veelgebruikt hulpmiddel in de statistieken omdat het helpt te begrijpen hoeveel gegevens asymmetrisch zijn ten opzichte van de normale verdeling.

Nadelen

  • Scheefheid varieert van negatief oneindig tot positief oneindig en het wordt soms moeilijk voor een investeerder om de trend in de dataset te voorspellen.
  • Een analist voorspelt de toekomstige prestaties van een actief met behulp van het financiële model dat er meestal van uitgaat dat gegevens normaal worden verdeeld, maar als de verdeling van gegevens scheef is, zal dit model niet het werkelijke resultaat weerspiegelen in zijn veronderstelling.

Belang

In de statistieken speelt het een belangrijke rol wanneer distributiegegevens niet normaal worden verdeeld. De extreme datapunten in de dataset kunnen ertoe leiden dat de datadistributie naar links scheef komt te staan ​​(dwz extreme data in de dataset zijn kleiner, die skew dataset negatief, wat betekent dat

Original text


modus). Het helpt een belegger met een korte houdperiode om de gegevens te analyseren om de trend te identificeren, die aan het uiterste einde van de uitkering valt.

Gevolgtrekking

Scheefheid is simpelweg hoeveel gegevensset afwijkt van de normale verdeling. Een grotere negatieve waarde in de dataset betekent dat de distributie negatief scheef is en een grotere positieve waarde in de dataset betekent dat de distributie positief is verdeeld. Het is een goede statistische maat die de belegger helpt om het rendement van de uitkering te voorspellen.