Kendalls tau
Uit Wikipedia, de vrije encyclopedia
Kendalls rangcorrelatiecoëfficiënt, of kortweg Kendalls т (tau), is in de statistiek een correlatiecoëfficiënt gebaseerd op de rangnummers van de data in plaats van op de data zelf. Het is daarmee een verdelingsvrije maat voor correlatie, ook geschikt voor data die slechts op ordinale schaal gemeten zijn. De coëfficiënt is in 1938 ingevoerd door de Britse statisticus Maurice Kendall en naar deze genoemd.
Laat een steekproef zijn van het tweetal simultaan verdeelde stochastische variabelen en . De toetsingsgrootheid Kendalls т is gedefinieerd door:
- ,
waarin het aantal concordante paren en het aantal discordante paren in de steekproef is. Hierbij wordt een tweetal steekproefelementen slechts eenmaal met elkaar vergeleken. Er zijn in de literatuur definities van de aantallen concordante en discordante paren, waarbij in de telling elk steekproefelement vergeleken wordt met elk ander. De aantallen concordante en discordante paren zijn dan een factor 2 groter dan de hier gedefinieerde.
Als er geen knopen zijn, geldt:
- ,
zodat ook geschreven kan worden als:
In deze definities komen de rangnummers niet expliciet voor. Er is een alternatieve formulering waarin dat wel het geval is en en berekend worden aan de hand van de rangnummers.