Spearmani korrelatsioonikoefitsient
Spearmani korrelatsioonikoefitsient on matemaatikas ja statistikas korrelatsiooni mõõtühik, mis on nimetatud selle tegija Charles Spearmani järgi. Seda kirjutatakse lühendatult kreeka tähega rho ( ρ {\displaystyle \rho } ) või mõnikord kui r s {\displaystyle r_{s}}. . See on arv, mis näitab, kui tihedalt on kaks andmekogumit omavahel seotud. Seda saab kasutada ainult selliste andmete puhul, mida saab järjestada, näiteks kõrgeimast madalaimani.
Üldine valem r s {\displaystyle r_{s}} on ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} .
Näiteks kui teil on andmed selle kohta, kui kallid on erinevad arvutid, ja andmed selle kohta, kui kiired on arvutid, siis võiksite näha, kas need on seotud ja kui tihedalt nad on seotud, kasutades r s {\displaystyle r_{s}} .
Töötab seda välja
Esimene samm
Selleks, et välja arvutada r s {\displaystyle r_{s}}, tuleb kõigepealt järjestada kõik andmed. Kasutame arvutite ja nende kiiruse sissejuhatuses toodud näidet.
Seega oleks madalaima hinnaga arvuti 1. kohal. Sellest kõrgemal asetsev oleks 2. Siis läheb see ülespoole, kuni kõik on järjestatud. Seda tuleb teha mõlema andmekogumiga.
Hind ($) | R a n k 1 {\displaystyle Rank_{1}} | Kiirus (GHz) | R a n k 2 {\displaystyle Rank_{2}} | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
Teine samm
Järgmiseks peame leidma kahe rea vahelise erinevuse. Seejärel korrutatakse see vahe iseendaga, mida nimetatakse ruutkatteks. Erinevust nimetatakse d {\displaystyle d} ja arvu, mille saadakse d {\displaystyle d} ruutu moodustades, nimetatakse d 2 {\displaystyle d^{2}}. .
R a n k 1 {\displaystyle Rank_{1}} | R a n k 2 {\displaystyle Rank_{2}} | d {\displaystyle d} | d 2 {\displaystyle d^{2}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Kolmas samm
Lugege, kui palju andmeid meil on. Need andmed on 1 kuni 5, seega on meil 5 andmestikku. Seda arvu nimetatakse n {\displaystyle n} .
Neljas samm
Lõpuks kasutame kõike, mida oleme seni välja töötanud, selles valemis: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} .
∑ d 2 {\displaystyle \sum d^{2}} tähendab, et võtame kõigi veerus d 2 {\displaystyle d^{2}} olevate arvude summa. . Seda seetõttu, et ∑ {\displaystyle \sum} tähendab kokku.
Niisiis, ∑ d 2 {\displaystyle \sum d^{2}} on 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1+1}, mis on 4. Valem ütleb, et korruta see 6ga, mis on 24.
n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} on 5 × ( 25 - 1 ) {\displaystyle 5\times (25-1)}, mis on 120.
Niisiis, et leida r s {\displaystyle r_{s}} , teeme lihtsalt 1 - 24 120 = 0.8 {\displaystyle 1-{\cfrac {24}{120}}=0.8} .
Seetõttu on Spearmani korrelatsioonikoefitsient selle andmekogumi puhul 0,8.
Mida tähendavad numbrid
r s {\displaystyle r_{s}} annab alati vastuse vahemikus -1 ja 1. Vahepealsed numbrid on nagu skaala, kus -1 on väga tugev seos, 0 ei ole seos ja 1 on samuti väga tugev seos. Erinevus 1 ja -1 vahel seisneb selles, et 1 on positiivne korrelatsioon ja -1 on negatiivne korrelatsioon. Andmete graafik, mille r s {\displaystyle r_s} väärtus on -1, näeks välja nagu näidatud graafik, ainult et joon ja punktid kulgeksid vasakult ülevalt paremale alla.
Näiteks eespool esitatud andmete puhul oli r s {\displaystyle r_{s}} 0,8. Seega tähendab see, et tegemist on positiivse korrelatsiooniga. Kuna see on 1 lähedal, tähendab see, et seos kahe andmekogumi vahel on tugev. Seega võime öelda, et need kaks andmekogumit on omavahel seotud ja tõusevad koos. Kui see oleks -0,8, võiksime öelda, et need on seotud ja kui üks tõuseb, siis teine langeb.
Kui kaks numbrit on samad
Mõnikord on andmete järjestamisel kaks või enam numbrit, mis on samad. Kui see juhtub r s {\displaystyle r_{s}} , võtame samade reitingute keskmist või keskmist. Neid nimetatakse võrdseteks ridadeks. Selleks reastame seotud arvud nii, nagu oleksid nad mitte seotud. Seejärel liidame kokku kõik reastused, mis neil oleks, ja jagame selle arvuga, kui palju neid on. Näiteks ütleme, et me reastame, kui hästi said erinevad inimesed õigekirja testis hakkama.
Testi tulemus | Koht | Koht (seotud) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}=3}} |
6 | 3 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}=3}} |
6 | 4 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}=3}} |
8 | 5 | 5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5} |
8 | 6 | 5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5} |
Neid numbreid kasutatakse täpselt samamoodi nagu tavalisi auastmeid.
Seotud leheküljed
Küsimused ja vastused
K: Mis on Spearmani korrelatsioonikoefitsient?
V: Spearmani korrelatsioonikoefitsient on korrelatsioonimõõdik, mis näitab, kui tihedalt on kaks andmekogumit omavahel seotud. Seda saab kasutada ainult selliste andmete puhul, mida saab järjestada, näiteks kõrgeimast madalaimani.
K: Kes on loonud Spearmani korrelatsioonikoefitsiendi?
V: Charles Spearman lõi Spearmani korrelatsioonikoefitsiendi.
K: Kuidas kirjutatakse Spearmani korrelatsioonikoefitsiendi üldine valem?
V: Spearmani korrelatsioonikoefitsiendi üldine valem on ρ = 1 - 6∑d2/n(n2-1).
K: Millal peaksite kasutama Spearmani ridade korrelatsioonikoefitsienti?
V: Spearmani korrelatsioonikoefitsienti tuleks kasutada siis, kui tahetakse näha, kui tihedalt on kaks andmekogumit omavahel seotud ja kas nad on üldse omavahel seotud.
K: Millist tüüpi andmetega see töötab?
V: See töötab mis tahes tüüpi andmetega, mida saab järjestada, näiteks kõrgeimast madalaimani.
K: Kas saate tuua näite, kus te seda meedet kasutate?
V: Näide, kus te võiksite seda meedet kasutada, võiks olla, kui teil on andmed selle kohta, kui kallid on erinevad arvutid, ja andmed selle kohta, kui kiired on arvutid, siis võiksite näha, kas need on seotud ja kui tihedalt nad on seotud, kasutades r_s.