Hur man beräknar den linjära korrelationskoefficienten

Innehåll

Steg
Metod 1 av 4: Beräkning av korrelationskoefficienten manuellt
Metod 2 av 4: Använda onlinekalkylatorer för att beräkna korrelationskoefficienten
Metod 3 av 4: Använda en grafräknare
Metod 4 av 4: Förklara grundläggande begrepp
Tips
Varningar

Korrelationskoefficienten (eller linjär korrelationskoefficienten) betecknas som "r" (i sällsynta fall som "ρ") och karakteriserar den linjära korrelationen (det vill säga förhållandet som ges av något värde och riktning) av två eller flera variabler. Värdet på koefficienten ligger mellan -1 och +1, det vill säga att korrelationen kan vara både positiv och negativ. Om korrelationskoefficienten är -1 finns det en perfekt negativ korrelation; om korrelationskoefficienten är +1 finns det en perfekt positiv korrelation. Annars finns det en positiv korrelation mellan de två variablerna, en negativ korrelation eller ingen korrelation. Korrelationskoefficienten kan beräknas manuellt, med gratis onlinekalkylatorer eller med en bra grafräknare.

Steg

Metod 1 av 4: Beräkning av korrelationskoefficienten manuellt

1 Samla in data. Innan du börjar beräkna korrelationskoefficienten, studera dessa par av tal. Bättre att skriva ner dem i ett bord som kan ordnas vertikalt eller horisontellt. Märk varje rad eller kolumn med "x" och "y".
- Till exempel, givet fyra par värden (siffror) för variablerna "x" och "y". Du kan skapa följande tabell:
  - x || y
  - 1 || 1
  - 2 || 3
  - 4 || 5
  - 5 || 7
2 Beräkna det aritmetiska medelvärdet "x". För att göra detta, lägg till alla x -värden och dividera sedan resultatet med antalet värden.
- I vårt exempel finns det fyra värden för variabeln "x". För att beräkna det aritmetiska medelvärdet "x", lägg till dessa värden och dela sedan summan med 4. Beräkningarna är skrivna enligt följande:
- ${ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}$
- ${ displaystyle mu _ {x} = 12/4}$
- ${ displaystyle mu _ {x} = 3}$
3 Hitta det aritmetiska medelvärdet "y". För att göra detta, följ samma steg, det vill säga lägga till alla y -värden och dela sedan summan med antalet värden.
- I vårt exempel ges fyra värden för variabeln "y". Lägg till dessa värden och dela sedan summan med 4. Beräkningarna kommer att skrivas enligt följande:
- ${ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}$
- ${ displaystyle mu _ {y} = 16/4}$
- ${ displaystyle mu _ {y} = 4}$
4 Beräkna standardavvikelsen "x". Efter beräkning av medelvärdet för "x" och "y", hitta standardavvikelserna för dessa variabler. Standardavvikelsen beräknas med följande formel:
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}$
- I vårt exempel kommer beräkningarna att skrivas så här:
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}}$
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}}$
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}$
- ${ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}$
- ${ displaystyle sigma _ {x} = 1.83}$
5 Beräkna standardavvikelsen "y". Följ stegen som beskrivs i föregående steg. Använd samma formel, men koppla in y -värdena.
- I vårt exempel kommer beräkningarna att skrivas så här:
- ${ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}}$
- ${ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}}$
- ${ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}$
- ${ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}$
- ${ displaystyle sigma _ {y} = 2,58}$
6 Skriv ner grundformeln för beräkning av korrelationskoefficienten. Denna formel inkluderar medelvärden, standardavvikelser och antalet (n) av parpar av båda variablerna. Korrelationskoefficienten betecknas som "r" (i sällsynta fall som "ρ"). Denna artikel använder en formel för att beräkna Pearson -korrelationskoefficienten.
- ${ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } höger) * vänster ({ frac {y- mu _ {y}} { sigma _ {y}}} höger)}$
- Här och i andra källor kan kvantiteter betecknas på olika sätt. Till exempel innehåller vissa formler “ρ” och “σ”, medan andra innehåller “r” och “s”. Vissa läroböcker ger olika formler, men de är matematiska motsvarigheter till ovanstående formel.
7 Beräkna korrelationskoefficienten. Du har beräknat medelvärden och standardavvikelser för båda variablerna, så du kan använda formeln för att beräkna korrelationskoefficienten. Kom ihåg att "n" är antalet par av värden för båda variablerna. Andra värden har beräknats tidigare.
- I vårt exempel kommer beräkningarna att skrivas så här:
- ${ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } höger) * vänster ({ frac {y- mu _ {y}} { sigma _ {y}}} höger)}$
- ${ displaystyle rho = left ({ frac {1} {3}} right) *}$ [ ${ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} höger) * vänster ({ frac {3-4} {2.58}} höger)}$
  ${ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1.83}} höger) * vänster ({ frac {7-4} {2.58}} höger)}$ ]
- ${ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}$
- ${ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}$
- ${ displaystyle rho = left ({ frac {2 965} {3}} right)}$
- ${ displaystyle rho = 0.988}$
8 Analysera resultatet. I vårt exempel är korrelationskoefficienten 0,988. Detta värde karakteriserar på något sätt en given uppsättning par par. Var uppmärksam på tecknet och storleken på värdet.
- Eftersom korrelationskoefficientens värde är positivt finns det en positiv korrelation mellan variablerna "x" och "y". Det vill säga, när värdet på "x" ökar, ökar också värdet på "y".
- Eftersom värdet på korrelationskoefficienten är mycket nära +1, är värdena för variablerna "x" och "y" starkt korrelerade. Om du sätter punkter på koordinatplanet kommer de att ligga nära en rak linje.

Metod 2 av 4: Använda onlinekalkylatorer för att beräkna korrelationskoefficienten

1 Hitta en miniräknare på Internet för att beräkna korrelationskoefficienten. Denna koefficient beräknas ofta i statistiken. Om det finns många par par är det nästan omöjligt att beräkna korrelationskoefficienten manuellt. Därför finns det onlinekalkylatorer för att beräkna korrelationskoefficienten. I en sökmotor anger du "korrelationskoefficientkalkylator" (utan citattecken).
2 Ange data. Kontrollera instruktionerna på webbplatsen för att ange rätt data (nummerpar). Det är absolut nödvändigt att ange lämpliga par nummer; annars får du fel resultat. Kom ihåg att olika webbplatser har olika inmatningsformat.
- Till exempel, på http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, anges värdena för variablerna x och y i två horisontella linjer. Värdena separeras med kommatecken. Det vill säga i vårt exempel anges värdena "x" så här: 1,2,4,5 och värdena "y" så här: 1,3,5,7.
- På en annan webbplats, http://www.alcula.com/calculators/statistics/correlation-coefficient/, matas data in vertikalt; i det här fallet, förväxla inte motsvarande par med tal.
3 Beräkna korrelationskoefficienten. När du har angett data klickar du helt enkelt på knappen "Beräkna", "Beräkna" eller liknande för att få resultatet.

Metod 3 av 4: Använda en grafräknare

1 Ange data. Ta en grafräknare, gå in i statistiskt beräkningsläge och välj kommandot "Redigera".
- Olika räknare kräver att olika knappar trycks in. Denna artikel diskuterar Texas Instruments TI-86-räknaren.
- Tryck på [2: a] - Stat (ovanför + -tangenten) för att öppna statistikberäkningsläget. Tryck sedan på F2 - Redigera.
2 Radera tidigare sparade data. De flesta räknare behåller den statistik du anger tills du raderar dem. För att undvika att förväxla gamla data med nya, ta först bort all lagrad information.
- Använd piltangenterna för att flytta markören och markera rubriken 'xStat'. Tryck sedan på Rensa och Enter för att rensa alla värden som anges i kolumnen xStat.
- Använd piltangenterna för att markera rubriken 'yStat'. Tryck sedan på Rensa och Enter för att rensa alla värden som anges i kolumnen yStat.
3 Ange inledande data. Använd piltangenterna för att flytta markören till den första cellen under rubriken "xStat". Ange det första värdet och tryck på Enter. Längst ner på skärmen visas "xStat (1) = __", där det angivna värdet ersätter ett mellanslag. När du har tryckt på Enter visas det angivna värdet i tabellen och markören flyttar till nästa rad; detta visar "xStat (2) = __" längst ner på skärmen.
- Ange alla värden för variabeln "x".
- När du har angett alla värden för x, använd piltangenterna för att navigera till kolumnen yStat och ange värdena för y.
- När du har angett alla par av nummer trycker du på Avsluta för att rensa skärmen och lämna aggregeringsläget.
4 Beräkna korrelationskoefficienten. Det kännetecknar hur nära data är till en viss rak linje. Grafräknaren kan snabbt bestämma den lämpliga raka linjen och beräkna korrelationskoefficienten.
- Klicka på Stat - Calc. Tryck på [2nd] - [Stat] - [F1] på TI -86.
- Välj funktionen Linjär regression. På TI-86, tryck på [F3] som är märkt "LinR". Skärmen visar raden "LinR _" med en blinkande markör.
- Ange nu namnen på två variabler: xStat och yStat.
  - Öppna listan över namn på TI-86; för att göra detta, tryck på [2nd] - [List] - [F3].
  - De tillgängliga variablerna visas på skärmens nedre rad. Välj [xStat] (du måste förmodligen trycka på F1 eller F2 för att göra detta), ange ett komma och välj sedan [yStat].
  - Tryck på Enter för att bearbeta inmatade data.
5 Analysera dina resultat. Genom att trycka på Enter kommer följande information att visas på skärmen:
- ${ displaystyle y = a + bx}$ : detta är funktionen som beskriver raden. Observera att funktionen inte är skriven i standardform (y = kx + b).
- ${ displaystyle a =}$ ... Detta är y-koordinaten för skärningspunkten mellan den raka linjen och y-axeln.
- ${ displaystyle b =}$ ... Detta är linjens lutning.
- ${ displaystyle { text {corr}} =}$ ... Detta är korrelationskoefficienten.
- ${ displaystyle n =}$ ... Detta är antalet par nummer som användes vid beräkningarna.

Metod 4 av 4: Förklara grundläggande begrepp

1 Förstå begreppet korrelation. Korrelation är det statistiska sambandet mellan två kvantiteter. Korrelationskoefficienten är ett numeriskt värde som kan beräknas för två datauppsättningar. Värdet på korrelationskoefficienten ligger alltid i intervallet från -1 till +1 och kännetecknar graden av samband mellan två variabler.
- Till exempel med tanke på barnens längd och ålder (cirka 12 år). Mest troligt kommer det att finnas en stark positiv korrelation, eftersom barn blir längre med åldern.
- Ett exempel på en negativ korrelation: straffsekunder och tid som används i skidskyttsträning, det vill säga ju mer en idrottare tränar, desto färre straffsekunder kommer att tilldelas.
- Slutligen finns det ibland mycket liten korrelation (positiv eller negativ), till exempel mellan skostorlek och matematikpoäng.
2 Kom ihåg hur du räknar ut det aritmetiska medelvärdet. För att beräkna det aritmetiska medelvärdet (eller medelvärdet) måste du hitta summan av alla dessa värden och sedan dela det med antalet värden. Kom ihåg att det aritmetiska medelvärdet behövs för att beräkna korrelationskoefficienten.
- Medelvärdet för en variabel indikeras med en bokstav med en horisontell stapel ovanför. Till exempel, när det gäller variablerna "x" och "y", betecknas deras medelvärden enligt följande: x̅ och y̅. Medelvärdet betecknas ibland med den grekiska bokstaven "μ" (mu). För att skriva det aritmetiska medelvärdet för värdena för variabeln "x", använd notationen μ_x eller μ (x).
- Till exempel med tanke på följande värden för variabeln "x": 1,2,5,6,9,10. Det aritmetiska medelvärdet för dessa värden beräknas enligt följande:
  - ${ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}$
  - ${ displaystyle mu _ {x} = 33/6}$
  - ${ displaystyle mu _ {x} = 5,5}$
3 Observera vikten av standardavvikelsen. I statistiken karakteriserar standardavvikelsen i vilken utsträckning siffror sprids i förhållande till deras medelvärde. Om standardavvikelsen är liten är siffrorna nära medelvärdet; om standardavvikelsen är stor är siffrorna långt ifrån medelvärdet.
- Standardavvikelse indikeras med bokstaven "s" eller den grekiska bokstaven "σ" (sigma). Således betecknas standardavvikelsen för värdena för variabeln "x" enligt följande: s_x eller σ_x.
4 Kom ihåg symbolen för summeringsoperationen. Summationssymbolen är en av de vanligaste symbolerna i matematik och anger summan av värden. Denna symbol är den grekiska bokstaven "Σ" (versa).
- Om till exempel följande värden för variabeln "x" ges: 1,2,5,6,9,10, betyder Σx:
  - 1 + 2 + 5 + 6 + 9 + 10 = 33.

Tips

Korrelationskoefficienten kallas ibland "Pearson -korrelationskoefficienten" efter dess utvecklare Carl Pearson.
I de flesta fall, när korrelationskoefficienten är större än 0,8 (positiv eller negativ), finns det en stark korrelation; om korrelationskoefficienten är mindre än 0,5 (positiv eller negativ) observeras en svag korrelation.

Varningar

Korrelation kännetecknar förhållandet mellan värdena på två variabler. Men kom ihåg att korrelation inte har något att göra med orsakssamband. Om du till exempel jämför människors längd och skostorlek kommer du sannolikt att hitta en stark positiv korrelation. I allmänhet, ju längre personen är, desto större är skostorleken. Men det betyder inte att en höjning av höjden leder till en automatisk ökning av skostorlek, eller att större fötter kommer att leda till snabbare tillväxt. Dessa mängder hänger helt enkelt samman.