Beräkna summan av kvadrater (SSE)

Författare: Charles Brown
Skapelsedatum: 9 Februari 2021
Uppdatera Datum: 1 Juli 2024
Anonim
Beräkna summan av kvadrater (SSE) - Råd
Beräkna summan av kvadrater (SSE) - Råd

Innehåll

Summan av kvadrater, eller SSE, är en preliminär statistisk beräkning som leder till olika datavärden. När du har en uppsättning datavärden är det användbart att kunna avgöra hur nära relaterade dessa värden är. Du måste organisera dina data i en tabell och sedan göra ganska enkla beräkningar. När du har hittat SSE för en datamängd kan du sedan hitta variansen och standardavvikelsen.

Att gå

Metod 1 av 3: Beräkna SSE för hand

  1. Skapa en tre-kolumntabell. Det tydligaste sättet att beräkna SSE är att börja med en tre kolonnstabell. Märk de tre kolumnerna Värde{ displaystyle { text {Value}}}Fyll i detaljerna. Den första kolumnen innehåller värdena för dina mätningar. Fyll i kolumnen Värde{ displaystyle { text {Value}}}Beräkna medelvärdet. Innan du kan beräkna felet för varje mätning måste du beräkna medelvärdet för hela datamängden.
    • Medelvärdet för en datamängd är summan av värdena dividerat med antalet värden i uppsättningen. Detta kan representeras symboliskt med variabeln μ{ displaystyle mu}Beräkna de enskilda felvärdena. I den andra kolumnen i din tabell måste du ange felvärdena för varje datavärde. Felet är skillnaden mellan mätningen och genomsnittet.
      • För den angivna datamängden, subtrahera medelvärdet, 98,87, från varje uppmätt värde och fyll i den andra kolumnen med resultaten. Dessa tio beräkningar går enligt följande:
        • 99,098,87=0,13{ displaystyle 99.0-98.87 = 0.13}Beräkna SSE. I den tredje kolumnen i tabellen, hitta kvadraten för vart och ett av de resulterande värdena i mittkolumnen. Dessa representerar kvadraterna för avvikelsen från medelvärdet för varje uppmätt datavärde.
          • För varje värde i mittkolumnen, använd en räknare för att beräkna kvadraten. Spela in resultaten i tredje kolumnen enligt följande:
            • 0,132=0,0169{ displaystyle 0.13 ^ {2} = 0.0169}Lägg till rutorna för felen. Det sista steget är att hitta summan av värdena i den tredje kolumnen. Det önskade resultatet är SSE, eller summan av kvadraten för felen.
              • För denna datamängd beräknas SSE genom att lägga till de tio värdena i den tredje kolumnen:
              • S.S.E=6,921{ displaystyle SSE = 6.921}Märk kolumnerna i kalkylarket. Du skapar en tabell med tre kolumner i Excel, med samma tre rubriker som ovan.
                • Skriv "Värde" som rubrik i cell A1.
                • I rutan B1 skriver du "Avvikelse" som rubrik.
                • I rutan C1 skriver du "Avvikelse i kvadrat" som rubrik.
              • Ange dina uppgifter. I den första kolumnen måste du ange värdena för dina mätningar. Om satsen är liten kan du enkelt skriva in den för hand. Om du har en stor datamängd kan du behöva kopiera och klistra in data i kolumnen.
              • Bestäm genomsnittet av datapunkterna. Excel har en funktion som beräknar genomsnittet för dig. I en tom cell under din datatabell (det spelar ingen roll vilken cell du väljer) anger du följande:
                • = Genomsnitt (A2: ___)
                • Ange inte tomt utrymme. Fyll i det utrymmet med cellnamnet på din senaste datapunkt. Om du till exempel har 100 datapunkter skulle du använda funktionen:
                  • = Genomsnitt (A2: A101)
                  • Denna funktion innehåller data från cellerna A2 till A101, eftersom den översta raden innehåller kolumnrubrikerna.
                • När du trycker på Enter eller när du klickar på en annan cell i tabellen fylls den nyligen programmerade cellen automatiskt med genomsnittet av dina datavärden.
              • Ange funktionen för felmätningarna. I den första tomma cellen i kolumnen "Avvikelse" anger du en funktion för att beräkna skillnaden mellan varje datapunkt och medelvärdet. För att göra detta, använd cellnamnet där medelvärdet finns. Låt oss anta att du har använt cell A104 för tillfället.
                • Felberäkningsfunktionen som du anger i cell B2 är:
                  • = A2- $ A $ 104. Dollartecknen behövs för att se till att du låser rutan A104 för alla beräkningar.
              • Ange funktionen för fyrkantsfelen. I den tredje kolumnen kan du instruera Excel att beräkna önskad kvadrat.
                • Ange följande funktion i cell C2:
                  • = B2 ^ 2
              • Kopiera funktionerna för att fylla hela tabellen. När du har angett funktionerna i den översta cellen i varje kolumn, B2 respektive C2, måste du fylla i hela tabellen. Du kan skriva in funktionen på vilken rad som helst i tabellen, men det skulle ta alldeles för lång tid. Markera cellerna B2 och C2 tillsammans med musen, och utan att släppa musknappen, dra till den nedre cellen i varje kolumn.
                • Förutsatt att du har 100 datapunkter i din tabell, dra musen till cellerna B101 och C101.
                • När du släpper musknappen kopieras formlerna till alla celler i tabellen. Tabellen bör fyllas automatiskt med de beräknade värdena.
              • Hitta SSE. Kolumn C i din tabell innehåller alla kvadratfelvärden. Det sista steget är att låta Excel beräkna summan av dessa värden.
                • Ange följande funktion i en cell under tabellen, förmodligen C102 i detta exempel:
                  • = Summa (C2: C101)
                • Om du klickar på Enter eller klickar bort i en annan cell i tabellen får du SSE-värdet för dina data.

Metod 3 av 3: Relatera SSE till annan statistik

  1. Beräkna avvikelsen från SSE. Att hitta SSE för en dataset är i allmänhet en byggsten för att hitta andra, mer användbara värden. Den första av dessa är varians. Variansen är ett mått på hur mycket den uppmätta data avviker från medelvärdet. Det är faktiskt medelvärdet av kvadratiska skillnader från medelvärdet.
    • Eftersom SSE är summan av de kvadrerade felen kan du hitta medelvärdet (det är variansen) bara genom att dividera med antalet värden. Men om du beräknar variansen för en provserie, snarare än en hel population, delar du variansen med (n-1) istället för med n. Så:
      • Varians = SSE / n, om du beräknar variansen för en hel population.
      • Varians = SSE / (n-1) vid beräkning av variansen för ett urval av data.
    • För provtagningsproblemet för patienternas temperatur kan vi anta att 10 patienter bara är ett prov. Därför beräknas variansen enligt följande:
      • Variation=SSE(n1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}Beräkna standardavvikelsen för SSE. Standardavvikelse är ett vanligt använt värde som anger hur långt värdena för en datamängd avviker från medelvärdet. Standardavvikelsen är kvadratroten av variansen. Kom ihåg att variansen är medelvärdet av kvadratfelmätningarna.
        • Efter beräkning av SSE kan du därför hitta standardavvikelsen så här:
          • Standardavvikelse=SSEn1{ displaystyle { text {Standardavvikelse}} = { sqrt { frac { text {SSE}} {n-1}}}}Använd SSE för att bestämma kovariansen. Den här artikeln har fokuserat på datamängder som bara mäter ett enda värde åt gången. I många studier kan du dock jämföra två separata värden. Till exempel vill du veta hur dessa två värden relaterar till varandra, inte bara till medelvärdet för datamängden. Detta värde är kovariansen.
            • Beräkningarna för kovarians är för detaljerade för att beskrivas här, förutom att notera att du kommer att använda SSE för varje datatyp och sedan jämföra den. För en mer detaljerad beskrivning av kovariansen och berörda beräkningar kan du hitta artiklar om detta ämne på wikiHow.
            • Som ett exempel på användning av kovarians kan du jämföra patienternas ålder i en medicinsk studie med effektiviteten av ett läkemedel för att sänka febertemperaturen. Då har du en datauppsättning med åldrar och en andra datauppsättning med temperaturer. Du hittar sedan SSE för varje datamängd och därifrån varians, standardavvikelser och kovarians.