

Ci sono solo una manciata di passaggi nella regressione lineare.
Calcolare la media della variabile X.
Calcolare la differenza tra ogni X e la media X. (Xi-Xmedio)
Elevare al quadrato le differenze e somma tutto.
Questo è SSxx.
Calcolare la media della variabile Y.
Moltiplicare le differenze (di X e Y dalle rispettive medie) e sommale tutte insieme.
Questo è SSxy.
Utilizzando SSxx e SSxy, si calcola l’intercetta sottraendo SSxx / SSxy * AVG (X) da AVG (Y).
Utilizzando il set di dati di esempio, ecco i calcoli.
Mese | Spesa | x̄ – x | (x̄-x)^2 | vendite | ȳ-y | (x̄ – x)*(ȳ – y) |
---|---|---|---|---|---|---|
1 | 1000 | 5541.67 | 30,710,069.44 | 9914 | 60956.33 | 337,799,680.56 |
2 | 4000 | 2541.67 | 6,460,069.44 | 40487 | 30383.33 | 77,224,305.56 |
3 | 5000 | 1541.67 | 2,376,736.11 | 54324 | 16546.33 | 25,508,930.56 |
4 | 4500 | 2041.67 | 4,168,402.78 | 50044 | 20826.33 | 42,520,430.56 |
5 | 3000 | 3541.67 | 12,543,402.78 | 34719 | 36151.33 | 128,035,972.22 |
6 | 4000 | 2541.67 | 6,460,069.44 | 42551 | 28319.33 | 71,978,305.56 |
7 | 9000 | -2458.33 | 6,043,402.78 | 94871 | -24000.67 | 59,001,638.89 |
8 | 11000 | -4458.33 | 19,876,736.11 | 118914 | -48043.67 | 214,194,680.56 |
9 | 15000 | -8458.33 | 71,543,402.78 | 158484 | -87613.67 | 741,065,597.22 |
10 | 12000 | -5458.33 | 29,793,402.78 | 131348 | -60477.67 | 330,107,263.89 |
11 | 7000 | -458.33 | 210,069.44 | 78504 | -7633.67 | 3,498,763.89 |
12 | 3000 | 3541.67 | 12,543,402.78 | 36284 | 34586.33 | 122,493,263.89 |
MEDIE | 6541.67 | 70870.33 | ||||
SOMME | 202729166.67 | 2153428833.33 |
I campi somma sono SSxx e SSxy (rispettivamente).
Per CALCOLARE il coefficiente di regressione dividiamo la covarianza di X e Y (SSxy) per la varianza in X (SSxx)
Coefficiente angolare = SSxy / SSxx
= 2153428833.33 / 202729166.67 = 10.62219546
L’intercetta è il “valore” che il modello deve compensare per il caso medio.
Intercetta = MEDIA (Y) – Pendenza * MEDIA (X)
Intercetta = 70870,33 – 10,62219546 * 6541,67 = 1.383,471380
Ora abbiamo la nostra semplice equazione di regressione lineare.
Y = 1.383,471380 + 10,62219546 * X