gray metal cubes decorative

Analisi di regressione: come si interpreta l’R-quadrato e si valuta la bontà di adattamento?

Dopo aver adattato un modello lineare utilizzando analisi di regressione, ANOVA o DOE, è necessario determinare in che misura il modello si adatta ai dati.
I software statistici presentano una varietà di statistiche sulla bontà di adattamento.

black blue and red graph illustration
Photo by Burak K on Pexels.com

In questo post, esploreremo la statistica R quadrato (R2), alcuni dei suoi limiti e scopriremo alcune sorprese lungo il percorso.
Ad esempio, valori di R quadrato bassi non sono sempre negativi e valori di R quadrato alti non sono sempre buoni!

COS’E ‘LA BONTA’ DI ADATTAMENTO PER UN MODELLO LINEARE?
La regressione lineare calcola un’equazione che riduce al minimo la distanza tra la linea DI REGRESSIONE e tutti i punti dati. Tecnicamente, la regressione dei minimi quadrati ordinari (OLS) riduce al minimo la somma dei residui quadrati.
In generale, un modello si adatta bene ai dati se le differenze tra i valori osservati ei valori previsti del modello sono piccole e imparziali.

Prima di esaminare le misure statistiche per la bontà di adattamento, è necessario controllare i grafici dei residui. I grafici dei residui possono rivelare modelli residui indesiderati che indicano risultati distorti in modo più efficace dei numeri.

CHE COS’È R al Quadrato?
R-quadrato è una misura statistica di quanto i dati sono vicini alla linea di regressione adattata. È anche noto come coefficiente di determinazione o coefficiente di determinazione multipla per la regressione multipla.

La definizione di R quadrato è abbastanza semplice; è la percentuale della variazione della variabile di risposta spiegata da un modello lineare. O:

R-quadrato = Varianza spiegata / Varianza totale

R-quadrato è sempre compreso tra 0 e 100%:

0% indica che il modello non spiega la variabilità dei dati di risposta intorno alla sua media.
100% indica che il modello spiega tutta la variabilità dei dati di risposta intorno alla sua media.
In generale, maggiore è l’R quadrato, migliore è il modello che si adatta ai dati. Tuttavia, ci sono condizioni importanti per questa linea guida.

LIMITAZIONI PRINCIPALI DI R al Quadrato
R-quadrato non è in grado di determinare se le stime e le previsioni dei coefficienti sono distorte, motivo per cui è necessario valutare i grafici dei residui.

R-quadrato non indica se un modello di regressione è adeguato. Puoi avere un valore R quadrato basso per un buon modello o un valore R quadrato alto per un modello che non si adatta ai dati!

R al Quadrato in sintesi
R al Quadrato è una misura pratica e apparentemente intuitiva di quanto il modello lineare si adatti a una serie di osservazioni. Tuttavia, come abbiamo visto, R al Quadrato non ci racconta l’intera storia.
I valori R-quadrato insieme ai grafici dei residui, altre statistiche del modello e conoscenza dell’area tematica sono necessari per completare il quadro (scusate il gioco di parole).

Sebbene R al Quadrato fornisca una stima della forza della relazione tra il modello e la variabile di risposta, non fornisce un test di ipotesi formale per questa relazione.

Il test F di significatività complessiva determina se questa relazione è statisticamente significativa.

F =([Somma dei quadrati dei residui]ridotto − [Somma dei quadrati dei residui]completo)/d
___________________________________________________________
[Somma dei quadrati dei residui]completo/(n − p − 1)

Nel mio prossimo blog, continueremo con il tema che R-quadrato di per sé è incompleto e guarderemo altri due tipi di R-quadrato: R-quadrato corretto e R-quadrato previsto. Queste due misure risolvono problemi specifici al fine di fornire informazioni aggiuntive mediante le quali è possibile valutare il potere esplicativo del modello di regressione.

chevron_left
chevron_right
%d blogger hanno fatto clic su Mi Piace per questo: