MODELLI LINEARI APPLICATI
2° Anno - Secondo Semestre
Frequenza Non obbligatoria
- 6 CFU
- 48 ore
- ITALIANO
- Sede di Trieste
- Opzionale
- Convenzionale
- Scritto
- SSD M-PSI/03
- A scelta dello studente
Utilizzare R per caricare, manipolare e trasformare dati di ricerca, anche mediante brevi cicli ricorsivi (for(), repeat(),…).
Utilizzare R per estrarre le componenti principali a partire da numerose variabili correlate tra loro, interpretare le componenti estratte ed utilizzarle come variabili esplicative all’interno di un modello di regressione lineare multiplo.
Utilizzare R per stimare un modello di regressione logistica (Logit) per variabili dipendenti dicotomiche, interpretarne correttamente i coefficienti lineari stimati, eseguire inferenze statistiche sui coefficienti (ed insiemi di essi), valutarne la capacità predittiva mediante l’analisi dell’ area sotto la curva ROC.
Statistica descrittiva ed inferenziale di base, elementi di regressione lineare multipla e analisi della varianza.
Il corso si pone l’obiettivo di introdurre gli studenti di psicologia alle applicazioni avanzate del modello statistico lineare, con particolare riferimento alla riduzione dimensionale dei dati mediante regressione ortogonale (tecnica delle componenti principali, PCA) e all’analisi di variabili dipendenti dicotomiche (modello Logit). Durante il corso verranno introdotti elementi di algebra lineare e di programmazione in linguaggio R, utili alla comprensione e successiva applicazione delle complesse tecniche affrontate.
Dispense fornite dal docente,
alcuni capitoli ed esempi tratti dal testo Agresti A. (1990) Categorical Data Analysis, New York, Wiley. Disponibile in consultazione presso la biblioteca di San Giovanni: https://www.biblio.units.it/SebinaOpac/resource/categorical-data-analysis/TSA00257281
Elementi di statistica descrittiva e inferenziale con R
Regressione lineare con R: due variabili esplicative continue, due variabili esplicative categoriali (Anova), una variabile esplicativa continua ed una categoriale (Ancova).
Algebra lineare: elementi e applicazioni con R (prodotto interno/esterno di vettori e matrici, rango di una matrice, determinante di una matrice, matrice inversa, autovalori e autovettori)
Analisi delle componenti principali: elementi teorici e applicazione in R.
La stima di massima verosimiglianza: (a) il caso della probabilità stimata di successo in “n” prove (di Bernoulli) (b) il caso del modello di regressione lineare (con errore normale).
Il modello di regressione logistica (Logit): introduzione, interpretazione dei coefficienti stimati e analisi di una tabella di contingenza 2x2 (ODDS RATIO).
Il modello di regressione logistica (Logit): interpretazione dei coefficienti nel caso di più variabili esplicative continue e categoriali.
Il modello di regressione logistica (Logit): approfondimento sulla stima di massima verosimiglianza dei coefficienti e sulla natura non lineare del modello predittivo per le probabilità di successo.
Inferenza statistica sui singoli coefficienti del modello (Wald test), bontà dell’adattamento e test statistico (Chi-square) per insiemi di coefficienti, test statistico per combinazioni lineari di coefficienti (differenza tra coefficienti, Metodo Delta).
Introduzione alla curva ROC e sua applicazione per quantificare la capacità predittiva di un modello Logit; selezione di un ristretto numero di predittori mediante analisi e confronto statistico dell’area sotto le curve ROC (AUC, DeLong test)
Lezioni frontali durante le quali verranno introdotte le basi teoriche delle tecniche affrontate, comprensive di applicazioni pratiche in R che gli studenti potranno direttamente eseguire sui loro calcolatori, implementando gli script di analisi forniti a lezione.
No
Vista la complessità degli argomenti trattati, agli studenti verranno proposti degli esercizi alla fine di ogni lezione da svolgere singolarmente (o in piccoli gruppi, max 2/3) e da restituire sotto forma di brevissime relazioni (o script di analisi svolte con R) che contribuiranno alla valutazione finale. L’esame finale si svolgerà mediante l’uso del calcolatore e prevedrà lo svolgimento di alcune analisi di dati con R.