METODOLOGIA SCIENTIFICA DELLA RICERCA
Primo Semestre
Frequenza Obbligatoria
- 4 CFU
- 48 ore
- ITALIANO
- Sede di Trieste
- Obbligatoria
- Orale
- SSD INF/01, MED/01
Structured into the following modules:
Il principale obiettivo di questo corso integrato è anzitutto acquisire gli strumenti di statistica descrittiva di base, che consentano di saper raccogliere dei dati su un argomento di interesse, descriverli ed interpretarli in modo critico. Vengono poi introdotte anche alcune nozioni di statistica inferenziale, utili per le procedure di verifica delle ipotesi dal campione rilevato rispetto alla popolazione di provenienza. Inoltre, si daranno alcune nozioni di base sull’utilizzo del software statistico free “R”.
Inoltre, verranno fornite delle competenze elementari di informatica con particolare riguardo alla gestione dei dati, nozioni elementari di programmazione e introduzione alle idee dell’intelligenza artificiale.
Conoscenza e capacità di comprensione: conoscere elementi di Statistica descrittiva, di applicazioni di calcolo delle probabilità, di Statistica Inferenziale, strumenti necessari per la professione di medico. Comprendere e gestire i problemi della memorizzazione e recupero dei dati. Comprendere sommariamente le promesse, le sfide e i limiti delle nuove tecniche di Intelligenza artificiale.
Capacità di applicare conoscenza e comprensione: essere in grado di leggere e di applicare elementi di Statistica a sperimentazioni e ricerche in ambito medico. Capacità di archiviare e manipolare autonomamente collezioni di dati per elaborare informazioni scientifiche o cliniche.
Autonomia di giudizio: essere in grado di valutare in maniera critica risultati di sperimentazioni e articoli scientifici con presenza di raccolta e analisi di dati.
Abilità comunicative: essere in grado di esprimersi in modo appropriato sui temi di base della Statistica su applicazioni di tipo biomedico-sanitarie, anche in vista del progetto di tesi di Laurea. Capacità di trasferire ed acquisire dati nei corretti formati di scambio.
Capacità di apprendimento: essere in grado di cogliere gli elementi salienti di nuove tematiche, in particolare sulla metodologia della ricerca e sull'elaborazione dei dati in ambito biomedico.
matematica e statistica di base
Richiami di statistica descrittiva con esempi ed applicazioni
Richiami di elementi di calcolo delle probabilità e del suo utilizzo in ambito biomedico.
Il Rischio Relativo e l'Odds Ratio. Esempi.
popolazioni di dati gaussiani e loro proprietà; altre principali distribuzioni di probabilità.
STATISTICA INFERENZIALE
1. Intervalli di confidenza per la media, intervalli di confidenza per una proporzione.
2. Verifica d'ipotesi: livello di significatività, p-value.
3. Verifica d’ipotesi sulla media.
4. Verifica di ipotesi su medie e proporzioni di due popolazioni.
Per la parte di informatica: Introduzione ai Principi base dell’Informatica Medica. Come è organizzato un computer. Il concetto di Algoritmo. Elementi di Intelligenza Artificiale e di Machine Learning per la Medicina. Learning vs Fitting. Supervised e Unsupervised Learning. Cosa è il Training. Reti Neurali e Deep Learning. Il concetto di generalizzazione.. Applicazioni in Medicina di supervised e di unsupervised learning. Cosa è la Generative AI. Il concetto di attenzione. Large Language Models: C. Apprendimento umano e delle macchina. Applicazioni in ricerca medica e nella pratica medica Memorizzazione e manipolazione dei dati: Fogli di calcolo versus database. Introduzione ai principi Base delle Basi di Dati Relazionali. Il modello dei dati relazionali. Progettazione, implementazione, popolamento, interrogazione di una base di dati relazionale. Esemplificazioni in DB MS Access: creazione di una base di dati; “Querying by Example”, con particolare riferimento a interrogazioni di aggregazione dei dati per supporto decisionale. Altri modelli dei dati: DB documentali e DB a grafo. Anonimizzazione dei dati medici, e modalità di “hacking” di basi di dati.
Marc M. Triola, Mario F. Triola. Fondamenti di statistica. Per le discipline biomediche. Pearson, 2017. W.W. Daniel, C.L. Cross. Biostatistica - Concetti di base per l' analisi statistica delle scienze dell' area medico – sanitaria. EdiSES, 2019. M.Bland, Statistica Medica, Seconda Edizione, APOGEO. P.Armitage, G.Berry “Statistical Methods in Medical Research”, Third Edition, Blackwell Science.
Per IA: R. Borhani, S. Borhani, A.K. Katsaggelos, Fundamentals of Machine Learning and Deep Learning in Medicine, Springer, 2022
Per le basi di dati: L. Alluri, U. Nanni, Fondamenti di basi di dati, Hoepli 20
Slides dei Docenti.
INTRODUZIONE
L'uso del metodo statistico e dei principi statistici in ambito clinico ed epidemiologico.
STATISTICA DESCRITTIVA:
1. Rappresentazione dei dati: tabelle e grafici. Frequenze assolute e frequenze relative, percentuali e cumulative
2. Misure di sintesi numerica. Misure di “tendenza centrale”: medie, mediana, moda e loro confronto.
3. Misure di “dispersione”: intervallo di variazione, varianza, scarto quadratico medio, coefficiente di variazione, percentili. I boxplot.
4. Analisi della relazione tra due variabili: tabelle a doppia entrata, diagramma di dispersione, correlazione.
ELEMENTI DI CALCOLO DELLE PROBABILITÀ
1. Le regole e i teoremi elementari.
2. Distribuzioni di probabilità discrete e continue. Distribuzione binomiale e normale.
STATISTICA INFERENZIALE
1. Campionamento e distribuzione campionarie. Il teorema del limite centrale.
2. Intervalli di confidenza per la media, intervalli di confidenza per una proporzione.
3. Test ipotesi: ipotesi nulla e alternativa, errori del I e II tipo, livello di significatività, definizione e l'interpretazione del valore p.
4. Verifica d’ipotesi sulla media.
5. Verifica di ipotesi su medie e proporzioni di due popolazioni.
Introduzione ai Principi base dell’Informatica Medica. Come è organizzato un computer. Il concetto di Algoritmo. Cosa è un programma. Compilatori e interpreti. Elementi di Intelligenza Artificiale e di Machine Learning per la Medicina. Learning vs Fitting. Statistica Classica vs Machine Learning. Supervised e Unsupervised Learning. Cosa è il Training. La Loss e la sua Minimizzazione della Loss. Il concetto di overfitting. Il concetto di Garbage In Garbage Out (GIGO). Il neurone artificiale. Reti Neurali e Deep Learning. Il concetto di generalizzazione. Le Reti Neurali Convoluzionali. Applicazioni in Medicina di supervised e di unsupervised learning. Cosa è la Generative AI. Il concetto di attenzione. Large Language Models: ChatGPT (e/o altri strumenti disponibili) e sue applicazioni in medicina. Capire l’impatto che la IA sta avendo e avrà sempre di più in medicina e nel modo in cui i pazienti vivono il rapporto coi medici. Apprendimento umano vs machine learning e altri temi etico-filosofici. Commento critico di alcuni articoli milestones di applicazione del Machine Learning in Medicina.
Parte di gestione dati. Sistemi informativi in medicina. Introduzione ai principi Base delle Basi di Dati Relazionali. Il modello relazionale dei dati. Progettazione di un base di dati relazionale. Creazione delle tabelle e definizione dei vincoli di chiave di dominio di integrità referenziale. Popolamento della base di dati (inserimento di dati manuale, da file, da interrogazione). Esemplificazioni in DB MS Access “Querying by Example”, con particolare riferimento a query di aggregazione dei dati per supporto decisionale. Esportazione dei dati in formati CSV ed Excel. Formati di scambio: CSV, Json, XML. Modelli dei dati alternativi: modello documentale, modello a grafo.
Le lezioni del corso saranno teoriche di tipo frontale. Verrà stimolata la partecipazione degli studenti per quanto riguarda il commento sugli esempi e l'interpretazione dei risultati statistici riportati negli articoli clinici.
Il corso prevede esercitazioni (in aula d'informatica o sui propri PC portatili) e verranno illustrati in aula esempi di analisi di dati software statistico free “R”.
L’esame del corso integrato consiste in due prove. Il voto finale sarà dato dalla media aritmetica dei voti nelle due prove.
La prova relativa alla parte statistica consiste in un quiz effettuato in aula accedendo alla piattaforma Moodle. I quiz vertono sugli argomenti teorici e pratici trattati durante il corso. Il quiz è composto da 16 domande, lo studente ha a disposizione 60 minuti per rispondere. Ogni risposta corretta vale 2 punti, per ottenere la sufficienza (18/30) occorre rispondere correttamente a 9 domande. Per ottenere 30/30 occorre rispondere correttamente a 15 domande. Per ottenere 30 e lode occorre rispondere correttamente a tutte e 16 le domande.
La parte di informatica è strutturata come un quiz composto da 12 domande delle quali parte sono a scelta multipla e parte sono a risposta libera. La somma dei punti associati alle domande (dichiarati insieme alle domande) è 32 che corrisponde a 30 e lode. Le domande a scelta libera permettono di misurare la capacità di risolvere problemi elementari. Le domande a scelta multipla permettono di verificare la conoscenza del linguaggio tecnico e dei concetti elementari della disciplina. Il voto è la somma algebrica dei punteggi associati alle singole domande. Nelle domande a scelta multipla il voto dell'esercizio è assegnato quando la risposta è corretta. Nelle domande a risposta libera il punteggio massimo previsto è assegnato in caso di svolgimento senza errori. In caso di errori nello svolgimento il punteggio massimo corrispondente è ridotto in ragione della gravità degli errori. Voto 28-30 e lode: lo studente ha una conoscenza APPROFONDITA della materia e sa risolvere problemi elementari. Voto 24-27: lo studente ha una BUONA conoscenza della materia e una discreta capacità a risolvere problemi elementari; Voto 18-23: lo studente ha una DISCRETA conoscenza della materia e una sufficiente capacità di risoluzione di problemi elementari. Esame non superato: lo studente non è in grado di risolvere problemi elementari ed ha una conoscenza lacunosa.
Il voto complessivo dell’esame è dato dalla media aritmetica dei voti conseguiti nella prova di statistica e in quella di informatica.
Questo insegnamento approfondisce argomenti strettamente connessi a uno o più obiettivi dell'Agenda 2030 per lo Sviluppo Sostenibile delle Nazioni Unite