OBIETTIVO DEL CORSO

I dati longitudinali hanno utilizzo sempre più diffuso negli studi epidemiologici (follow-up studies e clinical trials) e nella sanità pubblica per tre principali motivi: consentono un adeguato trattamento di varie forme di eterogeneità latente tra gli individui; possono migliorare notevolmente la precisione delle stime; consentono di sottoporre ad analisi empirica modelli realistici, con dinamica di breve e lungo periodo. Il workshop “Analisi dei dati longitudinali in ambito biomedico in Stata” pertanto offre ai partecipanti gli strumenti statistici, sia teorici sia applicati, necessari per: i) poter svolgere autonomamente analisi empirici di dati medici e bio-sanitari utilizzando le tecniche più recenti e avanzate, e ii) capire e valutare gli studi basati sui dati longitudinali riportati nella letteratura accademica e professionale. Durante il corso particolare attenzione sarà inoltre dedicata all’interpretazione e alla presentazione dei risultati. Alla fine del workshop, il partecipante sarà in grado di implementare autonomamente le metodologie utilizzate durante il corso nel proprio specifico contesto di ricerca. In linea con la nostra filosofia di formazione, le sessioni teoriche sono affiancate da illustrazioni pratiche ed esempi provenienti da diverse discipline biomediche, in cui il docente chiarisce le limitazioni e i punti di forza di ogni metodologia, nonché i criteri per la scelta e l’implementazione dello strumento di analisi statistica più appropriato per il problema oggetto di studio.

 

DESTINATARI

Il workshop è stato sviluppato per medici, ricercatori ed operatori in sanità pubblica provenienti da istituzioni pubbliche e private che desiderano acquisire gli strumenti necessari per condurre analisi empirici (per esempio sul rischio di contrarre una malattia o le relazioni tra variabile sanitarie e demografiche o ambientale) utilizzando i dati longitudinali. Il programma è anche indicato per Studenti, Dottorandi e Specializzandi.

 

REQUISITI RICHIESTI

Familiarità con il software Stata e conoscenze di base del modello di regressione lineare.


PROGRAMMA

SESSIONE I: CENNI PRELIMINARI

  • Introduzione a Stata
  • La matrice dei dati in Stata
  • L’esplorazione descrittiva dei dati
  • Il modello di regressione lineare multivariata
  • Introduzione ai dati longitudinali: definizioni e caratteristiche

 

SESSIONE II: I DATI IN FORMATO PANEL

  • La creazione di un database longitudinale in Stata
  • La gestione dei dati: pulizia dei dati e integrazione delle informazioni
  • Gli operatori time series in Stata
  • Esempi di dati panel in campo medico
  • I vantaggi e gli svantaggi dei dati longitudinali per l’analisi statistica
  • La descrizione dei dati: prime elaborazioni descrittive dei dati longitudinali
  • La variabilità cross-sezionale e quella longitudinale
  • Le rappresentazioni grafiche

 

SESSIONE III: MODELLI PER DATI PANEL

  • I modelli Linear mixed effect: una introduzione
  • Il modello di regressione ad effetti “fissi”: definizioni e ipotesi
  • Il modello di regressione ad effetti “random” definizioni e ipotesi
  • I metodi di stima:
    • Stimatore Pooled Ordinary Least Squares (POLS)
    • Stimatore Within
    • Stimatore Between
    • Stimatore Generalised Least Squares (GLS)
    • Stimatore Feasible Generalised Least Squares (FGLS)
    • Esempi: l’utilizzo dei diversi metodi di stima
  • La selezione del modello:
    • La scelta del modello ad Effetti “fissi” o ad effetti “random”: il Test di Hausman per:
    • Test per random effects: Breusch-Pagan Lagrange multiplier (LM)
    • La dipendenza cross-sezionale

 

  • Pesaran CD test
  • Test di eteroschedasticità dei residui
  • Test di correlazione seriale
  • Test di stazionarietà
  • Esercizi sui test introdotti e loro interpretazione

 

SESSIONE IV: GENERALIZED ESTIMATING EQUATIONS (GEE)

  • Introduzione al modello GEE: un’estensione del modello di regressione classico
  • Il trattamento delle osservazioni correlate
    • Le misure ripetute
    • Altri esempi di osservazioni correlate
  • Possibili strutture di correlazione ed ipotesi sottostanti
  • Stimatori GEE e modelli possibili
  • La stima tramite la funzione di quasi-verosimiglianza
  • L’utilizzo del modello GEE nel caso di dati longitudinali
  • Esempi ed esercizi: applicazioni in campo medico

 

SESSIONE V: DATI LONGITUDINALI E CURVE DI CRESCITA

  • Introduzione al concetto di curva di crescita
  • A quadro concettuale ed esempi
  • L’analisi descrittiva delle curve di crescita
  • La definizione e la valutazione dei predittori
  • Growth curve modeling (GCM)
  • GCM: vantaggi e svantaggi
  • Applicazioni ed esempi in campo medico

 

SESSIONE VI: APPROFONDIMENTI

 

  • Il trattamento dell’endogeneità nei dati panel:
    • Stimatori con variabili strumentali per dati panel
    • Lo Stimatore di Hausman-Taylor
    • Stimatore di Arellano-Bond
  • Esercizi ed esempi