DOMENICA 4 GIUGNO 2017
MODULO A: INTRODUZIONE A STATA
L’obiettivo del modulo è quello di fornire all’utente le nozioni introduttive che consentono di lavorare autonomamente in Stata oltre a una panoramica completa delle funzioni di base, che sono illustrate attraverso una miscela di esempi concreti.
SESSIONE I: INTRODUZIONE A STATA
Interfaccia utente: le finestre di Stata
Logica e sintassi: Come “pensa” Stata?
Piccoli ma importanti: if, by, bysort, in
Usare Stata in forma interattiva e in programmazione: riga di comando e menù VS .do files
File e cartelle in Stata:
tipi ed estensioni (.dta, .gph, .log, .smcl, .dct, …)
cartelle di lavoro (pwd, cd, mkdir, ls)
SESSIONE II: GLI ELEMENTI FONDAMENTALI DI STATA
Caricare dati di diversi formati in Stata: use, insheet, infile, import delimited, import excel
Esplorare i dati in Stata: describe, list, codebook, browse/edit, summarize
Le Tabelle in Stata: tabulate, table, epitab
SESSIONE III: STATA COME GESTIRE DI DATI
Il “Data housekeeping” in Stata: label, recode, replace, gen, egen
Alcuni grattacapi: valori missing (mvencode/mvdecode), gestione delle date (date())
Come fondere basi di dati con Stata: append e merge, reshape
SESSIONE IV: GRAFICI CON STATA
Logica e sintassi dei comandi graph
Anatomia e fisiologia dei grafici in Stata
Tipologie di grafici: pie, bar, hist, box, twoway scatter, twoway line, twoway connect, twoway rarea, ecc.
MODULO B: EPIDEMIOLOGIA CLINICA E SANITÀ PUBBLICA
LUNEDI’ 5 E MARTEDI’ 6 GIUGNO 2017
STATISTICA DESCRITTIVA E INFERENZIALE SU DATI EPIDEMIOLOGICI, AMMINISTRATIVI E OSPEDALIERI CON STATA
Il modulo introduce lo studente alla conoscenza delle diverse tipologie di dati analizzabili in ambito di epidemiologia e sanità pubblica e dei principali sistemi di classificazione in ambito sanitario, sia ospedalieri che extra-ospedalieri, ed alla loro gestione e manipolazione con Stata. Inoltre, si propone di fornire allo studente gli strumenti utili a creare tabelle, grafici, a calcolare i principali indici di sintesi e ad elaborare statistiche inferenziali.
SESSIONE I: NATURA E FONTI DEI DATI
Natura dei dati e loro archiviazione in Stata: dati categorici dicotomici, nominali, ordinali, dati numerici
Interpretare le variabili: Misure di Esposizione, Misure di Esito, Confondenti
Fonti dei dati: Database istituzionali e raccolte ad hoc
SESSIONE II: LA CLASSIFICAZIONE DELLE MALATTIE
Sistemi di classificazione in ambito sanitario
Classificazione delle malattie e delle procedure. ICD-9, ICD-9CM, ICD-10
La suite di comandi icd: icd9, icd9p, icd10
SESSIONE III: ANALISI DI DATI OSPEDALIERI
Il sistema DRG
La scheda di dimissione ospedaliera ed il dialogo grouper-Stata
Indici di case-mix. Indici di qualità della codifica
SESSIONE IV: TECNICHE DI STATISTICA DESCRITTIVA
Indici di tendenza centrale ed indici di dispersione: summarize, means
Tabelle a singola e doppia entrata: tabulate, table
Rappresentazioni grafiche: diagrammi a barre, distribuzioni di frequenza, serie temporali, mappe
SESSIONE V: TEORIA DELLA PROBABILITA’ ED INFERENZA STATISTICA
Incertezza e probabilità
Distribuzioni di probabilità: distribuzione normale e binomiale
Introduzione all’inferenza statistica
La distribuzione campionaria
Limiti di confidenza: ci, cii
Test di ipotesi parametrici e non parametrici: ttest, ranksum, kwallis, le opzioni chi2 ed exact di tabulate
Potenza e dimensioni del campione
MERCOLEDÌ 7 E GIOVEDÌ 8 GIUGNO 2017
REGRESSIONE LINEARE E LOGISTICA
Il corso intende fornire allo studente i principali strumenti per l’analisi di dati continui e binomiali attraverso la costruzione di modelli di regressione univariabili e multivariabili, e proporre l’applicazione a dati provenienti da raccolte ad hoc o da database amministrativo-epidemiologici.
SESSIONE I: REGRESSIONE LINEARE
Correlazione: i comandi correlate, pwcorr, spearman, graph matrix
Regressione lineare in Stata: i comandi regress, predict, margins
La Tabella ANOVA
Regressione lineare semplice
Interpretazione dei coefficienti
Regressione lineare multivariabile
Variabili dummy
Interazione e confondimento
Valutazione del modello
SESSIONE II: REGRESSIONE LOGISTICA
Il modello di regressione logistica
Regressione logistica in Stata: i comandi logit, logistic, predict, margins
Maximum Likelihood Estimation
Interpretazione dei coefficienti del modello logistico ed Odds Ratio
Regressione logistica multivariabile
Test del Likelihood-ratio
Test di Hosmer-Lemeshow
SESSIONE III: APPLICARE LE TECNICHE DI REGRESSIONE AI DATI AMMINISTRATIVI
Analizzare la durata di degenza e la sopravvivenza dopo interventi chirurgici
Regressione logistica e risk adjustment sui database amministrativi
VENERDÌ 9 GIUGNO 2017
ANALISI DELLA SOPRAVVIVENZA
Il corso intende fornire allo studente le conoscenze e gli strumenti per l’analisi di variabili del tipo “time-to-event”. Tale tecnica è comunemente utilizzata negli studi di coorte ed in quelli sperimentali.
SESSIONE I: PRINCIPI GENERALI
Motivazioni dell’analisi di sopravvivenza: il comando stset
Osservazioni censored
Stima della funzione di sopravvivenza secondo il metodo di Kaplan-Meier: sts list
Funzioni di rischio (rischio istantaneo e rischio cumulativo)
SESSIONE II: INFERENZA SULLA SOPRAVVIVENZA
Confronto tra funzioni di sopravvivenza: sts graph
Test del Log-Rank e di Wilcoxon: sts test
Numerosità campionaria: power logrank
SESSIONE III: STUDIARE LA SOPRAVVIVENZA CON MODELLI DI REGRESSIONE
Modello di regressione di Cox: stcox
Interpretazione dei coefficienti del modello di regressione
Valutazione dell’assunzione di proporzionalità del rischio: stphplot, estat phtest
SESSIONE IV: RISK ADJUSTMENT CON DATI DI SOPRAVVIVENZA
La sopravvivenza intraospedaliera come “time-to-event”