DOMENICA 4 GIUGNO 2017

MODULO A: INTRODUZIONE A STATA

L’obiettivo del modulo è quello di fornire all’utente le nozioni introduttive che consentono di lavorare autonomamente in Stata oltre a una panoramica completa delle funzioni di base, che sono illustrate attraverso una miscela di esempi concreti.

 

SESSIONE I: INTRODUZIONE A STATA

Interfaccia utente: le finestre di Stata

Logica e sintassi: Come “pensa” Stata?

Piccoli ma importanti: if, by, bysort, in

Usare Stata in forma interattiva e in programmazione: riga di comando e menù VS .do files

File e cartelle in Stata:

tipi ed estensioni (.dta, .gph, .log, .smcl, .dct, …)

cartelle di lavoro (pwd, cd, mkdir, ls)

 

SESSIONE II: GLI ELEMENTI FONDAMENTALI DI STATA

Caricare dati di diversi formati in Stata: use, insheet, infile, import delimited, import excel

Esplorare i dati in Stata: describe, list, codebook, browse/edit, summarize

Le Tabelle in Stata: tabulate, table, epitab

 

SESSIONE III: STATA COME GESTIRE DI DATI

Il “Data housekeeping” in Stata: label, recode, replace, gen, egen

Alcuni grattacapi: valori missing (mvencode/mvdecode), gestione delle date (date())

Come fondere basi di dati con Stata: append e merge, reshape

 

SESSIONE IV: GRAFICI CON STATA

Logica e sintassi dei comandi graph

Anatomia e fisiologia dei grafici in Stata

Tipologie di grafici: pie, bar, hist, box, twoway scatter, twoway line, twoway connect, twoway rarea, ecc.

 

 

MODULO B: EPIDEMIOLOGIA CLINICA E SANITÀ PUBBLICA

LUNEDI’ 5 E MARTEDI’ 6 GIUGNO 2017

STATISTICA DESCRITTIVA E INFERENZIALE SU DATI EPIDEMIOLOGICI, AMMINISTRATIVI E OSPEDALIERI CON STATA 

Il modulo introduce lo studente alla conoscenza delle diverse tipologie di dati analizzabili in ambito di epidemiologia e sanità pubblica e dei principali sistemi di classificazione in ambito sanitario, sia ospedalieri che extra-ospedalieri, ed alla loro gestione e manipolazione con Stata. Inoltre, si propone di fornire allo studente gli strumenti utili a creare tabelle, grafici, a calcolare i principali indici di sintesi e ad elaborare statistiche inferenziali.

 

SESSIONE I: NATURA E FONTI DEI DATI

Natura dei dati e loro archiviazione in Stata: dati categorici dicotomici, nominali, ordinali, dati numerici

Interpretare le variabili: Misure di Esposizione, Misure di Esito, Confondenti

Fonti dei dati: Database istituzionali e raccolte ad hoc

 

SESSIONE II: LA CLASSIFICAZIONE DELLE MALATTIE

Sistemi di classificazione in ambito sanitario

Classificazione delle malattie e delle procedure. ICD-9, ICD-9CM, ICD-10

La suite di comandi icd: icd9, icd9p, icd10

 

SESSIONE III: ANALISI DI DATI OSPEDALIERI

Il sistema DRG

La scheda di dimissione ospedaliera ed il dialogo grouper-Stata

Indici di case-mix. Indici di qualità della codifica

 

SESSIONE IV: TECNICHE DI STATISTICA DESCRITTIVA

Indici di tendenza centrale ed indici di dispersione: summarize, means

Tabelle a singola e doppia entrata: tabulate, table

Rappresentazioni grafiche: diagrammi a barre, distribuzioni di frequenza, serie temporali, mappe

 

SESSIONE V: TEORIA DELLA PROBABILITA’ ED INFERENZA STATISTICA

Incertezza e probabilità

Distribuzioni di probabilità: distribuzione normale e binomiale

Introduzione all’inferenza statistica

La distribuzione campionaria

Limiti di confidenza: ci, cii

Test di ipotesi parametrici e non parametrici: ttest, ranksum, kwallis, le opzioni chi2 ed exact di tabulate

Potenza e dimensioni del campione

 

MERCOLEDÌ 7 E GIOVEDÌ 8 GIUGNO 2017

REGRESSIONE LINEARE E LOGISTICA

Il corso intende fornire allo studente i principali strumenti per l’analisi di dati continui e binomiali attraverso la costruzione di modelli di regressione univariabili e multivariabili, e proporre l’applicazione a dati provenienti da raccolte ad hoc o da database amministrativo-epidemiologici.

 

SESSIONE I: REGRESSIONE LINEARE

Correlazione: i comandi correlate, pwcorr, spearman, graph matrix

Regressione lineare in Stata: i comandi regress, predict, margins

La Tabella ANOVA

Regressione lineare semplice

Interpretazione dei coefficienti

Regressione lineare multivariabile

Variabili dummy

Interazione e confondimento

Valutazione del modello

 

SESSIONE II: REGRESSIONE LOGISTICA

Il modello di regressione logistica

Regressione logistica in Stata: i comandi logit, logistic, predict, margins

Maximum Likelihood Estimation

Interpretazione dei coefficienti del modello logistico ed Odds Ratio

Regressione logistica multivariabile

Test del Likelihood-ratio

Test di Hosmer-Lemeshow

 

SESSIONE III: APPLICARE LE TECNICHE DI REGRESSIONE AI DATI AMMINISTRATIVI

Analizzare la durata di degenza e la sopravvivenza dopo interventi chirurgici

Regressione logistica e risk adjustment sui database amministrativi

 

VENERDÌ 9 GIUGNO 2017

ANALISI DELLA SOPRAVVIVENZA

Il corso intende fornire allo studente le conoscenze e gli strumenti per l’analisi di variabili del tipo “time-to-event”. Tale tecnica è comunemente utilizzata negli studi di coorte ed in quelli sperimentali.

 

SESSIONE I: PRINCIPI GENERALI

Motivazioni dell’analisi di sopravvivenza: il comando stset

Osservazioni censored

Stima della funzione di sopravvivenza secondo il metodo di Kaplan-Meier: sts list

Funzioni di rischio (rischio istantaneo e rischio cumulativo)

 

SESSIONE II: INFERENZA SULLA SOPRAVVIVENZA

Confronto tra funzioni di sopravvivenza: sts graph

Test del Log-Rank e di Wilcoxon: sts test

Numerosità campionaria: power logrank

 

SESSIONE III: STUDIARE LA SOPRAVVIVENZA CON MODELLI DI REGRESSIONE

Modello di regressione di Cox: stcox

Interpretazione dei coefficienti del modello di regressione

Valutazione dell’assunzione di proporzionalità del rischio: stphplot, estat phtest

 

SESSIONE IV: RISK ADJUSTMENT CON DATI DI SOPRAVVIVENZA

La sopravvivenza intraospedaliera come “time-to-event