panel
Campione rappresentativo di una popolazione ottenuto tramite la raccolta continuativa di informazioni statistiche. I dati p. o longitudinali derivano da osservazioni ripetute su un insieme di unità statistiche (persone, famiglie, regioni, imprese ecc.), normalmente condotte per più periodi o per più istanti temporali. Se i soggetti campionati provengono da una ben definita popolazione, i dati p. combinano caratteristiche di quelli sezionali (➔ dati) e delle serie storiche (➔). Come quelli sezionali, i dati p. presentano problemi di disegno e selezione del campione (➔ campione statistico) e di errore di misura. Come le serie storiche, essi possono dar luogo una certa regolarità o persistenza (➔) nel tempo.
I dati p. offrono alcuni vantaggi rispetto a quelli sezionali e alle serie storiche. Anzitutto, essi contengono più osservazioni di una singola serie storica. Inoltre, il loro uso semplifica l’analisi di problemi economici dove la dimensione intertemporale è importante (per es., lo studio dell’offerta di lavoro e dei consumi nel ciclo di vita). Infine, a differenza delle serie storiche macroeconomiche più aggregate, i dati p. consentono di analizzare il comportamento a livello individuale, controllando l’eterogeneità tra le unità. Si può distinguere tra p. macroeconomici, microeconomici e finanziari.
Contengono informazioni aggregate a livello di regione, Paese eccetera. Un esempio è la base di dati Eurostat con i conti economici a livello nazionale o regionale per i Paesi dell’Unione Europea.
Le osservazioni riguardano di solito persone, famiglie, o imprese. Il numero di unità è solitamente molto più elevato della dimensione temporale (per es. i p. SHIW della Banca d’Italia osservano 8000 famiglie su 10 anni, dal 1993 al 2010). Come esempi si ricordano la componente p. dell’indagine sui bilanci delle famiglie della Banca d’Italia (SHIW, Survey on Household Income and Wealth) il p. socioeconomico tedesco (GSOEP); il British Household Panel Study (BHPS) e lo English Longitudinal Study of Ageing (ELSA) per la Gran Bretagna; il Survey of Health, Ageing and Retirement in Europe (SHARE) per i Paesi dell’Europa continentale; i National Longitudinal Surveys (NLS), il Panel Study of Income Dynamics (PSID) e lo Health and Retirement Study (HRS) per gli USA.
Le unità sono di solito titoli o indici finanziari, con frequenza temporale molto alta, per cui è disponibile un numero di osservazioni elevato per ciascuna osservazione. P. finanziari sono per es. il data base CRSP del Center for Research in Security Prices presso l’Università di Chicago, o i dati sull’insieme dei titoli che costituiscono indici composti come Dow-Jones, S&P500, MSCI Euro o Nikkei.
Un p. è bilanciato se tutte le unità sono osservate in ogni istante di tempo, altrimenti è detto non bilanciato. Questo secondo tipo si verifica a causa sia dell’attrito, cioè della perdita di unità da una sezione all’altra, sia dell’ingresso di nuove unità. L’attrito è piuttosto comune in p. microeconomici o finanziari. Esso può essere esogeno (➔ endogeno/esogeno) se è incorrelato (➔ covarianza) con la variabile di interesse, o endogeno se è sistematicamente correlato con essa. Quando è endogeno, può causare distorsioni nelle stime dei parametri di interesse (➔ parametri economici). In p. di individui, questo fenomeno è tipicamente dovuto a importanti cambiamenti nella vita di una persona. Se tali modifiche sono l’oggetto di studio, allora l’attrito non può essere ignorato, perché porta a una distorsione. Considerazioni simili valgono per l’ingresso di nuove unità nel panel.
Tra i modelli per dati p., il modello lineare, per la sua semplicità, è uno dei più usati. Un modello lineare per dati p. ha generalmente la caratteristica di comprendere intercette differenziate per ciascuna osservazione appartenente al panel. Queste, interpretate come effetti specifici dei singoli individui, possono essere considerate come parametri ignoti ma fissi, che si aggiungono agli altri da stimare, oppure come realizzazioni di una medesima variabile aleatoria. Nel primo caso si ha un modello a effetti fissi, nel secondo un modello a effetti casuali. Quello a effetti fissi, nella sua formulazione più semplice, coincide con la stima di una regressione lineare in cui all’insieme di regressori si aggiungano tante variabili dummy (➔ dummy, variabili) quante sono le unità del panel. Esistono diverse altre specificazioni per ottenere lo stesso modello.