STATISTICA
. Secondo l'opinione più reputata il termine statistica deriva dall'italiano stato, statista, di uso comune presso i politici italiani dei secoli XV e XVI.G. Achenwall, che divulgò l'uso del nome, afferma esplicitamente che questo non proviene "vom Teutschen Worte Staat" ma che "Statistic, Name nicht neu, florebat saec. XVII, kommt vom fameusen ragione di stato". Nel senso odierno significa, anzitutto, tecnica e metodo appropriati a indagare i fenomeni collettivi o di massa, cioè quelli che si possono misurare soltanto in base a molteplici osservazioni (statistica metodologica); e significa pure applicazione di tale metodo all'investigazione delle diverse specie di fenomeni collettivi (statistica applicata). Della statistica metodologica si può considerare parte la statistica matematica, la quale appresta quei particolari strumenti che utilizzano le teorie matematiche e specialmente quelle del calcolo delle probabilità. E poiché i fenomeni della popolazione e della società - collettivi per eccellenza - furono tra i primi a richiedere l'impiego del metodo statistico e quindi a promuoverne la formulazione teorica e i successivi perfezionamenti, così sotto la denominazione di statistica s'intende spesso, oltre che la trattazione del metodo, l'applicazione di questo allo studio quantitativo dei fenomeni demografici e sociali. Che siffatto studio dei fenomeni collettivi richieda una tecnica speciale, proviene dalla pratica impossibilità, per le limitate nostre facoltà di associazione, di sintetizzare mentalmente in una o poche misure una molteplicità di osservazioni, anche se ciascuna di queste abbia dato luogo a un risultato numerico. La pur semplice enumerazione della popolazione di un territorio richiede procedimenti e cautele speciali; altrettanto si dica per il calcolo del rapporto in cui stanno nella popolazione stessa i maschi e le femmine; così pure, dato e non concesso che le stature dei coscritti di tutto un contingente annuale di leva potessero essere simultaneamente ricordate, in virtù di una prodigiosa memoria, ciò gioverebbe meno, per una conoscenza sintetica del carattere considerato, che il determinarne, con una semplice operazione, la media aritmetica; mentre, in un'indagine più approfondita potrebbe essere utile l'esprimere, se si può, in termini matematici il modo di distribuirsi di quelle stature, così da poter conoscere quanti sono i coscritti la cui statura rientra in ciascun grado (cm., mm.) della scala di misura all'uopo adoperata.
Molto spesso accade che lo studio accurato dei fenomeni collettivi metta in luce relazioni, regolarità, leggi che li governano, laddove, a prima vista e sulla base di osservazioni singole o poco numerose, nessun ordine appariva. I pochi nati vivi che di giorno in giorno si presentano nella popolazione di un villaggio, o di una piccola città, non dànno luogo, per ciò che concerne il loro sesso, a nessuna regolarità, poiché talora potrà accadere che le nascite femminili superino quelle maschili e talora il contrario e talora che si bilancino; ma se l'osservazione del sesso verrà estesa a gruppi molto numerosi di nascite, apparirà che il rapporto fra i numeri dei nati vivi maschi e femmine (rapporto di mascolinità dei nati vivi) presenta una notevole costanza ed è, circa, di 105 o 106 maschi per 100 femmine. La numerosità delle osservazioni riduce o praticamente annulla l'effetto del caso, e lascia in luce quelle regolarità che in poche osservazioni venivano mascherate dalle circostanze accidentali. Orbene, apprestati dalla statistica metodologica i necessarî strumenti d'indagine, lo scopo più elevato a cui tendono le sue applicazioni è quello, appunto, di scoprire, se esistono, le leggi che dominano le varie specie di fenomeni collettivi: e ciò, sia a un fine puramente speculativo, sia per un intento pratico, in quanto la constatata regolarità di un fenomeno o la sua accertata e misurata connessione con altri, consentirà, a parità di condizioni, di attribuire un'elevata probabilità e talora anche una pratica certezza al verificarsi in altri tempi o luoghi dello stesso fenomeno. Pertanto: "accertare l'ordine nella irregolarità delle distribuzioni; mettere in evidenza la quantità, il senso e la forma del movimento; fissare i rapporti e quindi enunciare le probabilità", è, con parole di A. Niceforo, il compito del metodo statistico. E, giustamente soggiunge questo autore, "il fatto di considerare la statistica come un metodo anzi che come una scienza ne eleva singolarmente, anzi che abbassarne, la dignità", e ciò soprattutto per la possibilità di estenderne le applicazioni alle più varie categorie d'indagini.
Ironicamente si affermò talora che alla statistica, in ragione della poca fondatezza dei dati e dell'arbitrarietà delle deduzioni, si potesse far dire ciò che si vuole; ma in verità essa non è mendace, purché la si lasci parlare attraverso le sue cifre. È celebre la definizione di Napoleone: "La statistique c'est le budget des choses" da lui stesso così postillata: "Sans budget point de salut". E sono di Mussolini le memorabili parole: "Nelle grandi società moderne non si può governare senza l'ausilio della statistica né un'impresa privata né lo stato. Le cifre indicano la consistenza, l'ampiezza, il carattere di un fenomeno e quindi permettono di comprenderlo e di fronteggiarlo".
Storia della statistica.
I primordî. - Relativamente recente è la sistemazione della statistica come dottrina, iniziata durante il sec. XVII; si può affermare, al contrario, che fino dai tempi più remoti dovette manifestarsi il bisogno, nelle umane società, di rilevazioni e di elaborazioni di carattere statistico, specialmente al fine di ottenerne indicazioni necessarie o utili al buon governo della pubblica cosa (popolazione atta a portare le armi, distribuzione e gettito delle imposte, distribuzione della proprietà terriera, ecc.). Il Shu-king di Confucio, che riproduce antichissimi scritti della Cina, fa cenno di misure delle terre e di enumerazioni degli abitanti, con distinzione degli addetti ai mestieri e ai commerci, attribuite al leggendario imperatore Yü verso il 2300 a. C.
Nella Bibbia sono ricordati diversi censimenti degli Ebrei, alcuni dei quali con separata elencazione dei maschi atti a portare le armi; citeremo quello eseguito al loro uscire dall'Egitto (Esodo, XII, 37; XXX, 12), quello nel deserto di Sinai, per opera di Mosè e di Aronne (Numeri, I), l'altro presso il Giordano di Gerico, fatto da Mosè e da Eleazaro (Numeri, XXVI); e anche quelli compiuti da Davide (II Samuele, XVIII, 1 segg.; XXIV) e nel primo anno di Ciro, re di Persia, al ritorno degli Ebrei in Gerusalemme dopo la cattività di Babilonia (Esdra, II e Nieemia, VII). Gli antichi Egizî eseguirono, essi pure, catasti e censimenti demografici, talora con l'annotazione dello stato civile dei censiti (E. Engel, in Preuss. stat. Zeitschrift, Berlino 1862); mentre sotto i Tolomei, le registrazioni della popolazione, soprattutto ai fini militari e fiscali, si ripeterono regolarmente a intervalli di 14 anni (E. Ciccotti, Il problema demografico nel mondo antico, in Metron, 1931). In quanto ai Greci, è da ritenersi che la costituzione politica, l'ordinamento militare e quello dell'educazione dei giovani richiedessero operazioni statistiche, fra le quali le denunce delle nascite e delle morti davano occasione a offerte di derrate e denaro a varie divinità.
Molto più si può dire, a tale riguardo, dei Romani, presso i quali, con la costituzione di Servio Tullio, venne prescritto un census da ripetersi ogni 5 anni e che, oltre il nome, l'età e la dimora del dichiarante, avrebbe dovuto rilevare il nome del padre, dell'avo, dei discendenti alieni iuris e della sposa, come pure l'indicazione dei beni e quelle degli schiavi maschi e femmine. Tuttavia, nessuna di siffatte specificazioni risulta nelle notizie dei censi che ci sono pervenute, ed è pure dubbia l'interpretazione delle cifre tramandate, se cioè esse comprendano tutti i maschi cittadini o se si debbano intendere esclusi i non reclutati nelle legioni (Ciccotti, l. c.). Di un censimento indetto da Cesare Augusto, nell'anno in cui nacque Cristo, parla Luca, II, 1-4. Altri documenti statistici della romanità sono il Breviarium Imperii o Brev. Augusti (Tacito, Ann., I), specie di libro di ricordi delle cose più notevoli dell'Impero, iniziato da Augusto e continuato dai successori; e le Notitiae omnium dignitatum administrationumque, compilate dal primicerius notariorum, di cui un esemplare, trascritto intorno al 400 d. C., è pervenuto fino a noi.
Nel Medioevo la documentazione statistica è assai scarsa; conviene, nondimeno, menzionare una descrizione, eseguita daglí Arabi, della popolazione e delle condizioni dell'agricoltura e del commercio della Penisola Iberica; la catastazione dell'Egitto, spesso ripetuta a partire dal 1240; il Breviarium fiscalium di Carlomagno, in cui sono minutamente descritte le abitazioni, le suppellettili, le provviste, il bestiame, le varie specie di colture; il Domesday Book o Liber iudiciarius seu censualis Willelmi I regis Angliae, grande catasto e libro fondamentale di Guglielmo il Conquistatore, composto intorno al 1083-86, che si può considerare come la prima vasta rilevazione censuaria dopo quelle di Roma, comprendente, oltre l'enumerazione degli abitanti, la descrizione statistica dei patrimonî, dei redditi, dei territorî, delle servitù prediali, cosicché nel diritto inglese esso serve a provare ancora oggi se un fondo sia allodiale. Si ricordano pure gl'inventarî dei beni della corona ereditati in Sicilia dall'imperatore Federico II, e il catasto fatto eseguire nel 1327 dal duca Carlo di Calabria.
A partire dal sec. XV più opere appaiono, indicate come pertinenti alla statistica, ma che poco hanno in comune con la statistica nel suo odierno significato. Come per altre branche della scienza, così anche per la statistica è con l'andar del tempo mutata l'ampiezza e la natura stessa del suo contenuto. Quattro fasi bene distinte si possono riconoscere nell'evoluzione della statistica. Nella prima di esse questo nome venne applicato alla descrizione comparativa delle cose più notevoli degli stati (Staatenkunde o Staatskunde o Statistik dei Tedeschi); tale disciplina, che si può considerare iniziata da Aristotele, venne dapprima coltivata da autori italiani dei secoli XV e XVI e successivamente da Olandesi e Tedeschi, e raggiunse il suo apogeo nelle università germaniche durante i secoli XVII e XVIII. La seconda fase ha principio nel sec. XVII in Inghilterra, ed è quella degli aritmetici politici, che specialmente si applicarono all'osservazione numerica delle nascite, delle morti e di altri fenomeni demografici, intanto che alla denominazione di "aritmetica politica" si veniva di mano in mano sostituendo quella di "statistica", già usata nel senso di Staatenkunde. Un'altra fase, che si apre nei primi anni del sec. XIX, è quella che viene caratterizzata dalla sistematica applicazione alle indagini statistiche del calcolo delle probabilità, un nuovo ramo della matematica che aveva, nel frattempo, ricevuto una sistemazione autonoma e che si era perfezionato nella classica Théorie analytique des probabilités (1812) di P.-S. Laplace. Infine è dei nostri giorni quello sviluppo in profondità e in estensione che si può considerare come una quarta fase della statistica e che sbocca da una parte nella statistica metodologica e matematica considerata come metodo, e dall'altra nell'applicazione di questo metodo all'indagine dei più svariati fenomeni di massa.
Prima fase. - La descrizione comparativa degli stati ha il suo esempio più lontano nelle Πολιτεῖαι di Aristotele, risultanti dalle descrizioni di 158 costituzioni politiche; di esse un solo frammento è rimasto, relativo alla costituzione degli Ateniesi. Per trovare un seguito a siffatto indirizzo bisogna poi venire fino al Rinascimento italiano e menzionare: un rapporto avente carattere statistico, compilato intorno al 1420 dal doge Mocenigo; le Relazioni degl'inviati della repubblica veneziana; lo scritto di Francesco Sansovino, Del governo e amministrazione di diversi regni e repubbliche (Venezia 1567), in cui sono descritti 22 stati, incominciando da Sparta, Atene e Roma per finire a Utopia; Le relazioni universali (1593) di Giovanni Botero, segretario di S. Carlo Borromeo. Al gentiluomo fiorentino Lodovico Guicciardini che, soggiornando in Anversa, ebbe occasione di scrivere la Descrittione di tutti i paesi bassi, altrimenti detti Germania inferiore (Anversa 1585) si deve forse il merito di avere trapiantato la nuova disciplina nell'Olanda: tanto che quivi apparvero, poco oltre (1624-1640), le Respublicae Elzevirianae, serie di 36 piccoli volumi di J. de Laet; e appartengono pure a questo torno di tempo le Recherches de la France (1581) di É. Pasquier. La statistica universitaria tedesca, considerata come parte della politica, s'inizia con L. v. Seckendorff, autore del Teuscher Fürstenstaat (1656); ma più famoso rimase l'insegnamento della Staatenkunde impartito da Hermann Conring (1606-1681) nell'università di Helmstedt. Le sue lezioni vennero, suo malgrado, pubblicate da uno scolaro nel 1671, sotto il titolo Notitia rerum publicarum, o descriptio singularis rerum publicarum aevi nostri. Fra i continuatori del Conring si ricorda M. Schmeitzel (1679-1747), che intitolò le sue letture Collegium politico-statisticum; ma fra tutti prevalse Gottfried Achenwall (1719-72), dell'università di Gottinga, che definì la statistica come la descrizione delle cose notevoli degli stati considerati nelle loro condizioni presenti, e che fu detto il "padre" della statistica, benché egli avesse, per modestia, voluto riservare questo epiteto al Conring. Di A. L. Schlözer (1735-1809), che accentuò il carattere quantitativo della disciplina e che raccomandò l'uso di numeri piuttosto che di vaghe espressioni, è l'aforisma "Statistik ist stillstehende Geschichte, Geschichte eine fortlaufende Statistik". Frattanto si vanno appunto facendo sempre meno rare le citazioni delle cifre, e tale tendenza è favorita dal sorgere della statistica "tabellare", così denominata dalla forma tipografica usata per l'esposizione delle notizie, in tabelle che facilitavano il confronto delle principali caratteristiche dei diversi stati. È questa, per es., la forma d'esposizione della Descriptio statuum cultiorum in tabulis (1741) di J. P. Anchersen (1700-1765). Dalla tabellare si può far derivare la statistica comparativa, fondata da A. F. Büsching (1724-1793), che ebbe però a considerarla come subordinata alla geografia. Infine fra i teorici della statistica, intesa sempre come descrizione degli stati, si dovranno ricordare Melchiorre Gioia e Giandomenico Romagnosi. Sono del primo la Logica statistica (Milano 1803), Tavole statistiche (ivi 1808), Filosofia della statistica (ivi 1826) e altri scritti, in tutti i quali egli considera la statistica come l'arte di descrivere gli oggetti in ragione delle loro qualità (logica descrittiva), cosicché, nei riguardi degli stati, egli afferma essere via via necessario esaminare sistematicamente le località delle produzioni e dei consumi, la popolazione, le qualità delle produzioni, le arti e i mestieri, il commercio, la pubblica autorità, l'influenza degli elementi topografici sulle abitudini degli uomini. Oltre all'aver dato il giusto rilievo all'influenza dell'ambiente fisico sulla popolazione, egli ebbe dunque anche il merito di attribuire al metodo statistico la massima generalità, cioè la sua applicabilità a diversi oggetti, per quanto manchi nelle sue vedute il fondamentale concetto della molteplicità delle osservazioni. In quanto al Romagnosi, egli scrisse Questioni sull'ordinamento delle statistiche civili (1830), con cui intese ribattere alcune opinioni poco favorevoli alla statistica espresse da J.-B. Say (Traité d'économie politique, 6ª ed., 1841) e fra esse quella di considerare la detta disciplina, nel senso degli universitarî tedeschi, nulla più che una scienza di classificazione e non d'investigazione. Per il Romagnosi la statistica è "l'esposizione dei modi di essere e delle produzioni delle cose e degli uomini"; di uno stato dovrebbero, secondo lui, essere fatte più statistiche successive a intervalli di 30 anni, per rilevare che cosa di esso debba essere conservato o modificato al fine di avvicinarlo a un suo modello ideale.
Seconda fase. - Gli aritmetici politici ebbero come loro capostipite J. Graunt (1620-74) e come lontano precursore Ulpiano, di cui è nota una tavola (inclusa nella Lex Falcidia) per il calcolo delle rendite vitalizie: se poi questa tavola, di carattere empirico, si possa assumere come esprimente le condizioni della mortalità in quei tempi, è assai dubbio. Su più salde basi, il Graunt, un mercante di Londra, ebbe la felice idea di esaminare attentamente la lista delle nascite e quella delle morti distinte per cause; liste pubblicate settimanalmente in quella città e consultate con molto interesse a cagione delle pestilenze e morie alle quali la città stessa andava frequentemente soggetta. Nacquero, da questo esame, le Natural and Political Observations upon the Bills of Mortality (Londra 1662), che ebbero una grande risonanza, e a giusta ragione, in quanto il Graunt, benché di modesta cultura, aveva, con geniale intuito, iniziata l'esplorazione scientifica di un fecondo campo per l'innanzi assolutamente ignoto. Furono, dapprima, certe regolarità (nel presentarsi di talune malattie, accidenti, suicidî, ecc.) che richiamarono la sua attenzione; osservò poi, sui dati di parecchi anni, le proporzioni delle morti in date classi d'età, venendo così a costituire una grossolana tavola di mortalità; osservò pure che i nati vivi davano un rapporto di circa 14 maschi per 13 femmine; che le nascite diminuivano in corrispondenza ai periodi di carestia, ecc. Il Graunt fu cordialmente sorretto nelle sue ricerche e nella divulgazione delle sue scoperte da sir William Petty (1623-87), molto più dotto di lui, creatore della denominazione political arithmetic per designare la nuova scienza, i cui principî egli espose in un'opera dallo stesso titolo (1690), la quale contiene pure una valutazione della popolazione e della potenza economica di varî stati, comparazioni fra alcune grandi città, e in particolare fra Roma e Londra, ecc. I risultati e le idee del Graunt ebbero immediata diffusione in Olanda, per l'applicazione che se ne poteva fare nel calcolo delle rendite vitaiizie, una forma nella quale venivano frequentemente contratti i debiti pubblici. All'accennata rudimentale tavola di mortalità del Graunt altre meno grossolane, per quanto sempre imperfette, venivano sostituite da C. Huyghens (1629-95) e da J. de Witt, basate sull'osservazione di migliaia di vitaliziati. Anche l'astronomo inglese E. Halley (1656-1742) eseguì ricerche molto importanti nel campo dell'aritmetica politica. Sono di lui alcune stime della popolazione di varî stati basate su criterî più razionali di quelli adottati antecedentemente; ma egli va ricordato soprattutto per le sue tavole di mortalità, che vennero costruite su materiale d'osservazione raccolto a Breslavia dall'introduttore dell'aritmetica politica in Germania, C. Neumann (1648-1715). Tale materiale passò nelle mani di Leibniz, e da questo venne trasmesso alla Royal Socieiy, che lo affidò appunto a Halley, uno dei suoi membri. Le tavole di Halley (An estimate of the Degrees of the mortality, ecc.) apparvero nelle Phil. Trans. of the R. Society of London per il 1693; ma esse, basate esclusivamente sulle liste mortuarie del 1687-91, non possono considerarsi come tavole di mortalità nel senso odierno della parola e, comunque, debbono intendersi riferite a una popolazione che si suppone stazionaria. Non fuori di luogo il nome di G. W. Leibniz ricorre in questi cenni: egli preconizzò, infatti, la creazione di una sezione accademica che svolgesse le funzioni di ufficio centrale di statistica, a profitto della pubblica amministrazione. L'idea d'istituire statistiche ufficiali venne caldeggiata in Francia dal maresciallo de Vauban, nel suo Projet d'une disme royale (1707), ove egli ebbe anche occasione di compiere una prima stima della popolazione della Francia (20 milioni). Una teoria dell'aritmetica politica, definita come "l'arte di ragionare mediante le cifre sulle cose che riguardano il governo" venne data da sir Charles Davenant nei suoi Discourses on the public revènues (1698); G. King (1648-1712) si dedicò ai calcoli sulla popolazione e sul suo futuro sviluppo; A. de Moivre, emigrato dalla Francia in Inghilterra per le persecuzioni religiose, trattò delle Annuities upon lives (1725). La diffusione dell'aritmetica politica in Francia fu favorita dal Colbert, poiché, divenuto egli controllore generale delle finanze, ordinò che gl'intendenti gli inviassero periodici rapporti sulle condizioni demografiche ed economiche della popolazione, della quale riuscì in tal modo ad avere una più esatta valutazione e conoscenza: problema di difficile soluzione diretta, per il timore che un censimento dovesse preludere ad aggravî fiscali. Nella Svezia le statistiche ufficiali si iniziarono con P. Elvins (1710-49), che ne propugnò l'istituzione, avvenuta nel 1748, sulla base delle annotazioni del movimento della popolazione eseguite dalle singole parrocchie (esempio di sistema decentrato di rilevazione statistica tuttora vigente); nello stesso paese, più alte mete furono raggiunte da P. Wargentin, che profondamente trattò anche argomenti prima di lui non toccati, quali il pauperismo, la fecondità, l'emigrazione, ecc. Nel 1766 egli pubblicò le sue famose tavole di mortalità per la Svezia, in base ai tre censimenti 1757, 1760, 1763, e ai decessi dal 1757 al 1763; le prime che si riferissero alla popolazione di un intero stato e le prime anche fra le tavole cosiddette di seconda specie o per contemporanei (v. morte: Statistica della mortalità). Altre tavole di mortalità, queste, però, di prima specie, o per generazione, si debbono a A. Déparcieux, che le dedusse dall'osservazione di una comunità di monaci fino alla sua completa estinzione (dal 1607 al 1765) e le pubblicò nel suo Traité des annuités, Parigi 1781; e infine, perfezionamenti al calcolo delle tavole di mortalità, tenendo anche conto dei movimenti migratorî, vennero apportati da T. Simpson in The Doctrine of annuities and reversions, Londra 1742. Ma specialmente col pastore prussiano J. P. Süssmilch (1707-67), autore dell'opera Die göttliche Ordnung in den Veränderungen des menschlichen Geschlechts aus der Geburt, dem Tode und der Fortpflanzung desselben erwiesen (Berlino 1741), l'aritmetica politica raggiunse la fase di maggiore rigoglio. Non avendo una profonda preparazione matematica, egli fu piuttosto incline ad accettare come buono quello che era stato fatto prima di lui; ma i risultati della propria e altrui esperienza seppe poi utilizzare con molto acume per lo studio dei varî fenomeni che intervengono nella società umana e divulgare nelle forme più suggestive; cosicché ben si può dire che la sua opera formi una pietra miliare nel cammino della statistica demografica e anche economica. Egli ritiene che lo studio della popolazione, nel suo stato e nel suo sviluppo, sia l'oggetto più importante della politica; afferma che gli uomini debbono obbedire al precetto biblico della moltiplicazione della specie senza commettere frodi poiché, indipendentemente dalla loro volontà, vige un ordine divino che regola le proporzioni delle nascite, delle morti, dei matrimoni; riconosce esplicitamente che le regolarità si manifestano attraverso la molteplicità delle osservazioni; rileva alcuni legami intercedenti tra fenomeni demografici ed economici; con l'assistenza di Eulero, che gli calcolò all'uopo una tavola numerica, considera il periodo di raddoppiamento di una popolazione sotto diverse condizioni; costruisce tavole di mortalità molto reputate, rimaste in uso fin oltre la metà del secolo scorso, limitandosi peraltro a calcolarle per medie aritmetiche da altre tavole preesistenti. Quest'opera fondamentale fu poi ristampata, con correzioni e aggiunte, anche in materia economica, da C. J. Baumann, genero del Süssmilch. Va altresì ricordato J. H. Lambert (1728-77) che esaminò il problema di determinare una legge della mortalità esprimibile analiticamente, mentre di altri autori che pure si occuparono di questioni attinenti all'aritmetica politica sarà fatto cenno più oltre, in quanto essi vanno ormai informandosi all'idea di utilizzare il calcolo delle probabilità. Si menzioneranno, infine, T. R. Malthus e J.-B.-J. Fourier che per l'aritmetica politica diffusero la denominazione di "statistica", già riservata dai Tedeschi alla Staatskunde.
Terza fase. - Applicazione alla statistica delle teorie della probabilità (per la parte tecnica, v. probabilità, calcolo delle: Applicazioni alla statistica). - Dopo che la teoria delle probabilità ebbe oltrepassata la sua fase embrionale, durante la quale aveva più che altro suscitato un interesse di curiosità nei suoi stessi iniziatori Cardano, Galileo, Pascal, Fermat, passò un certo tempo prima che essa venisse applicata sistematicamente nella statistica, sia a scopo d'interpretazione e di previsione dei fenomeni, sia come mezzo di verificazione dei risultati che quella teoria poteva fornire. L'Ars conjectandi (1713) di J. Bernoulli, il De mensura sortis (in Phil. Trans. 1711) e The Doctrine of chances, ecc. (Londra 1718) di A. de Moivre preparano siffatta applicazione, ma soltanto la Théorie analytique des probabilités (1812) di P.-S. Laplace farà finalmente persuasi gli statistici del profitto che essi potranno trarre dalla nuova disciplina. Discusse, infatti, il Laplace, con rigore di metodo, i due problemi fondamentali che si presentano nelle applicazioni del calcolo delle probabilità alle indagini statistiche, e cioè: a) deviazione di una frequenza empirica da una probabilità teorica, in un certo numero di prove; b) approssimazione raggiungibile, con un certo numero di prove, di una frequenza empirica a una probabilità supposta esistente ma sconosciuta. Cosicché dai risultati ottenuti egli poté trarre largo profitto sia nel problema del rapporto numerico fra i sessi nelle nascite avvenute a Parigi in una lunga serie di anni; sia in quello di risalire alla popolazione di un paese dalla conoscenza dei quozienti di natalità in alcune parti di esso e dal numero totale dei nati in un anno, particolare applicazione di quel metodo rappresentativo che era già stato impiegato empiricamente prima di lui, ma che da lui appunto ricevette una base razionale. Egli precisò ancora, nel suo Essai philosophique sur les probabilités (1816), il modo di costruzione di una tavola di mortalità di prima specie, quale si ottiene osservando una generazione di nati fino alla sua completa estinzione: e il metodo da lui indicato, se non poté avere larga applicazione per la lunghezza delle osservazioni a ciò necessarie, è, tuttavia, di uso corrente per le età infantili fin verso i 3 o 4 anni, mentre per l'intera scala delle età venne realizzato da Hermann per la Baviera ed è tuttora in corso di esecuzione per l'Olanda. Numerose applicazioni della matematica ai problemi della statistica vennero poi compiute da J.-B.-J. Fourier, il quale, ritornato dall'Egitto, dove aveva seguito Napoleone, fu addetto all'ufficio statistico di Parigi, e in tale qualità pubblicò varî scritti, fra cui: Notions générales sur la population (Parigi 1821), Mémoire sur les résultats moyens déduits d'un grand nombre d'observations (1826), ecc. Il problema della formulazione di una "legge della mortalità" fu ripreso da B. Gompertz (1779-1865), che, come espressione della forza della mortalità all'età x prese μx = βc e da W. M. Makeham, che nella sua memoria On the further development of Gonuertz's law (in Journ. of the Inst. of Actuaries, Londra, XVIII), perfezionò tale formula assumendo μx = α + βcx, dove α denota la parte che ha il caso nel determinare l'intensità della mortalità. Tale espressione di μx ha molta importanza pratica, perché quando una tavola di mortalità venga perequata per mezzo di essa il calcolo delle annualità su più teste si può ridurre a quello su di una sola testa. Notevole un Report on the evidence and elementary facts on wich the tables of life annuities are founded (Londra 1829), pubblicato da J. Finlaison, dal quale risultò essere la mortalità inferiore a quella risultante dalle tavole fino allora impiegate per il calcolo delle annualità, che avevano, pertanto, dato luogo a tariffe troppo basse e a gestioni deficitarie. La questione della precisione dei risultati statistici ebbe nuovi contributi da S.-D. Poisson nelle Recherches sur la probabilité des jugements en matière criminelle et en matière civile (Parigi 1837); da A.-A. Cournot, statistico di grande talento oltre che fondatore dell'economia matematica, nella sua Exposition de la théorie des chances et des probabilités (Parigi 1843); e da A. Bravais che, nell'Analyse mathématique sur les probabilités des erreurs de situation d'un point (in Mémoires de l'Istitut de France, Parigi 1846), stabilì il concetto analitico di correlazione fra due variabili aleatorie, senza peraltro approfondirlo, come fecero poi F. Galton e K. Pearson. Figura dominante dell'epoca è, senza dubbio, J. Quetelet, che di quel problema si occupò nelle sue Recherches statistiques (1844), e nelle Lettres sur la théorie des probabilités (Bruxelles 1845), mentre la legge normale di distribuzione degli errori venne da lui largamente illustrata mediante numerose osservazioni di caratteri fisici e morali dell'uomo nell'opera Sur l'homme et le développement de ses facultés, ou essai de physique sociale (Parigi 1835). La constatata regolarità di fenomeni statistici lo condusse ad affermare che ciò che si manifesta nella società umana è dello stesso ordine dei fatti fisici, e quindi a negare il libero arbitrio, negazione però moderata più oltre con l'affermare che l'uomo possiede una forza morale capace di modificare le leggi che lo concernono. Non soltanto egli intraprese lo studio quantitativo dei caratteri umani col metodo statistico, creando in tal modo l'antropometria (v.), ma dimostrò anche la grande fecondità del metodo stesso, considerandolo - conformemente all'attuale concezione - come un apparecchio fecondo di applicazioni nell'indagine quantitativa di molteplici ordini di fatti. Anche gli economisti riconobbero, seppure non sollecitamente, l'opportunità d'impiegare quel metodo, se non altro come mezzo di verifica delle loro deduzioni. In particolare, quando essi furono tratti a studiare le fluttuazioni del valore della moneta, sorse per loro iniziativa l'uso dei numeri indici (v. numero, XXV, p. 36 seg.); e di ciò il merito spetta, forse prima che ad altri, all'italiano G. R. Carli (1720-1795), che in una dissertazione relativa agli effetti della scoperta dell'America sul livello dei prezzi, calcolò una media semplice delle variazioni percentuali dei prezzi del grano, del vino e dell'olio nel 1750 rispetto ai corrispondenti nel 1500. Ma sono pur sempre le statistiche demografiche quelle che assumono i più ampî sviluppi e che dànno più frequente occasione alla formulazione di quei problemi teorici che, nel loro complesso, andranno a mano a mano costituendo il corpo della statistica metodologica e, in particolare, della statistica matematica. Gli atti del censimento inglese del 1851 vennero corredati di una serie di 12 tavole di mortalità per altrettanti gruppi professionali. D'altra parte la teoria formale della popolazione, la Populationistik dei Tedeschi (v. popolazione: Statistica della popolazione) trovava favorevole sviluppo, specialmente in Germania, per merito di G. F. Knapp, di G. Zeuner, autore delle Abhandlungen aus der mathematischen Statistik (Lipsia 1869); di K. Becker con le sue ricerche Zur Berechnung von Sterbetafeln an die Bevölkerungsstatistik zu stellende Anforderungen (Berlino 1874); e infine di W. Lexis con la Einleitung in die Theorie der Bevölkerungsstatistik (Strasburgo 1875). Altro titolo di benemerenza spetta al Lexis per il fatto di essere - con E. Dormoy, autore della Théorie mathématique des assurances sur la vie (Parigi 1878) - uno dei fondatori di quella teoria della dispersione che ha assunto una grande importanza nella statistica metodologica e che, come rileva G. Castelnuovo (Sulle prime applicazioni del calcolo delle probabilità alla statistica e all'attuaria, in Atti dell'Ist. Naz. delle Assicurazioni, Roma 1930), aveva avuto un lontano precursore in N. Bernoulli, nipote di Jacques. Orbene, il Lexis (Über die Theorie der Stabilität statistischer Reihen, in Jahrb. f. Nationalökonomie und Statistik, 1879) e il Dormoy, quasi contemporaneamente e all'insaputa l'uno dell'altro, ritennero opportuno di paragonare sistematicamente la disposizione degli scarti e la variabilità presentate dalla serie empirica di frequenze di un certo fenomeno statistico con la disposizione degli scarti e la variabilità teorica che sarebbero da attendersi in una serie costituita analogamente alla prima, se il fenomeno stesso dipendesse in ciascuna osservazione da una probabilità costante e uguale alla frequenza complessiva con la quale esso si è effettivamente presentato. La ricerca non fu vana e mise in evidenza che sono relativamente poche le serie statistiche per le quali le due accennate variabilità praticamente coincidono (serie a dispersione normale; cfr. probabilità, calcolo delle), mentre le altre serie presentano dispersione superiore o inferiore alla normale. Sussiste, comunque, la possibilità d'ideare per molti fenomeni statistici schemi probabilistici ai quali essi praticamente si conformino, col vantaggio di poter ottenere una interpretazione dei fenomeni stessi e di applicare al loro studio i procedimenti analitici proprî del calcolo delle probabilità, anche a scopo di previsione. Su questa via sono stati fino a oggi compiuti molti progressi dagli statistici, ai quali, tuttavia, altri importanti problemi si sono presentati, soprattutto nel corso delle indagini di antropometria (v.) e di biometria (v.).
In Italia, specialmente sotto il vigoroso impulso di Luigi Bodio che con molta perizia e alacrità resse la statistica ufficiale italiana dal 1872 al 1900, gli studî statistici ritornarono in grande onore. Gli Annali di statistica, di cui la prima serie venne iniziata nel 1871, raccolsero fin da allora pregiati scritti originali di studiosi italiani (Francesco Ferrara, Cesare Correnti, Angelo Messedaglia, Silvio Perozzo, Enrico Raseri, Luigi Rameri, Augusto Bosco, Enrico Ferri, ecc.), e relazioni critiche di lavori stranieri. In alcuni volumi del Movimento dello stato civile venne intrapresa la pubblicazione di comparazioni statistiche internazionali; successivamente apparve la Statistica della morbosità presso i soci delle società di mutuo soccorso (Roma 1879); A. Messedaglia contribuì al riordinamento della statistica giudiziaria ed eseguì interessanti ricerche sulle proprietà delle medie (v. media); S. Perozzo elaborò copioso materiale demografico, e ne trasse, fra altro, argomento allo studio Sulle curve della statura degli inscritti [di leva] misurati in Italia (in Ann. di stat., II, 11, 1878), come pure alla sistematica introduzione degli stereogrammi (v.) e delle curve di livello nello studio dei fenomeni statistici dipendenti da due variabili (statistica grafica); E. Raseri si applicò a studî di antropometria e pubblicò un bell'Atlante di demografia e geografia medica d'Italia (Roma 1906). Da ricordarsi pure Antonio Gabaglio che scrisse una pregevole Teoria generale della statistica (Milano 1888), e in particolar modo Ridolfo Livi, autore della classica Antropometria militare (Roma 1898).
Intanto in Francia A. Bertillon, nella memoria Une application de l'anthropométrie (in Annales de démographie internationale, V, 1881) proponeva, analogamente a ciò che aveva fatto il Quetelet, alcuni metodi per l'identificazione dei criminali. In Inghilterra, F. Galton ebbe il merito di applicarsi allo studio statistico dei fenomeni dell'eredità, e pubblicò in proposito opere fondamentali, quali Hereditary genius (Londra 1869) e Natural inheritance (Londra 1889), nelle quali egli ebbe anche occasione di ideare nuovi strumenti d'indagine, pervenendo, fra l'altro, alla formulazione di quella legge di regressione, secondo la quale se un carattere quantitativo è posseduto con intensità eccezionalmente alta o bassa, esso tende - nel trasmettersi ereditariamente - a regredire verso l'intensità normale.
Come risulta da questi cenni, la terza fase di sviluppo della statistica si è svolta con specializzazioni ed estensioni in varî sensi: affinamento dei metodi d'indagine e constatazione dell'applicabilità di questi metodi alle più disparate classi di fenomeni collettivi. Tuttavia nella fase stessa alcune teorie astratte, alla cui creazione aveva appunto dato occasione lo studio di tali fenomeni, non hanno ancora assunto né una propria autonomia, né un'organica sistemazione in un corpo di dottrine, quasi che per ciascun ordine di fatti collettivi occorresse uno speciale apparato metodologico.
Quarta fase. - Statistica metodologica e statistica applicata. - Rientrano in questa fase, che è l'odierna, tutti quegli sviluppi che presuppongono una netta distinzione fra l'insieme dei metodi idonei allo studio quantitativo dei fenomeni di massa da una parte e le applicazioni di siffatti metodi dall'altra. Naturalmente le origini di alcuni fra gli accennati sviluppi e specializzazioni risalgono all'una o all'altra delle precedenti fasi di evoluzione della statistica. In particolare i più elementari principî d'ordine pratico che si fanno rientrare nella statistica metodologica, dominante per la sua astrazione e generalità tutto il complesso, dovettero essere posti fin da quando sorse il bisogno delle prime rilevazioni statistiche: tali, per es., quelli che riguardano la raccolta, lo spoglio, la sistemazione dei dati e la valutazione dell'intensità media di un carattere.
I cenni che seguono definiscono brevemente il campo proprio delle più importanti specializzazioni, alle quali dà luogo la statistica, così come oggi è intesa.
Statistica metodologica.
È "una tecnica speciale, adatta per lo studio quantitativo dei fenomeni di massa o collettivi (o statistici), intendendo per tali quelli la cui misura richiede una massa o collezione di osservazioni" (C. Gini).
L'applicazione del metodo statistico non ha sempre lo stesso grado di necessità: vi sono fenomeni, l'intensità dei quali non può determinarsi se non impiegando quel metodo (es.: ammontare della popolazione di uno stato); altri dei quali si ha la conoscenza qualitativa ma non quantitativa senza l'impiego del metodo stesso (es.: modo di distribuirsi delle varie stature in una popolazione); e infine altri ancora per i quali l'uso di quel metodo serve a meglio precisare la conoscenza quantitativa che di essi già si aveva (es.: precisazione del peso di un corpo mediante molte pesate, sintetizzate opportunamente). Le singole osservazioni vengono generalmente fatte sui diversi elementi o unità statistiche di una collettività. In tali elementi si ha riguardo talvolta alla sola circostanza dell'essere un determinato carattere qualitativo presente o assente; qualche altra volta è possibile considerare in siffatto carattere varie modalità; infine, oltre ai qualitativi, possono negli elementi della collettività presentarsi caratteri quantitativi, di ciascuno dei quali potrà misurarsi l'intensità.
L'enumerazione delle unità statistiche di un gruppo e la determinazione della presenza o del grado o dell'intensità dei loro caratteri qualitativi o quantitativi, costituiscono ciò che si dice la rilevazione dei dati (es.: enumerazione dei maschi e delle femmine che compongono una popolazione; oppure: enumerazione e valutazione dei singoli patrimonî che compongono la ricchezza privata di una nazione). La rilevazione dei dati comporta diversi stadî: a) il piano della rilevazione, nel quale si deve: ben definire il fenomeno collettivo da rilevare; fissare i limiti del campo in cui l'osservazione deve essere contenuta e quelli della precisione da conseguire; stabilire come, quando, da chi e con quali mezzi la rilevazione debba essere fatta; b) l'assunzione o raccolta dei dati; in questa fase le rilevazioni possono essere preliminari o definitive, e anche occasionali (come l'indagine sulle abitazioni eseguita col censimento 1931), periodiche (come i censimenti demografici, che, in Italia, dal 1931 debbono aver luogo di 5 in 5 anni alla data 21 aprile), continue (come la rilevazione delle nascite, delle morti, dei matrimonî, ecc.); le rilevazioni si possono anche distinguere in dirette e indirette; sotto altro aspetto possono essere complete, incomplete, più che complete: in questo caso tutte le unità statistiche o parte di esse vengono rilevate più volte (p. es., in un censimento, gli assenti temporaneamente dalla dimora vengono censiti come tali nel luogo di dimora abituale, e come presenti in quello di presenza occasionale); infine una rilevazione, incompleta o più che completa, si dice rappresentativa se tutte le unità statistiche hanno uguale probabilità di venire rilevate; c) lo spoglio dei dati, comprendente l'enumerazione delle unità e la loro classificazione in categorie omogenee rispetto a qualche carattere; esso si può eseguire a mano o meccanicamente; d) la sistemazione dei dati in prospetti o tavole statistiche di varia complicazione. Infine, allo scopo di facilitarne lo studio, i dati statistici vengono spesso disposti in seriazioni e serie statistiche (v. serie: Serie e seriazioni statistiche), cioè in successioni corrispondenti alle modalità di caratteri quantitativi e rispettivamente qualitativi.
Tali sono le operazioni statistiche preliminari costituenti quella che più propriamente si può dire tecnica statistica. A esse altre ne seguono, di ordine più elevato, considerate nella loro generalità dalla statistica metodologica, la quale in senso stretto consta di due parti: la prima tratta dei metodi di misura appropriati a dati statistici che si suppongono perfetti; la seconda tende a correggere le imperfezioni di questi, li sottopone a critiche comparazioni, e ne induce eventualmente le leggi che governano i fenomeni per loro mezzo osservati.
1. La misura dei fenomeni statistici può avere come oggetto: l'intensità di un fenomeno; le relazioni fra le intensità di due o più fenomeni; la distribuzione di un fenomeno; le relazioni fra le distribuzioni di due fenomeni; le relazioni fra le singole modalità delle distribuzioni di due fenomeni.
a) La misura di un fenomeno statistico può concernere la sua intensità globale (p. es., ammontare della ricchezza privata di una nazione) o la sua intensità media (p. es., ricchezza media individuale). In senso generale, come intensità media (v. media) si può intendere qualunque intensità compresa fra la minima e la massima che un fenomeno o un carattere ha acquistato. Ma, caso per caso, conviene opportunamente specializzare la media. La più importante e di uso più comune nella statistica, la media per antonomasia, è quella aritmetica, definita da
dove a1, a2 ..., an denotano le singole intensità del fenomeno; essa consente di paragonare le intensità che un fenomeno assume in due collettività, anche nel caso in cui queste siano diversamente numerose. Non avrebbe, in generale, significato paragonare la ricchezza complessiva di 1000 individui con quella di 10; è, invece, significativo il confronto della ricchezza media individuale del primo gruppo con quella media del secondo gruppo d'individui. Della media aritmetica si fa pure uso quando, eseguite, di una grandezza, più misurazioni affette da errori accidentali, se ne voglia dedurre una misura, verosimilmente più corretta, della stessa grandezzȧ (media oggettiva). Se la media aritmetica viene, invece, calcolata per sintetizzare le misure delle diverse grandezze di una collettività, essa viene a costituire ciò che si dice una media soggettiva (p. es., statura media degli adulti maschi di una popolazione, media che si può riguardare come una caratteristica somatica della popolazione stessa). La media aritmetica, e anche la media geometrica e la mediana, senza nominarne altre meno usuali, hanno importanza anche in relazione allo studio della variabilità dei caratteri, per le proprietà di cui godono gli scostamenti che da esse hanno i singoli valori da cui sono dedotte (v. variabilità, e, per alcune pratiche applicazioni del concetto di variabilità, v. distribuzione della ricchezza). Inoltre, in base al principio di conservazione delle leggi formali, alcuni dei particolari concetti di media possono essere estesi a serie dipendenti da un carattere qualitativo, oppure dipendenti da due o più caratteri qualitativi o quantitativi. Si può così pervenire, fra l'altro, alle definizioni di centro di gravità e di centro mediano di un territorio o di una popolazione.
b) Le relazioni fra le intensità di fenomeni statistici, connessi logicamente fra loro, si determinano con opportune combinazioni e generalmente mediante rapporti delle misure di tali intensità. Si ottengono così quozienti "che si semplificano" oppure "che si risolvono" secondo che il risultato sia o non sia omogeneo con i termini del quoziente. Rapporti che si semplificano sono: la media aritmetica; i rapporti di coesistenza fra le intensità di due fenomeni in uno stesso luogo o tempo, oppure di uno stesso fenomeno in luoghi o tempi diversi (p. es., rapporto "di mascolinità" fra i numeri dei maschi e delle femmine di una popolazione; rapporto fra le popolazioni di due stati); i rapporti di composizione fra le parti e il tutto (p. es., percentuali di celibi, di coniugati, di vedovi, di separati legalmente e di divorziati in una popolazione); i rapporti di derivazione generica o specifica fra l'intensità di un fenomeno e quella di un altro, che ne costituisce il presupposto generico o specifico (p. es., quoziente generico di natalità, cioè numero dei nati in un anno per 1000 individui di una popolazione, v. nascita: Statistica della natalità; e, rispettivamente, quoziente di fecondità matrimoniale, cioè nati legittimi in un anno per 1000 coniugate); i rapporti analoghi a quello che definisce la probabilità matematica di un evento, fra il numero dei casi a esso favorevoli e il numero dei casi possibili; i numeri indici (v. poco oltre). Rapporti che si risolvono sono: di durata, se hanno luogo fra il numero degli elementi che compongono una collettività in un certo istante e il numero di quelli ehe nell'unità di tempo entrano nella collettività (oppure ne escono), e esprimono esattamente o soltanto approssimativamente - secondo che la collettivita sia o non sia stazionaria - la permanenza media degli elementi in seno alla collettività (p. es., l'ammontare dei depositi in una banca diviso per la media settimanale dei depositi, fornisce la giacenza media dei depositi, espressa in settimane); di ripetizione, se hanno luogo fra i numeri di eventi di due diverse classi e tali che gli eventi della prima siano originati da eventi della seconda classe: enumerati gli eventi di ciascuna delle due classi, che si verificano in uno stesso intervallo di tempo, il quoziente del primo numero per il secondo esprime (esattamente in regime stazionario, o se no approssimativamente) quanti eventi della prima derivano in media da ciascun evento della seconda (p. es., il numero medio annuo delle nascite legittime diviso per il numero medio annuo dei matrimonî dà approssimativamente il numero medio di nascite per matrimonio. Per un più esatto metodo di calcolo di questo numero cfr. C. Gini, Sulla determinazione del numero medio dei figli legittimi per matrimonio; Movimento della popolazione nel 1928, Roma, 1932.
I numeri indici possono essere semplici, sintetici e composti. Una serie (temporale o territoriale) di indici semplici o elementari è costituita dai valori ehe l'intensità di un fenomeno assume in tempi o luoghi diversi, quando l'intensità o la media delle intensità in un certo tempo o periodo o luogo (base) viene rappresentata con l'indice 100: perciò i valori degli indici mostrano senz'altro le variazioni percentuali dell'intensità del fenomeno rispetto all'intensità nel tempo o periodo o luogo base. Ecco, p. es., una serie di prezzi del pane e la corrispondente serie di indici semplici, quando sia indicato con 100 il prezzo medio nel 1913:
Una serie di indici sintetici è quella che riflette l'intensità complessiva di più fenomeni affini, e si ottiene con opportune medie (aritmetiche o geometriche, semplici o ponderate) dai termini corrispondenti delle diverse serie di indici semplici che denotano l'andamento di quei singoli fenomeni. Qualche volta, invece, la sintesi viene eseguita direttamente sulle intensità dei varî fenomeni, anziché sugl'indici elementari. Così, se p0′, p0″, p0‴, ... sono i prezzi unitarî di varî beni o servizî nel tempo t0 e p1′, p1″, p1‴ ... i prezzi degli stessi beni o servizî nel tempo t1, q0′, q0″, q0‴, ... e q1′, q1″, q1‴ ... le quantità di quei beni o servizî acquistate in t0 e t1, il quoziente (Σp1 q0 : Σp0 q0) • 100 sarà un indice sintetico di quei prezzi nel tempo t1 rispetto al tempo base t0, quando si assumano come coefficienti di ponderazione dei prezzi le quantità acquistate nel tempo t0; se invece si assumessero come pesi le quantità acquistate nel tempo t1, l'indice in t1 rispetto a t0 sarebbe (Σp1 q1 : Σp0 q1) • 100. La media geometrica di questi due indici, cioè
formata simmetricamente con le quantità q0 e q1, costituisce quel particolare indice (dei prezzi del tempo t1 rispetto a t0) che I. Fisher ha chiamato indice "ideale". Analogamente, l'indice "ideale" delle quantità in t, rispetto a t0 assumendo come pesi i prezzi, sarebbe
In queste scritture le somme indicate col segno Σ vanno estese a tutti i termini analoghi a quello scritto dopo quel segno. Gl'indici composti sono, infine, quelli che servono a sintetizzare le variazioni di fenomeni anche non omogenei e, in particolare, sono spesso impiegati per esprimere le condizioni economiche e sociali di un paese. Per l'Italia si potranno esaminare molte serie di numeri indici, specialmente relativi a fenomeni economici, nel Bollettino mensile di statistica e nel Bollettino dei prezzi dell'Istituto centrale di statistica del regno d'Italia, nelle Prospettive economiche di G. Mortara (Milano), ne La vita economica italiana diretta da C. Gini (Roma) e altrove.
c) Distribuzione di un fenomeno statistico. Può essere considerata nel tempo, nello spazio e secondo le modalità qualitative o quantitative del fenomeno stesso.
La distribuzione di un fenomeno statistico nel tempo, cioè la successione a1, a2,..., an delle sue intensità in istanti o intervalli di tempo che si susseguono, costituisce una serie storica o temporale (p. es., valore delle importazioni annue in uno stato, per una serie di anni), il cui andamento si può sintetizzare mediante l'indice di oscillazione (intensità media delle oscillazioni in valore assoluto, passando da ciascun termine al successivo) e mediante indici di evoluzione, che servono a rappresentare la tendenza generale del fenomeno nel tempo. Qualche volta è possibile e interessante scindere una serie storica in serie componenti più semplici: la componente secolare o movimento profondo (ingl. trend) rappresenta l'andamento principale del fenomeno, e può essere messa in evidenza mediante l'interpolazione col metodo dei minimi quadrati (v. sotto) o col metodo grafico di una retta o di una curva semplice, condotta a passare fra i valori a1, a2, ..., an e in prossimità di essi; eliminata tale componente, cioè sottratti dai valori a1, a2, ..., an i valori forniti dalle corrispondenti ordinate della retta o curva interpolatrice, può darsi che nella serie residua b1, b2, ..., bn risultino evidenti variazioni stagionali, cioè dipendenti dall'avvicendarsi delle stagioni; anche queste variazioni possono essere opportunamente eliminate, in modo da avere una nuova serie c1, c2, ..., cn che può presentare quelle variazioni che sono dette di congiuntura o cicliche, e che generalmente si svolgono nello spazio di qualche anno; eliminate anche queste, i termini residui d1, d2, ... dn presentano generalmente ancora delle variazioni, che sono quelle di carattere accidentale, cioè dipendenti da numerose cause agenti in vario senso e delle quali non riesce possibile separare gli effetti.
Se si osserva in qual modo un carattere qualitativo (o quantitativo) si distribuisce a seconda delle sue modalità fra gli elementi di una collettività, si ha una serie (o rispettivamente una seriazione) statistica (v. serie: Serie e seriazioni statistiche), il cui studio può essere agevolato mediante un'opportuna rappresentazione grafica (v. diagramma). Quando, in particolare, la distribuzione concerne un carattere quantitativo, si può usare un diagramma cartesiano portando sull'asse delle ascisse i valori di tale carattere e parallelamente all'asse delle ordinate i numeri degli elementi corrispondenti a ciascuno di quei valori. Unendo con segmenti di retta i successivi estremi di tali ordinate si ha un poligono di frequenze. Se poi si conoscono i numeri di elementi corrispondenti non già a singoli valori ma a intervalli di valori del carattere, bisogna sui segmenti che rappresentano tali intervalli costruire rettangoli le cui aree siano proporzionali a quei numeri di elementi, per ottenere ciò che si dice un istogramma. Si può anche sostituire a quei numeri (frequenze assolute) i loro rapporti (frequenze relative o semplicemente frequenze) rispetto al numero totale N degli elementi; e se, dopo ciò, si può pensare: che N tenda all'infinito, che il carattere considerato varii con continuità, e che le ampiezze degli intervalli di variazione del carattere diminuiscano indefinitamente e tendano ad annullarsi, allora i lati superiori degli accennati rettangoli vengono a costituire, al limite, quella che si dice una "curva delle frequenze". Posto che y = ϕ (x) sia l'equazione cartesiana di tale curva, ϕ (x) dx denoterà la frequenza relativa degli elementi nei quali il carattere assume un valore compreso fra x e x + dx, e l'area compresa fra la curva stessa e le ordinate corrispondenti a due ascisse a e b rappresenterà la frequenza relativa dei termini nei quali il valore del carattere è compreso fra a e b, cosicché se a e b fossero i valori estremi che il carattere assume nella data distribuzione, quell'area acquisterebbe il valore 1. Le curve di frequenze hanno talvolta una forma che si avvicina a quella campanulare della curva di distribuzione degli errori accidentali o curva normale della probabilità (v.), mentre altre volte se ne allontanano considerevolmente; esse possono essere dotate di una sola ordinata massima (corrispondente a quel valore del carattere che presenta la più elevata frequenza e che si dice moda o norma o valore tipico) e in tal caso si dicono unicuspidali o unimodali; altre volte, invece, sono plurimodali.
Data una distribuzione del genere accennato, e descritto. per maggiore chiarezza, il corrispondente diagramma cartesiano, si può indagare se quella che sarà al limite la curva delle frequenze, possa essere analiticamente rappresentata in forma relativamente semplice. È questo uno dei problemi dell'interpolazione e la sua soluzione, quando sia possibile, riveste molta importanza, sia perché l'equazione della curva interpolatrice permette di sintetizzare la distribuzione del fenomeno considerato, sia perché la stessa equazione (legame fra intensità del carattere e relativa frequenza) viene a costituire una legge, sia pure di carattere empirico, che governa il fenomeno. K. Pearson ha considerato i tipi di curva di frequenze che più spesso si presentano nella pratica statistica e ne ha date, da un punto di vista puramente formale, le rispettive equazioni deducendole tutte da una stessa equazione differenziale; di talune di queste curve F. P. Cantelli e F. Vinci hanno fornito interpretazioni probabilistiche.
Altri due tipi di curve di distribuzione, oltre quelle di frequenza, sono le curve "di graduazione" e quelle "di concentrazione". Delle prime (F. Galton) l'idea si può avere pensando al profilo disegnato dalle teste di un numeroso gruppo di persone equispaziate e disposte in fila diritta per ordine di statura crescente; sull'asse delle ascisse risulta allora rappresentato, dal principio della fila, il numero dei termini nei quali l'intensità del carattere considerato non supera un certo valore, mentre questo stesso valore viene rappresentato parallelamente all'asse delle ordinate. Una curva di concentrazione (Lorenz) è quella in cui un punto generico ha le coordinate cartesiane px e qx; px è la proporzione che sul totale N degli elementi costituisce il numero di quelli in cui il carattere non supera il valore x; qx è la proporzione che sulla quantità T di carattere, complessivamente posseduta dagli N elementi, costituisce la quantità di carattere posseduta insieme dai soli elementi in cui il carattere non supera il valore x. La curva in questione rimane quindi tutta compresa in un quadrato di lato uguale all'unità, volge la sua convessità verso l'asse delle ascisse e si stende dal vertice inferiore sinistro al vertice superiore destro del detto quadrato, restando sotto la diagonale che si stende fra gli stessi vertici. Se il carattere è uniformemente distribuito fra i varî elementi, la curva di concentrazione coincide con quella diagonale, altrimenti se ne distacca tanto più quanto maggiore è la disuguaglianza nella distribuzione del carattere. Perciò l'area ("di concentrazione") compresa fra la diagonale e la curva, paragonata al suo valore massimo, che si vede facilmente essere la metà del quadrato, costituisce un indice di variabilità relativa, detto "rapporto di concentrazione" (R), che è stato introdotto nella tecnica statistica dal Gini.
Le figg. 1-5 rappresentano varî tipi di curve di distribuzione. La fig. 4 (curva di distribuzione dei redditi globali) si può considerare come una curva di graduazione prendendo y come asse delle ascisse e x come asse delle ordinate. Data una distribuzione di un fenomeno quantitativo secondo le sue intensità, se ne possono dedurre certi valori caratteristici (o segnaletici, come dice A. Niceforo), che hanno lo scopo di misurare qualche particolare aspetto della distribuzione stessa. Tali sono, per es., le medie e gl'indici di variabilità assoluta o relativa (v. variabilità).
d) Relazioni fra le distribuzioni di due fenomeni. Se due siffatte distribuzioni hanno fra loro qualche nesso logico, per es. se sono ottenute in corrispondenza alle modalità di uno stesso carattere, è lecito e opportuno eseguirne il confronto, ciò che meglio si può fare rappresentandole graficamente, e allora può darsi che esse presentino, nel complesso, le stesse fasi di crescenza, di stazionarietà e di decrescenza (concomitanza), oppure che a variazioni in un senso nell'una corrispondano variazioni in senso opposto nell'altra (antagonismo). Se si tratta di due serie di frequenze (v. serie: Serie e seriazioni statistiche) dipendenti da uno stesso carattere quantitativo, esse possono venire paragonate nell'intento di constatare se esse diano o non diano luogo a "transvariazione", concetto introdotto dal Gini e chiarito dal seguente esempio. Come si sa, le femmine hanno, in genere, una statura inferiore a quella dei maschi, ma vi sono femmine la cui statura supera quella di taluni maschi. Ne segue che, presi a caso in una popolazione due gruppi molto e ugualmente numerosi di maschi e rispettivamente di femmine, e tracciate in uno stesso sistema cartesiano le corrispondenti curve di frequenza M ed F in funzione della statura (fig. 6), avverrà che la curva F rimarrà, nel suo insieme, a sinistra della M, ma che una parte della F si accavallerà su una parte della M, corrispondentemente a quelle femmine che hanno una statura maggiore di certi maschi. Si dice, pertanto, che le due considerate distribuzioni dànno luogo a transvariazione, mentre questa non si verificherebbe se la F rimanesse tutta a sinistra della M. La transvariazione può essere più o meno pronunciata, e i suoi varî aspetti possono essere misurati impiegando opportuni indici. Infine, passando sotto silenzio altre forme di confronto, due distribuzioni dipendenti da uno stesso carattere quantitativo possono essere paragonate al fine di misurare il loro grado di dissomiglianza (Gini). Supponendo, per semplicità, che esse siano ugualmente numerose, e disposti i termini di ciascuna distribuzione secondo il valore crescente di quel carattere, la media delle differenze in valore assoluto fra i valori che nelle due graduatorie occupano posti uguali (valori cograduati) costituirà un indice sintetico della complessiva diversità o dissomiglianza fra quelle distribuzioni e la media stessa si ridurrà a zero se le due distribuzioni coincidono. La curva di frequenze rappresentante la distribuzione di un fenomeno quantitativo può essere anche paragonata con una distribuzione teorica. Generalmente il confronto si eseguisce con la curva normale della probabilità, e poiché questa curva è simmetrica rispetto all'ordinata passante per il valore medio della variabile casuale, così è, anzitutto, opportuno misurare il grado di asimmetria della data distribuzione, ciò che può essere fatto mediante appositi indici: così la somma dei cubi degli scarti dei valori del carattere dalla media aritmetica di questo sarà nulla nel caso di simmetria, oppure positiva o negativa secondo che complessivamente prevalgano gli scarti positivi o quelli negativi.
In secondo luogo si osserverà fino a qual punto gli scarti dei valori del carattere dalla media aritmetica si conformino al modo di distribuirsi degli scarti nella distribuzione gaussiana; e infine si sperimenterà se la dispersione della data distribuzione sia o non sia normale (vedi probabilità, calcolo delle).
e) Relazioni fra le singole modalità delle distribuzioni di due fenomeni collettivi. Se in una collezione di unità statistiche sono simultaneamente considerati due caratteri, vi è luogo a eseguire una doppia classificazione di tali unità in dipendenza delle diverse modalità dell'uno e di quelle dell'altro carattere, ottenendo un prospetto a doppia entrata, in cui a capo delle linee sono indicate le modalità di uno, e a capo delle colonne le modalità dell'altro carattere, mentre in ciascuna casella è posto il numero delle unità nelle quali simultaneamente si presentano le modalità dei caratteri corrispondenti alla linea e alla colonna che in essa s'intersecano (p. es., una collettività di persone classificate secondo il loro peso e la loro statura). Altre volte, invece, i due caratteri considerati appartengono rispettivamente a due distinte e ugualmente numerose collezioni di unità statistiche poste in corrispondenza fra di loro (p. es., pesi di un gruppo di neonati ed età delle rispettive madri); ora, intendendo associata a ciascuna unità di una collezione quella corrispondente dell'altra, si verranno a costituire unità statistiche, che si potranno dire di second'ordine (Andreoli), classificabili in un prospetto a doppia entrata, nello stesso modo prima indicato. In un caso e nell'altro lo statistico disporrà dunque di una distribuzione di unità dipendente simultaneamente da due caratteri, e un problema che gli si offrirà sarà appunto quello di vedere se e di quanto le modalità di un carattere abbiano relazione con le modalità dell'altro carattere: se e in quale misura, nel primo esempio, al variare del peso, risulti subordinato un particolare modo di distribuirsi degl'individui secondo la statura e viceversa; e se e in quale misura, nell'altro esempio, al variare dell'età delle madri risulti subordinato un particolare modo di distribuirsi del peso dei neonati, e viceversa. Nello studio delle eventuali relazioni fra le singole modalità dei due caratteri è necessario distinguere due fasi successive, corrispondenti ai concetti di "connessione" e di "concordanza", dei quali il secondo è subordinato al primo. Esiste connessione fra i due caratteri, se, per ogni modalità dell'uno, quelle dell'altro si distribuiscono in modo particolare. Supposto, poi, che tale connessione si verifichi e che le modalità dei due caratteri siano paragonabili, si dirà che esiste concordanza (o discordanza) se al variare delle modalità di un carattere in un certo senso le modalità dell'altro tendono a variare nello stesso senso (o in senso opposto). Riferendosi al prospetto a doppia entrata di cui si è detto, se esiste connessione, le distribuzioni parziali contenute nelle diverse colonne (o linee) sono fra loro dissimili; se esiste concordanza (o discordanza), non soltanto tali distribuzioni sono dissimili, ma rivelano, nel complesso, variazioni dell'un carattere concordi (o discordi) rispetto a quelle dell'altro. Sono stati ideati diversi indici idonei a misurare, sotto varî aspetti, sia la connessione, sia la concordanza. Per tutta questa materia v. correlazione; probabilità, calcolo delle: Applicazioni alla statistica.
2. L'integrazione, la comparazione dei dati e le leggi statistiche.
a) Qualche volta accade che una serie di dati statistici, dipendente da un certo carattere, presenti lacune. Queste potranno talora colmarsi, in via congetturale, ricorrendo a un criterio di analogia, se si conoscono i termini corrispondenti a tali lacune in un'altra serie dipendente dallo stesso carattere, e avente un andamento parallelo alla serie che si tratta di completare. Ma se manca una base siffatta all'integrazione che si vuole eseguire, è necessario ricorrere all'interpolazione (v.) di una curva che - riferendosi a una rappresentazione cartesiana della serie data - passi per i punti o fra i punti corrispondenti ad alcuni dati noti (prossimi a quello ignoto), in modo che la curva stessa, se è stata scelta convenientemente, possa fornire con le sue ordinate plausibili valori dei dati incogniti. Potendolo, si applicheranno ambedue i procedimenti indicati, affinché l'uno serva di controllo all'altro, tanto più che nessuno di essi può pretendere di fornire dati esatti.
La curva interpolatrice viene qualche volta usata allo scopo di prolungare una serie di dati un poco oltre i limiti fra i quali essa è contenuta (estrapolazione): tale processo, che può fornire utili indicazioni e che, nel caso di una serie temporale, può essere applicato a scopo prospettivo o retrospettivo, deve essere sempre usato con grande cautela (v., per es., popolazione: Statistica della popolazione.
b) Gli errori accidentali da cui possono essere affetti i dati statistici sono talvolta messi in evidenza da un critico esame di questi dati, e tale esame risulta facilitato dall'ispezione di appropriate rappresentazioni grafiche: l'improvviso discostarsi di un dato dalla linea che segna l'andamento del fenomeno, è spesso indizio di errore, che si cercherà poi di determinare e correggere. Ma, più in generale, può accadere che la rappresentazione grafica dei dati y1, y2, ..., yi, ..., yn corrispondenti ai valori x1, x2, ..., xi, ..., xn, di un carattere quantitativo da cui essi dipendono (si pensi, per es., a una seriazione storica, data, cioè, in funzione del tempo) dia adito alla presunzione che i dati stessi siano tutti, più o meno, affetti da errori accidentali, e che perciò il genuino andamento del fenomeno sia rappresentato da una linea non già passante per i punti stessi, ma piuttosto fra di essi, in modo che da una parte della linea rimangano i punti corrispondenti a valori eccessivi e dall'altra quelli corrispondenti a valori scarsi. Siffatta linea può in alcuni casi essere tracciata a mano (interpolazione grafica), mentre in altri casi deve preferibilmente essere determinata con procedimento analitico (interpolazione analitica) e allora il metodo che generalmente meglio risponde allo scopo indicato è quello "dei minimi quadrati". Scelto, anzitutto, un conveniente tipo di funzione interpolatrice y = F (x), se ne determineranno poi i parametri in tal modo che risulti minima la somma dei quadrati delle differenze o scarti fra i valori osservati y1, y2, ..., yi, ... yn e i corrispondenti valori della funzione interpolatrice, F (x1), F (x2), ... F (xi), ..., F (xn). Se i punti mostrano una tendenza a disporsi sopra una retta, oppure sopra una parabola, ecc. si eseguirà l'interpolazione mediante una retta di equazione y = a + bx, o rispettivamente mediante una parabola di equazione y = a + bx + cx2, ecc. Per es., nel caso della retta, minimizzando la somma Φ = Σ (a + bxi − yi)2, ciò che si ottiene con l'uguagliare a zero le derivate parziali di Φ rispetto ad a e a b, questi parametri risulteranno determinati dal sistema di equazioni
c) Quando una rilevazione incompleta o più che completa non sia rappresentativa, cioè quando le modalità del fenomeno rilevato si presentino con frequenze relative sistematicamente diverse da quelle che si avrebbero nella rilevazione completa, si può qualche volta ovviare, con opportuni accorgimenti, alla mancanza di rappresentatività. Se, per es., volendo studiare il fenomeno della prolificità, s'interrogassero i figli anziché i genitori, e in tal modo si raccogliessero: 1000 denunce di famiglie con un solo figlio; 1800 con 2 figli; 3000 con 3 figli; 3200 con 4 figli; 3000 con 5 figli, sarebbe errato pensare che siano state, in tutto, rilevate 12.000 famiglie con complessivi 1000 + 3600 + 9000 + 12.800 + 15.000 = 41.400 figli, e che perciò la prolificità media sia di 41.400 : 12.000 = 3,45 figli per famiglia. In realtà ogni famiglia con un figlio è stata denunciata una sola volta; ognuna con 2 figli è stata denunciata da ciascuno di questi, e quindi 2 volte; ognuna con 3 figli, 3 volte, ecc. Perciò il vero numero delle famiglie è dato da 1000 (1800 : 2) + (3000 : 3) + (3200 : 4) + (3000 : 5) = 4300, e queste ebbero 12.000 figli, cosicché la prolificità media fu di 12.000 : 4300 = 2,79.
Il concetto di rappresentatività interviene anche nel caso in cui, data una collettività di N unità statistiche, venga assoggettata a indagine soltanto una sua parte o campione, costituita di n 〈 N unità prese a caso. Si presentano, allora, due problemi d'importanza fondamentale, dei quali si è fatto fugace accenno nella parte storica; essi sono: 1. con quale approssimazione una quantità caratteristica (p. es. una media, un indice di variabilità, ecc.) dedotta dal campione potrà rappresentare la quantità omologa dedotta dall'insieme totale? E inversamente: 2. dato un certo limite di approssimazione ε, come dovrà essere scelto n affinché vi sia una determinata probabilità che una certa quantità caratteristica dedotta dal campione non differisca in valore assoluto più di ε dalla quantità caratteristica dedotta dalla totalità? Alla soluzione di questi problemi il calcolo delle probabilità offre i suoi preziosi servigi.
d) La comparazione dei dati può essere eseguita dopo averli integrati e corretti e dopo avere da essi eliminati gli effetti di circostanze diversamente influenti. Essa costituisce una delle fasi più importanti e delicate nella elaborazione e interpretazione dei dati, specialmente quando si voglia predisporre la ricerca delle eventuali leggi e regolarità che dominano i fenomeni statistici. Della comparazione si tratta più oltre separatamente, con l'ampiezza che l'argomento richiede (v. oltre: Comparazione dei dati statistici.)
e) La più alta finalità alla quale può tendere l'indagine statistica, risalendo induttivamente dai fenomeni collettivi osservati, è quella di scoprire le cause che li producono e le circostanze che influiscono su di essi, e di precisare, qualora esistano, i legami costanti o leggi statistiche fra quei fenomeni e le cause o circostanze influenti. Queste leggi, nelle quali risulta eliminato tutto ciò che è accidentale e contingente, e ritenuto soltanto ciò che vi è di regolare e permanente nella manifestazione dei fenomeni statistici, hanno grande importanza, non solo da un punto di vista puramente speculativo, ma anche al fine di prevedere, per deduzione dalle leggi scoperte, il verificarsi del fenomeno al ripetersi in altro tempo o luogo delle cause e circostanze già osservate.
I fenomeni statistici, e specialmente quelli che hanno luogo nel campo sociale, sono generalmente di tal natura e così complessi, da non poter essere riprodotti a volontà dell'osservatore: non è dunque il metodo sperimentale che il più delle volte può essere impiegato nel loro studio, per quanto non manchino esempî di sperimentazioni eseguite per cercare le leggi dello sviluppo di alcune specie biologiche. Lo statistico deve perciò, di solito, limitarsi a osservare i fenomeni che sono oggetto della sua considerazione, anche se egli voglia di taluno di essi cercare le cause e le circostanze influenti. L'intervento di una causa si può scoprire per diverse vie, fra le quali è spesso seguita quella di osservare se il fenomeno subisca qualche deviazione rispetto all'andamento che sarebbe da presumersi se non agissero fattori di perturbazione. Altro mezzo è quello di formulare un sistema d'ipotesi che si ritenga atto alla spiegazione del fenomeno studiato, e di osservare fino a qual punto questo si accordi con lo schema teorico dedotto da quelle ipotesi; se l'accordo non è soddisfacente, ciò significa che qualche causa diversa o qualche causa supplementare, oltre a quelle implicite nelle ipotesi fatte, interviene nella produzione del fenomeno. Riconosciuto, in qualche modo, l'intervento di una causa, lo statistico dovrà passare a individuarla, e ciò potrà fare usando qualcuno dei soliti procedimenti induttivi, classificati da J. Stuart Mill sotto uno dei quattro schemi seguenti: a) metodo delle variazioni concomitanti: se un fenomeno A varia sempre in una certa direzione e misura, quando un altro B varia in una data direzione e misura, s'induce che fra A e B esiste una relazione di causa a effetto, oppure che entrambi dipendono da una medesima causa; b) metodo delle differenze: se A si verifica al verificarsi delle circostanze P, a, b, c e non si verifica al verificarsi delle sole circostanze a, b, c, s'induce che P è causa o parte integrante della musa di A; c) metodo delle concordanze: se A si verifica al verificarsi delle circostanze P, a, b, c, e anche delle circostanze P, d, e, e anche delle circostanze P, f, g, h, ecc., s'induce che P è causa o parte integrante della causa di A; d) metodo dei residui: se il fenomeno A + B ha come causa il complesso di circostanze P, q, r, s, e si sa che P è causa di A, s'induce che il complesso di circostanze q, r, s è causa di B. Queste forme d'induzione presuppongono naturalmente nelle cause in giuoco certi modi di operare che in riferimento ai fenomeni statistici, a cagione della loro complessità, non sempre si verificano; e perciò l'impiego di esse in questo campo deve esser fatto con molte cautele. Infine, riconosciute le cause di un fenomeno statistico, oppure le circostanze su esso influenti, si dovrà ancora, per giungere alla formulazione della legge statistica, precisare, anche quantitativamente se è il caso, il legame intercedente fra le modalità del fenomeno e quelle cause o circostanze, che possono, a loro volta, consistere in altri fenomeni, statistici o no. Quel legame deve conservare una forma costante ovunque il fenomeno in oggetto si manifesti, ma ciò non significa che la sua espressione matematica non possa contenere qualche parametro variabile da caso a caso. Si veda, p. es., la legge di distribuzione dei redditi di Pareto nella voce distribuzione della ricchezza (XIII, p. 44), nella quale l'indice α, pure essendo generalmente prossimo al valore 1,5, può tuttavia variare da una distribuzione a un'altra. Così pure, R. Benini ha formulato la legge: se i redditi globali crescono in progressione geometrica di ragione 2, i patrimonî corrispondenti crescono in progressione geometrica di ragione 3: orbene, se in campi diversi da quelli esplorati dal Benini, si trovassero, invece di queste, le ragioni 4 e 5, cioè se i parametri 2 e 3 fossero sostituiti da 4 e 5, la legge enunciata non sarebbe men vera, perché non muterebbe la natura della relazione fra le distribuzioni dei redditi e dei patrimonî. D'altra parte, si deve tenere presente che le leggi statistiche non sono rigide, ma valide con approssimazione dipendente dal numero delle osservazioni.
È stata a lungo discussa la questione se le leggi statistiche possano essere considerate alla stessa stregua delle leggi fisiche. Si disse che, mentre queste ultime possono essere stabilite a priori deducendole da principî della massima generalità, le altre vengono scoperte per via empirica; si soggiunse altresì che le leggi statistiche non sono, come quelle fisiche, applicabili ai singoli casi, e che hanno soltanto una validità approssimativa. A tali obiezioni si può anzitutto contrapporre che anche le leggi fisiche traducono il risultato di osservazioni dirette, o - se possono essere dedotte da principi più generali - sono questi, a loro volta, che debbono rispecchiare relazioni effettivamente osservate in natura; in secondo luogo, che di una legge statistica, in quanto dedotta da un numeroso insieme di osservazioni, non può e non deve essere sperimentata la validità in un campo ristretto; e infine che, subordinatamente a quest'ultima circostanza, l'approssimazione alla legge dipende dal numero delle osservazioni fatte. Anche le leggi statistiche, debitamente intese e applicate, hanno, dunque, pieno diritto di cittadinanza nel campo della scienza, e, al pari di quelle fisiche, rendono segnalati servigi per le deduzioni che se ne possono trarre.
Statistica matematica.
Viene intesa come insieme delle teorie matematiche e talora, in senso più ristretto, delle sole teorie appartenenti al calcolo delle probabilità, che si utilizzano nello studio quantitativo dei fenomeni di massa. Lo studio dei diversi tipi di curve di distribuzione dei fenomeni e particolarmente delle curve di frequenze e delle loro caratteristiche, il paragone delle curve empiriche con le teoriche dedotte da sistemi d'ipotesi più o meno aderenti alla realtà, la precisione delle costanti dedotte da rilevazioni incomplete, la decomposizione di curve di frequenze empiriche in componenti teoriche più semplici, la teoria della correlazione (v.), con la distinzione, se si vuole essere più precisi, dei due concetti di connessione e concordanza (v. sopra: Statistica metodologica; probabilità, calcolo delle: Applicazioni alla statistica) costituiscono i principali argomenti della statistica matematica in senso più ristretto, mentre in senso lato anche le rappresentazioni grafiche di uso più frequente nella statistica (v. cartogramma; diagramma, stereogramma), i metodi interpolatorî grafici e analitici e i procedimenti perequatorî si considerano parti della statistica matematica: questa è pertanto da riguardarsi, ai fini pratici, come compresa nella statistica metodologica, per quanto le si attribuisca, di solito, una propria autonomia, in ragione dello sviluppo e dell'importanza che, anche sotto il solo aspetto speculativo, essa ha assunto, specialmente in questi ultimi decennî. È quindi fuor di luogo il dissidio talora avvertito fra matematici, da una parte, che negherebbero qualsiasi valore ai metodi più elementari inizialmente ideati per indagare i fenomeni di massa, e gli statistici non matematici, dall'altra, che vorrebbero attribuire ai più raffinati procedimenti analitici una scarsa adattabilità ai casi pratici e un limitato valore investigativo. In realtà il congegno matematico, incessantemente perfezionato, trova prezioso impiego anche in molti problemi che si prospettano nell'indagine statistica e che non riceverebbero, altrimenti, adeguata soluzione.
Statistica applicata.
Sempre più vasta si manifesta la possibilità di applicazione del metodo statistico a svariatissime classi di fenomeni. Anche quando le apparenze fanno supporre negli elementi di una categoria una perfetta identità qualitativa e quantitativa e quindi l'esistenza di un tipo, si rivelano, a un più attento esame, attraverso l'impiego di mezzi d'osservazione sempre più perfetti, differenze di qualità e differenze di quantità negli elementi stessi; cosicché a cogliere i caratteri essenziali di tale atipica collettività, non è sufficiente portare l'esame su di un solo elemento, ma è necessario estenderlo al complesso totale, impiegando appunto il metodo statistico. Orbene, ogni particolare classe di fenomeni, la quale venga investigata con tale metodo, dà origine a una corrispondente disciplina, che si usa denominare "statistica" di quel certo gruppo di fenomeni. È, peraltro, necessario notare che, a rigore, due sono le fasi successive dell'indagine, con lo stesso nome indicate. Per quanto concerne la popolazione, ad es., si debbono dapprima raccogliere le "statistiche" demografiche, e passare poi a eseguire su queste le osservazioni, comparazioni e induzioni che insieme costituiscono la seconda fase, e cioè la "statistica" demografica nel senso più elevato della parola.
Non più che un fugace cenno può essere fatto delle recenti applicazioni del metodo statistico alla fisica e all'astronomia. Tali applicazioni, nel primo di questi campi, si conformano alla concezione di una struttura granulare della materia (molecole, atomi), dell'elettricità (elettroni) e dell'energia (quanti), struttura la quale consentirebbe a ciascun elemento molteplici possibilità di movimento, cosicché ciò che appare - a parità di condizioni - come modo costante di manifestarsi della materia, dell'elettricità, dell'energia, non sarebbe, in sostanza, che l'effetto medio e più probabile risultante secondo la legge del caso da quelle svariate possibilità (v. statistica, meccanica). Nel campo dell'astronomia le applicazioni sono di altro genere: ricerca di zone di addensamento, di correnti stellari, di correlazioni fra la massa e la luminosità delle stelle, di correlazioni fra la massa e il periodo della luminosità, ecc. Altri campi nei quali il metodo in parola è stato applicato da più antica data, brevemente accennati, sono i seguenti:
A) Statistica demografica o demografia (secondo la denominazione creata da A. Guillard, Éléments de statistique humaine, ou démographie comparée, Parigi 1855). - È la più antica fra le varie branche della statistica applicata, che ha dato la prima occasione alla formulazione dottrinale della statistica, cosicché per molto tempo si comprese sotto la comune denominazione di "statistica" sia lo studio della popolazione, considerata come fenomeno di massa, sia l'esposizione dei metodi idonei per siffatte indagini.
Argomenti principali trattati dalla statistica demografica sono: stato e movimento naturale e sociale della popolazione, censimenti demografici, statistica delle cause di morte, malattie sociali, migrazioni ed esodi, dinamica della popolazione, teoria e politica della popolazione, demografia storica (v. demografia; matrimonio: Statistica della nuzialità; morte: Statistica della mortalità; nascita: Statistica della natalità; popolazione: Dottrina e politica della popolazione; Statistica della popolazione).
B) Statistica economica o econometria. - È l'applicazione del metodo statistico allo studio dei fenomeni economici, che sono, essi pure, per la maggior parte, fenomeni di massa. D'altra parte i fenomeni in parola hanno luogo in seno alla società e così l'econometria può rientrare, in senso lato, nella statistica sociale (v. oltre). Non si vuole, con ciò, dire che attraverso il metodo statistico, prevalentemente induttivo, quello studio si esaurisca; e difatti anche il metodo deduttivo, al quale, partendo da pochi principî, si sono informate le elaborazioni dell'economia classica, deve avere la sua parte nelle indagini dei fatti economici. In quanto alle applicazioni della statistica metodologica, esse possono riguardare sia la fase produttiva, sia la circolazione, la distribuzione e il consumo della ricchezza; e tutte si compiono attraverso la raccolta di appropriate statistiche della produzione agricola, mineraria, industriale, dei prezzi delle merci in grosso e al minuto e dei servizî, del costo della vita, del corso dei titoli di stato, commerciali e industriali, dei salarî, dei consumi, delle importazioni e delle esportazioni, del traffico terrestre, marittimo e aereo, della distribuzione della ricchezza e di quella dei redditi, ecc. Il fine ultimo delle applicazioni del metodo statistico è tuttavia, anche in tale campo, quello di pervenire alla scoperta delle eventuali regolarità e leggi che governano i fatti economici.
C) Statistica sociale. - Investiga quantitativamente le leggi dei fenomeni sociali, fenomeni collettivi per eccellenza, che risultano da numerosi e non sempre individuabili gruppi di cause, agenti direttamente o indirettamente attraverso altri fenomeni. I fatti della società umana, a cagione appunto delle molteplici circostanze su essi influenti, si manifestano con un'immensa varietà di forme e di gradi, che a primo aspetto non dànno a vedere ordine alcuno. Il metodo statistico consente nondimeno, anche in questo caso, di riconoscere certe regolarità e certe leggi cui i fenomeni stessi vanno soggetti: e su esse possono talora fondarsi ragionevoli previsioni per l'avvenire. Gli argomenti principali considerati dalla statistica sociale risultano indicati nella bibliografia che segue poco oltre.
D) Statistica sanitaria. - Questo recente metodo di esplorazione del campo medico venne instaurato da P.-Ch.-A. Louis che, abbandonato il costume di restringere l'osservazione medica a pochi casi patologici, ciò che necessariamente conduceva a conclusioni spesso divergenti fra loro, diede esempio del più rigoroso metodo d'induzione in due opere classiche: Recherches anatomiques, pathologiques et thérapeutiques sur la phtisie, Parigi 1825, e Rech. anat., pathol. et thérap. sur la fièvre tiphoïde, Parigi 1829, basate sull'osservazione di più di 5000 autopsie.
Per la statistica biometrica, v. biometria; per la statistica antropometrica, v. antropometria; per la statistica psicometrica, v. psicometria.
Bibl.: Per la storia della statistica, v.: A. Quadri, Storia della statistica, Venezia 1824; G. B. Salvioni, Cenni storici sulla scienza della statistica, introduzione alla traduzione de La statistica e la vita sociale di G. Mayr, Roma 1879; V. John, Geschichte der Statistik, Stoccarda 1884; A. Gabaglio, Teoria generale della statistica, parte storica, Milano 1888; A. Bosco, Lezioni di statistica, parte 1ª, Roma 1909; J. Koren, History of statistics, New York 1918; C. Gini, Appunti di statistica, Padova 1921; H. Westergaard, Contributions to the history of statistics, Londra 1932; F. Vinci, Manuale di statistica, I, appendice ii, Bologna 1934.
Per la statistica metodologica, v.: G. Mayr, La statistica e la vita sociale, trad. di G. B. Salvioni, Roma 1879; R. Benini, Principî di demografia, Firenze 1901; id., Principî di statistica metodologica, Torino 1906; C. Gini, Variabilità e mutabilità, Bologna 1912: id., Appunti di statistica, già cit.; id., I principî fondamentali della statistica metodologica, appendice al Compendio statistico italiano per l'anno 1930; id., Memorie di statistica metodologica, Padova (in corso di stampa); H. Forcher, Die statistiche Methode als selbständige Wissenschaft, Lipsia 1913; G. U. Yule, An introduction to the theory of statistics, 5ª ed., Londra 1919; A. L. Bowley, Elements of statistics, 4ª ed., Londra 1920; G. Mortara, Lezioni di statistica metodologica, Città di Castello 1922; id., Sommario di statistica, Milano 1931; A. Niceforo, Il metodo statistico, Messina 1923; L. Livi, Elementi di statistica, Padova 1926; G. Pietra, Lezioni di statistica, ivi 1930; A. Julin, Précis du cours de statistique générale et appliquée, Parigi 1932; C. E. Bonferroni, Elementi di statistica generale, Torino 1933; F. Vinci, Manuale di statistica, Bologna 1934; M. Boldrini, Statistica, Milano 1934; L. Galvani, Introduzione matematica allo studio del metodo statistico, ivi 1933-34 (nel Trattato elementare di statistica, diretto da C. Gini, pubblicato sotto gli auspici dell'Istituto centrale di statistica, I: Statistica metodologica); M. Saibante, L'organizzazione dei servizi statistici nazionali, ibid.; V. Dore, Organizzazione delle statistiche internazionali, ibid.
Per molte questioni di statistica metodologica si consulteranno con profitto: Bulletin de l'Institut international de statistique (L'Aia); Giornale degli economisti e rivista di statistica (Milano); Metron (Roma); Rivista italiana di statistica, economia e finanza (Bologna); Giornale dell'Istituto italiano degli attuari (Roma); Journal of the Royal Statistical Society (Londra); Journal of the Statistical American Association (Washington).
Per la statistica matematica, a prescindere dalle opere, già citate, di statistica metodologica, delle quali molte contengono sviluppi di carattere analitico, si ricordano, come particolarmente dedicate all'argomento, le seguenti: G. Zeuner, Abhandlungen aus der mathematischen Statistik, Lipsia 1869; W. Lexis, Über die Wahrscheinlichkeitsrechnung und deren Anwendung auf die Statistik, in Jahrb. für Ökonomie u. Statistik, 1886; G. Th. Fechner, Kollektivmasslehre, a cura di G. F. Lipps, Lipsia 1897; L. v. Bortkiewicz, Das Gesetz der kleinen Zahlen, ivi 1898; H. Bruns, Wahrscheinlichkeitsrechnung und Kollektivmasslehre, ivi 1905; C. Gini, Variabilità e mutabilità, già cit.; id., La regolarità dei fenomeni rari, in Giornale degli economisti, 1908; id., Considerazini su l'interpolazione e la perequazione delle serie statistiche, in Metron, 1921; id., Sull'interpolazione di una retta quando i valori della variabile indipendente sono affetti da errori accidentali, ibid., 1921; id., Sul massimo degli indici di variabilità assoluta e sulle sue applicazioni agli indici di variabilità relativa e al rapporto di concentrazione, ibid., 1930; K. Pearson, Tables for Statisticians and Biometricians, Cambridge 1914; E. Czuber, Wahrscheinlichkeitsrechnung, Lipsia 1914; C.-V.-L. Charlier, Vorlesungen über die Grundzüge der matehmatischen Statistik, Lund 1920; G. Pietra, Interpolating plane curves, in Metron, 1924; id., The theory of statistical relations with special reference to cyclical series, ibid., 1925; H. L. Rietz e altri, Handbook of mathematical statistics, Cambridge Massachusetts 1924; M. Fréchet e M. Halbwachs, Le calcul des probabilités à la portée de tous, Parigi 1924; G. Castelnuovo, Calcolo delle probabilità, Bologna 1925; Ch. Jordan, Statistique mathématique, Parigi 1925; F. P. Cantelli, Lezioni di matematica attuariale, Roma 1933: id., Considérations sur la convergence dans le calcul des probabilités, in Annales de l'Institut Poincaré, Parigi 1935; G. Darmois, Statistique mathématique, ivi 1928; C. Gini e L. Galvani, Di talune estensioni dei concetti di media ai caratteri qualitativi, in Metron, 1929; L. Galvani, Punti di contatto e scambi di concetti tra la statistica e la matematica, in Giorn. dell'Istituto italiano degli attuari, 1933; R. Risser e C.-E. Traynard, Les principes de la statistique mathématique, Parigi 1933. Trattazione di molteplici argomenti di statistica matematica si troverà nelle riviste Biometrika (Cambridge) e Metron già citata.
Per la statistica demografica, oltre alle opere citate nelle voci sopra richiamate, v.: Trattato elem. di stat., diretto da C. Gini, II, Demografia, Milano 1933, e, in particolare: Rob. Bachi, La mobilità della popolazione urbana; L. de Berardinis, Statistica delle cause di morte; id., Malattie sociali; M. de Vergottini, Il movimento naturale della popolazione nel suo aspetto qualitativo; id., Migrazioni ed esodi; P. Fortunati, Demografia storica; U. Giusti, Censimenti demografici; G. Rugiu, Dinamica della popolazione; id., Teoria della popolazione e politica demografica; F. Savorgnan, Movimento naturale della popolazione; G. Zingali, Stato della popolazione. V. inoltre: G. H. Knibbs, The mathematical theory of population, ecc., Melbourne 1917; Atti del Congresso internazionale per gli studi sulla popolazione (Roma 1931), voll. 10, Roma 1933; F. Savorgnan, Demografia di guerra e altri saggi, Bologna 1921; id., Corso di demografia, Pisa 1936; Istituto centrale di statistica, Notiziario demografico, Roma.
Per la statistica economica, v.: R. Benini, Di alcune curve descritte dai fenomeni economici, in Giorn. degli econ., 1897; I. Fisher, The purchasing power of money, New York 1911: id., The making of index numbers, Boston 1922; C. Bresciani, La ricchezza delle città, in Annali del Semin. giuridico, Palermo 1912; G. Mortara, lezioni di statistica economica e demografica, Roma 1920; id., Prospettive economiche, I-XV (anni 1921-35); W. C. Mitchell, Index numbers and wholesale prices in the U. S. and foreign countries, a cura dell'U. S. Bureau of Labor statistics, 1921; A. Niceforo, Les indices numériques de la civilisation et du progrès, Parigi 1921; F. Savorgnan, La ripartizione regionale della ricchezza privata italiana, in Metron, 1921; id., Lezioni sulla moneta, Pisa 1928; C. Gini, La ricchezza delle nazioni, Torino 1914; id., Quelques chiffres sur la richesse et les revenus nationaux de quinze États, in Metron, 1923; id., Quelques considérations aus sujet de la construction des nombres indices des prix et des questions analogues, ibid., 1924; id., Patologia economica, 4ª ed., Milano 1935; L. March, Les indices économiques, in Metron, 1924; D. Donati e G. Pietra, La ricchezza privata delle provincie delle Tre Venezie, serie di monografie di varî autori, Padova 1931; G. Pietra e G. Ferrari, Ricchezza e reddito delle nazioni, in Trattato elem. di stat., IV e V, Statistica economica, Milano 1934; id., Costo e valore monetario dell'uomo, ibid.; M. De Vergottini, Concentrazione individuale e distribuzione territoriale del reddito e della ricchezza, ibid.; E. Corbino, Trasporti terrestri e marittimi, ibid.; Ricc. Bachi, Monete, banche e mercato finanziario, ibid.; G. Masci, Il mercato a termine delle merci, ibid.; G. Barsanti, Società per azioni, ibid.; F. Vito, La coalizione delle imprese, ibid.; F. Coppola d'Anna, Le statistiche delle scorte, ibid.; F. A. Répaci, Finanze dello stato, delle amministrazioni autonome ed enti autarchici, ibid.; J. Tivaroni, La pressione tributaria in Italia attraverso il tempo, ibid.; E. Cianci, La dinamica dei prezzi, ibid.; G. Tagliacarne, Il calcolo dei numeri indici dei prezzi, ibid.; Paola M. Arcari, Salari e costo della vita, ibid.; G. Zingali, Alimentazione, consumi, bilanci di famiglia, ibid.; G. Tagliacarne, Il calcolo dei numeri indici dei prezzi, ibid.; Paola M. Arcari, Salari e costo della vita, ibid.; G. Zingali, Alimentazione, consumi, bilanci di famiglia, ibid.; G. Borgatta, Bilancia dei pagamenti, cambio, ibid.; M. Saibante, Indici dello stato e del progresso economico, ibid.. V. pure: Istituto centrale di statistica, Bollettino mensile di statistica; Bollettino dei prezzi; Bollettino mensile di statistica agraria e forestale.
Per la statistica sociale, v.: A. Niceforo, Antropologia delle classi povere, Milano 1908-10; M. Marsili Libelli, Statistica e scienze sociali, in Tratt. elem. di stat., VI, Statistica sociale, Milano 1933; R. Tremelloni, Ordinamento scientifico del lavoro, ibid.; A. Uggè, Statistica della disoccupazione, ibid.; Mobilità del lavoro, ibid.; L. Cibrario, La statistica della beneficenza pubblica e dell'assistenza in Italia, ibid.; P. Luzzatto-Fegiz, Statistica delle assicurazioni, ibid.; L. Cibrario, La statistica delle assicurazioni sociali in Italia; V. Castrilli, Statistica intellettuale, ibid.; M. Avancini, Statistica turistica, ibid.; A. Spallanzani, Statistiche giudiziarie, ibid.; C. Pinghini, Tavole di morbilità e di mortalità, ibid.; L. de Berardinis, Statistica militare, ibid.; D. de Castro, Statistica della criminalità, Torino 1934.
Per la statistica sanitaria, v.: J. Gavarret, Principes généraux de statistique médicale, Parigi 1840; F. Prinzing, Handbuch der mediznischen Statistik, 2ª ed., Jena 1929; L. De Berardinis, Statistica sanitaria, in Trattato italiano d'igiene, Demografia, Torino 1930; A. Niceforo, La mortalità per tubercolosi, in Trattato della tubercolosi, Milano 1931; id., Malattie sociali, in Tratt. elem. di stat., II, Demografia, Milano 1933.
Per la statistica biometrica e antropometrica, v.: M. Boldrini, Biometria e antropometria, in Tratt. elem. di stat., Milano 1934.
La statistica ufficiale in Italia.
Nel Medioevo e per gran parte dei tempi moderni nessuna forma di attività delle pubbliche amministrazioni si può considerare come manifestazione di una statistica ufficiale, se si tolgono alcuni "stati di anime" e "catasti", quasi sempre eseguiti a scopo fiscale, e le più o meno regolari rilevazioni delle nascite, delle morti e dei matrimonî: documenti, tutti questi, dei quali alcuni sono tuttora conservati negli archivî dello stato e delle chiese, e che hanno bensì il carattere di vere e proprie statistiche, ma che generalmente si riferiscono alle popolazioni di zone assai ristrette. Per poter trovare un ordinamento statistico ufficiale a larga base, è necessario venire a tempi molto prossimi ai nostri. Fu, infatti, soltanto nel 1807 che il Regno italico dell'era napoleonica ebbe, sotto la direzione di Melchiorre Gioia (v.), un ufficio statistico, istituito, del resto, poco dopo l'ufficio creato in Francia da Luciano Bonaparte (1800) e prima di quelli dell'Austria (1828), del Belgio (1831), dell'Inghilterra (1832), e della Danimarca (1833). Ma l'ufficio italiano ben presto venne a fine, seguendo le avverse sorti delle fortune di Napoleone. Successivamente, parecchi dei piccoli stati della penisola ebbero, tuttavia, il loro ufficio di censimento: Palermo per la Sicilia nel 1832, Torino per il regno Subalpino nel 1836, Firenze per la Toscana nel 1849, Napoli per le provincie napoletane nel 1851, Roma per lo Stato della Chiesa nel 1858. Finalmente nel 1861, costituitosi a unità il Regno d'Italia, sorse quell'ufficio centrale di statistica (più tardi chiamato direzione generale della statistica e poi di nuovo ufficio centrale di statistica) che, assistito da un consiglio superiore, visse fino al 1926. Diretta successivamente da P. Maestri, da L. Bodio, da C. De Negri, da E. Raseri, da G. Montemartini, da G. Falciani e da A. Aschieri, la statistica italiana conseguì in un primo tempo, specie sotto il Bodio, che vigorosamente la resse dal 1872 al 1898, una fama mondiale, sia per il suo ordinamento esemplare sia per la vastità e l'importanza dei suoi lavori; ma poi, per il poco conto in cui questo importante ramo della pubblica amministrazione venne tenuto dai governanti di allora, essa cadde in grande abbandono. Anche a questa triste condizione di cose doveva riparare il governo fascista. È del 1923 un decreto che ricostituisce la direzione generale della statistica, mentre un decreto successivo ne determina i compiti, crea nuovamente il Consiglio superiore di statistica e stabilisce il principio che alla nuova direzione sono tenute a prestare la loro collaborazione, nelle materie di rispettiva competenza, le amministrazioni centrali, le autorità governative, le amministrazioni comunali e provinciali, nonché gli enti privati comunque soggetti a vigilanza da parte dello stato. Ma un più essenziale progresso venne conseguito in un secondo tempo, con una legge del luglio 1926. dalla quale ebbe vita l'Istituto centrale di statistica, posto alle dirette dipendenze del capo del governo, affinché la funzione di ordinare e raccogliere le statistiche potesse esercitarsi con quella pienezza di autorità che è necessaria per una rapida e scrupolosa segnalazione delle notizie e per la loro tempestiva utilizzazione. All'istituto sovraintende un Consiglio superiore di statistica, composto dal presidente e dal direttore generale dell'istituto, e da un certo numero di membri di nomina governativa. Le norme per l'applicazione della legge chiariscono, in particolare, che la diretta dipendenza dei servizî statistici dal capo del governo garantisce unità di direttive e uniformità di applicazioni presso tutte le amministrazioni, lasciando peraltro a queste il compito di raccogliere e di elaborare i dati statistici: soluzione intermedia fra un totale decentramento, che lascerebbe autonome le diverse amministrazioni per quanto concerne le statistiche che le riguardano, e un completo accentramento delle statistiche ufficiali in un organo solo. Successivamente un decreto del 1929 non soltanto conferiva all'istituto stesso maggiori poteri, ma prescriveva anche il graduale passaggio presso di esso di tutti i servizî statistici d'importanza nazionale. Ingente è il complesso delle opere che ebbero concreta attuazione in questo primo decennio di vita (1926-1935) dell'istituto. Un indice della sua vasta attività può essere costituito dalle numerose pubblicazioni, fra le quali si citano le più importanti: i volumi dell'Annuario statistico italiano (v. oltre: Annuarî statistici), Movimento della popolazione secondo gli atti dello stato civile; Statistica delle cause di morte; Bollettino mensile di statistica; Bollettino mensile di statistica agraria e forestale; Bollettino dei prezzi; Notiziario demografico; Statistica delle migrazioni da e per l'estero; Statistica del commercio speciale d'importazione e d'esportazione; Atti del Censimento 1921; Atti del censimento 1933; Censimento industriale e commerciale 1927; Censimento agricolo 1930; Atlante statistico italiano. in due grandi volumi di complessive 185 tavole; Catasto agrario, distribuito in una serie di fascicoli provinciali della quale è prossimo il compimento; Catasto forestale, esso pure in fascicoli provinciali; Compendio statistico italiano, una serie di volumetti annuali destinati alla divulgazione delle più importanti notizie statistiche riguardanti la nazione.
Meritano una particolare menzione, fra le pubblicazioni della statistica ufficiale italiana, gli Annali di statistica, in buona parte dedicati a memorie scientifiche, a discussioni su importanti lavori stranieri, a relazioni di carattere ufficiale, agli atti della Giunta divenuta poi Consiglio superiore di statistica e a quelli della Commissione per la statistica giudiziaria. Essi sono distribuiti in sei serie: I, di 10 volumi iniziata nel 1871; II, di 25 volumi iniziata nel 1878; III, di 16 volumi iniziata nel 1882; IV, di 111 volumi iniziata nel 1884, V, di 11 volumi iniziata nel 1912; VI, iniziata npl 1929, successivamente alla costituzione dell'attuale Istituto centrale di statistica, e comprendente 35 volumi a tutto il 1935. Il XXX di questi volumi è costituito dagli Indici degli Annali di statistica dal 1871 al 1934 (cronologico, per autori, per materie).
Ritornando, in particolare, ai lavori compiuti nel decennio sopra accennato è da dire che all'opera svolta al centro, l'istituto aggiunge quella di coordinare la raccolta e la prima elaborazione dei dati presso gli organi periferici (uffici di stato civile e uffici anagrafici dei comuni, consigli provinciali dell'economia corporativa, compagnie di navigazione, questure, ecc.), che funzionano anche come suoi corrispondenti; e quella anche di promuovere le indagini statistiche presso i privati studiosi, con premî e borse di studio.
Bibl.: Atti concernenti la costituzione dell'Istituto centrale di statistica, ecc., in Annali di statistica, s. 6ª, I, Roma, 1931; L'attività dell'Istituto centrale di statistica nel suo primo biennio di vita, ibid., s. 6ª, VI, ivi 1929; Atti del Consiglio superiore di statistica, ibid., s. 6ª, VI, ivi 1930; VII, ivi 1930; XXVI, ivi 1932; XXVII, ivi 1932; XXIX, ivi 1933; XXXIII, ivi 1934; XXXIV, ivi 1935, con discorsi di B. Mussolini nei voll. VI, XXIX e relazioni di C. Gini nei voll. VI, VII, XXVI, XXVII e di F. Savorgnan nei voll. XXIX, XXXIII, XXXIV; L. Galvani, The new organization of the statistical services in Italy, in Journ. of the Amer. Statist. Association, 1927; id., Il periodo di ricostruzione della statistica italiana, in Riv. di polit. economica, 1930; F. Mancinelli, La statistique italienne et son organisation actuelle, in Revue écon. internationale, 1932; A. Molinari, La fabbrica delle cifre, in Sapere, 1935. Si veda pure l'elenco delle fonti archivistiche, riguardanti la popolazione del Regno d'Italia dal 1000 al 1848, contenute negli archivî principali di 34 città italiane; è pubblicato in 4 volumi, a cura del Comitato italiano per lo studio dei problemi della popolazione, Roma 1934.
Comparazione dei dati statistici.
Eseguite la rilevazione e la elaborazione dei dati statistici, le conclusioni a cui queste possono dar luogo si ottengono mediante la comparazione dei dati e la successiva applicazione di quelle forme induttive e deduttive di ragionamento che sono proprie di tutte le scienze d'osservazione e sperimentali, ma che, nella loro estensione ai fenomeni collettivi, abbisognano di speciali accorgimenti. Il mero confronto di più dati statistici, senza tenere alcun conto delle differenze nelle circostanze che a essi si accompagnano, potrebbe condurre a conclusioni infondate. Affinché tale confronto sia significativo e fecondo di risultati è necessario che i dati siano comparabili, cioè che essi si accompagnino a un insieme di circostanze comuni, insieme che potrà variare ed essere più o meno ampio a seconda dello scopo della ricerca. Non si può dunque parlare di comparabilità di più dati in modo assoluto, ma soltanto di comparabilità relativa a un dato scopo. Così la comparazione dei quozienti generali di mortalità di più paesi sarà legittima allo scopo di constatare in quali di essi le falcidie della morte siano proporzionalmente più numerose; non lo sarà quando si voglia formulare un giudizio sulla resistenza vitale delle popolazioni; per ciò, bisognerà tener conto delle diverse proporzioni delle età, dei sessi, delle professioni, ecc.
Se i dati statistici di cui si dispone non siano comparabili (e non si abbia la possibilità o l'opportunità di eseguire nuove rilevazioni per sostituire, ad alcuni di essi, altri dati comparabili coi rimanenti), si dovrà, se è possibile, dedurre da quei dati primitivi altri dati comparabili. La comparabilità può essere in difetto: sia per ostacoli estrinseci, dipendenti o a) dai procedimenti di rilevazione, o b) da quelli di spoglio, o c) da quelli di elaborazione dei dati; sia per ostacoli intrinseci, dipendenti o d) dalla diversa intensità o e) dalla diversa composizione dei fenomeni a cui i dati stessi si riferiscono, intendendo per diversa composizione di un fenomeno la diversa frequenza delle circostanze a cui i singoli casi del fenomeno si accompagnano. Per es., rientra nel caso a) la mancanza di comparabilità fra le natimortalità dedotte, anche a parità di data, dalle statistiche francesi e dalle italiane, poiché quelle comprendono fra i nati morti anche i nati vivi spirati antecedentemente alla denuncia di nascita, mentre queste li escludono; peraltro, mediante rilevazioni parziali dirette a determinare, in un numero abbastanza ampio di nati morti fornito dalle statistiche francesi, quanti siano i morti fra la nascita e la denuncia, sarà possibile calcolare un coefficiente di correzione per dedurre da uno dei dati statistici considerati un nuovo dato comparabile col secondo. È del tipo b) l'incomparabilità dei dati riferentisi a diverse distribuzioni in cui gli elementi di spoglio siano raggruppati in classi di diversa ampiezza; tuttavia, se con opportuni procedimenti d'interpolazione si sapranno scindere le dette classi in classi meno ampie e poi raggruppare queste in modo che le classi delle diverse distribuzioni risultino di uguale ampiezza, si potranno, sui risultati delle interpolazioni, eseguire comparazioni attendibili, almeno entro certi limiti di approssimazione. Esempî del caso c) ci sono forniti da più successioni di dati interpolati con procedimenti di diversa natura, oppure da varî rapporti di concentrazione di un carattere calcolati con metodo analitico per alcune delle distribuzioni considerate e con metodo grafico per le altre. La prima di queste incomparabilità può essere, almeno in prima approssimazione, superata applicando a una stessa successione di dati quelle diverse forme d'interpolazione e deducendone coefficienti di correzione per il passaggio da un certo valore ottenuto con un metodo d'interpolazione ai valori che si sarebbero corrispondentemente avuti con gli altri metodi; e anche all'altra incomparabilità si può rimediare con l'uso di coefficienti correttivi determinati con opportune esperienze. Al caso d) appartiene l'incomparabilità della statura tra maschi e femmine che ostacola, p. es., lo studio dell'ereditarietà della statura fra genitori e figli, quando si prenda a esaminare un complesso d'individui maschi e femmine; e anche qui la difficoltà può essere superata impiegando un coefficiente di correzione che, da esperienze all'uopo istituite, è risultato di 1,08 per la conversione delle stature del sesso femminile in stature del sesso maschile. Finalmente è del tipo e) l'incomparabilità che, nei riguardi di molte ricerche, affetta i coefficienti generali di mortalità di due paesi, nei quali saranno generalmente diverse le proporzioni dei sessi, e in ciascun sesso diverse le proporzioni delle varie classi di età Le incomparabilità di quest'ultimo tipo sono forse quelle che più frequentemente si presentano allo statistico; possono anche esse superarsi con due metodi di cui stiamo per dire. Intanto dagli esempî dati deduciamo che due mezzi idonei a far conseguire la comparabilità dei dati possono essere: 1. l'uso dei coefficienti di correzione; 2. i procedimenti interpolatorî atti alla scissione di classi di certa ampiezza in altre di ampiezza minore. Altri due mezzi che illustreremo appunto sull'esempio del tipo e) sono: 3. il cosiddetto metodo "dei gruppi scelti", e infine 4. i metodi generali di eliminazione e particolarmente quello che si denomina "della popolazione tipo". Col metodo dei gruppi scelti, invece di paragonare senz'altro i coefficienti generali di mortalità dei diversi paesi, si mettono a confronto i coefficienti di mortalità relativi a gruppi parziali omogenei per sesso e per età, tratti dalle popolazioni di quei paesi (p. es., morti su 1000 maschi in età 20-25; e così per altre classi di età per l'uno e l'altro sesso). Su tale metodo è basata la costruzione delle tavole di mortalità. Il confronto, eseguito col metodo dei gruppi scelti, non conduce però a un risultato sintetico, per modo che spesso è di più conveniente impiego il metodo della popolazione tipo, il quale, riferito esso pure allo stesso esempio, consiste nell'eliminare l'influenza che sui coefficienti generali di mortalità ha la composizione delle varie popolazioni per età (e talora anche l'influenza della loro composizione per sesso). Per eseguire tale eliminazione si ricorre all'ipotesi che tale composizione per età (e eventualmente anche quella per sesso) sia la stessa nelle varie popolazioni considerate, e uguale a quella di una "popolazione tipo" (reale o fittizia). Applicando allora al numero degli esposti a morire in ciascuna classe di età della popolazione tipo il saggio di mortalità osservato per la medesima classe in una fra le date popolazioni, e addizionando i numeri dei morti così ottenuti, il totale, ragguagliato all'ammontare della popolazione tipo, costituirà un indice generale della mortalità nel paese stesso. Gl'indici così ottenuti per le diverse popolazioni saranno tra loro comparabili e varranno a mettere in luce, in modo sintetico, le differenze nella mortalità di quelle popolazioni, dipendenti dall'insieme delle circostanze non eliminate. Il metodo esposto è caso particolare di quei metodi generali di eliminazione che mirano appunto a fornire dati o indici fra loro comparabili, in quanto risulti eliminata l'influenza che ha su di essi un determinato gruppo più o meno ampio di circostanze o fattori da cui dipendono. Anche il metodo dei gruppi scelti si puô in un certo senso considerare caso particolare dei metodi di eliminazione, in quanto una tale forma di comparazione verte su gruppi parziali per i quali si verifica un insieme di circostanze comuni più ampio che per le date totalità: le circostanze supplementari sono dunque quelle che si possono ritenere eliminate. Vi è, infine, la possibilità di combinare i due metodi dei gruppi scelti e della popolazione tipo: ciò, per es., si verifica quando, volendo analizzare il comportamento della mortalità separatamente per i due sessi, eliminando l'influenza della composizione per età, si applichi a ciascun sesso preso a sé il metodo della popolazione tipo, riferendo i maschi alla popolazione tipo maschile e le femmine alla popolazione tipo femminile.
Bibl.: R. Benini, Principii di statistica metodologica, Torino 1906; C. Gini, Appunti di statistica, 3ª ed. litografata, Padova 1921 (edizione spagnola a stampa: Curso de estadistica, Barcellona 1935); per l'origine del metodo della "popolazione tipo", in particolare, vedi: V. Ogle, Proposal for the establishment and international use of a standard population, ecc., in Bull. de l'Institut international de statistique, VI (1891); J. Körösi, Mortalitäts-Coefficient und Mortalitäts-Index, ibid., VI. Per i procedimenti generali di eliminazione e le loro applicazioni particolari, v. C. Gini, Quelques considérations au sujet de la construction des nombres indices des prix et des questions analogues, in Metron, IV (1924); id., On the circular test of index numbers, ibid., IX (1931); id., Methods of eliminating the influence of several groups of factors, in Econometrica, IV (1936).
Statistiche municipali.
Cenno storico. - Come per gli stati nel loro complesso, così per le grandi città non mancano notizie statistiche anche per un passato assai lontano: anzi, almeno per quanto riguarda l'Italia, il grande sviluppo dei comuni e delle signorie ha dato spesso motivo ai cronisti e agli storici di raccogiiere sulle capitali dei singoli dominî più dati statistici che non sui dominî stessi in tutta la loro estensione. Né mancano in progresso di tempo, e cioè particolarmente fino verso la metà del sec. XIX, pubblicazioni di carattere locale a base statistica senza che peraltro si possa parlare di statistiche municipali nel senso che si dà ora a questa espressione. Del resto anche in questo primo periodo d'indagini locali, l'Italia può vantare iniziative di notevole importanza, come le monografie di Melchiorre Gioia su alcuni dipartimenti lombardi (1807), i due scritti di A. Zuccagni Orlandini: Prospetti comparativi della popolazione di Firenze dalla sua fondazione fino ai tempi moderni (inserita nelle sue Ricerche statistiche sul Granducato di Toscana, 1848) e Modello di statistica amministrativa: Comunità di Certaldo, esposta topograficamente, in prospetti statistici preceduti da illustrazioni fisiche e storiche, 1855; e il Dizionario geografico fisico-storico dei comuni della Toscana di E. Repetti, 1833. Queste iniziative non ebbero però adeguato svolgimento negli anni seguenti, e così l'Italia fu preceduta da varî stati esteri nella fondazione di uffici municipali di statistica con funzioni statistiche propriamente dette, e cioè ben determinate e distinte da quelle di altri organi amministrativi: Berlino e Vienna (1862), Riga (1866), Budapest (1869), Parigi (1879).
In Italia non mancarono, anche nei primi venticinque anni di unità nazionale, bollettini municipali pubblicati generalmente dagli uffici di igiene e pubblicazioni di carattere amministrativo arricchite di dati statistici, ma bisogna giungere al 1884 per trovare nel volume di Dati statistici annessi al conto consuntivo, edito dal comune di Milano, un vero annuario statistico; anche quest'esempio però, come quello dell'Annuario del comune di Roma del 1885, purtroppo non fu seguito e l'attività municipale statistica italiana si limitò a un certo numero di bollettini mensili, generalmente magri di notizie senza coordinazione alcuna fra loro e con frequenti cambiamenti di forma e di contenuto. Soltanto a datare dal 1903 fu cominciata e continuata regolarmente dal comune di Firenze la pubblicazione di un Annuario statistico che, pur essendo rimasta con scarso seguito da parte di altre città, diede luogo alla fondazione di una Unione statistica delle città italiane, rendendo così possibile nel 1904 la pubblicazione del primo Annuario statistico delle città italiane, pubblicazione che, dopo essere stata continuata per un'annata dalla Confederazione generale degli enti autarchici, fu ripresa nel 1935 dall'Istituto nazionale di urbanistica. La direzione generale della statistica italiana aveva del resto già procurato di riparare in qualche modo alla mancanza d'iniziative municipali con i due volumi pubblicati nel 1888 e nel 1891: Notizie sulle condizioni demografiche edilizie e amministrative di alcune grandi città italiane ed estere.
Ai primi del 1914 partì, anche questa volta da Milano, l'iniziativa di un nuovo genere di pubblicazione municipale, e cioè di una rassegna mensile di tutta la vita urbana, nella quale i ricchi quadri statistici sono preceduti da studî svariati sui problemi più diversi interessanti la città e illustrati da grafici, da disegni, da fotografie, sì da riuscire di gradita lettura a ogni classe di cittadini. La rassegna milanese, La città di Milano, trovò più imitatori che non le precedenti pubblicazioni; particolarmente notevoli per ampiezza, abbondanza di materiale raccolto, eleganza di edizione e adattamento alle condizioni locali, sono le rassegne mensili pubblicate sotto diversi nomi da Roma (Capitolium), da Torino, da Venezia, da Genova, da Bologna, da Firenze e da alcune altre città minori, che formano una serie di pubblicazioni di carattere tutto speciale e distinto dalla maggior parte delle pubblicazioni straniere in questo campo.
Sorto in Italia nel 1926 l'Istituto centrale di statistica, questo rivolse la sua attenzione anche alle statistiche municipali, fissando moduli uniformi per la raccolta e la pubblicazione dei dati nei bollettini mensili e promovendo apposite disposizioni legislative per favorire lo sviluppo delle statistiche stesse: il r. decr. legge 17 novembre 1927, n. 2372, per l'istituzione di speciali scuole di statistica e il r. decr. legge 24 marzo 1930, n. 436, che regola l'istituzione e il funzionamento degli uffici locali di statistica. Alcune notizie statistiche sulle grandi città sono pure incluse da varî anni nell'Annuario statistico italiano.
Le condizioni attuali della statistica municipale nei varî stati. - Nell'ex impero Austro-Ungarico si avevano importanti uffici municipali di statistica a Vienna, a Budapest, a Praga e si aveva pure una pubblicazione municipale collettiva, l'Österreichisches Städtebuch. L'attività di quegli uffici è continuata dopo la guerra nella repubblica Austriaca, in Cecoslovacchia e in Ungheria. In Danimarca l'ufficio di statistica di Copenaghen, il solo esistente, svolge una notevole attività estesa anche ai comuni limitrofi; all'ufficio medesimo è affidata l'esecuzione, per quanto riguarda la capitale, dei censimenti generali della popolazione. Nell'Estonia la statistica municipale è bene organizzata nelle tre città di Tallinn (Reval), Tartu (Dorpat) e Narva. In Francia e nel Belgio non esiste una vera organizzazione di statistica municipale: i varî uffici urbani pubblicano generalmente i loro rapporti riuniti nelle relazioni annuali che le città sono per legge obbligate a presentare. Un vero servizio di statistica municipale esiste soltanto a Parigi: le sue pubblicazioni, e particolarmente l'annuario, hanno meritata fama. In Germania la statistica municipale ha uno sviluppo e una organizzazione di gran lunga superiore agli altri paesi. Non ostante le restrizioni portate dalla guerra mondiale e dalle agitazioni successive, gli uffici municipali di statistica, ora in numero di 46, dopo un periodo di turbanento e di ristagno, hanno ripreso l'antica attività. L'opera loro è coordinata dal Verband der deutschen Städte-Statistiker sorto fino dal 1879, che riunisce tutti i dirigenti degli uffici e che tiene annualmente una riunione nella quale sono ampiamente discusse tutte le questioni tecniche e pratiche della statistica municipale. Il Verband, compreso ora nella nuova organizzazione comunale creata dal governo nazionalsocialista nel 1934, pubblica regolarmente lo Statistisches Jahrbuch deutscher Städte, fondato dal Neefe. In Gran Bretagna nelle maggiori città si pubblica generalmente ogni anno a cura degli uffici d'igiene un ampio rapporto demografico e sanitario. I dati demografici per un numero naggiore di città vengono raccolti e pubblicati con grande rapidità in bollettini settimanali, trimestrali e autunnali dai registrars-general di Inghilterra e di Scozia. La sola città di Londra possiede nello Statistical Department of the County Council un vero ufficio organizzato di statistica. La Lettonia possiede a Riga uno dei più antichi e meglio organizzati uffici municipali di statistica. La Norvegia, oltre a quello di Oslo, fondato nel 1886, possiede uffici di statistica a Bergen, a Stavanger, a Trondheim. In Olanda gli uffici municipali di statistica di Amsterdam, di Rotterdam, dell'Aia e di Utrecht sono bene organizzati sul tipo di quelli tedeschi; si possono ricordare le bellissime pubblicazioni, anche di statistica comparata, dell'ufficio di Amsterdam. In Polonia la statistica municipale è assai sviluppata; oltre agli antichi uffici di Varsavia e di Poznań, se ne sono creati a Łódż, a Cracovia, a Leopoli, a Lublino e in altre città minori. In Portogallo la sola città di Oporto possiede un ufficio di statistica. La Romania possiede a Bucarest un uf6cio di statistica che ha fatto qualche notevole pubblicazione. In Russia, prima della guerra, esistevano uffici di statistica a Pietroburgo, a Mosca e in qualche altra città. Ora anche le statistiche municipali sono in gran parte centralizzate; il cominissariato nazionale per gli affari interni pubblica dal 1926 un annuario dal titolo Economia comunale, contenente specialmente dati sulle imprese municipalizzate. In Spagna hanno uffici di statistica le città di Madrid, di Barcellona e di Valencia. In Svezia un ufficio perfettamente organizzato e noto per importanti pubblicazioni esiste a Stoccolma; altri uffici sono istituiti a Göteborg e Malmö. La Svizzera possiede una bene organizzata e collegata statistica municipale sul tipo di quella germanica, nei tre uffici di Basilea, Berna e Zurigo. Non mancano pubblicazioni di carattere statistico anche a Ginevra e in altre città in rapporti e relazioni sul tipo di quelle delle città francesi e belghe. Negli Stati Uniti molte città pubblicano per mezzo dei loro uffici d'igiene ampie relazioni demografico-sanitarie sul tipo di quelle inglesi. Soltanto in poche città, New York, Boston, Chicago, esistono uffici di statistica propriamente detti. La statistica comparata delle finanze delle città di almeno 10 mila abitanti è compilata a cura del Bureau of the Census. Negli stati dell'America Meridionale si possono segnalare gli uffici di statistica di Montevideo e Buenos Aires per le pubblicazioni, da essi fatte, specialmente in occasione di censimenti. È in ultimo da ricordare, nel campo della statistica municipale, l'Annuaire statistique des grandes Villes, il primo volume del quale è stato pubblicato a cura dell'Istituto internazionale di statistica (L'Aia 1927).
Bibl.: Non è possibile ricordare nemmeno le principali fra le numerose pubblicazioni di statistica municipale, oltre a quelle cui si è accennato nel testo. Sullo sviluppo e sulla organizzazione della statistica municipale citiamo l'articolo Die städtischen statischen Ämter, di W. Morgenroth, nel Handwörterbuch der Staatswissenschaften, 4ª ed., Jena 1925; la comunicazione La statistique municipale en Italie, di U. Giusti, in Bulletin de l'Institut international de statistique, XXII, Roma 1926, e il Répertoire international des institutions statistiques, pubblicato nel 1934 dall'Istituto internazionale di statistica.
Associazioni di statistica.
Si segnalano soltanto le principali associazioni scientifiche costituite per il promovimento degli studî di statistica.
L'Istituto internazionale di statistica è stato costituito a Londra nel 1885 per facilitare i contatti fra i cultori di statistica dei varî paesi. Dal 1853 al 1876 erano stati tenuti nove congressi internazionali di statistica: poi la serie delle riunioni era stata interrotta. L'istituto è stato costituito per riprendere sistematicamente l'opera internazionale degli studî statistici, per migliorare la metodologia, rendere più uniformi e comparabili i dati e per richiamare l'attenzione dei governi sulle questioni relative alle rilevazioni statistiche. L'istituto è costituito da membri titolari e da membri onorarî: i primi non possono superare il numero di 225 e sono designati per cooptazione, i secondi non possono superare il numero di 25; fra i membri dell'istituto figurano le personalità più notevoli del movimento scientifico internazionale e i dirigenti dei principali organismi pubblici di statistica. L'istituto tiene ogni biennio delle rimioni, alle quali partecipano anche delegati di molti governi e invitati. La sede dell'ufficio permanente dell'istituto è stata inizialmente a Roma ed è attualmente a L'Aia. L'istituto pubblica gli atti delle riunioni, i quali formano il Bulletin de l'Institut international de statistique, di cui sono stati pubblicati fino al 1935 ventotto volumi: la collezione di questo bollettino costituisce una vera biblioteca di statistica, di contenuto assai vario. L'ufficio permanente ha pubblicato fino al 1933 un bollettino mensile destinato specialmente a raccogliere prezzi e numeri indici dei prezzi del commercio all'ingrosso, oltre ad altri dati di statistica economica; al bollettino ha fatto seguito dal 1933 una rivista trimestrale dell'istituto, contenente prevalentemente memorie scientifiche dei soci e una sistematica bibliografia di statistica. L'istituto ha fatto varie pubblicazioni, fra cui degno di nota un volume commemorativo del primo cinquantennio della sua attività, edito nel 1934.
La più importante associazione statistica di singoli paesi è la Royal Statistical Society inglese: essa è stata costituita nel marzo 1834; il numero dei soci non è limitato ed è assai cospicuo. La società tiene riunioni mensili durante parte dell'anno; il testo delle memorie lette e il resoconto delle discussioni è pubblicato (insieme con altri articoli) nel Journal of the Royal Statistical Society, di cui si è iniziata la pubblicazione nel 1838; questo giornale è il più importante periodico scientifico di statistica; è pubblicato a fascicoli talora mensili e talora trimestrali. Nel 1885 la società ha pubblicato il Jubilee Volume contenente alcune importanti monografie e nel 1934 un volume commemorante il centenario. In Inghilterra esiste anche la Manchester Statistical Society, fondata nel 1833, la quale pubblica dei volumi di Transactions, in ciascuno dei quali raccoglie gli atti relativi alle sessioni.
Negli Stati Uniti esiste la American Statistical Association fondata nel 1839, con sede a New York. Pubblica trimestralmente il Journal of the American Statistical Association, importante periodico di alto valore scientifico, contenente memorie presentate alle sessioni della società e altri articoli. Le sessioni della società hanno luogo annualmente.
La Société de Statistique di Parigi è stata fondata il 5 giugno 1860; pubblica il Journal de la Société de Statistique de Paris (mensile).
Nel 1935, per iniziativa della rivista Barometro Economico, si è svolto un movimento per promuovere la fondazione in Italia di una società scientifica di statistica.
Annuarî statistici.
Si dà il nome di annuario statistico a una raccolta d'informazioni statistiche sugli aspetti della vita sociale di un paese che si prestano alla rappresentazione quantitativa. Nella maggior parte dei paesi civili viene pubblicato un annuario statistico, in generale con periodicità annuale, come richiederebbe il nome, talvolta a intervalli irregolari. L'annuario è compilato per cura dell'ufficio statistico centrale, o dell'organo che ne esercita le funzioni. Si possono distinguere due tipi principali di annuarî: quelli che recano soltanto informazioni statistiche, corredate di brevi note atte a chiarirne il significato o l'attendibilità, e quelli dove le informazioni statistiche costituiscono semplicemente la documentazione intercalata o annessa a trattazioni monografiche. Il primo tipo predomina fra gli annuarî dei grandi stati e i migliori esempî ci vengono dagli Stati Uniti e dalla Germania; il secondo fra gli annuarî coloniali e ne presenta il modello la Federazione australiana. Nell'esposizione sono seguiti criteri diversi: talvolta vengono date le sole notizie statistiche più recenti, con molti particolari, talaltra le notizie stesse sono date in forma più ristretta, ma in, compenso comparate con analoghe notizie retrospettive per periodi più o meno lunghi. Col primo criterio si offre una visione più ampia dei fatti attuali, col secondo si rende possibile la visione dello sviluppo degli eventi nel tempo. Si cercano di conciliare i due fini, riunendo in uno stesso annuario tabelle dei due tipi, o alternando regolarmente annuarî compilati con l'un criterio e con l'altro, o pubblicȧndo annualmente raccolte di dati attuali, e a più lunghi intervalli raccolte di dati retrospettivi.
Secondo le varie esigenze politiche, amministrative ed economiche dei diversi paesi, muta la proporzione assegnata a ogni singola materia nell'annuario, e in parte mutano le materie trattate, anche in relazione alla varia estensione delle informazioni statistiche disponibili. Le notizie che si trovano nella massima parte degli annuarî riguardano circostanze geografico-fisiche o geografico-politiche (estensione del territorio, circoscrizioni territoriali, climatologia, sinistri derivanti dalle forze naturali), fatti demografici (popolazione, sua composizione e sue variazioni, igiene e sanità pubblica), fatti politici e amministrativi (governo e amministrazione, rappresentanza, difesa nazionale, opere pubbliche, organizzazione sindacale), indici delle condizioni intellettuali o morali (istruzione, istituzioni religiose, polizia, delinquenza, giustizia civile e penale, carceri); ma in maggior copia si riferiscono ad aspetti dell'economia nazionale (ricchezza e reddito della popolazione e di singole categorie di essa; proprietà rurale e urbana e suoi trasferimenti, abitazioni, industrie agricole, pastorali e forestali; irrigazione; caccia e pesca; industrie estrattive; industrie produttrici di energia; industrie trasformatrici di materie; comunicazioni e trasporti per vie terrestri, acquee e aeree, commercio interno ed estero; lavoro, condizioni e mercato del lavoro, conflitti del lavoro; previdenza, risparmio, assicurazioni; moneta, credito, mercato monetario; finanze pubbliche). Gli stati, che possiedono colonie, spesso comprendono nei loro annuarî informazioni a queste relative, o pubblicano speciali annuarî coloniali.
Parecchi annuarî statistici sono corredati da un'appendice di confronti internazionali, che negli annuarî germanico e francese assume il carattere e le dimensioni di un vero annuario statistico internazionale. La Società delle nazioni ha pubblicato nel 1927 un primo saggio di annuario statistico internazionale. Annuarî statistici internazionali riferentisi a particolari aspetti della vita economica e sociale vengono pubblicati, con vario nome, da organizzazioni internazionali.
Molte città pubblicano annuarî statistici municipali, destinati a offrire informazioni sui principali aspetti della vita cittadina.
Il primo annuario statistico italiano, compilato da Luigi Bodio, allora segretario della Giunta centrale di statistica, reca il titolo L'Italia economica (Roma 1873), ed è del tipo descrittivo, le informazioni statistiche essendo inserite nel corso di trattazioni monografiche. Nell'Annuario statistico italiano, pubblicato dal 1878 in poi dalla Direzione di statistica (divenuta successivamente Direzione generale, Ufficio centrale, Istituto centrale), l'esposizione verbale cede gradualmente il campo alla documentazione statistica: l'introduzione generale e le introduzioni ai singoli capitoli si vanno assottigliando fino a scomparire. Dell'Annuario una prima serie comprende 13 volumi, pubblicati a intervalli irregolari: il primo reca la data del 1878 e i successivi rispettivamente si riferiscono agli anni 1881, 1884, 1886, 1887-88, 1889-90, 1892, 1895, 1897, 1898, 1900, 1904, 1905-07; una seconda serie comprende 9 volumi: 1911, 1912, 1913, 1914, 1915, 1916, 1917-18, 1919-21, 1922-25; una terza serie è stata iniziata col volume del 1927; una quarta col volume del 1934.
Tra gli Annuarî statistici esteri, si ricordano soltanto alcuni specialmente per l'importanza dei paesi cui si riferiscono, per la forma della loro compilazione e la ricchezza dei dati: Annuaire statistique de la France, Statistisches Jahrbuch für das deutsche Reich, Statistical abstract for the United Kingdom, Annuaire statistique de la République Polonaise (fino al 1929 in polacco e in francese, dal 1930 in inglese e in francese), Anuario estadístico de España, Statistisk Årsbok för Sverige, The Canada year book, Statistical abstract of the United States, Résumé statistique de l'Empire du Japon, Statistical abstract for British India, Official year book of the Commonwealth of Australia, New Zealand official year book, Official year book of the Union of South-Africa and of Basoutoland, Bechouanaland, Protectorate and Swaziland.
Tra gli annuarî statistici internazionali: Annuaire statistique international della Società delle nazioni (Ginevra 1927 e segg.), le appendici ai citati annuarî germanico e francese e dal 1934 all'Annuario statistico italiano. Tra gli annuarî speciali non può omettersi l'Annuaire international de statistique agricole (Istituto internazionale di agricoltura, Roma 1912 e segg.).
Tra gli annuarî statistici municipali è da ricordare l'Annuario storicostatistico del comune di Milano (v. sopra: Statistiche municipali).