Ecco che mi vado a cercare un’altra volta un argomento scomodo: la statistica, per di più applicata a un argomento drammatico: la disoccupazione giovanile. Più semplice e gratificante occuparsi della poligamia di Hollande.

Allora, almeno una volta al mese, arriva l’allarme sul 40 o 41 % di “Disoccupazione giovanile”, con conseguenti titoli a quattro colonne sulla stampa quotidiana. E questo mi sembra un perfetto esempio di comunicazione equivoca, di cui qualche volta sono colpevole anch’io, e dove chi originariamente dice una cosa intende dire A, mentre l’ascoltatore finale molto spesso ne sente un’altra B molto differente. Cosa che succede soprattutto se si tratta di problemi gravi o drammatici, come appunto la disoccupazione, e per di più giovanile

A ottobre scorso, un comunicato Flash dell’ISTAT è stato riportato da credo tutti i quotidiani con un titolo come quello che ho sotto gli occhi in questo momento, essendomi conservato il ritaglio di giornale: “Giovani, disoccupazione al 40%” che è assolutamente corretto (anche se Angelo Panebianco si è arrabbiato con l’ISTAT), ma corretto secondo la necessaria standardizzazione europea, standardizzazione che per quanto riguarda le applicazioni professionali (econometria, sociologia eccetera) a me pare sia l’unica significativa tra tutte le altre possibili alternative, sempre se presa non come un numero a sé stante ma assieme agli altri indicatori rilevanti. 

Allora: la percentuale di disoccupazione ISTAT va riferita ai soggetti attivi e solo ad essi, dove attivi significa occupati più non occupati ma in cerca di lavoro, il che significa 1 milione e 662 mila soggetti attivi. Altrimenti, se non si facesse la distinzione tra attivi o meno, anch’io pensionato, quindi non occupato, andrei ad aumentare la percentuale dei disoccupati sulla popolazione totale

Ma il fruitore finale, che nella stragrande maggioranza non è un economista o sociologo di professione, capisce invece: “Tra tutti i giovani, il 40% sono disoccupati”, dove tutti i giovani significa invece la somma (occupati + non occupati ma in cerca di lavoro + non occupati ma che non cercano un lavoro + studenti) di età tra i 15 e i 24 anni, che sono poco più di 6 milioni.

 

Allora (numeri di novembre), inevitabilmente un po’ approssimati:

Tutti i giovani tra 15 e 24:                                       6007000

In cerca di lavoro, ossia disoccupati:   659000

Occupati                                           924000

“Inattivi” (studenti più quelli che

non hanno un lavoro ma non lo

cercano)                                         4424000

                                                     -----------

                                                      6007000

 

In cerca di lavoro    659000

Occupati                 924000

                           ------------

                            1583000

 

In percentuali, usando le convenzioni UE:

disoccupati (o “in cerca di lavoro”, è la stessa cosa:

   100 x 659000/(659000+924000) = 100 x 659000/1583000 = 41,6 %

Occupati:

   100 x 924000/(659000+924000) = 100 x 924000/1583000 = 58,4 %

                                                                                               -------

                                                                                               100,0 %

 

Se invece facessi il discorso “su tutti i giovani da 15 a 24 anni”, che sono 6007000, avremmo:

  Occupati:                                           924000      15,38 %

  In cerca di lavoro (659000) più

  Inattivi (4424000)                             5083000      84,62 %

                                                        ------------  

 

                                                          6007000     100,00 %

 

dove una disoccupazione giovanile all’84% sarebbe un po’ troppo anche per i più sensazionalisti tra i giornalisti.

 

Ma ci sono evidentemente dei problemi: il primo è che a quanto pare, fino a che giustissimamente l’ha voluto l’UE (ignoro se la materia è passata per il Parlamento europeo, dei cui lavori sulla nostra stampa non compare mai nulla), non esisteva una statistica separata per la disoccupazione giovanile.

 

Il secondo è di disallineamento, forse, visto che la statistica prende in esame le classi di età tra i 15 e i 24 anni, ma in Italia l’obbligo scolastico arriva ai 16.

 

Il terzo è che non è evidenziato quanti sono gli studenti, il che mi sembra assai grave. Perché poi è importantissimo, secondo me, che si accresca proprio il loro numero, in Italia assolutamente troppo basso. E quindi che nell’intervallo di età 15-24 ci siano meno giovani a lavorare, non di più.

 

Quarto problema: lavoro in nero. Quanti, o perché costretti al nero o perché “danno una mano” nel bar del padre, lavorano ma risultano non censiti, ingrossano i numeri degli inattivi o dei disoccupati ?

 

Allora: per i limitati fini dell’avere una indicazione sull’accesso al lavoro da parte di quelli che avendo finito di studiare stanno cercando di entrare nel mercato (purtroppo è un mercato, e tale resterà fino a che la sinistra non si decide a considerare l’approssimazione, la superficialità e la retorica cose deplorevoli) del lavoro, le definizioni UE sono, secondo me, necessarie. Ma per farne un discorso di massimi sistemi occorre almeno sapere anche quanti sono gli studenti (sulla qual cosa non dovrebbero esserci vere difficoltà) e un intervallo di attendibili stime sul lavoro in nero: altrimenti restiamo in una vaghezza che serve solo a fare notizia, e quindi al mercato dell’informazione stampata o meno.

 

 

E arriva un ulteriore problema: nonostante Dario di Vico sul Corriere della Sera del 2 ottobre 2013 in un articolo dal titolo su cinque colonne “LA TRAPPOLA DELLE STATISTICHE DA DECIFRARE” abbia spiegato chiaramente la questione, anche Angelo Panebianco, professore universitario, scrittore di vari libri, rinomato studioso, editorialista dello stesso Corriere della Sera, ha interpretato quel 40% come riferito alla totalità dei giovani. In una sua successiva risposta a Patrizia Calcioli, direttore della comunicazione ISTAT, Panebianco chiarisce che si riferiva agli effetti scoraggianti di una comunicazione sensazionalistica (o meglio recepita come tale) sulla popolazione studentesca, soprattutto universitaria. Il che sposta il problema, aggravandolo: dimostra che in genere nella popolazione studentesca, perfino universitaria, pochi o pochissimi sanno leggere una statistica. Con il che non possiamo stupirci se la disoccupazione giovanile o meno è tanto alta: non ne usciamo, se poi a dirigere organizzazioni e aziende, che dovrebbero creare posti di lavoro, continueranno a andarci persone non preparate ai loro compiti.

 

Infine: chi lavora nei mezzi di comunicazione pare avere una consolidatissima abitudine a prendere le statistiche non come mezzo per la comprensione dei problemi ma come sintesi esplicativa dei problemi stessi: il che è una ricetta sicura per non capirne nulla e non farne capire nulla. Per almeno due motivi: primo, una forte correlazione statistica tra due serie di dati  di per sé  non dimostra una relazione di causa ed effetto, ma tutt’al più permette soltanto di non escluderla. Una volta, per farlo capire, si sono deliberatamente confrontati i dati sulla scolarità dei bambini in Nuova Guinea e  delinquenza giovanile a New York, trovando una correlazione statistica strettissima, pur essendo ovvio che i bambini Forè andando a scuola non spingevano gli adolescenti americani a commettere reati. Ma ci sono moltissimi casi in cui fenomeni assolutamente indipendenti potrebbero erroneamente messi in una qualche relazione (in realtà inesistente) per la casuale coincidenza del loro andamento.

 

Il secondo motivo è un po’ più sottile: supponiamo che sull’intera popolazione italiana un certo gruppo sanguigno abbia una frequenza del 30 %. Se andassimo a vedere la frequenza di quello stesso gruppo sanguigno in una Regione popolosa, come Lombardia, Campania o Lazio, la troveremmo assai poco diversa dalla media nazionale. Ma in Regioni poco popolose è assai probabile trovare uno scostamento più sensibile da quel 30%. Andando poi a vedere  la frequenza provincia per provincia, e poi comune per comune, e magari frazione per frazione, troveremmo medie parziali anche enormemente differenti dal 30%: più è piccolo il campione parziale più è ballerina la sua media.

In un articolo reperibile su Internet (basta cercare “The Most Dangerous Equation”) trovate un buon esempio del casino che si può fare procedendo a ritroso: negli Stati Uniti, una volta, si sono cercate le unità amministrative (contee) in cui il tasso di casi di cancro al rene fosse più basso, che sono risultate tutte rurali. Evviva evviva, stare in campagna fa bene, quindi non stare in campagna fa male ! Ma andando a cercare le contee con il più alto tasso di casi di cancro al rene, si è trovato che anch’esse erano tutte rurali, in parecchi casi adiacenti fisicamente alle prime. Perché le contee rurali hanno meno abitanti, e quindi su questi campioni a numerosità piccola, le differenze dalla media, in più o in meno, sono relativamente assai maggiori.

Se non ne siete convinti, generatevi un bel foglio di calcolo, poi prendete una moneta, tiratela in aria, andate a vedere se è testa e incasellate un 1, se è croce 0. Ripetete il processo diecimila volte (la scienza richiede sacrificio !) e poi fate fare al software del vostro foglio di calcolo la media: se la moneta non è fatta male, deve uscire un bel 0,5. Adesso fate fare al vostro foglio di calcolo le medie mobili, prima (voglio essere buono) su gruppi di 100 caselle: troverete che queste medie mobili saranno tutte vicinissime a 0,5. Rifate la stessa cosa riducendo progressivamente il numero delle caselle e vedrete se le medie mobili non si mettono via via a ballare perfino in una situazione tanto semplice e cretina come il lancio di una moneta. Quindi, quando si legge sul giornale che nel posto X vicino a una antenna di telefonia mobile c’è una incidenza di leucemie infantili molto maggiore della media, prima di prendermela con l’OMS, l’Organizzazione Mondiale della Sanità che se ne frega, occorre prima verificare se il giornalista non si è fatto sedurre dal sensazionalismo market oriented (in italiano commerciale ) del numero che fa effetto.