Modello a Coda

Dicembre 2017

Solo i pazzi e i solitari possono permettersi di essere se stessi.
I solitari perché non hanno bisogno di piacere a nessuno,
i pazzi perché di piacere a qualcuno, non gliene frega niente.
[C. Bukowski]

Morfeo & Chewie

Prima di addentrarci nella tana del bianconiglio e chiarire il rapporto tra scienza e magia, dobbiamo approfondire i concetti menzionati nelle puntate precedenti e definire una chiara metodologia di misura.
Il mondo è pieno di fanfaroni che mostrano grafici, video colorati, formule criptiche e filosofie ermetiche. Il vero scienziato non si esprime in modo ambiguo ma condivide i suoi segreti; spiega in dettaglio di cosa parla e come va misurato.
Proviamo a farlo anche noi. I concetti da chiarire sono tre: la differenza tra media e moda, la stima della varianza e il peso degli astenuti.


Media o moda?

Precedentemente abbiamo definito l'Indice di Aderenza a un Comportamento (IAC) riferendoci alla moda di un campione di misure. Per calcolare gli IAC della Sporca Dozzina utilizzando la moda dovremo allungare la brodaglia con pagine zeppe di calcoli e tabelle. Per evitare questa inutile sofferenza introduciamo un'approssimazione

La misura (sperimentale) dello IAC è calcolata sulla quantità MEDIA di attuazione del comportamento in esame


Media o moda?

Il fatto di usare la media (misura sperimentale) per stimare la moda (definizione teorica) comporta una certa imprecisione. Per esempio, quando abbiamo calcolato lo IAC del comportamento lavorare tot ore al giorno, la moda era pari a 40 ore settimanali contro una media di 38 ore. Ciò corrisponde a una differenza del 5% tra i due valori: nulla di drammatico.
La statistica ci dice che tanto più un campione assomiglia a una distribuzione gaussiana (o meglio simmetrica) tanto più media e moda tendono a coincidere. Poiché la maggior parte dei comportamenti umani sono caratterizzati da una distribuzione più o meno simmetrica, d'ora in poi calcoleremo lo IAC utilizzando la media al posto della moda.

Ovviamente, se dei veri scienziati volessero validare la Teoria della Matrice, dovrebbero utilizzare la moda anziché la media, e sorbirsi le pagine di calcoli che noi stiamo pigramente evitando.

La dispersione del pollo

Nel caso del comportamento lavorare tot ore al giorno abbiamo ottenuto la precisione della misura direttamente dai dati, ovvero siamo andati a vedere quanti italiani lavorano 40 ore la settimana, quanti 20 ore la settimana, quanti sono disoccupati e così via. Poi abbiamo usato questi numeri per calcolare tutti gli indicatori di cui avevamo bisogno: moda, media, indice di dispersione ecc. Se dovessimo fare lo stesso per gli indicatori della Sporca Dozzina questo romanzo diverrebbe un trattato di sociologia applicata. Optiamo quindi per un approccio più pratico e calcoliamo gli IAC della Sporca Dozzina direttamente dai dati dell'ISTAT.
In soldoni: per sapere quante ore al giorno dorme l'italiano medio non raccogliamo cifre né interpoliamo distribuzioni, ma apriamo un opportuno dossier ISTAT e usiamo un valore medio premasticato. Purtroppo, così facendo, ci perdiamo per strada l'indice di dispersione.
- L'indice di cosa?

Chiedo venia. Se non siete pratici di statistica le mie parole potrebbero suonare come il latinorum di Don Abbondio [1]. Sto parlando dello stesso problema che affliggeva il buon Trilussa

Seconno le statistiche d'adesso risurta che te tocca un pollo all'anno: e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perch'è c'è un antro che ne magna due

Varianze diverse

Non so se l'errore di Trilussa fosse voluto o se il poeta romano fosse semplicemente ignorante. Fatto sta che il valore della media, se sprovvisto del suo indice di dispersione, non può essere usato per formulare frasi del tipo "gli italiani mangiano in media un pollo a testa".
Proviamo a spiegarlo considerando la statura media di un maschio italiano, pari a 175 cm. Tale valore non ci dice se siamo tutti alti uguali (esattamente 175 cm) oppure se gli italiani si distribuiscono equamente tra i 50 cm e i 300 cm [2]. Per rispondere alla questione dobbiamo sapere quanto le altezze sono concentrate attorno al valor medio di 175 cm.

A tal scopo gli statistici usano l'indice di dispersione, o varianza. Nel caso dell'altezza dei maschi italiani, se la varianza fosse pari a 10 cm, allora potremmo dire che le persone alte tra i 165 cm e i 185 cm sono pressoché "normali", mentre le altre sono rispettivamente basse o alte.
E' proprio in virtù della varianza che abbiamo interpolato lo IAC del comportamento lavorare tot ore al giorno: senza la varianza non avremmo potuto tracciare la curva che fornisce lo IAC per un qualsiasi numero di ore.

Ecco il nocciolo del problema: per sapere quanto sta nella Matrice un comportamento della Sporca Dozzina dobbiamo conoscere la varianza della media, ma i dati pubblicati dall'ISTAT non sempre forniscono le varianze associate alle singole misure.
Per risolvere l'inghippo assumiamo per definizione che un generico valore medio sia affetto da un errore relativo del 25%. Giustificheremo questa scelta più avanti: per ora limitiamoci a ricordare che ogni modello scientifico implica approssimazioni, semplificazioni o l'assegnazione di parametri numerici. Quel che importa, quando si introduce un modello, è che esso conduca a esperimenti falsificabili. Non esistono modelli perfetti, altrimenti non sarebbero modelli ma realtà noumeniche. E il mio modello, modestamente, è imperfetto almeno quanto gli altri.

Il peso dell'astensione

Per il comportamento lavorare tot ore al giorno abbiamo calcolato lo IAC dei disoccupati sapendo che essi sono il 18% della popolazione. E' un risultato tutt'altro che banale, perché ci dice quanto sono "normali" le persone che si astengono dal praticare il comportamento in esame, cioè "lavorano" zero ore al giorno. Purtroppo i dati ISTAT forniscono poche informazioni su coloro che si astengono dal praticare un comportamento, perciò calcolare il peso degli astenuti per gli indicatori della Sporca Dozzina è un compito piuttosto arduo.
Facciamo un esempio: l'ISTAT ci dice che le donne italiane dedicano in media 5 ore al giorno alle faccende domestiche, ma non dice quante di loro si astengono completamente dal compito. Mi riferisco alle donne che delegano le pulizie alla colf, la spesa al marito e comprano solo cibi precotti. Anche se fossero poche sono proprio quelle che ci interessano, perché si trovano fuori dalla Matrice.
Proviamo a riformulare la questione: come possiamo stimare la percentuale di persone che non praticano mai un certo comportamento a partire dal valore medio di attuazione del comportamento in esame?

Il modello a coda

Modello a Coda

Per rispondere alla domanda introduciamo una distribuzione di mia invenzione, denominata Modello a Coda. Si tratta di una curva che approssima (ed estende) la gaussiana tenendo conto del contributo degli astenuti (o disoccupati). L'idea consiste nell'approssimare la curva a campana con due rette: una a sinistra del valore medio, una a destra. Per ottenere le equazioni delle rette si interpolano separatamente il versante destro e sinistro della gaussiana. Il modello viene poi aggiustato (mediante banali operazioni di scala) in modo da avere valore massimo unitario e dipendere solo da due variabili: la moda e la varianza del campione originale. Se disegnassimo su un foglio le due rette del Modello a Coda si otterrebbe una sorta di teepee indiano, dove le due rette sembrano sostenere la distribuzione gaussiana originale.

A questo punto si aggiunge una coda a sinistra del teepee, per rappresentare coloro che si astengono dal praticare il comportamento. L'altezza della coda nell'origine viene convenzionalmente fissata a 0,25. Da dove salta fuori questo valore? Se andate a rivedere lo IAC associato ai disoccupati scoprirete che esso era pari proprio al 24%. In pratica stiamo assumendo che la distribuzione del comportamento "lavorare" rappresenti un modello esemplare di distribuzione, da cui prendere esempio per tutti gli altri casi (arrotondando 0,24 con 0,25).

Ricordiamo infine che abbiamo assunto (per pura convenzione) che ogni campione abbia una varianza del 25% [3], ovvero: la varianza del Modello a Coda è un quarto della media. Ciò permette di tracciare tutti i punti del modello conoscendo il solo valor medio (che viene usato per stimare l'indice di dispersione). Ad esempio, se un certo comportamento venisse praticato dagli italiani in media 8 ore al giorno, assumere un errore relativo del 25% significa ipotizzare che la varianza del campione sia pari a 2 ore (un quarto di 8).

Modello a Coda

Il Modello a Coda risponde a tutti i quesiti sollevati finora. Permette di calcolare lo IAC di un comportamento senza conoscere l'indice di dispersione del campione (l'errore di Trilussa) e tiene conto del contributo di coloro che non praticano mai il comportamento (gli astenuti o disoccupati).
Il Modello a Coda è una brutale approssimazione, ma la fisica classica descrive una miriade di processi (dalla balistica ai movimenti orbitali dei pianeti) assumendo che i corpi in questione siano particelle puntiformi, nonché l'assenza delle forze di attrito. Ricordando poi che questo è un romanzo di self-fiction e non un trattato matematico, il Modello a Coda appare più che adeguato al nostro scopo.

Modello a Coda

Il Modello a Coda permette di stimare lo IAC di un qualsiasi comportamento a partire dal Valore Medio (VM) di attuazione del comportamento stesso. Tale distribuzione è composta da un triangolo di altezza 1 e una "coda" di altezza 0,25 nell'origine.
La "coda" decresce in modo da assumere valore 0 nel punto di ascissa pari a VM/4 (perciò la base del triangolo misura VM·7/4 - VM/4).

E' stata dura ma abbiamo chiarito i formalismi matematici utilizzati dalla Teoria della Matrice. Chi è allergico a numeri, formule e grafici penserà che vi ho sadicamente sottoposto a un inutile calvario, ma è solo questione di punti di vista. Agli occhi di un vero scienziato la Teoria della Matrice è un giocattolo per bambini. Ho cercato il compromesso, nella speranza di centrare due obbiettivi: permettere ai meno tecnici di seguire il discorso e agli esperti di comprendere l'intuizione di base, nella speranza che possano correggerla e migliorarla.
Per quanto grezzo e approssimato, il Modello a Coda ci permetterà di calcolare gli IAC della Sporca Dozzina e misurare l'appartenenza alla Matrice del sottoscritto. Anzi, faremo molto di più! Grazie all' Alta Magia, riusciremo a stimare la appartenenza alla Matrice di Morfeo dal 1997 al 2017.

Prima di addentrarci in questa personale introspezione esistenziale (per mia fortuna non troppo invasiva) vorrei riflettere su un risultato nascosto tra le righe. Il Modello a Coda non è solo un concetto statistico, ma offre un'interessante lettura sociologica: le persone che vivono completamente fuori dagli schemi non sono coloro che si astengono dal praticare un comportamento, ma quelle che lo praticano con estrema moderazione. Esasperando il concetto: i paria della nostra società non sono i benestanti né i poveri, ma quelli che si trovano "a metà strada" tra il normale e l'anormale.

Proviamo a spiegarlo nel caso del comportamento mangiare tot ore al giorno. Secondo l'ISTAT il valore medio di attuazione del comportamento è pari a 2 ore. Ciò significa che se dedichi al cibo esattamente 2 ore al giorno hai uno IAC del 100%, quindi sei normale. Se invece mangi poco o nulla (ovvero attui il comportamento pochi minuti al giorno) il Modello a Coda ci dice che appartieni alla Matrice in misura del 25%: sei anormale, stai fuori dagli schemi, ma tutto sommato rientri in una piccola nicchia di persone speciali. La società, in qualche modo, si prende cura di te e ti chiama addirittura per nome: anoressico. Fai notizia, ricevi attenzioni da medici e familiari, vieni accettato dagli altri, o meglio: incluso.

Sushi o insalata?

Se invece dedichi all'alimentazione solo mezz'ora al giorno o se pranzi al ristorante con un brodino, allora ti ritrovi completamente fuori dagli schemi. Non stai bene tra gli anoressici perché non mangiano mai, e non riesci a frequentare i matriciali perché si abbuffano. Vai a cena con gli amici che prendono primo, grigliata, dolce e caffè, tu ordini un'insalata e paghi 25€ per un po' di lattuga. Non vai alla cena aziendale (che sarebbe gratis) perché mangeresti talmente poco che il viaggio non vale la candela. Provi a frequentare vegani e vegetariani, ma il giorno che vuoi cenare con un uovo alla coque e una fetta di prosciutto trovi il frigo vuoto. Compri il sushi take away per moglie e figlia ma per te chiedi solo un'insalatina.

Il concetto di moderazione estrema mi ha aiutato a far pace con argomenti che mi tormentavano da tempo. Anni fa, intorno al 2004, mi capitò di assistere a una versione dell'Amleto recitato da disabili: fu uno strazio assoluto, eppure alla fine il pubblico applaudì, commosso.
- Guarda che fatica che fanno, poverini. Sono bravissimi a provarci.

La tana del bianconiglio

L'esperienza mi lasciò l'amaro in bocca. Certo, ero felice per quei coraggiosi handicappati, ma ero incazzato nero per tutti gli altri. Quelli che sono stonati e non potranno mai cantare. Quelli che dopo l'incidente non possono più andare in montagna. Quelli che al volante sono talmente imbranati da sudare sette camice. Se queste persone fossero mute, zoppe o disabili, avrebbero diritto a un'esenzione, una pensione o un pass arancione sul cruscotto. Se invece sei "solo" stonato, "solo" un po' inabile o "solo" un po' disabile, allora sei gabbato due volte. La prima perché non vedi il SUV alle tue spalle e lo investi facendo retromarcia, la seconda perché nessuno dice "poverino, è handicappato: non l'avrà visto". Il dolore cervicale non è una scusa, il torcicollo non ti giustifica, il sistema cognitivo di seconda classe non ti assolve.

Per anni ho creduto che questa fosse un'ingiustizia, una falla del Sistema, una carenza di applicazione della logica Fuzzy. Ho immaginato leggi che assegnassero a tutti una percentuale di disabilità, chi al 100%, chi al 50%, chi al 2%. Perché siamo tutti disabili, chi più chi meno. Ma come applicare la legge nel concreto? I disabili al 10% potrebbero parcheggiare sulle strisce arancio solo 36 giorni l'anno? O dovrebbero occupare il 10% dello spazio disponibile?

La risposta sta nel punticino che si trova tra la coda degli astenuti e la campana dei matriciali. Non è colpa della società, delle leggi o del governo. Semplicemente chi si trova a metà strada tra il l'abile e il disabile rappresenta una minoranza così sparuta da non avere voce. Ai confini della realtà non si fa comunella né con gli alternativi né coi normali. Uscire dalla Matrice non significa mollare il lavoro, entrare in una comune o vivere senza tecnologia, ma campare a metà tra i mondi, dove nessuno crede ci sia vita: tra il mainstream e l'indie.
Ecco perché Realtà e Matrice coincidono. Quando ti trovi nel punto del Modello a Coda collocato tra le due cuspidi sei diverso da tutti: nessuno crede che la tua scelta sia possibile. Smetti di esistere, diventi invisibile e scompari da tutte le realtà, sia maggioritarie che minoritarie. E' il punto dove attraversi lo specchio e cessi di appartenere a questo mondo: è la tana del bianconiglio.



[1] Questa frase è volutamente sarcastica. Se parlo di "indice di dispersione statistica" l'italiano medio potrebbe accusarmi di usare un gergo tecnico: non è lui a essere ignorante, ma io criptico. Di contro, se cito il latinorum di Don Abbondio come esempio "ante litteram" della Supercazzola, allora chi non coglie la citazione è un ignorante. Questa grave asimmetria didattica - che favorisce la cultura umanista rispetto a quella scientifica - persiste tutt'oggi nel sistema scolastico (specialmente in Italia), nonostante frotte di umanisti urlanti sostengano l'esatto contrario.

[2] Se l'altezza di tutti i maschi italiani fosse distribuita equamente tra i 50 e 300 cm si avrebbe un'altezza media pari a 175 cm. Precisiamo che esistono infiniti altri modi di distribuire l'altezza dei maschi italiani in modo da far saltar fuori il valore 175 cm come media. Ecco perché conoscere l'indice di dispersione è importante per "visualizzare" la distribuzione stessa. Una delle prime analisi in questa direzione è nota come il Quartetto di Anscombe (1973).

[3] Il foglio "Coda" del file "modello_a_coda-teoria_01.xls" mostra come l'errore relativo massimo (oltre al quale il modello non funziona) è pari al 25%. Anche se nel mondo reale si hanno (di solito) misure con dispersione inferiore, scegliamo un errore relativo "standard" pari al 25% per due ragioni:
1. Questo è il caso limite in cui possiamo applicare il modello, ovvero: non possiamo essere più pessimisti di così, altrimenti andremmo a invalidare il modello stesso.
2. Con un errore relativo del 25% il Modello a Coda prevede un unico punto avente IAC pari a zero (i.e. la congiunzione tra la retta della coda e la retta sinistra). Questa situazione minimizza il numero di coloro che sono "completamente fuori dalla Matrice" (cioè hanno IAC pari a zero) perché si trovano esattamente tra la coda e l'estremo sinistro della campana. Per definizione stessa di Matrice, un modello è tanto più buono quanto più associa il valore IAC = 0 a una sparuta minoranza di persone. Se così non fosse quelli fuori dalla Matrice rischierebbero di essere in troppi e la teoria sarebbe inconsistente.