Nota metodologica
Gli obiettivi conoscitivi dell’indagine
L'indagine "Bambini e ragazzi: comportamenti, atteggiamenti e progetti futuri", realizzata dall'Istituto Nazionale di Statistica, ha l'obiettivo di raccogliere dati su alcuni aspetti fondamentali della vita quotidiana di ragazzi e ragazze tra gli 11 e i 19 anni residenti in Italia, con particolare attenzione ai giovani di cittadinanza straniera.
La rilevazione è parte integrante del Programma Statistico Nazionale e ha ricevuto un'accurata supervisione da parte dell'Autorità Garante per la Protezione dei Dati Personali, al fine di garantirne il rispetto delle normative sulla privacy.
I giovani inclusi nel campione sono invitati a compilare un breve questionario online, facilmente accessibile anche tramite smartphone o tablet. Il questionario, composto da domande semplici, raccoglie informazioni su vari temi: la cittadinanza e l’identità, le relazioni con amici e famiglia, l’uso dei social media, l’esperienza scolastica, il tempo libero, la soddisfazione riguardo alcuni aspetti della vita, le paure e le difficoltà, nonché i progetti futuri.
I dati raccolti permettono di analizzare come vivono i giovani in Italia, quali sono le loro necessità e le loro aspettative. Nella versione 2023, inoltre, è stata aggiunta una sezione dedicata alle opinioni sui ruoli di genere, con un focus sulle percezioni riguardo le donne e gli uomini.
Definizione e target di indagine
All'indagine hanno partecipato circa 108.000 ragazzi e ragazze, di età compresa tra gli 11 e i 19 anni, residenti in Italia, italiani e stranieri. I partecipanti sono stati selezionati in modo casuale dagli archivi sulla popolazione dell'Istat.
La strategia di campionamento adottata ha permesso di ottenere un campione statisticamente rappresentativo della popolazione giovanile di 11-19 anni, di cittadinanza sia italiana che straniera, con un'attenzione particolare per le nazionalità più numerose. Per garantire una buona rappresentatività delle diverse comunità straniere, il 60% del campione è stato composto da giovani di cittadinanza non italiana.
In totale, sono stati raccolti 39.214 questionari, il 42% dei quali provenienti da ragazzi di cittadinanza straniera.
La durata della rilevazione
La rilevazione si è svolta dal 1° ottobre al 20 dicembre 2023.
Come sono stati raccolti i dati
Per quanto riguarda la tecnica di rilevazione, i giovani sono stati chiamati a rispondere a un questionario online, utilizzando la modalità “Computer Assisted Web Interview” (CAWI). Questa tecnica si è rivelata particolarmente efficace per raggiungere i ragazzi, un target abituato all’uso delle nuove tecnologie. Inoltre, come già accennato, per facilitare al massimo la partecipazione, il questionario è stato ottimizzato per la compilazione anche su smartphone e tablet.
Per raggiungere nel miglior modo possibile la popolazione di riferimento, sono state adottate diverse strategie. Innanzitutto, il questionario è stato progettato in modo da essere breve e conciso, con una durata media di compilazione inferiore ai 30 minuti (23 minuti in media). Inoltre, è stato inserito nelle lettere informative inviate agli indirizzi di residenza degli intervistati un QR code che, inquadrato con uno smartphone, permettesse l'accesso diretto al sito per la compilazione del questionario. Ciò ha semplificato notevolmente l'accesso e ha favorito l’uso di dispositivi mobili, più familiari ai giovani. In effetti, il 74,9% dei ragazzi italiani ha completato il questionario tramite smartphone o tablet, e la percentuale sale all’83,1% tra i ragazzi di cittadinanza straniera. Tra coloro che hanno utilizzato questi dispositivi, l’86,7% ha scelto di accedere tramite il QR code. Questo dato evidenzia come l’introduzione del QR code abbia significativamente facilitato l’uso di dispositivi mobili rispetto ai tradizionali PC. Nella precedente edizione dell'indagine (2021), dove il questionario era accessibile esclusivamente tramite un link, solo il 49% degli utenti aveva completato il questionario su smartphone o tablet.
Un altro aspetto importante è stato il supporto linguistico: per agevolare i giovani di nazionalità non italiana, il questionario è stato reso disponibile in oltre dieci lingue: albanese, arabo, inglese, francese, tedesco, cinese, rumeno, sloveno, spagnolo e ucraino. Escludendo il tedesco (necessario per la provincia di Bolzano), la lingua straniera più scelta è stata il cinese mandarino, seguita dall'inglese e dall'ucraino. Circa 1.700 rispondenti stranieri hanno completato il questionario in una lingua diversa dall’italiano.
Prima dell’avvio della rilevazione, è stata inviata ai rispondenti una lettera informativa firmata dal Presidente dell'Istat, contenente tutte le informazioni necessarie per accedere al questionario. Le lettere sono state inviate direttamente ai ragazzi maggiorenni o, nel caso di minorenni, alle loro famiglie. Le lettere erano disponibili in dieci lingue oltre l'italiano, inclusi albanese, arabo, cinese, francese, inglese, romeno, russo, sloveno, spagnolo e tedesco. Inoltre, sono stati inviati promemoria postali e, per i ragazzi maggiorenni, anche un promemoria attraverso l’app IO.
L’Istat ha prestato particolare attenzione alla protezione della privacy e alla sicurezza dei dati, adottando rigorosi protocolli per la raccolta delle informazioni. Il modello di rilevazione si è basato su studi precedenti e sul coinvolgimento di giovani e studenti in gruppi di discussione e in altre esperienze partecipative. Il questionario copre diversi aspetti della vita quotidiana dei giovani che indaga in otto sezioni, : “chi sei?”, “lo studio”, “cittadinanza e identità”, “relazioni sociali”, “tempo libero”, “il tuo futuro”, “opinioni su uomini e donne” e “altre informazioni”. Durante la compilazione, la piattaforma CAWI ha consentito di segnalare immediatamente eventuali incongruenze nei dati o risposte fuori range, garantendo la qualità e la coerenza delle informazioni. Inoltre, la tecnica CAWI ha reso possibile l'automazione dei salti tra le domande in base alle risposte precedenti, migliorando l’efficienza e l'accuratezza del processo di raccolta dati.
Infine, la modalità di rilevazione ha permesso un monitoraggio giornaliero delle operazioni, consentendo di seguire in tempo reale l'andamento delle risposte e la partecipazione dei giovani. I dati venivano salvati automaticamente sui server dell'Istat, consentendo di scaricare in tempo reale i questionari completati e di monitorare l’efficienza del processo, intervenendo prontamente in caso di eventuali problematiche.
Il fac-simile del questionario somministrato ai ragazzi e le lettere inviate alle famiglie sono disponibili online al seguente link: https://www.istat.it/it/archivio/287601
Disegno di campionamento
La popolazione di interesse dell’Indagine "Bambini e ragazzi: comportamenti, atteggiamenti e progetti futuri", è costituita dagli individui residenti in Italia di età compresa tra gli 11 e i 19 anni.
L’archivio di selezione è il Registro Base degli Individui (RBI) e contiene informazioni a livello individuale quali l’età, il sesso, la cittadinanza. In base a RBI, in Italia, i residenti tra gli 11 e i 19 anni risultano essere al 1° gennaio 2024 oltre cinque milioni (quasi il 9% della popolazione residente). A confronto, i dati Eurostat per l'UE27 al 1° gennaio 2023 mostrano un peso relativo del 9,5% per la stessa fascia d'età, con la Germania all'8,3%, la Francia all'11,3% e la Spagna al 9,6%.
I domini di studio, ossia gli ambiti rispetto ai quali sono riferiti i parametri di popolazione oggetto di stima, sono definiti sulla base delle seguenti variabili di stratificazione:
- regione (21 modalità);
- cittadinanza (sette modalità): italiana, le prime cinque cittadinanze straniere presenti in Italia (albanese, cinese, marocchina, romena e ucraina), altre cittadinanze straniere;
- classi di età (11-13, 14-19).
Il disegno campionario è di tipo stratificato a uno stadio ed è stato progettato per garantire la precisione delle stime a livello dei seguenti domini:
- cittadinanza per classi d’età;
- ripartizione geografica per classi d’età;
- ripartizione geografica per cittadinanza;
- regione per cittadinanza a due modalità (italiano, straniero) per classi d’età.
La stratificazione è stata definita dall’incrocio delle modalità della regione, delle classi di età, delle cittadinanze e del sesso, ottenendo complessivamente 588 strati. L’allocazione del campione è stata ottenuta sulla base degli errori campionari attesi di una generica stima di interesse, una prevalenza del 10% e fissando i vincoli sugli errori in modo differenziato nei domini di stima sopra definiti. Sono stati così allocati tra gli strati 39.496 bambini e ragazzi.
Il numero di ragazzi da selezionare sulla base dell’allocazione ottima è stato incrementato in ottica di
sovra campionamento a 107.961, per sopperire preventivamente alle mancate risposte, sulla base dei tassi di risposta osservati nella precedente edizione dell’indagine.
Nella rilevazione sono state utilizzate le seguenti classificazioni Istat:
- la classificazione dei codici comunali (codici Istat a 6 cifre con codice provincia e codice comune): https://www.istat.it/it/archivio/6789;
- la classificazione degli Stati esteri (codici Istat e 3 cifre) per la codifica univoca delle cittadinanze straniere: https://www.istat.it/it/archivio/6747.
Metodologia di calcolo dei pesi campionari
Le stime prodotte dall’indagine sono principalmente stime di frequenze assolute.
Il principio su cui è basato ogni metodo di stima campionaria è che le unità appartenenti al campione rappresentino anche le unità della popolazione che non sono incluse nel campione. Questo principio viene realizzato attribuendo a ogni unità campionaria un peso che denota il numero di unità della popolazione rappresentate dalla unità medesima.
La procedura di costruzione dei pesi finali da assegnare alle unità campionarie consta di più fasi:
- la prima fase in cui si calcola il peso base (o peso diretto) come inverso della probabilità di inclusione delle unità selezionate nel campione;
- la seconda fase in cui si calcola un fattore correttivo di mancata risposta per fare in modo che i rispondenti all’indagine rappresentino anche le unità statistiche che non hanno risposto; tale fattore è stato calcolato come l’inverso del tasso di risposta osservato a livello di ripartizione (Nord, Centro, Sud) e cittadinanza (italiana o straniera);
- nella fase finale, per ogni unità campionaria rispondente si calcola un fattore correttivo, detto fattore di “calibrazione”, che consente di soddisfare la condizione di uguaglianza tra i totali noti della popolazione e le corrispondenti stime campionarie.
I totali noti della popolazione, declinati a livello regionale, sono stati:
- il numero degli 11-19enni di ognuna delle “principali” cittadinanze considerate come variabili di stratificazione (7 vincoli);
- il numero degli 11-19enni distinti per sesso e tipo di scuola frequentata (medie, superiori e non iscritti), con la tipologia di scuola così come risultante dagli archivi del MIM (6 vincoli);
- il numero degli 11-19enni distinti per sesso, età suddivisa in due classi (11-13enni, 14-19enni) e cittadinanza suddivisa tra italiana e “non italiana” (8 vincoli).
Il peso finale della generica unità campionaria è dato dal prodotto del suo peso base per il fattore correttivo di mancata risposta e per il fattore di calibrazione.
Valutazione del livello di precisione delle stime
Le principali statistiche di interesse per valutare la variabilità campionaria delle stime prodotte da un’indagine sono l’errore di campionamento assoluto e l’errore di campionamento relativo, definite dalle seguenti espressioni:
Le stime prodotte dall’indagine sono state ottenute mediante uno stimatore di calibrazione in due passi sulla base di una funzione di distanza di tipo lineare. Poiché lo stimatore adottato non è funzione lineare dei dati campionari non è possibile ottenere una espressione analitica per la stima della varianza.
Pertanto, si è utilizzato il metodo proposto da Woodruff che, ricorrendo all’espressione linearizzata in serie di Taylor, consente di ottenere la varianza di ogni stimatore non lineare calcolando la varianza dell’espressione linearizzata ottenuta. Tale metodologia di stima della varianza è implementata nel software generalizzato ReGenesees, che è stato utilizzato per la stima della varianza delle stime.
Poiché le stime prodotte dall’indagine in oggetto sono in numero molto elevato, si è fatto ricorso ad una presentazione sintetica degli errori campionari. A tal fine si utilizza il metodo dei modelli regressivi che si basa sulla determinazione di una funzione matematica che mette in relazione ciascuna stima con il proprio errore campionario relativo stimato.
Il modello utilizzato per le stime di frequenze assolute e relative è il seguente:
dove i parametri a e b sono stimati, per un certo dominio di stima, con il metodo dei minimi quadrati su un insieme di stime ottenute dall’indagine (con i rispettivi errori relativi) che coprono approssimativamente l’intervallo di variazione delle stime di frequenze che vengono pubblicate. I parametri dei modelli descritti, che permettono la presentazione sintetica degli errori di campionamento, sono stati stimati tramite il software ReGenesees.
Utilizzando gli opportuni coefficienti è possibile calcolare una stima dell’errore campionario relativo di una generica stima di una frequenza assoluta Y ̂ applicando la seguente formula:
I modelli di presentazione sintetica degli errori di campionamento sono stati stimati per diversi domini di stima. I modelli proposti sono: il totale generale a livello Italia, i ragazzi distinti per cittadinanza (a 2 e a 7 modalità), la distinzione per ripartizione geografica e incrociando la ripartizione con la cittadinanza (a 2 modalità).
Nel seguito sono riportati, per tutti i domini di stima appena indicati, i prospetti relativi ai valori dei coefficienti
a e b e dell’indice di determinazione R² dei modelli d’interpolazione tra stime ed i relativi errori (Prospetto A). A questo prospetto segue il corrispettivo recante, per ogni modello, i valori interpolati indicativi degli errori campionari relativi alle corrispondenti stime assolute (Prospetto B).