Issuu on Google+

Standardizzazione italiana e procedure psicometriche

Lucio Cottini e Daniele Fedeli Università degli Studi di Udine Mauro Leoni Fondazione Sospiro, Università degli Studi di Parma Luigi Croce Anffas Onlus Brescia, Università Cattolica del Sacro Cuore

Riassunto Nel presente articolo vengono riportate le procedure per la standardizzazione italiana della Supports Intensity Scale (SIS; Thompson et al., 2005), nonché le analisi per la verifica della validità e dell’attendibilità dei dati raccolti. Il campione normativo, composto da 1052 soggetti con disabilità intellettiva, è stato stratificato rispetto a una serie di variabili sociodemografiche, quali età, sesso, tipologia residenziale, occupazione, ecc. I dati sono coerenti con quelli originali del campione americano, e inoltre lo strumento si è dimostrato particolarmente robusto da un punto di vista metodologico, garantendo l’affidabilità delle misurazioni e consentendo pertanto di ipotizzare una grande adattabilità alle necessità dei servizi alle disabilità nel territorio italiano.

Abstract The present paper presents standardization procedures for the Italian language for the Supports Intensity Scale (SIS; Thompson et al., 2005), and describe reliability and validity analysis. Normative sample was composed by 1052 subjects with Intellectual and Developmental Disabilities (IDD), and was stratified using socio-demographical variables like age, sex, residential setting, employment, etc. data are consistent with those of the original US sample, and furthermore the instrument seems particularly robust from a methodological perspective, justifying reliable measures and suggesting a high level of potential interest of the Italian services for IDD.

Per contattare gli autori scrivere a Lucio Cottini, Facoltà di Scienze della Formazione, Università degli Studi di Udine, Via Petracco, 8 - 33100 Udine. E-mail: lucio.cottini@uniud.it

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La Supports Intensity Scale nel panorama riabilitativo italiano

21


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

22

Premessa Il panorama riabilitativo italiano è tutt’ora caratterizzato da un’enfasi sull’utilizzo di strumenti di misurazione del funzionamento intellettivo, come ad esempio le scale Weschler. Molto più limitato è invece il ricorso alla valutazione di altri aspetti del funzionamento quotidiano del soggetto con disabilità cognitive, come ad esempio il grado di adattamento all’ambiente, le abilità d’autonomia, ecc. Per queste ultime dimensioni, infatti, è alquanto limitata la disponibilità di strumenti normativi, che permettano di collocare la prestazione del soggetto lungo un continuum di funzionamento. Si tratta di una carenza rilevante che limita sia la pratica di valutazione che la progettazione educativa e riabilitativa, nel momento in cui la maggior parte degli studi sulla Qualità della Vita della persona in condizione di disabilità legano il suo benessere psicofisico al grado di adattamento al proprio ambiente (Schalock, 2007; Cottini e Fedeli, 2007). Ancor più rilevante è l’assenza di strumenti normativi che si colleghino direttamente alla progettazione degli interventi educativi e riabilitativi, non in base a un individuale livello di funzionamento cognitivo, ma alla qualità d’interazione tra i bisogni di sostegno manifestati dal soggetto nel contesto di vita e la predisposizione di un sistema di sostegni. Un modello di riferimento per il framework complessivo sul funzionamento della persona con disabilità intellettive viene fornito dalla American Association on Intellectual and Developmental Disabilities (AAIDD), che descrive un quadro di analisi basato su un modello multiassiale a 5 dimensioni (Luckasson et al., 2005, p. 32):

I. CAPACITÀ INTELLETTIVE

II. COMPORTAMENTO ADATTIVO

III. PARTECIPAZIONE, INTERAZIONI, RUOLI SOCIALI

SOSTEGNI

Funzionamento Individuale

IV. SALUTE

V. CONTESTO

Il modello AAIDD offre il collegamento più diretto all’uso di strategie basate sul costrutto di Qualità della Vita, in particolare quando la valutazione dei bisogni della persona e dei gruppi di persone con disabilità viene valutato da uno strumento sovrapponibile ai domini e agli indicatori di Qualità di Vita. L’unico strumento attualmente in grado di svolgere que-


sto ruolo è costituito dalla Supports Intensity Scale (SIS; Thompson et al., 2005; ed. it. 2008), individuata pertanto come obiettivo essenziale per la ricerca sui vettori sopra descritti e di cui il presente articolo presenta gli esiti del percorso di standardizzazione per la lingua e il contesto italiano1. Sulla base di un progetto sostenuto da Anffas nazionale e finanziato dal Ministero della Solidarietà Sociale, si è organizzato un lavoro, svoltosi in un arco temporale di circa un anno, attraverso i seguenti passaggi operativi: 1. traduzione italiana e adattamento della SIS; 2. individuazione e stratificazione del campione normativo; 3. formazione iniziale dei raters; 4. analisi dei dati e creazione di tavole normative; 5. procedure di verifica dell’affidabilità e della validità dei dati raccolti.

Metodo Nelle pagine seguenti vengono descritte le procedure usate per la standardizzazione della Supports Intensity Scale (SIS). In particolare ci si soffermerà sulle caratteristiche del campione coinvolto e sulle modalità di selezione dello stesso, sui dati normativi ottenuti, sulla validità e affidabilità dello strumento. La standardizzazione italiana ha seguito le procedure adottate nel corso dell’originale taratura americana. Tuttavia, sono stati introdotti alcuni accorgimenti atti a migliorare l’attendibilità dei dati.

Il campione (1). Modalità di reclutamento e formazione dei valutatori Nel reclutamento del campione sono stati coinvolti i Servizi collegati ad ANFFAS sul territorio nazionale, i quali si sono prestati a effettuare la somministrazione della SIS agli utenti inseriti. Al fine di uniformare e razionalizzare le operazioni di somministrazione e rilevazione dei dati, gli operatori incaricati dai vari Servizi sono stati formati attraverso un modello di training di 2 giorni condiviso e certificato dall’AAIDD, ripetuto in tre eventi su scala nazionale. Inoltre è stato garantito un servizio di tutoring online su apposito portale Web condotto dai curatori, i quali hanno risposto alle domande e alle problematiche che gli operatori hanno incontrato nella somministrazione.

Il campione (2). Variabili di stratificazione Come anticipato nella premessa, la standardizzazione italiana delle SIS è stata effettuata attraverso la loro somministrazione a un campione di 1052 persone con disabilità intellettiva di varia gravità. Si ricorda che il campione originario americano è costituito da 1306 sog-

1

Il progetto “Introduzione nel Sistema Italiano del 10° Sistema di Diagnosi, Classificazione e Definizione dei Sostegni alle Persone con Disabilità Intellettive dell’American Association on Intellectual and Developmental Disabilities (AAIDD/AAMR - 2002)”, promosso da Anffas Onlus, è stato finanziato da Ministero della Solidarietà Sociale in base alla Legge 383/2000 – Bando 2005.

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

23


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

getti, distribuiti in 33 stati. Considerata la differente numerosità di popolazione dei due paesi, possiamo evidenziare l’estrema adeguatezza del campione italiano, che garantisce una solida robustezza metodologica dei dati raccolti e delle norme create. La stratificazione del campione in base a una serie di variabili sociodemografiche è risultata sufficientemente bilanciata. Per quanto riguarda la distribuzione geografica, 717 (68,1%) soggetti provengono da regioni del Nord, 168 (16%) dal Centro e 167 (15,9%) dal Sud. Per quanto riguarda il sesso, il campione normativo risulta sostanzialmente equilibrato: 591 (56,2%) maschi e 461 (43,8%) femmine. L’età cronologica mostra un andamento che si approssima fortemente alla normalità, come mostrato nel grafico seguente:

Numero di soggetti

24

DS = 14,20 Media = 42,3 N = 1052,00

Età

Come si può notare, l’età media del campione è pari a 42,3 anni (DS = 14,20), con un range compreso tra 16 e 81 anni. Considerando le 7 fasce d’età previste nella taratura americana, la distribuzione del campione risulta essere la seguente:

Tabella 1. Distribuzione per fasce d’età del campione normativo Fasce d’età

Numero di soggetti

Percentuale %

16 – 19

50

4,8

20 – 29

158

15,0

30 – 39

246

23,4

40 – 49

273

26,0

50 – 59

189

18,0

60 - 69

106

10,1

70 e oltre Totale

30

2,9

1052

100,0

Un andamento peculiare si osserva con riferimento alla stratificazione del campione in base al livello di ritardo intellettivo. Infatti, si registra una prevalenza delle fasce ‘moderato’ e ‘grave’, come mostrato nella tabella 2:


Tabella 2. Distribuzione per livello di disabilità intellettiva del campione normativo Livelli di disabilità intellettiva

Numero di soggetti

Percentuale %

Lieve

164

15,6

Moderato

331

31,5

Grave

345

32,8

Gravissimo

212

20,2

1052

100,0

Totale

Evidentemente, la difformità di questa distribuzione rispetto all’incidenza delle varie fasce di disabilità intellettiva nella popolazione generale è riconducibile alla tipologia di strutture e di servizi riabilitativi coinvolti. Dati di particolare interesse, soprattutto con riferimento al campione americano, sono desunti dalle restanti variabili di stratificazione. Infatti, nella standardizzazione dei dati si è ritenuto opportuno considerare anche la tipologia residenziale, considerato lo stretto collegamento che essa può avere con il livello di sostegni necessari alla persona. In specifico, sono state individuate 5 categorie: 1) La persona vive con i genitori, 2) La persona vive con altri parenti, 3) La persona vive in una struttura residenziale piccola (max 7 ospiti), 4) La persona vive in una struttura residenziale media (da 8 a 15 ospiti), 5) La persona vive in una struttura residenziale grande (con più di 15 ospiti). È stato possibile raccogliere questa informazione per 981 soggetti del campione normativo, mentre in 71 casi il dato è risultato mancante. La distribuzione finale è la seguente: Tabella 3. Distribuzione per tipologia di residenza del campione normativo Tipologia di residenza Con i genitori

Numero di soggetti

Percentuale %

416

42,4

Con altri parenti

55

5,6

Piccola struttura residenziale

50

5,1

Media struttura residenziale

80

8,2

Grande struttura residenziale

380

38,7

Totale

981

100,0

Dall’analisi della tabella si può facilmente evincere come la casa dei genitori e le grandi strutture residenziali rappresentino le condizioni abitative nettamente più frequenti, mentre rimangono ancora limitate le esperienze comunitarie più piccole, diversamente da altre realtà nazionali, come appunto quella americana, in cui si assiste a una maggiore articolazione e diffusione di tipologie residenziali medio-piccole, volte a incrementare l’autonomia delle persone con disabilità. Anche la condizione lavorativa è stata considerata una variabile significativa ai fini della composizione del campione. In questo caso, sono state individuate 4 categorie: 1) La persona frequenta la scuola o un centro di formazione professionale, 2) La persona frequenta un servizio diurno o residenziale senza impegno lavorativo, 3) La persona è inserita nel lavoro in un contesto protetto, 4) La persona è inserita nel lavoro in un contesto non protetto. Sono stati raccolti i dati sulla condizione occupazionale di 828 soggetti del campione normativo:

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

25


26

Tabella 4. Distribuzione per condizione occupazionale del campione normativo Occupazione

Numero di soggetti

Scuola o formazione professionale Servizio diurno o residenziale Lavoro protetto Lavoro non protetto Totale

Percentuale %

36

4,3

762

92,0

22

2,7

8

1,0

828

100,0

La stragrande maggioranza dei soggetti del campione normativo non risulta coinvolta in alcuna attività lavorativa (protetta o non). Si tratta chiaramente di un dato che deve essere connesso anche alla prevalenza di condizioni di disabilità intellettiva moderata e grave prima descritta. Tuttavia, segnala una volta ancora la necessità di promuovere maggiormente l’integrazione sociolavorativa, che risulta ancora limitata rispetto alle esperienze di inserimento scolastico. Passando a variabili individuali, come il funzionamento cognitivo e l’adattamento alla’mabiente, è stato possibile ottenere informazioni attendibili relative al quoziente intellettivo solamente per 136 soggetti del campione. Nella quasi totalità dei casi erano state utilizzate le scale Wechsler e in maniera significativamente ridotta altri strumenti (come ad esempio le Stanford Binet). La distribuzione presenta, come prevedibile, una forte asimmetria sinistra:

Numero di soggetti

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

DS = 16,80 Media = 39,8 N = 136,00

Quoziente intellettivo

Il punteggio medio è pari a un QI di 39,8 (DS = 16,80) al limite tra disabilità intellettiva moderata e grave. Il punteggio più elevato è stato pari a 82 (indice di un funzionamento intellettivo nella bassa norma). In altre parole, i pochi dati disponibili sul QI confermano quanto emerso dall’analisi dei livelli di disabilità intellettiva. Infine, per quanto attiene all’adattamento ambientale, va precisato che la valutazione standardizzata del comportamento adattivo è relativamente inusuale nel nostro paese. Anche in questo caso, infatti, è stato possibile risalire a un punteggio standard di adattamento solamente in 134 casi (il 12,7% del campione globale). Tuttavia, l’eterogeneità degli strumenti impiegati (prevalentemente


la scala Vineland) e le differenze nella siglatura dei punteggi (categoriale vs. numericodimensionale) rende particolarmente difficile qualsiasi rappresentazione e interpretazione dei dati. L’ultima variabile demografica riguarda la presenza di eventuali diagnosi aggiuntive relative a disabilità sensomotorie o a sindromi psichiatriche. Sono state individuate 7 categorie: 1) Disturbi psichiatrici, 2) Autismo, 3) Deficit motori, 4) Cecità, 5) Sordità, 6) Disabilità multiple, 7) Altro. I dati, raccolti su 694 soggetti, confermano l’alta incidenza di disturbi psicopatologici nelle persone con disabilità intellettiva, nonché l’elevata ricorrenza di casi di plurihandicap: Tabella 5. Distribuzione per doppia diagnosi del campione normativo Disturbi

Numero di soggetti

Percentuale %

148

21,3

Disturbi psichiatrici Autismo Deficit motori

51

7,3

113

16,3

8

1,2

Cecità Sordità Disabilità multiple

4

0,6

148

21,3

Altro

222

32,0

Totale

694

100,0

Analisi dei dati (1). Procedure di standardizzazione I punteggi normativi, così come previsto nella versione americana originale, si riferiscono alle sei subscale della SEZIONE 1. SCALA DEI SOSTEGNI NECESSARI (tra parentesi è indicato il numero di items di ciascuna subscala e il range di punteggio grezzo): 1. Attività relative alla vita nell’ambiente domestico (8, 0-92). 2. Attività relative alla vita nella comunità (8, 0-91). 3. Attività di apprendimento nel corso della vita (9, 0-104). 4. Attività relative all’occupazione (8, 0-87). 5. Attività relative alla salute e alla sicurezza (8, 0-94). 6. Attività sociali (8, 0-93). In riferimento al punteggio grezzo totale di ogni subscala sono stati calcolati i punti standard su una scala con media 10 e deviazione standard 3. Questa opzione, ripresa direttamente dalla standardizzazione americana, presenta alcuni vantaggi: in primo luogo, permette di ovviare al differente numero di items e alle diverse scale di alternative di risposta (Likert a 2, 3 o 4 livelli) di ogni subscala. In secondo luogo, consente di ottenere una distribuzione caratterizzata dagli stessi parametri dei principali strumenti utilizzati nella diagnostica riferita alle persone con disabilità intellettiva: dalle scale di intelligenza di Wechsler (1997) all’AAMR Adaptive Behavior Scale (Nihira, Leland & Lambert, 1993). Infine, questa trasformazione, normalizzando la distribuzione dei dati, ha permesso un calcolo dei percentili con andamento assimilabile alla curva gaussiana.

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

27


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

28

Tabella 6. Tabella normativa per convertire i punteggi grezzi delle subscale in punteggi standard e percentili Subscala dei punteggi grezzi Punteggi standard

A. Vita nell’ambiente domestico

B. Vita nella comunità

C. Apprendimento nel corso della vita

D. Occupazione

E. Salute e sicurezza

F. Sociale

Ranghi percentili

20

> 99

19

> 99

18

> 99

17

99

16

> 85

> 88

104

15

80–85

83–88

97–103

82–87

84–90

95

14

74–79

76–81

90–96

> 82

76–81

77–83

91

13

68–73

70–75

84–89

76–82

70–75

70–76

84

12

62–67

64–69

77–83

70–75

64–69

63–69

75

11

55–61

58–63

71–76

64–69

58–63

56–62

63

10

49–54

51–57

64–70

58–63

52–57

49–55

50

9

43–48

45–50

57–63

51–57

45–51

42–48

37

8

37–42

39–44

51–56

45–50

39–44

35–41

25

7

31–36

33–38

44–50

39–44

33–38

28–34

16

6

24–30

26–32

37–43

32–38

27–32

20–27

9

5

18–23

20–25

31–36

26–31

21–26

13–19

5

4

12–17

14–19

24–30

20–25

15–20

6–12

2

3

6–11

8–13

18–23

14–19

9–14

<6

1

2

<6

1–7

11–17

7–13

3–8

<1

0

4–8

2

<3

<1

<4

<2

1 0

> 87

> 90

98

<1

Nota per l’utilizzo della tabella. Dopo aver calcolato i totali grezzi relativi a ciascuna delle sei subscale, individuare nelle sei colonne centrali la fascia di punteggio corrispondente. Quindi, spostarsi orizzontalmente fino alla prima colonna di sinistra, per convertire i punteggi grezzi in punteggi standard. Spostarsi infine orizzontalmente fino all’ultima colonna a destra, per individuare il rango percentile.

Nella standardizzazione dei punteggi delle sei subscale, è stata considerata la possibilità di costruire tavole di conversione differenziate per le principali variabili di stratificazione del campione e, precisamente, per l’età e il livello di disabilità intellettiva. Infatti, è stata condotta un’analisi multivariata (MANOVA), che ha evidenziato la significatività statistica del fattore ‘età’ [Lambda di Wilks = 0,912, F(36, 4477,503) = 2,639, p < 0,001], del fattore ‘livello di disabilità intellettiva’ [Lambda di Wilks = 0,726, F(18, 2882,653) = 19,160, p < 0,001] e dell’interazione ‘età x livello di disabilità intellettiva’ [Lambda di Wilks = 0,854, F(108, 5847,128) = 1,515, p < 0,01]. Tuttavia, almeno in fase di prima standardizzazione, si è ritenuto opportuno compiere un’analisi sul campione globale in virtù di alcune riflessioni: 1. è stato deciso di seguire l’impostazione adottata nella taratura originale, in modo tale da garantire una maggiore omogeneità, soprattutto in vista di possibili ricerche comparative a livello internazionale; 2. l’analisi post-hoc tramite Tukey Test (si veda Appendice 2) evidenzia, soprattutto nel caso del fattore ‘età’, una serie di confronti significativi sparsi, impedendo l’individuazione di un trend preciso e stabile;


3. inoltre, la numerosità del campione relativa ad alcune fasce d’età risulterebbe esigua, minando quindi l’affidabilità dei dati normativi nel caso di tavole normative differenziate; 4. infine, nel caso del fattore ‘livello di disabilità intellettiva’, la costruzione di tavole di punteggi standard differenziati per livello di deficit intellettivo potrebbe porre problemi decisionali e arbitrarietà interpretative sul versante di differenti siglatori, in assenza soprattutto di un corrispettivo numerico preciso rappresentato da QI del soggetto valutato.

Tabella 7. Tabella normativa per convertire le somme dei punteggi standard in punteggio standard composito A.Totale (somma) dei punteggi standard delle subscale di attività

B. Indice dei bisogni di sostegno (punteggio standard composito)

C. Rango percentile

A.Totale (somma) dei punteggi standard delle subscale di attività

B. Indice dei bisogni di sostegno (punteggio standard composito)

C. Rango percentile

A.Totale (somma) dei punteggi standard delle subscale di attività

B. Indice dei bisogni di sostegno (punteggio standard composito)

C. Rango percentile

95

131

94

131

>99

67

106

>99

66

105

61

39

81

13

58

38

80

93

130

>99

65

12

104

55

37

79

92

129

>99

10

64

104

55

36

78

91

128

9

99

63

103

53

35

77

90

8

127

99

62

102

52

34

77

8

89

126

99

61

101

51

33

76

8

88

125

98

60

100

50

32

75

7

87

125

98

59

99

47

31

74

6

86

124

98

58

98

45

30

73

6

85

123

97

57

97

39

29

72

5

84

122

96

56

96

37

28

71

4

83

121

94

55

95

35

27

70

3

82

120

92

54

95

35

26

69

3

81

119

90

53

94

33

25

68

2

80

118

88

52

93

31

24

68

2

79

117

87

51

92

30

23

67

2

78

116

85

50

91

28

22

66

2

77

115

84

49

90

26

21

65

1

76

114

82

48

89

25

20

64

1

75

113

80

47

88

23

19

63

1

74

113

80

46

87

22

18

62

<1

73

112

77

45

87

22

17

62

<1

72

111

74

44

86

20

16

61

<1

71

110

71

43

85

19

15

60

<1

70

109

68

42

84

17

14

59

<1

69

108

66

41

83

16

13

58

<1

68

108

66

40

82

14

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

29

Nota per l’utilizzo della tabella. Dopo aver sommato i punteggi standard relativi alle sei subscale della Sezione 1, individuare il totale corrispondente nella colonna A. Quindi, spostarsi orizzontalmente nella colonna B per ottenere il punteggio standard composito, ovvero l’indice dei bisogni di sostegno e infine nella colonna C per il rango percentile.


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

Oltre al punteggio standard e ai ranghi percentili riferiti a ogni singola subscala, è possibile anche calcolare il punteggio standard totale (complessivo delle sei subscale) espresso in una scala con media 100 e deviazione standard 15. Le motivazioni di tale opzione sono le medesime discusse a proposito delle sei subscale. La tabella di conversione (tabella 9) permette di risalire dalla somma dei punteggi delle 6 subscale al punteggio totale standard e al relativo rango percentile. Anche in questo caso è stata compiuta una riflessione sull’opportunità di tavole di conversione differenziate. Infatti, un’Anova univariata ha evidenziato anche sul punteggio totale la significatività del fattore ‘età’ [F(6) = 2,824, p < 0,01] e del fattore ‘livello di disabilità intellettiva’ [F(3) = 97,995, p < 0,001]. In questo caso l’interazione perde di significatività statistica [F(18) = 0,963, p > 0,05]. Tuttavia, per i motivi precedentemente espressi, si è deciso di compiere anche questa standardizzazione sul campione nella sua globalità. In conclusione di questa sezione dedicata alla standardizzazione dei dati, può essere interessante effettuare un confronto tra la taratura americana e quella italiana. In particolare, in quest’ultima si riscontra una maggiore concentrazione dei dati verso la media, come illustrato nella figura seguente:

30

Indice dei bisogni di sostegno: taratura americana e italiana a confronto (punteggio standard composito) 143 131

Campione normativo italiano

Campione normativo americano

58 38

Queste differenze richiederanno ulteriori indagini e approfondimenti, anche in vista di possibili confronti internazionali. Al momento, è possibile avanzare alcune ipotesi: 1. in primo luogo, è probabile una maggiore omogeneità (a livello normativo, operativo, ecc.) sul territorio italiano, pur con le evidenti differenziazioni regionali, rispetto ai diversi stati nord-americani; 2. in secondo luogo, la formazione iniziale dei valutatori italiani potrebbe aver determinato una maggiore coerenza inter-rater nell’utilizzo delle SIS; 3. infine, è anche possibile che i valutatori americani, più abituati all’impiego di strumenti di tal genere, abbiamo fornito delle valutazioni più articolate e precise, producendo quindi una maggiore dispersione dei punteggi intorno ai valori medi.


Analisi dei dati (2). Procedure per la verifica dell’attendibilità e della validità Sulle 6 subscale standardizzate, sono state condotte alcune verifiche di affidabilità e di validità dei dati raccolti. Nella presente taratura italiana delle SIS, sono stati calcolati i seguenti indici di affidabilità: 1) consistenza interna; 2) errore standard di misura. In primo luogo, è stata verificata l’eventuale normalità della distribuzione dei totali grezzi relativi alle sei subscale della Sezione 1. La tabella 8 riporta i dati:

Tabella 8. Dati relativi ai punteggi grezzi totali delle sei subscale della Sezione 1 (n = 1052) Vita nell’ambiente domestico

Vita nella comunità

Media

51,80

53,99

66,73

60,26

54,15

51,86

DS

18,63

18,71

19,86

18,89

18,45

21,28

Skewness

-0,391

-0,749

-0,353

-0,648

-0,220

-0,359

Kurtosis

-0,675

0,209

-0,118

-0,104

-0,570

-0,608

Min

0

0

3

0

0

0

Max

92

91

104

87

94

93

Apprendimento nel corso della vita

Occupazione

Salute e sicurezza

Sociale

Tabella 9. Consistenza interna delle subscale per fasce d’età Vita nell’ambiente domestico

Vita nella comunità

Apprendimento nel corso della vita

Occupazione

Salute e sicurezza

Sociale

Totale

Fascia d‘età 16 – 19 (N = 50) Correlazione inter-item

0,45

0,34

0,35

0,31

0,38

0,39

0,31

Alfa

0,95

0,92

0,93

0,92

0,94

0,94

0,99

Correlazione inter-item

0,55

0,57

0,54

0,53

0,51

0,63

0,50

Alfa

0,97

0,97

0,97

0,96

0,96

0,98

0,99

Fascia d‘età 20 – 29 (N = 158)

Fascia d‘età 30 – 39 (N = 246) Correlazione inter-item

0,52

0,51

0,47

0,45

0,47

0,54

0,44

Alfa

0,96

0,96

0,96

0,95

0,95

0,97

0,99

Fascia d‘età 40 – 49 (N = 273) Correlazione inter-item

0,49

0,57

0,52

0,53

0,46

0,56

0,46

Alfa

0,96

0,97

0,97

0,96

0,95

0,97

0,99

Fascia d‘età 50 – 59 (N = 189) Correlazione inter-item

0,46

0,54

0,46

0,55

0,46

0,52

0,43

Alfa

0,95

0,97

0,96

0,97

0,95

0,96

0,99

Fascia d‘età 60 – 69 (N = 106) Correlazione inter-item

0,56

0,60

0,54

0,60

0,48

0,59

0,50

Alfa

0,97

0,97

0,97

0,97

0,95

0,97

0,99

Fascia d‘età 70 e oltre (N = 30) Correlazione inter-item

0,36

0,49

0,38

0,44

0,33

0,38

0,35

Alfa

0,93

0,96

0,94

0,95

0,92

0,94

0,99

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

31


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

32

I dati più rilevanti in questa fase riguardano la verifica della normalità della distribuzione di queste sei variabili. Come può essere dedotto dalla lettura dei dati di skewness e kurtosis, le distribuzioni delle sei variabili assumono un andamento che si discosta dalla normalità. Per evidenziare la coerenza interna, è stata calcolata l’alfa di Cronbach. Il calcolo è stato riferito a tutti i gruppi differenziati per età sulle diverse scale e sul punteggio totale. Da sottolineare, a questo proposito, che Nunnaly (1978) ritiene significativi i coefficienti di attendibilità superiori a ,70. I dati sono riportati in tabella 9. Dalla lettura della tabella si possono facilmente derivare dei coefficienti di correlazione tra items e dei coeficienti alfa particolarmente elevati per tutte le scale e per ciascuna fascia d’età. Si tratta evidentemente di uno strumento dotato di notevole consistenza interna. Alcuni studiosi ritengono addirittura problematici dei coefficienti alfa superiori a ,90 in quanto segnalerebbero una eccessiva omogeneità tra items e, quindi, il fatto che alcuni di essi risulterebbero ridondanti. Tuttavia, esula dagli obiettivi di questo report un’analisi dettagliata di tali aspetti, incidenti sulla struttura delle SIS, che invece rimangono inalterate rispetto alla taratura americana. È stato inoltre determinato l’errore standard di misura (ESM) per tutti i livelli di età, in modo da consentire all’operatore che utilizzerà le scale SIS di valutare con più sicurezza i punteggi ottenuti dai propri soggetti. La tabella 10 riporta, per ogni fascia d’età, l’errore standard di misura.

Tabella 10. Errore standard di misura per le sei subscale della Sezione 1 Vita nell’ambiente domestico

Vita nella comunità

Apprendimento nel corso della vita

Occupazione

Salute e sicurezza

Sociale

16 – 19

2,53

2,00

2,28

1,78

2,46

2,50

20 – 29

1,56

1,56

1,73

1,58

1,59

1,93

30 – 39

1,21

1,15

1,21

1,10

1,20

1,33

40 – 49

1,08

1,13

1,21

1,10

1,10

1,27

50 – 59

1,25

1,30

1,35

1,38

1,26

1,43

60 – 69

1,99

1,95

2,00

2,07

1,75

2,06

70 e oltre

2,58

3,19

3,36

3,11

2,95

3,00

Fasce d’età

Come si può notare, l’errore di misura tende ad essere maggiormente elevato nelle fasce d’età più estreme, laddove il campione normativo si riduce numericamente. In base a questi valori dell’errore, l’operatore può facilmente calcolare l’intervallo di fiducia del punteggio del proprio soggetto. Se, ad esempio, un soggetto di 45 anni avesse ottenuto un punteggio sulla scala ‘Vita domestica’ di 40, l’area nella quale cade il suo punteggio vero (liberato dall’errore standard di misura) con una probabilità del 95% sarebbe compresa fra 37,88 e 42,12, come risulta dallo sviluppo della formula di seguito riportato: 37,88 Punteggio vero = 40 + 1.96 x 1,08 = 42,12


Passiamo all’analisi della validità dello strumento. In considerazione del fatto che le SIS sono già state oggetto di valutazione della validità di contenuto e della validità convergente nella versione originale e che non sono state apportate modifiche agli item dello strumento, non risulta necessario ripetere un controllo di questi tipi di validità. Viceversa, a livello di validità di costrutto, si ritiene necessario approfondire soprattutto il rapporto tra punteggi alla SIS e alcune variabili di stratificazione. La standardizzazione americana delle scale SIS, con particolare riguardo all’analisi di validità di costrutto, ha richiamato in specifico il rapporto ipotizzato tra punteggi ottenuti alle scale, e quindi i livelli di sostegni necessari, e due variabili di stratificazione: il livello di disabilità intellettiva e l’età cronologica dei soggetti valutati. Per quanto riguarda la prima variabile, si ritiene che all’aumentare del grado di compromissione cognitiva debbano parimenti crescere i bisogni di sostegni. Diversa invece la previsione sul rapporto tra punteggi SIS ed età. Riprendendo fedelmente dal manuale americano: “… dal momento che i bisogni di sostegno degli adulti con ritardo mentale non varierebbero in maniera significativa in base all’età, le prestazioni alla SIS non dovrebbero essere strettamente correlate all’età cronologica…” (p. 114). In modo ancor più analitico, vengono riportati i confronti al post-hoc, che risultano tutti non significativi (>0,01). Anche i coefficienti di correlazione si dimostrano bassi (con un range tra –0,11 e 0,01) per le sei scale. Questi dati vengono pertanto assunti come sostegno alla validità di costrutto delle subscale SIS. Le analisi condotte nel processo di standardizzazione italiana delle SIS forniscono al riguardo una fotografia parzialmente diversa. Per quanto riguarda il livello di disabilità intellettiva, viene confermata la correlazione positiva tra deficit intellettivo e bisogno di sostegni, come evidenziato nella tabella seguente: Tabella 11. Punteggi medi standard stratificati per livello di disabilità intellettiva Vita nell’ambiente domestico

Vita nella comunità

Apprendimento nel corso della vita

Occupazione

Salute e sicurezza

Sociale

Totale

RM Lieve (DS)

6,93 (2,52)

6,82 (2,92)

6,84 (2,58)

7,32 (2,71)

6,95 (2,35)

7,13 (2,47)

83,86 (12,02)

RM Moderato (DS)

8,59 (2,45)

9,02 (2,81)

8,92 (2,57)

8,93 (3,03)

8,76 (2,57)

8,83 (2,76)

93,77 (13,02)

RM Grave (DS)

10,97 (2,18)

10,88 (1,99)

10,85 (2,18)

10,85 (2,14)

10,80 (2,21)

10,81 (2,20)

104,64 (10,34)

RM Gravissimo (DS)

12,99 (1,32)

12,55 (1,50)

12,74 (1,79)

12,35 (1,79)

12,98 (1,62)

12,74 (1,77)

114,67 (7,39)

Le differenze tra medie sono risultate altamente significative su tutte le scale: Subscale

F

Livello di probabilità

Vita nell’ambiente domestico

F(3, 1051) = 308,076

p < 0,01

Vita nella comunità

F(3, 1051) = 216,732

p < 0,01

Apprendimento nel corso della vita

F(3, 1051) = 242,669

p < 0,01

Occupazione

F(3, 1051) = 160,071

p < 0,01

Salute e sicurezza

F(3, 1051) = 271,247

p < 0,01

Sociale

F(3, 1051) = 217,088

p < 0,01

Totale

F(3, 1051) = 296,814

p < 0,01

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

33


All’aumentare del livello di disabilità intellettiva, crescono in maniera significativa i punteggi alle 6 subscale e al punteggio totale. L’andamento risulta evidente anche nel grafico seguente, nel quale vengono riportati i punteggi totali relativi ai due percentili estremi (93° e 97°): Confronto percentili per livello di disabilità intellettiva

Totale dei punteggi standard

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

34

Lieve

Moderata

Grave

Gravissima

Se i dati relativi alla correlazione tra livello di disabilità intellettiva e punteggi SIS confermano quanto previsto dalla taratura americana a proposito della validità di costrutto, è differente il quadro relativamente all’età. Infatti, con riferimento al campione globale (N = 1052), si registrano differenze statisticamente significative (<0,01) su tutte le scale per le 7 fasce d’età considerate, come risulta dalla tabella seguente: Tabella 12. Punteggi medi standard stratificati per fasce d’età Vita nell’ambiente domestico 16 – 19 (DS)

20 – 29 (DS)

30 – 39 (DS)

40 – 49 (DS)

50 – 59 (DS)

60 – 69 (DS)

70 e oltre (DS)

Vita nella comunità

Apprendimento nel corso della vita

Occupazione

Salute e sicurezza

Sociale

Totale

11,19

11,45

11,24

11,78

10,78

11,56

107,18

(2,88)

(2,26)

(2,44)

(2,00)

(2,83)

(2,49)

(12,00)

10,26

10,04

10,04

10,06

10,19

9,95

100,48

(3,17)

(3,14)

(3,28)

(3,16)

(3,24)

(3,42)

(16,33)

10,16

10,30

10,20

10,24

10,21

10,20

101,17

(3,06)

(2,89)

(2,88)

(2,75)

(3,05)

(2,95)

(14,65)

10,02

10,18

10,21

10,27

10,16

10,14

100,87

(2,88)

(2,98)

(3,03)

(2,88)

(2,96)

(2,96)

(14,73)

9,78

9,74

9,76

9,71

9,77

9,73

98,65

(2,77)

(2,87)

(2,80)

(3,02)

(2,81)

(2,78)

(14,05)

9,04

8,69

8,89

8,49

8,99

9,06

93,87

(3,30)

(3,22)

(3,11)

(3,38)

(2,92)

(2,99)

(15,90)

9,91

9,63

9,66

9,44

9,57

9,75

98,17

(2,27)

(2,80)

(2,78)

(2,71)

(2,63)

(2,32)

(12,73)


L’analisi della varianza evidenzia differenze significative su tutte le scale: Subscale

F

Livello di probabilità

Vita nell’ambiente domestico

F(6, 1051) = 3,679

p < 0,01

Vita nella comunità

F(6, 1051) = 6,377

p < 0,01

Apprendimento nel corso della vita

F(6, 1051) = 4,622

p < 0,01

Occupazione

F(6, 1051) = 8,887

p < 0,01

Salute e sicurezza

F(6, 1051) = 3,298

p < 0,01

Sociale

F(6, 1051) = 4,688

p < 0,01

Totale

F(6, 1051) = 5,776

p < 0,01

Il dato dell’influenza del fattore ‘età’ sui punteggi delle sei subscale e della scala globale viene ancor più confermato dai coefficienti di correlazione: Subscale Vita nell’ambiente domestico × età

Correlazione

Livello di probabilità

r = –0,085

p < 0,01

Vita nella comunità × età

r = –0,101

p < 0,01

Apprendimento nel corso della vita × età

r = –0,087

p < 0,01

Occupazione × età

r = –0,110

p < 0,01

Salute e sicurezza × età

r = –0,084

p < 0,01

Sociale × età

r = –0,087

p < 0,01

Totale × età

r = –0,096

p < 0,01

Si tratta di dati ampiamente discordanti rispetto alla taratura americana e, soprattutto, rispetto agli assunti della validità di costrutto. Ovviamente, nell’analisi e nell’interpretazione di questi dati è necessario considerare le peculiarità della realtà italiana, che emergono immediatamente dal confronto delle variabili descrittive dei due campioni. Ad esempio, nel contesto italiano vi è una sovrarappresentazione di condizioni abitative caratterizzate da ampie strutture assistenziali. Diversa, la situazione americana, maggiormente segnata da piccole strutture residenziali (case famiglia, ecc.). Anche le variabili occupazionali segnano delle divergenze particolarmente rilevanti. Questi dati demografici possono sicuramente aiutare nel comprendere alcune peculiarità dei dati di standardizzazione italiana. Tuttavia, dalla lettura dei coefficienti di correlazione, emerge un dato apparentemente paradossale. Infatti i coefficienti appaiono negativi, indicando una riduzione dei bisogni di sostegno all’aumentare dell’età cronologica. Si tratta chiaramente di un dato che richiede approfondimenti. Da un punto di vista intuitivo, infatti, all’aumentare dell’età dovremmo attenderci un incremento dei bisogni di sostegni. Come spiegare allora il dato riportato? Una variabile che può aver inciso, e che ovviamente non è possibile controllare in fase di analisi dei dati, riguarda le aspettative dei raters. In altre parole, il contesto riabilitativo italiano è ancora poco familiare con i concetti e, soprattutto, con le prassi riabilitative basate sul costrutto di Qualità della Vita. Di conseguenza, ciò che spesso di verifica negli operatori è uno ‘slittamento degli standard’ e una conseguente riduzione delle aspettative. In altre parole, di fronte alla persona anziana con disabilità intellettiva, a causa dei suoi deficit cognitivi e comportamentali, si abbassano le aspettative relative alla sua integrazione sociale e alla sua vita autonoma. Per-

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

35


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

tanto, anche ridotti livelli in queste dimensioni vengono considerati accettabili. Di qui allora il dato paradossale, per cui tali persone sembrerebbero meno bisognose di sostegni rispetto ai giovani. In realtà, il minor bisogno di sostegno è una riduzione nelle attese di vita autonoma nei loro confronti. Questa riflessione, ovviamente, permette di fornire un quadro logico all’interno del quale interpretare i dati di correlazione tra età e scale SIS, la cui non significatività è invece assunta dal manuale americano come prova di validità di costrutto. Tuttavia, al di là di tali ipotesi interpretative (che allo stato attuale dei dati devono rimanere a uno stato puramente congetturale), è possibile procedere a un’analisi maggiormente approfondita dei dati raccolti, attraverso la pulitura di alcune variabili di disturbo. Le analisi fin qui condotte hanno evidenziato un rapporto inverso tra età e punteggi alle scale SIS. Tuttavia, soprattutto quando si analizzano scale per fini diagnostici/riabilitativi e non meramente epidemiologici, può essere interessante verificare il loro andamento non solamente con i valori medi, ma anche e soprattutto con le fasce estreme. Tipicamente, i punteggi estremi,o patologici, sono considerati quelli che cadono oltre il 93° o il 97° percentile. Nel caso delle fasce d’età, i punteggi totali standard relativi ai due percentili sono riportati nel grafico seguente:

36

Totale dei punteggi standard

Confronto percentili per fasce d’età

16-19

20-29

30-39

40-49

50-59

60-69

70 e oltre

Si può notare come i punteggi indice di un livello estremo di sostegni presentino un andamento maggiormente regolare, seppure si verifichi sempre una leggera flessione nelle fasce d’età superiori. Precedentemente, si è rilevata la correlazione delle scale SIS non solo con l’età, ma anche con le altre variabili sociodemografiche, come ad esempio il livello di ritardo mentale. Ovviamente, allora, nell’analisi della possibile correlazione tra età e punteggi SIS, è necessario escludere l’influenza della variabile ‘ritardo mentale’, che potrebbe mascherare ovvero esasperare alcune correlazioni. In particolare, si potrebbe avanzare la seguente ipotesi: è possibile che le età più avanzate siano caratterizzate da livelli di ritardo mentale meno compromessi, in base a un meccanismo di selezione dei casi più gravi? In questo caso, allora, la correlazione inversa tra età e punteggi SIS potrebbe in realtà essere mediata da livelli intellettivi significativamente diversi nelle varie fasce d’età. Tuttavia, le analisi condotte permet-


tono di escludere questa distribuzione significativamente disomogenea del ritardo mentale nella varie fasce d’età, come emerge dal test di Kruskal Wallis [χ2(6) = 8.031, p>0,05]. Un aspetto rilevante, ai fini della correlazione tra l’età e i punteggi alle SIS, è rappresentato dal fatto che le varie fasce d’età pesano in maniera significativamente diversa. Come si può notare chiaramente dalla tabella 3, le fasce più estreme risultano sottodimensionate. Pertanto, ai fini del calcolo della suddetta correlazione, si è deciso di bilanciare le varie fasce d’età. Poiché quella meno numerosa (7 = 70 e oltre) è costituita da 30 soggetti, sono stati selezionati in maniera randomizzata 30 soggetti per ciascuna fascia, arrivando così a un sottocampione di 210 unità, le cui descrittive sono riportate nelle tabelle seguenti: Tabella 13. Descrittive del campione ristretto Numero dei soggetti

Percentuale %

147

70,0

Area geografica Nord Centro

16

7,6

Sud e isole

47

22,4

Genere Maschi

109

51,9

Femmine

101

48,1

Livello di disabilità intellettiva Lieve

23

11,0

Moderato

72

34,3

Grave

74

35,2

Gravissimo

41

19,5

Ancora una volta, su tale campione ristretto, sono stati calcolati i coefficienti di correlazione di Kendall per ciascuna delle 6 subscale e per il punteggio totale:

Subscale

Correlazione

Livello di probabilità

Vita nell’ambiente domestico

0,070

p > 0,05

Vita nella comunità

–0,028

p > 0,05

Apprendimento nel corso della vita

0,012

p > 0,05

Occupazione

–0,035

p > 0,05

Salute e sicurezza

0,025

p > 0,05

Sociale

0,005

p > 0,05

Totale

0,013

p > 0,05

Come si può facilmente evincere dalla lettura della tabella, i coefficienti risultano non significativi, come richiesto dall’impostazione di validità di costrutto della standardizzazione americana.

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

La SIS nel panorama riabilitativo italiano

37


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Cottini et al.

38

Discussione La standardizzazione italiana della SIS ha evidenziato la robustezza metodologica dello strumento. Infatti, i coefficienti di omegeneità degli item, particolarmente elevati, e i ridotti ESM per ogni subscala evidenziano come l’operatore possa utilizzare lo strumento con adeguata affidabilità, sapendo che eventuali fonti di bias incideranno in maniera estremamente ridotta. Si tratta di conclusioni rassicuranti, soprattutto per chi opera nel campo della progettazione di servizi alla persona, laddove è necessario disporre di musire precise, scevre da fonti spurie di distorsione. Ancor di più questo si rivela decisivo nella programmazione di politiche e di servizi alle persone disabilità, laddove le decisione prese a livello progettuale possono incidere pesantemente sul benessere emozionale e sociale dell’individuo. Partendo da tali premesse, la standardizzazione italiana apre la strada a ulteriori indagini, che analizzino più da vicino per esempio il rapporto tra i bisogni di sostegno e le variabili sociodemografiche individuali, come ad esempio la storia personale di vita, la tipologia di residenzialità, le prospettive di inserimento lavorativo, ecc. In questo modo, allora, è possibile svincolare l’intervento riabilitativo da un focus sul deficit e ampiarlo alla complessa interazione tra il soggetto, nelle sue molteplici potenzialità e disabilità, e il contesto di vita in cui si trova a operare. Infine, sia i dati di standardizzazione che l’ampia letteratura scientifica sullo strumento, suggeriscono di promuovere e sostenere sempre più l’adozione di strumenti come la SIS nel panorama dei servizi italiani, al fine di sensibilizzare la cultura dei servizi a un’ottica di Qualità di Vita in un’accezione basata su evidenze scientifiche e pertanto finalizzata ad affrontare con un approccio concreto, operazionale e misurabile, le scelte strategiche di gestione delle risorse e della progettazione educativa individuale.


traduzione di “Early Intensive Behavioral Intervention: Outcomes for Children With Autism and Their Parents After Two Years” Bob Remington University of Southampton, UK

Erik Jahr Akershus University Hospital, Norway

Richard P. Hastings University of Wales, Bangor, UK

Tony Brown, Paula Alsford, Monika Lemaic e Nicholas Ward University of Southampton, UK

Hanna Kovshoff e Francesca degli Espinosa University of Southampton, UK

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Intervento comportamentale intensivo precoce: esiti per bambini con autismo e genitori dopo due anni

39

Riassunto È stato identificato un gruppo d’intervento (n = 23) di bambini in età prescolare con autismo sulla base della preferenza dei genitori per un intervento di tipo comportamentale intensivo precoce, mentre un gruppo di controllo (n = 21) ha continuato ad essere sottoposto al consueto trattamento disponibile. Una valutazione prospettica è stata effettuata prima dell’inizio del trattamento, dopo 1 anno e ancora dopo 2 anni. I gruppi non mostravano differenze al momento della valutazione iniziale (baseline), ma dopo 2 anni si sono osservate differenze significative a favore dell’intervento comportamentale intensivo nelle misurazioni di intelligenza, linguaggio, abilità di vita quotidiana, comportamento sociale positivo, oltre a una differenza statistica nella misura delle migliori prestazioni. Misure del benessere dei genitori, raccolte negli stessi tre intervalli di tempo, non hanno evidenziato che l’intervento comportamentale fosse stato causa di un’esacerbazione delle problematiche né per le madri né per i padri dei bambini in trattamento.

Questo studio è stato finanziato tramite una sovvenzione dell’“Health Foundation”, Regno Unito (http://www.health.org.uk/). Gli autori sono molto grati per il generoso supporto al progetto. Un consorzio di 11 Autorità Educative Locali nel Sud dell’Inghilterra inclusi Southampton, Hampshire, East Sussex, Maidenhead e Windsor, Poole, Brighton e Hove, Wokingham, Wiltshire e Bournemouth, ha finanziato gli interventi dell’Università di Southampton per 13 bambini nel gruppo d’intervento. I restanti 10 bambini in quel gruppo sono stati seguiti da PEACH, the London Early Autism Program e dall’UK - Young Autism Programme. Gli autori ringraziano per il supporto collaborativo, sia finanziario sia pratico, tutti questi enti, senza i quali lo studio qui riportato non sarebbe stato possibile. Qualsiasi opinione qui espressa appartiene agli autori e non è necessariamente avallata dagli sponsor della ricerca o dai collaboratori. Francesca degli Espinosa ha avuto la funzione di supervisore senior ed Erik Jahr di consulente esterno per l’intervento dell’Università di Southampton. Gli autori ringraziano: Ruth Littleton, Sophie Orr e Penny Piggott che, con Paula Alsford e Monika Lemaic, hanno fatto da supervisori al team dell’Università di Southampton; Corinna Grindle che ha contribuito con le analisi d’affidabilità; e Catherine Carr, che ha offerto un favoloso supporto amministrativo e logistico al team. Per richieste di stampa e per contattare gli autori scrivere a: Bob Remington, Centre for Behavioural Research Analysis and intervention in Developmental Disabilities (BRAIDD), School of Psychology, University of Southampton, Southampton, SO17 1BJ, UK. E-mail: rer1@soton.ac.uk


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

40

Un numero sempre più ampio di ricerche empiriche suggerisce che un intervento precoce, intensivo, strutturato, basato sui principi dell’analisi applicata del comportamento (Applied Behavior Analysis, ABA), è efficace nel modificare i deficit intellettuali, linguistici e adattivi associati all’autismo. Lo studio originale di Lovaas (1987) evidenzia che un gruppo di bambini che ricevono 40 ore settimanali d’intervento comportamentale intensivo precoce a casa propria raggiunge significativi miglioramenti nelle misure del QI e del funzionamento sociale se paragonato con gruppi di controllo che ricevono un intervento meno intensivo oppure il trattamento standard offerto dai servizi educativi. Lo studio di follow-up di Mc Eachin, Smith e Lovaas (1993) evidenzia che i miglioramenti sono mantenuti all’età di 11,5 anni e che 8 bambini su 9, precedentemente identificati come i soggetti che avevano raggiunto il “miglior risultato”, non possono essere distinti dai loro coetanei a sviluppo tipico da ricercatori tenuti all’oscuro del loro trattamento. Dal 1987, molti ricercatori hanno condotto studi di valutazione che attestano l’efficacia di un intervento precoce sull’autismo, ma la maggior parte ha sofferto di limitazioni metodologiche che ne mettono a rischio la validità interna. Per esempio, così come nello studio di Lovaas (1987), molti studi a seguire non sono stati propriamente caratterizzati da sperimentazioni randomizzate prospettiche perché i ricercatori non hanno avuto la possibilità di assegnare i bambini ai gruppi in modo casuale (es., Anderson, Avery, DiPietro, Edwards e Christian, 1987; Birnbrauer e Leach, 1993; Eikeseth, Smith, Jahr e Eldevik, 2002) oppure si sono avvalsi di dati d’archivio per formare un gruppo di controllo (Sheinkopf e Siegel, 1998). Altri ancora si sono affidati a semplici gruppi di controllo prima e dopo l’intervento (es., Stahmer e Ingersoll, 2004; Weiss, 1999) o a studi su singoli casi controllati (es., Green, Brennan e Fein, 2002). Riassumendo, ci sono poche ricerche a controllo randomizzato che soddisfano adeguati criteri di validità interna e che evidenziano l’efficacia di un intervento comportamentale intensivo precoce. Due studi che rappresentano un’eccezione (Sallows e Graupner, 2005; Smith, Groen e Wynn, 2000) paragonano gli effetti dell’intervento precoce attuato usando un modello gestito dai clinici o dai genitori. Smith e colleghi (2000) mostrano che un intervento gestito dai clinici di 25 ore a settimana per 2 o 3 anni ha un impatto maggiore di un intervento meno intensivo basato sulla formazione dei genitori (5 ore a settimana). Misure di gruppo dell’intelligenza, delle capacità visuo-spaziali e del linguaggio dei bambini non differiscono all’età di 3 anni, ma cambiamenti a favore del gruppo gestito dai clinici sono presenti a 7-8 anni di età. Contrariamente, Sallows e Graupner (2005) non riscontrano differenze in simili misure tra programmi gestiti dai clinici e dai genitori dopo 4 anni di trattamento. In questo studio, ad ogni modo, le differenze tra i gruppi nell’intensità dell’intervento sono molto meno marcate. La scarsità di ricerche a controllo randomizzato in quest’area riflette le considerevoli difficoltà che si incontrano nella loro organizzazione: a differenza dagli studi sui farmaci, in cui i pazienti all’inizio sono in condizione cieca all’intervento, i genitori sono resi ben consapevoli in anticipo del trattamento che i loro bambini riceveranno. In più, mentre le conoscenze si accumulano e l’intervento precoce è sempre più accettato come il trattamento per eccellenza per l’autismo (es., Surgeon-General, 1999), i ricercatori si trovano ad affrontare le difficoltà etiche dell’assegnazione casuale ai gruppi, e le famiglie diventano meno desiderose di impegnare i loro bambini in trattamenti di lunga durata e dubbia utilità. Perciò, benché un approccio alla sperimentazione con controllo randomizzato possa, in condizioni ideali, produrre la più forte evidenza nello stabilire l’efficacia di un intervento (vedi, es.,


Whitehurst, 2003), potrebbe essere difficile condurre ulteriori esperimenti di valutazione di un intervento comportamentale intensivo precoce, a meno che si riescano a trovare alternative ben assortite ed egualmente credibili da opporre alle procedure standard. In ogni caso, è verosimile che l’efficacia nella pratica di un intervento comportamentale intensivo precoce sarebbe sovrastimata da qualsiasi esperimento randomizzato supposto. In generale, la validità esterna di tali esperimenti è compromessa da un severo controllo delle variabili, inclusa la comorbidità, la fedeltà del trattamento, l’aderenza al trattamento, e l’auto-selezione nelle ricerche (Kendall, Chu, Gifford, Hayes e Nauta, 1998; Persons e Silberschatz, 1998; Seligman, 1995). L’assenza di controllo su tali fattori è comune nei setting tipici dei servizi per cui il beneficio clinico a lungo termine di qualsiasi intervento dipende dagli effetti restanti che pertanto agiscono in condizioni non certamente ottimali. Considerazioni di questo tipo stanno alla base dello sviluppo di ricerche sul campo sull’efficacia, in cui l’assegnazione casuale ai gruppi e un più rigoroso controllo sperimentale vengono valutati rispetto a una più naturalistica valutazione d’erogazione del servizio nell’ambiente. Due recenti valutazioni di interventi comportamentali precoci per l’autismo hanno adottato questo approccio (H. Cohen, Amerine-Dickens e Smith, 2006; Howard, Sparkman, Cohen, Green e Stanislaw, 2005). Usando i criteri del Diagnostic and Statistical Manual of Mental Disorders (DSM-IV; American Psychiatric Association, 1994) piuttosto che lo strumento di ricerca ottimale, cioè l’Autism Diagnostic Interview-Revised (Lord, Rutter e Le Couteur, 1994), Howard e colleghi (2005) hanno identificato 61 bambini che soddisfacevano i criteri per il disturbo autistico o per il disturbo pervasivo dello sviluppo non altrimenti specificato (Pervasive Developmental disorders - not otherwise specified, PDD-NOS). Si sono messi a confronto 29 bambini che hanno ricevuto un intervento analitico comportamentale intensivo gestito dai clinici (da 25 a 40 ore settimanali) con due gruppi di controllo, uno (n = 16) che ha ricevuto un intervento complesso ugualmente intensivo, l’altro (n = 16) i cui membri non sono stati coinvolti in alcun programma d’intervento pubblico intensivo. L’assegnazione ai gruppi non era casuale, ma dipendeva dal consiglio dei medici, “tenendo altamente in considerazione le preferenze genitoriali” (Lord et al., 1994, p. 364). Insolitamente, Howard e colleghi hanno evitato il paragone diretto dei gruppi usando modelli ANOVA, preferendo invece un’analisi basata sulla regressione multipla, con l’appartenenza a ciascun gruppo come variabile categoriale. Questo evidenzia che prima del trattamento non c’erano differenze tra il gruppo d’intervento comportamentale analitico e i due gruppi di controllo combinati. In una seconda analisi di funzionamento 14 mesi dopo, Howard e colleghi (2005) hanno riscontrato che i bambini nel gruppo di intervento analitico comportamentale intenso ottengono punteggi più alti di quelli dei gruppi di controllo combinati in test standardizzati di funzionamento cognitivo, linguistico e adattivo. Sebbene gli effetti implicati da queste analisi ricevano, in un test simile, conferma dell’assoluto cambio di punteggio in tutte le misurazioni, non è stata presentata alcuna analisi che prenda in considerazione il cambio condizionato (es., relativo ai punteggi iniziali). In uno studio triennale con esiti prospettici condotto in un setting di comunità, Cohen e colleghi (2006) hanno messo a confronto 21 bambini che hanno ricevuto un trattamento comportamentale intensivo precoce con un ugual numero di bambini che sono stati inseriti in classi di educazione speciale in scuole pubbliche. L’assegnazione ai gruppi non è stata casuale, bensì basata sulle preferenze dei genitori e su un processo di revisione degli elen-

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

41


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

42

chi usato per identificare un bambino con lo stesso Quoziente Intellettivo (QI) ed Età Cronologica (EC) di ciascun bambino che riceveva l’intervento intensivo. In questo modo, è stato possibile formare un gruppo di bambini “che soddisfacevano i criteri di partecipazione… e i cui genitori avevano scelto altri servizi” (p. S147). Entrambi i gruppi includevano alcuni bambini con una diagnosi d’autismo e altri con una diagnosi di PDD-NOS, ma la proporzione di questi ultimi era più bassa nel gruppo d’intervento. Le analisi della covarianza (ANCOVA), usando i punteggi iniziali come covarianti e mettendo a confronto le performance dopo 1, 2 e 3 anni, rivelano che il gruppo intensivo è superiore nelle misure di QI e comportamento adattivo, ma non nelle misure di linguaggio e capacità non-verbali. Inoltre, la mancanza di un’interazione Gruppo × Tempo indica che le differenze di performance tra i gruppi raggiunte dopo 12 mesi non aumentano durante il trattamento. Il numero di bambini che hanno ottenuto un punteggio nella norma nella misura di esito primaria (cioè il QI) è più alto nel gruppo d’intervento intensivo dopo 3 anni, ma questa differenza non raggiunge la significatività statistica. I risultati degli studi di Howard e colleghi (2005) e di H. Cohen e colleghi (2006) suggeriscono che un intervento comportamentale intensivo precoce può essere efficace se condotto in setting tipici di comunità e quando messo a confronto con il trattamento usuale – la tipica combinazione di interventi disponibile per bambini con autismo. Nonostante ciò, in comune con quasi tutta la ricerca in quest’area, questi ricercatori non hanno preso in considerazione due questioni cruciali di cui cercheremo di occuparci nella presente ricerca. Prima di tutto, l’intervento comportamentale intensivo precoce ha un impatto al di là dei deficit nel comportamento cognitivo, linguistico e adattivo associati con l’autismo, che affliggono ulteriormente i caratteristici sintomi diagnostici del disturbo? Nel presente studio, sono state incluse scale di misura del quadro autistico, dei problemi sociali e del comportamento prosociale, oltre a una misura basata sull’osservazione dell’attenzione congiunta (Mundy e Crowson, 1997). La seconda questione di cui ci siamo occupati riguarda l’impatto di un intervento intensivo sui membri della famiglia. Questo punto è stato studiato in maniera minima, e anche se i dati esistenti suggeriscono che le madri, i fratelli e le sorelle dei bambini partecipanti allo studio non sono affetti in maniera negativa (Birnbrauer e Leach, 1993; Hastings, 2003a; Hastings e Johnson, 2001; Smith, Buch e Gamby, 2000; Smith, Groen e Wynn, 2000), non è stato finora pubblicato alcuno studio controllato di una gamma di misure del benessere sia materno che paterno. È stata inoltre studiata una questione metodologica chiave, concernente l’efficacia dell’intervento, tramite l’utilizzo di un approccio più preciso per identificare i bambini con il “miglior esito” basato sui criteri oggettivi di Jacobson e Truax (1991); si intendeva stabilire se un particolare bambino avesse beneficiato significativamente di un intervento. Questi criteri sono il cambiamento affidabile (fino a che punto i fattori statistici possono essere esclusi come spiegazione dell’apparente cambiamento) e il cambiamento clinicamente significativo (fino a che punto il cambiamento è clinicamente significativo). Anche se in studi precedenti i ricercatori avevano usato come criterio un QI che rientrasse nella normale gamma di variazione (Birnbrauer e Leach, 1993; Eikeseth et al., 2002; Lovaas, 1987; McEachin et al. 1993; Sallows e Graupner, 2005; Smith et al., 2000), per quanto ne sappiamo questo è il primo studio che applica simultaneamente i criteri statistici sia del cambiamento affidabile sia del cambiamento clinicamente significativo ai risultati di programmi di intervento comportamentale intensivo precoce.


Queste tre questioni chiave sono state esplorate all’interno del sistema educativo del Regno Unito, mentre in ricerche precedentemente pubblicate, basate su un’indagine non controllata dell’impatto dei programmi condotti a casa, Bibby, Eikeseth, Martin, Mudford e Reeves (2001) hanno riportato solo minimi risultati e ampie variazioni nella qualità e nell’intensità d’erogazione del servizio. Al contrario, si è cercato di costruire il più rigoroso studio di campo controllato sull’efficacia ottenibile nei limiti della cultura prevalente. Ciò prevede un disegno di ricerca longitudinale della durata di 2 anni, che mette a confronto bambini con autismo le cui famiglie avevano richiesto un intervento comportamentale intensivo condotto da una serie di diversi enti di servizi in Inghilterra, con bambini i cui genitori non avevano cercato questo tipo di intervento e stavano quindi ricevendo i tipici servizi prescritti dalla legge (trattamento usuale). Riassumendo, questo studio è stato disegnato come test rigoroso per determinare se l’uso continuativo di un intervento comportamentale intensivo precoce per bambini con autismo potesse portare a benefici, incorporando una larga serie di misure degli effetti sia sui bambini con autismo che sui loro genitori. Sono stati usati criteri oggettivi per identificare i bambini col “miglior esito”. Sulla base di precedenti studi sull’efficacia, ci si aspettava che l’intervento portasse a miglioramenti nel funzionamento cognitivo, linguistico e sociale dei bambini se paragonato al trattamento usuale. Ricerche precedenti sulle famiglie suggeriscono che il benessere psicologico dei genitori non è condizionato in senso negativo dall’essere coinvolti in un intervento intensivo, anche se non era chiaro se ci si potessero aspettare degli esiti positivi. Data la scarsità di dati pubblicati, non c’erano aspettative su eventuali cambiamenti positivi nel grado dei sintomi autistici, dei problemi di comportamento o nelle misure del comportamento di attenzione congiunta a seguito dell’intervento comportamentale intensivo precoce.

Metodologia Rassegna generale del disegno di ricerca Sono stati identificati due gruppi di bambini in età prescolare con una formale diagnosi di autismo. I genitori dei bambini nel gruppo di intervento hanno scelto interventi comportamentali intensivi precoci, alcuni procurati tramite fondi pubblici e altri ottenuti privatamente; i genitori dei bambini nel gruppo di controllo non hanno attivamente ricercato l’intervento comportamentale, e invece hanno ricevuto un servizio standard dalla provvigione dei fondi pubblici, condotto dalla loro Autorità Educativa Locale (es., trattamento usuale). Le valutazioni del funzionamento cognitivo, del comportamento adattivo, dei comportamenti autistici e delle abilità sociali e comunicative dei bambini sono avvenute in tre momenti di raccolta dei dati: prima dell’intervento (baseline), dopo 1 anno, e ancora dopo 2 anni d’intervento (assessment a 12 e a 24 mesi). Le misurazioni della salute mentale dei genitori, del loro livello di stress e delle loro percezioni positive nei confronti del figlio sono state raccolte negli stessi tre intervalli di tempo.

Soggetti Bambini con autismo. I bambini sono stati reclutati attraverso segnalazioni delle autorità educative locali, attraverso avvisi della United Kingdom National Autistic Society e delle sue sedi regionali, e attraverso gruppi di genitori o servizi di volontariato. I dati demografici delle

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

43


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

44

famiglie sono registrati nella tabella 1 e i dati relativi ai bambini sono evidenziati nella tabella 2 (per informazioni sul baseline vedi Risultati). Per soddisfare i criteri di inclusione per questo studio tutti i bambini, sia del gruppo sperimentale sia di controllo, dovevano possedere le seguenti caratteristiche. Prima di tutto, era richiesta una diagnosi di autismo basata sull’Autism Diagnostic Interview-Revised, completata da un operatore (l’ultimo autore) formato per la somministrazione e il calcolo del punteggio di questo strumento per fini di ricerca. Tutti i bambini, inoltre, avevano già ricevuto una diagnosi di autismo da un clinico indipendente dal programma di ricerca o avevano ricevuto una sospetta diagnosi di autismo. Secondo, i bambini dovevano avere tra i 30 e i 42 mesi di età al tempo del loro inserimento. Terzo, non dovevano presentare alcuna altra condizione medica cronica o seria che potesse interferire con la conduzione di un intervento consistente o potesse altrimenti avere effetti avversi sullo sviluppo. Infine, tutti i bambini vivevano in casa con la loro famiglia. Sono stati identificati 44 bambini che soddisfacevano questi criteri. Le famiglie di 23 di questi, che costituivano il gruppo di intervento, avevano scelto l’intervento comportamentale intensivo precoce, ricevendo la provvigione dall’Università di Southampton e i fondi tramite il loro servizio educativo locale (n = 13) oppure tramite un servizio privato (n = 10). In quest’ultimo caso, i servizi erano pagati dai genitori stessi o dal loro servizio educativo locale. Le restanti 21 famiglie, del gruppo di controllo, ricevevano varie forme di provvedimenti educativi per i loro bambini corrisposti da enti pubblici. I gruppi differivano leggermente per età cronologica (EC), essendo i bambini del gruppo di controllo (M = 38,4 mesi, DS = 4,4) in media approssimativamente 3 mesi più grandi dei bambini nel gruppo di intervento (M = 35,7 mesi, DS = 4,0), t(42) = 2,14, p < 0,05. Nessuna altra variabile demografica stimata per i bambini differiva nei due gruppi al momento iniziale. L’età cronologica è stata esplorata come una variabile di controllo nelle principali analisi statistiche. Genitori. Quarantaquattro madri e 31 padri dei bambini nel gruppo di intervento e di controllo hanno presentato dati su qualche aspetto del funzionamento del bambino e sul proprio benessere. I loro dettagli demografici sono esposti nella tabella 1. Nell’insieme della ricerca, 40 coppie sono state incluse nella stima iniziale. Nel caso di 9 famiglie, il padre ha declinato l’invito a partecipare alla ricerca. Nel caso di 4 famiglie, il padre non viveva nella stessa casa della madre e del bambino con autismo al momento iniziale della ricerca; questi padri non hanno preso parte alla ricerca. I due gruppi erano molto simili nella maggioranza delle caratteristiche demografiche dei genitori/famiglia. Anche se erano presenti alcune differenze demografiche, nessuna differenza tra i gruppi era abbastanza grande da raggiungere la significatività statistica dello 0,05. Quindi, nessuna di queste caratteristiche è stata considerata come possibile variabile di controllo nelle seguenti analisi.

Misure relative ai bambini Sono stati utilizzati strumenti normativi per raccogliere dati sugli esiti cognitivi, linguistici e comportamentali dei bambini. Gli strumenti di valutazione sono stati scelti per le loro buone proprietà psicometriche e per il loro uso in studi pubblicati con popolazioni simili. Un’importante considerazione riguarda la potenziale utilità di tali strumenti nel testare i bambini con autismo. Molti test richiedono abilità di linguaggio e di attenzione sostenuta, due abilità che potrebbero avere un effetto su questi bambini, i cui deficit sintomatici nel linguaggio, nel comportamento intellettuale, neurologico e adattivo e nelle abilità interpersonali potrebbero influenzare la performance su misure standardizzate e perciò avere un


Tabella 1. Caratteristiche demografiche delle famiglie per gruppo Intervento (n = 23) Demografica

n/ Media

%/DS

16 4

69,6 17,4

Range

Controllo (n = 21) n/ Media

%/DS

16 4

76,2 19

1

4,8

Range

Famiglie Stato Civile Sposato Vive col partner Divorziato/Separato/Single e non vive col partner

3

13

Fratelli e sorelle 0 1 2 3

5 11 7 0

21,7 47,8 30,4 0

3 13 4 1

14,3 61,9 19 4,8

Fratelli e sorelle con disturbi dello sviluppo 0 1 2

20 2 0

87 13 0

13 7 1

61,9 33.3 4,8

Tutte le madri (n = 44)

45

23

21

Età media

35,7

Livello di educazione Educazione non universitaria Educazione universitaria

13 10

57 43

17 4

81 19

7 0 7

30,4 0 100

7 0 7

33,3 0 100

Lavoro pagato Tempo pieno Part-time Tutti i padri che vivono in casa con la famiglia (n = 40)

4,0

26-42

20

33,6

3,8

38,88

Livello di educazione Educazione non universitaria Educazione universitaria

10 10

50 50

11 9

55 45

Lavoro pagato Tempo pieno Part-time

19 19 0

95 100 0

18 17 1

90 94,4 5,6

Età media Livello di educazione Educazione non universitaria Educazione universitaria Lavoro pagato Tempo pieno Part-time

5,5

31-50

16 38,7

26-41

20

Età media

Padri che hanno risposto al questionario (n = 31)

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

37,1

4,8

30-53

15 4,8

31-50

37,5

7 9

44 56

8 7

15 15 0

93,8 100 0

13 12 1

5,4

30-53

53 47 86,7 92,3 7,7

Nota. Tutte le madri hanno risposto al questionario, mentre solo 31 padri hanno risposto. I dati per entrambi i sottogruppi sono esposti nella tabella.


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

46

Tabella 2. Medie non adattate (DS) delle misure dei bambini per gruppo e momento di valutazione Baseline Misura

Intervento

QI** EMa**

Assessment a 12 mesi Controllo

Assessment a 24 mesi

Controllo

Intervento

Intervento

Controllo

61,43 (16,43)

62,33 (16,64)

68,78 (20,49)

58,90 (20,45)

73,48 (27,28)

60,14 (27,76)

22,04 0(6,89)

23,71 0(6,00)

33,70 (10,16)

29,81 0(9,89)

44,39 (16,39)

38,00 (17,44)

VABSb Compositi

114,78 (26,89)

113,57 (29,78)

169,70 (49,07)

145,76 (45,56)

202,83 (61,98)

182,86 (58,89)

Comunicazione

23,52 (11,35)

21,62 (10,81)

42,83 (18,25)

34,62 (17,17)

54,74 (24,43)

46,00 (24,51)

Vita quotidiana*

24,13 0(7,49)

25,43 (10,56)

39,52 (14,71)

35,52 (14,34)

50,22 (16,46)

44,67 (16,99)

Socializzazione

29,57 0(6,65)

28,29 0(7,48)

38,52 (12,57)

33,14 (11,77)

43,52 (15,94)

41,48 (14,52)

Abilità motorie*

37,57 0(6,37)

38,24 0(7,06)

48,83 0(6,84)

44,48 0(7,70)

54,35 0(9,12)

50,71 0(8,21)

Iniziativa di

3,33 0(4,40)

3,63 0(4,92)

7,71 0(7,52)

6,19 0(8,79)

11,76 0(9,41)

11,19 (13,86)

Abilità di risposta alla*

5,29 0(3,62)

5,94 0(3,91)

8,95 0(4,18)

7,13 0(5,21)

11,29 0(3,47)

10,06 0(4,99)

Attenzione congiuntac

a Età mentale. bPunteggi grezzi della Vineland Adaptive Behavior Scale. cMisurato usando le Early Social Communication Scales. *p < 0,05. **p < 0,01 sui principali effetti per i dati combinati a 12 e 24 mesi. Gruppo d’intervento n = 23 e Gruppo di controllo n = 21, eccetto per l’attenzione congiunta, gruppo d’intervento n = 21; gruppo di controllo n = 16.

impatto sull’affidabilità e sulla validità di qualsiasi test. Tutti i test sono stati somministrati seguendo le procedure standard per assicurare che i dati ottenuti fossero confrontabili con quelli di altri studi. In alcuni casi questo potrebbe potenzialmente portare a sottostimare l’abilità dei bambini (es., i bambini che si fermano a un certo punteggio nella Scala di Bayley avrebbero potuto raggiungere punteggi migliori se fossero loro stati somministrati item non verbali e non sociali); ad ogni modo, i metodi usati per calcolare i punteggi non hanno favorito in alcun modo un gruppo piuttosto che un altro. I test selezionati sono stati somministrati da un esperto specializzato in psicometria (il terzo autore), che aveva 4 anni di esperienza con bambini con autismo e che ha messo in pratica ogni accortezza al fine di ottenere dati affidabili e validi. Nonostante le risorse disponibili non permettessero di condurre controlli formali indipendenti sull’affidabilità nei casi in cui erano disponibili valutazioni da parte d’esperti psicometrici indipendenti, questi punteggi rientrano sempre in un intervallo d’errore standard di misurazione qui di seguito riportato. Inoltre, il terzo autore non è stato informato dello status del gruppo, ha lavorato indipendentemente dai team d’intervento, non ha avuto accesso alle relazioni sulla ricerca e i suoi contatti con le famiglie erano limitati all’assessment annuale. Funzioni intellettive. La scala di Bayley e la Stanford Binet Intelligence Scale, IV Edition (Thorndike, Hagen e Sattler, 1986) sono state entrambe scelte, in parte, per la loro bassa soglia d’accesso. La scala Bayley, studiata per bambini fino ai 42 mesi d’età, è adatta a bambini con disabilità intellettive o a quelli le cui abilità linguistiche non sono sufficientemente sviluppate per completare un test d’intelligenza articolato. Se la Scala Bayley è somministrata a bambini d’età cronologica (EC) superiore alle norme del test, la loro età mentale (EM) si calcola in base ai loro punteggi grezzi usando la tabella B.2 del manuale Bayley. L’indice di QI è quindi calcolato usando la formula EM/EC × 100. La Stanford-Binet fornisce dati normativi a partire dai 2 anni d’età e, avendo un solo subtest a tempo, offre un buon livello di flessibilità nella valutazione di bambini con autismo.


Linguaggio. Le Reynell Developmental Language Scales - Third Edition (Edwards et al., 1997) sono state scelte prima di tutto perché sono uno dei pochi strumenti di valutazione del linguaggio usati in precedenza negli studi sugli esiti dell’intervento comportamentale intensivo precoce e perché comprendono misure separate per l’espressione e per la comprensione del linguaggio. Ad ogni modo, la versione usata, adattata per il Regno Unito, fornisce dati normativi solamente dai 21 mesi d’età, significativamente più tardi rispetto alle norme della versione che risale al 1985, la quale iniziava a partire dai 12 mesi. Abilità adattive. La Vineland Adaptive Behavior Scale - Survey Form (Sparrow, Balla e Cicchetti, 1984) è stata scelta in quanto molto diffusa e al fatto che ne esiste una versione ridotta (la “survey form”). La Scala Vineland valuta quattro domini del comportamento adattivo: Socializzazione, Comunicazione, Abilità di vita quotidiana e Abilità motorie. Sfortunatamente, i miglioramenti nel comportamento adattivo dei bambini con autismo non sono sempre rilevati dai punteggi standardizzati della scala Vineland. Questo dipende in parte dal fatto che i bambini a più alto funzionamento mostrano profili di sviluppo disomogenei con differenze tra i vari domini (Burack e Volkmar, 1992) e in parte dal fatto che i bambini a basso funzionamento possono mostrare poca disomogeneità, dovuta a effetti basali (Carter et al., 1998). Per evitare tali problemi nelle applicazioni sperimentali con bambini autistici (al contrario delle applicazioni diagnostiche) Carter e colleghi (1998) raccomandano di usare i punteggi grezzi piuttosto che i punteggi standardizzati. Scale di valutazione per il comportamento dei bambini. La Positive Social Subscale del Nisonger Child Behavior Rating Form (Tassé, Aman, Hammer e Rojahn, 1996) e la versione con resoconto genitoriale della Developmental Behavior Checklist (Einfeld e Tonge, 1995) sono state scelte per valutare il comportamento del bambino. La scala Nisonger è una scala di valutazione che dà informazioni sul comportamento studiata per valutare bambini con disabilità intellettive. La Developmental Behavior Checklist è un questionario valutativo del comportamento contenente un Punteggio di Comportamento Totale, che indica la gravità dei problemi di comportamento e offre dei sottoinsiemi di item che funzionano come un valido e affidabile strumento di screening dell’autismo (Developmental Behavior Checklist- Autism Screening Algorithm, Einfeld e Tonge, 2002). È stato usato anche l’Autism Screening Questionnaire (Berument, Rutter, Lord, Pickles e Bailey, 1999). Questo strumento, derivato dall’Autism Diagnostic Interview algorithm (Lord et al., 1994) e completato dai genitori, fornisce un punteggio dimensionale per i sintomi autistici che sono stati usati nelle analisi. Misure osservazionali della comunicazione sociale non verbale. Le Early Social Communication Scales (Mundy, Hogan e Dohering, 1996) sono uno strumento osservazionale semistrutturato videoregistrato in cui chi somministra il test presenta una serie standard di giochi, studiati in modo da sollecitare comportamenti sociali e comunicativi in un contesto ecologicamente valido. Le variabili chiave ottenute tramite la somministrazione delle scale sono state una misura dell’iniziativa e una misura dell’abilità di risposta all’attenzione congiunta. L’iniziativa di attenzione congiunta si riferisce alla frequenza con cui i bambini usano il contatto visivo, indicano e mostrano, al fine di condividere l’esperienza di un gioco o di un oggetto durante il test. L’abilità di risposta all’attenzione congiunta si riferisce al numero di volte, in otto prove, in cui un bambino rivolge correttamente il suo sguardo e allinea l’attenzione nella direzione di un poster che gli o le è indicato da chi conduce il test. I bambini con autismo hanno meno probabilità, rispetto ai bambini a sviluppo tipico o ai bambini

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

47


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

48

con disabilità intellettive, di iniziativa o di abilità di risposta all’attenzione congiunta (McEvoy, Rogers e Pennington, 1993; Mundy e Crowson, 1997; Mundy, Sigman, Ungerer e Sherman, 1986). Di conseguenza, il presente studio ha cercato di valutare se questi comportamenti d’interazione sociale possano migliorare diversamente per il gruppo di intervento come risultato della partecipazione a un programma che richiede molte ore di interazione uno-a-uno con adulti. L’affidabilità inter-osservatore è stata stimata usando dati videoregistrati del 25% dei bambini (9) ad ogni punto nel tempo, rilevati da un operatore indipendente tenuto all’oscuro dello status del gruppo e istruito sul livello d’affidabilità usando videocassette di prova sulla Early Social Communication Scale. Le correlazioni interclasse tra valutazioni appaiate, usate per stimare la consistenza tra i codici degli osservatori in tutti e tre i punti d’assessment, variano da 0,95 a 0,99 per l’iniziativa di attenzione congiunta e da 0,96 a 0,97 per l’abilità di risposta all’attenzione congiunta.

Misure self-report del benessere genitoriale La Hospital Anxiety and Depression Scale (Zigmond e Snaith, 1983), scelta come misura della salute mentale dei genitori, include due subscale, che valutano una depressione e l’altra l’ansia. Ricerche precendenti con genitori di bambini con autismo hanno mostrato che tale misurazione ha un’alta affidabilità (consistenza interna) sia per le madri sia per i padri di bambini con autismo (Hastings, 2003b; Hastings e Brown, 2002). La subscala relativa ai Problemi dei genitori e della famiglia del Questionnarie on Resources and Stress - Friedrich short form (Friedrich, Greenberg e Crnic, 1983) è stata scelta come misura generale dello stress genitoriale. Il punteggio totale dello stress oltre 5 item fornito da questa scala, che in precedenza è stato accettato come una valida misura della depressione in genitori di bambini con disabilità (Glidden e Floyd, 1997), è stato tolto dalla scala complessiva. Questa modifica ha assicurato che non si creasse confusione tra le misure di stress e di salute mentale. La risultante scala, di 15 item, ha evidenziato una forte coerenza interna nel presente campione (i coefficienti di Kuder-Richardson sono 0,87 per le madri e 0,83 per i padri al baseline). Il Kansas Inventory of Parental Perceptions Positive Contributions subscale (Behr, Murphy e Summers, 1992) è stato scelto come misura del grado in cui i genitori avvertono percezioni positive del loro bambino e dell’impatto del bambino sulla famiglia (es., avvicinare di più la famiglia, aiutare gli altri membri della famiglia a diventare più comprensivi verso le altre persone, ed essere una risorsa di felicità e soddisfazione). Nella presente ricerca, è stato usato il punteggio totale delle percezioni positive. Tale punteggio ha evidenziato un alto livello di consistenza interna sia per le madri, α di Cronbach = 0,95, sia per i padri, α = 0,95.

Procedura Gruppo di intervento. A tutti i bambini nel gruppo di intervento è stato somministrato l’intervento comportamentale intensivo precoce per 2 anni. Tutor istruiti e genitori hanno svolto l’insegnamento uno-a-uno basato sull’analisi del comportamento applicata in media per 25,6 ore settimanali (DS = 4,8, range = da 18,4 a 34,0). Tredici dei 21 programmi sono stati forniti dall’Università di Southampton ed erano gratis per i genitori nominati dall’autorità educativa locale che forniva i fondi al team d’intervento dell’Università (che include il quarto, quinto, settimo e ottavo autore). I restanti programmi sono stati condotti da altri enti


del Regno Unito, pagati direttamente dai genitori o comprati per i genitori dalle loro Autorità Educative Locali. Questi enti includono il PEACH, un servizio di volontariato composto di genitori (n = 4), il London Early Autism Program (n = 1), lo United Kingdom-Young Autism Programme (n = 1), e l’East Sussex Local Education Authority (n = 1). Il bambino escluso dai precedenti programmi è stato seguito per 9 mesi dal PEACH, per 9 mesi da un consulente privato e gli ultimi 6 mesi da una scuola dove l’analisi comportamentale applicata era regolarmente utilizzata (era l’unico bambino a frequentare tale scuola). Nonostante gli interventi fossero condotti da una serie di enti fornitori di servizi, tutti avevano in comune le 10 caratteristiche degli interventi basati sulla ricerca identificati da Green e colleghi (2002, p. 70). All’inizio del trattamento, svolto nell’ambiente famigliare, tutti i bambini avevano tra i 3 e i 4 anni. Il trattamento, che si è protratto per 2 anni, includeva da 20 a 30 ore settimanali di insegnamento strutturato, basato sui principi dell’analisi del comportamento applicata. Perciò, i programmi comprendevano metodi di insegnamento strutturato con prove distinte (Lovaas, 1993) e incorporavano procedure di generalizzazione per estendere e mantenere i repertori comportamentali emergenti. Nella maggior parte degli interventi furono anche integrati elementi di training ambientale naturale (Sundberg e Partington, 1999) e di comportamento verbale (Partington e Sundberg, 1998). In alcuni casi, alternative riconosciute e sistemi di comunicazione aumentativi basati sui principi comportamentali sono stati incorporati negli interventi per ovviare all’assenza di linguaggio e fornire ai bambini iniziali mezzi di comunicazione. A 12 mesi, il 44% (10) dei bambini nel gruppo d’intervento stava usando il Picture Exchange Communication System e il 17% (4) continuava a farlo dopo 24 mesi. Per il linguaggio dei segni o per i Makaton Communication Systems, le figure erano rispettivamente il 44% (10) dopo 12 mesi e il 35% (8) dopo 24 mesi. Per ogni bambino sono stati individuati programmi di intervento che coprivano tutti gli aspetti del funzionamento (es., linguaggio, altri aspetti del funzionamento cognitivo, sociale e motorio), basandosi su analisi in corso delle attuali forze e bisogni, prendendo in considerazione la tipica evoluzione dello sviluppo e la praticabilità degli interventi. I programmi erano dunque progressivi: quando i bambini acquisivano le abilità più semplici, si stabilivano abilità più complesse come obiettivi comportamentali, e questo processo continuò per i 2 anni d’intervento. Allo stesso modo, quando le abilità dei bambini aumentavano, iniziava il processo d’accesso facilitato ad appropriati setting scolastici. Il programma è stato consegnato a ogni bambino da un gruppo di 3-5 terapisti istruiti all’uso delle procedure comportamentali analitiche (es., shaping, chaining, prompting, fading, modeling, apprendimento discriminato, analisi del compito, analisi funzionale) e supervisionato da membri dello staff con più esperienza, incluso un supervisore che aveva una sostanziale esperienza nell’ambito dell’intervento comportamentale intensivo precoce e, nella maggior parte dei casi, un consulente con ancor più esperienza, a livello di dottorato e/o una serie di ricerche pubblicate sul tema dell’analisi comportamentale. I genitori stessi conducevano la terapia, con il medesimo metodo di supervisione. Per la supervisione dei tutori dei vari staff è stato usato un modello di workshop in cui i supervisori organizzavano incontri con lo staff a intervalli regolari. La frequenza degli incontri dello staff dipendeva dal fornitore di servizi; per i 13 bambini che hanno ricevuto l’intervento supervisionato dell’Università di Southampton, gli incontri si tenevano due volte al mese, con ulteriori training sovrapposti regolarmente; per i bambini restanti, gli incontri

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

49


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

50

erano meno frequenti (range = 4-12 settimane). Durante gli incontri, si valutava il progresso dei bambini rispetto all’incontro precedente, si aggiungevano o modificavano i programmi e i membri dello staff (inclusi i genitori) facevano pratica dei programmi da attuare. I consulenti partecipavano ai meeting meno frequentemente (in media, una volta ogni 2 mesi). Ad ogni modo, questi rimanevano disponibili a offrire supervisione clinica supplementare via telefono o via e-mail. Allo stesso modo, tra un meeting e l’altro, i supervisori rimanevano a disposizione del resto dello staff e dei genitori. Nessun bambino nel gruppo d’intervento stava frequentando la scuola al momento dell’assessment iniziale ma, dopo 12 mesi, 13 bambini (57%) stavano frequentando una scuola tradizionale in media per 5,8 ore a settimana. Dopo 24 mesi, 17 bambini (74%) stavano frequentando una scuola tradizionale in media per 13,28 ore settimanali; e il 22% (5), una scuola per bisogni speciali in media per 9,15 ore a settimana. L’ultimo bambino continuava con il solo programma svolto a casa. Poiché la maggior parte dei bambini nel gruppo di intervento frequentava la scuola e allo stesso tempo seguiva il programma a casa, le ore di scuola erano leggermente inferiori a quelle dei bambini del gruppo di controllo al primo e al secondo anno dello studio. I principi del TEACCH-Treatment and Education of Autistic and Related Communication Handicapped Children (Schopler, Mesibov e Baker, 1982) erano talvolta inclusi negli interventi scolastici di 2 bambini (9%) dopo 12 mesi e del 13% (3) dopo 24 mesi. Oltre al trattamento comportamentale e alla scolarizzazione, alcuni bambini nel gruppo di intervento sono stati sottoposti anche ad altri interventi. Il 65% (15) stava già seguendo terapia del linguaggio al tempo della valutazione iniziale. Il 22% (5) la stava seguendo dopo 12 mesi; e il 26% (6), dopo 24 mesi. Sono stati anche frequentemente riportati interventi sulla dieta (tipicamente restrizioni di glutine e caseina), con 11 bambini (48%) sottoposti a diete restrittive al baseline, 14 (61%) e 12 (52%) rispettivamente dopo 12 e 24 mesi. Infine, anche i genitori hanno riportato l’uso regolare di farmaci: il 4% (1) al momento iniziale, il 17% (4) dopo 12 mesi, e il 4% (1) dopo 24 mesi. Sei bambini (26%) ricevevano iniezioni vitaminiche o alte dosi di vitamine al baseline; 10 (44%) e 7 (30%), rispettivamente, dopo 12 e 24 mesi. Per quanto riguarda gli interventi omeopatici, 5 bambini (22%) li ricevevano al baseline; 2 (90%), dopo 12 mesi; e 1 (4%) dopo 24 mesi. Gruppo di controllo. I bambini nel gruppo di controllo hanno seguito la programmazione standard dei sistemi educativi locali per bambini piccoli con autismo. Perciò, nel corso dei 2 anni, hanno seguito diversi tipi di interventi studiati per migliorare le conseguenze dell’autismo e accrescere il funzionamento, nessuno dei quali era intensivo o condotto su una base uno-a-uno per la maggior parte del tempo. L’intervento più frequentemente riportato è stata la terapia del linguaggio: 12 bambini (57%) la stavano seguendo al tempo della valutazione iniziale, il 67% (14) dopo 12 mesi, e il 48% (10) dopo 24 mesi. I genitori hanno riportato un uso frequente dei principi del TEACCH come parte dell’esperienza scolastica dei bambini (38%, 8 bambini, e 52%, 11 bambini rispettivamente dopo 12 e 24 mesi). In modo simile, erano spesso utilizzati anche il Picture Exchange Communication System (67%, 14 bambini e 76%, 16 bambini, rispettivamente dopo 12 e 24 mesi), il linguaggio dei segni o i Makaton Communication Systems (24%, n = 5 e 48%, n = 10, dopo 12 e 24 mesi), usati come sistemi di comunicazione alternativa. Anche gli interventi sulla dieta erano relativamente comuni, con il 14% (n = 3) che seguiva una dieta speciale al baseline, il 19% (n = 4) dopo 12 mesi, e il 29% (n = 6 bambini) dopo 24 mesi. È anche stato riportato l’uso di farmaci, di


vitamine e di trattamenti omeopatici: il 5% (1 bambino) riceveva farmaci al baseline, il 24% (5) dopo 12 mesi, e il 19% (4) dopo 24 mesi. Nessun bambino al baseline faceva iniezioni vitaminiche o assumeva alte dosi di vitamine, mentre 1 solo bambino (5%) le prendeva al momento dell’assessment a 12 e 24 mesi. Infine, gli interventi omeopatici erano riportati per il 24% (5) del campione al momento della valutazione iniziale, e per un solo bambino (5%) dopo 12 e 24 mesi. Nessun bambino nel gruppo di controllo frequentava una scuola al momento iniziale. Al tempo dell’assessment dopo 12 e 24 mesi, invece, in linea con la programmazione standard della amministrazione educativa, tutti avevano una sistemazione in una scuola. Dopo 12 mesi, il 48% (6) era in un contesto tradizionale; il 43% (9) era in una scuola per bambini con bisogni educativi speciali, e il 10% (2) era iscritto contemporaneamente a due scuole e passava metà del tempo in ciascuna scuola. Il numero medio di ore settimanali passate a scuola era simile per ogni bambino indipendentemente dalla sua sistemazione (una media di 15,3 ore passate in un contesto tradizionale, 17 ore passate in una scuola per bisogni speciali, e 15 ore passate in sistemazioni miste). Dopo 24 mesi, il 48% (10 bambini) era in una scuola tradizionale per una media settimanale di 22,3 ore e il 52% era in scuole per bambini con bisogni speciali per 13,6 ore a settimana. Nonostante i bambini nei gruppi di intervento e di controllo abbiano ricevuto livelli simili di intervento sul linguaggio e sulla comunicazione, è chiaro che questo pattern non è stato mantenuto durante i 24 mesi. In genere, come riportato successivamente, questo è stato causato dal fatto che l’intervento produceva effetti che riducevano il bisogno di altri interventi come il linguaggio dei segni o i Makaton. Assessment psicometrici. Le misurazioni degli esiti dei bambini e dei genitori sono state raccolte al momento del baseline, dopo 1 anno di intervento comportamentale o di programmazione standard (assessment a 12 mesi), e dopo 2 anni (assessment a 24 mesi). I test basati sulle prestazioni sono stati somministrati in un ambiente privo di distrazioni all’interno della casa familiare. Tutti i questionari sono stati spediti per posta ai genitori al tempo di ognuno dei tre assessment, e restituiti allo staff di ricerca poco dopo. Le interviste telefoniche condotte utilizzando la scala Vineland sono state compilate con chi si occupava primariamente dei bambini, approssimativamente 1 settimana prima delle visite per l’assessment dei bambini, tenuto nella casa familiare. Tali interviste duravano approssimativamente 60 minuti. Ad eccezione dell’Autism Diagnostic Interview, somministrata ai genitori in casa dall’ultimo autore al baseline, restanti misurazioni standardizzate dei risultati sono state effettuate dal terzo autore, usando un ordine uniforme di somministrazione: le Early Social Communication Scales, le Bailey Scales of Infant Development o la Stanford Binet e le Reynell Developmental Language Scales (somministrate solo nei casi in cui il linguaggio del bambino avesse raggiunto un livello tale da permettergli di accedere agli item del test).

Risultati Rassegna generale delle analisi sui dati di gruppo Per valutare l’efficacia dell’intervento comportamentale, si sono utilizzati i modelli ANCOVA. Poiché i gruppi non erano stati fatti attivamente coincidere al momento della valutazione iniziale, i punteggi di baseline sulle misurazioni dei risultati sono stati immessi come

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

51


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

52

covarianti nelle analisi che, quindi, prevedevano un fattore tra gruppi: Gruppo (intervento, controllo) e un fattore di misurazione ripetuto, Tempo (esiti dopo 12 mesi vs. 24 mesi). In questi modelli, un effetto principale significativo di gruppo suggerirebbe ampi cambiamenti in un gruppo visti sia dopo 12 sia dopo 24 mesi. Un’interazione significativa Gruppo × Tempo starebbe a indicare l’assenza di differenze significative tra i gruppi a un certo punto nel tempo e la presenza di differenze significative tra i gruppi a un altro punto nel tempo. L’assenza di effetti principali o di effetti di interazione suggerirebbe che i due gruppi non si distinguono né dopo 12 mesi né dopo 24 mesi. Per facilitare il paragone con altre ricerche e per facilitare successivi paragoni meta-analitici, le tabelle 2 e 4 (relative ai bambini) e la tabella 5 (relativa ai genitori) mostrano i punteggi medi non adattati per le variabili sui risultati al momento della valutazione iniziale e dopo 12 e 24 mesi. Esiti dei bambini. La tabella 2 espone i risultati di QI, EM, i punteggi grezzi nei subdomini della scala Vineland, e le misure ottenute con le Early Social Communication Scale nella iniziativa di attenzione congiunta e nella abilità di risposta alla attenzione congiunta. Il modello ANCOVA 2 × 2, usato per analizzare gli esiti dopo 12 e 24 mesi, ha evidenziato che il gruppo d’intervento mostra un vantaggio sul gruppo di controllo in quattro di queste misure dopo 12 mesi, che è stato mantenuto dopo 24 mesi. Per il QI, c’è un effetto principale di gruppo significativo, F(1,41) = 7,72, p = 0,008, ma non c’è un effetto di interazione. Allo stesso modo, l’EM mostra un significativo effetto principale di gruppo, F(1,41) = 8,37, p = 0,006, ma non c’è un effetto d’interazione. Sono stati trovati effetti di gruppo significativi (ma non di interazione) anche per le Abilità di vita quotidiana di Vineland, F(1,41) = 6,32, p = 0,016, e per le Abilità motorie di Vineland, F(1,41) = 4,49, p = 0,040, ma non per i punteggi compositi di Vineland né per i domini della Socializzazione e della Comunicazione. In tutti i casi, i bambini che hanno ricevuto l’intervento comportamentale intensivo precoce hanno evidenziato performance migliori dei bambini nel gruppo di controllo. Al momento della valutazione iniziale, 7 bambini (2 nel gruppo di intervento e 5 nel gruppo di controllo) non hanno potuto essere sottoposti alle Early Social Communication Scale, a causa di problemi comportamentali, disattenzione, o per l’assenza del permesso dei genitori alla videoregistrazione. In ogni caso, utilizzando i test di Mann-Whitney, non c’è stata la possibilità di identificare differenze d’EC o di misure dei risultati tra quei bambini che al baseline erano stati sottoposti ad assessment e quelli che non erano stati sottoposti. Per i bambini sottoposti ad assessment, i modelli ANCOVA 2 × 2 per gli esiti dopo 24 mesi hanno evidenziato un effetto principale di gruppo significativo nella abilità di risposta all’attenzione congiunta in favore del gruppo d’intervento, F(1,34) = 4,15, p = 0,049, ma non hanno evidenziato effetti significativi nella iniziativa di attenzione congiunta. Nessuna delle due misure ha evidenziato, anche in questo caso, interazioni significative, indicando così che gli effetti si erano stabiliti entro 12 mesi e che si mantenevano dopo 24 mesi. Dato che le EC dei gruppi di intervento e di controllo al baseline (rispettivamente, 35,7 e 38,3 mesi) differivano significativamente e che l’EC era correlata con QI, EM, e alcuni punteggi della scala Vineland, sono state condotte ulteriori analisi con modello ANCOVA per queste variabili, usando EC come covariante aggiuntiva. Similmente, tre su quattro degli effetti di gruppo sopra descritti restano significativi a livelli convenzionali, ma l’effetto principale della scala Vineland per le Abilità motorie raggiunge solo una marginale significatività, p = 0,057.


Sfortunatamente, durante i test, alcuni bambini non hanno ottenuto un punteggio nelle Reynell Developmental Language Scales, in particolare durante la valutazione iniziale, a causa dei criteri normativi più alti, come richieste, prodotti per la terza edizione del test (Edwards et al., 1997). Per questo, i dati grezzi per questa misurazione appaiono incompleti. Di conseguenza, gli effetti di gruppo delle scale Reynell sono stati valutati usando un’analisi di frequenza in cui il numero di bambini con un punteggio nelle scale Reynell versus i bambini senza punteggio sono stati paragonati usando il test del chi quadro 2 × 2 nei tre momenti di valutazione. Le frequenze dei gruppi sono mostrate nella tabella 3. Questi test non evidenziano differenze tra i gruppi al baseline per la comprensione ma mostrano differenze significative in favore del gruppo d’intervento sia dopo 12 mesi, χ2(1, N = 44) = 4,13, p = 0,042, sia dopo 24 mesi, χ2(1, N = 44) = 8,39, p = 0,004. Allo stesso modo, i gruppi non differivano al baseline nei punteggi di linguaggio espressivo, mentre differenze significative sono state trovate a favore del gruppo d’intervento sia dopo 12 mesi, χ2(1, N = 44) = 5,02, p = 0,025, sia dopo 24 mesi, χ2(1, N = 44) = 10,06, p = 0,002. La tabella 4 espone le valutazioni materne e paterne dei problemi comportamentali e dei comportamenti prosociali e autistici dei loro bambini. Le analisi della covarianza a 24 mesi rivelano un effetto di gruppo significativo per il comportamento sociale positivo riportato dalle madri, F(1,41) = 9,07, p = 0,004, e un effetto di gruppo marginalmente significativo per i padri in questa scala, F(1,28) = 4,09, p = 0,053. In entrambi i casi, nel gruppo di intervento si riportano più comportamenti sociali positivi. Nessun altro effetto principale di gruppo significativo e nessun effetto di interazione è stato trovato per le restanti variabili relative ai bambini riportate dai genitori. Esiti dei genitori. La tabella 5 presenta i punteggi delle misurazioni del benessere materno e paterno nei 2 anni di durata della ricerca. L’unico dato significativo è un effetto di gruppo principale per la depressione paterna. I padri nel gruppo di intervento riportano più sintomi di depressione sia dopo 12 mesi sia dopo 24 mesi, come rivelato da un effetto principale significativo nell’analisi ANCOVA 2 (gruppo) × 2 (tempo), F(1,28) = 5,19, p = 0,031.

Tabella 3. Frequenze dei bambini per gruppo con un punteggio nella scala di comprensione verbale di Reynell e nella scala di linguaggio espressivo ai tre momenti di valutazione Scala di comprensione verbale di Reynell Assessment tempo/Gruppo

Comprensione verbale

Linguaggio espressivo

Intervento

4

2

Controllo

3

1

Intervento

19

17

Controllo

11

8

Intervento

21

21

Controllo

11

10

Baseline

Assessment a 12 mesi

Assessment a 24 mesi

Nota. Gruppo d’intervento: n = 23; gruppo di controllo: n = 21.

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

53


Volume 6, Numero 1 - FEBBRAIO 2008 â&#x20AC;˘ AJMR - Edizione Italiana

B. Remington et al.

Tabella 4. Medie non adattate (DS) delle scale di valutazione genitoriale per il comportamento dei bambini per gruppo e momento di valutazione Baseline Misure genitoriali

Assessment a 24 mesi

Controllo

Intervento

Controllo

Intervento

Controllo

Developmental Behavior Checklist

M

50,26 (22,75)

67,81 (18,77)

45,57 (18,79)

57,71 (22,61)

44,70 (24,20)

60,62 (24,72)

Punteggio totale

P

46,67 (22,15)

57,57 (15,67)

43,67 (16,28)

58,02 (21,05)

45,19 (20,94)

55,20 (19,44)

M

22,22 0(9,54)

31,14 0(9,22)

20,39 0(8,54)

25,38 (10,94)

18,91 (10,29)

26,76 (11,21)

P

22,33 0(9,92)

26,29 0(8,90)

19,53 0(8,23)

25,12 (10,43)

19,50 0(8,80)

24,00 (11,60)

M

10,57 0(4,24)

9,29 0(3,47)

15,22 0(4,09)

11,00 0(4,10)

15,30 0(4,69)

11,86 0(4,84)

P

8,94 0(3,47)

8,73 0(3,67)

13,06 0(3,04)

10,40 0(4,75)

12,69 0(4,06)

11,20 0(5,19)

M

19,26 0(4,93)

21,14 0(5,47)

16,43 0(5,56)

20,14 0(6,55)

15,96 0(5,63)

19,29 0(7,22)

P

20,88 0(4,54)

21,07 0(6,41)

18,44 0(5,54)

20,73 0(7,45)

19,88 0(6,16)

19,47 0(7,46)

Developmental Behavior Checklist Autism algorithm

Nisonger Child Behavior Rating Form: Comportamento sociale positivo

54

Assessment a 12 mesi

Intervento

Autism Screening Questionnaire

Nota. Madri del gruppo dâ&#x20AC;&#x2122;intervento (M): n = 23; madri del gruppo di controllo: n = 21. Padri del gruppo dâ&#x20AC;&#x2122;intervento (P): n = 16; padri del gruppo di controllo: n = 15.

Tabella 5. Medie non adattate (DS) delle misure self-report di benessere genitoriale per gruppo e momento di valutazione Baseline

Misura Stress (QRS-F)

Intervento

Controllo

Assessment a 12 mesi Intervento

Controllo

Assessment a 24 mesi Intervento

Controllo

a

Madre

6,43 0(4,29)

7,24 0(4,19)

7,48 0(4,70)

6,48 0(4,08)

8,52 0(2,97)

8,29 0(2,17)

Padre

6,81 0(4,26)

5,87 0(3,19)

7,88 0(4,27)

5,53 0(3,00)

8,94 0(3,62)

7,60 0(2,72)

Madre

9,35 0(4,21)

9,76 0(4,87)

10,48 0(5,12)

8,52 0(4,72)

9,13 0(4,53)

8,62 0(4,43)

Padre

8,89 0(4,76)

7,93 0(3,67)

7,87 0(4,60)

7,00 0(3,16)

8,38 0(4,08)

8,13 0(4,10)

Madre

8,13 0(4,12)

8,71 0(3,68)

8,04 0(5,80)

7,19 0(4,26)

7,09 0(4,97)

6,90 0(3,94)

Padre

5,69 0(4,42)

7,07 0(3,61)

6,56 0(5,25)

5,27 0(2,99)

7,00 0(5,34)

5,93 0(3,83)

127,30 (27,00)

133,10 (19,37)

127,39 (23,79)

133,43 (18,23)

128,00 (19,62)

132,43 (17,94)

120,94 (20,23)

124,73 (19,66)

122,56 (19,70)

131,40 (15,68)

122,81 (22,47)

128,53 0(9,70)

HADS

b

Ansia

Depressione

Percezioni positive (KIPP-PC)c Madre Padre

Questionnaire on Resources and Stress Friedrich short form. Hospital Anxiety and Depression Scale. c Kansas Inventory of Parental Perceptions Positive Contributions subscale. a

b


Analisi degli esiti per ogni singolo bambino Poiché nelle precedenti ricerche sull’intervento comportamentale intensivo precoce il QI era considerato la principale variabile tra i risultati, e poiché nella presente ricerca ha evidenziato il più forte cambiamento in positivo come risultato dell’intervento, il QI è stato scelto come focus per l’analisi del cambiamento di ogni singolo bambino. Prima di tutto, è stata calcolata la dimensione dell’effetto di gruppo per il QI dopo 24 mesi per rinforzare la significatività clinica dell’effetto generale dell’intervento. La stima delle dimensioni dell’effetto è basata sulla statistica detta d di Cohen. In particolare, la differenza media dei cambiamenti di punteggio di QI tra i due gruppi dopo 24 mesi è usata come numeratore e il raggruppamento di DS dei cambiamenti di punteggio di QI dei due gruppi è usato come denominatore usando la formula di Cohen (J. Cohen, 1988). La dimensione dell’effetto per il QI dopo 24 mesi, calcolata usando questo metodo, è di 0,77, indicando una differenza relativamente grande tra i gruppi (J. Cohen, 1988, considera una d di 0,80 la soglia per un effetto grande). Per analizzare se questa differenza a livello di gruppo si riflettesse sugli esiti dei singoli bambini, è stato applicato il criterio stabilito da Jacobson e Truax (1991) per stabilire la soglia del cambiamento con attendibilità e significatività clinica nei gruppi di intervento e di controllo. Il calcolo di un punteggio indice di cambiamento affidabile può essere usato per stabilire il cambiamento di QI oltre il quale c’è il 95% di possibilità che il cambiamento osservato non derivi da inaffidabilità di misurazione e/o da una variabilità sottostante nei punteggi. Per calcolare il punteggio indice di cambiamento affidabile sono indispensabili due dati: la DS dei QI e la stabilità della misura di QI. Nel processo di identificazione di questi valori è stato usato un approccio conservativo. Non essendo disponibili fonti idonee di informazione normativa relative alla variabilità e alla stabilità del QI in bambini autistici molto piccoli, sono stati utilizzati i dati del presente campione di bambini piuttosto che attenersi alle informazioni normative proposte dai test Stanford-Binet o Bayley (es., la DS per il QI è normalmente 15). Prima di tutto, sono state identificate le DS per il QI per il nostro campione composto di 44 bambini al baseline. In seguito è stata valutata la stabilità del QI in bambini piccoli con autismo durante i 2 anni di ricerca, usando la correlazione tra i QI al baseline e dopo 2 anni solamente per il gruppo di controllo (non trattato). Questo ha dato origine alla miglior valutazione disponibile di stabilità tipica nel QI di bambini piccoli con autismo. Sostituendo questi valori nella formula di Jacobson e Truax (1991, p. 14) si è rivelato un indice di cambio affidabile al livello standard di 1,96, equiparato a un cambiamento di 23,94 punti di QI; il QI di un bambino dopo 2 anni doveva deviare da quello ottenuto all’inizio almeno di tale ammontare prima che il cambio potesse essere considerato affidabile; la figura 1 mostra i cambiamenti di punteggio di QI per ciascun bambino. Questo riflette l’effetto generale di gruppo, in cui un numero maggiore di bambini nel gruppo di intervento evidenzia nel tempo un aumento di QI rispetto al gruppo di controllo. Inoltre, mostra che 6 bambini nel gruppo di intervento (26%) hanno raggiunto un miglioramento affidabile nei 2 anni di ricerca. Anche 3 bambini (14%) del gruppo di controllo sono migliorati, ma allo stesso tempo 3 bambini di questo gruppo (quasi 4) hanno avuto un peggioramento significativo. Anche se l’uso dell’indice di cambio affidabile migliora la metodologia per stabilire i migliori risultati usati in studi precedenti ottenuti con l’uso di valutazioni quantificabili per ogni singolo bambino, questo non è sufficiente a stabilire il significato clinico dei risultati.

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

55


Analisi esplorative delle variabili associate con il cambiamento di QI La figura 1 è una rappresentazione evidente dell’impatto dell’intervento comportamentale intensivo precoce; molti più bambini nel gruppo di intervento che nel gruppo di controllo hanno ottenuto risultati positivi. Questo, però, porta a chiedersi quali fattori siano correlati al successo dell’intervento. Per valutarlo, sono stati valutati dati descrittivi sull’indice di cambiamento affidabile distinguendo tra rispondenti (i 6 bambini che hanno ricevuto l’intervento comportamentale intensivo precoce il cui QI è cambiato positivamente in modo

EIBI - QI

Confronto - QI

Soggetti

56

Il QI di un bambino potrebbe cambiare in modo affidabile senza per questo uscire dalla gamma di punteggi della grave invalidità. Perciò, è utile identificare un QI oltre il quale si considererebbe un bambino come appartenente alla popolazione tipica più che alla popolazione di bambini da cui è stato tratto il campione. Jacobson e Truax (1991) hanno discusso vari criteri per stabilire il significato clinico dei risultati. L’uso del loro Criterio C è raccomandabile quando, come nel presente caso, è possibile identificare la distribuzione non clinica di una variabile (es., QI) e ottenere informazioni ragionevoli sulla distribuzione della variabile in una popolazione clinica. Secondo il Criterio C, il QI che indica cambiamento clinico è a mezza via tra il QI medio dei bambini del presente campione al baseline e la media della popolazione tipica (100). Questo QI è di 81,93. Dopo 2 anni, 5 dei 6 bambini nel gruppo di intervento che hanno ottenuto un cambiamento affidabile hanno raggiunto anche un cambiamento clinicamente significativo (es., il loro QI superava l’81,93); tutti e 3 i bambini nel gruppo di controllo che hanno ottenuto miglioramenti affidabili hanno ottenuto anche un cambiamento clinicamente significativo. Nessun altro bambino in entrambi i gruppi ha ottenuto un cambiamento che fosse sia affidabile che clinicamente significativo.

Soggetti

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

Punti di cambiamento nel QI (23,94)

Punti di cambiamento nel QI (23,94)

Figura 1. Cambiamenti di QI nei bambini dei gruppi di intervento e di controllo. Le barre orizzontali indicano i cambiamenti di QI tra il momento di valutazione iniziale e l’assessment dopo 24 mesi per ciascun bambino nel gruppo d’intervento (grafico a sinistra) e nel gruppo di controllo (grafico a destra). In entrambi i grafici, le linee verticali nere con le frecce indicano il più alto e il più basso limite per un cambiamento affidabile di QI calcolato secondo il criterio di Jacobson e Truax (1991). EIBI = early intensive behavioral intervention (intervento comportamentale intensivo precoce).


affidabile) e non rispondenti (i 6 bambini del gruppo di controllo il cui QI è diminuito; cf. Sherer e Schreibman, 2005). Nonostante sia qui usato il termine non rispondenti, i dati presentati in figura 1 suggeriscono che il QI di questi 6 bambini sia diminuito meno di quanto ci si potesse aspettare in confronto ai bambini che hanno ottenuto i peggiori risultati nel gruppo di controllo. Si dovrebbe dunque ricordare la relatività del termine. La tabella 6 espone i punteggi medi per tutte le variabili continuative al momento della valutazione iniziale per questi due piccoli sottogruppi di bambini. Le medie sono state paragonate calcolando la d di Cohen per ciascuna misurazione. Seguendo le regole generali suggerite da Cohen (1985), le differenze tra l’indice di cambiamento affidabile dei rispondenti e non rispondenti sono state prese in considerazione solo se eccedevano 0,50 (effetto medio) e 0,80 (effetto grande). Queste analisi esplorative indicano che al momento della valutazione iniziale i bambini che hanno risposto più positivamente all’intervento comportamentale differivano dai soggetti che non rispondevano al trattamento nei seguenti modi: hanno punteggi più alti di QI, EM, Vineland (Composito, Comunicazione, Abilità sociali); hanno punteggi più bassi nelle Abilità motorie di Vineland, più problemi comportamentali rivelati sia dalle madri sai dai padri tramite il Developmental Behavior Checklist Autism Algorithm; e hanno ricevuto meno ore di intervento durante il secondo anno. Tabella 6. Medie al baseline (DS) e dimensioni dell’effetto sulle misurazioni dei bambini per i soggetti che rispondono al trattamento in modo più o meno positivo nel gruppo di intervento Baseline

Assessment a 12 mesi

DS

Media

DS

65,00

19,81

47,67

11,55

1,07

22,50

6,98

18,00

4,82

0,75

Punteggi al baseline

Media

QI EM

Grandezza dell’effetto

VABSa Compositi

107,17

12,75

99,50

12,28

0,61

Comunicazione

24,17

8,66

16,17

5,04

1,13

Vita quotidiana

21,17

6,34

21,17

3,82

0,00

Sociale

28,67

3,20

25,67

2,50

1,04

Motoria

33,17

3,54

36,50

6,38

–0,65

Madri

21,67

5,28

21,17

4,49

0,04

Padri

22,00

7,21

22,67

3,50

–0,14

Madri

69,67

18,24

51,83

24,05

0,84

Padri

73,67

9,29

49,80

24,57

1,12

Madri

28,67

8,96

23,83

10,80

–0,49

Padri

34,00

8,00

24,40

9,89

–1,02

Anno 1

970,08

342,11

1009,88

113,92

–0,16

Anno 2

760,58

533,53

1053,42

356,97

–0,65

ASQb

DBCc totale

DBC ASAd

Ore d’intervento

Punteggi Grezzi nelle Vineland Adaptive Behavior Scale. bAutism Screening Questionnaire. cDevelopmental Behavior Checklist. d Autism Screening Algorithm. a

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

57


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

58

Sono stati inoltre considerati i dati di baseline dei 3 bambini nel gruppo di controllo il cui QI è aumentato in modo affidabile e clinicamente significativo nei 2 anni dello studio. Poiché il loro numero era molto piccolo, non è stato possibile completare paragoni statistici formali, ma un’ispezione visiva dei loro punteggi in tutte le misure al baseline non mostra un andamento che possa valere come possibile spiegazione di un miglioramento significativo.

Discussione I dati di questo studio controllato di 2 anni sull’intervento comportamentale intensivo precoce messo a confronto col trattamento tipico nel sistema educativo del Regno Unito mostrano un vantaggio a favore del gruppo di intervento. In accordo con altre ricerche di campo sull’efficacia in questa area, sono stati trovati forti effetti principali di gruppo per QI, EM, Linguaggio espressivo e Comprensione del linguaggio di Reynell, e Abilità di vita quotidiana di Vineland dopo 24 mesi di intervento. Anche se meno significativi, sono stati inoltre trovati cambiamenti significativi nelle Abilità motorie di Vineland e nella abilità di risposta all’attenzione congiunta, misurati con le Early Social Communication Scales. Così come in Cohen e colleghi (2006), sono stati utilizzati i metodi ANCOVA per valutare le interazioni Gruppo × Tempo ed evidenziare una maggiore differenziazione di prestazione con il proseguire dell’intervento; e, così come nello studio di Cohen e colleghi, non è stata trovata alcuna interazione. Anche se rispetto a ricerche precedenti (H. Cohen et al., 2006; Howard et al., 2005) è stata inclusa una gamma più ampia di misurazione dei risultati, l’impatto dell’intervento comportamentale si nota quasi esclusivamente sulle abilità cognitive e linguistiche dei bambini e sul loro funzionamento adattivo. Eccezionalmente, i bambini nel gruppo di intervento evidenziano forti miglioramenti nelle valutazioni genitoriali dei comportamenti sociali positivi, ma non si evidenziano simili cambiamenti nei resoconti genitoriali sui problemi comportamentali dei bambini o sulle stime dei loro comportamenti autistici. Inoltre, c’è un minor numero di marcati miglioramenti nell’attenzione congiunta. Sallows e Graupner (2005), usando i punteggi nei domini dell’Autism Diagnostic Interview–Revised (ADI-R), evidenziano inoltre riduzioni nei sintomi autistici relativi ai deficit sociali e comunicativi, ma non trovano cambiamenti nei comportamenti ritualistici. In ogni caso, non è chiaro se questi punteggi sarebbero cambiati senza l’intervento intensivo poiché non c’era un gruppo di controllo con un intervento non-intensivo. L’assenza di una riduzione relativa nel riportare comportamenti problematici a seguito dell’intervento comportamentale intensivo precoce è in qualche modo sorprendente. Si dovrebbe in ogni caso ricordare che, poiché l’intervento si focalizza primariamente su obiettivi educativi, un’analisi funzionale dettagliata e interventi centrati sui valori funzionali per i comportamenti problematici non sono le componenti principali. Tuttavia, vista la nota associazione tra i problemi di comportamento e la gravità del funzionamento cognitivo e adattivo, specialmente le abilità linguistiche/comunicative (es., McClintock, Hall e Oliver, 2003), ci si possono aspettare benefici positivi sul comportamento del bambino a seguito di un intervento comportamentale precoce. È possibile che l’accresciuta abilità dei bambini nel gruppo di intervento di obbedire alle richieste di attenzione abbia portato all’aumento delle percezioni positive genitoriali dei comportamenti prosociali dei figli. Visto il ruolo di queste abilità pilota nel facilitare lo sviluppo linguistico e cognitivo (Mundy, 1995; Mundy e Crowson, 1997; Mundy e Neal, 1997), questa è una direzione importante per le ricerche future.


Il presente studio inoltre amplia le ricerche precedenti includendo una dettagliata analisi dei risultati genitoriali e i primi dati sui padri. Come ci si poteva aspettare in base alle precedenti ricerche trasversali (Hastings e Johnson, 2001), i benefici dell’intervento comportamentale intensivo precoce sui bambini non aumentavano il carico dei genitori. Non si trova evidenza di un aumento di stress differenziale o di maggiori problemi di salute mentale tra le madri o i padri del gruppo di intervento, anche se questi ultimi riportano più sintomi di depressione nel corso dello studio. Questi padri, ad ogni modo, mostrano meno sintomi di depressione al momento della valutazione iniziale rispetto a quelli del gruppo di controllo; quindi, il risultato potrebbe, almeno in parte, essere un artefatto di una forte regressione all’effetto principale dopo 12 e 24 mesi. Questi risultati sono importanti, perché le difficoltà nell’assestamento genitoriale potrebbero essere considerate a ragione come una controindicazione per un intervento comportamentale svolto a casa che richiede il coinvolgimento quotidiano della famiglia. In generale, la dimensione dell’effetto per l’impatto dell’intervento sui bambini è sostanziale e clinicamente significativa a livello di gruppo (la d di Cohen si avvicinava a 0,80 per il QI dopo 2 anni). H. Cohen e colleghi (2006) non lo riportarono, ma la dimensione dell’effetto sul QI nella loro ricerca – simile nel disegno al presente studio – è leggermente superiore a quello ottenuto nella presente ricerca (calcolato secondo i dati presentati in Cohen e colleghi come circa 0,90). Perciò, i nostri risultati sono paragonabili, nonostante gli interventi siano stati condotti in un periodo di tempo più breve e con una minore quantità di ore di intervento. In studi precedenti, è stato raramente quantificato l’impatto dell’intervento sui singoli soggetti. Al contrario, i ricercatori tendevano a riferire il numero di bambini con punteggi entro la gamma della normalità nelle misurazioni standard. Nel presente studio, si sono ampliate le conoscenze usando l’indice statistico del cambio affidabile di Jacobson e Truax (1991) come criterio preciso per il “miglior risultato”. Questo criterio rivela che il 26% dei bambini che ha ricevuto l’intervento comportamentale intensivo precoce ha raggiunto un cambiamento di QI statisticamente affidabile, e nessuno ha evidenziato una regressione di QI altrettanto affidabile. Nel gruppo di controllo, il 14% è migliorato significativamente ma, sfortunatamente, un altro 14% è peggiorato significativamente. Il cambiamento statistico affidabile serve anche come criterio di principio per identificare le variabili che hanno in comune quei bambini che più hanno beneficiato dell’intervento comportamentale intensivo precoce. Le analisi esplorative dell’indice di cambio affidabile, definendo i rispondenti più e meno positivi, hanno identificato correlazioni di cambiamento che erano già state identificate in studi precedenti (es., H. Cohen et al., 2006; Sallows e Graupner, 2005). Queste includono differenze nei punteggi più alti di funzionamento intellettivo e nelle abilità di comportamento adattivo al momento della valutazione iniziale (inclusi il punteggio totale, la comunicazione e le abilità sociali) nel gruppo dei rispondenti positivi. Sono state inoltre osservate differenze non prima identificate. Oltre ad abilità motorie più povere, i rispondenti più positivi presentano più problemi comportamentali e sintomi autistici più gravi al momento della valutazione iniziale. Questa relazione, apparentemente paradossale, potrebbe forse essere emersa se le misurazioni usate fossero state più sensibili al comportamento di quei bambini con un ritardo dello sviluppo meno grave. Non ci sono ovvie spiegazioni per il cambiamento significativo positivo di QI osservato nei 3 bambini del gruppo di controllo il cui QI è migliorato significativamente nei 2 anni.

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

59


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

60

I presenti risultati indicano che l’intervento comportamentale può essere efficace per bambini piccoli con autismo nel contesto educativo pre-scolare del Regno Unito, un sistema in cui, al contrario degli Stati Uniti, gli amministratori e gli educatori non hanno familiarità con l’intervento comportamentale intensivo precoce e che, in qualche modo, non lo supportano istituzionalmente. Per esempio, i genitori negli Stati Uniti beneficiano delle Leggi Pubbliche 94-142 (1975) e 99-457 (1986), che stabiliscono il diritto ai servizi d’intervento precoce per i bambini da 0 a 3 anni (l’Handicapped Infants and Toddlers Program: Part H). Il Regno Unito non ha una simile legislazione e molte delle sue autorità educative, durante il tempo della ricerca, si sono opposte di routine ai tentativi genitoriali di accedere all’intervento comportamentale intensivo precoce tramite programmazione pubblica (Johnson e Hastings, 2002). Per queste ragioni, non è stato possibile esercitare un alto grado di controllo su molti aspetti pratici dell’attuazione dell’intervento. Per esempio, i tutori che conducevano i servizi basati nelle case, non erano assunti dai ricercatori ma dalle autorità educative o dalle famiglie dei bambini. Ci sono state molte sostituzioni nello staff, i nuovi tutori erano difficili da ottenere e la loro formazione richiedeva tempo. Perciò, nonostante fosse stato stabilito l’obiettivo di 40 ore settimanali di intervento per 2 anni per il gruppo di intervento, gli esiti positivi si sono ottenuti con una media di sole 25,6 ore a settimana. Tuttavia, gli esiti positivi attesi sono stati ottenuti nonostante queste difficoltà, e questo vale come dimostrazione convincente dell’efficacia della ricerca. Così come la maggior parte delle ricerche applicate sull’intervento comportamentale intensivo precoce, il presente studio presenta una serie di limitazioni. Innanzitutto, non essendo una ricerca a controllo casuale, le poche differenze potenzialmente rilevanti notate tra i gruppi al momento della valutazione iniziale (es., l’EC all’inizio del trattamento) si sono dovute controllare statisticamente anziché sperimentalmente. È perciò possibile che, pur cercando di gestire le differenze pre-esistenti tra i gruppi nel modo più rigoroso possibile in uno studio di questo tipo, alcune possano essere passate inosservate. Inoltre, differenze tra i gruppi non considerate prima dell’intervento potrebbero manifestarsi anche in condizioni d’assegnamento casuale con campioni della grandezza tipicamente usata nella ricerca sull’intervento precoce (Drew et al., 2002). Ad ogni modo, sarebbe stato molto difficile eseguire uno studio con controllo casuale in questo caso, poiché la variabile indipendente è un intervento educativo esteso che non può essere condotto con metodo “cieco” e che viene corroborato da una vasta letteratura. Viste le difficoltà nel trovare un trattamento placebo ugualmente credibile, si può ragionevolmente aspettarsi che molti genitori i cui bambini sono stati casualmente assegnati al gruppo di controllo li ritirerebbero dallo studio, e una percentuale di questi cercherebbe l’intervento da qualche altra parte (Lord, Wagner et al., 2005). In queste circostanze, l’intenzione di trattare le analisi potrebbe essere fuorviante. Forse per queste ragioni, gli studi recentemente pubblicati in questa area (es., H. Cohen et al., 2006; Howard et al., 2005) hanno evitato la randomizzazione. Secondo la procedura, le ricerche a controllo casuale di solito includono un intervento preciso, spesso descritto in un manuale; un criterio di selezione dei soggetti severo e un assessment cieco. Il trattamento basato su un protocollo rigido non è una caratteristica del presente studio, in parte perché si è scelto di adottare ampi criteri d’inclusione. Non sarebbe stato pratico produrre un manuale dettagliato che si occupasse di tutte le possibili esigenze; inoltre, i ricercatori non erano in posizione da determinare il corso della terapia per tutti i bambini nel gruppo di intervento che, come visto, ricevevano i servizi da diverse fonti.


Tuttavia, tutti gli interventi sono stati supervisionati da clinici esperti con una conoscenza dettagliata della programmazione comportamentale, e siamo convinti della qualità di gestione del programma. Nei fatti, i problemi pratici di fedeltà del trattamento, soprattutto dovuti alla scarsità di tutor, sono molto più significativi di quelli relativi alla coerenza del trattamento. Per quanto riguarda la potenziale parzialità degli esaminatori, chi ha condotto la valutazione era indipendente dal team d’intervento e formalmente “cieco”, ma, sempre per ragioni pratiche, la valutazione è avvenuta nelle case dei bambini, e in qualche caso indizi fisici o comportamentali potrebbero aver rivelato il tipo di trattamento che stavano ricevendo. Si crede che sia difficile controllare indizi di questo tipo in qualsiasi studio dove c’è una vasta conoscenza professionale sulla natura dell’intervento. È inoltre da considerarsi la questione delle ristrette dimensioni del campione nel presente studio. Anche se si è riusciti a reclutare un campione di grandezza simile a quelli riportati in altre ricerche di valutazione sull’intervento comportamentale intensivo precoce, esiste un problema generale di potere statistico in studi di questo tipo. Qui sono da considerarsi due questioni in particolare. Primo, sono state trovate differenze d’effetto principale negli esiti chiave dei bambini, ma non sono stati trovati termini d’interazione significativa coi modelli ANCOVA 2 × 2. Questo risultato potrebbe significare, come hanno concluso H. Cohen e colleghi (2006), che gli effetti dell’intervento si erano già stabiliti dopo 12 mesi. Non è comunque possibile trarre tale conclusione in modo certo: è possibile che il cambiamento nei secondi 12 mesi sia stato meno marcato ma che in un campione più largo si sarebbe potuto vedere che il vantaggio per il gruppo di intervento continuava a crescere. È necessario condurre ulteriori ricerche su questo argomento. Una seconda questione è che è stata trovata molto poca evidenza di effetti negativi sul benessere genitoriale a causa del coinvolgimento nell’intervento comportamentale intensivo precoce, ma tali effetti potrebbero forse essere osservati in un campione più ampio. Anche se questa possibilità non può essere eliminata, è importante considerare che il presente campione mostra effetti significativi o marginali che con più potere avrebbero chiaramente potuto diventare significativi. È inoltre importante il fatto che i nostri risultati concordino con quelli di tutti gli studi esistenti i cui ricercatori hanno affrontato questa domanda usando vari disegni; nessuno di questi studi evidenzia un effetto negativo sull’assestamento dei membri della famiglia. La restrizione delle dimensioni del campione inoltre permette solo analisi esplorative della grandezza dell’effetto delle differenze tra quei bambini nel gruppo di intervento che hanno risposto più positivamente e quelli che sono peggiorati. Ad ogni modo, questo metodo ha qualche potenziale per l’applicazione in altri studi sui risultati e potrebbe contribuire al processo laddove l’intervento sia focalizzato su quei bambini e quelle famiglie le cui caratteristiche suggeriscono che potrebbero massimamente beneficiare dell’intervento. In conclusione, il presente studio indica che l’intervento per l’autismo infantile basato sull’analisi del comportamento applicata e condotta intensivamente a casa durante il periodo pre-scolare può portare a cambiamenti significativi nel funzionamento dei bambini senza portare con sè un impatto negativo sugli altri membri della famiglia, anche quando condotto in circostanze che per ragioni pratiche non permettono la sua attuazione ottimale. Rimangono in ogni caso domande su entrambi i fattori che meglio prevedono l’efficacia dell’intervento e l’impatto a lungo termine degli effetti osservati. Anche se genitori, educatori e fautori della politica tendono a chiedere se l’intervento comportamentale intensivo precoce “funziona” o “non funziona”, potrebbe rivelarsi più idoneo porsi, invece, domande più

Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

Interventi precoci per l’autismo

61


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

62

modeste ma potenzialmente più accessibili riguardo alla selezione dei bambini per l’intervento intensivo: l’identificazione e la valutazione dei curriculum e dei metodi di insegnamento idonei, e le forme più efficaci di programmi di mantenimento per i bambini alla fine di un prefissato periodo d’intervento precoce.

Bibliografia American Psychiatric Association. (1994). Diagnostic and statistical manual of mental disorders (4th ed.). Washington, DC: Author. Anderson, S.R., Avery, D.L., DiPietro, E.K., Edwards, G.L., & Christian, W.P. (1987). Intensive homebased early intervention with autistic children. Education and Treatment of Children, 10, 352-366. Bayley, N. (1993). Bayley Scales of Infant Development - Second Edition. San Antonio, TX: Psychological Corp. Behr, S.K., Murphy, D.L., & Summers, J.A. (1992). User’s manual: Kansas Inventory of Parental Perceptions (KIPP). Lawrence: University of Kansas, Beach Center on Families and Disability. Berument, S.K., Rutter, M., Lord, C., Pickles, A., & Bailey, A. (1999). Autism Screening Questionnaire: Diagnostic validity. British Journal of Psychiatry, 175, 444-451. Bibby, P., Eikeseth, S., Martin, N.T., Mudford, O.C., & Reeves, D. (2001). Progress and outcomes for children with autism receiving parent-managed intensive interventions. Research in Developmental Disabilities, 22, 425-447. Birnbrauer, J.S., & Leach, D.J. (1993). The Murdoch early intervention program after two years. Behaviour Change, 10, 63-74. Burack, J.A., & Volkmar, F.R. (1992). Development of low- and high-functioning autistic children. Journal of Child Psychology and Psychiatry, 33, 607-616. Carter, A.S., Volkmar, F.R., Sparrow, S.S., Wang, J.J., Lord, C., Dawson, G., Fombonne, E., Loveland, K., Mesibov, G., & Schopler, E. (1998). The Vineland Adaptive Behavior Scales: Supplementary norms for individuals with autism. Journal of Autism and Developmental Disorders, 28, 287-302. Cohen, H., Amerine-Dickens, M., & Smith, T. (2006). Early intensive behavioral treatment: Replication of the UCLA model in a community setting. Developmental and Behavioral Pediatrics, 27, S145-S155. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum. Drew, A., Baird, G., Baron-Cohen, S., Cox, A., Slonims, V., Wheelwright, S., Swettenham, J., Berry, B., & Charman, T. (2002). A pilot randomised control trial of a parent training intervention for preschool children with autism: Preliminary findings and methological challenges. European Child and Adolescent Psychiatry, 11, 266-272. Edwards, S., Fletcher, P., Garman, M., Hughes, A., Letts, C., & Sinka, I. (1997). The Reynell Developmental Language Scales III: The University of Reading Edition. Windsor: NFER Nelson. Eikeseth, S., Smith, T., Jahr, E., & Eldevik, S. (2002). Intensive behavioral treatment at school for 4- to 7-year-old children with autism. Behavior Modification, 26, 49-68. Einfeld, S.L., & Tonge, B.J. (1995). The Developmental Behaviour Checklist: The development and validation of an instrument to assess behavioral and emotional disturbance in children with mental retardation. Journal of Autism and Developmental Disorders, 25, 81-104. Einfeld, S.L., & Tonge, B.J. (2002) Manual for the Developmental Behaviour Checklist (2nd ed.) University of New South Wales, School of Psychiatry, Melbourne; Centre for Developmental Psychiatry, Monash University, Clayton, Victoria. Friedrich, W.N., Greenberg, M.T., & Crnic, K. (1983). A Short Form of the Questionnaire on Resources and Stress. American Journal of Mental Deficiency, 88, 41-48. Glidden, L.M. & Floyd, F.J. (1997). Disaggregating parental depression and family stress in assessing families of children with developmental disabilities: A multi-sample analysis. American Journal on Mental Retardation, 102, 250-266.


Green, G., Brennan, L.C., & Fein, D. (2002). Intensive behavioral treatment for a toddler at high risk for autism. Behavior Modification, 26, 69-102. Hastings, R.P. (2003a). Behavioral adjustment of siblings of children with autism engaged in applied behavior analysis early intervention programs: The moderating role of social support. Journal of Autism and Developmental Disorders, 33, 141-150. Hastings, R.P. (2003b). Child behaviour problems and partner mental health as correlates of stress in mothers and fathers of children with autism. Journal of Intellectual Disability Research, 47, 231-237. Hastings, R.P., & Brown, T. (2002). Behavior problems of autistic children, parental self-efficacy, and mental health. American Journal on Mental Retardation, 207, 222-232. Hastings, R.P., & Johnson, E. (2001). Stress in UK families conducting intensive home-based behavioral intervention for their young child with autism. Journal of Autism and Developmental Disorders, 31, 327-336. Howard, J.S., Sparkman, C.R., Cohen, H.G., Green, G., & Stanislaw, H. (2005). A comparison of intensive behavior analytic and eclectic treatments for young children with autism. Research in Developmental Disabilities, 26, 359-383. Jacobson, N. S., & Truax, P. (1991). Clinical significance: A statistical approach to defining meaningful change in psychotherapy research. Journal of Consulting and Clinical Psychology, 59, 12-19. Johnson, E., & Hastings, R.P. (2002). Facilitating factors and barriers to the implementation of intensive home-based behavioural intervention for young children with autism. Child: Care, Health and Development, 28, 123-129. Kendall, P.C., Chu, B.C., Gifford, A., Hayes, C., & Nauta, M. (1998). Breathing life into a manual: Flexibility and creativity with manual-based treatments. Cognitive and Behavioral Practice, 5, 177-198. Lord, C., Rutter, M., & LeCouteur, A. (1994). Autism Diagnostic Interview Revised: A revised version of a diagnostic interview for caregivers of individuals with possible pervasive developmental disorders. Journal of Autism and Developmental Disorders, 24, 659-685. Lord, C., Wagner, A., Rogers, S., Szatmari, P., Aman, M., Charman, T., Dawson, G., Durand, M.V., Grossman, L., Guthrie, D., Harris, S., Kasari, C., Marcus, L., Odom, S., Pickles, A., Scahill, L., Shaw, E., Siegel, B., Sigman, M., Stone, W., Smith, T., & Yoder, P. (2005). Challenges in evaluating psychosocial interventions for autistic spectrum disorders. Journal of Autism and Developmental Disorders, 35, 695-708. Lovaas, I.O. (1987). Behavioral treatment and normal educational and intellectual functioning in young autistic children. Journal of Consulting and Clinical Psychology, 55, 3-9. Lovaas, I.O. (1993). Teaching developmentally disabled children: The me book. Austin, TX: Pro-Ed. McClintock, S., Hall, S., & Oliver, C. (2003). Risk markers associated with challenging behaviours in people with intellectual disabilities: A meta-analytic study. Journal of Intellectual Disability Research, 47, 405-416. McEachin, J.J., Smith, T., & Lovaas, O.I. (1993). Long-term outcome for children with autism who received early intensive behavioral treatment. American Journal on Mental Retardation, 97, 359-372. McEvoy, R., Rogers, S., & Pennington, B. (1993). Executive function and social communication deficits in young autistic children. Journal of Child Psychology and Psychiatry, 34, 563-578. Mundy, P. (1995). Joint attention and social-emotional approach behaviour in children with autism. Development and Psychopathology, 7, 63-82. Mundy, P., & Crowson, M. (1997). Joint attention and early social communication: Implications for research on intervention with autism. Journal of Autism and Developmental Disorders, 27, 653-676. Mundy, P., Hogan, A., & Dohering, P. (1996). A preliminary manual for the abridged Early Social Communication Scales. Coral Gables, FL: University of Miami. Available at hfft://www.psy.miami. edu/fculty/pmundy Mundy, P., & Neal, R. A. (1997). Neural plasticity, joint attention, and a transactional social-orienting model of autism. International Review of Research in Mental Retardation, 23, 139-168. Mundy, P., Sigman, M., Ungerer J., & Sherman, T. (1986). Social interactions of autistic, mentally retarded and normal children and their caregivers. Journal of Child Psychology and Psychiatry, 27, 647-656.

Volume 6, Numero 1 - FEBBRAIO 2008 â&#x20AC;˘ AJMR - Edizione Italiana

Interventi precoci per lâ&#x20AC;&#x2122;autismo

63


Volume 6, Numero 1 - FEBBRAIO 2008 • AJMR - Edizione Italiana

B. Remington et al.

64

Partington, J. W., & Sundberg, M. L. (1998). The Assessment of Basic Language and Learning Skills: An assessment, curriculum guide, and tracking system for children with autism or other developmental disabilities. Danville, CA: Behavior Analysts. Persons, J.B., & Silberschatz, G. (1998). Are results of randomized clinical trials useful to psychotherapists? Journal of Consulting and Clinical Psychology, 66, 126-135. Sallows, G., & Graupner, T. (2005). Intensive behavioral treatment for children with autism. American Journal on Mental Retardation, 110, 417-438. Schopler, E., Mesibov, G., & Baker, A. (1982). Evaluation of treatment for autistic children and their parents. Journal of American Academy of Child Psychiatry, 21, 262-267. Seligman, M.E.P. (1995). The effectiveness of psychotherapy. American Psychologist, 50, 965-974. Sheinkopf, S.J., & Siegel, B. (1998). Home-based behavioral treatment of young children with autism. Journal of Autism and Developmental Disorders, 28, 15-23. Sherer, M., & Schreibman, L. (2005). Individual behavioral profiles and predictors of treatment effectiveness for children with autism. Journal of Clinical and Consulting Psychology, 73, 525-538. Smith, T., Buch, G.A., & Gamby, T.E. (2000). Parent-directed, intensive early intervention for children with pervasive developmental disorder. Research in Developmental Disabilities, 21, 297-309. Smith, T., Groen, A.D., & Wynn, J.W. (2000). Randomized trial of intensive early intervention for children with pervasive developmental disorder. American Journal on Mental Retardation, 105, 269-285. Sparrow, S., Balla, D.A., & Cicchetti, D. (1984). Vineland Adaptive Behavior Scales. Circle Pines, MN: American Guidance Service. Stahmer, A.C., & Ingersoll, B. (2004). Inclusive programming for toddlers with autism spectrum disorders: Outcomes from the Children’s Toddler School. Journal of Positive Behavior Interventions, 6, 67-82. Sundberg, M.L., & Partington, J.W. (1999). The need for both discrete trial and natural environment language training for children with autism. In P.M. Ghezzi, W.L. Williams & J.E. Carr (Eds.), Autism: Behavior analytic perspectives (pp. 139-156). Reno, NV: Context Press. Surgeon General. (1999). Mental health: A report of the surgeon general. Washington, DC: Department of Health and Human Services. Tassé, M.J., Aman, M.G., Hammer, D., & Rojhan, J. (1996). The Nisonger Child Behavior Rating Form: Age and gender effects and norms. Research in Developmental Disabilities, 7, 59-75. Thorndike, R.L., Hagan, E.P., & Sattler, J.M. (1986). The Stanford–Binet Intelligence Scale (4th ed.). Chicago: Riverside. Weiss, M. (1999). Differential rates of skill acquisition and outcomes of early intensive behavioral intervention for autism. Behavioral Interventions, 14, 3-22. Whitehurst, G.J. (2003). Identifying and implementing educational practices supported by rigorous evidence: A user friendly guide. Washington, DC: U.S. Department of Education, Institute of Education Sciences, National Center for Education Evaluation. Zigmond, A.S., & Snaith, P.R. (1983). The Hospital Anxiety and Depression Scale. Acta Psychiatrica Scandinavica, 63, 361-370.


2008_01_Leoni_SIS_Italy_standardization