220
Originalarbeit
Der Childhood Trauma Screener (CTS) – Entwicklung und Validierung von Schwellenwerten zur Klassifikation The Childhood Trauma Screener (CTS) – Development and Validation of Cut-Off-Scores for Classificatory Diagnostics Autoren
Heide Glaesmer1, Andrea Schulz2, Winfried Häuser3, Harald J. Freyberger2, Elmar Brähler1, Hans-Jörgen Grabe2
Institute
1
Abteilung für Medizinische Psychologie und Medizinische Soziologie, Universität Leipzig Klinik und Poliklinik für Psychiatrie und Psychotherapie, Universitätsmedizin Greifswald, Helios-Klinikum Stralsund 3 Klinik für Innere Medizin I, Klinikum Saarbrücken GmbH 2
Sonderdruck für private Zwecke des Autors
Schlüsselwörter
" Childhood Trauma Screener ● " Childhood Adversities ● " Schwellenwerte ● " kategoriale Diagnostik ●
Keywords
" Childhood Trauma Screener ● " childhood adversities ● " cut-off-scores ● " categorical diagnostics ●
Zusammenfassung !
Anliegen: Es sollen Schwellenwerte für die Klassifikation von Vernachlässigung und Missbrauch mithilfe des CTS entwickelt und validiert werden. Methodik: Auf Basis zweier Bevölkerungsstudien werden Schwellenwerte bestimmt und anhand des Außenkriteriums Depression validiert.
Einführung !
Bibliografie DOI http://dx.doi.org/ 10.1055/s-0033-1343116 Online-Publikation: 5.4.2013 Psychiat Prax 2013; 40: 220–226 © Georg Thieme Verlag KG Stuttgart · New York ISSN 0303-4259 Korrespondenzadresse PD Dr. Heide Glaesmer Universität Leipzig, Abteilung für Medizinische Psychologie und Medizinische Soziologie Philipp-Rosenthal-Straße 55 04103 Leipzig
[email protected]
Lebensgeschichtlich frühe traumatische Erfahrungen sind für die Entwicklung psychischer, psychosomatischer und körperlicher Erkrankungen in der Kindheit, aber auch später im Erwachsenenalter von großer Bedeutung [1, 2]. Insbesondere Vernachlässigung und Missbrauch in Kindheit und Jugend spielen eine zentrale Rolle [3 – 5]. Zur retrospektiven reliablen und validen Erfassung von Vernachlässigung und Missbrauch in Kindheit und Jugend stehen verschiedene Instrumente zur Verfügung. Der international am häufigsten eingesetzte Fragebogen ist die Kurzform des Childhood Trauma Questionnaire (CTQ) [6]. Der CTQ besteht aus 28 Items, von denen jeweils 5 die 5 Subskalen körperlicher, sexueller und emotionaler Missbrauch sowie körperliche und emotionale Vernachlässigung messen. Die Antworten werden auf einer 5-stufigen LikertSkala erfasst, die von „überhaupt nicht (1)“ bis „sehr häufig (5)“ reicht. Zusätzlich gibt es eine Bagatellisierungsskala mit 3 Items zur Identifikation von Antworttendenzen zur Verleugnung und Bagatellisierung. Die deutsche Version des CTQ findet Anwendung im klinischen und nichtklinischen Kontext [7, 8]. Sie stellt insgesamt ein reliables und valides Selbstbeurteilungsinstrument zur retrospektiven Erfassung früher traumatischer Erfahrungen dar, auch wenn die Subskala „körperliche Vernachläs-
Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
Ergebnisse: Die bestimmten Schwellenwerte differenzieren gut hinsichtlich der Häufigkeit von Depressionen, und zeigen mit Ausnahme der Dimension „körperliche Vernachlässigung“ gute bis sehr gute Sensitivitäten und Spezifitäten zum Childhood Trauma Questionnaire. Schlussfolgerung: Die Schwellenwerte unterstützen die Nutzung des CTS zur kategorialen Diagnostik.
sigung“ mit Vorsicht einzusetzen ist, da deren interne Konsistenz unbefriedigend zu sein scheint [9]. Zur ökonomischen Erfassung früher traumatischer Erfahrungen wurde aus dem CTQ ein Kurzscreener (Childhood Trauma Screener) mit insgesamt 5 Items entwickelt [10]. Auf Basis einer großen Bevölkerungsstichprobe wurde dazu aus jeder der 5 Subskalen des CTQ, dasjenige Item ausgewählt, welches nach Aspekten von Trennschärfe, Varianzaufklärung und Praktikabilität die Dimension am besten abbildete [10]. Die Korrelationen der Items mit den zugehörigen Skalen bewegten sich zwischen r = 0,55 und r = 0,87. Die interne Konsistenz des Childhood Trauma Screeners (CTS) (α = 0,757) ist gut. Der CTS stellt damit ein reliables und sehr ökonomisches Instrument zur Erfassung traumatischer Erfahrungen in Kindheit und Jugend dar [10]. Kurzscreener sind zur ökonomischen Erfassung von Außenkriterien in Studien, aber auch in 2-stufigen diagnostischen Prozessen zu empfehlen [11]. Anhand einer zweiten großen Bevölkerungsstichprobe konnte die Itemauswahl des CTS [10] untermauert werden, bisher stand jedoch die Ableitung von Schwellenwerten zur Identifikation von Kindesmisshandlung betroffener Personen noch aus [11]. Die vorliegende Untersuchung zielt auf Basis zweier großer Bevölkerungsstudien auf die Identifikation solcher Cut-off-Werte für den CTS ab. Dazu werden zunächst anhand der üblichen
Originalarbeit
Methodik !
Stichproben Stichprobe 1 (SHIP-LEGENDE) Die Daten wurden im Rahmen der DFG-geförderten Life-Events and Gene-Environment Interaction in Depression (LEGENDE)-Studie in einer Allgemeinbevölkerungsstichprobe erhoben. Das LEGENDE-Projekt deckt mit der Untersuchung von Gen-Umwelt-Interaktionen bei der Entwicklung psychischer Erkrankungen einen Teilbereich der umfassend angelegten multimodalen, prospektiven Allgemeinbevölkerungsstudie Study of Health in Pomerania [SHIP] [13] ab. Von den ursprünglich 4308 Personen aus der ersten Erhebungswelle (SHIP-0), konnten 3669 Probanden zu den Untersuchungen der SHIP-LEGENDE-Studie eingeladen werden. Während der Datenerhebung im Zeitraum von 2007 – 2010 verstarben 92 Probanden, weitere 1011 Personen lehnten eine Teilnahme an der Studie ab. Zu 132 Personen konnte kein Kontakt hergestellt werden und weitere 35 Probanden erschienen nicht zum vereinbarten Interviewtermin. Folglich konnten 2400 Probanden für die SHIP-LEGENDE-Studie untersucht werden. Bei Zusage der Probanden wurde vor dem vereinbarten Interviewtermin ein umfassendes Fragebogenpaket (vgl. [14 – 16]) mit einer Aufklärung über die Ziele und Methoden der Untersuchung verschickt. Fragen der Probanden zur Studie, den Fragebögen oder zum Datenschutz wurden von den geschulten Interviewern (Psychologen bzw. Psychologiestudenten im Hauptstudium) direkt vor dem Interview in den Untersuchungszentren Greifswald oder Stralsund bzw. beim Probanden zu Hause beantwortet. Jeder Proband unterschrieb vor Beginn der Untersuchung eine Einverständniserklärung. Das durchschnittliche Alter der 2400 Probanden lag bei 55,1 Jahren (SD = 13,7; Range: 29 – 89 Jahre). 52,4 % waren Frauen. 47,5 % schlossen ihre Schulausbildung nach 10 Jahren ab, 31,3 % schlossen die Schule nach weniger als 10 Jahren und 19,7 % nach mehr als 10 Jahren ab. 1,5 % der Befragten machten keine Angaben zur Schulausbildung. Aufgrund mangelnder Verlässlichkeit der Daten (z. B. aufgrund kognitiver Einschränkungen, Widersprüche der Angaben) wurden vom LEGENDE-Datensatz 274 Probanden ausgeschlossen. Die Analysen beruhen auf 2126 Probanden der Studie mit vollständigem Datensatz. In der Befragung wurden neben dem CTQ und dem daraus abgeleiteten CTS, das Beck Depression Inventory II (BDI-II) [17] und das Munich-Composite International Diagnostic Interview (M-CIDI) [18] eingesetzt.
Stichprobe 2 (Repräsentativbefragung 2010) Die zweite Stichprobe wurde im Rahmen einer bevölkerungsrepräsentativen Befragung, die im Jahr 2010 durch ein unabhängiges Institut für Meinungs- und Sozialforschung (USUMA, Berlin) durchgeführt wurde, gewonnen. Die Stichprobenziehung der Haushalte (258 sample points) erfolgte nach dem „RandomRoute-Verfahren“. Die Zielperson im Haushalt wurde ebenfalls per Zufall ermittelt und in einem Face-to-Face-Interview durch
geschulte Interviewer befragt. Die Ausgangsstichprobe bestand aus 4455 Personen im Alter von 14 – 92 Jahren, von denen 2500 (56 %) Personen tatsächlich an der Studie teilnahmen. Die Gründe für eine Nichtteilnahme waren Verweigerung des Interviews (15,6 %) und das Nichtantreffen der Zielperson (28,4 %). Das durchschnittliche Alter der 2500 Befragten lag bei 50,6 Jahren (SD = 18,6; Range: 14 – 90 Jahre). 53,2 % waren Frauen. Einen Hochschulabschluss besaßen 6,9 %, das Abitur bzw. Hochschulreife 7,3 %, einen Realschul- oder Fachschulabschluss bzw. einen Abschluss der Polytechnischen Oberschule (Schulabschluss in der ehemaligen DDR) wiesen 37 % vor, 44 % hatten einen Hauptschulabschluss, keinen Abschluss hatten 1,6 % und 3,2 % besuchten zum Befragungszeitpunkt noch die Schule. In der Befragung wurde neben dem CTQ und dem daraus abgeleiteten CTS der Patient Health Questionnaire-2 (PHQ-2) [19, 20] eingesetzt.
Psychometrische Verfahren Patient-Health-Questionnaire-2 (PHQ-2) Der PHQ-2 ist ein Kurzscreener, der aus dem Depressionsmodul des Patient-Health-Questionnaire entwickelt wurde. Er enthält lediglich die beiden ersten Items und erfasst damit die Kernsymptome der Major Depression (Anhedonie, Antriebsverlust). Die beiden Symptome werden mit den Items auf einer 4-stufigen Likert-Skala von „überhaupt nicht“ (0) bis „beinahe jeden Tag“ (3) eingeschätzt. Der Summenwert des PHQ-2 variiert damit zwischen 0 und 6. Trotz der Kürze zeigte der PHQ-2 (Cut-off ≥ 3 für klinisch bedeutsame Depression) bisher äußerst vielversprechende und mit längeren Screeningskalen vergleichbare Sensitivitäts- und Spezifitätswerte [19, 20].
Beck-Depressions-Inventar II (BDI-II) Das Ausmaß depressiver Beschwerden wurde mit dem BDI-II ermittelt, einem Selbstbeurteilungsfragebogen mit guter Reliabilität und Validität [17, 21]. Die revidierte Version des Beck-Depressions-Inventars (BDI-II) ist ein Fragebogen mit 21 Items zur Bestimmung der aktuellen Schwere einer Depression. Die Symptomfragen entsprechen den Kriterien zur Diagnose einer Depression, die im Diagnostischen und Statistischen Manual Psychischer Störungen (DSM-IV) aufgeführt sind. Der Beurteilungszeitraum bei der Beantwortung der Fragen durch den Probanden bezieht sich auf die vergangenen 2 Wochen. Folgende Symptome werden mit ihrem Schweregrad durch das BDI-II erfasst: Traurigkeit, Pessimismus, Versagensgefühle, Verlust von Freude, Schuldgefühle, Bestrafungsgefühle, Selbstablehnung, Selbstvorwürfe, Selbstmordgedanken, Weinen, Unruhe, Interessenverlust, Entschlussunfähigkeit, Wertlosigkeit, Energieverlust, Veränderungen der Schlafgewohnheiten, Reizbarkeit, Veränderungen des Appetits, Konzentrationsschwierigkeiten, Ermüdung oder Erschöpfung und Verlust an sexuellem Interesse. Der Gesamtwert des BDI-II kann Werte zwischen 0 und 63 Punkten annehmen. Laut Manual ergeben sich nach den Summenwerten folgende Schweregradstufen depressiver Symptomatik: unauffällige (0 – 8 Punkte), minimale (9 – 13 Punkte), leichte (14 – 19 Punkte), mittlere (20 – 28 Punkte) und schwere (ab 29 Punkten) Ausprägung depressiver Symptome.
Munich-Composite International Diagnostic Interview (M-CIDI) Die Lebenszeitdiagnose Depression wurde über das vollstandardisierte, computerisierte Munich-Composite International Diagnostic Interview (M-CIDI) bestimmt. Das im Auftrag der WHO und dem National Institute of Mental Health (NIMH, USA) am Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
Sonderdruck für private Zwecke des Autors
Schweregradeinteilung des CTQ und der Verteilung der Schweregrade in den CTS-Items geeignete Schwellenwerte entwickelt, die zu möglichst vergleichbaren Fallidentifikationsraten führen. Die externe Validität dieser Schwellenwerte wird dann mit Hilfe verschiedener Depressionsmaße aus den verwendeten Studien überprüft, da depressive Störungen eine der wichtigsten psychischen Folgen von Missbrauch und Vernachlässigung in Kindheit und Jugend sind [12].
221
222
Originalarbeit
Tab. 1
Häufigkeitsverteilung nach CTQ-Skalen und CTS-Items in beiden Stichproben.
CTQ-Skalen*
emotionaler Missbrauch
körperlicher Missbrauch
sexueller Missbrauch
emotionale Vernachlässigung
Sonderdruck für private Zwecke des Autors
körperliche Vernachlässigung
CTS-Items*
kein/
gering/
mäßig/
schwer/
gar nicht
selten
einige
häufig
sehr häufig
minimal
mäßig
schwer
extrem
n (%)
n (%)
Male
n (%)
n (%)
n (%)
n (%)
n (%)
n (%)
SHIPLEGENDE
1878 (88,3)
174 (8,2)
41 (1,9)
33 (1,6) Σ 3,5 %
1851 (87,1)
165 (7,8)
55 (2,6)
39 (1,8)
16 (0,8) Σ 5,2 %
Rep2010
2123 (85,0)
259 (10,4)
75 (3,0)
40 (1,6) Σ 4,6 %
2145 (85,9)
182 (7,3)
103 (4,1)
36 (1,4)
31 (1,2) Σ 6,7 %
SHIPLEGENDE
1940 (91,3)
91 (4,3)
56 (2,6)
39 (1,8) Σ 4,4 %
1860 (87,5)
167 (7,9)
61 (2,9)
30 (1,4)
8 (0,4) Σ 4,7 %
Rep2010
2198 (88,0)
162 (6,5)
70 (2,8)
69 (2,8) Σ 5,6 %
2189 (87,6)
178 (7,1)
92 (3,7)
30 (1,2)
10 (0,4) Σ 5,3 %
SHIPLEGENDE
1982 (93,2)
74 (3,5)
52 (2,4)
18 (0,8) Σ 3,2 %
2034 (95,7)
59 (2,8)
26 (1,2)
2 (0,1)
5 (0,2) Σ 4,3 %
Rep2010
2186 (87,4)
158 (6,3)
109 (4,4)
47 (1,9) Σ 6,3 %
2326 (93,1)
104 (4,2)
52 (2,1)
13 (0,5)
3 (0,1) Σ 6,9 %
SHIPLEGENDE
1321 (62,1)
553 (26,0)
117 (5,5)
135 (6,3) Σ 11,8 %
1164 (54,8)
628 (29,5)
120 (5,6)
118 (5,6)
96 (4,5) Σ 10,1 %
Rep2010
1259 (50,5)
888 (35,6)
184 (7,4)
164 (6,6) Σ 14,0 %
1165 (46,7)
910 (36,5)
254 (10,2)
85 (3,4)
82 (3,3) Σ 6,7 %
SHIPLEGENDE
1318 (62,0)
476 (22,4)
242 (11,4)
90 (4,2) Σ 14,6 %
1277 (60,1)
384 (18,1)
239 (11,2)
94 (4,4)
132 (6,2) Σ 10,6 %
Rep2010
1288 (51,6)
491 (19,7)
450 (18,0)
269 (10,8) Σ 28,8 %
1112 (44,6)
670 (26,9)
347 (13,9)
86 (3,4)
278 (11,2) Σ 14,7 %
n (%)
* hellgrau unterlegt sind die Kategorien, die im Sinne des Schwellenwerts zusammengefasst wurden; CTS = Childhood Trauma Screener, CTQ = Childhood Trauma Questionnaire
Max-Planck-Institut für Psychiatrie in München entwickelte Verfahren dient der Erfassung von insgesamt 64 psychischen Störungen nach den Diagnosekriterien des ICD-10 und des DSM-IV. Das Interview folgt einem modularen Aufbau mit auf Screeningfragen beruhenden Sprungregeln, wodurch, trotz der standardisierten Durchführung, Probanden nur die für ihr spezifisches Störungsbild relevanten Fragen zu beantworten haben. In die Analysen gehen hier nur die Ergebnisse aus der Sektion „depressive Störungen und Dysthymie“ ein. Das M-CIDI verfügt nach verschiedenen Validierungsstudien [18, 22] über akzeptable bis sehr gute psychometrische Kennwerte.
Statistische Analysen Die Analysen werden jeweils an beiden Stichproben durchgeführt um herauszufinden, ob die Ergebnisse für beide Stichproben vergleichbar sind. Zunächst werden die absoluten und relativen Häufigkeiten für die CTQ-Skalen und die daraus extrahierten CTS-Items für beide Stichproben berechnet. Auf den CTQ-Skalen werden in der Forschung häufig die Kategorien „mäßig bis schwer“ und „schwer bis extrem“ (vgl. [23]) als auffällig eingestuft. Der Anteil der von Kindesmisshandlung betroffenen Personen nach den CTQ-Skalen wird für beide Stichproben dargestellt. Anhand dieser Häufigkeiten wird dann entschieden, wo der Schwellenwert für die CTS-Items zu setzen ist, um vergleichbare Anteile betroffener Personen zu identifizieren (Fallidentifikationsrate). Zur Überprüfung der externen Validität werden in einem weiteren Schritt die Depressionswerte (dimensional nach BDI-II bzw. PHQ-2) und kategorial (nach M-CIDI bzw. Cut-off des PHQ-2) für die von Kindesmisshandlung betroffenen und unbetroffenen Personen nach CTQ-Skalen und CTS-Items in beiden Stichproben dargestellt. Die Unterschiede hinsichtlich der depressiven Symptomatik zwischen den betroffenen und unbetroffenen Personen werden in linearen bzw. logistischen Regressionsanalysen unter Berücksichtigung von Geschlecht und Alter geprüft. In einem Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
letzten Schritt werden Sensitivität und Spezifität der CTS-Items zu den CTQ-Skalen berechnet.
Ergebnisse !
Häufigkeiten von Vernachlässigung und Missbrauch in beiden Stichproben anhand der CTQ-Skalen und der CTS-Items
● Tab. 1 stellt die Häufigkeiten der 4 Abstufungen von Vernach"
lässigung bzw. Missbrauch in beiden Stichproben anhand der CTQ-Skalen bzw. der Abstufungen der Items des CTS dar. Im CTQ werden die beiden Schweregradkategorien „mäßig bis schwer“ und „schwer bis extrem“ (hellgrau unterlegt) üblicherweise als auffällig betrachtet. Die Anteile der Personen in diesen beiden Kategorien werden für beide Stichproben jeweils aufsummiert. Es wird deutlich, dass der Anteil von Kindesmisshandlung betroffener Personen in allen Subskalen in der Rep2010 höher ist als in der SHIP-LEGENDE-Stichprobe. In einem zweiten Schritt wird dann für die Stufen der CTS-Items ein Schwellenwert festgelegt, der zu einer vergleichbar hohen Fallidentifikationsrate führt. Für die Subdimensionen emotionaler bzw. körperlicher Missbrauch werden die Kategorien „einige Male“ bis „sehr häufig“ als auffällig kategorisiert. Für die Subdimension sexueller Missbrauch wird die Schwelle niedriger gesetzt und bereits Angaben ab „selten“ bis hin zu „sehr häufig“ als auffällig betrachtet. Für die Subdimensionen emotionale bzw. körperliche Vernachlässigung wird der Schwellenwert höher angesetzt, nur die beiden obersten Antwortstufen „häufig“ und „sehr häufig“ " Tab. 1 sind diese werden hier als auffällig klassifiziert. In ● Schwellenwerte durch hellgraue Unterlegungen gekennzeichnet. Bei der Festlegung der Schwellenwerte wird versucht, bei Abweichungen zwischen den 2 Stichproben ausgewogene Entscheidungen zu treffen. Ziel war es, Schwellenwerte abzuleiten, die der Verteilung in beiden Stichproben gerecht werden.
Originalarbeit
223
Tab. 2 Depressivität (Mittelwerte BDI/PHQ-2) differenziert nach initiierten (CTS) und etablierten (CTQ) Schwellenwerten in beiden Stichproben (SHIPLEGENDE, Rep2010).
CTS-Items mäßig/ schwer
unstand. Beta (KI) #
gar nicht – selten
einige Male – sehr häufig
unstand. Beta (KI) #
SHIP-LEGENDE (BDI)
6,06
14,17
8,25 (6,61 – 9,90)***
6,06
11,62
5,53 (4,16 – 6,70)***
Rep2010 (PHQ-2)
0,80
1,87
0,92 (0,80 – 1,04)***
0,80
1,57
0,75 (0,57 – 0,92)***
gar nicht – selten
einige Male – sehr häufig
körperlicher Missbrauch SHIP-LEGENDE (BDI)
6,13
10,99
5,02 (3,55 – 6,49)***
6,18
9,70
3,74 (2,30 – 5,19)***
Rep2010 (PHQ-2)
0,78
2,02
0,74 (0,61 – 0,87)***
0,79
1,94
1,13 (0,94 – 1,32)***
gar nicht
seltensehr häufig
sexueller Missbrauch SHIP-LEGENDE (BDI)
6,21
10,35
3,88 (2,16 – 5,60)***
6,20
9,64
3,14 (1,63 – 4,66)***
Rep2010 (PHQ-2)
0,80
1,65
0,79 (0,67 – 0,93)***
0,80
1,55
0,70 (0,53 – 0,87)***
gar nicht – einige Male
häufig – sehr häufig
emotionale Vernachlässigung SHIP-LEGENDE (BDI)
5,91
9,58
3,71 (2,78 – 4,65)***
6,03
9,12
3,04 (2,03 – 4,05)***
Rep2010 (PHQ-2)
0,74
1,55
0,54 (0,46 – 0,63)***
0,72
1,49
0,75 (0,64 – 0,87)***
gar nicht – einige Male
häufig – sehr häufig
körperliche Vernachlässigung SHIP-LEGENDE (BDI)
5,87
8,93
3,02 (2,19 – 3,87)***
6,10
8,41
2,26 (1,27 – 3,25)***
Rep2010 (PHQ-2)
0,68
1,27
0,46 (0,37 – 0,55)***
0,75
1,12
0,34 (0,24 – 0,44)***
# Lineare Regression unter Berücksichtigung von Alter und Geschlecht; BDI = Mittelwert des BDI-II; PHQ-2 = Summenwert des PHQ-2; KI = Konfidenzintervall; CTS = Childhood Trauma Screener, CTQ = Childhood Trauma Questionnaire; *** p < 0,001
Externe Validität der Schwellenwerte anhand verschiedener Depressionsmaße
Sensitivität und Spezifität der CTS-Items in Bezug auf die CTQ-Subskalen
Die externe Validität der im ersten Schritt festgelegten Schwellenwerte wird in einem zweiten Schritt anhand der Depressivität bzw. dem Vorliegen depressiver Störungen geprüft durch den Vergleich von als auffällig bzw. unauffällig klassifizierten Personen nach CTS. Da depressive Störungen eine der wichtigsten psychischen Folgen von Missbrauch und Vernachlässigung in Kindheit und Jugend sind, stellen diese ein geeignetes Außenkriteri" Tab. 2 stellt die mittleren Werte des PHQ-2 (Rep2010) um dar. ● bzw. des BDI-II (SHIP-LEGENDE) für die unauffälligen bzw. die auffälligen Personen nach CTQ bzw. CTS dar. Die linearen Regressionsanalysen zeigen, dass sich in beiden Stichproben die beiden Gruppen signifikant unterscheiden. Die als auffällig klassifizierten Personen zeigen in beiden Stichproben und auf allen Skalen signifikant höhere Werte für Depressivität. " Tab. 3 stellt die Lebenszeitprävalenzen der majoren Depres● sion (nach M-CIDI, SHIP-LEGENDE) bzw. die Screening-Positiven nach PHQ-2 (Rep2010) für die auffälligen bzw. unauffälligen Personen nach CTQ bzw. CTS dar. Die logistischen Regressionsanalysen zeigen auch hier signifikante Unterschiede in den Häufigkeiten depressiver Störungen zwischen den auffälligen und unauffälligen Personen in beiden Stichproben und in den Subdimensionen. Einzige Ausnahme ist die Subdimension körperliche Vernachlässigung in der SHIP-LEGENDE-Stichprobe. Hier findet sich kein signifikanter Unterschied hinsichtlich der Lebenszeitdiagnose Depression.
Im ersten Schritt wird versucht, die Schwellenwerte für die CTSItems so zu gestalten, dass die Fallidentifikationsraten etwa denen der CTQ-Skalen entsprechen. Dabei bleibt jedoch noch unklar, ob mit den CTS-Items und den jeweiligen Schwellenwerten die gleichen Fälle identifiziert werden. Aus diesem Grund wer" Tab. 4 die Sensitivitäten und Spezifitäten zum CTQ für den in ● alle Subdimensionen in beiden Stichproben dargestellt. Die Spezifitäten bewegen sich in beiden Stichproben über alle Subdimensionen hinweg in einem sehr hohen Bereich. Im Gegensatz dazu zeigen sich in einigen Subdimensionen weniger zufriedenstellende Sensitivitäten. Insbesondere die Subdimension körperliche Vernachlässigung stellt mit Werten von 0,44 bzw. 0,66 ein Problem dar. Darüber hinaus ist die Sensitivität mit 0,68 für die Dimension emotionale Vernachlässigung in der SHIP-LEGENDEStichprobe und die von 0,65 für die Dimension körperlicher Missbrauch in der Rep2010 unbefriedigend. Mit Blick auf die Häufig" Tab. 1) erscheint es jedoch nicht sinnvoll, keitsverteilungen (● die Schwellenwerte für diese beiden Dimensionen weiter abzusenken, weil sich damit zwar die Sensitivität erhöhen würde, gleichzeitig aber die Spezifität eingeschränkt würde.
Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
Sonderdruck für private Zwecke des Autors
CTQ-Skalen kein/mäßig
emotionaler Missbrauch
224
Originalarbeit
Tab. 3 Depressive Störungen (nach M-CIDI bzw. Screeningkriterium des PHQ-2) differenziert nach initiierten (CTS) und etablierten (CTQ) Schwellenwerten in beiden Stichproben (SHIP-LEGENDE, Rep2010).
CTQ-Skalen emotionaler Missbrauch
kein/mäßig n (%)
CTS-Items mäßig/ schwer n (%)
OR (KI) #
gar nicht – selten n (%)
einige Male – sehr häufig n (%)
OR (KI) #
SHIP-LEGENDE (MDD-CIDI)
326 (15,9)
34 (45,9)
3,74 (2,31 – 6,07)***
320 (15,9)
40 (36,4)
2,75 (1,81 – 4,16)***
Rep2010 (PHQ-2)
110 (5,2)
83 (22,2)
5,28 (3,86 – 7,21)***
6,6
23,1
4,14 (2,79 – 6,16)***
gar nicht – selten
einige Male – sehr häufig
körperlicher Missbrauch SHIP-LEGENDE (MDD-CIDI)
335 (16,5)
25 (26,3)
1,83 (1,13 – 2,97)*
334 (16,5)
26 (26,3)
1,84 (1,15 – 2,95)*
Rep2010 (PHQ-2)
130 (5,9)
63 (21,0)
4,10 (2,96 – 5,75)***
6,4
32,8
6,51 (4,32 – 9,78)***
gar nicht
selten – sehr häufig
sexueller Missbrauch SHIP-LEGENDE (MDD-CIDI)
336 (16,3)
24 (34,3)
2,29 (1,37 – 3,84)**
329 (16,2)
31 (33,7)
2,17 (1,38 – 3,44)**
Rep2010 (PHQ-2)
121 (5,5)
72 (23,1)
4,97 (3,59 – 6,87)***
6,6
23,4
4,16 (2,79 – 6,19)***
gar nicht – einige Male
häufig – sehr häufig
Sonderdruck für private Zwecke des Autors
emotionale Vernachlässigung SHIP-LEGENDE (MDD-CIDI) Rep2010 (PHQ-2)
291 (15,5)
69 (27,4)
2,21 (1,62 – 3,01)***
303 (15,8)
5 (26,6)
2,04 (1,46 – 2,85)***
51 (4,1)
142 (11,5)
3,06 (2,19 – 4,26)***
5,2
20,0
4,46 (3,27 – 6,07)***
gar nicht – einige Male
häufig – sehr häufig
körperliche Vernachlässigung SHIP-LEGENDE (MDD-CIDI) Rep2010 (PHQ-2)
290 (16,2)
70 (21,1)
1,62 (1,20 – 2,19)**
316 (16,6)
44 (19,5)
1,30 (0,91 – 1,86)
51 (4,0)
142 (11,8)
3,08 (2,19 – 4,32)***
5,9
12,4
2,18 (1,61 – 2,95)***
# Logistische Regression unter Berücksichtigung von Alter und Geschlecht; MDD-CIDI = majore Depression nach M-CIDI; PHQ-2 = Screeningkriterium für depressive Störungen nach PHQ-2 (Summenwert ≤ 3); * p < 0,05; ** p < 0,01; *** p < 0,001
Zusammenfassung und Diskussion !
Da Misshandlungen in Kindheit und Jugend mit einer Vielzahl psychiatrischer Erkrankungen im Erwachsenenalter assoziiert sind, ist die Aufdeckung von Missbrauch und Vernachlässigung in der Patientenbiografie ein entscheidender Schritt zur zielgerichteten Behandlung von betroffenen Patienten. Ein zeitökonomisches und valides Screening in der medizinischen Versorgung würde die Aufdeckung von psychischen und körperlichen Erkrankungen als Folge von traumatischen Erlebnissen und Misshandlungen in der Kindheit wahrscheinlicher machen und Behandlungspläne im Sinne des Patienten entscheidend beeinflussen und letztendlich medizinische Ressourcen schonen [24]. Darüber hinaus ist für große epidemiologische Studien, Untersuchungen mit umfangreichen Assessments oder telefonische Befragungen die Anwendungsökonomie von Fragebögen von erheblicher Bedeutung. Der CTS bietet sich hier als effizientes Screeninginstrument an. Um die Anwendung des CTS zu unterstützen, wurden deshalb auf Basis zweier großer Bevölkerungsstudien Cut-off-Werte bestimmt und deren externe Validität geprüft. Die vorgeschlagenen Schwellenwerte unterscheiden anhand der CTS-Items auffällige und unauffällige Probanden im Sinne einer Vorgeschichte von erlebten Kindesmisshandlungen. Ziel dieser Arbeit war es, mit den CTS-Items eine vergleichbare Fallidentifikationsrate wie mit den CTQ-Skalen zu erreichen. Auch wenn
Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
sich in den beiden Stichproben zum Teil relevante Prävalenzunterschiede finden, stellt dies aus unserer Sicht kein großes Problem für die Ableitung der Schwellenwerte dar, weil sich diese Prävalenzunterschiede auch in den CTS-Items widerspiegeln. Bei Abweichungen zwischen den beiden Studien wurden möglichst ausgewogene Entscheidungen getroffen. Die anhand der Schwellenwerte als auffällig bzw. unauffällig auf einer Subdimension klassifizierten Probanden wurden dann hinsichtlich ihrer Depressivität bzw. dem Vorliegen depressiver Störungen verglichen. Von einer Ausnahme abgesehen, finden sich in allen Analysen dazu relevante Gruppenunterschiede. Um zu prüfen, ob mit den Screeningitems des CTS nicht nur ähnliche Fallidentifikationsraten, sondern auch dieselben Fälle identifiziert werden, wurden Sensitivitäten und Spezifitäten bestimmt. Die Spezifitäten sind durchweg sehr gut, die Sensitivitäten sind zum großen Teil sehr gut. Insbesondere die Skala körperliche Vernachlässigung zeigt jedoch eine niedrige Sensitivität. Mit den vorgeschlagenen Schwellenwerten, die Art und Häufigkeit der Misshandlung im Kindesalter berücksichtigen, wird eine schnelle Beurteilung und Klassifikation des Patienten/Probanden ermöglicht. Neben der zeitökonomischen Anwendung liegt eine Stärke des CTS in der expliziten, handlungsbasierten Formulierung der ausgewählten Items. Obwohl es bisher keine klar etablierte Regel gibt, nach welchen Kriterien die Auswahl der Items für Kurzverfahren bzw. Screener erfolgen sollte, stellten Thombs
Originalarbeit
SHIP-LEGENDE (n = 2126)
Rep2010 (n = 2500)
Sensitivität
Spezifität
Sensitivität
Spezifität
emotionaler Missbrauch
0,81
0,99
0,81
0,97
körperlicher Missbrauch
0,94
0,98
0,65
0,98
sexueller Missbrauch
0,80
0,98
0,79
0,98
emotionale Vernachlässigung
0,68
0,98
0,80
0,93
körperliche Vernachlässigung
0,44
0,95
0,66
0,86
225
Tab. 4 Sensitivität und Spezifität der Screeningitems des CTS zu den CTQ-Skalen in beiden Stichproben.
CTS = Childhood Trauma Screener; CTQ = Childhood Trauma Questionnaire
den kann. Hier wäre möglicherweise zu überlegen, ob man die Grenzwerte für die Subskalen mit kritischen Sensitivitäten noch weiter nach unten setzt. Zu beachten ist dennoch, dass Missbrauchs- und Vernachlässigungserfahrungen bei den Betroffenen meist gehäuft auftreten. Es ist also davon auszugehen, dass viele Betroffene nicht nur auf einer Skala bzw. einem Item auffällig sind und damit möglicherweise auf einer anderen Dimension als auffällig identifiziert werden.
Konsequenzen für Klinik und Praxis
▶ Der Childhood Trauma Screener (CTS) ist ein kurzes und gut anwendbares Screeninginstrument zur Erfassung von Missbrauch und Vernachlässigung in Kindheit und Jugend. ▶ Die identifizierten Schwellenwerte ermöglichen die schnelle Klassifikation von Probanden in großen Studien, aber auch in der klinischen Praxis. In einem zweiten diagnostischen Schritt sollten die als „auffällig“ eingestuften Probanden genauer untersucht werden. ▶ Die Dimension „körperlicher Missbrauch“ ist mit psychometrischen Problemen behaftet und sollte deshalb mit besonderer Vorsicht interpretiert werden.
Danksagung Diese Arbeit wurde durch die Deutsche Forschungsgemeinschaft (DFG; GR 1912/5-1) und durch das „Greifswald Approach to Individualized Medicine“ (GANI_MED) Netzwerk, finanziert durch das Bundesministerium für Bildung und Forschung (Fördernummer 03IS2061A), unterstützt.
Interessenkonflikt !
W. H. hat Beratungshonorare von Daiichi Sankyo und Vortragshonorare von Abbott und Pfizer erhalten. Für die anderen AutorInnen besteht kein Interessenkonflikt.
Abstract
The Childhood Trauma Screener (CTS) – Development and Validation of Cut-Off-Scores for Classificatory Diagnostics !
Objectives: Childhood abuse and neglect are associated with worse physical and mental health outcomes. There is some evidence, that the CTS is a brief and valid screening tool. To support the application of the CTS for categorical diagnostics cut-offs will be identified and validated. Methods: Based on two large-scale population studies suitable cut-off-scores for the different dimensions of childhood abuse Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
Sonderdruck für private Zwecke des Autors
et al. (2006) fest, dass besonders vage und wenig handlungsbezogen formulierte Items des CTQ zu geringeren Antwortraten führten, insbesondere bei Männern. Die deutsche Version des CTQ zeigt, mit Ausnahme der Subskala körperliche Vernachlässigung, gute bis exzellente interne Konsistenzen (Cronbachs α ≥ 0,89) [7, 9]. Wingenfeld et al. (2010) führen die schlechten psychometrischen Eigenschaften der Subskala körperliche Vernachlässigung auf mehrdeutige Itemformulierungen zurück, die zu unspezifisch und nicht klar abgrenzbar von anderen Skalen wie emotionale Vernachlässigung und emotionaler Missbrauch sind [7]. Psychometrische Schwächen des CTQ betreffen potenziell ebenfalls den CTS. Da sich in verschiedenen Validitätsstudien die Skala körperliche Vernachlässigung wiederholt als ein nichtstabiler Faktor [4 – 6] erwies, war anzunehmen, dass auch der CTS mit der Reduktion auf ein Item der Skala Schwächen aufweist [10]. Die Dimension körperliche Vernachlässigung des CTQ und damit auch das Screeningitem des CTS unterliegen möglicherweise in besonderer Weise kulturellen, historischen und sozioökonomischen Einflüssen. Besonders bei älteren Patienten mit einer Kindheit in Kriegs- und Nachkriegsjahren sind Ereignisse, die heute indikativ für körperliche Vernachlässigung stehen, wie Mangel an Nahrung oder medizinischer Versorgung, allgegenwärtig und „Normalität“ gewesen. Darum sind vor allem Selbstangaben von älteren Erwachsenen in Europa in dieser Hinsicht mit Bedacht zu interpretieren, da diese Altersgruppe in ihrer Kindheit und Jugend häufig von derartigen Umständen betroffen war. Weiterhin können auch Veränderungen der sozialen Normen zu Verzerrungen im CTQ bzw. CTS führen. Körperliche Züchtigung war ein allgemein akzeptiertes und weitverbreitetes Erziehungsmittel bis ins späte 20. Jahrhundert hinein. Erst im Jahre 2000 wurde durch ein geändertes Familienrecht die körperliche Bestrafung, emotionale Verletzung und Demütigung von Kindern als Erziehungsmittel in Deutschland unter Strafe gestellt [25]. Insgesamt stellt der CTS ein ökonomisches Screeninginstrument zur Erfassung von Missbrauchs- und Vernachlässigungserfahrungen in Kindheit und Jugend dar. Mit der hier dargestellten Untersuchung werden erstmals Empfehlungen zu Schwellenwerten gemacht. Auch wenn es noch einige Unklarheiten, insbesondere zur Skala körperliche Vernachlässigung, gibt, stellt die Bestimmung von Schwellenwerten einen wichtigen Schritt zur Anwendung der CTS dar. Die hier empfohlenen Werte sollten vor ihrer Anwendung in anderen Settings (z. B. klinischen Stichproben) unbedingt auch in diesen noch einmal geprüft werden. Wie bereits ausführlich beschrieben: Je nach Ziel der Anwendung gibt es bei Screeninginstrumenten unterschiedliche Maßgaben zur Gestaltung der Schwellenwerte. Geht es um die Identifikation möglichst aller auffälligen Personen, sollte der Schwellenwert gegebenenfalls noch weiter nach unten gesetzt werden, insbesondere dann, wenn ein 2-stufiges Prozedere gewählt wird, in welchem in einem zweiten Schritt genauer diagnostiziert wer-
226
Originalarbeit
and neglect were identified due to comparable case identification rates in the CTS compared with the Childhood Trauma Questionnaire. The cut-off-scores were validated with respect to depression as an external criterion. Results: Suitable cut-off-scores were identified for all subscales in both samples. The cases and non-cases according to the cut-offscores differed significantly regarding the severity of depressive symptoms and the prevalence of depression. Good to very good sensitivity and specificity of the CTS-items and the related subscales of the CTQ are shown, except for the dimension “physical neglect”. Conclusion: With the help of the cut-off-scores it is possible to use the CTS for categorical diagnostics, especially in large-scale studies with two-step diagnostic approaches.
Sonderdruck für private Zwecke des Autors
Literatur 1 Dong M, Giles WH, Felitti VJ et al. Insights into causal pathways for ischemic heart disease: adverse childhood experiences study. Circulation 2004; 110: 1761 – 1766 2 Kessler RC, Davis CG, Kendler KS. Childhood adversity and adult psychiatric disorder in the US National Comorbidity Survey. Psychol Med 1997; 27: 1101 – 1119 3 Anda RF, Butchart A, Felitti VJ et al. Building a Framework for Global Surveillance of the Public Health Implications of Adverse Childhood Experiences. Am J Prev Med 2010; 39: 93 – 98 4 Felitti VJ. Adverse Childhood Experiences and Adult Health. Acad Pediatr 2009; 9: 131 – 132 5 Häuser W, Glaesmer H, Schmutzer G et al. Widespread pain in older Germans is associated with posttraumatic stress disorder and lifetime employment status – Results of a cross-sectional survey with a representative population sample. Pain 2012; 153: 2466 – 2472 6 Bernstein DP, Stein JA, Newcomb MD et al. Development and validation of a brief screening version of the Childhood Trauma Questionnaire. Child Abuse Negl 2003; 27: 169 – 190 7 Wingenfeld K, Spitzer C, Mensebach C et al. The German Version of the Childhood Trauma Questionnaire (CTQ): Preliminary Psychometric Properties. Psychother Psychosom Med Psychol 2010; 60: 442 – 450 8 Bader K, Hanny C, Schaefer V et al. Childhood Trauma Questionnaire – Psychometric properties of a German version. Z Klin Psychol Psychother 2009; 38: 223 – 230 9 Klinitzke G, Romppel M, Häuser W et al. The German Version of the Childhood Trauma Questionnaire (CTQ) – Psychometric Characteristics in a Representative Sample of the General Population. Psychother Psychosom Med Psychol 2012; 62: 47 – 51
Glaesmer H et al. Der Childhood Trauma … Psychiat Prax 2013; 40: 220–226
10 Grabe HJ, Schulz A, Schmidt CO et al. A Brief Instrument for the Assessment of Childhood Abuse and Neglect: the Childhood Trauma Screener (CTS). Psychiat Prax 2012; 39: 109 – 115 11 Glaesmer H, Brähler E. Kommentar zu Grabe HJ et al.: Ein Screeninginstrument für Missbrauch und Vernachlässigung in der Kindheit: der Childhood Trauma Screener (CTS). Psychiat Prax 2013; 40: 21 – 22 12 Kessler RC, McLaughlin KA, Green JG et al. Childhood adversities and adult psychopathology in the WHO World Mental Health Surveys. Br J Psychiatry 2010; 197: 378 – 385 13 John U, Greiner B, Hensel E et al. Study of Health in Pomerania (SHIP): a health examination survey in an east German region: objectives and design. Soz Präventivmed 2001; 46: 186 – 194 14 Völzke H, Alte D, Schmidt CO et al. Cohort Profile: The Study of Health in Pomerania. Int J Epidemiol 2011; 40: 294 – 307 15 Grabe HJ, Schwahn C, Mahler J et al. Moderation of adult depression by the serotonin transporter promoter variant (5-HTTLPR), childhood abuse and adult traumatic events in a general population sample. Am J Med Genet B Neuropsychiatr Genet 2012; 159B: 298 – 309 16 Appel K, Schwahn C, Mahler J et al. Moderation of Adult Depression by a Polymorphism in the FKBP5 Gene and Childhood Physical Abuse in the General Population. Neuropsychopharmacol 2011; 36: 1982 – 1991 17 Beck AT, Steer RA, Brown GK. Manual for the Beck-Depression-Inventory-II. San Antonio, TX: Psychological Corporation; 1996 18 Wittchen HU, Lachner G, Wunderlich U et al. Test-retest reliability of the computerized DSM-IV version of the Munich Composite International Diagnostic Interview (M-CIDI). Soc Psychiatry Psychiatr Epidemiol 1998; 33: 568 – 578 19 Löwe B, Kroenke K, Grafe K. Detecting and monitoring depression with a two-item questionnaire (PHQ-2). J Psychosom Res 2005; 58: 163 – 171 20 Kroenke K, Spitzer RL, Williams JBW. The Patient Health Questionnaire2 – Validity of a two-item depression screener. Med Care 2003; 41: 1284 – 1292 21 Kühner C, Burger C, Keller F et al. Reliability and validity of the revised Beck Depression Inventory (BDI-II). Results from German samples. Nervenarzt 2007; 78: 651 – 656 22 Lachner G, Wittchen HU, Perkonigg A et al. Structure, content and reliability of the Munich Composite International Diagnostic Interview (MCIDI) substance use sections. Eur Addict Res 1998; 4: 28 – 41 23 Häuser W, Schmutzer G, Brähler E et al. Maltreatment in Childhood and Adolescence Results From a Survey of a Representative Sample of the German Population. Dtsch Ärztebl Int 2011; 108: 287 – 2U5 24 Thombs BD, Bernstein DP, Ziegelstein RC et al. An evaluation of screening questions for childhood abuse in 2 community samples – Implications for clinical practice. Arch Int Med 2006; 166: 2020 – 2026 25 Bundesministerium der Justiz. Bürgerliches Gesetzbuch, §1631 Inhalt und Grenzen der Personensorge (2013). Im Internet: http://www.ge setze-im-internet.de/bgb/__1631.html (Stand: 21.03.2013)