Was messen wir und was sagen wir damit? Eine Einordnung zur Debatte um „islamismusaffine Einstellungen“ auf Basis der Studie „Menschen in Deutschland“

Autorin: Dr. Rebecca Endtricht (German Institute for Global and Area Studies (GIGA))

Die öffentliche Debatte um die Ergebnisse der aktuellen MiD-Studie hat in den letzten Tagen und Wochen eine Dynamik entwickelt, die wissenschaftlich wie gesellschaftlich problematisch ist. Schlagzeilen wie „Fast jeder zweite junge Muslim zum Islamismus hingezogen“ sind nicht nur verkürzt, sie sind in dieser Form schlicht nicht haltbar.

Die Diskussion hat einmal mehr gezeigt, wie groß das Bedürfnis nach klaren Zahlen ist – und auch, wie schnell diese Zahlen in politisch aufgeladene Narrative eingebettet werden. Der Befund, dass im Jahr 2025 rund 45 % der unter 40-jährigen Muslim:innen in Deutschland latent oder manifest islamismusaffine Einstellungen aufweisen, wurde in dieser Dynamik besonders prominent hervorgehoben.

Die Kritik an dieser Zahl, insbesondere an ihrer Interpretation, ist legitim und notwendig. Gleichzeitig gilt aber auch: Die Studie misst etwas gesellschaftlich Relevantes. Gerade deshalb lohnt es sich, genauer hinzusehen. Nicht, um Kritik abzuwehren, sondern um sie ernst zu nehmen und produktiv zu machen. Als Mitautorin der zugrunde liegenden Studie möchte ich einige dieser Punkte aufgreifen, einordnen und weiterdenken.

Dabei beziehe ich mich ausdrücklich auch auf den Blogbeitrag von Nader Hotait, der eine Reihe interessanter und wertvoller Kritikpunkte formuliert hat. Gerade weil der Beitrag sich nicht in Empörung erschöpft, sondern methodische und konzeptionelle Fragen stellt, ist er ein guter Ausgangspunkt für eine wissenschaftliche Debatte.

Die entscheidenden Fragen sind:

Was genau wurde gemessen?
Wie wurde gemessen?
Was lässt sich daraus tatsächlich schlussfolgern – und was nicht?

1. Ein Missverständnis vorweg: „45,1 %“ sind kein ideologisches Lager

Die viel zitierte Zahl von 45,1 % beschreibt den Anteil muslimischer Befragter zwischen 18 und 39 Jahren, die latent oder manifest islamismusaffine Einstellungen aufweisen. Diese Zahl ist erklärungsbedürftig. Denn zum einen verschleiert sie, dass sich dahinter Anteile von 11,5 % manifesten und 33,6 % latenten islamismusaffinen Einstellungen verbergen.

Zum anderen beschreibt diese Zahl weder in ihrer Gesamtheit noch in ihrer Aufteilung in latent und manifest eine homogene Gruppe, ein ideologisch geschlossenes Milieu oder gar ein politisches Programm. „Latent“ – was auf den Großteil der 45,1 % zutrifft – bedeutet in diesem Kontext zunächst nichts anderes als: ein gewisser Bereich der Zustimmungstendenz zu verschiedenen Aussagen, die Bestandteil eines breiteren Einstellungssyndroms sein können. Es geht also nicht um konsistente politische Programmatik oder gar Gewaltbereitschaft, sondern um eine Offenheit gegenüber bestimmten Inhalten ideologischer Narrative, die im weiteren Verlauf von Radikalisierungsprozessen relevant werden können.

Das ist ein zentraler Punkt: Zwischen einem gewissen Grad der Zustimmung zu einzelnen Items und einer konsistenten ideologischen Überzeugung liegt ein erheblicher Unterschied. Genau diese Differenz geht in der medialen Debatte jedoch nahezu vollständig verloren.

2. Was messen wir überhaupt? Zur Logik der skalenbasierten Messung

Ein zentraler Kritikpunkt betrifft die Zusammensetzung der Skala – insbesondere die Einbeziehung von Abwertungsitems, darunter antisemitische Aussagen, in die Messung islamismusaffiner Einstellungen.

Hier lohnt sich ein Schritt zurück: Islamismusaffine Einstellungen sind – ebenso wie rechtsextreme oder demokratiedistante Einstellungen – nicht direkt beobachtbar. Es handelt sich um ein latentes Konstrukt. Wie bei allen Einstellungsdimensionen sind wir daher darauf angewiesen, uns diesem Konstrukt mit Hilfe mehrerer Indikatoren anzunähern. Deshalb arbeiten wir mit mehrdimensionalen Skalen, die unterschiedliche Facetten des Phänomens, dem wir uns empirisch nähern wollen, abbilden. Im vorliegenden Fall sind das:

Das Verhältnis von Religion und Politik
Die Abwertung anderer Gruppen
Die Aufwertung der eigenen Religion

Diese Anlage folgt der grundlegenden empirischen Einsicht: Extremistische Einstellungen bestehen in der Regel nicht aus einem einzigen Element, sondern aus einer Kombination verschiedener Einstellungsdimensionen – im Kern also aus ideologischer Überhöhung der Eigengruppe, der Abwertung anderer Gruppen und einer gewissen Distanz zu demokratischen bzw. pluralistischen Ordnungen.

In diesem Sinne misst die Skala nicht „Islamismus“ im engen ideologischen Sinn, sondern ein Bündel potenziell radikalisierungsrelevanter Einstellungen.

Daraus folgt eine wichtige Konsequenz: Nicht jedes einzelne Item ist alleinstehend spezifisch islamistisch. Entscheidend ist das Zusammenspiel mehrerer Dimensionen.
Erst in ihrer Kombination entsteht ein Muster, das als extremismusaffin interpretiert werden kann. Oder anders gesagt: Die Skala misst kein starres Etikett, sondern ein Risikoprofil.

3. Zur Frage der „konzeptuellen Konfundierung“: Überschneidung ist kein Fehler

Der Einbezug von Abwertungsdimensionen in die mehrdimensionale Skala ist kein Zufall, sondern theoretisch begründet. Formen gruppenbezogener Abwertung – darunter auch Antisemitismus – sind kein exklusives Merkmal eines einzelnen Extremismusphänomens, sondern phänomenübergreifende Indikatoren für Extremismusaffinität.

Das bedeutet konkret: Antisemitismus allein macht niemanden „islamistisch“. Aber im Zusammenspiel mit anderen Einstellungen kann er Teil eines Musters sein, das wir als extremismusaffin interpretieren.

Genauso verhält es sich im Bereich Rechtsextremismus, wo dieselben Items zur Messung von Antisemitismus verwendet werden. Diese Überschneidung ist kein methodischer Fehler, sondern spiegelt eine empirische Realität wider: Extremismusformen teilen bestimmte ideologische Bausteine.

Wichtig ist dabei: Kein Einzelitem entscheidet über die Klassifikation. Die Zuschreibung erfolgt immer auf Basis des Gesamtmusters der Antworten.

In der Kritik wurde diesbezüglich weiterführend eingewandt, muslimische Befragte würden auf Basis antisemitischer Haltungen nur deshalb als islamismusaffin eingeordnet, weil sie Muslim:innen sind. So funktioniert das Instrument jedoch gerade nicht. Wenn muslimische Befragte antisemitische Einstellungen aufweisen, ist das zunächst einmal ein Hinweis auf eine Form gruppenbezogener Menschenfeindlichkeit. Ob dies im Rahmen der Islamismus-Skala relevant wird, hängt davon ab, ob bestimmte Antwortausprägungen auf weiteren Dimensionen hinzukommen. Genauso können muslimische Befragte im Rahmen anderer Skalen auch als demokratiedistant oder rechtsextrem eingeordnet werden, wenn die entsprechenden Antwortmuster vorliegen. Diese Kategorien schließen einander empirisch nicht aus.

Dennoch umfasst dieser Kritikpunkt aber auch ein methodisches Problem, das man ernst nehmen muss. Denn tatsächlich ist es rechnerisch möglich, dass Personen aufgrund ihrer Zustimmung zu den Items der Dimension „Abwertung anderer Gruppen“ in den Bereich latenter Islamismusaffinität geraten, ohne dass sie den stärker religionspolitischen Aussagen der Skala zustimmen.

Dies verweist auf eine Interpretationsgrenze des Instruments: Nicht jede als „latent islamismusaffin“ klassifizierte Person vertritt notwendig ein kohärent islamistisches Weltbild. In einem Teil der Fälle kann die Einstufung maßgeblich oder sogar ausschließlich durch Abwertungsdimensionen getragen sein. Das ist empirisch und begrifflich relevant, weil gruppenbezogene Menschenfeindlichkeit zwar ein ernstes Problem und ein möglicher Bestandteil extremistischer Einstellungsmuster ist, aber nicht ohne Weiteres mit Islamismus gleichgesetzt werden darf.

Gleichzeitig folgt daraus aus meiner Sicht nicht, dass die Skala insgesamt konzeptuell verfehlt wäre. Es zeigt vielmehr, dass sie ein breites Spektrum potenziell radikalisierungsrelevanter Einstellungen erfasst und dass innerhalb dieses Spektrums genauer unterschieden werden sollte, welche Antwortmuster eher auf spezifisch islamistische Orientierungen, welche eher auf allgemeine Intoleranz und welche auf phänomenübergreifende autoritäre Dispositionen hindeuten.

4. Inkonsistenzen in den Antworten auf Einzelitems: Problem oder Erkenntnis?

Die angesprochenen Unterschiede zwischen abstrakten und konkreten politischen Aussagen – hier bezogen auf Unterschiede in der Zustimmung zu einem „islamischen Gottesstaat“ und der Ablehnung spezifischer Umsetzungsformen in Deutschland – sind tatsächlich auffällig.

Ich würde das aber weniger als methodisches Problem lesen, sondern als empirisch interessante Spannung: zwischen abstrakten, religiös geprägten Idealvorstellungen auf der einen Seite und konkreten politischen Präferenzen im deutschen Kontext auf der anderen.

Diese Differenz kann auf genau das hinweisen, was die Kritik vermutet: dass religiöse Symbolik und politische Programmatik nicht deckungsgleich sind. Das ist kein Grund, die betreffenden Items zu verwerfen. Es ist aber ein klarer Hinweis darauf, dass wir in zukünftigen Analysen stärker unterscheiden müssen zwischen:

normativen, möglicherweise religiös geprägten Idealen
und konkreten politischen Präferenzen im deutschen Kontext.

Gerade diese Differenzierung ist empirisch sehr interessant. Sie deutet darauf hin, dass symbolische Zustimmung nicht automatisch in politische Systemablehnung übersetzt wird. Eine wichtige Aufgabe künftiger Forschung wird deshalb darin bestehen, diese Ebenen stärker systematisch zueinander in Beziehung zu setzen.

5. Das „Koran-Item“ und das vermeintliche Dilemma

Die Kritik, dass die Aussage „Die Regeln des Korans sind mir wichtiger als die Gesetze in Deutschland“ ein falsches Dilemma konstruiert, ist ernst zu nehmen. Religiöse Überzeugungen und demokratische Loyalität schließen sich empirisch nicht zwingend aus. Viele Menschen – nicht nur Muslim:innen – begründen ihre Rechtsbindung zumindest teilweise auch aus religiösen Normen heraus. Eine Zustimmung zu diesem Item kann also theologisch motiviert sein, ohne dass daraus automatisch problematische politische Konsequenzen folgen.

Gleichzeitig können solche Aussagen unter bestimmten Bedingungen mit politischer Radikalisierung korrelieren. Die Herausforderung liegt deshalb darin, zwischen normativer Religiosität und politischer Systemablehnung empirisch sauber zu unterscheiden. Das gelingt mit Einzelitems naturgemäß nur begrenzt. Umso wichtiger ist die Kombination mehrerer Indikatoren – oder im Idealfall sogar mehrerer Skalen –, um Überschneidungen zwischen relevanten Einstellungsdimensionen aufzuzeigen, z.B. zwischen:

Islamismusaffinität und Demokratiedistanz sowie
Islamismusaffinität und Gewaltakzeptanz.

Denn solche Kombinationen sagen deutlich mehr darüber aus, ob religiöse Überzeugungen tatsächlich in politische Systemablehnung übersetzt werden.

Hierzu haben wir bereits weiterführende Analysen durchgeführt, die in den kommenden Wochen veröffentlicht werden. Gezeigt haben wir vergleichbare Befunde aber auch bereits 2021 in einem Forschungsbericht. Im Kern zeigt sich: Nur ein Bruchteil der Personen mit extremismusaffinen Einstellungen – sei es im Bereich der Demokratiedistanz, des Rechtsextremismus oder des Islamismus – akzeptiert auch die Anwendung politischer Gewalt.

Das ist ein wichtiger Hinweis darauf, dass wir es mit einem Kontinuum verschiedener Haltungen und Einstellungen zu tun haben, innerhalb dessen bestimmte Konstellationen eher für eine weiter fortgeschrittene ideologische Radikalisierung sprechen als andere. Da wir uns hier aber ausschließlich auf der Einstellungsebene bewegen, können wir nichts über tatsächliche Handlungsintentionen aussagen. Wir wissen aus der Forschung, dass manifeste Einstellungen bestimmte Verhaltensweisen begünstigen können – aber eben nicht determinieren. Gerade deshalb ist es wichtig, solche Haltungen frühzeitig sichtbar zu machen und ernst zu nehmen. Keinesfalls lässt sich daraus jedoch schlussfolgern, „die Hälfte der Muslime“ sei islamistisch und wolle den deutschen Staat stürzen, wie es manche Medienberichte suggerieren.

6. Mittelwerte und das Dilemma der Cutoffs

Die Kritik an den Cutoffs ist methodisch absolut berechtigt. Ja: Schwellenwerte sind in gewissem Maße immer arbiträr. Entscheidend ist hier jedoch der Kontext der Studie. Die MiD-Studie ist Teil eines Monitoring-Projekts. Ziel ist es, Entwicklungen extremismusaffiner Einstellungen über die Zeit hinweg sichtbar zu machen – und dafür brauchen wir vergleichbare Skalen, stabile Schwellenwerte und kommunizierbare Prävalenzen.

Ohne diese Übersetzung in Prozentwerte wären unsere Ergebnisse für Politik und Öffentlichkeit kaum anschlussfähig. Gleichzeitig stehen wir hier in einem klassischen Spannungsfeld: Wissenschaftliche Präzision verlangt Differenzierung, öffentliche Kommunikation verlangt Verdichtung. Ein Monitoring-Bericht, der ausschließlich Mittelwerte, Varianzen und komplexe Interdependenzen berichtet, wäre zwar methodisch differenzierter, aber für die meisten politischen und medialen Adressat:innen kaum handhabbar. Das Problem liegt also nicht darin, dass Forschung ihre Ergebnisse verdichtet, sondern darin, wie diese Verdichtung anschließend gelesen und weiterverarbeitet wird.

Vor diesem Hintergrund zeigt die im oben benannten Blogbeitrag vorgestellte Simulation plausibel, dass die Prävalenz von Islamismusaffinität stark von den gewählten Cutoffs abhängt und unterschiedliche Antwortmuster zu ähnlichen Mittelwerten führen können. Das ist methodisch richtig. Was daraus aber nicht folgt, ist, dass die Befunde beliebig oder substanzlos wären. Vielmehr zeigt die Sensitivität der Grenzwerte, dass die Daten ein kontinuierliches Spektrum von Einstellungen beschreiben und keine klar trennbaren Gruppen, die sich sauber auf unterschiedliche „Stufen“ der Radikalisierung verteilen lassen.

Hinzu kommt: Die gewählten Cutoffs orientieren sich an etablierten Verfahren der Extremismusforschung, anhand derer seit vielen Jahren Prävalenzen rechtsextremer Einstellungen berichtet werden, etwa in der Mitte-Studie oder der Leipziger Autoritarismus-Studie. Diese Logik haben wir sowohl für unsere eigene Messung rechtsextremer Einstellungen als auch für islamismusaffine Einstellungen übernommen. Eine isolierte Anpassung nur für islamismusaffine Einstellungen würde zurecht die Frage aufwerfen, warum hier andere Maßstäbe gelten sollen als bei anderen Formen extremismusaffiner Haltungen.

Das eigentliche Problem liegt daher weniger in der Existenz von Cutoffs als in der Interpretation dieser Kategorien als fixe Zustände, obwohl sie in Wahrheit quantitative Abschnitte auf einem Kontinuum markieren. Die Kategorien „latent“ und „manifest“ sind in diesem Sinne analytische Vereinfachungen, keine natürlichen Grenzen in den Daten. Problematisch wird es erst dann, wenn diese Kategorien als reale, klar abgegrenzte Gruppen gelesen werden – und genau das geschieht derzeit häufig im öffentlichen Diskurs.

7. Verantwortung der Wissenschaft – und ihre Grenzen

Ein berechtigter Kritikpunkt betrifft die Verantwortung von Forschung in der Kommunikation ihrer Ergebnisse. Dem stimme ich ausdrücklich zu: Begriffe müssen präzise sein und Interpretationsspielräume müssen klar benannt werden.

Und ja: Wir sprechen in unserem Bericht bewusst ganz überwiegend von „islamismusaffinen Einstellungen“. Die Verwendung des Begriffs „islamistisch“ an einzelnen Stellen im Bericht ist insofern diskutabel, da sie Missverständnisse begünstigen kann.

Gleichzeitig müssen wir klar unterscheiden zwischen wissenschaftlicher Befundlage einerseits und politischer bzw. medialer Verarbeitung andererseits. Die Gleichsetzung von „latent islamismusaffin“ mit „islamistisch“ ist keine Folge der Methodik. Sie ist eine Fehlinterpretation im medialen und politischen Diskurs.

Dass diese Differenz in der öffentlichen Rezeption so schnell verloren gegangen ist, verweist auf ein strukturelles Problem: Je stärker Ergebnisse vereinfacht werden, desto größer wird die Gefahr ihrer Instrumentalisierung. Das entbindet Forschung nicht von Verantwortung. Es zeigt aber auch, dass wissenschaftliche Kommunikation selbst bei sorgfältiger Abwägung zwischen Präzision und Anschlussfähigkeit nur begrenzt Einfluss darauf hat, wie Ergebnisse im öffentlichen Raum aufgegriffen und weiterverwendet werden.

8. Was bleibt von den Ergebnissen – und was folgt daraus?

Wenn man die Befunde nüchtern liest, ergeben sich drei robuste Aussagen:

Die Mehrheit der Muslim:innen ist nicht islamismusaffin.
Es gibt eine relevante Minderheit mit Offenheit gegenüber problematischen Einstellungen.
Diese Offenheit nimmt insbesondere bei jüngeren Personengruppen zu – parallel zu ähnlichen Trends bei rechtsextremen Einstellungen in der Gesamtbevölkerung.

Gerade der dritte Punkt ist entscheidend: Wir beobachten kein isoliertes „muslimisches Problem“, sondern eine generell zunehmende Offenheit für autoritäre, abwertende und systemkritische Einstellungen in jüngeren Kohorten.

Nimmt man diesen Befund ernst, verschiebt sich die Perspektive. Die Frage ist dann nicht: „Was stimmt nicht mit den Muslimen?“ Sondern: Warum wenden sich junge Menschen verstärkt autoritären und radikalen Positionen zu? Und welche gesellschaftlichen Bedingungen begünstigen das?

Die Daten der MiD-Studie selbst geben hierfür Hinweise:

Steigende Krisenwahrnehmungen,
wachsendes Misstrauen gegenüber politischen Institutionen und Akteuren sowie
zunehmende Verunsicherung

sind zentrale Risikofaktoren, die die Wahrscheinlichkeit für die Ausbildung extremismusaffiner Einstellungen phänomenübergreifend erhöhen.

In dieser Hinsicht erscheinen radikale Ideologien – gleich welcher Art – für manche als Orientierung oder vermeintlicher Halt in unsicheren Zeiten. Die Antwort darauf kann nicht gesellschaftlicher Ausschluss sein. Ziel sollte vielmehr eine Integration im umfassenden Sinne sein: nicht nur von Muslim:innen, sondern von jungen Menschen insgesamt, die sich orientierungslos fühlen, Vertrauen verlieren und empfänglich für vereinfachende und polarisierende Antworten werden.

Genau hier liegt der eigentliche Erkenntniswert solcher Studien: nicht in der Etikettierung von Menschen, sondern im Verständnis von Zusammenhängen und Dynamiken.

Fazit

Empirische Sozialforschung bewegt sich immer in einem Spannungsfeld: zwischen Messbarkeit und Interpretierbarkeit, zwischen Differenzierung und Kommunikation.

Die aktuelle Debatte zeigt, wie wichtig es ist, dieses Spannungsfeld offenzulegen und dabei nicht nur Ergebnisse zu diskutieren, sondern auch die Wege, auf denen sie zustande kommen. Die wissenschaftlich fundierte Kritik ist in vielen Punkten berechtigt und produktiv. Sie hilft, Messungen zu schärfen, Differenzierungen zu erweitern und Interpretationsmöglichkeiten klarer einzuordnen. Wenn diese Diskussion dazu beiträgt, unsere Instrumente besser zu machen und unsere Aussagen präziser zu formulieren, dann erfüllt sie genau den Zweck, den wissenschaftliche Öffentlichkeit haben sollte.

Die MiD-Studie liefert wichtige empirische Hinweise auf problematische Einstellungsentwicklungen – insbesondere unter jüngeren Menschen. Aber:

Sie misst keine festen ideologischen Lager, sondern graduelle Orientierungen.
Sie identifiziert Risikomuster, nicht eindeutig klassifizierbare Gruppen.
Und sie erlaubt keine pauschalen Aussagen über „die Muslime“.

Die eigentliche Herausforderung liegt daher nicht in der Existenz dieser Daten, sondern in ihrem verantwortungsvollen Umgang.

Oder anders gesagt: Nicht die Zahlen sind das Problem, sondern die Geschichten, die wir aus ihnen machen.

Was messen wir und was sagen wir damit? Eine Einordnung zur Debatte um „islamismusaffine Einstellungen“ auf Basis der Studie „Menschen in Deutschland“

Autorin: Dr. Rebecca Endtricht (German Institute for Global and Area Studies (GIGA))

1. Ein Missverständnis vorweg: „45,1 %“ sind kein ideologisches Lager

2. Was messen wir überhaupt? Zur Logik der skalenbasierten Messung

3. Zur Frage der „konzeptuellen Konfundierung“: Überschneidung ist kein Fehler

4. Inkonsistenzen in den Antworten auf Einzelitems: Problem oder Erkenntnis?

5. Das „Koran-Item“ und das vermeintliche Dilemma

6. Mittelwerte und das Dilemma der Cutoffs

7. Verantwortung der Wissenschaft – und ihre Grenzen

8. Was bleibt von den Ergebnissen – und was folgt daraus?

Fazit

Newsletter

Gefördert vom: