Article

Kognitive Verzerrung bei Sachverständigen: Wie man sie minimiert

Jun 17, 2026 | 25 min | criminalistic

Language

DE EN

Forensic expert desk at night with case file, highlighted documents and security video still

Die Akte kommt an. 78 Dokumente, 3 Vernehmungsprotokolle, der Ermittlungsbericht, Fotografien, ein Vorstrafenregister, 2 Presseartikel. Jemand hat die Stellen, die er für relevant hält, bereits hilfreich markiert. Das Anschreiben bittet mich, mein Gutachten darüber abzugeben, ob das Videomaterial mit der Anwesenheit des Beschuldigten am Tatort vereinbar ist.

Das ist der Moment, in dem ich entscheiden muss, ob ich forensische Wissenschaft oder forensisches Theater betreiben werde. Der Unterschied ist wesentlich. Forensisches Theater produziert die Antwort, die den Fall konsistent aussehen lässt. Forensische Wissenschaft beginnt bei der Evidenz und geht, wohin diese führt, einschließlich Orten, wohin die Auftraggeber lieber nicht gegangen wären.

Die vollständige Fallakte mit ihrer vorverdauten Schuld-Narration ist das strukturelle Problem der Sachverständigenarbeit, und es ist das Problem, über das niemand laut genug spricht. Jeder Strafverteidiger kennt es. Jeder seriöse akademische Forscher in diesem Feld kennt es. Jeder ehrliche Sachverständige kennt es. Dennoch hält die Praxis an, weil die Alternative, nur die Beweismittel ohne den Ermittlungskontext zu erhalten, bestimmte Analyseformen technisch schwieriger macht und das Leben für die beauftragenden Behörden administrativ kompliziert. Also bleibt die bias-erzeugende Struktur bestehen, und wir diskutieren über Technik, während der Elefant im Raum auf dem Konferenztisch sitzt und die Ermittlungsakte frisst.

Ich möchte präzise in einer Sache sein. Kognitive Verzerrung in der forensischen Wissenschaft ist nicht primär eine Geschichte über unehrliche Sachverständige, korrupte Labore oder wissenschaftlichen Betrug. Es ist eine Geschichte darüber, was mit ehrlichen, gut ausgebildeten, genuinen gewissenhaften Profis passiert, wenn strukturelle Bedingungen ihre Schlussfolgerungen systematisch in Richtung eines vorbestimmten Ergebnisses schieben. Der Brandon-Mayfield-Fall ist das kanonische Beispiel, weil er genau das illustriert: 3 FBI-Fingerabdruckgutachter und ein unabhängiger externer Experte kamen alle zur selben falschen Schlussfolgerung, nicht weil irgendeiner von ihnen korrumpiert war, sondern weil sie in einem Umfeld operierten, das mit bestätigendem Druck beladen war.

Die Mayfield-Katastrophe und was sie tatsächlich zeigt

Am 6. Mai 2004 verhafteten FBI-Agenten den Rechtsanwalt Brandon Mayfield aus Portland als Zeugen im Zusammenhang mit den Bombenanschlägen auf Madrider Pendlerzüge vom März 2004. Grundlage war ein Teilfingerabdruck, der auf einer Detonatorentasche am Tatort gefunden worden war. Das Automatisierte Integrierte Fingerabdruck-Identifikationssystem des FBI hatte Mayfield als potenziellen Treffer markiert, und 3 FBI-Gutachter sowie ein unabhängiger externer Experte bestätigten die Identifizierung als “100-Prozent-Treffer.”

Die spanische Nationalpolizei widersprach von Anfang an. Sie hatte eine andere Person, einen algerischen Staatsbürger, als tatsächliche Übereinstimmung identifiziert, und sie kommunizierte dies wiederholt. Das FBI bestand auf seiner Analyse. Mayfield wurde 2 Wochen festgehalten, bevor das FBI unter wachsendem Druck der spanischen Seite den Fehler einräumte, Mayfield mit einer Entschuldigung freiließ und zugab, dass der Fingerabdruck nicht seinem entspreche. Die nachfolgende Überprüfung durch den Generalinspektor des DOJ stellte fest, dass die Gutachter zu selbstsicher gewesen waren, dass die Bildqualität als Problem anerkannt worden war, und dass nachfolgende Prüfer beeinflusst wurden, sobald der erste Gutachter eine Übereinstimmungsergebnis erzielt hatte. Die US-Regierung einigte sich schließlich mit Mayfield auf eine Entschädigung von 2 Millionen Dollar.

Keiner der Gutachter war korrumpiert. Alle hatten echte Expertise. Der Fehler war nicht technisch in dem Sinne, dass ein Datenpunkt übersehen worden wäre. Der Fehler war kognitiv: Sobald die Übereinstimmungshypothese im Raum war, wurde sie anders bewertet als die Nichtübereinstimmungshypothese es gewesen wäre. Bestätigende Evidenz wurde stärker gewichtet. Gegenteilige Indikatoren wurden wegerklärt. Die 2006 erschienene Studie von Itiel Dror und David Charlton, in der praktizierenden Fingerabdruckgutachtern Abdrücke vorgelegt wurden, die sie zuvor bereits untersucht hatten, diesmal jedoch mit verzerrenden Kontextinformationen, die ein Geständnis oder ein verifiziertes Alibi suggerierten, zeigte, dass 17% ihrer eigenen früheren Urteile in Richtung der neuen Kontextinformation änderten (Dror, I. E., & Charlton, D., 2006, Why experts make errors, Journal of Forensic Identification, 56(4), 600-616). Keine Novizen, keine unvorsichtigen Amateure. Erfahrene Profis, bei ihren eigenen früheren Entscheidungen, die unter kontextuellem Druck in 17% der Fälle umschwangen. Das ist die Mayfield-Geschichte, als kontrolliertes Experiment formuliert.

Der Jewell-Fall: Was die Medien nicht getan haben

Richard Jewell arbeitete während der Olympischen Sommerspiele 1996 in Atlanta als Sicherheitsmann im Centennial Olympic Park. Am 27. Juli 1996 bemerkte er einen herrenlosen Rucksack und begann, den Bereich zu räumen. Die Bombe darin explodierte kurz danach und tötete 1 Person und verletzte mehr als 100. Jewell hatte Dutzende von Menschen gerettet, indem er sie aus dem Gefahrenbereich brachte.

Innerhalb von 3 Tagen berichtete das Atlanta Journal-Constitution, Jewell stehe im Mittelpunkt der FBI-Ermittlungen. Was folgte, war ein 88-tägiges Medien- und Ermittlungsdebakel. Die relevante Tatsache, die fast jede Zusammenfassung dieses Falls übergeht, lautet: Richard Jewell wurde nie verhaftet. Gegen ihn wurde nie Anklage erhoben. Es gab nie einen Haftbefehl. Er wurde befragt, sein Haus wurde durchsucht, sein Besitz wurde beschlagnahmt, und sein Leben wurde öffentlich zerstört, aber niemand hat ihn jemals festgenommen, weil die Evidenz, die einen Haftbefehl gerechtfertigt hätte, sich nie materialisierte. Der echte Bomber war Eric Rudolph, der 1998 von Bundesermittlern identifiziert und 2003 in Gewahrsam genommen wurde.

Warum ist diese Unterscheidung für eine Diskussion über kognitive Verzerrung wichtig? Weil der Jewell-Fall primär keine Geschichte eines Ermittlungsfehlers ist. Es ist eine Geschichte von Narrativ-Festschreibung, dem Mechanismus, durch den eine Hypothese, die zum Ermittlungsprofil passt, ein möchte-gern-Held, verzweifelt nach Aufmerksamkeit, mit polizeilichen Ambitionen, in den Köpfen sowohl der Ermittler als auch der Medien selbstbestätigend wird. Jedes nachfolgende Stück zweideutiger Information wurde durch diese Brille gefiltert.

Kahnemans Arbeit in Thinking, Fast and Slow dokumentiert die allgemeine kognitive Architektur dahinter: System-1-Denken, schnell, assoziativ, mustererkennend, unterscheidet nicht gut zwischen einer kohärenten Geschichte und einer wahren Geschichte (Kahneman, D., 2011, Thinking, Fast and Slow, Penguin Books). Es lohnt sich, gegenüber der häufigen Fehldeutung dieser Forschung festzuhalten, dass Kahneman nicht behauptet, Bewusstsein für Verzerrungen korrigiere diese zuverlässig. Sein zentraler Befund ist nahezu das Gegenteil: Dass selbst Menschen, die Verzerrungen im Abstrakten verstehen, ihnen in der Praxis weiterhin unterliegen, und dass der Glaube, eine Verzerrung überwunden zu haben, selbst zu einer Quelle von Überzeugung werden kann. Diese Erkenntnis ist unbequem für Fortbildungskonzepte, die auf Aufklärung setzen. Sie ist aber das, was die Daten zeigen.

Die Central Park Five: Wenn Verzerrung institutionalisiert wird

1989 wurden 5 Jugendliche zwischen 14 und 16 Jahren im Zusammenhang mit der Vergewaltigung und schweren Körperverletzung einer Joggerin im Central Park in New York festgenommen. Sie wurden stundenlang verhört, legten Geständnisse ab, die sie jeweils später widerriefen und als erzwungen bezeichneten, und wurden trotz des Fehlens von DNA-Beweisen, die einen von ihnen mit dem Verbrechen in Verbindung brachten, verurteilt und inhaftiert. Sie saßen zwischen 6 und 13 Jahren ein.

2002 gestand ein Mann namens Matias Reyes, der bereits wegen einer anderen Vergewaltigung und eines Mordes einsaß, die Tat. DNA-Analysen bestätigten sein Geständnis. Die 5 wurden freigesprochen. Die Geständnisse waren falsch gewesen. Die Ermittlung, die Strafverfolgung und die Verurteilung hatten auf einem Fundament aus Tunnelblick gebaut, der so schwerwiegend war, dass gegenteilige Evidenz, das Fehlen forensischer Beweise gegen die Angeklagten, nicht als entlastend verarbeitet, sondern als zu verwaltender Widerspruch behandelt worden war.

Kassin, Dror und Kukucka haben den Kaskadenmechanismus formal identifiziert: Wenn Ermittler sich früh auf einen Verdächtigen festlegen, erzeugt diese Bindung Kontextdruck auf jedes nachfolgende Stück forensischer und aussagebezogener Evidenz (Kassin, S. M., Dror, I. E., & Kukucka, J., 2013, The forensic confirmation bias: Problems, perspectives, and proposed solutions, Journal of Applied Research in Memory and Cognition, 2(1), 42-52). Der Central-Park-Fall ist dieser Mechanismus in institutionellem Maßstab, in vollem Tempo, gegen 5 Jugendliche mit begrenzten Ressourcen. Die Geständnisse, die jahrelang als belastendste Evidenz galten, waren nicht Ausdruck von Schuld, sondern Ausdruck eines Verhördrucks, der länger andauerte als die Widerstandskraft von Jugendlichen gegen ihn.

Die Taxonomie: Welche Formen des Bias gibt es, und wie sehen sie konkret aus?

Der Begriff kognitive Verzerrung deckt eine Familie verschiedener Mechanismen ab. Alle unter “Bias” zu subsumieren verschleiert ihre unterschiedlichen Strukturen, ihre unterschiedlichen Auslöser und die unterschiedlichen Gegenmaßnahmen, die gegen jeden einzelnen tatsächlich wirken. Was folgt, ist eine Arbeitstaxonomie eines forensischen Praktikers, illustriert mit den Situationen, die nicht in akademischen Experimenten entstehen, sondern in den Fluren, Büros und Gerichtssälen, in denen die Arbeit tatsächlich stattfindet.

Anchoring bias (Ankereffekt): Ein Kollege lehnt sich über deinen Schreibtisch und sagt: Schau mal, schau dir das an, das ist doch so, weil hier dieser Riffelabschluss liegt und da die Verzweigung so läuft, das ist doch dieselbe Konfiguration. Du schaust. Du siehst den Riffelabschluss. Du siehst die Verzweigung. Du bildest dir eine Meinung aus dem Rahmen heraus, den dein Kollege soeben gesetzt hat. Deine Analyse war verankert, bevor sie begann. Der Anker muss nicht von einem Kollegen kommen. Er kann aus der Akte stammen: Der Ermittlungsbericht sagt, das Video zeige den Angeklagten am Tatort. Du öffnest das Video auf der Suche nach dem Angeklagten, weil der Anker bereits gesetzt ist. Was du eigentlich suchen solltest, ist: Was zeigt dieses Video? Das sind verschiedene Fragen, und sie produzieren verschiedene Antworten.

Der Ankereffekt gehört zu den am robustesten replizierten Befunden der kognitiven Psychologie. Erste Eindrücke, erste Zahlen, erste Beschreibungen strukturieren alles, was folgt, auch wenn der Person gesagt wird, die erste Information sei irrelevant oder zufällig gewesen. In einem forensischen Kontext ist der erste Bezugsrahmen fast nie zufällig. Er ist die Ermittlungshypothese. Und er kommt vor der Evidenz.

Confirmation bias (Bestätigungsfehler): Sobald eine Hypothese aktiv ist, verarbeitet der menschliche Geist bestätigende Evidenz flüssiger als widersprüchliche. Bestätigende Beobachtungen werden registriert, notiert, gewichtet. Widersprüchliche Beobachtungen werden langsamer wahrgenommen, häufiger auf alternative Interpretationen hin erneut untersucht und häufiger als Anomalien beiseitegelegt. Das Ergebnis ist keine absichtliche Unehrlichkeit. Das Ergebnis ist ein Gutachten, das die Hypothese widerspiegelt statt der Evidenz, auch wenn der Sachverständige aufrichtig glaubt, die Evidenz zu berichten.

Bei der Fingerabdruckuntersuchung ist der Bestätigungsfehler genau das, was Dror und Charlton dokumentierten: Dieselben Abdrücke, mit verzerrenden Kontextinformationen erneut untersucht, produzierten andere Schlussfolgerungen. Die Abdrücke hatten sich nicht verändert. Die Hypothese des Sachverständigen hatte es.

Authority bias (Autoritätseffekt): Der leitende Sachverständige im Labor hat bereits festgestellt, dass das Material authentisch ist. Du wirst um eine zweite Meinung gebeten. Du liest die erste Meinung, bevor du das Material begutachtest. Die Autorität des ersten Gutachters, seine Seniorität, seine Erfolgsbilanz, seine institutionelle Stellung, wirkt als Richtungskraft auf deine Analyse, ohne dass du entschieden hast, dass sie das sollte. Du bist nicht korrumpiert. Du bist menschlich. Die Korrektur ist im Prinzip einfach und in der Praxis selten: Der zweite Gutachter liest keine erste Meinung, bevor er seine eigene Analyse abgeschlossen hat.

Expectation bias (Erwartungseffekt): Ein erfahrener Rechtsmediziner, der 400 Tötungsdelikte durch stumpfe Gewalt untersucht hat, entwickelt zwangsläufig ein Mustergespür dafür, wie eine Tötungsverletzung im Vergleich zu einer Unfallletzung aussieht. Dieses Mustergespür ist die Expertise. Dasselbe Mustergespür, auf mehrdeutige Beweismittel in einem Fall angewandt, in dem die Ermittlungshypothese Totschlag lautet, schiebt die Interpretation systematisch in Richtung Totschlag. Dieselbe Verletzung, ohne Ermittlungskontext präsentiert, würde möglicherweise leichter als mehrdeutig klassifiziert werden. Die Expertise und die Verzerrung laufen auf demselben kognitiven Track. Man kann das eine nicht haben ohne das Risiko des anderen. Die strukturelle Antwort ist die blinde Untersuchung mehrdeutiger Beweismittel, nicht besseres Training.

Tunnel vision (Tunnelblick): Bereits im Jewell-Fall-Kontext beschrieben, aber als eigenständiger Mechanismus vom Bestätigungsfehler zu unterscheiden. Bestätigungsfehler ist die bevorzugte Verarbeitung bestätigender Informationen. Tunnelblick ist das Versagen, alternative Hypothesen überhaupt zu erzeugen. Der Ermittler, der einen Verdächtigen identifiziert hat, hört auf zu fragen, wer sonst noch infrage kommen könnte. Der forensische Sachverständige, dem ein Verdächtiger für den Vergleich gegeben wurde, hört auf zu fragen, ob der Vergleichsrahmen überhaupt der richtige ist. Tunnelblick ist kein Scheitern der Logik innerhalb einer Hypothese. Es ist das Scheitern, die Hypothese selbst in Frage zu stellen.

Hindsight bias (Rückschaufehler): Nach dem Urteil wirkt alles offensichtlich. Das Strafmaß wurde verhängt. Rückblickend auf die Beweismittel denkt der Sachverständige: Natürlich zeigte es in diese Richtung. Die Erinnerung an die Zweideutigkeit verblasst. Die Erinnerung an die Schwierigkeit löst sich auf. Was zum Zeitpunkt der Analyse tatsächlich unsicher war, bekommt retrospektiv den Charakter der Klarheit. Das ist deshalb bedeutsam, weil es das Lernen korrumpiert. Wenn die Fälle mit korrekten Schlussfolgerungen im Nachhinein wie immer klar gewesen wirken, lernt der Sachverständige nie, wie Unsicherheit in Echtzeit aussieht.

Framing bias (Rahmungseffekt): Zwei Fragen, dieselbe Evidenz. Frage eins: Sind diese 2 Proben konsistent mit einer gemeinsamen Herkunft? Frage zwei: Sind diese 2 Proben verschieden? Dieselbe Probenkombination, derselbe Gutachter, aber die Rahmung verschiebt den kognitiven Ausgangspunkt. Die erste Frage sucht nach einer Übereinstimmung und lädt den Gutachter ein, nach einer zu suchen. Die zweite Frage sucht nach einem Unterschied. Keine der Fragen ist neutral. Eine wirklich unabhängige Untersuchung stellt keine von beiden: Sie bittet den Gutachter zu beschreiben, was er beobachtet, und schiebt die interpretative Frage ans Ende. Die Rahmung der Beauftragungsfrage wird selten als Biasquelle diskutiert. Sie sollte es werden.

Peer pressure bias (Sozialer Konformitätsdruck): Der Mayfield-Fall umfasste 3 Gutachter und einen unabhängigen Experten, die alle zur selben falschen Schlussfolgerung gelangten. Teil dessen, was geschah, war genau dies: Sobald 2 Kollegen eine Übereinstimmung bestätigt haben, ist der strukturelle Druck auf den dritten Prüfer nicht auf unabhängige Analyse gerichtet, sondern auf Bestätigung. Widerspruch erfordert Selbstsicherheit, Argumentation und die Bereitschaft, institutionelle Reibung zu tragen. Zustimmung ist einfach, schnell und reibungslos. Die sozialen Kosten des Widerspruchs sind real, auch unter Profis, die aufrichtig bestreiten würden, dass soziale Kosten ihre technischen Urteile beeinflussen. Sie beeinflussen sie trotzdem.

Availability heuristic (Verfügbarkeitsheuristik): Der aktuell lebendigste Fall beeinflusst den nächsten, ohne dass der Sachverständige das registriert. Letzte Woche hast du an einem Fall mit einem besonders klaren Beispiel von Produktionsartefakt in einer Videoaufnahme gearbeitet. Dieses Wochen-Material hat ein vage ähnliches Qualitätsartefakt. Die Verfügbarkeit des Vorwochenfalls erhöht die Salienz der Produktionsartefakt-Interpretation für das aktuelle Material, unabhängig davon, ob die 2 Situationen tatsächlich vergleichbar sind. Erfahrung baut Expertise auf. Sie baut auch einen Katalog verfügbarer Interpretationsmuster auf, und nicht alle Muster sind gleichermaßen anwendbar.

Role bias (Rollenbias): Der von der Staatsanwaltschaft beauftragte Sachverständige operiert strukturell als Teil des Anklageteams. Nicht weil man ihn bittet, Partei zu ergreifen, sondern weil der organisatorische Kontext ihn in einen fallaufbauenden Apparat einbettet. Mit der Zeit entwickeln Sachverständige, die primär mit Ermittlern zusammenarbeiten, eine professionelle Identität, die partiell ermittlungsbezogen ist. Ihre Gutachten beginnen, mehr wie Ermittlungsbeiträge zu lesen als wie unabhängige Analysen. Ton, Rahmung, Gewichtung bestätigender versus gegenteiliger Beobachtungen driften allmählich in Richtung der Beauftragungsrolle. Kein einzelnes Gutachten repräsentiert eine bewusste Entscheidung zur Verzerrung. Der akkumulierte Drift repräsentiert ein strukturelles Ergebnis der Beauftragungsbeziehung.

Diese Formen des Bias operieren nicht isoliert. In jedem gegebenen Fall sind wahrscheinlich mehrere gleichzeitig präsent, sie nähren und verstärken sich gegenseitig. Der Kollege, der deine Analyse verankert, repräsentiert möglicherweise gleichzeitig eine Autorität, die den Autoritätseffekt auslöst. Die ermittlungsbezogene Rahmung, die den Erwartungseffekt erzeugt, definiert auch die Rollenbeziehung, die den Rollenbias erzeugt. Diese Kombinationen sind nicht additiv. Sie sind multiplikativ. Ein Fall, in dem 4 oder 5 dieser Mechanismen gleichzeitig aktiv sind, ist nicht 4- oder 5-mal so verzerrt wie ein Fall, in dem 1 aktiv ist. Er ist ein Fall, in dem unabhängige Analyse strukturell nahezu unmöglich geworden ist.

Warum die Vollakte das Kernproblem ist

Ich komme zurück auf die Akte, die auf meinem Schreibtisch angekommen ist. Ich sage es deutlich. Die strukturelle Praxis, dem forensischen Sachverständigen die vollständige Ermittlungsakte zu schicken, einschließlich der Ermittlungsnarration, der Vernehmungszusammenfassungen, des Vorregisters, der Staatsanwaltstheorie des Falls, ist eines der effektivsten Bias-Liefermechanismen im deutschsprachigen Rechtssystem, und er wird fast nie als solcher diskutiert.

Die Rechtfertigung ist praktisch: Der Sachverständige braucht Kontext, um die gestellte Frage zu verstehen. Das stimmt, bis zu einem gewissen Punkt. Ich muss wissen, was ich untersuchen soll. Ich muss nicht wissen, dass die Ermittlungsbehörde von der Schuld des Beschuldigten überzeugt ist, bevor ich die Videodatei öffne. Ich muss das Vorstrafenregister nicht lesen, bevor ich Körperstruktur und Bewegungsmuster beurteile. Ich muss die Vernehmungszusammenfassung nicht kennen, bevor ich die Methodik der Bildauthentifizierung anwende.

Wenn ich die vollständige Akte bekomme, erhalte ich tatsächlich einen vorstrukturierten Interpretationsrahmen, in den ich eingeladen werde, meine Befunde einzupassen. Jede zweideutige Beobachtung hat eine naheliegende Auflösung, die in der Akte steckt: Das Ermittlungsteam hat es so aufgelöst, und die implizite Einladung lautet, es genauso aufzulösen. Sachverständige, die diese Einladung internalisieren, tun das nicht aus Unehrlichkeit, sondern aus denselben kognitiven Prozessen, die Dror in den Fingerabdruckexperimenten demonstriert hat: Der vorherige Kontext verändert die Schwelle, ab der ein Merkmal als bedeutsam gezählt wird, die Schwelle, ab der ein Widerspruch wegerklärt wird, die Schwelle, ab der eine Schlussfolgerung als robust genug für die Berichterstattung gilt.

Mein Protokoll lautet: Ich extrahiere die spezifisch gestellten Fragen und die angeforderten Beweismittel, bevor ich irgendetwas anderes öffne. Ich analysiere die Beweise zuerst. Den Ermittlungskontext, falls überhaupt, lese ich danach. Das ist keine universelle Praxis in meinem Feld. Es sollte eine sein, und es ist aus gutem Grund keine: Es macht den Ermittlern das Leben schwerer, den Beauftragungsprozess unkomfortabler und die Lieferzeit länger. Das sind keine überzeugenden Argumente gegen das Protokoll. Es sind überzeugende Beschreibungen davon, warum das Protokoll nötig ist.

Tunnelblick und die Kaskade

Es gibt eine spezifische Form der kognitiven Verzerrung, der forensische Praktiker am häufigsten begegnen und die gleichzeitig am schwierigsten in Echtzeit zu benennen ist: Tunnelblick. Tunnelblick ist keine Dummheit. Es ist keine Nachlässigkeit. Es ist die Konsequenz echter Expertise, die ohne strukturelle Schutzmaßnahmen operiert. Ein erfahrener Ermittler, der 200 Einbrüche gesehen hat, erkennt das Muster des 201. schnell, effizient und oft korrekt. Derselbe kognitive Mechanismus, auf einen Verdächtigen statt auf einen Verbrechenstyp angewandt, erzeugt eine Gewissheit, die die Evidenz überholt.

Der forensische Sachverständige, der nach dem Ermittler ankommt, der bereits eine Hypothese gebildet hat, befindet sich im Sog dieses Tunnels. Die Akte enthält die Architektur des Tunnels. Jedes nachfolgende Beweismittel, der Fingerabdruckvergleich, die Bildanalyse, die Gangbeurteilung, wird von innen dieser Architektur aus evaluiert, gegen diese Hypothese, mit dem Übereinstimmungsschwellenwert, der durch frühere Bindung statt durch die Evidenz selbst gesetzt wird.

Risinger, Saks, Thompson und Rosenthal dokumentierten den Mechanismus, den sie als “Beobachtereffekte” bezeichneten: Forensische Gutachter sind keine neutralen Beobachter physischer Beweise, sondern Menschen, deren Wahrnehmungs- und kognitive Prozesse durch Erwartungen geformt werden, und diese Erwartungen treten unsichtbar in die forensische Analyse ein (Risinger, D. M., Saks, M. J., Thompson, W. C., & Rosenthal, R., 2002, California Law Review, 90(1), 1-56). Die Arbeit stammt aus dem Jahr 2002. Sie wurde hunderte Male zitiert. Die beschriebenen Praktiken haben sich nicht grundlegend geändert.

Die Kaskade ist das, was passiert, wenn die Verzerrung durch eine Kette von Sachverständigen und Überprüfern weitergegeben wird. Im Mayfield-Fall lief die Kaskade sequentiell: Erster Gutachter identifiziert eine Übereinstimmung, zweiter Gutachter prüft und bestätigt, dritter Gutachter prüft und bestätigt, unabhängiger externer Experte prüft und bestätigt. In jeder Phase weiß der überprüfende Gutachter, zu welchem Ergebnis der vorherige gelangt ist. In jeder Phase ist der strukturelle Druck eher zu bestätigen als zu widersprechen, weil Widerspruch teuer ist: Er erfordert die Identifizierung der genauen Fehlerquelle des vorherigen Gutachters und die Verteidigung dieser Identifizierung unter Angriff. Bestätigung ist einfach. Bestätigung ist auch die Art, wie verzerrte Schlussfolgerungen durch einen Überprüfungsprozess wandern, der darauf ausgelegt scheint, Fehler zu erkennen, aber tatsächlich als Verstärkungsmaschine funktioniert.

Die strukturell korrekte Antwort auf dieses Problem ist die, die ich bereits als unabhängige Verifikation beschrieben habe: Jeder Prüfer arbeitet von der Primärevidenz aus, ohne Kenntnis der vorangegangenen Schlussfolgerungen, und Schlussfolgerungen werden erst verglichen, nachdem jeder Gutachter seine eigene festgeschrieben hat. Das erfordert institutionelle Unterstützung, Zeit und Geld, das Strafermittlungen routinemäßig nicht zuweisen. Die Konsequenz ist eine Überprüfungsarchitektur, die von außen rigoros aussieht und von innen als Bestätigungsmaschine funktioniert.

Was Verzerrung tatsächlich reduziert

Bewusstsein für Verzerrungen hilft etwas, aber weniger als Menschen annehmen. Die metaanalytische Arbeit legt nahe, dass das Training forensischer Profis zur Erkennung kognitiver Verzerrungen bescheidene Auswirkungen auf die Ergebnisgenauigkeit hat, und dass die Auswirkungen bei expliziten Denk aufgaben stärker sind als bei Wahrnehmungs- und Mustererkennung, was genau die Aufgaben sind, in denen forensische Expertise liegt (Dror, I. E., 2016, A hierarchy of expert performance, Journal of Applied Research in Memory and Cognition, 5(2), 121-127).

Was tatsächlich wirkt, ist strukturell, nicht psychologisch.

Blinde Untersuchung, bei der der Sachverständige die Beweise ohne Zugang zu Kontextinformationen analysiert, die für die Analyse irrelevant sind, reduziert die Angriffsfläche für Verzerrungen. Das ist nicht immer administrativ bequem. Es funktioniert.

Linear sequentielles Entblinden, ein Protokoll, bei dem der Sachverständige nur die für jeden Analyseschritt streng notwendige Information erhält und Kontextinformationen erst erhält, nachdem seine Schlussfolgerungen über die physische Evidenz festgeschrieben sind, adressiert dasselbe Problem granularer. Dror und Kollegen haben diesen Ansatz speziell für forensische Kontexte entwickelt und validiert (Dror, I. E., et al., 2015, Journal of Forensic Sciences, 60(4), 1111-1112).

Unabhängige Verifikation, bei der die Evidenz von einem zweiten Sachverständigen ohne Kenntnis der Schlussfolgerung des ersten untersucht wird, adressiert das Kaskadenproblem, das Mayfield illustrierte. Echte Unabhängigkeit bedeutet, nicht zu wissen, was die erste Analyse ergeben hat.

Strukturierte Berichtsprotokolle, die verlangen, dass der Sachverständige vor der Darstellung einer Schlussfolgerung spezifiziert, welche Beobachtungen die Schlussfolgerung stützen, welche neutral sind und welche damit inkonsistent sind, reduzieren die Tendenz zur selektiven Berichterstattung. Die Gegenindikatoren gehören in den Bericht, präzise als Gegenindikatoren gerahmt, damit das Gericht das Beweisgewicht der Schlussfolgerung gegen das vollständige Bild abwägen kann.

Der NAS-Bericht von 2009, korrekt als “Strengthening Forensic Science in the United States: A Path Forward” tituliert und vom National Research Council veröffentlicht, nicht, wie er manchmal fälschlicherweise zugeschrieben wird, vom US-Justizministerium, dokumentierte diese strukturellen Probleme der forensischen Praxis ausführlich (National Research Council, 2009, The National Academies Press). Die meisten der empfohlenen Reformen wurden nicht oder nur teilweise umgesetzt.

Interessenkonflikte und das strukturelle Problem der Sachverständigenabhängigkeit

Forensische Sachverständige im deutschen System werden häufig von Ermittlern oder Staatsanwälten beauftragt. Die Verteidigung beauftragt eigene Sachverständige, die anders finanziert werden und typischerweise unter anderen praktischen Einschränkungen operieren. Der strukturelle Anreiz für den staatsanwaltschaftlichen Sachverständigen ist nicht korrumpiert: Er ist subtil und allgegenwärtig. Sachverständige, die konsistent Schlussfolgerungen erzielen, die für die beauftragende Behörde ungünstig sind, werden seltener beauftragt. Das ist keine Verschwörung; das ist ein Marktmechanismus. Und Marktmechanismen erzeugen, ohne strukturelle Gegenmittel, systematische Verzerrung, ohne dass ein einzelner Akteur das beabsichtigt.

Transparente Offenlegung des Beauftragungskontexts, also wer die Arbeit in Auftrag gegeben hat, welche Informationen zu Beginn bereitgestellt wurden, und wie der Sachverständige bezahlt wurde, ist eine Teilminderung. Sie eliminiert das strukturelle Problem nicht, macht den strukturellen Druck aber für das Gericht sichtbar. Ein Bericht, der seine eigenen potenziellen Verzerrungsquellen dokumentiert, ist glaubwürdiger, nicht weniger glaubwürdig, weil er zeigt, dass der Sachverständige sich mit der Frage auseinandergesetzt hat, statt so zu tun, als existiere sie nicht.

Saks und Koehler haben den Paradigmenwechsel identifiziert, den die forensische Identifikationswissenschaft braucht: weg von aussagebezogener Gewissheit hin zu probabilistischen, empirisch fundierten Aussagen über Beweisgewicht (Saks, M. J., & Koehler, J. J., 2005, Science, 309(5736), 892-895). Das Gerichtssystem, das an Sachverständigenaussagen gewöhnt ist, die Ja oder Nein sagen, und das unbequem ist mit Aussagen, die “wahrscheinlich ja mit diesem Wahrscheinlichkeitsgrad” sagen, erzeugt institutionellen Druck gegen kalibrierte Unsicherheit. Der strukturelle Anreiz treibt zur Überzeugung hin, und Überzeugung ist die Mutter der kognitiven Verzerrung.

Meine eigene Praxis: Was ich tue und warum

Ich bin nicht immun gegen kognitive Verzerrung. Ich sage das nicht als rhetorischen Zug zur falschen Bescheidenheit, sondern als sachliche Aussage darüber, wie Kognition funktioniert. Kein Maß an Training, Erfahrung oder theoretischem Verständnis von Verzerrung immunisiert den Praktiker dagegen. Was diese Dinge können, ist die Angriffsfläche zu reduzieren, auf der Verzerrung operiert, wenn sie von strukturellen Praktiken begleitet werden, nicht nur von Einstellungsveränderungen.

Mein Standardprotokoll für Bild- und Videoforensikaufträge: Ich lese das Anschreiben und extrahiere die spezifischen analytischen Fragen. Ich notiere Kontextinformationen, die ich unfreiwillig erhalten habe, was aus dem Brief, der Aktennummer, dem Datum sichtbar ist. Ich öffne die Fallakte nicht, bevor ich die Primäranalyse abgeschlossen habe. Ich arbeite durch das Beweismaterial zu den spezifisch gestellten Fragen. Erst nachdem meine Beobachtungen dokumentiert und meine vorläufigen Schlussfolgerungen festgehalten sind, lese ich, falls überhaupt, den Ermittlungskontext.

Dieses Protokoll macht meine Analyse nicht kontextfrei. Ich komme zu jedem Fall mit Wissen, das sich aus früheren Fällen angesammelt hat, mit theoretischen Bindungen, die durch Training geformt wurden, mit Wahrnehmungsmustern, die durch Erfahrung geprägt wurden. Diese sind nicht eliminierbar. Was das Protokoll verhindert, ist die Hinzufügung eines spezifischen, frischen und hochgradig aufgeladenen Kontextstücks, dieser Verdächtige, dieser Vorwurf, diese Schuldnarration, das auf meine Analyse einwirkt, bevor die Analyse stattgefunden hat.

Das zweite Element meiner Praxis: Ich dokumentiere meine Gegenindikatoren. Jede Analyse, die ich einreiche, enthält einen Abschnitt, der Beobachtungen festhält, die inkonsistent mit oder neutral gegenüber der Schlussfolgerung sind, die ich ziehe. Das ist keine Selbstuntergrabung. Es ist das Gegenteil davon. Ein Sachverständiger, der nur die Beobachtungen berichtet, die die Schlussfolgerung stützen, ist ein Sachverständiger, dem man nicht vertrauen kann, weil die Beobachtungen, die die Schlussfolgerung nicht stützen, ebenso real und ebenso Ergebnis der Analyse sind.

Das dritte Element: Ich lehne Aufträge ab, bei denen der Kontextdruck strukturell unlösbar ist. Es gibt Fälle, in denen das Investmentinteresse der beauftragenden Behörde in eine bestimmte Schlussfolgerung so explizit kommuniziert wurde, in der Rahmung der Fragen, in der Auswahl der bereitgestellten Beweismittel, im Telefonat, das der Akte vorausging, dass echte Unabhängigkeit unter den strukturellen Bedingungen des Auftrags nicht erreichbar ist. Diese lehne ich ab. Nicht aus einem abstrakten Prinzip, sondern weil eine Analyse, die ich nicht unabhängig durchführen kann, eine Analyse ist, hinter der ich nicht stehen kann, und eine Analyse, hinter der ich nicht stehen kann, sollte nicht auf einem Gerichtsexhibit erscheinen.

Strukturelle Reform ist die einzige adäquate Antwort

Individuelle Praxisverbesserungen sind notwendig, aber nicht ausreichend. Das Ausmaß des Problems ist institutionell. Thompson stellte die zentrale strukturelle Frage: Wie viel Zugang zu Ermittlungskontext sollte ein forensischer Sachverständige in jeder Phase der Analyse haben, und wer kontrolliert diesen Zugang? (Thompson, W. C., 2011, Australian Journal of Forensic Sciences, 43(2-3), 123-134.) Die Antwort, die die aktuelle Praxis standardmäßig produziert, lautet: vollständiger Zugang, zu Beginn, kontrolliert durch die Auftraggeber. Das ist die aus Sicht der Bias-Minimierung schlechtmöglichste Antwort auf diese Frage.

Ioannidis’ breitere Analyse, warum Forschungsergebnisse häufig unzuverlässig sind, gilt für forensische Wissenschaft in vollem Umfang: Kleine Studien in motivierten Kontexten, fehlende Vorabspezifikation von Analysemethoden und das Fehlen einer Kultur transparenter Fehlerberichterstattung erzeugen systematische Verzerrungen (Ioannidis, J. P. A., 2005, PLOS Medicine, 2(8), e124). Die institutionellen Bedingungen für unzuverlässige Befunde sind nahezu vollständig vorhanden.

Saks und Koehler identifizierten den Paradigmenwechsel, den forensische Identifikationswissenschaft braucht: weg von Zeugenaussagengewissheit hin zu probabilistischen, empirisch fundierten Aussagen über Beweisgewicht (Saks, M. J., & Koehler, J. J., 2005, Science, 309(5736), 892-895). Das Gerichtssystem, das an Sachverständigenaussagen gewöhnt ist, die Ja oder Nein sagen, schafft institutionellen Druck gegen kalibrierte Unsicherheit. Der strukturelle Anreiz treibt zur Überzeugung hin, und Überzeugung ist die Mutter der kognitiven Verzerrung.

Ich unterstütze die von Mnookin und Kollegen geforderte Forschungskultur: eine institutionelle Ausrichtung auf empirische Validierung von Methoden, unabhängig von den Bedürfnissen der Strafverfolgung, und auf ehrliche Veröffentlichung von Fehlerquoten, Versagensmodi und methodischen Einschränkungen (Mnookin, J. L., et al., 2011, UCLA Law Review, 58, 725-779). Diese Forschungskultur existiert nicht im benötigten Umfang. Sie aufzubauen erfordert eine Art von struktureller Investition, die die politische Ökonomie der Strafjustiz nicht natürlich erzeugt, weil der politische Anreiz darin besteht, Verbrechen zu lösen, nicht darin, die Fehlerquoten der Methoden zu dokumentieren, mit denen man sie löst.

Was ich allein oder in Kombination mit anderen Praktikern, die ähnliche Ansichten teilen, nicht kann, ist, institutionelle Reform zu ersetzen. Die Vollakte wird weiterhin auf Schreibtischen im deutschsprachigen Rechtsraum ankommen, beladen mit ihrer Schuldnarration, bis das System, das sie verschickt, geändert wird. Das ist die tatsächliche Größe der Aufgabe.

Der Elefant sitzt lange genug im Raum

Ich sage das nicht aus Bitterkeit. Ich sage es, weil ich diese Beobachtung seit über 2 Jahrzehnten trage, und die höflichen Foren haben nicht genug bewirkt. Kognitive Verzerrung in der forensischen Wissenschaft braucht nicht primär bessere Trainingsseminare. Sie braucht strukturelle Reform der Praktiken, die Verzerrungen erzeugen und übertragen: die vollständige Fallakte, die zu Beginn geliefert wird, das Fehlen verpflichtender Blindprotokolle, die Abwesenheit systematischer unabhängiger Verifikation, die strukturelle Abhängigkeit des Sachverständigeneinkommens von der Ermittlungszufriedenheit, und die Präferenz des Gerichts für Gewissheit gegenüber ehrlicher Aussage über Unsicherheit.

Jeder forensische Sachverständige, der eine vollständige Ermittlungsakte erhält und die Narration nicht quarantänt, bevor er die Beweise analysiert, nimmt an einem Bias-Liefersystem teil. Nicht absichtlich. Nicht korrumpiert. Als Frage struktureller Gewohnheit. Und Gewohnheiten werden durch strukturelles Redesign geändert, nicht durch Bewusstseinsseminare.

Die hier diskutierten Fälle, Mayfield, Jewell, die Central Park Five, sind keine Anomalien. Sie sind der sichtbare Teil eines Eisbergs, dessen unsichtbare Masse aus Fällen besteht, in denen Verzerrungen wirkten, aber keine Freispruch, kein Vergleich, keine nachträgliche Identifizierung des wahren Täters sie sichtbar machte. In diesen Fällen hat niemand den Bericht darüber geschrieben, was falsch gelaufen ist. Die falsche Schlussfolgerung sitzt noch immer irgendwo in einer Akte, unrevidiert, unbefragt und dauerhaft.

Das ist das tatsächliche Ausmaß des Problems. Und es ist, offen gesagt, inakzeptabel für ein System, das menschliche Freiheit auf der Grundlage von Schlussfolgerungen auf dem Spiel setzt, deren Entstehungsbedingungen sie systematisch verzerren.

Ich trage die Beobachtung, dass die Vollakte das zentrale Vektor des Problems ist, seit über 2 Jahrzehnten mit mir, und die höflichen Foren haben nicht genug bewirkt. Jedes Mal, wenn ich gefragt werde, warum manche Sachverständigengutachten so vorhersehbar in dieselbe Richtung zeigen wie die Ermittlungen, die sie begleiten, ist die Antwort nicht schwer. Das Problem heißt Seite 1 der Akte. Das Problem ist strukturell. Und es bleibt strukturell, bis jemand die Struktur ändert.

Die Namen, die dieser Artikel behandelt, Mayfield, Jewell, die Central Park Five, sind sichtbar, weil die Systeme, die in ihren Fällen versagt haben, konfrontiert wurden: mit einem Geständnis, mit einem anderen Fingerabdruck, mit DNA, die woandershin wies. Für jeden dieser Fälle existieren vermutlich Dutzende von Fällen, in denen die Verzerrung stillschweigend gewirkt hat, in denen keine neue Evidenz aufgetaucht ist, in denen niemand einen Bericht über das Versagen geschrieben hat. Diese Fälle bleiben, wie sie sind. Die Schlussfolgerungen in ihnen bleiben, wie sie sind. Unrevidiert.

Quellen

Dror, I. E., & Charlton, D. (2006). Why experts make errors. Journal of Forensic Identification, 56(4), 600-616.
Dror, I. E., Charlton, D., & Péron, A. E. (2006). Contextual information renders experts vulnerable to make erroneous identifications. Forensic Science International, 156(1), 74-78. https://doi.org/10.1016/j.forsciint.2005.10.017
Dror, I. E. (2016). A hierarchy of expert performance. Journal of Applied Research in Memory and Cognition, 5(2), 121-127. https://doi.org/10.1016/j.jarmac.2016.03.001
Dror, I. E., Kukucka, J., Kassin, S. M., & Zapf, P. A. (2015). Context management toolbox: A linear sequential unmasking approach for minimizing cognitive bias in forensic decision making. Journal of Forensic Sciences, 60(4), 1111-1112. https://doi.org/10.1111/1556-4029.12805
Ioannidis, J. P. A. (2005). Why most published research findings are false. PLOS Medicine, 2(8), e124. https://doi.org/10.1371/journal.pmed.0020124
Kahneman, D. (2011). Thinking, Fast and Slow. Penguin Books.
Kassin, S. M., Dror, I. E., & Kukucka, J. (2013). The forensic confirmation bias: Problems, perspectives, and proposed solutions. Journal of Applied Research in Memory and Cognition, 2(1), 42-52. https://doi.org/10.1016/j.jarmac.2013.01.001
Mnookin, J. L., Cole, S. A., Dror, I. E., Fisher, B. A. J., Houck, M. M., Inman, K., Risinger, D. M., Siegel, J. A., Stoney, D. A., Tobin, W., & Zabell, S. L. (2011). The need for a research culture in the forensic sciences. UCLA Law Review, 58, 725-779.
National Research Council. (2009). Strengthening Forensic Science in the United States: A Path Forward. The National Academies Press. https://doi.org/10.17226/12589
Risinger, D. M., Saks, M. J., Thompson, W. C., & Rosenthal, R. (2002). The Daubert/Kumho implications of observer effects in forensic science: Hidden problems of expectation and suggestion. California Law Review, 90(1), 1-56.
Saks, M. J., & Koehler, J. J. (2005). The coming paradigm shift in forensic identification science. Science, 309(5736), 892-895. https://doi.org/10.1126/science.1111565
Thompson, W. C. (2011). What role should investigative facts play in the evaluation of scientific evidence? Australian Journal of Forensic Sciences, 43(2-3), 123-134. https://doi.org/10.1080/00450618.2011.555416