Was der Knochen weiß, was kein Dokument weiß
Über die 99,63 Prozent Genauigkeit, über die niemand spricht, warum ein Becken jeden Aktenschrank mit Papieren aussticht, und was mit einer Identifikation passiert, wenn der Praktiker die Evidenzhierarchie zugunsten der Methode ignoriert, die er vor 20 Jahren gelernt hat.
Das Becken lag auf dem Untersuchungstisch, als der Kriminalist fragte, was er immer zuerst fragt. Nicht Todesursache, nicht Identität, nicht Liegezeit. Er fragte: Mann oder Frau? Er fragte es in dem Ton, mit dem man Fragen stellt, von denen man glaubt, sie hätten einfache Antworten, mit jener halb ungeduldigen Gewissheit dessen, der ein einzelnes Wort erwartet und dieses Wort in ein Formular einzutragen plant.
Ich gab ihm das Wort. Dann verbrachte ich die nächsten 20 Minuten damit zu erklären, warum ich sicher war, mit welcher Wahrscheinlichkeit, welche Evidenz diese Sicherheit erzeugt hatte, und was mit dieser Sicherheit geschehen wäre, wenn wir einen Schädel allein vor uns gehabt hätten statt eines vollständigen Innominatum. Er hörte auf zu schreiben und fing an zuzuhören, ungefähr 4 Minuten in den Vortrag, was schneller ist als bei den meisten Kriminalisten. Als ich die posteriore Wahrscheinlichkeit der DSP2-Berechnung erreichte, hatte er das Formular mit der beschriebenen Seite nach unten auf den Tisch gelegt und schaute mich so an, wie Menschen schauen, wenn sie merken, dass ein Fachgebiet, das sie für Intuition gehalten hatten, tatsächlich Arithmetik ist.
Das ist das fundamentale Kommunikationsproblem der skelettalen Geschlechtsschätzung: Sie sieht aus wie eine Kunst, sie wird in vielen Institutionen so praktiziert als wäre sie eine Kunst, und sie ist, in den Händen von jemandem, der sie lange und sorgfältig genug betrieben hat, erheblich zuverlässiger als eine Kunst. Der Unterschied zwischen Kunst und Arithmetik ist im Gericht entscheidend, wo ein gegnerischer Sachverständiger, der die Methode versteht, ein Gutachten, das nicht auf quantifizierbaren Belegen gründet, auseinandernehmen kann, und wo eine Familie, die auf die Identifikation von Überresten wartet, die genaueste Antwort verdient, die die Disziplin produzieren kann, und nicht die überzeugendst klingende.
Warum das biologische Profil mit dem Geschlecht beginnt

Das biologische Profil ist der Satz von Schätzungen, den ein forensischer Anthropologe aus skelettalen Überresten ableitet, um ein unbekanntes Individuum zu charakterisieren: Geschlecht, Alter, Körpergröße und Herkunft. Diese 4 Parameter definieren gemeinsam den Suchraum, in dem eine Vermisstermittlung operiert. Sie identifizieren niemanden; sie engen die Liste der Menschen, die das Individuum sein könnte, auf eine handhabbare Anzahl von Kandidaten ein, die dann über Zahnunterlagen, DNA oder andere identifizierende Belege abgeglichen werden können.
Von den 4 Parametern wird die Geschlechtsschätzung zuerst durchgeführt, weil sie den Suchraum in einem einzigen Schritt halbiert. Ein weibliches Skelett, geschätzt auf 35 bis 50 Jahre, 158 bis 165 Zentimeter Körpergröße, europäischer Herkunft, eliminiert ungefähr die Hälfte aller Vermissten-Einträge aus der Betrachtung, bevor irgendeine weitere Analyse beginnt. Ein Fehler bei diesem Schritt ist keine kleinere Ungenauigkeit, die nachfolgende Schätzungen kompensieren könnten: Ein weibliches Skelett, das als männlich erfasst wurde, wird in der falschen Hälfte der Datenbank gesucht, unabhängig davon, wie genau Alter, Körpergröße und Herkunft geschätzt werden, und die korrekte Identifikation wird nicht gefunden.
Das ist keine theoretische Gefahr. Die forensische Literatur enthält dokumentierte Fälle, in denen eine Geschlechtsfehlklassifikation, typischerweise ein weibliches Skelett, das aufgrund kranialer Robustizität ohne Beckenanalyse als männlich eingestuft wurde, eine Identifikation um Monate oder Jahre verzögert hat. Die Verzögerung ist nicht abstrakt bedauerlich; sie ist ein konkretes Versagen mit konkreten Konsequenzen für Ermittlungen und für die Familien der Toten. Sie ist auch, angesichts dessen, was das Fachgebiet gegenwärtig über die Genauigkeit verschiedener Methoden an verschiedenen Skelettelementen weiß, ein vermeidbares Versagen.
Die Biologie des Dimorphismus: Wo der Unterschied wohnt und warum
Sexueller Dimorphismus im menschlichen Skelett hat 2 distinkte biologische Ursprünge, und ihr Unterschied erklärt, warum Becken und Schädel so unterschiedlich als Geschlechtsschätzungsinstrumente funktionieren.
Der erste Ursprung ist hormonal. Ab der Pubertät üben Androgene und Östrogene differentielle Effekte auf Knochenwachstum, Dichte und Morphologie aus. Männer entwickeln unter dem Einfluss höherer Androgenkonzentrationen größere Knochenrobustizität, größere Muskelansatzflächen, ausgeprägtere kraniale Superstrukturen und größere allgemeine Skelettdimensionen im Durchschnitt. Frauen entwickeln unter Östrogeneinfluss eine etwas unterschiedliche spongiöse Knochenarchitektur mit Auswirkungen auf Knochendichte und Frakturmuster. Dieser hormonelle Dimorphismus ist real, statistisch signifikant in Populationsstichproben und in jedem Knochen des erwachsenen Skeletts reflektiert. Er ist auch variabel: Einige Frauen sind robuster als manche Männer, die Überlappung zwischen Verteilungen ist bei vielen Messungen substanziell, und das Ausmaß des Unterschieds variiert erheblich zwischen Populationen unterschiedlicher durchschnittlicher Körperzusammensetzung.
Der zweite Ursprung ist funktionell. Weibliche Becken entwickeln spezifische strukturelle Anpassungen für die Geburt, die architektonische Unterschiede vom männlichen Becken produzieren, die primär keine Frage von Größe oder Robustizität sind, sondern von Form, Winkel und Proportion. Der subpubische Winkel ist bei Frauen breiter, um während der Entbindung den fetalen Kopf aufzunehmen. Der Beckeneingang hat eine andere Form, oval bei Frauen statt herzförmig bei Männern. Das Ilium ist stärker ausgeflügelt, das Sakrum kürzer und breiter, die Incisura ischiadica major weiter. Diese Unterschiede sind keine zufälligen Ausdrücke hormoneller Variation; sie sind funktionelle Anpassungen unter direktem Selektionsdruck über die gesamte Evolutionsgeschichte der obligaten bipeden Geburt beim Homo sapiens, die ein besonders schwieriges Geburtsproblem im Vergleich zu den meisten anderen Primaten darstellt, weil der Bipedismus sowohl den fetalen Kopf vergrößert als auch den Geburtskanal verengt hat.
Die Konsequenz dieser Unterscheidung für die forensische Praxis ist tiefgreifend. Hormoneller Dimorphismus ist populationsspezifisch in seinem Ausmaß und auf individueller Ebene variabel. Funktioneller Dimorphismus des Beckens ist weitgehend populationsunabhängig in Richtung und Ausmaß, weil der Selektionsdruck, der ihn produziert hat, über alle menschlichen Populationen ähnlich gewirkt hat. Das ist der Grund, warum das Becken der zuverlässigste skelettale Indikator des Geschlechts ist und warum keine Menge kranialer Erfahrung die Beckenanalyse substituiert, wenn das Becken verfügbar ist.
Vor der Pubertät hat sich keiner dieser Ursprünge in den morphologischen Merkmalen ausgedrückt, auf die die genauesten Methoden sich stützen. Juvenile Skelette zeigen minimalen geschlechtsspezifischen Dimorphismus in den Merkmalen, auf die die Erwachsenenanalyse angewiesen ist. Diese Grenze füllt Erfahrung nicht auf; sie ist eine echte Grenze der Methode.
Das Becken: Die Zahl ist kein Druckfehler
Murail und Kollegen führten die Methode Diagnose Sexuelle Probabiliste 2005 ein. Die Methode wendet 10 lineare Maße des Innominatum auf eine Referenzdatenbank an, die aus 2.040 Skelettpräparaten zusammengestellt wurde, die die weltweite Bandbreite menschlicher Variation repräsentieren, und berechnet über Fishers lineare Diskriminanzanalyse eine posteriore Wahrscheinlichkeit der Geschlechtszuweisung für jedes analysierte Präparat (Murail, P., Brůžek, J., Houët, F., & Cunha, E., 2005, “DSP: A tool for probabilistic sex diagnosis using worldwide variability in hip-bone measurements”, Bulletins et Mémoires de la Société d’Anthropologie de Paris, 17(3-4), 167-176).
Die Genauigkeit dieser Methode an ihrer Validierungsstichprobe betrug 99,63 Prozent. DSP2, die 2017 von Brůžek und Kollegen publizierte Revision, verfeinerte das Messprotokoll und aktualisierte die Referenzdatenbank und erreichte in Validierungsstudien an europäischen, südamerikanischen, griechischen und anderen Populationen vergleichbare oder leicht verbesserte Genauigkeit (Brůžek, J., et al., 2017, “Reliability and validity of the sex diagnosis by DSP software”, Forensic Science International, 281, 207.e1-207.e7). Eine 2025 publizierte Validierungsstudie an einer spanischen Stichprobe von 303 Hüftknochen fand eine Gesamtgenauigkeit über 95 Prozent (PMC11850468, International Journal of Legal Medicine, 2025).
Die 99,63-Prozent-Zahl begegnet manchmal Skepsis von Menschen, die mit der Methode nicht vertraut sind. Sie ist jedoch kein Artefakt einer besonders günstigen Teststichprobe. Sie spiegelt die Tatsache wider, dass pelviner sexueller Dimorphismus in keinem bedeutsamen Sinne populationsspezifisch ist, was die weltweite Referenzdatenbank valide statt bloß ambitiös macht.
Die praktische Einschränkung von DSP2 ist die Knochenverfügbarkeit. Das Innominatum ist in Fällen mit traumatisierten oder taphonomisch veränderten Überresten häufig beschädigt, fehlend oder fragmentiert. DSP2 erfordert mindestens 4 der 10 Messungen, um einen Wahrscheinlichkeits-Output zu produzieren.
Die Phenice-Methode von 1969, von Klales und Kollegen 2012 für die probabilistische Anwendung überarbeitet, nutzt 3 morphologische Merkmale der ventralen Schambeinoberfläche, den ventralen Bogen, die subpubische Konkavität und den medialen Aspekt des Ramus ischiopubicus, um das Geschlecht aus dem Schambein zu schätzen (Klales, A.R., et al., 2012, American Journal of Physical Anthropology, 149(1), 104-114). Das Os pubis gehört zu den am stärksten sexuell dimorphen Elementen des Skeletts und übersteht Fragmentierung häufig besser als das Ilium, was die morphologische Phenice-Bewertung zu einem nützlichen Komplement der DSP2-Metriken macht.
Die Kombination aus DSP2-Metrikanalyse und Klales-morphologischer Bewertung repräsentiert die aktuelle Best Practice der pelvinen Geschlechtsschätzung und produziert Ergebnisse, die im Kreuzverhör verteidigungsfähig sind, weil sie explizit, reproduzierbar und an eine dokumentierte Genauigkeitsgeschichte gebunden sind.
Der Schädel: Ehrlich über seine Grenzen
Der Schädel allein, beurteilt durch einen geschulten Praktiker mit standardisierten morphologischen Protokollen, erreicht bei der Geschlechtsschätzung erwachsener Überreste ungefähr 80 Prozent Genauigkeit. Kranialer Dimorphismus ist variabel genug auf individueller Ebene und populationsspezifisch genug in seiner Ausprägung, dass ein substanzieller Anteil von Präparaten in den ambivalenten Bereich fällt, in dem morphologische Beurteilung nicht zuverlässig unterscheiden kann.
Die relevanten kranialen Merkmale sind gut charakterisiert. Der supraorbitale Torus, die Knochenprotrusion über den Orbita, ist bei Männern ausgeprägter, weil der Musculus temporalis, der bei Männern größer ist, mechanische Anforderungen schafft, die eine stärkere Knochendeposition entlang des Orbitalrandes stimulieren. Die Glabella projiziert bei Männern weiter nach anterior. Der Processus mastoideus, der den Sternocleidomastoideus verankert, ist bei Männern generell größer. Das Stirnbein ist bei Frauen vertikaler, bei Männern stärker geneigt. Orbitalformen sind bei Männern generell rechteckiger und bei Frauen runder. Der Unterkiefer ist größer und kantiger mit breiterem, quadratischem Kinn bei Männern.
Die Walker-Methode von 2008 stellte diese visuelle Beurteilung auf eine solidere statistische Grundlage, indem sie ordinale Bewertungsprotokolle für die am stärksten sexuell dimorphen kranialen Merkmale entwickelte und Diskriminanzfunktionsanalyse auf die resultierenden Scores anwendete, wobei ungefähr 89 Prozent Genauigkeit in der Validierung erreicht wurde (Walker, P.L., 2008, American Journal of Physical Anthropology, 136(1), 39-50).
Das 2024 publizierte Scoping-Review von Wu und Kollegen, das 73 Studien abdeckt, dokumentiert konsistente Genauigkeitsraten von 90 bis 95 Prozent für CT-basierte geometrisch-morphometrische und maschinelle Lernansätze zur kranialen Geschlechtsschätzung (Wu et al., 2024, PMC11627412). Wenn Becken und Schädel beide verfügbar sind, treibt das Becken die Geschlechtsschätzung und der Schädel ist konfirmatorisch.
Röhrenknochen und Fragmente: Wenn der Rest fehlt
Wenn weder Becken noch Schädel gewinnbar sind, liefern die Röhrenknochen metrische Belege für die Geschlechtsschätzung durch Diskriminanzfunktionsanalyse, angewendet auf Maximallänge, Kopfdurchmesser und Schaftumfang. Der Femurkopfdurchmesser gehört zu den zuverlässigsten Einzelmessungen, mit Schwellenwerten, die männliche von weiblichen Verteilungen mit einer Genauigkeit im Bereich von 85 bis 90 Prozent trennen.
FORDISC 3 von Jantz und Ousley wendet diese Prinzipien auf eine Referenzdatenbank an, die hauptsächlich aus der Forensic Anthropology Data Bank abgeleitet wurde (Jantz, R.L., & Ousley, S.D., 2005, University of Tennessee). Das Programm produziert eine Geschlechtsklassifikation mit zugehöriger posteriorer Wahrscheinlichkeit. FORDISCs Einschränkung ist die Zusammensetzung seiner Referenzdatenbank, die zur nordamerikanischen Population gewichtet ist, was bei der Anwendung auf europäische Fälle Fehlklassifikationen produzieren kann.
Was 118 praktizierende Anthropologen 2025 tatsächlich tun
Eine 2025 im Journal of Forensic Sciences veröffentlichte Befragungsstudie von Klales, die 118 in den USA praktizierende Skelett-Geschlechtsschätzer umfasst, liefert das aktuellste systematische Bild des Feldes in der Praxis (Klales, A.R., 2025, Journal of Forensic Sciences, 70, 825-834).
99,0 Prozent der Befragten gaben an, qualitative und quantitative Ansätze in Kombination zu verwenden, was die korrekte Praxis ist. Das Becken war der bevorzugte Ausgangspunkt für morphologische Ansätze. Aber 39,2 Prozent gaben an, die endgültige Schätzung nach Überprüfung aller Methoden auf Erfahrung zu stützen. In Grenzfällen, in denen die Belege nicht sauber konvergieren, führt das Fehlen einer formalen Entscheidungsregel zu Variabilität zwischen Praktikern, die im endgültigen Gutachten nicht sichtbar ist und die im Kreuzverhör nicht getestet werden kann.
DSP2 war, trotz seiner dokumentierten Überlegenheit, in der US-amerikanischen forensischen Praxis weniger verbreitet als FORDISC 3. Was in der Forschungsliteratur Best Practice ist, wird nicht automatisch zur Best Practice im Gerichtssaal, und die Lücke zwischen beiden ist dort, wo Identifikationen scheitern.
Populationsspezifität und das Herkunftsproblem
Das Zusammenspiel von Geschlechts- und Herkunftsschätzung im biologischen Profil ist strukturell unkomfortabel: Einige Geschlechtsschätzungsmethoden erfordern Kenntnis der Populationszugehörigkeit, um die geeignete Referenzgruppe auszuwählen. Wenn die Herkunft falsch geschätzt wird, kann auch die mit populationsspezifischen Normen produzierte Geschlechtsschätzung falsch sein.
DSP2, mit seiner weltweiten Referenzdatenbank, ist darauf ausgelegt, in seiner Geschlechtsdiskrimination populationsunabhängig zu sein. Die korrekte Verwendung von DSP2 erfordert keine vorherige Herkunftsschätzung. FORDISC 3 erfordert die Auswahl einer Referenzgruppe, und die Auswahl der falschen kann den Fehler in die Geschlechtsschätzung fortpflanzen.
Für Praktiker in europäischen Jurisdiktionen, einschließlich Deutschland, lautet die praktische Implikation: populationsunabhängige Methoden priorisieren, primär DSP2 für das Becken, und in jedem forensischen Gutachten explizit die Populationszugehörigkeits-Unsicherheit anerkennen. Ein weibliches Becken, bewertet mit DSP2, trägt eine nahezu sichere Geschlechtszuweisung unabhängig davon, ob das Individuum in München oder Mogadishu geboren wurde.
Polemische Vorwarnung
Ich möchte klar benennen, was forensische Geschlechtsschätzung nicht ist, weil die Verwirrung darüber, was sie ist, reale Konsequenzen produziert, die ich in Gerichtssälen und in der Kommunikation mit Ermittlungsbehörden beobachtet habe.
Sie ist keine Feststellung der Geschlechtsidentität. Das biologische Profil schätzt das biologische Geschlecht, also die hormonelle und funktionelle geschlechtsbezogene Biologie, die sich in der Skelettarchitektur ausdrückt. Das Becken weiß nichts über Selbstidentifikation. Es weiß über Geburtsbiomechanik und hormonelle Entwicklung und berichtet entsprechend mit 99,63 Prozent Genauigkeit.
Sie ist nicht unfehlbar. Die 99,63-Prozent-Zahl für DSP2-Beckenbewertung bedeutet, dass ungefähr 3,7 von jeweils 1.000 Bewertungen falsch sein werden. Sachverständigenzeugnis, das aussagt “die Überreste sind weiblich”, ist epistemisch verschieden von Zeugnis, das aussagt “die Beckenmetriken sind konsistent mit einem weiblichen Individuum mit einer posterioren Wahrscheinlichkeit von 0,996”, und der Unterschied ist bedeutsam für das Gewicht, das dem Beweis rechtlich angemessen beigemessen wird.
Sie ist nicht etwas, das Erfahrung allein für Methode substituieren kann. Ich habe Überreste neben Praktikern untersucht, die auf der Grundlage von Erfahrung überzeugt und auf der Grundlage von Belegen falsch lagen. Überzeugung und Genauigkeit sind nicht dieselbe Variable.
Wohin die Technologie das Feld trägt
Das 2024 publizierte Scoping-Review von Wu und Kollegen dokumentiert 3 methodologische Entwicklungen, die die Geschlechtsschätzungspraxis im kommenden Jahrzehnt grundlegend verändern werden. Die 3D-Bildgebung, insbesondere CT-Scans und strukturierte Lichtabtastung, ermöglicht die Messung von Landmarken, die am physischen Präparat mit manuellen Messgeräten nicht zugänglich sind, und schafft ein digitales Archiv der Überreste, das für Nachfolgeuntersuchungen verfügbar bleibt. Geometrische Morphometrie, die auf Oberflächenform statt auf lineare Distanzen angewendet wird, erfasst Gesamtforminformationen, die konventionelle Landmarkenmessungen auf wenige Zusammenfassungsstatistiken reduzieren. Maschinelle Lernklassifikatoren, die auf CT-Bildstapeln trainiert werden, können Muster in Knochenarchitektur identifizieren, die für jede auf Oberflächenmorphologie basierende Methode nicht zugänglich sind.
Was diese technologischen Entwicklungen nicht verändern, ist die zugrundeliegende Genauigkeitshierarchie der Skelettstruktur. Ein ausgezeichnetes Bildgebungsverfahren, das auf ein inhärent weniger dimorphes Element angewendet wird, produziert immer noch eine weniger genaue Schätzung als ein angemessenes Messverfahren, das auf das inhärent am stärksten dimorphe Element angewendet wird.
Die Evidenzhierarchie ist keine Empfehlung
Die forensische Anthropologie der Geschlechtsschätzung hat in den letzten 50 Jahren eine bemerkenswert klare Hierarchie von Beweisqualitäten produziert. Das Becken, bewertet mit DSP2 und ergänzt durch Klales-morphologische Bewertung der Schamregion, liefert die genauesten aus Knochen verfügbaren Belege. Der Schädel, bewertet mit dem Walker-morphologischen Scoring-Protokoll, liefert sekundäre Belege bei ungefähr 89 Prozent Genauigkeit, die die Beckenbewertung bestätigen, nicht überschreiben sollte. Die Röhrenknochen liefern metrische Belege im Bereich von 80 bis 90 Prozent, die zur Wahrscheinlichkeitsschätzung beitragen, wenn die primären Elemente nicht verfügbar sind.
Dieser Hierarchie zu folgen ist für einen Praktiker, der beabsichtigt, dass seine Arbeit wissenschaftlicher Prüfung standhält, nicht optional. Die Meldung einer Geschlechtsschätzung, die auf kranialer Morphologie allein basiert, wenn das Becken verfügbar, aber nicht untersucht war, ist ein methodisches Versagen, das ein gegnerischer Sachverständiger identifizieren und einem Gericht klar machen kann.
Der Kriminalist, der sein Formular hinlegte und zuhörte, war ungewöhnlich in seiner Bereitschaft, sich auf die Arithmetik einzulassen. Die Aufgabe des Praktikers ist es, beides zu geben: das Wort, und die Zahl dahinter, und die Methode, die die Zahl produziert hat, und die Population, aus der die Methode validiert wurde. Die Knochen erinnern sich an ihre Biologie mit der Präzision der Physik und Chemie. Das Gutachten sollte diese Präzision ehren statt sie in falsche Gewissheit zu übersetzen.
Quellen
- Brůžek, J., et al. (2017). Reliability and validity of the sex diagnosis by the Diagnose Sexuelle Probabiliste (DSP) software. Forensic Science International, 281, 207.e1-207.e7.
- Christensen, A.M., Passalacqua, N.V., & Bartelink, E.J. (2014). Forensic Anthropology: Current Methods and Practice. Academic Press.
- Jantz, R.L., & Ousley, S.D. (2005). FORDISC 3: Personal Computer Forensic Discriminate Functions. University of Tennessee, Knoxville.
- Klales, A.R. (2025). Reevaluating skeletal sex estimation practices in forensic anthropology. Journal of Forensic Sciences, 70, 825-834.
- Klales, A.R., et al. (2012). A revised method of sexing the human innominate using Phenice’s nonmetric traits and statistical methods. American Journal of Physical Anthropology, 149(1), 104-114.
- Murail, P., Brůžek, J., Houët, F., & Cunha, E. (2005). DSP: A tool for probabilistic sex diagnosis using worldwide variability in hip-bone measurements. Bulletins et Mémoires de la Société d’Anthropologie de Paris, 17(3-4), 167-176.
- Ousley, S.D., & Jantz, R.L. (2012). Fordisc 3 and statistical methods for estimating sex and ancestry. In D.C. Dirkmaat (Ed.), A Companion to Forensic Anthropology (pp. 311-329). Wiley-Blackwell.
- Phenice, T.W. (1969). A newly developed visual method of sexing the os pubis. American Journal of Physical Anthropology, 30(2), 297-301.
- PMC11850468. (2025). Application of DSP2 for biological sex estimation in a Spanish sample. International Journal of Legal Medicine. Springer Nature.
- Walker, P.L. (2008). Sexing skulls using discriminant function analysis of visually assessed traits. American Journal of Physical Anthropology, 136(1), 39-50.
- Wu, C., et al. (2024). Sex estimation techniques based on skulls in forensic anthropology: A scoping review. PMC11627412. International Journal of Legal Medicine.