Nieuwe verbeteringen voor cM Explainer™

Nieuwe verbeteringen voor cM Explainer™

MyHeritage heeft vorige maand tijdens RootsTech 2023 de release van cM Explainer™ aangekondigd. cM Explainer™ is een krachtige tool die verwantschapsbanden tussen DNA-matches inschat en voor iedere DNA-match voorspellingen biedt voor mogelijke relaties tussen de twee mensen en de waarschijnlijkheid daarvan. cM Explainer™ gebruikt daarvoor een nieuwe benadering. Bij de berekening van de relatiemogelijkheden worden behalve de hoeveelheid gedeeld DNA ook de leeftijden van de personen betrokken. Zoals met alle MyHeritage-functies, zijn we cM Explainer™ voortdurend aan het verfijnen om de nauwkeurigheid ervan te verbeteren. Vandaag willen we u graag vertellen over verschillende verbeteringen die we hebben aangebracht aan cM Explainer™ om de nauwkeurigheid van de voorspelling voor verre DNA-matches te verbeteren.

Verbeterde voorspellingen voor verre DNA-matches

DNA-matches worden bij MyHeritage standaard weergegeven in aflopende volgorde, van de grootste hoeveelheid gedeeld DNA tot de minste. Als er sprake is van een kleine hoeveelheid gedeeld DNA, dan wordt het moeilijker om onderscheid te maken tussen verre verwantschapsbanden. Naarmate het aantal mogelijke verwantschapsbanden toeneemt, kan het almaar moeilijker worden om de exacte relatie tussen twee personen te voorspellen.

Onlangs hebben we ons voorspellingsmodel verfijnd om beter te kunnen omgaan met lage cM-waarden (centimorgan). Als gevolg daarvan zullen sommige DNA-matches nu voorspellingen ontvangen die wijzen op een verder verwijderde verwantschapsband dan voorheen. Matches die eerder werden voorspeld als waarschijnlijke 3e neven of nichten kunnen nu bijvoorbeeld verschijnen als waarschijnlijke 4e neven of nichten en 4e neven of nichten kunnen nu verschijnen als waarschijnlijke 5e neven of nichten. Deze verbetering van het model voor cM Explainer™ geldt zowel voor relatievoorspellingen voor DNA-matches op MyHeritage als voor het analyseren van matches met behulp van de zelfstandige cM Explainer™-tool.

Een andere verandering die we hebben aangebracht, is dat we bij alle matches met 100 cM of minder gedeeld DNA nu spreken over een “geschatte relatie” in plaats van over een “waarschijnlijke relatie”. We hebben deze verandering aangebracht omdat voorspellingen voor lage cM-waarden onvermijdelijk minder nauwkeurig zijn.

Estimated relationships for matches of less than 100cM

Geschatte relaties voor matches met minder dan 100 cM (klik om te vergroten)

Nauwkeurigere voorspellingen voor verre matches tussen Asjkenazische Joden

Onder endogame populaties, waarin er vaak binnen de eigen gemeenschap wordt getrouwd, kunnen twee personen DNA hebben ontvangen van meerdere gemeenschappelijke voorouders. Dit resulteert in een grotere hoeveelheid gedeeld DNA dan je voor hun verwantschapsband zou verwachten. Oorspronkelijk hield cM Explainer™ bij het berekenen van relatievoorspellingen geen rekening met de etnische oorsprong van de DNA-matches. Daardoor leken de waarschijnlijke verwantschapsbanden tussen sommige matches nauwer dan ze in werkelijkheid zijn.

Als onderdeel van deze update hebben we op MyHeritage de relatievoorspellingen voor DNA-matches met een Asjkenazisch Joodse etniciteit verfijnd, vanwege de geschiedenis van onderlinge huwelijken binnen deze gemeenschap. Deze aanpassing geldt voor verre DNA-matches met minder dan 200 cM gedeeld DNA. cM Explainer™ gebruikt nu een formule die is ontwikkeld door het MyHeritage Science Team. Deze formule houdt rekening met de mate van Asjkenazisch Joodse etniciteit in een DNA-match. Het door het algoritme gebruikte gedeelde DNA wordt gecorrigeerd om de verwantschapsband nauwkeuriger te voorspelen. Hoe meer Asjkenazisch Joodse etniciteit de twee mensen delen, hoe groter de aanpassing aan het algoritme. MyHeritage is het eerste en enige DNA-bedrijf dat relatievoorspellingen levert die rekening houden met endogamie. Deze aanpassing is niet beschikbaar in de zelfstandige cM-tool, omdat daarin geen rekening wordt gehouden met etniciteitsgegevens.

In het onderstaande voorbeeld is de ene match 44 jaar oud met een voor 90,7% Asjkenazisch Joodse etniciteit. De andere match is 54 jaar met een voor 96,4% Asjkenazisch Joodse etniciteit. Ze bezitten 70 cM gedeeld DNA. De oorspronkelijke relatievoorspelling voor deze match duidde op een waarschijnlijke verwantschapsband met een 3e nicht. Door de combinatie van de algemene verbetering van het voorspellingsmodel en de toegevoegde aanpassingen voor twee matches met een significante Asjkenazisch Joodse etniciteit voorspelt cM Explainer™ nu een verwantschapsband met een 5e nicht en noemt de relatie “geschat” in plaats van “waarschijnlijk”.

Improved prediction for distant matches with Ashkenazi Jewish ethnicity

Verbeterde voorspelling voor verre matches met een Asjkenazisch Joodse etniciteit (klik om te vergroten)

We kunnen het algoritme in de toekomst verfijnen om preciezere voorspellingen te doen voor andere endogame populaties.

Samenvatting

We verbeteren cM Explainer™ voortdurend om de nauwkeurigheid van de relatievoorspellingen te verbeteren. We hopen dat deze verbeteringen u in staat stellen om efficiënter met uw DNA-matches te werken en uw verwantschapsbanden beter te begrijpen.