MyHeritage lanceert Book Matching

MyHeritage lanceert Book Matching

We zijn zeer verheugd om de release van een revolutionaire nieuwe technologie aan te kondigen. Het gaat om Book Matching, misschien wel onze beste technologie ooit. Book Matching doet automatisch onderzoek over personen in de stambomen op MyHeritage in onze uitgebreide collectie gedigitaliseerde historische boeken. Alleen MyHeritage beschikt nu over een innovatieve nieuwe technologie die gebruik maakt van semantische analyse om de betekenis van iedere zin op elke pagina van de gedigitaliseerde boeken te bepalen en zo met grote nauwkeurigheid matches te vinden. Book Matching heeft al meer dan 80 miljoen nieuwe matches voor onze gebruikers opgeleverd! Een boekmatch is een alinea in een boek die specifiek gaat over een persoon in de stamboom. De match bevat een directe link naar de passage in het boek en biedt de mogelijkheid om verder te lezen.

Met Book Matching ontdekt u fascinerende informatie over uw familie die u normaal gesproken niet had gevonden. U kunt zelfs nieuwe familieleden en voorouders ontdekken. Gebruik de informatie om uw stamboom uit te breiden en er kleur aan te geven.

Een korte schets van de achtergrond. SuperSearch™, onze zoekmachine voor gegevens werd in 2012 gelanceerd. In december 2015 hebben we de collectie gedigitaliseerde historische boeken aan SuperSearch™ toegevoegd. Zeer recentelijk hebben we het aantal boeken in de Compilatie van gepubliceerde bronnen verdrievoudigd van 150.000 tot 450.000 exemplaren met in totaal 91 miljoen pagina’s. We hebben een hardwerkend team gevormd en zijn van plan om jaarlijks honderden miljoenen pagina’s van gedigitaliseerde boeken aan de collectie toe te voegen.

De uitdagingen

Boeken behoorden altijd al tot de beste bronnen voor onderzoek naar familiegeschiedenis maar het was bijna onmogelijk om ze efficiënt te doorzoeken. Zelfs nadat boeken waren gescand en met behulp van optische tekenherkenning (OCR) waren geconverteerd naar digitale, doorzoekbare tekst, vergde het altijd nog veel tijd en doorzettingsvermogen om de eindeloze reeks fout-positieve resultaten door te spitten. Als u bijvoorbeeld een Richard Thomas in uw stamboom hebt staan en boektektsten op die naam doorzoekt, ontvangt u ook resultaten voor mensen die Richard of Thomas heten, zonder onderscheid naar voor- of achternaam. En zelfs als er een Richard Thomas werd gevonden, was het waarschijnlijk niet degene die u zocht. Het is zo goed als onmogelijk om naar een Richard Thomas te zoeken, die is geboren in Virginia en in de vroege jaren veertig is getrouwd met ene Wilma Griffith.

Book Matching komt te hulp

Book Matching ondervangt deze problemen door beschrijvingen van mensen in historische boeken automatisch te ontleden. De technologie begrijpt onder meer namen, gebeurtenissen, data, plaatsen en relaties en matcht de resultaten uiterst nauwkeurig en supersnel met de 2 miljard personen in de stambomen op MyHeritage. De analyse wordt automatisch herhaald als uw stamboom groeit en als er boeken worden toegevoegd.

Een moeilijke opgave makkelijk gemaakt

Genealogische informatie uit boeken halen is geen eenvoudige taak. In gestructureerde documenten, zoals geboorteakten of volkstellingsgegevens, is het heel duidelijk met welke informatie u van doen hebt. Het is duidelijk waar u bijvoorbeeld voornamen en geboortedata kunt vinden. In ongestructureerde gegevens, zoals die voorkomen in gedigitaliseerde historische boeken, is dat niet het geval. Feiten als geboortedatums, locaties en overlijdensdata kunnen op verschillende manieren en in verschillende verbanden worden beschreven en de informatie heeft geen vaste plaats of volgorde. Algemene termen als “dood”, “overleden” en “heengegaan” kunnen verwijzen naar iemands overlijden, maar ook minder vaak gebruikte uitdrukkingen zijn mogelijk. Denk bijvoorbeeld aan “het tijdelijke met het eeuwige verwisselen” en “haar laatste rustplaats gevonden”. Wij beschikken momenteel over een enorm aantal regels om te zoeken naar uitdrukkingen die de dood beschrijven! Mensen komen in boeken vaak niet met hun volledige naam voor. Een alinea kan bijvoorbeeld de voornaam van een vrouw bevatten en dan vervolgen met de naam en omschrijving van haar vader. Om dergelijke passages te analyseren en de puzzelstukjes in elkaar te passen, is gespecialiseerde technologie vereist. We hebben hard gewerkt aan de ontwikkeling van talrijke algoritmen om gegevens over de familiegeschiedenis uit boeken te destilleren. Ze zijn getest en getweakt, opnieuw toegepast en geperfectioneerd, om uiterst nauwkeurig zoveel mogelijk gegevens uit de boeken te verzamelen. Gedurende het proces hebben we miljoenen OCR-fouten kunnen verbeteren. Als de gescande tekst bijvoorbeeld beweert dat iemand in “]\lei” is geboren, dan weten wij dat “Mei” moet zijn. Hetzelfde geldt voor “apnl” en “april”, enzovoort.

De collectie gedigitaliseerde boeken bevat momenteel duplicaten, omdat boeken door meerdere partijen zijn gedigitaliseerd en aan het publieke domein zijn toevertrouwd. Niemand was tot nu toe in staat om die duplicaten op te sporen. We leggen op dit moment de laatste hand aan speciale technologie voor de deduplicatie van die boeken. Als we daarmee klaar zijn, zullen de meeste dubbele matches automatisch verdwijnen.

Book Matching in actie

We hebben Book Matching onlangs aan enkele toonaangevende geneabloggers gepresenteerd. Ze konden zo uit de eerste hand vernemen welke matches er voor hun eigen stambomen waren gevonden.

Dick Eastman van Eastman’s Online Genealogy Newsletter doet al jaren onderzoek naar de geschiedenis van zijn familie. Zijn stamboom op MyHeritage bevat ongeveer 2780 mensen en er werden zo’n 500 boekmatches voor hem gevonden. De gevonden informatie was voor het grootste deel nieuw voor hem.

Bijvoorbeeld, van Elizabeth Fifield, een directe voorouder (8 generaties terug) in de stamboom van Dick, waren alleen de geboorte- en overlijdensdatum en gezinsleden bekend.

In het boek “Genealogical and personal memoirs relating to the families of the state of Massachusetts” van William Richard Cutter (1847-1918) werd een boekmatch voor Elizabeth gevonden. De kans bestaat dat Dick Eastman nooit op de gedachte zou zijn gekomen om dat boek te bestuderen.

Het onderstaande fragment werd door MyHeritage gevonden. De spannende nieuwe informatie betreft hier de echtgenoot van Elizabeth en andere historische informatie over hem en zijn gezin, zoals hun zes kinderen en hun geboortedata. Die gegevens had Dick nog niet en hij kan nu een complete lijn aan zijn stamboom toevoegen.

De stamboom op MyHeritage van genealogieveteraan Randy Seaver van Genea-Musings bevat meer dan 40.000 personen. Met maar liefst 17.323 boekmatches kan hij nu een hele berg nieuwe informatie over mensen in zijn stamboom uitspitten!

Randy heeft bijvoorbeeld William Seaver Woods in zijn stamboom staan, ongehuwd, met alleen een geboortedatum.

MyHeritage vond in het jaarboek “Alumni Record of Wesleyan University, Middletown, Connecticut, 1921” een perfecte match voor William.

Het blijkt dat William aan deze universiteit heeft gestudeerd. De pagina geeft een overzicht van zijn prestaties en vermeldt dat hij een vrouw en een kind had, die beiden in de stamboom van Randy ontbreken. Merk op dat hun zoon Robert de achternaam Crombie van diens moeder Grace draagt. Aangezien Robert niet de achternaam Seaver of Woods gebruikt, had Randy dat zonder dit pareltje waarschijnlijk nooit ontdekt. Randy heeft nu een nieuw spoor. Hij kan deze familielijn die voorheen doodliep nu verder onderzoeken en aanvullen tot aan het heden.

Leland Meitzler van Genealogie Blog heeft zijn stamboom van 5106 personen in MyHeritage geïmporteerd. Dat leverde hem 694 boekmatches op. Leland ontving een melding dat er voor Elisha Mills in zijn stamboom een match was gevonden in het boek “A Walloon Family in America: Lockwood de Forest and His Forbears 1500-1848” uit 1914.

De match beschrijft de ouders van Elisha en zijn prestaties tijdens de Amerikaanse Onafhankelijkheidsoorlog.

Tot slot vonden we ook nog een paar boekmatches voor Pat Richley van Dear Myrtle. Voor Thomas Wasden, de over-overgrootvader van Pat, werden voorheen uitsluitend basisgegevens weergegeven, zoals data en plaatsen.

Er werd automatisch een match voor Thomas gevonden in het boek “Colonial Families of Philadelphia” van John Woolf Jordan (1840-1921) uit 1911.

De match bevatte een foto van hem uit de negentiende eeuw. Dat is een geweldige vondst, die Pat nu aan haar stamboom kan toevoegen.

De geneabloggers waren verheugd over deze spannende nieuwe ontdekkingen, waarmee ze waardevolle informatie aan hun stambomen kunnen toevoegen. Er zat geen enkele misser bij. Als Book Matching zo’n enorme hoeveelheid nieuwe gegevens kan opleveren voor doorgewinterde genealogen die al tientallen jaren hun familiegeschiedenis onderzoeken, dan kunt u zich voorstellen hoe nuttig Book Matching kan zijn voor u en bijna elke andere gebruiker van MyHeritage.

De collectie Compilatie van gepubliceerde bronnen is gratis toegankelijk. Om boekmatches te kunnen bekijken, is een abonnement bij MyHeritage vereist.

Hoe verder? Boek Matching is momenteel uitsluitend beschikbaar voor Engelstalige boeken maar de technologie zal binnenkort worden uitgebreid naar andere talen. We breiden onze bibliotheek met gedigitaliseerde historische gegevens voortdurend uit, zodat u steeds gemakkelijker uw familiegeschiedenis kunt onderzoeken. Wij verwachten dat de omvang van het corpus van gedigitaliseerde boeken op MyHeritage spoedig zal zijn verdubbeld. We zullen genealogieboeken uit heel Europa toevoegen, in alle grote Europese talen!

Hoe weet u dat u boekmatches heeft? Meld u simpelweg aan op uw familiesite en controleer uw Record Matches via het menu Ontdekkingen. Controleer ook uw inbox op e-mails over Record Matches. In de komende dagen sturen we die naar alle gebruikers voor wie nieuwe matches zijn gevonden. Alle matches met alinea’s in een boek zijn mogelijk door deze nieuwe technologie.

Is MyHeritage nieuw voor u? Schrijf u in op onze homepage. Daarna kunt u uw stamboom als GEDCOM-bestand uploaden en snel van Book Matching profiteren. Alleen bij MyHeritage!

De nieuwe Book Matching-technologie zal u versteld doen staan over de waarde van boeken. U zult ze opnieuw leren waarderen als bron voor stamboomonderzoek.

Veel plezier!

Opmerkingen

Het e-mailadres wordt privé gehouden en wordt niet weergegeven.

  • T.S.Glastra

    april 18, 2016

    geweldige vooruitgang

  • T.S.Glastra

    april 18, 2016

    geweldige prestatie

  • Jan M. Brandt

    april 18, 2016

    Proficiat, deze toevoeging aan het toch al bijzondere programma lijkt mij een enorme uitdaging te zijn geweest voor uw team.
    Ik vertrouw er op dat van de door u genoemde ‘grote Europese talen’ ook het Nederlands onderdeel is.

  • Ger Hemmes

    april 18, 2016

    Ik ben heel benieuwd…

  • catharina

    april 18, 2016

    Lijkt me geweldige aanvulling!

  • Hilbert Jacob Grieko van der Zwaag

    april 18, 2016

    Ik heb interesse

  • John de Neef

    april 18, 2016

    Interessante ontwikkeling!

  • Schoeter Guido

    april 18, 2016

    Dit is prachtig nieuws. Hiermee zullen wij misschien verre familie weten te vinden waarvan niemand weet waarna zij zijn vertrokken.
    Groetjes

  • J.W. de Gruijter

    april 19, 2016

    Dit biedt onvoorziene mogelijkheden.
    Prachtig!

  • Van Esch Myriam

    april 19, 2016

    Fantastisch

  • Sjouke schipper

    april 19, 2016

    Deze informatie is wel heel erg gericht op de USA
    komt er ook Nederlandse info beschikbaar?

    • MyHeritageNL

      april 22, 2016

      Beste Sjouke Schipper,

      MyHeritage zal in de toekomst genealogieboeken uit heel Europa toevoegen. We zullen onze gebruikers op de hoogte houden zodra er meer nieuws is.

  • Wim Timmer

    april 19, 2016

    Gefeliciteerd met deze prestatie!

  • maarten

    april 20, 2016

    als deze methode niet teveel kost, lijkt mij dit wel.
    Maarten

  • Ans van Neste

    april 20, 2016

    Het lijkt me geweldig. Ik zoek ook nog familie van voor 1780 en kom niet verder omdat archieven door brand verwoest zijn in Middelburg. Moet je hierop geabonneerd zijn? Hoe gaat dit verder?

  • PetCas

    april 20, 2016

    Ziet er indrukwekkend uit…ga het vanavond meteen proberen, als ik er tenminste voor in aanmerking kom met mijn basis abonnement. Maar dat zie ik dan wel weer. Wordt dan toch upgraden…..

    • MyHeritageNL

      april 22, 2016

      Beste Maarten, Ans en Peter,

      De collectie gedigitaliseerde historische boeken is gratis doorzoekbaar en toegankelijk. Om bij een match de volledige boekmatches te kunnen bekijken, is een abonnement bij MyHeritage nodig. Hiervoor zijn er regelmatig acties en aanbiedingen. Wilt u meer weten of heeft u verdere vragen, bel ons dan gerust via het gratis telnr 0800-2400013.

  • Branders Dirk

    april 21, 2016

    Dat belooft wat … doe zo verder !

  • AH de Bruijn

    mei 10, 2016

    lijkt mij geweldig

  • Rinse B. Rinsma

    juni 7, 2016

    Kan de laatste tijd helaas weinig aan onze stambomen werken i.v.m. ziekte van mijn vrouw, maar om in de toekomst alle nieuwe gegevens te kunnen verwerken, lijkt me geweldig.

  • R.Maeno (Kool van Langenberghe)

    juni 13, 2016

    Zou ik mijn Japanse vader, die in de oorlog in Nederlands-Indië, nu Indonesia, kunnen vinden of zijn familie in Japan ? Doormiddel van deze Book machine?

    • MyHeritageNL

      juni 14, 2016

      Beste R. Maeno, de MyHeritage zoekmachine SuperSearch™ bevat meer dan 6 miljard genealogische gegevens uit de hele wereld. We zouden u aanraden te starten met daarin zoeken op uw familienaam: . Ook kunt een basis stamboom aanmaken (dit kan gratis tot 250 personen). Er zullen dan automatisch ‘SmartMatches’ gegeneerd worden waarvan u bericht krijgt. Dit zijn overeenkomsten met personen in de stamboom van andere MyHeritage gebruikers (80 miljoen wereldwijd). Dit kan leiden tot het vinden van tot dan toe onbekende familieleden. SmartMatches ontvangen en de informatie als samenvatting inzien is gratis. De volledige informatie inzien en actie ondernemen (zoals contact opnemen met het andere MyHeritage lid met wie u een match heeft), is een betaalde Premium functie. We wensen u veel succes! Bij vragen kunt u ons bereiken via gratis telnr: 0800-24 000 13. Zie ook