MyHeritage publiceert een nieuwe namenindex voor vermeldingen in historische Amerikaanse en Canadese kranten, met bijna een miljard namen

MyHeritage publiceert een nieuwe namenindex voor vermeldingen in historische Amerikaanse en Canadese kranten, met bijna een miljard namen

Het doet ons een plezier om de publicatie aan te kondigen van een omvangrijke nieuwe collectie van 982 miljoen namen die zijn geëxtraheerd uit onze Amerikaanse en Canadese krantencollecties.

Historische kranten behoren tot de belangrijkste bronnen voor genealogische informatie, omdat ze veel details bevatten. Krantenartikelen geven vaak kleur en een persoonlijke toets aan de droge feiten die u kunt vinden in andere genealogische bronnen, zoals volkstellingen.

Over de collectie

De collectie is een index van namen die zijn onttrokken aan de bestaande ongestructureerde tekst in de Amerikaanse en Canadese krantencollecties op MyHeritage. De ongestructureerde tekst in deze collecties is verkregen door de krantenpagina’s te scannen met behulp van Optical Character Recognition (OCR-technologie). Daarbij worden de afbeeldingen in tekst omgezet.

De nieuwe namenindex komt niet in de plaats van de bestaande collecties met ongestructureerde krantenteksten maar wordt er als afzonderlijke collectie aan toegevoegd. Sterker nog, deze namenindex is nog maar het resultaat van de helft van onze kranten. De rest van de namenindex wordt op dit moment gegenereerd en zal binnenkort worden gepubliceerd. Er liggen dus bijna een miljard extra records in het verschiet.

De records in de index bevatten de naam van een persoon, een stukje tekst waarin de naam van de persoon in de krant voorkomt, de titel van de krant en de datum en plaats van publicatie. Iedere record bevat een scan van het oorspronkelijke krantenartikel. Sommige records bevatten gegevens waarop verder kan worden gezocht, zoals de naam van een echtgenoot of een woonplaats. Die gegevens zijn geëxtraheerd door algoritmen voor machinaal leren. De dekking qua jaren en plaatsen van publicatie vertoont in deze collectie grote verschillen.

Doorzoek de index naamsvermeldingen in kranten op MyHeritage

De nieuwe Index naamsvermeldingen in kranten maakt het veel gemakkelijker voor u om interessante details over uw voorouders te vinden. Gegevens die u bij eerdere zoekopdrachten misschien hebt gemist. Met de toevoeging van deze enorme collectie, zijn er nu 15,1 miljard historische gegevens op MyHeritage beschikbaar.

Waarom we de index naamsvermeldingen in kranten hebben gemaakt 

Hoewel het materiaal al in onze krantencollecties beschikbaar was, waren de zoekmogelijkheden in de ongestructureerde tekst beperkter dan nu. Als u op zoek was naar een voorouder met de voornaam William, werden krantenartikelen waarin uw voorouder Bill of Willie werd genoemd niet gevonden. Ook zou u niet ter zake doende artikelen hebben gevonden over mensen met de achternaam William. De nieuwe namenindex is een gestructureerde collectie die het resultaat is van een slim extractieproces met behulp van machinaal leren. In uw zoekopdrachten kunt u nu synoniemen gebruiken en er wordt onderscheid gemaakt tussen voor- en achternamen. De namenindex bevat zelfs relaties tussen personen en ook adressen, als die geëxtraheerd konden worden. Een krantenartikel waarin bijvoorbeeld “William and Roberta Miller” worden genoemd, levert gestructureerde indexrecords op voor zowel William Miller en Roberta Miller, waarvan we veronderstellen dat ze echtgenoten zijn. Die indexrecords kunnen met behulp van onze formidabele Record Matching-technologie automatisch met stambomen worden gematcht. Voorheen was het mogelijk dat u “William Miller” niet had gevonden, omdat de namen “William” en “Miller” in het artikel niet naast elkaar staan, wat bij ongestructureerde tekst resulteert in een lagere positie in de zoekresultaten.

De Index naamsvermeldingen in kranten maakt gebruik van Global Name Translation™ – de unieke technologie van MyHeritage om namen automatisch tussen verschillende talen te vertalen. Dit betekent dat een zoekopdracht naar namen in bijvoorbeeld het Hebreeuwse of Cyrillische schrift zoekresultaten oplevert van kranten in het Engels. MyHeritage is pionier op het gebied van Global Name Translation™. Onze technologie helpt gebruikers om taalbarrières te overwinnen en records te doorzoeken waarin hun voorouders in verschillende talen worden aangeduid (en naar variaties van namen in alle talen). Lees meer over de MyHeritage-technologie Global Name Translation™ in deze recente blogpost.

Voorbeeldrecords

De Index naamsvermeldingen in kranten bevat een vermelding voor muzieklegende Johnny Cash. De record is gebaseerd op korte vooraankondigingen van televisieprogramma’s die zijn gevonden in de Sarasota Herald-Tribune van 6 april 1978. Het docudrama met Johnny Cash zou op tv komen, dus besteedde de krant er kort aandacht aan. In de krantencollectie met ongestructureerde tekst zou u alleen het stukje tekst zien dat betrekking heeft op Johnny’s naam. De Index naamsvermeldingen in kranten bevat daarentegen naast Johnny’s naam ook de naam van zijn vrouw, June Cash.

Record on Johnny Cash in the Newspaper Name Index

Vermelding voor Johnny Cash in de Index naamsvermeldingen in kranten

De collectie bevat ook een vermelding voor de beroemde architect Frank Lloyd Wright. Het artikel gaat over een makelaarsconferentie waar Wright een van de hoofdsprekers zal zijn. In het artikel wordt ook verwezen naar zijn familielandgoed in Spring Green in de staat Wisconsin. In de Index naamsvermeldingen in kranten zijn zowel de naam als het adres van Frank Lloyd Wright geïndexeerd. Als u in de ongestructureerde tekst van de krantcollecties naar Frank Lloyd Wright zou zoeken, dan zou u alleen het stukje tekst met zijn naam zien, en niet zijn adres.

Record on Frank Lloyd Wright in the Newspaper Name Index

Vermelding voor Frank Lloyd Wright in de Index naamsvermeldingen in kranten

Samenvatting

Krantencollecties vormen een ongelooflijk rijke genealogische bron, omdat ze veel details bevatten. Genealogen maken graag gebruik van overlijdensberichten, huwelijksaankondigingen en kennisgevingen van geboorten. Daarnaast bevatten roddelrubrieken en plaatselijk nieuws veel informatie over activiteiten en gebeurtenissen in de gemeenschap en ook vaak details over de betrokken personen. De nieuwe naamindex verrijkt de Amerikaanse en Canadese krantencollecties van MyHeritage en opent de deur naar het vinden van details over verwanten die u in het verleden zijn ontgaan bij het doorzoeken van de ongestructureerde tekst van deze collecties. We hopen dat u met deze nieuwe index gemakkelijker verborgen schatten zult kunnen vinden in de kranten op MyHeritage.

Het doorzoeken van de collecties op MyHeritage is gratis. Om deze records te bekijken of in uw stamboom op te slaan, is een Data- of Compleet abonnement vereist. Als u een stamboom op MyHeritage hebt, dan waarschuwt onze Record Matching-technologie u automatisch als er matches zijn tussen records in de namenindex en de ongestructureerde tekst in de krantencollecties.

Veel plezier met de nieuwe collectie!