Gegevensgoeroe Mike Mansfield aan het woord

Reacties

Hebt u zich ooit afgevraagd hoe MyHeritage SuperSearch™ de juiste record vindt in de meer dan 9,7 miljard historische gegevens die onze archieven bevatten? Of hebt u wel eens nagedacht welke magie er achter een Record Match of Smart Match steekt? Bij het MyHeritage Content-team kunnen ze u daar alles over vertellen. Het team publiceert nieuwe collecties met historische gegevens en beheert de bestaande collecties om de ervaringen van de gebruikers te verbeteren. We ontvingen onze eigen Mike Mansfield, Director of Content Operations bij MyHeritage, aan tafel en stelden hem vragen over de gegevenscollecties van MyHeritage platencollecties en hoe zijn passie voor genealogie zijn dagelijks leven beïnvloedt.

V: Vertel eens iets over het Content-team. Hoe wordt de content gepubliceerd?

A: Het Content-team bestaat uit drie verschillende onderdelen. Ten eerste hebben we Russ, de Chief Content Officer. Russ onderhoudt wereldwijd contacten met archieven, instellingen en partnerorganisaties en voert besprekingen over aankopen en samenwerkingsprojecten.

Ikzelf ben de directeur van Content Operations. Als Russ een contract heeft afgesloten, werk ik samen met Russ en het team in Utah aan het opstellen van een uitvoeringsplan en nemen we beslissingen over alle fasen in de verwerking van de content. Dit verwerkingsproces stel ik soms voor als een olieraffinaderij. We laten de content door verschillende pijpen stromen en op de verbindingspunten worden uiteenlopende behandelingen toegepast. In de laatste 20 jaar dat ik op dit gebied werkzaam ben, heb ik nog nooit meegemaakt dat er niets in het proces hoefde te worden aangepast. Soms krijgen we gegevens waar bijna niets meer aan hoeft te gebeuren. Maar bij andere typen content kan het veel langer duren voor we de records kunnen publiceren, soms wel tien jaar.

Tal is onze Product Manager. Hij houdt zich intensief bezig met de planning van de roadmap voor alle infrastructuurprojecten en alle projecten die met de zoek- en content-systemen te maken hebben.

From left, Tal Erlichman, Mike Mansfield and Russ Wilding
Van links naar rechts: Tal Erlichman, Mike Mansfield en Russ Wilding

Wat zo geweldig is bij het MyHeritage Content-team is dat we stamboomgegevens kunnen gebruiken ter ondersteuning van de verwerking van onze content. We ontwikkelen algoritmen om zoveel mogelijk informatie uit onze stamboomgegevens te winnen. Die gegevens kunnen ons weer helpen bij de verwerking van alle mogelijke soorten nieuwe content. In veel van onze gegevensverzamelingen wordt bijvoorbeeld het geslacht niet vermeld, terwijl dat zeer nuttige informatie is om in SuperSearch op te nemen. Geslachtgegevens bieden ook veel inzicht in informatie over huishoudens en helpen bij het in kaart brengen van families. MyHeritage heeft besloten om een algoritme te ontwikkelen dat we onze gender deducer (geslachtsbepaler) noemen. Op basis van de gegevens van 45 miljoen stambomen kunnen we iemands geslacht bepalen aan de hand van de naam, het land en de cultuur. De gender deducer doet geen aanbevelingen als een voornaam ergens zowel door vrouwen als door mannen wordt gebruikt.

V: Waarom ben je bij MyHeritage gaan werken?

A: Al op de middelbare school had ik twee tegenstrijdige interesses: enerzijds informatica en technologie en anderzijds geschiedenis en genealogie. Dat ging door toen ik aan de Brigham Young University studeerde. Daar volgde ik colleges in genealogie en heb ik zelfs even overwogen om professioneel genealoog te worden. Uiteindelijk besloot ik de technologische weg te bewandelen en studeerde ik af met een graad in informatica.

Brigham Young University Campus, 2007
De campus van Brigham Young University, 2007

In mijn eerste baan na mijn studie schreef ik software voor een cd-rom. Dat was in 1994, toen het internet nog in zijn kinderschoenen stond. De meeste bedrijven publiceerden hun gegevens toen op cd’s. Veel van onze klanten waren grote advocatenkantoren en internationale ondernemingen die grote hoeveelheden gegevens moesten publiceren.

Vervolgens kreeg ik de kans om een functie op het gebied van zoek- en contentsystemen te vervullen bij een andere genealogische website. Daar kon ik mijn kennis van zoeksystemen toepassen op historische gegevens. Aan het eind van de jaren negentig begonnen mensen abonnementen op websites af te sluiten. Toen zijn we gaan nadenken over het online zetten van de collecties.

Ik herinner me nog dat ik een vergadering heb bijgewoond waar we hebben gebrainstormd over het online zetten van scans van de Amerikaanse federale volkstelling. We zouden de scans daarna indexeren, zodat de mensen de indexen konden doorzoeken om de scans te vinden. Er was al wat werk op het gebied van indexering verricht maar niemand had ooit de indexen met de afbeeldingen gecombineerd, zeker niet op de schaal die voor dat project werd overwogen. Achteraf bezien was dat een belangrijke ontwikkeling in de bedrijfstak, die de basis heeft gelegd voor een standaard in onze branche. Sindsdien streven we ernaar om de gebruikers online toegang te verlenen tot de indexen met directe links naar de gescande afbeeldingen.

V: Tot hoever terug heb je familie gevonden en tot hoever gaat je stamboom terug?

A: Ik heb het meeste werk besteed aan mijn stamvaders uit de Mansfield-lijn. Die zijn afkomstig uit Surrey in Engeland. Ik heb de lijn van mijn voorouders terug kunnen voeren tot het eerste decennium van de zeventiende eeuw.

Mijn bijzonderste familielid is echter de vader van mijn moeder, Thomas Joseph Griffiths, die in Wales is geboren.

Thomas Joseph Griffiths, Mike's grandfather
Thomas Joseph Griffiths, Mikes grootvader van moederszijde

De vader van Thomas was mijnwerker en hij werkte zelf ook al als mijnwerker. Maar op twintigjarige leeftijd besloot hij zijn familie te verlaten en naar de Verenigde Staten te emigreren.

Ik weet niet of de omstandigheden die hij in de Verenigde Staten aantrof overeenkwamen met wat hij had gehoopt, maar ik bewonder hoe hij als jongeman alleen reisde en zijn familie en alles wat hij kende voor het onbekende achterliet. Ik heb meer details kunnen vinden. Bijvoorbeeld, het schip waarop hij voer was de Aquitania en hij kwam op 26 januari 1928 op Ellis Island aan.

The RMS Aquitania
De RMS Aquitania

Uit het document dat bij zijn aankomst werd opgemaakt, blijkt dat hij op weg was naar Provo in de staat Utah, om daar in te trekken bij zijn broer, die er toen al woonde.

Arrival Record of Thomas Griffith, from the Ellis Island and Other New York Passenger Lists, 1820- 1957
Aankomstdocument van Thomas Griffith, Ellis Island en Andere Passagierslijsten New York, 1820-1957

Deze immigranten hadden echt veel lef om hun geboortelanden te verlaten. Hoewel hij nog wel brieven naar hen kon schrijven, heeft hij zijn ouders waarschijnlijk nooit meer teruggezien.

V: Wat is het opvallendste aan het werk bij MyHeritage?

A: Dat is iets waar ik vaak over spreek – het brede internationale publiek. In tegenstelling tot andere genealogische platforms en diensten die voornamelijk gericht zijn op Noord-Amerika, komt de overgrote meerderheid van de gebruikers van MyHeritage van buiten Noord-Amerika.

Het aantal talen voor onze websites en diensten is ongelofelijk groot. Onze website is beschikbaar in 42 verschillende talen. De meeste andere platforms komen niet verder dan tien. Het is heerlijk om te weten dat we zo’n breed internationaal bereik hebben.

Dat is voor mij persoonlijk ook erg leuk geweest. Ik heb veel Scandinavisch bloed, uit Noorwegen, Zweden en Denemarken. Om Smart Matches met verre neven en nichten te ontvangen, en tegenwoordig ook DNA-matches, dat is geweldig. Diezelfde ervaring kan niet één ander platform bieden.

MyHeritage DNA bestaat pas een paar jaar maar heeft een enorme groei doorgemaakt en biedt nu ongelooflijk geavanceerde DNA-matchingtechnologieën en een chromosomenbrowser. Dat je precies kunt zien hoe je verwant bent met een ver familielid in Noorwegen is een leuke maar ook nuttige manier om je stamboom uit te breiden en meer genealogische informatie te verwerken. Als ik contact krijg via een DNA-match, dan is de opwinding weer heel anders. Dan heb je echt een gevoel van directe verwantschap. Het DNA-gedeelte verhoogt de relatie van theoretisch naar absoluut.

V: Is er een bepaalde gegevenscollectie waar u het meest trots op bent?

A: Ik ben heel erg trots op de Zweedse huishoudsonderzoeksboeken. Dat is een project waar andere genealogiebedrijven ook aan zijn begonnen, maar zonder succes.

Als we scans ontvangen, dat moeten deze worden geïndexeerd of er moet een transcriptie worden gemaakt. Voor dit specifieke project hebben we samengewerkt met Zweedse genealogen die speciaal waren opgeleid in de Zweedse paleografie. Die hebben weer een team van meer dan 700 mensen in het ontcijferen van oude handschriften getraind, waardoor die ons konden helpen bij het indexeren van deze gegevens.

We bedanken Mike dat hij even de tijd heeft willen nemen om het bijzondere werk van het Content-team uit te leggen en zijn passie voor genealogie en familiegeschiedenis met ons te delen. Het doorzoeken van de MyHeritage inhoudsverzamelingen naar historische documenten met SuperSearch™ is de beste manier om meer informatie over uw voorouders en familiegeschiedenis te ontsluiten. Beproef uw geluk bij het doorzoeken van de collecties en laat ons in de opmerkingen hieronder weten wat u ontdekt!

Plaats een reactie

Het e-mailadres blijft privé en wordt niet gepubliceerd