¿Tambien comparan con libros genealogicos de España?
MyHeritage Lanza Book Matching
- Por Sonia Meza
Estamos muy contentos de anunciar el lanzamiento de una nueva y revolucionaria tecnología – Book Matching – quizás nuestra mejor tecnología desarrollada hasta el momento. Book Matching (Coincidencias de Libros) investiga de manera automática los individuos que se encuentran en los árboles genealógicos en MyHeritage y los compara con nuestra vasta colección de libros digitalizados. Única de MyHeritage, la nueva e innovadora tecnología utiliza el análisis semántico para comprender cada frase en todas las páginas de los libros digitalizados, con el fin de encontrar coincidencias con mucha precisión. Book Matching ya ha realizado más de 80 millones de nuevas coincidencias para nuestros usuarios! Cada coincidencia comprende un párrafo de un libro sobre la persona en el árbol familiar, proporciona acceso directo a ese párrafo y la posibilidad de navegar a través del resto del libro.
Con Book Matching, descubrirá información fascinante sobre su familia que no encontrará de otra manera. Puede incluso descubrir nuevos parientes y antepasados. Utilice esta información para ampliar su árbol familiar y añadir mucho más que nombres.
A modo de antecedente, lanzamos SuperSearch™, nuestro motor de búsqueda de registros históricos, en 2012. En diciembre de 2015 la colección de libros históricos digitalizados fue incluída en SuperSearch™. Recientemente, hemos triplicado los libros en la compilación de fuentes publicadas (en inglés) de 150.000 a 450.000 libros, con un total de 91 millones de páginas. Hemos reunido un equipo de curadores que trabajan arduamente y tenemos la intención de añadir cientos de millones de páginas adicionales de libros digitalizados a esta colección anualmente.
El reto
Los libros siempre han sido una de las mejores fuentes para la investigación de historia familiar, pero buscar de manera eficiente ha sido una tarea casi imposible. Incluso después de que los libros son fotografiados y son digitalizados, la búsqueda de texto digital mediante el reconocimiento óptico de caracteres (OCR) para utilizarlo siempre se requiere una gran inversión de tiempo y disposición para vadear un camino a través de falsos positivos interminables. Por ejemplo, si tiene un Richard Thomas en su árbol genealógico, haciendo una búsqueda en los libros de texto encontraría resultados para las personas llamadas Richard o Thomas, sin tener en cuenta si se trata del nombre o el apellido. Incluso si se encontrara un Richard Thomas, es probable que no se trate del que estaba buscando. No hay manera de encontrar el Richard Thomas exacto que está buscando, como el Richard Thomas que nació en Virginia en la década de 1940 y que se casó con una Wilma Griffith.
Book Matching al rescate
Nuestra tecnología Book Matching supera estas dificultades mediante la comprendiendo automáticamente la forma de describir a las personas en los libros históricos, incluyendo nombres, eventos, fechas, lugares y relaciones, y comparándolas con una elevada precisión y velocidad, con los 2 mil millones de personas de los árboles genealógicos alojados en MyHeritage; y esto se repite de forma automática a medida que crece su árbol y añadimos más libros.
Una tarea de enormes proporciones de forma sencilla
Extraer información genealógica de los libros no es una tarea sencilla. En los documentos estructurados, tales como certificados de nacimiento o registros de censos, es muy claro el tipo de información presentada en los datos encontrados. Está claro dónde localizar los apellidos, las fechas de nacimiento, y así sucesivamente. Por otra parte, en los datos de texto libre no estructurados, como los libros históricos digitalizados, hechos tales como las fechas de nacimiento, los lugares y las fechas de defunción pueden ser escritas de muchas maneras diferentes y en diferentes contextos y la información no tiene ningún orden designado. Mientras las palabras como «muerte», «muerto», «fallecido», puede referirse a la muerte efectiva de una persona, otras frases tales como «expirado», «puso fin a su carrera terrenal,» o «llamado al más allá » también pueden indicar lo mismo. Actualmente tenemos una variedad de reglas para detectar expresiones que describen la muerte. Los libros a menudo no se refieren a una persona por su nombre completo; por ejemplo, un párrafo puede hablar de una mujer por su nombre de pila y a continuación nombrar y describir su padre – se necesita una tecnología especial para rastrear y encajar esta información. Hemos trabajado mucho para desarrollar numerosos algoritmos que permitan cosechar la información de historia familiar incluida en los libros. Se ha probado y ajustado, reiterado y perfeccionado para garantizar un alto nivel de resultados con precisión, y recopilar tanta información como sea posible de los libros. En el proceso, también salvamos con con éxito a millones de errores OCR y los reparamos. Por ejemplo, si el proceso de OCR considera que una persona nació en «]\ayo», entendemos que es realmente mayo, «Abnl» corresponde con «Abril», y así sucesivamente.
Actualmente, algunos libros de la colección de libros digitalizados (de dominio público) están duplicados debido a que fueron aportados por diferentes grupos. Nadie detectó que algunos de ellos ya habían sido aportados. Estamos dando los toques finales a tecnología especializada que es capaz de detectar duplicación de libros. Una vez que completamos este trabajo, la mayoría de los duplicados desaparecerán automáticamente.
Book Matching en acción:
Recientemente, hemos mostrado algunos de los bloggers de genealogía (o geneabloggers como se conocen en la Comunidad Genealógica) Book Matching, para que pudieran ver de primera mano las coincidencias encontradas para sus propios árboles genealógicos.
Dick Eastman de Boletín Online de Genealogía de Eastman ha estado investigando su historia familiar durante años. Tiene alrededor de 2.780 personas en su árbol familiar en MyHeritage, y recibió cerca de 500 coincidencias de libros. La mayoría de la información de Book Matching era nueva para él.
Por ejemplo, Elizabeth Fifield, antepasado directo de Dick (8 generaciones), aparecieron en su árbol genealógico con sólo el nacimiento y la fecha de la muerte, y sus hermanos.
Un Book Match automático fue encontrado para Elizabeth en el libro «Memorias genealógicas y personales relativas a las familias del Estado de Massachusetts; por Cutter, William Richard, 1847-1918,» una fuente que Dick Eastman cree que nunca habría pensado examinar por propia iniciativa.
El extracto que aparece a continuación es la sección que fue encontrado por MyHeritage. La emocionante nueva información aquí, lista al marido de Elizabeth, y otra información histórica sobre él y su familia, como sus seis hijos y sus fechas de nacimiento, información que Dick no tenía anteriormente y que ahora puede añadir a su árbol genealógico e incluir una línea completa de su árbol genealógico.
El veterano Genealogista Randy Seaver de Genea-Musings cuenta con más de 40.000 personas en su árbol familiar en MyHeritage. Con la friolera de 17.323 20.609 Book Matches, ahora puede recoger una montaña de nueva información acerca de las personas en su árbol familiar
Por ejemplo, Randy tenía un pariente, William Seaver Woods, en su árbol genealógico con una fecha de nacimiento, y aparecía como soltero.
De manera inesperada, en el anuario «Registro de Graduados de la Universidad de Wesleyan, Middletown, Connecticut, 1921», MyHeritage encontró una coincidencia perfecta para William.
William estudió en esta universidad, en la página se enumera sus logros, menciona que él tenía esposa y un hijo, los cuales no estaban en el árbol de Randy. Observe que su hijo, Robert, utiliza el apellido de Crombie que viene de su madre Grace. Ya que Robert no utilizó el apellido Seaver o Woods, Randy podría no haberlo descubierto sin esta joya. Ahora Randy tiene una pista fresca. Puede investigar esta línea familiar y traerlo al presente cuando hasta hace poco era un callejón sin salida.
Leland Meitzler de Genealogía Blog ha importado su árbol familiar de 5106 personas para MyHeritage recibió 694 Book Matches. Leland fue notificada acerca de una coincidencia con Elisha Mills en su árbol familiar, encontrada en el libro «Una familia Wallon en América: Lockwood de Forest y sus antepasados, 1500-1848 «(1914).
A la coincidencia se suman los padres de Elisha y describe sus logros durante la Guerra de la Revolución.
Por último, Pat Richley de Dear Myrtle también recibió algunos Book Matches. Thomas Wasden, tatara abuelo de Pat, aparecía en el árbol con información básica, incluyendo fechas y lugares.
Una coincidencia con Thomas estaba en el libro «Las familias coloniales de Filadelfia, por Jordan, John Woolf, 1840-1921» (1911).
La coincidencia incluyó una fotografía de él del siglo XIX. ¡Qué gran descubrimiento que ahora puede añadir a su árbol familiar!
Los geneabloggers quedaron impresionados por estas emocionantes coincidencias, que añaden valiosa información para sus árboles genealógicos. Literalmente dijeron que no encontraron falsas coincidencias. Si Book Matching puede mostrar una gran cantidad de nuevos datos a los genealogistas experimentados que han estado investigando su historia familiar durante décadas, se puede imaginar cuán Book Matching útil puede ser para usted y cada uno de todos los usuarios de MyHeritage.
La Colección Compilación de Fuentes Publicadas es de libre acceso. Utilizar Book Matches requiere una suscripción de datos de MyHeritage.
¿Qué sigue? Book Matching libro está actualmente disponible sólo para libros en inglés, pero pronto la tecnología se adaptará para cubrir otros idiomas. Estamos ampliando continuamente nuestro repositorio de documentos históricos digitalizados, lo que facilita y agiliza la investigación de historia familiar. Esperamos que el total de libros digitalizados en MyHeritage pueda duplicarse pronto. Iremos añadiendo increíbles libros de Genealogía de toda Europa, en los principales idiomas europeos.
¿Cómo sabe si tiene Book Matches? Simplemente ingrese a su sitio familiar y compruebe sus Record Matches por el menú de Discoveries con el menú Descubrimientos, o compruebe su bandeja de entrada de su correo electrónico y consulte sus Record Match – éstos son enviados a nuestros usuarios cada algunos días, cada vez que se encuentran nuevas coincidencias. Cualquier coincidencia que reciba de un libro es posible gracias a esta nueva tecnología.
¿Nuevo en MyHeritage? Regístrese desde la página de inicio y suba su árbol familiar como un archivo GEDCOM, y beneficiese inmediatamente de Book Matching – que es exclusivo de MyHeritage.
Usted se sorprenderá por el valor de los libros y ganará una nueva perspectiva de ellos como un recurso genealógico con la nueva tecnología Book Matching.
¡Disfrútelo!
jose luis arranz
abril 18, 2016
espero que pronto este en español……