13.9 C
Nueve de Julio
viernes, junio 5, 2026
Inicio Blog Página 288

Participación nuevejuliense el XX Congreso de Historia de los Pueblos 

0

Los días 3 y 4 de septiembre del presente año, en el Centro Provincial de las Artes Teatro Argentino de La Plata se realizará el XX Congreso de Historia de los Pueblos de la Provincia de Buenos Aires en el marco de la celebración del Centenario del Archivo Histórico de la Provincia, fundado en el año 1925. Precisamente, es este Archivo quien organiza el tradicional congreso que congrega a investigadores de todo el país.

Gloria Tapia, Roberto Castro y Olga Fausón.
El Congreso contará con la participación de autores nuevejulienses con ponencias vinculadas al pasado de la comunidad de 9 de Julio: Gloria Luz Tapia presentará un estudio sobre «Las colonias agrícolas en 9 de Julio»; Olga Fausón expondrá sobre la historia de Ciudad Nueva y sus barrios y Roberto Castro presentará una ponencia sobre el “Fin de la Campaña del Desierto».
También, como es tradicional desde hace varios años, se presentarán ponencias escolares.
EL CONGRESO
Este Congreso es resultado del permanente crecimiento de una política cultural sostenida en el tiempo y es el ámbito ideal para celebrar el Centenario del Archivo Histórico, repensando su rol como una dinámica institución de la cultura dedicada a la preservación, producción y difusión de la historia y la identidad bonaerenses.
El Centenario representa una oportunidad para reflexionar acerca del rol del Archivo Histórico de la Provincia – y de los archivos en general-como instrumento de democratización, garantía de derechos y memoria de la sociedad.
A lo largo de estos cien años, el Archivo ha garantizado y perfeccionado el acceso y la preservación de los Fondos que resguarda, junto a la producción de conocimiento de la historia de la Provincia. También ha generado acciones y prácticas para acercar este patrimonio a las y los bonaerenses, de forma de garantizar su soberanía cultural y el derecho, participación y acceso a la cultura. Las temáticas que propone el XX Congreso, en su pluralidad de enfoques y multiplicidad de temas, promueven la indagación del pasado bonaerense articulándolo con el presente, sus interrogantes e interpelaciones, incluyendo perspectivas como las de géneros y decoloniales, mientras que mantiene vigentes los debates sobre Memoria, Verdad y Justicia.
Las ponencias de los autores nuevejulienses será publicadas en un volúmen especial que reunirá todos los trabajos que se presentarán en el Congreso.

Inteligencia Artificial: curso gratuito

0


La Municipalidad de 9 de Julio invita a participar del curso gratuito “Introducción a la Inteligencia Artificial”, destinado a quienes quieran aprender a integrar la IA en su trabajo y en la vida cotidiana.
Durante cuatro encuentros, los participantes explorarán desde los conceptos básicos hasta el diseño de actividades y materiales utilizando herramientas como ChatGPT, Canva IA, DALL·E y otras.
El curso se realizará en el Centro de Desarrollo Socio-Productivo “San Cayetano” (Libertad y Salta), los martes de 19:00 a 20:30 hs., comenzando el 2 de septiembre.
Los asistentes conocerán cómo funciona la IA, sus aplicaciones, la creación de chatbots, el diseño de actividades con herramientas inteligentes y también reflexionarán sobre su uso responsable.
Al finalizar, desarrollarán un proyecto práctico que integrará los conocimientos adquiridos.
Las inscripciones estarán abiertas del 13 al 31 de agosto, de 8:00 a 13:00 hs, en Libertad y Salta.
No pierdas la oportunidad de capacitarte en una de las tecnologías más transformadoras de la actualidad y potenciar tus habilidades profesionales.

Ascenso: Dudignac derrotó a Dennehy para seguir arriba

0


En el Estadio Dr. Alberto Sampietro del Club Atlético y Social Dudignac se vivió un encuentro muy emotivo por la 2da fecha del Torneo de Ascenso de la Liga Nuevejuliense de Fútbol. El equipo dudignaquense se impuso 3 a 2 a Dennehy, para continuar en la punta junto a 18 de Octubre.


Empezó ganando el equipo de Dudignac. A los 10 minutos Juan Cruz Pinciroli marcó el 1 a 0. El 2 a 0 lo marcó Juan Ignacio Villarreal en el minuto 18.
En los minutos finales del primer tiempo reaccionó el equipo visitante. A los 43 Julián Sancholuz puso el 1-2 para Dennehy. A los 45 Sancholuz marcó el 2 a 2.
En el final del encuentro, Dudignac lograría el gol del triunfo a través del ingresado Agustín Acuña, para el definitivo 3 a 2.

 

DUDIGNAC 3 – DENNEHY 2
CANCHA: Dudignac.
ARBITRO: Julio Márquez.
DUDIGNAC: Simón Silva, Juan Cruz Pinciroli, Martín Torres, Kevin Villarreal, Federico Berthelot, Martín Martínez, Alejandro Rivero, Maximiliano Pesciallo, Juan Villarreal, Benjamín Ferrer, Benjamín Stefoni. SUPLENTES: Bautista Gómez, Agustín Acuña, Gonzalo Nicora,
Mirco Fernández, Esteban Doucet, Federico Marquillo, Thiago Alvarez. DT: Bruno Barbutti.
DENNEHY: Alexis Atencio, Nicolás Blaiotta, Cristian Rithaud, Bautista Mato, Bautista Insaurralde, Guillermo Matta, Enzo Moccio, Valentín Mazzola, Julián Sancholuz, Ramiro Lechere, Martín Bandera. SUPLENTES: Raúl Terrile, Axel Negrette, Guido Ramírez, Jorge Barba, David Rivas, Nicolás Nievas, Luciano Perrotta. DT: Tomás Fons.
GOLES: Pinciroli, Juan I. Villarreal, Acuña (Du); Sancholuz 2 (De).

PROXIMA FECHA – 3RA
Def. de la Boca – Dudignac
Dennehy – Compañía Gral. Bs. As.
Def. de Sarmiento – 12 de Octubre
Libre: 18 de Octubre.

Distrito de Alem: anuncio del Intendente Carlos Ferraris

0

En el Aula Magna del Centro Universitario de Vedia, el Intendente Municipal, Prof. Carlos Ferraris, encabezó una conferencia de prensa junto a los principales medios de la región, donde presentó un anuncio de gran relevancia para el desarrollo productivo y laboral de ese distrito.

La reconocida empresa Aceitera General Deheza (AGD), con sede central en la provincia de Córdoba y amplia trayectoria en la industria alimenticia y exportadora, ha adquirido un predio de 90 hectáreas en el distrito de Leandro N. Alem para la instalación de una mega planta de procesamiento de maní.

Este proyecto generará más de 100 puestos de trabajo directos en diversas especialidades, potenciando el empleo local y fortaleciendo el perfil industrial de la región. La planta se ubicará sobre la Ruta Nacional N° 7, entre Vedia y Alberdi, en cercanías de Perkins.

Desde esta nueva instalación, que contará con un tendido eléctrico especial desde Junín para garantizar el suministro sin afectar a los vecinos, se movilizarán más de 300 camiones que transportarán maní pelado hacia el Puerto de Buenos Aires, con destino final a los mercados de Europa.

Los trabajos de construcción comenzarán durante este año 2025, previéndose la puesta en funcionamiento de la planta para el año 2027.

“Este es un paso histórico para nuestro distrito: más trabajo, más oportunidades de capacitación y un futuro industrial fortalecido”, destacó el Intendente Ferraris.

Curso de Manipulación de Alimentos en Patricios

0


La Dirección de Bromatología, dependiente de la Secretaría de Salud de la Municipalidad de Nueve de Julio, informa que durante los días 18, 20, 22, 25 y 27 de agosto se dictará en la localidad de Patricios el curso gratuito de manipulación segura de alimentos.
La capacitación se desarrollará de 8:15 a 10:45 hs. en la Estación de Tren y contará con asistencia obligatoria para la obtención del carnet habilitante.
Asimismo, el 27 de agosto se llevará a cabo un curso especial sobre manipulación de alimentos libres de gluten, orientado a promover prácticas seguras para personas celíacas.
Las inscripciones deben realizarse exclusivamente a través de la página web municipal:
www.9dejulio.gov.ar.
Estos cursos forman parte de las acciones permanentes de la Municipalidad para garantizar la inocuidad de los alimentos y proteger la salud de la comunidad, fortaleciendo los conocimientos de quienes manipulan y elaboran productos destinados al consumo.

Calendario de pagos de ANSES para este miércoles

0

ANSES, organismo dependiente del Ministerio de Capital Humano, informó que este miércoles 13 de agosto continúan los pagos de las Pensiones No Contributivas, jubilaciones y pensiones mínimas, Asignación por Embarazo, Asignación por Prenatal, Asignación Universal por Hijo y Asignación Familiar por Hijo. Todos incluyen el aumento por movilidad del 1,62 por ciento.

 

Pensiones No Contributivas

Titulares con documentos finalizados en 6 y 7 cobran su haber más el bono de 70 mil pesos.

 

Jubilaciones y pensiones que no superen un haber mínimo

Titulares de jubilaciones y pensiones mínimas con documentos concluidos en 3 cobran su haber más el bono de 70 mil pesos.

 

Asignación Universal por Hijo y Asignación Familiar por Hijo

Titulares con documentos terminados en 3.

 

Asignación por Embarazo

Titulares con documentos finalizados en 2.

 

Asignación por Prenatal

Titulares con documentos concluidos en 4 y 5.

 

 

 

 

 

 

¿Cómo consultar fecha y medio de cobro?

1. Desde el sitio web de ANSES, opción Calendario de pagos.

2. Desde mi ANSES, ingresando CUIL y Clave de la Seguridad Social. Ir a Cobros, opción Consultar fecha y medio de cobro.

3. Desde la app mi ANSES, ingresando CUIL y Clave de la Seguridad Social. Ir a Mis datos, opción Mis fechas de cobro.

4. A través de la modalidad Atención Virtual, con CUIL y Clave de la Seguridad Social. Ir a Iniciar atención, Consultas rápidas, Cuándo y dónde cobro.

Efemérides nuevejulienses. Lo que sucedió un día como hoy en 9 de Julio

0

  • 13 de agosto de 1887: Asumen las autoridades del Consejo Escolar de 9 de Julio. Fue elegido su presidente Nicolás Robbio (padre) siendo integrado por Antonio Millán, Antonio Bergés y Domingo Barreiro Jordán y Abelardo Parodi.
  • 13 de agosto de 1898: Fue creado en 9 de Julio el Registro de Contratos Públicos nº 4. Su primer regente fue el notario Pedro A. Morales.
  • 13 de agosto de 1922: Asume el cargo de intendente municipal, Miguel Saralegui. Se desempeñó hasta el 31 de diciembre de 1923.
  • 13 de agosto de 1932: El «Richmond Hotel» sufrió un voraz incendio que destruyó buena parte del edificio, sobre todo en el sector del comedor. Este hotel se encontraba ubicado en la avenid Vedia entre Bartolomé Mitre y La Rioja.
  • 13 de agosto de 1986: Fue fundada la Sociedad de Arquitectos de 9 de Julio.

Se registraron hechos de vandalismo en el Parque San Martín

0


En horas de la noche del lunes 11 de agosto, autores ignorados llevaron a cabo un acto de vandalismo contra la propiedad pública, en el Parque General San Martín. El hecho repudiable de daños se centraron no sólamente en el sector de juegos, donde aparecieron bancos rotos, sino también en el sector del Murallón, donde se dañaron instalaciones eléctricas -aún con los riesgos que ello conlleva-, sino también el cartel del ciano semáforo, que fue arrojado al espejo de agua y posteriormente retirado del mismo por operarios municipales.
Desde la Municipalidad de 9 de Julio se informó que ante esta situación, se dio inicio a un relevamiento de imágenes del centro de monitoreo y se están tomando las medidas correspondientes para la identificación de los responsables.
Cabe destacar que estos daños se vienen repitiendo en forma habitual y periódica por quienes no toman conciencia de que se trata de espacios de la comunidad, que requieren una inversión muy importante, y sobre las que todos debemos colaborar para su correcto mantenimiento.

El Teatro de Cáritas tuvo un debut muy positivo

0


El pasado fin de semana, sábado 9 y domingo 10 de agosto, comenzó con éxito la 36ta temporada del Grupo de Teatro de Cáritas 9 de Julio en el Teatro Rossini con la comedia “¡Estamos al horno!”.
El público acompañó el estreno del sábado, y también el domingo disfrutando de una historia con muchos enredos, muy entretenida y divertida, aplaudida de pié por los espectadores que en gran número se hicieron presentes en la sala. El ciclo “Agosto a todo teatro” 2025 se extenderá hasta 31 de agosto.
El Director del Grupo de Teatro de Cáritas Eduardo Bonoldi destacó que «el balance de este fin de semana fue totalmente positivo. El sábado se contó con la presencia de muchísimo público, también nos acompañó el domingo».
«La obra salió como todos esperábamos. Sabíamos que iba a gustar porque es una comedia reidera llena de enredos y dificultades. Los ensayos fueron muy difíciles por el ping-pong: en un momento hay nueve personas en escena y todos están participando de un solo diálogo», señaló Eduardo Bonoldi.
El Director del Grupo de Teatro de Cáritas se mostró muy contento por el apoyo de las instituciones, que participan en la venta de entradas a beneficio de las entidades, «nos acompañan todos los años».
«Esperamos que el próximo fin de semana nos acompañe el público. Queremos agradecer muy especialmente a los medios de comunicación, a las instituciones y a las familias de los integrantes de quienes se ven en escena -actores- como del grupo técnico que hacen un trabajo muy bueno y a los anunciantes que apoyan para afrontar los gastos de producción. Estamos agradecidos a todas las personas que hacen que Agosto a Todo Teatro siga adelante desde hace 36 temporadas», concluyó.
El elenco está conformado por Sergio Carassai (“Alberto”), Sergio Pignataro (“Raúl”), Martín Bonafina (“José”), Estela Fernández (“Juana”), Sandra Marino (“Julia”), Bibiana Di Sario (“Catalina”), Marisa Zubeldia (“Laura”) y Romina Ingrati (“Mecha”).
El staff está conformado por Eduardo Bonoldi, como Director General; Ana Inés Sendoya, Asistente de Dirección; Marina Lozano y Ramiro Leal, diseño de Luces y Sonido; María Del Carmen Hernández, Coordinación de Instituciones y Difusión; Marita Malizia, Julio Mascheroni y Carlos Del Castillo, Publicidad y Catering; Sergio Depetri, diseño de Programa; Marta Campelli y Edgardo Videla, Locución; Pablo Fantini, diseño de Banners y Sandra Poggi, fotografía.
La ficha técnica la componen Marina Lozano y Ramiro Leal, como operadores de luces y sonido, respectivamente; Ana Inés Sendoya, Rosana Corro y Gustavo Falco en la Asistencia Técnica; Marina Lozano, como Asistente de Producción; Sergio Carassai como Jefe de Utilería y Carlos Del Castillo como maquinista

¿Transkribus, ChatGPT, Gemini o eScriptorium?: herramientas de la IA para el estudio de manuscritos vinculados con la historia de 9 de Julio

Por Héctor José Iaconis.

Hoy proponemos efectuar la transcripción de un documento vinculado en la historia de 9 de Julio, empleando la herramienta  Gemini IA, modelo de lenguaje a gran escala.

Gemini es una familia de modelos de inteligencia artificial multimodal, desarrollada por Google DeepMind, que destaca por su capacidad de procesar y entender información de múltiples formatos de forma nativa. Su arquitectura se basa en una arquitectura de red neuronal optimizada para manejar texto, imágenes, audio y video simultáneamente. Esto le permite razonar de manera más abstracta y compleja, superando las limitaciones de los modelos unimodales. Gemini 1.0 se lanzó en tres tamaños —Ultra, Pro y Nano— para adaptarse a diversas aplicaciones, desde centros de datos hasta dispositivos móviles.

De acuerdo con los expertos, una característica clave es su entrenamiento intensivo, que integra datos multimodales desde cero, evitando la necesidad de unir componentes separados. Esto resulta en una coherencia y rendimiento superior en tareas que requieren el cruce de diferentes tipos de datos, como la comprensión de gráficos o la resolución de problemas científicos visuales. Gemini 1.5, con su innovadora arquitectura Mixture-of-Experts (MoE), mejora drásticamente su eficiencia y la capacidad de procesar contextos extremadamente largos.

El origen de este modelo se enmarca en la intensa competencia por el liderazgo en la inteligencia artificial generativa, especialmente tras el auge de ChatGPT de OpenAI a finales de 2022. Google, que ya había desarrollado los denominados LaMDA y PaLM, aceleró su estrategia. En mayo de 2023 se anunció oficialmente el desarrollo de un nuevo y avanzado modelo multimodal mientras que, un año más tarde, fue lanzada la versión 1.5, que incorporó la arquitectura Mixture-of-Experts (MoE). Hoy, promediando 2025, Gemini ha mejorando significativamente la eficiencia y la capacidad de manejar contextos de gran longitud.

La multimodalidad de Gemini le permite procesar imágenes de manuscritos, interpretar la caligrafía y contextualizar el contenido, incluso si el texto está dañado o incompleto. Su capacidad para manejar grandes datos de contexto facilita la comprensión de documentos extensos y la identificación de patrones en el estilo de escritura. Además, puede comparar el manuscrito con otros documentos históricos o bases de datos para mejorar la precisión de la transcripción. Esto no solo acelera el proceso, sino que también permite detectar detalles que serían difíciles de percibir para un ojo humano. El resultado es una transcripción más fiable y completa, que se puede utilizar para la investigación y la digitalización de archivos; aunque, en nuestro caso, hoy solamente nos limitaremos a un documento de una página.

I. EJEMPLO DE USO CON UN DOCUMENTO HISTORICO LOCAL

Hoy utilizaremos, para el análisis un documento histórico que se encuentra compuesto por tipografía y caligrafía manuscrita. Se trata de un recibo por el pago de un impuesto, digitalizado sin edición previa. Como es posible observar se trata de una tomada con cámara fotográfica, pero con baja calidad técnica:

Metadatos generales del archivo:

Formato: JPEG (.jpg)

Resolución:  768 × 873 píxeles

Relación de aspecto: 1:1.13 (ligeramente vertical)

Profundidad de color: 24 bits (8 bits por canal RGB)

Compresión: Con pérdida (lossy), típica del formato JPEG.

II. TRANSCRIPCION DEL DOCUMENTO

Al efectuar la primera transcripción, como puede apreciarse el modelo arrojó varios errores:

Al indicársele su corrección, ofreció las siguientes  versiones de transcripción correctas:

DIRECCION GENERAL DE RENTAS

Nota: Es permitido el pago del impuesto en cualquier oficina mientras se respeten los exteriores y el último recibo no podrá levantarse hasta no haberse abonado los años atrasados.

Partida N° 494 N° 91055

Provincia de Buenos Aires

1897

CONTRIBUCION DIRECTA

RECIBO DE PAGO

Don Ramón Monteverde ha satisfecho la suma de $ Veinte y cuatro Pesos m/n centavos, importe de la cuota correspondiente al año 1897 por finca de su propiedad, que se encuentra ubicada en este Partido de 9 de Julio Cuartel 1 Calle de Salta 24 de Setiembre de 1897

Seccion Manzana 18 Lotes 8 Quinta Chacra

EL RECAUDADOR

C. M. Rocca

Son $ 24.00 m/n.

Asimismo, ofreció las siguientes variantes de transcripción:

a) Formato de datos estructurado (listado): Este formato es ideal para extraer información clave de manera ordenada, facilitando su uso en bases de datos o sistemas de gestión.

Tipo de Documento: Recibo de Pago – Contribución Directa

Partida N°: 494 N°: 91055

Provincia: Buenos Aires

Año: 1897

Beneficiario: Ramón Monteverde

Importe: Veinte y cuatro Pesos m/n ($ 24.00 m/n)

Tipo de Propiedad: finca

Ubicación:

Partido: 9 de Julio.

Cuartel: 1

Calle: Salta

Manzana: 18

Lotes: 8

Fecha de Pago: 24 de Setiembre de 1897

Recaudador: M. Rocca

b) Formato de texto plano (párrafo): Este formato es útil para una lectura continua y resumida, ignorando la disposición original del documento.

Este es un recibo de pago por la contribución directa de 1897, emitido a favor de Ramón Monteverde. El monto pagado fue de Veinte y cuatro Pesos m/n ($ 24.00), correspondiente a una finca ubicada en el Partido de 9 de Julio, Cuartel 1, Calle Salta, con Manzana 18 y Lotes 8. El documento, con Partida N° 494 y N° 91055, fue firmado por el recaudador C. M. Rocca el 24 de Setiembre de 1897 en la Provincia de Buenos Aires.

c) Formato de tabla (Markdown): Este formato es claro y conciso, perfecto para comparar diferentes campos de un mismo documento de un vistazo.

Campo:Contenido
Documento:Contribución Directa – Recibo de Pago
Partida N° / N°:494 / 91055
Año:1897
Nombre:Ramón Monteverde
Monto:$ 24.00 m/n (Veinte y cuatro Pesos m/n)
Ubicación:Partido de 9 de Julio, Cuartel 1
Manzana / Lote:18 / 8
Fecha de Pago:24 de Setiembre de 1897
Recaudador:C. M. Rocca

 

d) Transcripción paleográfica del documento:

DIRECCIÓN GENERAL DE RENTAS (Texto vertical, en el margen izquierdo) Nota: Es permitido el pago del impuesto en cualquier oficina mientras se respeten los exteriores y el último recibo no podrá levantarse hasta no haberse abonado los años atrasados. (Texto en el margen izquierdo)

Partida N° 494 (494 manuscrito) N° 91055 (91055 manuscrito)

Provincia de Buenos Aires (Texto impreso, con ornamento) 1897 (Texto impreso)

CONTRIBUCION DIRECTA (Texto impreso en mayúsculas)

RECIBO DE PAGO (Texto impreso en mayúsculas)

Don Ramón Monteverde (Ramón Monteverde manuscrito en letra cursiva) ha satisfecho (Texto impreso)

la suma de $ 24 (24 manuscrito) Veinte y cuatro Pesos m/n (Veinte y cuatro Pesos m/n manuscrito en letra cursiva) centavos, importe de la cuota correspondiente al año 1897 por finca (finca manuscrito en letra cursiva) de su propiedad, que se encuentra ubicada en este (Texto impreso)

Partida de 9 de Julio (9 de Julio manuscrito en letra cursiva) Cuartel 1 (1 manuscrito) Calle de Salta (Salta manuscrito en letra cursiva)

21 de Setiembre de 1897 (21 de Setiembre de 1897 manuscrito en letra cursiva)

Seccion (Texto impreso) (En blanco)

Manzana 18 (18 manuscrito) Lotes 8 (8 manuscrito)

Quinta (Texto impreso) (En blanco)

Chacra (Texto impreso) (En blanco)

(Sello circular con el texto: FOTOGRAFIA Y PRUEBA en el borde superior, 2A SECCION en el centro y NUEVE DE JULIO en el borde inferior. Superpuesto al texto «Seccion Manzana…»)

EL RECAUDADOR (Texto impreso) A. M. Racaf (Firma manuscrita)

Son $ 24.00 m/n. (24.00 manuscrito, m/n impreso)

III. NOTA PALEOGRAFICA

La nota paleográfica efectuada por Gemini resultó menos exaustiva respecto de la efectuada, en otro ejemplo dado, por ChatGPT:

Este documento, fechado en 1897, es un formulario impreso de la «Provincia de Buenos Aires» para un recibo de «CONTRIBUCION DIRECTA». El análisis paleográfico se centra en la interacción entre el texto impreso y las adiciones manuscritas, ahora con una lectura más precisa de estas últimas.

    • Tipografía y Formato: El cuerpo principal del documento, incluyendo el encabezado, las etiquetas y la nota lateral, está impreso con una tipografía formal, típica de los documentos administrativos de finales del siglo XIX.
    • Escritura Cursiva (Manuscrita): Las adiciones a mano están realizadas con una caligrafía cursiva consistente y fluida. La tinta es de color oscuro y, aunque se ha desvanecido ligeramente, es en general legible.
      • Dígitos y fecha: Los números manuscritos (494, 91055, 18, 8, 24) son claros y se adhieren a un estilo estándar. La fecha, 24 de Setiembre de 1897, mantiene la grafía «Setiembre», una variante ortográfica común en la época.
      • Firma: La firma del recaudador, una vez corregida, se interpreta como «C. M. Rocca». Pese a la mayor claridad, la firma sigue mostrando características de una escritura rápida y personal, lo cual es típico de los documentos administrativos de la época.
    • Elementos Gráficos: El documento incluye un sello de tinta circular superpuesto. El texto del sello, «FOTOGRAFIA Y PRUEBA», «2A SECCION» y «NUEVE DE JULIO», sigue siendo un elemento paleográfico clave para contextualizar la procedencia del documento.
    • Estado de Conservación: El papel presenta el amarilleo y arrugas propias del paso del tiempo, pero su estado general es bueno, permitiendo una lectura completa de la información, tanto impresa como manuscrita.

IV. ALGUNOS ASPECTOS TECNICOS

La primera transcripción del documento fue realizada por Gemini  mediante una cadena de procesamiento que integra modelos de visión por computadora y de lenguaje natural. El procedimiento se desglosó en las siguientes fases:

  1. Análisis de Imagen (Computer Vision): El archivo jpg fue procesado por un modelo de visión por computadora. Este modelo, basado en arquitecturas de redes neuronales convolucionales (CNNs), identificó las regiones del documento que contenían texto. Se segmentaron las áreas de texto impreso y las áreas de texto manuscrito, lo cual es crucial para el posterior reconocimiento de caracteres.
  2. Reconocimiento Óptico de Caracteres (OCR): Se aplicaron algoritmos de OCR especializados. Para el texto impreso, se utilizó un motor de OCR de alta precisión, optimizado para tipografías formales del siglo XIX. Para el texto manuscrito, se empleó un modelo de reconocimiento de escritura a mano (Handwritten Text Recognition o HTR) más flexible, entrenado en una amplia variedad de estilos caligráficos cursivos.
  3. Procesamiento de Lenguaje Natural (PLN): El texto reconocido por el OCR y el HTR se alimentó a un modelo de lenguaje. Este modelo realizó un análisis semántico y contextual para corregir posibles errores de reconocimiento y para inferir el significado de abreviaturas o palabras de difícil lectura. Por ejemplo, el modelo pudo interpretar que m/n probablemente significaba «moneda nacional» en este contexto histórico.
  4. Estructuración y Generación de Salida: Finalmente, el modelo generativo reconstruyó la transcripción respetando la disposición espacial del documento original, lo cual se logró mediante un análisis del layout de la imagen y la inserción de saltos de línea y tabulaciones para emular la estructura visual del documento.

La corrección de la transcripción se basó en un procedimiento de retroalimentación o «Human-in-the-Loop» (HITL). Este proceso implicó la recepción de una nueva entrada de texto con nuestra corrección, que fue tratada como la fuente  definitiva para la transcripción. El procedimiento técnico fue el siguiente:

  1. Análisis de Instrucción: Se interpretó nuestra corrección como una instrucción explícita para reemplazar la transcripción inicial. El modelo reconoció la nueva información como una corrección sobre la interpretación previa de la imagen.
  2. Identificación de Discrepancias: Se realizó una comparación léxica y estructural entre la transcripción original y el texto corregido proporcionado por el usuario. Se identificaron las variaciones clave, como el cambio en la fecha de «21 de Setiembre» a «24 de Setiembre» y la nueva lectura de la firma del recaudador.
  3. Actualización del Modelo de Salida: En lugar de reinterpretar la imagen, el modelo utilizó el texto corregido como su nuevo «estado de verdad». Se generó una nueva transcripción fiel a la disposición espacial del documento, pero con el contenido literal proporcionado en la corrección, validando así la intervención humana como el factor determinante para la precisión.

Las versiones de transcripción subsecuentes (listado, texto plano, tabla) no implicaron un nuevo proceso de OCR, sino una reestructuración de la información ya validada.

  1. Extracción de Entidades y Análisis Semántico: Se aplicó un proceso de extracción de entidades nombradas (Named Entity Recognition o NER) sobre el texto corregido. El modelo identificó y clasificó entidades como «nombre del beneficiario», «monto», «fecha», «dirección» y «recaudador».
  2. Normalización y Estructuración de Datos: Las entidades extraídas se normalizaron y se organizaron en pares clave-valor (p. ej., Monto: 24.00 m/n). Este formato facilitó la transformación de los datos en diferentes estructuras.
  3. Generación de Salida Alternativa: Utilizando el formato estructurado como base, se aplicaron diferentes plantillas de generación de texto:
    • Formato de Listado: Se utilizó una plantilla que presenta las entidades en una lista jerárquica.
    • Formato de Texto Plano: Se generó un texto en prosa a partir de las entidades, conectándolas con lenguaje natural para crear un resumen coherente.
    • Formato de Tabla (Markdown): Se usó un lenguaje de marcado (Markdown) para crear una representación tabular de las entidades, lo que es útil para la visualización y comparación de datos.

En cuanto a la elaboración de la nota paleográfica requirió un proceso de razonamiento simbólico y deductivo más allá de la simple transcripción.

  1. Análisis de Metadatos y Contexto: El modelo procesó los datos extraídos del manuscrito (fecha, provincia, tipo de documento) para contextualizarlo históricamente. Utilizó su conocimiento sobre la evolución de la escritura, la ortografía y las prácticas administrativas del siglo XIX.
  2. Identificación de Características Caligráficas: Se analizaron los resultados del HTR inicial y las correcciones para identificar patrones caligráficos. Se reconoció la diferencia entre la tipografía impresa y la caligrafía cursiva, y se evaluó la legibilidad de la firma.
  3. Integración de Elementos No Textuales: Se consideraron elementos del análisis visual, como la presencia y el contenido del sello de la oficina, la condición física del papel (descoloración, arrugas) y la calidad de la tinta.
  4. Generación de Texto Analítico: El modelo sintetizó toda la información contextual, caligráfica y física en un texto explicativo. A través del procesamiento de lenguaje natural avanzado, se generó un informe que utiliza vocabulario técnico («paleografía», «cursiva», «grafía», «tipografía») para describir las características del documento de manera académica.

V. PASO A PASO

A continuación ofrecemos el “paso a paso” de este procedimiento que, desde luego, es accesible a todos quienes deseen aplicarlo y que, como se ve, arroga resultados provechosos:

Paso 1: Transcripción Inicial del Documento

El primer paso es obtener una transcripción fiel del documento, respetando su disposición, ortografía y cortes originales.

  • Acción del usuario: Debemos subir la imagen del documento y solicitar la transcripción.
  • Ejemplo de prompt: «Transcribe este documento en un formato editable. Realiza una transcripción fiel, respetando cortes de palabras, ortografía original y disposición textual.»
  • Resultado esperado: La herramienta Gemini procesará la imagen y generará una transcripción que reproduce el texto del manuscrito, intentando replicar la estructura visual del original.

Paso 2: Revisión y corrección de la transcripción

Debido a que el texto manuscrito puede ser de difícil lectura, es fundamental que revisemos y corrijamos la transcripción inicial. Este paso mejora significativamente la precisión final.

  • Acción del usuario: Leemos la transcripción inicial y comparamos cada palabra con la imagen. Identificamos y corregimos cualquier error en el texto. Luego, se envía la versión corregida.
  • Ejemplo de prompt: «Por favor, realiza las siguientes correcciones: [Copia y pega la transcripción completa, pero con los cambios exactos que deseas].»
  • Resultado esperado: La herramienta proporcionará una nueva transcripción, validada por el usuario, que se convertirá en la base para todos los análisis posteriores.

Paso 3: Generación de versiones de transcripción alternativas

Una vez que la transcripción sea precisa, podemos solicitar diferentes formatos para la información, lo que es útil para el análisis de datos o la presentación del contenido.

  • Acción del usuario: Debemos solicitar al modelo que reestructure la transcripción corregida en diferentes formatos.
  • Ejemplo de prompt: «Analiza la transcripción corregida y ofrece otras variantes de transcripción, como un listado de datos clave, un formato de texto plano y una tabla.»
  • Resultado esperado: La IA extraerá los datos relevantes (nombre, fecha, monto, etc.) y los presentará en las estructuras solicitadas.

Paso 4: Elaboración de un análisis paleográfico

Para obtener otra visión del documento, podemos solicitar un análisis detallado de sus características físicas y de escritura.

  • Acción del usuario: Solicitamos a la herramienta una «nota paleográfica» que analice el documento desde una perspectiva técnica e histórica.
  • Ejemplo de prompt: «Por favor, realiza una nota paleográfica, teniendo en cuenta las correcciones efectuadas anteriormente.»
  • Resultado esperado: La IA generará un texto analítico que describe la tipografía, la caligrafía, la ortografía de la época, los elementos gráficos (sellos), el estado de conservación del documento y su contexto histórico.

Como es fácil inferirlo, estas herramientas –como Gemini- resultan muy útiles cuando se deben transcribir grandes volúmenes de documentos manuscritos o tipográficos.

Hasta la próxima…

VI. BIBLIOGRAFIA

  • Humphries, Mark, Lianne C. Leddy, Quinn Downton, Meredith Legace, John McConnell, Isabella Murray, and Elizabeth Spence. «Unlocking the Archives: Large Language Models Achieve State-of-the-Art Performance on the Transcription of Handwritten Historical Documents.» En SSRN Electronic Journal, 2024. Disponible en https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5006071.
  • Humphries, Mark, Lianne C. Leddy, Quinn Downton, Meredith Legace, John McConnell, Isabella Murray, and Elizabeth Spence. «Unlocking the Archives: Using Large Language Models to Transcribe Handwritten Historical Documents.» En arXiv preprint arXiv:2411.03340, November 5, 2024. Disponible en https://arxiv.org/pdf/2411.03340.
  • Khan, Arsh, Utsav Rai, Shashank Shekhar Singh, Yukinori Yamamoto, Xabier Granja Ibarreche, Harrison Meadows, and Sergei Gleyzer. «OCR Approaches for Humanities: Applications of Artificial Intelligence/Machine Learning on Transcription and Transliteration of Historical Documents.» En Digital Studies in Language and Literature 1, no. 1-2 (2024): 85-112. Disponible en https://doi.org/10.1515/dsll-2024-0013.
  • «Handwriting Recognition in Historical Documents with Multimodal LLM.» En arXiv preprint arXiv:2410.24034v1, October 2024. Disponible en https://arxiv.org/html/2410.24034v1.