María Teresa Sánchez Nieto ha presentado en el V Congreso PaCor, Parallel-Corpus-based Approaches to Language and Data, celebrado en Valladolid del 28 al 30 de mayo la ponencia: Merck DE-ES: un corpus para el estudio de la comunicación médica en situaciones comunicativas simétricas y asimétricas

El Parallel Corpus of German and Spanish comprende una serie de “suplementos”, esto es, corpus bilingües paralelizados de menor tamaño que los corpus nucleares y que representan usos especializados de la lengua, que actualmente son tres: TED Talks DE-ES (que representa el uso divulgativo del lenguaje científico), Europarl DE-ES (que representa el uso administrativo de la lengua) y OpenSubtitles DE-ES (que testimonia el uso de la lengua en los subtítulos).

Este trabajo presenta el proceso de compilación de un nuevo suplemento para PaGeS: el suplemento Merck DE-ES. Se trata de un corpus paralelo bilingüe a partir de las versiones alemana y española de los manuales Merck disponibles en línea: Manual Merck versión para profesionales y Manual MSD versión para público general; MSD Manual Ausgabe für Patienten y MSD Manual Profi-Ausgabe.. Los manuales Merck son obras de referencia médica que se publicaron por primera vez en 1899 como una guía de bolsillo para médicos y farmacéuticos. Con el tiempo, se transformaron en un recurso en línea con versiones tanto para facultativos y otros profesionales de la salud (versión para profesionales) como para consumidores (versión para el hogar). Los manuales ofrecen información médica detallada escrita en un lenguaje adaptado a cada uno de los públicos objetivo mencionados, con el fin de proporcionar información médica imparcial y accesible. Por lo tanto, el suplemento Merck DE-ES representará el uso especializado de la lengua en el ámbito médico en situaciones de comunicación simétricas (experto-experto, p. ej. en la comunicación entre médicos) y asimétricas (experto-lego, p. ej. en la comunicación médico-paciente).

Tras presentar brevemente la historia, características e interés de los manuales Merck para el proyecto PaGeS/PaCorES, explicitaremos los criterios de selección del material y de los metadatos necesarios para integrar el suplemento en la arquitectura de PaCorES. Asimismo, describiremos las características del script que permite la extracción y conversión automatizada de los datos a partir de las páginas web que contienen los textos alemanes y españoles que nos interesan, y, finalmente, los pasos del posprocesamiento de los datos para su indexación en PaGeS. Tras exponer las estadísticas principales del corpus, reflexionaremos sobre el carácter piloto de esta compilación, con el fin de valorar la posibilidad de compilar con esta técnica suplementos Merk para PaEnS (inglés-español), PaFrEs (francés-español) y PaChEs (chino-español).

Doval, I., & Sánchez Nieto, M. T. (2026). Parallel Corpora Spanish (PaCorES): A collection of multifunctional parallel corpora. RESLA. Revista Española de Lingüística Aplicada / Spanish Journal of Applied Linguistics.

Manual Merck versión para profesionales. (s. f.). Recuperado 16 de febrero de 2025, de https://www.merckmanuals.com/es-us/professional

Manual MSD versión para público general. (s. f.). Recuperado 16 de febrero de 2025, de https://www.msdmanuals.com/es/hogar

MSD Manual Ausgabe für Patienten. (s. f.). Recuperado 16 de febrero de 2025, de https://www.msdmanuals.com/de/heim

MSD Manual Profi-Ausgabe. (s. f.). Recuperado 16 de febrero de 2025, de https://www.msdmanuals.com/de/profi Tomes, N. (2021). Not just for doctors anymore”: How the merck manual became a consumer health “bible. Bulletin of the History of Medicine, 95(1). https://doi.org/10.1353/bhm.2021.0000

Scroll al inicio