Iberlegal 2019

Recursos y aplicaciones de tecnologías del lenguaje para el dominio legal en lenguas de la Península Ibérica (español, catalán, vasco, gallego y portugués)

logo Iberlegal

IberLegal se celebra junto a la sesión de la industria en el marco de JURIX 2019 32nd International Conference on Legal Knowledge and Information Systems, evento organizado por la Foundation for Legal Knowledge Based Systems ( JURIX) desde 1988.

Inscripción

En caso de estar interesado en asistir al evento, puede registrarse en este enlace eligiendo "IberLegal" (sin coste).

Lugar

Fundación Gómez Pardo

Calle de Ríos Rosas 21, 28003 Madrid

Fecha

11 diciembre de 2019

Horario: 9:00 horas a 13:00 horas

Agenda

09:00-09:15
Registro
09:15-09:45
Inauguración: Plan TL y el Vertical de Justicia.
09:45-10:00
Introducción al Taller y Resultados preliminares de TL en Justicia Presentación [PDF] [1.42 MB]
  • Doaa Samy - SEAD
  • Jerónimo Arenas - SEAD

Sesión de actores relevantes / casos de uso

10:00-10:15
Caso de uso 1-AAPP: CENDOJ
  • Iñaki Vicuña
10:15-10:30
Caso de uso 2-AAPP: Comunidad de Madrid-Madrid Digital. Presentación [PDF] [2.39 MB]
  • Samuel Fraga Tamayo
  • Ana Puebla Rubio
10:30-10:45
Caso de uso 3-Industria: Centro de Excelencia en Justicia de Minsait. Presentación [PDF] [2.43 MB]
  • Jose Luis Purcalla Bonilla
  • Mariano Garralda
10:45-11:00
Debate
11:00-11:15
Café

Sesión técnico-académica

11:15-10:30
TimeLex: A Suite for Processing Temporal Information in Legal Texts. Presentación [PDF] [2.87 MB]
  • María Navas-Loro
  • Víctor Rodríguez-Doncel
11:30-11:45
Aprendiendo la noción de similaridad: Búsquedas inteligentes en bases de datos jurídicas con PLN y aprendizaje profundo. Presentación [PDF] [4.89 MB]
  • David Cómez-Ullate
  • David Gordo
11:45-12:00
Extracting Terminologies in the Legal Domain: A Syntactic pattern-based approach for Spanish. Presentación [PDF] [1.42 MB]
  • Mariano Rico
  • Pablo Calleja
  • Patricia Martín
  • Elena Montiel
12:00-12:15
Terminology Extraction in the Legal Domain for Spanish Administration. Presentación [PDF] [1.14 MB]
  • Pablo Calleja
  • Patricia Martín
  • Asunción Gómez-Pérez
12:15-12:30
Legal Document Retrieval across Languages: Topic Hierarchies Based on Synsets. Presentación [PDF] [2.88 MB]
  • Carlos Badenes-Olmedo
  • José Luis Redondo García
  • Oscar Corcho
12:30-12:45
El sistema arText: una aplicación tecnológica que ayuda a la ciudadanía a escribir textos a la Administración Pública. Presentación [PDF] [3.51 MB]
  • Iria da Cunha Fanego
12:45-13:00
Debate: Necesidades, oportunidades y retos
13:00-14:00
Almuerzo - Networking

Convocatoria para envío de resúmenes, demos y casos de uso:

Toda la información aquí

Contacto

Doaa Samy

Correo electrónico: doaa.samy@iic.uam.es

Organizadores

  • David Pérez Fernández - Coordinador del Plan de Tecnologías del Lenguaje (Plan TL), Secretaría de Estado para el Avance Digital (SEAD), Ministerio de Economía y Empresa
  • María José del Olmo Toribio (Plan TL), Secretaría de Estado para el Avance Digital (SEAD), Ministerio de Economía y Empresa
  • Doaa Samy (Instituto de Ingeniería del Conocimiento y Plan TL)
  • Jerónimo Arenas García (Universidad Carlos III Madrid y Plan TL)
  • David Griol Barres (Universidad Carlos III Madrid y Plan TL)
  • José R. Granger (ISDEFE y Plan TL)
  • Inés Rodríguez Pelarda (ISDEFE y Plan TL)
  • Marta Morales García (ISDEFE y Plan TL)

Resumen

IberLegal es un taller interactivo e inter-sectorial cuyo objetivo consiste en analizar los avances del Procesamiento del Lenguaje Natural (PLN) en el tratamiento de datos legales en idiomas de la Península Ibérica: el español, los idiomas cooficiales (catalán, euskera, gallego) y el portugués. Los representantes de entidades de todo tipo: la Administración Pública, la Academia y la Industria (PLN y Legal), compartirán sus enfoques, su trabajo en marcha y su experiencia en el sector.

El taller tiene los siguientes objetivos específicos:

  • Abordar las necesidades y oportunidades en el dominio legal dentro del contexto de los idiomas considerados.
  • Compartir los resultados de trabajos de investigación concluidos o en curso, incluyendo los recursos lingüísticos, las aplicaciones de PLN, traducción automática y sistemas de diálogo en el dominio legal en las lenguas en cuestión.
  • Presentar las soluciones y aplicaciones actuales desarrolladas por la industria.

Grupos destinatarios

  • Administración pública a nivel nacional y autonómica
  • Industria (TIC, Tecnologías del Lenguaje, Ciencias de Datos e Inteligencia Artificial)
  • Academia
  • Profesionales del derecho (consultoras jurídicas, despachos de abogados, etc.)
  • Asociaciones de profesionales en el sector

Alcance de IberLegal

IberLegal se plantea teniendo en cuenta dos dimensiones:

  • Difusión del Plan TL centrando en las tecnologías del lenguaje en el ámbito de la justicia/legal a través de un foro interactivo entre representantes de los diferentes sectores (administración pública, industria, academia, profesionales, etc.) sobre las necesidades, desafíos y oportunidades de la TL en el dominio legal.
  • Taller científico para presentar los resultados de los trabajos de investigación sobre TL en el ámbito legal y en los idiomas considerados.

Por lo tanto, se aceptan dos formas de participación:

  • Envío de resúmenes científicos de resultados publicados sobre trabajos en marcha o trabajos concluidos.
  • Presentación de demos / casos de uso

Motivación detrás de IberLegal

Dentro del Plan TL, se ha considerado un número de dominios prioritarios específicos para desarrollar proyectos piloto. El dominio legal se considera una de estas áreas prioritarias que ha estado en el centro de atención del Plan TL en los últimos años, dada su relevancia y su impacto en la sociedad a diferentes niveles: organismos gubernamentales, servicios para los ciudadanos, medidas estructurales de transformación digital del sector, etc.

Se han mantenido contactos a diferentes niveles con la Administración pública, así como con grupos académicos e industriales para obtener información de primera mano sobre la situación actual de las TL aplicadas al dominio legal en las lenguas en cuestión.

Desde el punto de vista de los organizadores, existen tres razones principales detrás de IberLegal. El primero tiene que ver con el contexto institucional y el papel de las Administraciones Públicas; el segundo está relacionado con el contexto lingüístico y el tercero con el uso técnico y práctico del PLN y las TL en el dominio legal.

Primero y desde la perspectiva del Plan TL, la Administración pública podría promover la industria del lenguaje y lograr que más departamentos y organismos públicos introduzcan el uso de estas tecnologías. Las AAPP podrían abrir más conjuntos de datos del ámbito legal y administrativo en el marco de la Directiva europea sobre datos abiertos y la reutilización de la información en el sector público, también conocida como 'Directiva de datos abiertos' (Directiva (UE) 2019/1024). De ahí, proporcionar los datos y recursos lingüísticos necesarios para desarrollar componentes basados en PLN y soluciones inteligentes capaces de: 1) transformar el largo flujo tradicional de los procedimientos en tareas más ágiles y eficientes ahorrando esfuerzo y tiempo; 2) ayudar a los decisores y a los actores públicos a navegar a través de grandes cantidades de datos legales y recuperar la información relevante de una forma más efectiva. Lograr esto se reflejaría en mejores servicios para los ciudadanos.

En segundo lugar, las lenguas objeto de IberLegal, representan, por un lado, dos lenguas muy habladas a nivel internacional: el español y el portugués y, por otro lado, las tres lenguas co-oficiales en España, catalán, euskera y gallego, considerados como idiomas con menos recursos desde la perspectiva del PLN. A pesar de que el idioma español es uno de los principales idiomas hablados internacionalmente con más de 500 millones de hablantes, todavía los recursos lingüísticos específicos de dominio, validados y a gran escala para PLN son limitados en comparación con el inglés. Lo mismo para el portugués con más de 200 millones de hablantes. Con respecto a las lenguas co-oficiales en España: el catalán, el euskera y el gallego son de gran interés como caso de uso de lenguas con menos recursos y, por lo tanto, los avances en recursos y aplicaciones están muy bien valorados por la comunidad de Tecnologías del Lenguaje.

En tercer lugar, el dominio legal, que incluye profesionales en consultoras y bufetes de abogados, legisladores y administradores públicos, maneja grandes cantidades de datos en diferentes formatos (texto, audio y video). Manejar grandes cantidades de información requieren de soluciones inteligentes para extraer el conocimiento relevante y para facilitar las tareas diarias ahorrando tiempo y esfuerzo. El uso de las TL es crucial para una amplia gama de aplicaciones relacionadas con el procesamiento de texto, como la recuperación y extracción de información, relación entre entidades, resumen automático, inferencia, modelado, etc.

Además, las tecnologías de voz podrían desempeñar un papel importante en el manejo de los datos multimodales permitiendo una mayor flexibilidad en la navegación a través de los diferentes formatos, así como otras facilidades para que los profesionales de TL y el sector judicial puedan manejar grabaciones de actos jurídicos o extraer información de pruebas en formato multimodal. Por tanto, las soluciones inteligentes que aplican técnicas de TL podrían causar un impacto en el sector de la Justicia, cualitativa y cuantitativamente.

JURIX es una de las conferencias líderes en el dominio. Aprovechando que este año se celebra en Madrid, es una oportunidad perfecta para promover más trabajo en el dominio legal en los idiomas español, portugués y lenguas cooficiales, así como para reunir a los agentes claves para abordar las necesidades, los desafíos y las oportunidades que pueden aprovecharse en el ámbito legal.