Curso de tecnologías del lenguaje para la extracción de información

Curso de tecnologías del lenguaje para la extracción de información

Mejora tu formación con el curso: Curso de tecnologías del lenguaje para la extracción de información

Curso impartido por:

Cursos de Cálamo & Cran
  • Matrícula abierta
  • Consultar
  • On line
  • Curso
  • España
  • Todas
  • Español

En este curso conocerás los fundamentos y técnicas básicas de este tipo de tecnologías relacionadas con el procesamiento de lenguaje natural para extraer información desde el punto de vista del lingüista/humanista. Adquirirás los conocimientos y habilidades necesarios para desempeñar roles profesionales significativos en el reconocimiento de entidades y conceptos, la extracción de insights, la clasificación automática, el análisis de sentimientos, emoción y opinión, y las técnicas de recuperación de información, respuesta a preguntas y extracción de resúmenes. Todo ello se desarrollará mediante un enfoque teórico-práctico, por lo que te enfrentarás a casos reales de aplicación empleando plataformas en la nube y ejemplos de código en Python.

Dirigido a: Este curso está dirigido a lingüistas (humanistas o computacionales) que deseen desempeñar roles profesionales en proyectos de tecnología lingüística relacionados con las tareas de Procesamiento de Lenguaje Natural (PLN) para extracción de información: reconocimiento de entidades, clasificación automática, análisis de sentimientos, análisis de opinión, recuperación de información, respuesta a preguntas, extracción de resúmenes, etc.

Requisitos: Para realizar este curso se requiere de un conocimiento introductorio acerca del sector de las tecnologías del lenguaje, el Procesamiento del Lenguaje Natural (PLN) y sus aplicaciones básicas.

Para qué te prepara: Tiene como objetivo profundizar en los fundamentos y técnicas básicas de las tecnologías relacionadas con el PLN para extraer información, así como adquirir los conocimientos y habilidades necesarios para desempeñar roles profesionales significativos en el reconocimiento de entidades y conceptos, la extracción de insights, la clasificación automática, el análisis de sentimientos, emoción y opinión, y las técnicas de recuperación de información, respuesta a preguntas y extracción de resúmenes.

Certificado: Certificado de aprovechamiento de Cálamo&Cran.

Contenido del curso Curso de tecnologías del lenguaje para la extracción de información

UNIDAD DIDÁCTICA 1. INTRODUCCIÓN

0. Objetivos de la unidad

1. Introducción

1.1. Orígenes de la extracción de información

1.2. Información estructurada vs. información no estructurada

2. Tareas de extracción de información

2.1. Reconocimiento de entidades

2.2. Clasificación automática 

2.3. Extracción de información elaborada

2.4. Recuperación de información

2.5. Respuesta a preguntas

2.6. Extracción de resúmenes

3. Generación automática de texto

3.1. Fundamentos

3.2. Modelos GPT

4. Métricas de evaluación

5. Aprendizaje automático y deep learning

5.1. Aprendizaje automático

5.2. Redes neuronales y deep learning

5.2.1. Redes neuronales convolucionales

5.2.2. Capa de atención

5.2.3. Redes neuronales recurrentes

5.2.4. Arquitectura encoder-decoder

5.2.5. Modelo de transformer

5.2.6 Ventajas e inconvenientes

5.3. Vectores de embeddings

UNIDAD DIDÁCTICA 2. RECONOCIMIENTO DE ENTIDADES

0. Objetivos de la unidad

1. Introducción

1.1. Fundamentos y conceptos básicos

1.2. Proceso de reconocimiento de entidades

1.3. Representación del texto como secuencias

1.4. Entity linking

1.5. Aplicaciones

2. Métricas de evaluación

3. Técnicas de reconocimiento de entidades

3.1. Modelos clásicos de procesamiento del lenguaje natural

3.1.1. Características para reconocer/clasificar entidades

3.1.2. Tarea del lingüista

3.2. Técnicas de aprendizaje automático

3.2.1. Algoritmos de aprendizaje automático

3.2.2. Deep learning

3.2.3. Tarea del lingüista

Ejercicio 1: Reconocimiento de entidades con un sistema real

1. Introducción

2. IBM Watson Natural Language Understanding

3. Google Cloud Natural Language

Ejercicio 2: Funcionalidades para la tarea de reconocimiento de entidades 

1. Introducción

2. Google Colaboratory

3. Creación de un cuaderno nuevo

4. Reconocimiento de entidades con NLTK

5. Reconocimiento de entidades con spaCy

UNIDAD DIDÁCTICA 3. CLASIFICACIÓN AUTOMÁTICA

0. Objetivos de la unidad

1. Introducción

1.1. Fundamentos y conceptos básicos

1.2. Tipos de clasificación

1.2.1. Clasificación binaria (binary)

1.2.2. Clasificación multiclase (multiclass)

1.2.3. Clasificación single-label vs. multi-label

1.3. Aplicaciones

2. Métricas de evaluación

2.1. Escenarios single-label

2.2. Escenarios multi-label

3. Técnicas de clasificación automática

3.1. Modelos basados en reglas

3.1.1. Tarea del lingüista

3.2. Técnicas de aprendizaje automático

3.2.1. Tarea del lingüista

3.3. Modelos híbridos

4. Tipos específicos de clasificación

4.1 Análisis de sentimientos

4.2. Análisis de emoción

4.3. Análisis de reputación

4.4. Detección de idioma

4.5. Detección de intenciones

Ejercicio 3: Clasificación de textos con un sistema real

1. Introducción

2. IBM Watson Natural Language Understanding

3. Google Cloud Natural Language

Ejercicio 4: Entrenamiento de un modelo de clasificación

1. Introducción

2. Modelo de clasificación de intenciones

3. Entrenamiento

4. Ejecución

UNIDAD DIDÁCTICA 4. EXTRACCIÓN DE INFORMACIÓN COMPLEJA

0. Objetivos de la unidad

1. Introducción

2. Modelo de grafo semántico

3. Tarea de extracción de información

3.1. Modelos de reglas de extracción

3.2. Técnicas de aprendizaje automático

3.3. Tarea del lingüista

UNIDAD DIDÁCTICA 5. RECUPERACIÓN DE INFORMACIÓN

0. Objetivos de la unidad

1. Fundamentos y conceptos

2. Modelos de recuperación de información

2.1. Modelo booleano

2.2. Modelo de espacio vectorial

2.3. Modelo probabilístico

3. Similitud semántica

3.1. Conceptos

3.2. Búsqueda semántica

4. Métricas de evaluación

5. Tarea del lingüista

Ejercicio 5: Similitud semántica y búsqueda semántica

1. Búsqueda semántica

2. Búsqueda de duplicados

UNIDAD DIDÁCTICA 6. RESPUESTA A PREGUNTAS

0. Objetivos de la unidad

1. Introducción

1.1. Conceptos y fundamentos

1.2. Historia

2. Proceso de respuesta a preguntas

2.1. Fundamentos

2.2. Análisis de la pregunta

2.3. Recuperación de contextos

2.4. Extracción de la respuesta

2.5. Ejemplo

3. Extractive question answering

4. Tarea del lingüista

UNIDAD DIDÁCTICA 7. EXTRACCIÓN DE RESÚMENES

0. Objetivos de la unidad

1. Introducción

2. Resúmenes extractivos

2.1. Conceptos

2.2. Proceso clásico

2.3. Modelos basados en aprendizaje automático

2.4. Escenarios específicos

2.5. Tarea del lingüista

3. Resúmenes abstractivos

3.1. Conceptos

3.2. Modelos

3.3. Tarea del lingüista

Ejercicio 6: Extracción de resúmenes extractivos y abstractivos

1. Resúmenes extractivos

2. Resúmenes abstractivos

UNIDAD DIDÁCTICA 8. ORIENTACIÓN PROFESIONAL Y PRÁCTICA FINAL

Rellena el formulario para que el centro pueda informarte

Los campos marcados con * son obligatorios

* Nombre: * Apellidos:
* País: * Provincia:
* Población: * C.P.:
* Dirección:
* Email: * Teléfono:
Nivel de estudios:
Solicitar información sin compromiso
Acepto la Política de Privacidad.
Quiero recibir información sobre cursos similares.

*Al pulsar "Solicitar información" aceptas las condiciones de utilización y la política de protección de datos. A su vez, autorizas EXPRESAMENTE a HispaVista, S.L. a enviar tus datos al centro que imparte el curso por el cual te has interesado.

En virtud del interés demandado, Hispavista S.L. comunicará al centro de formación que imparte el programa, los datos personales prescindibles con la finalidad que éste pueda ponerse en contacto y facilitarle la información solicitada.

Trabajos

Quiénes somos

Ofertas de empleo en tu email

Contáctanos

Blog

Blog de empleo

Construye el mejor currículo

Test psicotécnico

Cómo afrontar la entrevista

Crea tu propia empresa

Formación

Área de formación

Centros de formación

Acceso a centros de formación

Publica tus cursos

Ayuda

Preguntas frecuentes

Ayuda

Aviso legal

Política de cookies