Lingüística y Lenguas Aplicadas Plan 2019
Grado y Doble Grado. Curso 2023/2024.
PROCESAMIENTO DEL LENGUAJE NATURAL - 805146
Curso Académico 2023-24
Datos Generales
- Plan de estudios: 080K - GRADO EN LINGÜÍSTICA Y LENGUAS APLICADAS (2019) (2019-20)
- Carácter: Optativa
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
ACTIVIDADES DOCENTES
Clases teóricas
Clases prácticas
Presenciales
Semestre
Breve descriptor:
La elección del texto para aprender PLN no es arbitraria. Se puede afirmar que el texto es el formato estándar de la información en los entornos digitales, y, en todo caso, el formato más sencillo de procesar. Actualmente hay más de 15 exabytes (1018 bytes) de texto digital en internet y su crecimiento es mayor que los formatos de audio y vídeo. Esto significa que la minería de textos (que es el tratamiento automático de textos para la obtención de información y conocimiento) tiene, y tendrá previsiblemente, un gran interés científico y económico. De esta forma los conocimientos adquiridos proporcionarán una capacitación profesional y una visión ajustada a las necesidades de la sociedad de la información.
Requisitos
Objetivos
- Conocer y ser capaz de utilizar aplicaciones PLN para llevar a cabo sencillas tareas de procesamiento del lenguaje natural (segmentación, etiquetado, recuperación de información, clasificación automática, )
- Conocer y ser capaz de utilizar recursos lingüísticos como los corpus y vocabularios para llevar a cabo tareas de procesamiento del lenguaje natural
- Ser capaz de construir sistemas PLN prototípicos sencillos para el análisis del lenguaje natural.
- Saber definir y llevar a cabo un proyecto de PLN
Contenido
1. Introducción al Procesamiento del Lenguaje Natural
1.1. Definición, objetivo, terminología, problemas del PLN (revisión)
1.2. Cómo procesa el LN el cerebro humano
1.3. Arquitectura y funciones básicas de un Sistema PLN
1.4. Aplicaciones
1.5. Python: entorno de desarrollo y revisión de programación
1.6. Evaluación
2. Análisis textual
2.1. Recolección y almacenamiento de textos
2.2. Estudio y descripción del corpus textual con herramientas de análisis textual
2.3. Verificación de la calidad de los textos
2.4. Práctica: descripción de los textos fuente
3. Preparación de los datos
3.1. Tareas y resultados de la preparación de datos
3.2. Segmentación y etiquetado
3.3. Representación formal y almacenamiento
3.4. Práctica: preparación los datos para su clasificación
4. Modelo de procesamiento
4.1. Selección de las técnicas de modelado
4.2. Corpus de prueba y corpus de evaluación
4.3. Construcción del modelo
4.4. Aplicación del modelo
4.5. Práctica: construcción de un clasificador de textos
5. Evaluación y depuración
5.1. Métricas de evaluación
5.2. Evaluación del modelo
5.3. Depuración del modelo
5.4. Práctica: evaluación y ajustes del clasificador
6. Desarrollo de un proyecto de minería de textos
6.1. El modelo CRISP-DM 1.0
6.2. Especificación del proyecto desarrollado en el curso
Evaluación
Al finalizar el curso se realizará un examen final con preguntas de carácter teórico y práctico sobre los contenidos de la asignatura. Para aprobar la asignatura es imprescindible aprobar el examen final.
La calificación final se obtendrá:
- El 10 % se obtiene de la participación y trabajo continuo en las sesiones presenciales.
- El 40 % se obtiene de las calificaciones de las prácticas y evaluaciones continuas de cada tema.
- El 50 % se obtiene de la calificación en el examen final sobre los contenidos teóricos y prácticos desarrollados durante el curso. Es requisito indispensable aprobar el examen al margen de que la media final supere el 5.
Bibliografía
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C. and Wirth, R. (1999), CRISP-DM 1.0: Step-by-Step Data Mining Guide, Accessed online 1 August 2015: https://the-modeling-agency.com/crisp-dm.pdf
GraphLab User Guide: https://dato.com/products/create/resources.html
WordSmith Tools Manual: http://lexically.net/downloads/version6/HTML/index.html?getting_started.htm
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 22/01/2024 - 08/05/2024 | JUEVES 10:30 - 12:00 | A-LAB 007 | LARA ALONSO SIMON |
VIERNES 10:30 - 12:00 | A-LAB 007 | LARA ALONSO SIMON |