Tópicos Selectos de Computación
-
El lenguaje de programación AWK
-
Notas (Ver Capítulos 2, 3 y 16)
-
Diapositivas
-
Tareas a entregar
-
Cálculo de probabilidad de términos
Crear un programa para calcular el rango, el término, su frecuencia y su probabilidad. Graficar los
resultados obtenidos, usando los corpora pre-procesados que se encuentran en la carpeta "categorization corpora". Evaluar el parecido de las curvas usando la herramienta WaCOS
disponible via web en: http://nlp.dsic.upv.es/watermarker.
-
Alfabetos
Investigar y entregar un reporte sobre la cultura Berbere y el alfabeto Amazigh.
-
Clasificador basado en Centroides
Crear un programa para clasificar datos continuos usando los centroides de los datos (usando un corpus de entrenamiento). Usar
los datos de longitud y ancho de hojas obtenidos para evaluar el rendimiento del clasificador.
-
Clasificador Gaussiano Multivariado
Crear un programa para clasificar datos continuos usando las medias y las desviaciones estándar de los datos (usando un
corpus de entrenamiento). Usar los datos de longitud y ancho de hojas obtenidos para evaluar el rendimiento del clasificador.
-
Clasificador de Naive Bayes
Usar el clasificador desarrollado en clase para evaluar TODOS los corpora proporcionados para la tarea de clasificación. Usar
las medidas de "Precision", "Recall" y "F-Measure" para evaluar el rendimiendo del clasificador.
-
Identificación de Idiomas
Documentar el proyecto hecho en clase para la identificación automática de idiomas. Discutir ampliamente el
resultado obtenido por el clasificador cuando se varían las características (n-gramas de palabras vs. n-gramas de palabras).
-
Proyecto de Clasificación
Proponer una tarea de clasificación real en donde se apliquen los conocimientos obtenidos.