Análisis textual de los títulos, resúmenes y palabras claves de la revista Ciencias e Ingeniería en el periodo 2000 – 2016, publicadas en Saber ULA
Resumen
El presente trabajo especial de grado, se realizó un análisis de texto a la revista de Ciencia e Ingeniería publicada en el repositorio institucional SABER ULA, perteneciente a la Universidad de Los Andes para el periodo comprendido entre los años 2000 y 2016, el cual tuvo como objetivo general Analizar textualmente los títulos, resúmenes y palabras claves de la revista Ciencias e Ingeniería en el periodo 2000 – 2016, publicadas en Saber ULA. Mediante la utilización de la herramienta R a fin de realizar el análisis textual (minería de texto) a los títulos, resúmenes y palabras claves, con el uso de diversas librerías para efectuar dicha minería, lo que facilitó la compresión de nueva información y, de alguna manera, permitió determinar la temática de una forma más sencilla. En relación al análisis textual, no se siguió ninguna metodología en específico. Se crearon nubes de palabras para cada año en estudio, contentivas de las palabras claves, resúmenes, títulos y la nube de comparación; para la realización de este análisis de texto y de las nubes fue necesario crear una base de datos en archivos txt, donde se almacenaron para cada año los títulos, resúmenes, palabras claves y autores. También fue necesario la depuración de los artículos publicados con respecto a los caracteres especiales, signos de puntuación, números, acentuaciones, entre otros. En cambio, para realizar la recurrencia de los autores de dicha revista, esto si se realizó mediante la aplicación de la metodología de análisis planteada por Meeker y Escobar (1998) y Nelson (2003). Se estimaron modelos no paramétricos para el promedio acumulado del número de publicaciones recurrentes en la revista en función de la edad (meses de observación) para las publicaciones de los autores aquellos que tuvieron 2 o más artículos publicados. Con los modelos paramétricos estimados se obtuvieron los pronósticos del número promedio de artículos recurrentes de los autores.
