Rendimiento de las nuevas funciones

Funciones a comparar:

En este artículo se compara le rendimiento de las funciones nuevas en relación a al funciones anteriores en la realización de una misma tarea:

  • acep_cleaning() vs acep_clean()

  • acep_count() vs acep_men()

El input para la prueba de rendimiento son 100 notas de la Revista Puerto.

Comparativa entre acep_cleaning() vs acep_clean()

FUN.v1 <- system.time({ acep_clean(df$nota) })

FUN.v2 <- system.time({ acep_cleaning(df$nota) })

cat("La nueva versión (acep_cleaning) procesa los datos ingresados en", FUN.v2[3], "segundos.", 
    "\nLa vieja versión (acep_clean) procesa los datos ingresados en", FUN.v1[3], "segundos.", 
    "\nLa diferencia es de", FUN.v1[3]-FUN.v2[3])
#> La nueva versión (acep_cleaning) procesa los datos ingresados en 1.542 segundos. 
#> La vieja versión (acep_clean) procesa los datos ingresados en 8.132 segundos. 
#> La diferencia es de 6.59

Comparativa entre acep_count() vs acep_men()

FUN.v1 <- system.time({ acep_men(df$nota, dicc, tolower = FALSE) })

FUN.v2 <- system.time({ acep_count(df$nota, dicc) })

cat("La nueva versión (acep_count) procesa los datos ingresados en", FUN.v2[3], "segundos.", 
    "\nLa vieja versión (acep_men) procesa los datos ingresados en", FUN.v1[3], "segundos.", 
    "\nLa diferencia es de", FUN.v1[3]-FUN.v2[3])
#> La nueva versión (acep_count) procesa los datos ingresados en 2.245 segundos. 
#> La vieja versión (acep_men) procesa los datos ingresados en 1.081 segundos. 
#> La diferencia es de -1.164

Resultados

Las mejoras en el rendimiento son significativas, en especial entre las dos versiones de la función de limpieza y normalización de texto.