En este artículo se compara le rendimiento de las funciones nuevas en relación a al funciones anteriores en la realización de una misma tarea:
acep_cleaning()
vs
acep_clean()
acep_count()
vs acep_men()
El input para la prueba de rendimiento son 100 notas de la Revista Puerto.
acep_cleaning()
vs
acep_clean()
FUN.v1 <- system.time({ acep_clean(df$nota) })
FUN.v2 <- system.time({ acep_cleaning(df$nota) })
cat("La nueva versión (acep_cleaning) procesa los datos ingresados en", FUN.v2[3], "segundos.",
"\nLa vieja versión (acep_clean) procesa los datos ingresados en", FUN.v1[3], "segundos.",
"\nLa diferencia es de", FUN.v1[3]-FUN.v2[3])
#> La nueva versión (acep_cleaning) procesa los datos ingresados en 1.542 segundos.
#> La vieja versión (acep_clean) procesa los datos ingresados en 8.132 segundos.
#> La diferencia es de 6.59
acep_count()
vs
acep_men()
FUN.v1 <- system.time({ acep_men(df$nota, dicc, tolower = FALSE) })
FUN.v2 <- system.time({ acep_count(df$nota, dicc) })
cat("La nueva versión (acep_count) procesa los datos ingresados en", FUN.v2[3], "segundos.",
"\nLa vieja versión (acep_men) procesa los datos ingresados en", FUN.v1[3], "segundos.",
"\nLa diferencia es de", FUN.v1[3]-FUN.v2[3])
#> La nueva versión (acep_count) procesa los datos ingresados en 2.245 segundos.
#> La vieja versión (acep_men) procesa los datos ingresados en 1.081 segundos.
#> La diferencia es de -1.164
Las mejoras en el rendimiento son significativas, en especial entre las dos versiones de la función de limpieza y normalización de texto.