Mostrar el registro sencillo del ítem

dc.contributor.authorJaramillo-Valbuena, Sonia
dc.contributor.authorAugusto-Cardona, Sergio
dc.contributor.authorAldana, Jorge Alejandro
dc.date.accessioned2024-04-18T15:14:59Z
dc.date.available2024-04-18T15:14:59Z
dc.date.issued2019-11-04
dc.identifier.issn0798-1015
dc.identifier.issn2739-0071
dc.identifier.urihttp://bdigital2.ula.ve:8080/xmlui/654321/13900
dc.description.abstractMany internet-based applications generate data streams, among others, the financial markets, computer network, phone conversations, biological and medical applications. Streaming data presents challenges in different level that cannot be handled by traditional database management systems. Reliability, scalability, durability, lack of structure, response time are some of them. Motivated by the industry’s need to obtain useful knowledge from data streams on the fly, several clustering methods have been proposed. In particular, in this paper, we compare experimentally 5 state of the art stream clustering algorithms: StreamKM++, CluStream, DenStream, ClusTree and ClusCTA-MEWMA. We assess their robustness in the presence of noisy data. We conduct experiments based on synthetic datasets. The results show that ClusCTAEWMA has better performance than the other algorithms in datasets with noise.en_US
dc.description.abstractMuchas aplicaciones basadas en Internet generan streams de datos. Algunas de ellas son los mercados financieros, redes informáticas, conversaciones telefónicas, aplicaciones biológicas y médicas. El procesamiento de streams de datos representa grandes desafíos a nivel de fiabilidad, escalabilidad, durabilidad, falta de estructura, memoria y tiempo de respuesta, que no pueden ser resueltos mediante los sistemas de gestión de bases de datos tradicionales. La necesidad de obtener conocimiento útil a partir de streams de datos ha llevado a la construcción de diferentes métodos de clustering. En particular, en este documento, se comparan experimentalmente 5 algoritmos de clustering sobre streams de datos: StreamKM ++, CluStream, DenStream, ClusTree y ClusCTA-MEWMA. Se evalúa su robustez ante la presencia de ruido. Los experimentos realizados se efectúan sobre datasets sintéticos. Los resultados muestran que ClusCTA-EWMA tiene mejor rendimiento que los otros 4 algoritmos en datasets con ruido.en_US
dc.language.isoenen_US
dc.publisherGrupo Editorial Espacios GEES, 2021, C.A.en_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/ve/en_US
dc.subjectClusteringen_US
dc.subjectData Stream Miningen_US
dc.subjectadaptive learningen_US
dc.subjectoutliersen_US
dc.subjectClusteringen_US
dc.subjectminería sobre streams de datosen_US
dc.subjectaprendizaje adaptativoen_US
dc.subjectvaloresen_US
dc.titlePerformance evaluation of different clustering algorithms for data streamsen_US
dc.title.alternativeEvaluación del rendimiento de diferentes métodos de clustering sobre streams de datosen_US
dc.typeArticleen_US


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

http://creativecommons.org/licenses/by-nc-sa/3.0/ve/
Excepto si se señala otra cosa, la licencia del ítem se describe como http://creativecommons.org/licenses/by-nc-sa/3.0/ve/