Análisis de opinión sobre tuits del COVID-19 generados por usuarios ecuatorianos
Palabras clave:
Análisis de opinión, KDD, Minería de texto, Procesamiento del Lenguaje NaturalResumen
Actualmente, se generan millones de datos por medio de la red social Twitter. El análisis de estos datos es fundamental e importante para examinar e investigar el conocimiento que se encuentra oculto entre estos. En este trabajo de investigación se realiza un análisis de opinión de tuits generados en Ecuador que tienen relación con el COVID-19 en el año 2020. Para ello, se utilizó la metodología Knowledge Discovery in Databases (KDD) para la gestión de los datos y para el descubrimiento de patrones ocultos en el conjunto de datos que tiene un total de 149.077 tuits. Se utilizaron varias herramientas para el Procesamiento del Lenguaje Natural, tales como: MeaningCloud, TextBlob, IBM Watson, Algoritmo Bayesiano (Creación Propia), Google Cloud Natural Language. Los clústeres generados presentaron la siguiente polaridad: 84.044 tuits positivos, 52.451 tuits negativos y 12.582 tuits neutros.Métricas
Citas
Aldana, H. S. M., Rivas, J. D. C., & Hidalgo, J. M. V. (2018). Big Data, el futuro de las predicciones certeras. Revista Avenir, 2(2), 10-16.
Alonso-Arévalo, J., & Vázquez Vázquez, M. (2016). Big Data: la próxima" gran cosa" en la gestión de la información.
Álvarez Sarmiento, K. L. (2020). Investigación y análisis de herramientas para extracción de Tweets sobre COVID19 focalizadas en RStudio y Python que permitan crear una base de datos relacional (Doctoral dissertation, Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Networking y Telecomunicaciones).
Anual P. Aplicación del proceso de descubrimiento del conocimiento para la detección de diabetes (2020) In: 10° Congr Int Comput México - Colomb.;10(ISSN 2462-9588):234.
Arroyo Laimito, K. F. (2020). Desarrollo de un sistema de análisis de datos mediante la metodología Knowledge Discover Database para el procesamiento de información en la determinación de estrategias de salud pública nutricional. Univ Nac del Cent del Perú;(064). http://repositorio.uncp.edu.pe/handle/UNCP/5781
Del Alcazar Ponce JP. (2019)Consultoría de marketing, clientes, innovación y planificación. Published 2019. Accessed July 2, https://www.formaciongerencial.com/
Cortez Reyes, R. A. (2018). Extracción de conocimiento a partir de textos obtenidos de Twitter.(65):30-41.
Cumbicus-Pineda O.M., Ordoñez-Ordoñez P.F., Neyra-Romero L.A., Figueroa-Diaz R. (2019) Automatic Categorization of Tweets on the Political Electoral Theme Using Supervised Classification Algorithms. In: Botto-Tobar M., Pizarro G., Zúñiga-Prieto M., D’Armas M., Zúñiga Sánchez M. (eds) Technology Trends. CITT 2018. Communications in Computer and Information Science, vol 895. Springer, Cham. https://doi.org/10.1007/978-3-030-05532-5_51.
Eichstaedt, J. C., Schwartz, H. A., Kern, M. L., Park, G., Labarthe, D. R., Merchant, R. M., ... & Seligman, M. E. (2015). Psychological language on Twitter predicts county-level heart disease mortality. Psychological science, 26(2), 159-169.
Jiménez-Zafra SM. (2017) Detección de la negación en textos en español y aplicación al Análisis de Sentimientos. CEUR Workshop Proc.;vol 1961.
Lakshmi, P. V., Shwetha, G., & Raja, N. S. M. (2017, March). Preliminary big data analytics of hepatitis disease by random forest and SVM using r-tool. In 2017 Third International Conference on Biosignals, Images and Instrumentation (ICBSII) (pp. 1-5). IEEE.
López Pedraza FJ, González Macías M del C, Sandoval García Edgar R. (2019). Minería de Datos: Identificando causas de deserción en las Instituciones Públicas de Educación Superior de México. TiES, Rev Tecnol e Innovación en Educ Super.;1(2):1-12. http://www.ties.unam.mx/
Martín Morales, S. (2016). Análisis de información proveniente de redes sociales como Twitter (Bachelor's thesis).
Aldana, H. S. M., Rivas, J. D. C., & Hidalgo, J. M. V. (2018). Big Data, el futuro de las predicciones certeras. Revista Avenir, 2(2), 10-16.
Olarte, E., Panizzi, M. D., & Bertone, R. A. (2018). Segmentación de mercado usando técnicas de minería de datos en redes sociales. In XXIV Congreso Argentino de Ciencias de la Computación (La Plata, 2018)..
Méndez, N. P., & Rubier, J. P. (2018). Ciencia de datos: una revisión del estado del arte. UCE Ciencia. Revista de postgrado, 6(3).
Romero-Vega R.R., Cumbicus-Pineda O.M., López-Lapo R.A., Neyra-Romero L.A. (2021) Detecting Xenophobic Hate Speech in Spanish Tweets Against Venezuelan Immigrants in Ecuador Using Natural Language Processing. In: Botto-Tobar M., Montes León S., Camacho O., Chávez D., Torres-Carrión P., Zambrano Vizuete M. (eds) Applied Technologies. ICAT 2020. Communications in Computer and Information Science, vol 1388. Springer, Cham. https://doi.org/10.1007/978-3-030-71503-8$_$24
Sharmin, S., & Zaman, Z. (2017, December). Spam detection in social media employing machine learning tool for text mining. In 2017 13th International Conference on Signal-Image Technology & Internet-Based Systems (SITIS) (pp. 137-142). IEEE.
Symeonidis S, Effrosynidis D, Arampatzis A. A comparative evaluation of pre-processing techniques and their interactions for twitter sentiment analysis. Expert Syst Appl. 2018;110:298-310. doi:10.1016/j.eswa.2018.06.022
Viegas F, Rocha L, Resende E, et al. Exploiting efficient and effective lazy Semi-Bayesian strategies for text classification. Neurocomputing. 2018;307:153-171. doi:10.1016/j.neucom.2018.04.033
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
-
Luego que el artículo científico es aceptado, para su publicación el o la autora aceptan ceder los derechos de la primera publicación a la Revista CEDAMAZ, conservando sus derechos de autor. Se permite la reproducción total o parcial de los textos que se publican siempre y cuando sea sin fines de lucro. Cuando se ejecute la reproducción total o parcial de los artículos científicos aceptados y publicados en la revista CEDAMAZ, se debe citar la fuente completa y la dirección electrónica de la publicación.
-
Los artículos científicos aceptados y publicados en la revista CEDAMAZ pueden ser depositados por los autores de manera integra en cualquier repositorio sin fines comerciales.
-
Los autores no deben distribuir los artículos científicos aceptados, pero que todavía no han sido publicados oficialmente por la revista CEDAMAZ. En el caso de incumplir esta norma implica el rechazo del articulo científico.
- La publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons