Análisis de opinión sobre tuits del COVID-19 generados por usuarios ecuatorianos

Autores/as

  • John A. Torres A. Carrera de Ingeniería en Sistemas/Computación, Universidad Nacional de Loja, Loja, Ecuador

Palabras clave:

Análisis de opinión, KDD, Minería de texto, Procesamiento del Lenguaje Natural

Resumen

Actualmente, se generan millones de datos por medio de la red social Twitter. El análisis de estos datos es fundamental e importante para examinar e investigar el conocimiento que se encuentra oculto entre estos. En este trabajo de investigación se realiza un análisis de opinión de tuits generados en Ecuador que tienen relación con el COVID-19 en el año 2020. Para ello, se utilizó la metodología Knowledge Discovery in Databases (KDD) para la gestión de los datos y para el descubrimiento de patrones ocultos en el conjunto de datos que tiene un total de 149.077 tuits. Se utilizaron varias herramientas para el Procesamiento del Lenguaje Natural, tales como: MeaningCloud, TextBlob, IBM Watson, Algoritmo Bayesiano (Creación Propia), Google Cloud Natural Language. Los clústeres generados presentaron la siguiente polaridad: 84.044 tuits positivos, 52.451 tuits negativos y 12.582 tuits neutros.

Métricas

Cargando métricas ...

Citas

Aldana, H. S. M., Rivas, J. D. C., & Hidalgo, J. M. V. (2018). Big Data, el futuro de las predicciones certeras. Revista Avenir, 2(2), 10-16.

Alonso-Arévalo, J., & Vázquez Vázquez, M. (2016). Big Data: la próxima" gran cosa" en la gestión de la información.

Álvarez Sarmiento, K. L. (2020). Investigación y análisis de herramientas para extracción de Tweets sobre COVID19 focalizadas en RStudio y Python que permitan crear una base de datos relacional (Doctoral dissertation, Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Networking y Telecomunicaciones).

Anual P. Aplicación del proceso de descubrimiento del conocimiento para la detección de diabetes (2020) In: 10° Congr Int Comput México - Colomb.;10(ISSN 2462-9588):234.

Arroyo Laimito, K. F. (2020). Desarrollo de un sistema de análisis de datos mediante la metodología Knowledge Discover Database para el procesamiento de información en la determinación de estrategias de salud pública nutricional. Univ Nac del Cent del Perú;(064). http://repositorio.uncp.edu.pe/handle/UNCP/5781

Del Alcazar Ponce JP. (2019)Consultoría de marketing, clientes, innovación y planificación. Published 2019. Accessed July 2, https://www.formaciongerencial.com/

Cortez Reyes, R. A. (2018). Extracción de conocimiento a partir de textos obtenidos de Twitter.(65):30-41.

Cumbicus-Pineda O.M., Ordoñez-Ordoñez P.F., Neyra-Romero L.A., Figueroa-Diaz R. (2019) Automatic Categorization of Tweets on the Political Electoral Theme Using Supervised Classification Algorithms. In: Botto-Tobar M., Pizarro G., Zúñiga-Prieto M., D’Armas M., Zúñiga Sánchez M. (eds) Technology Trends. CITT 2018. Communications in Computer and Information Science, vol 895. Springer, Cham. https://doi.org/10.1007/978-3-030-05532-5_51.

Eichstaedt, J. C., Schwartz, H. A., Kern, M. L., Park, G., Labarthe, D. R., Merchant, R. M., ... & Seligman, M. E. (2015). Psychological language on Twitter predicts county-level heart disease mortality. Psychological science, 26(2), 159-169.

Jiménez-Zafra SM. (2017) Detección de la negación en textos en español y aplicación al Análisis de Sentimientos. CEUR Workshop Proc.;vol 1961.

Lakshmi, P. V., Shwetha, G., & Raja, N. S. M. (2017, March). Preliminary big data analytics of hepatitis disease by random forest and SVM using r-tool. In 2017 Third International Conference on Biosignals, Images and Instrumentation (ICBSII) (pp. 1-5). IEEE.

López Pedraza FJ, González Macías M del C, Sandoval García Edgar R. (2019). Minería de Datos: Identificando causas de deserción en las Instituciones Públicas de Educación Superior de México. TiES, Rev Tecnol e Innovación en Educ Super.;1(2):1-12. http://www.ties.unam.mx/

Martín Morales, S. (2016). Análisis de información proveniente de redes sociales como Twitter (Bachelor's thesis).

Aldana, H. S. M., Rivas, J. D. C., & Hidalgo, J. M. V. (2018). Big Data, el futuro de las predicciones certeras. Revista Avenir, 2(2), 10-16.

Olarte, E., Panizzi, M. D., & Bertone, R. A. (2018). Segmentación de mercado usando técnicas de minería de datos en redes sociales. In XXIV Congreso Argentino de Ciencias de la Computación (La Plata, 2018)..

Méndez, N. P., & Rubier, J. P. (2018). Ciencia de datos: una revisión del estado del arte. UCE Ciencia. Revista de postgrado, 6(3).

Romero-Vega R.R., Cumbicus-Pineda O.M., López-Lapo R.A., Neyra-Romero L.A. (2021) Detecting Xenophobic Hate Speech in Spanish Tweets Against Venezuelan Immigrants in Ecuador Using Natural Language Processing. In: Botto-Tobar M., Montes León S., Camacho O., Chávez D., Torres-Carrión P., Zambrano Vizuete M. (eds) Applied Technologies. ICAT 2020. Communications in Computer and Information Science, vol 1388. Springer, Cham. https://doi.org/10.1007/978-3-030-71503-8$_$24

Sharmin, S., & Zaman, Z. (2017, December). Spam detection in social media employing machine learning tool for text mining. In 2017 13th International Conference on Signal-Image Technology & Internet-Based Systems (SITIS) (pp. 137-142). IEEE.

Symeonidis S, Effrosynidis D, Arampatzis A. A comparative evaluation of pre-processing techniques and their interactions for twitter sentiment analysis. Expert Syst Appl. 2018;110:298-310. doi:10.1016/j.eswa.2018.06.022

Viegas F, Rocha L, Resende E, et al. Exploiting efficient and effective lazy Semi-Bayesian strategies for text classification. Neurocomputing. 2018;307:153-171. doi:10.1016/j.neucom.2018.04.033

Descargas

Publicado

2021-07-15

Cómo citar

Torres A., J. A. (2021). Análisis de opinión sobre tuits del COVID-19 generados por usuarios ecuatorianos. CEDAMAZ, 11(1), 70–77. Recuperado a partir de https://revistas.unl.edu.ec/index.php/cedamaz/article/view/1039

Número

Sección

Ciencias exactas e ingenierías