Resumen: Las redes sociales han evolucionado la forma de comunicarnos, se han convertido en una nueva fuente de información y de expresión. Se trata de una comunicación espontanea, libre, inmediata, diversa y universal, que permite a las personas, participar activamente en los temas de su interés. El contenido que se genera en la interacción con las redes sociales es vasto y se ha convertido en una valiosa fuente de información, que requiere ser analizada y explorada mediante la aplicación de técnicas para la clasificación o etiquetado de sentimientos, con el propósito de encontrar patrones o tendencias en el comportamiento de las personas, que apoyen a las organizaciones en el fortalecimiento de sus tareas relacionadas con marketing digital. Este artículo hace un recorrido teórico por diversas técnicas utilizadas para la clasificación de sentimientos en medios sociales. Se propone el clasificador lineal de aprendizaje supervisado SVM (Support Vector Machines) para la clasificación o etiquetado de sentimientos en redes sociales.
Palabras-clave: Redes sociales; minería de opinión; técnicas para la clasificación de sentimientos; Máquinas de Soporte Vectorial; Marketing digital y redes sociales.
Abstract: Social networks have evolved the way we communicate; they have become a new source of information and expression. It is a spontaneous, free, immediate, diverse and universal communication, which allows people to actively participate in topics of their interest. The content generated in the interaction with social networks is vast and has become a valuable source of information, which needs to be analyzed and explored by applying techniques for the classification or labeling of sentiments, in order to find patterns or trends in people's behavior, which support organizations in strengthening their tasks related to digital marketing. This article takes a theoretical tour of various techniques used to classify feelings on social media. The SVM (Support Vector Machines) supervised learning linear classifier is proposed for the classification or labeling of sentiments in social networks.
Keywords: Social Networking; Opinion Mining; Techniques for the Classification of Sentiments; Support Vector Machines; Digital Marketing and Social Networks.
1. Introducción
Durante la última década, las redes sociales más populares como Twitter y Facebook han experimentado un crecimiento exponencial, al captar a cientos de millones de usuarios, proporcionando nuevos caminos para que las personas puedan colaborar, interactuar, comunicarse, co-crear, compartir ideas y conocimientos (Hartshorne, 2009), a través de, mensajes de texto, de voz, imágenes, fotografías, sonidos, vídeos, participación en encuestas, entre otros, lo que las ha convertido en las verdaderas protagonistas de Internet.
El alto grado de penetración de las redes sociales en la vida de las personas se ve reflejado en las cifras entregadas por (Simon, 2018), en su Global Digital Report, para los portales We Are Social y Hootsuite , donde, de los 7.593 millones de habitantes de nuestro planeta, un 53 por ciento (4.021 millones) son usuarios activos de Internet, un 42 por ciento (3.196 millones) son usuarios activos de medios sociales, un 68 por ciento (5.135 millones) son usuarios de móviles y un 39 por ciento (2.958 millones) utiliza medios sociales desde su teléfono móvil. Para el caso de Colombia, en este mismo reporte encontramos que del total de habitantes, el 63 por ciento son usuarios activos de internet y de los medios sociales.
El potencial de las redes sociales, evidenciado con estas cifras, es un escenario ideal para que las organizaciones, puedan llegar fácilmente a sus clientes o seguidores, y así establecer estrategias que les permitan posicionar sus pro- ductos o propuestas. Los seres humanos utilizamos diversas palabras o expresiones para manifestar nuestro grado de aceptación (positivo - negativo - neutro) hacia un tema de interés, ya sea, un producto, una persona, o un comentario, entre otras. Gran parte de las técnicas de análisis de sentimiento (minería de opinión) están enfocadas precisamente en el análisis de dichas palabras y expresiones, las cuales están sujetas a la diversidad cultural y en gran medida al grado de educación de las personas.
Un campo en el que la minería de opinión está siendo utilizada para el análisis de tendencias, es en el marketing digital en redes sociales, donde se busca medir el impacto que genera una campaña publicitaria en las personas.
2. Antecedentes
Las redes sociales rompen los límites entre el mundo real y el mundo virtual. Ahora se pueden integrar teorías sociales con métodos computacionales para estudiar cómo interactúan los individuos (átomos sociales) y cómo se forman las comunidades (moléculas sociales). La singularidad de los datos de las redes sociales requiere nuevas técnicas de minería de datos que puedan manejar eficazmente el contenido generado por el usuario con ricas relaciones sociales. El estudio y el desarrollo de estas nuevas técnicas están bajo el control de la minería de redes sociales, una disciplina emergente bajo el paraguas de la minería de datos.
La minería de medios sociales es el proceso de representar, analizar y extraer patrones significativos de los datos en las redes sociales, como resultado de las interacciones sociales. Es un campo interdisciplinario que abarca técnicas de ciencias de la computación, minería de datos, aprendizaje automático, análisis de redes sociales, ciencias de redes, sociología, etnografía, estadísticas, optimización y matemáticas. La minería de medios sociales se enfrenta a grandes desafíos, como la paradoja del big data, la obtención de muestras suficientes, la falacia de eliminación de ruido y el dilema de la evaluación (Zafarini, Ali Abbasi, & Huan, 2014).
La aparición de las redes sociales y la enorme cantidad de datos generados por ellas ha llevado a los investigadores a estudiar la posibilidad de su explotación para identificar el conocimiento oculto. Por lo tanto, dos áreas están atrayendo cada vez más interés en la comunidad investigadora, la minería de opiniones y el análisis de sentimientos (Guellil & Boukhalfa, 2015) - Ver Tabla 1.
Nota. Trabajo de investigación realizado por (Guellil & Boukhalfa, 2015) y traducido al español por Fredy Yarney Romero Moreno (autor de este trabajo de investigación), sobre el estudio y clasificación de 60 investigaciones relacionadas con minería de medios sociales o big data social.
Como se puede evidenciar en la Tabla 1, son tres los grandes enfoques en los procesos de minería de medios sociales: minería de datos del usuario, minería de relaciones del usuario y minería al contenido generado por el usuario, siendo ésta última la que agrupa el mayor número de investigaciones. Este trabajo de investigación se centra en la minería de opinión y análisis de sentimiento al contenido generado por el usuario, claro está que sin abandonar las demás categorías.
La minería de redes sociales representa el mundo virtual de las redes sociales de una manera computable, lo mide y diseña modelos que pueden ayudarnos a comprender sus interacciones. Además, la minería en las redes sociales proporciona herramientas necesarias para explotar este mundo en busca de patrones interesantes, analizar la difusión de la información, estudiar la influencia y la homofilia, proporcionar recomendaciones efectivas y analizar el comportamiento social novedoso en las redes sociales (Zafarini, Ali Abbasi, & Huan, 2014).
1.Minería de los datos de usuario. Se han identificado 4 problemas de investigación para extraer los datos de usuario:
* Detección de comunidades: detectar y extraer grupos implícitos.
* Clasificación de usuarios: clasificar en la misma red los usuarios con los mismos atributos, preferencias y comportamientos.
* Detección de Spam: detectar solicitudes de amistades o mensajes no deseados de los usuarios de redes sociales.
* Privacidad y seguridad: Proteger de intrusiones no autorizadas.
2. Minería de las relaciones entre los usuarios. Se identifican tres temas de investigación:
* Predicción del vínculo: intenta predecir pares de usuarios qué pueden ser conectados.
* Predicción de las relaciones: busca encontrar las relaciones entre los usuarios (relación familiar, relación con los compañeros, compañeros u otros).
* Predicción de la fuerza de las relaciones: busca encontrar la intensidad de la relación y el vínculo entre los usuarios. Para (Granovetter, 1983) la fuerza de un vínculo es una (probablemente lineal) combinación del tiempo, la intensidad emocional, intimidad (confianza mutua) y los servicios recíprocos que caracterizan a dicho vínculo.
3. Minería del contenido generado por los usuarios: Se identifican cinco temas de investigación para extraer el contenido generado por los usuarios:
* Análisis de la influencia: tiene como objetivo identificar los nodos que pueden influir en el comportamiento de sus vecinos. (Rabade et al., 2014).
* Difusión de información: Está interesada en la forma en que la información se difundirá en Los medios sociales y los modelos de propagación utilizados para describir la difusión.
* Recomendación: tiene como objetivo analizar los datos sociales con el fin de recomendar nuevos amigos o grupos a los usuarios. (Barbier and Liu, 2011).
* Selección de características y opinión: tiene por objeto seleccionar las características, es decir, los datos. (Tang and Liu, 2012).
* Minería de opinión y análisis de sentimientos: se enfocan en el estudio de tres temas de investigación, que son el centro de interés en la comunidad científica, a saber:
- Minería de opinión.
- Minería de emoción.
- Análisis de sentimiento.
A continuación, se describe brevemente cada una de estas tres subdivisiones.
Minería de opinión: Para (Liu, 2012), la opinión sería el centro de todas las actividades humanas, es un aspecto importante que influye en el comportamiento humano. La minería de opinión, representa un estudio computacional de las opiniones, actitudes y evaluaciones con respecto a una entidad y sus aspectos. La entidad se refiere a un producto, servicio, organización o a una persona determinada y los aspectos a los atributos de la entidad. De igual manera, para (Rafea and Mostafa, 2013) y (Shahheidari et al., 2013), la minería de opinión es un área de investigación dedicada a la extracción de los sujetos dominantes o el análisis de subjetividad de un texto dado. Con las anteriores definiciones y con los aportes de (Guellil and Boukhalfa, 2015), se pueden identificar tres tareas principales que caracterizan la minería de opinión:
* Modelado de la opinión, fase donde se formaliza esta opinión.
* Extracción de opiniones que pueden afectar a un sujeto general o a varios sujetos o una expresión que incluya una opinión o el titular de la opinión (el individuo que expresóla opinión).
* Análisis de la subjetividad de un texto. Se considera objetivo si contiene los hechos y subjetivo si representa una opinión.
Minería de emoción: en" Sentiment Analysis and Opinion Mining", (Liu, 2012), define la emoción como nuestros sentimientos y pensamientos subjetivos. Las emociones se han estudiado en múltiples campos, por ejemplo, psicología, filosofía y sociología. Los estudios son muy amplios, a partir de respuestas emocionales de reacciones fisiológicas (por ejemplo, cambios en la frecuencia cardíaca, presión sanguínea, sudoración, etc.), expresiones faciales, gestos y posturas a diferentes tipos de experiencias subjetivas del estado de ánimo de un individuo. Los científicos han clasificado las emociones de la gente en algunas categorías. Sin embargo, todavía no hay un conjunto de emociones básicas acordadas entre los investigadores. La gente tiene seis emociones primarias, es decir, el amor, la alegría, la sorpresa, la ira, la tristeza y el miedo, que pueden subdividirse en muchas emociones secundarias y terciarias. Cada emoción también puede tener diferentes intensidades.
Para (Yassine and Hajj, 2010), la minería emocional puede dividirse en tres categorías dependiendo de la meta deseada. La primera categoría tiene como objetivo extraer la valencia (orientación semántica) del texto indicando si tiene emociones positivas o negativas. La segunda categoría identifica el texto que contiene emociones y uno que no contiene. La tercera categoría identifica las emociones y las fortalezas de las emociones.
Análisis de Sentimiento: Para la firma (Brandwatch,2015), el análisis de sentimiento es el proceso de determinar el tono emocional que hay detrás de una serie de palabras, y se utiliza para intentar entender las actitudes, opiniones y emociones expresadas en una mención online. El análisis de sentimiento es extremadamente útil en la monitorización de las redes sociales ya que permite hacernos una idea de la opinión pública sobre ciertos temas. Herramientas de monitorización de las redes sociales como Brandwatch Analytics hacen que este proceso sea mucho más rápido y fácil que nunca gracias a la capacidad de monitorizar en tiempo real. Los beneficios del análisis de sentimiento son numerosos e importantes. La habilidad de extraer información de datos de las redes sociales es una práctica que ya están adoptando organizaciones a nivel mundial.
El objetivo primordial del análisis de sentimiento es extraer aquellos términos semánticos que expresen un sentimiento en particular para conocer la opinión, las actitudes y las expectativas sobre un tema en concreto así como para analizar el comportamiento de los usuarios ante algún mensaje y, por tanto, determinar su impacto o poder anticipar su reacción. Los sentimientos se clasifican en positivos, negativos o neutros. Sin embargo, el lenguaje natural es complejo y ambiguo por lo que enseñar a una máquina a que analice los diferentes matices gramaticales, variaciones culturales, jergas, expresiones coloquiales o a distinguir faltas de ortografía, la sinonimia o la polisemia dentro de un contexto que determina el tono de la conversación es francamente difícil. As'i, por ejemplo, ante un comentario sarcástico, la máquina tomaría la frase como algo positivo en vez de algo negativo o expresiones como "LOL, OMG, estuvo geeeeeee- niaaaaaaaal" son dificilísimas de procesar. Otro ejemplo de palabras para el análisis de sentimiento(Medhat
et al., 2014) en su artículo" Algoritmos y aplicaciones de análisis de sentimientos", exponen que el análisis de sentimiento y la minería de opinión, en realidad, expresan un significado mutuo, son intercambiables, complementarias y representan el estudio computacional de las opiniones, actitudes y emociones de las personas hacia una entidad. La entidad puede representar individuos, eventos o temas. La minería de extrae y analiza la opinión de la gente sobre una entidad mientras que análisis de sentimiento identifica el sentimiento expresado en un texto y luego lo analiza. Por lo tanto, el objetivo de análisis del sentimiento es encontrar opiniones, identificar los sentimientos que expresan, y luego clasificar su polaridad. El análisis de sentimiento se considera como un proceso de clasificación, como se muestra en la figura 1.
3.Técnicas para la clasificación de sentimientos en redes sociales
Para (Cambria et al., 2013) los enfoques existentes en análisis de sentimiento se pueden agrupar en cuatro categorías principales:
Localización de palabras clave: Clasifica el texto en categorías de afecto basado en la presencia de palabras de afecto no ambiguas como feliz, triste, asustado, y aburrido.
Afinidad léxica: no solo detecta palabras de afecto obvias, también asigna a palabras arbitrarias una probable "afinidad" a emociones particulares.
Métodos estadísticos: ventaja de elementos de aprendizaje de máquina tales como análisis de semántica latente, máquinas de vectores de soporte, "bolsa de palabras" y Orientación Semántica - Información Mutua Puntual. Métodos más sofisticados tratan de detectar el poseedor de un sentimiento (o sea la persona que mantiene ese estado afectivo) y el objetivo (o sea la entidad sobre la cual se siente el afecto).Para minar la opinión en contexto y obtener la característica sobre la cual se opinó, son usadas las relaciones gramaticales de las palabras. Las relaciones de dependencia gramatical son obtenidas mediante un análisis gramatical profundo del texto.
Técnicas a nivel de concepto: a diferencia de las técnicas puramente sintácticas, los enfoques a nivel de concepto sacan ventaja de elementos de representación del conocimiento tales como ontologías y redes semánticas y, por lo tanto, son también capaces de detectar semánticas que son expresadas de manera sutil, por ejemplo, mediante el análisis de conceptos que no transmiten explícitamente información relevante, pero que están implícitamente ligados a otros conceptos que sí.
Siguiendo a (Medhat et al., 2014) y retomando la figura 1, es importante tener en cuenta los conjuntos de datos utilizados para el análisis de sentimiento, porque de la calidad, veracidad y confiabilidad de su análisis dependen muchas decisiones de las organizaciones. Las fuentes de las revisiones son diversas, no sólo se aplican en las revisiones de productos, sino que también puede aplicarse en los mercados de valores, artículos de noticias, o debates políticos. En los debates políticos, por ejemplo, se puede averiguar las opiniones de la gente sobre ciertos candidatos electorales o partidos políticos. Los sitios de redes sociales y sitios de microblogging se consideran una muy buena fuente de información porque la gente comparte y discute libremente sus opiniones sobre un determinado tema. También se utilizan como fuentes de datos en el proceso de análisis de sentimiento. Hay muchas aplicaciones y mejoras en los algoritmos de Análisis de Sentimiento que se han propuesto en los últimos años. (Medhat et al., 2014), en su artículo" Sentiment analysis algorithms and applications: A survey", dan una mirada más cercana a estas mejoras, las resumen y categorizan de acuerdo con el estudio y análisis de varios artículos, proponiendo para ello un marco de técnicas de clasificación de sentimientos, que se muestra en la figura 2.
Como lo muestra la figura 2, las técnicas de clasificación de sentimientos se dividen en dos grandes grupos, a saber:
(1) Enfoque de aprendizaje automático y (2) Enfoque basado en el léxico. Para éste último, se tienen los enfoques basados en diccionarios y los enfoques basados en textos. En cuanto a los enfoques basados en textos o grupos de textos, se tienen las técnicas de clasificación a nivel estadístico y a nivel semántico.
Claramente se observa que el enfoque de aprendizaje automático tiene una gran variedad de modelos y/o algoritmos para el análisis de sentimiento. Éste enfoque se subdivide en aprendizaje supervisado y aprendizaje no supervisado. En cuanto al aprendizaje supervisado, se tienen 4 importantes Clasificadores para el Análisis de Sentimiento, a saber:
* Árboles de decisión.
* Lineales:
* Basados en reglas.
* Probabilísticos
3.1. Enfoque de aprendizaje automático
El método de aprendizaje de la máquina se basa en los famosos algoritmos ML para resolver el Análisis de Sentimiento como un problema de clasificación de texto regular que hace uso de características sintácticas y / o lingüísticas. Tenemos un conjunto de registros de entrenamiento donde cada registro se etiqueta a una clase.
El modelo de clasificación está relacionado con las características del registro subyacente con una de las etiquetas de la clase. Para una instancia dada de clase desconocida, el modelo se utiliza para predecir una etiqueta de clase. El problema de clasificación es difícil cuando solo se asigna una etiqueta a una instancia y es suave cuando se asigna un valor probabilístico de etiquetas a una instancia.
Clasificadores de árboles de decisión: el clasificador de árbol de decisión proporciona una descomposición jerárquica del espacio de datos de entrenamiento en el que se utiliza una condición en el valor del atributo para dividir los datos. La condición o predicado es la presencia o ausencia de una o más palabras. La división del espacio de datos se realiza de forma recursiva hasta que los nodos hoja contienen cierto número mínimo de registros que se utilizan con el propósito de clasificación. (Hu and Li, 2011) desarrollaron el llamado Modelo de Descripción de Términos Tópicos para la clasificación de sentimientos. En su definición," términos tópicos" son aquellas entidades especificadas o ciertos aspectos de entidades en un dominio particular. Ellos introdujeron una extracción automática de términos tópicos del texto basado en su dominio term-hood. Luego, utilizaron estos términos extraídos para diferenciar los temas de los documentos. Esta estructura transmite información de sentimiento. Su acercamiento es diferente de los algoritmos regulares del árbol de aprendizaje de la máquina, pero es capaz de aprender el conocimiento contextual positivo y negativo con eficacia.
Clasificadores lineales: en el campo del aprendizaje automático, el objetivo del aprendizaje supervisado es usar las características de un objeto para identificar a qué clase (o grupo) pertenece. Un clasificador lineal logra esto tomando una decisión de clasificación basada en el valor de una combinación lineal de sus características.
Las características de un objeto son típicamente presentadas en un vector llamado vector de características.
Los clasificadores lineales se suelen usar en situaciones donde la velocidad de la clasificación es importante, ya que a menudo es el clasificador más rápido, especialmente cuando el vector es disperso. Además, los clasificadores lineales con frecuencia funcionan muy bien cuando el número de dimensiones del vector es grande, como en clasificación de documentos, donde típicamente cada elemento en el vector es el número de apariciones de una palabra en un documento. Los clasificadores lineales más utilizados son:
Clasificador de Máquinas de Vectores Soporte: Según (Suárez, 2014), las máquinas de vectores soporte (SVM, del inglés Support Vector Machines) tienen su origen en los trabajos sobre la teoría del aprendizaje estadístico y fueron introducidas en los años 90 por Vapnik y sus colaboradores [Boser et al., 1992, Cortes - Vapnik, 1995]. Aunque originariamente las SVMs fueron pensadas para resolver problemas de clasificación binaria, actualmente se utilizan para resolver otros tipos de problemas (regresión, agrupamiento, Multi- clasificación). También son diversos los campos en los que han sido utilizadas con éxito, tales como visión artificial, reconocimiento de caracteres, categorización de texto e hipertexto, clasificación de proteínas, procesamiento de lenguaje natural, análisis de series temporales. De hecho, desde su introducción, han ido ganando un merecido reconocimiento gracias a sus sólidos fundamentos teóricos. Las SVMs inducen separadores lineales o hiper planos, ya sea en el espacio original de los ejemplos de entrada, si éstos son separables o casi-separables (ruido), o en un espacio transformado (espacio de características), si los ejemplos no son separables linealmente en el espacio original. Como se verá más adelante, la búsqueda del hiper plano de separación en estos espacios transformados, normalmente de muy alta dimensión, se hará de forma implícita utilizando las denominadas funciones kernel.
Clasificador de Redes Neuronales: el análisis sentimental de textos con Redes Neuronales se trata de una aplicación de inteligencia que utiliza un software de textos en lenguaje natural para rastrear lo que se conversa sobre determinada marca, industria, persona u otros en las redes sociales, sitios web y otras plataformas electrónicas. Recaudar esta información se combina con un análisis posterior que valora dichas conversaciones, para luego emitir un informe (Toro Tamara, 2011). Algunos análisis de sentimiento no sólo hacen valoraciones de conversaciones sobre cuántas y cuáles son las menciones positivas, negativas o neutras que tiene el objeto de estudio sino también consideran qué persona hace el comentario, pues no es lo mismo un posteo de un usuario común al de un experto en el tema y opinión. Además el proceso también puede contemplar reportes en tiempo real, lo que implica generar en algunos casos oportunidades de negocios para las empresas. Sin embargo, la gran cantidad de fuentes y el elevado volumen de textos con opiniones hacen que resulte complicado para el usuario seleccionar información de su interés. Por ello, es necesario desarrollar sistemas de clasificación de opiniones a nivel de aspecto, que ayuden a los usuarios a tomar decisiones y que, por otro lado, muestren a las empresas la opinión que los consumidores tienen acerca de sus productos, para ayudarles a decidir qué deben mantener, qué deben eliminar o qué deben mejorar.
Para este tipo de análisis se utilizan las Redes Neuronales Artificiales, ya que las capacidades de entrenarse y aprender la hacen una de las herramientas más óptimas pues al proporcionarle como datos de entrada varias y distintas opiniones (positivas, negativas, neutras) extraídas de Internet en forma de texto, la red pasará por una etapa de aprendizaje y tras un número elevado de opiniones distintas y de los tres tipos que se le proporcionen, modificará sus valores o pesos en sus conexiones por medio de un algoritmo, así este entrenamiento continuara' hasta que la red sea capaz de que al pasarle cualquier opinión, esta la clasifique como positiva, negativa o neutra según lo que por sí sola haya aprendido de los datos que al principio le proporcionamos. Después de obtener esta información se pueden elaborar informes y estadísticas que sirvan de conocimiento para las Empresas y aplicarlo en distintos beneficios como los ya mencionados.
Clasificadores basados en reglas: en los clasificadores basados en reglas, el espacio de datos es modelado con un conjunto de reglas. El lado izquierdo representa una condición en el conjunto de características expresado en forma normal disyuntiva mientras que el lado derecho es la etiqueta de clase. Las condiciones están en el término presencia. La ausencia de término se utiliza rara- mente porque no es informativo en datos escasos. Hay un número de criterios para generar reglas, la fase de entrenamiento construye todas las reglas dependiendo de estos criterios. Según (Liu et al., 1998), los dos criterios más comunes son el apoyo y la confianza. El soporte es el número absoluto de instancias en el conjunto de datos de entrenamiento que son relevantes para la regla. La Confianza se refiere a la probabilidad condicional de que el lado derecho de la regla se cumple si el lado izquierdo está satisfecho. (Medhat et al., 2008) propone algunos algoritmos de regla combinada como:
* Algoritmo Apriori.
* Reglas de la Asociación Minera con múltiples soportes mínimos usando restricciones máximas.
* Reglas de asociación simple.
Clasificadores Probabilísticos: los clasificadores probabilísticos utilizan modelos de mezcla para la clasificación. El modelo de mezcla asume que cada clase es un componente de la mezcla. Cada componente de la mezcla es un modelo generativo que proporciona la probabilidad de muestrear un término particular para ese componente. Este tipo de clasificadores también se llaman clasificadores generativos. Según (Medhat et al., 2014), los clasificadores probabilísticos más usados son: Naive Bayes, Redes Bayesianas y Entropía Máxima.
Clasificador Naive Bayes (NB): El clasificador Naive Bayes es el clasificador más simple y más comúnmente utilizado. Calcula la probabilidad posterior de una clase, sobre la base de la distribución de las palabras en el documento. El modelo funciona con la extracción de funciones BOW (Bolsa de palabras del inglés Bag Of Words) qué ignora la posición de la palabra en el documento. Utiliza el teorema de Bayes para predecir la probabilidad de que un determinado conjunto de características pertenezca a una etiqueta en particular.
En términos simples, un clasificador de Bayes ingenuo asume que la presencia o ausencia de una característica particular no esta' relacionada con la presencia o ausencia de cualquier otra característica, dada la clase variable. Por ejemplo, una fruta puede ser considerada como una manzana si es roja, redonda y de alrededor de 7 cm de diámetro. Un clasificador de Bayes ingenuo considera que cada una de estas características contribuye de manera independiente a la probabilidad de que esta fruta sea una manzana, independientemente de la presencia o ausencia de las otras características.
Para otros modelos de probabilidad, los clasificadores de Bayes ingenuo se pueden entrenar de manera muy eficiente en un entorno de aprendizaje supervisado. En muchas aplicaciones prácticas, la estimación de parámetros para los modelos Bayes ingenuo utiliza el método de máxima verosimilitud, en otras palabras, se puede trabajar con el modelo ingenuo de Bayes sin aceptar probabilidad bayesiana o cualquiera de los métodos bayesianos.
Una ventaja del clasificador de Bayes ingenuo es que solo se requiere una pequeña cantidad de datos de entrenamiento para estimar los parámetros (las medias y las varianzas de las variables) necesarias para la clasificación. Como las variables independientes se asumen, solo es necesario determinar las varianzas de las variables de cada clase y no toda la matriz de covarianza.
Redes Bayesianas (BN): Una red bayesiana, red de Bayes, red de creencia, modelo bayesiano (de Bayes) o modelo probabilístico en un grafo acíclico dirigido, es un modelo grafo probabilístico (un tipo de modelo estático) que representa un conjunto de variables aleatorias y sus dependencias condicionales a través de un grafo acíclico dirigido (DAG por sus siglas en inglés). Por ejemplo, una red bayesiana puede representar las relaciones probabilísticas entre enfermedades y síntomas. Dados los síntomas, la red puede ser usada para computar la probabilidad de la presencia de varias enfermedades.
Formalmente, las redes bayesianas son grafos dirigidos acíclicos cuyos nodos representan variables aleatorias en el sentido de Bayes: las mismas pueden ser cantidades observables, variables latentes, parámetros desconocidos o hipótesis. Las aristas representan dependencias condicionales; los nodos que no se encuentran conectados representan variables las cuales son condicionalmente independientes de las otras. Cada nodo tiene asociado una función de probabilidad que toma como entrada un conjunto particular de valores de las variables padres del nodo y devuelve la probabilidad de la variable representada por el nodo.
Entropía máxima (ME): El clasificador Maxent (conocido como clasificador exponencial condicional) con- vierte los conjuntos de características etiquetados en vectores usando la codificación. Este vector codificado se utiliza entonces para calcular pesos para cada característica que puede combinarse para determinar la etiqueta más probable para un conjunto de características. Este clasificador está parametrizado por un conjunto de X pesos, que se utiliza para combinar las características conjuntas que se generan a partir de un conjunto de características mediante una X codificación. En particular, los mapas de codificación C (con- junto de características, etiqueta) se unen a un vector.
Aprendizaje débil, semi y no supervisado: El propósito principal de la clasificación de texto es clasificar los documentos en un cierto número de categorías predefinidas. Para lograrlo, se utiliza un gran número de documentos de formación etiquetados para el aprendizaje supervisado, como se ha ilustrado anteriormente. En la clasificación de texto, a veces es difícil crear estos documentos de capacitación etiquetados, pero es fácil recolectar los documentos no etiquetados. Los métodos de aprendizaje sin supervisión superan estas dificultades. Muchos trabajos de investigación se han presentado en este campo, incluyendo el trabajo presentado por (Ko and Seo, 2000) donde propusieron un método que divide los documentos en oraciones y clasificaron cada oración usando listas de palabras clave de cada categoría y medida de similitud de oraciones.
Aprendizaje no supervisado es un método de Aprendizaje Automático donde un modelo es ajustado a las observaciones. Se distingue del Aprendizaje supervisado por el hecho de que no hay un conocimiento a priori. En el aprendizaje no supervisado, un conjunto de datos de objetos de entrada es tratado. Así, el aprendizaje no supervisado típicamente trata los objetos de entrada como un conjunto de variables aleatorias, siendo construido un modelo de densidad para el conjunto de datos.
El aprendizaje no supervisado puede ser usado en conjunto con la Inferencia bayesiana para producir probabilidades condicionales (es decir, aprendizaje supervisado) para cualquiera de las variables aleatorias dadas. El Santo Grial del aprendizaje no supervisado es la creación de un código factorial de los datos, esto es, un código con componentes estadísticamente independientes. El aprendizaje supervisado normalmente funciona mucho mejor cuando los datos iniciales son primero traducidos en un código factorial.
3.2. Enfoque basado en el léxico
Las palabras de opinión se emplean en muchas tareas de clasificación de sentimientos. Las palabras de opinión positiva se usan para expresar algunos estados deseados, mientras que las palabras de opinión negativas se usan para expresar algunos estados no deseados. También hay frases de opinión y expresiones idiomáticas que en conjunto se llaman léxico de opinión.
Enfoque basado en diccionario: (Hu and Liu, 2004) y (Kim and Hovy, 2004), presentaron la estrategia principal del enfoque basado en el diccionario. Un pequeño conjunto de palabras de opinión se recoge manualmente con orientaciones conocidas. Entonces, este conjunto se cultiva mediante la búsqueda en los bien conocidos diccionarios corporal WordNet o tesauro para sus sinónimos y antónimos. Las palabras recién encontradas se añaden a la lista de semillas y luego comienza la siguiente iteración. El proceso iterativo se detiene cuando no se encuentran palabras nuevas. Una vez finalizado el proceso, se puede realizar una inspección manual para eliminar o corregir errores.
Enfoque basado en Corpus: el enfoque basado en Corpus (textos) ayuda a resolver el problema de encontrar palabras de opinión con orientaciones específicas del contexto. Sus métodos dependen de patrones o patrones sintácticos que ocurren en conjunto, junto con una lista de semillas de palabras de opinión para encontrar otras palabras de opinión en un corpus grande. Uno de estos métodos fue representado por (Hatzivassiloglou and McK- eown, 1997). Comenzaron con una lista de adjetivos de opinión de semillas y los usaron junto con un conjunto de restricciones linguísticas para identificar palabras de opinión adjetivas adicionales y sus orientaciones. Las restricciones son conectivas como AND, OR, PERO, ETER-OR; La conjunción Y por ejemplo dice que los adjetivos conjuntivos suelen tener la misma orientación. Esta idea se llama consistencia de sentimiento, que no siempre es consistente prácticamente. También hay expresiones adversativas tales como, pero, sin embargo, que se indican como cambios de opinión. Con el fin de determinar si dos adjetivos unidos son de la misma orientación o diferentes, el aprendizaje se aplica a un corpus grande. Entonces, los enlaces entre los adjetivos forman un grafo y el agrupamiento se realiza en el gráfico para producir dos conjuntos de palabras: positivo y negativo.
Enfoque estadístico: encontrar patrones de co-ocurrencia o palabras de opinión semilla puede hacerse usando técnicas estadísticas. Esto podría hacerse derivando polaridades posteriores usando la co-ocurrencia de adjetivos en un corpus. Es posible utilizar todo el conjunto de documentos indexados en la web como corpus para la construcción del diccionario. Esto supera el problema de la falta de disponibilidad de algunas palabras si el corpus utilizado no es lo suficientemente grande. La polaridad de una palabra se puede identificar estudiando la frecuencia de ocurrencia de la palabra en un corpus grande de textos. Si la palabra ocurre más frecuentemente entre los textos positivos, entonces su polaridad es positiva. Si ocurre más frecuentemente entre los textos negativos, entonces su polaridad es negativa. Si tiene frecuencias iguales, entonces es una palabra neutral.
Enfoque semántico: el enfoque semántico da valores de sentimientos directa mente, se basa en diferentes principios para calcular la similitud entre las palabras. Este principio da valores de sentimiento similares a palabras semánticamente cerradas. WordNet, por ejemplo, proporciona diferentes tipos de relaciones semánticas entre las palabras utilizadas para calcular las polaridades del sentimiento. WordNet también podría utilizarse para obtener una lista de palabras de sentimiento mediante la expansión iterativa del conjunto inicial con sinónimos y antónimos y luego determinar la polaridad de sentimiento para una palabra desconocida por el recuento.
4.Clasificador lineal Support Vector Machine (máquinas de soporte vectorial)
Las máquinas de soporte vectorial o Support Vector Machines (SVM) (Cortes & Vapnik, 1995) se utilizan para resolver problemas de clasificación, regresión, agrupamiento y multiclasificación. Han sido utilizadas con éxito en diferentes campos como visión artificial, reconocimiento de caracteres, categorización de texto e hipertexto, clasificación de proteínas, procesamiento de lenguaje natural, análisis de series temporales, entre otros. Desde su introducción, han ido ganando un merecido reconocimiento gracias a sus sólidos fundamentos teóricos (Carmona Suárez, 2014).
Una SVM es un algoritmo que, a partir del producto escalar de los vectores multidimensionales de las muestras, construye un hiperplano o conjunto de hiperplanos en un espacio de dimensionalidad muy alta que separa los grupos y puede ser utilizado en problemas de clasificación o regresión. Una SVM primero mapea los puntos de entrada a un espacio de características de una dimensión mayor (i.e.: si los puntos de entrada están en R2 entonces son mapeados por la SVM a R3) y encuentra un hiperplano que los separe y maximice el margen m entre las clases en este espacio como se aprecia en la Figura 3 (Betancourt, 2005).
Como se observa en la Figura 3, el hiperplano óptimo B representado por la función de decisión , está separando las clases 1 (cuadrados) y 2 (círculos) con un margen m que corresponde al espacio existente entre los hiperplanos A y C que contienen los vectores de soporte. Los hiperplanos A y C, están representados por las funciones de decisión y, respectivamente.
Mientras la mayoría de los métodos de aprendizaje se centran en minimizar los errores cometidos por el modelo generado a partir de los ejemplos de entrenamiento (error empírico), el sesgo inductivo asociado a las SVM radica en la minimización del denominado riesgo estructural. La idea es seleccionar un hiperplano de separación que equidista de los ejemplos más cercanos de cada clase para, de esta forma, conseguir lo que se denomina un margen máximo (Tmax) a cada lado del hiperplano. Además, a la hora de definir el hiperplano, sólo se consideran los ejemplos de entrenamiento de cada clase que caen justo en la frontera de dichos márgenes. Estos ejemplos reciben el nombre de vectores soporte.
Desde un punto de vista práctico, el hiperplano separador de margen máximo ha demostrado tener una buena capacidad de generalización, evitando en gran medida el problema del sobreajuste a los ejemplos de entrenamiento. Desde un punto de vista algorítmico, el problema de optimización del margen geométrico representa un problema de optimización cuadrático con restricciones lineales que puede ser resuelto mediante técnicas estándar de programación cuadrática. La propiedad de convexidad exigida para su resolución garantiza una solución única, en contraste con la no unicidad de la solución producida por una red neuronal artificial entrenada con un mismo conjunto de ejemplos (Carmona Suárez, 2014).
5.Modelo propuesto para análisis de sentimiento en redes sociales utilizan una máquina de soporte vectorial
A continuación, se propone un modelo conceptual para el análisis de sentimientos en las campañas de marketing realizadas sobre redes sociales, utilizando como base el clasificador lineal de aprendizaje supervisado SVM (Support Vector Machines). Ver figura 4.
Paso 1: Se carga un conjunto de datos debidamente etiquetado como se muestra en la figura 5.
Paso 2: A cada una de las opiniones se les realiza un proceso de tokenización, limpieza de datos, eliminación de palabras y caracteres sin significado, y todas las demás transformaciones que se reqieran.
Paso 3: Entrenar el modelo SVM utilizando herramientas de minería como Rapid Miner. Ver figura 6.
Pasos 4, 5 y 6: Cargar el conjunto de opiniones para aplicar el modelo entrenado en el paso 3.
Paso 7: Validar la precisión del modelo.
La anterior serie de pasos permitirá a una agencia de marketing analizar los sentimientos que expresan los usuarios respecto a una campaña publicitaria.
6.Conclusiones
En este artículo se realizó un estudio (estado del arte) sobre un tema reciente en el campo de la minería de datos, centrado en el análisis de sentimiento o también conocido como minería de opinión y cuyo objetivo principal se fundamenta en analizar grandes volúmenes de datos con el fin de encontrar patrones de comportamiento para que las organizaciones puedan medir la aceptación de sus productos, propuestas, campañas de marketing, y con base en ello, tomar decisiones.
La minería de opinión o análisis de sentimiento es un tema de interés para los investigadores puesto que tiene un enorme potencial para las organizaciones. Su estudio requiere un profundo análisis de diferentes modelos o algoritmos para el análisis de información. Cada uno de éstos modelos y/o algoritmos requiere de un profundo análisis para su aplicabilidad y comprobación de los resultados que arrojan.
El análisis del sentimiento o minería de opinión es una interesante rama de la investigación que hasta ahora está dando sus primeros pasos entre el procesamiento del lenguaje natural, la lingüística computacional y la minería de textos. Este cruce de caminos, todavía en un estado inicial, es una de las tecnologías que estoy completamente seguro, que en un futuro no muy lejano van a revolucionar varios aspectos de nuestras vidas, permitirán predecir la ocurrencia de diversos hechos cotidianos, como por ejemplo, resultados electorales.
Como resultado de ésta introducción al análisis de sentimiento en redes sociales, para la clasificación o etiquetado de opiniones generadas a partir de campañas publicitarias, por su simplicidad y fácil manejo, se propone el modelo de la figura 4, basado en el clasificador lineal SVM. Para esto, es requisito indispensable la creación de un corpus de documentos (opiniones) debidamente etiquetadas como se muestra en la figura 5.
Referencias
Barbier, G. and Liu, H. (2011). Data mining in social media. In Ag- garwal, C. C., editor, Social Network Data Analytics, pages 327-352, Boston, MA. Springer US.
Black, W. (2012). A data and analysis resource for an experiment topic', proceedings of the 8th international conference on lan- guage resources and evaluation. pages 21-27.
Brandwatch (2015). Entendiendo el ana'lisis de sentimiento: que' es y para que' se usa.<https://www.brandwatch.com/es/2015/02/analisis-de- sentimiento/.
Cambria, E., Schuller, B., Xia, Y., and Havasi, C. (2013). New av- enues in opinion mining and sentiment analysis. volume 28, pages 15-21.
Granovetter, M. (1983). The strength of weak ties: A network theory revisited. volume 1, pages 201-233. [American Soci- ological Association, Wiley, Sage Publications, Inc.].
Guellil, I. and Boukhalfa, K. (2015). Social big data mining: A survey focused on opinion mining and sentiments analysis. In 2015 12th International Symposium on Programming and Systems (ISPS), pages 1-10.
Gundecha, P. and Liu, H. (2012). Mining social media: A brief introduction. In New Directions in Informatics, Optimization, Logistics, and Production, pages 1-17.
Hartshorne, R., . A. H. (2009). Examining student decisions to adopt web 2.0 technologies: Theory and empirical tests. [Ad- vance online publication]. Journal of Computing in Higher Education.
Hatzivassiloglou, V. and McKeown, K. R. (1997). Predicting the semantic orientation of adjectives. In Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics and Eighth Conference of the European Chapter of the Association for Computational Linguistics, ACL '98, pages 174-181, Stroudsburg, PA, USA. Association for Com- putational Linguistics.
Hu, M. and Liu, B. (2004). Mining and summarizing customer reviews. In Proceedings of the Tenth ACM SIGKDD Interna- tional Conference on Knowledge Discovery and Data Min- ing, KDD '04, pages 168-177, New York, NY, USA. ACM.
Hu, Y. and Li, W. (2011). Document sentiment classification by ex- ploring description model of topical terms. volume 25, pages 386 - 403. Language and speech issues in the engineering of companionable dialogue systems.
Kim, S.-M. and Hovy, E. (2004). Determining the sentiment of opinions. In Proceedings of the 20th International Confer- ence on Computational Linguistics, COLING '04, Strouds- burg, PA, USA. Association for Computational Linguistics.
Ko, Y. and Seo, J. (2000). Automatic text categorization by unsu- pervised learning. In Proceedings of the 18th Conference on Computational Linguistics - Volume 1, COLING '00, pages 453-459, Stroudsburg, PA, USA. Association for Computational Linguistics.
Liu, B. (2012). Sentiment analysis and opinion mining. volume 5, pages 1-167.
Liu, B., Hsu, W., and Ma, Y. (1998). Integrating classification and association rule mining. In Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining, KDD'98, pages 80-86. AAAI Press.
Manning, C. D., Raghavan, P., and Schu"tze, H. (2008). Introduc- tion to information retrieval. New York, NY, USA. Cam- bridge University Press.
Medhat, W., Hassan, A., and Korashy, H. (2014). Sentiment anal- ysis algorithms and applications: A survey. volume 5, pages 1093 - 1113.
Medhat, W., Hassan, A., and Korashy Mohamed, H. (2008). Com- bined algorithm for data mining using association rules. vol- ume 1.
Montecinos, L. (2014). AnA' lisis de sentimientos y predicciO' n de eventos en twitter.
Paltoglou, G. and Thelwall, M. (2012). Twitter, myspace, digg: Unsupervised sentiment analysis in social media. volume 3, pages 66:1-66:19.
Rabade, R., Mishra, N., and Sharma, S. (2014). Survey of influen- tial user identification techniques in online social networks. In Thampi, S. M., Abraham, A., Pal, S. K., and Rodriguez, J. M. C., editors, Recent Advances in Intelligent Informat- ics: Proceedings of the Second International Symposium on Intelligent Informatics (ISI'13), August 23-24 2013, Mysore, India, pages 359-370, Cham. Springer International Publish- ing.
Rafea, A. and Mostafa, N. A. (2013). Topic extraction in social media. In 2013 International Conference on Collaboration Technologies and Systems (CTS), pages 94-98.
Shahheidari, S., Dong, H., and Daud, M. N. R. B. (2013). Twitter sentiment mining: A multi domain analysis. In 2013 Seventh International Conference on Complex, Intelligent, and Soft- ware Intensive Systems, pages 144-149.
Simon, K. (2018). Digital in 2018 global overview. https://wearesocial.com/ blog/2018/01/global-digital-report- 2018.
Smith, A. (2014). Cell phones, social media and campaign 2014. Pew Research Center.
Suárez, E. J. C. (2014). Tutorial sobre máquinas de vectores so- porte (svm).
Tang, J., Chang, Y., and Liu, H. (2014). Mining social media with social theories: A survey. volume 15, pages 20-29, New York, NY, USA. ACM.
Tang, J. and Liu, H. (2012). Feature selection with linked data in social media. In Proceedings of the 2012 SIAM International Conference on Data Mining, pages 118-128.
Toro Tamara, J. S. (2011). Empresas sentimentales.
Tumasjan, A., Sprenger, T., Sandner, P., and Welpe, I. (2010). Pre- dicting elections with twitter: What 140 characters reveal about political sentiment'. pages 178-185.
Yassine, M. and Hajj, H. (2010). A framework for emotion mining from text in online social networks. In 2010 IEEE Interna- tional Conference on Data Mining Workshops, pages 1136- 1142.
Zafarani, R., Abbasi, M. A., and Liu, H. (2014). Social media mining: An introduction. Cambridge University Press.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
© 2020. This work is published under https://creativecommons.org/licenses/by-nc-nd/4.0 (the “License”). Notwithstanding the ProQuest Terms and Conditions, you may use this content in accordance with the terms of the License.
Abstract
El contenido que se genera en la interacción con las redes sociales es vasto y se ha convertido en una valiosa fuente de información, que requiere ser analizada y explorada mediante la aplicación de técnicas para la clasificación o etiquetado de sentimientos, con el propósito de encontrar patrones o tendencias en el comportamiento de las personas, que apoyen a las organizaciones en el fortalecimiento de sus tareas relacionadas con marketing digital. The content generated in the interaction with social networks is vast and has become a valuable source of information, which needs to be analyzed and explored by applying techniques for the classification or labeling of sentiments, in order to find patterns or trends in people's behavior, which support organizations in strengthening their tasks related to digital marketing. The SVM (Support Vector Machines) supervised learning linear classifier is proposed for the classification or labeling of sentiments in social networks. Keywords: Social Networking; Opinion Mining; Techniques for the Classification of Sentiments; Support Vector Machines; Digital Marketing and Social Networks. 1.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Details
1 Universidad Distrital, Bogotá Colombia
2 Universidad Manuela Beltrán, Bogotá Colombia
3 La Fundación Universitaria Internacional de La Rioja - UNIR, Bogotá Colombia
4 Universidad Manuela Beltran, Bogotá Colombia





