Recibido (30/10/2018)
Revisado (26/12/2018)
Aceptado (30/12/2018)
RESUMEN: El objetivo del estudio es aportar información para la toma de decisiones en el marco de políticas turísticas aplicadas a la gestion de destinos. Diversos mecanismos de segmentación de mercado son aplicados de forma frecuente en el analisis de turismo y son utilizadas diferentes metodologías estadísticas segón el fin que se persigue. En este trabajo se aplica una tecnica de clasificacion no supervisada que tiene por objetivo determinar grupos de variables. Se hace enfósis en un criterio de poda de variables que determina un grupo de ruido y en la comparacion de dos metodologías diferentes en referencia al trato de las variables cualitativas. A partir de ellas se realiza una segmentación de los cruceristas. En esta óltima etapa es novedosa la aplicación de un criterio seleccion de variables que intenta emular los grupos obtenidos con las variables originales. Son analizados los resultados obtenidos en cada paso y se realiza una comparativa con clósteres determinados en temporadas anteriores.
Palabras Clave: Clósteres de variables, k-medias, selección de variables, turismo de cruceros
ABSTRACT: Diverse market segmentation mechanisms have been frequently applied in the tourism analysis and different statistical methodologies have been used according to the objective pursued. This study applies a segmentation technique that tries to determine groups of variables, based on their quadratic correlation for quantitative variables or based on the sum of correlation ratios for qualitative variables. In each of the clusters of variables, the subgroup of determinant variables are identified using a pruning technique which cancels the effect of unnecessary variables. From these set of determinant variables we conduct a cruise segmentation analysis using k-means. The results show the formation of four clusters in which the key variables are age, residence, travel party size and the port of visit. Then, we analyze the cluster expenditure type behavior, finding that shopping is the most important spending in all the groups. The study aims to provide information for decision making within the framework of tourism policies, in reference to each of the groups obtained.
Keywords: Cruise tourism, variable clusters, k-means, variable selection
(ProQuest: ... denotes formulae omitted.)
1.IntroduccOn
La industria de cruceros a nivel mundial ha experimentado un crecimiento sostenido en los últimos 15 años, comenzando la decada del 90 con casi 4 millones de pasajeros hasta llegar a mús de 23 millones en 2014, ver [CLIA, 2018] y [Brida et al., 2014a]. En los últimos cuatro anos el sector ha experimentado un crecimiento promedio anual de casi el 9%. El sector de Crucerismo es el sector mas dinámico del turismo y de las actividades recreativas en general y se preve que este dinamismo continúe en el futuro. Segun CLIA (Cruise Lines International Association) en los ultimos años el dinamismo de la industria se debió al mayor número de cruceros y a la mayor diversidad de rutas en especial los cruceros que navegan por ríos, así como también a las nuevas generaciones que estan optando por este tipo de turismo, ver [CLIA, 2018].
En este contexto, los países de America del Sur se han beneficiado tambien de este crecimiento y Uruguay no ha sido la exception. Si bien el turismo de cruceros sigue siendo una pequeña porciún del total de turistas que ingresan al país, este no es ajeno al dinamismo mundial que caracteriza al mercado (según datos obtenidos del anuario que publica el Ministerio de Turismo de Uruguay, en 2013 el total de cruceristas alcanzoú un 13% del total de turistas que visitaron Uruguay, en 2014 el 12%, en 2015 el 9,8% y 8,4% en 2016).
En Uruguay los cruceros visitan dos puertos: la capital (Montevideo) y una ciudad costera con un gran desarrollo en la actividad de turismo de playa (Punta del Este). Montevideo se transformo hace muy poco en un puerto de embarque mientras que Punta del Este es un puerto de escala. Otra diferencia entre ambos puertos es que en Montevideo los pasajeros desembarcan directamente en el muelle, en Punta del Este el crucero ancla a cierta distancia y los pasajeros son trasladados en bote hasta el muelle [Brida et al., 2015a].
En la temporada 2013-2014 se registro un incremento de 6,3% en la llegada de cruceros con respecto a la temporada anterior, crecimiento que se explica en mayor medida por la afluencia de cruceros a Punta del Este la cual llego a cifras record, ver [Ministerio de Turismo, 2015]. El gasto tambien tuvo cifras record en esa misma temporada llegando a 19 millones de dolares corrientes. En cuanto a la cantidad de personas que llegaron en la modalidad de crucero se registra un pico de cruceristas arribados en la temporada de 2012-2013 (411.937 cruceristas). Cabe notar que estas cifras disminuyeron de forma leve en las siguientes temporadas.
Por lo anteriormente planteado, resulta importante estudiar en detalle las caracterúísticas de la demanda de cruceristas que llega al país para que el mismo pueda aprovechar al maximo los beneficios asociados a esta actividad. En este sentido, el objetivo de este trabajo es encontrar y analizar grupos homogeneos de pasajeros que desembarcaron en los puertos uruguayos. Esto permite identificar segmentos de mercado que luego podrúan ser analizados en detalle y de acuerdo con sus características, apoyar la toma de decisiones empresariales y políticas orientadas a mejorar la relaciúon entre el destino y el turista, encontrar mercados objetivos y ofrecer la mayor cantidad de actividades que le sean atractivas a los cruceristas que llegan al país. Por otro lado tambien es de interes poder analizar la evoluciún temporal de este tipo de turismo en el país.
Las túecnicas de segmentaciúon de mercado se han utilizado de forma extensiva en la investigación academica, ver [Liao et al., 2012], [Romero and Ventura, 2013] y [Ngai et al., 2009]. Estas túecnicas son uútiles para conocer las preferencias de los consumidores y poder ajustar los productos y servicios ofrecidos por un destino para satisfacer las necesidades de los turistas [Pesonen, 2012] y ver por ejemplo los distintos flujos economicos que ellos determinan, ver [Brida et al., 2018]. Para lograr el objetivo planteado se realizan tres etapas de anúalisis en las cuales se adoptan túecnicas de agrupamiento tanto para variables como para unidades. El primer paso consiste en la reduction del conjunto original de variables. Esta reducciúon del nuúmero de variables tiene el propoúsito de encontrar variables dependientes que podrúían estar brindando informacioún similar y al mismo tiempo encontrar e interpretar dimensiones comunes a dichas variables.
A diferencia de trabajos recientes sobre segmentación en [Brida et al., 2014a], ademas de utilizar un algoritmo de k-medias en lugar de un algoritmo jerárquico, se considera un grupo de variables de ruido que no presentan una correlation muy baja con cada cluster de variable. En particular son utilizados dos enfoques distintos para el tratamiento de las variables cualitativas y los resultados obtenidos son comparados.
Despues de encontrar los grupos de variables el siguiente paso es segmentar los datos a traves del algoritmo de agrupamiento de Ward para determinar grupos de personas. Lo innovation en este caso respecto a [Brida et al., 2014a] es la asignacion de cierto nivel de importancia a cada variable en el momento de determinancion de los cluster de individuos. En este sentido seguimos una metodología novedosa pero de escaso uso en las aplicaciones (desarrollada en [Fraiman et al., 2008]).
Por ultimo, mediante el analisis CART se pretende encontrar las variables que impulsaron la formation de los conglomerados.
El trabajo se organiza de la siguiente manera. A continuation se realiza un analisis de la literatura, luego se describe la base de datos que se utilizará en este trabajo. Se realiza un breve introduction a metodología utilizada, se describen las etapas que se siguieron y posteriormente se enumeran los principales hallazgos. Por ultimo se mencionan algunas implicancias en política y marketing que se derivan de los resultados y se mencionan aquellas diferencias significativas respecto a los cluusteres encontrados en la temporada anterior.
2.Revisión de la literatura
Se han implementado varios algoritmos aplicados a la técnica de clásteres, por ejemplo el de kmedias, de particionamiento, distancias pequeñas entre los miembros del mismo, areas densas del espacio de datos, intervalos o distribuciones estadísticas particulares, etc., que permiten categorizar los clásteres en Cluster Particionado y Cluster Jerárquico. El algoritmo apropiado depende del conjunto de datos (cualitativo y/o cuantitativo) que se analiza y el uso que se le dara a los resultados, ver [Joshi and Kaur, 2013] y [Sanchez-Hernundez et al., 2013].
En lo que se refiere al turismo, esta tecnica tambien se ha utilizado ampliamente con el objetivo de conocer las características de los turistas que llegan de visita. Es el caso del trabajo de [Bloom, 2004] que con el objetivo de solventar las limitaciones que imponen las tecnicas de regresion lineal, realiza un ejercicio para encontrar relaciones no lineales mediante la segmentation del mercado, aplicadas a los turistas que visitan Ciudad del Cabo. Algo similar se realiza en el trabajo de [Dolnicar et al., 2012] en el cual se aplica una tecnica particular de clusteres (biclusteres) y tambien en el trabajo de [Kim et al., 2003], que aplica este tipo de tecnica al anulisis de las decisiones turísticas que realizan las personas mayores que visitan la zona Oeste de Australia.
Sin embargo, la aplicacion de estas tecnicas no se ha implementado de forma tan extensa en el estudio y analisis de la experiencia de los cruceristas que visitan un puerto de escala. En trabajos realizados para Cartagena de Indias, [Brida et al., 2012] y [Brida et al., 2015b], encontraron tres clusteres alrededor de la variable "tiempo empleado en el destino": pasajero en transito, estadua corta y estadi'a larga, concluyendo que el gasto realizado por el grupo de turistas que estu poco tiempo en el destino es casi imperceptible.
En el trabajo del año 2015, se encontraron 6 segmentos de mercado cuyas variables centrales fueron, nacionalidad, satisfacciuon, percepciuon de seguridad y gasto. En este uultimo trabajo el resultado fundamental al cual llegaron fue la necesidad de mejorar la percepciuon de seguridad y la posibilidad de trabajar sobre programas turusticos especuficos para el grupo de juovenes sudamericanos.
En [Andriotis and Agiomirgianakis, 2010] encuentran que los cruceristas que llegan a la ciudad de Heraklion (Creta, Grecia) no lo hacen motivados por el sol y la playa como sucede con otros destinos del Caribe o del Mediterráneo, sino que están motivados en explorar los aspectos culturales del destino.
Por su parte, en [Thurau et al., 2007] implementan la técnica de segmentación de mercados a los cruceristas que llegan a Panamó, y encuentran que el ecoturismo tiene mayor nivel de preferencia al que se pensaba previo al estudio. Para Uruguay se encontraron dos trabajos que utilizaron la metodología de clósteres. En uno de ellos [Brida et al., 2014b], se segmenta el mercado de cruceristas en tres grupos segón el país de residencia, las ciudades visitadas y visitas previas al país.
Se concluye que los turistas que visitan por primera vez Punta del Este, los jubilados que visitan Montevideo y los brasileños, constituyen las categorías de turistas que podrían intensificar en mayor medida, el impacto econóomico proveniente de la industria de cruceros.
En el segundo trabajo, se utiliza el algoritmo ClustOfVar y se encuentran cinco clósteres que demuestran que el agrado de los cruceristas con la gente local y caracterósticas tales como la edad y el góenero son las variables maós importantes para explicar el impacto econoómico del turismo de cruceros, ver [Brida et al., 2014a]. Estos óltimos resultados son utilizados como insumo en la comparacióon con el presente trabajo.
3.Descriptiva de la base de datos
Para llevar a cabo este estudio se utilizan los datos de la encuesta realizada por el Ministerio de Turismo durante la temporada 2014-2015 y la temporada 2015-2016. La base de datos cuenta con 6207 casos y 45 variables.
Las encuestas se implementaron en los 2 puertos de desembarco (Montevideo y Punta del Este), por lo que se realizo una muestra independiente en cada puerto. Para obtener dicha muestra se llevan a cabo 2 etapas: por un lado se sortean los cruceros y por otro lado los "grupos de viaje" que descienden de los mismos.
En una primera fase, los cruceros fueron seleccionados mediante muestreo sistemóatico, a partir de una lista de buques que se espera lleguen durante la temporada. En la segunda etapa, se eligen con equiprobabilidad los grupos de viaje a ser encuestados. Las entrevistas se realizan cuando los cruceristas estaón subiendo al barco, o sea cuando su viaje ha terminado.
La Tabla 1 presenta la lista de variables que se utilizan para el anaólisis. Las mismas pueden agruparse en: socio-demograficas, relacionadas con el viaje y las psicograficas.
Se observa que el 58% de las personas descendidas son mujeres. La mayor parte de los cruceristas tienen entre 30 y 59 años (69%). Los países vecinos aportan un porcentaje elevado en este tipo de turismo (51% en Brasil y 21% en Argentina). Del total visitan nuestro pai's por primera vez el 71%. En cuanto a la ocupacióon el 32% fueron profesionales, tóecnicos o docentes, el 27% fueron jubilados y el 18% empresarios, comerciantes o patróon.
El principal motivo de agrado fue la gente, cordialidad y la atencióon (28%), seguido por la arquitectura, los edificios y monumentos (18%). De las cosas que mencionaron como desagrado destacan los precios (58%) y la higiene (18%). El gasto promedio ha sido de USD 34, siendo compras (60%) y alimentación (24%) los principales rubros de gasto.
Con respecto a temporadas anteriores (ver [Brida et al., 2014b] y [Brida et al., 2014a]) se encuentra que el pai's de origen prevaleciente de los pasajeros continúa siendo Argentina y Brasil, con un notorio aumento de la presencia de brasilenños y un disminucioón de los pasajeros argentinos en las temporadas analizadas en este estudio. Asimismo, en promedio, en la mayoría de los pasajeros que visitan los dos destinos de estudio, se encontroó un leve aumento de la cifra de los que por primera vez visita el paós.
4.Metodología
Como ya se mencionó anteriormente, las tecnicas de segmentación se han utilizado de forma extensiva, lo que ha generado una evolucion importante en las mismas de manera de solventar algunas limitaciones, errores y malas interpretaciones que surgen de su aplicacion en la investigación. Un problema que surge al momento de agrupar unidades (crear clústeres) es la redundancia en la informacioón de las variables. Este problema se origina en la posibilidad de que las variables estóen fuertemente correlacionadas, determinando así la duplication de information y la clasificación de unidades es a veces engañosa. Otro problema es la inclusion en el análisis de variables que no presentan asociacioón con la variable a ser explicada, por tanto son meramente ruido que perturban el problema. En el trabajo (a diferencia de [Brida et al., 2014a]) se observa la presencia de ciertas variables no influyentes en el problema de segmentation, por tanto es fundamental poder detectar las mismas con el fin de obtener resultados mós claros y precisos. La determination de clósteres de variables es una alternativa vaólida para la reduccióon de la dimensionalidad de los datos, presentando la ventaja de una mayor interpretabilidad de los resultados frente a otras alternativas como, por ejemplo, el anaólisis factorial.
En esta seccióon describiremos los procedimientos que empleamos para determinar aquellos grupos (tambióen denominados cluósteres) de variables de mayor importancia para la delineacióon de los diferentes comportamientos de los turistas cruceristas en Uruguay en la temporada 2014-2015 y 2015-2016.
4.1.Cluster de Variables
La primera etapa tiene por objetivo determinar grupos de variables asociadas al comportamiento de los turistas cruceristas. La metodología de [Vigneau and Qannari, 2003] nos permite identificar dichos clósteres, basados en el anólisis de componentes principales (PCA) y mediante la construccióon de variables latentes.
Se observa un resultado novedoso, ambos mecanismos proporcionan en nuestro caso clósteres similares de variables. Posterior a la determinacióon de estos grupos, en una segunda etapa, se realiza una "poda" de estos. Es decir, se excluyen de los grupos aquellas variables que presentan poca correlación, en referencia a su varianza, respecto a la variable latente que determina el grupo, ver [Vigneau et al., 2016]. Estas variables descartadas pasan a formar parte de otro cluster que denominaremos cluster residuo. Posteriormente se determinan grupos de turistas cruceristas mediante algoritmo de k-medias. Se realiza una busqueda de aquellas variables que son determinantes de estos cluster de variables. La metodología implementada para la selection de estas variables se basa en el trabajo de [Fraiman et al., 2008]. Puesto que el numero de variables es elevado, para la implementation del algoritmo forward-backward, en el algoritmo de [Fraiman et al., 2008], las variables se van eligiendo secuencialmente de los cluuster de variables y del grupo de las variables residuo obtenidas en la primera etapa (esto genera un nexo de dependencia entre ambas etapas).
El trabajo puede situarse como una extension del estudio de [Brida et al., 2014a] pero con diferencias metodologicas sustanciales que nos permitirán analizar la evolucion que ha seguido el mercado de los cruceristas en funcion de existencia o no de nuevos perfiles de pasajeros. En este trabajo se busca determinar cluusteres de variables muas robustos, podando aquellas variables que cumplen un papel de ruido en el modelo. A diferencia de [Brida et al., 2014a], en lugar de utilizar procedimientos jerarquicos, se determinan los grupos a partir de algoritmos basados en kmedias, tanto en la primera (cluster de variables) como en la segunda parte del trabajo (cluster de individuos). Ademas, se utiliza un paquete (ClustVarLV) que mide las variables como cuantitativas, a diferencia del paquete que utiliza el trabajo mencionado (ClustOfVar) que toma variables mixtas. En lo que se refiere a los cluster de individuos, ambos trabajos difieren en el metodo utilizado para identificar las variables mas significativas; en el trabajo de [Brida et al., 2014a] se utiliza el metodo CART y en este trabajo se utiliza, como metodo novedoso, el algoritmo desarrollado en [Fraiman et al., 2008]. Por otro lado en el trabajo anterior la nacionalidad fue considerada como una variable explicativa para la determinaciuon de los cluuster. En este trabajo se busca observar como la tipologuía de los cruceristas encontrada aporta information sobre la procedencia de este.
Consideramos en particular que este tipo de encuestas pueden estar contaminadas por diversos motivos (por ejemplo falta de tiempo del crucerista o la "deseabilidad social" al contestar las preguntas). Por tanto es relevante podar determinada information que distorsiona el problema en cuestiuon.
En la primera etapa se busca una medida de similaridad entre las variables. En el caso del metodo CLV introducido por [Vigneau and Qannari, 2003] se consideran las variables agrado y desagrado como cuantitativas dicotómicas tomando valores 0 y 1. Llamamos Xj con j = 1,... ,p al vector determinado por la respuesta a la j-esima variable, donde p es el numero de variables. Si se fijan a priori K grupos se modelan las variables latentes ck asociada al k-esimo grupo de forma de maximizar la expresioun,
.... (1)
donde la Var(ck) = 1 y 5kj es la funcion indicatriz que vale 1 si la variable j se encuentra en el grupo k. Como los autores demuestran, fijada la particioun de variables, las variables latentes que optimizan la expresioun S son
... (2)
Podemos encontrar dos algoritmos para el agrupamiento de las variables:
(1)algoritmo de agrupacioun jeruarquica,
(2)algoritmo de partición (k-medias).
Ambos algoritmos de agrupación tienen como objetivo maximizar el criterio de homogeneidad. Este criterio implica que las variables de un clóster esten fuertemente asociadas a una variable cuantitativa sintetica central (variable de resumen).
Esta relation se mide, como ya se menciono anteriormente, como la suma de los coeficientes de correlacion o correlaciones cuadráticas segón el tipo de variable. Adicionalmente, se realiza un bootstrap para medir la estabilidad de las particiones de las variables y se puede utilizar como criterio para determinar el nómero ajustado de clósteres a realizar.
A partir del algoritmo de k-medias, que es el que utilizamos en este trabajo, el algoritmo iterativo para determinar los cluósteres es entonces,
(Algoritmo 1)
* Se fijan la cantidad de grupos y se selecciona una particion inicial de variables.
* Se determinan las variables latentes ck .
* Se reasignan las variables al grupo k-esimo donde maximiza la covarianza con ck.
* Se reitera el procedimiento con la nueva particion.
Si las variables gustos y desgustos las consideramos como cualitativas, es decir, los grupos ß1 = {xi,..., xPl} y ß2 = {z1,..., zP2} son las variables cuantitativas y cualitativas respectivamente, la variable latente que identifica al grupo ck esta dado por,
... (3)
siendo r el coeficiente de correlación y т la razon de correlacion entre las variables, ver [Chavent et al., 2017]. El calculo de ck es la primer componente principal a traves de algoritmo PCAMIX, ver [Kiers, 1991], aplicado a la matriz determinada por las columnas de las variables cuantitativas y la matriz determinada por las columnas de las variables cualitativas.
Al igual que en el algoritmo del metodo anterior se parte de una particion dada, se determinan las variables latentes y en cada paso se asocia cada variable a la variable latente con la cual presenta mayor asociacion (coeficiente de correlacion o razón de correlacion segón corresponda).
Podado de clústeres Se busca identificar un clóster de ruido, concepto introducido por [Dave, 1991]. Para identificar aquellas variables que quedan incluidas en los K clósteres del Algoritmo 1 pero serán llevadas a un nuevo grupo de ruido se utiliza la estrategia "K + 1" como se denomina en [Vigneau et al., 2016]. En este caso la expresion a maximizar es
... (4)
con Var(ck) = 1. Por tanto el Algoritmo 1 es modificado de la siguiente forma,
* Si, fijado j, ... entonces la variable Xj es asignada al grupo de ruido.
* Si ... entonces la variable xj se asigna al grupo k si covv(xj, ck) < cov(xj, ckr) para todo k = k'
Es claro que el tamaño del grupo de ruido depende de la eleccion de p. La selection de este parametro es discutida en [Vigneau et al., 2016] y [Cabilio and Masaro, 2001].
Finalmente, fijado el nómero de clóster en K = 4 (mediante el índice ajustado de Rand), se realiza el Algoritmo 1 a partir de la particion inicial obteniendo los clusteres direccionales de variables. En la Tabla 4 (ver Anexo) se representan los clústeres de variables, la correlación de cada variable con la variable latente del grupo y su correlación con la variable latente del grupo con el que se encuentra correlacionada en segundo lugar.
Estos resultados fueron obtenidos bajo el supuesto de que las variables de gustos y desgustos son consideradas del tipo cuantitativo pero, si consideramos las variables gustos y desgustos como cualitativas, utilizando la librería ClustofVar, los clústeres de variables obtenidos son similares. También en la Tabla 4 figura con una cruz aquellas variables que el algoritmo asociú a un clúster diferente. En la misma Tabla pero en la columna denominada Poda se encuentran marcadas con una cruz las variables que pasaron a formar parte, luego de utilizada la estrategia "K + 1", del clúster de outilers. La proportion de poda fue de con p = 0.3.
La matriz de correlaciún entre las variables latentes que identifican los grupos es dada por la Tabla 2. Se observa aquí una asociacion moderada en los tres primeros clusteres y un comportamiento no asociado de las variables del cuarto cluúster de variables.
En esta segunda etapa se realizan cluústeres de individuos basados en el algoritmo clúasico de ⅛-medias a partir del conjunto de todas las variables originales. En primera instancia se observa el comportamiento del gasto de los cruceristas en cada cluúster. Por uúltimo, a partir del múetodo introducido por [Fraiman et al., 2008] y los clústeres de variables determinados en la primera etapa se seleccionan las variables determinantes de estos grupos. Se observa el impacto causado en la distribuciúon del gasto por rubro en cada grupo si súolo utilizamos las variables seleccionadas. A partir del criterio coeficiente de Silhouette se opto por trabajar con 5 grupos.
En la Figura 1 se observa las diferentes distribuciones de gasto total en cada grupo. Se marcan con una lúínea horizontal la mediana y los cuartiles en cada caso. En la Tabla 3 se observa el nuúmero de turistas en cada uno de los grupos, en donde la mayor parte se encuentran contenidos en grupo 1 y el grupo 3 que representan más del 70% de todos los individuos. En la Figura 2 se puede observar el diferente comportamiento del gasto por rubro en cada grupo en relaciún al gasto total.
A traves del algoritmo forward-backward introducido en [Fraiman et al., 2008], se seleccionan que variables son las de mayor influencia en la determination de los clústeres. Los pasos del algoritmo son los siguientes.
(1) Se comienza por ingresar aquella variable "mas influyente", es decir aquella en que la asignación en los clósteres es mas afectada por su ausencia. Se congela una a una cada variable (las restantes se sustituyen por la estimacioón de su esperanza condicional) y se elige aquella que produce menos variation en la determination de los clósteres (respecto al grupo con el conjunto de variables).
(2) Este procedimiento se reitera secuencialmente hasta superar un porcentaje fijado de bien clasificados respecto a los grupos originales.
(3) El paso tres es la realization de una busqueda backward. Las variables son sustituidas una a una por su esperanza condicional y se van eliminado aquellas que producen menor cambio en la asignacióon de los individuos.
Como indican los autores, el algoritmo es computacionalmente costoso. En tal sentido, el agregado de variables se realiza de acuerdo a los grupos de variables obtenidos en la primera etapa del trabajo. Se comienza introduciendo la variable mas asociada a la variable latente de cada grupo de variables y así sucesivamente hasta alcanzar el umbral de coincidencias fijado. Para estimar la media condicional se realiza el promedio del valor de los 20 vecinos mas cercanos. A partir de dicho algoritmo, con las variables "entre30-44", "entre45-59", "TotPersonas", "Mdeo", "Residbra", "mujeres", "Jubilado", "GustaMercPuerto" y "DesagradPrecios", se logra reconstruir los grupos originales con una eficiencia del 85%.
5.Resultados
En esta sección se describen los principales hallazgos sobre la segmentación de los turistas cruceristas según la metodología utilizada y se comparacíon con la temporada 2012-2013.
5.1.Cluster de variables
Luego de podados los clósteres obtenemos 4 grupos . El grupo 1 esta caracterizado por variables de edad y profesión. Las personas de mediana edad (entre 45 y 59) están relacionadas positivamente con la variable latente del grupo, mientras que las personas mayores (por encima de 60 anos) estan relacionadas negativamente. Este resultado se confirma con las variables de profesion, la relation positiva con las profesiones activas (empresarios y profesional) y la negativa con las profesiones inactivas (jubilados) y que ademas residen en países europeos.
El grupo 2 también tiene un componente fuerte relacionado con las variables de edad. Tiene una correlación directa con las personas de entre 30 y 45 años de nacionalidad brasilera que visitan por primera vez el país. La variable "Residente en America del norte" tiene una correlación negativa al igual que la variable que indica la repeticioón del destino.
El grupo 3 agrupa las variables de góenero y de tamanño del grupo. Todas las variables estaón correlacionadas positivamente. En este sentido, este grupo tiene un alto porcentaje de mujeres que viajan en grupos. Estos grupos de viajeros pueden estar representando a turistas que viajan en familia, con personas menores de edad y jovenes de entre 18 y 29 anos. La variable hombre tambien tiene una correlacióon positiva con el grupo, lo cual refuerza la interpretacióon de este grupo.
El grupo de variables móas numeroso, el grupo 4, se puede identificar como el destino del crucero. En una dirección se encuentran aquellas variables relacionadas al destino Montevideo y en la direction contraria estan las variables relacionadas con el destino Punta del Este. De acuerdo con esto, los turistas que desembarcan y visitan Montevideo estóan satisfechos con el Mercado del Puerto, los Edificios, la Ciudad vieja y la comida y les desagrada la higiene y las pocas opciones de tiendas (que puede estar relacionado con la llegada de cruceros el fin de semana donde las tiendas cercanas a la zona portuaria estóan cerradas). Por otro lado, los turistas que desembarcan y visitan la ciudad de Punta del Este, estan satisfechos con las variables Gusta Punta, Gusta Casa Pueblo, Gusta Higiene y Desagrada precios (concordante con la condition de Punta del Este de ser un destino caro). Adicionalmente, el desembarco en Punta del Este está asociado a los turistas residentes en Argentina.
En base a estos resultados se pudo identificar que las variables asociadas a la Edad, el Total de personas en el grupo de viaje, la Residencia y el Puerto de visita son las variables que determinan la formation de clósteres. La Edad estó presente en tres de los cuatro grupos y en dos de ellos (clóster 1 y 2), es la variable con mayor correlation del clóster. Con las variables de Residencia sucede algo similar; esta presente en los clósteres 1, 2 y 4. El total de personas en el grupo de viaje define el cluóster 3 y el puerto de visita el cluóster 4.
Esto dispara diferentes implicaciones a nivel de política economica y de marketing estratégico orientadas a satisfacer necesidades de grupos especóficos de cruceristas y atraer a otros. Los resultados sugieren que sería rentable para el destino organizar actividades acordes a los diferentes grupos etarios y principalmente orientados a las familias. Con esto se busca que la familia o el grupo bajen del barco, conozca el destino y que todos se vean atrai'dos con lo que puede ofrecer el puerto visitado.
Tambióen hay claros indicios de que el turista se comporta diferente seguón su residencia. De modo que, los turistas europeos y jubilados podróan estar buscando actividades guiadas orientadas a conocer el acervo cultural, gastronomico, arquitectónico, etc., mientras que las personas de mediana edad buscaróan actividades menos estructuradas.
Otros resultados referentes a la Residencia estarían indicando que el brasilero viene por primera vez y el argentino visita Punta del Este. Este resultado se podrıa interpretar de dos maneras, una es que el brasilero no es leal al destino y la otra es que tal vez vuelve como turista de estancia, lo cual conlleva a estrategias bien diferentes.
En cuanto a los argentinos, es probable que el no visitar Montevideo este reflejando la cercanía entre ambos lugares. Estos resultados también refuerzan la idea de crear estrategias específicas para cada perfil de crucerista. Por último, el cluster 4 tambien refleja información importante. Es claro que las variables de higiene y precios deben ser revisadas por todos los actores involucrados.
5.2.Cluster de individuos y selección de variables
De acuerdo con los resultados en esta etapa, se pueden obtener algunas conclusiones interesantes. Los grupos 1, 3 y 4 son los grupos mas parecidos en terminos de gasto total y el 1 y el 3 son los que acumulan mayor cantidad de observaciones (2356 y 2150 respectivamente). Se puede observar que los valores de la mediana, cuartiles y maximos son similares. Adicionalmente, estos 3 grupos son los que tienen valores maús dispersos en túerminos de la distancia entre el valor múínimo (cero) y el maúximo. El grupo 3 y el grupo 5 son los que tienen mayor acumulaciúon de valores cercanos a cero, lo que significa que los individuos en estos grupos son los que menos gastos realizaron. Ademaús, el grupo 3 es uno de los que acumula mayor cantidad de observaciones indicando que en este grupo muchos individuos gastaron poco o nada. El grupo 2 tiene la menor cantidad de observaciones y es el mas homogeneo de todos. Se puede observar tambien, sobre todo en los grupos 1, 3 y 4, que hay observaciones acumuladas en valores redondos. Este resultado es bastante intuitivo, ya que cuando se le pregunta al crucerista cuúanto gastúo, es probable que haga una estimaciúon redonda de su gasto y no responda un resultado exacto.
En la figura 2 se puede observar que todos los grupos realizaron su mayor gasto en Compras, pero fue el grupo 1 el que mayor gasto hizo en este rubro (el 38% de los individuos destinaron mas al 60% de su presupuesto en Compras). En el rubro Alimentos, fue el grupo 5 el que se destaco en comparacioún con el resto de los grupos, y el grupo 3 lo hizo en el rubro tour. El gasto en transporte fue bajo en todos los grupos. Esto puede ser debido a que, quienes usaron transporte lo hicieron como parte de un tour o tambiúen por el hecho de que las ciudades de visita son chicas. Pero, por otro lado, puede estar reflejando que el transporte no es amigable para el turista y optaron por realizar visitas en tour o cercanas al puerto. Este es un aspecto muy interesante para investigar ya que podría ser un punto a mejorar.
Para una mejor y múas acertada interpretaciúon de los resultados se optúo por trabajar con el conjunto de todas las variables y no determinar los clústeres a partir de las variables latentes. Sin embargo, los cluústeres de variables obtenidos en la segunda etapa de la secciúon metodolúogica, son tambiúen de vital importancia en el momento de la selecciúon de variables, pues la correlacioún con la latente indica el orden de entrada en el algoritmo forward-backward de la siguiente seccion.
Para la selecciúon de variables, cuando se toma en cuenta las variables múas influyentes de cada cluúster, los resultados no varúían demasiado. En los grupos 1, 3 y 5 la distribucioún del gasto total parecerúía ser la misma que cuando se toman en cuenta todas las variables del cluúster. Mientras que, en los grupo 4 y 2 se puede observar que, en el primero existúían observaciones atúípicas relacionadas con variables que no eran extremadamente influyentes para armar el grupo. Una vez que esas variables se extrajeron del grupo, disminuyo el rango entre el valor mínimo y múximo. En el grupo 2 se puede observar que la grafica se afina y se alarga reflejando un aumento en el rango mín-múx.
La caracterizacion de los grupos se puede visualizar en la Figura 5 a traves de un árbol de decisiúon. Dentro de las variables consideradas en este trabajo, solamente el puerto de desembarco, la edad y la ocupacion de Jubilado discriminan los diferentes grupos.
La primera variable y múas importante que determina la primera particiúon es el puerto de desembarco. En la rama de la derecha, se encuentran aquellos que no desembarcaron en Montevideo (es decir, desembarcaron en Punta del Este) y se particiona nuevamente segón la edad entre aquellos grupos de cruceristas que incluyen a lo sumo un menor de edad y el resto. Los mayores de edad son parte de casi la totalidad del Grupo 5 (94%) y el Grupo 3 esta conformado por los que tienen como móximo un menor (95%).
En la rama de la izquierda, están aquellos individuos que desembarcaron en Montevideo. Estos se particionan entre aquellos que son Jubilados y aquellos que no. La sub-rama de la derecha se caracteriza por los que son Jubilados que forma parte del 87% del Grupo 4 y los no jubilados, a su vez, se diferencian entre aquellos que son menores y los que no lo son. Los no jubilados y menores de edad conforman el 89% del Grupo 1 y los no jubilados mayores de edad conforman el 92% del Grupo 5.
Con estos resultados y los detallados en el punto anterior podemos caracterizar mejor a los grupos. En este sentido, podemos identificar que el Grupo 1 que gasto mas del 60% de su presupuesto en Compras, son individuos que desembarcaron en Punta del Este y cuya ocupacióon no es Jubilado (es decir, es un individuo econoómicamente activo) y por tanto no son menores de edad.
El Grupo 3, que gastóo en tours móas que el resto de los grupos, estóa caracterizado por cruceristas con a lo sumo un menor de edad de edad que desembarcaron en Punta del Este. También es interesante caracterizar el Grupo 4 y 5 que, si bien no incluye a la mayor parte de la muestra (25% del total), arrojan resultados interesantes. El Grupo 4, que también realizo un gasto importante en compras, esta compuesto por Jubilados que desembarcan en Punta del este y el Grupo 5, que fue que el que realizo el gasto mas alto en alimentos, se caracteriza por individuos mayores de edad, en edad activa que desembarcaron en Punta del Este y Menores que desembarcaron en Montevideo.
El grupo 2 son cruceristas que desembarcan en Montevideo pero no tienen alguna caraterización fuerte que los identifique entre ellos, podríamos denominarlo como un grupo de ruido que por su tamaño no es relevante para los objetivos del trabajo.
6.Conclusiones y trabajo a futuro
Este trabajo se enmarca dentro de la literatura sobre el turismo de cruceros, utilizando una metodología poco extendida en este rubro como lo es el análisis de clusteres. En este sentido, este estudio llegó a resultados que contribuyen a la literatura general sobre el turismo y particularmente a la literatura de la industria de cruceros. Adicionalmente, se encontraron resultados que permiten obtener implicancias a nivel de varios actores involucrados en esta actividad y que refuerzan conclusiones obtenidas en otros estudios analizados en la literatura. A continuacioón, se enumeran los principales hallazgos de la investigation:
* A partir de un procedimiento robusto de cluster de variables se pudo identificar aquellos grupos de variables con mayor asociacióon entre ellas, y por otro lado un grupo de variables de ruido.
* Ambas metodologóías utilizadas para el cluóster de variables nos proporcionan cluósteres de variables similares, e incluso aquellas variables que pasan a formar el cluóster de ruido son las menos asociadas a la variable latente de cada grupo en clustofVar.
* Los clósteres de variables determinan una fuerte dependencia entre la edad de los cruceristas, el tipo de grupo en que viajan y la ocupacion de sus integrantes.
Los clósteres anteriores nos permiten demostrar que sería redituable para el destino armar estrategias específicas para cada grupo objetivo de cruceristas que llegan al país. Esto permitiría mejorar la relacioón entre el destino y los cruceristas explotando al móaximo el tiempo que le dedican a las ciudades que visitan. De acuerdo con esto, los resultados demuestran que la existencia de familias en el crucero exige que el destino les ofrezca actividades amigables a todos los miembros.
Se encontró tambien que los turistas europeos son en su mayoría personas mayores a 60 años que podróan estar buscando realizar tours guiados orientados a conocer el acervo cultural, gastronóomico, arquitectoónico, etc.
Con respecto a la residencia, variable clave en la formation de clósteres, se encontró que el residente en Brasil llega a los puertos uruguayos por primera vez y el argentino esta atraódo mayormente por Punta del Este.
Las estrategias tendientes a promocionar el turismo de cruceros en los paóses vecinos, deberóan orientarse al grupo de turistas brasileños que aón no han venido al paós asó como tambien lograr mayor lealtad en aquellos que ya lo han visitado.
Otros resultados importantes y en los cuales se debe poner foco es en los puntos debiles de los destinos, como higiene, precios y la falta de tiendas en Montevideo y en los puntos fuertes que fueron los atractivos de ambas ciudades. Estos resultados refuerzan la idea de crear actividades especóficas seguón el destino y el perfil del turista que desembarca del crucero y la necesidad de trabajar sobre la sinergia de todos los involucrados para lograr el mayor beneficio posible.
Si comparamos con la temporada de 2011-2012 analizada por [Brida et al., 2014a] encontramos algunas diferencias en la conformacióon de los perfiles de turistas que llegaron en esa temporada con respecto a la analizada en este trabajo. Las diferencias se vinculan baósicamente con dos variables: Precio y lealtad al destino. En cuanto a los precios, se puede identificar que en la temporada 20112012 los turistas no se sintieron insatisfechos con los mismos, mientras que en las temporadas entre 2014 y 2016 los turistas encontraron que los destinos tenían precios altos en especial Punta del este (concordante con el encarecimiento del país frente a otros países de la región). En el trabajo de [Brida, et al., 2014c] se encontró que los brasileños tenían lealtad con Punta del este mientras que en este trabajo se encontró que los brasileños llegaban por primera vez. Este resultado podría estar indicando que los brasileños dejaron de repetir el destino y una de las causas podría ser el encarecimiento relativo. En cuanto a la lealtad del destino, los argentinos siguen repitiendo el destino, en especial Punta del este
En lo que se refiere a los resultados economicos, se pudo identificar que:
* Gasto en Compras: todos los grupos encontraron oportunidades para gastar en el rubro compras por sobre cualquier otro rubro, a pesar de que algunos turistas se fueron insatisfechos por la falta de tiendas (particularmente en Montevideo). El perfil de crucerista que gasto mas en este rubro fue el Grupo 1 caracterizado por turistas no jubilados (economicamente activos) que bajaron en Punta del este. Es de destacar que, si bien
* Punta del este esta asociado con precios altos, los turistas encuentran opciones de gasto mós interesantes que en Montevideo. Sería interesante estudiar en detalle la incidencia del precio en la decision de compra de los turistas porque parecería no ser una variable que reduce la demanda de bienes y servicio y esto podríía definir el producto que se le ofrece al turista.
* Gasto en Tours: fue muy chico, aspecto que se debería estudiar con mayor detalle ya que podría estar respondiendo a la insatisfaccion de los turistas con los tours ofrecidos por los destinos. El gasto en tours estaí asociado con un perfil de crucerista que viaja en familia y desciende en Punta del este.
* Gasto en Transporte: también fue muy chico lo que podría estar indicando insatisfaccion por las posibilidades de transporte con las que cuentan.
* Gasto en Alimentos: el grupo que gasto mós en alimentos fue el 5 caracterizado por turistas jubilados que desembarcaron en Punta del este.
Una salvedad que se debe tener en cuenta con respecto al menor gasto encontrado en los rubros tours y transporte es que podríía estar respondiendo a la incapacidad de la encuesta de captar este gasto ya que es usual que el crucerista contrate el tour dentro de las opciones que le ofrece el crucero.
A diferencia del trabajo de [Brida et al., 2014a], en este trabajo se segmento a los individuos por rubro de gasto. De todos modos, a nivel de gasto total se encontró una gran diferencia en el perfil de crucerista con mayor nivel de gasto. En la temporada 2011-2012, el grupo de turistas que gastó mas fue un brasilero o norteamericano, Jubilado y satisfecho con el destino que desembarco en Montevideo. Mientras que en las temporadas entre 2014 y 2016, el perfil de ese crucerista que gastó mas fue un turista con profesion economicamente activa que desembarco en Punta del este.
Como trabajo a futuro, sería interesante poder integrar a la encuesta de cruceristas otras variables que ayudarían a complementar estos resultados, tal como, el nivel de ingresos, el nivel educativo, el tiempo en destino, desagregar las preguntas sobre tours y compras, actividades que le gustaría realizar y no tuvo oportunidad, si volvería como turista de estancia, etc. Esto permitiría conocer el perfil de turista con mayor nivel de detalle y como consecuencia se mejorarían los productos y servicios que se le pueden ofrecer.
Referencias bibliográficas
Andriotis and Agiomirgianakis, 2010. Andriotis, K. and Agiomirgianakis, G. (2010). Cruise visitors' experience in a mediterranean port of call. International Journal of Tourism Research, 12(4):390-404. Bloom, 2004. Bloom, J. Z. (2004). Tourist market segmentation with linear and non-linear techniques. Tourism Management, 25(6):723-733.
Brida et al., 2015a. Brida, J. G., Bukstein, D., and Tealde, E. (2015a). Exploring cruise ship passenger spending patterns in two Uruguayan ports of call. Current Issues in Tourism, 18(7):684-700.
Brida et al., 2015b. Brida, J. G., Bukstein, D., and Tealde, E. (2015b). Exploring cruise ship passenger spending patterns in two uruguayan ports of call. Current Issues in Tourism, 18(7):684-700.
Brida et al., 2014a. Brida, J. G., Fasone, V., Scuderi, R., and Zapata-Aguirre, S. (2014a). Clustofvar and the segmentation of cruise passengers from mixed data: Some managerial implications. Knowledge-Based Systems, 70:128-136.
Brida et al., 2018. Brida, J. G., Lanzilotta, B., Moreno, L., and Santinaque, F. (2018). A non-linear approximation to the distribution of total expenditure distribution of cruise tourists in uruguay. Tourism Management, 69:62-68.
Brida et al., 2012. Brida, J. G., Pulina, M., Riano, E., and Zapata-Aguirre, S. (2012). Cruise passengers experience embarking in a caribbean home port. the case study of cartagena de indias. Ocean & Coastal Management, 55:135-145.
Brida et al., 2014b. Brida, J. G., Scuderi, R., and Seijas, M. N. (2014b). Segmenting cruise passengers visiting uruguay: A factor-cluster analysis. International Journal of Tourism Research, 16(3):209-222.
Cabilio and Masaro, 2001. Cabilio, P. and Masaro, J. (2001). Basic statistical procedures and tables.
Chavent et al., 2017. Chavent, M., Kuentz, V., Liquet, B., Saracco, J., Chavent, M. M., and PCAmixdata, I. (2017). Package clustofvar.
CLIA, 2018. CLIA (2018). 2018 cruise industry outlook.
Dave, 1991. Dave, R. N. (1991). Characterization and detection of noise in clustering. Pattern Recognition Letters, 12(11):657-664.
Dolnicar et al., 2012. Dolnicar, S., Kaiser, S., Lazarevski, K., and Leisch, F. (2012). Biclustering: Overcoming data dimensionality problems in market segmentation. Journal of Travel Research, 51(1):41-49.
Fraiman et al., 2008. Fraiman, R., Justel, A., and Svarc, M. (2008). Selection of variables for cluster analysis and classification rules. Journal of the American Statistical Association, 103(483):1294-1303.
Joshi and Kaur, 2013. Joshi, A. and Kaur, R. (2013). A review: Comparative study of various clustering techniques in data mining. International Journal of Advanced Research in Computer Science and Software Engineering, 3(3).
Kiers, 1991. Kiers, H. A. (1991). Simple structure in component analysis techniques for mixtures of qualitative and quantitative variables. Psychometrika, 56(2):197-212.
Kim et al., 2003. Kim, J., Wei, S., and Ruys, H. (2003). Segmenting the market of west australian senior tourists using an artificial neural network. Tourism Management, 24(1):25-34.
Liao et al., 2012. Liao, S.-H., Chu, P.-H., and Hsiao, P.-Y. (2012). Data mining techniques and applications-a decade review from 2000 to 2011. Expert systems with applications, 39(12):11303-11311.
Ministerio de Turismo, 2015. Ministerio de Turismo, U. (2015). Anuario 2015.
Ngai et al., 2009. Ngai, E. W., Xiu, L., and Chau, D. C. (2009). Application of data mining techniques in customer relationship management: A literature review and classification. Expert systems with applications, 36(2):2592-2602.
Pesonen, 2012. Pesonen, J. A. (2012). Segmentation of rural tourists: Combining push and pull motivations. Tourism and Hospitality Management, 18(1):69-82.
Romero and Ventura, 2013. Romero, C. and Ventura, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 3(1):12-27.
Sanchez-Hernandez et al., 2013. Sánchez-Hernández, G., Chiclana, F., Agell, N., and Aguado, J. C. (2013). Ranking and selection of unsupervised learning marketing segmentation. Knowledge-based systems, 44:20-33.
Thurau et al., 2007. Thurau, B. B., Carver, A. D., Mangun, J. C., Basman, C. M., and Bauer, G. (2007). A market segmentation analysis of cruise ship tourists visiting the panama canal watershed: Opportunities for ecotourism development. Journal of Ecotourism, 6(1):1-18.
Vigneau and Qannari, 2003. Vigneau, E. and Qannari, E. (2003). Clustering of variables around latent components. Communications in Statistics-Simulation and Computation, 32(4):1131-1150.
Vigneau et al., 2016. Vigneau, E., Qannari, E., Navez, B., and Cottet, V. (2016). Segmentation of consumers in preference studies while setting aside atypical or irrelevant consumers. Food quality and preference, 47:54-63.
(ProQuest: Appendix omitted.)
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
© 2018. This work is published under https://creativecommons.org/licenses/by-nc/4.0 (the “License”). Notwithstanding the ProQuest Terms and Conditions, you may use this content in accordance with the terms of the License.
Abstract
El objetivo del estudio es aportar información para la toma de decisiones en el marco de políticas turísticas aplicadas a la gestion de destinos. Diversos mecanismos de segmentación de mercado son aplicados de forma frecuente en el analisis de turismo y son utilizadas diferentes metodologías estadísticas segón el fin que se persigue. En este trabajo se aplica una tecnica de clasificacion no supervisada que tiene por objetivo determinar grupos de variables. Se hace enfósis en un criterio de poda de variables que determina un grupo de ruido y en la comparacion de dos metodologías diferentes en referencia al trato de las variables cualitativas. A partir de ellas se realiza una segmentación de los cruceristas. En esta óltima etapa es novedosa la aplicación de un criterio seleccion de variables que intenta emular los grupos obtenidos con las variables originales. Son analizados los resultados obtenidos en cada paso y se realiza una comparativa con clósteres determinados en temporadas anteriores.