RESUMEN
Este artículo continúa con la línea de investigación relativa a modelos predictivos de índices bursátiles: algoritnios genéticos y redes neuronales. Los modelos anteriores, paramétricos o no paramétricos, lineales y no lineales, buscan reconocer pautas de comportamiento y relaciones que se expresan en un lenguaje matemático, por medio de la estimación de coeficientes y su significación estadística. Sin embargo, la mayoría de los agentes que participan en el mercado bursátil utiliza un lenguaje que incorpora aspectos cualitativos para referirse, por ejemplo, al precio de un activo, a la rentabilidad de la inversion, etc. En este contexto, los modelos cuantitativos tienen dificultades para absorber esta información, lo que plantea la necesidad de desarrollar y analizar el uso de nuevas técnicas que permitan incorporer este tipo de referencias. La metodología de lógica borrosa, basada en la idea de que las variables deben ser manejadas no como un número sino mas bien por las características que ellas presentan, responde a esta inquietud. Se utilizaron series históricas de cotizaciones diarias de los índices bursátiles norteamericanos DJI y Nasdaq (Estados Unidos), IPC (México) y TSE (Canada), correspondientes al periodo comprendido entre el 8 de octubre de 1996 y el 7 de enero de 2005. Se construyó un modelo de lógica y otro de lógica difusa, para efectos de proyectar el signo de las variaciones de los índices bursátiles ya señalados. Los modelos de lógica y de lógica borrosa tuvieron una capacidad predictiva estadisticamente significativa. Además, ambos modelos lograron un rendimiento extranormal significativo y positivo al ser utilizados en una estrategia de comercio (trading), aun después de considerar los costos de transacción.
ABSTRACT
This article continues with the research related to predict stock index, such as, genetic algorithms and neuronal networks. Parametrics or non parametrics, lineals and non lineals models, try to recognize patterns and relations that express themselves in a mathematical language, through the estimation of coefficients and their statistical significance. However, most of the agents in the stock market use a language that incorporates qualitative aspects to refer to, for example, the price of an asset, the yield of the investment, etc. In this context, the quantitative models have problems to absorb this information, which suggests the need to develop and analyze new techniques, incorporating this type of references. The methodology of fuzzy logic gives answer to this question because it's based on the idea that the variables should be handled not as a number but as characteristics that they represent. We used historic series of daily prices of the North American stock index DJI and Nasdaq (USA), IPC (Mexico) y TSE (Canada), corresponding to the period October 8, 1996 and January 7, 2005. We designed a model of logic and fuzzy logic, to forecast the stock indexes sign variations. The logic models and the fuzzy logic models reached a forecast capability statistically significant. In addition, both models achieved a significant and positive abnormal return when they were used as a trading strategy, even after transaction costs.
INTRODUCCIÓN
La predicción de los movimientos de los precios accionarios y de los indices bursátiles ha sido un tema de gran interés en el ámbito financiero. Diverses estudios muestran que los rendimientos accionarios son predecibles en algún grado. Por ejeniplo, Lo y MacKinley (1988), utilizando datos de mercados bursátiles desarrollados, encontraron una correlación serial positiva entre los rendimientos semanales; DeBondt y Thaler (1985), Fama y French (1988), Poterba y Summers (1988) y Chopra, Lakonishok y Ritter (1992) obtuvieron una correlacion serial negativa en los rendimientos de los activos individuales y varias carieras en intervalos de tres a diez años.
Predecir los movimientos de los precios accionarios futures a partir del análisis de series historicas de cotizaciones bursátiles ha llevado a que los analistas se centren en la psicología del inversionista y en la respuesta de éste a los movimientos de los precios accionarios. La idea detrás de esto es que el precio al cual un inversionista está dispuesto a comprar o vender depende de sus expectativas: si espera un alza futura en el precio del activo, entonces comprará; por lo contrario, si espera una caída en la cotización bursátil, entonces venderá. Esta conducta que pareciera ser trivial resulta de gran complejidad ya que responde a las expectativas y actitudes del ser humano. Este estudio busca predecir el comportamiento del mercado bursátil -representado por un índice accionario-, trazando sus variaciones históricas por medio de un sistema lógico de procesamiento de datos.
En los decenios recientes se han incorporado en los procesos de prediccion nuevas técnicas con base en modelos no paramétricos y no lineales, como las redes neuronales. A modo de ejemplo, Parisi, Parisi y Guerrero (2003) utilizaron redes neuronales en el proceso de construcción de modelos predictivos de las variaciones semanales de diferentes indices bursátiles internacionales. Lo anterior se suma a los resultados de Tsibouris y Zeidenberg (1995) y White (1993), quienes trabajaron en la predicción de indices bursátiles y de activos individuales, y confirmaron un mejor rendimiento de la redes neuronales. También Parisi, Parisi y Cornejo (2004) utilizaron algoritmos genéticos para encontrar el proceso de busqueda del mejor modelo lineal multivariado dinámico y recursive, en términos de su capacidad para predecir el signo de la variacion experimentada por los índices DJI, Nasdaq, IPC y TSK,1 mismos que se abordan en esta investigación.
Los modelos anteriores, paramétricos o no paramétricos, lineales y no lineales, buscan reconocer pautas de comportamiento y establecer relaciones entre la variable que se desea proyectar y la(s) variable(s) explicativa(s). Estas relaciones se expresan en un lenguaje matemático, por medio de la estimación de coeficientes y del análisis de su significación estadística. Sin embargo, la mayoría de los agentes que participan en el mercado bursátil utiliza un lenguaje que incorpora aspectos de carácter cualitativo para referirse, por ejemplo, al precio de un activo, a la rentabilidad de la inversión, a la volatilidad del mercado, etc. Así, es comun encontrar expresiones como que el precio esta "relativamente alto" o "relativamente bajo", que la rentabilidad de tal o cual instrumento de inversion es "atractiva", que la volatilidad del mercado bursátil es "relativamente alla" o que éste se encuentra más bien "estable", etc. En este contexto, los modelos cuantitativos tienen dificultades para absorber esta información de carácter cualitativo, lo que plantea la necesidad de desarrollar y analizar el uso de nuevas técnicas que permitan incorporar este tipo de referencias. La metodología de lógica borrosa (también conocida como lgica difusa o fuzzy logic), basada en la idea de que las variables son de carácter lingüístico y que, por tanto, deben ser manejadas no como un número sino mas bien por las características que ellas presentan, responde a esta inquietud.
La importancia de lo anterior radica en que el uso de técnicas avanzadas, como lógica borrosa, algoritmos genéticos y redes neuronales, ayuda a mejorar el proceso de proyección de precios, lo que es vital en la gestión de carteras de inversión de renta variable. En el caso especifico de la lógica difusa, es posible construir un modelo de óptimos computarizados para proyectar el signo de la variación de un determinado índice bursátil, es decir, para realizar un pronóstico respecto a si éste se moverá al alza o a la baja en el future inmediato.
Existe un gran número de trabajos y aplicaciones de lógica difusa en multiples ámbitos -principalmente relacionados con controladores automáticos-, pero ésta ha sido escasamente usada en el campo económico. Dourra y Siy (2001) evaluaron los movimientos de los precios de un conjunto de acciones, aplicando un proceso de lógica borrosa en los resultados del análisis técnico, y obtuvieron una ventaja comparativa en términos de rentabilidad respecte al mercado.
El documento se divide en tres secciones: la sección 1 presenta un resumen de los conceptos básicos de lágica borrosa; en la sección il se explica la metodología utilizada, la sección ni aborda el análisis de los resultados y al final se présenta las conclusiones del estudio.
I. LÓGICA DIFUSA: CONCEPTOS BÁSICOS
De esta manera, la pertenencia de un elemento al conjunto A queda fraccionada y las relaciones entre conjuntos quedan categorizadas, siendo la transicion entre dos conjuntos (o estados) AyB radical e inmediata.
La lógica borrosa, por su parte, considera la idea de variable lingiiistica, que capta las propiedades de aproximación o los conceptos de imprecisión en un sistema, lo que permite que un elemento tenga valores intermedios en el grado de pertenencia a un conjunto determinado. Cada elemento del universe tiene asociada una funcion de pertenencia continua f^sub A^ -que toma valores entre 0 y 1- que indica el "grado de pertenencia" del elemento x al conjunto A. Así, un conjunto en el universe de discurso U es definido por una función de pertenencia f^sub A^: U [arrow right] [0,1], en la que f^sub A^(x)∈ [0,1] indica el grado de pertenencia de x al conjunto A.
En este concepto de lógica borrosa reside la idea de que los elementos clave del pensamiento no son numéricos, sino que son ideas con cierto grado de vaguedad, en las que los elementos pasan de un conjunto a otro de manera suave y flexible, convirtiéndose de esta manera en un instrumento atractivo para manejar la incertidumbre. La logica borrosa incorpora tres pasos fundamentales: i) la elección de los insumos (inputs) del proceso/uzzy, ii) la designación de funciones y conjuntos de pertenencia y iii) la determinación de las reglas difusas y de la variable de salida (desfuzificación).
Los insumos del proceso fuzzy se refieren a las variables que se presumen importantes de considerar, ya que el comportamiento de estas y sus combinaciones influyen en la variable que se desea proyectar. Estas variables son agrupadas en los conjuntos de pertenencia (también llamados conjuntos difusos) a los cuales pertenecerán en algún grado. Los conjuntos de pertenencia son determinados por sus funciones de pertenencia. Comúnmente, el número de conjuntos difusos es definido de manera que contenga todo el rango de posibles valores que podría adoptar la variable. Este rango de variación es conocido como universo de discurso. Las funciones de pertenencia generalmente son funciones continuas cuyo dominio es el conjunto de discurso y su imagen un valor real entre 0 y 1, el cual representará el grado de pertenencia de la variable al conjunto de que se trate. Estos conjuntos de pertenencia, junto a las reglas difusas, determinarán el comportamiento que tendra la variable de salida.
Se requiere el establecimiento de reglas para combinar los conjuntos de pertenencia mediante operaciones de union, intersección y complemento. Las operaciones entre conjuntos se asociarán a las conexiones lingüísticas "o"/"y". Así, la intersección se asocia a "y", mientras que la unión a "o". De esta manera se pueden conectar y manipular los conjuntos de pertenencia que contienen los insumos para, a su vez, obtener nuevos conjuntos difusos en los cuales se agrupen los productos (outputs). En principio, no existen reglas generales o un método de construcción de reglas fuzzy o de funciones de pertenencia, por lo que estas son determinadas por cada disenador. No obstante, éstas deben cumplir con las propiedades de t-normas para la interseccion y t-conormas para la unión.2
El proceso de proyección es realizado por medio de la elaboración de reglas difusas, las cuales relacionan la correspondencia entre los insumos y el producto mediante las operaciones de conjuntos. La forma usual de las reglas difusas es del tipo: si i^sub 1^ es f^sub 1^ y/o i^sub 2^ es f^sub 2^ y/o... i^sub n^ es f^sub n^, entonces o^sub t^ es o^sub k^. Donde i^sub 1^, i^sub 2^...i^sub n^ son los insumos atribuibles a las funciones de pertenencias f^sub 1^, f^sub 2^,..., f^sub n^ respectivamente; o^sub t^ es el producto, y o^sub k^ es la clasificación atribuible a o^sub t^. Finalmente, el producto fuzzy debe ser transformado en una variable posible de interpretar, proceso denominado "desfuzificación".
II. DATOS Y METODOLOGÍAS
En este artículo se utilizaron series históricas de cotizaciones de cierre diarias de los principales índices bursátiles de América del Norte: DJI, Nasdaq (Estados Unidos), IPC (México) y TSE (Canada). Los datos corresponden al periodo comprendido entre el 8 de octubre de 1996 y el 7 de enero de 2005.
Se construyó un modelo de lógica y otro de lógica difusa para efectos de proyectar -en el momento t- el signo de la variación que experimentarán en el momento t + 1 los índices bursátiles señalados. De esta manera se busca pronosticar si los indices en análisis se moverán al alza -signo positivo- o a la baja -signo negativo-. Esto, entendiendo que la predicción de la dirección del movimiento del índice accionario es pertinente para desarrollar estrategias de transacción efectivas (Leung, Daouk y Chen, 2000). La principal diferencia entre el modelo de logica y el de lógica difusa radica en que este ultimo ha sido construido asignando a los insumos funciones de pertenencia, mientras que el primero carece de esta propiedad. En ambos casos se busca mostrar la eficiencia de la técnica en función de dos aspectos: por una parte, en la elaboración de un modelo que maximice el porcentaje de predicción de signo (PPS) y, por otra, en la capacidad para generar una rentabilidad extranormal, es decir, superior a la generada por un punto de referencia (benchmark).
1. Modelo de lógica
Con este modelo las asociaciones lógicas y la magnitud de los parámetros serán determinadas con un proceso heurístico, valiéndose para ello de un proceso de simulación. El objetivo es generar evidencia que permita analizar si el modelo lógico puede crear, por una parte, un modelo que maximice el PPS dentro de un subperiodo de estudio (intramuestral)3 -para luego evaluar los resultados en una serie extramuestral- y, por otra, una estrategia de comercio (trading) que genere rendimientos extranormales. Se consideró como producto del proceso fuzzy la variación que experimentará el índice bursátil en el periodo f +1. Por otro lado, se consideraron diez insumos: las variaciones del indice bursátil en cuestión correspondientes a los periodos t, t - 1, t -2, t -3 y t- 4, y las variaciones del índice DJI en t, t - 1, t - 2, t - 3 y t - 4. Para el caso del índice DJI el modelo de lógica contiene sólo cinco insumos: las variaciones del DJI relativas a los periodos t, t -1, t -2, t - 3 y t - 4. Para cada uno de los insumos se consideraron cinco conjuntos de pertenencia, en los que cada uno de ellos corresponde a un quintil de la distribución de frecuencia absoluta simple de las variaciones de precios historicós. En cuanto al producto, los conjuntos de pertenencia son tres: al alza, se mantiene y a la baja.
2. Modelo de logica borrosa
Al igual que en el caso anterior, se consideró como producto la variación que experimenterá el índice bursátil en el periode t +1. También se consideraron diez insumos: las variaciones en t, t -1, t -2, t - 3 y t - 4 del índice respectivo y las variaciones del indice DJI en t, t - 1, t - 2, t - 3 y t - 4. Para el caso del índice DJI, el modelo de lógica difusa contiene sólo cinco insumos: las variaciones del DJI relativas a los periodos t, t -1, t -2, t -3 y t -4.
De esta manera, y a modo de ejemplo, el valor de la función de pertenencia muy bajo la media que está asociado al insumo i^sub t^ representa el grado de pertenencia que tiene dicho insumo al conjunto o intervalo que esta ubicado dos desviaciones estándar bajo la media del índice bursátil. Cabe señalar que estas funciones de pertenencia irán cambiando en el tiempo, ya que la media y la desviación estándar serán recalculadas día a día -tanto las totales (μ^sup i^^sub t^ y σ^sup i^^sub t^) como las relativas a los conjuntos de pertenencia (μ^sup i^^sub j,t^ y σ^sup i^^sub j,t^ )-, otorgando así mayor ilexibilidad a los conjuntos difusos.
El último paso en el procesoy fuzzy consiste en la desfuzificación. Tras la aplicación de las reglas si i^sub 1^, es f^sub 1^ y/o i^sub 2^ es f^sub 2^ y/o... i^sub n^ es f^sub n^, entonces o^sub t^ es o^sub k^, lo que se obtiene es la imagen de la función de pertenencia, es decir, el grado de pertenencia del producto a un determinado conjunto k, cuya inversa proporciona el valor del producto (O^sub t^) correspondiente a ese nivel de pertenencia. Sin embargo, la función exponencial es una función epiyectiva y, por tanto, su inversa deberá estar restringida a un subintervalo de la preimagen. Los intervalos considerados para la función de pertenencia a la baja son los valores que están sobre la media del conjunto. Para las funciones de pertenencia se mantiene y a la baja se consideraron los valores que están sobre la media. Esto se muestra en la gráfica 3.
De esta manera el valor obtenido tras la desfuzificación es un valor en torno de la media de las variaciones de precio de los pasados 20 días, que indicaría cuál es la tendencia que sigue el movimiento del índice bursátil.
Luego, a fin de analizar si la capacidad predictiva de los modelos se traduce o no en beneficios economicos, se calculó la rentabilidad acumulada que se hubiese logrado de haber seguido las recomendaciones de comercio del modelo: comprar si la proyección es al alza y vender si la proyección es a la baja. Para ello se supuso una inversión inicial de 100 mil dólares. Al momento de calcular la rentabilidad de la estrategia de comercio no se realizaron ventas cortas y se supuso un eosto fijo por transacción de 15 dólares.7
Además, con objeto de evitar el problema de data snooping8 -y despejar las dudas respecto a si la capacidad predictiva se debe a la bondad del modelo, a las caracteristicas de la muestra de observaciones a la que ha sido aplicado, o simplemente al factor suerte-, cada modelo se evaluó con un total de mil subconjuntos extramuestrales, de 209 precios de cierre diarios cada uno. Estos mil subconjuntos extramuestrales fueron generados a partir del conjunto extramuestral original, utilizando un proceso de block-bootstrap.10
4. Punto de referenda y prueba de significación estadístico
Los resultados de ambos modelos -de lógica y lógica difusafueron comparados con la rentabilidad generada per una estrategia buy and hold.11 Por otro lado, para analizar si existen diferencias estadísticamente significativas entre los PPS de les modelos y entre les rendimientos extranormales de las estrategias de comercio, se realizaron pruebas no paramétricas de hipótesis de diferencias de medias (prueba de Friedman y de Tukey).
III. RESULTADOS
El cuadro 1 presenta los estadisticos descriptivos de los índices analizados. Al analizar la serie de valores de cierre, en primera diferencia, de los índices IPC, DJI, Nasdaq y TSE se encontró que, en los tres primeros casos, el coeficiente de asimetría es negative, por lo que la distribución presenta un sesgo hacia la izquierda, conio consecuencia de la existencia de valores extremes y poco usuales. Por su parte, la distribución de las variaciones de los valores de cierre diarios del TSE presenta un sesgo hacia la derecha. Para el IPC, DJI, Nasdaq y TSE, el valor de la curtosis fue superior a 3. En consecuencia, la distribución de las observaciones adoptó una forma leptocurtósica, con las observaciones concentradas en un estrecho rango de valores y una masa relativamente baja en las colas de las funciones de densidad.
CUADRO 1. Estadísticos descriptives para las series de valores de cierre diarios, en primera diferencia(a)
Al analizar los resultados de la prueba de Jarque-Bera se rechazó la hipótesis de que las variaciones de los valores de cierre semanales de los índices IPC, DJI, Nasdaq y TSE siguen una distribución normal, con una significación de 5%. Además, exceptuando el caso del TSE, los coeficientes de autocorrelación para AR(1), AR(2), AE(3) y AR(4) resultaron ser estadísticamente no significativos -a un nivel de significación de 5 y de 10%-, por lo que no se encontre evidencia de autocorrelación entre las variaciones experimentadas por los índices entre los periodes t y t- 1, t y t- 2, t y t - 3 y t y t - 4, respectivamente. Por ultimo, las pruebas de Wald-Wolfowitz (de corridas) y Cox-Stuart (de signos no ponderados) no rechazaron la hipotesis nula de aleatoriedad en las variaciones de los índices accionarios (para el caso del Nasdaq, no existe evidencia concluyente para rechazar dicha hipotesis).
El cuadro 2 resume la capacidad predictiva de los modelos, calculada en el conjunto intramuestral. También muestra el resultado de la prueba de acierto direccional (AD) y la rentabilidad acumulada que hubiera logrado un inversionista al basar su estrategia de comercio en las recomendaciones de compra-venta de los modeles, así como el rendimiento de la estrategia buy and hold. El mejor modelo de lógica obtuvo un PPS de 62, 61, 60 y 59% para los índices IPC, Nasdaq, TSE y DJI, respectivamente. Esta capacidad predictiva, estimada en un conjunto intramuestral de mil datos diarios, resultó estadísticamente significativa en cada uno de los óndices. Por su parte, al analizar el PPS de los modelos de lógica borrosa, se encontró que éstos fueron menores (58, 60, 57 y 55%, respectivamente), resultando también estadísticamente significativos.
CUADRO 3. Resumen de los parámetros estimados para los modelos de lógica y lógica borrosa(a)
Se observó que la capacidad predictiva de los modelos se tradujo en beneficios económicos. Los modelos de lógica obtuvieron el mayor PPS y, simultáneamente, el mayor rendimiento acumulado. Además, independientemente de la significación estadística de la capacidad predictiva de los modelos, éstos superaron en rentabilidad a la estrategia buy and hold, la cual evidencio la rentabilidad más baja en cada uno de los índices analizados. Por lo anterior, siempre fue mejor gestionar la cariera indizada (representada por el índice bursátil) en función de alguno de los modelos de proyección. El cuadro 3 presenta los parámetros estimados para los modelos de lógica y de logica borrosa, correspondientes a los índices bursátiles IPC, Nasdaq, TSE y DJI.
CUADRO 4. Resumen estadístico del PPS, de la prueba de acierto direccional (AD) y de los rendimientos acumulados(a)
CUADRO 4. Resumen estadístico del PPS, de la prueba de acierto direccional (AD) y de los rendimientos acumulados(a)
Se probó la solidez de estos resultados a fin de evitar el problema de data snooping. Para ello se tomó el mejor modelo de proyección para cada indice y se lo evaluó en un total de mil conjuntos extramuestrales de 20 datos de cierre diarios cada uno. Estos mil conjuntos extramuestrales fueron generados a partir del conjunto extramuestral original utilizando un proceso de block-bootstrap. El cuadro 4 muestra los estadísticos para el PPS (sección A), la prueba AD (sección B) y la rentabilidad acumulada de las estrategias de comercio (sección C). Al analizar el PPS generado en los mil conjuntos extramuestrales por el modelo de lógica, no se rechazó la hipótesis de que el PPS de los índices IPC, DJI, Nasdaq y TSE sigue una distribución normal, con una significación de 5%, de acuerdo con la prueba de Jarque-Bera. En la seccion A se observa que, en promedio, el PPS fue de 50.88, 52.58, 49.07 y 52.93% para los indices DJI, IPC, Nasdaq y TSE, respectivamente. Luego, al calcular la prueba AD se encontre que la capacidad predictiva fue significativa solo en 6,34,17 y 29% de los conjuntos extramuestrales analizados para el DJI, IPC, Nasdaq y TSE, respectivamente (véase sección B). Sin embargo, al analizar la rentabilidad acumulada se encontró que -de los mil conjuntos extramuestrales- los modelos superaron el rendimiento de una estrategia buy and hold en 57, 59, 62 y 71% de los casos en los índices DJI, IPC, Nasdaq y TSE, respectivamente, tal como se observa en la sección C del cuadro 4.
Por otra parte, y respecto al modelo de logica borrosa, no se rechazó la hipotesis de que el PPS de los índices IPC, DJI, Nasdaq y TSE sigue una distribución normal, con una significación de 5%, de acuerdo con la prueba de Jarque-Bera. En la sección A del cuadro 4 se observa que, en promedio, el PPS fue de 49.85, 51.58, 48.07 y 52.93% para los índices DJI, IPC, Nasdaq y TSE, respectivamente. Luego, al calcular la prueba AD se encontró que la capacidad predictiva fue significativa sólo en 5, 30, 15 y 30% de los conjuntos extramuestrales analizados para el DJI, IPC, Nasdaq y TSE, respectivamente (véase sección B). Sin embargo, la rentabilidad de estos modelos superó de nuevo el rendimiento de una estrategia buy and hold en 55, 57, 59 y 64% de los casos en los indices DJI, IPC, Nasdaq y TSE, respectivamente, como se observa en el cuadro 4, sección C.
Por ultimo, los resultados de la prueba de Friedman (cuadro 5) indican que existen diferencias estadisticamente significativas entre los PPS y los rendimientos anormales generados por los modelos analizados. De manera más específica, la prueba de Tukey señala que no hay diferencias significativas entre el modelo de lógica y el modelo de lógica borrosa, en términos de PPS, pero sí la hay en las rentabilidades, superando el rendimiento del primer modelo a la rentabilidad del segundo. Además, las rentabilidades de los modelos predictivos construidos en función de lógica y lógica borrosa, son estadísticamente superiores al rendimiento de la estrategia buy and hold.
Cabe señalar que los resultados apuntan en la misma dirección que los obtenidos en Parisi, Parisi y Cornejo (2004), en el sentido de que es posible establecer modelos predictivos que permitan aumentar el rendimiento de las estrategias de comercio. En dicho estudio, los modelos multivariados producidos por el algoritmo genético tuvieron un PPS extramuestral de 59,60,59 y 59% para los índices IPC, Nasdaq, TSE y DJI, respectivamente, en el que la capacidad predictiva es significativa en cada uno de ellos. Además, estos modelos superaron el rendimiento de una estrategia buy and hold en 57,59, 71 y 41% de los casos en los indices DJI, IPC, TSE y Nasdaq, respectivamente.
CONCLUSIONES
En este artícule se construyó un modelo de lógica y otro de lógica difusa para proyectar -en el momento t- el signo de la variación que experimentarán en el momento t +1 los índices bursátiles de América del Norte: DJI y Nasdaq (Estados Unidos), IPC (México) y TSE (Canadá). Los datos corresponden al periode comprendido entre el 8 de octubre de 1996 y el 7 de enero de 2005. Los resultados senalan que el modelo de lógica tendría mayor capacidad que el modelo de lógica borrosa para predecir las variaciones de los indices ya señalados, que esta capacidad predictiva sería estadisticamente significative y que una estrategia de comercio basada en las recomendaciones de compra-venta dadas por este modelo permitiría obtener rendimientos relativamente más altos. Por ultimo, destacamos que los modeles de lógica y de lágica borrosa superaron, en promedio, los resultados de la estrategia buy and hold, aun cuando se consideró un costo por transacción equivalente a 15 dólares.
Los resultados apuntan en la misma dirección que los obtenidos en Parisi, Parisi y Cornejo (2004), en el sentido de que es posible desarrollar modeles predictivos que permitan incrementar el rendimiento de las estrategias de comercio. En dicho estudio los modeles multivariados producidos por el algoritmo genético obtuvieron un PPS extramuestral de 59, 60, 59 y 59% para los índices IPC, Nasdaq, TSE y DJI, respectivamente, cuya capacidad predictiva es significativa en cada uno de ellos. Además, estos modelos superaron el rendimiento de una estrategia buy and hold en 57, 59, 71 y 41% de los casos en los índices DJI, IPC, TSE y Nasdaq, respectivamente.
De esta manera, se presenta pruebas de que la capacidad de los modelos de lógica y lógica borrosa podría resultar pertinente para predecir el signo de las variaciones de los indices bursátiles abordados en este estudio, lo que los situa como una opción al análisis técnico, a los modelos naive, a las redes neuronales y a los algoritmos genéticos aplicados en series de tiempo, para predecir la evolución del mercado bursátil.
* Palabras clave: lógica borrosa, funciones de pertenencia, conjuntos de pertenencia, reglas de comercio (trading), desfuzificación, porcentaje de predicción de signo, prueba de acierto direccional. Clasificación JEL: G10, G14, G15. Artículo recibido el 14 de abril y aceptado el 16 de agosto de 2005. Los autores desean agradecer los comentarios realizados por Jorge Gregoire, Fernando Bravo, Jorge Niño, Alex Silemberger, y a los participantes en el seminario realizado en el Departamento de Administración de la Universidad de Chile. También a Edinson Cornejo, por su labor como asistente de investigación.
1 Dow Jones Industry (DJI) de la New York Stock Exchange (NYSK), Estados Unidos. Índice de Precios y Colizaciones (IPC) de la Boisa Mexicana de Valores (BMV), México. Toronto Stock Exchange (TSE), Canada.
2 Véase el apéndice.
3 El conjunto intramuestral corresponde al conjunto de datos históricos con los cuales se simulera un millon de posihles combinaeiones lógiras, a fin de eneontrar el modrlo que maximice el PPS. No obstante, al operar en este conjunto, el modelo proyectará las variaciones en t + 1 únicamente a partir de la información disponible entre los periodos t - 4 y t.
4 μ^sup i^^sub j,t^, μ^sup i^^sub t^, σ^sup i^^sub t^ y σ^sup i^^sub j,t^ fueron calculados con las variaciones experimentadas por los índices respectives durante los pasados 20 días de operación bursátil, incluyendo el momento t.
5 Se evaluó la calidad de cada uno del millón de modelos generados tanto por el proceso de lógica como de lógica borrosa.
6 Directional Accuracy Test.
7 Para efectos de realizar un análisis comparativo de la rentabilidad ohtenida en los índices bursátiles al aplicar las estrategias de comercio, se considero como rosto de transacción el del mercado bursátil estadunidense, el cual es fijo. El costo de transacción del mercado estadunidense depende del corredor de bolsa (broker) empleado, y fluctúa entre 7 y 20 dólares por transacción. En función de esto, el estudio consideró un costo de 15 dólares por transacción, situando así el análisis en un punto intermedio.
8 El término data snooping (también conocido como data mining), "ocurre cuando un determinado conjunto de datos es usado más de una vez para propositos de inferencia o selección de modelos. Cuando esta reutilización de datos ocurre, siempre existe la posibilidad At que cualquier resultado satisfactorio que se haya obtenido pueda deberse sencillamente a la suerte, en vez de a algun mérite inherente al modelo que generó esos resultados" (White, 2000).
9 A partir de los datos del conjunto extramuestral, y por medio de un proceso de block-boots-trap, se generaron mil subconjuntos extramuestrales de 20 observaciones diarias cada uno. El tamano de los subconjuntos busca conformar periodes mensuales de comercio (20 días hábiles). De esta manera se busca analizar la capacidad de los modelos para generar rendimientos extranormales en periodos de corto y largo plazos.
10 Una manera de probar la bondad de los modelos y la validez de sus resultados, independientemente de la muestra de datos a la que ha side dirigidos, es aplicar un proceso de bootstrap. El bootstrap es un proceso de generación de observaciones ficticias a partir de datos históricos, a fin de dar solución al problema de escasez de datos y, de esta manera, tener suficiente información para elaborar diferentes conjuntos extramuestrales con los cuales probar la validez de los modelos.
11 La estrategia buy and hold es una estrategia de inversión pasiva que no aplica gestión alguna. Consiste en comprar el activo de que se trate y mantenerlo durante todo el periode de inversión, para venderlo al final de éste. La rentabilidad de esta estrategia está dada por la diferencia entre el valor de venta y el de compra del active analizado.
REFERENCIAS BIBLIOGRÁFICAS
Chopra, N., J. Lakonisliok y J. R. Ritter (1992), "Measuring Abnormal Returns: Do Stocks Overreact?", Journal of Financial Economics 31, pp. 235-268.
DeBondt, W. F. M., y R. Thaler (1985), "Does the Stock Market Overreact?", Journal of Finance 40, pp. 793-805.
Dourra, H., y P. Siy (2001), "Stock Evaluation Using Fuzzy Logic", International Journal of Theoretical and Applied Finance, vol. 4, num. 4, pp. 585-602.
Fama, E., y K. R. French (1988), "Permanent and Temporary Components of Stock Prices", Journal of Political Economy, 98, pp. 247-273.
Leung, Mark T., Hazem Daouk y An-Sing Chen (2000), "Forecasting Stock Indices: A Comparison of Classification and Level Estimation Models", International Journal of Forecasting (16)2, pp.173-190.
Lo, A., y A. C. MacKinley (1988), "Stock Market Price Do not Follow Random Walk: Evidence from a Simple Specification Test", Review of Financial Studies 1, pp. 41-66.
Parisi, A., F. Parisi y J. L. Guerrero (2003), "Modelos predictives de redes neuronales en índices bursátiles internacionales", EL TRIMESTRE ECONOMICO, vol. LXX (4), núm. 280, pp. 721-744.
_____, _____ y E. Cornejo (2004), "Algoritmos genéticos y modelos multivariados recursivos en la prediccion de indices bursátiles de America del Norte: IPC, TSE, Nasdaq y DJI", EL TRIMESTRE ECONOMICO, vol. LXXI (4), num. 284, pp. 789-809.
Pesaran, M. H., y A. Timmermann (1992), "A Simple Nonparametric Test of Predictive Performance", Journal of Business and Economie Statistics 10, pp. 461-465.
Poterba, J. M., y L. H. Summers (1988), "Mean Reversion in Stock Prices: Evidence and Implications", Journal of Financial Economics 22, pp. 27-59.
Tsibouris, G., y M. Zeidenberg (1995), "Testing the Efficient Markets Hypothesis with Gradient Descent Algorithms", A. P. Refenes (comp.), Neural Networks in the Capital Markets, Chichester, Reino Unido, Wiley, pp. 127-136.
White, H. (1993), "Economic Prediction Using Neural Networks: The case of IBM Daily Stock Returns", R. R. Trippi y E. Turban (comps.), Neural Networks in Finance and Investing, Nueva York, Irwin, pp. 315-328.
_____ (2000), "A Reality Check for Data Snooping", Econométrica, vol. 68, núm. 5, pp. 1097-1126.
Antonino Parisi F. y Franco Parisi F.**
** A. Parisi F., profesor asistente, Departamento de Administración, Universidad de Chile. EuroAmerica Chair in Finance. F. Parisi F., profesor asociado, Departamento de Administración, Universidad de Chile. EuroAmerica Chair in Finance [correo electrónico: fparisi@negocios. uchile.cl].
APÉNDICE
Las operaciones en conjuntos establecen las reglas para determiner los conjuntos de unión, intersección y complemento. Estos se construyen por medio de funciones que manipulan los conjuntos para obtener nuevos conjuntos. Cada planeador puede definir o elegir la operación de unión, intersección o complemento que desee. Estas operaciones deben cumplir con ciertas caracteristicas:
i) El complemento del conjunto borroso A, C(A), es el conjunto que contiene los elementos que no pertenecen a A. Cumple con: Contorno, en los extremes se comporta igual que la negacion nitida. C(1) =0 y C(0) = 1; Monotonía, el complemento es monotono no decreciente; Involución, C(C(A)) = A.
ii) La intersección "i" asociada a los conjuntos borrosos A y B cumple las siguientes propiedades: Contorno, en los extremes se comporta igual que la intersección nitida, es decir i(0,0),0) =0; i(0,1) =0, e i(1, 1) = 1; Conmutatividad, i(A, B) = i(B, A); Monotonía, la intersección "i" es monótona creciente, es decir: A ∈ A', R e B' [implies] i(A, B) e i(A', B');Asociatividad,i(i(A, B),C) - i(A, i(B, C)). Las funciones que verifican estas propiedades se denominan i-normas.
iii) La unión "u" de los conjuntos borrosos A y B la denotames por u(A, B)la cual cumple con las siguientes propiedades: Coniorno, en los contornos se comporta igual que la interseccion nítida. u(0, 0) = 0; u(0, 1) = 1; u(1, 1) = 1; Conmutatividad, u(A, B) = u(B, A); Monotonía, la unión "u" es monótona creciente, es decir, A ∈ A',B ∈ B' [implies] u(A, B) ∈ u(A', B');Asociatividad, u(u(A, B),C) = u(A, u(B, C)). Las funciones que cumplen estas propiedades se denominan t-conormas.
La t-normas y la t-conormas se hallan relacionadas. De este modo, fijando una de ellas se puede deducir la otra. A modo de ilustración, en el siguiente cuadro se presentan algunas reglas de t-normas y t-conormas sobre conjuntos difusos.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Copyright Fondo de Cultura Economica Apr-Jun 2006