Etiqueta: DataBasedTrading

La Gripe y las Variables Ocultas

La Gripe y las Variables Ocultas

Hace muchos-muchos años un excelente profesor en gestión de datos nos aleccionaba sobre las sutiles diferencias entre las variables relacionadas y los riesgos de atribuirles sistemáticamente causa-efecto.

El ejemplo práctico que nos planteó me sigue pareciendo útil. Nos pidió que imaginásemos una tabla temporal que reflejara la primeras nevadas en los Alpes y, del otro lado, la aparición de la gripe en cualquier punto del hemisferio norte.

Nos preguntó si nos parecía factible que hubiese una fuerte relación y coincidencia entre ambos acontecimientos. Todos estábamos de acuerdo en que era muy probable que ambas variables tuvieran una fuerte correlación temporal. Y también que esa relación tuviera un importante histórico que la avalase.

«Así pues –concluyó– ¿podríamos decir que la aparición de la gripe en cualquier parte del mundo y las primeras nevadas en los Alpes están relacionadas?«

En ese punto, toda la clase quedó callada. No nos atrevíamos a decir que sí, porque era un absurdo. Una nevada en Suiza no puede causar ningún efecto sobre la salud de la población en China o Siberia. Tampoco nos atrevíamos a decir que no, porque acabábamos de admitir que existía una relación evidente entre ambos hechos.

«Así pues –concluyó– ¿podríamos decir que la aparición de la gripe en cualquier parte del mundo y las primeras nevadas en los Alpes están relacionadas?»

Evidentemente, había una «variable oculta» común, que era «el frío», factor desencadenante de las dos anteriores.

Pero, lo importante es que este tipo de especulaciones entre variables relacionadas son una de las más habituales «trampas» de aspecto matemático-científico que sirven, en el mejor de los casos, para distraernos con algún titular llamativo o, en el peor, para confundirnos.

Quédense con el ejemplo, por favor. Y con el concepto de las «variables ocultas», causantes reales de algunas relaciones aparentemente sorprendentes, pero que pueden ser ambas simultáneamente EFECTO y, ninguna de ellas, CAUSA de la otra.

La Información Que Falta

La Información Que Falta

En general obtenemos información de los datos presentes. Los identificamos, los clasificamos, los procesamos y extraemos conclusiones en forma de gráficos.

Pero, muchas veces olvidamos que también podemos obtener información de los datos que, en cada contexto, deberían estar presentes y NO lo están. Estaríamos hablando de obtener información «por defecto». Por ausencia de datos que deberían estar presentes.

En un entorno tan variable y ruidoso como el de el flujo de datos de los mercados, es interesante tenerlo presente y observar tanto lo que podríamos considerar como estructuras de datos comunes o patrones como sus alteraciones gráficas, generalmente debidas a deficiencias en datos.

Determinados déficits de datos en situaciones tipo pueden ser TAN significativos como los propios patrones y, en ocasiones, ocasionan situaciones completamente opuestas.

Como en un sudoku, la resolución viene de la componente entre los datos presentes y los ausentes; lo que hay y lo que no hay pero debería estar.

Los Mercados son Información

Los Mercados son Información

«Lo que en la bolsa todos saben, a mí ya no me interesa»

André Kostolany

Los Mercados son sistemas de intercambio de información.

Ese es su principal objeto: comunicar de forma pública una información relevante, en este caso concreto, el precio de los activos valorados.

Esta declaración, poco discutible desde cualquier óptica, no va en contra de cualquier otra interpretación o forma de abordar los mercados y su operativa. Simplemente abre una nueva puerta desde la que estudiarlos, abordarlos e interpretarlos: la del análisis de los datos y sus flujos; una especialidad propia del siglo XXI.

Los mercados son datos que fluyen. Un sistema ultra-complejo -casi orgánico- de reglas estrictas; un número prácticamente ilimitado de procesos paralelos y variables tendiendo al infinito. ¿Irresoluble? Quizás, pero no por ello deja de ser apasionante intentar desmenuzar algunos de sus componentes.

Los Mercados son sistemas de intercambio de información.

Datos que fluyen.

La complejidad del sistema es tal que es muy difícil identificar y reconocer cada proceso individualmente para poder aislarlo y estudiarlo o, simplemente, identificar las fuentes fiables y separarlas de las que no lo son.

Pongamos mejor un ejemplo práctico. Desde ese punto de vista, sería como pasear por un gran bazar repleto de gente ya que, en el fondo, los mercados financieros del siglo XXI no dejan de ser una forma evolucionada de un típico mercado donde compradores y vendedores se encuentran y negocian, aunque ahora sea digital y remotamente.

Desde el punto de vista de la Teoría de la Información (TI), puedes captar alguna que otra frase entrecortada aquí y allá entre el tremendo ruido de la multitud y del propio bazar. Aunque todas las conversaciones que en él se producen sean, una por una, coherentes, seguramente no tiene mucho sentido preguntarse de qué habla el mercado en cada momento. Es un problema básico de ruido y señal.

De las conversaciones parciales que captamos a nuestro paso, puede que lleguemos a comprender el sentido de alguna, que nos equivoquemos en la interpretación de la mayoría, o que entendamos justo lo contrario a lo que se está diciendo en otras. Eso es un problema derivado de la información fragmentada o incompleta. Además, es muy difícil saber de entre todas esas conversaciones entrecortadas, quién miente y quién dice verdad.

Pero, cuando nosotros mismos establecemos conversación con un comerciante, podemos llegar a establecer un negocio. Y, si hemos sido hábiles, ya sabremos de antemano a qué precio se está negociando esa mercancía que nos interesa en otros puntos del bazar. Así, dentro del jolgorio, del ruido y del supuesto caos de un mercado aparentemente no coherente, podemos obtener la información estrictamente necesaria para realizar un buen negocio concreto: el nuestro.

Tú crees que especulas, pero sólo analizas información.

Así manejamos la Teoría de la Información en nuestra vida cotidiana: sin pensar en ella y sin conocer sus estrictas reglas matemáticas. Distinguimos señal de ruido, extraemos conclusiones de los datos disponibles en informaciones fragmentadas, y separamos fuentes fiables de las que no lo son. Tratamos y procesamos toda esa la información intuitivamente. Es así de fácil y así de difícil.

Por eso a mí me gusta recordar que igual tú crees que especulas, pero sólo analizas información.

¿Se pueden entender mejor los mercados con nuevas herramientas basadas en técnicas de gestión de datos del siglo XXI? Ese es el desafío.


Si te interesa este tema:

Sistemas, Temporalidad y Beneficios

Sistemas, Temporalidad y Beneficios

Una de las cosas que más me ha llamado siempre la atención es la evidente descorrelación entre los resultados de los sistemas según las diferentes temporalidades aplicadas. Un sistema automático puede ser bueno en 2 minutos, malo en 3, regular en 5, pésimo en 10, muy malo en 15, extraordinario en 20, mediocre en 30…, y así sucesivamente. ¿Por qué nadie habla de esto?

No existe una pauta reconocible que te haga posible establecer si el rendimiento mejora o empeora aumentando o disminuyendo la temporalidad del gráfico.

Alejándome todo lo posible para intentar ver con más claridad las causas de este paradójico hecho, creo que la clave está en el concepto base de la operativa típica del trading (lo que equipararíamos al «core sys«): en trading difícilmente se considera el tiempo como un continuo variable, sino se lo fracciona en porciones iguales de forma más o menos caprichosa y se espera que todas y cada una de esas fracciones tengan sentido por sí mismas y en relación con el resto.

Desde el punto de vista del análisis de la información eso es ridículo y no tiene ningún sentido. Imaginen que apliquemos un concepto parecido a un documento y agrupemos las palabras en grupos fijos de 3, de 5 o de 15 palabras, en lugar de hacerlo por frases completas. Evidentemente las frases y párrafos estarían ahí, pero esperar que encajase con alguna medida fija concreta sería bastante difícil. ¿Qué bloque fijo de palabras sería más comprensible? ¿Cuál nos aportaría mejor señal/mensaje? Evidentemente el que se acercase más a la media de las frases.

En trading difícilmente se considera el tiempo como un continuo variable, sino se lo fracciona en porciones iguales de forma más o menos caprichosa y se espera que todas y cada una de esas fracciones tengan sentido por sí mismas y en relación con el resto.

Los sistemas (y los indicadores antes que ellos) operan, básicamente, tomando los datos de cada elemento (barra o vela) e intentando establecer relaciones entre ellos y con los anteriores.

Sin embargo, convertidos en un sistema, poco tienen que ver los datos operativos que obtenemos de una vela de 60 minutos o de las 60 velas de 1 minuto que lo componen. En la vela horaria, podríamos ver una apertura muy por debajo de un cierre, con pocas sombras, mientras que en las 60 velas que la forman quizás observásemos una fuerte arrancada, una mayor bajada, dos periodos de lateralidad y una subida final realizada en los últimos minutos.

¿Cuál de estas dos situaciones es real? Evidentemente, ambas. Pero el mismo sistema automático generará dos operativas muy distintas con el mismo bloque de información dependiendo de cómo la fraccionemos, hasta el punto de que, sólo por ese factor los resultados operativos serán completamente diferentes en ambos casos. Desde la vista de la vela horaria, las órdenes del sistema en un minuto resultarían completamente incomprensibles, incluso absurdas.

Evidentemente, fraccionar el tiempo de trading en porciones iguales no parece la mejor fórmula para analizar qué está sucediendo en el mercado, si entendemos el mercado como un flujo continuo de información. Volúmenes o ticks quizás fueran una mejor opción, pero tampoco (por ahora) tengo razones para justificarlo más que por eliminación y descarte. (Acabado el estudio, meses más tarde, sí pude explicarlo y justificarlo con datos)

Un mismo sistema automático generará dos operativas muy distintas con el mismo bloque de información sólo dependiendo de cómo la fraccionemos

Creo que la clave está en la forma de la velas, en cómo fraccionamos la información para que sea lo más coherente posible. De hecho, este problema es uno de los básicos dentro de la gestión técnica de la información: cómo empaquetar de forma coherente la información [entendiendo, en este caso, como ‘paquete’ cada una de las velas].

De todos modos, cuando intento poner a trabajar un sistema sobre ticks en tiempo real y la plataforma no me lo permite, vuelvo a darme cuenta de lo limitados que estamos todavía para poder escudriñar el mercado desde otros puntos de vista de los tradicionalmente establecidos.


Si te interesan más artículos sobre el tema:

Buscando El Patrón Señal/Ruido

Buscando El Patrón Señal/Ruido

Estudio de la Frecuencia de Series Consecutivas de Velas

Les voy a hacer un resumen, porque todavía siento que estoy a medio camino. Quizás de aquí un tiempo, cuando sea capaz de completarlo y complementarlo, merezca algo más largo y detallado. Por ahora, comparto este breve avance y los primeros resultados.

Ya saben que mi idea base es considerar y tratar la información bursátil bajo la perspectiva de la más estricta de la gestión de datos. Grandes volúmenes de datos transitando a gran velocidad.

Resumiéndolo mucho, todo se reduciría a separar señal de ruido y operar siguiendo exclusivamente la señal, cosa que en terminología trader conocemos como “tendencia”.

Llegados a ese punto, me planteé si podría encontrar alguna forma objetiva de medir la proporción de señal/ruido existente para cada temporalidad y activo.

Mi primera hipótesis de trabajo era que a mayor cantidad de señal, mayor sería la frecuencia de series de velas consecutivas, ya fueran alcistas o bajistas. Y, en sentido contrario, cuanto más difícil que velas consecutivas muestren una misma dirección, mayor ruido.

El siguiente paso fue diseñar herramientas para realizar un recuento automático, tomar los datos y procesarlos para ver si encontraba un patrón lógico de evolución de esa hipotética señal/ruido.

Hoy comparto con ustedes algunos gráficos sobre muestras de unas 10.000 velas en cada una de las temporalidades. Sería estupendo que alguien más realizara un estudio parecido para comparar resultados.

En los siguientes gráficos se muestra la probabilidad de encontrar una serie consecutiva de velas (cualquier cantidad) frente a la pura alternancia.

O, si lo prefieren interpretar de otro modo, dada una vela cualquiera, el gráfico marca la probabilidad de que la/s siguiente/s tengan el mismo sentido.

Como siempre he presumido de tener unos lectores de nota, no necesitan de mis conclusiones. Si me lo permiten, me las reservo para más adelante [cuando acabe pruebas complementarias], pero ustedes pueden ir extrayendo las suyas propias. Sólo me gustaría destacar la evidencia de que cada activo parece tener una “huella” propia y casi única. Interesante, ¿verdad?

Espero que lo encuentren útil y, si es así, no sean egoístas y compártanlo como he hecho yo.


Sobre este mismo tema, también te puede interesar:

Probabilidades y Velas Consecutivas

Probabilidades y Velas Consecutivas

¿Qué posibilidad hay que después de una vela alcista, se dé otra en el mismo sentido? ¿Cuál es la probabilidad que, después de dos velas alcistas, se produzca una tercera? ¿Y cuál es la probabilidad que se den 7 u 8 velas alcistas o bajistas consecutivas?

La verdad es que hallar respuesta a estas preguntas [quizás estúpidas, aunque NO me lo parece] es simple: basta con tomar una muestra y contar para salir de dudas.

Como soy un perezoso redomado (y poco amante de los conteos manuales) me he diseñado un par de «cacharrines» para que me ayuden y he obtenido algunas respuestas.

Por ejemplo, voy a compartir con ustedes [por esa paciencia que demuestran aguantándome y leyendo estas cosas mías] los resultados que acabo de obtener sobre el FIBEX en diferentes temporalidades y sobre una muestra media de unas 14.000 velas en cada muestra hecha ya hace algún tiempo, aunque no tengo razones para pensar que no sea (salvo mínimas variaciones) vigente.

No creo que la tabla sea muy difícil de interpretar, pero la explicaré. A la izquierda, las diferentes temporalidades, en la parte superior y en porcentaje las veces que se han dado grupos de velas consecutivas del mismo signo, desde 2 velas consecutivas (2v) hasta grupos de 10 o más (>=10). En la parte inferior, y sobre fondo amarillo, las medias de esas muestras para cada grupo.

Pasando directamente a las conclusiones, resulta que la probabilidad de que a una vela cualquiera del FIBEX en cualquier temporalidad le siga una del mismo color es de un 46,34% contra un 53.66% de probabilidades de que no lo sea.

Por ejemplo, las probabilidades de que se dé un grupo 2 velas seguidas (para el FIBEX y en la muestra estudiada) ha sido del 23,96% (1 de cada 4 ocasiones) y de que a esas se les una una tercera, sólo pasará 1 de cada 10 veces. Encontrar 6 velas consecutivas del mismo signo pasa 1 de cada 100 veces, y hallar un grupo de 10 velas o más consecutivas, se da 2 veces cada 1.000.

La probabilidad de que a una vela cualquiera del FIBEX en cualquier temporalidad le siga una del mismo color es de un 46,34% contra un 53.66% de probabilidades de que no lo sea.

En general las proporciones son lógicas pero, por mor de esa manera de tratar la información de las cotizaciones que es cortarla en cachitos iguales de tiempo, se dan singularidades curiosas.

¿Qué quiere decir y para qué sirve todo esto?

Recuerdo que mi profesor de física de bachiller nos explicaba que, a lo largo de los siglos, han sido miles y miles los que han desbordado una bañera demasiado llena al introducir su cuerpo. Pero sólo Arquímides sacó de este hecho una conclusión con aplicaciones prácticas. Si al final lo conseguimos, gritaremos «¡Eureka!«


Este artículo fue precursor de una ponencia presentada públicamente meses después y un vídeo posterior.

InfoTrading y Nuevos Indicadores

InfoTrading y Nuevos Indicadores

Vídeo de la presentación realizada en el IG Trading Barcelona (18/6/2015)

Mi sincero agradecimiento a IG Trading por invitarme a participar en ese evento.

Como ya hice en una anterior ocasión y para facilitar el visionado de las partes de interés, he elaborado una tabla de tiempos y temas para su más fácil localización en el vídeo.

  • 00:00 – 02:19              Presentación
  • 02:20 – 04:20              Lo más importante: ¡SEAN CRÍTICOS, por favor!
  • 04:21 – 06:50              Una historia de maletas (Aplicación de Tecnología)
  • 06:50 – 08:30              InfoTrading: Gestión de Datos Bursátiles
  • 08:30 – 10:15              Desaprender y el «Enfoque Data»
  • 10:15 – 11:20              Datos y Fuentes de Datos
  • 11:20 – 16:40              Preguntas inquietantes y mitos a derribar
  • 16:40 – 19:20              Indicadores Técnicos y el «Cuento» del pastor
  • 19:20 – 23:30              Por Qué se necesitaban nuevos indicadores
  • 23:30 – 24:45              Nuevas herramientas y Nuevos enfoques
  • 24:45 – 33:00              BLAI5 ATLAS a fondo
  • 33:00 – 48:00              BLAI5 VIGÍA a fondo
  • 49:00 – 59:00              Conclusiones y Preguntas
Webminario: Del Trading al InfoTrading

Webminario: Del Trading al InfoTrading

Estos son los conceptos básicos que rigen mi forma de analizar los mercados desde la perspectiva del análisis de los flujos de datos y los principios de la Teoría Matemática de la Información y por qué decidí hacerlo así. Una mirada justificadamente alternativa al trading tradicional.

Vídeo: Temporalidad vs. Ticks ¿Qué es mejor?

Vídeo: Temporalidad vs. Ticks ¿Qué es mejor?

Desde el punto de vista del análisis de datos, nos cuestionamos por qué en el trading generalmente se fracciona la información en porciones iguales de tiempo (velas temporales isocrónicas) y se analiza si esa es la mejor opción.

Estudio comparativo realizado en 2015 y presentado como ponencia.

Webminario: Unidades Básicas de Información en el Trading

Webminario: Unidades Básicas de Información en el Trading

Nuestras plataformas gráficas son, técnicamente, bases de datos gráficas. Pero, ¿cuál es la unidad mínima de información que manejan? ¿Cómo resulta más coherente manejarla para obtener los mejores resultados? Y, por último, ¿la forma en que agrupemos esa información puede alterar o modificar los cálculos y algoritmos?