Los modelos de lenguaje extenso (LLM) promocionados para la sincronización del mercado de valores pierden su ventaja durante períodos prolongados y no logran adaptarse cuando las condiciones del mercado cambian, según un estudio publicado el 25 de junio que desafía la premisa de las estrategias de trading impulsadas por IA.
"Los LLM muestran un rendimiento inicial sólido en tareas de sincronización del mercado, pero esa ventaja se erosiona a medida que se alarga la ventana de evaluación y cambian los regímenes del mercado", dijo el autor principal del estudio, cuya investigación probó múltiples modelos fronterizos frente a índices de referencia de comprar y mantener en distintos horizontes temporales. El artículo aún no ha sido revisado por pares.
La investigación probó modelos como GPT-4 de OpenAI y Claude de Anthropic en tareas como predecir movimientos direccionales del S&P 500 y señales de rotación sectorial. Si bien los modelos registraron tasas de precisión superiores al 55 % en los primeros tres meses de trading simulado — superando el azar y las estrategias simples de impulso — el rendimiento cayó a niveles cercanos a la línea base durante períodos de 12 meses. La caída fue más pronunciada durante los picos de volatilidad y las reversiones de tendencia, donde los modelos no lograron ajustar su generación de señales.
Los hallazgos llegan en un momento en que el mercado de herramientas de inversión impulsadas por IA se expande. Los activos bajo gestión en fondos cuantitativos impulsados por IA han crecido hasta un estimado de USD 450 mil millones a nivel mundial, según datos de Preqin, con firmas como Two Sigma, Renaissance Technologies y Bridgewater Associates invirtiendo fuertemente en sistemas de trading basados en LLM. El estudio sugiere que los modelos entrenados con datos históricos pueden codificar patrones que se rompen cuando la microestructura del mercado cambia, un problema conocido como cambio de distribución que ha afectado durante mucho tiempo a las estrategias cuantitativas.
Por qué los modelos generalistas tienen dificultades con los mercados
La limitación central radica en cómo se construyen los LLM. Estos modelos optimizan para la comprensión amplia del lenguaje a través de millones de ejemplos de entrenamiento, no para los patrones estrechos y dependientes del régimen que impulsan los mercados financieros. Un modelo entrenado con texto de 2020 a 2024 puede aprender correlaciones — como que la caída de los rendimientos de los bonos del Tesoro impulse las acciones tecnológicas — que se invierten cuando el entorno macroeconómico cambia, como ocurrió cuando la Reserva Federal comenzó su ciclo de ajuste en 2022.
Esto refleja una tendencia más amplia identificada por ScaleDown AI, una firma de evaluación comparativa que recientemente descubrió que los modelos de lenguaje pequeños y específicos para tareas superan a los LLM fronterizos en trabajos de clasificación especializados en un 8 %, mientras son 161 veces más baratos de ejecutar. El mismo principio se aplica a la sincronización del mercado: un modelo generalista al que se le pide predecir la dirección de una acción carga con la sobrecarga de miles de millones de parámetros entrenados para tareas no relacionadas, mientras que un modelo creado para un propósito específico podría, en teoría, concentrar su capacidad en señales específicas del mercado.
Lo que esto significa para las estrategias de trading con IA
Para los inversores, el estudio plantea preguntas sobre la durabilidad del alfa impulsado por IA. Si las estrategias de sincronización basadas en LLM se deterioran con el tiempo, los USD 450 mil millones que fluyen hacia fondos mejorados con IA podrían enfrentar una crisis de rendimiento a medida que las condiciones del mercado cambien inevitablemente. La investigación sugiere que las firmas que dependen de modelos fronterizos genéricos para señales de trading podrían ver erosionada su ventaja sin una detección continua de regímenes y un reentrenamiento del modelo, capacidades que siguen siendo costosas y difíciles de implementar a escala.
Los fondos de cobertura cuantitativos que construyen modelos propietarios y específicos del mercado podrían tener un mejor desempeño que aquellos que utilizan LLM de propósito general, pero los hallazgos del estudio se aplican ampliamente a cualquier sistema entrenado con patrones históricos de precios sin un manejo explícito del cambio de régimen. El artículo recomienda que los sistemas de trading con IA incorporen mecanismos de filtrado basados en volatilidad que reduzcan la influencia del modelo durante los cambios de régimen, una característica ausente en la mayoría de las implementaciones actuales.
Este artículo es solo con fines informativos y no constituye asesoramiento de inversión.