Ciencia de datos, investigación de mercados, IA

Pronósticos VAR y VEC en investigación de mercados.

Escrito por Gabriel Contreras | 19/06/2026 06:42:04 PM

Dónde convergen las empresas de investigación de mercados y las empresas de analítica de datos para anticipar la experiencia de cliente de todos los jugadores a la vez

La pregunta que llega del área de negocio suele formularse en singular: ¿cómo evolucionarán nuestro NPS, nuestra satisfacción y nuestra intención de recompra en los próximos meses? La respuesta básica también es singular: se toma la serie histórica de la marca, se ajusta un modelo a su propia inercia y se proyecta. Funciona, hasta que uno mira el resultado al lado del de los competidores y nota que algo no cierra. Responderla bien es justo el terreno en el que las empresas de investigación de mercados y las de analítica de datos dejaron de ser oficios separados: hace falta entender la categoría y, a la vez, modelar su dinámica con herramientas estadísticas.

El problema es que un mercado de experiencia de cliente rara vez es una colección de trayectorias independientes. Cuando un operador mejora su atención y captura promotores, estos provienen de algún lado. Una caída de red que afecta la percepción de calidad no respeta fronteras de marca: arrastra a varias a la vez. Y la evaluación que un cliente hace de su proveedor está anclada, casi siempre, a una comparación implícita con las alternativas que conoce. La métrica de cada jugador lleva adentro información de los demás.

El pronóstico individual no se autocontiene

Ahí aparece la primera grieta del enfoque marca por marca: los pronósticos individuales no se autocontienen. Cada uno se construye como si el resto del mercado fuera ruido de fondo, y al juntarlos pueden describir un futuro que no podría ocurrir —todas las marcas subiendo su satisfacción relativa en el mismo trimestre, por ejemplo, como si el share of satisfaction no sumara un total. La inconsistencia no es un detalle estético. Significa que cada modelo está descartando, una y otra vez, la señal presente en la covarianza entre competidores.

La hipótesis de trabajo es directa: lo que mueve la métrica de una marca el mes que viene ya está escrito en lo que les pasó a sus rivales este mes. Si eso es cierto —y la magnitud depende de la categoría—, modelar las series por separado deja valor predictivo sobre la mesa y, sobre todo, impide leer la dinámica competitiva como lo que es: un sistema acoplado.

Modelar el mercado como un sistema: el aporte de las empresas de analítica de datos

Un modelo de vectores autorregresivos (VAR) toma en serio ese acoplamiento. En lugar de explicar cada métrica solo por su propio pasado, la explica por su pasado y por el pasado de todas las demás del mercado. La estructura, que Sims introdujo a comienzos de los ochenta para macroeconomía, traduce bien a la investigación de experiencia: cada operador es una ecuación, y el sistema completo captura cómo se influyen entre periodos.

Eso habilita preguntas que el modelo individual no puede formular. Si el alza de NPS de un competidor tiende a anteceder la caída del propio —lo que se examina con causalidad de Granger—, el sistema lo recoge como un rezago cruzado, y el pronóstico de cada serie hereda esa interdependencia. El resultado son trayectorias mutuamente consistentes: cuando el modelo proyecta un movimiento para un jugador, las demás proyecciones reaccionan en consecuencia, porque comparten las mismas ecuaciones.

El equilibrio de largo plazo: cointegración y VEC

Hay un escalón más. A veces las métricas de varios competidores comparten una tendencia común de fondo —un nivel latente de la categoría que sube cuando el sector entero mejora su servicio, o baja cuando una crisis lo arrastra—. Cuando ocurre, las series individuales pueden vagar bastante, pero la distancia entre ellas se mantiene atada: se dice que están cointegradas.

Un modelo de corrección de errores (VEC) está pensado para ese caso. Además de los rezagos cruzados, incorpora una fuerza de retorno: cuando una marca se aleja demasiado del equilibrio de largo plazo con el resto del mercado, el modelo estima a qué velocidad tiende a corregirse. Conceptualmente, trata a los competidores como cuerpos atados por una misma gravedad de categoría; los desvíos son transitorios y el sistema los reabsorbe. Para un mercado maduro y estable, esa lectura suele ser más fiel que la de series que flotan sin ancla.

Cuándo el sistema le gana a las partes

El atractivo conceptual no garantiza el resultado empírico, y conviene decirlo antes que después. Un sistema de este tipo paga su poder con parámetros: con K jugadores, el número de coeficientes a estimar crece aproximadamente con el cuadrado de K. La pregunta operativa no es si el mercado está acoplado —casi siempre lo está—, sino si la historia disponible alcanza para estimar ese acoplamiento con precisión útil.

De ahí se desprenden las condiciones que inclinan la balanza, más como gradientes que como reglas:

La longitud de la serie frente al número de jugadores. Tres o cuatro operadores con varios años de medición mensual dejan margen; el mismo modelo sobre dos años de historia y diez competidores estima ruido con confianza espuria, y sus intervalos engañan al subestimar la incertidumbre real.

La naturaleza de la correlación. Que dos métricas se muevan juntas en el mismo mes no implica que una ayude a pronosticar a la otra el mes siguiente. El valor del sistema vive en la dinámica cruzada con rezago, no en la correlación contemporánea, que un modelo individual ya absorbe de forma indirecta.

La estabilidad estructural. Una campaña agresiva, un cambio regulatorio o una fusión rompen la relación histórica entre jugadores. El sistema asume que las reglas del juego de ayer siguen vigentes mañana; cuanto más cerca de un quiebre, menos confiable la proyección.

La disciplina que ordena todo esto es una sola: validar fuera de muestra contra alternativas simples. Antes de adoptar el sistema, conviene reservar los últimos meses, pronosticarlos con el VAR, con el VEC y con un modelo univariado por serie —incluso con un ingenuo estacional— y comparar el error. El sistema se gana su lugar cuando vence ahí; cuando no lo hace, la complejidad cruzada está restando precisión, y la lectura honesta es que el mercado, para fines de pronóstico, se comporta como piezas más sueltas de lo que la intuición sugería.

Mercados anchos: muchos jugadores, muchos atributos

El planteamiento se tensiona cuando el objeto a pronosticar no son cuatro NPS sino veinte o treinta indicadores —varios atributos de imagen por cada marca, por ejemplo—. Ahí el VAR clásico se queda sin grados de libertad mucho antes de volverse informativo. Dos caminos sostienen la idea de sistema sin la fragilidad del modelo ancho: el encogimiento, donde un VAR bayesiano regulariza los cientos de coeficientes hacia un comportamiento por defecto y mantiene el sistema estimable; y la reducción de dimensión, donde se extraen unos pocos factores latentes que resumen la batería —la mayor parte de la covarianza de los atributos de imagen suele caber en dos o tres dimensiones— y se pronostican esos factores. El primero conserva la lectura jugador por jugador; el segundo gana parsimonia leyendo dimensiones en vez de indicadores.

La lectura para el negocio: lo que piden las empresas de investigación de mercados

Para quien decide, el valor de modelar el mercado como sistema migra del número puntual hacia la estructura. Un pronóstico conjunto coherente responde preguntas que la proyección aislada no toca: si un competidor recupera terreno, qué implica eso para el resto; qué tan rápido tiende el mercado a reabsorber una ventaja transitoria; cuál jugador tiende a moverse primero y arrastrar a los demás. Esa lectura de quién mueve a quién suele ser más accionable para una estrategia competitiva que el decimal exacto del NPS del próximo trimestre.

Al mismo tiempo, conviene sostener la expectativa en su sitio. En paneles cortos, la precisión del sistema puede no superar a la de un modelo simple, y forzarlo agrega una falsa sensación de control. El criterio que mejor envejece combina las dos cosas: usar el sistema para entender la arquitectura del mercado y para garantizar escenarios consistentes entre jugadores, y apoyarse en la validación fuera de muestra para decidir, caso por caso, cuánto peso darle al número que produce. Esa combinación —criterio de categoría y rigor de modelamiento— es la que distingue a las empresas de investigación de mercados y a las empresas de analítica de datos cuando trabajan como una sola práctica.

En Sinnetic integramos investigación de mercados y analítica de datos: modelamiento estadístico, simulación y economía del comportamiento aplicados al diseño de estudios. Si están evaluando cómo anticipar la evolución competitiva de sus métricas de experiencia, conversemos sobre qué enfoque se ajusta a la estructura y al historial de su categoría.