La aplicación de datos en tiempo real en los modelos de predicción

La pandemia por COVID-19 está obligando a las empresas a tomar decisiones clave para su supervivencia en un clima de gran incertidumbre, que se ve acrecentada por la falta de referentes. Hasta ahora, las crisis económicas se habían producido por desequilibrios económicos que se iban acumulando y no por la paralización de la actividad productiva y de la movilidad de las personas.

Este hecho obliga a replantear los modelos de predicción que empleaban las empresas en el diseño de sus planes de negocio, para incluir nuevos paradigmas generados por la propia pandemia.

En esa labor serán claves las infraestructuras big data, especialmente en la gestión de los datos en tiempo real. Si tenemos en cuenta la urgencia con la que las empresas deben replantear sus objetivos, evaluar sus riesgos o hacer frente a sus necesidades de liquidez, será necesario recabar, analizar y tratar datos en tiempo real con el fin de realizar predicciones en el menor plazo posible.

Una de las herramientas que permiten recopilar datos en tiempo real es Google Trends, una plataforma que recoge los principales términos de búsqueda de los usuarios de Internet. En pleno confinamiento, el equipo de KPMG Lighthouse se propuso calcular la evolución del PIB a partir de la tendencia que presentaban determinados términos de búsqueda en este motor. “En las semanas en las que las restricciones a la actividad productiva y la movilidad de las personas eran muy estrictas, analizar la actividad online de los usuarios constituía una técnica adecuada para predecir el comportamiento económico”, explica Gabriel Pierobon, Manager Data Scientist de KPMG en España.

Los principales organismos nacionales e internacionales sitúan el retroceso del PIB español en 2020 entre el 8% (predicciones del FMI en abril) y el 15,1% (predicciones para el escenario de recuperación tardía del Banco de España). El equipo de KPMG Lighthouse calcula una contracción del 14% en términos interanuales. ¿Cómo han llegado a este dato?

Aplicación de datos en tiempo real en los modelos de predicción
Aplicación de datos en tiempo real en los modelos de predicción

Generando un nuevo modelo econométrico

“En este desarrollo seguimos el mismo proceso técnico que aplicamos en otros proyectos de analítica avanzada”, señala Pierobon. El punto de partida de este nuevo modelo fueron los datos del PIB que publica el INE. El organismo descompone el PIB en 10 sectores económicos: Agricultura, ganadería, silvicultura y pesca; Construcción; Industria; Actividades artísticas y recreativas; Actividades financieras y de seguros; Actividades inmobiliarias; Actividades profesionales, científicas y técnicas; Administración pública, educación y sanidad; Comercio, transporte y hostelería; e Información y comunicaciones.

En primer lugar y utilizando los resultados trimestrales de la serie 2016-2019, se calculó la evolución que habría experimentado la economía española en el primer y segundo trimestre de 2020 si la pandemia no hubiese ocurrido. De este modo se obtendría un escenario base con el que se podrían comparar con los resultados del nuevo modelo y evaluarlos.

Posteriormente, se procedió a seleccionar términos de búsqueda para los sectores en los que el INE descompone el PIB. Pronto se observó la difícil correlación entre el comportamiento de determinados sectores económicos, especialmente los productivos (industria y agricultura), y la frecuencia de búsquedas en Google. Por esa razón, se decidió calcular y ajustar la evolución de esos sectores a partir de los resultados obtenidos en aquellos sectores en los que esa correlación era fiable. Este efecto derrame tenía sentido, ya que los primeros afectados por las medidas de confinamiento son los sectores que dependen directamente del consumo directo de los individuos y esos efectos se propagan posteriormente a los sectores productivos.

De este modo se identificaron términos de búsqueda para los sectores de Construcción; Actividades artísticas y recreativas; Actividades inmobiliarias; Actividades profesionales, científicas y técnicas; y Comercio, transporte y hostelería y se analizó el comportamiento de esos términos en Google Trends. Para evitar problemas de multicolinealidad (alta correlación entre dos variables), se decidió descomponer cada sector en diferentes subsectores y se asignó a cada uno una única variable exógena (que no se ve afectada por ninguna variable incluida en el modelo).

A partir de las proyecciones que se calcularon para estos sectores se estableció una primera proyección del PIB. Esa proyección ajustada se utilizaría como variable exógena en los sectores de Agricultura, ganadería, silvicultura y pesca; Industria; Actividades financieras y de seguros; Administración pública, educación y sanidad; e Información y comunicaciones. A partir de ahí se realizaría la segunda proyección del PIB, en la que todos los sectores incluidos en el desglose que el INE hace del PIB tendrían su propia proyección.

Complementar, no sustituir

“Este es un modelo simple y de ningún modo descartamos la posibilidad de que haya otros planteamientos para resolver los retos a los que nos hemos enfrentado en su diseño. Nuestro objetivo no ha sido establecer un modelo de predicción del PIB, sino mostrar cómo las empresas pueden introducir la recopilación y el tratamiento de datos obtenidos en tiempo real en sus modelos de predicción y así mejorarlos”, explica Pierobon.

De hecho, unos de los análisis más interesantes que ha realizado el Banco de España en sus últimas predicciones es el de estimar  en tiempo real el impacto de la recesión en función de los datos de movilidad proporcionados Google, que reflejan que España o Italia están entre los países donde la movilidad se ha visto más restringida.

En un contexto cambiante como el actual, es necesario que las empresas adapten sus procesos con el fin de incrementar su capacidad de reacción ante situaciones imprevistas como la de la pandemia por COVID-19. Actualizar sus modelos de predicción con el fin de incorporar las posibilidades que abre el big data incrementa su resiliencia y abre nuevas posibilidades en la relación con el cliente.