Recibido 02 de Noviembre 2021 | Arbitrado y
aceptado 02 de Noviembre 2021 | Publicado el 16 de Diciembre 2021 RESUMEN Esta investigación selecciona los datos del Índice
de Precios al Consumidor (IPC) de la ciudad de Lima Metropolitana de enero
2012 a diciembre 2020 como muestra y establece el modelo de IPC
SARIMA(2,1,0)〖(1,0,2)〗_12 para el análisis empírico. Se utilizó el
software libre R para los análisis. Los resultados muestran que el modelo
es exacto. Se pronostican los datos del IPC en 2020, y el valor
pronosticado está muy cerca del valor real. Finalmente se utiliza el
modelo para hacer los pronósticos del IPC en el primer semestre de 2021. Palabras clave: IPC, SARIMA, Lima Metropolitana. ABSTRACT This research
selects the data from the Consumer Price Index (CPI) of the city of
Metropolitan Lima from January 2012 to December 2020 as a sample and
establishes the SARIMA IPC model (2,1,0) 〖(1,0,2) 〗 _12 for
empirical analysis. Free R software was used for the analyzes. The results
show that the model is accurate. The CPI data is forecast in 2020, and the
predicted value is very close to the actual value. Finally, the model is
used to make the CPI forecasts in the first half of 2021. Keywords:
IPC, SARIMA, Metropolitan Lima. RESUMO Palavras-chave: IPC,
SARIMA, Lima metropolitana.
Esta pesquisa seleciona os dados do
Índice de Preços ao Consumidor (IPC) da cidade de Lima Metropolitana de
janeiro de 2012 a dezembro de 2020 como amostra e estabelece o modelo
SARIMA IPC (2,1,0) 〖(1,0,2)〗 _12 para análise empírica. O software R livre foi
usado para as análises. Os resultados mostram que o modelo é preciso. Os
dados do CPI são previstos em 2020, e o valor previsto está muito próximo
do valor real. Por fim, o modelo é utilizado para fazer as projeções do
IPC no primeiro semestre de 2021.
Jaime Yelsin Rosales Malpartida https://orcid.org/0000-0003-4574-5172 Universidad Nacional de Ingeniería, Lima, Perú
Introducción
El índice de precios al consumidor (IPC) es un índice estadístico económico
muy importante, que refleja el nivel de precios y el nivel de vida de los
residentes en un período determinado. Lima Metropolitana es un área
metropolitana peruana conformada por cincuenta distritos, donde cuarenta y tres
distritos corresponde a la Provincia de Lima y siete distritos a la Provincia
constitucional del Callao. Es el área metropolitana más grande, extensa y
poblada del Perú, por lo tanto, vale la pena estudiar los problemas económicos
de Lima Metropolitana, como el IPC.
En 1970, Box y Jenkins propusieron una metodología rigurosa para la
identificación, estimación, validación y pronóstico de modelos dinámicos para
datos de series temporales, como los Modelos Autorregresivos
Integrados de Promedio Móvil (ARIMA) y los Modelos Autorregresivos
Integrados de Promedio Móvil Estacionales (SARIMA). Con esta metodología
general, se ha desarrollado en la literatura la metodología de pronósticos para
series temporales. Muchas investigaciones realizan análisis empírico de la
serie del Índice de Precios al Consumidor en diversos contextos han sido
desarrollados por autores. Cerna et al. (2021) [1] analiza el índice de precios
al consumidor de Lima Metropolitana según el modelo SARIMA(0,1,1)〖(1,0,1)〗_12 con variable dummy. Basándose en los datos mensuales Lima Metropolitana
desde enero de 2010 a diciembre de 2020 obtenida de la web del Banco Central de
Reserva del Perú. Siesquen
y Riojas (2017) [2] tuvieron como objetivo determinar los modelos de pronóstico
para el Índice de Precios al Consumidor tanto de la Región Lambayeque como
Nivel Nacional, basados en sus series históricas de índices registrados por el
INEI, durante el periodo enero 2010 a diciembre 2016. Los modelos estimados, adecuados
y óptimos para la serie Índice de Precios al Consumidor Región Lambayeque para
el periodo enero 2010 a diciembre del 2016 fue un ARIMA(0,
1, 1); para el caso de la serie Índice de Precios al Consumidor a Nivel
Nacional para el periodo enero del 2010 a diciembre 2016 fue un ARIMA(0, 1, 1).
Djami et al. (2021) [3] establece el modelo ARIMA
(1,1,1) utilizado para pronosticar el IPC en la ciudad de Ambon de Indonesia
para el período de enero de 2007 a diciembre de 2020. Xingxiang
Qi (2021) [4] Selecciona los datos del IPC de la
ciudad de Jinan de China de 2011 y establece el modelo ARIMA (11, 1, 12) de
índice de precios al consumidor para el análisis empírico. Los resultados
mostraron que el modelo es exacto y se pronostican los datos del IPC en 2020 donde
el valor pronosticado está muy cerca del valor real. LI Shu,
WANG Fei y WANG Feng-xiao
(2020) [5] toman como muestra los datos mensuales del IPC de Qingdao desde
enero de 2010 hasta junio de 2019, y establecen el modelo ARIMA (11,1,12). CHU Rui (2018) [6] selecciona los datos mensuales del IPC de
enero de 2005 a junio de 2017 en Beijing como muestra, y se construyó el modelo
ARIMA (0,1,12). Li Xuan y Huang
Dongdong [7] Con base en los datos mensuales del IPC
de enero de 2000 a diciembre de 2012, construyeron un modelo ARIMA para
analizar y pronosticar el IPC en la primera mitad de 2013. Los resultados
empíricos muestran que el modelo ARIMA.
(3,1,3) puede muy bien describir el IPC y proporcionar
una mejor predicción. Zhang Yangyang, Deng Wei y Song
Changyu (2020) [8] utilizan el modelo ARIMA (2,1,2)
para ajustar los datos del IPC de la provincia de Shandong de enero de 1995 a
mayo de 2020 y predecir el IPC de la provincia de Shandong de junio a octubre
de 2020. Zhou Mei-ying
(2011) [9] establece el modelo ARIMA (10,1,3) y analiza la serie temporal del
IPC de la provincia de Hubei. GUO Xiao-feng (2012)
[10] selecciona los datos mensuales del IPC de China desde enero de 2001 a
octubre de 2011 como muestras y establece el modelo ARIMA (12,1,20). CUI Wen-yan y XU Feng-hua (2016) [11]
establecen el modelo ARIMA (0,1,2) sobre los datos anuales del IPC de la
provincia de Shandong durante 1995-2011. En las referencias de [1] - [11],
aunque los parámetros del modelo son distintos, todos usan ARIMA o SARIMA para
ajustar y predecir los datos del IPC en diferentes períodos. En esta
investigación se selecciona los datos del IPC de la ciudad de Lima
Metropolitana de enero 2012 a diciembre 2020 como muestra y utiliza el modelo SARIMA(2,1,0) (1,0,2)_12
para ajustar y predecir el primer semestre de 2021.
Figura
1. Índice de precios al consumidor de Lima metropolitana, enero 2012 -
diciembre 2020
Material y Métodos
En la presente
investigación de series temporales la población de interés está constituida por
la serie histórica del Índice Mensual de Precios al Consumidor de Lima
Metropolita (año base 2012=100). La muestra comprendió desde el periodo enero
2012 a diciembre 2020, la serie se obtuvo de la página web del BCRP. La
metodología utilizada para estimar el modelo econométrico de pronóstico
satisfactorio es la de Box-Jenkins, consistente en: identificación, estimación,
validación y pronóstico. La serie histórica se divide en dos partes; de enero
2012 a diciembre 2019 para la identificación, estimación y validación del
modelo (etapa de estimación) y el periodo de enero 2020 a diciembre 2020 para
la validación del pronóstico (prueba o Testing). Las pruebas estadísticas
correspondientes a cada una de estas etapas se realizaron en el software libre
R.
Análisis empírico
Pruebas de
estacionariedad
Se utilizó la prueba
Augmented Dickey Fuller (ADF) para probar la raíz unitaria de los datos del IPC
y sus datos de diferencia de primer orden.
Prueba de hipótesis de ADF de los datos del
IPC.
H0: la serie no es
estacionaria, tiene raíces unitarias
H1: la serie es
estacionario, no tiene raíces unitarias
Dickey-Fuller
= -0.70794, Lag order = 4,
p-value =
0.9668
Según la prueba de ADF,
el valor p del IPC de la serie original es mucho mayor que 0.05, por lo que
debemos aceptar la hipótesis nula de que la serie tiene raíz unitaria y es una
serie de tiempo no estacionaria. Por lo tanto, necesitamos hacer un procesamiento
diferencial.
Resultados de la prueba
de hipótesis de ADF de los datos del IPC en primera diferencia.
Dickey-Fuller = -4.0577, Lag order = 4,
p-value = 0.01
El valor p de la
secuencia de diferencias de primer orden d(IPC) es menor que 0.05, por lo que
no se acepta la hipótesis nula, es decir, no se considera que la secuencia
tenga raíz unitaria y es una serie de tiempo estacionaria. Por tanto, la
secuencia de diferencias de primer orden es una serie de tiempo estacionaria.
Del análisis anterior,
podemos ver que la serie de tiempo después de la diferencia de primer orden es
una serie estacionaria sin ruido blanco, que puede ajustarse al modelo
SARIMA(p,1,q) (P,0,Q)_12. Para obtener el modelo de ajuste relativamente
óptimo, los valores de p, q, P y Q se determinan según el coeficiente de
autocorrelación simple y el coeficiente de autocorrelación parcial,
estableciendo de este modo diferentes modelos SARIMA(p,1,q) (P,0,Q)_12.
Establecimiento del modelo ARIMA
La función de
autocorrelación parcial (PACF) determina los valores de p y P; la función de
autocorrelación (ACF) determina los valores de q y Q. Los resultados del
análisis de la función de autocorrelación simple y la función de
autocorrelación parcial se muestran en la Figura 2 y 3 respectivamente.
Figura
2. Análisis de autocorrelación simple de d(IPC).
Figura
3. Análisis de autocorrelación parcial de d(IPC).
De
acuerdo con las características estadísticas de la función de autocorrelación y
la función de autocorrelación parcial en la Figura 2 y 3 se determinan los
valores de p, q, P y Q para el modelo SARIMA. Para obtener un modelo de mejor
ajuste se intenta establecer diferentes modelos
para la estimación
de parámetros. Los resultados de los mejores modelos encontrados se muestran en
la tabla 1.
Tabla
1. Presentación de resultados del mejor modelo SARIMA
Modelos |
Criterio |
Testing |
|
RMSE |
0.703 |
MAE |
0.593 |
|
MAPE |
0.441 |
|
|
RMSE |
0.695 |
MAE |
0.635 |
|
MAPE |
0.473 |
|
|
RMSE |
0.429 |
MAE |
0.347 |
|
MAPE |
0.259 |
|
|
RMSE |
0.625 |
MAE |
0.556 |
|
MAPE |
0.414 |
|
|
RMSE |
0.451 |
MAE |
0.368 |
|
MAPE |
0.274 |
|
|
RMSE |
0.444 |
MAE |
0.364 |
|
MAPE |
0.271 |
Un modelo con un valor de
RMSE, MAE y MAPE más bajo es mejor [12], en ese sentido podemos ver que el
modelo SARIMA(0,1,0) 〖(0,0,1)〗_12 tiene valores de RMSE, MAE y MAPE más pequeños siendo
el modelo simple y factible dado que solo se hizo una diferenciación simple
(d=1). Por lo tanto, se selecciona este modelo.
Prueba del mejor modelo SARIMA
La comparación del valor
real con el valor de ajuste del modelo SARIMA(2,1,0) (1,0,2)_12 se muestra en
la Figura 4 y el valor de los residuales del modelo SARIMA(2,1,0) (1,0,2)_12 se
muestra en la Figura 5.
El análisis de
autocorrelación simple y autocorrelación parcial de los residuales se muestra
en la Figura 6 y 7 respectivamente.
Figura 4. Valor real y valor ajustado del modelo
Figura 5. Valor residual del modelo .
En la Figura 4, el
cambio del valor de ajuste y el valor real del modelo es consistente, y en la
Figura 5 el residuo del modelo fluctúa alrededor del valor medio cero. Por otra
parte, se muestra en la Figura 6 que el coeficiente de autocorrelación simple
ACF básicamente cae dentro de la banda de confianza con nivel de significancia
de 0.05, es decir, la secuencia residual del modelo es una secuencia de ruido
blanco aleatorio, y el modelo
SARIMA(2,1,0)〖(1,0,2)〗_12 establecido es más razonable.
Figura 6. Análisis de autocorrelación simple de los
residuales de .
Figura 7. Análisis de autocorrelación parcial de los
residuales de SARIMA(2,1,0)〖(1,0,2)〗_12.
El modelo planteado
es SARIMA(2,1,0) (1,0,2)_12 que es significativamente eficaz y se puede
utilizar directamente para la predicción cuya fórmula es la siguiente:
∆IPC_t= 0.321IPC_(t-1 )-0.152IPC_(t-2 )+0.999IPC_(t-12
) +ε_t 〖-0.932ε〗_(t-12) -0.032ε_(t-24)
Donde:
∆: Operador de
primera diferencia.
IPC: Índice de
Precios al Consumidor.
ε_t: Error.
Predicción del
modelo ARIMA
El modelo
SARIMA(2,1,0) (1,0,2)_12 se aplica para pronosticar el IPC mensual de Lima
Metropolitana en 2020 y se compara con el valor real (ver Tabla 2) y se ve que
los datos del IPC mensual de Lima Metropolitana en 2020 ajustados por el modelo
SARIMA(2,1,0)〖(1,0,2)〗_12 tienen un error muy pequeño con el valor real, y el
error en mayo es casi cero, lo que indica que el modelo se ajusta bien. y el
resultado de la predicción es ideal, que se puede utilizar para la predicción
de datos futuros. Utilizando el modelo SARIMA(2,1,0)〖(1,0,2)〗_12 para pronosticar los datos
del IPC mensual de Lima Metropolitana en el primer semestre de 2021, los
resultados se muestran en la Tabla 3.
Tabla 2. El valor
real y el valor de pronóstico del IPC mensual en Lima Metropolitana en 2020.
Fecha |
Valor real |
Valor pronosticado |
Error |
Ene-20 |
132.77 |
132.90 |
0.13 |
Feb-20 |
132.96 |
133.16 |
0.20 |
Mar-20 |
133.82 |
133.99 |
0.17 |
Abr-20 |
133.96 |
134.17 |
0.21 |
May-20 |
134.23 |
134.30 |
0.07 |
Jun-20 |
133.87 |
134.42 |
0.54 |
Jul-20 |
134.49 |
134.74 |
0.25 |
Ago-20 |
134.35 |
135.08 |
0.73 |
Set-20 |
134.53 |
135.24 |
0.71 |
Oct-20 |
134.55 |
135.31 |
0.76 |
Nov-20 |
135.25 |
135.34 |
0.09 |
Dic-20 |
135.32 |
135.62 |
0.30 |
Tabla 3. Resultados
de los pronósticos de los datos mensuales del IPC de Lima Metropolitana en el
primer semestre de 2021.
Fecha |
Valor pronosticado |
Ene-21 |
135.3997 |
Feb-21 |
135.6337 |
Mar-21 |
136.4461 |
Abr-21 |
136.5744 |
May-21 |
136.7131 |
Jun-21 |
136.7131 |
A partir de los
resultados del pronóstico, los datos del IPC de enero a junio de 2021 en
comparación con el mismo período del año pasado, han aumentado todos los meses
y la tendencia es creciente. Desde enero de 2020, la tendencia creciente del
IPC no ha cambiado.
Conclusiones
Hasta cierto punto,
el modelo SARIMA puede utilizar el análisis de valores pasados y presentes para
predecir el desarrollo futuro de series de tiempo. El modelo SARIMA es más
adecuado para pronósticos a corto plazo. Con la extensión del período de
pronóstico, el error de pronóstico aumentará en consecuencia. Utilizando los
datos del IPC mensual de Lima Metropolitana en los últimos 9 años, se utiliza
el modelo SARIMA(2,1,0)〖(1,0,2)〗_12 para ajustar y pronosticar. Los datos del IPC del
primer semestre de 2021 pueden ser utilizados como referencia por los
departamentos de gestión económica para tomar medidas de control a nivel macro
con anticipación para garantizar la estabilidad y el desarrollo económico a
largo plazo.
Referencias
CERNA, Branco
Ernesto Arana; FARFÁN, Karl Vladimir Mena; CABALLERO, Ana María Núñez. Modelo
sarima para el pronóstico del índice mensual de precios al consumidor de Lima
metropolitana. TZHOECOEN, 2021, vol. 13, no 1, p. 101-120.
SIESQUÉN ACOSTA,
César Nicanor; RIOJAS YAMUNAQUÉ, José Jhosimar. Modelos de pronóstico del
índice de precios al consumidor región lambayeque ya nivel nacional. Enero 2010
a diciembre 2016. 2018.
RADJABAYCOLE, Jefry
Esna T.; DJAMI, Ronald John; HAUMAHU, Gabriella. Forecasting the Ambon City Consumer
Price Index Using Arima Box-Jenkins. Tensor: Pure and Applied Mathematics
Journal, 2021, vol. 2, no 2, p. 87-96.
QI, Xingxiang. Análisis empírico del índice de precios al consumidor de
Jinan basado en el modelo ARIMA. En VII Congreso Internacional de Investigación
en Humanidades y Ciencias Sociales (ICHSSR 2021) . Atlantis Press, 2021. p.
235-238.
LI Shu, WANG Fei,
WANG Feng-xiao, Aplicación del modelo ARIMA en el pronóstico del índice de precios
al consumidor de Qingdao, Revista de la Universidad de Artes y Ciencias de
Lanzhou (Ciencias Naturales), Lanzhou, Gansu, 2020, págs. 11-16 . DOI: 10.13804
/ j.cnki.2095-6991.2020.06.003
CHU Rui, Pronóstico
y análisis del IPC en Beijing basado en el modelo ARIMA, Ingeniería de valor,
Shijiazhuang, Hebei, 2018, págs. 21-22. DOI: 10.14018 / j.cnki.cn13-1085 /
n.2018.05.009
Li Xuan, Huang
Dongdong, Análisis y pronóstico del IPC basado en el modelo ARIMA, Revista de
la Universidad de Shenyang (Ciencias Sociales), vol. 15, Shenyang, Liaoning,
2013, págs. 306-310.
Zhang Yangyang, Deng
Wei, Song Changyu, Predicción del IPC en la provincia de Shandong basada en
análisis de series de tiempo, Revista de la Universidad Normal de Shandong
(Ciencias Naturales), Jinan, Shandong, 2020, págs. 329-336. DOI: 10.3969 /
j.issn.1001-4748. 2020.03.010
ZHOU Mei-ying,
Análisis de series de tiempo y predicción del IPC en la provincia de Hubei
Basado en el modelo ARIMA, Kunming, Yunnan, Times Finance, 2011, págs. 66,110.
GUO Xiao-feng,
Predicción y análisis de la tendencia del IPC de China basada en el modelo
ARIMA, Estadísticas y decisiones, Wuhan, Hubei, 2012, págs. 29-32. DOI:
10.13546 / j.cnki.tjyjc.2012.11.004
CUI Wen-yan, XU
Feng-hua, La aplicación del modelo ARIMA en la predicción del IPC en la
provincia de Shandong, Revista de la Universidad Zaozhuang, vol. 33, Zaozhuang,
Shandong, 2016, págs. 24-28.
E. Hopali y A.
Cakmak., Rev. Internacional de Información, Negocios y Gestión, vol. 12 (2020).