RESUMEN

 

El dióxido de carbono es el principal gas de efecto invernadero (GEI) que conduce al calentamiento global y, en consecuencia, al cambio climático y ambiental. Trae efectos negativos al desarrollo económico, la vida humana y el medio ambiente. Es de suma importancia poder medir y predecir de manera precisa la emisión de dióxido de carbono, ya que de esta manera podemos llevar a cabo una buena política sostenible para nuestro medio ambiente. Ante ello, la presente investigación tiene como principal objetivo encontrar el mejor modelo de predicción de las emisiones de dióxido de carbono (CO2) en el Perú, mediante la evaluación comparativa de los métodos ARIMA y Redes Neuronales Artificiales. Se utilizó los datos anuales de las emisiones de CO2 del Banco Mundial los cuales fueron analizados mediante la programación del software libre R studio. Para determinar el mejor modelo se utilizaron los errores de pronósticos tales como: raíz cuadrada del error cuadrático Medio (RMSE), error absoluto medio (MAE) y error porcentual absoluto medio (MAPE). Los resultados revelan que el modelo más apropiado entre estos dos métodos para la predicción de las emisiones del CO2 en Perú es la red neuronal ANN(5-10-1), es decir, la red neuronal con cinco valores rezagados como entrada conectada por diez nodos en la capa oculta y una sola capa de salida, la cual tuvo una mayor precisión con un RMSE = 1125.82, MAE = 1040.68 y MAPE = 1.90 en la fase de prueba a comparación con el  mejor modelo ARIMA(0,1,10) que tuvo un RMSE = 4223.73, MAE = 3143.40 y MAPE = 5.80 en la fase de prueba. En conclusión, se puede usar las redes neuronales para predecir las emisiones de CO2, la cual mostró claramente que las emisiones anuales de CO2 en el Perú aumentarán en los próximos años. Estos conocimientos reales serán útiles para que los responsables de la formulación de políticas traigan cambios significativos en las principales áreas medioambientales en nuestro país.

 

Descriptores: Modelo ARIMA, Redes Neuronales, GEI, CO2.

 

 

ABSTRACT

 

Carbon dioxide is the main greenhouse gas (GHG) that leads to global warming and consequently to climate and environmental change. It brings negative effects to economic development, human life and the environment. It is of the utmost importance to be able to accurately measure and predict the emission of carbon dioxide, since in this way we can carry out a good sustainable policy for our environment. Given this, the main objective of this research is to find the best prediction model for carbon dioxide (CO2) emissions in Peru, through the comparative evaluation of ARIMA methods and Artificial Neural Networks. The annual data of CO2 emissions from the World Bank were used, which were analyzed by programming the free software R studio. To determine the best model, forecast errors such as: square root of the mean square error (RMSE), mean absolute error (MAE) and mean absolute percentage error (MAPE) were used. The results reveal that the most appropriate model between these two methods for the prediction of CO2 emissions in Peru is the ANN(5-10-1) neural network, that is, the neural network with five lagged values ​​as input connected by ten nodes in the hidden layer and a single output layer, which had a higher accuracy with RMSE = 1125.82, MAE = 1040.68 and MAPE = 1.90 in the test phase compared to the best model ARIMA(0,1,10) which had an RMSE = 4223.73, MAE = 3143.40 and MAPE = 5.80 in the test phase. In conclusion, neural networks can be used to predict CO2 emissions, which clearly showed that the annual CO2 emissions in Peru will increase in the coming years. These real insights will be useful to policymakers to bring about meaningful changes in major environmental areas in our country.

 

Descriptors: ARIMA Model, Neural Networks, GHG, CO2.

 

RESUMO


O dióxido de carbono é o principal gás de efeito estufa (GEE) que leva ao aquecimento global e, consequentemente, às mudanças climáticas e ambientais. Traz efeitos negativos para o desenvolvimento econômico, a vida humana e o meio ambiente. É de extrema importância poder medir e prever com precisão a emissão de dióxido de carbono, pois assim podemos realizar uma boa política sustentável para o nosso meio ambiente. Diante disso, o objetivo principal desta pesquisa é encontrar o melhor modelo de previsão de emissões de dióxido de carbono (CO2) no Peru, através da avaliação comparativa dos métodos ARIMA e Redes Neurais Artificiais. Foram utilizados dados anuais de emissões de CO2 do Banco Mundial, que foram analisados ​​por meio da programação do software livre R studio. Para determinar o melhor modelo, foram utilizados erros de previsão como: raiz quadrada do erro quadrático médio (RMSE), erro absoluto médio (MAE) e erro percentual médio absoluto (MAPE). Os resultados revelam que o modelo mais adequado entre esses dois métodos para a previsão de emissões de CO2 no Peru é a rede neural ANN(5-10-1), ou seja, a rede neural com cinco valores defasados ​​como entrada conectados por dez nós na camada oculta e uma única camada de saída, que teve maior precisão com RMSE = 1125,82, MAE = 1040,68 e MAPE = 1,90 na fase de teste em comparação com o melhor modelo ARIMA(0,1,10) que teve um RMSE = 4223,73, MAE = 3143,40 e MAPE = 5,80 na fase de teste. Em conclusão, as redes neurais podem ser usadas para prever as emissões de CO2, o que mostrou claramente que as emissões anuais de CO2 no Peru aumentarão nos próximos anos. Esses insights reais serão úteis aos formuladores de políticas para promover mudanças significativas nas principais áreas ambientais do nosso país.

 

Descritores: Modelo ARIMA, Redes Neurais, GEE, CO2.

 
 

 

 


c

Jaime Yelsin Rosales Malpartida

https://orcid.org/0000-0003-4574-5172

jrosalesm@uni.pe

Universidad Nacional de Ingeniería

 

 

 

 

 

 

 

 


 


1.             Introducción

El cambio climático es uno de los principales problemas ambientales a nivel mundial, esto debido a las grandes emisiones de gases de efecto invernadero, principalmente dióxido de carbono (CO2) [1]. Tras una caída sin precedentes del 5,4% en 2020, las emisiones mundiales de dióxido de carbono están volviendo a los niveles anteriores a la COVID y las concentraciones de GEI en la atmósfera siguen aumentando; para resolver el problema climático se requiere una reducción rápida y sostenida de las emisiones [2]. Las emisiones excesivas de CO2 no solo son la causa del calentamiento global, sino también una amenaza para la supervivencia humana al causar problemas naturales y sociales como el cambio climático, el deshielo de los glaciares, el aumento del nivel del mar y la destrucción de la biodiversidad. Al realizar evaluaciones en Perú para determinar la vulnerabilidad y el riesgo en el sector agropecuario relacionado al clima, se encontró que, en la costa, los principales peligros climáticos son las inundaciones y sequías en las zonas bajas y en las partes altas la presencia de friajes y heladas, sumado a la presencia de eventos periódicos de El Niño. En la sierra, el 100% de las regiones sufren los impactos de las inundaciones y las heladas, mientras que el 80% reporta la presencia de friajes y sequías. En las zonas de selva o Amazonia peruana, el 100% de las regiones están expuestas a las inundaciones y friajes, mientras que el 85% de ellas también reportan la presencia de sequías [3]. Se demostró que existe una relación directa entre el crecimiento económico acoplado a las emisiones de CO2 en Perú asimismo aumentan los GEI [4].

La Figura 1 muestra las emisiones de CO2 en Perú por años (Banco Mundial, 2021). Como muestra la figura, las emisiones de CO2 tienen una tendencia creciente. Las emisiones de CO2, la principal fuente de emisiones de GEI, deben reducirse con el propósito de disminuir los efectos globales peligrosos.

Gráfico, Gráfico de líneas

Descripción generada automáticamente

Figura 1. Emisiones anuales de CO2 en Perú.

Se han realizado muchos estudios sobre los pronósticos de emisiones de CO2 a través de series de tiempo. Longqi Ning, Lijun Pei y Feng Li [5] utilizó el modelo ARIMA para predecir las emisiones de CO2 en China. Yawei Qi et al. [6] utilizó el modelo de redes neuronales para predecir la cuota regional de emisiones de CO2. Wenhao Zhou et al. [7] utilizaron el método de modelado gris para predecir las emisiones de dióxido de carbono de China. Santos et al. [8] utilizaron una red bayesiana dinámica para el pronóstico emisiones de CO2 en sistemas de generación de energía de múltiples fuentes en Brasil. Elham Shabani et al. [9] utilizó un enfoque novedoso para predecir las emisiones de CO2 en el sector agrícola de Irán basado en un modelo múltiple inclusivo. Yi-Chung Hu et al. [10] utilizó un modelo optimizado de predicción fraccional gris para la predicción de emisiones de CO2. Eyoh, Imo J, Umoeka, Ini J.1 y Udo, Edward N [11] utilizaron un sistema intuicionista de lógica difusa para la predicción global de emisiones de CO2 en Nigeria. Egemen Hopali y Aslihan Cakmak [12] pronosticaron de manera diaria las emisiones de CO2 de una fábrica de Turquía utilizando métodos estacionales ARIMA y Holt-Winters.

Por lo tanto, para este estudio, era importante comprender la trayectoria de emisiones de CO2 en el pasado de Perú con el objetivo de hacer una predicción confiable de sus emisiones futuras con el fin de formular mejor las políticas y tomar medidas para reducir las emisiones de CO2. El estudio pronosticó y modeló los niveles de emisión de CO2 en Perú utilizando modelos ARIMA y Redes Neuronales.

 

 

2.     Metodología

2.1.  Modelo ARIMA y notaciones asociadas

El modelo econométrico ARIMA fue presentado por primera vez por Box & Jenkins en 1970 [13]. El modelo generalmente se ve favorecido por su flexibilidad para varios tipos de datos de series de tiempo y su precisión de predicción. ARIMA es una combinación de los modelos AR y MA, junto con la diferenciación. En los modelos autorregresivos (AR), las predicciones se basan en valores pasados de los datos de series de tiempo, y en los modelos de media móvil (MA), los residuos anteriores se consideran para pronosticar valores futuros. La forma general de ARIMA (p, d, q) se puede representar mediante un operador de desplazamiento hacia atrás como:

   …… (1)

Donde los operadores característicos autorregresivos (AR) y promedio móvil (MA) son:

 …… (2)

 …… (3)

 

Además, se cumple que:

 …… (4)

Donde  es el parámetro estimado del componente autorregresivo,  es el parámetro estimado del componente de promedio móvil,  es el parámetro de transformación por Box-Cox,  es el operador de diferencia,  es la diferencia,  es el operador de rezago y  es el término de perturbación.

2.2.             La Metodología de Box - Jenkins

El primer paso hacia la selección del modelo es diferenciar la serie para lograr la estacionariedad.

Una vez finalizado este proceso, el investigador examinará el correlograma para decidir los órdenes apropiados de los componentes AR y MA. Es importante destacar el hecho de que este procedimiento (de elegir los componentes AR y MA) está sesgado hacia el uso del juicio personal porque no existen reglas claras sobre cómo decidir sobre los componentes AR y MA apropiados. Por lo tanto, la experiencia juega un papel fundamental en este sentido. El siguiente paso es la estimación del modelo tentativo, después de lo cual se realizarán las pruebas de diagnóstico. La verificación de diagnóstico generalmente se realiza generando el conjunto de residuos y probando si satisfacen las características de un proceso de ruido blanco. De lo contrario, sería necesario volver a especificar el modelo y repetir el mismo proceso; esta vez desde la segunda etapa.

2.3.             Recopilación de datos

El estudio se basó inicialmente en 59 observaciones de las emisiones totales anuales de CO2 en el Perú (es decir, 1960-2018). Estos se obtuvieron de la base de datos del Banco Mundial actualizado al 2021, que es una fuente confiable de diversos datos macroeconómicos para todos los países del mundo. Tal es su credibilidad que muchos países realizaron este tipo de estudios utilizando esta base de datos para hacer sus investigaciones. Por lo tanto, la investigación tuvo que preferir esta fuente a base de su credibilidad y reconocimiento.

3.                 Resultados e interpretación

3.1.             Análisis de los datos

Se procedió a dividir los datos de 1990 hasta 2014 para la fase de entrenamiento (Training o entrenamiento) y desde 2015 hasta 2018 para realizar nuestros pronósticos (Testing o prueba).

En primer lugar, para el modelo ARIMA se analizó los datos de predicción de emisión de CO2 mediante pruebas de estacionariedad: análisis gráfico y estadística descriptiva.

3.2.             Pruebas

Pruebas de diagnóstico y evaluación de modelos - Pruebas de estacionariedad: análisis de la Figura 1.

Gráfico, Histograma

Descripción generada automáticamente

Figura 2. Gráficos de los correlogramas (ACF y PACF) para el modelo en fase de entrenamiento.

Gráfico, Histograma

Descripción generada automáticamente

Figura 3. Gráficos de ACF y PACF para el modelo en fase de entrenamiento.

 

Como vemos que aún tiene una tendencia intensa (aun no es estacionaria) por ello procedemos a diferenciarla y vemos el gráfico realizando la primera diferenciación (d = 1).

Gráfico, Gráfico de líneas

Descripción generada automáticamente

Figura 4. Gráfico de la serie CO_2^λ diferenciada con d = 1.

Vemos nuevamente los correlogramas (Figura 5):

Gráfico, Histograma

Descripción generada automáticamente

Figura 5. Gráficos de ACF y PACF para la serie CO_2^λ  en fase de entrenamiento.

Y por la prueba de Dick Fuller tenemos un p-value = 0.0402 < 0.05 la cual nos dice según la H0 que ya es estacionario y a partir de ello podemos identificar a nuestros modelos, las cuales en resumen son: ARIMA(1,1,8), ARIMA(1,1,7), ARIMA(1,1,6), ARIMA(7,1,1) y ARIMA(0,1,10); las cuales son los mejores modelos de un total de 30 modelos con distintos valores de p, d y q.

Tabla 1. Evaluación de modelos ARIMA.

Ajuste del modelo

Modelo

RMSE

MAE

MAPE

ARIMA(1,1,8)

Training

1650.324

1304.579

5.41614

Testing

6528.334

5406.255

9.950276

ARIMA(1,1,7)

Training

1651.282

1318.154

5.458692

Testing

6341.742

5221.669

9.611984

ARIMA(1,1,6)

Training

1656.738

1315.751

5.450563

Testing

6450.754

5356.532

9.857981

ARIMA(7,1,1)

Training

1669.879

1314.456

5.461572

Testing

5913.827

4978.697

9.162236

ARIMA(0,1,10)

Training

1590.562

1110.441

4.758085

Testing

4223.73

3143.398

5.796372

 

 

 

 

 

 

 

 

 

Tabla 2. Presentación de resultados del mejor modelo ARIMA(0,1,10).

Modelo

Parámetro

Coeficiente

Error Estándar

t- Calculado

P-Valor

ARIMA(0,1,10)

MA1

0.349

0.160

2.175

0.034

MA2

0.101

0.168

0.602

0.549

MA3

-0.139

0.158

-0.876

0.385

MA4

0.192

0.156

1.236

0.221

MA5

-0.020

0.160

-0.124

0.902

MA6

0.115

0.131

0.876

0.385

MA7

0.330

0.178

1.854

0.069

MA8

-0.033

0.177

-0.186

0.853

MA9

0.232

0.159

1.460

0.150

MA10

0.182

0.181

1.008

0.318

 

 

Gráfico

Descripción generada automáticamente

Figura 6. Prueba de estabilidad del ARIMA (0,1,10)

 

3.4.                  Hallazgos y discusiones

Tabla 3. Estadística descriptiva

 

Descripción

Estadístico

Media   

26705.82

Mediana

23340.46

Mínimo

8173.74

Máximo

56530.00

Desviación Estándar

12565.63

Asimetría

0.96

Curtosis

3.13

 

De la tabla 3 tenemos que la media es positiva, es decir, 26705.81. La emisión mínima de dióxido de carbono es 8173.74 y la emisión máxima de dióxido de carbono es 56530. La asimetría es 0,96 y lo más importante es que es positiva, lo que demuestra que está sesgada positivamente y no es simétrica. La curtosis es 3.13 lo que indica que tenemos una distribución leptocúrtica y que la serie de emisiones de dióxido de carbono no se distribuye normalmente.

De la tabla 2 según los coeficientes estimados del mejor modelo ARIMA(0,1,10) la estructura de la ecuación para las emisiones de CO2 del Perú será la siguiente ecuación:

 

3.5.                  Comparación de la Red Neuronal Feed-forward y ARIMA.

Al capturar el comportamiento complejo no lineal en una serie de datos, las redes neuronales son más efectivas y preferidas en lugar de los modelos ARIMA. Los resultados de la Tabla 4 revelaron que los datos de entrenamiento se ajustan utilizando la red de alimentación directa (Feedforward) 5-10-1, es decir, la red utiliza cinco valores rezagados (t-1, t-2, t-3, t-4, t-5) de series de tiempo como entrada, que está conectado por diez nodos ocultos a la capa oculta y conectado a una sola capa de salida. Para predecir las emisiones de CO2 (en la fase de entrenamiento), ANN predijo con valor                RMSE = 707.13, MAE = 485.16 y MAPE = 1.96 y en la fase de prueba, se encontró que ANN predijo con valor RMSE = 1125.82, MAE = 1040.68 y MAPE = 1.90 mucho más preciso en comparación al mejor modelo ARIMA (0,1,10) que obtuvo un RMSE = 1590.56, MAE = 1110.44 y MAPE = 4.76 (en la fase de entrenamiento) y un RMSE = 4223.73, MAE = 3143.40 y MAPE = 5.80 (en la fase de prueba) no logrando superar a ANN durante las pruebas (Tabla 4) [14]. La precisión del pronóstico de los modelos de redes neuronales de alimentación hacia adelante fue consistente con respecto a RMSE, MAE y MAPE en las dos fases del ajuste del modelo, es decir, entrenamiento y prueba. Debido a que un modelo de red neuronal aprende de los datos, captura la no linealidad en la serie de datos de manera eficiente y finalmente, predice con mayor precisión que los modelos ARIMA. Por lo tanto, se prefirieron las redes neuronales en lugar de los modelos ARIMA para predecir las emisiones de CO2 de Perú.

Tabla 4. Presentación de resultados del mejor modelo ARIMA y Redes Neuronales.

Modelos

Criterio

Training

Testing

ARIMA(0,1,10)

RMSE

1590.56

4223.73

MAE

1110.44

3143.40

MAPE

4.76

5.80

ARIMA(7,1,1)

RMSE

1669.88

5913.83

MAE

1314.46

4978.70

MAPE

5.46

9.16

ANN(5-10-1)

RMSE

707.13

1125.82

MAE

485.16

1040.68

MAPE

1.96

1.90

 

La Figura 7 con un rango de pronóstico a partir de 2015 (líneas punteadas) hasta 2018 y la Tabla 4, muestran claramente que las emisiones totales anuales de CO2 de Perú aumenten durante los próximos años. El modelo con mayor precisión ANN (5,10,1) elegido aparentemente está enviando señales de advertencia a los economistas medioambientales de Perú sobre la necesidad de actuar a la luz del cambio climático y el calentamiento global.

Gráfico, Gráfico de líneas

Descripción generada automáticamente

Figura 7. Rendimiento de predicción del mejor modelo ARIMA (0,1,10) y el mejor modelo de red neuronal Feed Forward ANN(5,10,1) para conjuntos de entrenamiento (1960-2014) y de prueba (2015-2018) de las emisiones de CO2 en Perú actualizado por el Banco Mundial al 2021.

4.     Conclusión

El presente estudio comparó los modelos ARIMA con las redes neuronales artificiales, demostrando que el modelo de red neuronal ANN (5,10,1) es el modelo más adecuado para predecir el CO2 total anual en el Perú durante los próximos años, dado que los modelos de redes neuronales están destinados principalmente a conjuntos de datos complejos no lineales y predicen de forma coherente cuando el conjunto de datos se divide en conjuntos de entrenamiento y de prueba. Según los resultados anteriores, la red neuronal converge a un ritmo más rápido a los mínimos locales y tiene la capacidad para analizar estructuras de datos complejas [6]. Mostrando claramente que las emisiones totales anuales de CO2 de Perú aumenten en los próximos años. Estos conocimientos reales serán útiles para que los responsables de la formulación de políticas traigan cambios significativos en las principales áreas medioambientales en nuestro país.

5.     Recomendaciones

·        El gobierno de Perú debería reducir la contaminación implementando acciones políticas tales como aumentar los impuestos a las empresas contaminantes, especialmente a aquellas que utilizan combustibles fósiles en sus actividades de producción.

·        Es necesario desarrollar o adquirir tecnologías de ahorro de energía más eficaces.

·        Se recomienda el uso de energías renovables en Perú.

·        Se recomienda esforzarse por educar continuamente a la sociedad de Perú sobre la esencia de la reducción de los niveles de contaminación.

·        Se recomienda tener acceso gratuito a las mediciones del CO2 de manera diaria, mensual o a tiempo real para futuras investigaciones y realizar modelos más eficientes que permitan tomar mejores decisiones.

Referencias

D. M. Maria, A. Adriana, L. Laura y J. Maritza, Rev. EIA, vol.18 (2021)

E. Hopali y A. Cakmak., Rev. Internacional de Información, Negocios y Gestión, vol. 12 (2020).

E. Shabani et al., Rev. Cleaner Production, vol. 279 (2021).

G. C. Mauricio David, tesis, Universidad Nacional de San Agustín de Arequipa, 2021.

J. Eyoh, I. Umoeka y, E. Udo, Rev. Internacional de Tendencias Avanzadas en Ciencias e Ingeniería de la Computación, vol. 10 (2021).

L. Ning, L. Pei and F. Li., Rev. Hindawi, Article ID 1441942 (2021).

L. O. Pedro, tesis, Universidad Nacional de Cajamarca PE, 2021.

S. R. Eduardo et al., Rev. JC, vol. 10 (2021).

Swaraj et al., Rev. Informática Biomédica, vol. 121 (2021).

T. M. Santos et al., IEEE International Systems Conference (SysCon), 2021, pp. 1-8.

UNEP, UNEP DTU Partnership, Informe sobre la Brecha de Emisiones, 2021.

W. Zhou et al., Rev, Chaos, Solitons & Fractals, vol. 147 (2021).

Y. Qi, W. Peng , R. Yan and G. Rao, Rev. Hindawi, Article ID 6659302 (2021).

Yi-Chung Hu et al., Rev. Internacional de investigación ambiental y salud pública, vol. 18 (2021).