Printer Friendly

Prediccion de los precios de contratos de electricidad usando programacion genetica con bloques funcionales.

Electricity contract price prediction using genetic programming with functional blocks

INTRODUCCION

En los ultimos anos la prediccion de series de precios ha sido de gran importancia, principalmente en los mercados de energia, debido a la desregularizacion de los mercados de precios de compra y venta, y la complejidad inherente a la modelacion de series temporales.

En los precios de la electricidad influyen varios factores: las caracteristicas fisicas del sistema de generacion, las decisiones de negocio de los distintos agentes y la regularizacion [1]. Lo anterior conlleva que en las series de precios de la energia se presenten: componentes ciclicos estacionales con periodicidad de corto y largo plazo, volatilidad variable en el tiempo, cambios estacionales, valores extremos, correlaciones de alto orden y tendencias locales [2], que generan alta complejidad en la generacion de modelos la modelacion y prediccion de las series temporales.

Adicionalmente, se presenta que los agentes del mercado utilizan contratos para la negociacion de la electricidad, como mecanismo de mitigacion del riesgo asociado a las fluctuaciones de corto plazo, protegiendo asi al comprador de precios excesivamente altos, como al vendedor de precios demasiado bajos.

Desde la liberalizacion del mercado electrico colombiano, se establecio que la electricidad puede ser negociada en la Bolsa de Electricidad o a traves de contratos bilaterales entre agentes. Actualmente, existen dos tipos principales de contratos: paguecontratado y pague-demandado. Pague-contratado consiste en que el comprador debe pagar la totalidad de la electricidad contratada; mientras que, en pague-demandado, el comprador solo se compromete a pagar la energia efectivamente consumida.

Es asi que la prediccion de los precios de la electricidad es una necesidad constante de los distintos agentes de mercado para planear y desarrollar sus estrategias de negociacion y generacion de energia.

En la literatura se han reportado experiencias sobre el pronostico de series de precios de la energia utilizando perceptrones multicapa (MLP, por su sigla en ingles), redes neuronales artificiales, modelos DAN2 [3], heuristicas y modelos ARIMA [4]. Sin embargo, los modelos propuestos asumen la estructura funcional de los datos y se concentran en la optimizacion de parametros respectivos, sin considerar que pueden corresponder a una mezcla de modelos.

Por otra parte, en la literatura tambien se presentan algoritmos bio-inspirados que permiten evitar asumir la forma de la funcion de prediccion a priori; por el contrario, la determinan a partir de un espacio de busqueda definido. Una de las principales tecnicas corresponde a la programacion genetica (GP, por su sigla en ingles). GP puede entenderse como una extension de los algoritmos geneticos que permite obtener expresiones matematicas empiricas que aproximan la relacion existente y desconocida entre un conjunto de variables independientes y una variable dependiente; es asi como en GP, los individuos representan expresiones matematicas [5]. Para ello, dichas expresiones matematicas (o individuos en la jerga de los algoritmos geneticos) son representadas como arboles sintacticos donde las funciones y operadores matematicos (suma, resta, multiplicacion, etc.) van en los nodos interiores (o nodos funcionales), y las variables y las constantes numericas van en los nodos terminales. De esta forma, al aplicar los operadores geneticos de clonacion, cruce y mutacion sobre una poblacion de individuos, se realiza una busqueda en el espacio de expresiones matematicas con el fin de encontrar una ecuacion empirica que permita representar la relacion existente entre un conjunto de variables de entrada y una variable de salida.

Sin embargo, dado que el algoritmo de GP es principalmente combinatorio, en el cual los terminales corresponden a los rezagos y constantes, no es posible garantizar el uso de todos los rezagos de interes, la inclusion de modelos de prediccion de series de tiempo de la literatura, ni limitar el espacio de busqueda. Por lo anterior, se propone el uso de bloques funcionales (BF) como unicos terminales a ser considerados en la generacion de los individuos.

Por lo anterior, el objetivo de este articulo es presentar los resultados obtenidos al pronosticar la serie de precios promedio mensuales de contratos despachados en la Bolsa de Energia de Colombia, GP y comparandolo con los reportados en la literatura usando DAN2 y un modelo ARIMA, y determinar cual de dichas aproximaciones permite obtener pronosticos mas precisos. En este caso se consideran unicamente modelos univariados, ya que no hay estudios que permitan relacionar los precios de los contratos con variables fisicas o economicas del mercado de electricidad, ni con la serie de precios de Bolsa. Una presentacion profunda sobre el modelo ARIMA, sus propiedades y su proceso de especificacion es realizada por Makridakis et al. (1998).

La originalidad e importacion de la investigacion propuesta se basa en los aspectos:

1. Aunque en la literatura se han presentado casos de prediccion de precios de electricidad en mercados de corto plazo [1], el de contratos no ha sido tan nutrido y aun presenta problemas de prediccion a horizontes de tiempo superiores a un ano.

2. La motivacion de este articulo surge desde la necesidad de los agentes de mercado para contar con pronosticos acertados de los precios de la electricidad, que les permitan tomar decisiones adecuadas de negocio. En este articulo se busca evaluar si es posible utilizar el algoritmo de programacion genetica para el pronostico de la serie de precios, de tal manera, que sus resultados son una clara senal para la continuacion de esta investigacion incorporando nuevos avances en GP. Debe aclararse que esta investigacion no se centra en los aspectos rigurosos y formales propios del analisis econometrico, sino en los aspectos empiricos de la prediccion como un insumo para la toma de decisiones, donde prima la capacidad para obtener el pronostico mas preciso posible, dejando a un lado los aspectos mas formales.

3. Se contribuye a difundir el uso de GP para la prediccion de series de precios en mercados de electricidad, aumentando asi la cantidad de herramientas disponibles.

El resto de este articulo esta organizado como se indica a continuacion. En la seccion 2, se analiza el algoritmo de programacion genetica y la informacion del mercado colombiano de precios de la energia. En la seccion 3, se reportan los resultados obtenidos usando el algoritmo de GP y se comparan con los resultados obtenidos usando un modelo DAN2 y ARIMA. En la ultima seccion se presentan las respectivas conclusiones.

1 METODOLOGIA

1.1 Informacion utilizada

En este trabajo fue analizado el logaritmo natural de la serie de precios mensuales promedio de los contratos despachados en la Bolsa del mercado mayorista de electricidad en Colombia (PCONTRATOS) expresada en $/kWh, entre mayo de 1996, y junio de 2008.

PCONTRATOS es calculada como el promedio de los precios pactados en los contratos en ejercicio durante cada mes, ponderados por la cantidad de energia negociada en cada contrato; cabe precisar que el precio pactado en cada contrato es privado y, por tanto, los agentes del sistema no tienen acceso a este valor. Consecuentemente, la serie en estudio se constituye como la unica senal directamente visible para todo el mercado sobre este indicador. Por otra parte, la cantidad de electricidad negociada en contratos corresponde hasta en un 80 % del total de la produccion de los agentes generadores en el mercado, los cuales dejan el porcentaje restante para maniobrar en la Bolsa de Energia.

El comportamiento de la serie muestra alta complejidad, debido principalmente a [7]:

* La cantidad de energia liquidada al final del contrato: pague-lo-contratado, paguelo-demandado, pague-lo-demandado-con-tope.

* El mecanismo para calcular los precios: un unico precio fijo para todo el contrato, precio horario fijo, precio amarrado al precio de Bolsa, precio indexado, inclusion de topes maximo y minimo para el precio del contrato.

* El momento en que fueron firmados los contratos en ejercicio: desde unos pocos meses hasta diez anos atras. No obstante, existe una clara tendencia a que el plazo de los contratos no supere los dos anos.

En la figura 1, se puede apreciar la prediccion (circulos blancos) de la serie PCONTRATOS desde mayo de 1998 (circulos rellenos), la cual fue analizada por [2], mostrando una tendencia creciente de largo plazo hasta el primer semestre de 2003; durante ese mismo intervalo de tiempo se evidencia una componente ciclica de periodicidad anual de amplitud variable, explicada, posiblemente, por el ciclo invierno-verano. Desde el ano 2003 se presenta una tendencia ligeramente descendente que finaliza en algun momento del primer semestre del ano 2006. Se evidencia en este momento del tiempo un cambio estructural en la serie, tanto en su tendencia como en su componente ciclica; por una parte, se recuperan los niveles de crecimiento que caracterizaron los anos 2000, 2001 y 2002, mientras que, por la otra, se presenta nuevamente un ciclo estacional de periodo anual, cuyo nivel mas alto coincide con la estacion de verano [2].

1.2 Metodologia empleada

Se incluyeron los articulos que cubren el pronostico de los indicadores bursatiles mediante logica difusa, sistemas de inferencia borrosa y sistemas neuro-difusos. Se excluyeron los articulos relacionados con el analisis fundamental o en los que se pronostiquen los precios de acciones particulares.

El algoritmo de programacion genetica corresponde a una extension de los algoritmos geneticos (GA, por su sigla en ingles) propuesto por Koza (1992), en los cuales los individuos corresponden a expresiones matematicas, representadas computacionalmente por arboles sintacticos, por lo general binarios. Los individuos estan compuestos por nodos internos llamados nodos funcionales y nodos al final de las ramas llamados nodos terminales. Los nodos funcionales corresponden a los operadores a ser utilizados, suelen corresponder a operaciones aritmeticas basicas F = {+, -, *, /}. Los nodos terminales corresponden a las variables de entrada y constantes numericas (tambien llamadas parametros) a ser utilizados T = {[c.sub.1], ..., [c.sub.k], [x.sub.t-1], ..., [x.sub.t-p]}.

Por otro lado, los operadores geneticos de cruce y clonacion son aplicados a los arboles sintacticos, y no solo a valores especificos como en GA.

A continuacion se muestra el algoritmo original de GP propuesto por Koza (1992):

1. En la iteracion o generacion inicial (g = 0) se crea una poblacion ([P.sub.0]) de n individuos.

2. Para cada individuo [S.sub.i], con i = {1, ..., n}, se evalua la funcion de aptitud f ([S.sub.i]).

3. Se genera una nueva poblacion [P.sup.*.sub.g] aplicando los operadores geneticos a la poblacion actual [P.sub.g], de la siguiente forma:

a) Son seleccionados los padres a los cuales se les aplicaran los operadores de cruce y clonacion de una manera probabilistica.

b) A diferencia de los algoritmos geneticos tradicionales no se considera el operador de mutacion por lo que se limita a cruce y clonacion.

4. La poblacion de hijos [P.sup.*.sub.g] se remplaza por la poblacion actual [P.sub.g] asi: [P.sub.g] = [P.sup.*.sub.g]

5. Se evaluan los criterios de parada (usualmente es utilizado el numero maximo de generaciones); si no se cumplen se vuelve al paso 2. En caso contrario se termina la ejecucion del algoritmo.

Por otra parte, en [8] son mostradas las ventajas de utilizar bloques funcionales como unicos terminales a ser considerados en la generacion de los individuos. De acuerdo con ello, en este trabajo se toma el algoritmo original de GP con terminales correspondientes a BF.

Los BF corresponden a una funcion B(.) la cual puede ser evaluada numericamente sin depender de otras funciones externas. B (.) puede entenderse como una combinacion lineal de las funciones [g.sub.i] (.) asi: BF = b + [suma de (i)] [w.sub.i][g.sub.i] (X), donde X es el vector de entradas (variables/rezagos) del modelo, b y [w.sub.i] son los parametros del BF.

2 RESULTADOS Y DISCUSION

La muestra seleccionada corresponde al logaritmo natural de los precios medio mensuales de los contratos despachados en la Bolsa del mercado mayorista de electricidad en Colombia, expresada en $/kWh entre mayo de 1996 y junio de 2008 (PCONTRATOS). La serie consta de 146 observaciones, de las cuales las primeras 122 son utilizadas para entrenamiento del algoritmo y las restantes 24 para validacion de pronostico. Con el fin de analizar distintos horizontes de tiempo de prediccion, se separo el conjunto de datos de validacion en un ano (12 primeras observaciones) y dos anos.

Para cada uno de los conjuntos de datos (prediccion 1 ano y prediccion 2 anos), fue analizada la bondad de ajuste por medio de la sumatoria del error cuadratico medio (SSE, por su sigla en ingles) y su desviacion media absoluta (MAD, por su sigla en ingles).

En la tabla 1, se reportan los resultados obtenidos por la metodologia propuesta utilizando GP (GPBF), la metodologia tradicional de GP, los cuales fueron resumidos por medio de dos modelos:

* GP-1: Poblacion inicial: 30 individuos; nivel de profundidad maximo inicial 3; Numero maximo de generaciones: 10; Funcion de error: SSE; Numero de rezagos: 12. Funcion de optimizacion: OPTIM.

* GP-2: Poblacion inicial: 30 individuos; nivel de profundidad maximo inicial 3; Numero maximo de generaciones: 10; Funcion de error: SSE; Numero de rezagos: 25. Funcion de optimizacion: OPTIM.

* GPBF-1: Poblacion inicial: 100 individuos; nivel de profundidad maximo inicial 30; Numero maximo de generaciones: 10; Funcion de error: SSE; Numero de rezagos: 12.

* GPBF-2: Poblacion inicial: 100 individuos; nivel de profundidad maximo inicial 30; Numero maximo de generaciones: 10; Funcion de error: SSE; Numero de rezagos: 25.

Adicionalmente, en la tabla 1 se muestran los resultados de los modelos DAN2 y ARIMA reportados en [2].

En la tabla 1 se puede apreciar que el modelo propuesto GPBF-2 presenta el mejor ajuste de pronostico tanto para un horizonte de 12 meses como para el de 24 meses, con unos SSE (MAD) de 0.006 (0.018) y 0.011 (0.019), respectivamente.

Lo anterior implica que el modelo generado por GPBF-2 presenta tanto un mejor error de aproximacion en los pronosticos, como una menor desviacion absoluta. Cabe resaltar, ademas, que GPBF-2 disminuye en un 54% el SSE de pronostico a un ano con respecto al modelo DAN2-3, el cual es el de menor SSE reportado por [2] y en un 50% con respecto al modelo ARIMA-3 para el pronostico a dos anos, el cual corresponde al modelo con menor SSE reportado por [2].

Por otra parte, comparando los resultados de GPBF-2 con los resultados del algoritmo tradicional de GP (GP-1 y GP2) tambien se muestra una mejora del 50 % en el SSE de prediccion a un ano y del 54 % con respecto al SSE de prediccion de dos anos con respecto al modelo GP-1. Esto tambien muestra la mejora registrada en la capacidad de prediccion al utilizar bloques funcionales.

Los resultados indican, de forma indirecta, que el modelo GPBF-2 captura adecuadamente la dinamica de la serie PCONTRATOS, respecto a las aproximaciones ARIMA y DAN2.

[FIGURA 1 OMITIR]

3 CONCLUSIONES

En este articulo se pronostican los precios promedio de contratos despachados en el mercado electrico colombiano, usando el algoritmo de programacion genetica con bloques funcionales, comparandolos con los reportados por modelos ARIMA y DAN2. El modelo de GP con BF preferido es capaz de capturar la dinamica intrinseca de la serie de precios, ademas de pronosticar con una mayor precision que los reportados por la metodologia ARIMA clasica y DAN2 para los horizontes de tiempo de 12 y 24 meses. Este resultado confirma que es posible la aplicacion del algoritmo de GP a la prediccion de la serie de precios promedio despachados en el mercado electrico colombiano con menor error y un nivel de variabilidad inferior que los modelos tradicionales de prediccion de series de tiempo ARIMA y las redes neuronales dinamicas DAN2.

REFERENCIAS

[1] J. D. Velasquez, I. Dyner y R. C. Souza, "?Por que es tan dificil obtener buenos pronosticos de los precios de la electricidad en mercados competitivos?", Cuadernos de Administracion, 20(34), 259-282, 2007.

[2] J. D. Velasquez H. y C. J. Franco C., "Prediccion de los precios de contratos de electricidad usando una red neuronal con arquitectura dinamica", Innovar, vol. 20, no. 36, pp. 7-14. ISSN 0121-5051, 2010.

[3] M. Ghiassi y H. Saidane, "A dynamic architecture for artificial neural networks", Neurocomputing, 63, 397-413, 2005.

[4] G. E. P. Box y G. M. Jenkins, "Time Series Analysis: Forecasting and Control", San Francisco: Holden-Day Inc, 1970.

[5] J. R. Koza, "Genetic Programming: On the Programming of Computers by Means of Natural Selection", Cambridge: MIT Press, 1992.

[6] S. G. Makridakis, S. C. Wheelwright y R. J. Hyndman, "Forecasting: Methods and applications (3a. ed.)", New York: John Wiley & Sons, 1998.

[7] I. Dyner, C. J. Franco y S. Arango, "El mercado mayorista de electricidad colombiano", Medellin: Universidad Nacional de Colombia, 2008.

[8] C. A. Martinez y J. D. Velasquez H. "Problemas abiertos en la aplicacion de la Regresion Simbolica en el pronostico de series de tiempo", Tesis de maestria, Universidad Nacional de Colombia sede Medellin, 2011.

Recibido: 22/05/2013 * Aceptado: 06/09/2013

Carlos A. Martinez, Estudiante, Doctorado en Ingenieria--Ingenieria de Sistemas e Informatica, Universidad Nacional de Colombia, Medellin, Colombia (2013) ; Magister en Ingenieria de Sistemas, Universidad Nacional de Colombia, Medellin, Colombia (2012). Direccion de correspondencia: Universidad Nacional de Colombia. Facultad de Minas. Cra 80 65-223, Bloque M8A, Of. 206. Medellin, Colombia. Tel +57 +4 425 5350. Correo electronico: amartin@unal. edu.co

Juan D. Velasquez, Doctor en Ingenieria, Area de Sistemas Energeticos, Universidad Nacional de Colombia, Medellin, Colombia (2009); Magister en Ingenieria de Sistemas, Universidad Nacional de Colombia, Medellin, Colombia (1997); Profesor Asociado de la Universidad Nacional de Colombia (sede Medellin, Colombia).. Direccion de correspondencia: Universidad Nacional de Colombia. Facultad de Minas. Cra 80 65-223, Bloque M8A, Of. 206. Medellin, Colombia. Tel. +57 +4 425 5370. Correo electronico: jdvelasq@unal.edu.co
Tabla 1: Estadisticos de ajuste de los modelos a la serie de
precios.

Modelo          Rezagos         Prediccion 1 Ano   Prediccion 2 Anos
                                   SSE (MAD)           SSE (MAD)

GP--1           1-12             0.012 (0.023)       0.024 (0.021)
GP--2           1-25             0.012 (0.024)       0.025 (0.023)
GPBF--1         1-12             0.026 (0.035)       0.068 (0.042)
GPBF--2         1-25             0.006 (0.018)       0.011 (0.019)
ARIMA--1 [2]    1                0.015 (0.031)       0.023 (0.026)
ARIMA--2 [2]    1-2              0.015 (0.031)       0.023 (0.026)
ARIMA--3 [2]    1-3              0.015 (0.031)       0.022 (0.026)
ARIMA--4 [2]    1-4              0.015 (0.031)       0.022 (0.026)
ARIMA--5 [2]    1-5              0.019 (0.033)       0.028 (0.027)
ARIMA--6 [2]    1-6              0.018 (0.033)       0.027 (0.028)
ARIMA--7 [2]    1-7              0.017 (0.033)       0.027 (0.029)
ARIMA--8 [2]    1-8              0.017 (0.034)       0.028 (0.029)
ARIMA--9 [2]    1-9              0.017 (0.034)       0.027 (0.029)
ARIMA--10 [2]   1-10             0.018 (0.035)       0.030 (0.031)
ARIMA--11 [2]   1-11             0.018 (0.034)       0.030 (0.030)
ARIMA--12 [2]   1-12             0.017 (0.033)       0.026 (0.028)
DAN2--1 [2]     1-2, 13-14       0.015 (0.028)       0.041 (0.034)
DAN2--2 [2]     1-3, 13-15       0.017 (0.029)       0.040 (0.031)
DAN2--3 [2]     1-4, 13-16       0.013 (0.025)       0.037 (0.029)
DAN2--4 [2]     1-5, 13-17       0.017 (0.021)       0.042 (0.027)
DAN2--5 [2]     1-6, 13-18       0.031 (0.036)       0.063 (0.038)
DAN2--6 [2]     1-7, 13-19       0.023 (0.032)       0.066 (0.039)
DAN2--7 [2]     1-8, 13-20       0.019 (0.031)       0.041 (0.032)
DAN2--8 [2]     1-9, 13-21       0.021 (0.033)       0.041 (0.034)
DAN2--9 [2]     1-10, 13-22      0.024 (0.035)       0.045 (0.035)
DAN2--10 [2]    1-11, 13-23      0.022 (0.034)       0.041 (0.033)
DAN2--11 [2]    1-24             0.035 (0.041)       0.086 (0.044)
DAN2--12 [2]    1-25             0.064 (0.056)       0.084 (0.047)

Fuente: elaboracion propia
COPYRIGHT 2014 Universidad de Medellin
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2014 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Martinez, Carlos A.; Velasquez, Juan D.
Publication:Revista Ingenierias
Date:Jan 1, 2014
Words:3547
Previous Article:Identificacion de peligros quimicos en cuencas de abastecimiento de agua como instrumento para la evaluacion del riesgo.
Next Article:Sistema de inferencia difuso para la valoracion de empresas.
Topics:

Terms of use | Privacy policy | Copyright © 2021 Farlex, Inc. | Feedback | For webmasters |