48
Aprendizaje de M´ aquinas Aplicado al An´ alisis de Poder de Mercado en el Mercado El´ ectrico ´ Alvaro Riascos 1 Juli´ an Chitiva 2 Hamadys Benavides 2 1 Universidad de los Andes y Quantil 2 Quantil II Foro XM Septiembre 5 - 6 de 2019

Aprendizaje de Máquinas Aplicado al Análisis de Poder de

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Aprendizaje de Maquinas Aplicado al Analisis dePoder de Mercado en el Mercado Electrico

Alvaro Riascos 1 Julian Chitiva 2 Hamadys Benavides 2

1Universidad de los Andes y Quantil

2Quantil

II Foro XM

Septiembre 5 - 6 de 2019

Page 2: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Contenido

1 Introduccion

2 MetodologıaIndicadoresValidacionAprendizaje de maquinas

3 Monitoreo

Quantil Aprendizaje de Maquinas y Poder de Mercado

Page 3: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion

La liberalizacion del sector electrico ha tenido como uno desus principales propositos promover la eficiencia de laprestacion de un servicio escencial para la sociedad, de formaconfiable, con calidad, etc.

Desde un punto de vista economico, en mercadosdescentralizados la prescripcion normativa es promover lacompetencia (i.e., mitigar el poder de mercado).

Quantil Aprendizaje de Maquinas y Poder de Mercado

Page 4: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion

La liberalizacion del sector electrico ha tenido como uno desus principales propositos promover la eficiencia de laprestacion de un servicio escencial para la sociedad, de formaconfiable, con calidad, etc.

Desde un punto de vista economico, en mercadosdescentralizados la prescripcion normativa es promover lacompetencia (i.e., mitigar el poder de mercado).

Quantil Aprendizaje de Maquinas y Poder de Mercado

Page 5: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion: El Problema

Como garantizar una operacion eficiente en un mercado con lacarcterısticas propias del mercado electrico:

1 Demanda inelastica.2 Concentracion de mercado.3 Altos costos de almacenamiento.

Quantil Aprendizaje de Maquinas y Poder de Mercado

Page 6: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion: Modelo

El modelo de Cournot como forma de racionalizar el problemay la propuesta de solucion.

Un mercado con pocas firmas en competencia a la Cournot.

En equilibrio:

Markup ≡ P − CMi

P= −1

ε

Qi

Q

CMi es el costo marginal del recurso i .P es el precio de bolsa.ε es la elasticidad de la demanda del mercado.Qi disponibilidad del recurso i .Q demanda agregada.

Page 7: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion: Modelo

El modelo de Cournot como forma de racionalizar el problemay la propuesta de solucion.

Un mercado con pocas firmas en competencia a la Cournot.

En equilibrio:

Markup ≡ P − CMi

P= −1

ε

Qi

Q

CMi es el costo marginal del recurso i .P es el precio de bolsa.ε es la elasticidad de la demanda del mercado.Qi disponibilidad del recurso i .Q demanda agregada.

Page 8: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion: Modelo

El modelo de Cournot como forma de racionalizar el problemay la propuesta de solucion.

Un mercado con pocas firmas en competencia a la Cournot.

En equilibrio:

Markup ≡ P − CMi

P= −1

ε

Qi

Q

CMi es el costo marginal del recurso i .P es el precio de bolsa.ε es la elasticidad de la demanda del mercado.Qi disponibilidad del recurso i .Q demanda agregada.

Page 9: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Motivacion: Modelo

El modelo de Cournot como forma de racionalizar el problemay la propuesta de solucion.

Un mercado con pocas firmas en competencia a la Cournot.

En equilibrio:

Markup ≡ P − CMi

P= −1

ε

Qi

Q

CMi es el costo marginal del recurso i .P es el precio de bolsa.ε es la elasticidad de la demanda del mercado.Qi disponibilidad del recurso i .Q demanda agregada.

Page 10: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Experiencia internacional

Existe un consenso en la necesidad de introducir unmecanismo de monitoreo y seguimiento del mercado tal que:

1 Permita identificar potenciales abusos de poder de mercado.2 Introduzca medidas de mitigacion exante y/o punitvas expost.

Ejemplos: OFGEM (Gran Bretana), Nordpool (paısesEscandinavos), FERC (Estados Unidos), NYISO (NuevaYork), PJM (Centro Estados Unidos) CAISO (California), etc.

Page 11: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Experiencia internacional

Existe un consenso en la necesidad de introducir unmecanismo de monitoreo y seguimiento del mercado tal que:

1 Permita identificar potenciales abusos de poder de mercado.2 Introduzca medidas de mitigacion exante y/o punitvas expost.

Ejemplos: OFGEM (Gran Bretana), Nordpool (paısesEscandinavos), FERC (Estados Unidos), NYISO (NuevaYork), PJM (Centro Estados Unidos) CAISO (California), etc.

Page 12: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Literatura academica

Internacional

Twomey, Green, Neuhoff y Newbery. 2005. Review of theMonitoring of Market Power. Journal of Economic Literature.

Wolak. 2003. Measuring Unilateral Market Power inWholesale Electricity Markets: The California Market:1998-2000. American Economic Review.

Newbery. 2008. Predicting Market Power in WholesaleElectricity. Cambridge Working Papers in Economics Markets.

Swinand, Scully, Foulkes, Kessler. 2007. Structure andPerformance of Six European Wholesale Electricity Markets in2003, 2004, and 2005. London Economics.

Page 13: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Literatura academica

Colombia

Botero, Garcıa, Velez. 2013. Mecanismos utilizados paramonitorear el poder de mercado en mercados electricos:Reflexiones para Colombia. Cuadernos de Economıa.

Medidas para la Promocion de la Competencia en el MercadoMayorista de Electricidad. 2010. Documento CREG - 118.

Page 14: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Contenido

1 Introduccion

2 MetodologıaIndicadoresValidacionAprendizaje de maquinas

3 Monitoreo

Quantil Aprendizaje de Maquinas y Poder de Mercado

Page 15: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

En una cascara de nuez...

1 Construccion indicadores de competencia (IOR).

2 Validacion de la relevancia de los indicadores (dependencia delIOR con markups y contratos).

3 Hacia una metodologıa de deteccion y generacion de alertasbasada en aprendizaje de maquinas.

Page 16: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residualEl IOR del recurso i se define como:

IOR =

∑j Qj − Qi

Q

Es una generalizacion continua de concepto de agente pivotal.

IOR vs Agente Pivotal

IOR o Pivotal

Oferta residual / Demanda

¿Qué pasó?

¿Qué pasará?

¿Qué pasaríasi…?

Más Poder de Mercado

IOR

Menos Poder de Mercado

0

1

1

Figura: IOR vs. Agente Pivotal

Page 17: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residualEl IOR del recurso i se define como:

IOR =

∑j Qj − Qi

Q

Es una generalizacion continua de concepto de agente pivotal.

IOR vs Agente Pivotal

IOR o Pivotal

Oferta residual / Demanda

¿Qué pasó?

¿Qué pasará?

¿Qué pasaríasi…?

Más Poder de Mercado

IOR

Menos Poder de Mercado

0

1

1

Figura: IOR vs. Agente Pivotal

Page 18: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual

Teorıa (el modelo de Cournot nuevamente):

Markup ≡ P − CMi

P= −1

ε(1− IORi )

Incluimos importaciones y excluimos recursos determinısticos(no restamos los contratos al no existir informacion publicahoraria - subestimamos el IOR).

No tenemos informacion de mantenimientos (no es pubica) nifallas (sobrestimamos la oferta residual y por lo tanto el IOR).

Page 19: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual

Teorıa (el modelo de Cournot nuevamente):

Markup ≡ P − CMi

P= −1

ε(1− IORi )

Incluimos importaciones y excluimos recursos determinısticos(no restamos los contratos al no existir informacion publicahoraria - subestimamos el IOR).

No tenemos informacion de mantenimientos (no es pubica) nifallas (sobrestimamos la oferta residual y por lo tanto el IOR).

Page 20: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual

Teorıa (el modelo de Cournot nuevamente):

Markup ≡ P − CMi

P= −1

ε(1− IORi )

Incluimos importaciones y excluimos recursos determinısticos(no restamos los contratos al no existir informacion publicahoraria - subestimamos el IOR).

No tenemos informacion de mantenimientos (no es pubica) nifallas (sobrestimamos la oferta residual y por lo tanto el IOR).

Page 21: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual

Teorıa (el modelo de Cournot nuevamente):

Markup ≡ P − CMi

P= −1

ε(1− IORi )

Incluimos importaciones y excluimos recursos determinısticos(no restamos los contratos al no existir informacion publicahoraria - subestimamos el IOR).

No tenemos informacion de mantenimientos (no es pubica) nifallas (sobrestimamos la oferta residual y por lo tanto el IOR).

Page 22: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual: recursos

Figura: IOR por recurso

Page 23: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual: agentes

Figura: IOR por agentes

Page 24: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Indicador de oferta residual: agentes horas pico vs. valle

Figura: IOR por agentes horas pico vs. valle

Page 25: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Markups y contratos

Tres ideas (evidencia sugestiva):1 Relacion entre markups basados en costos marginales

estimados desde un punto de vista de ingenierıa (estimacion decostos - Riascos, Camelo, de Castro, Oren, Papavasiliou.[2016], [2018]).

2 Markups basados en costos marginales estimados desde unpunto de vista economico (i.e., costos revelados en un modelode competencia - Carranza, Martin, Riascos [2019] yGarcia-Rendon, Perez-Libreros [2019]).

3 Relacion con contratos.

Page 26: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Markups y contratos

Tres ideas (evidencia sugestiva):1 Relacion entre markups basados en costos marginales

estimados desde un punto de vista de ingenierıa (estimacion decostos - Riascos, Camelo, de Castro, Oren, Papavasiliou.[2016], [2018]).

2 Markups basados en costos marginales estimados desde unpunto de vista economico (i.e., costos revelados en un modelode competencia - Carranza, Martin, Riascos [2019] yGarcia-Rendon, Perez-Libreros [2019]).

3 Relacion con contratos.

Page 27: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Markups y contratos

Tres ideas (evidencia sugestiva):1 Relacion entre markups basados en costos marginales

estimados desde un punto de vista de ingenierıa (estimacion decostos - Riascos, Camelo, de Castro, Oren, Papavasiliou.[2016], [2018]).

2 Markups basados en costos marginales estimados desde unpunto de vista economico (i.e., costos revelados en un modelode competencia - Carranza, Martin, Riascos [2019] yGarcia-Rendon, Perez-Libreros [2019]).

3 Relacion con contratos.

Page 28: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Markups y contratos

Tres ideas (evidencia sugestiva):1 Relacion entre markups basados en costos marginales

estimados desde un punto de vista de ingenierıa (estimacion decostos - Riascos, Camelo, de Castro, Oren, Papavasiliou.[2016], [2018]).

2 Markups basados en costos marginales estimados desde unpunto de vista economico (i.e., costos revelados en un modelode competencia - Carranza, Martin, Riascos [2019] yGarcia-Rendon, Perez-Libreros [2019]).

3 Relacion con contratos.

Page 29: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Relacion con markups: Ingenierıa

Figura: IOR por agentes

Page 30: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Relacion con contratos: disponibilidad (neta de contratos)

Figura: IOR por agentes

Page 31: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio

La estrategia general de deteccion de anomalıas en los datoses una tarea estandar y muy estudiada en aprendizaje demaquinas.

Ejemplos:1 Sistemas de administracion de riesgo de lavado de activos y

financiacion del terrorismo (SARLAFT - SuperintendenciaFinanciera).

2 Anomalıas en la informacion de la base de suficiencia delMinisterio de Proteccion Social.

Page 32: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio

La estrategia general de deteccion de anomalıas en los datoses una tarea estandar y muy estudiada en aprendizaje demaquinas.

Ejemplos:1 Sistemas de administracion de riesgo de lavado de activos y

financiacion del terrorismo (SARLAFT - SuperintendenciaFinanciera).

2 Anomalıas en la informacion de la base de suficiencia delMinisterio de Proteccion Social.

Page 33: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: Cuatro lecciones del aprendizaje de maquinas

Enfatizar la diferencia y/o relacion entre causalidad yprediccion.

El problema de aproximacion y estimacion.

Regularizacion.

Validacion cruzada.

Page 34: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: Cuatro lecciones del aprendizaje de maquinas

Enfatizar la diferencia y/o relacion entre causalidad yprediccion.

El problema de aproximacion y estimacion.

Regularizacion.

Validacion cruzada.

Page 35: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: Cuatro lecciones del aprendizaje de maquinas

Enfatizar la diferencia y/o relacion entre causalidad yprediccion.

El problema de aproximacion y estimacion.

Regularizacion.

Validacion cruzada.

Page 36: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: Cuatro lecciones del aprendizaje de maquinas

Enfatizar la diferencia y/o relacion entre causalidad yprediccion.

El problema de aproximacion y estimacion.

Regularizacion.

Validacion cruzada.

Page 37: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: Cuatro lecciones del aprendizaje de maquinas

Enfatizar la diferencia y/o relacion entre causalidad yprediccion.

El problema de aproximacion y estimacion.

Regularizacion.

Validacion cruzada.

Page 38: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: El problema de aproximacion y estimacion

y

x

Figure 1: Suppose we want to estimate a functional dependence from a set of examples (black dots).Which model is preferable? The complex model perfectly fits all data points, whereas the straightline exhibits residual errors. Statistical learning theory formalizes the role of the capacity of themodel class, and gives probabilistic guarantees for the validity of the inferred model (from Scholkopfand Smola (2002)).

There exist two different types of consistency in the literature, depending on the taste of theauthors, and both of them are usually just called “consistency” without any distinction. Tointroduce these concepts, let us make the following notation. Given any particular classificationalgorithm, by fn we will denote its outcome on a sample of n training points. It is not importanthow exactly the algorithm chooses this function. But note that any algorithm chooses its functionsfrom some particular function space F. For some algorithms this space is given explicitly, for othersit only exists implicitly via the mechanism of the algorithm. No matter how this space F is defined,the algorithm attempts to chooses the function fn ∈ F which it considers as the best classifier inF, based on the given training points. On the other hand, in theory we know precisely what thebest classifier in F is: it is the one that has the smallest risk. For simplicity, we assume that it isunique and denote it as fF, that is

fF = argminf∈F

R(f). (3)

The third classifier we will talk about is the Bayes classifier fBayes introduced in Equation (2)above. This is the best classifier which exists at all. In the notation above we could also denote itby fFall

(recall the notation Fall for the space of all functions). But as it is unknown to the learner,it might not be contained in the function space F under consideration, so it is very possible thatR(fF) > R(fBayes). With the notation for these three classifiers fn, fF, and fBayes we can nowdefine different types of convergence:

Definition 1 Let (Xi, Yi)i∈N be an infinite sequence of training points which have been drawnindependently from some probability distribution P . Let ` be a loss function. For each n ∈ N, letfn be a classifier constructed by some learning algorithm on the basis of the first n training points.

1. The learning algorithm is called consistent with respect to F and P if the risk R(fn) convergesin probability to the risk R(fF) of the best classifier in F, that is for all ε > 0,

P (R(fn)−R(fF) > ε)→ 0 as n→∞.

2. The learning algorithm is called Bayes-consistent with respect to P if the risk R(fn) convergesto the risk R(fBayes) of the Bayes classifier, that is for all ε > 0,

P (R(fn)−R(fBayes) > ε)→ 0 as n→∞.

3. The learning algorithm is called universally consistent with respect to F (resp. universallyBayes-consistent) if it is consistent with respect to F (resp. Bayes-consistent) for all proba-bility distributions P .

7

Figura: Sobreajuste y complejidad

Page 39: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Interludio: El problema de aproximacion y estimacion38 2. Overview of Supervised Learning

High Bias

Low Variance

Low Bias

High VariancePredictionError

Model Complexity

Training Sample

Test Sample

Low High

FIGURE 2.11. Test and training error as a function of model complexity.

be close to f(x0). As k grows, the neighbors are further away, and thenanything can happen.

The variance term is simply the variance of an average here, and de-creases as the inverse of k. So as k varies, there is a bias–variance tradeoff.

More generally, as the model complexity of our procedure is increased, thevariance tends to increase and the squared bias tends to decrease. The op-posite behavior occurs as the model complexity is decreased. For k-nearestneighbors, the model complexity is controlled by k.

Typically we would like to choose our model complexity to trade biasoff with variance in such a way as to minimize the test error. An obviousestimate of test error is the training error 1

N

∑i(yi − yi)

2. Unfortunatelytraining error is not a good estimate of test error, as it does not properlyaccount for model complexity.

Figure 2.11 shows the typical behavior of the test and training error, asmodel complexity is varied. The training error tends to decrease wheneverwe increase the model complexity, that is, whenever we fit the data harder.However with too much fitting, the model adapts itself too closely to thetraining data, and will not generalize well (i.e., have large test error). In

that case the predictions f(x0) will have large variance, as reflected in thelast term of expression (2.46). In contrast, if the model is not complexenough, it will underfit and may have large bias, again resulting in poorgeneralization. In Chapter 7 we discuss methods for estimating the testerror of a prediction method, and hence estimating the optimal amount ofmodel complexity for a given prediction method and training set.

Figura: Aproximacion y estimacion

Page 40: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Lasso: Least absolute shrinkage and selection operator

El problema de optimizacion:

mın(β0,β)

1

2N

N∑

i=1

(yit − β0 − xTit β + Ri )2 + λ||β||1 (1)

Los hiperparametros se eligen con validacion cruzada.

Page 41: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Lasso: Capacidad predictiva

0

20

40

60

0.0 0.1 0.2 0.3 0.4MAPE mensual

Den

sida

d

Recursos

A

B

C

Distribución del MAPE

Figura: Desempeno predictivo

Page 42: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Lasso: Deteccion de ofertas atıpicas

0.00

0.02

0.04

0.06

0.08

150 175 200 225 250Oferta

Den

sida

dDistribución de la Oferta A

Figura: Distribucion de la oferta A

Page 43: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Lasso: Deteccion de ofertas atıpicas

0.00

0.01

0.02

0.03

0.04

0 50 100 150Oferta

Den

sida

dDistribución de la Oferta B

Figura: Distribucion de la oferta B

Page 44: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Lasso: Deteccion de ofertas atıpicas

0.00

0.02

0.04

0.06

450 475 500 525 550Oferta

Den

sida

dDistribución de la Oferta C

Figura: Distribucion de la oferta C

Page 45: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Contenido

1 Introduccion

2 MetodologıaIndicadoresValidacionAprendizaje de maquinas

3 Monitoreo

Quantil Aprendizaje de Maquinas y Poder de Mercado

Page 46: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Hacia una propuesta de monitoreo

Prueba de conducta:1 Identificar aquellos agentes pivotales (bajo IOR).2 Entre los pivotales, identificar aquellos que pontencialmente

pudieron haber abusado de su poder de mercado (deteccion deanomalıas en las ofertas).

3 Generar alertas ex-ante.

Prueba de impacto.

Page 47: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Hacia una propuesta de monitoreo

Prueba de conducta:1 Identificar aquellos agentes pivotales (bajo IOR).2 Entre los pivotales, identificar aquellos que pontencialmente

pudieron haber abusado de su poder de mercado (deteccion deanomalıas en las ofertas).

3 Generar alertas ex-ante.

Prueba de impacto.

Page 48: Aprendizaje de Máquinas Aplicado al Análisis de Poder de

Gracias!

www.alvaroriascos.com