Ratios, promedios, y resultados reproducibles

Estoy haciendo malabares con la encuesta nacional a los presidentes municipales de 2002. El proyecto busca definir el tamaño óptimo de gestión de recursos hidrológicos a nivel municipal, lo que requiere reconciliar unidades administrativas con unidades hidrológicas. Estamos estudiando la capacidad de cooperación intermunicipal reportada por los presidentes municipales. El mismo asunto está estudiado en Rodríguez-Oreggia y Tuirán Gutiérrez, en Gestión Pública 2006

Teniendo la mismita base de datos, me interesa replicar los resultados de dichos autores y a  partir de alli empezar a jugar. Esos autores reportan el siguiente cuadrito:







O la variable de deuda está mal definida o yo no entiendo nada. La situación es triste pues si ni por las estadísticas básicas nos ponemos de acuerdo, mucho menos en los probits. Llegaba a lo siguiente. Las dos primeras variables están muy bien, se reproducen las básicas exactamente.


Pero qué pasa con la deuda?? La media me da uno, mientras la de ellos es 0.05. Pensé que estaba tomando una pregunta diferente en la encuesta, pero no. Si la variable deuda se define como la ratio del dato municipal a la media de los municipios, como hacen ellos, entonces la media no puede ser sino uno. Es refacilito verlo:






El promedio de las ratios de los observados con respecto a su media tiene que ser uno. Me parece que la media de la deuda, tal como ellos la definen, no puede ser 0.05. Sonamos.



Moraleja: O no entiendo nada o tenemos problemas en el asunto de los resultados reproducibles de los estudios científicos...


Actualizacion I: Van tres días desde que contacté a los autores planteándoles mis dudas. El correo de uno de ellos ya no funciona. El otro correo parece si funcionar, pero no he recibido respuesta. Lo que he hecho es obtener el ln(deuda) y seguir trabajando. La variable de las ratios de los observados a la media se parece más a lo que ellos reportan cuando cada observado es el logaritmo de la deuda reportada en la encuesta. No obstante, me hacen falta las dummies de legislación estatal que no vienen en la encuesta, y que ellos obtienen del trabajo de Santín que citan en su artículo. Dicho trabajo es fantasma pues no se encuentra en ningún lado. Fue editado por la Sedesol a través del Indesol (aunque la información es imprecisa, hágame usté el favor), pero no está en ningún lado electrónicamente. En pleno 2011 tendré que ir al centro documental de dicho instituto/secretaría (asumiendo que tienen uno) a buscar el ejemplar físico... Áteme esa mosca por el rabo (Sacristán dixit). 

Así pasa un día más de evidencia de los efectos medio nocivos de costos elevados de transacción en la divulgación de la investigación en este país...


Actualización II: ARGGHHHHH GRRRRRRR 






Más costos de transacción a lo menso!! Llevan 9 meses levantando ese sitio!!! 9!! Un ser humano nace en 9 meses y ellos no pueden levantar un sitio de búsqueda







La idea difícil de Ricardo


Más sobre la idea difícil de Ricardo por Tim Haab, de Environmental Economics...
Un buen ejercicio en clase para mostrar las ganancias en el comercio relativas a una situación de autarquía que se derivan de patrones de comercio guíados por la ventaja comparativa.

Im my Principles of Econ class yesterday, I stole one of John's in class activities to demonstrate the principle of comparative advantage.  I posted a short video of the students participating, but the video really shows nothing other than I know how to use the video camera on my Blackberry. In setting up the demonstration, I thought I had a complete understanding of comparative advantage, after all, I'm an award winning serious economist.  But in running through the rounds of the demonstration, I ended up giving myself a much clearer understanding of what comparative advantage means*.  So I thought I would share (even if what follows is obvious to everyone else).
First some background on the experiment.  In the experiment, students are divided into groups, by table in my case, which each represent a country or island or neighborhood or state or fictitious realm or whatever.  Each group is allocated 100 hours of labor per round to be divided between the production of red things and black things. Labor is the only input required to produce red things and black things.  
The trick to the demonstration is that the production technology (the number of hours needed to produce one red thing and one black thing) is determined by a random deal of red and black playing cards.  Each group is dealt one red card and one black card from a standard deck--with face cards removed to avoid the confusion over what a J means in numbers.  The number on each card represents the number of hours it takes to produce that color thing.  For example, if I am dealt a 4 of hearts and a 5 of clubs, I can produce one red thing in 4 hours and one black thing in 5 hours. Some groups were very efficient at producing both (say a red 1 and a black 2) while most groups were efficient at one and less efficient at the the other.  There was one group that was highly inefficient at both (red 9 and black 10).  i mention that group because it plays a key role in my better understanding of comparative advantage. 
In round one of the demonstration, groups have to make production decisions on their own, with no trades allowed.  Everything produced will be consumed.  I told them to think of it as the deserted island scenario.  I threw in the requirement that in order to survive to the next round they have to consume at least three of each thing, red and black.  Beyond that, groups were free to produce as much or as little of each as they want as long as they use up all 100 hours of their labor.  Most groups chose a similar strategy with no trading:  Produce three of the good you're less efficient at producing and then maximize production of the other color.  So a group with a red 5 and a black 10 might choose to produce 3 black (30 hours) and 14 red (70 hours) using this typical strategy.  When asked why they chose this strategy, many responded that it gave them the most things to consume.  So far so good.  Since I didn't give any real reason to prefer red over black or vice-versa, maximizing total production and consumption seems to be rational. 
In round 2, countries are allowed to make one trade, but they can only trade after they make their production decisions and they can only make one trade.  Next is where I made my mistake.  I told them that the goal of trading is to see if they could improve on their first round outcome--that is consume more red and more black than they did in round 1.  While more consumption of both is a possible consequence of trade, it turns out that's really not the point.  In some cases, countries were able to find a trade that made them better off as I defined it, but in others, they weren't.  I was puzzled and thinking that I had a lot of work to do with these students.  Trade should be able to make everyone better off.   
So I encouraged everyone to trade for another round but with different partners.  And I got the same result.  Some were better off, some weren't.  And there was one group who nobody wanted to trade with; the highly inefficient group (9 red and 10 black).  That's when I started thinking that maybe I wasn't thinking about this the right way.  The principle of comparative advantage says that even if a country is highly inefficient at producing everything, there should still be opportunities for gains from trade. Maybe I needed to reconsider what I meant by gains?
So in the next round I assigned trading partners based on proximity (the closest table) and I told them that they had to make a trade, but I wanted them to trade in such a way that they consumed a bundle of red and black that they couldn't have produced on their own.   That is, the bundle they consume would have to take them more than 100 hours to produce if they produced it on their own.  That's when it clicked.  
Immediately, groups started to realize that they would have to produce the thing they were best at producing and then trade for what they needed of the other.  If two groups were better at producing red than black, then the one who had to give up the least black to produce one red would produce red and the other would produce black.  Within a minute or two, all of the groups had found an acceptable trade, including the group that was bad at producing both things.
Once they had their trades complete I asked them to calculate the number of hours it would have taken them to produce everything they consume--keeping in mind that it took a combined 200 hours to produce everything consumed by each pair of countries.  The lowest total equivalent hours of consumption we had was 240 hours and the largest was over 300, and every group was now consuming more than 100 hours worth of red and black.  In other words, through specialization and trade, we were able to expand total production/consumption by 20-50% over what could have been consumed without trade.
That's comparative advantage.
*One of the biggest benefits of teaching is that I really learn what I thought I knew.
---
MoralejaEl mensaje principal está allí: el comercio bajo ventaja comparativa funciona como una expansión del conjunto factible global por encima del de la suma de las partes... (en el ejemplo noten que la solución de comercio permite que la "economía global" del salón de clase obtenga una asignación con las 200 horas de dotacion global de trabajo que hubiera requerido 240 horas globales para producirse autárquicamente... Además de esta expansión global, la asignación consumida por cada economía local en la asignación de comercio resulta no factible con los recursos locales... En otras palabras, la asignación consumida con comercio es no factible sin comercio para todas y cada una de las regiones, incluyendo la menos eficiente).

La enfermedad Holandesa y la evidencia contemporánea

Reposteamos de Freakonomics


Accepted wisdom generally holds that the presence of natural resources in a developing country is bad news, a so-called "natural resource curse." This view began to emerge in the 1980s, and gained popularity in the mid-1990s with the publication of Jeffrey Sachs' and Andrew Warner's paper Natural Resource Abundance and Economic Growth, which argued that economies with a high ratio of natural resource exports to GDP tended to have low growth rates. One of the primary culprits cited by the resource curse theory is the economic phenomenon known as Dutch Disease, in which revenues from natural resource exports cause an increase in the real exchange rate and lead to domestic wage inflation, which in turn has a negative impact on the manufacturing sector of the resource-rich country. There is also the belief that abundant natural resources sparks political conflict and can lead to authoritarian regimes.
However, a new paper by Stephen Haber and Victor Menaldo disputes this maxim entirely. Citing data concerns with previous studies, the authors "develop unique historical datasets, employ time-series centric techniques, and operationalize explicitly specified counterfactuals." Haber and Menaldo test to see if there is "a long-run relationship between resource reliance and regime type within countries over time, both on a country-by-country basis and across several different panels."
Ultimately, they find that contrary to popular belief, "increases in resource reliance are not associated with authoritarianism." And in fact, may in many specifications, "generate results that suggest a resource blessing." (HT: Chris Blattman)

Taylor, Mankiw, Freakonomics, y las correlaciones

John Taylor, ni más ni menos, ha iniciado un debate que ahora envuelve a algunas personalidades del gremio más visibles, entre ellas, claro está, los de siempre: Krugman, Mankiw, y los Freak.

Aquí van algunas piezas de la secuencia:

  1. El primer post de Taylor: Correlación entre desempleo e inversión. 
  2. Krugman reacciona aquí diciendo... bueno... la verdad no se sabe bien qué dice, pero lo dijo bien rápido (kinda, como dicen allá, pues tiene 2 meses de retraso)...
  3. Krugman vuelve a reaccionar, graficando la relación con la inversión no residencial, Le añade un poco de teoría al asunto: la causalidad va del desempleo (que la entiende como una proxy para la capacidad instalada ociosa) a la inversión productiva (por eso no residencial). Y tiene sentido: a menor desempleo (menor capacidad ociosa) más cerca se ven las restricciones físicas a la producción, etc., por lo que hace sentido relajar dichas restricciones (con mayor inversión no residencial).
  4. Taylor dice que sí, que la correlación entre el desempleo y la inversión no residencial es aún más fuerte que entre el desempleo y la inversión total.
  5. Wolfers, del equipo Freak, dice que no! Que el asunto es puro Cherry-picking (o de cuando tomas las unicas 2 cerezas azules de entre las 400 rojas que hay para decir que todo el cerezo da frutos azules... en otras palabras, anglosajonas, un caso de sample bias: "be wary of economists wielding short samples"). Muy interesante, por supuesto, pero muy debatible (ver moraleja)
  6. Taylor le responde a Wolfers. "He is wrong". (Documentando con un caso más la sinceridad franca de los neoyorquinos de la que el resto de los estadounidenses se queja!). La pérdida de fuerza de la correlación que Wolfers observa en décadas anteriores se debe a la muy documentada, dice Taylor, elevación de la NRU (natural rate of unemployment), asunto estructural de relevancia mayor que va desplazando la curva hacia abajo (lo que hace que la relación pierda fuerza en el scatter plot) y esto obliga, ni más ni menos, a reducir la muestra a los años en que dicho fenómeno no está ya presente, que es precisamente lo que hace Taylor desde el principio. Qué elegancia para responder! 
  7. Wolfers toma la crítica con honestidad: "Taylor has responded. His observation is considered and reasonable". Pero no se convence de su conclusión. Le resta la NAIRU a la tasa de desempleo y obtiene una correlación más bien débil. Luego cita al mismo Taylor algunos años atrás: Behind the use of time-series estimation is the assumption that the structure and coefficients to be estimated remain stable over the sample period…  If this assumption is in fact not correct, the estimated function would have little use either as an explanation of the causes of murder or of the policy implications of changing the value of an exogenous variable in the structure.
  8. Mankiw se limita con una solución de compromiso. La correlación, dice, va de ambos lados (o sea que Krugman puede tener razón), y que la interpretación de la gráfica está sujeta a debate (o sea que todos tienen razón al brincar con sus explicaciones sobre lo que pasa en las gráficas). Pero la fuerza de la correlación, termina, es incontestable. Ay se me cayó.
MoralejaMe parece que Wolfers acierta en lo general. No es posible esperar una correlación fuerte observable con datos que incluyen décadas de comportamiento pues las condiciones institucionales y estructurales de una economía cambian con relativa rapidez. Las reglas del juego cambian, y con ellas las estructuras de incentivos que influencian las respuestas de los agentes que llevan a resultados diversos. Hay que usar todos los datos disponibles, sí, pero en esto Taylor tambien acierta: hay que tener cuidado al hacerlo. Una muestra completa esconde aquellos cambios estructurales. ¿Cuál es el proceder científico bueno? El que queda como resultado de la interacción que aquí relatamos: La correlación no se observa con los datos que van hasta 1948, pero se observan desplazamientos de la curva hacia adentro (lo que apoya la noción de los cambios estructurales, aquí traducidos con las modificaciones a la NRU que dice Taylor). Ahora, con la estructura actual, es decir con la muestra de Taylor, la correlación es incontestable, como dice Mankiw. Hubiera sido preferible que Taylor hubiera presentado toda la muestra. Sí. Pero es una ventaja que la disciplina sea dialógica, así también aprendemos un poco de la rudeza y la elegancia para decir que el de enfrente se equivocó...