Ratios, promedios, y resultados reproducibles

Estoy haciendo malabares con la encuesta nacional a los presidentes municipales de 2002. El proyecto busca definir el tamaño óptimo de gestión de recursos hidrológicos a nivel municipal, lo que requiere reconciliar unidades administrativas con unidades hidrológicas. Estamos estudiando la capacidad de cooperación intermunicipal reportada por los presidentes municipales. El mismo asunto está estudiado en Rodríguez-Oreggia y Tuirán Gutiérrez, en Gestión Pública 2006

Teniendo la mismita base de datos, me interesa replicar los resultados de dichos autores y a  partir de alli empezar a jugar. Esos autores reportan el siguiente cuadrito:







O la variable de deuda está mal definida o yo no entiendo nada. La situación es triste pues si ni por las estadísticas básicas nos ponemos de acuerdo, mucho menos en los probits. Llegaba a lo siguiente. Las dos primeras variables están muy bien, se reproducen las básicas exactamente.


Pero qué pasa con la deuda?? La media me da uno, mientras la de ellos es 0.05. Pensé que estaba tomando una pregunta diferente en la encuesta, pero no. Si la variable deuda se define como la ratio del dato municipal a la media de los municipios, como hacen ellos, entonces la media no puede ser sino uno. Es refacilito verlo:






El promedio de las ratios de los observados con respecto a su media tiene que ser uno. Me parece que la media de la deuda, tal como ellos la definen, no puede ser 0.05. Sonamos.



Moraleja: O no entiendo nada o tenemos problemas en el asunto de los resultados reproducibles de los estudios científicos...


Actualizacion I: Van tres días desde que contacté a los autores planteándoles mis dudas. El correo de uno de ellos ya no funciona. El otro correo parece si funcionar, pero no he recibido respuesta. Lo que he hecho es obtener el ln(deuda) y seguir trabajando. La variable de las ratios de los observados a la media se parece más a lo que ellos reportan cuando cada observado es el logaritmo de la deuda reportada en la encuesta. No obstante, me hacen falta las dummies de legislación estatal que no vienen en la encuesta, y que ellos obtienen del trabajo de Santín que citan en su artículo. Dicho trabajo es fantasma pues no se encuentra en ningún lado. Fue editado por la Sedesol a través del Indesol (aunque la información es imprecisa, hágame usté el favor), pero no está en ningún lado electrónicamente. En pleno 2011 tendré que ir al centro documental de dicho instituto/secretaría (asumiendo que tienen uno) a buscar el ejemplar físico... Áteme esa mosca por el rabo (Sacristán dixit). 

Así pasa un día más de evidencia de los efectos medio nocivos de costos elevados de transacción en la divulgación de la investigación en este país...


Actualización II: ARGGHHHHH GRRRRRRR 






Más costos de transacción a lo menso!! Llevan 9 meses levantando ese sitio!!! 9!! Un ser humano nace en 9 meses y ellos no pueden levantar un sitio de búsqueda