Aplicación de métodos estadísticos a los problemas económicos

  1. Educación
  2. Economía
  3. Econometría
  4. Aplicación de métodos estadísticos a los problemas económicos

Libro Relacionado

Econometría para maniquíes

Por Roberto Pedace

Los estudiantes de Econometría siempre aprecian una revisión de los conceptos estadísticos que son más importantes para tener éxito con la econometría. Específicamente, usted necesita estar cómodo con las distribuciones de probabilidad, el cálculo de estadísticas descriptivas y las pruebas de hipótesis.

Su capacidad para cuantificar con precisión las relaciones económicas depende no sólo de sus habilidades para construir modelos econométricos, sino también de la calidad de los datos que utiliza para el análisis y de su capacidad para adoptar las estrategias apropiadas para estimar modelos que probablemente violen un supuesto estadístico. Los datos deben derivarse de un proceso de recolección confiable, pero también debe tener en cuenta cualquier limitación o desafío adicional.

Pueden incluir, pero no se limitan a

  • Agregación de datos: La información que puede haberse originado en un hogar, individuo o empresa se mide a nivel de ciudad, condado, estado o país en sus datos.
  • Variables correlacionadas estadísticamente pero económicamente irrelevantes: Algunos conjuntos de datos contienen abundante información, pero muchas de las variables pueden no tener nada que ver con la cuestión económica que se espera abordar.
  • Datos cualitativos: Los conjuntos de datos ricos suelen incluir variables cualitativas (información geográfica, raza, etc.), pero esta información requiere un tratamiento especial antes de poder utilizarla en un modelo econométrico.
  • Fracaso del modelo clásico de regresión lineal (CLRM): La legitimidad de su enfoque econométrico siempre se basa en un conjunto de suposiciones estadísticas, pero es probable que encuentre que al menos una de estas suposiciones no se sostiene (lo que significa que no es cierto para sus datos).

Los economómetras se diferencian de los estadísticos al enfatizar las violaciones de las suposiciones estadísticas que a menudo se dan por sentadas. La técnica más común para estimar un modelo econométrico son los mínimos cuadrados ordinarios (OLS). Sin embargo, una serie de supuestos del CLRM deben mantenerse para que la técnica OLS proporcione estimaciones confiables. En la práctica, las suposiciones que tienen más probabilidades de fallar dependen de sus datos y de su aplicación específica.

Reconociendo la importancia del tipo, frecuencia y agregación de los datos

Los datos que usted utiliza para estimar y probar su modelo econométrico se clasifican típicamente en uno de tres tipos posibles:

  • Sección transversal: Este tipo de datos consiste en mediciones de observaciones individuales (personas, hogares, empresas, condados, estados, países, etc.) en un momento dado.
  • Series de tiempo: Este tipo de datos consiste en mediciones de una o más variables (como el producto interno bruto, las tasas de interés o las tasas de desempleo) a lo largo del tiempo en un espacio determinado (como un país o estado específico).
  • Panel o longitudinal: Este tipo de datos consiste en una serie temporal para cada unidad transversal de la muestra. Los datos contienen mediciones de observaciones individuales (personas, hogares, empresas, condados, estados, países, etc.) durante un período de tiempo (días, meses, trimestres o años).

El tipo de datos que está utilizando puede influir en la forma en que calcula su modelo econométrico. En particular, se requieren técnicas especializadas para tratar con series temporales y datos de panel.

Usted puede anticipar problemas econométricos comunes porque ciertos fracasos en la suposición de CLRM son más probables con tipos particulares de datos. Dos casos típicos de fracasos en la suposición de CLRM implican heteroskedasticidad (que ocurre frecuentemente en modelos que utilizan datos de corte transversal) y autocorrelación (que tiende a estar presente en modelos que utilizan datos de series de tiempo).

Además de conocer el tipo de datos con los que está trabajando, asegúrese de estar siempre al tanto de la siguiente información:

  • El nivel de agregación utilizado para medir las variables: El nivel de agregación se refiere a la unidad de análisis cuando se adquiere información para los datos. En otras palabras, las mediciones variables pueden originarse en un nivel más bajo de agregación (como un individuo, un hogar o una empresa) o en un nivel más alto de agregación (como una ciudad, un condado o un estado).
  • La frecuencia con la que se capturan los datos: La frecuencia se refiere a la velocidad a la que se obtienen las mediciones. Los datos de series temporales pueden capturarse con mayor frecuencia (como por hora, día o semana) o con menor frecuencia (como mensual, trimestral o anual).

Todos los datos del mundo no le permitirán producir resultados convincentes si el nivel de agregación o frecuencia no es apropiado para su problema. Por ejemplo, si usted está interesado en determinar cómo el gasto por alumno afecta el rendimiento académico, los datos a nivel estatal probablemente no serán apropiados porque el gasto y las características de los alumnos tienen tanta variación entre las ciudades dentro de los estados que es probable que sus resultados sean engañosos.

Evitar la trampa de la minería de datos

A medida que adquiera más herramientas de análisis de datos, puede inclinarse a buscar en los datos relaciones entre variables. Puede utilizar sus conocimientos de estadística para encontrar modelos que se ajusten bastante bien a sus datos. Sin embargo, esta práctica se conoce como minería de datos, y usted no quiere ser seducido por ella!

Aunque la minería de datos puede ser útil en campos donde el mecanismo subyacente que genera los resultados no es importante, la mayoría de los economistas no ven este enfoque favorablemente. En econometría, construir un modelo que tenga sentido y sea reproducible por otros es mucho más importante que buscar un modelo que tenga un ajuste perfecto.

Incorporación de información cuantitativa y cualitativa

Los resultados económicos pueden verse afectados tanto por factores cuantitativos (numéricos) como cualitativos (no numéricos). Generalmente, la información cuantitativa tiene una aplicación e interpretación directa en los modelos econométricos.

Las variables cualitativas se asocian a caracteres que no tienen representación numérica natural, aunque los datos brutos pueden codificar caracteres cualitativos con un valor numérico. Por ejemplo, una región de EE.UU. puede estar codificada con un 1 para el Oeste, 2 para el Sur, 3 para el Medio Oeste y 4 para el Noreste. Sin embargo, la asignación de los valores específicos es arbitraria y no tiene un significado especial.

Para utilizar la información contenida en las variables cualitativas, normalmente se convierten en variables ficticias -variables dicotómicas que toman un valor de 1 si una característica particular está presente y de 0 en caso contrario.

A veces el resultado económico en sí es cualitativo o contiene valores restringidos. Por ejemplo, su variable dependiente podría medir si una empresa quiebra (se declara en bancarrota) en un año determinado utilizando varias características de la empresa como variables independientes. Aunque las técnicas estándar son a veces aceptables con variables dependientes cualitativas y no continuas, por lo general dan lugar a violaciones de supuestos y requieren un enfoque econométrico alternativo.

Reply