Tipos de datos estadísticos: Numérico, categórico y ordinal

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. Tipos de datos estadísticos: Numérico, categórico y ordinal

Libro Relacionado

Por Deborah J. Rumsey

Cuando se trabaja con estadísticas, es importante reconocer los diferentes tipos de datos: numéricos (discretos y continuos), categóricos y ordinales. Los datos son las piezas reales de información que usted recopila a través de su estudio. Por ejemplo, si le preguntas a cinco de tus amigos cuántas mascotas tienen, es posible que te den los siguientes datos: 0, 2, 1, 4, 18. (La quinta amiga puede contar cada uno de sus peces de acuario como una mascota por separado.) No todos los datos son números; digamos que usted también registra el género de cada uno de sus amigos, obteniendo los siguientes datos: macho, macho, hembra, macho, hembra.

La mayoría de los datos se dividen en dos grupos: numéricos o categóricos.

  • Datos numéricos. Estos datos tienen un significado como medida, como la estatura, el peso, el coeficiente intelectual o la presión arterial de una persona; o son un recuento, como el número de acciones que posee una persona, cuántos dientes tiene un perro o cuántas páginas puede leer de su libro favorito antes de dormirse. Los datos numéricos se pueden dividir en dos tipos: discretos y continuos. los datos discretos representan elementos que se pueden contar; asumen valores posibles que se pueden enumerar. La lista de valores posibles puede ser fija (también llamada finita); o puede ir desde 0, 1, 2, hasta el infinito (haciéndolo infinitamente). Por ejemplo, el número de cabezas en 100 tiradas de monedas toma valores de 0 a 100 (caso finito), pero el número de tiradas necesarias para obtener 100 cabezas toma valores de 100 (el escenario más rápido) hasta el infinito (si nunca se llega a la centésima cabeza). Sus valores posibles se listan como 100, 101, 102, 103, ….. Los datos continuos representan mediciones; sus posibles valores no pueden ser contados y sólo pueden ser descritos usando intervalos en la línea numérica real. Por ejemplo, la cantidad exacta de gas comprada en la bomba para autos con tanques de 20 galones serían datos continuos de 0 galones a 20 galones, representados por el intervalo[0, 20], inclusive. Usted puede bombear 8.40 galones, o 8.41, o 8.414863 galones, o cualquier número posible de 0 a 20. De esta manera, los datos continuos pueden ser considerados como infinitos de manera incontable. Para facilitar el mantenimiento de registros, los estadísticos generalmente escogen algún punto en el número para redondear. Otro ejemplo sería que la vida útil de una batería C puede ser desde 0 horas hasta un número infinito de horas (si dura para siempre), técnicamente, con todos los valores posibles en el medio. Es cierto que no se espera que una batería dure más de unos cientos de horas, pero nadie puede ponerle un límite al tiempo que puede durar (¿recuerda el Conejo Energizer?).
  • Datos categóricos: Los datos categóricos representan características tales como el género de una persona, su estado civil, su ciudad natal o los tipos de películas que le gustan. Los datos categóricos pueden tomar valores numéricos (como «1» que indica hombre y «2» que indica mujer), pero esos números no tienen significado matemático. No se pueden sumar, por ejemplo. (Otros nombres para los datos categóricos son datos cualitativos, o datos de Sí/No).

Los datos ordinales mezclan datos numéricos y categóricos. Los datos se dividen en categorías, pero los números colocados en las categorías tienen significado. Por ejemplo, calificar un restaurante en una escala de 0 (el más bajo) a 4 (el más alto) estrellas da datos ordinales. Los datos ordinales se tratan a menudo como categóricos, donde los grupos se ordenan cuando se hacen gráficos y tablas. Sin embargo, a diferencia de los datos categóricos, los números tienen un significado matemático. Por ejemplo, si encuesta a 100 personas y les pide que califiquen un restaurante en una escala de 0 a 4, tomar el promedio de las 100 respuestas tendrá significado. Este no sería el caso de los datos categóricos.

Reply