¿Cuáles son 2 categorías principales de datos?
Pero todavía es importante tener al menos una comprensión básica de los diferentes tipos de datos, y el tipo de preguntas que se pueden utilizar para responder.
En este post, voy a proporcionar una visión general básica de los tipos de datos que es probable que encuentre, y vamos a utilizar una caja de mis dulces favoritos - Jujubes —para ilustrar cómo podemos recopilar estos diferentes tipos de datos, y para qué tipos de análisis podríamos utilizarlos.
Los dos sabores principales de los datos: cualitativo y cuantitativo
En el nivel más alto, existen dos tipos de datos: cuantitativa y cualitativa .
Cuantitativo Los datos se refieren a números y cosas que se pueden medir objetivamente: dimensiones como altura, anchura y longitud. Temperatura y humedad. Precios. Área y volumen.
Cualitativo Los datos tratan de características y descriptores que no se pueden medir fácilmente, pero que se pueden observar subjetivamente, como olores, gustos, texturas, atractivo y color.
En términos generales, cuando se mide algo y se le da un valor numérico, se crean datos cuantitativos. Cuando clasificas o juzgas algo, creas datos cualitativos. Hasta ahora, todo bien. Pero este es sólo el nivel más alto de datos: también hay diferentes tipos de datos cuantitativos y cualitativos.
Sabores cuantitativos: datos continuos y datos discretos
Existen dos tipos de datos cuantitativos, que también se denominan datos numéricos: continuo y discreto . Como regla general, cuenta son discretos y mediciones son continuas.
Dicreto Los datos son un conteo que no se puede hacer más preciso. Típicamente involucra números enteros. Por ejemplo, el número de niños (o adultos, o mascotas) en tu familia es discreto, porque estás contando entidades completas e indivisibles: no puedes tener 2,5 niños o 1,3 mascotas.
Continuo los datos, por otra parte, podrían dividirse y reducirse a niveles más y más finos. Por ejemplo, puede medir la altura de sus hijos a escalas progresivamente más precisas (metros, centímetros, milímetros y más allá), por lo que la altura es datos continuos.
Si cuento el número de Jujubes individuales en una caja, ese número es una pieza de datos discretos.
Si utilizo una escala para medir el peso de cada Jujube, o el peso de toda la caja, son datos continuos.
Los datos continuos se pueden utilizar en muchos tipos diferentes de Ensayos de hipótesis . Por ejemplo, para evaluar la exactitud del peso impreso en la caja Jujubes, podríamos medir 30 cajas y realizar una prueba t de 1 muestra.
Algunos análisis utilizan datos cuantitativos continuos y discretos al mismo tiempo. Por ejemplo, podríamos realizar un análisis de regresión para ver si el peso de las cajas de Jujube (datos continuos) está correlacionado con el número de Jujubes en el interior (datos discretos).
Sabores cualitativos: datos binomios, datos nominales y datos ordinales
Cuando clasificas o categorizas algo, creas Cualitativo o atributo datos. Hay tres tipos principales de datos cualitativos.
Binario los datos colocan las cosas en una de dos categorías mutuamente excluyentes: derecha/equivocada, verdadera/falsa, o aceptar/rechazar.
De vez en cuando, conseguiré una caja de Jujubes que contiene un par de piezas individuales que son demasiado duras o demasiado secas. Si fuera a través de la caja y clasificara cada pieza como "Bueno" o "Malo", serían datos binarios. Podría usar este tipo de datos para desarrollar un modelo estadístico para predecir con qué frecuencia puedo esperar obtener un Jujube malo.
Al recoger sin ordenar o nominal datos, asignamos elementos individuales a categorías nombradas que no tienen un valor o rango implícito o natural. Si pasara por una caja de Jujubes y registrara el color de cada uno en mi hoja de trabajo, serían datos nominales.
Este tipo de datos se puede utilizar de muchas maneras diferentes, por ejemplo, podría utilizar análisis de chi-cuadrado para ver si hay diferencias estadísticamente significativas en las cantidades de cada color en una caja.
También podemos tener ordenado o ordinal datos, en los que los ítems se asignan a categorías que sí tienen algún tipo de orden implícito o natural, como "corto, mediano o alto". Otro ejemplo es una pregunta de encuesta que nos pide calificar un artículo en una escala de 1 a 10, siendo 10 el mejor. Esto implica que 10 es mejor que 9, que es mejor que 8, y así sucesivamente.
Los usos de los datos ordenados son una cuestión de debate entre los estadísticos. Todo el mundo está de acuerdo en que es apropiado para crear gráficos de barras, pero más allá de eso la respuesta a la pregunta "¿Qué debo hacer con mis datos ordinales?" es "depende". Aquí está un post de otro blog que ofrece un excelente resumen de la consideraciones pertinentes .
Artículos Relacionados: