Comparar medias con el uso de la “t” de Student y el ANOVA de un factor

Comparar medias nos permite conocer si existen diferencias entre dos o más grupos, por ejemplo ¿existen diferencias significativas entre hombres y mujeres con respecto al tiempo que tardan en resolver problemas matemáticos? ¿hay diferencias significativas en estudiantes de secundaria, preparatoria y licenciatura con respecto al número de horas que dedican a usar redes sociales? ¿son diferentes los tiempos dedicados a la lectura entre profesionistas y no profesionistas? Para responder estas preguntas necesitamos echar mano de herramientas estadísticas que nos permitan identificar si existen diferencias significativas entre dos o más conjuntos de datos. En este tema vamos a revisar dos tipos de pruebas paramétricas que nos ayudan a esto: la “t” de student y la ANOVA de un factor. Es importante recordar que estas pruebas son PARAMETRICAS, es decir, las usamos sólo cuando la variable a analizar es de tipo intervalar y nuestra muestra se distribuye de manera normal y existe varianza homogenea.

“t” de student

Se usa para comparar el promedio de dos conjuntos de datos. Existen tres situaciones diferentes para su uso:

a) “t” para una muestra (One Sample T Test): este caso sirve cuando queremos comparar el promedio de una variable de nuestra muestra con un puntaje promedio de una población, (por ejemplo, estamos investigando los hábitos de lectura en una escuela secundaria y comparamos si hay diferencias estadisticamente significativas en su promedio de libros leídos con el dato que tenemos de los libros que leen los adolescentes a nivel nacional).

b) “t” para muestras independientes (Independent Sample T Test): este caso sirve en los casos en que queremos comparar el promedio de una variable en 2 grupos, (por ejemplo, en el mismo tema, comparamos si hay diferencias estadísticamente significativas en el promedio de libros leídos por los alumnos en una escuela secundaria pública y una particular)

c) “t” para muestras relacionadas (Pared Samples T Test): se usa cuando queremos comparar el puntaje de un mismo grupo en dos momentos diferentes (por ejemplo, si a los mismos alumnos de secundaria se les vuelve a hacer una encuesta cuando estén en preparatoria y se quiere saber si hay diferencias en los números de libros leídos en esos dos momentos).

ANOVA de un factor

Cuando queremos saber si existen diferencias en el promedio de una variable en dos o más grupos usamos la prueba ANOVA de un factor (ANOVA one way) (por ejemplo, si queremos saber si existen diferencias en los libros léidos por alumnos de tres carreras: Pedagogía, Literatura e Ingeniería). La ANOVA de un factor sólo nos va a indicar si hay diferencias entre todos los grupos, pero no entre que pares de elos, por lo que tenemos que indicarle al programa SPSS que nos realicé una prueba post hoc para conocer este dato.

Esto sería lo esencial con respecto a este tema y chequen los videos tutoriales que encontré en la red al respecto, para que repasen. Suerte!!!!!

Archivos sobre estadística

Hola chicas y chicos, como hemos visto en clase, para hacer un uso adecuado del programa SPSS, debemos de tener claro algunos conceptos básicos de Estadística y Metodología de la Investigación. Les recomiendo la siguiente página web: “TesisPerú” donde encontrarás información muy resumida que les puede servir para este propósito. Les enlisto a continuación algunas temáticas que nos comparte esta página, solo den click sobre ellas y los enlazara a la información en PDF que nos proporciona esta página:

  1. Niveles de medición de las variables.
  2. Medidas de tendencia Central y de Dispersión.
  3. Tipos principales de investigación inferencial estudios de comparación y correlación).
  4. Características de las pruebas paramétricas y No paramétricas.
  5. Coeficiente de Correlación.

Espero les sean útiles estos archvos, por favor, imprimanlos y repasenlos o tenganlos a la mano, para cuando los necesiten. Saludos!!!!

 

Crear y editar gráficos

Hola de nuevo, chicos y chicas. Les comentaba en clase que no esta contemplado revisar como editar gráficos (cambiar color, hacerlo más pequeño o grande, etc.), sin embargo, les pongo un tutorial donde nos comparten como realizar esto. En este caso les recomiendo de manera personal que ustedes mismos experimenten en la ventana de gráficos todas las herramientas que pueden usar para la edición de gráficos. Y ya que estamos hablando de gráficos descriptivos, les recuerdo que lo más apropiado es usar “frecuencias” cuando queremos presentar nuestros datos en “gráfico de barras”, y usar “porcentaje” cuando los presentamos en “gráfico de sectores” (pastel), así que no se les olvide marcar la opción adecuada para cada gráfico.

NOTA: De este tutorial, por el momento sólo céntrense en los primeros 4 minutos, que corresponde a la explicación de la edición de gráficos.

Realizar análisis de varios grupos o de sólo un grupo

¿Qué podríamos hacer si estamos haciendo una investigación con alumnos de 5 licenciaturas distintas de UNITEC y queremos conocer los resultados específicos de cada uno de estos 5 grupos de alumnos? ¿Qué tendríamos qué hacer si nos pidieran que hicieramos un análisis más, pero solamente con el grupo de alumnos de Derecho? ¿Qué tendríamos que hacer si nos pidieran que realizaramos un análisis sólo con alumnos de Derecho y sólo con aquellos que tuvieran un promedio superior a 9?

Nosotros podemos indicarle al programa del SPSS que nos muestre los resultados por separados de todos los grupos de una variable, o sólo un grupo de una de esas variables, o pedirle que combine o tome en cuenta dos condiciones de dos grupos diferentes. Les dejo este tutorial donde nos describen este procedimiento.

NOTA: Como les mencionaba, en el tutorial están usando la versión en Inglés, me parece que no hay problema en casi ninguna traducción, sólo mencionar que la herramienta “Split File” que se menciona que esta en la barra de herramientas “Data” en la versión en Español es la herramienta “Segmentar archiivo” que se encuentra en la barra de herramienta “Datos”.



Crear una nueva variable (por rangos) partir de una ya existente

En este post les comparto un video tutorial donde nos explican uno de los temas que vimos esta semana: cómo crear una nueva variable a partir de una ya existente. Algunos ejemplos para los cuales este procedimiento nos podría ser útil serían los siguientes:

-Si estuvieramos estudiando a una población de entre 9 y 30 años y nos pidieran que nuestra variable “edad” la trabajaramos en los siguientes grupos: 9-11 (niños); 12-18 adolescencia; 19-25 juventud; adultez: 30 años.

-Como en el caso que trabajamos en clase, donde teníamos las calificaciones de los alumnos y a partir de los datos de esa variable los convertimos en tres grupos: 5-7.5 (bajo rendimiento); 7.6-8.9 (mediano rendimiento); y 9-10 (alto rendimiento).

-En una escala de ansiedad donde el puntaje total va de 0 a 20 y queremos crear otra variable con 3 niveles: 0-8 (ansiedad normal); 9-14 (ansiedad moderada); 15-20 (ansiedad alta).

NOTA 1: En el video les explican un 1er método, un poco más largo del que vimos en clase y que nosotros no lo revisamos. Como lo menciona el tutorial, el método que vimos y que también se explica en el video que les comparto, sólo se puede realizar a partir de la versión 12 del SPSS, y de ahi que el autor del video lo explique también.

NOTA 2: La mayor parte de los tutoriales usan la versión del SPSS en inglés, cuando los revisen chequen cuidadosamente a que botón del SPSS en español corresponde (por ejemplo, Data corresponde a Datos, o Analize a Analizar).

Análisis descriptivo y de frecuencia con SPSS

Hola chicos y chicas, en este post repasaremos el tema de estadística descriptiva con el SPSS, a continuación les pondré breves definiciones de los conceptos estadísticos que trabajamos y posteriormente les pondré un video tutorial del tema que revisamos. Antes de empezar con esto, también les voy a pedir los dos siguiente favores a los que lean este post:

1: Por favor DEJEN UN COMENTARIO de que entraron, así yo me doy una idea de cuantos de ustedes están entrando a revisar estos archivos.

2. Si aún después de lo visto en clase y después de haber checado el tutorial tienen alguna duda, me la pueden escribir por este medio -o como dijimos, al inicio o final de la clase me la pueden comentar-, si es breve incluso se las puedo comentar aquí, si no, la voy viendo de una vez y la resuelvo en la siguiente clase.

CONCEPTOS BÁSICOS DE ESTADÏSTICA DESCRIPTIVA

Estadística descriptiva: Es la parte de la estadística que trata solamente de describir y analizar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas que se relacionan con el resumen y la descripción de datos numéricos.

Frecuencia: Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar cuántos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada tabla de frecuencias.

Las frecuencias pueden ser de dos tipos:

a) Frecuencia o Frecuencia Absoluta: Es el número de veces que se presenta un valor o categoría de una variable. Se representa por f.

b) Frecuencia Relativa: La frecuencia relativa se puede expresar en términos de porcentaje o de proporción y se representa por fr. (Es la razón entre la frecuencia absoluta y el total de datos)

MEDIDAS DE TENDENCIA CENTRAL

Moda: La moda es el valor que aparece con mayor frecuencia en la serie de datos. Así por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.

Mediana: Toma en cuenta la posición de los datos y se define como el valor central de una serie de datos o, más específicamente, como un valor tal que no más de la mitad de las observaciones son menores que el y no más de la mitad mayores.

Media o promedio: Es el promedio más comúnmente usado y se calcula a partir de la suma de todos los valores dividida por el número de datos.

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión son las que posibilitan retratar la distancia de los valores de las variables, pero a un cierto valor central. Al mismo tiempo, permiten la identificación de la concentración de todos los datos en un determinado sector de los recorridos que realiza la variable. Entre las principales medidas de dispersión que tenemos y que se trabajaran en clase, se encuentran las siguientes: rango, desviación estándar y varianza.