7. Statistics

Nota: Esta unidad se imparte con la metodología del aprendizaje basado en proyectos según la planificación expresada aquí.

La descripción del proyecto está en esta página.

Situación introductoria / Introductory situation

Questions:

  1. How many people are there in the world (in scientific notation)?(*)
  2. How much money makes the most typical person per month?
  3. What do you think the sentence "the median age of the world's population is 28"?
  4. Are you typical? In which feature?
  5. Have you found any mistake in the video?
  6. Find out how many han chinese people are there in the world?
  7. What is the height in cm of a typical holland man?
  8. How long are you expecting to live if you are a japanese woman?
  9. How many hours a day do some ethiopian women spend collecting water?

Fill the following survey in order to get some data to work with.

No pulses "Intro", ni el botón "Enviar", hasta que completes el formulario del todo.

Recursos necesarios

Nota: Para este tema necesitarás los siguientes programas o apps (son sólo recomendaciones, cualquier programa con funciones similares es también válido):

También haremos grupos de trabajo de seis miembros con el "armador de grupos" de classdojo y con unos papeles bien definidos para todos sus miembros.

Contenidos / Contents

  • Diferentes formas de recogida de información. Organización en tablas de datos recogidos en una experiencia. / Collecting information. Collection and organization of data.
  • Frecuencia absoluta. Frecuencia relativa. Frecuencia acumulada. / Absolute frequency. Relative frequency. Statistic table.
  • Diagramas estadísticos. / Statistical graphs.
  • Análisis de los aspectos más destacables de los gráficos.
  • Diagrama de barras. Polígono de frecuencias. Diagrama de sectores. / Histogram. Frequency polygon. Pie chart.
  • Medidas de centralización: media, mediana y moda. / Measures of central tendency.
  • Medidas de dispersión: rango y desviación típica / Measures of dispersion: range and standard deviation.
  • La hoja de cálculo. / Spreadsheet.

Collecting information

Fill the following survey in order to get some data to work with.

No pulses "Intro", ni el botón "Enviar", hasta que completes el formulario del todo.

Organización de datos en tablas. Frecuencias/Data organization. Frequencies.

Remember how to collect data in a table and the vocabulary related to this procedure: tally, frequency, percentage...

  1. Solve "thatquiz" using the code given by your teacher.
  2. These are the ages of the students that answered our last survey: 14, 14, 14, 13, 14, 13, 13, 13, 13, 13, 13, 13, 13, 13, 13, 14, 14, 14, 13, 14, 14, 14, 13, 13, 14, 13, 13, 14, 14, 14, 13, 13, 13, 14, 13, 13, 13, 13, 13, 13, 13, 14, 11, 13, 14. Arrange the data in a table with the following columns: Age, n (absolute frequency), f (relative frequency), % (percentage). Add a row at the end for the totals.
  3. Do the same for the gender: Female, Female, Female, Male, Male, Female, Male, Female, Male, Male, Female, Female, Male, Male, Male, Male, Female, Female, Female, Female, Male, Male, Female, Female, Female, Male, Female, Male, Female, Male, Female, Female, Female, Male, Female, Female, Female, Female, Female, Female, Male, Female, Male, Male, Female. Now do the same for your class. Can you get some conclusion from both gender tables?
  4. Collecting data. Have a look at our last study related to your favourite colours and answer the following questions:
  5. Among girls: Purple, Purple, Blue, Pink, Blue, Blue, Black, Pink, Other, Blue, Blue, Blue, Pink, Blue, Red, Black, Orange, Black, Green, Blue, Blue, Blue, Blue, Yellow, Green, Green, Blue.
  6. Among boys: Blue, Green, Orange, Orange, Green, Purple, Orange, Blue, Yellow, Purple, Purple, Red, Orange, White, Blue, Red, Green, Red.
    1. How many girls prefer pink?
    2. What percentage of the boys prefer blue or green?
    3. What is the difference between the percentage of girls and boys that prefer red?
  7. The following set of data shows the number of siblings in your family (2018 survey): 4, 1, 1, 4, 1, 2, 1, 2, 3, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 2, 2, 1, 2, 1, 1, 1, 2, 3, 2, 1, Más de 5, 2, 2, 1, 1, 1, 1, 1, 1, 1, 2. Make a frequency table from these data. How many large families (3 or more siblings) are there? What is the percentage of only child families?

Diagramas estadísticos / Statistical charts

Remember also the different kinds of statistical charts: bar, line, pie, pictograms...

  1. The bar chart shows the pieces of fruit Ken, Liam and Maria ate one week.
    1. How many pieces of fruit did Ken eat?
    2. How many pieces did Ken, Liam and Maria eat altogether?
    3. How many more pieces did Liam eat than Maria?
  1. The bar chart shows the number of glasses of each type of drink sold at a cafe one morning.
    1. How many glasses of milk were sold?
    2. Which was the most popular drink?
    3. How many more glasses of cola than lemon were sold?
    4. How many glasses of drink were sold altogether?
  1. Which is your favourite subject? The collected data are shown in the following chart:
    1. Which is your worst subject? The collected data are shown in the following chart
    1. Draw a pie chart using those data.
    2. Compare it with the results of the last courses.
  1. Find out how many people in USA have the same first name and last name than you and four of your friends? Copy the data in a table of a spreadsheet. Build an appropiate bar chart.
  2. Usa la hoja de cálculo para hacer un polígono de frecuencias (line chart) con las respectivas posiciones en la liga del Granada C.F. y otros dos clubes de tu elección en las últimas cinco jornadas.
  3. Observa el siguiente gráfico. Toma sus datos y construye tú un diagrama de barras desde cero. ¿Coincide con el que apareció en televisión? Haz lo mismo con el gráfico venezolano.
Gráfico telemadrid
Venezuela
      1. Enlace a la noticia con el gráfico rectificado.
  1. Do you think sharks are dangerous? Have a look at this pictogram. Make a pictogram with the following data (answers to the question "How many times a week do you eat fish?" in 2018 survey): 2, 3, 1, 1, 2, 2, 1, 1, 2, 3, 2, 1, 3, 4, 1, 2, 1, 4, 1, 1, 0, 0, 1, 1, 2, 2, 3, 2, 1, 1, 0, 0, 2, 2, 1, 0, 2, 0, 3, 0, 1, 1, 2, 1, 2.
  2. Busca información fiable en internet sobre el número de veces que debe aparecer el pescado en una dieta equilibrada. Compárala con los resultados del ejercicio anterior y obtén una conclusión.
  3. Construye un histograma y un polígono de frecuencias para la tabla de pesos del ejercicio de arriba.
  4. Observa la siguiente encuesta sobre las próximas elecciones europeas. Se trata de una especie de diagrama de sectores.

Moda / Mode

The mode is the value that appear most often in a set of data.

La moda es el valor de la variable más frecuente, el que más se repite, el que tiene mayor frecuencia absoluta. Es el parámetro más sencillo de calcular y puede extraerse en todo tipo de variables, incluso en las que vienen dadas con palabras, sin números, que se llaman variables cualitativas.

Está íntimamente relacionado con las proporciones o los porcentajes que hemos calculado en el apartado de tablas estadísticas, en el sentido de que es el valor que se presenta en un mayor porcentaje, el más alto en su proporción.

Moda

En cierto modo, la moda tiene mucho que ver con su significado cotidiano. Decimos que algo está de moda cuando lo usa, lleva o dice mucha gente.

¿Estarán de moda en el sentido matemático estas zapatillas?

Exercise: Find out the mode of the favourite sport amongst students of 2º ESO from the data collected in a 2017 survey. Represents those data in a pie chart.

Which is your favourite sport? Others, Others, Football, Cycling, Swimming, Basketball, Volleyball, Basketball, Football, Skiing, Football, Tennis, Football, Basketball, Football, Swimming, Swimming, Others, Basketball, Others, Football, Football, Others, Football, Football, Others, Others, Basketball, Football, Skiing, Swimming, Volleyball, Basketball, Football, Swimming, Cycling, Swimming, Football, Skiing, Football, Others, Cycling, Football, Others.

El retrato robot del parado (modas y proporciones para describir este problema social).

Media aritmética / Arithmetic mean, average

La media es un valor de la variable que marca su punto de equilibrio. Resume todos sus valores recogidos en uno solo.

Moda

La media aritmética permite comparar fácilmente dos poblaciones. Por ejemplo, los alumnos de 4º y los de 3º; los alumnos de 4º del Fray Luis y los de 4º de otro centro; o los alumnos de 4º de este curso y los del curso pasado.

Su cálculo se puede hacer sólo para variables cuantitativas. Se realiza sumando todos los valores y dividiendo por el número total de valores recogidos.

Observa este dato:

El alumnado de 4º toma 1,4 piezas de fruta al día como media.

Quizás pueda alguien tomarse una fruta y parte de otra, pero una media aritmética no representa un valor particular.

Ejercicio 1: los datos del cuadro amarillo anterior son de un estudio de 2013. Compáralos con los siguientes, recogidos en 2019 para alumnos de 2 de la ESO. Extrae una conclusión que pueda ofrecerse a modo de titular.

165, 156, 165, 148, 157, 170, 160, 156, 155, 160, 159, 165, 162, 170, 150.

Ejercicio 2: compara la ingesta de fruta del alumnado de 2º de la ESO (2019) con el de 4º, que se ofrece más arriba. 10, 5, More, 4, 7, 7, 6, 2, 9, 10, 3, 7, 7, 5, 7, 11, 0, 6, 2, 4, 7, 2.

Ejercicio 3: Hay 5 personas en un ascensor, 2 mujeres y 3 hombres. El peso medio de las mujeres es de 50 kg y el de los hombres de 90 kg. ¿Cuál es el peso medio de las 5 personas del ascensor?

  1. El peso de varios alumnos en kg, según una encuesta (2018), es el siguiente: 80, 46, 70, 47, 53, 55, 50, 45, 47, 40, 57, 60, 30, 45, 60, 43, 53, 34.1, 47, 69, 40, 42, 60, 76.4, 50, 53, 50, 45, 49, 64, 80, 55, 52, 58, 40, 52, 49.
  2. Calcula la media aritmética de todos los pesos. ¿Has obtenido el mismo resultado que tus compañeros? Distribuye los datos en una tabla agrupándolos previamente en intervalos de 10 kilogramos. Crea una columna para la marca de clase. Calcula la media aritmética usando las marcas de clase. ¿Cuál es la diferencia respecto al cálculo anterior?

Mediana / Median

La mediana es el valor de la variable que deja a tantos individuos por detrás de sí mismo como por delante, cuando todos los valores están ordenados.

Por ejemplo, en el caso de las estaturas de un grupo de personas, la estatura mediana sería la correspondiente a la persona que quedase en medio una vez que estas se ponen en fila, desde la más baja hasta la más alta.

fruta
Mediana

La línea roja muestra la estatura mediana de este grupo de muñecos.

Para una serie de números es sencillo encontrar la mediana. Primero se ordenan y luego se identifica el que está en medio.

Por ejemplo, el número de televisores en casa de los alumnos de 4º de ESO, según se recogió en el cuestionario inicial son:

2, 4, 2, 3, 3, 3, 4, 2, 3, 2, 1, 5, 4, 3, 3, 2, 1, 1, 4, 1, 2, 5, 1, 1, 2, 2, 1, 5, 5, 1, 2

Esos 31 números ordenados de menor a mayor quedan

1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5

y dejan en medio al número 2.

1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5

Pues ese valor, precisamente, es la mediana. Su interpretación es la siguiente: alguien con dos televisores tiene tantos compañeros con más televisores que él en casa que con los mismos o menos.

Cuando los datos están dispuestos en una tabla ordenada, es como si los tuviésemos ya contados, así que sólo hay que ir acumulando las frecuencias de cada valor de la variable hasta superar la mitad de los valores.

Mediana (tabla)

Ejercicio: Calcula el ritmo cardíaco mediano de los alumnos de 2º ESO (2018) según una encuesta que ha recogido los siguientes datos:

Measure your heart rate 112, 4,5, 37, 80, 72, , 76, 68, 68, 88, 92, 62, 72, 64, 60, 72, 72, 80, 100, 120, 80, 70, 24, 21, 30, 64, 16, 120, 60, 64, 60, 84, 12, 80, 74, 60, 64, 65, 80, , 100, 70, 108

Nota: elimina los datos claramente incorrectos (por ejemplo, números menores de 30 o mayores que 200).

El siguiente vídeo resume cómo calcular la media (MEAN), la mediana (MEDIAN) y la moda (MODE):

Actividades sobre las medidas de centralización / activities about central tendency measurements

  1. Revisa el vídeo de la introducción, detecta la media, la mediana y la moda en todas las ocasiones en las que aparece.
  2. Imagina que tu amigo se ha comido dos chuches y tú ninguna. Calcula la media de chuches que os habéis comido entre ambos. ¿Es representativo ese dato para ti?
  3. Find measures of central tendency in this site.
  4. Calculate the average of tweets per week of three of the people of this list.
  5. The following numbers represents the time in minutes to get to school of some students (actually they are data from 1ESO students, year 12-13): 15, 20, 25, 15, 20, 15, 17, 17, 10, 15, 15, 30, 60, 30, 15, 15, 45, 23, 30, 20, 35, 30, 35, 35, 15, 15, 25, 15, 10, 10, 30, 20, 30, 5, 15, 15, 10, 20, 15, 15, 40, 10, 15, 30, 20, 10, 30, 20, 30, 45, 55, 60, 10, 15, 15, 20, 15, 55, 76, 30, 20. Do you think they live far or close to the school?
  6. Compara el peso medio de este curso con el obtenido en el curso anterior. ¿Obtienes alguna conclusión?
  7. Observa las siguientes estaturas de una muestra aleatoria del alumnado de 1º de ESO de este centro (curso 2012-2013): 154, 157, 165, 162, 162, 155, 155, 167, 157, 159, 152, 168, 168, 170, 162, 168, 160, 175, 150, 145, 140, 155, 155, 167, 155, 140, 140, 150. Los resultados para 2º de ESO (2017) han sido los siguientes: 162 155 157 168 1'75 m 170 162 cm 158 156 160 165 1,6 160 cm 1m 60cm 168 150 162 166 167 158 164 1,62 167 170cm 170 1,75-77 176 154 170 1.62 1.68m 165 167 cm. 1'60 1.67 148 1.62 170 153 1,55 150 178 178 160 1,69 160 158 161 1,55 171 1'60 171 171 170 1.65. Responde de un modo científico a esta pregunta ¿son más altos los chicos y chicas de 2º de ESO que los de 1º de ESO? ¿Qué pasa si los comparas con los datos de 4º que aparecen más arriba?
  8. Haz diez intentos de estimación de 10 segundos sin ninguna práctica previa. Practica durante un rato y realiza otros diez intentos. Pasa todos los datos a una hoja de cálculo. ¿Crees que el entrenamiento ha mejorado tu capacidad de estimación?
  9. Razona la siguiente afirmación "la mayoría de habitantes españoles tiene más piernas que la media".
  10. Observa la siguiente noticia (clic en la imagen para verla más grande), especialmente las partes resaltadas. ¿Hay algún error en el cálculo de la media?

  1. Activity (work in pairs):
  2. Read a question of the survey.
  3. Make some guessing or hypothesis (a headline).
  4. Collect the data, store them in a table, calculate percentages, show the info using statistical charts.
  5. See if the results and your prediction match.
  6. Do this test about central tendency measures.
  7. Find the mean (test at the bottom of the page), the median and the mode.
  8. Observa los datos recogidos en la encuesta al principio del tema. Escoge cinco de las preguntas y realiza un resumen estadístico completo (tabla con frecuencias y porcentajes, gráfica apropiada y medidas de centralización). Tras realizar el estudio, mira lo que más te llame la atención y exprésalo en una frase, como si se tratase del titular de un hipotético artículo para una página web.
  9. Reaction time:
    1. This is the 100m world record (by Usain Bolt). One of his his secrets, his amazing reaction time [1], only 0.146 s (Wikipedia).
    2. But you have to be careful because if you start jumping the gun, you'll be disqualified. Have a look at this video about a false start. (The false start rule).
      1. USAIN BOLT FALSE STARTS 100m final World... by somaliflag.
      2. To measure those false starts it's taken into acount that no human can react in less than a tenth of a second (source: false start detection).
    1. Let's train our reaction time. Work in groups. Make some practise using this web page. Write down your marks. Choose a leader and explain why have you chosen him or her.
    2. Competition. Five attempts.
    3. To work at home:
      1. Do your reactions improve with training?
      2. Do boys react more quickly than girls?
      3. Do young people react more quickly than older people?
    4. An article about reaction time and an interesting line chart.
  1. Game: the arithmetic mean as an estimation.
  2. Sensible or not?
  3. Prepare a video like "Are you typical?"

______

[1] Reaction time is the elapsed time between the presentation of a sensory stimulus and the subsequent behavioral response (Wikipedia).

Enlaces / Links

-Evaluación del tema-