Introducción a la probabilidad y estadística

Page 1

Y ESTADÍSTICA

MENDENHALL – BEAVER – BEAVER Introducción
PROBABILIDAD
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
a la

This is an electronic version of the print textbook. Due to electronic rights restrictions, some third party content may be suppressed. Editorial review has deemed that any suppressed content does not materially affect the overall learning experience. The publisher reserves the right to remove content from this title at any time if subsequent rights restrictions require it. For valuable information on pricing, previous editions, changes to current editions, and alternate formats, please visit www.cengage.com/highered to search by ISBN#, author, title, or keyword for materials in your areas of interest.

Important Notice: Media content referenced within the product description or the product text may not be available in the eBook version.

MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Introducción a la PROBABILIDAD Y ESTADÍSTICA

William Mendenhall, III

1925–2009

Robert J. Beaver

University of California, Riverside, Emeritus

Traducción

RaquelArcosBulos

Maestra en Demografía y Traductora técnica

Revisión técnica

LuisMedinaGual

Universidad Iberoamericana

AlbinoRodríguezDíaz

TecNM, Instituto Tecnológico de Tepic

AndreaOviedoBautista

Universidad Anáhuac de Querétaro

AzucenaMinervaGarcíaLeón

Universidad Autónoma de Nuevo León

BeatrizAdrianaHernándezHernández

UNITEC campus Atizapán

CarlosAugustoJiménezZárate

Universidad Autónoma de Nuevo León

DeydraCelesteLópezPiñón

Universidad Autónoma de Nuevo León

DianaLizetteBecerraPeña

Universidad de Guadalajara

EdgarEduardoMendozaVelázquez

Universidad Autónoma de Chihuahua

ErickEscobedoRodríguez

Universidad Anáhuac de Querétaro

ErnestinaMacíasLópez

Universidad Autónoma de Nuevo León

FélixFernándezMéndez

Universidad Anáhuac México

FiladelfoLeón-Cázares

Universidad de Guadalajara

Barbara M. Beaver

University of California, Riverside, Emeritus

GilbertoGamalielDíazMonroy

Instituto Politécnico Nacional

GracielaGonzálezPerales

Universidad Autónoma de Nuevo León

JönsSánchezAguilar

TecNM campus Querétaro

JosédeJesúsCedilloBarco

UNITEC campus León

LuisArturoSilvaGarnica

UNITEC campus Querétaro

LuzMaríaTrinidadPérezAlvarado

TecNM campus León

MaríadelCarmenGarzaSalazar

Universidad Autónoma de Nuevo León

MaríaTeresaTovarMorales

Universidad Autónoma de Nuevo León

MarioCruzVargas

Universidad Autónoma de Nuevo León

SergioRamírezEspinosa

Instituto Politécnico Nacional

SoniaGuadalupeAnguianoRostro

Universidad Autónoma de Nuevo León

YadiraValdiviesoDíaz

Universidad de las Américas Puebla

Australia • Brasil • Canadá • Estados Unidos • México • Reino Unido • Singapur
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Introducción a la probabilidad y estadística

Primera edición

William Mendenhall, III, Robert J. Beaver, Barbara M. Beaver

Directora Higher Education

Latinoamérica:

Lucía Romo Alanís

Gerente editorial Latinoamérica:

Jesús Mares Chacón

Editora:

Cinthia Chávez Ceballos

Coordinador de manufactura: Rafael Pérez González

Diseño de portada:

Karla Paola Benítez García

Imagen de portada: © YesPhotographers / Shutterstock.com

Composición tipográfica: Ediciones OVA

© D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Av. Andrés Molina Enríquez 354, Primer piso, Oficina “A”, Colonia Ampliación Sinatel, Delegación Iztapalapa, Ciudad de México, C.P. 09479. Cengage Learning® es una marca registrada usada bajo permiso.

DERECHOS RESERVADOS. Ninguna parte de este trabajo amparado por la Ley Federal del Derecho de Autor, podrá ser reproducida, transmitida, almacenada o utilizada en cualquier forma o por cualquier medio, ya sea gráfico, electrónico o mecánico, incluyendo, pero sin limitarse a lo siguiente: fotocopiado, reproducción, escaneo, digitalización, grabación en audio, distribución en internet, distribución en redes de información o almacenamiento y recopilación en sistemas de información a excepción de lo permitido en el Capítulo III, Artículo 27 de la Ley Federal del Derecho de Autor, sin el consentimiento por escrito de la Editorial.

Traducido del libro Introduction to Probability and Statistics, Fifteenth Edition, Metric Version de William Mendenhall, III, Robert J. Beaver y Barbara M. Beaver. Publicado en inglés por Cengage Learning © 2020

ISBN: 978-0-357-11446-9

Datos para catalogación bibliográfica: Mendenhall, III, William, Robert J. Beaver, Barbara M. Beaver Introducción a la probabilidad y estadística

Primera edición

ISBN: 978-607-570-166-0

Visite nuestro sitio web en: latam.cengage.com

Publicado en México 1 2 3 4 5 6 26 25 24 23 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Tabla de contenido breve

INTRODUCCIÓN: ¿QUÉ ES LA ESTADÍSTICA? 1

1 DESCRIPCIÓN DE DATOS CON GRÁFICOS 7

2 DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS 54

3 DESCRIPCIÓN DE DATOS BIVARIADOS 96

4 PROBABILIDAD 126

5 DISTRIBUCIONES DE PROBABILIDAD DISCRETAS 167

6 LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL 212

7 DISTRIBUCIONES MUESTRALES 245

8 ESTIMACIÓN CON MUESTRAS GRANDES 288

9 PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES 335

10 INFERENCIA A PARTIR DE MUESTRAS PEQUEÑAS 380

11 EL ANÁLISIS DE VARIANZA 445

12 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN 503

13 ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE 555

14 ANÁLISIS DE DATOS CATEGÓRICOS 599

15 ESTADÍSTICA NO PARAMÉTRICA 633

APÉNDICE I 681

FUENTES DE DATOS 714

RESPUESTAS A EJERCICIOS SELECCIONADOS 727

ÍNDICE 745

iii MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Contenido

Introducción: ¿Qué es la estadística?  1

Poblaciones y muestras  3

Estadística descriptiva e inferencial  3

Lograr el objetivo de la estadística inferencial: los pasos necesarios  4 Claves para un aprendizaje exitoso  5

Descripción de datos con gráficos 7

1.1 Variables y datos  8 Tipos de variables  9

Ejercicios  11

1.2 Gráficos para datos categóricos  12 Ejercicios  15

1.3 Gráficos para datos cuantitativos  17

Gráficas circulares y gráficas de barras  17 Gráficas de líneas  19

Gráficas de puntos  20

Diagramas de tallo y hoja  20

Interpretación de gráficas con ojo crítico  22 Ejercicios  24

1.4 Histogramas de frecuencia relativa  27 Ejercicios  31

Revisión del capítulo  35

Tecnología actual  35

Revisar lo que ha aprendido  47

ESTUDIO DE CASO: ¿Cómo está su presión arterial?  53

Descripción de datos con medidas numéricas  54

Introducción  55

2.1 Medidas de tendencia central  55 Ejercicios  59

2.2 Medidas de variabilidad  61 Ejercicios  66

iv
1
2
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

3 4

2.3 Comprensión e interpretación de la desviación estándar  67

Teorema de Chebyshev  67

La regla empírica  69

Aproximación de s mediante el rango  71

Ejercicios  73

2.4 Medidas de posición relativa  76

Puntaje z  76

Percentiles y cuartiles  77

El resumen de cinco números y el diagrama de caja  80

Ejercicios  83

Revisión del capítulo   86

Tecnología actual  87

Revisar lo que ha aprendido  91

ESTUDIO DE CASO: Los chicos del verano  95

Descripción de datos bivariados  96

Introducción  97

3.1 Descripción de datos categóricos bivariados  97

Ejercicios  99

3.2 Descripción de datos cuantitativos bivariados  101

Diagramas de dispersión  101

Coeficiente de correlación  104

La línea recta de mínimos cuadrados  106

Ejercicios  109

Revisión del capítulo  112

Tecnología actual  112

Revisar lo que ha aprendido  118

ESTUDIO DE CASO: Su ropa, ¿está realmente limpia?  124

Probabilidad  126

Introducción  127

4.1 Eventos y el espacio muestral  127

Ejercicios  130

4.2 Cálculo de probabilidades mediante eventos simples  131

Ejercicios  134

4.3 Reglas de conteo útiles  137

Uso de la calculadora TI-83/84 Plus 142

Contenido v
Ejercicios  142 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

4.4 Reglas para calcular probabilidades  144

Cálculo de probabilidades para uniones y complementos  146

Cálculo de probabilidades para intersecciones  148

Ejercicios  155

4.5 Regla de Bayes  158 Ejercicios  161

Revisión del capítulo  163

Revisar lo que ha aprendido  163

ESTUDIO DE CASO: Probabilidad y toma de decisiones en el Congo  166

Distribuciones de probabilidad discretas  167

5.1 Variables aleatorias discretas y sus distribuciones de probabilidad  168 Variables aleatorias  168

Distribuciones de probabilidad  168

La media y la desviación estándar de una variable aleatoria discreta  170 Ejercicios  174

5.2 La distribución de probabilidad binomial  176 Ejercicios  185

5.3 La distribución de probabilidad de Poisson  189 Ejercicios  194

5.4 La distribución de probabilidad hipergeométrica  196 Ejercicios  198

Revisión del capítulo  200

Tecnología actual  201

Revisar lo que ha aprendido  206

ESTUDIO DE CASO: Un misterio: casos de cáncer cerca de un reactor  211

La distribución de probabilidad normal  212

6.1 Distribuciones de probabilidad para variables aleatorias continuas  213

La distribución de probabilidad uniforme continua  215

La distribución de probabilidad exponencial  216

Ejercicios  217

6.2 La distribución de probabilidad normal  218

La variable aleatoria normal estándar  219

Calcular probabilidades para una variable aleatoria normal general  222

Ejercicios  225

6.3 La aproximación normal a la distribución de probabilidad binomial  228

Ejercicios  232

Contenido vi
6 5 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Revisión del capítulo  235

Tecnología actual  235

Revisar lo que ha aprendido  241

ESTUDIO DE CASO: “¿Va a calificar por curva?”  244

Distribuciones muestrales  245

Introducción  246

7.1 Planes de muestreo y diseños experimentales  246

Ejercicios  249

7.2 Estadísticas y distribuciones muestrales  252

Ejercicios  254

7.3 El teorema del límite central y la media muestral  255

El teorema del límite central  255

La distribución muestral de la media muestral  258

Error estándar de la media muestral  259

Ejercicios  262

7.4 Pruebas de normalidad  264

7.5 La distribución muestral de la proporción muestral  268

Ejercicios  271

7.6 Una aplicación del muestreo: control estadístico de procesos (opcional)  273

Una gráfica de control para la media del proceso: la gráfica x  274

Una gráfica de control para la proporción de piezas defectuosas: la gráfica p  276 Ejercicios  278

Revisión del capítulo  280

Tecnología actual  281

Revisar lo que ha aprendido  284

ESTUDIO DE CASO: Muestreo con la ruleta en Monte Carlo  287

Estimación con muestras grandes  288

8.1 Dónde hemos estado y hacia dónde vamos  289

Inferencia estadística  289

Tipos de estimadores  290

8.2 Estimación puntual  291

Ejercicios  296

8.3 Estimación por intervalos  298

Construir un intervalo de confianza  298

Intervalo de confianza con muestras grandes para una media poblacional   300

Contenido vii
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
7 8

Interpretar el intervalo de confianza  301

Intervalo de confianza para una proporción poblacional p con muestras grandes  303

Usar la tecnología  304

Ejercicios  304

8.4 Estimar la diferencia entre dos medias poblacionales  307

Ejercicios  311

8.5 Estimar la diferencia entre dos proporciones binomiales  313

Usar la tecnología  316

Ejercicios  316

8.6 Límites de confianza unilaterales  319

Ejercicios  320

8.7 Elegir el tamaño de la muestra  322

Ejercicios  325

Revisión del capítulo  326

Tecnología actual  327

Revisar lo que ha aprendido  330

ESTUDIO DE CASO: ¿Qué tan confiable es esa encuesta? CBS News: cómo y dónde comen los estadounidenses  333

Pruebas de hipótesis con muestras grandes  335

Introducción  336

9.1 Una prueba estadística de hipótesis  336

Ejercicios  339

9.2 Una prueba para la media poblacional, con muestra grande  340

Lo esencial de la prueba  340

Calcular el valor p  344

Dos tipos de errores  348

El poder (potencia) de una prueba estadística  349

Ejercicios  352

9.3 Una prueba de hipótesis para la diferencia entre dos medias poblacionales, con muestras grandes  354

Pruebas de hipótesis e intervalos de confianza  356

Ejercicios  357

9.4 Una prueba de hipótesis para una proporción binomial, con muestra grande  360 Significancia estadística e importancia práctica  362

Ejercicios  363

9.5 Una prueba de hipótesis para la diferencia entre dos proporciones binomiales, con muestras grandes  365

Ejercicios  367

Contenido viii
9 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

9.6 Comentarios finales sobre las pruebas de hipótesis  369

Revisión del capítulo  370

Tecnología actual  371

Revisar lo que ha aprendido  375

ESTUDIO DE CASO: ¿Una aspirina al día...?  378

Inferencia a partir de muestras pequeñas  380

Introducción  381

10.1 Distribución t de Student  381 Supuestos detrás de la distribución t de Student  384 Ejercicios  385

10.2 Inferencias respecto a una media poblacional a partir de una muestra pequeña  386

Ejercicios  390

10.3 Inferencias respecto a la diferencia entre dos medias poblacionales a partir de muestras pequeñas: muestras aleatorias independientes  394 Ejercicios  400

10.4 Inferencias respecto a la diferencia entre dos medias a partir de muestras pequeñas: una prueba de diferencias por pares  404

Ejercicios  409

10.5 Inferencias respecto a una varianza poblacional  413

Ejercicios  419

10.6 Comparar dos varianzas poblacionales  421

Ejercicios  427

10.7 Revisión de los supuestos a partir de muestras pequeñas  429

Revisión del capítulo  430

Tecnología actual  431

Revisar lo que ha aprendido  439

ESTUDIO DE CASO: Responsabilidad escolar: ¿lo estamos haciendo mejor?  443

El análisis de varianza  445

11.1 El diseño de un experimento  446 Definiciones básicas  446 ¿Qué es un análisis de varianza?  447

Los supuestos para un análisis de varianza  448

Ejercicios  448

11.2 El diseño completamente aleatorio: una clasificación en una dirección  449

Dividir la variación total en el experimento  450

Contenido ix
10 11 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Probar la igualdad de las medias de tratamientos  453

Estimación de diferencias en las medias de tratamientos  455

Ejercicios  458

11.3 Clasificación de las medias poblacionales  461

Ejercicios  464

11.4 El diseño aleatorio en bloques: una clasificación en dos direcciones  465

Dividir la variación total en el experimento  466

Probar la igualdad de las medias de tratamientos y de bloques  469

Identificación de diferencias en las medias de tratamientos o de bloques  471

Algunos comentarios de advertencia sobre el bloqueo  472

Ejercicios  473

11.5 El experimento factorial a 3 b: una clasificación en dos direcciones  477

El análisis de varianza para un experimento factorial a 3 b  479

Ejercicios  483

11.6 Revisión de los supuestos del análisis de varianza  486

Gráficas residuales  487

11.7 Un breve resumen  489

Revisión del capítulo  490

Tecnología actual  490

Revisar lo que ha aprendido  497

ESTUDIO DE CASO: ¡Cómo ahorrar dinero en comestibles!  502

Regresión lineal simple y correlación  503

Introducción  504

12.1 Regresión lineal simple  504

Un modelo lineal simple  505

El método de mínimos cuadrados  507

Ejercicios  509

12.2 Un análisis de varianza para regresión lineal  511

Ejercicios  514

12.3 Prueba de la utilidad del modelo de regresión lineal  516

Inferencias respecto a b, la pendiente de la recta de medias  516

La prueba F del análisis de varianza  519

Medir la fuerza de la relación: el coeficiente de determinación  520

Interpretar los resultados de una regresión significativa  521

Ejercicios  522

Contenido x
12 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

12.4 Herramientas de diagnóstico para comprobar los supuestos de regresión  525

Términos de error dependientes  525

Gráficas de residuos  525

Ejercicios  526

12.5 Estimación y predicción mediante la recta ajustada  530

Ejercicios  534

12.6 Análisis de correlación  537

Ejercicios  540

Revisión del capítulo  543

Tecnología actual  544

Revisar lo que ha aprendido  549

ESTUDIO DE CASO: ¿Su automóvil es “hecho en Estados Unidos”?  553

Análisis de regresión lineal múltiple  555

Introducción  556

13.1 El modelo de regresión múltiple  556

13.2 Análisis de regresión múltiple  558

El método de mínimos cuadrados  558

El análisis de varianza  559

Probar la utilidad del modelo de regresión  561

Interpretar los resultados de una regresión significativa  562

Regresión de los mejores subconjuntos  563

Verificar los supuestos de regresión  564

Uso del modelo de regresión para estimación y predicción  564

Ejercicios  565

13.3 Un modelo de regresión polinomial  567

Ejercicios  570

13.4 Uso de variables predictoras cuantitativas y cualitativas en un modelo de regresión  573

Ejercicios  578

13.5 Prueba de conjuntos de coeficientes de regresión  582

13.6 Otros temas en la regresión lineal múltiple  584

Interpretación de las gráficas de residuos  584

Análisis de regresión por pasos  586

Regresión logística binaria  587

Interpretación incorrecta de un análisis de regresión  587

13.7 Pasos que deben seguirse al construir un modelo de regresión múltiple  589

Contenido xi
13 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Revisión del capítulo  589

Tecnología actual  590

Revisar lo que ha aprendido  592

ESTUDIO DE CASO: “Hecho en Estados Unidos”: otra mirada  598

Análisis de datos categóricos  599

14.1 El experimento multinomial y la estadística ji-cuadrada  600

14.2 Prueba de probabilidades para celdas específicas: la prueba de bondad de ajuste  602

Ejercicios  604

14.3 Tablas de contingencia: una clasificación en dos direcciones  606

La prueba de independencia ji-cuadrada  607

Ejercicios  611

14.4 Comparación de varias poblaciones multinomiales: una clasificación en dos direcciones con totales de fila o de columna fijos  614

Ejercicios  616

14.5 Otros temas del análisis de datos categóricos  619

La equivalencia de pruebas estadísticas  619

Otras aplicaciones de la prueba ji-cuadrada  620

Revisión del capítulo  621

Tecnología actual  622

Revisar lo que ha aprendido  627

ESTUDIO DE CASO: ¿Quién es el sostén principal de su familia?  631

Estadística no paramétrica  633

Introducción  634

15.1 La prueba de suma de rangos de Wilcoxon: muestras aleatorias independientes  634

Aproximación normal a la prueba de suma de rangos de Wilcoxon  638 Ejercicios  641

15.2 La prueba de signos para un experimento pareado  643

Aproximación normal para la prueba de signos  644

Ejercicios  646

15.3 Comparación de pruebas estadísticas  648

15.4 La prueba de rangos con signo de Wilcoxon para un experimento pareado  648

Aproximación normal para la prueba de rangos con signo de Wilcoxon  652

Ejercicios  653

Contenido xii
14 15 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

15.5 La prueba H de Kruskal-Wallis para diseños completamente aleatorios  655

Ejercicios  658

15.6 La prueba F r de Friedman para diseños aleatorios en bloques  660

Ejercicios  663

15.7 Coeficiente de correlación de rangos  666

Ejercicios  670

15.8 Resumen  672

Revisión del capítulo  672

Tecnología actual  673

Revisar lo que ha aprendido  676

ESTUDIO DE CASO: Segunda sede de Amazon  680

Apéndice I    681

Tabla 1 Probabilidadesbinomialesacumuladas  682

Tabla 2 ProbabilidadesdePoissonacumuladas  688

Tabla 3 Áreasbajolacurvanormal  690

Tabla 4 Valorescríticosde t  692

Tabla 5 Valorescríticosdeji-cuadrada  694

Tabla 6 Puntosporcentualesdeladistribución F  696

Tabla 7 Valorescríticosde T paralapruebadesumaderangosdeWilcoxon, n1 # n2  704

Tabla 8 Valorescríticosde T paralapruebaderangosconsigno deWilcoxon, n 5 5(1)50  706

Tabla 9 Valorescríticosdelcoeficientedecorrelaciónderangos deSpearmanparaunapruebadeunacola  707

Tabla 10 Númerosaleatorios  708

Tabla 11 PuntosporcentualesdelrangodeStudent, q.05(k, df )  710

Fuentes de datos  714

Respuestas a ejercicios seleccionados  727

Índice  745

Contenido xiii
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Cada vez que lee un periódico o una revista, ve la televisión o navega por Facebook encuentra estadísticas. Cada vez que llena un cuestionario, se registra en un sitio de internet o ingresa su tarjeta de puntos por compras en un escáner electrónico, sus datos personales pasan a formar parte de una base de datos que contiene su información estadística personal. ¡No puede evitarlo! En esta era digital, la recopilación y el análisis de datos forman parte de nuestras actividades diarias. Si quiere ser un consumidor y un ciudadano educado, necesita entender cómo se usan las estadísticas de manera correcta e incorrecta en nuestra vida diaria. Esta versión métrica internacional está diseñada para las escuelas y los estudiantes que se encuentran fuera de Estados Unidos. Las unidades de medida que se usan en los ejemplos y ejercicios seleccionados se han cambiado, de las unidades habituales en Estados Unidos a unidades métricas. No actualizamos los problemas que son específicos de las unidades habituales estadounidenses, como las yardas por pase en el futbol o los datos relacionados con publicaciones específicas.

El secreto de nuestro éxito

En el primer curso universitario de introducción a la estadística que nosotros tomamos usamos el texto Introducción a la probabilidad y estadística, de William Mendenhall. Desde entonces, este texto (actualmente en la decimoquinta edición en inglés) ha ayudado a generaciones de estudiantes a entender en qué consiste la estadística y cómo se puede usar como una herramienta en sus áreas de aplicación particular. El secreto del éxito de Introducción a la probabilidad y estadística es su capacidad para combinar lo antiguo con lo nuevo. Con cada revisión intentamos basarnos en los puntos fuertes de las ediciones anteriores y buscar nuevas formas de motivar, animar e interesar a los estudiantes usando nuevas tecnologías.

Características distintivas de esta edición

Esta edición fue traducida de la decimoquinta edición en inglés, la cual mantiene el esquema tradicional de cobertura de la estadística descriptiva e inferencial que se ha empleado en las ediciones anteriores. Esta revisión mantiene la presentación sencilla de la decimocuarta edición en inglés. Continuamos con la simplificación del idioma para que el texto sea más legible, sin sacrificar la integridad estadística de la presentación. Queremos que los estudiantes entiendan cómo aplicar los procedimientos estadísticos y también que entiendan:

• Cómo describir de manera significativa conjuntos de datos reales.

• Cómo explicar los resultados de las pruebas estadísticas en forma práctica.

• Cómo saber si los supuestos en los que se basan las pruebas estadísticas son válidos.

• Qué hacer cuando estos supuestos se infringen.

Ejercicios

Como en todas las ediciones anteriores en inglés, la variedad y la cantidad de aplicaciones reales en los conjuntos de ejercicios son uno de los puntos fuertes principales de esta edición. Hemos revisado los conjuntos de ejercicios para ofrecer nuevas e interesantes situaciones del mundo real y conjuntos de datos reales, muchos de los cuales provienen de publicaciones

Contenido xv
xv MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Prefacio

periódicas y revistas actuales. Esta edición contiene más de 1900 ejercicios, muchos de los cuales son nuevos. Los ejercicios se gradúan según el nivel de dificultad; algunos, que solo incluyen técnicas básicas, pueden ser resueltos por casi todos los estudiantes, mientras que otros, que involucran aplicaciones prácticas e interpretación de resultados, desafían a los alumnos para que apliquen un razonamiento estadístico y una comprensión más sofisticados. Los ejercicios se han reorganizado para ofrecer una distribución más uniforme de los problemas al interior de cada capítulo, además, se ha introducido un nuevo sistema de numeración que inicia con cada nueva sección.

Organización y cobertura

Creemos que los capítulos 1 a 10 (con la posible excepción del capítulo 3) deben abordarse en el orden en que se presentan. Los capítulos restantes se pueden cubrir en cualquier orden. El capítulo de análisis de varianza precede al de regresión, de tal forma que el docente pueda presentar el análisis de varianza como parte de un análisis de regresión. Por lo tanto, la presentación más efectiva sería ordenar también estos tres capítulos.

Los capítulos 1 a 3 presentan el análisis descriptivo de datos para una y dos variables con MINITAB 18, Microsoft Excel 2016 ® y las calculadoras TI-83/84 Plus. El capítulo 4 incluye una presentación completa de la probabilidad. La última sección del capítulo 4 en la decimocuarta edición en inglés del texto, “Variables aleatorias discretas y sus distribuciones de probabilidad”, se reubicó para convertirse en la primera sección del capítulo 5. Al igual que en la decimocuarta edición en inglés, los capítulos sobre análisis de varianza y regresión lineal incluyen, en la presentación básica del texto, tanto las fórmulas de cálculo como salidas de programas de cómputo. Los docentes que deseen emplear el enfoque de cálculo “manual” de la regresión lineal y del ANOVA pueden usar estos capítulos con la misma facilidad que aquellos que opten por centrarse en la interpretación de las salidas estadísticas generadas por computadora. Esta edición incluye una cobertura ampliada de las distribuciones uniforme y exponencial en el capítulo 5, gráficas de probabilidad normal para evaluar la normalidad en el capítulo 7, además de una tabla t ampliada (tabla 4 del apéndice I). Los nuevos temas del capítulo 13 incluyen los procedimientos de regresión de mejores subconjuntos y la regresión logística binaria.

Una característica importante en los capítulos sobre pruebas de hipótesis es el énfasis en los valores p y su uso para evaluar la significancia estadística. Con la llegada de los valores p generados por computadora, estas probabilidades se han vuelto esenciales al momento de presentar los resultados de un análisis estadístico. Así, el valor observado de la estadística de prueba y su valor p se estudian de manera conjunta al principio de nuestro análisis sobre las pruebas de hipótesis estadísticas como herramientas equivalentes para la toma de decisiones. La significancia estadística se define en términos de valores preasignados de , y el enfoque del valor p se presenta como una alternativa al enfoque del valor crítico para probar una hipótesis estadística. Los ejemplos se explican usando ambos enfoques, el del valor p y el del valor crítico, para la prueba de hipótesis. En los ejemplos prácticos del texto se hace hincapié en la discusión sobre la interpretación práctica de los resultados estadísticos, junto con la diferencia entre las significancias estadística y práctica.

Características especiales de esta edición

• NECESITO SABER : en esta edición se incluyen las secciones destacadas denominadas “NECESITO SABER…” que se identifican con este icono Necesito saber... ? . Estas secciones proporcionan información que consiste en definiciones, procedimientos o instrucciones paso a paso para la resolución de problemas asociados con preguntas específicas, por ejemplo “NECESITO SABER... ¿Cómo construir un histograma de frecuencia relativa?” o “NECESITO SABER... ¿Cómo decidir qué prueba utilizar?”.

• La descripción gráfica y numérica de los datos incluye tanto métodos tradicionales como el análisis exploratorio de datos (EDA, por sus siglas en inglés), usando gráficas generadas con los programas de cómputo MINITAB 18 para Windows y MS Excel 2016

• En varios ejemplos se usan capturas de pantalla de la calculadora TI-84 Plus, lo que permite a los estudiantes tener acceso a esta opción para el análisis de los datos.

Prefacio xvi
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

• Todos los ejemplos y ejercicios del texto que incluyen impresiones o capturas de pantalla de calculadoras se basan en MINITAB 18,MS Excel 2016 o la calculadora TI-84 Plus. Para algunos ejercicios se proporcionan estos resultados, mientras que otros problemas requieren que el estudiante obtenga soluciones sin usar una computadora.

NombreLongitud (km)NombreLongitud (km)

Superior560Titicaca195

Victoria334Nicaragua163

Huron330Athabasca333

Michigan491Reindeer229

MardeAral416TonleSap112

Tanganyika672Turkana246

Baykal632IssykKul184

GreatBear307Torrens208

Nyasa576Vänern146

GreatSlave477Nettilling107

Erie386Winnipegosis226

Winnipeg426Albert160

Ontario309Nipigon115

Balkhash602Gairdner144

Ladoga198Urmia144

Maracaibo213Manitoba224

Onega232Chad280

Eyre144

Fuente:The World Almanac and Book of Facts 2017

a. Use un diagrama de tallo y hoja para describir la longitud de los principales lagos del mundo.

b. Utilice un histograma para mostrar estos datos. ¿Cómo se compara con el diagrama de tallo y hoja del inciso a?

c. ¿Estos datos son simétricos o se encuentran sesgados? Si la distribución está sesgada, ¿cuál es la dirección de la inclinación?

DATA SET DS0128

6. Limpieza de derrames de petróleo El 20 de abril de 2010 hubo en Estados Unidos un gran desastre ambiental cuando la plataforma de perforación

Deepwater Horizon explotó en el Golfo de México. El personal ocupado y el equipo que se utilizó en la limpieza del derrame de petróleo en el Golfo, desde el 2 de mayo de 2010 (día 13) hasta el 9 de junio de 2010 (día 51) se indica en la siguiente tabla.17

d. Utilice una gráfica de barras para mostrar el porcentaje de áreas de pesca federales del Golfo cerradas.

e. Use una gráfica de líneas para mostrar las cantidades de dispersantes utilizadas. ¿Hay alguna relación de línea recta subyacente a lo largo del tiempo?

DATA SET

DS0129

7. Resultados electorales Las elecciones de 2016 en Estados Unidos fueron una contienda en la que Donald Trump derrotó a Hillary Clinton y otros candidatos al ganar 304 votos electorales, o 57% de los 538 disponibles. Sin embargo, Trump solo ganó 46.1% del voto popular, mientras que Clinton obtuvo 48.2%. El voto popular (en miles) para Donald Trump en cada uno de los 50 estados se enlista a continuación:18

AL1319HI129MA1091NM320SD228

AK163ID409MI2280NY2820TN1523

AZ1252IL2146MN1323NC2363TX4685

AR685IN1557MS701ND217UT515

CA4484IA801MO1595OH2841VT95

CO1202KS671MT279OK949VA1769

CT673KY1203NE496OR782WA1222

DE185LA1179NV512PA2971WV489

FL4618ME336NH346RI181WI1405

GA2089MD943NJ1602SC1155WY174

a. Con solo mirar la tabla, ¿qué forma cree que tendrá la distribución del voto popular por estado?

b. Trace un histograma de frecuencia relativa para describir la distribución del voto popular para el presidente Trump en los 50 estados.

c. ¿El histograma del inciso b confirmó su suposición del inciso a? ¿Hay valores atípicos? ¿Cómo puede lil?

Prefacio xvii 0
Figura 9.9 Salida de la calculadora TI-84 Plus, para el ejemplo 9.7
Frecuencia relativa Puntuaciones 8.5 14.5 20.5 26.5 32.5 6/25 4/25 2/25 0
Figura 2.11 Histograma de frecuencia relativa para el ejemplo 2.8
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

TECNOLOGÍA ACTUAL

El papel de las computadoras y de las calculadoras en esta edición: tecnología actual

Las computadoras y las calculadoras científicas o graficadoras ahora son herramientas comunes para los estudiantes universitarios de todas las disciplinas. La mayoría de ellos son usuarios expertos de procesadores de texto, hojas de cálculo y bases de datos, y no tienen problemas para navegar por los programas de cómputo en el entorno Windows. Muchos tienen una calculadora científica o graficadora, a menudo una de aquellas que fabrica Texas InstrumentsTM. Sin embargo, creemos que los avances en la tecnología de cómputo no deberían convertir los análisis estadísticos en una “caja negra”. Más bien, optamos por aprovechar las facilidades de cálculo que la tecnología moderna ofrece con el fin de tener más tiempo para reforzar el razonamiento estadístico, además de comprender e interpretar los resultados estadísticos.

En esta edición, los estudiantes podrán utilizar las computadoras para efectuar análisis estadísticos estándar y como herramienta para reforzar y visualizar los conceptos estadísticos. MS Excel2016 y MINITAB18 se emplean exclusivamente como programas de cómputo para el análisis estadístico, junto con los procedimientos disponibles en las calculadoras TI-83 o TI-84 Plus. Sin embargo, hemos decidido aislar las instrucciones para generar las salidas de computadora o de calculadora en secciones independientes denominadas “Tecnología actual ”, al final de cada capítulo. En cada análisis se usan ejemplos numéricos para guiar al estudiante a través de los comandos y opciones de MS Excel necesarios en los procedimientos que se estudian en ese capítulo y, a continuación, se presentan los pasos y comandos equivalentes necesarios para obtener los mismos resultados o algunos similares con MINITAB y las calculadoras TI-83/84 Plus. Hemos incluido capturas de pantalla de MS Excel, MINITAB18 y la TI-84 Plus para que el estudiante pueda trabajar en estas secciones como “minilaboratorios”.

Si usted no necesita conocimientos “prácticos” sobre MINITAB, MS Excel o las calculadoras TI-83/84 Plus, o si utiliza otra calculadora o programa de cómputo, puede omitir estas secciones y usar las impresiones como guía para una comprensión básica de los resultados generados por computadora o calculadora.

Medidas numéricas descriptivas en Excel

MS Excel proporciona la mayoría de las estadísticas descriptivas básicas que se presentaron en el capítulo 2 mediante un solo comando en la pestaña Data. Es posible calcular otras estadísticas descriptivas mediante el grupo Function Library en la pestaña Formulas

EJEMPLO . Los siguientes datos son los espacios (en pulgadas) para las piernas en los asientos delanteros y traseros de 10 vehículos utilitarios deportivos compactos diferentes:13

Marca y modelo Espacio para piernas en asientos delanteros Espacio para piernas en asientos traseros

ChevroletEquinox42.530.0

FordEscape41.528.0

HyundaiTucson41.528.0 JeepCherokee43.530.0

Medidas numéricas descriptivas en MINITAB MINITAB proporciona la mayoría de las estadísticas descriptivas básicas presentadas en el capítulo 2 mediante un solo comando en los menús desplegables.

EJEMPLO .

Los siguientes datos son los espacios (en pulgadas) para las piernas en los asientos delanteros y traseros de 10 vehículos utilitarios deportivos compactos diferentes:13

Marca y modelo Espacio para piernas en asientos delanteros Espacio para piernas en asientos traseros

ChevroletEquinox42.530.0

FordEscape41.528.0

HyundaiTucson41.528.0

Medidas numéricas descriptivas en las calculadoras TI-83/84 Plus Las calculadoras TI-83/84 Plus pueden utilizarse para calcular estadísticas descriptivas y crear diagramas de caja con los comandos stat ➤ CALC y 2nd ➤ stat plot

EJEMPLO . Los siguientes datos son los espacios (en pulgadas) para las piernas en los asientos delanteros y traseros de 10 vehículos utilitarios deportivos compactos diferentes:13

Marca y modelo Espacio para piernas en asientos delanteros Espacio para piernas en asientos traseros

ChevroletEquinox42.530.0

FordEscape41.528.0 HdiT415280

Prefacio xviii
TECNOLOGÍA ACTUAL MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Apoyos de estudio

Los numerosos y variados ejercicios del texto son la mejor herramienta de aprendizaje para los estudiantes que emprenden un primer curso de estadística. Las respuestas a todos los ejercicios impares se incluyen al final del libro. Cada ejercicio de aplicación tiene un título, lo que facilita a los alumnos y a los profesores identificar de inmediato tanto el contexto del problema como el área de aplicación. Todos los ejercicios básicos se reescribieron y todos los ejercicios de aplicación se reestructuraron en orden creciente de dificultad. Se añadieron nuevos ejercicios, se eliminaron los obsoletos y se introdujo un nuevo sistema de numeración en cada sección.

Técnicas básicas

¿Aproximación normal? ¿Se puede emplear la aproximación normal para aproximar las probabilidades de la variable aleatoria binomial x, con los valores de n y p dados en los ejercicios 1 a 4? Si no, ¿hay alguna otra aproximación que pueda usar?

1. n = 25 y p = .6 2. n = 45 y p = .05

3. n = 25 y p = .3 4. n = 15 y p = .5

Uso de la aproximación normal Encuentre la media y la desviación estándar de la variable aleatoria binomial x con la información de los ejercicios 5 a 11. Posteriormente, use la corrección por continuidad y calcule las probabilidadesmediantelaaproximaciónnormal

12. P(x ≥ 6) y P(x > 6) cuando n = 15 y p = .5

13. P(4 ≤ x ≤ 6) cuando n = 25 y p = .2

14. P(x ≥ 7) y P(x = 5) cuando n = 20 y p = .3

15. P(x ≥ 10) cuando n = 20 y p = .4

Aplicación de los conceptos básicos

16. Día de la Tierra Una instantánea en la revista USA Today encontró que 47% de los estadounidenses asocia el “reciclaje” con el Día de la Tierra.9 Suponga que se aplica una encuesta a una muestra aleatoria de n = 50 adultos y que la cifra de 47% es correcta. Use la curva normal para aproximar a las probabilidades de los siguientes eventos.

Se debe animar a los estudiantes para que usen las secciones “NECESITO SABER...” en cuanto aparecen en el texto. La ubicación de estas secciones tiene el objetivo de responder las preguntas tal como se plantearían normalmente en los debates. Además, hay numerosos consejos denominados “CONSEJO PRÁCTICO” que aparecen en los márgenes del texto. Estos consejos son breves y concisos.

● Consejo práctico Parámetro ⇔ Población Estadística ⇔ Muestra

En los tres capítulos anteriores usted aprendió mucho sobre distribuciones de probabilidad, como las distribuciones binomiales y normales. La forma de la distribución normal está determinada por su media m y su desviación estándar s, mientras que la forma de la distribución binomial está representada por p. Estas medidas numéricas descriptivas, a las que se llama parámetros, son necesarias para calcular la probabilidad de observar resultados muestrales.

En la práctica usted puede decidir qué tipo de distribución de probabilidad usará como modelo, pero los valores de los parámetros que especifican su formaexacta se desconocen. He aquí dos ejemplos:

Por último, las secciones denominadas “Conceptos y fórmulas clave” aparecen en cada capítulo como un resumen del material cubierto en ese capítulo.

Conceptos y fórmulas clave

I. Medidas de tendencia central de una distribución de datos

1. Media aritmética (media) o promedio

a. Población: m

b. Muestra de n mediciones: x x n i 5

2. Mediana; posición de la mediana n 1 .5(1)

3. Moda

4. Se prefiere la mediana sobre la media si los datos están muy sesgados.

II. Medidas de variabilidad 1R R láilíi

2. La regla empírica solo puede emplearse para conjuntos de datos relativamente en forma de montículo. Aproximadamente 68%, 95% y 99.7% de las mediciones se ubican dentro de una, dos y tres desviaciones estándar de la media, respectivamente.

IV. Medidas de posición relativa

1. Puntaje z muestral: z xx s

2. p-ésimo percentil; p% de las mediciones son menores, y p (100)% son mayores.

3. Cuartil inferior, Q1 ; posición de Q n 51.25(1) 1

4. Cuartil superior, Q3; posición de Q3 = .75(n + 1)

5. Rango intercuartil: QQ52 IQR 31

V. El resumen de cinco números y los diagramas de caja

Prefacio xix
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
REVISIÓN DEL CAPÍTULO

Recursos para el docente (disponibles solo en inglés)

WebAssign

WebAssign para el texto Introducción a la probabilidad y estadística, de Mendenhall/Beaver/ Beaver, 15.ª edición versión métrica, es una solución didáctica en línea, flexible y totalmente personalizable que pone a disposición de los profesores poderosas herramientas que les permiten implementar las tareas, evaluar al instante el rendimiento individual de los alumnos y del grupo, así como ayudar a sus alumnos a dominar los conceptos del curso. Con la potente plataforma digital WebAssign y el contenido específico de Introducción a la probabilidad y estadística, puede personalizar su curso, mediante una amplia gama de configuraciones de tareas, añadir sus propias preguntas y contenido, y tener acceso a herramientas de análisis y comunicación de los estudiantes y del curso.

MindTap Reader

Disponible a través de WebAssign, MindTap Reader es el libro electrónico de próxima generación de Cengage. El lector MindTap ofrece sólidas herramientas para que los estudiantes subrayen, tomen notas, naveguen e interactúen con el texto. Los profesores pueden editar el texto y los recursos en el lector, así como añadir videos o hipervínculos.

Cognero

La herramienta de pruebas de Cengage, desarrollada por Cognero, es un sistema en línea flexible que le permite importar, editar y manejar contenido del banco de exámenes creado para el texto, o de otros lugares (incluidas sus preguntas de examen favoritas); además le permite crear varias versiones de examen rápidamente y entregar los exámenes a través de su sistema de gestión de aprendizaje, en su salón de clases u otro lugar.

Manual

de

soluciones

para el docente

Este manual en línea que ahorra un valioso tiempo a los docentes ofrece soluciones completas a todos los problemas del texto. Puede descargar el manual de soluciones en el sitio web de acompañamiento para los docentes.

Sitio web de acompañamiento para los docentes

¡Todo lo que necesita para su curso en un solo lugar! Esta colección de herramientas de clase específicas para un libro está disponible en línea en www.cengage.com/login. Ingrese y descargue presentaciones de PowerPoint, imágenes, el Manual de soluciones para el docente, conjuntos de datos y más.

SnapStat

Cuente la historia detrás de las cifras con SnapStat en WebAssign. Diseñado con el apoyo de estudiantes para dar vida a las estadísticas, SnapStat usa imágenes interactivas para efectuar complejos análisis en línea. Los Laboratorios y Proyectos de WebAssign permiten a los estudiantes analizar sus propios datos o bien elegir entre conjuntos de datos preexistentes con el fin de familiarizarse con la tecnología y comprobar, por sí mismos, que la estadística es mucho más que solo números.

WebAssign

WebAssign para el texto Introducción a la probabilidad y estadística, de Mendenhall/Beaver/ Beaver, 15.ª edición versión métrica, le permite prepararse con confianza para la clase. Esta

Prefacio xx
Recursos para el estudiante (disponible solo en inglés y el acceso se vende por separado)
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

plataforma de aprendizaje en línea, para sus cursos de matemáticas, estadística y ciencias, le ayuda a practicar y asimilar lo que estudia. Los videos y tutoriales le explican los conceptos cuando tiene dificultades; la retroalimentación y las calificaciones que se generan al instante le permiten saber dónde se encuentra, de modo que puede enfocar su tiempo de estudio y obtener mejores resultados en sus tareas. ¡Estudie de forma más inteligente con WebAssign!

MindTap Reader

Disponible a través de WebAssign, MindTap Reader es el libro electrónico de próxima generación de Cengage. El lector MindTap ofrece sólidas herramientas para que los estudiantes subrayen, tomen notas, naveguen e interactúen con el texto. Las anotaciones escritas en MindTap se vinculan automáticamente con la aplicación Bloc de notas, donde se pueden ver cronológicamente, de forma lineal y convincente.

SnapStat

Aprenda la historia detrás de las cifras con SnapStat en WebAssign. Diseñado con el apoyo de estudiantes con el objetivo de dar vida a las estadísticas, SnapStat usa imágenes interactivas para efectuar complejos análisis en línea. Los Laboratorios y Proyectos de WebAssign permiten a los estudiantes analizar sus propios datos, o bien elegir entre conjuntos de datos preexistentes con el fin de familiarizarse con la tecnología y comprobar, por sí mismos, que la estadística es mucho más que solo números.

Reconocimientos

Los autores agradecen a Catherine Van Der Laan y al equipo editorial de Cengage Learning por su paciencia, ayuda y cooperación en la preparación de esta edición.

También agradecemos a los revisores de la decimoquinta edición en inglés, Olcay Akman, Matt Harris, Zhongming Huang, Bo Kai, Sarah Miller y Katie Wheaton. Queremos dar las gracias a los autores y a las organizaciones por permitirnos reimprimir material seleccionado; dondequiera que dichos materiales aparecen en el texto, se incluyen las citas y menciones correspondientes.

Prefacio xxi
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

¿Qué es la estadística?

¿Qué es la estadística? ¿Alguna vez ha conocido a un experto en esta materia? ¿Sabe usted qué hace? Tal vez piense en la persona que se sienta en la cabina de transmisión del Tazón de las Rosas (Rose Bowl) y registra el número de pases completos, yardas recorridas o intercepciones lanzadas el día de Año Nuevo. O tal vez la simple mención de la palabra estadística le produce temor. Usted quizá piense que no sabe nada de estadística, pero prácticamente cada vez que vea los noticieros o consulte su aplicación de noticias favorita, ¡se encontrará con la estadística de una forma u otra! Estos son algunos ejemplos que encontramos justo antes de las elecciones de noviembre de 2017:

• Northam encabeza la contienda por la gubernatura de Virginia con una ligera ventaja. Las primeras elecciones estatales importantes desde la toma de posesión del presidente Trump se llevarán a cabo en martes... Y aunque el resultado final de la contienda, por sí solo, no nos diga mucho sobre el entorno político nacional, es probable que tenga un gran efecto en las elecciones intermedias de 2018. Las encuestas muestran una contienda bastante reñida, con Northam ligeramente favorecido para ganar [sobre Ed Gillespie]. Un promedio de las últimas 10 encuestas concede a Northam una ventaja de 46 a 43%. Durante el último mes la contienda se endureció, pues el candidato Gillespie logró remontar lo que había sido una ventaja de seis puntos. Sin embargo, hay una dispersión bastante amplia entre las encuestas individuales. Se ha estimado la ventaja de Northam en 17 puntos porcentuales (una encuesta de la Universidad de Quinnipiac) y, por otra parte, ha quedado atrás de su oponente hasta en 8 puntos porcentuales (una encuesta de la Universidad de Hampton).1

—www.fivethirtyeight.com

• ¿Por qué Trump tiene asegurada la nominación del Partido Republicano para 2020? En entrevistas con casi tres docenas de estrategas y recaudadores de fondos del Partido Republicano en las acaloradas últimas semanas, casi todo el mundo me dijo que... esperan que Trump alcance la nominación del Partido Republicano en el año 2020... los obstáculos que sus opositores enfrentarán en las elecciones primarias de 2020 son evidentes si se considera una encuesta reciente del Washington Post/ABC News, que indica que 91% de los votantes de Trump dijo que volvería a votar por él... Esta encuesta de ABC News/Washington Post se realizó por teléfono fijo y celular del 29 de octubre al 1 de noviembre de 2017, en inglés y español, con base en una muestra aleatoria nacional compuesta por 1005 adultos. El margen de error de muestreo es de 3.5 puntos, incluido el efecto de diseño.2

1
—www.cnn.com 1
Introducción
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Andrea Ricordi, Italy/Moment/Getty Images

¿Qué es la estadística?

Artículos semejantes a estos son comunes en todos los medios de comunicación y se publica una nueva encuesta casi todos los días, justo antes de una elección presidencial o legislativa. Estos artículos nos son muy familiares; sin embargo, pueden dejar algunas preguntas sin respuesta. ¿Cómo se seleccionó a las personas que participaron en la encuesta? ¿Estas personas darán la misma respuesta mañana? ¿Responderán lo mismo el día de las elecciones? ¿Votarán siquiera? ¿Estas personas son representativas de todos los que votarán el día de las elecciones? El trabajo de un experto en estadística es hacer estas preguntas y encontrar respuestas en el lenguaje de la encuesta.

La mayoría cree en el “encubrimiento” de los hechos en el asesinato de JFK

La mayoría del público cree que el asesinato del presidente John F. Kennedy fue parte de una conspiración mayor y no el acto de un solo individuo. Además, la mayoría de los estadounidenses piensa que diversos hechos sobre el tiroteo del año 1963 fueron encubiertos. Casi 50 años después del asesinato de JFK, una encuesta de FOX News indica que muchos estadounidenses están en desacuerdo con las conclusiones del gobierno acerca de ese hecho. La Comisión Warren concluyó que Lee Harvey Oswald actuó solo cuando disparó a Kennedy; no obstante, 66% del público actualmente piensa que el asesinato fue “parte de una conspiración mayor”, mientras que únicamente 25% piensa que fue el “acto de un individuo”.

“Para los estadounidenses de mayor edad, el asesinato de Kennedy fue una experiencia traumática que inició una pérdida de confianza en el gobierno”, comentó John Gorman, presidente de Opinion Dynamics. “Las personas más jóvenes han crecido con películas y documentales que han promocionado la línea de la ‘conspiración’. Por lo tanto, no sorprende que haya un consenso nacional, bastante sólido, de que aún no se sabe la verdad”.

(En la encuesta se preguntó): “¿Cree que conocemos todos los hechos acerca del asesinato del presidente John F. Kennedy o cree que hubo un encubrimiento?”

Conocemos todos los hechos (%) Hubo un encubrimiento (No está seguro)

—www.foxnews.com3

Cuando usted ve un artículo como este, ¿simplemente lee el título y el primer párrafo, o lee más allá y trata de entender el significado de las cifras? ¿Cómo obtuvieron los autores estas cifras? ¿De verdad entrevistaron a todos los estadounidenses con cada afiliación política? Es tarea del experto en estadística responder algunas de estas preguntas.

Noticias de última hora: 98.6 ºF no es normal

Después de creer durante más de un siglo que 98.6 °F era la temperatura corporal humana normal, los investigadores ahora afirman que lo normal ya no es normal.

Para algunas personas, a ciertas horas del día, 99.9 °F podría estar bien mientras que lecturas tan bajas como 96 °F resultan ser muy “humanas”.

El estándar 98.6 °F proviene de cálculos que realizó un médico alemán en 1868. Algunos médicos han sospechado siempre de la investigación de este buen médico, en particular sobre su afirmación: un millón de lecturas, en una época sin computadoras.

Así que Mackowiak & Co. registraron las lecturas de temperatura de 148 personas sanas durante un periodo de tres días y descubrieron que la temperatura media era de 98.2 °F. Únicamente 8% de las lecturas fueron de 98.6 °F.

—The Press-Enterprise4

¿Qué preguntas le vienen a la mente cuando lee este artículo? ¿Cómo seleccionaron los investigadores a las 148 personas y cómo podemos estar seguros de que los resultados obtenidos de estas son precisos cuando se refieren a la población general? ¿Cómo llegaron los investigadores a las temperaturas normales “altas” y “bajas” que se presentan en el artículo? ¿Cómo registró el médico alemán un millón de temperaturas en 1868? Este es otro ejemplo de un problema estadístico con aplicación en la vida cotidiana.

INTRODUCCIÓN
2
Todos 147412 Demócratas 11818 Republicanos 186913 Independientes 127117
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

La estadística es una rama de las matemáticas que tiene aplicaciones en casi todos los aspectos de nuestra vida diaria. Para la mayoría de las personas es un lenguaje nuevo y desconocido; sin embargo, como cualquier lenguaje nuevo, la estadística puede resultar abrumadora a primera vista. Pero una vez que se aprende y se entiende su lenguaje, proporciona una poderosa herramienta para el análisis de datos en muchos campos de aplicación diferentes.

Poblaciones y muestras

En el lenguaje de la estadística, uno de los conceptos fundamentales es el muestreo. En la mayoría de los problemas estadísticos, se extrae un número específico de mediciones o datos (una muestra) de un conjunto de mediciones mucho más grande, llamado población.

En el experimento de la temperatura corporal, la muestra consiste en el conjunto de mediciones de temperatura corporal de las 148 personas sanas seleccionadas por el experimentador. Esperamos que la muestra sea representativa de un conjunto de mediciones mucho más grande: la población, ¡la temperatura corporal de todas las personas sanas del mundo!

¿Qué es más importante para nosotros, la muestra o la población? En la mayoría de los casos nos interesa principalmente la población, pero identificar a cada miembro de la población puede ser difícil o imposible. ¡Imagine que trata de registrar la temperatura corporal de cada persona sana en el mundo o la preferencia presidencial de todos los votantes registrados en Estados Unidos! En cambio, tratamos de describir o predecir el comportamiento de la población con base en la información contenida en una muestra representativa de esa población.

Los términos muestra y población tienen dos significados para la mayoría de las personas. Por ejemplo, usted leyó que una encuesta de Gallup que se aplicó en Estados Unidos se basó en una muestra de 1823 personas. Se supone que a cada persona entrevistada se le plantea una pregunta en particular, y su respuesta representa una sola medición en la muestra. ¿La muestra consiste en el conjunto de 1823 personas o en las 1823 respuestas que dan?

En estadística distinguimos entre el conjunto de objetos en los que se toman las mediciones y las propias mediciones. Para los experimentadores, los objetos en los que se toman las mediciones se denominan unidades experimentales. Quienes se dedican al estudio de las encuestas por muestreo los llaman elementos de la muestra.

Estadística descriptiva e inferencial

Cuando usted tiene ante sí cierto conjunto de mediciones por primera vez, ya sea una muestra o una población, debe encontrar una manera de organizarlo y resumirlo. La rama de la estadística que proporciona herramientas para describir conjuntos de mediciones se denomina estadística descriptiva. Usted ha visto estadísticas descriptivas de muchas formas: gráficas de barras, gráficas circulares y gráficas de líneas que son presentadas, por ejemplo, por algún candidato político; tablas numéricas en los medios de comunicación, o la cantidad promedio de precipitaciones en su aplicación meteorológica favorita. Las gráficas y los resúmenes numéricos generados por computadora son habituales en nuestra comunicación diaria.

Estadística descriptiva e inferencial 3
Población Muestra
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

DEFINICIÓN

La estadística descriptiva comprende los procedimientos que se usan para resumir y describir las características importantes de un conjunto de mediciones.

Si el conjunto de mediciones es toda la población usted solo necesita obtener conclusiones basadas en las estadísticas descriptivas. Sin embargo, identificar a cada miembro de la población puede resultar demasiado costoso o consumir bastante tiempo. Incluso, aplicar cierta prueba en todas las unidades experimentales de una población las destruiría, por ejemplo, al medir la cantidad de fuerza necesaria para provocar la rotura de un casco de futbol. Por estas u otras razones, es posible que solo cuente con una muestra de la población. Para estudiar la muestra necesitará responder preguntas sobre la población en su conjunto. La rama de la estadística que se ocupa de este problema se denomina estadística inferencial

DEFINICIÓN

La estadística inferencial comprende procedimientos que se usan para hacer inferencias (es decir, obtener conclusiones, hacer predicciones, tomar decisiones) acerca de una población a partir de la información contenida en una muestra extraída de dicha población.

El objetivo de la estadística inferencial es hacer inferencias acerca de una población, a partir de la información contenida en una muestra.

Lograr el objetivo de la estadística inferencial: los pasos necesarios

¿Cómo puede hacer inferencias acerca de una población usando la información contenida en una muestra? La tarea se simplifica si organiza el problema en una serie de pasos lógicos.

1. Especifique las preguntas por responder e identifique la población de interés. En la encuesta electoral de Virginia, el objetivo es determinar quién recibirá más votos el día de las elecciones. Por lo tanto, la población de interés es el conjunto de todos los votos en las elecciones de Virginia. Al seleccionar una muestra es importante que esta última sea representativa de esta población, no de la población que consiste en las preferencias de los votantes algún día previo a la elección.

2. Decida cómo seleccionar la muestra. Esto se denomina diseño del experimento o diseño muestral. ¿La muestra es representativa de la población de interés? Por ejemplo, si se selecciona una muestra de los votantes registrados en la ciudad de San Francisco, ¿sería representativa de todos los votantes del estado de California? ¿Será igual a una muestra de “votantes posibles” (aquellos que probablemente sí votarán en las elecciones)? ¿La muestra es suficientemente grande para responder las preguntas formuladas en el paso 1 sin perder tiempo y dinero en información adicional? Un buen diseño muestral responderá las preguntas planteadas con un costo mínimo para el experimentador.

3. Seleccione y analice la información de la muestra. Al margen de la cantidad de información que contenga la muestra, debe usar un método de análisis adecuado para extraerla. Muchos de estos métodos, que dependen del diseño muestral del paso 2, se explican en el texto.

INTRODUCCIÓN ¿Qué
estadística? 4
es la
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

4. Use la información del paso 3 para hacer inferencias acerca de la población. Es posible usar muchos procedimientos diferentes para hacer estas inferencias, algunos son mejores que otros. Por ejemplo, 10 métodos distintos para estimar la respuesta humana a un fármaco experimental podrían estar disponibles, pero un procedimiento puede ser más preciso que otros. Debe usar el mejor procedimiento de inferencia disponible (muchos de ellos se explican en el texto).

5. Determine la confiabilidad de la inferencia. Puesto que usted está usando solo una fracción de la población para obtener las conclusiones descritas en el paso 4, ¡podría equivocarse! Si una agencia realiza una encuesta estadística para usted, en la que estima que el producto de su empresa ganará 34% del mercado este año, ¿cuánta confianza depositaría en esta estimación? ¿La precisión de la estimación será de 1, 5 o 20 puntos porcentuales?

¿Es suficientemente confiable para que usted la use en el establecimiento de los objetivos de producción? Cada inferencia estadística debe incluir una medida de confiabilidad que indique cuánta confianza se tiene en ella.

Ahora que ha aprendido algunos términos y conceptos básicos, planteamos de nuevo la pregunta que se hizo al principio de esta discusión: ¿sabe lo que hace un experto en estadística? Pues bien, su trabajo es llevar a cabo todos los pasos anteriores.

Claves para un aprendizaje exitoso

A medida que avance en el estudio de la estadística, descubrirá que hay muchos términos y conceptos nuevos por aprender y dominar. Puesto que la estadística es una rama aplicada de las matemáticas, muchos de estos conceptos fundamentales son matemáticos, se basan en los resultados del cálculo o las matemáticas superiores. Sin embargo, no es necesario ser capaz de probar los resultados para aplicarlos de forma lógica. En este texto, usamos ejemplos numéricos y argumentos de sentido común para explicar conceptos estadísticos, en lugar de argumentos matemáticos más complicados.

Actualmente hay computadoras y calculadoras que están disponibles para los estudiantes y que representan una herramienta invaluable. En el estudio de la estadística, incluso el estudiante que inicia puede utilizar programas de cómputo para efectuar análisis estadísticos con un alto grado de velocidad y precisión. Algunos de los programas estadísticos más comunes disponibles en los laboratorios de cómputo son MINITABTM, SAS y SPSS. MINITAB, MS Excel, JMP y otros pueden instalarse tanto en las computadoras de escritorio como en las portátiles. Muchos estudiantes están familiarizados con las calculadoras TI-83 o TI-84 Plus, que incluyen numerosas funciones estadísticas. Incluso hay programas estadísticos en línea y “applets” interactivos que los estudiantes pueden usar.

Estos programas, denominados software estadístico, difieren en los tipos de análisis disponibles, las opciones dentro de los programas y las formas de los resultados impresos (denominados resultados o salidas). Sin embargo, todos son similares. En este libro se utilizarán MINITAB y Microsoft Excel como herramientas estadísticas. Comprender los resultados o las salidas básicas de estos programas le ayudará a interpretar los de otros programas. Del mismo modo, entender los resultados que se muestran en su calculadora TI-83 o TI-84 Plus facilitará mucho la comprensión de una calculadora diferente.

Al final de la mayoría de los capítulos encontrará una sección llamada “Tecnología actual ”. Estas secciones presentan ejemplos numéricos con el fin de guiarlo a través de los comandos y opciones de MINITAB, MS Excel y TI-83/84 Plus necesarios en los procedimientos de ese capítulo. Si utiliza MINITAB, MS Excel o su calculadora TI-83/84 Plus en un laboratorio o en su hogar, tal vez quiera trabajar esta sección con su propia computadora o calculadora para familiarizarse con los métodos prácticos. Si no necesita conocimientos prácticos sobre MINITAB, MS Excel o las calculadoras TI-83/84 Plus, puede omitir esta sección y simplemente usar las imágenes de la computadora o las capturas de pantalla de la calculadora para el análisis, tal como aparecen en el texto.

Claves
5
para un aprendizaje exitoso
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Lo más importante es que el uso exitoso de la estadística requiere sentido común y pensamiento lógico. Por ejemplo, si queremos encontrar la estatura promedio de todos los estudiantes de una universidad en particular, ¿seleccionaríamos toda nuestra muestra de los miembros del equipo de basquetbol? En el ejemplo de la temperatura corporal, un pensador lógico cuestionaría un promedio con base en un millón de mediciones que se efectuaron en 1868, cuando las computadoras aún no se habían inventado.

A medida que aprenda nuevos términos, conceptos y técnicas estadísticas, recuerde ver cada problema con una mirada crítica y asegúrese de aplicar la regla del sentido común. A lo largo del texto, le recordaremos las dificultades y los peligros del uso o mal uso de la estadística. Benjamin Disraeli dijo una vez que hay tres tipos de mentiras: ¡mentiras, malditas mentiras y estadísticas! Nuestro propósito es demostrar que esta afirmación es errónea, ¡le mostraremos cómo hacer que la estadística trabaje para usted y no mienta por usted!

A medida que avance en el libro, consulte esta introducción de vez en cuando. Cada capítulo aumentará sus conocimientos de estadística y, de alguna manera, debería ayudarlo a lograr uno de los pasos descritos aquí. Cada uno de estos pasos es importante para lograr el objetivo general de la estadística inferencial: hacer inferencias acerca de una población con base en la información contenida en una muestra extraída de esa población.

INTRODUCCIÓN
6
¿Qué es la estadística?
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Descripción de datos con gráficos

¿Cómo está su presión arterial?

¿Su presión arterial es normal o se encuentra demasiado alta o baja? El estudio de caso al final de este capítulo examina un amplio conjunto de datos sobre la presión arterial. Utilizará gráficas para describir estos datos y comparar su presión arterial con la de otras personas de su misma edad y sexo.

OBJETIVOS DE APRENDIZAJE

Muchosconjuntosdemedicionessonmuestrasseleccionadasdepoblacionesmásgrandes.Otros conjuntosconformantodaunapoblación,comoenelcasodeuncensonacional.Enestecapítulo aprenderáquéesuna variable,cómoclasificarlasvariablesenvariostiposycómosegeneranmedicionesodatos.Posteriormenteserácapazdeusargráficasparadescribirconjuntosdedatos.

ÍNDICE DEL CAPÍTULO

● Distribucionesdedatosysusformas(1.1,1.3)

● Gráficasdepuntos(1.3)

● Gráficascirculares,gráficasdebarras,gráficasdelíneas(1.2,1.3)

● Variablescualitativasycuantitativas:discretasycontinuas(1.1)

● Histogramasdefrecuenciarelativa(1.4)

● Diagramasdetalloyhoja(1.3)

● Datosunivariadosybivariados(1.1)

● Variables,unidadesexperimentales,muestrasypoblaciones,datos(1.1)

● Necesito saber...

Cómo construir un diagrama de tallo y hoja

Cómo construir un histograma de frecuencia relativa

7 1 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
© Photographee.eu/Shutterstock.com

1.1 Variables y datos

En los capítulos 1 y 2 presentaremos algunas técnicas básicas en estadística descriptiva, la rama de la estadística que se ocupa de describir conjuntos de mediciones, tanto de muestras como de poblaciones. Una vez que haya recopilado un conjunto de datos, ¿cómo puede mostrarlos de forma clara, comprensible y legible? En primer lugar, debe ser capaz de definir qué se entiende por mediciones o “datos” y clasificar los tipos de datos que probablemente encuentre en la vida real. Empezaremos por presentar algunas definiciones.

DEFINICIÓN

Una variable es una característica que cambia o varía con el tiempo y para diferentes personas u objetos en consideración.

Por ejemplo, la temperatura corporal es una variable que cambia con el tiempo en una sola persona; también varía de una persona a otra. La afiliación religiosa, el origen étnico, los ingresos, la estatura, la edad y el número de hijos son variables, características que varían según la persona seleccionada.

En la “Introducción” definimos una unidad experimental o un elemento de la muestra como el objeto en el que se toma una medición. Es lo mismo que decir que una unidad experimental es el objeto sobre el que se mide una variable. Cuando una variable se mide en un conjunto de unidades experimentales se obtiene un conjunto de mediciones o datos

DEFINICIÓN

Una unidad experimental es el individuo o el objeto en el que se mide una variable. Se produce una sola medición o valor de dato cuando una variable se mide en la realidad en una unidad experimental.

Si se obtiene una medición para cada unidad experimental en toda la colección, el conjunto de datos resultante constituye la población de interés. Cualquier subconjunto más pequeño de mediciones es una muestra

DEFINICIÓN

Una población es el conjunto de todas las mediciones de interés para el investigador.

DEFINICIÓN

Una muestra es un subconjunto de mediciones seleccionado de la población de interés.

EJEMPLO . De todos los estudiantes de pregrado de una universidad grande se selecciona un subconjunto de cinco y las mediciones se registran en una hoja de cálculo, como se muestra en la figura 1.1. Identifique los diversos elementos que intervienen en la obtención de este conjunto de datos.

Solución La unidad experimental en la que se miden las variables es un estudiante universitario del campus en particular, esto se muestra en la columna A. Para cada estudiante se miden cinco variables: promedio de calificaciones (GPA, grade point average), género, nivel en la universidad, especialidad y número actual de unidades matriculadas. Cada una de estas

CAPÍTULO  Descripción de datos con gráficos 8
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Figura 1.1

Mediciones en cinco estudiantes de pregrado

Estudiante Género Especialidad Número de unidades Psicología Matemáticas

características varía de un estudiante a otro. Si consideramos que los GPA de todos los estudiantes de esta universidad son la población de interés, los cinco promedios de la columna B representan una muestra de esta población. Si se hubiera medido el promedio de cada estudiante de pregrado de la universidad, tendríamos toda la población de mediciones para esta variable.

La segunda variable que se mide en los estudiantes es el género, en la columna C. Esta variable es algo diferente del GPA porque normalmente toma uno de dos valores: masculino (M) o femenino (F). Si pudiéramos identificar a cada miembro de la población, esto consistiría en un conjunto de M y F, uno para cada estudiante de la universidad. La tercera y cuarta variables, nivel y especialidad, también involucran datos no numéricos: el nivel tiene cuatro categorías (primero, segundo, tercero y último año) y la variable especialidad tiene una categoría para cada especialidad de pregrado ofrecida en el campus. La última variable, el número actual de unidades matriculadas, se valora numéricamente y consiste en un conjunto de números en lugar de un conjunto de cualidades o características.

Aunque hemos analizado cada variable de manera individual, recuerde que hemos medido cada una de estas cinco variables en una sola unidad experimental: el estudiante. Por lo tanto, en este ejemplo, una “medición” en realidad consiste en cinco observaciones, una para cada variable medida. Por ejemplo, la medición tomada en el estudiante 2 produce esta observación: (2.3, F, segundo, Matemáticas, 15)

Hay una diferencia entre una sola variable medida en una sola unidad experimental y múltiples variables medidas en una sola unidad experimental como en el ejemplo 1.1.

DEFINICIÓN

Se obtienen datos bivariados cuando se mide una sola variable en una sola unidad experimental.

DEFINICIÓN

Se obtienen datos bivariados cuando se miden dos variables en una sola unidad experimental.

Se obtienen datos multivariados cuando se miden más de dos variables.

Si se mide la temperatura corporal de 148 personas, los datos resultantes son univariados. En el ejemplo 1.1 se midieron cinco variables en cada estudiante, lo que dio como resultado datos multivariados.

■ Tipos de variables

Las variables pueden clasificarse en dos tipos: cualitativas o cuantitativas.

DEFINICIÓN

Las variables cualitativas miden una cualidad o característica en cada unidad experimental. Las variables cuantitativas miden una cantidad numérica en cada unidad experimental.

. Variables y datos 9
Inglés Inglés Negocios Nivel Primero Segundo Segundo Primero Tercero
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

● Consejo práctico

Cualitativo ⇔ “calidad” o característica

Cuantitativo ⇔ “cantidad” o número

Las variables cualitativas producen datos que se pueden separar en categorías. Por lo tanto, se denominan variables categóricas y producen datos categóricos. Las variables género, año y especialidad en el ejemplo 1.1 son variables cualitativas que producen datos categóricos. Estos son otros ejemplos:

• Afiliación política: republicana, demócrata, independiente.

• Clasificación de sabor: excelente, buena, regular, mala.

• Color de un caramelo: café, amarillo, rojo, naranja, verde, azul.

Las variables cuantitativas, que a menudo se representan con la letra x , producen datos numéricos como los que se enlistan a continuación:

• x = tasa de interés preferencial

• x = número de pasajeros en un vuelo de Los Ángeles a Nueva York

• x = peso de un paquete listo para enviar

• x = volumen del jugo de naranja en un vaso

Observe la diferencia en los tipos de valores numéricos que toman estas variables cuantitativas. El número de pasajeros, por ejemplo, solo puede ser x 5 0, 1, 2, . . ., mientras que el peso de un paquete puede ser cualquier valor superior a cero, o x . 0. Para dar cuenta de esta diferencia, definimos dos tipos de variables cuantitativas: discretas y continuas.

DEFINICIÓN

Una variable discreta solo puede tomar un número finito o contable de valores. Una variable continua puede tomar los valores infinitos que corresponden a los puntos que hay en un intervalo de recta.

● Consejo práctico

Discreto ⇔ “es posible enlistar los valores”

Continuo ⇔ “no es posible enlistar los valores”

El término discreto se refiere a los espacios discretos entre los valores posibles que la variable puede tomar. Variables como el número de miembros de una familia, el número de automóviles nuevos vendidos y el número de neumáticos defectuosos devueltos para su reemplazo son ejemplos de variables discretas. Por otro lado, variables como la altura, el peso, el tiempo, la distancia y el volumen son continuas porque pueden tomar valores en cualquier punto a lo largo de un intervalo de recta. En este caso, ¡para cualesquiera dos valores que se elijan siempre se puede encontrar un tercer valor entre ellos!

Identifique cada una de las siguientes variables como cualitativa o cuantitativa:

1. El uso más frecuente de su horno microondas (recalentar, descongelar, calentar, otros).

2. El número de consumidores que se niegan a responder una encuesta telefónica.

3. La puerta elegida por un ratón en un experimento de laberinto (A, B o C).

4. El tiempo ganador para un caballo que corre en el Derby de Kentucky.

5. El número de niños en una clase de quinto grado que leen al nivel de su grado o por encima de él.

● Consejo práctico

Las variables discretas a menudo consisten en el “número de” elementos en un conjunto.

Solución Las variables 1 y 3 son cualitativas porque solo se mide una cualidad o característica de cada individuo u objeto; las categorías para estas dos variables se muestran entre paréntesis. Las otras tres variables son cuantitativas. Las variables 2 y 5 son discretas porque pueden tomar cualquiera de los valores x 5 0, 1, 2, . . ., con un valor máximo en función del número de consumidores a quienes se llamó o del número de niños en la clase, respectivamente. La variable 4, el tiempo ganador para un caballo que corre en el Derby de Kentucky, es la única variable continua de la lista. El tiempo ganador, si puede medirse con suficiente precisión, podría ser de 121 segundos, 121.5 segundos, 121.25 segundos o cualquier valor entre dos tiempos cualesquiera que se hayan elegido.

CAPÍTULO  Descripción de datos con gráficos 10
EJEMPLO .
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

¿Por qué preocuparse por los diferentes tipos de variables (que se muestran en la figura 1.2) y los datos que generan? Porque los diferentes tipos de datos requieren métodos distintos para su descripción, de modo que puedan presentarse de forma clara y comprensible para el público.

Datos

1.1 E JERCICIOS

Técnicas básicas

Unidades experimentales Defina las unidades experimentales para las variables descritas en los ejercicios 1 a 5.

1. Género de un estudiante.

2. Número de errores en un examen parcial.

3. Edad de un paciente con cáncer.

4. Número de flores en una planta de azalea.

5. Color de un automóvil que entra a un estacionamiento. ¿Cualitativa o cuantitativa? Las variables de los ejercicios

6 a 9 ¿son cualitativas o cuantitativas?

6. Cantidad de tiempo que toma armar un rompecabezas sencillo.

7. Número de estudiantes en un aula de primer grado.

8. Calificación de un político recién elegido (excelente, bueno, regular, malo).

9. Estado en el que vive una persona.

¿Discreta o continua? Las variables de los ejercicios 10 a

18, ¿son discretas o continuas?

10. Población en un área determinada de Estados Unidos.

11. Peso de los periódicos reciclados en un día.

12. Número de reclamos presentados a una compañía de seguros durante un día.

13. Número de consumidores en una encuesta de 1,000 entrevistados que consideran importante el etiquetado nutricional de los productos alimenticios.

14. Número de accidentes de navegación en un tramo de 80 kilómetros del río Colorado.

15. Tiempo necesario para completar un cuestionario.

16. Costo de una lechuga.

17. Número de hermanos y hermanas que usted tiene.

18. Rendimiento del trigo (en toneladas) de una parcela de una hectárea.

¿Poblaciones o muestras? En los ejercicios 19 a 22, determine si los datos recopilados representan una población o una muestra.

19. Un investigador utiliza una base de datos estatal para determinar el porcentaje de conductores de Michigan que han tenido un accidente en los últimos cinco años.

20. Se entrevistó a mil ciudadanos y se registraron sus opiniones sobre el control de armas.

21. Veinte animales reciben una nueva dieta y se registra su aumento de peso durante tres meses.

22. La distribución de ingresos de 10% de la población que percibe los salarios más altos en Estados Unidos se determina mediante datos del Servicio Interno de Impuestos.

. Variables y datos 11
Continuo
CualitativoCuantitativo Discreto
Figura 1.2 Tipos de datos
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Aplicación de los conceptos básicos

23. Estacionamiento en el campus Seis vehículos seleccionados de una base de datos de automóviles del campus se muestran en la tabla.

VehículoTipoMarca¿Colectivo?

25. Actitudes de los votantes Usted es un candidato para la legislatura de su estado y desea aplicar una encuesta para conocer las actitudes de los votantes hacia sus posibilidades de ganar.

Distancia de viaje en una dirección (kilómetros)

a. ¿Cuál es la población que le interesa y de la que desea elegir su muestra?

Antigüedad (años)

1AutoHondaNo37.86

2AutoToyotaNo27.53

3CamiónToyotaNo16.24

4CamionetaDodgeSí50.72

5MotocicletaHarleyDavidson No40.81

6AutoChevroletNo  8.69

a. ¿Cuáles son las unidades experimentales?

b. Enliste las variables que se están midiendo, ¿de qué tipo son?

c. ¿Se trata de datos univariados, bivariados o multivariados?

24. Expresidentes de Estados Unidos Un conjunto de datos proporciona información sobre las edades, al momento de la muerte, de los 38 expresidentes de Estados Unidos que han fallecido hasta ahora.

a. Este conjunto de datos, ¿es una población o una muestra?

b. ¿Cuál es la variable que se mide?

c. ¿La variable del inciso b es cuantitativa o cualitativa?

b. La población en el inciso a, ¿cómo depende del tiempo?

26. Tiempos de supervivencia al cáncer Un investigador desea estimar el tiempo de supervivencia de un paciente enfermo de cáncer después de un ciclo de radioterapia.

a. ¿Cuál es la variable de interés para el investigador?

b. La variable en el inciso a, ¿es cualitativa, cuantitativa discreta o cuantitativa continua?

c. ¿Cuál es la población de interés?

d. ¿Cómo podría el investigador seleccionar una muestra de la población?

e. ¿Qué problemas pueden ocurrir en el muestreo de esta población?

27. Nuevos métodos de enseñanza Una investigadora quiere saber si una nueva forma de enseñar a leer a estudiantes sordos es eficaz. Mide la puntuación de los estudiantes en un examen de lectura antes y después de enseñarles con el nuevo método.

a. ¿Cuál es la variable que se mide? ¿Qué tipo de variable es?

b. ¿Cuál es la unidad experimental?

c. ¿Cuál es la población de interés?

1.2 Gráficos para datos categóricos

Una vez recopilados los datos, estos se pueden consolidar y resumir para mostrar la siguiente información:

• Los valores de la variable que se han medido.

• La frecuencia con la que se ha producido cada valor. En primer lugar, elabore una tabla estadística y, a continuación, úsela para crear una gráfica denominada distribución de datos. El tipo de gráfica que elija depende del tipo de variable que haya medido.

Cuando la variable de interés es cualitativa o categórica, la tabla estadística incluye una lista de las categorías junto con una medida de la frecuencia con la que se produjo cada categoría. Puede medir “con qué frecuencia” se ha producido cada valor de tres maneras diferentes:

• La frecuencia o el número de mediciones en cada categoría.

• La frecuencia relativa o proporción de mediciones en cada categoría.

• El porcentaje de mediciones en cada categoría.

CAPÍTULO  Descripción de datos con gráficos 12
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Sea n el número total de mediciones en el conjunto, puede encontrar la frecuencia relativa y el porcentaje mediante estas relaciones:

● Consejo práctico

Tres pasos para la distribución de datos:

(1) Datos brutos ⇒

(2) Tabla estadística ⇒

(3) Gráfico

La suma de las frecuencias siempre es n, la suma de las frecuencias relativas es 1 y la suma de los porcentajes es 100%.

Cuando la variable es cualitativa, las categorías deben elegirse de tal manera que:

• una medición se clasifique en una y solo una categoría, y

• haya una categoría a la que pertenezca cada medición. Por ejemplo,

• Para clasificar los productos cárnicos según el tipo de carne utilizada, podría usar las categorías: carne de res, pollo, mariscos, cerdo, pavo u otros.

• Para clasificar los rangos de los profesores universitarios, podría emplear las categorías: profesor, profesor asociado, profesor asistente, instructor, conferencista, otros.

La categoría “otros” se incluye en ambos casos para permitir la posibilidad de que una medición no entre en alguna de las categorías definidas.

Una vez que las mediciones se han resumido en una tabla estadística, puede usar una gráfica circular o una de barras para mostrar la distribución de los datos. Una gráfica circular es la que se conoce como gráfica de pay o pastel, y que muestra cómo se distribuyen los datos entre las categorías. Una gráfica de barras muestra la misma distribución de datos entre las categorías, y la altura de las barras mide la frecuencia con la que se observa cada categoría en particular.

EJEMPLO . En una encuesta sobre educación pública se pidió a 400 administradores de escuelas que calificaran la calidad de la educación en Estados Unidos. Sus respuestas se resumen en la tabla 1.1. Elabore una gráfica circular y una gráfica de barras para este conjunto de datos.

Solución Para crear una gráfica circular, asigne un sector del círculo a cada categoría. El ángulo de cada sector está determinado por la proporción de mediciones (o frecuencia relativa) en esa categoría. Como un círculo tiene 360°, puede usar la siguiente ecuación para encontrar el ángulo:

Ángulo 5 Frecuencia relativa 3 360°

■ Tabla 1.1 Calificación de la educación en Estados Unidos hecha por 400 educadores

CalificaciónFrecuencia

A35 B260

C93 D12

Total400

● Consejo práctico

Las proporciones suman 1. Los porcentajes suman 100. Los ángulos de sector suman 360°.

La tabla 1.2 muestra las calificaciones junto con las frecuencias, las frecuencias relativas, los porcentajes y los ángulos de sector necesarios para elaborar la gráfica circular que se muestra en la figura 1.3. Mientras que en las gráficas circulares se emplean los porcentajes para determinar los tamaños relativos de los “sectores circulares”, en las gráficas de barras por lo general se emplean las frecuencias de las categorías. En la figura 1.4 se muestra una gráfica de barras para estos datos.

. Gráficos para datos categóricos 13
Frecuenciasrelativas Frecuencia Porcentaje100 Frecuenciarelativa 5 53 n
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

EJEMPLO .

■ Tabla 1.2 Cálculos necesarios para crear la gráfica circular del ejemplo 1.3 CalificaciónFrecuenciaFrecuencia relativaPorcentajeÁngulo

El aspecto de estas dos gráficas es muy diferente. La gráfica circular muestra la relación de las partes con el todo; la gráfica de barras, en cambio, muestra la cantidad o frecuencia real de cada categoría. Como las categorías de este ejemplo están ordenadas como “calificaciones” (A, B, C y D), no se quiere reordenar las barras de la gráfica para cambiar su forma. En una gráfica circular el orden de presentación es irrelevante.

Una bolsa de cacahuates M&M’s® contiene 21 piezas con los colores que se indican en la tabla 1.3. La variable “color” es cualitativa, por lo que la tabla 1.4 enumera las seis categorías junto con el conteo del número de chocolates por cada color. Las tres últimas columnas de la tabla 1.4 muestran la frecuencia con la que se produjo cada categoría. Como las categorías son colores y no tienen un orden en particular, puede crear gráficas de barras con muchas formas diferentes simplemente reordenando las barras. Para enfatizar que el café es el color más frecuente, seguido del azul, el verde y el naranja, se ordenan las barras de mayor a menor frecuencia y se elabora la gráfica de barras de la figura 1.5. Una gráfica de barras donde las barras se ordenan de mayor a menor altura se denomina diagrama de Pareto

14
CAPÍTULO  Descripción de datos con gráficos
A3535/400 5 .099% 358.09360324 B260260/400 5 .6565% 8234.0 C9393/400 5 .2323% 882.8 D1212/400 5 .033% 8 10.8 Total4001.00100% 8360 D 3.0% A 8.8% B 65.0% C 23.3% Figura 1.3 Gráfica circular para el ejemplo 1.3 Figura 1.4 Gráfica de barras para el ejemplo 1.3 250 200 150 100 50 0 ABCD Calificación Frecuencia
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

■ Tabla 1.3 Datos brutos: colores de 21 chocolates confitados

1.2 EJERCICIOS

E JERCICIOS

■ Tabla 1.4 Tabla estadística: datos de chocolates confitados para el ejemplo 1.4

CategoríaConteoFrecuenciaFrecuencia relativaPorcentaje

CaféIIIII 66/2128%

VerdeIII 33/2114

NaranjaIII 33/2114

AmarilloII 22/2110

RojoII 22/2110

AzulIIII 55/2124

Total211100%

Técnicas básicas

Gráficas circulares y de barras Los datos de los ejercicios 1 a 3 representan diferentes formas de clasificar a un grupo de 100 estudiantes de una clase de estadística. Elabore una gráfica de barras y una gráfica circular para describir cada conjunto de datos.

Calificación finalFrecuencia

A31

B36

C21 D9

Primeraño32

Segundoaño34

Terceraño17

Últimoaño  9

Graduado  8

Facultad Frecuencia

Humanidades,ArtesyCiencias43

CienciasNaturalesyAgronomía32

Negocios17

4. Grupos de personas Cincuenta personas se agrupan en cuatro categorías: A, B, C y D, y el número de personas que pertenecen a cada categoría se muestra en la tabla:

CategoríaFrecuencia

a. Elabore una gráfica circular para describir los datos.

b. Elabore una gráfica de barras para describir los datos.

c. ¿Cambia la forma de la gráfica de barras del inciso b según el orden de presentación de las cuatro categorías?

¿Es importante el orden de presentación?

d. ¿Qué proporción de personas están en las categorías B, C o D?

e. ¿Qué porcentaje de personas no están en la categoría B?

.
Gráficos para datos categóricos 15
RojoRojoVerdeCafé AmarilloNaranjaVerdeAzul CaféAzulAzulCafé NaranjaAzulCaféNaranja
CaféVerdeCaféAzul
Amarillo
Figura 1.5
6 5 4 3 2 1 0
Diagrama de Pareto para el ejemplo 1.4
Frecuencia
Café Azul Verde Naranja Amarillo Rojo Color
F3
Otras8 1. 3.
B14 C20
A11
D5
2. Nivel Frecuencia
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

5. Pantalones de mezclilla Un fabricante de pantalones de mezclilla tiene plantas de manufactura en California, Arizona y Texas. Se seleccionan al azar 25 pantalones de la base de datos computarizada y se registra el estado en el que se produce cada uno:

9. Elabore una gráfica de barras para describir el nivel de aprobación de Barack Obama según la edad.

10. ¿Qué efecto, si lo hay, tienen las variables de género, origen étnico, edad y afiliación de partido en las calificaciones de aprobación?

a. Use una gráfica circular para describir los datos.

b. Use una gráfica de barras para describir los datos.

c. ¿Qué proporción de pantalones se fabrica en Texas?

d. ¿Qué estado produjo la mayor cantidad de pantalones?

e. Si quiere saber si las tres plantas produjeron la misma cantidad de pantalones, ¿cómo puede usar las gráficas de los incisos a y b para averiguarlo? ¿Qué conclusiones puede obtener a partir de estos datos?

Aplicación de los conceptos básicos

Popularidadpresidencial Después de las elecciones de 2016 se aplicó una encuesta para estudiar los niveles de aprobación de los expresidentes George W. Bush y Barack Obama. En la encuesta, que incluyó a 1,009 adultos estadounidenses de 18 años o más que viven en Estados Unidos y el Distrito de Columbia, se obtuvieron calificaciones de aprobación por género, origen étnico, edad y afiliación de partido.1 Use estos datos para los ejercicios 6 a 10.

Categoría George W. BushBarack Obama

11. ¿Le gustaría ser presidente? En una encuesta de opinión realizada por ABC News, casi 80% de los adolescentes dijo que no estaba interesado en ser presidente de Estados Unidos.2 Cuando se les preguntó: “¿Cuál es la razón principal por la que no querría ser presidente?”, mencionaron las siguientes respuestas:

Otrosplanesdecarrera/noleinteresa40% Demasiadapresión20% Demasiadotrabajo15% Noseríabuenoenello14% Demasiadasdiscusiones5%

a. ¿Se incluyen todos los motivos en esta tabla? Añada otras categorías si lo considera necesario.

b. ¿Usaría una gráfica circular o una gráfica de barras para describir visualmente los datos? ¿Por qué?

c. Dibuje la gráfica que eligió en el inciso b.

d. Si usted fuera la persona que aplicó la encuesta de opinión, ¿qué otras cuestiones querría investigar?

Adultos

estadounidenses 5963

Género Hombre5660

Mujer6066

Origen étnico

Caucásico6455

Nocaucásico4782

Edad

18a344275

35a546462

551 6555

Afiliación de partido

Republicanos8222

Independientes5665

Demócratas4195

6. Elabore una gráfica de barras para describir el nivel de aprobación de George W. Bush según la afiliación de partido.

7. Elabore una gráfica de barras para describir el nivel de aprobación de George W. Bush según la edad.

8. Elabore una gráfica de barras para describir el nivel de aprobación de Barack Obama según la afiliación de partido.

Usuarios de Facebook La red social Facebook ha crecido rápidamente en los últimos 10 años. La siguiente tabla muestra el número promedio de usuarios diarios (en millones) a medida que ha crecido de 2010 a 2017, en diferentes regiones del mundo.3 Use estos datos para resolver los ejercicios 12 a 15.

Región

20102017

EstadosUnidos/Canadá99183

Europa107271

Asia64453

Restodelmundo58419

Total3281,326

Fuente: Reportes de la compañía | A partir del segundo trimestre de 2017.

12. Use una gráfica circular para describir la distribución de los usuarios diarios promedio en las cuatro regiones en 2017.

13. Use una gráfica de barras para describir la distribución de los usuarios diarios promedio en las cuatro regiones en 2010.

14. Use una gráfica de barras para describir la distribución de los usuarios diarios promedio en las cuatro regiones en 2017.

15. ¿Cómo describiría los cambios en la distribución de los usuarios diarios promedio durante este periodo de siete años?

CAPÍTULO  Descripción de datos con gráficos 16
DATA SET DS0101
CACATXTXTX AZAZCAAZTX CAAZTXTXTX CAAZAZCACA
CAAZAZTXCA
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

16. Regreso al trabajo ¿Cuánto tiempo le lleva adaptarse a su rutina laboral normal después de volver de vacaciones? Aquí se muestra una gráfica de barras con datos de USA Today:

a. ¿Se tienen en cuenta todas las opiniones en la gráfica? Añada otra categoría si lo considera necesario.

b. ¿La gráfica de barras se dibujó con precisión? Es decir, ¿las tres barras están en la proporción correcta entre sí?

c. Use una gráfica circular para describir las opiniones. ¿Cuál gráfica resulta más interesante?

Adaptación después de vacaciones

Participación mundial en los ingresos por diamantes

17. Dibuje una gráfica circular para describir las distintas participaciones de los ingresos mundiales por producción de diamantes.

18. Dibuje una gráfica de barras para describir las distintas participaciones de los ingresos mundiales por producción de diamantes.

19. Dibuje un diagrama de Pareto para describir las distintas participaciones de los ingresos mundiales por producción de diamantes.

20. ¿Cuál de las gráficas es la más eficaz para describir los datos?

DATA SET DS0102

¡Los diamantes son para siempre! Gran parte de la industria minera de diamantes del mundo se encuentra en África, Rusia y Canadá. A continuación se muestra una representación visual de la participación de los ingresos mundiales derivados de la producción de diamantes, adaptada de la revista Time Magazine 4 Use esta información para responder las preguntas de los ejercicios 17 a 20.

21. Colores de automóviles Los colores más populares para autos compactos y deportivos en los últimos años se muestran en la tabla.5

Color PorcentajeColor Porcentaje Plata14Blanco/blanco perla

21 Negro/efecto negro21Beige/café4 Gris17Amarillo/dorado2 Azul9Verde1 Rojo11Otro ,1

Fuente:The World Almanac and Book of Facts 2017 Use una gráfica apropiada para describir estos datos.

1.3 Gráficos para datos cuantitativos

Las variables cuantitativas miden una cantidad en cada unidad experimental. Si la variable solo puede tomar un número finito o contable de valores, se trata de una variable discreta. Una variable que puede tomar el número infinito de valores correspondientes a los puntos en un intervalo de recta se denomina continua

■ Gráficas circulares y gráficas de barras

A veces una variable cuantitativa puede medirse en diferentes segmentos de la población o para diferentes categorías de clasificación. Por ejemplo, usted puede medir los ingresos promedio de personas de diferentes grupos de edad y géneros, o que viven en áreas geográficas distintas del país. En esos casos puede usar gráficas circulares o de barras para describir los datos, utilizando la cantidad medida en cada categoría. La gráfica circular muestra cómo se distribuye la cantidad total entre las categorías y la gráfica de barras se vale de la altura de cada barra para mostrar la cantidad en una categoría en particular.

. Gráficos para datos cuantitativos 17
Botsuana Otros 8–13% Zimbabwe 10% Angola 10% Sudáfrica 18% Canadá 20% Rusia
26%
40 30 20 10 0 Porcentaje 40 34 19
UndíaVariosdías Sintiempo
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Fuente: Kimberley Process.

EJEMPLO .

La cantidad de dinero gastada en el año fiscal 2016 por el Departamento de Defensa de Estados Unidos en varias categorías se muestra en la tabla 1.5.6 Utilice tanto una gráfica circular como una de barras para describir los datos. Compare las dos formas de presentación.

■ Tabla 1.5 Gastos por categoría

Categoría

Cantidad (miles de millones de dólares)

Personalmilitar138.6

Operaciónymantenimiento244.4

Adquisiciones118.9

Investigaciónydesarrollo69.0

Construcciónmilitar6.9

Otro2.5

Total 580.3

Solución Se están midiendo dos variables: la categoría del gasto (cualitativa) y la cantidad del gasto (cuantitativa). La gráfica de barras de la figura 1.6 muestra las categorías en el eje horizontal y las cantidades en el eje vertical.

OperaciónAdquisicionesPersonalymantenimiento militar

Para la gráfica circular de la figura 1.7, cada “sector circular” representa la proporción de los gastos totales ($580.3 mil millones) correspondiente a su categoría particular. Por ejemplo, para la categoría de investigación y desarrollo, el ángulo del sector es

CAPÍTULO  Descripción de datos con gráficos 18
250 200 150 100 50 0 Cantidad (miles de millones de dólares)
InvestigaciónydesarrolloConstrucciónmilitar Otro
3858 69.0 580.3 36042.8 Construcción militar 6.9 Otro 2.5 Personal militar 138.6 Operación y mantenimiento 244.4 Adquisiciones 118.9 Investigación y desarrollo 69.0
barras
ejemplo 1.5
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Figura 1.6
Gráfica de
para el
Figura 1.7
Gráfica
circular para el ejemplo 1.5

EJEMPLO .

Ambas gráficas muestran que las mayores cantidades de dinero se gastaron en personal y operaciones. Como no hay un orden particular para las categorías, puede reorganizar las barras o los sectores de las gráficas en la forma que desee. La forma de la gráfica de barras no influye en su interpretación.

■ Gráficas de líneas

Cuando una variable cuantitativa se registra a lo largo del tiempo a intervalos equidistantes (como diario, semanal, mensual, trimestral o anual), el conjunto de datos forma una serie de tiempo. Los datos de series de tiempo se presentan de forma más eficaz en una gráfica de líneas con el tiempo representado en el eje horizontal. La idea es tratar de encontrar un patrón o tendencia que probablemente continúe en el futuro, y luego usar ese patrón para hacer predicciones precisas para el futuro inmediato.

En 2025, los baby boomers de edad más avanzada (nacidos en 1946) tendrán 79 años, y los integrantes de la Generación X de edad más avanzada (nacidos en 1965) estarán a dos años de ser elegibles para jubilarse. ¿Cómo afectará esto las tendencias de los consumidores en los próximos 40 años? ¿Habrá fondos suficientes para que los baby boomers reciban los beneficios del Seguro Social? La Oficina del Censo de Estados Unidos realiza proyecciones acerca de la población estadounidense que tendrá 85 años o más en los próximos años, como se muestra en la tabla 1.6.5 Utilice una gráfica de líneas para representar los datos. ¿Cuál es el efecto de estirar o encoger el eje vertical de la gráfica de líneas?

■ Tabla 1.6 Proyecciones de crecimiento demográfico

Fuente: The World Almanac and Book of Facts 2017, p. 618

Solución La variable cuantitativa “85 y más” se mide en cuatro intervalos, creando una serie de tiempo que puede representarse visualmente mediante una gráfica de líneas. Los intervalos están marcados en el eje horizontal y las proyecciones en el eje vertical. Los puntos de datos se conectan para formar las gráficas de líneas de la figura 1.8. Observe la diferencia en las escalas verticales de las dos gráficas. Encoger la escala en el eje vertical hace que los cambios grandes parezcan pequeños y viceversa. Para evitar conclusiones equivocadas, observe cuidadosamente las escalas de los ejes vertical y horizontal. Sin embargo, a partir de ambas gráficas se obtiene una imagen clara del número cada vez mayor de personas de 85 años y más en los próximos 40 años.

. Gráficos
19
para datos cuantitativos
Año 20202030204020502060 85ymás(millones)6.79.114.619.019.7
2050 2060 2040 2030 2020 Año 20.0 17.5 15.0 12.5 10.0 7.5 5.0 85 y más (millones) Figura 1.8 Gráficas de líneas para el ejemplo 1.6 100 80 60 40 20 85 y más (millones) 2050 2060 2040 2030 2020 Año MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
• Consejo práctico ¡Tenga cuidado de estirar o encoger los ejes cuando elabore o analice una gráfica!

Figura 1.9

Gráficas de puntos para conjuntos de datos pequeños y grandes

■ Gráficas de puntos

Muchos conjuntos de datos cuantitativos consisten en números que no se pueden separar fácilmente en categorías o intervalos. ¡Necesita una forma diferente de graficar este tipo de datos!

La gráfica más sencilla para los datos cuantitativos es la gráfica de puntos. Para un conjunto pequeño de datos (por ejemplo, el conjunto 2, 6, 9, 3, 7, 6) puede simplemente trazar los datos como puntos en un eje horizontal, como se muestra en la figura 1.9(a). Sin embargo, para un conjunto de datos grande, como el de la figura 1.9(b), la gráfica de puntos puede ser difícil de interpretar.

■ Diagramas de tallo y hoja

Otra forma sencilla de mostrar la distribución de un conjunto de datos cuantitativos es el diagrama de tallo y hoja. Esta gráfica utiliza los valores numéricos de cada punto de datos.

Necesito saber...

Cómo construir un diagrama de tallo y hoja

1. Divida cada dato en dos partes: el tallo y la hoja.

2. Enliste los tallos en una columna, con una línea vertical a la derecha.

3. Para cada dato, registre la parte de la hoja en la misma fila que su tallo correspondiente.

4. En cada tallo, ordene las hojas de menor a mayor.

5. Proporcione una clave para la codificación del tallo y de la hoja de tal forma que el lector pueda volver a generar los datos originales si es necesario.

EJEMPLO . La tabla 1.7 muestra los precios (en dólares) de 19 marcas diferentes de zapatos para caminar. Utilice un diagrama de tallo y hoja para representar los datos.

■ Tabla 1.7 Precios de zapatos para caminar 907070707570 656860747095

Solución Para crear el tallo y la hoja, divida cada observación entre las unidades y las decenas. El número de la izquierda es el tallo y el número de la derecha es la hoja. Por lo tanto, para los zapatos que cuestan $65, el tallo es 6 y la hoja es 5. Los tallos, que van de 4 a 9, se enlistan en la figura 1.10, junto con las hojas para cada uno de los 19 datos. Si indica que la unidad de hoja es 1, el lector sabrá que el tallo 6 y la hoja 8, por ejemplo, representan el número 68, registrado al dólar más cercano.

CAPÍTULO  Descripción de datos con gráficos 20
2 3 4 5 6 7 8 9 Conjunto de datos pequeño (a) 0.98 1.05 1.12 1.19 1.26 1.33 1.40 1.47 Conjunto de datos grande (b)
?
70
757068654065
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

EJEMPLO .

A veces, las opciones de tallos disponibles dan como resultado un diagrama que contiene muy pocos tallos y una gran cantidad de hojas en cada tallo. En esta situación puede extender los tallos dividiendo cada uno en varias líneas, según los valores de hoja que se les asignen. En general los tallos se dividen de dos maneras:

• En dos líneas, con la hojas de 0 a 4 en la primera línea y las hojas de 5 a 9 en la segunda línea.

• En cinco líneas, con las hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas, respectivamente.

Los datos de la tabla 1.8 son los pesos al nacer, en libras, de 30 recién nacidos a término en un hospital metropolitano; los pesos se registraron hasta la décima de libra más cercana.7 Elabore un diagrama de tallo y hoja para mostrar la distribución de los datos.

■ Tabla 1.8 Pesos al nacer, en libras, de 30 recién nacidos a término

Solución Aunque los datos se registran con la precisión de solo un decimal, son mediciones de la variable continua x 5 peso, que puede tomar cualquier valor positivo. Si observa los datos de la tabla 1.8 verá que los pesos más alto y más bajo son 9.4 y 5.6 libras, respectivamente. Pero, ¿cómo se distribuyen los pesos restantes? Si utiliza el punto decimal como línea divisoria entre el tallo y la hoja, solo tendrá cinco tallos, lo que no proporciona una imagen suficientemente buena. Si, en cambio, divide cada tallo en dos líneas, habrá ocho tallos, ¡porque la primera línea del tallo 5 y la segunda línea del tallo 9 están vacías! Este es un diagrama más descriptivo, como se muestra en la figura 1.11. Para estos datos, la unidad de hoja es .1, y el lector puede deducir que el tallo 8 y la hoja 2, por ejemplo, representan el dato x 5 8.2.

Si gira el diagrama de tallo y hoja hacia un lado, de modo que la línea vertical sea un eje horizontal, verá que los datos se han “amontonado” o “distribuido” a lo largo del eje en un patrón que puede describirse como “en forma de montículo”, como un montón de arena en la playa. Este diagrama muestra de nuevo que los pesos de estos 30 recién nacidos oscilan entre 5.6 y 9.4; muchos pesos están entre 7.5 y 8.0 libras.

. Gráficos para datos cuantitativos 21
5 140 55 6580855Reordenamiento6055588 7000504050070000000455 88 905905
40Unidaddehoja
Figura 1.10 Diagrama de tallo y hoja para los datos de la tabla 1.7 ● Consejo práctico Tallo | Hoja
7.27.86.86.28.2 8.08.25.68.67.1 8.27.77.57.27.7 5.86.86.88.57.5 6.17.99.49.07.8 8.59.07.76.77.7
Figura 1.11
586568 612612 68887Reordenamiento67888 72217122 78795775877557777889 8022280222 85658556 9040Unidaddehoja=.19004
Diagrama de tallo y hoja para los datos de la tabla 1.8
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

■ Interpretación de gráficas con ojo crítico

Una vez que haya creado una o varias gráficas para un conjunto de datos, ¿qué debe buscar al intentar describir los datos?

• Primero, compruebe las escalas horizontal y vertical para que tenga claro lo que se está midiendo.

• Observe la ubicación de la distribución de datos. ¿En qué parte del eje horizontal se ubica el centro de la distribución? Si compara dos distribuciones, ¿están ambas centradas en el mismo lugar?

• Observe la forma de la distribución. ¿Tiene un “pico”, es decir un punto más alto que cualquier otro? Si es así, esta es la medición o categoría que se produce con más frecuencia. ¿Hay más de un pico? ¿Hay aproximadamente el mismo número de datos a la izquierda y a la derecha del pico?

• Busque medidas excepcionales o valores atípicos. Es decir, ¿hay alguna medida mucho más grande o más pequeña que todas las demás? Es posible que estos valores atípicos no sean representativos de los demás valores del conjunto.

Las distribuciones se describen a menudo según su forma.

DEFINICIÓN

Una distribución es simétrica si los lados izquierdo y derecho, cuando se dividen a la altura del valor medio, forman imágenes espejo.

Una distribución está sesgada a la derecha si una mayor proporción de las mediciones se encuentra a la derecha del valor máximo. Las distribuciones que están sesgadas a la derecha contienen algunas mediciones excepcionalmente grandes.

Una distribución está sesgada a la izquierda si una mayor proporción de las mediciones se encuentra a la izquierda del valor máximo. Las distribuciones que están sesgadas a la izquierda contienen algunas mediciones excepcionalmente pequeñas.

Una distribución es unimodal si tiene un pico; una distribución bimodal tiene dos picos. Las distribuciones bimodales a menudo representan una mezcla de dos poblaciones diferentes en el conjunto de datos.

EJEMPLO . Observe las cuatro gráficas de puntos que se muestran en la figura 1.12. Describa las ubicaciones y formas de estas distribuciones.

CAPÍTULO  Descripción de
con
22
datos
gráficos
Figura 1.12
2 3 5 7 9 1468
Formas de distribuciones de datos para el ejemplo 1.9
1234567 1234567
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

● Consejo

Solución La primera gráfica de puntos muestra una distribución relativamente simétrica con un solo pico ubicado en x 5 4. Si doblara la página en este punto máximo o pico, las mitades izquierda y derecha serían casi imágenes espejo. A veces a esta forma se le llama “forma de montículo” porque los puntos de datos parecen acumularse como un montículo de arena. La segunda gráfica de puntos también es simétrica, pero es plana o “uniforme” en lugar de tener forma de montículo. La tercera gráfica de puntos, no obstante, está lejos de ser simétrica. Tiene una “cola derecha” larga, lo que significa que hay algunas observaciones excepcionalmente grandes. Si doblara la página en el pico o valor máximo, en el lado derecho habría una proporción de datos mayor que la del izquierdo. Esta distribución está sesgada a la derecha. De manera similar, la cuarta gráfica de puntos con la “cola izquierda” larga está sesgada a la izquierda

EJEMPLO .

Un asistente administrativo del departamento de atletismo de una universidad local da seguimiento a los GPA de ocho miembros del equipo femenino de voleibol. El asistente ingresa los GPA en una base de datos pero, por accidente, coloca mal el punto decimal de la última entrada.

2.83.03.03.32.43.43.0.21

Utilice una gráfica de puntos para describir los datos y descubrir el error del asistente.

Solución La gráfica de puntos de este pequeño conjunto de datos se muestra en la figura 1.13(a). Claramente se distingue el valor atípico o excepcional generado por el asistente al capturar los datos. Una vez corregido el error, como en la figura 1.13(b), se aprecia la distribución correcta del conjunto de datos. Como se trata de un conjunto muy pequeño, es difícil describir la forma de la distribución, pero parece tener un valor máximo en 3.0 y ser relativamente simétrica.

Al comparar las gráficas creadas para dos conjuntos de datos debe comparar sus escalas de medición, ubicaciones y formas, y buscar valores excepcionales o atípicos. Recuerde que los valores atípicos no siempre se deben a errores o al registro de datos incorrecto. A veces proporcionan información muy valiosa que no debe ignorarse. Es posible que tenga que investigar si un valor atípico es una medición válida que simplemente es excepcionalmente grande o pequeña, o si ha habido algún error en la recopilación de datos. Si las escalas difieren mucho, ¡tenga cuidado al hacer comparaciones o sacar conclusiones que podrían ser inexactas!

. Gráficos para datos cuantitativos 23 2 3 5 7 9 1468
ejemplo 1.10 0.51.01.52.02.53.03.5 GPA 2.22.42.62.83.03.23.4 GPA
práctico Simétrico ⇔ imágenes espejo Sesgada a la derecha ⇔ cola derecha larga Sesgada a la izquierda ⇔ cola izquierda larga Figura
1.13
Distribuciones del GPA para el
● Consejo práctico Los valores atípicos se encuentran lejos del cuerpo principal de datos.
(b) MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
(a)

1.3 EJERCICIOS

Técnicas básicas

Gráficas de puntos Elabore una gráfica de puntos para los datos que se proporcionan en los ejercicios 1 y 2. Describa la forma de la distribución y busque valores atípicos.

11. Describa la forma de la distribución. ¿Observa algún valor atípico?

12. Compare la gráfica de puntos y el diagrama de tallo y hoja. ¿Transmiten aproximadamente la misma información?

1. 2.0 , 1.0 ,

0.9,

1.1,

,

,

1.0 , 0.9, 1.4 , 0.9, 1.0 , 1.0

2. 53, 61, 58 , 56 , 58 , 60 , 54 , 54 , 62 , 58 , 60 , 58 , 56 , 56 , 58

Diagrama de tallo y hoja I Elabore un diagrama de tallo y hoja para estas 50 mediciones y responda las preguntas de los ejercicios 3 a 5.

3.14.92.83.62.54.53.53.74.14.9

2.92.13.54.03.72.74.04.43.74.2

3.86.22.52.92.85.11.85.62.23.4

2.53.65.14.81.63.66.14.73.93.9

4.35.73.74.64.05.64.94.23.13.9

3. Describa la forma de la distribución. ¿Observa algún valor atípico?

4. Utilice el diagrama de tallo y hoja para encontrar la observación más pequeña.

5. Encuentre la octava y la novena observaciones más grandes. DATA SET

DS0104

Diagrama de tallo y hoja II Utilice el siguiente conjunto de datos para responder las preguntas de los ejercicios 6 a 8.

4.53.23.53.93.53.9

4.34.83.63.34.34.2

3.93.74.34.43.44.2

4.44.03.63.53.94.0

6. Dibuje un diagrama de tallo y hoja, utilice como tallo el número en la posición de las unidades.

7. Dibuje un diagrama de tallo y hoja, utilice dos veces cada número en la posición de las unidades para formar los tallos.

8. ¿El diagrama de tallo y hoja del ejercicio 7 mejora la presentación de los datos?

Comparación de gráficas Una variable discreta solo puede tomar los valores 0, 1 o 2. Use el conjunto de 20 mediciones de esta variable para responder las preguntas de los ejercicios 9 a 12. 12102

Gráficas de líneas Elabore una gráfica de líneas para describir los datos y responder las preguntas de los ejercicios 13 y 14.

13. Atravesar un laberinto Un psicólogo midió el tiempo que tardaba una rata en atravesar un laberinto cada día durante un periodo de cinco días. ¿Cree que está ocurriendo algún aprendizaje?

Día12345

Tiempo(segundos)4543463225

9. Trace una gráfica de puntos para describir los datos.

10. ¿Cómo podría definir el tallo y la hoja de este conjunto de datos? Dibuje el diagrama de tallo y hoja.

DATA SET DS0105

14. Medición a lo largo del tiempo Una variable cuantitativa se mide una vez al año durante un periodo de 10 años. ¿Qué indica la gráfica de líneas acerca de los datos?

Aplicación de los conceptos básicos

15. Hamburguesas con queso Elabore una gráfica de puntos para el número de hamburguesas con queso que 10 estudiantes universitarios comen en una semana determinada.

45421

33427

a. ¿Cómo describiría la forma de la distribución?

b. ¿Qué proporción de los estudiantes comió más de cuatro hamburguesas con queso esa semana?

DATA SET DS0106

16. Puntuaciones en pruebas Se registraron las puntuaciones de 20 estudiantes en una prueba de 100 puntos.

61939186556386827657

94896762728768657584

a. Describa los datos mediante un diagrama de tallo y hoja.

b. Describa la forma y la ubicación de las puntuaciones.

c. ¿La forma de la distribución es excepcional? ¿Se le ocurre alguna razón por la que las puntuaciones tienen esa forma?

CAPÍTULO  Descripción de datos con gráficos 24
1.1,
1.0
1.2
1.3,
0.9,
22110 01211
21100
DATA SET DS0103
161.5658.2 262.3757.5 360.7857.5 459.8956.1 558.01056.0
AñoMediciónAñoMedición
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

17. Recuento de glóbulos rojos El recuento de glóbulos rojos de una persona sana se midió cada día durante un periodo de 15 días. El valor registrado se mide en millones de células por microlitro (μL).

5.45.25.05.25.5

5.35.45.25.15.3

5.34.95.45.25.2

a. Describa los datos mediante un diagrama de tallo y hoja.

b. Describa la forma y la ubicación de los recuentos de glóbulos rojos.

c. Si el día de hoy se midiera el número de glóbulos rojos de la persona y el resultado fuera 5.7 millones de células por microlitro, ¿este valor sería excepcional? ¿Qué conclusiones puede obtener?

de Hershey's®

a. ¿Los tamaños, alturas y volúmenes de los seis productos representan con precisión la cantidad de calorías que contienen?

b. Elabore una gráfica de barras para describir el número de calorías en estos seis alimentos.

DATA SET

DS0110

DATA SET

DS0108

18. Contenido de calcio El contenido de calcio (Ca) de una sustancia mineral en polvo se analizó 10 veces con los siguientes porcentajes de composición registrados.

2.712.822.792.812.68

2.712.812.692.752.76

a. Dibuje una gráfica de puntos para describir los datos. (Sugerencia: La escala del eje horizontal debe comprender entre 2.60 y 2.90).

b. Dibuje un diagrama de tallo y hoja para los datos. Emplee como tallos los números en las posiciones de las centésimas y las milésimas.

c. ¿Alguno de los datos es inconsistente con el resto de las mediciones? Esto indicaría que el técnico pudo haber cometido un error en el análisis.

21. ¡La educación vale la pena! La educación vale la pena, de acuerdo con algunos datos de la Oficina de Estadísticas Laborales. La mediana de los ingresos semanales y las tasas de desempleo para ocho niveles educativos diferentes se muestran en la tabla.10

Nivel de estudios

Tasa de desempleo (%)

Mediana de los ingresos semanales habituales ($)

Títulodedoctorado1.61,664 Títulodeespecialidad1.61,745

Títulodemaestría2.41,380

Títulodelicenciatura2.71,156 Títulotécnico3.6819 Licenciaturainconclusa,sintítulo4.4756 Graduadodebachillerato5.2692 Menosquediplomade bachillerato

7.4504

Nota:Losdatosaplicanparapersonasde25añosomás.Losingresosson paratrabajadoresasalariadosdetiempocompleto.

DATA SET

DS0109

19. Correr en el agua Se ha sugerido que correr en el agua es un buen ejercicio para los atletas lesionados y otras personas que desean practicar un programa de aeróbicos de bajo impacto. Un estudio publicado en la revista Journal of Sports Medicine informó sobre las frecuencias cardiacas de 20 voluntarios sanos a una cadencia de 96 pasos por minuto.8 A continuación se enlistan los datos:

871097980969590929698

10191781129498941078196

a. Elabore un diagrama de tallo y hoja para describir los datos.

b. Analice las características de la distribución de datos.

20. El gran debate sobre las calorías ¿Quiere perder peso? ¡Puede hacerlo si reduce las calorías, siempre y cuando obtenga suficiente valor nutricional de los alimentos que come! Esta es una imagen que muestra la cantidad de calorías que contienen algunos de los alimentos favoritos en Estados Unidos, adaptada de un artículo en The Press-Enterprise 9

Fuente: Encuestadepoblaciónactual,DepartamentodeTrabajodeEstadosUnidos,OficinadeEstadísticasLaboralesdeEstadosUnidos,20de abrilde2017.

a. Elabore una gráfica de barras para describir las tasas de desempleo por nivel educativo.

b. Elabore una gráfica de barras para describir la mediana de los ingresos semanales medios por nivel educativo.

c. Resuma la información con base en las gráficas de los incisos a y b.

22. Religiones organizadas Las estadísticas de las religiones del mundo son solo aproximadas porque muchas de ellas no llevan un registro del número de sus miembros. En la tabla se muestra una estimación de estos números (en millones).11

. Gráficos para datos cuantitativos 25
DATA SET DS0107
Religión Miembros (millones)Religión Miembros (millones) Budismo376Judaísmo14 Cristianismo2,100Sijismo23 Hinduismo900Chinatradicional394 Islam1,500Otra61 Indígenasprimitivasy africanastradicionales 400 Númerodecalorías 26 Kisses
53
140
145 Botella
330 Una
800
DATA SET DS0111 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Galleta Oreo®
Lata
de refresco de cola de 350 mL
de cerveza Budweiser® de 350 mL rebanada de pizza de pepperoni de Papa John's® Hamburguesa Whopper con queso de Burger King®

a. Describa el número total de miembros de las religiones organizadas del mundo mediante una gráfica circular.

b. Describa el número total de miembros de las religiones organizadas del mundo mediante una gráfica de barras.

c. Ordene los grupos religiosos según el número de miembros, del número menor al mayor. Utilice un diagrama de Pareto para describir los datos. ¿Cuál de las tres visualizaciones considera más eficaz?

2.

3.

23. Residuos peligrosos ¿Qué tan seguro es su vecindario? ¿Hay algún sitio con residuos peligrosos cerca? La tabla y el diagrama de tallo y hoja muestran el número de sitios con residuos peligrosos en cada uno de los 50 estados y el Distrito de Columbia en Estados Unidos en 2016.5

DS0112

AL15HI3MA33NM16SD2

AK6ID9MI67NY87TN17

AZ9IL49MN25NC39TX53

AR9IN40MS9ND0UT18

CA99IA13MO33OH43VT12

CO21KS13MT19OK8VA31

CT15KY13NE16OR14WA51

DE14LA15NV1PA97WV10

DC1ME13NH21RI12WI38

FL54MD21NJ115SC25WY2

GA17

Fuente: The World Almanac and Book of Facts 2017, p. 335.

a. Describa la forma de la distribución. Identifique a qué estados pertenecen las mediciones excepcionalmente grandes marcadas como “altas” en el diagrama.

b. ¿Se le ocurre alguna razón por la que estos estados tendrían una gran cantidad de sitios con residuos peligrosos? ¿Qué otra variable podría medir para explicar por qué los datos se comportan de esta manera?

Diagrama de tallo y hoja de residuos peligrosos N 5 51

a. Dibuje un diagrama de tallo y hoja para los datos. Describa la forma de la distribución y busque valores atípicos.

b. Dibuje una gráfica de puntos para los datos. ¿Cuál de las dos gráficas es más informativa? Explique por qué.

24. Las 20 mejores películas La siguiente tabla muestra los ingresos brutos (en millones de dólares) por la venta de boletos de cine para ver las 20 mejores películas durante el fin de semana del 25 al 28 de agosto de 2017:12

DATA SET

DS0114

25. Presidentes estadounidenses La siguiente tabla muestra las edades, en el momento de la muerte, de los 38 presidentes estadounidenses fallecidos, desde George Washington hasta Ronald Reagan:5

Washington67Arthur57

J.Adams90Cleveland71

Jefferson83B.Harrison67

Madison85McKinley58

Monroe73T.Roosevelt60

J.Q.Adams80Taft72

Jackson78Wilson67

VanBuren79Harding57

W.H.Harrison68Coolidge60

Tyler71Hoover90

Polk53F.D.Roosevelt63

Taylor65Truman88

Fillmore74Eisenhower78

Pierce64Kennedy46

Buchanan77L.Johnson64

Lincoln56Nixon81

A.Johnson66Ford93

Grant63Reagan93

Hayes70

Garfield49

a. Antes de graficar los datos, piense en la distribución de las edades de los presidentes en el momento de la muerte. ¿Qué forma tendrá?

CAPÍTULO  Descripción de datos con gráficos 26
DATA SET
120689999
212111 18255 163133 13389 11403 949 85134 55 56 567 Unidad de hoja 5 1 HI 87, 97, 99, 115
6 0011223
211022333344 (9)1555667789
Película Ingresos brutos de fin de semana ($ millones) Película Ingresos brutos de fin de semana ($ millones)
$2.4
1. Duro de cuidar $10.311. Viaje de chicas
Anabelle
7.712.
2.3
2: la creación
Locos por las nueces 2
Bailarina 4.713.
3 1.8 4. Viento salvaje 4.614. La torre oscura 1.7 5. La estafa de los Logan 4.215. Mujer maravilla 1.7 6. Dunkerque 3.916. El milagro de todos los santos 1.5 7. Spiderman: de regreso
casa 2.817. Desaparecido 1.5 8. El nacimiento del dragón 2.718. El castillo de cristal 1.4 9. Mayweather vs. McGregor 2.619. Baby: el aprendiz del crimen 1.2 10. Emoji: la película 2.520. El planeta de los simios: la guerra 0.9
Mi villano favorito
a
DATA SET
DS0113
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

b. Dibuje un diagrama de tallo y hoja para los datos. Describa la forma. ¿Le sorprende?

c. Los cinco presidentes más jóvenes en el momento de la muerte aparecen en la “cola” inferior de la distribución. Identifique a estos cinco presidentes.

d. Tres de los cinco presidentes más jóvenes en el momento de la muerte tienen una característica en común. ¿Cuál es?

1.4 Histogramas de frecuencia relativa

Un histograma de frecuencia relativa se parece a una gráfica de barras, pero se usa para representar visualmente datos cuantitativos en lugar de cualitativos. Los datos de la tabla 1.9 son los pesos al nacer, en libras, de 30 recién nacidos a término, reproducidos del ejemplo 1.8 y representados mediante una gráfica de puntos en la figura 1.14(a). En primer lugar, divida el intervalo que comprende de la medición más pequeña a la más grande en subintervalos o clases de igual longitud. Si apila los puntos en cada subintervalo (figura 1.14(b)) y dibuja una barra sobre cada pila, habrá creado un histograma de frecuencia o un histograma de frecuencia relativa, según la escala del eje vertical.

■ Tabla 1.9 Pesos al nacer, en libras, de 30 recién nacidos a término

Estas son algunas definiciones y términos que se usan comúnmente al construir histogramas de frecuencia relativa.

DEFINICIONES

• Una clase es un subintervalo que se crea al dividir el intervalo que comprende de la medición más pequeña a la más grande.

• Los límites o fronteras de clase son los números que marcan los límites superior e inferior de la clase.

• El ancho de clase es la diferencia entre los límites de clase superior e inferior.

• La frecuencia de clase es el número de mediciones que caen dentro de esa clase en particular.

• Un histograma de frecuencia relativa para un conjunto de datos cuantitativos es una gráfica de barras en la que la altura de la barra muestra “con qué frecuencia” (medida como proporción o frecuencia relativa) las mediciones caen en cada subintervalo o clase. Las clases o subintervalos se trazan a lo largo del eje horizontal.

. Histogramas de frecuencia relativa 27
7.27.86.86.28.2 8.08.25.68.67.1 8.27.77.57.27.7 5.86.86.88.57.5 6.17.99.49.07.8 8.59.07.76.77.7
6.06.67.27.88.49.0 Pesos al nacer (a) 9.0 8.5 8.0 7.5 7.0 6.5 6.0 9.5 Pesos al nacer
(b)
Figura 1.14 Cómo construir un histograma
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

● Consejo práctico Las frecuencias relativas suman 1; las frecuencias suman n

La forma en que se crean las clases o subintervalos es una cuestión de elección personal. Sin embargo, como regla general, el número de clases debe oscilar entre 5 y 12; cuantos más datos disponibles haya, más clases se necesitan. Elija las clases de tal forma que cada medición se incluya en una y solo una clase. Puede usar la tabla 1.10 como guía para seleccionar el número aproximado de clases para un conjunto de datos en particular. Sin embargo, recuerde que esto es solo una guía; puede usar más o menos clases si esto hace que la gráfica sea más descriptiva.

■ Tabla 1.10 Elección del número de clases

Tamañodelamuestra2550100200500

Númerodeclases678910

Para los pesos al nacer de la tabla 1.9, se ha decidido usar ocho intervalos de igual longitud. Puesto que el rango total de los pesos al nacer es

25 9.45.63.8

el ancho mínimo de clase necesario para cubrir el rango de los datos es (3.8 ÷ 8) = .475. Por conveniencia se redondea este ancho aproximado a .5. El primer intervalo comienza en el valor más bajo, 5.6; a partir de ese punto se forman subintervalos de 5.6 hasta 6.1, pero sin incluir este último; de 6.1 hasta 6.6, pero sin incluir este último, y así sucesivamente. Al emplear el método de inclusión izquierda en el que se incluye el punto límite de clase izquierdo pero no el punto límite de clase derecho se elimina cualquier confusión sobre dónde colocar una medición que se ubica exactamente en un límite de clase.

La tabla 1.11 muestra las ocho clases, etiquetadas del 1 al 8 para su identificación. Los límites o fronteras de las ocho clases, junto con un recuento del número de mediciones que caen en cada clase, también se muestran en la tabla. Al igual que con las gráficas de la sección 1.3, ahora es posible medir la frecuencia con la que cada clase ocurre utilizando ya sea la frecuencia o la frecuencia relativa

Para construir el histograma de frecuencia relativa, trace los límites o fronteras de clase a lo largo del eje horizontal. Dibuje una barra sobre cada intervalo de clase, con una altura igual a la frecuencia relativa de esa clase. El histograma de frecuencia relativa para los datos de peso al nacer (figura 1.15) muestra, de un vistazo, cómo se distribuyen los pesos al nacer en el intervalo que va de 5.6 a 9.4.

■ Tabla 1.11 Frecuencias relativas para los datos de la tabla 1.9

ClaseLímites de claseRegistro Frecuencia de clase

Frecuencia relativa de clase

15.6a ,6.1II22/30

26.1a ,6.6II22/30

36.6a ,7.1IIII44/30

47.1a ,7.6IIII55/30

57.6a ,8.1IIIIIII88/30

68.1a ,8.6IIII55/30

78.6a ,9.1III33/30

89.1a ,9.6I11/30

CAPÍTULO  Descripción de datos con gráficos 28
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

EJEMPLO . Veinticinco clientes de una cafetería son entrevistados para una encuesta de mercadotecnia en la que se les pregunta: “¿Con qué frecuencia visita la cafetería en una semana típica?”. En la tabla 1.12 se enlistan las respuestas de estos 25 clientes. Utilice un histograma de frecuencia relativa para describir los datos.

■ Tabla 1.12 Número de visitas en una semana típica para 25 clientes 67156

Solución La variable que se mide es “número de visitas a la cafetería”, una variable discreta que solo toma valores enteros. En este caso, lo más sencillo es elegir las clases o subintervalos como valores enteros en el rango de valores observados: 1, 2, 3, 4, 5, 6 y 7. Los intervalos podrían escribirse como .5 a <1.5, 1.5 a <2.5, y así sucesivamente, pero note que los únicos valores que realmente pueden aparecer son los valores enteros, 1, 2,..., 8. La tabla 1.13 muestra las clases así como sus frecuencias y frecuencias relativas correspondientes. El histograma de frecuencia relativa se muestra en la figura 1.16.

. Histogramas de frecuencia relativa 29
Histograma de frecuencia relativa 8/30 7/30 6/30 5/30 4/30 3/30 2/30 1/30 0 5.66.16.67.17.68.18.69.19.6 Frecuencia relativa Pesos al nacer
Figura 1.15
46468 65634 55576 35755
Número de visitas a la cafetería Límites de claseFrecuencia Frecuencia relativa 1.5a ,1.51.04 21.5a ,2.5— 32.5a ,3.52.08 43.5a ,4.53.12 54.5a ,5.58.32 65.5a ,6.57.28 76.5a ,7.53.12 87.5a ,8.51.04 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
■ Tabla 1.13 Tabla de frecuencias para el ejemplo 1.11

Necesito saber... ?

Cómo construir un histograma de frecuencia relativa

1. Elija el número de clases, normalmente entre 5 y 12. Cuantos más datos tenga, más clases debe usar.

2. Encuentre el ancho aproximado de clase, para ello divida la diferencia entre los valores más grande y más pequeño entre el número de clases.

3. Redondee el ancho de clase aproximado a un número conveniente.

4. Si los datos son discretos, puede asignar una clase para cada valor entero. Para un gran número de valores enteros, es posible que tenga que agruparlos en clases.

5. Enliste los límites o fronteras de clase. La primera clase debe incluir la medición más pequeña. A continuación, defina las clases restantes; incluya el punto límite izquierdo pero no el derecho.

6. Elabore una tabla estadística que contenga las clases, sus frecuencias y sus frecuencias relativas.

7. Dibuje el histograma como una gráfica de barras, con los intervalos de clase en el eje horizontal y las frecuencias relativas como la altura de las barras.

Se puede utilizar un histograma de frecuencia relativa para describir la ubicación y la forma de un conjunto de datos, y para comprobar si hay valores atípicos. Por ejemplo, los datos de peso al nacer resultaron relativamente simétricos, sin mediciones excepcionales, mientras que los datos sobre las visitas a la cafetería estaban sesgados a la izquierda. Dado que la barra dibujada sobre cada clase representa la frecuencia relativa o proporción de las mediciones en esa clase, estas alturas se pueden utilizar para calcular lo siguiente:

• La proporción de las mediciones que caen en una clase o grupo de clases en particular.

• La probabilidad de que una medida extraída al azar del conjunto caiga en una clase o grupo de clases en particular.

Observe el histograma de frecuencia relativa para los datos de peso al nacer en la figura 1.15. ¿Qué proporción de los recién nacidos tienen un peso al nacer de 7.6 libras o mayor? Esto implica a todas las clases más allá de 7.6 en la tabla 1.11. Puesto que hay 17 recién nacidos en esas clases, la proporción de bebés que tienen un peso al nacer de 7.6 o mayor es de 17/30, o aproximadamente 57%. Este es también el porcentaje del área total bajo el histograma de la figura 1.15 que se encuentra a la derecha de 7.6.

CAPÍTULO  Descripción de datos con gráficos 30 La distribución está sesgada a la izquierda y hay un espacio entre 1 y 3. Figura 1.16 Histograma de frecuencia relativa para el ejemplo 1.11 0.30 0.35 0.25 0.20 0.05 0.10 0.15 0 12345678 Visitas Frecuencia relativa
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Suponga que usted escribió cada uno de los 30 pesos al nacer en un pedazo de papel, puso los pedazos en un sombrero y extrajo uno al azar. ¿Cuál es la probabilidad de que en este pedazo de papel esté escrito un peso al nacer de 7.6 o mayor? Como 17 de los 30 pedazos de papel cumplen con esta característica, hay 17 oportunidades de 30; es decir, la probabilidad es de 17/30. La palabra probabilidad no es desconocida para usted; se discutirá con más detalle en el capítulo 4.

Aunque solo estamos describiendo el conjunto de n = 30 pesos al nacer, también puede interesarnos la población de la que se extrajo la muestra, que es el conjunto de pesos al nacer de todos los bebés nacidos en este hospital. O, si nos interesan los pesos de los recién nacidos en general, podemos considerar nuestra muestra como representativa de la población de pesos al nacer de los recién nacidos en hospitales similares. Un histograma de la muestra o muestral proporciona información valiosa sobre el histograma de la población o poblacional, la gráfica que describe la distribución de toda la población. No obstante, recuerde que diferentes muestras de la misma población producirán histogramas diferentes, incluso si usa los mismos límites de clase. Sin embargo, puede esperar que los histogramas de la muestra y de la población sean similares. A medida que agrega más y más datos a la muestra, los dos histogramas se parecen cada vez más. Si amplía la muestra para incluir a toda la población, ¡los dos histogramas serán idénticos!

1.4 E JERCICIOS

Técnicas básicas

Elaborar histogramas de frecuencia relativa Elabore un histograma de frecuencia relativa con la información de las tablas estadísticas de los ejercicios 1 y 2. ¿Cómo describiría la forma de la distribución?

1.

Límites de clase Frecuencia relativa

100a ,120.08

120a ,140.22

140a ,160.49

160a ,180.17

180a ,200.04

2.

Número de animales de compañía Frecuencia

3. 33 o mayor

5. Menor que 31

4. 32 a <33.5

6. Mayor o igual que 33.5

7. Por lo menos 34 8. Por lo menos 31.5 pero menor que 33.5

Límites de clase En los ejercicios 9 a 12, use la información proporcionada para encontrar un ancho de clase conveniente. A continuación haga una lista de los límites o fronteras de clase que se pueden usar para crear un histograma de frecuencia relativa.

Interpretación de histogramas de frecuencia relativa Use el histograma de frecuencia relativa a continuación para calcular la proporción de mediciones que caen dentro de los intervalos dados en los ejercicios 3 a 8. Recuerde que las clases incluyen el punto límite izquierdo, pero no el derecho.

9. 7 clases para n 5 50 mediciones; valor mínimo = 10; valor máximo = 110

10. 6 clases para n 5 20 mediciones; valor mínimo = 25.5; valor máximo = 76.8

11. 10 clases para n 5 120 mediciones; valor mínimo = 0.31; valor máximo = 1.73

. Histogramas de frecuencia relativa 31
013
21
119
2 34 41 50 61
0.4 0.3 0.2 0.1 0 30.531.031.532.032.533.033.534.0 34.5 x Frecuencia relativa MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

12. 8 clases para n 5 75 mediciones; valor mínimo = 0; valor máximo = 192

21. Describa la forma y la ubicación de las puntuaciones.

22. ¿La forma de la distribución es excepcional? ¿Se le ocurre alguna razón por la que los datos tengan esa forma?

DS0115

Histograma de frecuencia relativa I Elabore un histograma de frecuencia relativa para las siguientes 50 mediciones, defina clases que comiencen en 1.6 con un ancho de clase de .5. Posteriormente, responda las preguntas de los ejercicios 13 a 16.

3.14.92.83.62.54.53.53.74.14.9

2.92.13.54.03.72.74.04.43.74.2

3.86.22.52.92.85.11.85.62.23.4

2.53.65.14.81.63.66.14.73.93.9

4.35.73.74.64.05.64.94.23.13.9

13. ¿Cómo describiría la forma de la distribución?

14. ¿Qué fracción de las mediciones es menor que 5.1?

15. ¿Cuál es la probabilidad de que una medición tomada al azar de este conjunto sea mayor o igual que 3.6?

16. ¿Qué fracción de las mediciones va desde 2.6 hasta 4.6, pero sin incluir 4.6?

Histograma de frecuencia relativa II Elabore un histograma de frecuencia relativa para las siguientes 20 mediciones en una variable discreta que solo pueda tomar los valores 0, 1 y 2. Posteriormente, responda las preguntas de los ejercicios 17 a 20. 12102

23. Compare la forma del histograma con el diagrama de tallo y hoja del ejercicio 16, sección 1.3. ¿Las formas son aproximadamente las mismas?

Aplicación de los conceptos básicos

17. ¿Qué proporción de las mediciones es mayor que 1?

18. ¿Qué proporción de las mediciones es menor que 2?

19. Si se selecciona al azar una medición de las 20 mostradas, ¿cuál es la probabilidad de que sea un 2?

20. Describa la forma de la distribución. ¿Observa algún valor atípico?

DATA SET

DS0116

Puntuaciones en pruebas Se registraron las puntuaciones de 20 estudiantes en una prueba de 100 puntos. Elabore un histograma de frecuencia relativa para los datos, utilice seis clases de ancho 8 que inicien en el valor 52. Posteriormente, responda las preguntas de los ejercicios 21 a 23.

61939186556386827657

94896762728768657584

DATA SET

DS0117

24. Tiempos de supervivencia En un estudio, Altman y Bland informaron sobre los tiempos de supervivencia de pacientes con hepatitis activa; la mitad fueron tratados con prednisona y la otra mitad no recibió tratamiento.13 Los datos a continuación son una adaptación de los datos de los investigadores y corresponden a los pacientes que fueron tratados con prednisona. Los tiempos de supervivencia se registran en el mes más cercano:

887127147

1193133148

5297139157

57109142162

65120144165

a. Observe los datos. ¿Puede suponer cuál sería la forma aproximada de su distribución?

b. Elabore un histograma de frecuencia relativa para los datos. ¿Cuál es la forma de la distribución?

c. ¿Hay valores atípicos en el conjunto? Si es así, ¿qué tiempos de supervivencia son excepcionalmente cortos?

25. Una enfermedad recurrente Se registró el tiempo (en meses) entre el inicio de una enfermedad particular y su recurrencia para n = 50 pacientes:

a. Construya un histograma de frecuencia relativa para los datos.

b. ¿Describiría la forma como aproximadamente simétrica, sesgada a la derecha o sesgada a la izquierda?

c. Encuentre la fracción de tiempos de recurrencia que son menores o iguales a 10 meses.

CAPÍTULO  Descripción de datos con gráficos 32
DATA SET
21100 22110 01211
DATA SET DS0118
2.14.42.732.39.99.02.06.63.91.6 14.79.616.77.48.219.26.94.33.31.2 4.118.4.26.113.57.4.28.3.31.3 14.11.02.42.418.08.724.01.48.25.8 1.63.511.418.026.73.712.623.15.6.4
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

26. Preescolar Las edades (en meses) en las que 50 niños fueron inscritos por primera vez en preescolar se enlistan a continuación.

38403035394048363136

47353443413641434840

32344130463540304637

55393332324542413650

42503739334538463631

a. Elabore un histograma de frecuencia relativa para estos datos. Establezca el límite inferior de la primera clase en 30 y utilice un ancho de clase de cinco meses.

b. ¿Qué proporción de niños tenía una edad igual o mayor que 35 meses pero menor que 45 meses al momento de ser inscritos por primera vez en preescolar?

c. Si un niño fuera seleccionado al azar de este grupo, ¿cuál es la probabilidad de que tuviera menos de 50 meses al momento de ser inscrito por primera vez en preescolar?

a. Elabore un histograma de frecuencia relativa para describir los promedios de bateo de estos 20 campeones.

DATA SET

DS0120

27. ¿Qué tan larga es la fila? Para decidir el número de mostradores de servicio necesarios para las tiendas que se construirán en el futuro, una cadena de supermercados recopiló información sobre el tiempo (en minutos) necesario para atender a los clientes; para ello empleó una muestra de 60 tiempos de servicio al cliente, que se muestran a continuación:

b. Si eligiera al azar uno de los 20 nombres, ¿qué posibilidades hay de que elija a un jugador cuyo promedio esté por encima de .400 en su año de campeonato?

a. Elabore un histograma de frecuencia relativa para los tiempos de servicio en las tiendas.

b. Describa la forma de la distribución. ¿Observa algún valor atípico?

c. Si se asumiera que los valores atípicos de este conjunto de datos son observaciones válidas, ¿cómo los explicaría a la gerencia de la cadena de supermercados? DATA SET DS0121

28. Campeones de bateo Los oficiales de las Grandes Ligas de Béisbol han coronado a un campeón de bateo en la Liga Nacional cada año desde 1876. En la tabla14 se presenta una muestra de los promedios de bateo de algunos de estos campeones:

DATA SET DS0122

29. Antigüedad de monedas de un centavo Se recolectaron 50 centavos estadounidenses y se registró su antigüedad mediante el siguiente cálculo: ANTIGÜEDAD = AÑO ACTUAL – AÑO GRABADO EN LA MONEDA.

5191220025017

144302533828

521199050210

011902020162210

a. Antes de elaborar cualquier gráfica, ¿cómo piensa que será la distribución de la antigüedad de las monedas de un centavo? ¿Tendrá forma de montículo, simétrica, sesgada a la derecha o sesgada a la izquierda?

b. Trace un histograma de frecuencia relativa para mostrar la antigüedad de las monedas de un centavo. ¿Cómo describiría la forma de la distribución?

30. Antigüedad de monedas de un centavo, continuación Aquí los datos representan la antigüedad de un conjunto distinto de 50 monedas de un centavo, nuevamente mediante el siguiente cálculo: ANTIGÜEDAD = AÑO ACTUAL – AÑO GRABADO EN LA

. Histogramas de frecuencia relativa 33 DATA SET DS0119
3.61.92.1.3.8.21.01.41.81.6 1.11.8.31.1.51.2.61.1.81.7 1.4.21.33.1.42.31.84.5.9.7 .62.82.51.1.41.2.41.3.81.3 1.11.2.81.0.9.73.11.71.12.2 1.61.95.2.51.8.31.1.6.7.6
19362301176050
DATA SET DS0123
419043038213 2104014025122419 311472445120 1493530817160 0735237281792 Año Nombre Promedio 2000ToddHelton.372 2017CharlieBlackmon.331 1917EddRoush.341 1934PaulWaner.362 1911HonusWagner.334 1898WillieKeeler.379 1924RogerHornsby.424 1963TommyDavis.326 1992GarySheffield.330 1954WillieMays.345 1975BillMadlock.354 1958RichieAshburn.350 1942ErnieLombardi.330 1948StanMusial.376 1971JoeTorre.363 1996TonyGwynn.353 1961RobertoClemente.351 1968PeteRose.335 1885RogerConnor.371 2009HanleyRamirez.342 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
MONEDA.

a. Trace un histograma de frecuencia relativa para mostrar las antigüedades de las monedas de un centavo. ¿La forma es similar a la forma del histograma de frecuencia relativa del ejercicio 29?

b. ¿Hay alguna medida excepcionalmente grande o pequeña en el conjunto?

31. Ciudades con viento ¿Hay ciudades con más viento que otras? ¿La ciudad de Chicago merece ser apodada como “la ciudad del viento”? Estos datos se refieren a la velocidad media del viento (en kilómetros por hora) para 54 ciudades seleccionadas de Estados Unidos:5

13.112.215.411.011.212.018.112.012.5

11.218.416.816.511.856.216.014.912.6

13.316.515.811.812.511.414.912.316.3

11.713.315.715.213.412.89.814.614.4

9.912.615.29.816.310.612.613.418.4

15.015.87.010.615.515.712.817.013.6

Fuente: The World Almanac and Book of Facts 2017, p. 343

a. Elabore un histograma de frecuencia relativa para los datos. (Sugerencia: Elija los límites de la clase sin incluir el valor x = 56.2 en el rango de valores).

b. El valor x = 56.2 se registró en la ciudad de Mt. Washington, Nuevo Hampshire. ¿La geografía de esa ciudad explica la observación?

c. La velocidad media del viento en Chicago se registra en 15.8 kilómetros por hora. ¿Cree que ahí hace mucho viento?

32. Estaturas de estudiantes Las estaturas declaradas por 105 estudiantes de una clase de bioestadística se describen en el histograma de frecuencia relativa que se muestra a continuación.

a. Describa la forma de la distribución.

b. ¿Observa alguna característica excepcional en este histograma?

c. ¿Se le ocurre alguna explicación para los dos picos o máximos locales del histograma? ¿Hay algo que ocasione que las estaturas se aglutinen en dos picos o máximos locales separados? ¿Qué es?

33. Starbucks® ¡Los estudiantes de la Universidad de California, Riverside (UCR), al igual que muchos otros californianos, adoran su Starbucks®! Aquí se muestran las distancias en kilómetros desde el campus a las 39 cafeterías Starbucks® que se localizan en un radio de 16 kilómetros de la UCR:15

a. Construya un histograma de frecuencia relativa para describir las distancias desde el campus de la UCR; utilice ocho intervalos de clase de ancho 2, inicie en 0.0.

b. ¿Cuál es la forma del histograma? ¿Observa alguna característica excepcional?

c. ¿Puede explicar por qué el histograma tiene ese aspecto?

A medida que continúe trabajando en los ejercicios de este capítulo, aprenderá a reconocer mejor los diferentes tipos de datos y a elegir cuál es la mejor gráfica para utilizar. Recuerde que el tipo de gráfica que emplee no es tan importante como la interpretación que acompaña a la imagen. Busque estas características importantes:

• Ubicación del centro de los datos.

• Forma de la distribución de los datos.

• Observaciones excepcionales en el conjunto de datos.

Con estas características como guía puede interpretar y comparar conjuntos de datos mediante gráficas, que son solo las primeras de muchas herramientas estadísticas con las que pronto tendrá que trabajar.

CAPÍTULO  Descripción de datos con gráficos 34
DATA SET DS0125
0.61.01.61.84.55.85.96.16.46.4 7.07.28.58.58.89.39.49.810.210.6 11.212.012.212.212.513.013.313.813.914.1 14.114.214.214.614.715.015.415.515.7
DATA SET DS0126 10/105 5/105 0 152.5160.0167.5175.0182.5190.0 Estaturas Frecuencia relativa
DATA SET DS0124 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Conceptos clave

I. Cómo se generan los datos

1. Unidades experimentales, variables y mediciones

2. Muestras y poblaciones

3. Datos univariados, bivariados y multivariados

II. Tipos de variables

1. Cualitativa o categórica

2. Cuantitativa

a. Discreta

b. Continua

III. Gráficos para distribuciones de datos univariados

1. Datos cualitativos o categóricos

a. Gráficas circulares

b. Gráficas de barras

Introducción a Microsoft Excel

2. Datos cuantitativos

a. Gráficas circulares y de barras

b. Gráficas de líneas

c. Gráficas de puntos

d. Diagramas de tallo y hoja

e. Histogramas de frecuencia relativa

3. Descripción de las distribuciones de datos

a. Formas: simétricas, sesgadas a la izquierda, sesgadas a la derecha, unimodales y bimodales

b. Proporción de mediciones en determinados intervalos

c. Valores atípicos

MS Excel está diseñado para una variedad de aplicaciones, incluidas las estadísticas. Asumiremos que está familiarizado con el sistema operativo Windows y que conoce las técnicas básicas necesarias para ejecutar comandos desde las pestañas, los grupos y los menús desplegables en la parte superior de la pantalla. Si no es así, quizás un asistente de laboratorio o un profesor pueda ayudarle a dominar los conceptos básicos. La versión de MS Excel que se muestra en esta sección a lo largo de la obra es Excel 2016, que se utiliza en el ambiente Windows 10. Cuando se abre el programa aparece una hoja de cálculo (véase la figura 1.17) que contiene filas y columnas en las que puede introducir datos. Las pestañas de la parte inferior de la pantalla identifican las hojas de cálculo disponibles para su uso; cuando se guardan varias hojas de cálculo como una colección, estas se denominan libro de trabajo.

Tecnología actual 35
TECNOLOGÍA ACTUAL
REVISIÓN DEL CAPÍTULO
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Figura 1.17

Graficar con Excel

En MS Excel es posible crear gráficas circulares, gráficas de barras y gráficas de líneas. Los datos se introducen en la hoja de cálculo, incluidas las etiquetas, si es necesario. Resalte los datos que se van a representar en la gráfica y, a continuación, haga clic en el tipo de gráfica que desee en la pestaña Insert del grupo Charts. Una vez creada la gráfica se puede editar de varias formas para cambiar su aspecto.

EJEMPLO . (Gráficas circulares y de barras) Se registró la variable cualitativa “nivel cursado en la universidad” para cada uno de los 105 estudiantes en una clase de Introducción a la Estadística; las frecuencias se registran en la tabla 1.14.

■ Tabla 1.14. Nivel que cursan estudiantes universitarios que actualmente estudian la materia de Estadística

Nivel Primer añoSegundo añoTercer año Último añoGraduado Frecuencia523323510

1. Introduzca las categorías en la columna A y las frecuencias en la columna B de la primera hoja de cálculo. Debe tener dos columnas con datos, incluidas las etiquetas.

2. Resalte los datos; para ello haga clic en el botón izquierdo del mouse y arrastre desde la celda A1 hasta la celda B6 (este rango puede expresarse como A1:B6). A continuación dé clic en la pestaña Insert y haga clic en el icono Pie en el grupo Charts. En la lista desplegable verá una variedad de estilos para elegir. Seleccione la primera opción de la sección Gráfico 2D para producir la gráfica circular. Haga doble clic en el título “Frequency” y cambie el título a “Nivel del estudiante”.

3. Edición de la gráfica circular: una vez que haya creado la gráfica, utilice el mouse para asegurarse de que esté seleccionada; aparecerá un cuadro con controladores de tamaño alrededor de ella. Debería ver una pestaña con la etiqueta “Chart Tools” en color verde. Haga clic en la pestaña Design y consulte las listas desplegables de los grupos Chart Layout y Chart Styles. Estas listas le permiten modificar la apariencia de la gráfica. En la figura 1.18(a), la gráfica circular se modificó utilizando el diseño 6 en Quick Layout (en el grupo Chart Layout) para que los porcentajes se muestren en los sectores apropiados y la leyenda aparezca a la derecha. Para que la leyenda se muestre más cerca de la gráfica circular la hemos arrastrado con un clic.

4. Haga clic en varias partes de la gráfica circular (leyenda, área de la gráfica, sector) y aparecerá un cuadro con controladores de tamaño alrededor. Haga doble clic y aparecerá un menú de formato en la parte derecha de la pantalla. Puede ajustar la apariencia del objeto o la región seleccionada en este menú. Cuando haya terminado, para cerrar el menú de formato, haga clic en la “X” que se encuentra en la esquina superior derecha.

CAPÍTULO  Descripción de datos con gráficos 36
Nivel del estudiante Primeraño Segundoaño Terceraño Últimoaño Graduado 5% Nivel del estudiante Frecuencia Primeraño 40 35 30 25 20 15 10 5 0 SegundoGraduado añoTercerañoÚltimoaño
Figura 1.18
(a) (b) MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

5. Aún en la pestaña Design, pero en el grupo Type, haga clic en Change Chart Type y elija el tipo de Column más simple. Haga clic en OK para crear una gráfica de barras para el mismo conjunto de datos.

6. Edición de la gráfica de barras: de nuevo, puede experimentar con las distintas opciones de los grupos Chart Layouts y Chart Styles para cambiar el aspecto de la gráfica. Puede hacer clic en toda la gráfica de barras (“chart area”) o en el interior (“Plot area”) para estirar la gráfica. Puede cambiar los colores al hacer doble clic en la región correspondiente. Se ha elegido el diseño 9 en Quick Layout (en el grupo Charts Layout) que incorpora los títulos de los ejes (se han editado) y se eliminó la leyenda “frequency”. También se han reducido los espacios entre las barras; para ello, haga clic con el botón derecho en una de las barras, enseguida seleccione la opción Format Data Series en el menú contextual y cambie Gap Width a 50%. La gráfica de barras editada se muestra en la figura 1.18(b).

EJEMPLO . (Gráficas de líneas) Se dio seguimiento al promedio industrial Dow Jones (PIDJ) al cierre de la negociación durante 10 días en un año reciente; los resultados se muestran en la tabla 1.15.

■ Tabla 1.15 Promedio Industrial Dow Jones

1. Haga clic en la pestaña de la parte inferior de la pantalla marcada con “+” para abrir una nueva hoja de cálculo. Introduzca el Día en la columna A y el PIDJ en la columna B. Debe tener dos columnas con datos, incluidas las etiquetas.

2. Resalte los datos del PIDJ en la columna B; para ello haga clic en el botón izquierdo del mouse y arrastre desde la celda B1 hasta la celda B11 (este rango puede expresarse como B1:B11). Haga clic en la pestaña Insert y dé clic en el icono Line del grupo Charts Seleccione la primera opción de la sección 2D Line para producir la gráfica de líneas.

3. Edición de la gráfica de líneas: de nuevo, puede experimentar con las distintas opciones de los grupos Charts Layout y Charts Styles para cambiar el aspecto de la gráfica. Se ha elegido un diseño (Layout 10 desde el grupo Quick Layout) que incorpora los títulos de ambos ejes y los hemos cambiado a “Día” y “PIDJ”. Además, se ha eliminado el título y la leyenda del lado derecho. La gráfica de líneas se muestra en la figura 1.19.

4. Nota: Si la serie de tiempo involucra periodos que no están igualmente espaciados, es mejor usar un gráfico de dispersión con puntos conectados para formar una gráfica de líneas. Este procedimiento se describe en la sección Tecnología actual del capítulo 3.

Tecnología actual 37
PIDJ Día 21700 21600 21500 21400 21300 21200 21100 12345678910
Figura 1.19
Día12345678910 PIDJ21,47921,47821,32021,41421,40921,53221,55321,63821,63021,575
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

EJEMPLO . (Histogramas de frecuencia) Las 50 principales acciones extrabursátiles (OTC, over-thecounter) de un año reciente se encontraron utilizando una ponderación igual del rendimiento total a 1 año y el crecimiento promedio del volumen diario en dólares. Estas 50 ponderaciones o promedios se muestran a continuación:16

■ Tabla 1.16 Clasificación de las 50 principales acciones OTC

1. Muchos de los procedimientos estadísticos que se usan en este libro de texto requieren la instalación del complemento Analysis ToolPak. Para cargar este complemento, haga clic en File ➤ Options ➤ Add-ins. En la parte inferior del cuadro de diálogo, dé clic en el botón Go ubicado justo a la derecha de la lista desplegable Manage Excel Add-ins Seleccione las casillas Analysis ToolPak, Analysis ToolPak VBA y, a continuación, haga clic en OK

2. Haga clic en la pestaña marcada con “+” en la parte inferior de la pantalla para añadir una nueva hoja de cálculo. Introduzca los datos en la primera columna e incluya la etiqueta “Promedio” en la primera celda.

3. Excel se refiere al valor máximo de cada intervalo de clase como límite de clase. Esto significa que Excel utiliza un método de inclusión derecha, que es ligeramente diferente del método presentado en la sección 1.4. Para este ejemplo, se ha elegido usar los intervalos de clase 0-150, >150-300, >300-450, etc. Introduzca los valores de límite de clase (150, 300, 450, ..., 1500) en la segunda columna de la hoja de cálculo, incluya la etiqueta “Límites de clase” en la celda B1

4. Seleccione Data ➤ Data Analysis➤ Histogram y haga clic en OK. Aparecerá el cuadro de diálogo Histogram, como se muestra en la figura 1.20.

5. Resalte o escriba los rangos de entrada y de límites de clase apropiados para los datos. Note que puede dar clic en el botón Minimizar a la derecha del cuadro antes de dar clic y arrastrar para resaltarlo. De nuevo haga clic en el botón minimizar para ver todo el cuadro de diálogo. El rango de entrada aparecerá como $A$1:$A$51, con el signo de dólar que indica un rango de celdas absoluto. Asegúrese de hacer clic en las casillas de verificación “Labels” y “Chart Output”. Elija una celda conveniente para la ubicación de la salida (aquí se ha elegido E1) y a continuación dé clic en OK. La tabla de frecuencias y el histograma aparecerán en la hoja de cálculo. El histograma (figura 1.21(a)) no aparece exactamente como se esperaba.

6. Edición del histograma: dé clic en la leyenda frecuencia y en el título del histograma y oprima la tecla Eliminar. A continuación, seleccione la Serie de datos dando doble clic en una barra. En el menú de Formato que aparece, cambie Gap Width a 0% (sin espacio) y haga clic en la “X” en la esquina superior derecha para cerrar el menú. Agrande el gráfico arrastrando la esquina inferior derecha y edite los colores, el título y las etiquetas, si es necesario, para completar el histograma, como se muestra en la figura 1.21(b). Recuerde que los números que se muestran a lo largo del eje horizontal son los límites de clase, es decir los límites superiores de los intervalos de clase, no los puntos medios de los intervalos.

CAPÍTULO  Descripción de datos con gráficos 38
1395.27 1196.82 1147.05 1138.47 832.23 807.73 780.16 729.44 642.91 598.51 515.74 392.52 374.27 350.20 350.13 305.59 297.60 268.97 258.30 246.19 245.39 231.13 195.94 194.91 189.79 176.81 166.09 165.73 152.97 147.95 143.70 142.82 135.82 135.47 124.06 113.52 112.60 105.74 105.10 103.15 95.75 88.73 88.38 85.02 83.48 83.44 80.85 78.67 78.20 76.48
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Figura 1.20

FrecuenciaFrecuencia

TECNOLOGÍA ACTUAL

Introducción a MINITABTM

El software MINITAB es un programa de computadora basado en Windows diseñado específicamente para aplicaciones estadísticas. Asumiremos que está familiarizado con el ambiente Windows y que conoce las técnicas básicas necesarias para ejecutar comandos desde las pestañas y los menús desplegables en la parte superior de la pantalla. Si no es así, quizás un asistente de laboratorio o profesor pueda ayudarle a dominar los conceptos básicos. La versión actual de MINITAB que se muestra en esta sección a lo largo de la obra es MINITAB 18, que se utiliza en el ambiente Windows 10. Cuando se abre el programa se muestra la pantalla principal (véase la figura 1.22) que contiene dos ventanas: la ventana Datos, similar a una hoja de cálculo de Excel, y la ventana Sesión, en la que aparecerán los resultados. Al igual que con MS Excel, MINITAB permite guardar hojas de cálculo (similares a las hojas de cálculo de Excel), proyectos (colecciones de hojas de cálculo) o gráficos.

Tecnología actual 39
Límitesdeclase Más Histograma
7. Puede guardar el libro de Excel para utilizarlo más adelante mediante los comandos File ➤ Save o File ➤ Save As y llámelo “Capítulo 1”.
Frecuencia Promedio Más
Figura 1.21
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Figura 1.22

Representación gráfica con MINITAB

Todos los métodos gráficos que hemos revisado en este capítulo se pueden crear en MINITAB Los datos se ingresan en una hoja de cálculo de MINITAB, con etiquetas en las celdas grises justo debajo del nombre de la columna (C1, C2, etc.) en la ventana Datos. EJEMPLO

(Gráficas circulares y de barras) Se ha registrado la variable cualitativa “nivel cursado en la universidad” para cada uno de los 105 estudiantes en una clase de Introducción a la Estadística y las frecuencias se muestran en la tabla 1.17.

■ Tabla 1.17 Nivel que cursan estudiantes universitarios que actualmente estudian la materia de Estadística

NivelPrimerañoSegundoañoTercerañoÚltimoañoGraduado Frecuencia523323510

1. Introduzca las categorías en la columna C1, con su propio nombre descriptivo, quizás “Nivel (Status)” en la celda gris. Observe que el nombre C1 ha cambiado a C1-T porque está introduciendo texto en lugar de números. Introduzca las cinco frecuencias numéricas en C2 y asígnele el nombre “Frecuencia (Frequency)”.

2. Para crear una gráfica circular para estos datos, dé clic en Graph Pie Chart y aparecerá un cuadro de diálogo (véase la figura 1.23). Dé clic en el botón de opción marcado Chart values from a table. A continuación, coloque el cursor en el cuadro marcado como “Categorical variable”. O bien (1) resalte C1 en la lista de la izquierda y elija Select, (2) haga doble clic en C1 en la lista de la izquierda o (3) escriba C1 en el cuadro “Categorical variable”. Del mismo modo, coloque el cursor en el cuadro marcado “Summary variables” y seleccione C2. Haga clic en Labels y seleccione la pestaña marcada Slice Labels. Verifique las casillas marcadas como “Category names” y “Percent”. Al hacer dos veces clic en OK, MINITAB creará la gráfica circular de la figura 1.24(a). La leyenda se eliminó al seleccionarla y borrarla.

3. A medida que vaya mejorando en el uso del comando de gráfico circular, podrá aprovechar algunas de las opciones disponibles. Una vez que haya creado la gráfica, dé clic con el botón derecho en la gráfica circular y seleccione Edit pie. Puede cambiar los colores y el formato de la gráfica, “separar” sectores importantes del círculo y cambiar el orden de las categorías. Si hace clic con el botón derecho en la gráfica circular y selecciona Update Graph Automatically, la gráfica circular se actualizará en forma automática cuando cambie los datos en las columnas C1 y C2 de la hoja de cálculo de MINITAB.

4. Para construir una gráfica de barras, utilice el comando Graph Bar Chart. En el cuadro de diálogo que aparece, seleccione Simple. Elija una opción en la lista desplegable “Bars represent”, según la forma en que se hayan introducido los datos en la hoja de cálculo. Para los datos de la tabla 1.17, se elige “Values from a table” y se da clic en OK Cuando aparezca el cuadro de diálogo, coloque el cursor en el cuadro “Graph variables”

CAPÍTULO  Descripción de datos con gráficos 40
.
Figura 1.23
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

y seleccione C2, en el cuadro “Categorical variable” seleccione C1. Haga clic en OK para terminar la gráfica de barras, que se muestra en la figura 1.24(b). Una vez creada la gráfica, haga clic con el botón derecho en varias partes de la gráfica de barras y elija Edit para cambiar su aspecto.

EJEMPLO . (Gráficas de líneas) Se dio seguimiento al promedio industrial Dow Jones al cierre de la negociación durante 10 días en un año reciente con los resultados que se muestran en la tabla 1.18.

■ Tabla 1.18

Promedio Industrial Dow Jones

1. Aunque podríamos simplemente introducir estos datos en la tercera y cuarta columnas de la hoja de cálculo actual, vamos a crear una nueva con los comandos File ➤ New ➤ Worksheet. Introduzca los Días en la columna C1 y el PIDJ en la columna C2.

2. Para crear la gráfica de líneas, utilice Graph ➤ Time Series Plot ➤ Simple. En el cuadro de diálogo que aparece, coloque el cursor en el cuadro “Series” y seleccione “PIDJ” en la lista de la izquierda. En Time/Scale, elija “Stamp” y seleccione la columna C1 (“Día”) en el cuadro denominado “Stamp Columns”. Haga clic dos veces en OK para obtener la gráfica de líneas que se muestra en la figura 1.25.

Tecnología actual 41
Gráficacirculardelnivel GraduadoPrimeraño Segundoaño Terceraño Últimoaño (a) PrimerañoSegundoañoTercerañoÚltimoañoGraduado Nivel Frecuencia (b)
Figura 1.24
Día12345678910 PIDJ21,47921,47821,32021,41421,40921,53221,55321,63821,63021,575
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

EJEMPLO . (Gráficas de puntos, diagramas de tallo y hoja, histogramas) Las 50 principales acciones extrabursátiles (OTC) de un año reciente se encontraron mediante una ponderación igual del rendimiento total de 1 año y el crecimiento promedio del volumen diario en dólares. Estas 50 ponderaciones o promedios se enlistan en la tabla 1.19.16 Cree una nueva hoja de cálculo (File ➤ New ➤ Worksheet). Introduzca los datos en la columna C1 y asígnele el nombre “Promedio” en la celda gris justo debajo de C1.

■ Tabla 1.19 Clasificación de las 50 principales acciones OTC

1. Para crear una gráfica de puntos, utilice Graph ➤ Dotplot. En el cuadro de diálogo que aparece, elija One Y Simple y haga clic en OK. Para crear un diagrama de tallo y hoja, utilice Graph ➤ Stem-and-Leaf. Para cualquiera de las gráficas, coloque el cursor en el cuadro “Graph variables” y seleccione “Promedio” en la lista de la izquierda (véase la figura 1.26).

2. Puede elegir entre una variedad de opciones de formato antes de hacer clic en OK. La gráfica de puntos aparece como un gráfico, mientras que el diagrama de tallo y hoja aparece en la ventana Session. Para imprimir ya sea una ventana de Graph o la ventana de Session, haga clic en la ventana para activarla y utilice File ➤ Print Graph (o Print Session Window).

CAPÍTULO  Descripción de datos con gráficos 42
Figura 1.25
Día
PIDJ
GráficadeseriedetiempodePIDJ
Figura 1.26
1395.27807.73515.74305.59245.39176.81143.70113.5295.7583.44 1196.82780.16392.52297.60231.13166.09142.82112.6088.7380.85 1147.05729.44374.27268.97195.94165.73135.82105.7488.3878.67 1138.47642.91350.20258.30194.91152.97135.47105.1085.0278.20 832.23598.51350.13246.19189.79147.95124.06103.1583.4876.48
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

3. Para crear un histograma, utilice Graph Histogram. En el cuadro de diálogo que aparece, elija Simple y haga clic en OK, seleccionando “Promedio” en el cuadro “Graph variables”. Seleccione Scale Y-Scale Type y haga clic en el botón de opción marcado como “Frequency”. (Puede editar el histograma más adelante para mostrar las frecuencias relativas). Haga clic dos veces en OK. Una vez creado el histograma, haga clic con el botón derecho en el eje y y elija Edit Y-Scale. En la pestaña marcada “Scale”, puede hacer clic en el botón de opción marcado como “Position of ticks” y escribir 0 5 10 15 20. A continuación, haga clic en la pestaña “Labels”, marque el botón de opción “Specified” y escriba 0 5/50 10/50 15/50 20/50. Haga clic en OK. Esto reducirá el número de marcas en el eje y y las cambiará a frecuencias relativas. Por último, haga doble clic en la palabra “Frequency” a lo largo del eje y. Cambie la casilla marcada como “Text” para que diga “Frecuencia relativa” y haga clic en OK

4. Para ajustar los límites o fronteras de clase del histograma, haga clic con el botón derecho en las barras del histograma y elija Edit Bars. Use la pestaña marcada como “Binning” para elegir “Cutpoints” o “Midpoints” para el histograma; puede especificar las posiciones del punto de corte o el punto medio si lo desea. En este mismo cuadro Edit, puede cambiar los colores, el tipo de relleno y el estilo de fuente del histograma. Si da clic con el botón derecho en las barras y selecciona Update Graph Automatically, el histograma se actualizará en forma automática cuando cambie los datos de la columna “Promedio”.

A medida que se familiarice con MINITAB, podrá explorar las distintas opciones disponibles para cada tipo de gráfica. Es posible trazar más de una variable a la vez, cambiar los ejes, elegir los colores y modificar las gráficas de muchas maneras. Sin embargo, incluso con los comandos básicos por defecto, está claro que la distribución de las acciones OTC en la figura 1.27 está muy sesgada a la derecha.

TECNOLOGÍA ACTUAL

Introducción a las calculadoras TI-83/84 Plus

Muchos estudiantes están familiarizados con las calculadoras TI-83 o TI-84 Plus. Estas dos calculadoras funcionan casi de la misma manera y pueden utilizarse para diversas aplicaciones, incluida una gran cantidad de aplicaciones estadísticas. Cuando la calculadora esté encendida, verá una pantalla con un cursor parpadeante, donde puede realizar muchos cálculos numéricos. Sin embargo, para usar muchas de las funciones estadísticas, primero deben introducirse los datos en las listas del Editor de listas de estadísticas. Una vez que se han registrado los datos, se dará cuenta de que hay muchas gráficas diferentes disponibles.

Tecnología actual 43
Frecuencia relativa 20/50 15/50 10/50 5/50 0 030060090012001500 Histogramadepromedio Promedio HistogramofAverage
Figura 1.27
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Crear gráficas con la calculadora TI-83/84 Plus

Primero, borre cualquier gráfico, función o dibujo no deseado de la calculadora. Oprima 2nd ➤ stat plot. Use las flechas de dirección (o presione 4) para seleccionar 4:PlotSoff y oprima enter dos veces. La calculadora responderá con Done. Puede activar un gráfico en el menú stat plot cuando lo necesite. Borre las funciones no deseadas presionando y = y el botón clear. Por último, oprima 2nd ➤ draw ➤ 1:ClrDraw para borrar los dibujos no deseados.

EJEMPLO . (Gráficas de barras) Se ha registrado la variable cualitativa “nivel cursado en la universidad” para cada uno de los 105 estudiantes en una clase de Introducción a la Estadística, y las frecuencias se muestran en la tabla 1.20.

■ Tabla 1.20 Nivel que cursan estudiantes universitarios que actualmente estudian la materia de Estadística

Nivel PrimerañoSegundoañoTercerañoÚltimoañoGraduado

Frecuencia 523323510

1. Introduzca los datos en el editor de la lista de estadísticas presionando stat. El cursor (resaltado en negro) debe estar en el comando EDIT y 1:Edit... y, al oprimir enter, aparecerá el editor de la lista de estadísticas (figura 1.28).

La variable cualitativa “año en la universidad” se codifica numéricamente como Primero = 1, Segundo = 2, ..., Graduado = 5, y luego se introduce en las primeras cinco filas de la lista L1 con las flechas de dirección para navegar por la tabla. Las cinco frecuencias se incluyen en la lista L2.

2. Para crear la gráfica de barras, presione 2nd ➤ stat plot. El cursor estará en 1:Plot 1, presione enter. Hay cuatro opciones que se pueden elegir en la siguiente pantalla (figura 1.29), presione enter después de cada elección y utilice las flechas de dirección para navegar por la pantalla.

CAPÍTULO  Descripción de datos con gráficos 44
Figura 1.28 Figura 1.29
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

Elija activar el gráfico (On) y después Histogram (la tercera opción). La opción Xlist especifica los datos del eje horizontal (x), en este caso L1. La opción Ylist muestra los datos del eje vertical (y), en este caso L2. Como el valor predeterminado para Ylist es 1, tendrá que cambiarlo con 2nd ➤ L2. Ahora presione zoom y 9:ZoomStat para ver la gráfica de barras, creada automáticamente por la calculadora, que se muestra en la figura 1.30(a).

3. Observe que no hay etiquetas en ninguno de los ejes. Puede entender mejor la gráfica presionando la tecla trace y moviendo el cursor parpadeante de izquierda a derecha con las flechas direccionales. La barra “Primer año” comienza en 1, termina en <1.5 y su altura es 5. La brecha entre la primera y la segunda barras comienza en 1.5 y termina en 2, donde comienza la barra “Segundo año”. Es decir, la calculadora está creando clases “inclusivas a la izquierda”.

4. Edición de la gráfica de barras: presione window para ver los ajustes exactos de la gráfica (figura 1.30(b)). Es posible cambiar cualquiera de estos ajustes. Los valores mínimo y máximo para los ejes x y y son Xmin, Xmax, Ymin y Ymax. El ancho de cada intervalo a lo largo de los ejes x y y es Xscl y Yscl, respectivamente. Para la figura 1.30(a), el límite inferior de la primera clase es 1 y el límite superior de la última clase es 5.5; cada barra mide 0.5 unidades de ancho y la distancia entre las marcas de graduación del eje es de 59 unidades. Si se cambia la configuración de la ventana como se muestra en la figura 1.31(a) y presiona la tecla graph, la gráfica de barras aparecerá como en la figura 1.31(b). Ahora, las barras están centradas sobre los valores de “nivel en la universidad”, 1, 2, 3, 4 y 5. [Nota: Si presiona zoom ➤ 9:ZoomStat en lugar de graph en este punto, la configuración de la calculadora volverá a la configuración predeterminada y la gráfica de barras aparecerá como en la figura 1.30(a)].

Tecnología actual 45
Figura 1.31 (a) (b) (a) Figura 1.30
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
(b)

EJEMPLO . (Gráficas de líneas) Se dio seguimiento al promedio industrial Dow Jones, al cierre de la negociación durante 10 días en un año reciente, y los resultados se muestran en la tabla 1.21.

■ Tabla 1.21 Promedio Industrial Dow Jones

1. En el editor de listas de estadísticas, borre las listas L1 y L2, para ello coloque el cursor sobre el nombre de la lista y oprima clear y enter. Después ingrese los datos en la tabla 1.21, con los Días en la lista L1 y el PIDJ en la lista L2.

2. Siga un procedimiento similar al que se utilizó para crear la gráfica de barras. Presione 2nd stat plot 1: Plot1. En la pantalla que aparece, asegúrese de que el gráfico esté activado y elija el tipo de gráfico Line Chart (la segunda opción). Luego Xlist = L1 (días) y Ylist = L2 (PIDJ). Presione zoom 9:ZoomStat (o simplemente zoom 9) para obtener la gráfica de líneas que se muestra en la figura 1.32.

3. Del mismo modo que con la gráfica de barras, puede usar la tecla trace para navegar por la pantalla y ver los valores de PIDJ de los 10 días. También puede utilizar la pantalla window para modificar la configuración de los ejes x y y. De nuevo, no hay etiquetas en ninguno de los ejes, pero aún se puede ver la tendencia del PIDJ durante los 10 días.

(Histogramas de frecuencia) Las 50 principales acciones extrabursátiles (OTC) de un año reciente se encontraron utilizando una ponderación igual del rendimiento total de 1 año y el crecimiento promedio del volumen diario en dólares. Estas 50 ponderaciones o promedios se muestran aquí:16

■ Tabla 1.22 Clasificación de las 50 principales acciones OTC

1. De nuevo se utilizará el tipo de gráfico Histogram en el menú de gráficos de estadísticas (stat plot), pero en este caso cada observación ocurre solo una vez, por lo que las frecuencias (Freq) serán 1. Introduzca los datos en la lista L1 en el editor de listas de estadísticas.

2. Para crear el histograma, presione 2nd stat plot 1:Plot1. En la pantalla que aparece, asegúrese de que la gráfica esté activada (On), elija el tipo Histogram (la tercera opción) y Xlist = L1 (promedios). Escriba el número “1” en Ylist y presione zoom 9:ZoomStat (o simplemente zoom 9) para mostrar el histograma.

CAPÍTULO  Descripción de datos con gráficos 46
Día12345678910
PIDJ21479214782132021414214092153221553216382163021575
Figura 1.32
1395.27807.73515.74305.59245.39176.81143.70113.5295.7583.44 1196.82780.16392.52297.60231.13166.09142.82112.6088.7380.85 1147.05729.44374.27268.97195.94165.73135.82105.7488.3878.67 1138.47642.91350.20258.30194.91152.97135.47105.1085.0278.20 832.23598.51350.13246.19189.79147.95124.06103.1583.4876.48
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
EJEMPLO .

3. Edición del histograma: una vez creado el histograma, utilice la ventana (window) para ajustar los límites o fronteras de clase y el ancho de las clases. La pantalla window se muestra en la figura 1.33(a). Hemos optado por usar clases de ancho 150, que comienzan en 0 y terminan justo por encima del valor más grande en 1500. Recuerde que las calculadoras TI utilizan el método de “inclusión a la izquierda” tal como se presenta en la sección 1.4. Una vez que haya cambiado la configuración de la ventana, presione graph para mostrar el histograma de la figura 1.33(b). La distribución de las acciones OTC está muy sesgada a la derecha, con algunas mediciones excepcionalmente grandes.

REVISAR LO QUE HA APRENDIDO

1. ¿Cuantitativa o cualitativa? Identifique cada variable como cuantitativa o cualitativa:

a. Origen étnico de un candidato a un cargo público.

b. Puntuación (0-100) en un examen de colocación.

c. Restaurante de comida rápida preferido por un estudiante (McDonald’s®, Burger King® o Carl’s Jr.®).

d. Concentración de mercurio en una muestra de atún.

2. ¿Simétrica o sesgada? ¿Espera que las distribuciones de las siguientes variables sean simétricas o sesgadas? Explique.

a. Precio de una lata de chícharos de 250 gramos.

b. Estatura en centímetros de las estudiantes de primer año en su universidad.

c. Número de tostadas rotas en un paquete de 100 tostadas.

d. Número de garrapatas encontradas en cada uno de 50 conejos de rabo blanco atrapados.

3. ¿Continua o discreta? Identifique cada variable como continua o discreta:

a. Periodo entre llegadas de pacientes a una clínica médica.

b. Tiempo necesario para terminar un examen.

c. Peso de dos docenas de camarones.

d. La temperatura corporal de una persona.

e. Número de personas que esperan atención en la sala de emergencias de un hospital.

4. Continua o discreta, de nuevo Identifique cada variable como continua o discreta:

a. Número de propiedades en venta por una agencia inmobiliaria.

b. Profundidad de una nevada.

c. Periodo para que un conductor responda cuando está a punto de sufrir un choque.

d. Número de aviones que llegan al aeropuerto de Atlanta en una hora determinada.

DATA SET

DS0127

5. Los principales lagos del mundo Un lago es una masa de agua rodeada de tierra. Por lo tanto, algunos cuerpos de agua llamados “mares”, como el mar Caspio, son en realidad lagos salados. En la siguiente tabla se indica la longitud en kilómetros de los principales lagos naturales del mundo, excepto el mar Caspio, que tiene una longitud de 1,216 kilómetros.5

Revisar lo que ha aprendido 47
(a) (b)
Figura 1.33
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

NombreLongitud (km)NombreLongitud (km)

Superior560Titicaca195

Victoria334Nicaragua163

Huron330Athabasca333

Michigan491Reindeer229

MardeAral416TonleSap112

Tanganyika672Turkana246

Baykal632IssykKul184

GreatBear307Torrens208

Nyasa576Vänern146

GreatSlave477Nettilling107

Erie386Winnipegosis226

Winnipeg426Albert160

Ontario309Nipigon115

Balkhash602Gairdner144

Ladoga198Urmia144

Maracaibo213Manitoba224

Onega232Chad280

Eyre144

Fuente:The World Almanac and Book of Facts 2017

a. Use un diagrama de tallo y hoja para describir la longitud de los principales lagos del mundo.

b. Utilice un histograma para mostrar estos datos. ¿Cómo se compara con el diagrama de tallo y hoja del inciso a?

c. ¿Estos datos son simétricos o se encuentran sesgados? Si la distribución está sesgada, ¿cuál es la dirección de la inclinación?

6. Limpieza de derrames de petróleo El 20 de abril de 2010 hubo en Estados Unidos un gran desastre ambiental cuando la plataforma de perforación

Deepwater Horizon explotó en el Golfo de México. El personal ocupado y el equipo que se utilizó en la limpieza del derrame de petróleo en el Golfo, desde el 2 de mayo de 2010 (día 13) hasta el 9 de junio de 2010 (día 51) se indica en la siguiente tabla.17

d. Utilice una gráfica de barras para mostrar el porcentaje de áreas de pesca federales del Golfo cerradas.

e. Use una gráfica de líneas para mostrar las cantidades de dispersantes utilizadas. ¿Hay alguna relación de línea recta subyacente a lo largo del tiempo?

7. Resultados electorales Las elecciones de 2016 en Estados Unidos fueron una contienda en la que Donald Trump derrotó a Hillary Clinton y otros candidatos al ganar 304 votos electorales, o 57% de los 538 disponibles. Sin embargo, Trump solo ganó 46.1% del voto popular, mientras que Clinton obtuvo 48.2%. El voto popular (en miles) para Donald Trump en cada uno de los 50 estados se enlista a continuación:18

AL1319HI129MA1091NM320SD228

AK163ID409MI2280NY2820TN1523

AZ1252IL2146MN1323NC2363TX4685

AR685IN1557MS701ND217UT515

CA4484IA801MO1595OH2841VT95

CO1202KS671MT279OK949VA1769

CT673KY1203NE496OR782WA1222

DE185LA1179NV512PA2971WV489

FL4618ME336NH346RI181WI1405

GA2089MD943NJ1602SC1155WY174

a. Con solo mirar la tabla, ¿qué forma cree que tendrá la distribución del voto popular por estado?

b. Trace un histograma de frecuencia relativa para describir la distribución del voto popular para el presidente Trump en los 50 estados.

c. ¿El histograma del inciso b confirmó su suposición del inciso a? ¿Hay valores atípicos? ¿Cómo puede explicarlos?

Barrerascolocadas(kilómetros)7450410301454

Dispersantesusados(miles delitros)

590189332934326

Barcosdesplegados(cientos)1.06.014.035.0

a. ¿Qué tipos de gráficas podría utilizar para mostrar estos datos?

b. Antes de trazar las gráficas, ¿qué tendencias observa en cada una de las variables?

c. Use una gráfica de líneas para mostrar el personal ocupado durante este periodo de 51 días.

DATA SET

DS0130

8. Resultados electorales, continuación Consulte el ejercicio 7. A continuación se muestra el porcentaje del voto popular que el presidente Trump recibió en cada uno de los 50 estados:18

CAPÍTULO  Descripción de datos con gráficos 48
DATA SET DS0129
DATA SET DS0128
AL62HI30MA33NM40SD62 AK51ID59MI47NY37TN61 AZ49IL39MN45NC50TX52 AR61IN57MS58ND63UT46 CA32IA51MO57OH52VT30 CO43KS57MT56OK65VA44 CT44KY63NE59OR39WA37 DE42LA58NV46PA48WV68 FL49ME45NH46RI39WI47 GA51MD34NJ41SC55WY68
Númerodepersonal(miles)3.017.520.024.0 Áreasdepescafederales cerradasenelGolfo 3%8%25%32%
Día
13Día 26Día 39Día 51
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

a. Con solo mirar la tabla, ¿qué forma cree que tendrá la distribución del porcentaje del voto popular por estado?

b. Trace un histograma de frecuencia relativa para describir la forma de la distribución y busque los valores atípicos.

¿La gráfica confirma su respuesta del inciso a?

9. Resultados electorales, continuación Consulte los ejercicios 7 y 8. Los diagramas de tallo y hoja que aquí se muestran se generaron con el software MINITAB para las variables denominadas “voto popular” y “porcentaje de voto”.

Diagrama de tallo y hoja: Voto popular Diagrama de tallo y hoja: Porcentaje

Diagrama de tallo y hoja de voto popular N 5 50

Diagrama de tallo y hoja de porcentaje N 5 50

600111115300234

12022233310377999

17044455164012344

22066677(10)45566677899

250899245011122

251011185567778899

22122223396112233

161455536588

12167

Unidad de hoja = 1 101 10201 8223 62 62 62889

Unidad de hoja = 100 HI 44, 46, 46

a. Describa las formas de las dos distribuciones. ¿Hay valores atípicos?

b. ¿Se parecen los diagramas de tallo y hoja a los histogramas de frecuencia relativa construidos en los ejercicios 7 y 8?

c. Explique por qué la distribución del voto popular para el presidente Trump por estado es sesgada, mientras que el porcentaje de votos populares por estado tiene forma de montículo. DATA SET

a. ¿Por qué todas las medidas son números pares?

b. Dibuje un diagrama de tallo y hoja para describir los datos, divida cada tallo en dos líneas.

c. Construya un histograma de frecuencia relativa para los datos.

d. Escriba un párrafo breve que describa la distribución de las frecuencias del pulso de los estudiantes.

DATA SET

DS0132

11. Energía eólica La energía eólica es el uso del flujo del viento a través de turbinas para propulsar generadores de energía eléctrica. El siguiente mapa muestra la generación neta del viento (en megavatios hora) por estado en Estados Unidos a finales de 2017.19

a. Para los estados que cuentan con capacidad de generación de energía eólica instalada, utilice un histograma de frecuencia relativa para describir su capacidad de generación eólica a finales de 2017.

b. ¿Cuál es la forma del histograma? ¿Hay alguna característica excepcional? Si hay algún valor atípico, ¿puede explicarlo?

c. ¿Se le ocurre alguna razón para la falta de generadores eólicos en los estados del sureste?

DATA SET

DS0133

10. Pulso Un grupo de 50 estudiantes de biomédica registró su pulso, para ello los estudiantes contaron el número de latidos durante 30 segundos y lo multiplicaron por 2.

12. Un hallazgo arqueológico Un artículo en la revista científica Archaeometry describió 26 muestras de cerámica romano-británica, encontradas en cuatro hornos diferentes en Reino Unido.20 El porcentaje de óxido de aluminio en cada una de las 26 muestras se expone en la siguiente tabla.

DS0131

Revisar lo que ha aprendido 49 2222 3944 3379 0 471 0 0 0 NS = No significativo 0 0 0 67,092 24,404 0 18,501 5237 3154 10,987 2150 4398 9567 4542 588 935 361 13,971 6506 7481 2453 30 0 0 1563 4742 11,297 1949 20,816 10,885 1529 5072 221 414 279 153 NS 20 5 511 164 643 80708870846684826642 52729070968496866278 608288546666808856104 84846084885872846874 8472629072847211010058
LlanederynCaldicotIsland ThornsAshley Rails 14.411.611.818.317.7 13.811.111.615.818.3 14.613.418.016.7 11.512.418.014.8 13.813.120.819.1 10.912.7 10.112.5
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

a. Use un histograma de frecuencia relativa para describir el contenido de óxido de aluminio en las 26 muestras de cerámica.

b. ¿Qué característica excepcional observa en esta gráfica? ¿Se le ocurre una explicación para esta característica?

c. Dibuje una gráfica de puntos para los datos, use las letras (L, C, I o A) para ubicar el punto de datos en la escala horizontal. ¿Ayuda esto a explicar la característica excepcional del inciso b? DATA

22,50010,0006,300

14,0008,3706,000

14,0006,8096,000

13,8606,4005,850

11,2346,4005,616

Fuente: The World Almanac and Book of Facts 2017, p. 726.

a. Construya un diagrama de tallo y hoja para los datos.

b. ¿Cómo describiría la forma de esta distribución?

DS0134

13. Impuesto a la gasolina A continuación se muestran los impuestos estatales a la gasolina en 2017, expresados en centavos por galón para los 50 estados de Estados Unidos y el Distrito de Columbia.21

DATA SET DS0136

15. ¿Qué es normal? El valor estándar de 37.0 grados para la temperatura corporal humana fue derivado por un médico alemán en 1868. Para comprobar esta afirmación, Allen Shoemaker22 registró la temperatura corporal de 130 personas sanas. A continuación se muestra el histograma de frecuencia relativa de estos datos.

0.25

0.20

0.15

0.10

AL22.91HI44.39MA26.54NM18.88SD30.00

AK12.25ID33.00MI40.44NY43.88TN21.40

AZ19.00IL34.01MN28.60NC34.55TX20.00

AR21.80IN33.59MS18.79ND23.00UT29.41

CA38.13IA30.70MO17.30OH28.01VT30.46

CO22.00KS24.03MT27.75OK17.00VA22.39

CT39.85KY26.00NE28.20OR31.12WA49.40

DC23.50LA20.01NV33.52PA58.20WV32.20

DE23.00ME30.01NH23.83RI34.00WI32.90

FL36.80MD33.50NJ37.10SC16.75WY24.00

GA31.09

a. Dibuje un diagrama de tallo y hoja para los datos.

b. ¿Cómo describiría la forma de esta distribución?

c. ¿Hay estados con impuestos a la gasolina excepcionalmente altos o bajos? Si es así, ¿qué estados son?

DATA SET

a. Describa la forma de la distribución de temperaturas.

b. ¿Hay alguna observación excepcional? ¿Se le ocurre alguna explicación para esto?

c. Ubique el valor estándar de 37.0 grados en el eje horizontal de la gráfica. ¿Parece estar cerca del centro de la distribución?

Por su cuenta

DATA SET

14. Centrales hidroeléctricas Los siguientes datos representan las capacidades instaladas en megavatios (millones de vatios) para las 15 centrales hidroeléctricas más grandes del mundo.5 0.05

16. Vetos presidenciales A continuación se presenta una lista de los 44 presidentes de Estados Unidos junto con el número de vetos regulares para cada uno de ellos:5

DS0137

Washington2B.Harrison19

J.Adams0Cleveland42

Jefferson0McKinley6

Madison5T.Roosevelt42

Monroe1Taft30

J.Q.Adams0Wilson33 (Continúa)

MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

CAPÍTULO  Descripción de datos con gráficos 50
SET
ME 30.01¢ NY 43.88¢ PA 58.20¢ VA 22.39¢ NC 34.55¢ SC 16.75¢ GA 31.09¢ FL 36.80¢ AL 22.91¢ MS 18.79¢ LA 20.01¢ TX 20.00¢ OK 17.00¢ AR 21.80¢ KS 24.03¢ NE 28.20¢ SD 30.00¢ ND 23.00¢ MT 27.75¢ WY 24.00¢ CO 22.00¢ NM 18.88¢ AZ 19.00¢ UT 29.41¢ NV 33.52¢ CA 38.13¢ OR 31.12¢ WA 49.4¢ ID 33.00¢ TN 21.40¢ KY 26.00¢ WV 32.20¢ OH 28.01¢ IN 33.59¢ IL 34.01¢ MO 17.30¢ IA 30.70¢ MN 28.60¢ WI 32.90¢ MI 40.44¢ NH 23.83¢ AK 12.25¢ HI 44.39¢ VT 30.46¢ MA 26.54¢ RI 34.00¢ CT 39.85¢ NJ 37.10¢ DE 23.00¢ MD 33.50¢ DC 23.50¢
DS0135 Frecuencia relativa Temperatura 37.037.4 37.8 38.2 38.639.0 0

Jackson5Harding5

VanBuren0Coolidge20

W.H.Harrison0Hoover21

Tyler6F.D.Roosevelt372

Polk2Truman180

Taylor0Eisenhower73

Fillmore0Kennedy12

Pierce9L.Johnson16

Buchanan4Nixon26

Lincoln2Ford48

A.Johnson21Carter13

Grant45Reagan39

Hayes12G.H.W.Bush29

Garfield0Clinton36

Arthur4G.W.Bush12

Cleveland304Obama12

Fuente: The World Almanac and Book of Facts 2017.

Emplee una gráfica apropiada para describir el número de vetos emitidos por los 44 presidentes. Escriba un resumen de un párrafo que describa este conjunto de datos.

17. Derby de Kentucky El siguiente conjunto de datos muestra los tiempos ganadores (en segundos) para las carreras del Derby de Kentucky de 1950 a 2017.23

podían usar computadoras en casa. Aquí se muestran los resultados de los exámenes finales de las dos clases.

Con computadora portátil Sin computadora portátil

†Tiemporécordestablecidoporelsecretariadoen1973

Fuente: https://www.kentuckyderby.com/history/kentucky-derby-winners

a. ¿Piensa que habrá una tendencia en los tiempos ganadores a lo largo de los años? Elabore una gráfica de líneas para verificar su respuesta.

b. Use una gráfica para describir la distribución de los tiempos ganadores. Comente la forma de la distribución y busque cualquier tiempo ganador excepcional.

Escriba un resumen de un párrafo que describa y compare las puntuaciones del examen final de los dos grupos de estudiantes. DATA SET

19. Old Faithful Los siguientes datos son los tiempos de espera entre las erupciones del géiser Old Faithful en el Parque Nacional de Yellowstone.25 Use una gráfica para describir los tiempos de espera. Si hay alguna característica excepcional en su gráfica, reflexione sobre si existe alguna explicación práctica para ella.

DATA SET

DS0139

18. Las computadoras portátiles y el aprendizaje En una escuela secundaria de Nueva Jersey se llevó a cabo un experimento informal para investigar el uso de computadoras portátiles como herramienta para el aprendizaje en el estudio del álgebra.24 A 20 estudiantes de una clase de primer año se les dieron computadoras portátiles para que las usaran en la escuela y en el hogar, mientras que a 27 estudiantes de otra clase de primer año no se les proporcionaron; sin embargo, muchos de estos estudiantes

Revisar lo que ha aprendido 51
9884638397 9793935274 8857836388 10084868184 10081999149 7883808189 6884782964 4793747289 9057678970 9483
(1950)121.3122.3121.3122.0123.0121.4123.2122.1125.0122.1 (1960)122.2124.0120.2121.4120.0121.1122.0120.3122.1121.4 (1970)123.2123.1121.4119.2†124.0122.0121.3122.1121.1122.2 (1980)122.0122.0122.2122.1122.2120.1122.4123.0122.1125.0 (1990)122.0123.0123.0122.0123.3121.1121.0122.2122.1123.29 (2000)121.00119.97121.13121.19124.06122.75121.36122.17121.82122.66 (2010)124.45122.04121.83122.89123.66123.02121.31123.59
Con computadora portátil Frecuencia relativa Sin computadora portátil 0.40 0.30 0.20 0.10 0 30 40506070809010030405060708090100
Los histogramas a continuación muestran la distribución de las puntuaciones en los exámenes finales de los dos grupos.
56895179588252885278 69757753805479746578 55875385619354768081 59867871778945937271 76947550838272777565 79727877797282748049 75786480494988517885 65757769929153864979 68876181559353847073 93508777748987765980 DATA SET DS0138 MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
DS0140

20. ¿Qué tan cara es su universidad? Los datos a continuación representan una muestra de instituciones educativas terciarias que ofrecen carreras con duración de cuatro años y universidades en Estados

Unidos; se incluyen sus costos de matrícula y cuotas por alojamiento y alimentación en 2016.5 ¿Cómo se compara su institución educativa con esta muestra?

Nombre

Pública o privada Matrícula y cuotas

Alojamiento y alimentaciónName

Pública o privada Matrícula y cuotas

Alojamiento y alimentación

AmericanUniv.,DCPrivada$44,593$14,526NorthParkUniv.,ILPrivada$25,860$8,460 AuburnUniv.,ALPública10,42412,584OhioState,OHPública10,03711,666 BelmontUniv.,TNPrivada30,00010,970PacificLutheran,WAPrivada37,95010,330 BradleyUniv.,ILPrivada31,4809,700PrairieViewA&M,TXPública9,7458,419 CalStateBakersfield,CAPública6,81112,561RobertMorrisUniv.,ILPrivada25,95012,600 CarletonCollege,MNPrivada49,26312,783St.John’sUniv.,MNPrivada40,2269,604 TheCitadel,SCPública13,0246,381SanFranciscoState,CAPública6,47612,234 CollegeoftheHolyCross,MAPrivada48,94013,225SouthDakotaState,SDPública8,1727,462 ConcordiaUniv.,ILPrivada30,6409,172SouthwesternUniv.,TXPrivada39,06012,288 DePauwUniv.,INPrivada44,67811,700StetsonUniv.,FLPrivada43,24012,326 EasternMichiganUniv.,MIPública10,4179,398TowsonUniv.,MDPública9,18211,638 EndicottCollege,MAPrivada30,49214,112Univ.atAlbany,SUNY,NYPública8,99612,422 FordhamUniv.,NYPrivada47,31716,350Univ.ofCentralFlorida,FLPública6,3689,300 GeorgiaStateUniv.,GAPública10,68613,646Univ.ofIllinoisatUrbana-Champaign,ILPública15,62611,000 HampshireCollege,MAPrivada48,81013,274Univ.ofMiami,CoralGables,FLPrivada47,00413,310 IdahoStateUniv.,IDPública6,7846,338Univ.ofNorthCarolina,NCPública8,59110,902 IthacaCollege,NYPrivada40,65814,674Univ.ofRedlands,CAPrivada44,90013,090 KentState,OHPública10,0129,908Univ.ofSouthernCalifornia,CAPrivada50,21013,855 LehighUniv.,PAPrivada46,23012,280Univ.ofUtah,UTPública8,1979,000 LoyolaMarymount,CAPrivada42,56914,470ValparaisoUniv.,INPrivada36,16010,520 MarquetteUniv.,WiPrivada38,47011,440WartburgCollege,IAPrivada38,3809,460 MiamiUniv.,OHPública14,28711,644WashingtonStateUniv.,Pullman,WAPública11,96711,356 MonroeCollege,NYPrivada14,1489,400WesternOregonUniv.,ORPública8,7969,638 MuhlenbergCollege,PAPrivada45,87510,770WorcesterStateUniv.,MAPública8,85711,560

Fuente: The World Almanac and Book of Facts 2017

Utilice cualquiera de las gráficas que se han estudiado en este capítulo para describir los costos de las universidades en la tabla. Si observa alguna característica excepcional en las gráficas o detecta algún valor atípico, ¿puede explicar estos resultados?

CAPÍTULO  Descripción de datos con gráficos 52
SET DS0141
DATA
MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.

¿Cómo está su presión arterial?

La presión arterial es la presión que la sangre ejerce contra las paredes de las arterias. Cuando los médicos oenfermeros miden la presión arterial, toman dos lecturas. La presión arterial sistólica es la presión cuando el corazón se contrae y, por lo tanto, bombea. La presión arterial diastólica es la presión en las arterias cuando el corazón se relaja. La lectura de la presión arterial diastólica es siempre la más baja de las dos lecturas. La presión arterial varía de una persona a otra; también variará para una sola persona de un día a otro e incluso en un mismo día.

Si la presión arterial es demasiado alta puede provocar un derrame cerebral o un infarto. Si es demasiado baja la sangre no llegará a las manos ni a los pies y es posible que se sienta mareado. Por lo general, la presión arterial baja no es grave.

Entonces, ¿cuál debería ser su presión arterial? Una presión arterial sistólica de 120 se consideraría normal; una de 150 sería alta. Pero, puesto que la presión arterial varía entre los géneros y aumenta con la edad, se obtendrá un mejor indicador de la posición relativa de la presión arterial al compararla con la población de la presión arterial de todas las personas de su género y edad en Estados Unidos. Por supuesto, no es posible proporcionar ese conjunto de datos, pero sí presentar una muestra muy grande seleccionada a partir de este. Los datos de la presión arterial de 1,910 personas, 965 hombres y 945 mujeres de entre 15 y 20 años, forman parte de una encuesta de salud realizada por los National Institutes of Health (NIH). Las observaciones para cada persona incluyen su edad y su presión arterial sistólica y diastólica en el momento en que se registró la presión arterial. Utilice un paquete estadístico para responder las siguientes preguntas.

1.¿Cuáles son las variables que se midieron en esta encuesta? ¿Las variables son cuantitativas o cualitativas? ¿Discretas o continuas? ¿Los datos son univariados, bivariados o multivariados?

2.¿Qué tipos de gráficas se pueden usar para describir este conjunto de datos? ¿Qué tipos de preguntas se pueden responder con diferentes tipos de gráficas?

3.Elabore un histograma de frecuencia relativa con los datos de presión arterial sistólica para los 965 hombres y otro para las 945 mujeres. Compare ambos histogramas.

4.Considere a los 965 hombres y 945 mujeres como la totalidad de la población de interés. Seleccione una muestra de n 5 50 hombres y n 5 50 mujeres, y registre tanto los datos de la presión arterial sistólica como de las edades. Dibuje dos histogramas de frecuencia relativa para mostrar gráficamente la presión arterial sistólica en las dos muestras. ¿Se parecen las formas de los histogramas a los histogramas de población del inciso 3?

5.¿Cómo se compara su propia presión arterial con la de otras personas de su mismo sexo? Verifique su presión arterial sistólica con el histograma apropiado de los incisos 3 o 4 para determinar si su presión arterial es “normal” o si es excepcionalmente alta o baja.

Estudio de caso 53 DATA SET BLOOD PRESSURE
ESTUDIO DE CASO MUESTRA ISSUU © D.R. 2023 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS.
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.