7__

Page 1

FÍSICA •El estudio de la física •Sistema de unidades •Mecánica y fuerzas •Estática •Cinemática •Dinámica •Hidrostática e hidrodinámica •Temperatura y dilatación •Cambios de estado •Termodinámica •Movimiento ondulatorio •Acústica •Óptica •La luz y el color •Física nuclear •Electrostática y electrodinámica •Magnetismo y electromagnetismo •Electrónica P

P

–F R F

R



EL ESTUDIO DE LA FÍSICA

Conceptos generales Fenómenos naturales y objeto de la física El conocimiento del medio que le rodea es una cuestión que ha preocupado al hombre desde los albores de su existencia. Las causas de los fenómenos naturales, los ciclos que rigen el devenir de los astros y los océanos, los misterios de la acción y la inacción, el tiempo y el espacio, han sido desde siempre fuente de especulaciones má-

gicas y estudios filosóficos, de la expresión poética del mito y del rigor sistemático de la ciencia. La física, una disciplina científica con la misión de responder a las preguntas sobre la realidad del mundo, pretende desvelar las causas de la diversidad de las formas naturales, la relación entre materia y energía o el origen y sentido del tiempo, entre otras muchas cuestiones. En una definición más formal se diría que la física es la rama de la ciencia dedicada al estudio de los objetos inanimados y los factores que pueden modificar su condición sin alterar su naturaleza propia y distintiva.

Fenómenos naturales como las descargas eléctricas que se desencadenan durante las tormentas constituyeron la referencia inmediata para los estudios físicos en la antigüedad. Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


4

FÍSICA

________________________________________________________________________________________________________

Varios son los adjetivos que podrían completar la descripción de este área del saber. Así, la física es una ciencia fenomenológica, por cuanto su principal objetivo es el estudio de los fenómenos naturales para poder conocer los principios que los gobiernan. Y también una ciencia observacional, ya que es en la observación paciente de estos fenómenos donde se asientan sus logros, y experimental, porque no se puede considerar suficientemente conocido nada que no se consiga reproducir. Sobre esta base, el edificio de la física se ha construido en torno a dos pilares fundamentales: la aplicación de una metodología científica sólida y estructurada y el empleo de un lenguaje altamente especializado, fundamentalmente matemático, que le ha permitido expresar con precisión las cada vez más abstractas y complejas nociones que manejaba. Con este espíritu, se ha vivido en el curso de la historia una notable evolución en las diversas disciplinas de la física. Al estudio de temas clásicos, como la mecánica de los cuerpos, el calor o la luz, se han añadido en los últimos siglos nuevos conceptos (electricidad, magnetismo, el átomo y sus partículas) y sistematizaciones teóricas (relatividad general, mecánica cuántica). En la física actual se vive un proceso simultáneo de disgregación y unificación. Por una parte, el grado de detalle alcanzado en el conocimiento de los fenómenos ha conducido a una notable complejidad de los modelos propuestos e, inevitablemente, a la especialización de los científicos. Pero al mismo tiempo, el es-

fuerzo de los investigadores se ha dirigido a la búsqueda de las causas primordiales en las que se fundamentarían los fenómenos físicos en sus variadísimas manifestaciones. Según este enfoque, todos los procesos de la naturaleza, aunque aparentemente tan diferentes como el peso, la dilatación de los cuerpos o el estallido del trueno y el relámpago, obedecerían a unas leyes universales comunes cuyo descubrimiento es misión última de la física. En sus largos siglos de investigación, los físicos han concluido que existen tan sólo cuatro tipos de interacciones fundamentales que dan origen a todos los fenómenos naturales conocidos: – La interacción gravitatoria, responsable de la atracción mutua entre los cuerpos dotados de masa y cuyos efectos más visibles son la gravedad y el orden que gobierna el movimiento del Sol, sus planetas y, en definitiva, los cuerpos celestes. – La interacción electromagnética, manifiesta en los hechos que estudian la electricidad, el magnetismo y la óptica (la luz es una forma de radiación electromagnética). – La interacción fuerte, que sostiene el armazón de los átomos y evita que los núcleos de éstos, base de toda la materia conocida, se disgreguen o destruyan. – La interacción débil, que rige ciertos acontecimientos muy particulares detectados a escala subatómica.

Ramas de la física Rama Mecánica

Subdivisiones Fuerzas: Fluidos:

Electricidad y magnetismo

Estática Cinemática Dinámica Hidrostática Hidrodinámica

Tema que estudia Las leyes del movimiento de la materia

Electrostática Electrodinámica Electromagnetismo

Las cargas eléctricas, su corriente y la interacción entre sus campos eléctricos y magnéticos

Electrónica Temperatura Calorimetría Termodinámica

Los procesos afectados por el calor o la temperatura

Óptica

Lentes Fotometría Colorimetría

La producción, absorción y propagación de las ondas visibles

Acústica

Acústica arquitectónica Acústica ambiental

La producción, absorción y propagación de las ondas sonoras

Ondulatoria

Ondas elásticas Ondas inelásticas

Las ondas producidas por el sonido y las vibraciones

Física nuclear

Física atómica Física de partículas

Las propiedades y leyes del átomo

Termología


____________________________________________________________________________________________

El estudio de la física

Premios Nobel de física El premio Nobel es uno de los galardones más importantes que se conceden para premiar las diferentes facetas del pensamiento humano. Fue creado por el científico sueco Alfred Nobel y lo otorga anualmente la Academia sueca. Los ganadores del premio Nobel de física, desde 1901, han sido los siguientes: 1901 W. C. Röntgen (Alemania) 1902 H. A. Lorentz (Holanda) P. Zeeman (Holanda) 1903 A. H. Becquerel (Francia) P. Curie (Francia) M. Curie (Francia) 1904 J. W. S. Rayleigh (Gran Bretaña) 1905 P. E. A. Lenard (Alemania) 1906 J. J. Thomson (Gran Bretaña) 1907 A. A. Michelson (EE. UU.) 1908 G. Lippman (Francia) 1909 G. Marconi (Italia) C. F. Braun (Alemania) 1910 J. D. Van Der Waals (Holanda) 1911 W. Wien (Alemania) 1912 N. G. Dalén (Suecia) 1913 H. Kamerlingh-Onnes (Holanda) 1914 M. Von Laue (Alemania) 1915 W. H. Bragg (Gran Bretaña) W. L. Bragg (Gran Bretaña) 1916 No otorgado 1917 C. G. Barkla (Gran Bretaña) 1918 M. K. E. L. Planck (Alemania) 1919 J. Stark (Alemania) 1920 C. E. Guillaume (Suiza) 1921 A. Einstein (germano-suizo) 1922 N. Bohr (Dinamarca) 1923 R. A. Millikan (EE. UU.) 1924 K. M. G. Siegbahn (Suecia) 1925 J. Franck (Alemania) G. Hertz (Alemania) 1926 J. B. Perrin (Francia) 1927 A. H. Compton (EE. UU.) C. T. R. Wilson (Gran Bretaña) 1928 O. W. Richardson (G. Bretaña) 1929 L. V. de Broglie (Francia) 1930 C. V. Raman (India) 1931 No otorgado 1932 W. Heisenberg (Alemania) 1933 E. Schrödinger (Austria) P. A. M. Dirac (Gran Bretaña) 1934 No otorgado 1935 J. Chadwick (Gran Bretaña) 1936 V. F. Hess (Austria) C. D. Anderson (EE. UU.) 1937 C. J. Davisson (EE. UU.) G. P. Thomson (Gran Bretaña) 1938 E. Fermi (Italia) 1939 E. O. Lawrence (EE. UU.) 1940 No otorgado 1941 No otorgado 1942 No otorgado 1943 O. Stern (EE. UU.) 1944 I. I. Rabi (EE. UU.) 1945 W. Pauli (Austria)

1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976

P. W. Bridgman (EE. UU.) E. V. Appleton (Gran Bretaña) P. M. S. Blackett (Gran Bretaña) H. Yukawa (Japón) C. F. Powell (Gran Bretaña) J. D. Cockcroft (Gran Bretaña) F. Bloch (EE. UU.) E. M. Purcell (EE. UU.) F. Zernike (Holanda) M. Born (Gran Bretaña) W. Bothe (R. F. Alemania) W. E. Lamb (EE. UU.) P. Kusch (EE. UU.) W. Shockley (EE. UU.) J. Bardeen (EE. UU.) W. H. Brattain (EE. UU.) C. N. Yang (China) T. D. Lee (China) P. A. Cerenkov (URSS) I. M. Frank (URSS) I. J. Tamm (URSS) E. G. Segré (EE. UU.) O. Chamberlain (EE. UU.) D. A. Claer (EE. UU.) R. Hofstadter (EE. UU.) R. L. Mössbauer (R. F. Alemania) L. D. Landau (URSS) E. P. Wigner (EE. UU.) M. Goeppert-Mayer (EE. UU.) J. H. D. Jensen (R. F. Alemania) Ch. H. Townes (EE. UU.) N. G. Basov (URSS) A. M. Prochorov (URSS) S. I. Tomonaga (Japón) J. Schwinger (EE. UU.) R. P. Feynman (EE. UU.) A. Kastler (Francia) H. A. Bethe (EE. UU.) L. W. Álvarez (EE. UU.) M. Gell-Mann (EE. UU.) H. Alfvén (Suecia) L. Néel (Francia) D. Gador (Gran Bretaña) J. Bardeen (EE. UU.) L. N. Cooper (EE. UU.) J. R. Schrieffer (EE. UU.) L. Esai (Japón) I. Giaever (EE. UU.) B. D. Josephson (Gran Bretaña) M. Ryle (Gran Bretaña) A. Hewish (Gran Bretaña) A. Bohr (Dinamarca) B. Mottelson (Dinamarca) J. Rainwater (EE. UU.) B. Richter (EE. UU.) S. C. C. Ting (EE. UU.)

1977 P. W. Anderson (EE. UU.) F. Mott (Gran Bretaña) J. H. Van Vleck (EE. UU.) 1978 P. L. Kapitsa (URSS) A. A. Penzias (EE. UU.) R. W. Wilson (EE. UU.) 1979 S. L. Glashow (EE. UU.) 1980 J. W. Cronin (EE. UU.) V. L. Fitch (EE. UU.) 1981 N. Bloembergerg (EE. UU.) A. L. Schawlow (EE. UU.) K. M. Siegbahn (Suecia) 1982 K. G. Wilson (EE. UU.) 1983 S. Chandrasekhar (EE. UU.) W. A. Fowler (EE. UU.) 1984 C. Rubbia (Italia) S. Van Der Meer (Holanda) 1985 K. Von Klitzing (R. F. Alemania) 1986 F. Ruska (R. F. Alemania) G. Binnig (R. F. Alemania) H. Rohrer (Suiza) 1987 J. G. Bednorz (R. F. Alemania) K. A. Müller (Suiza) 1988 L. M. Lederman (EE. UU.) Schwartz (EE. UU.) J. Steinberger (EE. UU.) 1989 N. F. Ramsey (EE. UU.) H. G. Dehmelt (EE. UU./ Canadá) W. Paul (R. F. Alemania) 1990 J. I. Friedman (EE. UU.) H. W. Kendall (EE. UU.) R. E. Taylor (Canadá) 1991 P. G. de Gennes (Francia) 1992 G. Charpak (Francia) 1993 R. A. Hulse (EE. UU.) J. H. Taylor (EE. UU.) 1994 B. N. Brockhouse (Canadá) C. G. Shull (EE. UU.) 1995 Martin L. Perl (EE. UU.) Frederic Reines (EE. UU.) 1996 David M. Lee (EE. UU.) Douglas D. Osherof (EE. UU.) Robert C. Richardson (EE. UU.) 1997 Steven Chu (EE.UU.) Claude Cohen-Tannoudji (Francia) William Phillips (EE.UU.) 1998 Robert B. Laughlin (EE.UU.) Horst L. Störmer (Alemania) Daniel C. Tsui (EE.UU.) 1999 Gerardus’t Hooft (Países Bajos) Martinus J.G. Veltman (Países Bajos) 2000 Zhores I. Alferov (Rusia) Herbert Kroemer (EE.UU.) Jack Kilby (EE.UU.)

5


6

FÍSICA

________________________________________________________________________________________________________

Dicho método debe cumplir cuatro fases o etapas, que son las siguientes:

Central generadora de energía atómica en Tokai-Mura, Japón. Desde la segunda mitad del siglo XX, la investigación científica sobre la utilización de la energía nuclear ha experimentado espectaculares avances.

El objetivo final de los físicos es, pues, formular hipótesis que ayuden a interpretar estas interacciones desde una concepción unificada. Sólo así podrá llegar a comprender la esencia íntima de las principales magnitudes que definen los fenómenos físicos: materia, energía, espacio y tiempo.

Metodología Reciben el nombre de métodos los pasos o vías que se utilizan para poder llegar a conocer la verdad de un hecho, de una idea o de una hipótesis. El método utilizado en física es el método científico por excelencia, es decir, el experimental, que permite a los estudiosos descifrar, hasta donde les es posible, los fenómenos investigados.

– En primer lugar, el investigador debe observar los fenómenos tal como se producen en la naturaleza, intentando acumular la mayor información posible sobre los mismos y captando todas las circunstancias de lugar y tiempo que influyen sobre dichos fenómenos. – A continuación, el científico debe intentar reproducir el fenómeno estudiado de la forma más fiel posible y en igualdad de condiciones para poder así relacionar todos los factores que puedan intervenir. – El siguiente paso es el más importante, ya que el científico debe preguntarse el porqué de los fenómenos que se observan durante su estudio e intentar establecer una generalización para todos los fenómenos semejantes. Es la fase de la formulación de hipótesis y de la puesta en práctica de los procedimientos oportunos para su demostración. Cuando esta última se consigue, se formula la correspondiente tesis, es decir, una propuesta de explicación concreta sostenida con argumentos demostrables. En caso contrario, cuando la hipótesis no puede demostrarse con un grado de validez y fiabilidad suficientes, el proceso vuelve a empezar. – El último paso es el de comunicar a toda la comunidad científica los resultados obtenidos de las investigaciones para así poder contrastar, confirmar o rectificar lo enunciado. Cuando la comunidad científica establece distintas hipótesis para explicar un determinado fenómeno surgen las teorías, como, por ejemplo, las que se han producido en los últimos años sobre el origen del universo.

_ Preguntas de repaso 1. ¿Por qué se dice que la física es una ciencia fenomenológica? 2. ¿En qué se diferencia una hipótesis de una tesis? 3. ¿Qué tema estudia la mecánica?


SISTEMAS DE UNIDADES

Conceptos generales Unidades y magnitudes Uno de los objetivos de la física es medir, interpretar y relacionar los resultados de las medidas entre sí y con otras magnitudes que no pueden ser directamente mensurables. Otro de sus objetivos es deducir las leyes cuantitativas que pueden obtenerse de estas relaciones y que deben poder probarse con nuevas mediciones. En el mundo de la física, el término magnitud se utiliza para poder trabajar y operar con todas las propiedades que sean observables y mensurables y que además puedan expresarse cuantitativamente. Se entiende por magnitud física toda característica de los cuerpos que se puede medir y comparar con otra de la misma naturaleza. Cada magnitud o tipo de magnitudes posee una serie de unidades de medida –por ejemplo, el metro en longitud o el kilogramo en masa– que se adopta arbitrariamente para poder comparar con ella las distintas mediciones de la misma especie. Estas comparaciones son posibles gracias a la medición o medida, con la que se puede comprobar el número de veces que una determinada magnitud integra a su unidad. Para que una medición sea válida y admisible es necesario que haya sido determinada por medio de unidades elementales, constantes, repetibles e inalterables. Por ejemplo, si se afirma que un partido de fútbol ha durado 90 minutos, ello significa que duró lo que un reloj tarda en medir ese tiempo. En este caso, la magnitud medida es el tiempo, la unidad de medida es el minuto y el reloj es un patrón, más concretamente un patrón secundario, dado que el minuto no se define según las propiedades de dicho reloj. Todos los instrumentos de medida se calibran directa o indirectamente en función de los patrones primarios de longitud, tiempo y masa establecidos por la comunidad científica internacional. El resultado de la medición es la medida de la magnitud y suele expresarse con un número, seguido del símbolo de la unidad utilizada. Estas medidas reciben el nombre de directas. La definición de los patrones primarios se ha modificado a lo largo del tiempo debido a la mayor precisión de

las medidas. El metro, por ejemplo, que es la unidad de longitud, se definió incialmente en 1889 como la longitud de una determinada barra de platino iridiado mantenida en unas condiciones fijas. Este patrón se desechó en 1960 porque su conservación y reproducción resultaban muy difíciles y estaban sujetas a imprecisiones. Hoy en día, la longitud patrón se toma de la longitud de onda de la radiación rojo-anaranjada emitida por los átomos de kriptón 86 en el interior de un tubo de descarga eléctrica. Como sucede con la longitud, se han establecido patrones unitarios para el tiempo y la masa.

Patrón en platino e iridio que determina la masa exacta del kilogramo, conservado en la Oficina Internacional de Pesos y Medidas de Sèvres, Francia. Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


8

FÍSICA

________________________________________________________________________________________________________

En función de estas tres magnitudes fundamentales, que se representan por medio de los símbolos L (longitud), T (tiempo) y M (masa), y de sus combinaciones matemáticas pueden expresarse todas las demás en el ámbito de la mecánica clásica.

Magnitudes fundamentales y derivadas Como ya se ha comentado, se consideran magnitudes físicas todas las características y propiedades susceptibles de ser medidas. Las magnitudes físicas se clasifican en dos grupos: fundamentales y derivadas. La masa, la longitud, el tiempo y la intensidad eléctrica de corriente son magnitudes fundamentales, ya que pueden medirse directamente. Las magnitudes derivadas, en cambio, no son directamente mensurables, sino que se basan en las fundamentales y se expresan por medio de operaciones matemáticas denominadas ecuaciones dimensionales (v. más adelante). Entre ellas se encuentran el volumen (longitud elevada al cubo), la velocidad (longitud entre tiempo), la densidad (masa entre volumen), la superficie (longitud por longitud) y la presión (masa entre superficie).

Sistema Internacional (S.I.) El Sistema Internacional de medidas nació bajo las directrices de la Oficina Internacional de Pesos y Medidas como modificación del sistema M.K.S. (metro-kilogramomasa y segundo), al que añade las siguientes unidades de base: el kelvin para medir temperaturas y la candela para medir intensidades luminosas. El origen del S.I. se remonta a 1948, año en el que se celebró la IX Conferencia General de Pesas y Medidas (CGPM). No obstante, hasta la XI CGPM, celebrada en 1960, no se establecieron las unidades suplementarias y derivadas, así como las normas para los prefijos de los múltiplos y submúltiplos de las unidades. Las unidades básicas que forman el S.I. para cada una de las siguientes magnitudes fundamentales: longitud, masa, tiempo, temperatura, intensidad de corriente eléctrica e intensidad luminosa, son, respectivamente: el metro, el kilogramo, el segundo, el kelvin, el amperio y la candela. En la historia de la física se han dado definiciones cada vez más exactas de estas unidades fundamentales, pudiendo considerarse como correctas las siguientes: Metro (m). El metro es la longitud igual a 1.650.763,73 longitudes de onda (λ) de la radiación correspondiente a la transición entre dos niveles 2p10 y 5d5 del isótopo 83 del átomo de kriptón en el vacío. Kilogramo (kg). El kilogramo es la masa formada por una aleación de iridio y platino que equilibra un decímetro cúbico de agua a la temperatura de 4 ºC pesados en una balanza de brazos iguales.

Segundo (s). El segundo es la duración de 9.192.631.770 períodos de radiación correspondiente a la transición entre dos niveles hiperfinos del estado fundamental del isótopo 133 del átomo de cesio. Kelvin (K). El kelvin es la fracción 1/273,16 de la temperatura termodinámica del punto triple del agua y equivale a la expresión de un intervalo de temperatura. Amperio (A). El amperio es la intensidad de una corriente eléctrica constante que, mantenida en dos conductores paralelos y rectilíneos de longitud infinita, de sección circular y puestos en el vacío a la distancia de un metro entre uno y otro, produce en dichos conductores una fuerza igual a 2 · 10-7 newton por metro de longitud. Candela (cd). La candela es la intensidad luminosa en dirección perpendicular de una superficie de 1/60 cm2 de un cuerpo negro a la temperatura de congelación del platino, bajo la presión de 101.325 newton por metro cuadrado. En este mismo sistema se contemplan también las llamadas unidades suplementarias, que no son ni fundamentales ni derivadas, sino geométricas y engloban las siguientes: el ángulo plano (radián) y el ángulo sólido (estereorradián). En la XI Conferencia General de Pesas y Medidas, celebrada en 1960, se dieron las siguientes definiciones a las unidades del ángulo plano y del ángulo sólido: El radián es el ángulo plano que, teniendo su vértice en el centro de un círculo, intercepta sobre la circunferencia de este círculo un arco de longitud igual al radio. El estereorradián es el ángulo sólido que, teniendo su vértice en el centro de una esfera, delimita sobre la superficie esférica correspondiente un área igual a la de un cuadrado que tiene como lado el radio de la esfera. Los prefijos adoptados para designar los múltiplos y submúltiplos de las unidades son los siguientes:

Prefijos de múltiplos y submúltiplos de la unidad Múltiplos

Submúltiplos

Factor de Factor de Prefijo Símbolo multipli- Prefijo Símbolo multiplicación cación Deca Hecto Kilo Mega Giga Tera

Da H K M G T

101 102 103 106 109 1012

Deci Centi Mili Micro Nano Pico

d c m µ n p

10-1 10-2 10-3 10-6 10-9 10-12


____________________________________________________________________________________________

Magnitud

Unidad

Símbolo

Fundamen- Longitud tales Masa Tiempo Intensidad de corriente eléctrica Temperatura termodin. Intensidad luminosa

Metro Kilogramo Segundo Amperio

m kg s A

Kelvin

K

Candela

cd

Suplementarias

Ángulo plano Ángulo sólido

Radián Estereorradián

rad sr

Derivadas

Superficie Volumen Densidad

Metro cuadrado Metro cúbico Kilogramo por metro cúbico metro por segundo metro por segundo cuadrado Newton Pascal Vatio Newton por metro Newton por metro Culombio Voltio

m2 m3 kg/m3

c V o W/A

Faradio

F o c/A

Sistema

Longitud

Ohmio

Ω o V/A

Sistema Internacional

Metro (m)

CGS (Cegesimal)

Centímetro (cm)

Gramo (g)

Metro (m)

Velocidad Aceleración

Fuerza Presión Potencia Momento de una fuerza Tensión superficial Carga eléctrica Potencial eléctrico Capacidad eléctrica Resistencia eléctrica Inducción magnética Flujo de inducción magnética Iluminancia Frecuencia Actividad radioactiva Entropía Densidad de corriente

1 kp = 9,80 N

m/s m/s2

N Pa o N/m2 W N·m

El Sistema Cegesimal se utilizó durante años, sobre todo en la física teórica. Sus unidades fundamentales son el centímetro (cm), el gramo (gr) y el segundo (s). La base teórica de este sistema fue expuesta por Maxwell en los siguientes términos: “Los fenómenos por los cuales la electricidad nos es conocida son de naturaleza mecánica y, como consecuencia, deben medirse con las unidades o patrones mecánicos”.

Sistemas y unidades

N/m

Unidades fundamentales

2

Tesla

T o Wb/m

Weber

Wb o V · s

Técnico o terrestre Lux Hertz Curie

lx Hz Ci

Julio por kelvin Amperio por metro cuadrado

S o J/K A/m2

9

básico sea el S.I.) son el Sistema Cegesimal y el Sistema Técnico. Existe también el Sistema fps o británico, que sólo se emplea en el Reino Unido, los Estados Unidos y algunos países de la Comunidad Británica de Naciones. Este sistema está basado en las unidades pie (f), libra (p) y segundo (s). En el Sistema Técnico, la fuerza es una magnitud física fundamental, mientras que la masa se define como una magnitud derivada. En este sistema, la unidad de masa no tiene nombre concreto; se le llama simplemente unidad técnica de masa (utm). Una unidad técnica de masa se define como la masa que adquiere la aceleración de 1 m/s2 al aplicarle la fuerza de un kilopondio (kp). El kilopondio o kilogramo-peso (unidad fundamental de fuerza en el sistema técnico) se define como la fuerza con que la Tierra atrae al kilogramo-patrón al nivel del mar en el paralelo 45º.

Unidades del Sistema Internacional Tipo

Sistemas de unidades

Otros sistemas En los cálculos físicos se utilizan otros sistemas, además del Sistema Internacional. Los más utilizados (aunque el

Masa

Tiempo

Kilogramo Segundo (kg) (s) Segundo (s)

Fuerza – –

Segundo Kilopondio (s) (kp)

Ecuaciones dimensionales Las ecuaciones de dimensión de una unidad derivada son expresiones simbólicas, que indican la relación que existe entre esa unidad y las unidades fundamentales. En las ecuaciones dimensionales se utilizan los siguientes símbolos: L M T

Dimensiones de longitud Dimensiones de masa Dimensiones de tiempo


10

FÍSICA

I E θ

________________________________________________________________________________________________________

Dimensiones de intensidad de corriente Dimensiones de intensidad luminosa Dimensiones de temperatura termodinámica

Las ecuaciones derivadas, y por tanto sus unidades, pueden relacionarse con las magnitudes fundamentales ya sea directa o indirectamente. Así, la velocidad depende directamente de las magnitudes fundamentales, longitud y tiempo. v= s t siendo s el espacio (o longitud) y t el tiempo. En cambio, el trabajo está indirectamente relacionado con las magnitudes fundamentales, aunque es posible expresarlo en función de ellas por transformaciones sucesivas: · s2 T = F · s = m · a · s = m · –v · s = m · –s2 · s = m –––– 2 t t t donde F es la fuerza, a la aceleración, s el espacio (o longitud) y t el tiempo. La última expresión representa el valor del trabajo en función de las magnitudes fundamentales: masa, longitud (o espacio) y tiempo. Es habitual representar las magnitudes fundamentales con letras mayúsculas: M (masa), L (longitud) y T (tiempo). Si se pone en la expresión última esas letras mayús-

culas y la magnitud de trabajo entre corchetes, se obtiene la ecuación de dimensiones del trabajo: [T] = ML2T -2 que, para la velocidad, sería: [V] = LT -1 Las unidades que figuran en el denominador se colocan en el numerador con exponente negativo. Si en alguna ecuación figura algún valor constante, no se incluye en la ecuación dimensional, ya que ésta sólo expresa cómo varía una unidad en función de las unidades fundamentales. La ecuación de dimensiones sirve para comprobar la homogeneidad de las fórmulas. Esta comparación es muy importante, ya que no es posible sumar dos cantidades que no sean homogéneas, algo que puede deducirse de sus respectivas ecuaciones de dimensiones. Por tanto, dos ecuaciones son homogéneas si tienen la misma ecuación de dimensiones, aunque expresen magnitudes físicas distintas. A continuación se recogen de forma gráfica las ecuaciones dimensionales de las principales magnitudes.

Errores Siempre que se efectúa una medición, aunque el método y los sistemas para realizarla sean de una gran precisión, el resultado numérico obtenido tiene una precisión limitada. La medición siempre se ve afectada por alguna inexactitud o error. Esta inexactitud o error puede deberse a la imprecisión inherente a los aparatos utilizados; al procedimiento indirecto empleado, que también experimenta una cierta imprecisión; a errores accidentales cometidos durante la medición; a defectos del medidor utilizado y otros factores. Los errores cometidos cuando el valor obtenido es mayor que el real se denominan por exceso. En caso contrario, cuando el valor que se obtiene es menor que el real, se denominan errores por defecto. Cuando los errores son imputables al operador que realiza la medición (falta de concentración, errores visuales...), se llaman errores personales. Los que se deben al aparato empleado se denominan instrumentales. Los errores en una medición pueden ser absolutos o relativos: El error absoluto cometido al realizar una medición es la diferencia entre el valor obtenido (m´) y la medida exacta (m): Los registros de presión y temperatura se realizan mediante barómetros-termómetros como el representado en la imagen.

Ea = m´ – m


____________________________________________________________________________________________

Ecuaciones dimensionales Magnitud

Ecuación dimensional

Superficie Volumen Densidad Aceleración Fuerza Presión Energía, trabajo, calor Potencia Momento de una fuerza Tensión superficial Carga eléctrica Potencial eléctrico Capacidad eléctrica Resistencia eléctrica Densidad de corriente Inducción magnética Flujo de inducción magnética Iluminancia Frecuencia Entropía, capacidad térmica

L2 L3 ML-3 LT-2 LMT-2 L-1MT-2 L2MT-2 L2MT-3 L2MT-2 MT-2 TI L2MT-3I-1 L-2M-1T4I2 L2MT-3I-2 IL-2 MT-2I-1 L2MT-2I-1 EL-2 T-1 L2MT-2θ-1

De esta fórmula puede deducirse que la expresión de una medida cuyo valor aproximado se ha calculado o conocido es: m = m´ ± Ea Cuando la medida exacta no se conoce, en la práctica se toma por valor exacto la media aritmética de las medidas efectuadas. El valor de Ea puede ser positivo (error por exceso) o negativo (por defecto). El error absoluto es una magnitud de la misma naturaleza que la magnitud que se mide y se evalúa en la misma unidad. Por ejemplo, si se afirma que la medida exacta de una

Sistemas de unidades

11

longitud es L = 38,000 m, se quiere decir que el error absoluto cometido es menor que un milímetro, por lo que la medida podría expresarse de la siguiente manera: L = (38,000 ± 0,001) m. En las medidas, los ceros después de una coma indican su grado de exactitud. Así, se puede afirmar que para valorar un tiempo medido con un cronómetro es más exacta la cifra de 27,000 s que 27,00 s, y aún más que simplemente 27 s. El error relativo, por su parte, se define como el cociente entre el error absoluto y el valor verdadero. En el ejemplo anterior, el error relativo de la medida (27,00 ± 0,01) sería: ∆E 0,01 ––––– = ––––– = 0,00037 ≈ 0,037% E 27,00

_ Preguntas de repaso 1. Expresar las siguientes mediciones en el Sistema Internacional: v = 120 km/h. m = 2,5 tm. s = 400 cm2. 2. Deducir si se pueden sumar entre sí las magnitudes físicas de cantidad de movimiento (m.v) y la de impulso mecánico (F.t). 3. Se ha calculado que la distancia entre dos edificios es de 1.700 m, con un error de ± 2 m; al mismo tiempo, se midió la altura de una señal de tráfico, resultando su valor de 2,35 m, con un error de ± 2 cm. ¿Cuál de las dos medidas se ha realizado con mayor precisión?


MECÁNICA MECÁNICA YYFUERZAS FUERZAS

Introducción La mecánica es la parte de la física que estudia los movimientos de los cuerpos y las causas que los producen. Las ramas principales de la mecánica son la estática, que estudia las fuerzas que provocan el equilibrio de los sistemas físicos, y la dinámica, o estudio de la acción de las fuerzas y de los movimientos resultantes. La fuerza, entendida como origen de todo movimiento, es un concepto fundamental de la mecánica. Al tratarse de una magnitud vectorial y antes de entrar en materia conviene repasar los principios de las operaciones con magnitudes escalares y vectoriales.

Magnitudes escalares y vectoriales Las magnitudes que se miden en la física pueden ser de naturaleza escalar o vectorial. Las magnitudes escalares son aquellas que quedan perfectamente definidas con la simple especificación de su módulo. Así, se dice que el valor de un trabajo es de 8 julios, sin indicar en qué dirección ni sentido se ha realizado; ello indica que el trabajo es una magnitud escalar. Estas magnitudes deben su calificativo al hecho de que sus valores pueden representarse en escalas apropiadas con un punto de referencia como origen. Son magnitudes escalares, entre otras muchas, la longitud, el tiempo, la masa, la densidad, el trabajo, la intensidad de corriente y el potencial eléctrico. (– 4) - (– 3) - (– 2) - (– 1) - (0) - (1) - (2) - (3) - (4) Representación de la longitud como magnitud escalar en una escala aleatoria

dor, no es suficiente información para conocer su posición. Si se complementa este dato diciendo que vuela en la línea Buenos Aires-Madrid (dirección), todavía no podríamos saber si va o vuelve de Madrid, por lo que entonces sería necesario además conocer también su sentido de movimiento. Además de la velocidad son magnitudes vectoriales la fuerza, la aceleración, el peso de los cuerpos, el campo eléctrico, la cantidad de movimiento, etc. La representación de las magnitudes vectoriales se realiza mediante vectores. Un vector se define como todo segmento rectilíneo orientado y compuesto por un módulo, una dirección, un sentido y un punto de aplicación: A

O

v

A'

Módulo: 3 unidades

El módulo es una longitud que indica, en una escala, el valor numérico de la magnitud que representa. En el ejemplo ilustrado, el vector v tiene un módulo de 3 unidades. La dirección es la recta sobre la que se extiende el vector. En el ejemplo, sería la horizontal que une los extremos A-A’. El sentido al que apunta el vector se indica mediante el extremo de flecha que posee en uno de los puntos terminales. En una dirección únicamente existen dos sentidos. En el ejemplo, el vector apunta de izquierda a derecha (A-A’). El punto de aplicación es el origen del vector; en el ejemplo, el punto O. Los vectores se denotan con una flecha sobre la letra o letras que lo representan, por ejemplo, v o OA. El módulo del vector se representa como | v|.

Tipos de vectores Sin embargo, para definir las magnitudes vectoriales no es suficiente con conocer su módulo. Además, han de especificarse la dirección, el sentido de la magnitud y el punto de aplicación. Magnitud vectorial es, por ejemplo, la velocidad de un móvil. Si se dijera que un avión está sobrevolando el ecua-

Vectores fijos o ligados son los que únicamente poseen un punto de aplicación, una dirección y un sentido, por lo que están inmóviles en el espacio. Vectores libres son los que como punto de aplicación tienen cualquier punto del espacio, por lo que pueden

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


____________________________________________________________________________________________

trasladarse paralelamente a sí mismos a cualquier punto de origen. Vectores deslizantes son los que se pueden apoyar en cualquier punto de la recta sobre la que se sustenta y señala su dirección. Vectores equipolentes son los que poseen igual módulo y sentido, pero direcciones paralelas. Si dos vectores poseen igual módulo y direcciones paralelas, pero de sentido contrario, forman un par de vectores. Vectores axiales son los que representan magnitudes asociadas a un movimiento de rotación. Vectores polares son los que representan magnitudes asociadas a un movimiento de traslación: v v o' o v v o o' vector fijo vector deslizante vector libre a

b par de vectores

b

s = a + b = a + b’ b' a

1. Suma de dos vectores consecutivos: dados dos vectores el vector resultante de la suma s tiene consecutivos a y b, como origen el punto de partida de a , y como extremo, el de llegada de b:

Diferencia. En la diferencia o resta de vectores se pueden producir los siguientes casos: 1. Diferencia de dos vectores consecutivos: se considera la di ferencia entre a y b como la suma de a con el opuesto de b:

r = a – b = a + (– b) –b

b a

2. Diferencia de dos vectores concurrentes: la diferencia es la suma de a con un vector equipolente al entre a y b, opuesto de b:

= a + (– b’) r = a – b = a + (– b) –b r

a

–b

b

3. Diferencia de vectores libres: al igual que sucede con los vectores concurrentes, la diferencia entre a y b, es la suma de a con un vector equipolente al opuesto de b: – b' a

r

b

s = a + b = OB a

b

O

s

A

b

s A

O

O

a A

2. Suma de dos vectores concurrentes: dados dos vectores concurrentes a y b, el vector suma s es el que une el ori equipolente de b y cuyo gen de a con el extremo de b’, origen es el extremo de a :

OA + AB= OB s = a + b = a + b’= b' a

a

–b B

B

s b

Operaciones con vectores Como antecedente de las operaciones entre vectores propiamente dichas, es importante recordar el significado de vector equipolente de un vector v . El vector equipolente de v es otro vector de igual módulo, dirección y sentido, pero aplicado en otro punto del espacio. Suma. En la suma de vectores se pueden producir los siguientes casos:

a

b

r

vectores axiales

b

Si se desea sumar o restar tres o más vectores, basta con aplicar la propiedad asociativa y llevar a cabo el proceso explicado de dos en dos vectores. El vector obtenido al sumar o restar varios vectores recibe el nombre de resultante, al ser equivalente a la acción conjunta de sus diversos componentes. Así, puede decirse que la composición de varios vectores es equivalente a su suma. Al igual que de varios vectores puede obtenerse la resultante de su suma, también es factible el paso inverso consistente en descomponer vectorialmente un vector en varios, una técnica de gran interés para la resolución de problemas:

s

y

b r

3. Suma de dos vectores libres: dados dos vectores libres el vector suma s es el que une el origen de a con a y b,

13

equipolente a b y cuyo origen es el exel extremo de b’, tremo de a :

v

a

Mecánica y fuerzas

r2

r r1

x


14

FÍSICA

________________________________________________________________________________________________________

descomposición vectorial del vector r , obteniéndose r 1 y r 2

Producto de un escalar por un vector. El producto de un escalar n por un vector r es otro vector cuya dirección coincide con la de r , al igual que su sentido si el escalar es positivo (el sentido será opuesto si tiene signo negativo). El módulo del resultado es igual al producto del escalar n por el módulo de r . Por tanto, el vector nr queda determinado por: Módulo = |nr |. Dirección = la misma que la de r . Sentido = si n > 0, el mismo que r; si n < 0, el opuesto a r . Producto escalar de dos vectores. Al realizar el producto escalar de dos vectores se obtiene un escalar. El resultado de esta operación es el producto de los módulos de los vectores que se multiplican por el coseno del ángulo que forman entre ellos:

· cos α a · b = |a | · |b| Producto vectorial de dos vectores. El producto vectorial de dos vectores v 1 y v 2 es un nuevo vector de dirección perpendicular al plano formado por v 1 y v 2, cuyo sentido es el del avance de un tornillo o un sacacorchos que girase de v 1 hacia v 2, y su módulo se obtiene por el producto de v 1 por v 2 y por el seno del ángulo que forman: | v1 v 2| = | v1| · | v2| · sen α

v v2 v1

v2 α

2. Dirección. Recta sobre la que actúa la fuerza y a través de la cual se desplazará el cuerpo. 3. Sentido. Cada una de las dos posibilidades que tiene la fuerza de orientarse sobre el eje señalado por su dirección. 4. Intensidad. Medida de la fuerza con respecto a un valor unitario que se admite por convenio. En el Sistema Internacional, la unidad de fuerza es el newton. Como puede verse por los parámetros que definen a una fuerza, se trata de una magnitud vectorial y, por tanto, cumple todas las propiedades de los vectores.

Momento de una fuerza Las fuerzas aplicadas sobre un cuerpo, además de producir en él deformaciones y traslaciones, también pueden rotar en torno a un punto o un eje para dar lugar al momento de una fuerza. Algunos ejemplos cotidianos de estos momentos de fuerzas son abrir o cerrar puertas y ventanas, girar las ruedas de un coche, etc. En lenguaje formal, se llama momento de una fuerza respecto de un eje perpendicular a la fuerza al producto de la distancia del eje a la dirección de la fuerza por la intensidad de dicha fuerza. De esta definición se deduce que el efecto de la fuerza varía con la distancia al eje de giro, por lo que será más fácil abrir una puerta cuanto más lejos de la bisagra se aplique la fuerza. El momento de una fuerza es una magnitud vectorial; el vector que la representa es perpendicular al plano que forma la distancia al eje y la fuerza:

OF = XO F 1 = XB F 2 M X B

Doble producto vectorial. El producto vectorial de v 1 por el producto vectorial de v 2 y v 3 es igual al valor escalar resultante del producto escalar del primer y el tercer vector por el segundo menos el producto escalar del primer y el segundo vector por el tercero. Expresado en términos matemáticos: v 1 ( v 2 v 3) = ( v 1 · v 3) · v 2 – ( v 1 · v 2) · v 3

Concepto de fuerza La fuerza se puede definir como una magnitud vectorial capaz de deformar los cuerpos (efecto estático), modificar su velocidad o vencer su inercia y ponerlos en movimiento si estaban inmóviles (efecto dinámico). También el peso se considera una fuerza, ya que se manifiesta de la misma forma, a pesar de sus particularidades. El concepto de fuerza, a pesar de ser uno de los más importantes en el estudio de la física, no siempre se utiliza correctamente. Para definir una fuerza es preciso considerar cuatro parámetros, que son: 1. Punto de aplicación. Punto del cuerpo sobre el que se aplica la fuerza.

F2

O

F1

_ Preguntas de repaso 1. Calcular el producto escalar y vectorial entre v y w: w v

90º

2. Decir si las siguientes afirmaciones son verdaderas o falsas: a) Una fuerza única no produce equilibrio. b) La estática estudia las fuerzas como causantes del equilibrio de los cuerpos. c) Dos fuerzas son concurrentes cuando sus direcciones pasan por un mismo punto de aplicación.


ESTÁTICA

L

a estática es la parte de la mecánica que estudia la acción de las fuerzas como causantes del equilibrio de los cuerpos.

Equilibrio de un sólido Un sólido está en equilibrio estático cuando todas aquellas fuerzas que actúan sobre él no modifican su estado de reposo, por lo que su resultante y el momento de las fuerzas deben ser nulos: Σ Fi = 0

ΣMi = 0

Par de fuerzas Se denomina par de fuerzas al resultado de aplicar en puntos diferentes dos fuerzas iguales en intensidad, paralelas y de sentido opuesto. El efecto de un par de fuerzas aplicado sobre un cuerpo da una resultante de valor nulo. El efecto que se produce en el cuerpo no es de traslación, sino de rotación. Así, se infiere que los movimientos de rotación de los cuerpos se deben a la acción sobre ellos de un par de fuerzas. Momento de un par de fuerzas. El módulo de un momento de un par de fuerzas es igual al producto del brazo del par por la intensidad de una de las fuerzas (ambas fuerzas son de igual intensidad): = d · F M d = XY · sen α

Si un sólido que está sometido a dos fuerzas permanece en equilibrio, ello indica que dichas fuerzas tienen el mismo módulo, igual dirección y son de sentido contrario. Por ejemplo, si se suspende un sólido de un solo punto, dicho sólido permanecerá en equilibrio por el efecto de dos fuerzas: su peso, que se aplica sobre su centro de gravedad (c.d.g.), y la fuerza de reacción que ejerce el punto de apoyo sobre el cuerpo:

= XY · sen α · F M X

d

–F F F=–P P

De igual forma, si el sólido se mantiene en equilibrio sobre una superficie horizontal, dicho equilibrio se produce por el efecto de dos fuerzas de igual módulo y dirección y sentido contrario. Una de las fuerzas es su peso aplicado en el centro de gravedad, y la otra es la reacción normal del plano, que se aplica en el mismo punto:

F α Y

El momento de un par de fuerzas es una magnitud vectorial; el vector que lo representa es, por tanto, perpendicular al plano formado por las dos fuerzas y su sentido se corresponde con el producido al avanzar un tornillo que girase con el par. El sentido del par se caracteriza por el sentido de giro, el cual se establece previamente. Por convenio se suele considerar como giro positivo el que tiene lugar en sentido contrario a las agujas del reloj. Dos pares de fuerzas se consideran equivalentes si sus momentos son iguales: 2 = 4 · 4 = 16 M

1 = 2 · 8 = 16 M F

N

F'

N=–P P

–F

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).

– F'


16

FÍSICA

________________________________________________________________________________________________________

Por su parte, dos pares de fuerzas se equilibran entre sí cuando sus momentos tienen un mismo módulo y son mutuamente opuestos (giran al revés): F

F'

–F

Por otra parte, para incrementar la estabilidad de un cuerpo se debe procurar que su centro de gravedad esté localizado lo más bajo posible y que su base sea muy ancha. Un claro ejemplo de ello lo constituyen los automóviles deportivos, que suelen ser muy bajos y de anchura considerable para garantizarles que sean más estables y veloces:

– F'

M1 = 5 · 4 = 20

M2 = 2 · 10 = 20 c.d.g.

Centro de gravedad En la naturaleza, las fuerzas que actúan sobre casi todos los cuerpos se ejercen sobre los diferentes puntos de dichos cuerpos. Por ejemplo, todas las partículas de un sólido son atraídas por la Tierra por una fuerza igual a los pesos de la totalidad de las partículas que lo componen:

• •

• • • • c.d.g. • • •

R

en equilibrio

Objetos ordenados de mayor a menor estabilidad

En física, se califica de máquinas simples a la polea, el torno, la palanca y el plano inclinado. Todos estos mecanismos se utilizan para contrarrestar los efectos de unas fuerzas llamadas resistentes (Fr) por medio de la acción de otras denominadas motrices (Fm). Gracias a las máquinas es posible vencer grandes fuerzas resistentes aplicando pequeñas fuerzas motrices. Por ejemplo, en una mudanza un solo empleado será capaz de subir a un octavo piso un mueble mediante la utilización de una polea. Agrupando en dos resultantes, por un lado, todas las fuerzas resistentes y, por otro, las motrices, se obtiene la denominada magnitud de desarrollo mecánico. El desarrollo mecánico (Dm) es la capacidad de una máquina para transformar fuerzas, y se expresa mediante la siguiente fórmula: Dm = Fr / Fm

c.d.g. •

Pues bien, para que un cuerpo se encuentre en equilibrio estable, la línea vertical proyectada desde su centro de gravedad debe pasar por su base:

c.d.g.

c.d.g.

Máquinas

No obstante, es posible sustituir, en un plano teórico, el efecto de todas las fuerzas por una sola resultante de su acción conjunta. La resultante determina el peso, la dirección y el sentido de la fuerza. Al punto de aplicación de esta fuerza resultante se le denomina centro de gravedad (c.d.g.) del cuerpo. El centro de gravedad no tiene por qué estar localizado en el propio cuerpo. Así, el centro de gravedad de una esfera hueca se situaría en el centro geométrico de la esfera, análogamente a lo que sucede con un anillo, que tendría su centro de gravedad en su centro geométrico:

c.d.g.

c.d.g.

c.d.g.

c.d.g.

no en equilibrio

Polea La polea simple es una máquina compuesta por un disco acanalado giratorio de un eje fijo sostenido por un estribo y fijado a un soporte. Por el canal del disco se hace pasar una cuerda que, por un extremo, sujetará el objeto que se desplaza; en el otro extremo se aplicará la fuerza motriz. Con la polea no se logra reducir la fuerza motriz (sin considerar rozamientos), sino que se busca cambiar la dirección de la fuerza resistente y hacer su aplicación más cómoda. Para reducir la fuerza resistente se pueden montar varias poleas consecutivas, con lo que se logra distribuir la resistencia por todos los puntos de la cuerda. Estas máquinas reciben el nombre de polispastos:


______________________________________________________________________________________________________

Estática

17

pinzas para mariscos son un ejemplo ilustrativo de esta clase de palanca. – Palancas de tercera especie, cuya fuerza motriz se encuentra entre el punto de apoyo y la fuerza resistente, como sucede, por ejemplo, en las pinzas para hielo.

P P

Plano inclinado R

–F

El plano inclinado considerado como máquina es simplemente un plano rígido en posición oblicua (ni horizontal ni vertical). Si la fuerza motriz es paralela a la del plano, para que se alcance el equilibrio es necesario que la relación entre esta fuerza motriz (F) y la resistente (R) sea igual a la establecida entre la altura del plano (h) y su longitud (l):

F

R

Torno

F

El torno es una máquina provista de dos discos acanalados y que atraviesan el mismo eje, sujetos por un estribo que está fijado a un soporte. Con el torno se consigue reducir la acción de la fuerza motriz. En él se cumple que: r

R R

F = h R l

R

Si la fuerza motriz es paralela a la base del plano inclinado, para que se alcance el equilibrio es necesario que la relación entre la fuerza motriz (F) y la resistente (R) sea igual a la formada entre la altura (h) y su longitud de la base del plano (b):

P2

P1

h

l

P 1 · r = P2 · R

Palanca La palanca se puede definir como una máquina que únicamente consta de una barra rígida que oscila sobre un punto de apoyo. Su desarrollo mecánico puede calcularse simplemente mediante el equilibrio de todas las fuerzas y momentos que actúan sobre ella. Matemáticamente se expresa así:

F h RR b

F = h R b

F

l1

l2 α

_ Preguntas de repaso

R

· l2 · cos α = 0 · l1 · cos α – |F| |R| Este cálculo se considera ideal, dado que se desprecian todas las fuerzas de rozamiento, que complicarían considerablemente estas sencillas expresiones. Las palancas se clasifican en tres grupos: – Palancas de primera especie, que tienen el punto de apoyo entre la fuerza resistente y la motriz. Ejemplos de esta categoría son los alicates y la balanza. – Palancas de segunda especie, con la fuerza resistente situada entre el punto de apoyo y la fuerza motriz. Las

1. Calcular la intensidad y el punto de aplicación de la resultante que equilibra a dos fuerzas paralelas y del mismo sentido, que actúan en los extremos de una barra de un metro y que tienen unas intensidades de 50 y 25 N. 2. Un niño quiere abrir una puerta de 80 cm de ancho, haciendo para ello una fuerza perpendicular a la puerta de 25 N desde su extremo. Mientras tanto, el padre intenta impedírselo haciendo una fuerza de 60 N a una distancia de 20 cm del eje. Determinar si la puerta terminará por abrirse o no.


CINEMÁTICA

S

e llama cinemática a la rama de la física que estudia los movimientos y las leyes que los rigen, independientemente de las causas que los hayan producido.

Elementos del movimiento En física se puede definir el movimiento como el cambio continuo de posición de una partícula. Este cambio de posición recibe el nombre de desplazamiento, por lo que puede decirse que el desplazamiento es originado por un movimiento. Para completar un desplazamiento, un cuerpo pasa por una serie de puntos consecutivos que configuran una trayectoria. Si la unión de todos los puntos que definen un desplazamiento constituye una trayectoria recta, el movimiento se dice rectilíneo. De igual forma, si la trayectoria es curva, el movimiento se llama curvilíneo. Al contrario que en los rectilíneos, en un movimiento curvilíneo la trayectoria y el desplazamiento no coinciden:

referencia puede ser absoluto o relativo, según se defina con ejes de referencia fijos o determinados con respecto a otros puntos de referencia. Para situar una partícula en el espacio se suelen utilizar ejes cartesianos perpendiculares entre sí, que se identifican con los símbolos X, Y, Z. Si, en cada instante, se une la posición de una partícula en movimiento con el origen del sistema de referencia, se formará un vector con extremo en la posición de la partícula, que recibe el nombre de vector de posición de la partícula. Al moverse en el espacio, la partícula habrá pasado al cabo de cierto tiempo de estar en el punto A (x, y, z) al A’ (x’, y’, z’), de lo que se deduce que el vector de posición también variará en función del tiempo, algo que se indica de la siguiente forma: r = r (t) Y el desplazamiento de la partícula se indicará también como: ∆r = r’– r

y

Trayectoria

o

Desplazamient

x

Para la consumación de cualquier movimiento, por breve que éste sea, se necesita un tiempo determinado. Así, podría decirse que un cuerpo se mueve cuando su posición con respecto a un sistema de referencia varía con el tiempo. El sistema de referencia permite localizar y ubicar en el espacio cualquier partícula que se desplace. El sistema de

El movimiento de la partícula de X a X’ en un tiempo determinado permite conocer la velocidad media del desplazamiento, que se calcula como la relación constante existente entre el espacio recorrido por un cuerpo y el tiempo empleado en recorrerlo. En el Sistema Internacional (S.I.), la unidad de la velocidad es el metro por segundo (m/s). Si la velocidad en el desplazamiento no es constante, es posible utilizar el concepto de velocidad instantánea en cada punto de la trayectoria para poder describir el movimiento: vmedia =

∆r ∆t

donde ∆r es el cambio de longitud y ∆t el incremento de tiempo. Cuando la velocidad de una partícula varía en el transcurso del tiempo, se dice que existe una aceleración. Si en

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


____________________________________________________________________________________________________

t segundos la velocidad de la partícula cambia en v m/s, su aceleración media se define como el cociente: amedia =

∆v ∆t

con ∆v el cambio de velocidad y ∆t el incremento de tiempo. Tanto la velocidad como la aceleración son magnitudes vectoriales dotadas de un módulo, una dirección y un sentido. A escala de su trayectoria global, pueden distinguirse dos componentes de la aceleración: uno tangencial o tangente a la trayectoria y otro centrípeto o dirigido al centro geométrico en torno al cual se describe la trayectoria.

Cinemática

19

Movimiento rectilíneo uniforme Un cuerpo se desplaza según un movimiento rectilíneo uniforme cuando su velocidad es constante en todos sus parámetros: módulo, dirección y sentido. Por ello, la velocidad media del desplazamiento coincide con la instantánea en todos los puntos de su trayectoria. Un movimiento rectilíneo puede ser uniforme o acelerado. En el movimiento uniforme, la velocidad permanece constante, mientras que en el acelerado cambia con el paso del tiempo. Cuando el cambio de velocidad en cada segundo es constante, el movimiento se dice uniformemente acelerado. En un movimiento rectilíneo uniforme, el espacio que se recorre en un tiempo determinado viene dado por la siguiente expresión: s=v·t

Tipos de movimientos

(s: espacio, v: velocidad, t: tiempo)

En virtud de su tipo de trayectoria, los movimientos pueden ser rectilíneos o curvilíneos. Movimientos rectilíneos son los que poseen una trayectoria recta y en los que la velocidad sólo cambia de módulo, manteniendo constantes la dirección y el sentido. En los movimientos rectilíneos, la aceleración sólo posee componente tangencial, sin aceleración centrípeta debido a que el radio de la trayectoria es cero. Movimientos curvilíneos son los que poseen una trayectoria curva, ya sea parabólica, elíptica, circular, etc. En el movimiento curvilíneo sí aparece un componente centrípeto de la aceleración, cuya dirección es la del radio de la curva que describe, con sentido hacia el centro. El módulo de la aceleración centrípeta es igual al cociente del cuadrado del módulo de la velocidad entre el módulo del radio: 2 | ac| = v r

En caso de que el origen de coordenadas no coincida con el de partida del movimiento habrá que añadir un término de desplazamiento igual a la constante s0: s = s0 + v · t Para ilustrar gráficamente un movimiento, se dibuja su curva representativa en un sistema de coordenadas: s s = s0 + vt s = vt t Diagrama espacio-tiempo (s-t) de un movimiento rectilíneo uniforme. La pendiente de la recta representa la velocidad del cuerpo en desplazamiento

v v = cte S=v.t

ac

o

t at

a a t : aceleración tangencial

a c: aceleración centrípeta

Diagrama velocidad-tiempo (v-t) de un movimiento rectilíneo uniforme. El área de color azul representa el espacio recorrido por el cuerpo que se desplaza

Al ser la velocidad constante, su representación gráfica siempre será una recta paralela al eje de tiempos. Si la recta se encuentra por encima del eje, la velocidad es positiva; en caso contrario, la velocidad será negativa.


20

FÍSICA

________________________________________________________________________________________________________

Movimiento rectilíneo acelerado

Movimiento circular uniforme

Este tipo de movimientos se caracteriza por poseer una aceleración constante cuya dirección y sentido son los mismos que en la velocidad (salvo que el movimiento sea uniformemente retardado, en cuyo caso la deceleración tiene sentido opuesto a la velocidad). Al ser la aceleración constante, tanto la aceleración media como la instantánea tienen el mismo valor. La velocidad se expresa por la siguiente ecuación:

Un cuerpo tiene movimiento circular uniforme cuando se desplaza según una circunferencia y recorre arcos iguales en tiempos iguales. A diferencia del movimiento rectilíneo uniforme, el circular uniforme sí posee una aceleración, en este caso centrípeta o normal, siempre dirigida hacia el centro de la circunferencia y perpendicular a la trayectoria en todos y cada uno de sus puntos. La aceleración centrípeta en el S.I. se mide en metros por segundo al cuadrado (m/s2) y su módulo viene dado por la siguiente expresión:

vfinal = v0 + a · t siendo v0 la velocidad inicial, a la aceleración y t la variable tiempo. Si cuando t0, v0 = 0, entonces: vfinal = a · t La ecuación general de un movimiento rectilíneo uniformemente acelerado es: S = S0 + v0 · t +

1 a · t2 2

Donde s0 es el espacio inicial y v0 la velocidad inicial, es decir, la que tiene el móvil cuando se empieza a contar el tiempo. Si s0 = 0, la expresión se reduce a:

2 an = v R

siendo v la velocidad lineal y R el radio de la circunferencia (radio de curvatura). Velocidad lineal y angular del movimiento circular uniforme. La velocidad lineal o de traslación de un cuerpo que sigue una trayectoria circular es igual al arco que recorre en la unidad de tiempo:

y

x

x'

y

1 S = v0 + t + a · t2 2

2 O

y'

Si además de s0 = 0, el cuerpo parte de una situación de reposo (v0 = 0), la ecuación se simplifica aún más: s=

1 a · t2 2

En caso de movimientos uniformemente retardados, las anteriores fórmulas también resultan válidas, aun cuando el valor de la aceleración será negativo por oponerse al movimiento del cuerpo. La representación gráfica espacio-tiempo de un movimiento uniformemente acelerado tiene forma de parábola, como corresponde a su ecuación matemática: v

S 4

a = m/s

0

v = v0 + a . t v=v.t

1

2

t

0

v=

arco descrito tiempo empleado en recorrerlo

En un movimiento circular uniforme, la velocidad angular es el ángulo recorrido por unidad de tiempo. Así, es igual el ángulo barrido por el vector de posición OX en la unidad de tiempo. La velocidad angular se representa por ω y se mide en radianes por segundo (rad/s):

2

1

La velocidad lineal del punto 1 será: v1 = x x’/t, y la del punto 2, v2 = y y’/t. Se deduce fácilmente que si el tiempo es igual en ambos casos, v1 > v2, por lo que la velocidad lineal es directamente proporcional al radio de giro:

t

Por su parte, la representación de una gráfica velocidad-tiempo es una recta cuya pendiente refleja la aceleración del movimiento.

ω=

arco descrito = ϕ tiempo empleado t

Un radián es el valor del ángulo central de una circunferencia que abarca un arco de longitud igual al radio. Por tanto: 360º = 2π rad.


____________________________________________________________________________________________________

La frecuencia (N) de un cuerpo que se mueve con movimiento circular uniforme es el número de vueltas (o ciclos) que da por unidad de tiempo. Cuando el ángulo ϕ = 2π rad (una vuelta completa), entonces t = T, un tiempo que recibe el nombre de período:

Cinemática

21

X A A O

1 2

ω = 2π · rad/s T Si el cuerpo completa N vueltas (en un segundo), en dar una vuelta tardará 1/N segundos, o sea, el período T. Entonces: ω = 2πN rad/s La velocidad lineal (v) es igual al producto de la velocidad angular por el radio (m/s): v=ω·R

Aceleración angular La aceleración angular es el cociente entre la variación de la velocidad angular y el tiempo en que se produce esta variación de velocidad. En el S.I. se mide en radianes por segundo al cuadrado (rad/s2):

α=ω t

N = 1/T

Movimiento circular uniformemente acelerado. Las fórmulas de velocidad y espacio del movimiento circular uniformemente acelerado son equiparables a las del movimiento rectilíneo. Así pues, las respectivas magnitudes angulares se expresan de la siguiente forma: Velocidad angular: ω = ω0 + αt Espacio angular: ϕ = ϕ0 + ω0t +

La máxima distancia que separa un punto de la posición de equilibrio recibe el nombre de amplitud, y se representa con la letra A. En la representación, es el segmento OA. La distancia a que se encuentra el punto en cualquier instante del movimiento con respecto a la posición de equilibrio se denomina elongación (X). Por tanto, podría definirse la amplitud como la máxima elongación posible. En la representación, los segmentos O1 y O2 son elongaciones en un momento dado. Período es el tiempo que invierte el móvil en dar una vuelta entera a la circunferencia. Se representa con el símbolo T y en el S.I. se mide en segundos. Al número de veces que el móvil pasa por un mismo punto en la unidad de tiempo (segundos) se le llama frecuencia, magnitud que puede también definirse como la inversa del período:

1 2 αt 2

donde ω: velocidad angular; ω0: velocidad angular inicial; α: aceleración angular; ϕ: ángulo; ϕ0: ángulo inicial; t: tiempo.

Movimiento armónico simple Se llama movimiento armónico simple al desplazamiento que produce la proyección de una masa puntual sobre el diámetro de una circunferencia cuando se desplaza sobre ella con movimiento circular uniforme. Cuando el móvil completa una vuelta alrededor de la circunferencia, y la proyección del punto ha recorrido enteramente el diámetro en ambas direcciones, se dice que se ha producido una oscilación completa:

La ecuación que gobierna el movimiento armónico simple es: A = X · sen ωt

_ Preguntas de repaso 1. Un hombre se desplaza en motocicleta en dirección rectilínea a una velocidad de 95 km/h durante 30 km, pero al llegar a una montaña reduce su velocidad a 48 km/h durante 22 km. Calcular la velocidad media de todo el desplazamiento. 2. Un ciclista consigue mantener una velocidad constante de 30 km/h. Sabiendo que la rueda tiene un diámetro de 0,6 m, calcular: a) La velocidad angular de una rueda. b) La aceleración centrípeta de las ruedas. c) Las vueltas que da cada rueda por cada kilómetro que recorre la bicicleta.


DINÁMICA

L

a dinámica es la parte de la mecánica física que estudia las fuerzas como agentes del movimiento de los cuerpos. Sus principios, ya analizados desde los inicios de la historia de la ciencia, fueron desvelados en la edad moderna por destacados estudiosos e investigadores, particularmente Galileo Galilei, Johannes Kepler e Isaac Newton, considerado el creador de la dinámica clásica.

Leyes fundamentales de la dinámica Según las concepciones de la dinámica clásica, la noción de movimiento está asociada a la de fuerza, de forma que siempre que se desplaza un cuerpo puede hallarse una fuerza determinada que soporta tal movimiento. Por tanto, se podría afirmar que un cuerpo permanece en reposo siempre y cuando no existan fuerzas exteriores actuando sobre él. La resistencia que oponen todos los cuerpos al movimiento, debida a su masa inercial, se llama fuerza de inercia. Aunque fue Galileo el primero en enunciar el principio de inercia, el inglés Newton lo incorporó a sus postulados básicos de la dinámica, por lo que fue llamado primera ley de Newton de la dinámica. Dicho principio afirma que todo cuerpo permanece en su estado de reposo o de movimiento rectilíneo y uniforme a no ser que alguna fuerza exterior actúe para modificar dicho estado. Por tanto, si a un cuerpo se le aplica una fuerza uniforme, se moverá con una velocidad constante mientras no actúen sobre él fuerzas exteriores que lo frenen o lo aceleren. Newton resumió el comportamiento dinámico de los cuerpos sometidos a fuerzas en otras dos leyes consideradas fundamentales. Así, la segunda ley de Newton afirma que la fuerza resultante que actúa sobre un cuerpo es directamente proporcional a la masa y a la aceleración con que se desplaza. Esta ley se expresaría matemáticamente del modo siguiente: ΣF = m · a En la vida cotidiana puede comprobarse la validez de este principio sin más que aplicar una misma fuerza a dis-

tintos cuerpos: éstos se moverán con distintas velocidades, menores cuanto mayor sea su masa. Así, los cuerpos con mayor masa tienen más dificultad para acelerarse que los menos masivos. La tercera ley de Newton, llamada de acción y reacción, dice que siempre que un cuerpo ejerce una fuerza sobre otro, este segundo actúa sobre el primero con la misma fuerza (igual módulo y dirección), pero en sentido contrario. De esta forma, si en la ilustración llamamos F a la fuerza que ejerce el cuerpo de la izquierda sobre el de la derecha y F ’ a la ejercida por el cuerpo de la derecha sobre el de la izquierda, el principio de acción y reacción se expresaría como: F = – F' F

F'

Impulso y cantidad de movimiento Si se escribe la segunda ley de Newton, F = m · a, como: F = m · a → F = m · ∆ v → F · ∆t = m · ∆ v ∆t Se obtiene en el primer miembro ( F · ∆t) una magnitud denominada impulso mecánico, de naturaleza vectorial, que en el Sistema Internacional (S.I.) se mide en newton por segundo (N/s). Por tanto, el impulso mecánico es:

I = F · ∆t En el segundo miembro de la expresión obtenida de la segunda ley de Newton aparece otra nueva magnitud: la cantidad de movimiento o momento lineal de un cuerpo. Esta magnitud se puede definir como el producto de la masa de un cuerpo por la velocidad que adquiere dicho cuerpo. Al igual que el impulso mecánico, la cantidad de movimiento, denotada por p , es una magnitud

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


____________________________________________________________________________________________________

vectorial y, en el S.I., sus unidades son el newton por segundo (N/s) o también su equivalente, kg/m/s. Matemáticamente, la cantidad de movimiento es: p = m · v De lo anterior puede definirse el impulso mecánico como la variación de la cantidad de movimiento en un cuerpo o un sistema dado. Las fuerzas cuya acción es tan breve que no se puede medir en el tiempo reciben el nombre de fuerzas instantáneas. El efecto que producen puede verse como un impulso mecánico o como una cantidad de movimiento equivalente: F · t = m · v El desplazamiento de un cuerpo será rectilíneo y uniforme, con velocidad constante, mientras no actúe sobre él ninguna fuerza exterior (rozamiento, otro cuerpo que lo frene, etc.). Ahora, que si la fuerza que actúa sobre el cuerpo es constante, el cuerpo se moverá con una aceleración también constante, en virtud de la segunda ley de Newton. Conservación de la cantidad de movimiento. El principio de conservación de la cantidad de movimiento fue enunciado por Newton al tiempo que su segunda ley fundamental, y afirma que la cantidad de movimiento de un sistema de masas permanece constante siempre que no actúe sobre él alguna fuerza exterior al sistema. En términos matemáticos se expresaría como:

T=F·s Por consiguiente, pueden producirse dos casos, según el sentido de aplicación de la fuerza: 1. Si la fuerza y el desplazamiento tienen el mismo sentido, el trabajo es positivo y se llama trabajo motor. 2. Cuando la fuerza y el desplazamiento apuntan en sentidos contrarios, el trabajo es negativo y se llama trabajo resistente. Trabajos de fuerzas constantes cuya dirección no es la del desplazamiento. El trabajo que realiza una fuerza constante cuyo punto de aplicación se desplaza en una dirección cualquiera, no coincidente con la de desplazamiento, se calcula como el producto del desplazamiento por la proyección de la fuerza sobre el desplazamiento: W = F · s · cos α Desplazamiento F

Por tanto, la cantidad de movimiento de una masa individual puede variar, pero no así la suma de todas las cantidades de movimiento de un sistema aislado (siempre y cuando no actúen sobre él fuerzas exteriores).

α = 0º

F

α = 45º

F

Trabajo

α = 90º

julio = newton · metro

23

El kilográmetro (kgrm) es la unidad de trabajo en el Sistema Técnico, siendo 1 kgrm = 9,8 J. Por su parte, en el sistema C.G.S. la unidad de trabajo es el ergio, siendo 1 julio = 107 ergios. Trabajos de fuerzas constantes (en magnitud y dirección). Cuando la fuerza que realiza el trabajo es de intensidad constante y el desplazamiento se produce en la misma dirección de la fuerza, el trabajo se obtiene aplicando la fórmula:

Σm · v = constante

El trabajo (denotado por T o W) es una magnitud física que se determina al valorar el esfuerzo”, ya sea éste muscular o el requerido, por ejemplo, para el consumo de una determinada cantidad de combustible por un motor. La realización de un trabajo se debe siempre a la acción de una fuerza y da origen a un movimiento de desplazamiento desde su punto de aplicación. Cuando la fuerza que se ejerce, por ejemplo, en una tracción es igual o inferior a la del peso que se quiere desplazar, se produce un cansancio o fatiga, pero no se realiza ningún trabajo, ya que el cuerpo no se desplaza. Por tanto, una fuerza sólo realiza un trabajo cuando se produce un desplazamiento de su punto de aplicación. En el S.I., el trabajo se mide en julios (J), unidad que se define como el trabajo realizado por una fuerza de un newton cuando su punto de aplicación se desplaza un metro en su misma dirección:

Dinámica

W=0

F α = 180º –W

Si α es un ángulo comprendido entre 0º y 90º, el trabajo es positivo; si α está entre 90º y 180º, el trabajo es negativo. Cuando α = 90º o 270º, el trabajo realizado es nulo (por ejemplo, cuando se lleva algún objeto de la mano, lo que se realiza es una fuerza para sostener el objeto y no un trabajo). Gráficamente, el trabajo puede verse como el área que forman el desplazamiento, representado en el eje de abscisas, y la intensidad de la fuerza constante, en el de ordenadas: F T=F.S S


24

FÍSICA

________________________________________________________________________________________________________

Trabajo realizado por una fuerza variable. Si la fuerza no es constante, esto es, si es función de una variable, el desplazamiento puede descomponerse en otros iguales ∆s, lo suficientemente pequeños como para que en ellos se pueda considerar la fuerza como constante. Para cada uno de estos desplazamientos el trabajo infinitesimal será: ∆W = F∆x el trabajo total: W = ΣF∆x Más exactamente, si se toman límites tendentes a cero en un desplazamiento desde un punto 1 al 2: W = lim ΣF∆x = ∫ 21 F(x)dx Geométricamente, el valor obtenido es el área comprendida entre la función F(x) y los valores 1 y 2 en el eje x: F F(x)

x1

x2

x(S)

Energía

Energía potencial (Ep) Existen en la naturaleza varios tipos de energías potenciales. Así, una carga eléctrica posee una energía potencial eléctrica; un muelle, energía potencial elástica, y un cuerpo que se desplaza en dirección descendente, energía potencial gravitatoria. Esta última se puede definir como la energía que posee un cuerpo en función de la altura a que se encuentre, siendo igual al producto de su masa por la aceleración de la gravedad y por la altura: Ep = m · g · h El trabajo necesario para elevar un cuerpo hasta una cierta altura coincide con su energía potencial, por lo que para medir la energía se utiliza la misma que para el trabajo, el julio.

Potencia La potencia media de una fuerza en un intervalo de tiempo es el cociente entre el trabajo realizado y el tiempo empleado en realizarlo. En forma matemática, ello se expresa como: P= W t

En términos mecánicos, la energía se puede definir como la capacidad de la materia para producir un trabajo en forma de movimiento. De ahí que para realizar cualquier trabajo sea necesario transmitir energía de un lugar a otro. Existen muchas clases de energía: muscular, eléctrica, calorífica, nuclear, etc. La energía mecánica de un cuerpo o un sistema es la suma de sus energías cinética y potencial: E = Ec + Ep Por la ley de conservación, la energía mecánica en un sistema material aislado siempre se mantiene constante.

Energía cinética (Ec) La energía cinética es aquella que posee un cuerpo que lleva una cierta velocidad. El trabajo realizado por una fuerza a lo largo de un desplazamiento se transforma en energía cinética del cuerpo en movimiento, es decir: W = ∆Ec La energía cinética de un cuerpo se define como la mitad del producto de su masa por el cuadrado de su velocidad, es decir: Ec =

1 · m · v2 2

El trabajo es independiente del tiempo que se tarda en realizarlo. Por tanto, un hombre que empuja un carro lleva a cabo el mismo trabajo que el que haría un caballo; la diferencia es que el caballo, al poseer mayor potencia, invierte mucho menos tiempo. La potencia es la magnitud que refleja la rapidez con que se realiza un trabajo. La unidad de potencia en el S.I. es el vatio (W = julio/segundo), que se define como la potencia necesaria para realizar un trabajo de un julio durante un segundo. Otras unidades de potencia ampliamente utilizadas son el caballo de vapor (CV) o caballo de potencia (HP) y el kilogramo por segundo (kg/s), cuyas equivalencias son las siguientes: 1 CV = 75 kg/s 1 CV = 746 W = 0,746 kw El trabajo también se puede expresar como unidad de potencia-tiempo, al ser W = P · t. La unidad en que se mide, desde este punto de vista, es el kilovatio-hora, magnitud igual al trabajo realizado en una hora por una máquina que funciona con una potencia constante de un kilovatio. El kilovatio-hora se simboliza como kwh, y su equivalencia a julios es: 1 kwh = 1.000 J/s · 3.600 s = 3,6 · 106 julios


____________________________________________________________________________________________________

Principios de la dinámica terrestre y celeste Ley de la gravitación universal de Newton Todos los cuerpos son atraídos hacia el centro de la Tierra por una fuerza que recibe el nombre de gravedad. Así, el peso de un cuerpo es la fuerza con que es atraído por la Tierra. Pero este fenómeno no es algo peculiar del planeta terrestre. De hecho, todos los cuerpos materiales se ejercen mutuamente fuerzas atractivas que son producto de interacciones gravitatorias. Ya en 1680, Newton estudió este fenómeno y enunció la ley de la gravitación universal, que afirma que: la fuerza de atracción mutua creada entre dos puntos materiales es proporcional al producto de sus masas e inversamente proporcional al cuadrado de la distancia que los separa. Matemáticamente: F = G · m · 2m’ d

Como ya se ha dicho, la fuerza con que un cuerpo es atraído por la Tierra es igual a su peso, por lo que el peso de un cuerpo situado en la superficie terrestre puede expresarse como: F = P = G · M · 2m’ R siendo M la masa de la Tierra, m la masa del cuerpo y R el radio terrestre. La fuerza con que la Tierra atrae a la unidad de masa se denomina intensidad del campo gravitatorio terrestre (gravedad), y se representa con la letra g. Es decir: g = G · M2 R De donde: P=m·g Por tanto, el peso de un cuerpo no depende sólo de su masa, sino también de la posición de la Tierra en que se encuentre (el valor de R no es perfectamente constante, pues depende de la altitud y está influido por la forma geométrica de la Tierra, más un elipsoide que una esfera).

Leyes de Kepler El alemán Johannes Kepler (1571-1630) propuso un conjunto de principios sistemáticos, obtenidos de la observación

25

de los movimientos de los planetas alrededor del Sol, que han demostrado su validez en el estudio de los desplazamientos de los cuerpos celestes desde el punto de vista de la mecánica clásica. Estos principios, unidos al concepto de gravitación universal debido a Newton, explican con un grado de exactitud bastante elevado el movimiento del Sol, sus planetas y sus satélites en el ámbito del Sistema Solar. En su libro Astronomia Nova (1609), Kepler enunció sus dos primeras leyes, que dicen: 1. Los planetas giran alrededor del Sol en órbitas elípticas, con el astro en uno de los focos. 2. El radio vector que va desde el Sol a un planeta dado barre áreas iguales en tiempos iguales. La tercera ley de Kepler vio la luz por vez primera en el libro Harmonices Mundi, de 1619, y establece que la razón matemática que existe entre los períodos de dos planetas cualesquiera es igual a la razón entre las distancias medias elevada a tres medios (es decir, la razón de las potencias 3/2 de los dos semiejes mayores elípticos). Si T y T’ son los períodos de revolución, y α y α’, los ejes correspondientes, la ley se expresaría matemáticamente:

donde m y m’ son las masas de los cuerpos y d la distancia de separación; G es la llamada constante de gravitación universal, y en el S.I. tiene el valor de: G = 6,67 · 10-11 N · m2/kg2

Dinámica

T2 = α3 T’2 α’3 La ecuación fundamental del movimiento planetario es, por tanto, la siguiente: 2 3 GMs = 4π2 r3 f 2 = 4π 2r T

siendo: Ms: la masa del Sol; r: el radio de la órbita del planeta; v: la velocidad del planeta; T: el período de revolución; f: la frecuencia de giro.

_ Preguntas de repaso 1. Calcular el impulso mecánico de la fuerza que ha actuado para que un coche de 1.200 kg que circula a 60 km/h aumente su velocidad hasta 100 km/h. 2. Un hombre sube un cuerpo de 20 kg por un plano inclinado con una aceleración de 1,5 m/s2, para lo que aplica una fuerza paralela al plano (ángulo de inclinación 30º). Despreciando el rozamiento, calcular: a) La fuerza realizada por el hombre. b) El trabajo, si el plano tiene una longitud de 6 m. c) La potencia desarrollada por el hombre si logra subir el cuerpo en 5 minutos.


HIDROSTÁTICA E HIDRODINÁMICA

Hidrostática La estática de los fluidos o hidrostática es la rama de la física que estudia las propiedades mecánicas de los fluidos en reposo. El estudio de las propiedades mecánicas de los fluidos gaseosos recibe también el nombre de aerostática.

sidad absoluta y la densidad del agua. La densidad de los gases se mide con respecto a la densidad absoluta del aire. Así pues: ρcuerpo d líquido, sólido = ρ agua ρgas d gas = ρ aire

Magnitudes básicas La densidad y el peso específico son las dos propiedades intrínsecas de los cuerpos líquidos y gaseosos que determinan su comportamiento al ser sometidos a fuerzas y presiones. Densidad. La densidad, una de las propiedades características de los cuerpos, se define como el cociente entre la masa del cuerpo y su volumen. Por tanto, la densidad de un cuerpo es la masa de una unidad de volumen. La unidad de la densidad en el Sistema Internacional (S.I.) es el kilogramo por metro cúbico (kg/m3), aunque la más utilizada sea el gramo por centímetro cúbico (g/cm3), que es la unidad de densidad en el sistema C.G.S. (cegesimal). La densidad se suele representar por la letra griega ρ, y en términos matemáticos se expresa como: ρ = m V Así, cuando se dice que un cuerpo es más denso que otro, lo que en realidad se afirma es que una misma masa estará contenida en un volumen menor. Análogamente, un cuerpo es más denso que otro si, con el mismo volumen, pesa más. De la expresión que define a la densidad se puede interpretar la masa de un cuerpo como el producto de su volumen por la densidad del material que lo compone. Matemáticamente: m=v·ρ Densidad relativa (d). La densidad relativa de un cuerpo sólido o líquido es la relación que existe entre su den-

La densidad relativa, lógicamente, carece de unidades al ser una relación entre magnitudes iguales. En la práctica, la densidad relativa expresa cuántas veces es un cuerpo más o menos denso con respecto al agua (si es sólido o líquido) o al aire (si es un gas). Peso específico. El peso específico de un cuerpo se define como el cociente entre el peso del cuerpo y su volumen. Su unidad de medida en el S.I. es el newton por metro cúbico (N/m3) y, en términos matemáticos, se expresaría como: Pe = P V

Densidades de algunos sólidos (T = 20 ºC) Sólido Plomo Hierro Acero Vidrio Aluminio Mármol Tierra Hielo Madera

Gramos/centímetro cúbico 11,3 7,9 7,8 3,0-3,6 2,7 2,7 1,2 0,92 0,2-0,8

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


____________________________________________________________________________________

Densidades de algunos líquidos (T = 20 ºC) Líquido

27

líquidos todas las fuerzas de cohesión están equilibradas. No así en su superficie, donde al existir sólo una atracción desde el interior del líquido, las fuerzas no se compensan, dando lugar a una resultante que atrae a las partículas superficiales del fluido hacia el interior del mismo:

Gramos/centímetro cúbico

Mercurio Leche Agua de mar Agua destilada Aceite Gasolina

13,6 1,03 1,025 1 0,92 0,68

Densidades de algunos gases (T = 0 ºC y P = 1 atm.) Gas

Hidrostática e hidrodinámica

Gramos/centímetro cúbico

Butano Dióxido de carbono Aire Hidrógeno

0,0026 0,0018 0,0013 0,00084

R=0

R

Esta acción sobre las moléculas de la capa superficial del líquido induce en ésta un comportamiento similar al de una membrana elástica. Tal acción es debida a la presencia de la tensión superficial.

Presión hidrostática Siempre que un cuerpo se encuentra en contacto con un fluido, cualquier parte de sus paredes que toca el fluido experimenta fuerzas de presión dirigidas contra él:

Sustituyendo P por m · g en la definición de peso específico, se obtiene la expresión: Pe = m · g/V Sabiendo que m/V es la densidad (ρ), el peso específico puede escribirse también como: Pe = ρ · g Lo que indica que la densidad es una característica constante de cada material, mientras que el peso específico depende del valor de la aceleración de la gravedad (g).

Tensión superficial Se llama tensión superficial a la fuerza ejercida en la superficie de los líquidos por unidad de longitud. Matemáticamente se expresa como: σ= F l En un líquido actúan unas fuerzas de cohesión sobre todas las moléculas que lo componen. En el interior de los

Pelota llena de agua

Las fuerzas de presión ejercidas por un fluido sobre las paredes del recipiente que lo contiene son siempre perpendiculares a dichas paredes. La aplicación de estas fuerzas normales a la superficie y de módulo constante recibe el nombre de presión hidrostática. Esta presión, debida a la fuerza que actúa uniformemente sobre una superficie S, es igual al cociente entre la fuerza y la superficie. Matemáticamente: n= F S De esta expresión se deduce que la presión es directamente proporcional a la fuerza e inversamente proporcional a la superficie sobre la que actúa. Por tanto, al reducir la superficie se pueden conseguir grandes presiones con la aplicación de fuerzas pequeñas (el filo de un cuchillo o la punta de un clavo).


28

FÍSICA

________________________________________________________________________________________________________

La unidad de medida de la presión en el S.I. es el pascal, en homenaje al científico francés Blaise Pascal, que enunció el principio que lleva su nombre. El principio de Pascal para los líquidos afirma que la presión ejercida sobre un determinado punto de un líquido se transmite en todas las direcciones con la misma intensidad y siempre en dirección perpendicular a la superficie donde se encuentra el punto de aplicación. Al igual que los sólidos transmiten las fuerzas que se les aplica, los líquidos transmiten las presiones. Aplicaciones técnicas de este principio son la prensa hidráulica, el elevador hidráulico y los frenos de los coches: F

f

S

Y como el volumen es: V = S · h, se tiene que: F=S·h·δ·g (F, fuerza de la presión; S, superficie; h, altura; δ, densidad; g, aceleración de la gravedad.) Esta fórmula se conoce como principio fundamental de la hidrostática.

Hidrodinámica La hidrodinámica, también denominada mecánica de fluidos o dinámica de los fluidos, es la disciplina científica dedicada al estudio de la mecánica de movimiento de los líquidos y los gases.

Flujo estacionario y flujo turbulento

F = f· S V Un pascal (Pa) es la presión ejercida por la fuerza de un newton que actúa uniformemente sobre una superficie de un metro cuadrado. Se expresa matemáticamente como: 1 Pa = 1 N2 1m Otra unidad de medida de presión muy utilizada es el bar, equivalente a 105 pascales. De todo lo expuesto se deduce que la fuerza de presión sobre una superficie es igual al producto de la presión por la superficie:

Aunque un fluido esté formado teóricamente por unas moléculas entendidas como puntuales en cada instante del movimiento, se considera que se desplaza homogéneamente sin considerar de modo individual la molécula que ocupa cada lugar del espacio en un instante dado. El régimen o movimiento de un fluido en virtud de la disposición relativa de sus moléculas durante el desplazamiento, se puede catalogar en estacionario o laminar y turbulento. El régimen se dice estacionario cuando el fluido se desplaza de modo ordenado a una velocidad uniforme en todos sus puntos, con lo que pueden determinarse con precisión las posiciones concretas de una partícula del fluido en todo momento. Por el desplazamiento paralelo que experimentan sus moléculas recibe también el nombre de régimen laminar. Por su parte, el régimen se dice turbulento cuando las moléculas del fluido se desplazan de manera caótica y desordenada, lo que impide predecir su posición concreta en un momento determinado; las moléculas describen en este régimen trayectorias no paralelas entre sí:

F=p·s

La presión que ejerce el líquido sobre una superficie horizontal sumergida a cierta profundidad es igual al peso de la columna de ese líquido, que tiene como base la superficie, y como altura, la distancia hasta la superficie libre. Es decir: F=P F=m·g=V·δ·g

Estacionario

Turbulento

Ejemplo de régimen aproximadamente laminar serían las aguas de un río en su desembocadura, las cuales fluyen tranquilas y de modo que pudiera considerarse ordenado. Sin embargo, el mismo río en sus fuentes, donde existen corrientes y rápidos, tendrá un régimen claramente turbulento.


____________________________________________________________________________________

En términos matemáticos, el paso de un fluido en régimen estacionario a régimen turbulento se expresa por un parámetro denominado número de Reynolds y depende de la viscosidad de cada fluido. El número de Reynolds es un valor básico en la formulación teórica de toda la hidrodinámica y aerodinámica. Si se asume que un fluido no se puede comprimir, con lo que su densidad sería siempre constante, una partícula que se desplazara por una conducción en el interior del fluido cumpliría la siguiente expresión, denominada teorema de la continuidad, en cualquier sección o filete de la conducción:

Hidrostática e hidrodinámica

29

Tubo Venturi. El efecto Venturi se aprecia cuando un fluido en régimen estacionario pasa de una sección determinada a otra menor. Al llegar a la menor sección, el fluido experimenta una reducción en su velocidad y su presión hidrostática. Venturi ideó un aparato, conocido por venturímetro o tubo de Venturi, que sirve para medir la velocidad de los líquidos. El venturímetro se coloca adosado a la conducción en un punto donde ésta tenga estrechamientos:

S A · V A = SB · V B h SA

VA

VB

SB

SB

d'

VB

a

SA

d

VA

Principios teóricos de la hidrodinámica Las leyes conocidas como teoremas de Bernouilli y Torricelli y efecto Venturi se utilizan en hidrodinámica para expresar el comportamiento físico de los fluidos ideales en régimen estacionario dotados de movimiento. Teorema de Bernouilli. Daniel Bernouilli, físico francés, enunció en 1738 el teorema que lleva su nombre, en el que afirmaba que las presiones totales en dos puntos cualesquiera de un fluido en movimiento, incompresible y sin rozamiento son iguales. Este principio también podría exponerse diciendo que la suma de las presiones hidrostática, potencial y cinética es constante en todos los puntos del fluido. Es decir: P + dgh +

1 dV 2 = constante 2

siendo P la presión hidrostática; el producto dgh, la presión potencial, y 1/2 dV2, la presión cinética. Como el fluido se considera incompresible, el volumen que fluye en un determinado tiempo por una sección dada es igual al que discurre por otro punto en el mismo tiempo, con independencia del valor de la sección de la conducción en el segundo punto: VA B VA A hA

hB

La velocidad del líquido se obtiene mediante la expresión que se indica seguidamente, donde d es la densidad del líquido que fluye por la conducción y d´ la densidad del líquido empleado en el propio mecanismo del venturímetro (un manómetro): V=

2 · a · g · (d’ – d) · h d

En el efecto Venturi se basa el funcionamiento de distintos mecanismos, como los medidores de velocidad del aire o de los aviones. Teorema de Torricelli. En virtud del teorema de Torricelli, la velocidad de un líquido que fluye por una pequeña abertura o poro de un recipiente es igual a la velocidad que tendría el líquido si cayera desde la altura de la superficie libre del líquido:

h

d

V

Al considerar el flujo del líquido como un movimiento uniformemente acelerado en caída libre, y aplicando Bernouilli, la velocidad de líquido será: V = 2 g h con h = altura del líquido y g = aceleración de la gravedad.


30

FÍSICA

________________________________________________________________________________________________________

La presión en la superficie de la masa de agua es igual a la existente en el orificio por donde fluye el líquido. Estas presiones coinciden con la presión atmosférica, un concepto que introdujo el propio Torricelli. Cálculo de la presión atmosférica. La presión atmosférica, descrita por Torricelli en 1643, es la fuerza que ejerce la atmósfera terrestre por unidad de superficie en los cuerpos que se encuentran inmersos en ella. Para calcular el valor de la presión atmosférica, Torricelli llenó un tubo de un metro de mercurio y, tapándolo por el extremo, lo introdujo en una cuba de mercurio (con el experimento realizado al nivel del mar). Al retirar el dedo, el nivel del tubo bajó hasta una altura de 76 cm. En la parte que se vacía existe una presión nula (p = 0), y en la superficie de la cuba y en el interior del tubo al mismo nivel, las presiones son iguales. Esta presión es la atmosférica, que equivale a la presión de la columna de mercurio medida en el interior del tubo de Torricelli:

1 atm = 1 kg/m2 1 atm = 105 pascales 1 atm = 103 milibares 1 atm = 1 bar La presión disminuye con la altura, dado que la cantidad y el peso de aire también disminuye en tales circunstancias. El tubo de Torricelli es simplemente un barómetro con el que es posible medir la presión atmosférica en centímetros de mercurio. En este instrumento, la altura barométrica es la altura de la columna de mercurio, y la cámara barométrica es el espacio vacío situado en su extremo.

_ Preguntas de repaso

p=0

1. Calcular la densidad de un cubo de material desconocido que tiene 13 cm de base y que pesa 2,5 kg.

76 cm

2. Calcular la presión que ejerce el tapón (de 1,1 cm de radio) sobre cada centímetro cuadrado de una botella al cerrarla, si está totalmente llena y el tapón actúa sobre el agua con una fuerza de 1 N.

Hg

La presión atmosférica por el principio fundamental de la hidrostática será igual a: P=δ·h·g Por lo que la presión atmosférica normal, de 76 cm de mercurio, equivaldrá a: P = 13.600 kg/m3 · 0,76 m · 9,8 m2/s = 101.300 N/m2 = = 101.300 pascales Otra unidad utilizada para medir la presión atmosférica, sobre todo en el ámbito de la meteorología, es el milibar. En esta escala, la presión atmosférica equivale a 1.013 milibares. Es también muy frecuente la utilización de la propia presión atmosférica como unidad de presión, en cuyo caso recibe el nombre de atmósfera. Las equivalencias de esta unidad con las anteriores son:

3. Calcular la superficie que deberá tener el émbolo más pequeño de una prensa hidráulica para que en el émbolo mayor, de superficie 0,5 m2, se originen fuerzas de 100 N, si en el menor se aplica una fuerza de 15 N. 4. Calcular la velocidad a la que saldrá el agua de una cisterna colocada en el suelo cuando se abre un grifo en su base. La cisterna, que está al 80% de su capacidad, es cilíndrica y mide 10 m de altura y 3 m de radio. 5. ¿Podría suceder que al fluir un líquido por una conducción, el estrechamiento de la sección provocara un aumento de la presión con respecto a la sección más ancha? 6. Razonar si es cierta la siguiente afirmación: “En las conducciones de líquidos, la presión aumenta con la velocidad, con la altura y en los ensanchamientos de sección.”


TEMPERATURA Y DILATACIÓN

Conceptos generales Concepto de temperatura La idea de temperatura puede explicarse de forma intuitiva por las sensaciones de frío o calor que se experimentan al tocar un cuerpo. Cuando el sentido del tacto indica que un cuerpo está más caliente que otro, tal sensación se expresa diciendo que el primero posee una temperatura mayor que el segundo. Así, si dos cuerpos están igualmente calientes o fríos se dice que poseen la misma temperatura. Pero la fiabilidad de los sentidos para comparar temperaturas es muy limitada, ya que se trata de percepciones subjetivas que pueden estar muy condicionadas por diversos factores. La temperatura es una magnitud mensurable y su correcta medición se realiza por medio de termómetros. Cuando un cuerpo experimenta un incremento de temperatura se debe a que ha recibido una cantidad de energía y, por el contrario, si su temperatura desciende se debe a que ha cedido energía a otro cuerpo o al medio exterior. Al poner en contacto dos cuerpos de distinta temperatura, el más caliente cede energía en forma de calor al cuerpo de menor temperatura hasta que el valor térmico de ambos se iguala en una situación denominada equilibrio térmico.

Termómetros Se puede llamar termómetro a cualquier instrumento o dispositivo que sirve para señalar o medir temperaturas. En realidad, el termómetro lo que mide es su propia temperatura, que se corresponde con la del medio en que se encuentra y con el que ha establecido un equilibrio térmico. Para que el funcionamiento de un termómetro sea correcto deben cumplirse varias condiciones: 1. El termómetro debe alcanzar con la mayor rapidez la temperatura del medio en el que se introduce. 2. El termómetro no debe alterar la temperatura inicial del medio con el que está en contacto. 3. El líquido escogido para la escala de medida debe ser muy buen conductor del calor y su masa lo menor posible.

4. El circuito que contiene el líquido debe ser cerrado y no sufrir pérdidas. El termómetro más común se compone de un tubo capilar cerrado, de vidrio, ensanchado en su parte inferior en forma de depósito. Este depósito contiene un líquido, generalmente azogue o alcohol teñido, que al dilatarse o contraerse por el descenso o aumento de temperatura, señala en una escala los grados de temperatura:

Alcohol Índice de hierro Mercurio Termómetro clínico

Termómetro de máximas y mínimas

Dilatación de sólidos Todo sólido al ser calentado aumenta de volumen, fenómeno que es conocido con el nombre de dilatación térmica. El cuerpo que lo experimenta se dice que ha sido dilatado. Los distintos incrementos de dilatación dependen de la naturaleza del cuerpo calentado.

Dilatación lineal La dilatación de los cuerpos siempre se produce en las tres dimensiones del espacio, de forma que lo que aumenta realmente es el volumen. Sin embargo, cuando se trata de alambres o varillas muy finos, se considera que la dilatación solamente se produce en la dimensión longitudinal, despreciando la producida en las otras dos, de magnitud muy inferior. En intervalos de temperaturas comprendidas entre 0 ºC y 100 ºC, la dilatación lineal es proporcional al aumento de temperatura. Así, puede verse que cuando se duplica o triplica la temperatura de una varilla, el alargamiento de ésta igualmente se multiplica por dos o por tres.

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


32

FÍSICA

________________________________________________________________________________________________________

La dilatación lineal es proporcional a la longitud inicial del cuerpo dilatado. Si éste es homogéneo en la naturaleza de su composición, todas las unidades de su longitud se dilatan por igual, por lo que el alargamiento total aumentará cuanto mayor sea la longitud inicial del cuerpo que se calienta.

De donde: S = S0 · (1 + βt) El factor (1 + βt) se conoce como binomio de dilatación superficial. El coeficiente de dilatación superficial tiene valor de doble magnitud que el coeficiente de dilatación lineal: β=2λ

Dilatación cúbica Las dilataciones lineales se pueden medir mediante un instrumento que es denominado dilatómetro de cuadrante. Coeficiente de dilatación lineal (λ). Se denomina coeficiente de dilatación lineal de un sólido al aumento de longitud que experimenta la unidad de longitud medida (1 m) a 0 ºC, cuando se produce un incremento de temperatura de 1 ºC. En términos matemáticos se expresa como: λ =

l – l0 l0 t

Siendo: l, la longitud a temperatura t a la que se calienta el sólido; l0, la longitud del sólido a 0 ºC; t, la temperatura a la que se calienta el cuerpo. De la anterior fórmula podemos deducir la longitud de una varilla a una temperatura determinada si sabemos su longitud a 0 ºC: l = l0 + l0 λt l = l0 (1 + λt) (1 + λt) se conoce como binomio de dilatación lineal.

En sentido estricto, la dilatación cúbica es la única que de las mencionadas tiene existencia real. Se puede comprobar mediante la experiencia del anillo de Gravesande, que se ilustra en el dibujo: En frío o caliente anillo y esfera

Esfera caliente

– Si sólo se calienta la esfera, ésta no pasa por el anillo. – Si se calientan ambos cuerpos, la esfera pasará por el anillo. – Es indiferente que la esfera sea maciza o hueca, pues los sólidos huecos se dilatan como si fuesen macizos. De la experiencia se extrae la conclusión de que los sólidos se dilatan al ser calentados y se contraen al enfriarse. Coeficiente de dilatación cúbica. El coeficiente medio de dilatación cúbica de los sólidos es el aumento que experimenta la unidad de volumen inicial por cada grado de incremento en la temperatura. Se calcula en términos matemáticos: α =

V – V0 V0 t

Dilatación superficial Se puede hablar de dilatación superficial, al igual que ocurría con la lineal, cuando el cuerpo que se calienta (una chapa o lámina) posee un grosor despreciable frente a su superficie. Coeficiente de dilatación superficial. Se denomina coeficiente de dilatación superficial al aumento de superficie que experimenta la unidad de superficie inicial por cada grado de incremento de la temperatura. En términos matemáticos: β =

S – S0 S0 t

Siendo: V, el volumen a los t ºC a los que se calienta el sólido; V0, el volumen del sólido a 0 ºC; t, los grados centígrados a los que se calienta. De donde: V = V0 · (1 + αt) El factor (1 + αt) se conoce como binomio de dilatación cúbica. El coeficiente de dilatación cúbica es de valor triple que el de dilatación lineal: α=3λ

Dilatación de líquidos Siendo: S, la superficie a los t ºC a los que se calienta el sólido; S0, la superficie del sólido a 0 ºC; t, los grados centígrados a los que se calienta.

Para comprender mejor el fenómeno de la dilatación de los líquidos puede efectuarse la siguiente experiencia:


________________________________________________________________________________________

—3 —1 —2

En un recipiente de cuello estrecho dotado de un tubo fino graduado se vierte agua hasta un nivel “1” y se procede a su calentamiento. Se observa entonces que, primeramente, el agua desciende hasta un nivel “2” y luego se eleva hasta un nivel “3”. Estos cambios de nivel se deben a que en el inicio del proceso, lo que primero se calienta es el recipiente, por lo que aumenta su volumen y el nivel del líquido desciende hasta “2”. Al seguir aplicando calor, el líquido también empieza a dilatarse y se eleva hasta el nivel “3”. El hecho de que el nivel “3” se halle por encima del inicial “1” indica que la dilatación real del líquido es mayor que la experimentada por el recipiente. En los líquidos existen dos coeficientes de dilatación: el real, que corresponde a la verdadera dilatación del líquido, y el aparente, asociado a la diferencia de volumen experimentada por el líquido y la sufrida por el recipiente: γreal = γaparente + γrecipiente

Dilatación de gases a presión constante Los gases se dilatan en mucha mayor medida que los líquidos y los sólidos. Por lo general, cuando se calienta un gas pueden variar a la vez su volumen y la presión a que está sometido, por lo que se puede considerar por separado la variación de volumen cuando cambia la temperatura con la presión constante y cuando se altera la presión manteniendo constante el volumen. El coeficiente medio de dilatación de los gases sometidos a presión constante para un cambio de temperatura entre 0 ºC y t ºC es el aumento de volumen que experimenta la unidad de volumen por cada grado que se incrementa la temperatura. Este coeficiente se expresa mediante la fórmula:

α =

V – V0 V0 t

De donde: V = V0 · (1 + αt) El factor (1 + αt) se conoce como binomio de dilatación de un gas a presión constante. Un gas perfecto es el que mantiene constante el valor α = 1/273, con independencia de la magnitud de su presión y temperatura.

Temperatura y dilatación

33

Escalas termométricas En el S.I. se elige como unidad de temperatura la escala Kelvin o absoluta, cuyos grados se expresan con el símbolo K y la temperatura con T. Los grados Kelvin son propios de termómetros de gas y, debido a su escaso valor práctico fuera del contexto científico, los termómetros más utilizados son los de líquidos (mercurio) y los termopolares (sólidos), con escalas en grados centígrados o Celsius. La escala Celsius tiene dos puntos fijos: 1. El valor cero (0 ºC), que es el punto de fusión del hielo. 2. El punto 100 ºC, correspondiente a la temperatura del agua hirviente a una presión de 1 atmósfera o 760 mm de mercurio. Entre el intervalo de 0 ºC a 100 ºC existen 100 divisiones iguales que corresponden a cada uno de los grados Celsius. Las escalas Celsius y Kelvin son ambas centígradas, con igual valor de su unidad o grado: T (kelvin) = (273 + t) ºC

Escalas termométricas Centígrada Fahrenheit Kelvin Punto de ebullición del agua 100 ºC Pto. de fusión del agua 0 ºC Cero absoluto – 273 ºC

212 ºF 32 ºF – 459 ºF

373 ºK 273 ºK 0 ºK

La escala Fahrenheit se utiliza en países que tienen temperaturas ambiente muy bajas, en particular el Reino Unido, y se relaciona con la escala Celsius por la siguiente expresión: ºF – 32 = 9 ºC 5

_ Preguntas de repaso 1. ¿Cuánto medirá una varilla de acero a 60 ºC, si a 0 ºC su longitud es de 100 cm? Se sabe que el coeficiente de dilatación del acero es de 1,1 · 10–6 ºC–1. 2. Una varilla de hierro de 10 m de longitud a 0 ºC, a 100 ºC mide 10,011 m: a) Hallar los coeficientes de dilatación del hierro y del cobre. La relación entre los coeficientes lineales de dilatación del hierro y cobre es 11/16. b) Calcular la temperatura a la que otra varilla de cobre mediría 10 m, si a 100 ºC su longitud es 10,011 m.


CAMBIOS DE ESTADO

Calor y energía El calor es una clase de energía que puede definirse como el intercambio que tiene lugar como resultado de la existencia de una diferencia o gradiente de temperatura. Los efectos que produce el calor en la materia se pueden clasificar básicamente en: – Dilataciones y aumentos de volumen, abordados en el capítulo “Temperatura y dilatación” (pág. 31). – Cambios de estado (el presente capítulo). La cantidad de calor que necesitará un cuerpo para alterar su temperatura dependerá directamente de su naturaleza, su masa y la temperatura que se pretenda elevar.

Mecanismos de transferencia del calor Para que se produzca la transferencia o intercambio de calor entre los cuerpos existen principalmente dos mecanismos: la conducción y la radiación. Cuando el proceso de conducción va asociado a un movimiento macroscópico de un medio fluido se denomina convección. Conducción. Se llama conducción al intercambio de calor producido de un cuerpo a otro con temperatura más baja y con el que se encuentra en contacto. También se puede producir entre distintas partes de un mismo cuerpo dotadas de temperaturas diferentes. Durante la conducción se produce una transferencia de energía desde las moléculas más energéticas (de mayor temperatura) a las más frías (de menor temperatura). Convección. La convección es el mecanismo de intercambio de calor que se produce cuando un fluido de temperatura conocida se pone en contacto con una superficie sólida que posee una temperatura diferente. Según el tipo de movimiento que experimente el fluido se puede distinguir entre convección natural o libre y forzada. La convección libre se produce cuando el fluido se desplaza impelido por las propias fuerzas de empuje

originadas por la diferencia de temperatura en el fluido. La convección forzada tiene lugar cuando el movimiento del fluido se debe a presiones impuestas artificialmente o al movimiento de la superficie con la que se encuentra en contacto. Radiación. La radiación térmica es un tipo de transferencia de calor de fundamento radicalmente diferente de la conducción y la convección. Se basa en el hecho de que todo cuerpo caliente emite una radiación en forma de ondas electromagnéticas. Las propiedades de esta radiación dependen de la temperatura de la superficie, su naturaleza, la longitud de onda de la emisión y la dirección en que se propague.

Equilibrio térmico Cuando dos cuerpos dotados de diferente temperatura se ponen en contacto, el más energético efectúa una transferencia de energía al de menor temperatura que, por tanto, se calentará. La transferencia o intercambio concluirá cuando los cuerpos adquieran igual temperatura, condición necesaria para que se establezca el equilibrio térmico. Para alcanzar este equilibrio el cuerpo más caliente ha de haber cedido la misma cantidad de calor que la absorbida por el más frío.

Unidades de cantidad de calor Dado que el calor es una forma de energía, su unidad en el Sistema Internacional (S.I.) es el julio, la misma que para el trabajo y la energía. Antes de conocerse la equivalencia entre calor y energía se adoptó como unidad práctica para la medida del calor la caloría, definida como la cantidad de calor necesaria para elevar la temperatura de un gramo de agua destilada de 14,5 ºC a 15,5 ºC (es decir, en un grado centígrado). El símbolo de esta unidad es cal.

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


______________________________________________________________________________________________

Posteriormente, el británico James P. Joule, en la segunda mitad del siglo XIX, dedujo experimentalmente la equivalencia entre la caloría y el julio, que se expresa a continuación: 1 kilocaloría (kcal) = 1.000 cal 1 termia (ter) = 106 cal 1 cal = 4,1868 J 1 J = 0,239 cal 1 cal(termoquímica) = 4,184 J 1 kcal = 4,1868 kJ

Cambios de estado

35

y sobre todo la caloría por gramo y grado Celsius (cal/g · ºC). Se llama capacidad térmica o calorífica (Ct o Cm) a la cantidad de calor necesaria para elevar un grado centígrado la temperatura de la masa m de un cuerpo dado. En términos matemáticos: Q = m · c · (t2 – t1) = Ct · (t2 – t1)

Formas de cambios de estado

En el S.I. no se admite la caloría como unidad elemental de calor, a pesar de lo cual, y aunque indebidamente, continúa siendo de utilización muy frecuente en los círculos científicos y técnicos.

Calor específico y capacidad térmica La cantidad de calor (Q) que ha de aplicarse a un cuerpo cuya masa es m para elevar su temperatura actual t1 hasta t2 viene dada por la siguiente expresión:

Fusión y solidificación La fusión es el proceso por el cual un cuerpo pasa del estado sólido al líquido. Al calentar un sólido cristalino puro de forma continuada llegará a un momento en que dicho sólido cambiará de estado para pasar al estado líquido. La temperatura a la que se produce este cambio se llama punto de fusión:

Q = m · c · (t2 – t1) 0 ºC

La constante de proporcionalidad c es el calor específico del cuerpo, un parámetro que depende de su naturaleza y constitución. Despejando c en la anterior expresión: C=

Q m · (t2 - t1)

Por tanto, la unidad de calor específico en el S.I. será el julio por kilogramo y kelvin: J kg · K En la práctica también se utilizan otras unidades para el calor específico, en particular el J/kg · ºC, el kJ/kg · ºC

Algunos calores específicos Elemento Agua Hielo Hierro Cobre

cal/g · ºC

kJ/kg · K

1,000 0,480 0,119 0,095

4,1868 2,0934 0,4610 0,3977

Determinación del punto de fusión del hielo

El paso inverso por el cual un líquido, al ser enfriado, se convierte al estado sólido recibe el nombre de solidificación. A excepción de los materiales amorfos, que carecen de un punto determinado de fusión, los cuerpos sometidos a los procesos de fusión o solidificación obedecen a las siguientes leyes: – A presión constante, los sólidos se funden a una temperatura determinada, que se denomina temperatura de fusión (punto de fusión). – A presión constante, los líquidos puros inician su solidificación a una temperatura determinada, que recibe el nombre de temperatura de solidificación.


36

FÍSICA

________________________________________________________________________________________________________

– Para cada sustancia, la temperatura de fusión coincide con la de solidificación. – Durante los procesos de fusión y solidificación, la temperatura no varía. – El proceso de fusión absorbe calor, y el de solidificación, lo desprende. – Tanto en la fusión como en la solidificación se producen variaciones de volumen. En general, los sólidos aumentan su volumen al fundirse y se contraen al enfriarse. En algunos casos, como en el hierro fundido, la plata y el agua, sucede el fenómeno contrario (por la misma razón por la que el hielo flota en el agua, ya que es menos denso):

qu

id

o

t (ºC)

Vaporización en el vacío. Este tipo de vaporización tiene lugar cuando el líquido se encuentra en un ambiente libre de cualquier gas. En tal caso, la vaporización es instantánea y concluye cuando el vapor se satura. La presión del vapor saturado es superior a la del vapor seco, siempre y cuando la temperatura permanezca constante. Vaporización en una atmósfera gaseosa. Esta vaporización se produce en líquidos inmersos en un ambiente cerrado, pero que contiene otro gas. A diferencia de la vaporización en el vacío, cuando se trata de una atmósfera el proceso no es instantáneo, y será más lento cuanto mayor sea la presión del gas contenido en el ambiente. La mezcla del gas del ambiente más la mezcla del vapor saturado posee una presión global equivalente a la presión inicial del gas más la presión máxima del vapor: Tubo referencia

Sólido + líquido

90

lid

o

Aire

Aire 8

t (min)

10

Éter t (ºC) Mercurio

Lí id

qu

Si inyectamos éter al presionar la pera, se evapora en el vaso de aire y hace que el mercurio ascienda por el tubo de referencia. Habrá un momento en que, a pesar de seguir inyectando éter, el nivel se estabilizará, pues el aire del vaso se saturará de vapor de éter

o

Sólido + líquido

90

o

lid

8

10

t (min)

Tanto en la fusión como en la solidificación, el paso de líquido a sólido y de sólido a líquido se produce a la misma temperatura

Vaporización La vaporización es el paso de un cuerpo del estado líquido al gaseoso. Este fenómeno se puede producir de cuatro formas diferentes: 1. 2. 3. 4.

Vaporización en el vacío. Vaporización en una atmósfera gaseosa. Evaporación. Ebullición.

Evaporación. Se llama evaporación al cambio de estado de líquido a vapor producido en la superficie de un líquido al dejarlo al aire libre en una atmósfera ilimitada. La evaporación constituye el tipo de vaporización más lento de los existentes. Para un líquido cualquiera, la rapidez de la evaporación se rige por los siguientes principios:

Algunas temperaturas de ebullición Acetona Agua Éter Cloroformo Cobre Carbono Plata

– 88,6 ºC 100 ºC 34,6 ºC 61,30 ºC 2.330 ºC 4.000 ºC 1.950 ºC


______________________________________________________________________________________________

Cambios de estado

37

– A mayor temperatura ambiente, mayor evaporación. – Cuanto mayor es el movimiento del aire en contacto con el líquido, mayor será también la evaporación. – El ritmo de la evaporación es proporcional a la superficie del líquido.

el líquido. Sin embargo, la licuación no tiene lugar a cualquier temperatura por mucho que se eleve la presión. En todos los gases existe una temperatura por encima de la cual la licuación es imposible, es la denominada temperatura crítica.

Ebullición. La ebullición es el paso a estado de vapor de un líquido formado en toda su masa por burbujas gaseosas. Al calentar un líquido aparecen burbujas en su base que, por su menor densidad, se elevan rápidamente hasta alcanzar la superficie, donde se condensan bruscamente. Este proceso produce en el líquido una agitación irregular de sus partículas:

Sublimación

a)

100 ºC

b)

Agua

a) Determinación del punto de ebullición del agua (100 ºC) b) Ebullición de un líquido

El punto de ebullición es la temperatura que debe tener un líquido para empezar a hervir, es decir, comenzar a convertirse en vapor. La temperatura de ebullición depende directamente de la presión atmosférica a que se encuentra el líquido, y aumenta al hacerlo esta presión. En un ambiente a presión constante, la ebullición de un líquido puro se produce siempre a la misma temperatura, que permanece constante mientras dura la ebullición. Los líquidos puros comienzan su proceso de ebullición a la temperatura para la cual la presión de su vapor saturado iguala a la presión que soporta el líquido. El proceso inverso a la vaporización se denomina licuación o paso de un gas al estado líquido. La vaporización puede producirse a cualquier temperatura, siempre que se disminuya convenientemente la presión ejercida sobre

La sublimación, una característica propia de cada sustancia, es el paso directo de un cuerpo en estado sólido al estado gaseoso. En realidad, todos los sólidos se pueden sublimar, aunque para que ello ocurra tienen que estar, en la mayoría de los casos, a una presión muy baja. En condiciones normales, sólidos como la naftalina, el yodo o el arsénico experimentan el proceso de sublimación y desaparecen poco a poco en estado de vapor, de ahí el olor característico que desprenden. Un sólido se sublima cuando, a una temperatura inferior a la de fusión, la presión de su vapor iguala a la presión atmosférica que lo rodea.

_ Preguntas de repaso 1. Por medio de un calentador eléctrico se calienta agua durante 15 minutos. Si el calentador desarrolla una potencia calorífica de 950 vatios, calcular: a) La energía o cantidad de calor que se desprende (en el S.I.). b) Si se aprovecha solamente el 75% del calor desprendido en calentar el agua, hallar la temperatura que tendrá una masa de agua de 750 gramos tomada a 2 ºC. 2. Se introducen 60 g de hielo en un calorímetro que contiene 500 g de agua a 40 ºC. Sabiendo que la capacidad calorífica del calorímetro es de 30 cal/ºC y que el calor de fusión del hielo es Cf = 80 cal/g, hallar la temperatura final. (Un calorímetro es un vaso que permite medir las cantidades de calor que intervienen en una transformación.)


TERMODINÁMICA

Sistemas termodinámicos La termodinámica es la parte de la física que estudia los mecanismos de transformación o transferencia de energía de un cuerpo a otro dentro de un sistema. Se llama sistema termodinámico a toda porción o cantidad de materia definida y limitada por barreras, ya sean éstas reales o imaginarias. Las barreras de un sistema pueden clasificarse de la siguiente manera: – Aislantes, que no permiten el paso de materia ni de energía. – Fijas o rígidas, que impiden los cambios de volumen. – Adiabáticas, que no permiten la transferencia de energía en forma de calor ni de materia. – Impermeables, a través de las cuales no se produce intercambio de materia. – Permeables, que facultan el intercambio de materia y energía en forma de calor. – Diatérmicas, que facilitan el intercambio de energía en forma de calor. – Móviles, que permiten los cambios de volumen. Un sistema termodinámico puede estar confinado por barreras dotadas simultáneamente de varias de las anteriores características, pudiendo ser, por ejemplo, diatérmicas y rígidas al mismo tiempo.

Barreras termodinámicas

{

Aislante Fija y rígida Adiabática Impermeable Permeable Diatérmica Móvil

En virtud del tipo de barrera que poseen, los sistemas termodinámicos se pueden clasificar en los grupos que se indican a continuación:

Abiertos, en los que es posible el intercambio de energía y materia con el medio exterior (medio exterior es todo aquello que sea ajeno al sistema). El hecho de que pueda existir un intercambio de materia indica que al menos una de las paredes del sistema es imaginaria. A su vez, los sistemas abiertos pueden ser estacionarios o no estacionarios. En los primeros, la cantidad de materia que entra en el sistema es igual a la que sale, es decir, el flujo de masa es constante. En los sistemas no estacionarios, la materia que entra no es igual a la que sale. Cerrados, sistemas termodinámicos en los que no puede existir intercambio de materia, pero sí de energía con el exterior. Aislados, sistemas termodinámicos en los que no es posible ni el intercambio con el exterior de materia ni de energía. Térmicamente aislados o adiabáticos, sistemas termodinámicos en los que no se produce intercambio de materia ni de energía en forma de calor con el exterior, pero sí es posible la transferencia de energía en forma de trabajo.

Sistemas termodinámicos

{

Abiertos

{ Estacionarios No estacionarios

Cerrados Aislados Térmicamente aislados o adiabáticos

Variables termodinámicas Se llama variables termodinámicas a las propiedades macroscópicas de los sistemas termodinámicos. Por su parte, se denomina estado a cada una de las diferentes formas en que se puede presentar un sistema termodinámico. Las variables de estado son aquéllas que definen un sistema en equilibrio. Estas variables son la presión, el volumen y la temperatura (simbolizadas, respectivamente, por P, V, T). Si varía una de ellas, se producirá una al-

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


________________________________________________________________________________________________

teración en el valor de, al menos, otra de estas variables, relacionadas entre sí por medio de la ecuación de estado, P · V = n · R · T (n, número de moles de gas; R, constante universal de los gases perfectos). Las variables termodinámicas se pueden dividir en intensivas y extensivas. Se llama variables extensivas a aquéllas cuyo valor se obtiene sumando sus valores en todos los subsistemas en que se puede dividir el sistema principal. Por tanto, dependen de la “cantidad” de sistema que se considere, medida, por ejemplo, en forma de masa, volumen, trabajo, etc. Las variables intensivas son aquéllas en que su valor neto no se obtiene como la suma de los valores parciales en todos los subsistemas. Estas variables no dependen de la cantidad de sistema que se considere, de tal forma que la temperatura o presión de una habitación será la misma con independencia de que se considere, por ejemplo, todo su volumen o una parte de él.

39

Termodinámica

Las transformaciones que se realizan a presión constante se denominan isobaras. Isocoras son aquellas transformaciones que se realizan a volumen constante. Las transformaciones experimentadas a temperatura constante se denominan isotermas. Finalmente, las transformaciones que se realizan sin intercambio de calor con el exterior se denominan adiabáticas. P P

P P = cte

isocora

isobara

O

V = cte

V

P

O

V

P ΣQ = cte

isoterma

adiabática

P, V, T, m

P m

P m2

V T

V2 T

Las variables intensivas no varían, aunque se parta la caja en dos, pero las extensivas sí

T = cte O

V

O

V

Leyes fundamentales de la termodinámica Primer principio de la termodinámica

Estado de equilibrio Se considera que un sistema se encuentra en equilibrio cuando sus variables termodinámicas no varían y son iguales en todos los puntos del sistema. Para determinar el estado de equilibrio basta con tener en cuenta las variables (P, V, T), las cuales son capaces por sí solas de definir el estado de un sistema. Las diferentes formas en virtud de las cuales los sistemas intercambian energía o materia con el entorno o con otro sistema se llaman cambios, procesos o transformaciones. Los cambios de estado se manifiestan a través de alteraciones en las variables de estado. Así, se llaman cambios cuasiestáticos a aquéllos en que se conoce el camino que sigue la transformación y, por tanto, todos sus estados de equilibrio intermedios. Los cambios no estáticos son aquellos en que no es posible conocer los estados de equilibrio intermedios de la transformación, sino tan sólo las variables iniciales y las finales de la transformación. Son procesos reversibles aquéllos en que la transformación de un punto a otro experimenta un cambio cuasiestático y sus puntos de equilibrio están infinitamente próximos. El sistema puede recorrerse tanto en un sentido de la transformación como en el contrario sin que se alteren las condiciones del sistema.

La ley física conocida como primer principio de la termodinámica regula los intercambios de energía en los sistemas termodinámicos. Este principio postula que en todo sistema termodinámico el balance energético global es siempre constante. Consideremos un sistema que después de haber sufrido una serie de transformaciones sucesivas retorna a su estado inicial (realiza un ciclo), y que, además, en dichas transformaciones intervienen como únicas energías el calor Q absorbido por el sistema y el trabajo mecánico W, que es realizado por el mismo. Por tanto, el principio de la conservación de la energía exige que: Q = W. Si el calor fuese menor que el trabajo, y dado que por definición al final del ciclo la situación coincide con la del estado inicial, la repetición sucesiva de la transformación llevaría a obtener de la nada todo el trabajo que se desease. Se habría fabricado así el móvil perpetuo de primera especie, una entelequia de la física clásica refutada teóricamente a mediados del siglo XIX. Si el calor fuese mayor que el trabajo Q > W, repitiendo sucesivamente el ciclo se destruiría cuanta energía se quisiera. Debido a ello podría reformularse el primer principio de la termodinámica afirmando que es imposible la existencia del móvil perpetuo de primera especie; es decir, un sistema cerrado que experimente un proceso cíclico no


40

FÍSICA

________________________________________________________________________________________________________

puede proporcionar mayor cantidad de trabajo que la energía que recibe en forma de calor:

W (–)

W (+) Sistema

Q (+)

Es decir, la cantidad infinitesimal de calor que se comunica a un sistema se emplea, por una parte, en aumentar su energía interna y, por otra, en producir un trabajo exterior. Procesos isocoros. En el tipo de transformaciones denominadas isocoras, el volumen es constante, por lo que dV = 0 y, por tanto, el trabajo también será nulo:

Q (–)

Q = ∆U Sin embargo, en las transformaciones abiertas el estado final de las transformaciones es distinto al inicial. Por tanto, en general, es Q ≠ W o Q – W ≠ 0, lo que es lo mismo. Pero ha de tenerse en cuenta que la energía Q – W, por el principio de conservación de energía, no puede desaparecer. Por ello se considera que esa diferencia de energía ha sido absorbida por el sistema, el cual evoluciona aumentando su energía interna U. Así pues, la transformación puede definirse por la siguiente expresión:

De ello se deduce que en una transformación isocora el calor absorbido (o cedido) por el sistema se utiliza en incrementar (o disminuir) su energía interna. En la representación gráfica de un proceso isocoro se puede apreciar claramente que el trabajo es nulo, pues su función no crea ningún área sobre el eje del volumen (este área sería el trabajo): P

∆U = ∆Q – ∆W Esta fórmula contiene la definición matemática del primer principio de la termodinámica, según el cual la variación de energía interna de un sistema es igual a la diferencia existente entre el calor absorbido por dicho sistema y el trabajo realizado por él. La energía interna puede definirse como la energía total que posee el sistema debido a su masa, el movimiento de sus partículas, su posición en un posible campo de fuerzas, etc. A cada estado del sistema le corresponde una cantidad invariable de energía interna, y la variación que experimenta esta magnitud al pasar el sistema de un estado a otro será independiente de los estados intermedios por los que haya atravesado, es decir, del tipo de transformación experimentada. Por tanto, la energía interna de un sistema es una función de estado cuyo valor depende únicamente de estado del sistema. Podría parecer ilógico que a partir de la diferencia entre el calor y el trabajo, que no son funciones de estado, se obtenga una magnitud que sí lo es. Pero la energía interna de un sistema (U) puede considerarse como la suma de las energías cinética y potencial de todas sus partículas, la primera de ambas determinada por la masa y la velocidad de las partículas y la segunda por las fuerzas de atracción entre ellas. Un sistema que se encuentre en un estado dado poseerá una energía cinética y potencial determinadas y, por tanto, una energía interna que es función del estado del sistema. El primer principio de la termodinámica para una transformación elemental se puede expresar mediante la siguiente fórmula: dQ = dU – dW

O

V

V

dU = dQ = nCV · dT CV = 5 R, para gases de moléculas diatómicas 2 CV = 3 R, para gases de moléculas monoatómicas 2 Si el sistema que realiza la transformación fuera un gas ideal, entonces: P·V=n·R·T Por tanto: P = n·R → T V

P1 P = 2 T1 T2

Procesos adiabáticos. Los procesos adiabáticos son aquéllos en que no se producen intercambios de energía en forma de calor. Estas transformaciones son reversibles por naturaleza. Al ser Q = 0, el primer principio de la termodinámica se reduce en este caso a: dW = – dU


________________________________________________________________________________________________

Es decir, el trabajo en una expansión adiabática se realiza a expensas de la energía interna del sistema, lo que produce una disminución de su temperatura. El valor del trabajo en un proceso adiabático es, por tanto: W1-2 = – (U2 – U1) = U1 – U2 = n · Cv · (T1 – T2) Si T2 es mayor que T1, el trabajo es negativo y el medio exterior suministra trabajo al sistema. Si T2 es menor que T1, el trabajo es positivo y lo realiza el sistema como se representa en el gráfico:

–W

+W

T1 1

T1 < T2

T2

T1

2

1

T2 2

T1 > T2

Termodinámica

41

Al aplicar el primer principio de la termodinámica, sustituyendo el trabajo se obtiene: Qp = U2 – U1 + p · (V2 – V1) = (U2 + pV2) – (U1 + pV1) La suma de las funciones de estado U y pV es, a su vez, otra función de estado que recibe el nombre de entalpía (H). La entalpía, junto con la presión, el volumen y la temperatura, caracterizan el estado del sistema. De la anterior ecuación se deduce: Qp = H2 – H1 o dQp = dH De dicha ecuación se colige que todo el calor que absorbe el sistema, cuando la presión es constante, se emplea en incrementar la entalpía. Si el sistema que evoluciona es un gas ideal, el calor recibido es: Qp = nCp · (V2 – V1)

Si el sistema del proceso fuera un gas ideal, utilizando el coeficiente adiabático γ = 1,4 (γ = Cp/Cv), el trabajo se puede calcular de la siguiente manera:

V1 V = 2 T1 T2

W = P1 · V 1 – P2 · V 2 γ–1 En una transformación adiabática, la presión y el volumen se pueden relacionar entre sí por la siguiente expresión: P1 · V 1γ = P2 · V 2γ P · V 2γ = constante La temperatura se relaciona con el volumen y la presión mediante la fórmula: V·T

1 γ–1

= constante

P·T

γ γ–1

se cumplen las siguientes igualdades:

CP = 5 R, para gases de moléculas monoatómicas 2 Cv = 3 R, para gases de moléculas diatómicas 2 Procesos cíclicos. Aplicando el primer principio de la termodinámica a una transformación cíclica, como en ella es Q = W, la energía interna será nula. Así pues: Q=W

= constante

Procesos isóbaros. Son procesos isóbaros aquellos que se realizan a presión constante.El trabajo producido en este tipo de procesos se puede deducir muy fácilmente si se tiene en cuenta su función en los ejes cartesianos presión-volumen:

Por tanto, no es posible que un sistema cerrado que experimenta un proceso cíclico proporcione mayor cantidad de energía en forma de trabajo de la que recibe en forma de calor. El trabajo total se puede calcular sumando algebraicamente el componente de trabajo de todos los procesos independientes que forman el ciclo.

P

Segundo principio de la termodinámica

P

Consideremos las siguientes experiencias: O

V1

V2

W1– 2 = p · (V2 – V1)

V

1. Dos cuerpos a diferentes temperaturas se ponen en contacto entre sí y se mantienen térmicamente aislados del medio exterior. Ambos cuerpos alcanzan finalmen-


42

FÍSICA

________________________________________________________________________________________________________

te la misma temperatura y la cantidad de calor cedida por el cuerpo más caliente es igual a la recibida por el más frío. 2. Un volante en rotación se detiene por rozamiento en sus cojinetes. La temperatura del volante y de los cojinetes aumenta, siendo el trabajo producido por rozamiento igual a la cantidad de calor absorbida por el sistema para elevar su temperatura. En cada una de estas transformaciones, de acuerdo con el primer principio de la termodinámica, la energía total del sistema considerado permanece constante. Supongamos ahora que los dos sistemas anteriores se encuentran en el estado final de las transformaciones dadas e imaginemos que se producen transformaciones en el sentido inverso. En el primer ejemplo, uno de los cuerpos debe enfriarse espontáneamente y el otro calentarse hasta que se restablezcan las temperaturas iniciales. En el segundo caso, el volante y los cojinetes deben enfriarse y el volante empezar a girar hasta alcanzar su velocidad inicial. La experiencia demuestra que estos procesos nunca se producen en la naturaleza, a pesar de que la energía total del sistema permanece constante y que, por tanto, no están en contradicción con el primer principio de la termodinámica. Así pues, debe existir otra ley natural que determine el sentido de evolución de los procesos en un sistema aislado. Esta ley es el denominado segundo principio de la termodinámica. Al igual que el primero, constituye una generalización de la experiencia y establece que ciertos procesos completamente consecuentes con el primer principio no podrán producirse en la práctica. Muchos enunciados se han propuesto para el segundo principio, todos los cuales coinciden en afirmar que un determinado proceso es imposible. Uno de estos enunciados es el debido a lord Kelvin, quien, en 1851, afirmó que es imposible cualquier proceso cíclico cuyo único resultado sea la extracción de calor de una única fuente y la producción de una cantidad equivalente de trabajo. Un dispositivo que pudiera operar de esta manera se llama móvil perpetuo de segunda especie. Si fuera posible su construcción, extrayendo calor de cualquiera de las fuentes inagotables de la naturaleza (el mar o la atmósfera) podría obtenerse todo el trabajo que se deseara. Se tendría así un movimiento continuo que no estaría en contradicción con el primer principio.

dQrev T

dS =

∆Q = ∆S · T

En los procesos reversibles, la entropía del conjunto sistema-entorno no varía, pero en los procesos irreversibles siempre aumenta.

Entropía y desorden La entropía de un sistema puede relacionarse con la idea de desorden. Supongamos, por ejemplo, que un sistema aislado está formado por dos gases separados por un tabique. Tal sistema posee un cierto grado de orden, en el sentido de que todas las moléculas de uno de los gases están a un lado del tabique y todas las del otro gas se encuentran al otro lado. Si retiramos el tabique, se mezclan las moléculas de ambos gases hasta que, finalmente, ambas clases de moléculas se distribuyen uniformemente en todo el volumen. El orden original ha disminuido, y aumentado el grado de desorden o de mezcla del sistema. Pero también se ha incrementado la entropía del sistema, ya que el volumen que ocupa cada gas se ha duplicado (a T constante, si los gases son ideales) dado que: VB VB

∆S = n · R · ln

Así pues, se puede considerar la entropía como una medida del desorden de un sistema.

Ciclo de Carnot Se llama ciclo de Carnot a un proceso en cuatro pasos que permite transformar calor en trabajo. Para ello, como de acuerdo con el segundo principio no puede transformarse en trabajo el calor recibido de una sola fuente, se dispone de dos fuentes a temperatura diferente, de manera que el sistema absorbe calor de la fuente caliente y cede calor a la fuente fría, realizando además trabajo. El ciclo consta de los pasos siguientes:

P

A Q2

Entropía

4

1 B

La magnitud física denominada entropía y representada con la letra S es una función de estado cuyo comportamiento para el conjunto sistema-entorno muestra diferencias en los procesos reversibles e irreversibles. Para un proceso reversible elemental se define matemáticamente como:

C 3 Q1 O

T2

2 D

T1 V


________________________________________________________________________________________________

1. El sistema absorbe calor Q2 de la fuente a temperatura T2 mediante una expansión isoterma, para pasar de un estado PA, VA y T2 a otro VB y PB a igual temperatura. 2. El sistema se expande adiabáticamente hasta un volumen VD y temperatura T1, menor que T2. 3. El sistema se comprime isotérmicamente a la temperatura T1, cediendo calor Q1, a la fuente fría a temperatura T1, hasta poseer un volumen VA y una presión PA. 4. El sistema se comprime adiabáticamente hasta recobrar su estado inicial. Al representar el ciclo en un diagrama P-V, el trabajo realizado vendrá dado por el área encerrada por las líneas del ciclo. Como el sistema completa un ciclo cerrado, la variación de energía interna es nula. Por tanto, de acuerdo con el primer principio de la termodinámica, el trabajo será: W = Q2 – Q1 (Q1 < 0) El rendimiento termodinámico del ciclo, por definición, es la relación existente entre el trabajo realizado W y el calor absorbido Q2: η=

W Q + Q2 Q = 1 = 1 + 1 (Q1 < 0) Q2 Q1 Q2

Este rendimiento, lógicamente, siempre será menor que uno. Se puede calcular el rendimiento en función de las temperaturas de las fuentes, a partir de la ecuación de estado del sistema. Si se tratara de un gas ideal, podría afirmarse que: – Transformación A-B: WA-B = Q2 = n · R · T2 ln (VB/VA). – Transformación B-D: WB-D = n · Cv · (T2 – T1). – Transformación D-C: WD-C = Q1 = n · R · T1 ln (VC/VD). – Transformación C-A: WC-A = n · Cv · (T1 – T2).

Termodinámica

43

Por tanto, el trabajo total sería: W = n · R · T2 ln (VB/VA) + n · R · T1 ln (VC/VD) y el rendimiento del ciclo, tras sucesivas simplificaciones: η=1–

T1 T2

El rendimiento se incrementa al aumentar T2 y disminuir T1 y, por tanto, al aumentar la diferencia entre estas temperaturas. La existencia de esa diferencia térmica es condición necesaria para que el ciclo produzca trabajo. Si T1 = T2, entonces el rendimiento es nulo, es decir, no se realiza trabajo. El rendimiento del ciclo de Carnot no depende de la sustancia que evoluciona, sino de las temperaturas del hogar y del refrigerante. Por ello, según la teoría todos los ciclos de Carnot que funcionan a las dos mismas temperaturas tienen el mismo rendimiento.

_ Preguntas de repaso 1. Sabiendo que el peso molecular de un gas es 32 y que su coeficiente adiabático es γ = 1,4, deducir los calores específicos de dicho gas a presión y a volumen constante, en unidades del S.I. R = 8.315 J/kmol · K. 2. Componer un cuadro en el que se indiquen las principales características de las transformaciones isoterma, isocora, isobara y adiabática.


MOVIMIENTO ONDULATORIO

Conceptos generales Ondas El término onda se aplica a un amplio conjunto de fenómenos físicos muy diferentes entre sí, como la luz, el calor, el movimiento del agua cuando se arroja un objeto sobre ella, etc. Todos estos fenómenos comparten el hecho de que transportan energía de un punto a otro. Una onda, base del movimiento ondulatorio, se puede definir como el fenómeno de transmisión de una perturbación de un punto a otro del espacio, sin que exista un transporte neto de materia entre dichos puntos. Si la onda se propaga en un medio elástico ideal, la transmisión de energía es completa. Por el contrario, cuando el movimiento ondulatorio se produce en un medio no elástico, la onda es amortiguada y termina por desaparecer, tal y como sucede en la realidad. De particular interés para la física es el estudio del movimiento ondulatorio periódico no amortiguado y sinusoidal, conocido simplemente por movimiento ondulatorio:

Movimiento ondulatorio periódico

Las ondas que necesitan de un medio natural como soporte para su propagación se conocen como ondas materiales y no pueden propagarse en el vacío. A esta categoría pertenecen el sonido y sus fenómenos extremos, los ultrasonidos y los infrasonidos. La velocidad de propagación de las ondas materiales depende directamente de las características elásticas del medio. Las ondas que pueden propagarse tanto en el vacío como en los medios materiales reciben el nombre de electromagnéticas. En este grupo se encuadran las ondas de radio y televisión, el radar, etc. La velocidad de propagación de las ondas electromagnéticas depende de la constante dieléctrica ε y de la permeabilidad magnética µ del medio; en el caso del vacío se tiene que: c=

1 300.000 km/h ε0 · µ0

con ε0 constante dieléctrica en el vacío y µ0 permeabilidad magnética en el vacío. En virtud de la dirección en que se produce la perturbación las ondas pueden ser transversales o longitudinales. En las ondas transversales, las partículas del medio vibran en dirección perpendicular a la del desplazamiento de la onda. Cuando las direcciones de vibración y propagación coinciden, la onda se dice longitudinal. Cuando las ondas longitudinales se propagan por el interior de un fluido se llaman ondas a presión. Éste es el caso del desplazamiento del sonido en el aire:

Movimiento ondulatorio periódico amortiguado V Movimiento ondulatorio periódico no amortiguado y sinusoidal

Clases de ondas Es posible establecer una clasificación de las ondas en función de dos criterios: la naturaleza del medio en que se propagan y la dirección en que se produce la perturbación mientras la onda se desplaza.

V V

Onda transversal

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


__________________________________________________________________________________________

Movimiento ondulatorio

45

siendo v la velocidad de propagación, λ la longitud de onda y T el período. Para determinar la función de un movimiento ondulatorio sinusoidal que lleva vibrando t segundos con una amplitud A y que se encuentra a una distancia x del foco, se emplea la ecuación del movimiento ondulatorio:

V V V V

y = A · sen 2π

(Tt – λx)

Onda longitudinal En la onda transversal, la cuerda oscila perpendicularmente a la dirección en que se propaga la onda. En la onda longitudinal, el muelle oscila en la misma dirección en que se propaga la onda

Ecuación del movimiento ondulatorio Para determinar la función matemática que permita conocer el movimiento ondulatorio sinusoidal, primeramente es preciso conocer las magnitudes que intervienen en él. Amplitud es la máxima elongación que puede inducir un movimiento ondulatorio. Se representa convencionalmente con la letra A. Longitud de onda es la distancia existente entre dos puntos consecutivos de la onda que se encuentren en las mismas condiciones de movimiento, es decir, entre dos pulsos sucesivos. Se representa con la letra λ: λ A

Período es el tiempo necesario para que una partícula efectúe una vibración completa, es decir, el tiempo que transcurre entre dos pulsos sucesivos. Se suele representar con el símbolo T, y en el Sistema Internacional se mide en segundos. Durante un período la onda habrá recorrido la longitud λ. Frecuencia es el número de vibraciones completas efectuadas en una unidad de tiempo (normalmente un segundo). La frecuencia es la magnitud inversa del período, se representa con f y su unidad en el S.I. es el hercio (Hz): f=

donde x, y son las coordenadas horizontal y vertical del punto; A, la amplitud de la onda; T, el período; λ, la longitud de onda, y t, la variable tiempo.

Propiedades de las ondas El paso de una onda de un medio de propagación a otro provoca cambios en la dirección de desplazamiento, en un fenómeno conocido como refracción. Si, por el contrario, la onda “rebota” en el segundo medio y se devuelve al primero, se dice que la onda se refleja. Otras propiedades básicas de la luz son la difracción y las interferencias entre las ondas.

Reflexión Cuando el frente de una onda llega a la superficie de separación entre dos medios que tienen densidades y propiedades mecánicas diferentes, generalmente se originan dos ondas: la refractada, que atraviesa el medio en general con un cambio de dirección, y la reflejada, que es devuelta al primer medio también, por lo general con cambio de dirección. La reflexión produce un cambio de dirección en la onda, regido por las siguientes leyes: 1. El rayo u onda incidente y el rayo reflejado se encuentran en el mismo plano. 2. El ángulo de incidencia, i, y el ángulo de reflexión, r, son iguales: Incidente r

i

1 T

Medio 1 Medio 2

Velocidad de onda o velocidad de propagación Se dice velocidad de propagación a la velocidad requerida para recorrer una longitud de onda en un período de tiempo dado. Siempre que los diferentes pulsos se propaguen con la misma velocidad, para lo cual el medio de propagación ha de ser isótropo, uniforme y homogéneo, se tiene que: v=

λ T

Reflejado

Refractado d

Refracción Se llama refracción al cambio de dirección experimentado por una onda al pasar de un medio a otro en los que posee distinta velocidad de propagación. El fenómeno de la refracción se rige por dos leyes principales:


46

FÍSICA

________________________________________________________________________________________________________

1. El rayo incidente, la normal y el rayo refractado se encuentran en el mismo plano. 2. La relación entre el seno del ángulo de incidencia y el seno del ángulo de refracción es igual al cociente entre las velocidades de la onda en los dos medios:

Agua

Las ondas, al coincidir en un punto, dan origen a una nueva. Sin embargo, antes y después del punto de confluencia, mantienen sus características inherentes, propiedad que caracteriza al movimiento ondulatorio. La coincidencia de dos o más ondas en un mismo punto se llama interferencia. Se entiende por interferencia constructiva cuando la perturbación resultante de la superposición de dos o más ondas supone un refuerzo de las originales. Si, por el contrario, la perturbación resultante es de intensidad menor que las ondas originales, la interferencia recibe el nombre de destructiva:

Difracción Aunque la difracción ya fue descrita por Isaac Newton y Christiaan Huygens en el siglo XVII, fue el francés Jean Fresnel (1778-1872) quien, basándose en un principio enunciado de Huygens, ofreció una explicación detallada de este fenómeno. Así, la difracción, que permite a la luz doblar esquinas o bordear obstáculos, puede explicarse como el resultado de la colisión de una onda con una superficie que no puede atravesar, pero en cuya parte central existe un orificio del tamaño del orden de magnitud de su longitud de onda. En dicho orificio, que actuará como una fuente puntual de onda, se creará un nuevo frente de onda. Por tanto, la difracción se produce con mayor claridad cuando el tamaño del orificio es muy próximo a la longitud de onda del propio movimiento ondulatorio:

Superposición de ondas

Ondas estacionarias. Las ondas estacionarias constituyen un caso particular de las interferencias, en el que las ondas que confluyen son iguales y con la misma dirección, aunque de sentido contrario:

V1 N1

N2 V1

Polarización Se conoce por polarización al fenómeno experimentado por una onda cuando pasa por una pequeña ranura practicada en un cuerpo que no puede atravesar, de modo que sólo se transmite a través del obstáculo la porción de onda que vibra en la misma dirección que la ranura. La onda que atraviesa el obstáculo sólo vibrará en un plano y se dirá que está polarizada:

V2

Al coincidir estas perturbaciones dan lugar a una onda estacionaria, en la que se distinguen puntos inmóviles denominados nodos (N1, N2...) y vientres (V1, V2...), que se desplazan hasta posiciones extremas. En apariencia, la onda produce la sensación de permanecer inmóvil en el espacio, por lo que recibe el nombre de onda estacionaria. Una forma sencilla y fácil de producir una onda estacionaria consiste en superponer la onda incidente en un obstáculo y su onda reflejada.

_ Preguntas de repaso Onda transversal sin polarizar

Onda polarizada

Superposición (interferencias) Cuando dos o más ondas se propagan por el mismo medio, la perturbación resultante en cada punto del medio que recibe ambos movimientos ondulatorios es igual a la suma de las perturbaciones que producirían cada una de las ondas por separado.

1. Contestar razonadamente a estas cuestiones: a) ¿Cuál es la diferencia entre onda y movimiento ondulatorio? b) ¿Pueden producir interferencias un sonido y una onda electromagnética? c) ¿Qué es lo que transmite la onda? 2. Hallar la longitud de onda de un movimiento cuya velocidad de propagación es de 300 m/s, con una frecuencia de 650 ciclos por segundo.


ACÚSTICA

Naturaleza del sonido El origen de cualquier sonido es la vibración de la materia. El ser humano tiene la capacidad de percibir, gracias a su capacidad auditiva, los sonidos que se emiten o propagan con una frecuencia comprendida entre 16 y 20.000 Hz. Este intervalo se conoce como banda acústica. El hecho de que el sonido es producido por la vibración de la materia puede apreciarse con claridad en ejemplos tan cotidianos como: – Los instrumentos musicales, los cuales emiten sonido cuando vibran sus cuerdas (violín o guitarra) o membranas (tambores), o bien el aire en su interior (flautas o trompetas). – La voz humana es producto de la vibración de las cuerdas vocales. Así, también se puede definir el sonido como la sensación provocada por una oscilación de frecuencia audible, es decir, comprendida entre 16 y 20.000 Hz.

El sonido se propaga según movimientos ondulatorios a través de medios materiales. Para definir estos movimientos se emplean magnitudes tales como la longitud de onda, la amplitud, la frecuencia y el período, propias del dominio de la mecánica ondulatoria. Alternativamente, la naturaleza y las características de un sonido pueden definirse perfectamente por otras magnitudes como el tono, la intensidad y el timbre. La velocidad del sonido, en general, es superior en los sólidos que en los líquidos y, a su vez, mayor en éstos que en los gases. La influencia de la temperatura en la velocidad de propagación del sonido en sólidos y líquidos es prácticamente nula. No sucede lo mismo, sin embargo, en los medios gaseosos.

Tono, intensidad y timbre Aparte de las propiedades físicas del sonido, este fenómeno posee como cualidades diferenciativas, relacionadas con el modo de percepción de sus ondas por el oído humano, el tono, la intensidad y el timbre. Tono. Característica del sonido íntimamente relacionada con su frecuencia, el tono permite distinguir entre sonidos agudos y graves. Los primeros son los constituidos por ondas sonoras de alta frecuencia, mientras que los sonidos graves están formados por ondas de baja frecuencia: Sonido agudo

Sonido grave

Velocidad del sonido según el medio de propagación Medio

Velocidad (m/s)

Hierro Aluminio Agua Aire

5.130 5.100 1.460 340

Con independencia de la altura del sonido, lo que nunca varía es su velocidad de propagación. Ahora bien, las notas altas poseen mayor frecuencia y menor longitud de onda que las bajas, al cumplirse la expresión: v=λ·f donde v es la velocidad de propagación; λ, la longitud de onda, y f, la frecuencia.

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


48

FÍSICA

________________________________________________________________________________________________________

Al ser la velocidad constante en un medio dado, al aumentar la frecuencia disminuye la longitud de onda. Intensidad. Se llama intensidad del sonido a la energía transmitida en cada segundo por una onda sonora al atravesar la unidad de superficie perpendicular a la dirección de propagación. En el Sistema Internacional, la unidad de medida de la intensidad del sonido es el vatio por metro cuadrado (W/m2). La propagación de las ondas sonoras tiene lugar en todas las direcciones. Cuando el medio de propagación es homogéneo, las ondas que se forman son longitudinales esféricas. La “fortaleza” o “debilidad” de un sonido, es decir, su intensidad, depende únicamente de la amplitud de sus ondas: Sonido fuerte

Efecto Doppler-Fizeau Cuando se escucha el sonido de un automóvil que circula por una carretera pueden apreciarse variaciones en su tono o frecuencia según se aleje o acerque con respecto al lugar de observación. Los cambios de frecuencia de las ondas cuando existe un movimiento relativo del foco emisor con respecto al receptor son comunes para todos los tipos de ondas. El efecto responsable de este fenómeno se denomina efecto Doppler-Fizeau. En los movimientos relativos de emisor y receptor se pueden dar dos casos: 1. Si el emisor (E) se mueve a lo largo del eje horizontal hacia el receptor (R) con una velocidad vf, en un medio caracterizado por una velocidad de propagación del sonido v, siendo f 0 la frecuencia con que emite las ondas el foco, la frecuencia percibida en el receptor será:

Sonido débil

fr = Para el oído humano existe un límite por debajo del cual no puede percibir ningún sonido. Esa intensidad mínima audible (I0) recibe el nombre de umbral inferior de audición, y depende de la frecuencia del sonido y, sobre todo, de la capacidad auditiva de cada persona. En el otro extremo del intervalo auditivo se encuentra el umbral superior de audición, que corresponde a la máxima intensidad de sonido que el oído es capaz de percibir sin sufrir ningún daño. Por su parte, se llama sonoridad a la intensidad sonora en relación con la capacidad fisiológica propia del oído humano para distinguir entre sonidos de mayor o menor intensidad. La sonoridad o nivel de intensidad se mide en decibelios (dB) y se calcula mediante la siguiente expresión: i = 10 log

f0

(1 ± VV ) f

En la fórmula se atribuye signo positivo al caso en que el foco emisor se aleja del receptor, y negativo cuando se produce el movimiento en sentido contrario. Si en el sentido opuesto al movimiento hubiese otro receptor R’, a ambos receptores llegaría el mismo número de ondas, aunque desigualmente espaciadas (es decir, con distinta longitud de onda): Vf 1 2 3 R'

λ'

λ

E1

R E2 E3

x

I I0

Timbre. La cualidad sonora responsable de que podamos distinguir entre varios sonidos, aunque posean el mismo tono y se perciban con igual intensidad, es el timbre. Esta propiedad permite distinguir claramente si un sonido es humano o, por ejemplo, procede de un piano o una trompeta, aunque todos ellos tengan igual tono e intensidad. El tono fundamental de un sonido es el formado por una onda de una sola frecuencia. En la realidad no existen apenas sonidos que se emitan en su tono fundamental; por lo general, están formados por la superposición de muchas ondas de muy distintas frecuencias múltiplos de la frecuencia del tono fundamental, denominadas armónicos. El tono fundamental se percibe con idéntica impresión sonora para cualquier instrumento, y son el timbre y los armónicos los que caracterizan a cada sonido en concreto.

2. Si el receptor permanece inmóvil y el que se desplaza es el receptor, la longitud de onda no variará, pero sí lo hará la frecuencia de las ondas. Si se aleja, el receptor percibirá ondas con menor frecuencia, que serán de frecuencia superior en caso de que se acerque. La frecuencia de las ondas percibidas por el receptor, fr, viene dada por la expresión:

(

fr = f0 · 1 ±

)

vr v

donde f0 es la frecuencia de emisión; vr, la velocidad del objeto vista desde el receptor, y v, la velocidad de propagación del sonido. Se asigna a esta frecuencia signo positivo cuando el receptor se acerca al foco, y negativo, cuando se aleja de él.


______________________________________________________________________________________________________

El efecto Doppler-Fizeau se aprecia en todos los movimientos ondulatorios, pero con particular importancia en el caso de la luz. La frecuencia del haz luminoso cuando se acercan el foco y el receptor resulta mayor que si permaneciesen inmóviles uno con respecto a otro, lo que produce un corrimiento hacia el azul del tono cromático (frecuencias más altas). Este corrimiento es hacia el rojo cuando foco y receptor se alejan, un hecho de especial interés en el contexto de la astrofísica y la cosmología, al ser un indicio de la expansión del universo en su conjunto.

Resonancia El fenómeno de la resonancia se produce cuando la emisión de ondas por parte de un objeto hace vibrar solidariamente a otro. Las compresiones y enrarecimientos de las ondas sonoras debidas a las emisiones del primer objeto actúan regularmente sobre el segundo y provocan su vibración. Este hecho se denomina también vibración por simpatía. El fenómeno de la resonancia tiene lugar cuando las frecuencias naturales de vibración de dos objetos son idénticas o la de uno de ellos es un múltiplo de la del otro. De esta forma, un tenor podría ser capaz de hacer vibrar las cuerdas de un piano contiguo que poseyeran su misma frecuencia.

El segundo diapasón vibrará por resonancia siempre que tenga la misma frecuencia que el primero o un múltiplo de ésta

La resonancia no es sólo un fenómeno asociado a las ondas sonoras, sino que también se puede dar en estructuras vibrantes, ondas hertzianas y ondas luminosas.

Ultrasonidos El oído humano, que funciona como una caja de resonancia, sólo es capaz de percibir sonidos comprendidos en una banda de frecuencia entre 16 y 20.000 Hz (que corres-

Acústica

49

ponden a una longitud de onda de 5 m para el sonido más débil y de 3 cm para el más intenso). Los sonidos cuya frecuencia es superior a 20.000 Hz y, por tanto, ya no percibibles por el oído humano reciben el nombre de ultrasonidos. Una forma de producir ultrasonidos de muy alta frecuencia es someter láminas de cuarzo a la acción de una corriente eléctrica alterna. Al paso de ésta, las láminas de cuarzo se comprimen y estiran, es decir, vibran con una frecuencia muy alta. Los ultrasonidos se utilizan en muy distintas aplicaciones, tales como la esterilización de la leche, la limpieza de aires contaminados, el diagnóstico de ciertas enfermedades, las operaciones quirúrgicas o la catálisis y aceleración de reacciones químicas. La energía de los ultrasonidos es tan intensa que si se sumerge una mano en un líquido sometido a vibraciones ultrasónicas, se experimentaría un dolor muy agudo.

_ Preguntas de repaso 1. Establecer la veracidad o falsedad de las siguientes afirmaciones: a) Las ondas de sonido no se pueden propagar en el vacío. b) El sonido se transmite mejor en los líquidos que en los gases. c) La transmisión del sonido es mejor en los líquidos que en los sólidos. d) La intensidad fisiológica es una sensación auditiva que se mide en decibelios. e) Cuanto mayor sea la temperatura del agua, más rápidamente se propagará el sonido. 2. ¿En qué tipo de movimiento ondulatorio se aprecia más el efecto Doppler-Fizeau? 3. ¿A qué se llama ultrasonidos?


ÓPTICA

Introducción La óptica es la parte de la física que estudia los fenómenos producidos por las radiaciones electromagnéticas visibles, que se manifiestan a través de su doble naturaleza de ondas y corpúsculos materiales. Todos los tipos de radiación electromagnética conocidos tienen en común su velocidad de propagación en el vacío (2,99793 · 108 km/s), valor constante que constituye uno de los paradigmas de la física teórica. La óptica se centra principalmente en el estudio de la naturaleza de la luz, que posee propiedades y características propias de las ondas. Por tanto, podría también definirse la óptica como el área de la física dedicada al estudio de los fenómenos producidos por la luz visible o energía radiante que podemos percibir por la retina de nuestros ojos.

Hipótesis sobre la naturaleza de la luz La naturaleza de los efectos luminosos ha sido objeto de controversia desde los albores de la ciencia. En la física moderna, la idea de una luz compuesta por partículas materiales, defendida, entre otros, por Isaac Newton en su obra Opticks (1704), fue duramente contestada. Christiaan Huygens y otros científicos propusieron una teoría que propugnaba que la luz era un mero fenómeno ondulatorio. La historia se encargó de demostrar que ambos enfoques eran complementarios: según la doctrina electromagnética y la teoría cuántica más avanzada, la luz está formada, al igual que los restantes tipos de radiación electromagnética no visible, por partículas sin masa llamadas fotones que comparten en su movimiento las propiedades de los fenómenos ondulatorios.

Teoría electromagnética Los trabajos de Thomas Young y Augustin-Jean Fresnel en el siglo XIX reafirmaron la idea previamente propuesta por Robert Hooke de que las ondas luminosas son transversales, es decir, que la vibración de las partículas que

emiten luz es perpendicular a la dirección del desplazamiento de la onda. Este resultado contradecía los postulados vigentes y planteaba incógnitas que los modelos aceptados eran incapaces de resolver: E H

Esta contradicción se resolvió en 1873 cuando el británico James Maxwell enunció la teoría electromagnética de la luz. Según esta hipótesis, el paso de un tren de ondas luminosas implica fluctuaciones periódicas de los campos eléctricos y magnéticos y no vibraciones materiales. La teoría de Maxwell adquirió plena aceptación con los trabajos de Heinrich Hertz en 1887. Utilizando un circuito oscilante de reducidas dimensiones, Hertz consiguió producir ondas electromagnéticas que mostraban idénticas propiedades que la luz, dando por comprobada la naturaleza electromagnética de las ondas luminosas.

Teoría cuántica El físico alemán Max Planck (1858-1947) propuso en 1900 la hipótesis cuántica, que revolucionaría las bases de la física teórica. Según esta hipótesis, la emisión de energía por los cuerpos no es continua, sino que se realiza por paquetes o cuantos de acción cuya energía viene dada por la expresión: E=h·f siendo f la frecuencia de la radiación, y h, un parámetro denominado constante de Planck y cuyo valor es: h = 6,6256 · 10-34 J · s La teoría cuántica, inicialmente recibida con cierta frialdad en los círculos científicos, fue admitida a escala glo-

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


________________________________________________________________________________________________________

bal cuando demostró su validez en la explicación de los fenómenos subatómicos luminosos. Fue Albert Einstein quien se encargó de aplicar la teoría de cuantos al estudio de la luz. Llamó fotones a esos cuantos de luz, con lo que el producto de su frecuencia por la constante de Planck sería la energía asociada a cada uno de ellos. Según estas consideraciones, la luz sería una corriente de fotones (corpúsculos) de energía hf, a la que se asociaría una radiación de frecuencia f. Esta idea se aplicaría también al resto de las partículas subatómicas, en la llamada hipótesis de la dualidad corpúsculo-onda. Así pues, el fotón se caracteriza por su longitud de onda λ y frecuencia f, y la onda, por su cantidad de movimiento (p = m · c) y por su energía (E = hf). Entre todas estas magnitudes se establecen las siguientes relaciones: E=h·f por lo que la cantidad de movimiento del fotón será: 2

p = mc, y como E = mc entonces p =

E h·f h = = c c λ

Con todo, la aproximación teórica puramente ondulatoria de la luz mantiene su utilidad y su vigencia en múltiples procesos y aplicaciones, principalmente a escala macroscópica.

Espectro electromagnético Frecuencia ciclos/segundo 1023 1022 1021 1020 1019 1018 1017 1016 1015 1014 1013 1012 1011 1010 109 108 107 1 MHz = 106 105 104 1 kHz = 103 102 10

Longitud de onda/metros

Rayos gama Rayos X Ultravioleta VISIBLE

Infrarrojo

Ondas de radio cortas Ondas de TV y radio de FM Ondas de radio de AM Ondas de radio largas

10-14 10-13 10-12 10-11 10-10 = 1 Å 10-9 = 1 mm 10-8 10-7 10-6 = 1 µm 10-5 10-4 10-3 10-2 = 1 cm 10-1 =1m 1 101 102 103 = 1 km 104 105 106 107

Óptica

51

Propiedades de la luz La óptica se encarga del estudio de las propiedades de la luz, como su propagación en los medios materiales y sus diversas incidencias: reflexión o “rebote” de los rayos luminosos en superficies pulimentadas; refracción o cambio de dirección al pasar de un medio a otro; difracción, un curioso fenómeno que permite a los haces luminosos sortear obstáculos, doblar curvas, etc.; polarización u orientación de las ondas de luz en una dirección privilegiada; interferencias; dispersión, etc.

Propagación de la luz La luz se propaga en línea recta en el vacío o a través de medios transparentes homogéneos. Los manantiales de luz se llaman focos, y si son muy pequeños con respecto a los cuerpos que integran su medio, se dicen focos puntuales o puntos luminosos. Según el efecto que induce en ellos la luz, los cuerpos se pueden catalogar en opacos, transparentes y translúcidos: – Se llama opacos a los cuerpos que no son atravesados por la luz, como la piedra, la madera, etc. – Transparentes son los materiales que permiten que la luz les atraviese, como el agua, el vidrio, etc. – Los cuerpos translúcidos o semitransparentes permiten el paso de la luz, pero no se pueden distinguir perfectamente los contornos de los objetos a su través. Los cuerpos transparentes y translúcidos también absorben parte de la luz que incide sobre ellos y, a determinados espesores, se hacen opacos; es conocido, por ejemplo, que el agua a ciertas profundidades (superiores a 100 m en mares y océanos) no permite el paso de la luz. Se llama rayo luminoso a la línea recta que sigue la luz cuando se propaga entre dos puntos. Esta línea, puramente teórica, carece de entidad real, pero se emplea como forma de representación de la luz en los principios de la óptica. Cuando el foco de luz puede considerarse puntual, la interposición de cuerpos opacos produce una sombra de contornos nítidos. No ocurre así cuando la luz emerge de un foco extenso, en cuyo caso la sombra aparece rodeada de otra menos intensa que se llama penumbra: Sombra Foco puntual

Foco extenso Penumbra


52

FÍSICA

________________________________________________________________________________________________________

Reflexión de la luz. Espejos Cuando la luz colisiona con una superficie no pulimentada, se refleja en todas las direcciones. Este fenómeno recibe el nombre de difusión de la luz. Sin embargo, cuando incide sobre una superficie pulimentada (llamada espejo), el haz luminoso se refleja en unas ciertas direcciones privilegiadas determinadas por el fenómeno de la reflexión. Se puede definir la reflexión de la luz como la modificación brusca de la dirección que experimenta un haz luminoso cuando colisiona contra una superficie pulimentada: Difusión de la luz en superficie no pulimentada

El periscopio es una de las utilidades del espejo plano

Espejos cóncavos y convexos. Los espejos no planos, ya sean cóncavos o convexos, son esféricos y comparten las siguientes propiedades y definiciones:

Reflexión Espejo

En función del tipo de superficie, el espejo puede ser plano, cóncavo o convexo. Espejo plano. En los espejos planos, la imagen del objeto es simétrica y de igual tamaño que el propio objeto. La distancia del objeto al espejo es igual, aunque de sentido contrario, a la que existe entre la imagen y el espejo: Espejo

1 1 1 –– + –– = –– S S’ f

i

A

a

– El centro geométrico de la figura (O) es el centro del espejo. – El centro de curvatura (C) corresponde al centro de la esfera a que pertenece el espejo. – El eje principal es la línea recta que une el centro de la figura y el de curvatura. – Se llama eje secundario a toda recta que pase por el centro de curvatura. – Foco principal es el punto situado en el eje principal sobre el cual coinciden todos los rayos paralelos al eje principal de un haz luminoso. – La distancia focal es la separación que existe entre el foco principal y el centro del espejo. La distancia focal es la mitad del radio del espejo. – El plano focal es el plano perpendicular al eje principal y que contiene al foco. En los espejos esféricos, tanto cóncavos como convexos, el valor inverso de la distancia focal es igual a la suma de los valores inversos de las distancias del espejo al objeto y a su imagen:

r

i=a r=b a=b i = b (2.ª ley)

Imagen

b

A'

Los espejos planos resultan medios ideales para ilustrar las leyes de la reflexión desde el punto de vista de la física clásica. La primera ley de la reflexión afirma que el rayo incidente, el reflejado y la normal a ambos se encuentran en un mismo plano. Por su parte, la segunda ley de la reflexión establece que el ángulo de reflexión es igual al de incidencia. Por la tercera ley, el camino seguido por los rayos de luz es independiente del sentido de su propagación:

El tamaño del objeto reflejado viene dado por la siguiente expresión: S’ t = –– S En estas expresiones es importante el “signo” de las distancias. Una distancia se considera positiva cuando se mide hacia la derecha del centro de la figura y hacia arriba del eje principal. Los espejos cóncavos son los que poseen como superficie reflectante la cara interior. En las figuras se ilustran las diversas posibilidades de fenómenos de reflexión existentes en dichos espejos:


________________________________________________________________________________________________________

Óptica

53

ESPEJOS CÓNCAVOS O

C

F I Cuerpo situado fuera

del centro de curvatura

1

O C

2

3

4

5

6

Para simplificar, las lentes se representan esquemáticamente de la siguiente manera:

F

I Cuerpo situado entre el foco

Divergentes

Convergentes

y el centro de curvatura O C

F

I Cuerpo situado en el centro de curvatura

Por su parte, espejos convexos son los que tienen como superficie reflectante la cara exterior. En ellos, la imagen obtenida es siempre de menor tamaño que el objeto, con independencia de la distancia que les separe del espejo:

r i O I F

C

Imagen en un espejo convexo

Las lentes de buena calidad deben ser lo más delgadas posible para así sólo recibir los rayos que pasan próximos a su centro y obtener una imagen clara. En una lente se distinguen dos clases de elementos: los ópticos, como el centro óptico y los focos principales, y los geométricos, que son el centro de curvatura, el eje principal y la sección principal. La alteración de las imágenes por lentes cumple las siguientes propiedades: – Cualquier rayo secundario que atraviesa por el centro óptico de la lente no sufre refracción alguna. – Todo rayo paralelo al eje principal se refracta a través del foco imagen. – Todo rayo que pase por el foco objeto experimenta una refracción en la lente paralela al eje principal. – Cuando un punto está situado sobre el eje principal del haz luminoso atraviesa la lente sin refractarse y su imagen estará también sobre el eje. – Si el objeto está situado sobre el foco, su imagen se forma en el infinito, pues los rayos que de él emergen surgen paralelos de la lente:

Refracción de la luz. Lentes Se denomina refracción a todo cambio de dirección experimentado por un rayo luminoso al pasar de un medio de propagación a otro. Por su parte, las lentes ópticas son medios transparentes limitados por dos superficies, al menos una de las cuales es curva, que refractan la luz. Las lentes se pueden clasificar en:

Eje principal

C

F

O

Centro curvatura

C'

Foco imagen

Elementos de una lente convergente

– Convergentes o convexas: • Biconvexa (1). • Planoconvexa (2). • Meniscoconvexa (3). – Divergentes: • Bicóncava (4). • Planocóncava (5). • Meniscocóncava (6).

Eje principal

C

O

F S

Elementos de una lente divergente

Construcción de imágenes:

C'


54

FÍSICA

________________________________________________________________________________________________________

X

B F

O

A

F'

B'

O

F' A' X' Imagen de un objeto en una lente divergente

Imagen de un punto en una lente convergente

La distancia del objeto a la lente S, de la lente a la imagen S´ y la distancia focal f’ de la imagen se relacionan entre sí de la siguiente manera:

B F

A

O

F' A' B'

Imagen de un objeto situado entre el infinito y el foco

B' A'

B

con ambas distancias positivas. La magnitud 1/f´, inversa de la distancia focal, es la potencia de la lente. Cuando la distancia focal se mide en metros, la potencia tiene como unidad la dioptría. La relación entre el tamaño de la imagen y la dimensión real del objeto viene dada por la siguiente expresión: S’ Tamaño de la imagen = Tamaño del objeto · –– S

F'

O

1 1 1 –– = –– – –– f’ S’ S

F A

El uso de las lentes es muy diverso en aparatos de óptica, tales como cámaras fotográficas, lupas, microscopios, anteojos, instrumentos astronómicos ópticos, etc.

Imagen de un objeto situado entre la lente y el foco

B

A' O

A

_ Preguntas de repaso

F'

F B' Imagen de un cuerpo simétrico al eje principal

En las lentes divergentes, cualquiera que sea la posición del objeto, la imagen que se produce es siempre virtual, directa y de menor tamaño:

1. Calcular la longitud de un espejo plano y la distancia a que debe colocarse del suelo para que un hombre de 1,82 m de altura pueda verse en él de cuerpo entero. La altura a la que tiene los ojos es 1,70 m. 2. Determinar la posición, la naturaleza y el tamaño de una imagen producida por una lente convergente de 25 cm de distancia focal, al recibir los rayos de un cuerpo de 6 cm de altura colocado a 60 cm de la lente. Resolver el problema también gráficamente.


LA LUZ Y EL COLOR

Luminosidad de los cuerpos La sensación de luz percibida por los sentidos contiene tanto elementos psicológicos como físicos. La cantidad de energía radiante y el color o frecuencia de la radiación luminosa determinan en cierta medida la impresión visual que recibimos. Estas y otras magnitudes configuran las ramas de la ciencia física conocidas como fotometría y colorimetría.

Intensidad luminosa

emite un foco puntual con una intensidad de una candela (cd).

Color de los cuerpos Un prisma óptico es cualquier medio transparente limitado por dos caras que se cortan. Cuando un rayo luminoso atraviesa un prisma se produce una desviación en su dirección. Las imágenes producidas por un prisma son virtuales y siempre están desplazadas hacia su base:

La intensidad luminosa de un foco puntual es el flujo de luz emitido por unidad de ángulo sólido atravesado:

A A'

dF I = ––– dW (I, intensidad luminosa; dF, variación de flujo; dW, ángulo sólido.) La unidad de medida en el Sistema Internacional (S.I.) de la intensidad luminosa es la candela (cd), que se define como una sexta parte de la intensidad luminosa emitida por un centímetro cuadrado de un cuerpo negro, a una temperatura igual a la de fusión del platino (2.045,5 K), en una dirección perpendicular al cuerpo. La relación existente entre el flujo luminoso emitido por un foco y su flujo radiante total se denomina rendimiento luminoso. Su unidad de medida es el lumen/vatio. El flujo luminoso de un lumen que incide por unidad de superficie (m2) recibe el nombre de lux, que es la unidad de medida de la iluminación. Es decir, 1 lux = 1 lm/m2.

Flujo luminoso Se llama flujo luminoso a la energía radiante correspondiente al intervalo visible del espectro electromagnético. Los flujos luminosos proceden siempre de un foco, llamado así cualquier cuerpo que emita ondas luminosas, ya sean producidas por el mismo o por su reflejo. La unidad de medida en el S.I. del flujo luminoso es el lumen (lm), que se define como el flujo luminoso total que

Rayo de luz blanca

rojo naranja amarillo verde azul añil violeta

Cuando el rayo de luz que atraviesa el prisma es monocromático (de un solo color) y se refracta en las dos caras del prisma no se descompone, apareciendo un rayo desviado, pero del mismo color. Sin embargo, cuando el rayo de luz que atraviesa el prisma es de luz blanca, el rayo refractado es una banda vertical de siete colores. En el extremo superior se situará el color rojo, y en el inferior, el violeta. Los siete colores en que se descompone la luz blanca son: rojo, naranja, amarillo, verde, azul, añil y violeta. El proceso por el cual la luz blanca se fragmenta y descompone en estos siete colores se llama dispersión. El proceso inverso es también cierto, es decir, la superposición de estos siete colores da como resultado el blanco, tal como comprobó Isaac Newton con su experimento con el disco que lleva su nombre. El disco de Newton está formado por una circunferencia dividida sectorialmente en los siete colores, de modo que al hacerlo girar a gran velocidad se ve el blanco:

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


56

FÍSICA

________________________________________________________________________________________________________

Eje violeta añil

rojo azul

naranja amarillo verde

Aplicando los fundamentos del láser, pero con longitudes de onda milimétricas y de microondas, se obtiene un dispositivo similar al láser que se denomina máser. Con él se consigue una generación coherente de ondas electromagnéticas por la emisión estimulada de partículas, ya sean átomos o moléculas.

Disco de Newton

Se llama colores complementarios a los que al combinarse dan como resultado el blanco. Como conclusión, se puede decir que los objetos no tienen un color propio, sino que su frecuencia cromática depende del tipo de luz que incida sobre ellos y de la que difunden o absorben. Los cuerpos negros son los que absorben todo tipo de acción luminosa que les llega y no difunden ninguna. De esta forma, el negro en física no se considera un color, sino la ausencia de él, pues no difunde ninguna radiación luminosa:

Color

Intervalo de longitud de onda (en angström, Å)

Violeta Añil Azul Verde Amarillo Naranja Rojo

4.000 a 4.500 4.500 a 4.750 4.750 a 5.000 5.000 a 5.700 5.700 a 5.900 5.900 a 6.100 6.100 a 7.500

Luz coherente y sus aplicaciones Los focos de luz común emiten sus ondas en todas las direcciones y en varias frecuencias. No sucede así con una tecnología de invención relativamente reciente, la luz láser que, gracias a la coherencia y monocromaticidad de sus haces, se ha convertido en fuente de numerosas y variadísimas aplicaciones industriales y científicas.

Láser El término láser proviene de la definición en inglés, light amplification by stimulated emission of radiation, que significa amplificación de la luz por emisión estimulada de radiación. El láser es un dispositivo por el cual se genera una radiación electromagnética coherente, prácticamente de una única longitud de onda y altamente direccional. La longitud de onda en la que puede emitir un láser corresponde a un intervalo comprendido entre un milímetro y las correspondientes a la luz ultravioleta y los rayos X. Debido a que su frente de ondas se encuentra en fase y se desplaza de forma constante, el láser genera una energía muy elevada. Esta alta energía que produce y la precisión de su emisión hace que su espectro de aplicación sea tan amplio, desde su utilización en operaciones quirúrgicas de gran precisión hasta su empleo en el taladrado de materiales de gran dureza y con puntos de fusión muy altos.

Holografía Una de las aplicaciones más espectaculares de la luz láser es la holografía. Esta técnica, que en un inicio se llamó reconstrucción del frente de ondas, fue inventada por el estadounidense Dennis Gabor en 1948, mientras intentaba mejorar la calidad de las imágenes obtenidas en los microscopios electrónicos. El proceso que se sigue para realizar una holografía se diferencia del de la fotografía corriente en el hecho de que no se registra la imagen de un cuerpo, sino las ondas de la luz que refleja. El holograma registrado es una mezcla de puntos, manchas y espirales sin parecido alguno con el cuerpo objeto de la holografía. En una holografía la información almacenada es mucho más rica que la que se registra en una fotografía. Mediante un proceso de reconstrucción se logra obtener una imagen inteligible y percibida “en tres dimensiones”. Esta técnica, aunque experimentó un importante avance cuando aplicó el láser como fuente de luz, es aún objeto de una intensa labor de investigación. Ello no obstante, ha encontrado aplicación en áreas muy diferentes, como el almacenamiento de información, el tratamiento de imágenes, la metrología, la presentación de imágenes o ciertas técnicas biomédicas: Objeto

Láser Placa fotográfica Haz de referencia Esquema de la formación de un holograma

La visión tridimensional de las figuras se consigue por los fenómenos de interferencia de los rayos reflejados por difusión en el propio objeto y por el haz de referencia. Los puntos de la placa fotográfica donde coinciden rayos con una misma fase quedan iluminados con una mayor intensidad, por lo que tras la reacción química de la placa fotográfica la imagen se percibe como tridimensional.

_ Preguntas de repaso 1. ¿A qué se llama intensidad luminosa de un foco? 2. ¿Qué son los colores complementarios? 3. ¿De dónde proviene el término láser?


FÍSICA NUCLEAR

Introducción La idea de que la materia está constituida por unidades mínimas e indivisibles se remonta a los albores de la ciencia. Estas unidades elementales, en sus diversas formas imaginadas por filósofos y científicos, tanto antiguos como contemporáneos, han recibido el nombre de átomos. Según la física contemporánea, el átomo está compuesto por un núcleo y un halo de electrones que lo rodea. Ernest Rutherford propuso en 1911 el modelo de la física nuclear comúnmente aceptado. Este modelo expone que el átomo posee prácticamente toda su masa concentrada en su centro, en una región denominada núcleo. El núcleo tiene carga positiva y su tamaño es de diez mil a cien mil veces menor que el del átomo. En un inicio se pensaba que el átomo era una estructura muy simple, una idea que pronto hubo de ser desechada. La variedad y complejidad de los procesos atómicos ha promovido el nacimiento de toda una disciplina de la física, llamada física nuclear. La profundización en el estudio de los fenómenos atómicos y subatómicos ha hecho posible un gran avance en el conocimiento de la materia, y ha dado origen al uso y dominio de la energía nuclear. El núcleo de los átomos está formado por neutrones y protones, partículas que reciben el nombre genérico de nucleones. Como se ha dicho anteriormente, la masa del núcleo suma prácticamente la total del átomo, al significar la masa de un electrón tan sólo una 1.840ª parte de la de un nucleón. La masa de los protones, neutrones y electrones se puede medir en kilogramos, pero por su magnitud tan reducida, se emplea para su medición la unidad de masa atómica (u.m.a.). Una unidad de masa atómica se define como la doceava parte de la masa del isótopo 12 del carbono. Lo mismo sucede con las medidas de longitud, para las que se utiliza como unidad de medida el fermi, equivalente a 1,0 · 10-15 m:

Protón Carga eléctrica (culombios) Masa (kg) Masa (u.m.a.) Radio (fermi)

Neutrón

Electrón

1,6021 · 10-19

0

– 1,6021 · 1-19

1,6726 · 10-27 1,0073 1,2

1,6749 · 10-27 9,1096 · 10-31 1,0087 5,4859 · 10-4 1,2 0

El radio del núcleo atómico varía entre 1,2 y 7,5 fermis. De las tres partículas atómicas que constituyen un átomo (protón, neutrón y electrón), es el número de protones la característica que distingue a unas especies atómicas de otras. Esta cantidad de protones de cada elemento se denomina número atómico y se representa con la letra Z. La suma de la masa de los protones y los neutrones (prácticamente, la de átomo) se conoce como número másico (o peso atómico) y se representa con la letra A. De esta forma, un elemento con símbolo X se representaría como AZX. Se llama isótopos a los núcleos de un mismo elemento que poseen igual número atómico, pero distinto número másico. Algunos de los elementos, como el flúor o el sodio, sólo poseen un isótopo, pero otros tienen gran cantidad de isótopos. También es posible “fabricar” isótopos artificiales de ciertos elementos en el laboratorio. La energía que mantiene unidos a los nucleones en el núcleo atómico, igual a la que habría que aportar para separarlos, recibe el nombre de energía de enlace del núcleo, y se puede asociar a la existencia de un campo nuclear llamado de interacción fuerte. Las principales características de este campo nuclear son: – Es independiente de la carga eléctrica. Las interacciones nucleares protón-neutrón, neutrón-neutrón o protónprotón se consideran prácticamente iguales. – Es una fuerza de corto alcance. Sólo se pone de manifiesto cuando las distancias son inferiores a un fermi. – Es una fuerza de naturaleza atractiva, ya que mantiene unidos a los nucleones entre sí; a distancias muy inferiores a su alcance resulta repulsiva. La energía de enlace media constituye un factor acertado para la determinación del grado de estabilidad del núcleo.

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


58

FÍSICA

________________________________________________________________________________________________________

Radiactividad La radiactividad natural fue descubierta por el francés Henri Becquerel en 1896, pero fueron Rutherford y Royds quienes en 1909 obtuvieron la prueba experimental de que las hasta entonces misteriosas partículas α eran átomos de helio doblemente ionizados. En virtud de estos descubrimientos se constató que la radiactividad es una propiedad del núcleo atómico. Numerosos elementos químicos poseen núcleos que, al ser inestables, se desintegran espontáneamente para transformarse en núcleos de átomos diferentes. Este fenómeno se acompaña de emisión de partículas nucleares o radiactividad. Si la desintegración de un átomo es espontánea, puede producirse aunque el átomo se halle totalmente aislado de agentes externos. Un átomo inestable puede existir durante millones de años sin desintegrarse para, de forma repentina y espontánea, iniciar su proceso de desintegración radiactiva. Este fenómeno, cuando es espontáneo, no requiere la absorción de energía suministrada por agentes externos. Al emitir radiactividad un átomo puede producir tres tipos distintos de partículas: α, β y γ. Las radiaciones α, β y γ resultan de verdaderos cambios nucleares, pues el núcleo modifica su naturaleza; ello no obstante, en una radiación γ lo que sucede es una desexcitación del núcleo, que vuelve a ser estable tras la perturbación. Los tres tipos principales de radiación (α, β y γ) emiten rayos de diferentes características: las partículas α tienen carga positiva; las β, negativa, y las γ, se suponen descargadas, ya que no se ven afectadas por la acción de campos eléctricos. Los átomos con intensa fuerza de atracción nuclear entre los protones y los neutrones de su núcleo producen la emisión de partículas α y, muy raramente, protones. Cuando la atracción electromagnética es muy débil se emiten partículas γ, en forma de protones. El poder ionizante de una partícula emitida durante la radiación es su capacidad para formar iones. Este poder

ionizante tiene efecto hasta una cierta distancia a partir de la cual se anula. Esta distancia se conoce como alcance de la radiación. La cantidad de pares de iones producida por unidad de longitud de la trayectoria de la partícula emitida se denomina ionización específica. La ionización específica disminuye a medida que aumenta el alcance de la partícula. Según la naturaleza del medio en que se propaga la partícula emitida, el recorrido o alcance puede variar. Esta variación en la energía absorbida de la partícula ionizante por el medio se denomina poder de detención, magnitud que se mide respecto al aire: d 0 · s0 · A Poder de detención = –––––––– d · s · A0 donde: d: densidad del elemento estudiado; s: espesor del elemento estudiado; A: masa atómica del elemento estudiado; d0: densidad del aire; s0: espesor del aire; A0: masa atómica del aire. Por tanto, el alcance es la distancia necesaria para frenar a una partícula α, y depende directamente del medio en que se emita la partícula. Por ejemplo, el alcance en el aire de una partícula α con una energía de 6,0 MeV es de más o menos 5 cm, mientras que en el aluminio es de 0,05 mm. Al igual que sucede en todos los procesos fisicoquímicos, en una desintegración radiactiva se cumplen las siguientes leyes de conservación: – – – –

Conservación de la cantidad de movimiento. Conservación de la energía. Conservación de la carga. Conservación del número de nucleones.

Formas de desintegración radiactiva de núcleos inestables Tipos

Partícula emitida

Nuevo Z

Nuevo A

Interacción responsable

Desintegración α

α (4He)

Z–2

A–4

Fuerte

Desintegración β

β– (electrón) β+ (positrón)

Z+1 Z–1

A A

Débil Débil

Desintegración γ

γ (fotón) e– (electrón)

Z Z

A A

Electromagnética

Emisión de protones

1

Z–1

A–1

Fuerte

Fisión espontánea

El núcleo se parte en dos partes distintas

~ Z/2

~ A/2

Electromagnética

H (protón)


________________________________________________________________________________________________

El número de nucleones (protones y neutrones) sin desintegrar en un instante dado, se calcula mediante la siguiente expresión: N = N0 · e

-λt

donde N0 es el número inicial de nucleones y λ una constante radiactiva que depende del nucleón que se considere. Otra magnitud empleada en este contexto es la vida media de una muestra radiactiva, definida como el tiempo que ha de transcurrir para que se haya desintegrado la mitad de los nucleones radiactivos iniciales (N0/2). A partir de la anterior expresión se puede determinar el valor de la vida media o tiempo de semidesintegración: ln2 T = ––– λ Unidades radiactivas. La unidad de medida de la radiación es el curie, representado por ci y cuyo nombre es un homenaje al matrimonio de físicos franceses Pierre y Marie Curie, galardonados con el Premio Nobel de física en 1903 por sus descubrimientos sobre radiactividad. Existen submúltiplos del curie, tales como el milicurie (10-3 ci) y el microcurie (10-6 ci). Ya en 1946 se adoptó también como unidad de medida para la radiactividad, propuesta de los científicos Condon y Curtis, el rutherford (rd), que equivale a 1,5 · 10-5 curies.

Reacciones nucleares Dos son los procesos principales en los que los intercambios de partículas elementales y subatómicas producen cambios en la naturaleza de los átomos que intervienen en ellos: la fisión nuclear, o ruptura de un núcleo atómico en otros, y la fusión, o conjugación de dos o más átomos para formar uno de una especie química diferente.

Fisión nuclear La fisión nuclear consiste en la fragmentación en dos partes de masas prácticamente iguales de un núcleo pesado, como el uranio o torio. La fisión espontánea es prácticamente inexistente en la naturaleza, pero se puede lograr por medios artificiales mediante el bombardeo con neutrones del núcleo atómico que se quiere fisionar. Los neutrones aportan la energía necesaria para que se pueda producir la ruptura del átomo. Al producirse la fisión del núcleo atómico se producen, además de los dos fragmentos atómicos en que se divide, varios neutrones libres que pueden activar otras fisiones, en un fenómeno de reacción en cadena. Así, por ejemplo,

Física nuclear

59

la reacción nuclear de fisión del uranio puede expresarse como: 1 0

+ 235 92V → X + Y + 2 o 3 o n

Los términos X e Y son nucleidos que poseen un número másico comprendido en los intervalos 84-104 y 129-149. Cuando se consume un neutrón para activar la fisión y se obtiene como resultado también un protón, la reacción está controlada. Pero si por el ritmo de la reacción no se consumen los neutrones que se producen en exceso tiene lugar una reacción en cadena, base de las armas conocidas como bombas atómicas. La energía que son capaces de liberar algunos elementos, como el uranio, durante una fisión es de tal envergadura que con una tonelada de material fisionable se obtiene una cantidad de energía equivalente a la de dos millones de toneladas métricas de petróleo.

Fusión nuclear La fusión nuclear se basa en el proceso inverso a la fisión. En las reacciones de fusión se logra obtener un núcleo más pesado a partir de la colisión de dos átomos ligeros. Las fusiones nucleares alimentan la energía que se consume en el corazón de las estrellas, que pueden verse como descomunales hornos de fusión. A nivel científico e industrial, la fusión aún no ha sido controlada con garantías, aunque su enorme atractivo como fuente energética ha motivado intensos esfuerzos de investigación. En la fusión nuclear no existen prácticamente residuos, al contrario que en la fisión, origen de grandes cantidades de desechos radiactivos peligrosos. Además, el rendimiento energético es considerablemente superior en las reacciones de fusión nuclear. Un ejemplo sencillo de fusión es la conversión de hidrógeno pesado (deuterio y tritio) en helio, acompañada de la emisión de un neutrón: 2 1H

+ 31H → 42He + 10n

_ Preguntas de repaso 1. ¿Cuáles son las tres partículas de las que está constituido el átomo y cuál de ellas es la más representativa? 2. ¿Qué son los isótopos de un elemento químico? 3. Explicar qué es la radiactividad y decir las emisiones que puede producir.


ELECTROSTÁTICA Y ELECTRO DINÁMICA

Electrostática

atómica que constituye la unidad elemental de carga eléctrica.

Cargas eléctricas La electrostática es la ciencia que estudia el comportamiento de las cargas eléctricas en reposo. La electricidad en reposo recibe el nombre de electricidad estática. Los primeros descubrimientos de interés acerca de la electricidad estática se debieron al griego Tales de Mileto hacia el año 600 a.C., cuando describió la cualidad del ámbar (resina fosilizada) de atraer pequeñas virutas de madera al ser frotado con un material de lana: Varilla electrizada

A raíz de este descubrimiento se introdujo el término griego “elektron”, que significa ámbar y con el cual se pretendía denominar a todos los cuerpos capaces de cargarse de carga eléctrica. Posteriormente se comprobó que otros materiales, al ser cargados eléctricamente, en vez de atraerse se repelían entre sí. Ello se interpretó como la existencia de dos clases de cargas eléctricas. La clase de carga originada por el frotamiento del ámbar recibió el nombre de resinosa, y la originada por el frotamiento del vidrio, vítrea. Fue el estadounidense Benjamin Franklin (1706-1790) quien atribuyó a estas dos clases de cargas el nombre por el que se conocen en la actualidad. Así, la resinosa pasó a ser la negativa y la vítrea se denominó positiva. La electrostática se rige por una serie de propiedades básicas de las cargas eléctricas: – La carga puede ser tanto positiva como negativa. – Las cargas de igual signo (positivo o negativo) se repelen y las de distinto signo se atraen. – La carga se puede medir y cuantificar, siendo toda carga múltiplo de la que posee el electrón, partícula sub-

+ –

+

+

Los cuerpos se pueden clasificar en electronegativos o electropositivos, según el tipo de carga que en ellos predomine. Un cuerpo cargado negativamente (electronegativo) es aquel en cuya estructura existe un exceso de electrones, los cuales ha recibido de otro cuerpo. Cuando el cuerpo cede electrones a otro y tiene así un déficit de estas partículas queda cargado positivamente y se denomina electropositivo. La carga eléctrica neta de un cuerpo viene dada por el número de electrones que posee en exceso o que ha cedido. La carga se representa por la letra Q, y en el Sistema Internacional (S.I.) se mide en culombios (C): 1 culombio = 6,25 · 1018 electrones 1 µC = 10-6 C Con lo que la carga de un electrón será: 1e– = 1,60 · 10-19 culombios

Ley de Coulomb El principio de la electrostática conocido como ley de Coulomb permite calcular numéricamente la fuerza con que se atraen o repelen dos cargas eléctricas. Tras unas experiencias iniciales realizadas por los científicos ingleses Joseph Priestley y Henry Cavendish inspiradas en las leyes de la gravitación universal de Newton, fue Charles A. Coulomb quien en 1785 enunció la ley fundamental de la electrostática, que lleva su nombre y que afirma que la fuerza existente entre dos cargas, ya sea de atracción o repulsión, es directamente proporcional al producto de las cargas e inversamen-

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


__________________________________________________________________________________

te proporcional al cuadrado de las distancias que las separa: Q1 · Q2 F = K –––––– d2

61

La resultante de las fuerzas que actúan sobre la unidad de carga en un punto de un campo eléctrico se representa por medio de un vector tangente a la línea de fuerza en ese punto, y recibe el nombre de vector campo o intensidad del campo eléctrico en dicho punto.

La constante de proporcionalidad K de esta fórmula depende del medio en que se encuentren las cargas y de las unidades que se empleen. En el vacío y usando el Sistema Internacional (S.I.), K tiene el siguiente valor:

+

N · m2 K = 9 · 109 –––––– C2

+q

Lo que indica que en el vacío una carga de un culombio repele a otra igual situada a un metro con una fuerza de 9 · 109 newtons. Para cualquier otro medio, el valor de K viene dado por la expresión: 1 K = –––– 4πε donde ε es la constante dieléctrica del medio en el que se encuentran las cargas y que constituye una medida de su poder no conductor. Por tanto, la ley de Coulomb se puede expresar mediante la denominada ecuación racionalizada:

La intensidad del campo eléctrico se representa por la y se expresa matemáticamente de la siguiente maletra E, nera: F E = –– Q Donde Q es la carga que origina el campo y F la fuerza con que el campo atrae o repele a la unidad de carga positiva. La unidad de medida de la intensidad de campo eléctrico en el S.I. es el newton/culombio. El módulo de la intensidad del campo eléctrico creado por una carga positiva Q a una distancia d a la cual se coloca la unidad de carga positiva + q podrá expresarse también como:

1 Q 1 · Q2 F = ––– · –––––– επ4 d2

Q E = K ––– d2

Campo eléctrico

o bien:

Recibe la denominación de campo eléctrico el espacio que rodea a una carga y en el cual se perciben sus efectos de atracción o repulsión sobre otras cargas. Al introducir una carga en el campo eléctrico generado por otra se crea un campo eléctrico de fuerzas, una magnitud de naturaleza vectorial.

+

Electrostática y electrodinámica

En un campo eléctrico se llama líneas de fuerza a las trayectorias que siguen las cargas positivas repelidas por un cuerpo electropositivo. Se considera que las líneas de fuerza emergen radialmente del cuerpo cargado positivamente. Intensidad del campo eléctrico. Se dice intensidad del campo eléctrico en un punto a la fuerza con que la carga generada del campo atrae o repele a la unidad de carga positiva en dicho punto. La intensidad del campo eléctrico es directamente proporcional al número de líneas de fuerza que atraviesan la unidad de superficie en dirección perpendicular al campo.

1 Q E = –––– . ––– 4πε d2 El campo eléctrico es una magnitud de carácter vectorial, cuyo módulo es el cociente de la fuerza por la carga, y cuya dirección, la recta que une la carga fuente del campo con la carga que se introduce en él. El sentido del campo depende del signo de la carga cuando la carga que genera el campo es positiva; el sentido del campo es hacia fuera. Si la carga es negativa, el campo apuntará hacia la propia carga. Cuando la intensidad del campo eléctrico es idéntica en todos los puntos del mismo, el campo se dice que es eléctrico uniforme entre dos cargas (p. ej., entre las armaduras de un condensador plano).

Potencial eléctrico Toda carga inmersa en el interior de un campo eléctrico posee, además de una intensidad, cierta energía. Esta energía está directamente relacionada con la distancia a que se encuentra de la carga fuente el campo. El potencial del campo eléctrico en un determinado punto del mismo es el trabajo que sería preciso realizar


62

FÍSICA

________________________________________________________________________________________________________

para atraer la unidad de carga positiva desde el infinito hasta dicho punto. Su valor se calcula mediante la siguiente expresión: 1 Q V = ––– · –– 4πε d o lo que es lo mismo: Q V = K · –– d siendo: V, potencial del campo eléctrico; Q, carga eléctrica; d, distancia; ε, constante dieléctrica del medio:

+Q

d

P+0

+q (∞)

Si un punto determinado del espacio recibe la influencia de la acción de varias cargas, el potencial resultante es la suma de todos los potenciales individuales: Q V = ΣK · –– d Diferencia de potencial. La diferencia de potencial entre dos puntos es el trabajo que es preciso realizar para llevar la unidad de carga positiva de un punto al otro. Matemáticamente se expresa como: Wa-b Vb – Va = –––– +q Por lo que el trabajo para trasladar una carga q de un punto a otro puede representarse como: Wa-b = q . (Vb – Va) En el S.I., la unidad de medida de potencial y diferencia de potencial es el voltio, equivalente a un julio por culombio (1V = 1J/1c). El voltio, que se representa con la letra V, es la diferencia de potencial entre dos puntos cuando el trabajo realizado para trasladar la carga de un culombio de un punto al otro es igual a un julio. En la práctica se manejan también las siguientes unidades derivadas del voltio: Megavoltio (MV) = 106 V Kilovoltio (kV) = 103 V Milivoltio (mV) = 10 – 3 V

Electrodinámica La electrodinámica es la rama de la física que estudia las cargas eléctricas en movimiento.

Corriente eléctrica La corriente eléctrica es un efecto producido por el paso de electrones a través de un material conductor. Dicha corriente solamente se produce cuando existe una diferencia de nivel eléctrico o de potencial entre dos puntos del conductor. Esta diferencia de potencial es originada por los llamados generadores. Si se somete el conductor a un campo eléctrico, el movimiento de los electrones tiene lugar en la dirección contraria a la del campo. Los electrones se desplazan por el interior de los conductores al azar, colisionando entre ellos y con los iones de la red atómica del conductor, sin obedecer a ninguna ley causal. A pesar de ello, la velocidad de desplazamiento de estas partículas es constante. El movimiento de los electrones produce dos tipos de corriente: la alterna y la continua. En la corriente alterna se producen variaciones rapidísimas y periódicas en el sentido del campo eléctrico, y en la continua, el sentido de la corriente es siempre el mismo (aunque pueda variar la intensidad), al serlo también el del campo eléctrico que la genera.

Intensidad de la corriente Se denomina intensidad de corriente eléctrica a la cantidad de electricidad que circula por la sección recta de un conductor en la unidad de tiempo: Q (culombios) I = ––––––––––––– t (segundos) Q=I·t La intensidad de corriente eléctrica se representa por el símbolo I, y su unidad de medida en el S.I. es el amperio (A). Un amperio es, por tanto, la intensidad de corriente eléctrica que transporta en un segundo una carga de un culombio. Los instrumentos utilizados para medir intensidades reciben el nombre de amperímetros. El amperio tiene las siguientes unidades derivadas principales: Microamperio (µA) = 10 – 6 A Miliamperio (mA) = 10 – 3 A Es muy frecuente también medir la electricidad en términos de amperios-hora, que es la cantidad de electricidad que transporta la corriente eléctrica (ininterrumpida) en un período de una hora. La equivalencia de esta unidad con la del S.I. es: 1 amperio-hora = 3.600 culombios

Resistencia eléctrica La resistencia eléctrica representa la oposición que ejerce la red de átomos metálicos del conductor a la circulación de los electrones por ella. Esta resistencia aumenta con la


__________________________________________________________________________________

longitud del conductor y disminuye al incrementarse su sección. También está íntimamente relacionada con la naturaleza del conductor (resistividad); así, por ejemplo, el cobre ofrece menor resistencia al paso de corriente que el hierro a igual longitud y sección. La resistencia eléctrica en el S.I. se mide en ohmios (Ω), que es la resistencia al paso de corriente que ofrece una columna de mercurio con una longitud de 106 cm y 1 mm2 de sección a la temperatura de 0 ºC. La resistividad de un conductor (ρ) de un material determinado es la resistencia que ofrecería al paso de la corriente eléctrica un alambre de dicho material que tuviera una sección de 1 cm 2 y una longitud de 1 cm. Es decir: L R·S R = ρ · –– → ρ = –––– Ω · cm S L Asociación de resistencias. Las resistencias pueden disponerse en un circuito en serie o en paralelo. La resistencia total que resultaría de sustituir todas las resistencias individuales por una única resistencia resultante vendría dada por las siguientes fórmulas: – Resistencias en serie: RT = ΣRi : R1

I

I

I

R1

I2

R2

I3

R3

63

Ley de Joule. Energía de la corriente eléctrica Experimentalmente se comprueba que todo conductor por el que circula corriente se calienta en mayor o menor medida. El físico británico James Joule enunció una ley, que lleva su nombre, según la cual cuando por un conductor circula corriente eléctrica, se desprende una cantidad de calor que es directamente proporcional a la resistencia del propio conductor, al tiempo en el cual circula y al cuadrado de su intensidad: C = R · I2 · t El calor producido (energía) equivale a un trabajo, por lo que su unidad será el julio. También se suele expresar en calorías, donde una caloría equivale a 4,186 julios. Por tanto: julio = culombio · voltio La energía (trabajo) que se pierde por unidad de tiempo es la potencia eléctrica, en este caso igual a: W = __ C P = __ t t de donde:

R2

R · I 2t P = ––––– = R · I 2 t

I

– Resistencias en paralelo: 1/RT = Σ1/Ri , y la intensidad total, IT = ΣIi : I1

Electrostática y electrodinámica

Luego: P = R · I2 o bien: P = Va-b · I

I

En la práctica, la energía eléctrica se mide en vatioshora (w/h), que es la energía producida por un vatio durante una hora: 1 w/h = 3.600 julios 1 Kw/h = 3.600.000 julios

Ley de Ohm El principio de la electrodinámica conocido por ley de Ohm relaciona las tres magnitudes básicas estudiadas: el potencial, la intensidad y la resistencia. Esta ley afirma que el potencial (V) perdido en una resistencia (R) al pasar una intensidad de corriente I es: V=I·R V a – Vb = I · R A partir de la ley de Ohm se puede definir más claramente el ohmio como la resistencia existente entre dos puntos de un material conductor por el que, al aplicar una diferencia de potencial de un voltio, circula una intensidad de un amperio.

_ Preguntas de repaso 1. Hallar la intensidad de un campo eléctrico si una carga de 6 microculombios situada en el campo experimenta una fuerza de 0,15 N. 2. Decir de qué tipo es y calcular la fuerza que existe entre dos cargas puntuales situadas en el vacío y separadas entre sí 50 cm. Q1 = 3 µC y Q2 = 5 µC. 3. Calcular el trabajo necesario y la potencia desarrollada para desplazar una carga de 15 C desde un punto con 2.500 voltios a otro con 1.800 V en un tiempo de 3 minutos.


MAGNETISMO Y ELECTROMAGNETISMO

Introducción Los fenómenos producidos por el mineral magnetita eran ya conocidos por los antiguos. La capacidad de este mineral para atraer el hierro fue aprovechada en la China antigua para inventar la brújula, construida con una varilla de este metal que, colgada de un hilo, siempre se orientaba en la dirección norte-sur por efecto del campo magnético terrestre. La magnetización es el fenómeno por el cual si se frota en una misma dirección una barra de acero con magnetita, la barra adquiere las mismas propiedades que el mineral. Los trozos de magnetita que poseen estas propiedades reciben el nombre de imanes naturales. Los imanes artificiales son aquéllos que se obtienen a partir de la magnetización de materiales ferromagnéticos, tales como el níquel, el hierro o el cobalto. La mayoría de los imanes que se pueden adquirir en un comercio están compuestos por hierro y níquel. Desde el punto de vista de sus propiedades de imanación, los cuerpos se pueden dividir en magnéticos y no magnéticos. Los cuerpos magnéticos, como el hierro o el acero, son fuertemente atraídos por los imanes, mientras que los no magnéticos no experimentan esta atracción. En los imanes se distinguen dos polos magnéticos, arbitrariamente bautizados como norte y sur. Estos polos tienen la propiedad de experimentar una fuerza de repulsión con los de otros imanes si son de la misma polaridad, y de atracción, si son de polaridad distinta. La línea imaginaria central que separa ambos polos recibe el nombre de línea neutra, la cual no posee las cualidades de los polos:

N S N S

S N

N S

En un imán no se pueden observar a simple vista los polos magnéticos, si bien éstos siempre existen en parejas y no pueden aislarse. De esta forma, si se divide un imán por la mitad, se obtendrán dos imanes, cada uno con su polo norte y sur; por más que se realicen particiones sucesivas siempre se obtendrán nuevos imanes dipolares (no existe en la práctica el monopolo magnético). Si se calienta un imán al rojo y se deja enfriar perderá todas las propiedades magnéticas:

N

S

N

N

S

S

N

N

S

N

S

S

N

S

Al igual que la fuerza gravitatoria o la existente entre cargas eléctricas, las fuerzas de atracción o repulsión entre los polos de los imanes son inversamente proporcionales al cuadrado de la distancia que las separa.

Campo magnético Al igual que en los alrededores de una carga eléctrica existe un campo eléctrico, en torno a los imanes se crea un campo magnético, que puede definirse como el espacio o región que rodea a un imán y donde éste manifiesta sus efectos magnéticos. Las líneas de fuerza del campo magnético son las trayectorias que, hipotéticamente, tendría un polo norte ais-

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


__________________________________________________________________________________

lado si se colocara dentro del campo magnético. Una forma de ver y entender claramente el significado de las líneas de fuerzas sería colocar un imán debajo de un papel y verter sobre éste limaduras de hierro. Las líneas emergen de un polo y se suman en el otro; por convenio, se admite que las líneas de fuerza salen del imán por el polo norte y vuelven a él por el polo sur:

N

Magnetismo y electromagnetismo

S

N

65

S

Flujo magnético a través del aire y del hierro (el trozo de hierro queda imantado por un cierto período de tiempo) N

S

Al introducir una carga Q dotada de una velocidad v en un campo magnético aparece sobre ella una fuerza de dirección determinada por la regla de la mano izquierda, en la que el dedo pulgar indica la dirección de la fuerza; el índice, el sentido del campo, y el medio, el sentido de movimiento de la carga: F (fuerza)

Las líneas de fuerza no se cruzan y son cerradas, por lo que en el interior del imán se dirigen del polo sur al norte. B (campo magnético)

Flujo magnético El conjunto de las líneas de fuerza de un campo magnético se denomina flujo magnético. Esta magnitud se representa con la letra griega ϕ y su unidad en el Sistema Internacional (S.I.) es el weber (Wb). Inducción magnética. La densidad de flujo magnético (B) es el número de líneas de fuerza del campo magnético que atraviesan perpendicularmente a la unidad de superficie:

V (movimiento)

El módulo de la fuerza se calcula por medio de la siguiente expresión:

V

ϕ (flujo magnético) B = ––––––––––––––––– S (superficie) La densidad de flujo magnético también se conoce por es un vecinducción magnética, que, simbolizada por B, tor que posee una dirección y sentido determinados en cada punto del campo. La unidad en el S.I. de inducción magnética es el tesla (T), definido como la inducción magnética uniforme que, repartida perpendicularmente en una superficie de un metro cuadrado, produce un flujo magnético de un weber: ϕ (wb) B = –––––– S (m2) 1 weber tesla = ––––––– 1 m2 Otra unidad de medida habitual para la inducción magnética es el gauss, que se utiliza sobre todo cuando los campos magnéticos son poco intensos. Una tesla equivale a 104 gauss:

α

B

a

F = B · Q · v · sen α donde α es el ángulo comprendido entre la dirección del campo y la de desplazamiento de la carga.

Electromagnetismo: campos creados por corrientes eléctricas En 1820, el físico danés Hans Christian Oersted observó que el paso de la corriente eléctrica crea un campo magnético a su alrededor. Para sus estudios realizó la siguiente experiencia: colocó una brújula debajo de un conductor eléctrico, de modo que mientras por el conductor no circulaba corriente, la brújula no se movía; pero si se cerraba el circuito y se hacía pasar corriente por el conductor, la brújula giraba en un movimiento que dependía del sentido en que circulara la corriente:


66

FÍSICA

________________________________________________________________________________________________________

+ –

+ –

– + I

I N

I

S

Todo lo experimentado demuestra que en la zona o región próxima a un conductor eléctrico por el que se hace pasar corriente eléctrica se crea un campo magnético. El sentido del campo depende de la dirección en que se haga circular la corriente. Campo magnético creado por un conductor rectilíneo de longitud indefinida. Para comprobar la existencia de este campo magnético se hace la siguiente experiencia: se atraviesa un papel con un conductor vertical rectilíneo por el que se hace circular una corriente de intensidad I y sobre el papel se espolvorean limaduras de hierro; el resultado es que las limaduras se orientan formando círculos concéntricos alrededor del conductor en un plano perpendicular a éste, círculos que siguen las líneas del campo producido por la corriente eléctrica rectilínea:

I

I N S N

S

N

S N S

Campo magnético creado por una corriente circular. Si se hace circular corriente por una espira circular que atraviesa un papel y se espolvorean sobre él limaduras de hierro, se aprecia que alrededor del conductor, en sus dos puntos de intersección con el papel, se agrupan las limaduras en torno a las líneas de campo magnético:

I

Por tanto, el campo magnético creado por una corriente circular forma circunferencias concéntricas alrededor del conductor y se encuentran en un plano perpendicular a la espira. Al establecerse el flujo magnético, la espira queda polarizada y, por analogía con los imanes, se dice que adquiere una cara norte y otra sur. La cara norte es aquella en que, al ser mirada de frente, la corriente gira en el sentido contrario al de avance en las agujas de un reloj. Por el contrario, en la cara sur la corriente gira en el sentido de las agujas de un reloj:

Cara sur

Si en vez de limaduras de hierro se utilizan pequeñas agujas imantadas (imanes), se aprecia que se disponen de tal forma que su dirección es tangente a las circunferencias anteriormente formadas. Si se cambia la dirección de la corriente eléctrica, las agujas invierten su sentido, al igual que las líneas del campo. Para poder conocer el sentido de giro de las líneas del campo se utiliza la regla de la mano derecha, por la que si se sujeta el conductor con la mano derecha de forma que el dedo pulgar señale el sentido de la corriente, la dirección de los dedos indica el sentido de las líneas del campo: Paso de corriente

Cara norte

Campo magnético creado por un solenoide o bobina. Un solenoide es el dispositivo que resulta de arrollar un conductor en torno a un cilindro hueco y de material aislante; las espiras que se forman deben estar muy próximas, pero sin tocarse (eléctricamente aisladas entre sí):

I Solenoide I

Líneas de campo

Si se hace circular corriente por el conductor, el campo magnético que se crea a su alrededor es igual al que se formaría con un imán natural con forma rectangular. Las líneas que se forman, como en un imán natural, son cerradas y salen de un extremo (polo norte) para sumirse en el otro (polo sur).


__________________________________________________________________________________

Mientras por un solenoide circule corriente, el dispositivo se comporta exactamente igual que un imán natural, pero pierde todas las propiedades magnéticas al interrumpir el suministro de corriente. La inducción magnética que se crea en el interior de un solenoide es función del número de espiras, de la intensidad de la corriente y de la longitud del solenoide. Es decir:

Magnetismo y electromagnetismo

– La intensidad del campo magnético en un electroimán o bobina se puede controlar simplemente modificando la intensidad de la corriente eléctrica: Pulsador

Tornillo de ajuste

N·I B = 4 · π · 107 –––– L siendo N, el número de espiras; L, la longitud del solenoide; I, la intensidad de corriente:

67

Electroimán Timbre Una aplicación del electroimán es el timbre eléctrico

I N

S I

Campo magnético de un electroimán. Un electroimán es un solenoide donde el conductor se enrolla sobre un cilindro (núcleo) de hierro dulce, en virtud de lo cual la intensidad del campo magnético creado llega a ser miles de veces mayor que en un solenoide o bobina simple. El núcleo del electroimán puede ser recto o tener forma de herradura, con lo que el campo magnético será más intenso debido a la mayor proximidad entre los polos:

El campo magnético terrestre El hecho de que un pequeño imán se oriente siempre en la misma dirección indica que el globo terrestre en su conjunto se comporta como un imán de grandes proporciones. Así, el polo norte magnético se encuentra cerca del polo sur geográfico, y el polo sur magnético es próximo al norte geográfico: SM NG α

SG N

S

NM

Representación del campo magnético terrestre

Por tanto, el polo norte de una brújula se orienta aproximadamente hacia el polo norte geográfico. La pequeña desviación existente entre el polo y la dirección marcada por la brújula se denomina ángulo de declinación.

Electroimán de herradura

Electroimán recto

Los electroimanes y las bobinas presentan mejores características que los propios imanes naturales. Las diferencias principales que existen entre ellos son: – En los electroimanes se puede invertir la polaridad simplemente alterando el sentido de la corriente. – Los campos magnéticos que se crean son mucho más intensos (sobre todo en el caso de los electroimanes).

_ Preguntas de repaso 1. Explicar el motivo por el cual la intensidad de un imán disminuye si se calienta. 2. Indicar las diferencias que existen entre un imán natural y un electroimán. 3. ¿De qué depende la mayor o menor intensidad de un electroimán?


ELECTRÓNICA

Introducción La electrónica es la rama de la física que se encarga del estudio del movimiento de los electrones y otras partículas atómicas cargadas. A diferencia de la electrodinámica, que estudia los electrones que circulan a través de un conductor, la electrónica analiza su movimiento en el vacío, en atmósferas con gases enrarecidos o en semiconductores. La electrónica también se dedica al estudio de la emisión, propagación, recepción, reflexión y refracción de las ondas electromagnéticas. Así pues, la electrónica define el uso de materiales y dispositivos que almacenan o transportan electrones, con el fin de manipular, transmitir o grabar información física. En electrónica, las variables principales utilizadas son función del tiempo, como la corriente, el voltaje o tensión y la carga. La propiedad fundamental de los dispositivos electrónicos es su capacidad para amplificar y rectificar las señales que les llegan. Las aplicaciones de la electrónica son múltiples y variadas, en campos tan diversos como la informática, las telecomunicaciones, la electromedicina, la óptica electrónica, etc.

Emisión termoiónica El fenómeno de la emisión termoiónica consiste en la emisión de electrones por parte de un metal caliente, de modo que cuanto mayor es la temperatura del metal, mayor es la cantidad de electrones emitidos. Este fenómeno fue descubierto por vez primera por el estadounidense Thomas A. Edison en 1883, cuando trabajaba en la invención de su lámpara incandescente. Edison constató que en el interior de una lámpara con una atmósfera nula (de vacío) se originaba entre un filamento incandescente y un electrodo positivo una corriente eléctrica, ya que el filamento al calentarse

emitía electrones que eran atraídos por el electrodo positivo: Amperímetro

Placa A

Filamento

El paso de corriente se puede comprobar interponiendo un amperímetro en el circuito. El amperímetro indica el paso de corriente siempre que el electrodo introducido en la lámpara de vacío esté conectado a un potencial positivo. Si el electrodo o placa estuviese unido a un potencial negativo, el amperímetro no detectaría ningún paso de corriente. Si se aumenta la diferencia de potencial que se aplica al circuito, la corriente medida en el amperímetro aumentará también, pero no de forma lineal. En virtud de ello, para cierto valor de la diferencia de potencial se alcanza lo que se denomina corriente de saturación, valor límite que no se puede superar:

I IS

T3 T2 T1

V T2 < T2 < T3

Fotografías de cabecera: dispositivo centrífugo de bombeo (izq.) e imagen del reactor de la central nuclear de Zorita, España (der.).


____________________________________________________________________________________________________

Diodos y triodos

Electrónica

69

Rejilla +

Un diodo es un dispositivo formado por un filamento y una placa, en el que existe emisión termoiónica. El diodo permite el paso de la corriente sólo en un sentido, del filamento (cátodo) a la placa (ánodo), y se representa esquemáticamente de la siguiente manera:

Filamento Placa Triodo

Placa

Filamento +

Transistores

Así pues, el diodo rectifica la corriente debido a su carácter unidireccional. Al entrar corriente alterna por el ánodo emerge en el cátodo únicamente con pulsos positivos, como muestra el gráfico: V

V

t

t

Señal de entrada

Los transistores, al igual que los triodos, permiten la amplificación de señales (tensión e intensidad), pero además se utilizan también como osciladores y de otras maneras. Los transistores están compuestos principalmente por tres partes bien diferentes: el emisor, el colector y la base. La parte central es la base, que se intenta sea lo más delgada posible. El emisor y colector, ubicados en los extremos, están fabricados del mismo material semiconductor (germanio, silicio y otros materiales) y diferente del de la base. Los transistores pueden representarse esquemáticamente como la combinación de circuitos electrónicos, de la siguiente manera:

Señal de salida Colector

Este fenómeno se denomina rectificación de media onda. Para lograr una rectificación completa de la onda se incluye otro diodo que provoca un entrelazado de la señal resultante:

Base

Colector

Base

Emisor V

Emisor

V

t Señal de entrada

t Señal de salida

_ Preguntas de repaso 1. ¿Qué estudia la electrónica?

El triodo es un dispositivo resultante de añadir a la cámara o lámpara de vacío del diodo un tercer electrodo llamado rejilla o electrodo de control, situado entre el filamento y la placa. El triodo se utiliza principalmente para amplificar la tensión y para tener un mayor control sobre la corriente circulante:

2. ¿Por qué en la transmisión termoiónica se produce el paso de corriente? 3. ¿Qué partes se distinguen en un transistor?


GLOSARIO

Absorción: Acción por la que los cuerpos, en general los de naturaleza gaseosa, penetran y se diluyen en otros. Acción por la que la energía penetra en la materia. Acumulador: Instrumento en el que se almacena cualquier clase de energía (en particular, en forma de corriente eléctrica continua). En un sentido amplio, todo aparato o instrumento destinado a recoger la energía sobrante de una máquina para su ulterior utilización cuando sea necesario. Adhesión: Fuerza intramolecular existente entre las superficies en contacto de dos cuerpos. Aislador: Dícese del material que no permite el paso de la corriente eléctrica. Sinónimo de aislante. Amperímetro: Instrumento que, colocado en serie en un circuito de corriente eléctrica, sirve para medir la intensidad que circula por dicho circuito, medida en amperios. Amperio: Unidad de intensidad de corriente eléctrica en el Sistema Internacional. Símbolo: A. Angström: Unidad de longitud de escala subatómica, usada principalmente en la medición de longitudes de onda. Equivale a 10–10 metros. Símbolo: Å. Anión: Ion cargado negativamente. Ánodo: Polo positivo de un generador de electricidad (p. ej., de una pila). Año luz: Unidad de longitud utilizada en magnitudes astronómicas. Equivale a 946,05 . 1010 km, y es la distancia recorrida en el vacío por un haz de luz en un año. Balanza: Aparato o instrumento utilizado para medir masas. Existen muchas clases de balanzas, que aplican el método de comparación con otras masas conocidas, miden la masa por el grado de elongación de un muelle o usan procedimientos electrónicos o hidráulicos. Baricentro: Punto físico de un cuerpo en el que se encuentra el centro de gravedad. Barómetro: Instrumento o aparato destinado a la medición de la presión atmosférica. El primer modelo de barómetro se debe al italiano Evangelista Torricelli en 1643. El tipo más común es el de mercurio. Batería: Instrumento compuesto por varias pilas o acumuladores para el suministro de corriente eléctrica. Para obtener mayor tensión, las pilas se conectan en serie, y para conseguir mayor capacidad, en paralelo. Brújula: Instrumento que sirve para señalar la dirección de los polos magnéticos (desviados de los geográficos por la

declinación terrestre), compuesto por una aguja imantada que gira libremente alrededor de un eje. Caballo de vapor: Unidad de potencia, utilizada sobre todo en máquinas. Equivalente a 745,7 vatios. Símbolo: HP. Caída de tensión: Gradiente asociado a la medida de la tensión eléctrica en una resistencia por la que circula una corriente eléctrica. Calorimetría: Disciplina científica que estudia el calor desprendido o absorbido por los cuerpos. Candela: Unidad de intensidad luminosa en el Sistema Internacional. Símbolo: cd. Capacidad: Cantidad de carga eléctrica que puede almacenar un condensador eléctrico. Capilaridad: Efecto de las fuerzas moleculares que son responsables de los fenómenos de adherencia y cohesión de los líquidos. Carga: Balance de electrones (carga negativa) y protones (positiva) que posee un cuerpo, es decir, su cantidad de electricidad neta, ya sea positiva o negativa. Catión: Ion provisto de carga positiva. Cátodo: Polo negativo de un generador de electricidad (p. ej., una pila). Cohesión: Fuerza que obliga a mantenerse unidas a las moléculas de un cuerpo. Al elevarse la temperatura, la fuerza de cohesión disminuye. Componente: Cada una de las partes en que se puede dividir una magnitud, según las direcciones en las que actúa. Compresión: Reducción del volumen mediante la acción de una presión sobre él. Condiciones normales: Atmósfera ambiente situada a 0 ºC de temperatura y 1 atm de presión. Abreviatura: C.N. Conductividad: Capacidad de ciertos materiales para permitir el paso de corriente eléctrica por ellos (conductores). Corpúsculo: Partícula elemental de muy pequeñas dimensiones. Cuanto: Mínima cantidad en la que se manifiesta una magnitud de valores discretos cuantificados. Descarga: Proceso por el cual un generador eléctrico nivela su diferencia de potencia. Por ejemplo, cuando se descarga una batería de un coche. Deslizamiento: Movimiento de traslación que sufren los cuerpos sobre una superficie. Diafragma: Superficie de separación entre dos medios o cuerpos, ya sea permeable o impermeable.


______________________________________________________________________________________________________

Diagrama: Método de representación gráfica de varias magnitudes sobre unos ejes dispuestos, por lo general, en direcciones mutuamente perpendiculares entre sí. Diapasón: Instrumento en forma de horquilla que, al ser golpeado, emite vibraciones en cinco tonos que se usan como referencias. Dieléctrico: Sustancia que ofrece resistencia al paso de la corriente eléctrica, como la madera o el plástico. Dinamo: Instrumento que convierte la energía mecánica en eléctrica. Aunque también puede realizar la transformación inversa, el término es menos empleado para ello. Distorsión: Falta de uniformidad en el aumento o disminución en la imagen de un objeto al atravesar una lente. Ebulliscopio: Instrumento por el que se miden los puntos de ebullición de las distintas sustancias. Eco: Proceso de repetición de los sonidos, debido a su reflexión en cuerpos sólidos. Electrodo: Cada uno de los dos polos de una pila o generador, que reciben el nombre de ánodo y cátodo. Electrón: Partícula elemental constituyente de los átomos, que en los materiales conductores circula libremente por la retícula cristalina (base de la electricidad). Posee carga eléctrica negativa de 1,602 . 10–19 culombios y masa casi despreciable (1.836 veces menor que la del protón). Equilibrio: Estado alcanzado cuando la suma de todas las fuerzas que actúan sobre un cuerpo o un sistema se neutralizan. En termodinámica, el equilibrio se alcanza cuando las variables del sistema se mantienen invariantes en todos sus puntos. Escalar: Magnitud que se define simplemente por su valor numérico, como, por ejemplo, la temperatura. Espectro: Distribución de cualquier magnitud física, por ejemplo la emisión de radiaciones electromagnéticas por un cuerpo radiante. Espectrómetro: Instrumento que mide el espectro luminoso, las masas y la abundancia de isótopos en una mezcla. Estado: Conjunto de todas las magnitudes que definen un cuerpo o sistema. En termodinámica, el estado se define por medio de la presión, la temperatura y el volumen de un sistema. Expansión: Toda acción destinada a aumentar el volumen de los cuerpos, ya sean gases, líquidos o sólidos. FEM: Tensión almacenada en un acumulador o batería. Abreviatura de fuerza electromotriz. Fibra óptica: Guía de ondas constituida por numerosos hilos finísimos de vidrio de distintos índices de refracción por los que circulan señales luminosas a velocidades próximas a la de la luz. Filtro: Dispositivo que deja pasar a un intervalo de frecuencias o de longitudes de onda, pero no los impulsos no comprendidos en dicho intervalo. Focómetro: Instrumento que sirve para calcular la distancia focal de las lentes. Fotón: Partícula elemental constituyente de la luz y las radiaciones electromagnéticas (radio, rayos X, infrarrojo, ultravioleta). Carece de masa y su energía es directamente proporcional a su frecuencia. Galvanómetro: Aparato utilizado para medir el sentido y la intensidad de corrientes eléctricas.

Glosario

71

Generador: Instrumento o máquina capaz de transformar la energía mecánica en eléctrica. Grado: Cada una de las divisiones elementales de las escalas termométricas (grados Celsius, Kelvin, etc.). Hercio: Unidad de frecuencia en el Sistema Internacional. Símbolo: Hz. Se escribe también hertz. Hipersonido: Vibración que posee una frecuencia superior a la del sonido, es decir, mayor que 109 Hz. Homogeneidad: Cualidad de los cuerpos que tienen todas sus características repartidas uniformemente. Término contrario a heterogeneidad. Imanación: Acción consistente en magnetizar un cuerpo ferromagnético, convirtiéndolo en un imán. Incompresibilidad: Característica de algunas sustancias por la cual su volumen no disminuye al ser sometidas a compresión. Inversor: Instrumento capaz de modificar el sentido de la corriente eléctrica. Ion: Átomo cargado eléctricamente por haber ganado (anión, negativo) o perdido (catión, positivo) electrones. Isotones: Núcleos atómicos de un elemento, que tienen igual número de neutrones, pero distinto número de protones. Kelvin: Unidad elemental de temperatura en el Sistema Internacional, definido como 1/273,16 partes de la temperatura termodinámica del punto triple del agua. Símbolo: K. Kilogramo: Unidad elemental de masa en el Sistema Internacional, según el patrón de platino iridiado conservado en la Oficina de Pesas y Medidas de París. Símbolo: kg. Lente especular: Dispositivo óptico que habitualmente se comporta como lente, pero se convierte en espejo mediante la impregnación con un metal de una de las caras. Ley de Avogadro: Principio que indica que el número de moléculas de los gases es siempre el mismo si son idénticos el volumen, la presión y la temperatura a que están sometidos. Límite de elasticidad: Máxima deformación que puede sufrir un cuerpo a partir de la cual ya no recobrará su estado original cuando cese la fuerza que actúa sobre él. Lupa: Lente biconvexa de pequeño tamaño, que tiene un foco de corta distancia. Incrementa el ángulo de visión, y la imagen obtenida es virtual. Macrofísica: Disciplina de la física que estudia los procesos naturales percibidos por los sentidos. Manómetro: Instrumento que sirve para medir la presión de los fluidos. Pueden ser de mercurio, agua o alcohol. Metro: Unidad elemental de longitud en el Sistema Internacional, definido como la distancia recorrida en el vacío por la luz en 1/299792458 de segundo. Símbolo: m. Microfísica: Disciplina de la física que se dedica al estudio de los cuerpos elementales, como el átomo y sus partículas constituyentes. Microscopio: Instrumento óptico destinado a la observación cercana de objetos extremadamente pequeños, con unos aumentos muy elevados. Los modelos más antiguos son los microscopios ópticos; en la actualidad existen otras muchas clases: electrónicos, de polarización, de interferencias, etc. Mol: Unidad de cantidad de materia en el Sistema Internacional, definida como la cantidad de una sustancia que


72

FÍSICA

________________________________________________________________________________________________________

contiene tantas partículas elementales como átomos existen en 0,012 kg del isótopo 12 del carbono. Monocromática: Dícese de la radiación que posee una única longitud de onda, es decir, un solo color. Neutrón: Partícula subatómica que, junto con los protones, forma parte de los núcleos atómicos. Su carga eléctrica es nula y su masa es 1,00136 veces la masa del protón. Número atómico: Cantidad de protones que existe en un núcleo atómico. Magnitud identificativa de cada uno de los elementos químicos. Número de Avogadro: Cantidad de moléculas o átomos contenidos en un gramo-mol. Igual a 6,234.1023. Número másico: Suma del número de protones y neutrones del núcleo atómico. Opaco: Dícese del cuerpo que no deja pasar la luz. Oscilación: Proceso de vibración por el que un cuerpo se desvía periódicamente de su posición de reposo. Ósmosis: Mecanismo por el que los líquidos pasan de unos cuerpos a otros a través de membranas o paredes semipermeables, debido a la diferencia de presión existente entre ambos medios. Palanca: Dispositivo que, al hacer girar una barra sobre un punto de apoyo, proporciona fuerzas de mayor magnitud a la aplicada. Paralaje: Ángulo que forman dos rayos que, emergentes de puntos distintos, se dirigen a uno común. Patrón: Magnitud mensurable que se adopta como valor de referencia y comparación. Pirómetro: Instrumento óptico o eléctrico utilizado para medir temperaturas muy altas. Plasma: Mezcla de electrones e iones en estado gaseoso que resulta de calentar los átomos a temperaturas superiores a cien millones de grados. Principio de Le Chatelier-Braun: Ley que enuncia que cuando sobre un sistema en equilibrio se ejerce una influencia externa en una determinada dirección, el equilibrio se desplaza en la dirección necesaria para contrarrestar dicha influencia. Procesos irreversibles y reversibles: Los procesos irreversibles son aquellos que sólo se pueden desarrollar en una dirección. En los reversibles, el proceso puede tener lugar en ambas direcciones. Protón: Partícula subatómica de carga positiva que forma parte, junto con los neutrones, del núcleo de los átomos.

De idéntica carga que el electrón (1,602 . 10–19 culombios), aunque positiva, y masa igual a 1,672 . 10–24 g. Radar: Instrumento que, mediante el uso de ondas electromagnéticas, sirve para determinar la posición exacta de los cuerpos. Radián: Unidad de medida de los ángulos planos. Un radián equivale a 57,30 grados. Reacción en cadena: Serie sucesiva de fisiones de núcleos atómicos, que constituye la base de los reactores y las bombas nucleares. Rectificador: Aparato que convierte la corriente alterna en continua, o al contrario. Remanencia: Imantación residual de los materiales ferromagnéticos después de haber experimentado una imanación. Segundo: Unidad elemental de tiempo en el Sistema Internacional, definida como la duración de 9.192.631.770 períodos de la emisión de radiación entre dos niveles hiperfinos del cesio 133. Símbolo: s. Semiconductor: Material cuya conductividad varía en función de la temperatura. Los dispositivos semiconductores son básicos en electrónica digital. Sólido rígido: Cuerpo considerado como indeformable que se adopta como ideal en los cálculos físicos. Telescopio: Instrumento óptico de gran alcance que se dedica a la observación a grandes distancias (astros). El primer modelo fue construido por Galileo Galilei en 1609. Tono: Sensación acústica producida en el oído como consecuencia de una vibración sonora. Transformador: Aparato eléctrico que convierte corriente de alta tensión y débil intensidad en otra de baja tensión y gran intensidad, o al contrario. Transistor: Dispositivo electrónico semiconductor, que puede ejercer funciones de detección y modulación, así como provocar oscilaciones y amplificar corrientes eléctricas. Vacuómetro: Instrumento medidor de la presión de vacío. Viscosidad: Cualidad de los fluidos debida al rozamiento entre las moléculas que lo constituyen. Se gradúa mediante la determinación de la velocidad de los fluidos a través de tubos capilares. Viscosímetro: Aparato o instrumento que mide la viscosidad, esto es, el rozamiento interno. Voltímetro: Aparato que mide la tensión eléctrica que circula por un conductor.


RESPUESTAS A LAS PREGUNTAS DE REPASO

que la segunda, aunque su error absoluto sea muy superior al que se comete en la segunda medición.

El estudio de la física 1. Porque su principal objetivo es el estudio de los fenómenos naturales para poder comprender los principios que los gobiernan. 2. La hipótesis es una proposición pendiente de demostrar. La tesis es una proposición apoyada por argumentos demostrables. 3. Las leyes que rigen el movimiento de la materia.

Sistemas de unidades 1.

v = 120 · 1.000 m = 33,33 m/s 360 s

Mecánica y fuerzas |v | = 2 | = 4 |w

1.

Producto escalar: v · w = v · w · cos 90º = 2 · 4 · 0 = 0 Producto vectorial: | v w| = | v|·| w|· sen 90º = 2 · 4 · 1 = 8 El resultado del producto vectorial es un vector r , de módulo 8 unidades, cuya dirección es perpendicular al pla , y su sentido viene no que determinan los vectores v y w dado por la llamada regla del tornillo o sacacorchos:

m = 2,5 · 1.000 kg = 2.500 kg s=

v v2

400 cm2 = 0,04 m2 2 10.000 cm2 m

2. A simple vista parecería que no, pero para saberlo es necesario comprobar si las dos magnitudes son homogéneas, para lo cual deben tener la misma ecuación de dimensiones: L [m · v] = M ––– = MLT –1 T [F · t] = MLT-2 · T = MLT –1 Las dos ecuaciones de dimensiones son homogéneas, por lo que sí pueden sumarse. 3. Para saber qué medida se realizó con mayor precisión, se calculan los errores relativos en ambos casos. Primer caso: 2m Er = ––––––– = 0,00117 1.700 m es decir, el error relativo es: Er = 0,117%. Segundo caso: 0,02 m Er = –––––– = 0,0085 2,35 m es decir, el error relativo es: Er = 0,85%. Comparando los dos errores relativos, se observa que la primera medida se realizó con bastante mayor precisión

v1

v2 α

2. a) Verdadero. b) Verdadero. c) Verdadero.

Estática 1. La fuerza resultante que equilibrará el sistema tendrá sentido contrario a las otras dos, y para que el sistema se equilibre debe cumplirse que: ΣF = 0; F 1 + F 2 + R = 0 R = – F 1 – F 2 = – 50 – 25 = – 75 N Recuérdese que, aunque tengan signo negativo, las fuerzas siempre poseen intensidades positivas, y lo único que nos indica el signo es que apuntan en dirección contraria: →

R

X

d1 →

F1

Y

d2 →

F2


74

FÍSICA

________________________________________________________________________________________________________

También debe cumplirse que la suma de todos los momentos con respecto a un punto sea cero. Si tomamos el punto X como referencia: F 1 · 0 + R · d 1 – F 2 · d 2 = 0 R · d 1 = F 2 · d 2

cida por el peso es: Fuerza realizada por el hombre. Así: F’ = m · g · sen α = 20 kg · 9,8 m/s2 · sen 30º = 98 N Ahora bien, el efecto resultante de ambas fuerzas se traducirá en una aceleración: Σ F = m · a, con lo que: F – F’ = m · a

Sabemos que: d1 + d2 = 1 m. R · d1 = F2 · (1 – d1) 75 · d1 = 25 · (1 – d1); 75 · d1 = 25 – 25 · d1; 100 d1 = 25 d1 = 25/100 = 0,25 m → d2 = 0,75 m Por lo que la resultante de 75 N está aplicada a 25 cm del punto X y a 75 cm de Y. 2. El momento producido por el niño al abrir la puerta será:

Por tanto: F = m · a + F’ = 20 kg · 1,5 m/s2 + 98 N = 128 N b) Trabajo realizado: T = F · s = 128 N · 6 m = 768 julios c) Potencia desarrollada por el hombre: P = T/t = 768/300 s = 2,56 vatios

M1 = 25 N · 0,8 m = 20 N · m Y el del padre: M2 = 60 N · 0,2 m = 12 N · m M1 } M2, por lo que el padre no podrá impedir que el niño abra la puerta.

Hidrostática e hidrodinámica 1. El volumen del cubo es su arista elevada a la tercera potencia: V = 133 = 2.197 cm3:

Cinemática vm = desplazamiento tiempo empleado vm =

vm =

52 km 30 km + 22 km 95 km/h 48 km/h

52 km = 67,17 km/h (0,3157 + 0,4583) h

2. a) Como la bicicleta avanza por segundo N veces la longitud de la periferia de la llanta de la rueda, la velocidad lineal de la periferia de las ruedas es igual a la de traslación de la bicicleta: v=ω·R De donde ω = v/R = 30 km/h/0,3 m = = 8,33 m/s/0,3 m = 27,77 s–1 = 27,77 rad/s b) La aceleración centrípeta o normal viene dada por la expresión: 2 2 ac = v = 8,33 = 231,29 m/s2 R 0,3 c) El número de vueltas que dará cada rueda en un kilómetro es la relación que existe entre la distancia recorrida y la longitud periférica de la rueda: nº de vueltas = 1.000 m = 1.000 m = 530,5 vueltas 2πR 2π · 0,3 m

2. La presión transmitida por el tapón a cada punto de la botella viene dada por la fórmula: p = F S La superficie circular de la botella es πr 2, S = π · 1,12 = 3,8 cm2. Pasada la superficie al Sistema Internacional, S = 3,8 · 10–4 m2: ρ=

1N = 2.631,5 pascales 3,8 · 10–4 m2

3. De la fórmula: F = f · ↓f s

1.

100 km/h = 27,77 m/s 60 km/h = 16,66 m/s I = m · ∆v = 1.200 kg · (27,77 – 16,66) = 13.332 N/s

2. a) En el sistema intervienen dos fuerzas: la ascendente, realizada por el hombre en el sentido del movimiento, y la componente del peso en la dirección del plano, que se opone al desplazamiento. La fuerza “negativa” ejer-

F

S

Despejando s: s=S·

Dinámica

S s ↓

1.

ρ = m = 2.500 g 3 = 1,137 g/cm3 V 2.197 cm

f F

= 0,5 ·

15 100

= 0,075 m2

4. Al estar la cisterna a 10 m de altura y al 80% de su capacidad, el nivel del agua estará a 8 m de su base. Aplicando el teorema de Torricelli, la velocidad del líquido en la salida será:

h = 2 · 9, 8 · 8 = 12,52 m/s V = 2 g 5. En una conducción horizontal, la presión no puede crecer si se ensancha la sección. La única forma de que ello sucediese es que la conducción fuera descendente.


______________________________________________________________________________

6. Según el teorema de Bernouilli, la suma de la presión hidrostática, cinética y potencial deben ser constantes en todos los puntos de la conducción. Es decir: 1 P + dgh + dV 2 = constante 2 Luego al aumentar la altura h, la presión P disminuirá. Por su parte, al ser mayor la velocidad v, también se reducirá la presión. En los ensanchamientos, debido al teorema de la continuidad (S · V = cte.), la velocidad es menor y, por tanto, la presión aumenta (la única afirmación cierta de la frase propuesta).

Temperatura y dilatación 1. La longitud a 60 ºC vendrá dada por la expresión: l = l0 (1 + λt) Siendo: l la longitud a los t ºC a que se calienta el sólido, l0 la longitud del sólido a 0 ºC y t los grados centígrados de incremento de temperatura: l = 100 cm · (1 + 1,1 · 10 –6 ºC –1 · 60 ºC) = 100,0066 cm 2. a) El coeficiente de dilatación del hierro viene dado por

la expresión:

Respuestas a las preguntas de repaso

75

2. Se parte del concepto de que el calor cedido por el agua es igual al calor absorbido por el hielo. Siendo t la temperatura final que se alcanza, el calor perdido por el agua será: Q1 = 500 g · 1 cal/g ºC · (30 – t) Calor perdido por el calorímetro: Q2 = 30 cal/g ºC · (40 – t) Estos calores perdidos los absorbe el hielo al fundirse para acabar llegando a la temperatura t. El calor perdido es el de fusión más el de 0 ºC hasta alcanzar la temperatura t. Calor de fusión: Qf = 60 g · 80 cal/g = 4.000 cal Calor de 0 ºC a t: Q3 = 50 g · 1 cal/g ºC · (t – 0) Igualando calores perdidos a absorbidos: Q1 + Q2 = Qf + Q3 [500 · 1 · (30 – t) + 30 · (40 – t)] cal = [4.000 + 50 · 1(t – 0)] cal 15.000 – 500 t + 1.200 – 30 t = 4.000 + 50 t 580 t = 12.200 t = 12.200 = 21,03 ºC 580

λ = l – l0 l0 t es decir: λFe = (10,011 – 10) m = 1,1 · 10–5 10 m · 100 ºC Y el del cobre es la 16/11 parte del coeficiente del hierro, es decir:

λFe 11 = λFe 16

λCu = 16 · 1,1 · 10–15 = 1,6 · 10–15 11

b) La varilla de cobre a 0 ºC medirá: l l0Cu = = 10,011 m = 9,995 m (1 + λt) 1 + 1,6 · 10–5 · 100 ºC Conociendo la longitud de la barra a 0 ºC podemos saber a qué temperatura medirá 10 m: l = l0 (1 + λt) 10 m = 9,995 m (1 + 1,6 · 10 –5 · t) Por tanto: 1 10 – 1 = 31,26 ºC t= 1,6 · 10–5 9,995

[

]

Cambios de estado 1. a) El trabajo o la energía es igual a la potencia por el tiempo: E = 950 W · (15 min · 60 s/min) = 855.000 W/s = 855 kJ b) Se aprovecha el 75%, luego: Q = 75% E = 855 kJ · 0,75 = 641,25 kJ De la ecuación: Q = m · c · (t2 – t1) si sabemos que el calor específico del agua es 4,18 kJ/ kg ºC, despejamos t2, que es la temperatura alcanzada por el agua. (Todas las cantidades se expresan en unidades del S.I.) t2 = 206,54 ºC

Termodinámica 1. Los calores específicos a presión y volumen constantes se obtendrán a partir de las dos siguientes igualdades: Cp – Cv = R γ = Cp/Cv Como Cp = 1,4 Cv, se sustituye en la primera ecuación y queda: 1,4 Cv – Cv = 8.315 J/kmol · K Cv = 8.315/0,4 = 20.787 J/kmol · K Sustituyendo el valor de Cv: Cp = 1,4 Cv = 1,4 · 20.784 = 29.097,6 J/kmol · K 2. Las principales características de las transformaciones isoterma, isocora, isobara y adiabática son las que se citan en el recuadro de la página siguiente.

Movimiento ondulatorio 1. a) La diferencia entre onda y movimiento ondulatorio reside en que la onda es el ente que se propaga hacia el infinito, mientras que el movimiento ondulatorio es la clase de movimiento que posee la onda. b) Sí, porque las ondas electromagnéticas, además de poder propagarse en el vacío, también lo hacen en medios materiales, al igual que el sonido. Recuérdese que el sonido es una onda material y necesita un medio material para propagarse. No ocurre así con las radiaciones electromagnéticas, que también pueden propagarse en el vacío. c) Lo que se transmite en las ondas es energía. 1 1 1 2. λ = v · T y T = –– → λ = v · –– = 300 · ––– = 0,46 m f f 650


76

FÍSICA

________________________________________________________________________________________________________

Transformación

Isoterma dT = 0

Ecuación

P1V1 = P2V2

Calor

Energía interna

Trabajo

Q

U dU = n · CvdT

W dW = pdV

dW = dQ Q1 – 2 = nRT ln (V2/V1) = = nRT ln (P1/P2)

dU = 0 U1 = U2

W1 – 2 = nRTL (P1/P2)

Representación gráfica

P

O V1 Isocora dV = 0

P1/T1 = P2/T2

dQ = dU Q1 – 2 = U2 – U1 = = nCv (T2 – T2)

dU = n · CvdT U2 – U1 = = n · Cv (T2 – T1)

W1 – 2 = 0

P

V2

V

2 1

O Isobara dP = 0

V1/T1 = V2/T2

dQ = dW + dU Q1 – 2 = nCp (T2 – T1)

dU = n · CvdT U2 – U1 = = n · Cv (T2 – T1)

W1 – 2 = nR (T2 – T1)

V

P

O V1 γ

Adiabática dQ = 0

γ

P1V 1 = P2V 2

γ–1 T1V 1

γ–1

= T2V 2

dQ = 0 Q1 – 2 = 0

dU = n · CvdT U2 – U1 = = n · Cv (T2 – T1)

W1 – 2 = (P1V1 – – P2V2)/γ – 1

P

1 2

O V1

SO = 1,70 m Altura al suelo, h = BC SC = CS´ = d OD = SS´ Por relaciones de semejanza entre los triángulos OAB y OH´S´, se cumple:

Verdadero. Verdadero. Falso. Verdadero. Falso.

2. En el caso de la luz. 3. A los sonidos cuya frecuencia es superior a 20.000 Hz y no son perceptibles por el oído humano.

Óptica 1.

H O

A M B

S

V2 V

Datos:

Acústica 1. a) b) c) d) e)

V2 V

d

l

C

H' D S'

Según el esquema anterior, se pueden comprobar las siguientes igualdades: HS = H´S´ = 1,82 m Longitud del espejo, l = AB

l OB l 1 –––– = ––– → –––– = –– H’S’ OS’ 1,82 2 Despejando l, obtenemos que la longitud del espejo es de 91 cm. Por semejanza de los triángulos OSS´ y BCS´, se verifica: OS SS’ 1,70 2d ––– = ––– → –––– = ––– = 2 BC CS’ h 2 Despejando la altura del espejo al suelo, h, se obtiene que el espejo debe estar a 0,85 cm del suelo. 2. La distancia de la imagen a la lente es s´, en la fórmula siguiente: 1 = –– 1 – –– 1 –– f ’ s’ s – f ´ es la distancia focal, igual a 25 cm (positivos, por estar a la derecha de O); – s es la distancia del objeto a la lente, – 60 cm en el ejercicio (negativos por estar a la izquierda de O):


______________________________________________________________________________

f’ (25 cm) · (– 60 cm) –1.500 S’ = –––– · s’ = –––––––––––––––– = –––––– = 42,85 cm S +j (– 60 + 25) cm – 35 S’ Tamaño de la imagen = Tamaño del objeto · S Ti = 6 cm · (42,85/– 60) = – 4,28 cm La imagen estará a 42,85 cm a la derecha de la lente (s’ es positiva) y tendrá un tamaño de 4,28 cm (el signo negativo significa que está invertida con respecto al objeto). La imagen es real por estar situada a la derecha de la lente: Objeto

F

O

F' Imagen

Respuestas a las preguntas de repaso

77

2. Al ser las dos cargas del mismo signo (positivas), la fuerza que habrá entre ellas será repulsiva, y se puede calcular gracias a la ley de Coulomb: Q1 · Q2 F = K –––––– d2 3 · 10–6 · 5 · 10–6 F = 9 · 109 ––––––––––––– = 0,54 N 0,52 3. El trabajo desarrollado para llevar una carga de un punto a otro es: Wa – b = q · (Vb – Va) Wa – b = 15 C · (2.500 – 1.800) V = 10.500 julios Y la potencia desarrollada:

La luz y el color 1. La intensidad luminosa de un foco puntual es el flujo de luz emitido por unidad de ángulo sólido atravesado. Se expresa matemáticamente: dF I = ––– dW 2. Los que al combinarse dan como resultado el blanco. 3. De la expresión inglesa light amplification by stimulated emission of radiation, que significa amplificación de la luz por emisión estimulada de radiación.

Física nuclear 1. El átomo está constituido por protones, neutrones y electrones. Las partículas que hacen posible la distinción entre los distintos elementos son los protones. 2. Se llaman isótopos de un elemento químico a los núclidos que poseen el mismo número atómico (Z) y distinto número másico (A). 3. La radiactividad es la ruptura espontánea de un núcleo inestable. El núcleo inestable puede ser natural o artificial. La radiactividad produce la emisión de una o varias de las siguientes radiaciones: – Radiaciones α: son núcleos de helio 42He2+ emitidos por los átomos (pueden llamarse partículas α). – Radiaciones β: son electrones emitidos por los átomos (se les puede llamar partículas β). – Radiaciones γ: son ondas electromagnéticas de altísima frecuencia (incluso mayor que la de los rayos X).

Electrostática y electrodinámica 1. La carga de 2 µC equivale a 2 · 10–6 C. La intensidad del campo viene dada por la fórmula: F E = –– Q 0,15 N = 25 · 103 N/C E = –––––––– 6 · 10 –6 C

W julios P = –– = 10.500 –––––– = 58,33 W t (180) s

Magnetismo y electromagnetismo 1. El magnetismo de un imán está ligado a la orientación de pequeñas unidades magnéticas contenidas en el interior del mismo, y al aumentar la temperatura, estas unidades magnéticas se desorientan debido a la mayor agitación molecular. 2. – En un electroimán se obtienen campos magnéticos más intensos que en un imán natural. – En un electroimán se puede invertir la polaridad simplemente con cambiar el sentido de la corriente. – Controlando la intensidad de la corriente, en los electroimanes se puede modificar la intensidad del campo magnético. 3. Los motivos de una mayor o menor intensidad de un imán se pueden resumir en tres (principalmente los dos primeros): – El mayor ferromagnetismo del núcleo, que aumenta de forma muy notable la intensidad del campo magnético en un electroimán. – La cantidad de capas de conductor que tenga la bobina, que cuanto mayor sea más importante será la intensidad. – Los electroimanes en herradura poseen un campo magnético más intenso debido a la cercanía de sus polos.

Electrónica 1. La electrónica es la rama de la física que estudia el movimiento de los electrones y otras partículas atómicas cargadas, en el vacío, en atmósferas con gases enrarecidos o en semiconductores. 2. El paso de corriente se produce debido a que el filamento metálico, al calentarse, emite electrones, que en el vacío de la lámpara circulan del filamento a la placa o ánodo. 3. En un transistor se distinguen el emisor, el colector y la base.



QUÍMICA la

•El estudio de la química •Estructura atómica

Cu Cátodo

Zn

•Estructura electrónica

Bombil

etro Voltím

Puente salino

Ánodo

2+

y sistema periódico

Cu 2+

•Nomenclatura y formulación

Zn

•Enlaces atómicos y moleculares •Estados de agregación de la materia

•Elementos de la tabla periódica

+ Se rom la unió pe iones n de los

-

+

•Química orgánica

-

-

•Reacciones químicas

+

•Química de disolución

+ +

-

CH 3

O

N

HN

O

N CH 3

N

-

•Alcoholes, fenoles y éteres •Otros compuestos orgánicos

-

+

+

•Hidrocarburos

T ºC 0 –10 –20 –30 –40 –50 –60 –70 –80 –90 –100 –110 –120 –130 –140 –150 –160 –170 –180 –190 1 2 3

4 5 6 7 8 9 10 11 1

-

+ +

-

2 n.º ca rbon

os



O

EL ESTUDIO DE LA QUÍMICA

HN

O

N

N CH3

Aproximación histórica

CH3

N

fenicios fabricaban sus armas. La extracción del hierro en hornos rudimentarios y, sobre todo, el descubrimiento del acero, aleación obtenida al mezclar carbón vegetal con hierro, marcó una nueva era en la historia del hombre. Los egipcios desarrollaron magistralmente determinadas técnicas químicas, fabricando vidrios y esmaltes, preparando colorantes para teñir telas y elaborar perfumes, bálsamos, venenos y jabones. También conocían sistemas de embalsamamiento, purificaban metales, en especial oro y cobre, y obtuvieron diversas sales minerales. A partir del siglo VI a.C. se sentaron en Grecia las bases de la química teórica, surgiendo otro importante foco de conocimiento, aunque diferente al del pueblo egipcio. Mientras los egipcios adquirían conocimientos de los hechos experimentales, los filósofos griegos especulaban sobre la naturaleza de la materia y ofrecían una explicación del mundo mediante la elaboración de doctrinas. Los filósofos griegos creían que existía un elemento esencial que originaba todas las demás sustancias. Tales de Mileto consideraba que ese elemento fundamental era el agua, Heráclito pensaba que era el fuego, Anaxímenes creía que era el aire y Empédocles añadió un cuarto elemento además de los anteriores, la tierra. Aristóteles aceptó la teoría de los cuatro elementos y los relacionó con las cualidades de seco, húmedo, caliente y frío. Los cuatro elementos eran consecuencia de dos propiedades no opuestas: el fuego, caliente y seco; el aire, caliente y húmedo; la tierra, fría y seca; el agua, húmeda y fría:

La química es la ciencia que estudia la estructura, constitución, propiedades y posibles transformaciones de la materia, así como la energía que se desprende de dichas transformaciones. Aunque la química concebida como ciencia moderna y experimental es relativamente reciente, su origen real se funde con las primeras manifestaciones culturales, artes y oficios del hombre primitivo. El descubrimiento y dominio del fuego, en la edad de piedra, permitieron al hombre controlar los primeros cambios químicos en la estructura y composición de la materia, y sentaron los precedentes más remotos de los procesos químicos. La conquista del fuego motivó el conocimiento de tres importantes técnicas químicas: la cerámica, el vidrio y la metalurgia. El pueblo chino conocía la técnica de la cerámica cinco mil años antes de nuestra era. El origen del vidrio se remonta a los asirios, que ya utilizaban la pasta de vidrio unos 2.500 años antes de la era cristiana. Los egipcios perfeccionaron la técnica y se convirtieron en maestros de la fabricación del vidrio. En cuanto a los metales, el descubrimiento de que el cobre metálico se obtenía al calentar determinadas piedras azules o verdes probablemente fuera fruto de la casualidad. El bronce se descubrió unos 4.000 años a.C. al calentar a la vez minerales de estaño y cobre, de manera que se obtenía un material de gran dureza con el que los

Fuego Seco

Caliente

Aire

Tierra Tierra Frío

Húmedo Agua

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


82

QUÍMICA

____________________________________________________________________________________________________

Antoine Laurent de Lavoisier aportó notables avances al estudio de la química de los gases.

En el siglo IV, Leucipo y Demócrito defendieron la teoría del atomismo, según la cual la materia no es divisible indefinidamente, sino que se llegaría a una partícula tan pequeña que ya no se podría dividir. Epicuro llamó átomo a esa partícula indivisible. Esta teoría fue desechada por los grandes filósofos griegos, Sócrates, Platón y Aristóteles, y no reapareció hasta el siglo XIX con John Dalton. Durante el siglo IV a. C., las civilizaciones griega y egipcia contrastaron su saber y surgió un enfrentamiento que originó un período oscurantista durante el cual se detuvo el desarrollo de la ciencia. En el siglo VII se produjo la expansión árabe. La cultura islámica asimiló las doctrinas filosóficas de Grecia y Egipto y se acuñó la palabra Al-Kimiya o alquimia para referirse al estudio de las transformaciones de la materia. Los alquimistas, precursores de los modernos químicos, se dedicaron a obtener sustancias por procedimientos de transformación química, con el objetivo de buscar los cuerpos nobles que les revelaran el secreto de los cambios del Universo. Durante la edad media, los alquimistas pensaban que los cuatro elementos aristotélicos podían intercambiarse entre distintos materiales, por lo que tendría que existir un sistema para convertir una sustancia en otra, y más concretamente para convertir cualquier metal en oro. Consideraban que los metales se componían de dos

principios comunes: el mercurio, que les daba carácter metálico, y el azufre, que les confería combustibilidad, y condensaba los elementos tierra y fuego. Para obtener oro, sólo tenían que mezclar azufre y mercurio en las proporciones adecuadas, pero en presencia de la “piedra filosofal”, a la que también se atribuía la cualidad de eliminar la enfermedad, devolver la juventud y proporcionar inmortalidad, por lo que se denominó también “elixir de la vida” y “elixir de la eterna juventud”. Los alquimistas europeos, entre los siglos XII y XVI, consiguieron aislar diversos elementos, como el bismuto, el arsénico o el antimonio, y utilizaron para ello diferentes métodos operativos, como la calcinación, la disolución, la sublimación o la cristalización. Entre los famosos alquimistas árabes se encuentra Geber (o Yabir), que en su búsqueda de la piedra filosofal, preparó los ácidos acético (a partir del vinagre) y nítrico diluido (a partir de los nitratos naturales) y describió la síntesis de algunas sales. En Occidente destacaron san Alberto Magno, Roger Bacon, Arnau de Vilanova y Ramón Llull. Hacia principios del siglo XVI, las corrientes científicas del momento ayudaron a la alquimia a salir del oscurantismo en el que estuvo durante la edad media. Surgió un gran interés por la aplicación de drogas, tanto naturales como artificiales, para la curación de enfermedades. Se trataba de una química farmacéutica, a la que se denominó iatroquímica o química médica. Durante esta época destacaron, entre otros, los trabajos del alemán Georg Agrícola, que buscó la utilidad medicinal de muchos minerales y resumió los conocimientos metalúrgicos de la época. Otro representante fue el médico suizo Paracelso, quien sentó las bases de la moderna química médica. El médico alemán Libavin preparó el ácido clorhídrico, el agua regia (mezcla capaz de disolver el oro, compuesta por los ácidos clorhídrico y nítrico) y muchos medicamentos. El médico flamenco Jean Baptiste Van Helmont inventó la palabra gas (del griego “chaos”: desorden) para denominar a los vapores. Estudió y demostró que el gas producido en la combustión de la madera era distinto del aire, y lo denominó “gas silvestre” (es el actual dióxido de carbono). Entre los primeros químicos que rompieron con la tradición alquimista cabe citar al angloirlandés Robert Boyle, quien en su obra El químico escéptico, publicada en 1661, sustituyó el término alquimia por el de química. Estableció el moderno concepto de elemento, considerándolo, desde un punto de vista práctico, como la sustancia que no puede descomponerse en otras más simples. Estudió la materia en estado gaseoso y descubrió que al aumentar la presión disminuía el volumen y viceversa. La cualidad de los gases de ser compresibles ratificó su convicción de que la materia estaba compuesta por átomos y fue el primero que utilizó esta teoría para explicar las transformaciones químicas. En esa misma época, el alemán Georg Ernst Stahl propuso la teoría del “flogisto”, según la cual los metales y las sustancias combustibles contenían un principio infla-


________________________________________________________________________________________

mable llamado flogisto, que se desprendía al arder una sustancia o al enmohecerse un metal. Esta teoría trataba de explicar los procesos de combustión en el aire y la calcinación de los metales. Una sustancia rica en flogisto ardía con facilidad y sin dejar cenizas, en tanto que los metales sin flogisto (enmohecidos) eran más difíciles de quemar. La teoría del flogisto no explicaba las diferencias de peso entre las distintas sustancias. La madera disminuía de peso al arder, ya que desprendía flogisto, pero los metales al enmohecerse aumentaban de peso, aunque también perdiesen flogisto. Antoine-Laurent de Lavoisier resolvió este problema sustituyendo el flogisto por el oxígeno, constituyente gaseoso de los ácidos y de las bases. Con meticulosidad, calcinó estaño en un recipiente cerrado y comprobó que el conjunto no aumentaba de peso; el metal, calcinado o enmohecido, pesaba más que el estaño inicial, pero el aire del recipiente había disminuido su peso en la misma cantidad. Después de varios experimentos, determinó que el aire contenía un 27% de un componente activo al que denominó oxígeno, que reaccionaba con el metal y actuaba en la combustión (la proporción de oxígeno en el aire es del 21%). El resto del aire, inactivo, se denominó “ázoe” y posteriormente nitrógeno. Lavoisier desarrolló en su tratado elemental de química todos los conocimientos químicos de la época y creó las bases de la química moderna. Aplicaba sistemáticamente el principio según el cual la masa no se crea ni se destruye en los procesos químicos, sino que unas sustancias se transforman en otras. También desarrolló, junto a

El estudio de la química se centró durante la edad media en los laboratorios de alquimia. En la imagen, El alquimista, de David Teniers, (Museo del Prado, Madrid).

El estudio de la química

83

Principales divisiones de la química Divisiones de la química

Objeto de estudio

Inorgánica

Estudia los elementos y sus compuestos, excepto los que están formados por cadenas de carbono

Orgánica

Estudia los compuestos del carbono

Analítica

Estudia los métodos utilizados para identificar y determinar la composición porcentual de las sustancias

Física

Estudia las relaciones entre la estructura y las propiedades de las sustancias

Técnica o industrial Describe los procedimientos industriales para obtener las sustancias

otros investigadores, un sistema detallado de nomenclatura química. Los esfuerzos de Lavoisier y de sus seguidores por establecer un método de nomenclatura y unos principios universales dieron sus frutos durante el siglo XIX. Lavoisier abrió un período en torno al cual se articularon un conjunto de nuevos principios y descubrimientos. Los químicos centraron su atención en las masas que forman parte de las reacciones y que participan en la composición de las sustancias. John Dalton explicó la constancia en la proporción de los elementos que constituían un compuesto químico, considerando que estaban formados por pequeñas partículas denominadas moléculas. Desarrolló una teoría atómica, según la cual los elementos químicos estarían formados por átomos, iguales entre sí, indestructibles e indivisibles. Joseph-Louis Gay-Lussac estudió en 1808 los volúmenes de gases de las reacciones químicas y observó que los volúmenes medidos, en igualdad de condiciones de presión y temperatura, mantenían relaciones fijas, determinables mediante análisis matemáticos de unidades enteras simples. Por ejemplo, el hidrógeno reacciona con el oxígeno en la proporción de dos volúmenes de hidrógeno por cada volumen de oxígeno para producir dos volúmenes de vapor de agua; el nitrógeno y el hidrógeno lo hacen en una proporción de un volumen de nitrógeno por cada tres volúmenes de hidrógeno; un volumen de cloro se combina con uno de hidrógeno para formar dos volúmenes de cloruro de hidrógeno. Con los datos así obtenidos, no se entendía que partiendo de una molécula de cloro y una de hidrógeno se formasen dos moléculas de cloruro de hidrógeno cuando


84

QUÍMICA

____________________________________________________________________________________________________

Premios Nobel de química Instituidos en 1901 por el científico sueco Alfred Nobel para galardonar los avances más decisivos del saber humano, en la disciplina de química los premios Nobel han recaído en: 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943

J. H. Van’t Hoff (Países Bajos) E. Fischer (Alemania) S. A. Arrhenius (Suiza) Sir W. Ramsay (G. Bretaña) A. Von Baeyer (Alemania) H. Moissan (Francia) E. Buchner (Alemania) E. Rutherford (G. Bretaña) W. Ostwald (Alemania) O. Wallach (Alemania) M. Curie (Francia) V. Grignard (Francia) P. Sabatier (Francia) A. Werner (Suiza) T. W. Richard (EE. UU.) R. Willstätter (Alemania) No concedido No concedido F. Haber (Alemania) No concedido W. Nersnt (Alemania) F. Soddy (G. Bretaña) F. V. Aston (G. Bretaña) F. Pregl (Austria) No concedido R. Zsigmondy (Alemania) T. Svedberg (Suecia) H. Wieland (Alemania) A. Windaus (Alemania) A. Harden (G. Bretaña) H. Von Euler-Chelpin (Suecia) H. Fischer (Alemania) K. Bosch (Alemania) F. Bergius (Alemania) J. Langmuir (EE. UU.) No concedido H. C. Urey (EE. UU.) F. e I. Joliot-Curie (Francia) P. J. W. Debye (Países Bajos) N. Haworth (G. Bretaña) Paul Karrer (Suiza) R. Kuhn (Alemania) A. Butenandt (Alemania) L. Ruzicka (Suiza) No convocado No convocado No convocado G. de Hevesy (Hungría)

1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976

O. Hahn (Alemania) A. I. Virtanen (Finlandia) J. B. Sumner (EE. UU.) J. H. Northrop (EE. UU.) W. M. Stanley (EE. UU.) R. Robinson (G. Bretaña) A. W. K. Tiselius (Suecia) W. F. Giauque (EE. UU.) O. P. H. Diels (R. F. Alemania) Kurt Alder (R. F. Alemania) E. M. McMillan (EE. UU.) G. T. Seaborg (EE. UU.) A. J. P. Martin (G. Bretaña) R. L. M. Synge (G. Bretaña) H. Staudinger (R. F. Alemania) L. G. Pauling (EE. UU.) V. du Vigneaud (EE. UU.) G. N. Hinshelwood (G. Bretaña) N. N. Semyonov (URSS) A. R. Todd (G. Bretaña) F. Sanger (G. Bretaña) J. Heyrovsky (Checoslovaquia) W. F. Libby (EE. UU.) M. Calvin (EE. UU.) M. F. Perutz (G. Bretaña) J. C. Kendrew (G. Bretaña) K. Ziegler (R. F. Alemania) G. Natta (Italia) D. Hodgkin (G. Bretaña) R. B. Woodward (EE. UU.) R. S. Mulliken (EE. UU.) M. Eigen (R. F. Alemania) R. G. W. Norrish (G. Bretaña) G. Porter (G. Bretaña) I. Onsager (EE. UU.) D. H. R. Barton (G. Bretaña) O. Hassel (Noruega) L. F. Leloir (Argentina) G. Herzberg (Canadá) Ch. B. Anfinsen (EE. UU.) S. Moore (EE. UU.) H. Stein (EE. UU.) E. O. Fischer (R. F. Alemania) G. Wilkinson (G. Bretaña) P. Flory (EE. UU.) J. W. Cornforth (G. Bretaña) V. Prelog (Suiza) W. N. Lipscomb (EE. UU.)

debía de formarse una sola. Amadeo Avogadro, en 1811, encontró una explicación. Postuló la existencia de moléculas, indicando que las partículas que forman los gases elementales no son átomos, sino agregados de átomos, a los que denominó moléculas, y enunció su hipótesis suponiendo que bajo condiciones análogas de presión y

1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996

1997 1998 1999 2000

I. Prigogine (Bélgica) P. Mitchell (G. Bretaña) H. C. Brown (EE. UU.) G. Wittig (R. F. Alemania) P. Berg (EE. UU.) W. Gilberg (EE. UU.) F. Sanger (G. Bretaña) K. Fukui (Japón) R. Hoffmann (EE. UU.) A. Klug (G. Bretaña) H. Taube (EE. UU.) B. Merrifield (EE. UU.) H. A. Hauptman (EE. UU.) J. Karle (EE. UU.) D. R. Herschbach (EE. UU.) Y. T. Lee (EE. UU.) J. C. Polanyi (Canadá) D. J. Cram (EE. UU.) J. M. Lehn (Francia) C. J. Pedersen (EE. UU.) J. Deisenhofer (R. F. Alemania) R. Huber (R. F. Alemania) H. Michel (R. F. Alemania) S. Altman (EE. UU.) T. R. Cech (EE. UU.) E. J. Corey (EE. UU.) R. R. Ernst (Suiza) R. A. Marcus (EE. UU.) K. B. Mullis (EE. UU.) M. Smith (Canadá) G. A. Olah (EE. UU.) P. Crutzen (Países Bajos) M. Molina (México) F. Sherwood Rowland (EE. UU.) Robert F. Curl (EE. UU.) Richard E. Smalley (EE. UU.) Harold W. Kroto (G. Bretaña) Paul Boyer (EE.UU.) John Walker (G. Bretaña) Walter Hohn (EE.UU.) John A. Pople (EE.UU.) Ahmed H. Zewail (Egipto/EE.UU.) Hideki Shirakawa (Japón) Alan Heeger (EE.UU.) Alan MacDiarmid (Nueva Zelanza/EE.UU.)

temperatura, volúmenes iguales de diversos gases contenían siempre el mismo número de moléculas. De esta forma, si las moléculas de cloro e hidrógeno tuvieran dos átomos cada una, sí podrían formarse dos moléculas de cloruro de hidrógeno. Se pensó que los átomos de los elementos eran agrega-


________________________________________________________________________________________

dos de átomos de hidrógeno (ésta era la hipótesis de Proust), ya que las masas atómicas relativas eran números enteros. Las nuevas hipótesis y leyes, así como la mayor exactitud de las medidas, demostraron más adelante que la mayoría de las masas relativas eran números decimales. La siguiente escala de masas atómicas se basó en la masa del átomo de oxígeno y actualmente se fundamenta en el valor 12 para la masa de carbono-12. Jakob Berzelius publicó en 1828 la tabla de las masas atómicas de los elementos conocidos hasta ese momento. En el primer tercio del siglo XX se hicieron varios intentos de clasificar los elementos químicos. El criterio más utilizado era el de seguir el orden creciente de sus masas atómicas. Julius Lothar Meyer y Dimitri Ivánovich Mendéleiev fueron los creadores del sistema periódico. Este hecho llevó a pensar que los átomos debían ser más complejos de lo que se creía hasta ese momento, y más tarde, en 1897, el descubrimiento del electrón contribuyó al concepto de química moderna que se aplica actualmente. Los electrones se convirtieron en los responsables de las reacciones químicas. La existencia de un desequilibrio electrónico explicaba los efectos fisicoquímicos. La química orgánica, que en un principio se aplicaba exclusivamente a los seres vivos, amplió sus aplicaciones. Se consiguieron compuestos orgánicos mediante procesos artificiales de síntesis, que repercutieron sobre la industria. El descubrimiento de las sustancias radiactivas y el creciente empleo de combustibles fósiles y derivados del petróleo abrieron nuevos caminos a la química. La química médica y farmacéutica, y la química de los grandes polímeros (plásticos, fibras, etc.), se desarrollaron de forma espectacular durante la segunda mitad del siglo XX. La alimentación, los cultivos agrícolas y diversos tipos de utilización de la química surgieron como resultado de una ciencia en continua evolución. Durante las últimas décadas, la visión tridimensional de las moléculas, los avances en los métodos de análisis y síntesis y la utilización de la informática como herramienta de trabajo han supuesto nuevos logros para la ciencia química, en constante y continuo progreso.

Clasificación de la química La clasificación de la química en ramas perfectamente definidas e independientes es difícil de establecer debido a la amplitud de los campos que estudia esta ciencia, así como por el gran número de interrelaciones que presenta con otras ciencias. Los criterios de división en diferentes áreas especializadas de trabajo han sido muy variados. Una de las divisiones que se establecieron atiende a su utilidad inmediata, considerándose química pura cuando su enfoque se dirige a la construcción de modelos y sistemas teóricos para explicar y predecir el comportamiento de las especies químicas, o química aplicada cuando considera los aspectos prácticos de sus diversas áreas. Dentro de la química pura existen varias subdivisiones

El estudio de la química

85

en función de las sustancias objeto de trabajo y de la naturaleza de las sustancias a estudiar. La química general analiza distintos acontecimientos y características que describen procesos en los que intervienen los diferentes elementos químicos. La termoquímica estudia y analiza los intercambios de energía que se producen en las reacciones químicas. La cinética interpreta la naturaleza de los equilibrios en las sustancias químicas, así como las velocidades de las reacciones que se producen. La química física establece las relaciones entre la estructura y las propiedades de las sustancias. Por otra parte, la síntesis química reúne diversas técnicas y conocimientos que permiten la fabricación de determinadas sustancias a partir de otros compuestos iniciales (se acerca así al objetivo de la química aplicada y a la química industrial). La química analítica estudia los métodos para reconocer y determinar los componentes elementales de las sustancias. La química descriptiva estudia las propiedades y características de los compuestos para utilizarlos en su identificación y determinación cualitativa, de forma que se diferencian dos grandes tipos de sustancias químicas: las inorgánicas y las orgánicas. La química inorgánica estudia los elementos simples y compuestos, salvo los que están formados por cadenas de carbono. La química orgánica estudia los compuestos del carbono, así como sus combinaciones con otros elementos, en especial hidrógeno, oxígeno, nitrógeno, fósforo, azufre y cloro, y constituidos fundamentalmente por estructuras complejas y unidas entre sí por largas cadenas de enlaces químicos (en un principio se pensaba que estas sustancias se obtenían exclusivamente de los seres vivos, pero también se obtienen por síntesis). Dentro de la química orgánica, el estudio de las macromoléculas durante el siglo XX adquirió una gran importancia en bioquímica, ciencia que estudia las estructuras y los procesos biológicos y que es actualmente una disciplina independiente. En el cuadro que se ofrece en la página 79 se indica, a modo de resumen, una de las principales clasificaciones de la química.

_ Preguntas de repaso 1. ¿Quién fue el primer científico que utilizó el término de “química” para designar los temas que estudiaba la antigua alquimia? 2. ¿Cuál fue la principal aportación de Lavoisier al desarrollo de la ciencia química? 3. ¿En qué cinco grupos principales puede dividirse la química?


ESTRUCTURA ATÓMICA

O HN

O

N

N CH3

Teoría atómico-molecular Como se indicó en el tema anterior, las investigaciones sobre si la materia estaba constituida por partículas invisibles o, por el contrario, formaba una entidad única, comenzaron con los filósofos de la antigua Grecia. Fue Demócrito quien desarrolló la primera teoría basada en la discontinuidad de la materia, y puso de manifiesto la existencia del átomo. A principios del siglo XIX, John Dalton desarrolló su teoría atómica, donde exponía sus ideas sobre la constitución de la materia. Ésta se puede resumir así en los términos siguientes: – Los átomos son las partículas constitutivas de todas las sustancias; son pequeñas esferas macizas e invisibles. – Las esferas, o átomos, son idénticas (tienen la misma masa y las mismas propiedades) para un mismo elemento y diferentes a las de cualquier otro elemento. – Los átomos de distintos elementos pueden agruparse para formar moléculas compactas, entre las que se establece una relación numérica sencilla. En el año 1896, Henri Becquerel rebatió la teoría de la indivisibilidad del átomo, al realizar sus experiencias con las sales de uranio que emitían radiaciones similares a los rayos X. Estos experimentos dieron lugar al establecimiento de diferentes modelos atómicos para poner de manifiesto la existencia de partículas tanto de carga positiva como de carga negativa en el interior de un mismo átomo.

Modelo atómico de Thomson En 1897, al estudiar la naturaleza de los rayos catódicos, Joseph J. Thomson puso de manifiesto la existencia del electrón. Para ello utilizó un tubo de vacío, que disponía de un campo eléctrico y otro magnético. Observó que los electrones poseen carga negativa, mientras que los átomos son eléctricamente neutros, por lo que, para equilibrar la carga negativa de los electrones, cada átomo debería tener igual carga positiva. Estas premisas permitieron a Thomson suponer un modelo atómico constituido por una esfera maciza de carga

CH3

N

positiva y con electrones de carga negativa en su interior, por lo que el resultado de su conjunto era el átomo de carga neutra. A partir de este modelo se postuló que la materia está constituida por partículas cargadas eléctricamente, que se desplazan de unos cuerpos a otros. Una vez formulada la teoría que sostiene que el átomo consta de electrones, negativos, y protones, positivos, el principal problema radicaba en determinar la distribución y número de partículas que había en el átomo.

Modelo atómico de Rutherford Ernest Rutherford, discípulo de J. J. Thomson, demostró a principios del siglo XX la teoría de su maestro y dio un paso decisivo en el estudio de la estructura del átomo al descubrir que éste poseía un núcleo central donde se hallaba concentrada la carga positiva y que los electrones giraban alrededor. Rutherford llegó a esta conclusión mientras investigaba la difusión de partículas alfa por la materia. Así, cuando la radiación emitida por un elemento se hace pasar a través de un campo magnético, se desdobla en tres haces distintos. Rutherford nombró estos haces con las tres primeras letras del alfabeto griego. Los rayos alfa son partículas positivas cuya masa es mayor que la del átomo de hidrógeno; los rayos beta, haces de electrones, y los gamma son radiaciones de naturaleza electromagnética, ya que no se desvían con un campo magnético. Para su experimento diseñó un dispositivo mediante el cual bombardeó una lámina muy fina de oro con partículas alfa, emitidas por materiales radiactivos protegidos mediante una cámara de plomo, disponiendo una pantalla fluorescente detrás para poder observar los impactos de las partículas cuando salían de la lámina metálica. Supuestamente, si la carga positiva y la masa del electrón se encontraban distribuidas uniformemente, las partículas alfa, con carga positiva, debían desviarse ligeramente al atravesar la lámina metálica. El resultado que se obtuvo fue que la mayoría de los rayos alfa atravesaban la lámina sin sufrir prácticamente ninguna desviación, algunos se desviaban ligeramente, mientras que ciertas partículas rebotaban y seguían una trayectoria de retroceso.

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


______________________________________________________________________________________________

Estos resultados no podían explicarse según el modelo de Thomson, razón por la que Rutherford elaboró un nuevo modelo atómico según el cual el átomo debía estar prácticamente vacío, concentrándose toda su masa en el centro o núcleo, que estaría constituido por cargas positivas. En este modelo, los electrones, cargados negativamente, giraban alrededor del núcleo como en un sistema planetario, donde existen espacios libres. La existencia de un núcleo, formado por protones, y la corteza, constituida por electrones girando, permitía explicar el comportamiento de las partículas alfa: – Las que no se desviaban pasaban alejadas del núcleo a través de los espacios vacíos. – Las que sufrían una pequeña desviación pasaban cerca de algún núcleo y se repelían, al estar cargados positivamente tanto las partículas como el núcleo. – Las grandes desviaciones de algunas partículas alfa se podían explicar pensando en un choque contra una partícula de gran masa y carga positiva, es decir, las que rebotaban era debido a que chocaban con el núcleo, y rebotaban tan pocas porque la probabilidad de chocar era muy pequeña. Así pues, se supuso que los electrones se encuentran girando en órbitas concéntricas y fijas, con un movimiento rápido que les confiere una fuerza centrífuga que impide que caigan sobre el núcleo, a pesar de la atracción electrostática que éste ejerce. Posteriormente, Rutherford obtuvo una partícula que más tarde se identificó como el protón, constituyente del núcleo cuya masa es 1.837 veces mayor que la masa de un electrón. Conociendo la existencia de electrones y protones como constituyentes del átomo, había que explicar la discrepancia entre masa y carga de los elementos, por lo que se postuló la existencia en el núcleo de otra partícula sin carga y de igual masa que el protón. James Chadwick demostró la existencia de dicha partícula, denominada neutrón. Sobre estas premisas se desarrollaría el modelo atómico de Bohr, sobre el cual se asentarían buena parte de los principios de la química atómica moderna.

Estructura atómica

87

Espectros atómicos Se puede estudiar la composición de cualquier tipo de energía electromagnética mediante sistemas ópticos, tales como prismas o espectroscopios, basándose en el hecho de que la luz, al atravesar un prisma triangular de vidrio o ser reflejada por una red de difracción, se dispersa en sus diferentes componentes. Se obtiene así un conjunto de imágenes denominadas espectros, integrado por líneas, bandas y espacios, de color, más o menos separados según sean sus componentes. Los espectros pueden ser continuos, de bandas y de rayas: – El espectro continuo corresponde a la luz blanca o solar. Es un espectro de colores, donde el azul y el rojo se disponen en los extremos. – El espectro de bandas es característico de las moléculas. Está formado por rayas muy finas que se agrupan y aparecen como bandas. – El espectro de rayas es típico de cada átomo. Si un elemento, en estado gaseoso, se somete a un calentamiento mediante una llama o se excita por una chispa o descarga eléctrica, emite una radiación que constituye su espectro atómico de emisión. Si se estudia el espectro del hidrógeno gaseoso, se observan una serie de líneas con longitudes de onda y frecuencias únicas y características. Todas estas líneas se conocen como series de Balmer, ya que fue este investigador quien descubrió que las frecuencias de la zona visible presentaban una relación sencilla entre ellas: 1/λ = ν = R(1/n12 – 1/n22) (siendo λ la longitud de onda y n1 y n2 números enteros.) Posteriormente se obtuvieron otra serie de líneas espectrales con relaciones análogas a la de Balmer, que permitían obtener las diferentes longitudes de onda del espectro del hidrógeno: Serie de Lyman = región ultravioleta. Serie de Paschen = región infrarrojo próximo. Serie de Brackett = región infrarrojo lejano.

Hipótesis de Planck Modelo atómico de Bohr El modelo atómico de Rutherford no justificaba la estabilidad del átomo, ya que, según las leyes electromagnéticas clásicas, cuando una partícula cargada eléctricamente se mueve, emite energía radiante en forma de ondas. Por tanto, el electrón iría perdiendo su energía y disminuiría su velocidad, describiendo órbitas cada vez más pequeñas hasta precipitarse sobre el núcleo. Para solucionar el problema, Niels Bohr, en 1913, estableció un nuevo modelo atómico para el hidrógeno, basándose en el modelo de su maestro Rutherford, así como en el estudio de los espectros atómicos y en la idea de Max Planck de la cuantización de la energía para explicar la radiación del cuerpo negro, principios ambos que se exponen en detalle a continuación.

Max Planck llegó a la conclusión de que la radiación no puede ser emitida ni absorbida de forma continua, sino sólo en momentos determinados y en cantidades definidas. Tales cantidades quedan establecidas en los llamados cuantos o fotones. La radiación emitida o absorbida por un cuerpo sólo puede ser un número entero de cuantos. Según Planck, el cuanto es la mínima cantidad de energía que se puede emitir y su valor es directamente proporcional a la frecuencia de la radiación emitida. Puede calcularse mediante la siguiente expresión matemática: e=h·ν Siendo h la constante de Planck = 6,624 · 10-27 ergios por segundo o 6,624 · 10-34 julios por segundo, ν (letra griega


88

QUÍMICA

____________________________________________________________________________________________________

ni) la frecuencia de la energía electromagnética, y e la energía del cuanto o fotón. A partir de lo expuesto anteriormente, Bohr estableció su modelo atómico formulando tres postulados: Primer postulado. Cuando un electrón gira en su órbita, no emite energía radiante, por lo que la órbita descrita por el electrón es estacionaria. Al no emitir energía, no varía su velocidad y no se acerca al núcleo, sino que gira alrededor de él describiendo una órbita circular. Este postulado confirma la teoría de Rutherford y permite conocer la velocidad del electrón al asemejar la fuerza de atracción electrostática, fe (que viene dada por la ley de Coulomb: proporcional al producto de las cargas dividido por la distancia al cuadrado), con la fuerza centrípeta, fc; es decir, cuando un electrón gira alrededor del núcleo, la fuerza de atracción electrostática funciona como fuerza centrípeta:

trón está cuantizado. Dando a π valores 1, 2, 3, 4, …, se obtienen los radios, r, de la órbitas permitidas. Para n = 1, la órbita es la de menor radio y por tanto el electrón en ella posee la mínima energía potencial. El estado fundamental o de mínima energía y, por tanto más estable, del hidrógeno corresponde al electrón en la primera órbita. Tercer postulado. El paso de un electrón de una órbita superior (más alejada) a otra inferior (más cercana) libera energía en forma de ondas electromagnéticas. De igual forma, para lograr que un electrón salte a una órbita más externa se necesita un aporte de energía. La frecuencia de las ondas electromagnéticas o fotones, emitidas cuando un electrón excitado en la órbita a cae en la b perdiendo la excitación, viene dada por: Ea – Eb = hν

Fuerza electrostática →fe = Ze · e/r2, siendo Z el número atómico y e la carga de los electrones de la periferia. Fuerza centrípeta →fc = mv2/r

La fórmula de la energía del electrón en cualquier órbita se puede deducir mediante las ecuaciones obtenidas en el primer y segundo postulado:

mv2/r = Ze · e/r2

Energía del electrón = Energía potencial + Energía cinética

Como Z, el número atómico, es igual al número de protones del núcleo o de electrones de la periferia y e se toma como carga de los electrones periféricos, la igualdad se transforma en la expresión siguiente:

Ee- = Ep + Ec Ec = 1/2 mv2

mv2/r = Ze2/r2; mv2 = Ze2/r; v2 = Ze2/m · r Segundo postulado. Para el electrón sólo son posibles las órbitas en las que la cantidad de movimiento del electrón por la longitud de la órbita sea un múltiplo del cuanto de energía (h/2π). Este postulado relaciona al átomo con la teoría cuántica de Planck. Puesto que la energía se emite o se absorbe en forma de cuantos de luz o fotones, no puede tomar cualquier valor, sino sólo los múltiplos enteros de ese cuanto (e = h · ν, donde h es la constante de Planck y ν la frecuencia). Como el momento cinético del electrón cuando gira alrededor del núcleo viene expresado por mvr y ha de ser múltiplo entero de h/2π. mvr = nh/2π donde n = número cuántico = 1, 2, 3 mv · 2πr = nh

Ep = ∫ r – Ze2/r2 · dr = Ze2/r La energía potencial será la carga del electrón por el potencial del punto donde se encuentra dicho electrón. Como en el infinito la energía potencial es cero, y los demás potenciales van disminuyendo según se acercan al núcleo, tendrán signo negativo. Por tanto, Ep = –Ze2/r y Ee- = 1/2 mv2 – Ze2/r Como en el primer postulado: 1/2 mv2 = 1/2 Ze2/r Sustituyendo, se obtiene la energía total del electrón Ee- = 1/2 Ze2/r – Ze2/r = –1/2 Ze2/r Teniendo en cuenta el valor de r en el segundo postulado

se eleva la expresión al cuadrado para poder sustituir la v2 por el valor obtenido en el primer postulado

Ee- = –(1/2) Ze2 · m · Ze2 · 4π 2/h2 · n2 Ee- = –mZ2 · e4 · 2π2/h2 · n2

m2 · v2 · 22 · π2 · r2 = n2 · h2

Como n = 1, 2, 3, …, n2 = 1, 4, 9, …, la expresión anterior indica que también está cuantizada la energía, puesto que depende del valor de n2. Supongamos ahora el electrón en las dos primeras órbitas; su energía para cada una de ellas será:

Se sustituye v2 por Ze2/mr m2 · Ze2/mr · 22 · π2 · r2 = n2 · h2 m · Ze2 · 4π2 · r = n2 · h2 r = h2n2/m · Ze2 · 4π2 Esta expresión indica que el radio de la órbita del elec-

Si n = 1 (órbita 1): Ee- = -2π2 · m · Z2 · e4/h2 · 12 Si n = 2 (órbita 2): Ee- = -2π2 · m · Z2 · e4/h2 · 12


______________________________________________________________________________________________

Es decir, la energía del electrón es mayor para la segunda órbita que para la primera, lo que significa que las órbitas de mayor energía son las más alejadas del núcleo, y por tanto, si un electrón pasa de una órbita superior (más alejada) a otra inferior, se libera energía. La energía liberada queda registrada en las rayas que constituyen los espectros de emisión.

Partículas subatómicas Los átomos no son las partículas elementales de la materia. Gracias a los aceleradores de partículas y a los estudios de la radiación cósmica, actualmente se conocen varios centenares de partículas de dimensiones inferiores a los átomos. Estas partículas se diferencian entre sí en razón de su masa y por su carga eléctrica. A este respecto, cabe puntualizar que a cada una de las partículas subatómicas o elementales les corresponde una antipartícula, de igual masa y duración de vida, pero de carga opuesta. Así, se definirían como partículas el protón y el electrón, mientras que serían sus correspondientes antipartículas el antiprotón y el positrón (o antielectrón). El neutrón y el antineutrón presentan una misma carga, pero se diferencian por otras características electromagnéticas, mientras que otras partículas de carga neutra, como el fotón (γ) o el pión neutro (π), son ellas mismas sus propias antipartículas. En esencia, se distinguen las siguientes categorías de partículas subatómicas: – Los leptones son las partículas más ligeras; incluyen el electrón (e-), de carga negativa; el neutrino (ν), de carga neutra y masa igual a la del electrón; el positrón (e+), de igual masa que el electrón, pero de carga positiva; el mesón o muón (µ), de carga positiva o negativa y masa 209 veces mayor que la del electrón, y sus antipartículas correspondientes. – Los mesones, partículas de masa media (menor que la del protón, pero mayor que la del electrón), con carga tanto positiva como negativa. Entre ellos se encuentran el mesón π o pión, de carga variable; el mesón K o kaón, también de carga variable; el fotón; los rayones, y sus respectivas antipartículas. – Los bariones, que son las partículas de mayor peso, entre los que podemos encontrar los nucleones –protones y neutrones–, hiperiones y sus antipartículas. Al conocerse la existencia de tan elevado número de partículas, se hacía necesario elaborar un sistema para su ordenación. Según el físico Murray Gell-Mann, estas partículas quedarían ordenadas si se admitiese la existencia de unidades más elementales, llamadas quarks. Las partículas elementales se caracterizan por su carga, su masa de reposo, el momento de rotación y el momento de traslación en una órbita. La gran mayoría de estas partículas son inestables, si bien tres de ellas –el electrón, el protón y el neutrón– están presentes en casi todos los átomos. Las características principales de estas tres partículas se pueden resumir de la siguiente forma:

Estructura atómica

89

Electrón. Los electrones fueron las primeras partículas subatómicas descubiertas. Están cargados negativamente. Símbolo: e, eMasa en reposo: 9,1090 · 10-24 g Carga: 1,602 · 10-19 culombios Protón. Partícula constitutiva del núcleo atómico, con carga igual a la del electrón, pero de signo positivo, y una masa 1.837 veces mayor que la del electrón y aproximadamente igual a la del neutrón. Símbolo: P, 11 H+ Masa en reposo: 1,6725 · 10-24 g Carga: 1,602 · 10-19 culombios Neutrón. El neutrón es la partícula constitutiva del núcleo atómico, no tiene carga eléctrica y por tanto no es desviada por los campos magnéticos o eléctricos. Símbolo: n Masa en reposo: 1,6748 · 10-24 g Carga: 0 culombios

Número atómico Se llama número atómico al número de protones que tiene en su núcleo un átomo. Este número es característico de cada elemento químico determinado, es decir, que todos los átomos de un mismo elemento tienen el mismo número de protones, mientras que en átomos de diferentes elementos el número de protones es distinto. Así, por ejemplo: el átomo de cloro es el único que tiene número atómico 17, el oxígeno 8, el carbono 6, etc. El número atómico se representa por Z, y es exactamente igual al número de electrones de la corteza en un átomo neutro, ya que los protones llevan una carga positiva igual en magnitud y de signo opuesto a la de los electrones. n.º atómico = n.º de protones = n.º de electrones = Z La determinación experimental del número atómico se realiza mediante el análisis del espectro de rayos X del elemento en cuestión.

Número másico Se denomina número másico a la suma del número de protones y el de neutrones. El símbolo que se utiliza es A. n.º másico = n.º de protones + n.º de neutrones = A A=Z+N En la tabla periódica se representa situándolo como superíndice junto al símbolo correspondiente del elemento. El número puede ser diferente en átomos de un mismo


90

QUÍMICA

____________________________________________________________________________________________________

elemento, es decir, los átomos de un elemento siempre tienen el mismo número de protones, pero pueden tener diferente número de neutrones. A los átomos de un mismo elemento que se diferencian en su número másico se les denomina isótopos.

Para designar la cantidad de sustancia en número de moles se usa el símbolo n. Ejemplo: En 74 g de Ca(OH)2 hay 1 mol, n = 1, en 148 g hay 2 moles de Ca(OH)2, es decir, n = 2

Masa atómica La unidad de medida de masa atómica o peso atómico (u o uma) en un principio era aproximadamente igual a la masa del átomo de hidrógeno. Se adoptó la masa del átomo de hidrógeno como unidad de masa atómica al ser el elemento más pequeño. También se utiliza el oxígeno como elemento tipo o patrón por su cualidad de combinarse con casi todos los elementos. En 1961 se tomó una unidad de masa relativa estableciendo una nueva escala de pesos atómicos, basada en el isótopo 12 del carbono. Esta unidad de masa atómica es la doceava parte de la masa del átomo de carbono. Este valor se ha deducido experimentalmente y equivale a 1,66 · 10-24 gramos. El átomo-gramo de un elemento es el número de gramos de dicho elemento, igual numéricamente a su masa o peso atómico, o, expresado de otra forma, el átomo-gramo, es el peso atómico expresado en gramos. Ejemplo. El átomo-gramo del azufre pesa 32 gramos porque su masa atómica es 32; el cobre pesa 63,5 gramos; el oxígeno, 16 gramos, etc.

El número de moléculas contenidas en un mol de una sustancia es constante e igual al número de Avogadro (N), que tiene un valor de: N = 6,023 · 1023 moléculas/mol El valor de esta constante permite obtener el número de moléculas (nm) contenido en cierta cantidad de gramos (x) de cualquier sustancia, así como el número de átomos (na) contenido en una cantidad de gramos de un determinado elemento. Se aplican las siguientes fórmulas: nm = Nx/mol = 6,023 · 1023 · x/mol na = Nx/átomo gramo Volumen molar. Experimentalmente se ha demostrado que una molécula de cualquier gas medido a 760 mm de mercurio de presión y 0º C de temperatura ocupa un volumen de 22,415 litros. A ese volumen se le denomina volumen molar.

Masa molecular Isótopos Se denomina molécula a la partícula neutra más pequeña de una sustancia, que presenta las características necesarias para participar en los procesos químicos y tiene capacidad de existir independientemente. Para que se constituya una molécula han de unirse varios átomos entre sí. Partiendo de estas premisas, se puede definir el concepto de masa molecular o peso molecular como la suma de las masas o pesos atómicos que componen una molécula concreta. Ejemplo. Para la molécula de hidróxido de calcio, formada por dos átomos de oxígeno, dos átomos de hidrógeno y un átomo de calcio Ca(OH)2, como la masa atómica o peso atómico es: Ca = 40; O = 16; H = 1 La masa molecular será: Masa molecular Ca(OH)2 = 1 · 40 + 2 · 16 + 2 · 1 = 74 u (unidades de masa atómica) La molécula-gramo o mol de una sustancia es la masa molecular de dicha sustancia expresada en gramos. En el ejemplo anterior del hidróxido de calcio: Masa molecular = 74 u Molécula-gramo o mol = 74 g

Pueden existir varias clases de átomos de un mismo elemento, debido a que, a pesar de tener el mismo número de protones, tienen diferente número de neutrones. A estos átomos con igual número atómico, pero diferente número másico, se les denomina isótopos. Los isótopos de un elemento deben tener idéntico comportamiento químico y diferenciarse físicamente sólo en la masa, ya que tienen la misma carga nuclear, que es la responsable de las propiedades características de cada átomo. Para cada elemento pueden exisitir una serie de isótopos en distinta proporción en la naturaleza. Por ejemplo, hay tres clases de átomos de hidrógeno, denominados protio o hidrógeno, deuterio y tritio. Al conjunto de todos los isótopos de un elemento químico se le llama pléyade. Todos los isótopos de hidrógeno tienen un protón en su núcleo, pero el hidrógeno no contiene ningún neutrón, el deuterio tiene uno y el tritio tiene dos neutrones. Hidrógeno: 11H Deuterio: 21H Tritio: 31H Actualmente se sabe que de todos los elementos conocidos, tan sólo 21 de ellos son puros. En general, un elemento químico está formado por una mezcla de isótopos que se presentan con distinta frecuencia en la naturaleza.


______________________________________________________________________________________________

Por ejemplo, el cloro tiene 2 isótopos –cloro-35 y cloro-37– y su presencia en la naturaleza es del 75% y del 25%, respectivamente. Por tanto, la masa promedio de un átomo de cloro es: 75 · 35 u + 25 · 37 u = 35,5 u 100

Mecánica cuántica El modelo atómico de Bohr era aplicable al átomo de hidrógeno, pero no explicaba el espectro de otros elementos químicos con más de un electrón. El nuevo modelo dio lugar al desarrollo de la denominada mecánica cuántica. Varias fueron las claves para superar el modelo de Bohr: – Principio de dualidad onda-corpúsculo de De Broglie. – Principio de incertidumbre de Heisenberg. – Ecuación de onda de Schrödinger.

Estructura atómica

91

y por tanto no se podría conocer la trayectoria del electrón. Ecuación de onda de Schrödinger y concepto de orbital. Partiendo de la idea de que toda partícula en movimiento lleva asociada una onda, Schrödinger halló una ecuación que permitía describir el movimiento del electrón. La ecuación de onda tiene varias soluciones para determinados valores de energía que coinciden con los números cuánticos n, l y m de la teoría de Bohr. Estas soluciones son funciones matemáticas y por tanto se pueden representar gráficamente. Esta representación delimita una región donde la probabilidad de encontrar el electrón es elevada. A ese volumen del espacio en el que resulta más probable encontrar un electrón se le llama orbital atómico. La descripción mecánico-cuántica del electrón situado en un determinado orbital necesita cuatro números cuánticos para explicar su disposición alrededor del núcleo: n, l, m, s

Principio de dualidad onda-corpúsculo de De Broglie. Según este principio, la materia se comporta como onda o como partícula según las circunstancias. La luz puede tener por una parte comportamiento corpuscular, como si fuese un conjunto de partículas (tal es el caso del efecto fotoeléctrico) y en otras ocasiones puede manifestarse como una onda (como ocurre en el fenómeno de difracción). Louis de Broglie caracterizó la onda asociada a un fotón y propuso la relación: p = h/λ o λ = h/p en donde p es la cantidad de movimiento o momento del fotón (p = m · v), λ es la longitud de onda y h la constante de Planck. De Broglie generalizó esta conclusión a toda la materia, de tal forma que no sólo el fotón llevaría una onda asociada, sino que toda la materia presentaría esta dualidad onda-corpúsculo, con lo que todo objeto o partícula en movimiento llevaría asociada una onda de longitud: λ = h/p. El segundo postulado de Bohr puede explicarse a partir de este principio, de tal forma que una órbita será posible cuando la onda electrónica sea estacionaria, o lo que es lo mismo, cuando la longitud de la órbita sea múltiplo de la longitud de onda electrónica. Principio de incertidumbre de Heisenberg y concepto de orbital. Constituye una de las ideas fundamentales del pensamiento físico actual. Al intentar conocer la cantidad de movimiento y la posición del electrón en un momento determinado, Werner Heisenberg formuló su principio, que se puede enunciar de la siguiente forma: No se pueden conocer simultáneamente y con precisión absoluta la posición y la cantidad de movimiento o momento de un electrón. Para determinar la posición de un electrón habría que emplear luz de longitud de onda menor que las dimensiones del electrón, algún fotón podría chocar contra el electrón y cambiaría su velocidad

Los orbitales de un átomo se agrupan en niveles de energía. El número cuántico principal, n, indica el nivel energético que tiene el electrón. Puede tomar cualquier valor de los números naturales a excepción del 0. Si n = 1, el orbital pertenecerá al primer nivel de energía (órbita más cercana al núcleo) si n = 2, el orbital pertenecerá al segundo nivel, y así sucesivamente. Es decir, los electrones cuyo número cuántico principal es elevado tienen más energía y están más alejados del núcleo. El número cuántico secundario o azimutal, l, también denominado angular o número cuántico orbital, describe la forma geométrica del orbital. Las energías de los orbitales que pertenecen a un mismo nivel no son idénticas. Por ello, los orbitales se agrupan en subniveles dentro de cada nivel, de tal forma que los electrones pertenecientes al mismo subnivel tienen la misma energía. El número cuántico, l, indica el subnivel de energía en el que se encuentra un orbital. Los posibles valores de l dependen del valor de n y pueden tomar cualquier valor, desde 0 hasta n – 1. Por ejemplo, si n = 4, el número l puede tomar los valores 0, 1, 2 y 3. Según los valores que toma el número cuántico secundario, las sub-órbitas se denominan: si l = 0, se tiene un orbital s; si l = 1, se tiene un orbital p; si l = 2, se tiene un orbital d; si l = 3, se tiene un orbital f; m es el número cuántico magnético, que indica la orientación del orbital l en el espacio con relación a la dirección de un campo magnético externo. Por cada valor de l, el número cuántico m puede tomar todos los valores enteros positivos y negativos comprendidos entre –l y l. Así si l = 3, m puede valer cualquier número entre 3 y –3, es decir, 3, 2, 1, 0, –1, –2, –3.


92

QUÍMICA

____________________________________________________________________________________________________

Un orbital puede tener como máximo dos electrones, que se diferencian entre sí por el sentido de giro sobre su eje. El número cuántico s o número de espín (spin en inglés significa giro) informa sobre el sentido de giro de un electrón dentro de un orbital. Sólo puede adoptar 2 valores, +1/2 o –1/2, ya que solamente son posibles dos sentidos de giro. El signo + o - depende de que el espín tome una dirección paralela o antiparalela al campo magnético exterior.

Números cuánticos Numero cuántico

Primer nivel (n = 1)

l = 0 (orbital s)

Segundo nivel (n = 2)

l = 0 (orbital s) l = 1 (orbital p)

Tercer nivel (n = 3)

l = 0 (orbital s) l = 1 (orbital p) l = 2 (orbital d)

Cuarto nivel (n = 4)

l = 0 (orbital s) l = 1 (orbital p) l = 2 (orbital d) l = 3 (orbital f)

Por otra parte, sólo existe un orbital s en cada nivel. Los orbitales p aparecen en grupos de tres, los d en grupos de cinco y los f en grupos de siete (ver cuadro siguiente):

Orbital s (l = 0)

m=0

un orbital s

Orbital s (l = 1)

m = –1 m=0 m = +1

tres orbitales p

Orbital d (l = 2)

m = –2 m = –1 m=0 m = +1 m = +2

cinco orbitales d

m = –3 m = –2 m = –1 m=0 m = +1 m = +2 m = +3

siete orbitales f

Orbital s (l = 3)

Forma de los orbitales La forma del orbital depende exclusivamente del número cuántico l.

Valores posibles

Significado

n

Principal

1, 2, 3, …

Nivel energético

l

Secundario o azimutal

0, … (n-1)

Tipo orbital (s, p, d, f)

m

Magnético

–l, …, 0, … +l

Orientación del orbital

s

De spin

–1/2, + 1/2

Sentido de giro del orbital

Distribución de los orbitales Los orbitales s aparecen en todos los niveles; los orbitales p aparecen a partir del segundo nivel; los d, a partir del tercer nivel, y los f, a partir del cuarto nivel:

Nombre adicional

– Para el electrón en un subnivel s (l = 0), todos los orbitales tienen m = 0. La distribución de la densidad de carga es independiente de la dirección en el espacio, no tiene orientación determinada y lo único que varía es la distancia al núcleo. Los orbitales s adquieren forma de esferas cuyo radio depende del valor del número cuántico principal n. – La distribución de carga de los orbitales p, l = 1, depende de la dirección. Para l = 1 son posibles tres orbitales p: px, py y pz, ya que m puede tomar los valores +1, o/y –1. Todos los orbitales p toman la misma forma y se representan por dos lóbulos separados por un plano, en el cual la probabilidad de encontrar el electrón es nula. Los tres orbitales p difieren entre sí sólo por la orientación según los tres ejes. Para el orbital l = 1, m = –1, la mejor orientación es según el eje x (Px). Para l = 1, m = 0, la orientación más privilegiada es según el eje y (Py). Para l = 1, m = 1, el orbital donde es más probable encontrar los electrones está orientado según el eje z (Pz). – Los orbitales d y f son de representación más complicada, ya que difieren entre sí tanto por su orientación en el espacio como por su forma. Hay cinco orientaciones para los orbitales d y siete para los orbitales f.

_ Preguntas de repaso 1. ¿Cuántos protones y cuántos neutrones hay en el núcleo del estroncio-90 (90 38Sr)? 2. Determinar la masa de una molécula de ácido sulfúrico, H 2SO 4, sabiendo que la masa o peso atómico del azufre es S = 32, la del oxígeno 0 = 16 y la del hidrógeno H = 1. 3. ¿Cuál es el número de orbitales presentes en el segundo nivel de energía de un átomo? ¿Qué forma adoptarían dichos orbitales?


ESTRUCTURA ELECTRÓNICA Y SISTEMA PERIÓDICO Clasificación de los elementos A comienzos del siglo XIX surgieron los primeros intentos de clasificación de los elementos químicos en grupos o familias, pero hasta 1869 no se logró una ordenación regular y coherente de los elementos, en función de sus pesos atómicos. Lothar Meyer y Dimitri Ivánovich Mendéleiev utilizaron el mismo criterio de los pesos atómicos crecientes, pero siguieron caminos distintos. Meyer, a partir de la densidad y masa de los elementos, hizo un cálculo relativo de los volúmenes atómicos y obtuvo una representación en forma de ondas, donde los elementos de propiedades análogas ocupaban lugares equivalentes, ya que aparecían con periodicidad. Por su parte, Mendéleiev tuvo en consideración el número que caracteriza la capacidad de combinación de cada átomo, es decir, la valencia. Al ordenar los elementos de acuerdo con su masa atómica, observó que las valencias se sucedían periódicamente. Dispuso los elementos en una tabla periódica, de forma que los elementos con igual valencia y propiedades similares quedaban en la misma columna. Así obtuvo una tabla con siete columnas. Colocó los elementos de transición en subgrupos dentro de los anteriores y en un grupo aparte. Interpretó los huecos como elementos todavía no descubiertos, y predijo las propiedades que tendrían los hipotéticos elementos, a los que dio nombres provisionales, añadiendo el prefijo eka al elemento que estaba encima del lugar vacío. El descubrimiento del galio, escandio y germanio, cuyas propiedades coincidían con las predichas por Mendéleiev para el eka-aluminio, eka-boro y eka-silicio, confirmó el valor de esta tabla periódica, conocida como sistema periódico corto. La tabla periódica ha sufrido modificaciones hasta llegar al actual sistema periódico largo, que está elaborado en función del número atómico, en lugar de tomar como base el peso atómico, ya que el número atómico de un elemento es característico del mismo, y de él dependen las propiedades periódicas de los elementos. Como el átomo es eléctricamente neutro (tiene el mismo número de protones y de electrones), el número atómico también indica la cantidad de electrones del átomo.

O HN

O

N

N CH3

CH3

N

Siguiendo la ordenación de esos electrones se conoce su configuración electrónica y el lugar que ocupa en el sistema periódico.

Configuración electrónica Se llama configuración electrónica de un elemento a la disposición que adoptan los electrones en un átomo de dicho elemento respecto de la posición central del núcleo. La representación de la configuración electrónica de un átomo consiste en la distribución, en niveles energéticos, de sus electrones. El primer nivel energético contiene el orbital 1s; el segundo contiene el orbital 2s y tres orbitales 2p; el tercer nivel, un orbital 3s, tres 3p y cinco orbitales 3d, y el cuarto nivel, un orbital 4s, tres 4p, cinco 4d y siete 4f. Para obtener la configuración electrónica de cualquier elemento hay que tener en cuenta una serie de principios de construcción que se exponen a continuación. Principio de exclusión de Pauli. En 1925, Wolfgang Pauli enunció un principio según el cual en ningún átomo pueden coexistir dos electrones con los cuatro números cuánticos iguales. De este modo, para un valor fijo de n, l y m hay dos electrones formando un orbital. – n define un nivel energético, y en cada nivel sólo caben 2n2 electrones; – n y l corresponden a un subnivel energético y definen el tipo de orbital; en cada subnivel caben 2(2l + 1) electrones; – n, l, m definen la orientación en el espacio del subnivel energético (un orbital determinado); en cada orientación caben dos electrones; – n, l, m, s definen un electrón, ya que sólo un electrón presenta un conjunto de cuatro números cuánticos. Regla de la máxima multiplicidad de Hund. En un mismo subnivel (p d f), los electrones tienden a ocupar un número máximo de orbitales y siempre con los mismos valores de espín hasta que sea posible.

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


94

QUÍMICA

____________________________________________________________________________________________________

Tabla de clasificación periódica de los elementos

1

CLAVE

IA

2

–252,7 –259,2 0,071

6,939

1330 108,5 0,53

Na

1

K

2770 1277 1,85

1

Rb 132,905

24,312

12 1107 650 1,74

2

Mg 40,06

20 1440 838 1,55

2

Ca

1

Cs

2

Sr

2730 1539 3,0

39

137,34

56 1640 714 3,5

2

Ba

bario 88

(226)

— 700 5,0

2

Ra radio

Sc

57 3470 920 6,17

89 — 1050 —

47,90

22 3260 1668 4,51

4,3

Ti

88,905 3

50,942

24

3450 1900 6,1

5,4,3,2

2665 1875 7,19

Y

3300 2468 8,4

Zr

3

La

72 5400 2222 13,1

5

Ta

tantalio

(260)

6,3,2

2150 7,6,4,2,3 1245 7,43

Cr

Mn

— 2140 11,5

Mo

3000 1536 7,86

7

Tc

Fe

58,933

Co

101,07

44

4900 2,3,4,6,8 2500 12,2

Ru

5900 7,6,4,2,–1 3180 21,0

5500 2,3,4,6,8 3000 22,6

tungsteno

renio

osmio

Re

102,905

45 4500 1966 12,4

Os

192,2

77 5300 2454 22,5

3

Ac

actinio✽ ✽

Rf

Ha

rutherfordio

halnio

140,12

58 3468 795 6,67

90

4

Th

torio

59 3127 935 6,77

140,907 3,4

Pr

praseodimio

232,038

3850 1750 11,7

7

Ce

cerio

6 ✽✽

3,4

91 — (1230) 15,4

(231) 5,4

Pa

protactinio

144,24

60 3027 1024 7,00

3

Nd

neodimio

61 — (1027) —

(147) 3

Pm

prometio

92

238,03

93

(237)

3818 1132 19,07

6,5,4,3

— 637 19,5

6,5,4,3

U

uranio

Np

neptunio

2,3,4,6

Ir

iridio

(260)

105

2,3,4

Rh

rodio

190,2

76

2,3

cobalto

5930 6,5,4,3,2 3410 19,3

W

27 2900 1495 8,9

rutenio

186,2

75

2,3

hierro

tecnecio

183,85

74

(99)

43

5560 6,5,4,3,2 2610 10,2

55,847

26

manganeso

95,94

42

VIII

54,938

25

molibdeno

180,948

5425 2996 16,6

Hf

104

Nb

73

4

hafnio

(227)

5,3

niobio

178,49

VII B

51,996

cromo

92,906

41

4

circonio

138,91

V

vanadio

91,22

40 3580 1852 6,49

VI B

23

titanio

lantano✽

1

Fr

3

2927 1509 4,47

VB

IV B

44,956

itrio

(223)

francio

III B 21

escandio

87,62

38 1380 768 2,6

cesio

— (27) —

Be

estroncio

rubidio

87

2

calcio

85,47

690 28,7 1,90

Símbolo Nombre

* Basada en el C 12. Indica el isótopo más estable. ** Para los elementos gaseosos, los valores registrados son los de su estado líquido en el punto de ebullición.

9,0122

4

potasio

688 38,9 1,53

Zr

II A

magnesio

39,102

55 7

1

760 63,7 0,86

Estado de oxidación

4

berilio

sodio

37 6

Li 22,9898

892 97,8 0,97

19 5

1

3580 1852 6,49

circonio

litio 11

4

H

hidrógeno 3

3

1

Masa atómica*

91,22

40

Número atómico Punto de ebullición ºC Punto de fusión ºC Densidad (g/nl)**

1,00797

1

62

150,35

1900 1072 7,54

Sm

3,2

samario 94 3235 640 —

(242) 6,5,4,3

Pu

plutonio


__________________________________________________________________________

Estructura electrónica y sistema periódico

Tabla de clasificación periódica de los elementos (cont.)

IV A

III A 10,811

5 — (2030) 2,34

3

B

12,01115

6

4830 3727g ✽ 2,26

boro

2450 660 2,70

VIII

IB

58,71

28 2730 1453 8,9

2,3

Ni

níquel

3980 1552 12,0

2,4

Pd 195,09

4530 1769 21,4

Cu

65,37

30 906 419,5 7,14

2,4

Pt

1

Ag

platino

3,1

69,72

2237 29,8 5,91

2

Au oro

357 –38,4 13,6

3

Ga

2680 1410 2,42

Cd

2,1

Hg

3

In

mercurio

Si

4

Ge 118,69

50 2270 231,9 7,30

4,2

Sn

estaño

204,37

1457 303 11,85

4

72,59

32 2830 937,4 5,32

indio 81

3,1

Tl

207,19

82 1725 327,4 11,4

talio

63

151,96 3,2

Eu

europio 95

(243)

— — —

6,5,4,3

Am

americio

157,25

64 3000 1312 7,89

3

Gd

2800 1356 8,27

gadolinio 96

(247)

— — —

3

Cm curio

158,924

65

3,4

Tb

terbio

66 2600 1407 8,54

4,2

Pb

3

Dy

2600 1461 8,80

disprosio

97

(247)

— — —

4,3

Bk berkelio

3

Ho

–1

F 35,453

azufre

cloro

74,922

33 613 817 5,72

±3,5

As

S

34

78,96

35

6,4,–2

58 –7,2 3,12

1380 630,5 6,62

±3,5

Sb 208,980

83 1560 271,3 9,8

Se

selenio

121,75

51

Cl

685 217 4,79

arsénico

3,5

Bi

±1,5

Br

127,60

53

–2,4,6

183 113,7 4,94

4,2

±1,5,7

I

Po

— ±1,3,5,7 (302) —

At

polonio

0

Kr 131,30

54 –108,0 –111,9 3,06

0

Xe

xenón

(210)

85

83,80

36 –152 –157,3 2,6

yodo

(210)

— 254 (9,2)

0

Ar

kriptón

126,904

telurio

0

39,948

18 –185,8 –189,4 1,40

bromo

989,8 449,5 6,24

84

Ne

argón

79,909

52

Te

20,183

neón

fósforo

P

10 –246 –248,6 1,20

flúor

–34,7 ±1,3,5,7 –101,0 1,56

167,26

68 2900 1497 9,05

holmio

3

Er

98

99

— — —

3

— — —

Es

einstenio

100 — — —

(222)

86 (–61,8) (–71) —

astato

3,2

0

Rn

radón

Tm

Fm

101 — — —

173,04

70 1427 824 6,98

tulio

(253)

fermio

168,934

69 1727 1545 9,33

erbio

(254)

californio

–188,2 –219,6 1,505

17

0

b✽ ✽ = blanco

(249)

Cf

18,9984

9

444,6 6,3,4,–2 119,0 2,07

bismuto

164,930

67

O 32,064

16

He

helio

280 b ✽ ✽ +3,5,4 44,2 b ✽ ✽ 1,82 ✽ ✽

plomo

162,50

30,9738

15

2

oxígeno

antimonio

g ✽ = grafito

1439 826 5,26

N

–183 –218,8 1,14

4,0026

–268,9 –269,7 0,126

VII A

15,9994

8

nitrógeno

28,086

14

–195,8 ±3,5,4,2 –210 0,81

germanio

114,82

49 2000 156,2 7,31

C

VI A

14,0067

7

silicio

galio

200,59

80

Al

31

cadmio

196,967

79

Zn 112,40

48 765 320,9 8,65

plata

2970 1063 19,3

2

zinc

107,870

47 2210 960,8 10,5

paladio 78

2,1

cobre

106,4

46

63,54

29 2595 1083 8,96

3

aluminio

II B

±4,2

carbono

26,9815

13

VA

2

3,2

Yb

71

174,97

3327 1652 9,84

Lu

iterbio

(256) —

Md

mendelevio

102 — — —

3

lutecio

(254) —

No nobelio

103 — — —

(257) —

Lw

lawrencio

95


96

QUÍMICA

____________________________________________________________________________________________________

P

No

Px Py Pz

De esta forma ocupa 3 orbitales

Sólo ocuparía 2 orbitales

Principio de mínima energía de Aufbau. Los electrones tienden a ocupar los orbitales con menor energía posible; para n + l: 3d 4s 4p

n+l=3+2=5 n + l = 4 + 0 = 4 Se llena antes n+l=4+1=5

Regla de Madelung. Cuando dos orbitales tienen el mismo valor para n + l, se llena antes y es más estable el de menor n. En el ejemplo anterior será más estable y comenzará a llenarse el subnivel 3d y luego el 4f. Atendiendo a las reglas y principios enumerados, se pueden escribir las configuraciones electrónicas de los átomos. También, mediante el espectroscopio, se determinó la secuencia de los niveles electrónicos de la corteza de la siguiente forma:

Cuando aumenta el número de la capa, los niveles se acercan entre sí y sus energías se entremezclan, por lo que empieza a llenarse la siguiente capa sin haberse completado la anterior. La secuencia de ocupación viene determinada por el diagrama que se expone a continuación, si bien hay que tener en consideración que los orbitales 4f se llenan después del primer electrón del 5d, y los 5f comienzan a llenarse después del primer electrón del orbital 6d:

7s

7p

6s

6p

6d

5s

5p

5d

5f

4s

4p

4d

4f

3s

3p

3d

2s

2p

1s

1s, 2s, 2p, 3s, 3p, 4s, 3d, 4p, 5s, 4d, 5p, 6s, 4f ↔ 5d, 6p, 7s, 5f ↔ 6d, 7p.

6f 7p 7.ª capa

6d 5f

6.ª capa

7s 6p 5d 5.ª capa

4f 6s 5p 4d

4.ª capa

5s 4p 3d 3.ª capa

4s 3p 3s 2p 2s 1s

Para conocer la distribución electrónica de los elementos del sistema periódico, se puede comenzar por el hidrógeno, para ir rellenando con electrones sucesivos los diferentes niveles de energía, pero respetando el principio de exclusión de Pauli. La configuración de un determinado elemento será igual a la del que le precede en el sistema periódico, aunque añadiéndole un electrón en el nivel vacante de menor energía. El hidrógeno tiene un electrón definido por los números cuánticos: n = 1, l = 0, s = + 1/2. Lo que se puede escribir de forma abreviada como H = 1s1 (notación simplificada de la estructura electrónica, n lx, donde n es el número cuántico principal, x el número de electrones y l el número cuántico del momento angular, que en el caso del hidrógeno significa que en el nivel 1, el orbital s está ocupado por un electrón). Este electrón del orbital s se puede representar como:

2.ª capa 1.ª capa

1H

: 1s1 1s

Energías para llenar los orbitales para cada nivel cuántico principal El número cuántico n se relaciona con el de la capa, y el l corresponde a las letras s, p, d, f. El valor de m está representado por las líneas horizontales. Por tanto, para conocer la configuración electrónica hay que ir rellenando los huecos de energía, de tal forma que un nivel s sólo puede albergar dos electrones; en el nivel p puede haber seis, puesto que hay tres subniveles, y en el d puede haber diez.

El helio posee dos electrones en el nivel fundamental, con lo que ha llenado el primer nivel energético: 2He

: 1s2 1s

El litio, de número atómico 3, presenta la configuración del helio, pero con un electrón más, y debe comenzar a


__________________________________________________________________________

llenar el segundo nivel o capa, que admite 8 electrones (2 en el nivel s y 6 en el p): 3Li

1s

36Kr

2s 1s

2s 4s

4Be

2

: 1s 2s o (He) 2s

2s

Necesariamente, el siguiente elemento comenzará a llenar el subnivel 2p, en el que, además del principio de mínima energía, se tendrá que aplicar la regla de Hund para llenar los orbitales p (se colocan en cada orbital con los espines desapareados). : 1s22s22p1 o (He) 2s22p1

6C

: 1s22s22p2 o (He) 2s22p2

1s

2s

2p

1s

2s

2p

Así sucesivamente, hasta llegar al neón, que con sus 10 electrones llena la segunda capa. 10Ne

: 1s22s22p6 o (He) 2s22p6 1s

2s

2p

A partir del neón comienza a llenarse el siguiente nivel energético. De igual forma que cuando empezó a llenarse el segundo nivel, el primer elemento que comienza a llenar el tercer nivel tiene la misma configuración electrónica que el gas noble anterior (Ne): 11Na

: 1s22s22p63s1 o (Ne) 3s1 1s

2s

2p

3s

En este tercer nivel existen también orbitales d, y es donde se debe aplicar la regla de Madelung (es más estable el orbital de menor n + l), por lo que : Para el subnivel 3d, n = 3 y l = 2, n + l = 5. Para el subnivel 4s, n = 4 y l = 0, n + l = 4. Según este razonamiento, comenzará a llenarse el subnivel 4s antes que el 3d 19K

: (Ar) 4s1 1s

2s

2p

: (Ar) 4s23d104p6 2p 3d

3s

3p 4p

2

1s

5B

97

n + l coincide, pero, como es más estable el de menor nivel energético n, comenzará a llenarse el subnivel 3d y luego el 4p.

: 1s22s1

El berilio, con 4 electrones, llena el subnivel energético 2s: 2

Estructura electrónica y sistema periódico

3s

3p

4s

Cuando se llega a los subniveles 3d y 4p, el valor de

En resumen, se puede decir que la estructura electrónica de un elemento cualquiera es exactamente igual que la del elemento anterior salvo el último electrón añadido, o electrón diferenciador.

Sistema periódico La tabla periódica tiene filas, denominadas períodos, y columnas que forman grupos o familias, donde se sitúan los elementos químicamente afines. Según las normas de la IUPAC (Unión Internacional de Química Pura y Aplicada), el sistema periódico actual se compone de siete períodos y dieciocho grupos que se numeran del 1 al 18, aunque también se pueden numerar según la nomenclatura clásica: del IA al VIIIA y del IB al VIIIB). En cada período hay una gradación característica de las propiedades físicas y químicas al pasar de un elemento a otro. Cada período se inicia cuando comienza a llenarse un nuevo nivel de electrones. El número de un período indica qué orbitales s o p se están ocupando a medida que se construye el período. También indica el valor del número cuántico n. Ejemplo. Los elementos que están completando sus orbitales 4s o 4p corresponden al período 4. Los elementos que pertenecen a un mismo grupo presentan un comportamiento químico similar, debido a que tienen la misma configuración electrónica en el nivel más externo: – Los gases nobles deben su estabilidad a tener completa la última capa electrónica. Todos tienen una configuración electrónica ns2 np6, salvo el helio, que tiene sólo dos electrones. – Los elementos de los grupos 1, 2, 13, 14, 15, 16 y 17 no tienen completos sus niveles energéticos superiores y el último electrón ocupa un orbital s o p. – Los elementos de los grupos 3, 4, 5, 6, 7, 8, 9, 10, 11 y 12 son los elementos de transición, los metales. El electrón diferenciador se coloca en la penúltima capa; son elementos en los que se van completando los orbitales d. – Los elementos de transición interna son los lantánidos y los actínidos, cuyo electrón diferenciador se sitúa en la antepenúltima capa. Se van llenando los orbitales f. Los elementos del grupo 1 se denominan también metales alcalinos, los del grupo 2 son los metales alcalinotérreos, los de los grupos 13, 14, 15, 16 y 17 son los no me-


98

QUÍMICA

____________________________________________________________________________________________________

Escala de electronegatividad de Pauling

volver a aumentar paulatinamente hasta el final, a lo largo de los períodos. Meyer fue el primero que indicó la periodicidad de la variación del volumen atómico con el peso atómico.

Radio atómico y radio iónico Cesio Rubidio Potasio Bario Sodio Estroncio Calcio Litio Magnesio Escandio Aluminio Berilio Titanio Zirconio Germanio Estaño

0,7 0,8 0,8 0,9 0,9 1,0 1,0 1,0 1,2 1,3 1,5 1,5 1,6 1,6 1,7 1,7

Silicio Antimonio Boro Astato Teluro Hidrógeno Selenio Yodo Carbono Azufre Bromo Cloro Nitrógeno Oxígeno Flúor

1,8 1,8 2,0 2,0 2,1 2,1 2,4 2,4 2,5 2,5 2,8 3,0 3,0 3,5 4,0

tales, y además los del grupo 17 son los halógenos (que forman sales), y los del grupo 18 son los gases nobles. Los tres primeros períodos son los períodos cortos: el primer período únicamente contiene dos elementos, el hidrógeno y el helio; el segundo y tercer período contienen ocho elementos. Los restantes períodos se conocen como períodos largos: el cuarto y quinto período contienen dieciocho elementos, y el sexto, treinta y dos. El séptimo período está incompleto.

Propiedades periódicas En cualquier grupo o familia, los elementos que lo forman tienen características químicas similares y a lo largo de cada período las propiedades varían, también, de forma periódica. Esto se debe a que en cada familia, todos los elementos presentan la misma configuración electrónica en su última capa, siendo los electrones de esta capa externa los que intervienen en los procesos químicos. En los epígrafes siguientes se estudiarán las propiedades periódicas más características.

Volumen atómico El volumen atómico se define como la relación entre el peso atómico y la densidad de un elemento. Volumen atómico = Peso atómico/Densidad El volumen atómico, dentro de cada grupo, aumenta de arriba hacia abajo y disminuye hacia el centro, para

El radio atómico es la mitad de la distancia entre dos núcleos de dos átomos contiguos. Su valor aumenta con el número atómico, al ser mayor el número de pisos electrónicos. Los elementos de mayor radio atómico son los del grupo 1. Por su parte, el radio iónico se define como el que tiene un átomo cuando ha perdido o ganado electrones. Las variaciones del radio iónico son regulares a lo largo del sistema periódico, e igual que el radio atómico, aumenta, en cada grupo, con el número atómico. El radio de los aniones (iones cargados negativamente) siempre es mayor que el de los átomos del elemento que provienen, mientras que los iones positivos (cationes) tienen los radios menores que los átomos de los que provienen y, al aumentar su carga positiva, disminuye su tamaño.

Potencial de ionización Es la energía necesaria para arrancar el electrón más débil a un átomo neutro gaseoso, y formar un ion positivo o catión. un átomo neutro gaseoso + energía → → ion positivo gaseoso + e– Cuanto más elevado sea el valor del potencial de ionización, menor tendencia presentará ese átomo para formar iones positivos. Como la energía de ionización es necesaria para arrancar un electrón del átomo, en cada elemento químico toma tantos valores como electrones tiene. En función del electrón que se trate de arrancar, se denomina primer potencial de ionización, cuando corresponde a la energía necesaria para arrancar el primer electrón; segundo potencial de ionización, cuando se trata de sustraer el segundo electrón, etc. El segundo potencial de ionización es siempre mayor que el primero, ya que el volumen de un catión es menor que el del átomo, y la fuerza electrostática es mayor. La energía de ionización se expresa en electrones voltio –eV, que es la cantidad de energía que adquiere un electrón cuando sufre una aceleración mediante una diferencia de potencial de un voltio– o en julios o kilojulios por mol (kJ/mol). En términos generales, el potencial de ionización disminuye al aumentar el número atómico y se incrementa en los períodos proporcionalmente a ese número atómico. Los metales alcalinos tienen valores mínimos de los potenciales de ionización, por lo que presentan mayor fa-


__________________________________________________________________________

cilidad para perder los electrones, dando iones positivos o cationes, y van aumentando hasta alcanzar el máximo en los gases nobles, ya que su configuración electrónica es la más estable, por lo que se necesita más energía para arrancar un electrón. Los elementos del grupo 17 también tienen una energía de ionización muy elevada, con tendencia a ganar un electrón para dar iones negativos o aniones. Resumiendo, se puede decir que el potencial de ionización mide la mayor o menor capacidad de los átomos para formar iones positivos, de forma que cuanto menor es el potencial de ionización, mayor es la capacidad de formar iones.

Afinidad electrónica o electroafinidad Se define como la tendencia de un átomo a ganar electrones para formar un ion negativo. Es, por tanto, la energía desprendida cuando un átomo neutro, gaseoso y en estado fundamental capta un electrón para formar un ion gaseoso con carga negativa. Se mide en electrovoltios por átomo o en kilojulios por mol. Un átomo neutro gaseoso + e– → ion negativo + energía (afinidad electrónica) Esta propiedad es contraria a la de la energía de ionización, y aumenta en los grupos de abajo arriba y en los períodos de izquierda a derecha. Se incrementa dentro de un período a medida que aumenta el número atómico (excepto los gases nobles que tienen baja afinidad), y en los grupos disminuye a medida que aumenta el número atómico. Los iones que se forman con desprendimiento de energía son más estables que los átomos de los que proceden y presentan también un volumen mayor, ya que al existir un exceso de cargas negativas se producen fuerzas de repulsión que inducen un aumento del radio y del volumen atómico. Esta propiedad es de gran utilidad para predecir el carácter oxidante de un elemento químico.

Electronegatividad Es la tendencia o capacidad de un átomo para atraer hacia sí el par de electrones que comparte en el enlace con otro átomo.

Estructura electrónica y sistema periódico

99

Esta propiedad está relacionada con las dos anteriores. Si la afinidad electrónica es elevada, el elemento tiene gran tendencia a captar electrones, por lo que será muy electronegativo. Suele medirse como la media aritmética entre el potencial de ionización y la afinidad electrónica. Electronegatividad = P · I + A · E/2 La escala de electronegatividad es muy útil para predecir el tipo de enlace que se puede producir entre dos elementos. Si la electronegatividad es elevada, la tendencia será reaccionar formando compuestos con un enlace iónico. Por el contrario, si las electronegatividades son parecidas, tenderán a formar compuestos con enlaces covalentes. (Ambos tipos de enlace se estudiarán en próximos capítulos.) La electronegatividad aumenta de izquierda a derecha a lo largo de los períodos y de abajo arriba dentro de cada grupo. El cesio es el elemento menos electronegativo, y el flúor el de mayor electronegatividad.

_ Preguntas de repaso 1. ¿Cuál es la configuración electrónica de los gases nobles? 2. Utilizando el denominado diagrama de ocupación electrónica, ¿cuál es la configuración electrónica de un átomo de sodio en estado fundamental? 3. Ordenar de mayor a menor potencial de ionización los siguientes elementos: Cl, Na, Ne, Br, Li 4. ¿Cuál de los elementos que se exponen a continuación tiene mayor volumen? Ordenarlos de mayor a menor: Fe, Se, Ca, Ga


NOMENCLATURA Y FORMULACIÓN

O HN

O

N

N

N

CH3

E

n química se utiliza un lenguaje determinado o nomenclatura, y un sistema abreviado de escritura o formulación, que simplifican el aprendizaje de esta ciencia. Así pues, formulación es la parte de la química que consiste en representar las moléculas mediante notaciones de símbolos y números que sirven para definir la composición de una sustancia y a las que se designa como fórmulas químicas, mientras que la nomenclatura tiene por objeto poner nombres a dichas fórmulas. Una fórmula está constituida por la yuxtaposición de los símbolos de los elementos que la integran, a los que se les añaden subíndices numéricos que indican el número de átomos del mismo elemento que forman parte de dicha fórmula (salvo cuando el subíndice es uno, que se omite). Las fórmulas pueden ser empíricas, moleculares y estructurales. Las fórmulas empíricas representan la proporción en que se encuentran los compuestos. Las fórmulas moleculares representan el número real de átomos de los diferentes elementos que forman los compuestos. Las fórmulas estructurales, además de indicar el número y tipo de átomos, indican también la ordenación y tipo de enlace que presentan esos átomos en el espacio. Suelen utilizarse en química orgánica, y pueden ser: semidesarrolladas (indican los enlaces que unen los átomos), desarrolladas (los enlaces se indican en un plano) y tridimensionales (representan la ordenación espacial de los enlaces en un plano). El conjunto de reglas que rigen la nomenclatura se ha modificado en numerosas ocasiones. La IUPAC, tras la revisión y unificación de los numerosos criterios aplicados, ha desarrollado unas reglas normalizadas de nomenclatura, para que sean utilizadas universalmente, si bien aún se siguen empleando diversas maneras de nombrar a las sustancias. Para desginar sistemáticamente los más de dos millones de compuestos conocidos, la IUPAC, establece dos grandes bloques de compuestos: inorgánicos y orgánicos. En este tema se tratará del estudio de las reglas de nomenclatura de los compuestos inorgánicos más significativos, y la nomenclatura de los compuestos orgánicos se

CH3

abordará en los capítulos dedicados específicamente a la química orgánica.

Combinaciones de un solo elemento Las moléculas formadas por un solo elemento pueden ser monoatómicas, biatómicas (diatómicas), triatómicas, tetraatómicas, etc.

Combinaciones de un solo elemento Sustancia Fórmula Hidrógeno Oxígeno Nitrógeno Sodio

H2 O2 N2 Na

Nombre sistemático Nombre IUPAC funcional Dihidrógeno Dioxígeno Dinitrógeno Sodio

Hidrógeno Oxígeno Nitrógeno Sodio

La fórmula general es En , donde E puede representar tanto a elementos metálicos como no metálicos, y n = 1, 2, 3, ... Según la nomenclatura sistemática de la IUPAC, las moléculas de las sustancias simples se nombran mediante un prefijo numeral: mono, di, tri, etc. (el prefijo mono suele omitirse), que indica el número de átomos de que constan las moléculas, seguido del nombre del elemento: H2 = dihidrógeno, etc. La nomenclatura sistemática nombra las sustancias teniendo en cuenta la estructura real de las moléculas. Según la nomenclatura funcional, o antigua, estas moléculas de sustancias simples reciben el nombre del elemento al que pertenecen. La nomenclatura funcional pone nombre a las sustancias teniendo en cuenta las funciones químicas.

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


____________________________________________________________________________________

Nomenclatura y formulación

101

Óxidos metálicos y no metálicos Fórmula Fe O Fe2 O3 Cl2 O Cl2 O3 CO2 Cl2 O5 Cl2 O7

Nomenclatura sistemática Nombre estequiométrico Monóxido de hierro Trióxido de hierro (sesquióxido de hierro) Óxido de dicloro (hemióxido de cloro) Trióxido de dicloro (sesquióxido de cloro) Dióxido de carbono Pentaóxido de dicloro Heptaóxido de dicloro

Óxidos Óxidos metálicos y no metálicos Se denominan óxidos los compuestos inorgánicos binarios cuyas moléculas están formadas por átomos de oxígeno y de cualquier otro elemento. Todos los óxidos se ajustan a la fórmula general E2 On, donde E es el elemento que acompaña al oxígeno y n la valencia con la que actúa dicho elemento. Al escribir la fórmula se tendrá en cuenta si el elemento que acompaña al oxígeno actúa con valencia 1, ya que en este caso no se pone como subíndice y se sobreentiende: Na2 O1 es incorrecto y Na2 O es correcto. Si la valencia del elemento es múltiplo de dos, los subíndices se dividen y se simplifica la fórmula: Ca2 O2 se simplifica como CaO. Se escribe en primer lugar el símbolo del metal o no metal y a continuación el del oxígeno, cambiando las valencias y omitiendo los signos de las mismas. Los óxidos metálicos u óxidos básicos están formados por un metal y el oxígeno. El nombre de óxidos básicos se debe a que al reaccionar con el agua dan hidróxidos o bases. Los óxidos no metálicos son los compuestos formados por la unión de un no metal y el oxígeno. Los óxidos se nombran con la palabra óxido, la preposición de y a continuación el nombre del elemento que acompaña al oxígeno. Cuando un elemento puede actuar con más de una valencia, ésta se indicará según la notación de Stock (se suele usar únicamente para los elementos metálicos): se expresa en números romanos y entre paréntesis inmediatamente después del nombre, o bien mediante los prefijos griegos mono-, di-, tri-, etc., que indican los átomos de cada elemento constituyente de la molécula del óxido. Está permitido también la utilización de los prefijos hemi- (1/2) y sesqui- (3/2). En la nomenclatura clásica o funcional, los óxidos metálicos se nombran con la palabra genérica óxido seguida del nombre del metal, o por la raíz del nombre del metal y el sufijo -ico, si actúa con el número de valencia mayor y -oso si es la menor. Los óxidos no metálicos que reaccionan con el agua se conocen como anhídridos u óxidos ácidos. Como en el

Nomenclatura de Stock Óxido de hierro (II) Óxido de hierro (III) Óxido de cloro (I) Óxido de cloro (III) Óxido de carbono (IV) Óxido de cloro (V) Óxido de cloro (VII)

Nomenclatura funcional Óxido ferroso Óxido férrico Anhídrido hipocloroso Anhídrido cloroso Anhídrido carbónico Anhídrido clórico Anhídrido perclórico

caso anterior, cuando el no metal presenta dos valencias distintas se nombran con el término anhídrido seguido del nombre del no metal y el sufijo -oso o -ico según se utilice la menor o mayor valencia, respectivamente. Cuando el no metal actúa con cuatro valencias distintas se utilizan prefijos y sufijos. Para diferenciar entre sí a los de menor valencia, al menor se le antepone el prefijo hipo-, y para distinguir a los dos de mayor valencia, se antepone el prefijo per- al de valencia superior.

Óxidos dobles Están formados por agrupaciones de dos o más moléculas de óxidos de un mismo elemento metálico. Su fórmula general es M3 O4 . Según la nomenclatura sistemática, los óxidos dobles se nombran igual que los óxidos sencillos. Según la nomenclatura funcional, se nombran con la palabra óxido y a continuación la raíz del nombre del metal terminado primero en -oso y después en -ico.

Óxidos dobles Fórmula

Nombre sistemático (Notación de Stock)

Nombre funcional

Cr3O4

Tetraóxido de tricromo u Óxido óxido de cromo (II, III) cromoso-crómico

Fe3O4

Tetraóxido de trihierro u óxido de hierro (II, III)

Óxido ferroso-férrico

Peróxidos Se llaman peróxidos los compuestos formados por átomos de metal y el grupo peróxido (-O-O-), que actúa con valencia 2-. Se podría decir que son los óxidos metálicos


102

QUÍMICA

____________________________________________________________________________________________________

Peróxidos Fórmula

Nombre sistemático (Notación de Stock)

Nombre funcional

Hg2O2

Peróxido de mercurio (I)

HgO2

Peróxido de mercurio (II) Peróxido mercúrico

Na2O2

Peróxido de sodio (I)

Peróxido sódico o de sodio

BaO2

Peróxido de bario (II)

Peróxido bárico o de bario

Peróxido mercurioso

que tienen un oxígeno añadido. Su fórmula general se representa por M2 (O2)n. Al escribir la fórmula se ha de poner en primer lugar el símbolo del metal seguido del símbolo del grupo peróxido. Se intercambian los números de valencia prescindiendo del signo, y se efectúa la división si los subíndices son divisibles por el mismo número. En la nomenclatura sistemática, según la notación de Stock, los peróxidos se nombran con la palabra óxido, la preposición de y el nombre del metal seguido del número de valencia en números romanos entre paréntesis. Según la nomenclatura funcional, los peróxidos se nombran con la palabra peróxido seguida por la preposición de y el nombre del metal o la raíz del nombre del metal con el sufijo -ico. Cuando el metal actúa con dos valencias, se utiliza el sufijo -oso e -ico según actúe con la valencia menor o mayor, respectivamente.

cando la valencia en números romanos y entre paréntesis (notación de Stock), o bien utilizando los prefijos mono-, di-, tri-, tetra-, etc., según el número de hidrógenos que hay en la molécula. Según la nomenclatura clásica o funcional, los hidruros metálicos se nombran con el término genérico hidruro, seguido del nombre del metal con el sufijo -oso o -ico según actúe con el número de valencia menor o mayor, respectivamente.

Hidruros no metálicos, ácidos hidrácidos Los hidruros no metálicos son aquellos compuestos cuyas moléculas están formadas por átomos de hidrógeno y un no metal. La fórmula general es mHn y Hnm, según sea de electronegativo el elemento, ya que se coloca siempre el elemento más electropositivo en primer lugar; la IUPAC recomienda colocar más a la izquierda al elemento que se sitúa antes en la siguiente lista: B, Si, C, Sb, As, P, N, H, Te, Se, S, At, I, Br, Cl, O, F más electronegativos Así se consigna HCl y no ClH, HF y no FH. Se nombran con la terminación -uro, que se añade detrás del nombre abreviado o de la raíz latina del elemento mas electronegativo, que se debe escribir a la derecha. Cloruro de hidrógeno y no hidruro de cloro, fluoruro de hidrógeno y no hidruro de flúor. Las combinaciones del hidrógeno con F, Cl, Br, I, S, Se y Te reciben el nombre especial de hidrácidos, ya que cuando están disueltos en agua tienen carácter ácido. Estos compuestos se nombran con la palabra ácido seguida de la raíz del nombre del no metal y el sufijo-hídrico cuando están disueltos en el agua y actúan como ácidos.

Hidruros Los hidruros son compuestos binarios cuyas moléculas están formadas por átomos de hidrógeno y cualquier otro elemento. Se escriben colocando en primer lugar el elemento más electropositivo y cambiando la valencia. Se dividen en metálicos y no metálicos.

Hidruros metálicos Son los compuestos que contienen una combinación de hidrógeno y metal. Todos los hidruros metálicos responden a la fórmula general MHn, donde M es el símbolo del metal que se combina con el hidrógeno y n la valencia con la que actúa dicho elemento. Al escribir la fórmula se tendrá en cuenta: escribir en primer lugar el símbolo del metal (es más electropositivo) y a continuación el del hidrógeno, cambiando las valencias y prescindiendo del signo. Como la valencia del hidrógeno es 1, no se pone como subíndice y se sobreentiende. Los hidruros metálicos se nombran anteponiendo la palabra hidruro al nombre del metal correspondiente, indi-

Fórmula

Nombre sin disolver

Nombre disuelto en agua

H2Te H2Se H2S HI HBr HCl HF

Teluro de hidrógeno Seleniuro de hidrógeno Sulfuro de hidrógeno Yoduro de hidrógeno Bromuro de hidrógeno Cloruro de hidrógeno Fluoruro de hidrógeno

Ácido telurhídrico Ácido selenhídrico Ácido sulfhídrico Ácido yodhídrico Ácido bromhídrico Ácido clorhídrico Ácido fluorhídrico

En el caso de los elementos más electropositivos que el hidrógeno, las fórmulas se nombran con la palabra hidruro precedida de los prefijos mono-, di- tri-, tetra-, etc., según el número de hidrógenos que posean las moléculas, la preposición de y el nombre del no metal. También están admitidos por la IUPAC los nombres comunes o vulgares de estos elementos.


____________________________________________________________________________________

Nomenclatura y formulación

103

Hidruros metálicos Fórmula CrH2 CrH3 FeH2 FeH3 CaH2

Fórmula NH3 PH3 AsH3 SbH3 CH4 SiH4 BH3

Nomenclatura sistemática Nombre estequiométrico

Nomenclatura de Stock

Dihidruro de cromo Trihidruro de cromo Dihidruro de hierro Trihidruro de hierro Dihidruro de calcio

Hidruro de cromo (II) Hidruro de cromo (III) Hidruro de hierro (II) Hidruro de hierro (III) Hidruro de calcio

Nombre sin disolver Trihidruro de nitrógeno Hidruro de nitrógeno (III) Trihidruro de fósforo Hidruro de fósforo (III) Trihidruro de arsénico Hidruro de arsénico (III) Trihidruro de antimonio Hidruro de antimonio (III) Tetrahidruro de carbono Hidruro de carbono (IV) Tetrahidruro de silicio Trihidruro de boro

Nombre vulgar Amoníaco Fosfina Argona Estibina Metano

En el primer caso, son sustancias cuyas moléculas están formadas por átomos de no metal y metal. Se las denomina también sales binarias. Su fórmula general es Mn m n . Se escribe poniendo el metal primero, ya que es el elemento más electropositivo, seguido del elemento más electronegativo, cambiando las valencias. Según la nomenclatura sistemáti-

Hidruro cromoso Hidruro crómico Hidruro ferroso Hidruro férrico Hidruro cálcico

ca, se nombran añadiendo el sufijo-uro al no metal, la preposición de y el nombre del metal, indicando las proporciones en que se combinan los elementos mediante prefijos mono-, di-, tri-, tetra-, etc. Según la notación de Stock, se indica la valencia mediante números romanos. En la nomenclatura funcional o clásica, se utilizan los sufijos -oso e -ico, según la valencia menor o mayor del elemento. En el caso de la combinación de no metales ente sí, se nombran del mismo modo, pero añadiendo la terminación -uro al elemento más electronegativo. Es correcto escribir BP, fosfuro de boro, pero incorrecto escribir PB, boruro de fósforo.

Silano Borano

Combinación entre metal y no metal y entre no metal y no metal

Nomenclatura funcional

Hidróxidos Los hidróxidos son compuestos formados por un metal o grupo metálico (electropositivo) y un grupo hidroxilo (OH) electronegativo, cambiando las valencias. La fórmula general es M(OH)n, donde M es el símbolo del elemento metálico y n su valencia. Al escribir la fórmula de un hidróxido, se pondrá en primer lugar el metal (elemento más electropositivo) y a continuación el grupo hidroxilo entre paréntesis. Al intercambiar las valencias, si la del metal es 1, se suprime el paréntesis. Según la nomenclatura sistemática, los hidróxidos se nombran con la palabra hidróxido, seguida de la preposición de

Combinación entre metal y no metal y entre no metal y no metal Fórmula CaF2 MnS MnS2 FeBr2 FeBr3

Nomenclatura sistemática Nombre estequiométrico Difluoruro de calcio Monosulfuro de manganeso Disulfuro de manganeso Dibromuro de hierro Tribromuro de hierro

Nomenclatura de Stock Fluoruro de calcio Sulfuro de manganeso (II) Sulfuro de manganeso (IV) Bromuro de hierro (II) Bromuro de hierro (III)

Nomenclatura funcional Fluoruro cálcico Sulfuro manganoso Sulfuro mangánico Bromuro ferroso Bromuro férrico


104

QUÍMICA

____________________________________________________________________________________________________

Hidróxidos Fórmula Pb (OH)2 Pb (OH)4 NaOH CuOH Cu (OH)2

Nomenclatura sistemática Nombre estequiométrico

Nomenclatura de Stock

Dihidróxido de plomo Tetraóxido de plomo Hidróxido de sodio Hidróxido de cobre Dihidróxido de cobre

Hidróxido de plomo (II) Hidróxido de plomo (IV) Hidróxido de sodio (I) Hidróxido de cobre (I) Hidróxido de cobre (II)

y el nombre del metal, e indicando las proporciones de los elementos mediante los prefijos mono-, di-, tri-, tetra-, etc. Según la nomenclatura de Stock, se indican las valencias del metal en números romanos y entre paréntesis. En la nomenclatura funcional o clásica, se nombran de igual forma que en la sistemática, sustituyendo el prefijo mono-, di-, tri-, etc., por el sufijo -oso e -ico, según actúe el metal con valencia menor o mayor respectivamente.

Oxoácidos Los oxoácidos son compuestos ternarios cuyas moléculas están formadas por átomos de hidrógeno, oxígeno y un no metal o metal. La fórmula general de los oxoácidos es del tipo Ha X b O c , donde X es un elemento no metálico, aunque a veces puede ser un metal de transición en un elevado estado de oxidación, y a, b y c son los átomos que hay de cada elemento en la molécula. La fórmula se escribe colocando primero el hidrógeno, seguido del metal o no metal, y finalmente el oxígeno. Según la nomenclatura sistemática de la IUPAC, se nombra primero la palabra oxo, para indicar el oxígeno, seguida del nombre del metal o no metal terminado en -ato (indicando la valencia en números romanos entre paréntesis), y finalmente el hidrógeno precedido de la preposición de. Las proporciones de los constituyentes se indican mediante los prefijos mono-, di-, tri-, tetra-, etc. H 2 CO3 = Trioxocarbonato (IV) de hidrógeno

Nomenclatura funcional Hidróxido plumboso Hidróxido plúmbico Hidróxido sódico Hidróxido cuproso Hidróxido cúprico

Según la notación de Stock, se nombran con la palabra ácido, seguido de oxo (de oxígeno), y por último el elemento metálico o no metal terminado en -ico, indicando su valencia en números romanos entre paréntesis. H 2 CO3 = ácido trioxocarbónico (IV) No obstante, y a pesar de existir esta nomenclatura, la IUPAC admite los nombres funcionales de las sustancias debido al uso tan arraigado. Para nombrar a los oxoácidos se utilizan las terminaciones -oso e -ico y los prefijos hipo- y per-. HClO HClO2 HClO3 HClO4

ácido hipocloroso ácido cloroso ácido clórico ácido perclórico

Algunos anhídridos de no metales, como el fósforo, el arsénico y el antimonio, pueden unirse a una, dos o tres moléculas de agua, obteniéndose ácidos oxoácidos polihidratados. Para nombrarlos se pone la palabra ácido, seguida del nombre del anhídrido correspondiente, al que se antepone el prefijo meta- cuando se une a una molécula de agua, piro- si se une a dos moléculas y orto- si procede de la unión de tres moléculas de agua: P2 O 3 P2 O 3 P2 O 5 P2 O 5

+ 2H2 O = H4 P 2 O 5 (ácido pirofosforoso) + 3H2 O = H6 P 2 O 6 = H3 PO3 (ácido ortofosforoso) + H2 O = H2 P 2 O 6 = HPO3 (ácido metafosfórico) + 2H2 O = H4 P 2 O 7 (ácido pirofosfórico)

Oxoácidos Fórmula

Nombre sistemático (Stock)

HClO HClO2 HClO3 HClO4

Ácido oxoclórico (I) Ácido dioxoclórico (III) Ácido trioxoclórico (V) Ácido tetraoxoclórico (VII)

Nombre funcional (Stock) Oxoclorato (I) de hidrógeno Dioxoclorato (III) de hidrógeno Trioxoclorato (V) de hidrógeno Tetraoxoclorato (VII) de hidrógeno

Nombre tradicional Ácido hipocloroso Ácido cloroso Ácido clórico Ácido perclórico


____________________________________________________________________________________

Nomenclatura y formulación

105

Cationes y aniones Como se indicó en el capítulo dedicado a la estructura atómica, cuando un átomo o grupos de átomos están cargados eléctricamente se denominan iones. A los iones cargados positivamente se les denomina cationes y a los cargados negativamente aniones. Los cationes monoatómicos presentan la fórmula general: Xn+, –donde n+ es el número de cargas positivas que tienen en exceso los átomos del elemento X. Se nombran con la palabra catión o anión seguida del nombre del elemento y la carga entre paréntesis. Según la notación de Stock, la carga se expresa en números romanos entre paréntesis. Según la nomenclatura funcional, si los átomos del elemento dan un solo ion, se denominan catión o ion seguido del nombre del elemento; si dan dos iones, se nombran con la palabra catión o ion seguida de la raíz del nombre del elemento y el sufijo -oso o -ico, según sea la menor o mayor carga, respectivamente. Cuando los cationes son poliatómicos, como los que se obtienen de los hidruros, se nombran con la palabra ion o catión seguida de la raíz del nombre del hidruro y el sufijo -onio. AsH3 = ion o catión arsonio. PH3 = ion o catión fosfonio.

Cationes y aniones Fórmula Nombre sistemático Fe2+ Fe3+ Cu+ Cu2+

Ion o catión hierro (II) Ion o catión hierro (III) Ion o catión cobre (I) Ion o catión cobre (II)

Nombre funcional Ion o catión ferroso Ion o catión férrico Ion o catión cuproso Ion o catión cúprico

Los aniones son átomos cargados negativamente, con fórmula general: Xn–, donde n– representa las cargas negativas que tienen en exceso los átomos del elemento X. Tanto en la nomenclatura sistemática como en la funcional se nombran con la palabra genérica anión o ion seguida de la raíz del nombre del elemento, al que se le añadirá el sufijo -uro. H – = ion o anión hidruro. Cl– = ion o anión cloruro. N 3– = ion o anión nitruro. Cuando los aniones son poliatómicos (son dos o más átomos cargados negativamente), como es el caso de los aniones que se obtienen de las sales, se utiliza la nomenclatura funcional fundamentalmente. Se nombran con la palabra genérica ion o anión seguida de la primera palabra de la sal de la que derivan.

Aniones poliatómicos Fórmula

Nombre sistemático

Nombre funcional

ClO–

Ion o anión monoxoclorato (I)

Ion o anión hipoclorito

ClO2–

Ion o anión dioxoclorato (III)

Ion o anión clorito

SO42–

Ion o anión tetraoxosulfato (VI)

Ion o anión sulfato

Sales Las sales pueden ser consideradas compuestos que se forman por la unión de una especie aniónica con otra catiónica.

Sales neutras Son combinaciones poliatómicas que se obtienen al sustituir los átomos de hidrógeno de los ácidos por átomos de metales o grupos electropositivos. La fórmula general de las sales neutras es M’x (R)n , donde M’ simboliza el metal o grupo de átomos con carácter metálico y R el resto ácido. En este apartado se estudiarán las sales neutras que se derivan de los oxoácidos, denominadas oxisales. Según la IUPAC, al consignar las fórmulas de las sales, se escribirá en primer lugar el símbolo del metal o átomos de carácter metálico (M’) y a continuación el resto ácido entre paréntesis. Si los subíndices del elemento metálico y del resto ácido son divisibles por un mismo número, se hará una reducción de la fórmula. Si el número de valencia del elemento metálico es 1+, al resto ácido se le quita el paréntesis y no se coloca ningún subíndice. Todas las sales de los oxoácidos terminan en -ato, indicándose entre paréntesis, detrás del nombre, la valencia con la que actúa el metal; y en caso de un intercambio de valencias que implique un subíndice detrás del radical, se indicará mediante los nombres griegos dis, tris, tetrakis, pentakis, que servirán para indicar la repetición de un anión poliatómico: Al2 (SO4 ) 3 = tris [tetraoxo sulfato (IV)] de dialuminio. Según la nomenclatura funcional, si el metal o grupo metálico de las moléculas de las sales neutras actúan con un solo número de valencia, el nombre de la sal se forma con el del específico de la molécula del ácido del que derivan, cambiando los sufijos -oso por -ito e -ico por -ato, y el nombre del metal o grupo metálico, o la raíz del nombre del metal con el sufijo -ico, precedido de la preposición de. Si el metal actúa con dos o más números de valencia, a la raíz del metal se le coloca el sufijo -oso o -ico según actúa con el número de valencia menor o mayor, respectivamente.


106

QUÍMICA

____________________________________________________________________________________________________

Sales neutras Fórmula

Oxoanión del que proceden

K2SO3 K2SO4 NaClO NaClO2 NaClO3 NaClO4

SO32– SO42– ClO– ClO2– ClO3– ClO4–

Nombre sistemático IUPAC

Nombre tradicional

Trioxosulfato (IV) de potasio Tetraoxosulfato (VI) de potasio Monoxoclorato (I) de sodio Dioxoclorato (III) de sodio Trioxoclorato (V) de sodio Tetraoxoclorato (VII) de sodio

Sulfito de potasio Sulfato de potasio Hipoclorito de sodio Clorito de sodio Clorato de sodio Perclorato de sodio

Sales ácidas

Tioderivados

Las sales ácidas proceden de sustituir algunos de los hidrógenos de las moléculas de los ácidos por átomos de elementos metálicos o grupos de átomos con carácter metálico o electropositivos. Su fórmula general es M’t (Hk R)n, donde M’ es el símbolo del metal o grupo con carácter electropositivo que sustituyó al hidrógeno del ácido; t es el número de átomos de hidrógeno que fueron sustituidos, y n es el número de valencia de los metales o grupos electropositivos sin el signo +. Según las normas de la IUPAC, se nombran anteponiendo la palabra hidrógeno al nombre de la sal correspondiente. Para las fórmulas, las normas son similares a las dadas para las sales neutras. En la nomenclatura funcional, las sales ácidas se nombran igual que las sales neutras correspondientes, pero colocando delante del elemento metálico los prefijos mono-, di-, tri-, etc., para indicar el número de átomos de hidrógeno sustituidos. Cuando se sustituyen sólo la mitad de los hidrógenos sustituibles, se pueden nombrar con el nombre de la sal neutra, colocando el prefijo bi- en la primera palabra que compone el nombre, o bien colocando ácido de, entre las dos palabras que forman el nombre de la sal.

Sales ácidas Fórmula

Nombre sistemático IUPAC

Nombre funcional (incorrecto)

NaHSO4 Hidrogenosulfato de Bisulfato sódico sodio [hidrogenotetraoxosulfato (VI) de sodio] KH2PO4 Dihidrogenofosfato de potasio

Bifosfato potásico

K2HPO4 Monohidrogenofosfato de potasio

Bifosfato de dipotasio

Son derivados del azufre que presentan una estructura relacionable con la de un derivado oxigenado conocido, al que se nombra añadiendo el prefijo tioH3 PO3 S (ácido monotiofosfórico) H3 PO2 S 2 (ácido ditiofosfórico) H3 POS3 (ácido tritiofosfórico)

}

Del H3 PO4

Los aniones de estos ácidos se nombran de la forma usual: monotiofosfato, ditiofosfato, etc.

_ Preguntas de repaso 1. Formular los compuestos que se exponen a continuación: a) Ácido fosfórico g) Peróxido de b) Ácido sulfhídrico hidrógeno c) Óxido de hierro (II) h) Hidrogenocarbonato d) Óxido de rubidio de sodio e) Hidróxido de i) Sulfato de potasio aluminio j) Sulfuro de f) Hidróxido de bario hidrógeno 2. Nombrar los siguientes compuestos: a) MgO d) NaHSO4 g) HNO3 b) CO e) HIO3 h) KMnO4 f) Cu2 O c) Ca(OH)2 3. Nombrar los compuestos: d) FeS2 O 3 a) SO4 2– e) MgTiO3 b) Li[AlH4 ] f) MgNa2 (CO3)2 c) BeS 4. Formular: a) Perclorato de vanadilo (V) b) Sulfato de magnesio c) Fosfonato de platino (II) d) Ácido disulfuroso e) Tribromuro de fósforo

g) HBF4 h) SOCl2 i) Na2 FeCl4


ENLACES ATÓMICOS Y MOLECULARES

Enlace químico La materia está constituida por agrupaciones de átomos: los elementos químicos son unas agrupaciones de átomos iguales, en tanto que los compuestos químicos son agregados de átomos diferentes. Al conjunto de fuerzas o interacciones que mantienen unidos entre sí a los átomos, iones o moléculas para dar lugar a estructuras o agrupaciones más estables que los átomos o moléculas de partida se le denomina generalmente enlace químico. Así pues, los enlaces se producen para economizar energía y, por tanto, para conseguir una mayor estabilidad: los agregados atómicos son más estables que los átomos aislados, porque contienen menos energía. Ello significa que cuando se forme un enlace se desprenderá energía, mientras que será necesario aportar energía para romperlo. Como la consecuencia del enlace es una mayor estabilidad, y los átomos de los gases nobles son sistemas muy estables, dada su escasa reactividad, los átomos tienden a adquirir la configuración electrónica del gas noble que tienen más próximo, es decir, a llenar de electrones por completo sus orbitales más externos. Por ello, en el enlace químico desempeña un papel decisivo la configuración electrónica de dicho nivel externo de los átomos, conocida como configuración de valencia, de la que, además, dependerá el tipo de enlace que se forme. Los átomos de los gases nobles, a excepción del helio, tienen en el nivel de valencia 8 electrones, situados en los orbitales s y p, que estarán ocupados por completo (s 2 p 6 ). Esta disposición de octeto confiere una gran estabilidad a los átomos que la presentan. Como el resto de los elementos poseen incompletos sus niveles de valencia, reaccionarán para captar o ceder los electrones que les faltan para que la configuración electrónica de su nivel de valencia sea similar a la de los gases nobles. Kossel, en 1916, estableció la regla del octeto con esta teoría. En general, los enlaces se dividen en dos grandes grupos: enlaces intramoleculares y enlaces intermoleculares. Los enlaces intramoleculares o interatómicos son los que mantienen unidos a un conjunto de átomos para constituir una estructura superior:

O HN

O

N

N

CH3

N

CH3

– Enlace iónico, entre metal y no metal, producido por captación o cesión de electrones. – Enlace covalente, entre no metal y no metal, en el que se comparten electrones de valencia de átomos diferentes. – Enlace metálico, entre átomos de un mismo metal, en el que se forma una nube electrónica móvil que mantiene unidos los cationes constituyentes del metal. Los enlaces intermoleculares, más débiles que los intramoleculares, mantienen unidas entre sí las moléculas de una misma sustancia. Son los siguientes: – Enlace por fuerzas de Van der Waals, debidas a la existencia de dipolos en las moléculas. – Enlace por puentes de hidrógeno, unión entre moléculas de hidrógeno y de elementos muy electronegativos, como el flúor, el oxígeno o el nitrógeno.

Enlace iónico Los átomos en estado fundamental tienen el mismo número de protones que de electrones: son eléctricamente neutros. En ocasiones, y bajo determinadas condiciones, los átomos pueden perder uno o más electrones, quedando por tanto una carga positiva, o bien pueden captar uno o más electrones, resultando en el conjunto una carga negativa. A estos átomos se les denomina iones. Los de carga eléctrica positiva son los cationes y los de carga negativa los aniones. Estos iones de signo contrario se unirán con fuerzas electrostáticas de atracción, donde el átomo de electronegatividad baja cede uno o varios electrones al de electronegatividad alta, formando un enlace iónico. Al número de electrones que un elemento cede o capta para formar el correspondiente ion se le denomina electrovalencia o valencia iónica de dicho elemento. A modo de ejemplo, un caso sencillo de enlace iónico se produce en la molécula de NaCl: +

Na (Z = 11): 1s 2 2 s 2 2 p 6 3 s 1 → Na : 1 s 2 2 s 2 2 p 6 – Cl (Z = 17): 1s 2 2 s 2 2 p 6 3 s 2 3 p 5 → Cl : 1 s 2 2 s 2 2 p 6 3 s 2 3 p 6 – + – Cl + Na → [Cl Na+ ]

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


108

QUÍMICA

____________________________________________________________________________________________________

Como se puede observar, el átomo de sodio con un electrón en su nivel de valencia, cuando está próximo a un átomo de cloro que tiene 7 electrones en dicho nivel, cede su electrón de valencia convirtiéndose en ion sodio (Na+ ) y el cloro capta el electrón pasando a ion cloruro (Cl–). Estos iones, de cargas eléctricas opuestas, se atraen y establecen un enlace iónico. En este compuesto, los átomos de cloro y sodio alcanzan la estructura de gas noble, al completar los 8 (7 + 1) electrones que pueden situarse en el nivel más externo. La estructura electrónica del ion cloruro es similar a la del átomo de argón, y la configuración electrónica del ion sodio es similar a la del átomo de neón.

Redes cristalinas iónicas Aunque se habla de moléculas iónicas, las unidades moleculares aisladas no se presentan realmente en estado natural, salvo cuando el compuesto se encuentra en estado de vapor. En realidad, los compuestos iónicos forman redes cristalinas en las que los iones positivos y negativos están ordenados de forma regular y situados en los vértices, caras y aristas de dicha red, de forma que la atracción electrostática entre ellos sea máxima. Para que se forme una red iónica, el número de cargas de signo positivo ha de ser igual al de cargas de signo negativo, ya que el conjunto de la red ha de ser siempre eléctricamente neutro, y los iones estarán ordenados en el espacio de forma que se consiga la máxima compactación en el empaquetamiento. El número de iones de un signo que rodea a cada uno de los iones de signo contrario se llama número o índice de coordinación. En el caso del NaCl, cada ion sodio se encuentra rodeado por seis iones cloruro y, de la misma forma, el ion cloruro está rodeado por seis iones sodio, obteniéndose como resultado una gran red eléctricamente neutra. Los tipos de redes dependen de dos factores: el tamaño de los iones, ya que influye en el número de iones que se pueden situar alrededor, y el número de cargas positivas, que ha de ser igual al de cargas negativas, ya que los compuestos iónicos deben de ser isoeléctricos.

Energía reticular Se denomina energía reticular a la energía que se desprende en la formación de un compuesto iónico mediante la unión de iones de signo opuesto. Esta energía es la misma que se necesita para separar los iones negativos de los iones positivos que lo forman. Por tanto, un cristal iónico será más estable, desde el punto de vista químico, cuanto mayor sea su energía reticular. La mayor o menor energía reticular depende de la magnitud de las cargas eléctricas y los radios de los iones que componen la red.

Propiedades de los compuestos iónicos Los compuestos iónicos son sólidos a temperatura ambiente y presentan unas propiedades características, dada la naturaleza del enlace iónico:

Dureza. Debido a la fortaleza del enlace, estos sólidos presentan una elevada resistencia a ser rayados o dilatados, y presentan elevados puntos de fusión, ya que la energía necesaria para separar los iones es alta. Conductividad. Conducen la electricidad en estado de fusión y en disolución, ya que, en estado líquido, los iones se disponen en forma desordenada y con libertad de movimientos, permitiendo el transporte de la corriente eléctrica, mientras que en estado sólido no son conductores de la electricidad porque los iones están fijos dentro de una red. Solubilidad. Los sólidos iónicos son solubles en disolventes polares y en el agua, en la que se disocian, y son insolubles en disolventes no polares. A este respecto cabe puntualizar que los disolventes polares son aquellos en los que hay separación permanente entre cargas positivas y negativas y que presentan gran actividad química, mientras que los no polares son los que mantienen características opuestas. Fragilidad. Los sólidos iónicos son relativamente frágiles, ya que la acción de fuerzas exteriores produce deslizamiento de un plano del cristal sobre otro y se deshace el empaquetamiento y hace que se enfrenten iones del mismo signo, permitiendo la aparición de fuerzas que se repelen y contribuyen a la rotura del cristal.

Enlace covalente El enlace iónico explica la combinación de átomos de diferente electronegatividad –es decir, tendencia más o menos pronunciada a aceptar electrones en su capa externa–, pero no explica las propiedades o la resistencia de muchas moléculas, cuyos átomos son eléctricamente iguales o similares. El enlace covalente se forma al compartir electrones los diferentes átomos que constituyen la molécula. Para explicar el enlace entre átomos de estas características surgió la idea de la compartición de electrones entre átomos. Cada uno de ellos tiende a compartir electrones con otros átomos de características similares para llegar a adquirir su configuración eléctrica estable, ya que, aunque la diferencia de electronegatividad de los átomos que forman la molécula puede variar, nunca podrá alcanzar valores que permitan la transferencia de electrones de un átomo a otro.

Teoría de Lewis Lewis, basándose en la regla del octeto de Kossel, que establece que la tendencia de cada átomo es tener ocho electrones en su última capa, para adoptar la configuración de gas noble, sugirió que los átomos pueden alcanzar esta estructura estable de gas noble si comparten uno o varios pares de electrones con otros átomos, para formar enlaces de unión, a los que denominó covalentes. La representación de este enlace se realiza sólo para los electrones de valencia, mediante el símbolo del elemento


________________________________________________________________________________

rodeado de puntos y cruces que simbolizan los electrones de valencia de cada uno de los átomos, o bien mediante puntos y rayas que simbolizan el par de electrones compartidos. Estos diagramas se llaman diagramas de puntos o de Lewis. Cada par de electrones compartido constituye un enlace, por lo que puede haber varios tipos de enlaces covalentes: – Sencillo o simple, si en la formación del enlace participa un solo par de electrones, como el enlace de dos átomos de hidrógeno: H + H → H – H o H .x H – Doble, si se comparten dos pares de electrones, como el que se establece entre dos átomos de oxígeno: x x

xx

xx

••

xx

x • • x x x → • O• x O x → O = O O +O xx xx

– Triple, como el enlace que tiene lugar entre dos átomos de nitrógeno: • •

••

xx

••

xx

N + Nx xx → N •• •x xx N → N ≡ N •

H

••

• •

••

F ••

H

••

••

••

••

••

• •

••

F •• ••

••

••

••

H •• N •• + B •• F •• → H •• N : B •• F •• ••

H

• •

F •• ••

••

H

• •

F •• ••

Amoniaco trifluoruro de boro H F |• | H – N• + B – F | | H F

El modelo artificial de Lewis no corresponde exactamente a la realidad, ya que parece indicar que los pares de electrones se encuentran en posiciones fijas. Además de la teoría de Lewis, el enlace covalente se puede explicar mediante dos teorías complementarias, basadas en el modelo ondulatorio: la teoría del enlace de valencia y la teoría de los orbitales moleculares. Teoría del enlace de valencia. La teoría del enlace de valencia o de los electrones desapareados, elaborada por L. Pauling y J. C. Slater, supone que la formación del enlace covalente tiene lugar cuando cada uno de los átomos participantes posee al menos un electrón desapareado. La formación del enlace covalente consiste en el apareamiento de esos electrones, que mantienen espines de signo contrario, y la máxima superposición de los orbitales atómicos que contienen esos electrones, originando una región de alta densidad electrónica. En el caso de la formación de la molécula de hidrógeno, los orbitales 1s de los átomos de hidrógeno se solapan en la región entre núcleos, dando lugar a la formación de un orbital molecular o de valencia que contiene los dos electrones opuestos, según el principio de exclusión de Pauli. enlace ———–

1s

1s

H

H

Por cada par de electrones que se aparean se forma un enlace y, por tanto, por cada átomo se podrán formar tantos enlaces como electrones desapareados posea. A la capacidad que tiene un elemento de formar enlaces covalentes se le llama covalencia. Así, la covalencia es el número de electrones desapareados de que dispone o puede disponer ese elemento. Por ejemplo, el oxígeno tiene en sus compuestos una covalencia 2, puesto que tiene en los orbitales py y pz dos electrones desapareados. Cada uno de estos orbitales podrá solaparse con otro orbital que posea un electrón, como es el caso del 1s del hidrógeno, para formar la molécula de agua: O (Z = 8) : 1s2 2s2p4

H F | | H–N → B–F | | H F

Covalencia 2 1s

2s

2p 1s

Amoniaco trifluoruro de boro 1s En la molécula de amoniaco, el átomo de nitrógeno tiene en la órbita exterior un par de electrones sin compartir. En el trifluoruro de boro, el boro sólo tiene seis electrones en su capa exterior. Al compartir los dos electrones del nitrógeno, el boro adopta la estructura del neón, saturando el orbital que tenía libre. El amoniaco es la molécula donadora y el trifluoruro de boro la receptora. Al escribir la fórmula se suelen indicar los enlaces covalentes mediante una flecha (→) dirigida del átomo donador al receptor.

109

Teorías del enlace covalente

Enlace covalente coordinado o dativo En la formación del enlace covalente es posible que el par de electrones sea cedido por uno solo de los átomos que se unen; en este caso se denomina enlace covalente coordinado o enlace dativo. El átomo o molécula que aporta el par de electrones actúa como donante, y el otro, como receptor. Un ejemplo es el enlace formado entre el trifluoruro de boro y el amoniaco:

Enlaces atómicos y moleculares

2s

2p

H | O | 1s H

H H O

H2O


110

QUÍMICA

____________________________________________________________________________________________________

La teoría de orbitales de valencia, además de establecer el carácter direccional de las moléculas, explica su geometría, basándose en el carácter direccional que poseen los orbitales cuando se solapan para formar el enlace covalente Se ha comprobado que cuando existen cuatro átomos ligados a otro, la estructura de la molécula puede ser la de un tetraedro con un átomo central y cuatro en los vértices, o bien puede constar de una estructura cuadrangular plana. Cuando el número de átomos ligado a uno central es de cinco, se presenta una estructura de pirámide cuadrangular o bipirámide triangular. Si el número de átomos es de seis, aparece una disposición octaédrica; con tres átomos ligados a uno central, una disposición piramidal triangular, en t o trigonal plana. Con dos átomos unidos a otro, la disposición es angular o lineal. Teoría de los orbitales moleculares. La teoría de los orbitales moleculares se debe a Hund y Mulliken. Difiere de la teoría del enlace de valencia en que tiene en cuenta todos los electrones combinados y considera que la unión en la molécula se produce mediante un conjunto de orbitales polinucleares. La formación del enlace covalente se debe a la superposición de orbitales atómicos con energía y simetría determinadas. Estos orbitales se combinan originando un orbital molecular en el que habrá un par de electrones (principio de exclusión de Pauli). Como los electrones compartidos pertenecen a los dos átomos, la máxima probabilidad de hallarlos en el orbital molecular se encuentra en la región entre los dos núcleos. Si los orbitales atómicos se describen mediante una función de onda que define su dirección y la forma, el orbital molecular también se describe mediante una función de onda que es la expresión matemática de la combinación lineal de los orbitales atómicos de los que procede. Esta combinación se puede efectuar de dos formas, según que las funciones de onda tengan el mismo o distinto signo, de forma que cuando la densidad de carga entre los núcleos es mayor en los átomos aislados que en el orbital molecular, se le denomina orbital molecular antienlazante. Cuando la densidad de carga del orbital molecular es mayor que en los dos átomos aislados, constituye un orbital molecular enlazante. La formación de orbitales moleculares a partir de la interacción de orbitales s origina orbitales que contienen los dos núcleos atómicos y se denominan orbitales σ. Si las funciones de onda de los orbitales s tienen signos distintos, el orbital obtenido es antienlazante.

σ 2s

+ 2s

Átomo A

2s

Átomo B

Orbital molecular antienlazante

σ 2s

+

Átomo A

Átomo B

Orbital molecular enlazante

Los orbitales σ se pueden formar también a partir de un orbital s y otro p o de dos p , pero a lo largo del eje x, es decir, interaccionan frontalmente. Cuando los orbitales py y px se solapan no de forma frontal, sino lateral, se forma un orbital con simetría diferente al orbital σ, que se denomina orbital π. A

+

x

σ 2pz Antienlazante

2pz Átomo B

2pz Átomo A

B

A

B x

σ 2pz Enlazante

+ 2py ó 2pz Átomo A

A 2py ó 2pz Átomo B

x

B

Antienlazantes π 2py o π 2pz

A

B Enlazantes π 2py o π 2pz

En ambos tipos de orbitales (σ y π), el orbital del que proceden se indica mediante subíndices (si el orbital procede de un orbital s → σS). A los orbitales antienlazantes se los distingue mediante un asterisco (π*, σ*).

Hibridación y estereoquímica molecular Aunque en principio se podía pensar que los orbitales moleculares mantienen la orientación espacial que presentan los orbitales atómicos de los que proceden, el estudio de estructuras covalentes ha dado resultados que


________________________________________________________________________________

111

Enlaces atómicos y moleculares

Polaridad del enlace

Hibridaciones Pares de Orbitales electrones Forma atómicos Enlaces no de la Hibridación combinados sigma compartidos molécula sp

s1 pz

2 1

0 1

lineal lineal

sp2

s1 px py

3

0

2

1

trigonal plana angular de 120º

4 3

0 1

2

2

5

0

4

1

3 2

2 3

bipiramidal trigonal tetraédrica distorsionada forma de T lineal

6

0

octaédrica

5

1

4

2

bipiramidal cuadrada cuadrada plana

sp3

sp3 d

sp3 d2

s1 px py pz

s1 px py pz d2z

s1 px py pz d2z dx2 -y 2

tetraédrica piramidal trigonal angular de 109,5º

no coinciden con esta teoría. Para explicar esta falta de coincidencia se creó el concepto de hibridación. La hibridación es un fenómeno que implica una redistribución interna de los orbitales atómicos dando lugar a otros orbitales nuevos que favorecen el máximo solapamiento y la máxima economía energética en la formación de enlaces. Matemáticamente, son la combinación lineal de las funciones de onda de los orbitales atómicos no hibridados. Tomemos como ejemplo la molécula de metano. El carbono a partir del orbital s y los tres p forman cuatro orbitales iguales que ya no son ni p ni s y forman una estructura tetragonal, donde los lóbulos se pueden solapar con los orbitales del hidrógeno para originar los orbitales moleculares. Este tipo de hibridación se denomina tetragonal por la geometría de la molécula, o sp3 por los orbitales que intervienen. Los orbitales híbridos solamente se pueden unir por solapamiento frontal, por lo que los enlaces que se producen son solamente de tipo sigma (σ). Existen cinco posibles hibridaciones entre orbitales atómicos, y cada una de ellas da lugar a diferentes disposiciones geométricas de las moléculas.

En el enlace covalente, los electrones compartidos, de los que depende el enlace, están situados a la mitad de la distancia entre los núcleos en el caso de moléculas con dos átomos iguales. Sin embargo, cuando las partículas pertenecen a distintos elementos, los electrones son atraídos más por un átomo que por el otro, debido a que cada uno presenta un valor diferente de electronegatividad. El centro de la carga tiende a distribuirse más cerca del núcleo del átomo de mayor electronegatividad y se crea un dipolo eléctrico. Un dipolo es un par de cargas iguales y opuestas (una positiva y otra negativa), separadas por una distancia pequeña. El momento dipolar es el producto de la carga por la distancia entre ellas y define a un dipolo. Su unidad es el Debye (1D = 3,3 · 1030 culombios metro). Los compuestos iónicos tienen momentos dipolares de gran magnitud, considerándose, por tanto, que el enlace iónico es un caso límite de enlace covalente de polaridad máxima, y los compuestos covalentes típicos como el Cl2 no presentan momento dipolar, son apolares, ya que el par de electrones de enlace permanece en el centro de la distancia internuclear. Existe, sin embargo, una gradación entre el enlace covalente apolar y el iónico. Dentro de esa escala se encuentra una serie de compuestos que presentan momentos dipolares de menor magnitud que los compuestos iónicos. Entre ellos se encuentran muchos compuestos covalentes formados por átomos distintos, como el HCl, HBr, H2 O, etc. Son moléculas en las que se ha formado un dipolo y se denominan polares. Cuanto mayor sea la atracción de un átomo por los electrones de un enlace covalente, mayor será la polaridad de la molécula que forma:

+ Na

– Cl

– Cl

+ H

NaCl

HCl

Enlace iónico

Enlace covalente polar

Cl

±

Cl

Cl2

Enlace covalente apolar

Como en un enlace iónico se produce transferencia total de electrones de una órbita de un átomo a la del otro, cuando la transferencia es parcial, el enlace es de carácter parcialmente iónico. Por tanto, la mayoría de los compuestos covalentes tienen cierto carácter iónico, ya que son polares.

Enlace metálico Existen dos teorías para explicar el enlace metálico: la teoría clásica, que no explica el comportamiento de los


112

QUÍMICA

____________________________________________________________________________________________________

elementos semiconductores, y la teoría cuántica o teoría de bandas.

Teoría clásica El enlace metálico es el que se establece entre un gran número de cationes rodeados por una nube electrónica que los mantiene unidos. En un metal no se unen solamente dos átomos, sino que un número indefinido de iones forma una red metálica donde los electrones son atraídos por igual por todos los núcleos y mantienen unidos a un gran número de iones positivos. Los iones de esta red metálica se disponen formando planos, entre los que la nube de electrones de valencia se mueve libremente, y aunque estos planos están formados por cargas del mismo signo, no se repelen, debido al hecho de que la nube de electrones actúa a modo de pantalla, aunque pueden desplazarse unos sobre otros con facilidad.

+ +

+ +

+

+ +

+

+ +

+

+ +

+

+ +

+

+ +

+

+ +

+

+ +

+

+ +

+

+ +

+

+ +

Estructura de red metálica con electrones de valencia deslocalizados

Este tipo de enlace es exclusivo de los metales y sus aleaciones, que presentan dos características: – Bajo potencial de ionización, por lo que pueden ceder electrones con facilidad y dar lugar a la nube electrónica, y a la vez forman los iones positivos característicos de la red metálica. – Orbitales de valencia vacíos, que confieren gran libertad de movimiento a los electrones. Las redes metálicas pertenecen principalmente a tres modelos estructurales: red cúbica centrada en el centro, red cúbica centrada en las caras y red hexagonal compacta. Las tres son resultado del apilamiento compacto de los átomos de los metales.

Red cúbica central

Red cúbica centrada en las caras

Red hexagonal

La red cúbica centrada en el centro corresponde con un número de coordinación de 8 y la presentan los metales: litio, sodio, potasio, bario, etc. La estructura cúbica centrada en las caras es típica del calcio, aluminio, hierro, níquel, cobre, plata, oro y cincuenta metales más, con un número de coordinación de 12. La hexagonal compacta es típica de metales como el cromo, berilio, magnesio, con número de coordinación también de 12.

Teoría de bandas Se puede considerar que un metal es una macromolécula formada por un elevado número de átomos cuyos orbitales atómicos interaccionan dando lugar a orbitales moleculares. Al ser muy grande el número de orbitales atómicos, sus niveles de energía están tan próximos que forman una banda de energía. En los metales alcalinos, la configuración electrónica de la capa de valencia es ns 1 y es la que contribuye a la formación de una banda semillena, puesto que los orbitales de niveles inferiores no contribuyen a la formación del enlace. En los metales alcalinotérreos, la configuración electrónica de la capa de valencia es ns 2, por lo que la banda estará completamente llena y solapada con la p que estará desocupada. Tanto en el caso de los metales alcalinos como en el de los alcalinotérreos, los niveles energéticos están tan próximos que el aporte de energía necesario para que los electrones llenen orbitales desocupados es mínimo, y el movimiento de electrones sólo se verá impedido por los choques que se producen contra los núcleos en vibración. Como las vibraciones aumentan al incrementarse la temperatura, también aumentará el número de choques, con lo que se observa que la conductividad de los metales disminuye con la temperatura. En el caso de los semiconductores (elementos situados en el sistema periódico entre los metales y no metales), no hay superposición entre las bandas s y p, aunque ésta separación es mínima y por tanto se puede superar con un aporte de energía, en pequeña cantidad. Esto provoca que al aumentar la temperatura, se favorezca la conductividad. En los sólidos aislantes, con enlaces covalentes, la separación entre bandas es muy elevada, por lo que sería necesario un gran aporte de energía para que fueran conductores.

Orbitales atómicos p

Orbitales atómicos p

Orbitales atómicos s

Orbitales atómicos s

Metales alcalinos

Metales alcalinotérreos


________________________________________________________________________________

Orbitales atómicos p

Orbitales atómicos p ∆E

∆ E Orbitales atómicos s

Orbitales atómicos s

Semiconductores

Aislantes

Propiedades de los metales Los metales presentan las siguientes propiedades: – Conductividad. Los metales son excelentes conductores, tanto térmicos como eléctricos, debido a la gran movilidad de sus electrones de valencia. – Ductilidad y maleabilidad. Los metales tienen gran facilidad para ser estirados en forma de hilos (ductilidad) y para ser extendidos en láminas muy finas (maleabilidad). Ambas propiedades son debidas a la disposición en capas de los iones que forman la red, por lo que, cuando se aplica cierta presión al metal, las capas se deslizan unas sobre otras. – Tenacidad. Los metales presentan la capacidad de resistir tensiones de tracción o choque sin romperse (son tenaces). Esta característica se debe a la intensidad de la nube de carga negativa y de las fuerzas de atracción entre los iones positivos, que mantienen la estructura estrechamente unida. – Brillo. Los metales emiten energía en forma luminosa, al saltar los electrones libres a niveles fundamentales de energía. – Efecto fotoeléctrico y termoiónico. Al tener los electrones de valencia gran libertad de movimiento, pueden ser arrancados mediante una pequeña aportación de energía luminosa o térmica.

Fuerzas intermoleculares Las fuerzas que intervienen en la unión entre moléculas de diferentes compuestos, denominadas fuerzas intermoleculares, son mucho más débiles que las fuerzas intramoleculares. De ellas depende el estado de agregación de los compuestos (líquido, sólido, gas) y los puntos de fusión y ebullición, ya que al ser fuerzas débiles se necesita poca energía para provocar un cambio de fase (p. ej., de sólido a líquido o de líquido a gas). Estas fuerzas se deben a la existencia de dipolos, aunque las moléculas no sean polares. Existen varios tipos,

Enlaces atómicos y moleculares

113

pero las más características son las fuerzas de Van der Waals y el enlace o puente de hidrógeno. Fuerzas de Van der Waals. Se deben a la formación de dipolos instantáneos, producidos por las vibraciones de las moléculas que hacen que la nube de electrones se desplace respecto del núcleo. La formación de estos dipolos induce a otros dipolos en las moléculas próximas y por tanto se originan fuerzas de atracción. Son fuerzas más débiles que las de otros tipos de enlace y aumentan con el volumen de las moléculas, ya que en las moléculas de mayor tamaño, las capas electrónicas externas se deforman con mayor facilidad. Puentes de hidrógeno. Cuando el hidrógeno está formando una molécula con algún elemento muy electronegativo y de mayor tamaño (como el oxígeno, flúor y nitrógeno), el par de electrones es fuertemente atraído por el elemento más electronegativo, con lo que el hidrógeno queda cargado positivamente y constituye un polo positivo muy intenso que se une al elemento electronegativo de la molécula contigua. Estas fuerzas constituyen el enlace o puente de hidrógeno, que se representa mediante una línea discontinua de puntos: O H

H

H O

O

H

H

H

O H

H

Puentes de hidrógeno de la molécula de agua

_ Preguntas de repaso 1. Utilizando la teoría del enlace de valencia, explicar la formación de la molécula de flúor (F2 ). 2. ¿Cómo se representa la molécula de agua según la estructura de Lewis? ¿Presenta dicha molécula momento dipolar? Razónese la respuesta. 3. De las afirmaciones que se exponen a continuación, indicar, de forma razonada, si son ciertas o no: a) Las redes cristalinas no presentan conductividad. b) Los sólidos iónicos funden a temperaturas superiores a las de los sólidos moleculares. c) Los electrones de valencia de los metales no esmtán deslocalizados. d) La temperatura aumenta la conductividad de los metales.


ESTADOS DE AGREGACIÓN DE LA MATERIA

L

a materia puede presentarse en tres estados fundamentales de agregación: sólido, líquido y gaseoso. Las partículas que forman la materia se encuentran en ocasiones en condiciones de desorden completo, como en el caso del gas ideal, o pueden formar ordenaciones regulares, como en el caso del sólido cristalino, pero entre ambos estados ideales existen otros reales (aunque suelen estudiarse los estados ideales por su mayor facilidad para establecer leyes generales).

Estado gaseoso

O HN

O

N

N CH3

CH3

N

La presión parcial es la que ejerce uno de los gases que componen una mezcla cuando ocupa el volumen total de la masa. La presión total es la suma de las presiones parciales de los componentes de dicha mezcla. Por su parte, el volumen de un gas es el espacio en el que sus moléculas se mueven libremente. La unidad de volumen es el centímetro cúbico (es una medida análoga al milímetro en el caso de los líquidos). Para explicar el comportamiento de los gases en diferentes condiciones existen diversas leyes que se exponen a continuación.

Ley de Boyle-Mariotte Los gases forman un estado de la materia en el que sus partículas se encuentran en un completo desorden, debido a la gran distancia que hay entre las moléculas, y a que no existen grandes fuerzas que las unan. Los gases se expanden indefinidamente y no tienen forma ni volumen definido, sino que adoptan la forma del recipiente que los contiene. También se pueden comprimir fácilmente, reduciéndolos a una porción mínima del volumen inicial, sin que sea necesario aplicar grandes presiones. El estudio de los gases ha sido fundamental en el desarrollo de la química. Cuando se comprimen o se calientan, los gases presentan un comportamiento más simple que otros estados de la materia. La modificación de la presión, volumen y temperatura origina la transición de un estado a otro de agregación de la materia, pudiéndose conseguir que la sustancia cambie de estado. La presión de un gas es debida al choque de las moléculas contra las paredes del recipiente que lo contiene, y por tanto es la fuerza que ejerce sobre una unidad de superficie. La unidad de presión en el Sistema Internacional es el pascal, que es la presión ejercida por una fuerza de un newton sobre una superficie de 1 metro cuadrado. No obstante, también se utiliza como unidad la atmósfera, que es la fuerza ejercida por una columna de mercurio de 760 mm de altura y 1 cm2 de sección, a 0 ºC y sobre el nivel del mar. 1 atmósfera = 101.325 pascales

En la segunda mitad del siglo XVII, e independientemente, Boyle en Gran Bretaña, y Mariotte en Francia, establecieron la relación existente entre la presión y el volumen de una cantidad de gas a temperatura constante. Al someter un gas a diferentes presiones, los volúmenes son proporcionales a dichas presiones, de forma que si se duplica la presión, el volumen se reduce a la mitad y viceversa. Según la ley de Boyle-Mariotte, a temperatura constante, la presión que se ejerce sobre un gas y el volumen que ocupa son inversamente proporcionales. El producto de la presión y el volumen es constante y se expresa matemáticamente como: P·V=K donde P es la presión, V el volumen y K una constante; es decir, si una masa de gas ocupa un volumen V1 cuando la presión es P1 , y ocupa un volumen V2 al ser la presión P2 , el producto del volumen por la presión es el mismo en ambos casos: P 1 · V1 = P2 · V2 o P1 /P2 = V2 /V1

Leyes de Charles y Gay-Lussac Al calentarse, los cuerpos sufren una dilatación que es mucho mayor en los gases que en los líquidos y sólidos. La ley de Charles relaciona la temperatura y el volumen:

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


____________________________________________________________________________

A presión constante, el volumen de una cierta masa de gas es directamente proporcional a la temperatura absoluta: V = K · T o V/T = K expresión en la que V es el volumen, T la temperatura absoluta en grados kelvin y K una constante O también: V i /Ti = Vf /Tf donde los subíndices i y f significan inicial y final del volumen y temperatura. La ley de Gay-Lussac relaciona presión y temperatura: A volumen constante, la presión de un gas es directamente proporcional a la temperatura absoluta:

Estados de agregación de la materia

115

Avogadro enunció una hipótesis según la cual el motivo de que los compuestos gaseosos se combinasen según esa relación sencilla de volúmenes era que volúmenes iguales de todos los gases, bajo las mismas condiciones de presión y temperatura, contienen el mismo número de moléculas. Experimentalmente, se ha visto que, en condiciones normales, a 0º C y 1 atmósfera de presión, un mol de cualquier gas ocupa 22,4 litros aproximadamente, volumen que se denomina molar. La cadena de equivalencias será para el O2 , por ejemplo: 1 mol de O2 → 32 gramos O2 → 22,4 litros → → 6,02 · 1023 moléculas de O2

Ecuación general de los gases perfectos

P i /Ti = Pf /Tf

Según las leyes anteriores, la presión ejercida por un gas es directamente proporcional a la temperatura absoluta e inversamente proporcional al volumen que se considera función de estado (por depender de la presión y la temperatura). La ecuación de estado o de los gases perfectos relaciona todos los factores que determinan el estado de un gas aplicada a n moléculas y se expresa:

si se contemplan las presiones y temperaturas inicial y final.

P · V = nRT

P = K · T o P/T = K donde P es la presión, T la temperatura absoluta medida en grados kelvin y L una constante. También se puede expresar:

Ley completa de los gases

R es una constante universal cuyo valor puede conocerse a partir de la ecuación:

Como en un caso real no parece probable que se mantengan constantes la temperatura y la presión de un gas, las leyes de Gay-Lussac y Boyle se pueden combinar en una única ley para expresar la variación de volumen de una cierta masa de gas, con la presión y la temperatura.

El volumen se mide en litros, la temperatura en grados absolutos y la presión en atmósferas. Así se deduce que:

P · V/T = K

R= 1 atm · 22,4l/1mol · 273 K = 0,082 atm · l/mol · K

R= Vo Po /nT

o análogamente al producto de las leyes anteriores P i Vi /Ti = Pf Vf /Tf Para una masa determinada de cualquier gas, el producto del volumen por la presión dividido por el valor de la temperatura es una constante. El valor de la constante depende de la masa del gas considerado.

Ley de Gay-Lussac de volúmenes de combinación de gases. Principio de Avogadro y volumen molar En 1808, Gay-Lussac demostró que cuando se forma una sustancia gaseosa a partir de la reacción de dos o más gases, los volúmenes de las diferentes sustancias, medidas bajo las mismas condiciones, se encuentran en una relación de números enteros: Hidrógeno + cloro 1 volumen

1 volumen

Mezcla de gases. Presiones parciales y ley de Dalton Para una mezcla de gases que no reaccionan químicamente entre sí, Dalton estableció la ley de las presiones parciales, según la cual la presión total de la mezcla es la suma de las presiones parciales que cada uno de los gases parciales ejercería si él solo ocupase todo el recipiente. Como la ecuación de los gases perfectos se puede aplicar a un solo gas o a mezcla de gases, si Pt es la presión total y Vt el volumen total, puede establecerse que P t = P1 +P2 +P3 +.... = n1 RT/V1 + n2 RT/V2 +....+ n RT/Vt En general, la presión parcial de cualquier componente de la mezcla es la presión total por la fracción del número de moles de ese componente:

cloruro de hidrógeno 2 volúmenes

P A = X A Pt


116

QUÍMICA

____________________________________________________________________________________________________

X A es la fracción molar del componente A, luego, en consecuencia: X A = moles de A/moles totales

Teoría cinética molecular de los gases Según los principios de la teoría cinética, los gases están formados por partículas, moléculas o átomos esféricos que están moviéndose continuamente con movimiento rectilíneo y con una velocidad que depende de la naturaleza del gas y la temperatura. La dirección del movimiento varía cuando la molécula choca con otra partícula o con las paredes del recipiente que contiene el gas. La teoría cinética intenta explicar el comportamiento y propiedades de los gases. En este sentido, cabe reseñar tres factores esenciales: – Los gases no reducen su volumen o presión espontáneamente a una temperatura determinada, debido a que los choques entre las moléculas o con las paredes del recipiente son elásticos y por tanto no se pierde nada de energía. – El aumento de volumen y presión es consecuencia del movimiento desordenado de las moléculas cuando se eleva la temperatura. – La presión que ejerce un gas se debe a la existencia de un movimiento caótico entre muchos millones de moléculas en una mínima cantidad de gas.

Ley de la difusión de gases. Ley de Graham Graham estudió en 1832 las velocidades de difusión de diferentes gases y enunció la ley por la que las velocidades de difusión de un gas, en igualdad de condiciones de presión o temperatura, son inversamente proporcionales a las raíces cuadradas de sus densidades respectivas:

ño y por tanto son muy poco compresibles. Tienen mayor fuerza de atracción intermolecular que los gases y mayor condensación. En consecuencia, estas fuerzas de cohesión hacen que los líquidos se adapten a la forma del recipiente que los contiene. Sin embargo, cuando se encuentran libres en un gas o en otro líquido, tienden a adoptar un volumen esférico. Las moléculas de los líquidos poseen movimiento de traslación, aunque menor que los gases y con menor velocidad.

Tensión superficial Una molécula en el interior de un líquido es atraída con la misma intensidad en todas direcciones, y la fuerza resultante sobre cualquiera de ellas es cero, ya que cada molécula se encuentra rodeada por completo por otras moléculas. Pero las moléculas de la superficie sí se encuentran sometidas a una fuerza resultante de atracción, ya que estas moléculas de la capa superficial no se hallan completamente rodeadas por otras y por eso se ven sometidas a la atracción de las que se sitúan en capas inferiores, con lo que se forma una capa resistente llamada tensión superficial. La tensión superficial de un líquido se puede definir como la fuerza ejercida sobre la superficie de ese líquido, que se opone al aumento de su área. También se puede definir como el trabajo que habría que efectuar para extender un centímetro cuadrado la superficie de un líquido. Este hecho explica que la tendencia de los líquidos se encamina a la formación de gotas esféricas, puesto que la esfera es el cuerpo de menor superficie. La tensión superficial es el fenómeno físico responsable de la formación en los tubos capilares de meniscos, convexos (a) o cóncavos (b), según su magnitud en cada líquido, en lo que constituye el fundamento de diversos aparatos de medición. En la imagen se ilustran los meniscos formados por elevación o descenso de los líquidos, siendo r el radio del menisco y h la magnitud del desplazamiento:

d 2/ d 1 V 1 /V2 = r

donde V1 y V2 son las velocidades de difusión. La densidad presenta valores menores en los gases que en los líquidos y sólidos:

h

d = masa (peso molecular)/volumen h

Estado líquido Los líquidos se consideran un estado de agregación de la materia intermedio entre el estado de gas ideal y de sólido cristalino. En un líquido, las moléculas están muy próximas unas de otras, el espacio entre ellas es muy peque-

r

a

b


____________________________________________________________________________

Estados de agregación de la materia

P = π · S (dv)/dr

Viscosidad y fluidez

donde π es el coeficiente de viscosidad, constante característica de cada sustancia líquida.

La viscosidad y la fluidez son características opuestas entre sí, que permiten establecer diferencias entre el estado líquido y gaseoso. La fluidez es una característica de los líquidos, cuyas moléculas pueden deslizarse al ser sometidas a una fuerza. Por otra parte, se denomina viscosidad de un líquido, o de un gas, a la resistencia que éstos ofrecen a fluir. Esta resistencia es debida al rozamiento interno que originan las atracciones que las moléculas ejercen entre sí y que tienden a oponerse al movimiento de una partícula con respecto a otra. En los líquidos, la viscosidad disminuye al aumentar la temperatura. Cuando un líquido presenta una viscosidad elevada, se denomina viscoso o espeso; cuando la viscosidad impide el flujo, por ser muy elevada, el cuerpo se denomina vítreo. Así pues, un vidrio tiene el desorden molecular de un líquido y las propiedades externas de un sólido, motivo por el que al calentar dicho cuerpo vítreo disminuye la viscosidad y aparecen las propiedades del estado fluido. Si se supone que la capa laminar de un líquido se desplaza con una velocidad, v , y otra capa con superficie, s, se desplaza a su lado con velocidad inferior, r , la capa de menor velocidad ejerce una fuerza que disminuye la velocidad mayor con el fin de igualar ambas velocidades. Matemáticamente se expresa:

Vaporización: evaporación y ebullición Todos los líquidos pueden pasar a gas o vapor. Este proceso se denomina vaporización. El paso de líquido a vapor, cuando se produce en la superficie del líquido, a cualquier temperatura, se llama evaporación, mientras que si este proceso tiene lugar en toda la masa del líquido, a una temperatura constante, se denomina ebullición.

Evaporación La evaporación se puede explicar mediante la teoría cinética. Según esta teoría, las partículas que forman una masa líquida están en constante movimiento, en función de su energía cinética. Para que una molécula pase de líquido a gas será necesaria una energía cinética que le permita vencer la tensión superficial. Las moléculas de la capa superficial son las que mayor energía poseen y, por tanto, pueden escapar del líquido y pasar a la fase de vapor. Como las molé-

Tipos de sólidos Clase

117

Unidades

Unión

Propiedades

IÓNICOS (Sal común)

IONES

Fuerzas eléctricas

– Redes iónicas – Altos puntos de fusión y ebullición – Duros – Solubles en H2 O – Conductores

ATÓMICOS O COVALENTES

ÁTOMOS

Enlace covalente

– Duros – Altos puntos de fusión y ebullición – Insolubles – Formación de redes

METÁLICOS

IONES + y ELECTRONES –

Eléctrica

– Sólidos – Maleables – Dúctiles – Brillo – Conductores – Insolubles – Formación de redes

MOLECULARES (Glucosa, celulosa)

MOLÉCULAS

Fuerzas intermoleculares (Van der Waals o dipolares)

– Blandos – Volátiles – Bajos puntos de fusión y ebullición – Insolubles en H2 O – No conductores


118

QUÍMICA

____________________________________________________________________________________________________

culas que se evaporan son las de mayor energía, el líquido se enfriará, ya que disminuye la energía cinética media del resto de las moléculas. La evaporación se facilita al aumentar la temperatura, ya que aumenta la energía cinética de las moléculas. El incremento de la superficie libre del líquido también facilita la evaporación.

Ebullición Como se indicó anteriormente, la ebullición y la evaporación son procesos similares, aunque difieren en algunos aspectos. La evaporación tiene lugar de forma espontánea y sólo se produce en la zona superficial, y la ebullición se efectúa cuando se proporciona calor y, por tanto, el líquido alcanza una temperatura que permite la formación de burbujas que al ascender se rompen y liberan vapor. Este proceso de vaporización tiene lugar de forma tumultuosa en toda la masa del líquido. El punto de ebullición de un líquido es la temperatura a la que la presión de vapor es igual a la presión exterior que actúa sobre la superficie del líquido (será la presión atmosférica si el líquido está en una vasija abierta). El punto de ebullición de un líquido es la temperatura a la que su presión de vapor es de 760 mm. Como la presión atmosférica varía con la altura, los líquidos hierven a temperaturas distintas según la altura a la que se encuentren. A mayor altura se necesita menor temperatura.

Saturación y presión de vapor Si la evaporación de un líquido se produce en un recipiente abierto, pocas moléculas de las que se han difundido hacia la atmósfera vuelven a la superficie del recipiente. Por el contrario, si la evaporación se verifica en un recipiente cerrado, las moléculas que se vaporizan no pueden escapar y se condensan, pasando nuevamente al líquido. La saturación se produce cuando se condensan

tantas moléculas por segundo como las que se vaporizan en ese mismo intervalo de tiempo. El líquido está en equilibrio con el vapor, puesto que la velocidad de escape de las moléculas de líquido a vapor es igual a la de retorno de la fase de vapor a la fase líquida. Cuando se llega a la saturación y se establece el equilibrio, la cantidad relativa de líquido y vapor permanecen constantes. La presión del vapor saturado, a una temperatura determinada, es la presión de vapor del líquido que presenta valores fijos y característicos para cada sustancia.

Estado sólido Por regla general, se dice que el estado sólido se caracteriza por tener forma y volumen determinados. La forma y el volumen determinados y la mínima compresibilidad hacen suponer que, en los sólidos, las moléculas o los átomos se encuentran en contacto unos con otros, ya que poseen unas fuerzas de atracción muy intensas. Para establecer las propiedades de los sólidos se ha creado el modelo de sólido cristalino ideal, que obedece a un orden geométrico y que permite desarrollar la siguiente clasificación.

Clasificación de los sólidos Los sólidos se suelen clasificar en dos grandes grupos: los sólidos vítreos o amorfos y los sólidos cristalinos. Los sólidos vítreos o amorfos son sustancias cuya constitución interna es variable, debido a que adoptan una distribución más o menos al azar. Dentro de este grupo de sustancias se encuentran las resinas sintéticas o el vidrio. El vidrio es considerado un líquido de fuerzas internas intensas –denominadas también líquidos sobreenfriados– y es considerado un estado de agregación intermedio entre los líquidos y los cristales. Las partículas del vidrio no están ordenadas geométricamente y su estructura interna corresponde a la de un líquido de viscosidad máxima y gran rapidez.

Tipos de sistemas coloidales Fase dispersa

Medio dispersante

Sistema coloidal

Ejemplos

Gas +

Gas Líquido Sólido

No existe Espumas Espuma sólida

No pueden existir Espuma de cerveza, nata batida Piedra pómez

Líquido +

Gas Líquido Sólido

Nieblas, aerosoles Emulsiones Geles

Nubes, bruma Leche, mahonesa Gelatina, jalea, queso

Sólido +

Gas Líquido Sólido

Humos Soles Coloide sólido

Humos y polvo Disoluciones coloidales Vidrios coloreados, piedras preciosas coloreadas


____________________________________________________________________________

Coloides Se llama coloide o estado coloidal a un sistema en el que en un medio dispersante se encuentran esparcidas una serie de partículas llamadas micelas, cada una de las cuales está constituida por un grupo de átomos, o bien moléculas gigantes o macromoléculas que pueden alcanzar el tamaño de las micelas (la hemoglobina de la sangre es una macromolécula). Aunque los coloides típicos están formados por una fase dispersante líquida, existen diversos sistemas de agregación para cada fase del coloide, por lo que se pueden clasificar según se indica en el recuadro inferior. Los sistemas coloidales se presentan muy a menudo en la naturaleza y constituyen un grupo muy importante de sustancias. La mayoría de los líquidos orgánicos y los tejidos son sistemas coloidales. La leche, las nubes, las películas fotográficas, los humos, las jaleas y un largo etcétera son sustancias de tipo coloidal.

Cambios de estado El estado físico en que se encuentra una sustancia depende del tipo de sustancia que se esté considerando y de la temperatura y la presión a la que se encuentre sometida; por tanto, modificando alguno de estos factores, o los dos, se puede conseguir que dicha sustancia cambie de estado. Cuando se calienta un sólido, las partículas que lo constituyen se van desordenando hasta llegar al estado líquido. A esta energía que hay que aportar por unidad de masa para pasar del estado sólido al líquido se le llama calor latente de fusión, o calor molar de fusión cuando se trata de 1 mol de sustancia. Al seguir aumentando la temperatura, aumenta la energía cinética, se llega al punto de ebullición y el líquido se convierte tumultuosamente en gas. Nuevamente se ha

119

realizado un aporte de energía por unidad de masa para que la sustancia cambie del estado líquido a gas, denominándose calor latente de vaporización (o calor molar de vaporización si se trata de 1 mol de sustancia). Sólido

n

ó ci

ón ci ca ifi ón lid si So Fu

Los sólidos cristalinos o cristales se caracterizan por ser homogéneos y anisótropos, es decir, partes iguales de un cuerpo y con la misma orientación presentan las mismas propiedades físicas y químicas (homogeneidad). Por otra parte, las propiedades de un cristal dependen de la dirección que se considere al analizarlas (anisotropía). Los cristales se constituyen en redes poliédricas según las tres direcciones del espacio. Se pueden clasificar por el tipo de enlace que mantiene unidas a las moléculas o átomos y también por las simetrías cristalinas.

Estados de agregación de la materia

a ón im aci l b Su blim Su Condensación Licuefacción Gas

Líquido

Vaporización, evaporación y ebullición

En el Sistema Internacional de unidades, el calor latente del cambio de estado se mide en julios/kilogramos, aunque también se utilizan la kilocaloría/kilogramo y caloría/gramo.

_ Preguntas de repaso 1. En el transcurso de un viaje, en el que el coche tiene uno de sus neumáticos sin cámara, la temperatura que alcanzan las ruedas es de 83 ºC. ¿Qué presión llegará a soportar el neumático sin cámara, si se tiene en cuenta que a temperatura ambiente de 20º C soporta una presión de 1,7 atmósferas y tiene una capacidad de 17 litros? 2. Si un gas a 700 mm de presión y 27º C de temperatura ocupa un volumen de 100 centímetros cúbicos, ¿cuál será su volumen en condiciones normales de presión y temperatura? 3. Determinar la densidad del oxígeno en condiciones normales de presión y temperatura. 4. ¿Qué cantidad de calor habrá que aportar para fundir un cubito de hielo de 30 gramos de masa y que está a –18º C de temperatura? El calor latente de fusión del agua es de 334,4 julios/kilogramo.


QUÍMICA DE DISOLUCIÓN

O HN

O

N

N

CH3

N

CH3

Mezclas Una mezcla es la unión de dos o más sustancias, en cualquier proporción, en la que cada uno de los componentes conserva su identidad y propiedades específicas, ya que no llega a formar una nueva especie química. Cuando los componentes de una mezcla se distinguen con facilidad, se dice que la mezcla es heterogénea. Por el contrario, en las mezclas homogéneas se necesitan métodos analíticos para determinar sus componentes; a estas mezclas homogéneas se las suele denominar dispersiones. Las dispersiones están integradas por una sustancia llamada fase dispersa, contenida en otra llamada fase dispersante. En función de los estados de agregación de estas dos fases, las dispersiones se dividen básicamente en dos grupos: suspensiones y disoluciones (también llamadas soluciones). Por su parte, las suspensiones están constituidas por dos o más sustancias insolubles entre sí. Se subdividen según el estado de agregación de las fases que las componen en: suspensiones coloidales, formadas por fases dispersantes líquidas o gaseosas con fase dispersada sólida o gaseosa, y emulsiones, constituidas por las fases líquidas.

Mezclas

Homogéneas Dispersiones

Suspensiones Disoluciones

Coloidales Emulsiones

Heterogéneas

Disoluciones Una disolución o solución es una mezcla homogénea de dos o más sustancias.

Disoluciones Tipos

Ejemplos

Disoluciones en estado gaseoso. (Se comportan como gases.)

– Gases en gases (aire) – Líquidos en gases (agua en aire: niebla) – Sólidos en gases (polvo en aire)

Disoluciones en estado líquido. (Se comportan como líquidos. Son las disoluciones propiamente dichas.)

– Gases en líquidos (CO2 en H2 O) – Líquidos en líquidos (alcohol en H2 O) – Sólidos en líquidos (azúcar en H2 O )

Disoluciones en estado sólido. (Se comportan como sólidos.)

– Gases en sólidos – Líquidos en sólidos – Sólidos en sólidos (aleaciones: latón, bronce, etc.)

Sus componentes son al menos dos: el disolvente, que equivale a la fase dispersante y es el componente que interviene en mayor proporción, y el soluto o fase dispersa, que se halla en menor cantidad. Existen diferentes tipos de disolución. Pueden distinguirse, así, los diversos grupos desarrollados en el recuadro superior. Cualquier mezcla de gases es una disolución, independientemente de la proporción en que se encuentre cada componente. En este contexto, cuando dos o más sustancias pueden mezclarse en cualquier proporción se dice de ellas que son completamente miscibles. Las sustancias que no se mezclan entre sí se dice que no son miscibles (p. ej., el agua y el aceite). Entre estos dos tipos de sustancias existen otros que se mezclan parcialmente para formar disoluciones, pero sólo lo hacen en determinadas proporciones.

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


__________________________________________________________________________________________

Solubilidad y saturación La solubilidad de un soluto en un disolvente es la cantidad de soluto máximo que puede disolverse en un volumen de disolvente determinado. Atendiendo a la cantidad de soluto disuelto se obtienen diferentes tipos de disolución: – Cuando a una disolución se le agrega una cantidad muy grande de soluto, parte de éste no se disuelve y se obtiene una disolución saturada. – Cuando a la disolución se le agrega una cantidad mayor de disolvente, ocurre el fenómeno contrario, es decir, la disolución se diluirá, por lo que la tendencia será que el soluto vaya disminuyendo su concentración en la mezcla. – Cuando este soluto se disuelve totalmente sin alcanzar la saturación, se obtiene una disolución no saturada. Se originará una disolución sobresaturada cuando un disolvente contenga una cantidad de soluto superior a su solubilidad, a temperatura ambiente. La solubilidad de casi todas las sustancias sólidas en líquidos aumenta con la temperatura y está ligada al calor de disolución, que es el que se absorbe o desprende cuando se disuelve un sólido. Al disolver un sólido en un líquido se desencadenan dos procesos: – Ruptura de la red cristalina, que es un proceso endotérmico o, lo que es lo mismo, necesita energía para que esa ruptura se produzca. – Hidratación o posible combinación entre soluto y disolvente. Las partículas se rodean de moléculas de agua en un proceso exotérmico, es decir, en el que se libera energía. Por tanto, en una disolución, el efecto térmico es la suma de los dos cambios energéticos, por lo que si el que predomina es el exotérmico se calentará, mientras que si el que predomina es el endotérmico se enfriará. Si este calor de disolución se multiplica por el peso molecular del soluto se obtiene el calor molar de disolución de la combinación.

Disolución de gases. Ley de Henry En términos generales, aunque todos los gases son parcialmente miscibles en los líquidos, su solubilidad es relativamente baja y depende de tres factores: la naturaleza del gas, la temperatura de la disolución y la presión que ejerce el gas sobre la disolución. El hidrógeno, el oxígeno y el nitrógeno se disuelven mal en agua y forman disoluciones en las que las moléculas permanecen igual que antes de formar parte de la disolución. Sin embargo, en los gases muy solubles, como el NH3 y HCl, al formar parte de una disolución, se originan una serie de reacciones químicas que hacen que las propiedades de la disolución sean diferentes de las del soluto y de las del disolvente aislados. Este tipo de disoluciones es muy impor-

Química de disolución

121

tante para la vida en el mar, ya que los animales marinos dependen, entre otros elementos, del oxígeno disuelto. Según la ley de Henry, la solubilidad es directamente proporcional a la presión del gas sobre la disolución cuando la temperatura es constante.

Formas de expresar la concentración Las propiedades de una disolución dependen en gran medida de la composición, tanto en lo que se refiere a la clase de sustancias que la forman como en cuanto respecta a sus cantidades relativas o, lo que es lo mismo, a su concentración (concentración se define como la relación que existe entre las cantidades de soluto y de disolvente de dicha disolución). La composición de una disolución puede expresarse de diferentes formas, que se exponen a continuación.

Concentración centesimal La concentración se expresa en forma de porcentaje, señalando cuánta masa de soluto se encuentra presente en 100 gramos de disolución: C (%) = (peso de soluto/peso disolución) · 100

Molaridad Es el número de moles o moléculas-gramo de soluto que contiene un litro de disolución: M = n/V

M = molaridad en moles/litro n = número de moles V = volumen de disolución en litros

El número de moles es la cantidad de gramos de la sustancia dividido entre la masa molecular expresada en gramos (mol). Una disolución 1 molar (1M) contiene 1 mol de soluto en un litro de disolución; una disolución 2 molar (2M) contiene 2 moles de soluto en 1 litro de disolución, etc.

Normalidad La normalidad de una disolución se define como el número de equivalentes-gramo de soluto en 1 litro de disolución. El equivalente gramo es el número de gramos igual al peso equivalente químico, que es, a su vez, el cociente entre el peso atómico o molecular y la valencia de un determinado compuesto: N = ne /V

N = normalidad ne = número de equivalentes V = volumen de la disolución en litros

n e = m/eq

m = cantidad de soluto en gramos eq = equivalente – gramo

eq = peso atómico/valencia = peso molecular/valencia = = mol/v (valencia)


122

QUÍMICA

____________________________________________________________________________________________________

n e = m/(mol/v) = m.v/mol como m/mol = n (número de moles) ne = n . v y por tanto N = n . v/V en donde n/V = molaridad (M) luego N = M · v La normalidad es igual a la molaridad por la valencia.

Molalidad Es el número de moles de soluto por kilogramo de disolvente. Ml = n/Md Ml = molalidad n = número de moles del soluto Md = masa en kilogramos de disolvente

Fracción molar La fracción molar de un soluto es el cociente entre el número de moles del soluto y el número total de moles de la disolución (soluto y disolvente: ns + nd ): X s = moles del soluto (ns )/moles de soluto (ns ) + + moles del disolvente (nd ) La fracción molar del disolvente se define de forma análoga: X d = moles de disolvente (nd )/moles de soluto (ns ) + + moles de disolvente (nd )

Coeficiente de reparto Cuando una sustancia actúa como soluto y se disuelve en dos líquidos no miscibles entre sí, este soluto se reparte en los líquidos según cierta proporción determinada por el llamado coeficiente de reparto (K), que corresponde a: K = solubilidad del disolvente 1/ solubilidad del disolvente 2

Propiedades coligativas de las disoluciones Muchas propiedades de las disoluciones dependen únicamente del número de partículas presentes, es decir, de la concentración del soluto. Las propiedades coligativas más importantes son: la presión de vapor de las disolu-

ciones, la temperatura de ebullición, la temperatura de congelación y la presión osmótica.

Presión de vapor. Ley de Raoult Al igual que en el estudio de los gases se introduce el concepto de gas ideal, al estudiar las disoluciones se utiliza la noción de disolución ideal. Fue François Raoult quien enunció la ley que afirma que: la presión parcial de vapor de un componente de una disolución, a cualquier temperatura, es igual al producto de la fracción molar del componente por su presión de vapor en estado líquido puro. De forma análoga, se puede decir que la disminución de la presión de vapor del disolvente es proporcional a la fracción molar del soluto. En una disolución compuesta por dos líquidos volátiles A y B, si la presión de vapor del cuerpo A es PoA , su fracción molar es XA y las presiones de vapor parcial PA , la ley de Raoult se expresaría: PA = XA . P Ao para el segundo compuesto se expresaría: PB = X B . P o B La presión del vapor total de la disolución será la suma de las presiones parciales (ley de Dalton): P = XA · P Ao + X B . P Bo Cuando el soluto no es volátil (caso de disolución de un sólido), la presión total está determinada únicamente por la del disolvente. Según la ley de Raoult, si Po es la presión de vapor del agua pura, XA la fracción molar del agua disuelta y P la presión de vapor de la disolución: P = XA P o Como en una disolución las fracciones molares de todos sus elementos han de ser 1, si Xs es la fracción molar del soluto: X A = 1 – Xs y, por tanto, P = Po (1 – Xs ) → Po – P = Xs . Po . P o – P = ∆P, variación de presión de vapor Si sustituimos el valor de la fracción molar: Xs = ns /(ns + nd) ∆P = ns /(ns + nd) . Po

Variación de los puntos de fusión y ebullición: ebulloscopia y crioscopia La disminución de la presión de vapor debida al soluto afecta directamente a los puntos de fusión (que disminu-


__________________________________________________________________________________________

yen) y ebullición (que aumentan). Por tanto, si la variación en los puntos de fusión y ebullición depende de la molalidad de la disolución, se podrá determinar el peso molecular del soluto, si se miden el punto de congelación o el de ebullición de la disolución: Ml = (moles soluto/g disolvente) . 1.000 g moles = gramos /peso molecular Por otra parte, el punto de ebullición de una disolución es superior al del disolvente puro y la diferencia se denomina elevación del punto de ebullición. Como consecuencia de la ley de Raoult, se deduce que la elevación del punto de ebullición es proporcional a la molalidad y por tanto: ∆te = Ml . Ke donde te es la elevación del punto de ebullición, Ke es la constante ebulloscópica (elevación molal del punto de ebullición) y Ml es la molalidad. Para el descenso del punto de congelación se sigue un procedimiento análogo, ya que es directamente proporcional a la concentración molal de la disolución: ∆tc = Ml . Kc donde K c es la constante crioscópica. Se pueden utilizar los enunciados anteriores y se obtendrá la expresión: ∆t = Kc . [gramos soluto · 1.000/(peso molecular · · gramos disolvente)]

Ósmosis y presión osmótica La ósmosis es un proceso mediante el cual un disolvente pasa a través de una membrana semipermeable. Las membranas semipermeables se caracterizan por permitir que un componente de la disolución (disolvente) pase a través de ellas, pero impiden el paso del otro componente (soluto). Este tipo de membranas pueden ser de origen vegetal, animal o sintéticas. Al separar dos concentraciones de disoluciones diferentes mediante una membrana semipermeable, desde la disolución más diluida fluye el disolvente hacia la disolución más concentrada, con el fin de igualar las concentraciones. La diferencia de niveles determina la presión osmótica, que es la presión que ejercen las disoluciones,

Química de disolución

123

debida al contacto de las partículas del soluto con las paredes del recipiente que las contiene. Dado que el comportamiento de las disoluciones es comparable al de los gases perfectos, para determinar la presión osmótica se puede deducir una expresión análoga a la de los gases ideales. πV = nRT

π es la presión osmótica V el volumen de la disolución n el número de moles del soluto R la constante de los gases (R = 0,082 atmos l/mol ºK) T la temperatura absoluta π = nRT/V

Como n = masa del soluto (m)/masa molecular (Mm) π V = (m/Mm) . R . T → Mm = (m/π . V) . R . T La presión osmótica es directamente proporcional a la temperatura para concentraciones constantes. De igual forma, será directamente proporcional a la concentración de la disolución cuando la temperatura sea constante. Por tanto, las disoluciones de igual temperatura y concentración poseen presiones osmóticas iguales. Los fenómenos osmóticos desempeñan un papel muy importante en diversas funciones vitales de los organismos vivos, como en los intercambios de sustancias metabólicas entre las células y el medio que las rodea. También, las sustancias nutritivas y el agua que necesitan las plantas son absorbidas por ósmosis.

_ Preguntas de repaso 1. En un litro de disolución hay 3 gramos de hidróxido sódico. ¿Cuál será la molaridad de dicha disolución? 2. ¿Cuál es la composición centesimal de una disolución de 60 gramos de cloruro sódico en un litro de agua? 3. Calcular el número de equivalentes gramo de hidróxido sódico que hay en 15 litros de una disolución, si la concentración de esa sustancia es 2 normal.


REACCIONES QUÍMICAS

O HN

O

N

N CH3

Ecuaciones químicas y cálculos estequiométricos Las reacciones químicas son transformaciones de unas sustancias en otras. En este proceso químico, los elementos o compuestos iniciales, denominados reactivos o reactantes, sufren una redistribución en su estructura atómica a través de varios mecanismos, para dar lugar a otras sustancias de diferente naturaleza, denominadas productos de reacción. Para esquematizar las reacciones químicas se utilizan representaciones escritas denominadas ecuaciones químicas, que constan de dos miembros separados por una flecha, generalmente orientada de izquierda a derecha, que indica el sentido en el que se produce la reacción correspondiente. Por tanto, las ecuaciones químicas son igualdades cuyo primer miembro corresponde a las fórmulas de los reactivos y en cuyo segundo término, situado a la derecha, se consignan las fórmulas de los productos: Reactivos → Producto Si existe más de un reactivo o se forma más de un producto, las fórmulas de estos reactivos o de los productos formados se separan mediante signos de adición: Reactivo A + Reactivo B → Producto A + Producto B HCl + Na OH → Cl Na + H2O Las reacciones que tienen lugar en un solo sentido se denominan irreversibles, mientras que las que se producen en los dos sentidos se designan como reacciones reversibles, en las que los términos se separan mediante dos flechas de sentido contrario (equilibrio). Reactivo 1 + Reactivo 2 ↔ Producto 1 + Producto 2 C + O2 ↔ CO2 Una vez consignadas las fórmulas de reactivos y productos, como la ecuación ha de cumplir la ley de conser-

CH3

N

vación de masas, se debe comprobar que el número de átomos que hay de cada elemento es el mismo en ambos miembros de la igualdad, ya que de no ser así será necesario ajustar la ecuación. Ajustar una ecuación química consiste en encontrar el número mínimo de moléculas de cada una de las sustancias que intervienen en el proceso, para que se verifique la ley de conservación de masas. Se utilizan coeficientes (que son esos “números mínimos de moléculas”) que se colocan delante de cada fórmula. Por ejemplo, el metano, CH 4, arde en presencia de oxígeno, O 2, formando dióxido de carbono, CO 2, y agua, H2O: CH4 + O2 → CO2 + H2O Esta ecuación no está correctamente ajustada, ya que tiene un mayor número de átomos de hidrógeno en el reactivo que en el producto, mientras que con el oxígeno ocurre lo contrario. Por tanto, se ajusta la ecuación de la siguiente manera: CH4 + 2O2 → CO2 + 2H2O En este caso, el número de átomos de hidrógeno y oxígeno que aparecen en los dos miembros de la ecuación es equivalente, y los coeficientes indican que para que arda una molécula de metano, son necesarias 2 moléculas de oxígeno, y se formará una molécula de CO2 y dos de agua. Por tanto, en cualquier reacción, la suma de los subíndices de cada elemento por sus coeficientes es equivalente en los dos miembros de la ecuación. En ciertos procesos químicos es necesario especificar el estado físico de las sustancias, que se indica entre paréntesis a la derecha de las fórmulas. Además de los estados sólido (s), líquido (l) y gaseoso (g), se suele indicar si la sustancia se encuentra disuelta en agua (a). CaCO3 (s) + 2HCl (a) → CaCl2 (a) + CO2 (g) + H2O (l) CH4 (g) + 2O2 (g) → CO2 (g) + H2O (l)

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


__________________________________________________________________________________________

Zn + Ag+ → Zn2+ + Ag Zn (s) + 2Ag+ (a) → Zn2+ (a) + 2Ag (s) Por otro lado, el número de moléculas que entra a formar parte de una reacción tiene que ser un número entero. Cuando se utilizan coeficientes racionales, se aplica el criterio de Avogadro, según el cual cada fórmula está representada por un mol.

Cálculos estequiométricos La estequiometría es la parte de la química que relaciona las cantidades y proporciones de productos y reactivos que intervienen en una reacción. De una ecuación química ajustada pueden deducirse los volúmenes y masas de los reactivos y los productos. Los problemas estequiométricos plantean situaciones en las que se puede calcular la cantidad de una sustancia cualquiera que participa en una reacción si se conoce la cantidad de alguna de las otras sustancias participantes. Estos cálculos reciben el nombre de estequiométricos. Las cantidades de reactivos y productos que intervienen en el proceso pueden expresarse en gramos, moles, litros, moles por litro, número de moléculas, átomos, moléculas, etc. Sobre esta base, se pueden efectuar diferentes cálculos cimentados en las ecuaciones químicas: – Cálculos peso-peso. Si se conoce el peso de una sustancia de la ecuación, puede hallarse el de otra. – Cálculos peso-volumen. En el caso de los gases, puede darse su cantidad en volumen, por lo que si se conoce el peso de una de las sustancias, puede hallarse el volumen del gas. – Cálculos volumen-volumen, entre al menos dos gases. Cuando se conoce la ecuación química de un proceso se puede seguir un modelo para la solución de todos los problemas estequiométricos. Se resuelve en varios pasos, que son los siguientes: 1. Ajustar la ecuación. 2. Determinar la masa molecular de las sustancias implicadas en el problema. 3. Convertir la cantidad de sustancias dadas a moles. 4. Convertir los moles de las sustancias dadas en moles de las sustancias que se desean.

125

5. Convertir los moles de las sustancias deseadas en las unidades que se precisen.

Equilibrio químico Una vez iniciada una reacción química, puede desarrollarse hasta que se agote uno de los reactivos, o bien puede desarrollarse hasta un cierto punto en que permanece invariable aunque existan reactivos. En el segundo caso se dice que el sistema está en equilibrio. Inicialmente, los reactivos se combinan rápidamente para formar producto, hasta que la cantidad de productos es lo suficientemente grande como para que reaccionen entre sí volviendo a formar los reactivos de partida. Esta situación es un estado de equilibrio. El equilibrio se alcanza cuando los productos vuelven a transformarse en reactivos con la misma velocidad que los reactivos se transforman en productos, es decir, el equilibrio es una reacción reversible en la que las concentraciones de los productos y reactivos no varían. En la reacción aA + bB ↔ cC + dD en el instante inicial sólo hay reactivos y la velocidad en que reaccionan es máxima; va disminuyendo a medida que disminuyen los reactivos. En la formación de los productos, la velocidad, nula en un principio, aumenta en la medida en que aumentan dichos productos. Como la velocidad de los reactivos disminuye y la de los productos aumenta, llega un momento en el que las dos velocidades se igualan, alcanzándose el equilibrio químico:

Velocidad

Otro tipo particular de ecuaciones químicas es el que se utiliza para representar las reacciones en las que intervienen iones, donde, además, hay que igualar eléctricamente ambos miembros para que se cumpla la ley de conservación de carga, lo que implica que la suma algebraica de las cargas positivas y negativas sea equivalente en ambos miembros de la ecuación:

Reacciones químicas

V1

Reacción directa aA + bB → cC + dD Equilibrio

V2

Reacción inversa cC + dD → aA + bB Tiempo

Experimentalmente se ha comprobado que en el equilibrio, el producto de las concentraciones molares de los productos elevadas a la potencia igual a sus coeficientes estequiométricos, dividido por el producto de las concentraciones molares de los reactivos elevadas a la potencia correspondiente a sus coeficientes estequiométricos, es constante para una temperatura dada. Esta constante, K, tiene un valor fijo para cada temperatura, independientemente de los valores absolutos de las concentraciones molares y no varía en presencia de un catalizador, puesto que el catalizador sólo afecta al tiempo necesario para alcanzar el equilibrio: Kc = [C]c[D]d/[A]a[B]b


126

QUÍMICA

____________________________________________________________________________________________________

La constante de equilibrio también se puede expresar en función de las presiones parciales y de las fracciones molares: PcC · PdD Kp = ———— PaA · PbB Kc = Kp (1/RT)∆n

XcC · XdD Kx = ———— XaA · XbB Kp = Kx P∆n

∆n es el incremento de moles de la reacción, Kp y Kc son función sólo de la temperatura y Kx depende además de la presión. Las tres constantes de equilibrio coinciden sólo cuando no hay variación en el número de moles (∆n = 0). También se relaciona con la energía libre de Gibbs mediante la expresión: ∆Gº = –RTlnKp

Equilibrios de ácido-base

Principio de Chatelier Si en un sistema en equilibrio varían las condiciones, la reacción se ajusta a la nueva situación y se establece un nuevo equilibrio, es decir, si en un sistema en equilibrio actúa una causa externa (se modifican la presión, la temperatura o la concentración), el sistema evoluciona en el sentido de contrarrestar dicha causa. Con base en el principio de Le Chatelier, a continuación se expone el efecto que producen distintos factores externos sobre un sistema en equilibrio. Efecto de la concentración sobre el equilibrio. Si en una reacción reversible se aumenta la concentración de las sustancias participantes en el equilibrio, la reacción se verificará en la dirección que tiende a disminuir su concentración. Sea la reacción: aA + bB ↔ cC + dD – Si se aumenta la concentración [A] y/o [B] Kc = [C]c[D]d/[A]a[B]b el exceso A o B reacciona para formar más C y D y alcanzar de nuevo el equilibrio. La reacción se desplaza hacia la derecha (→). – Si se disminuye [A] y/o [B], el equilibrio se desplaza hacia la izquierda (←). – Cuando se aumenta el producto [C] y/o [D], el equilibrio se desplaza hacia la izquierda, mientras que si se disminuye alguno de los elementos de este miembro de la ecuación, se desplaza hacia la derecha y disminuye [C] y/o [D]. Efecto de la temperatura sobre el equilibrio. En una reacción en la que se libera o absorbe calor, el equilibrio se puede desplazar adicionando o eliminando energía calorífica al sistema. Si una reacción química en sentido directo es endotérmica y en el inverso es exotérmica: aA + bB ↔ cC + dD

si aumenta la temperatura, el sistema absorbe calor, y para contrarrestar este exceso de temperatura reacciona desplazándose hacia la izquierda, favoreciendo la reacción endotérmica. Si se disminuye la temperatura, se produce el efecto contrario. Efecto de la presión sobre el equilibrio. Las variaciones de presión sólo afectan a los equilibrios en los que hay alguna variación de volumen en la reacción e interviene algún gas. Como a mayor presión las sustancias se comprimen y disminuyen su volumen, si aumenta la presión el equilibrio se desplaza hacia donde haya menos moles gaseosos; por el contrario, si la presión disminuye, se desplaza el equilibrio hacia donde hay más moles gaseosos.

∆H > O

Concepto de ácido-base No hay una única teoría que pueda explicar de forma convincente el concepto de ácido y de base. A continuación se exponen una serie de teorías sobre dicho concepto. Teoría de Arrhenius. El primer intento teórico de justificar las propiedades ácidas y básicas se debe al químico sueco Svante Arrhenius, quien, trabajando con disoluciones de electrolitos en agua, estableció que ésta, además de actuar como agente dispersante, hacía que los electrolitos se disociaran en iones negativos y positivos. En el caso de los ácidos, al disociarse aparecían iones de hidrógeno, H+, mientras que en las bases aparecían iones OH–. Por tanto, según Arrhenius: – Ácido es toda sustancia química que en disolución acuosa cede iones H+ (protones). – Base es toda sustancia química que en disolución acuosa cede iones OH– (oxidrilo, hidroxilo o iones hidróxido). Son ácidos sustancias como HCl, HNO3 , H2 SO4 , etc. (ácido) HCl → H+ + Cl– (base) (ácido) HNO3 → H+ + NO3 – (base) Teoría de Brönsted y Lowry. La teoría de Arrhenius limitaba el carácter básico a los hidróxidos, cuando la realidad pone de manifiesto la existencia de sustancias, que no son hidróxidos, con carácter básico, como es el caso del amoniaco, que no contiene iones OH–. Por otra parte, limitaba el concepto de disolvente al medio acuoso, por lo que era necesario ampliarla. Estos inconvenientes desaparecieron mediante la teoría que, de forma independiente, propusieron Brönsted y Lowry y según la cual: – Ácido es toda sustancia que en disolución cede iones H+. – Base es toda sustancia que en disolución acepta H+.


__________________________________________________________________________________________

De esta forma se puede decir que las reacciones ácidobase consisten en la transferencia de iones H+ de un dador, ácido, a un aceptor, base. Los ácidos de Brönsted y Lowry son los mismos que los ácidos de Arrhenius: (ácido) HCl → H+ + Cl– (base) (ácido) HNO3 → H+ + NO3 – (base) Además de los hidróxidos, son también bases sustancias como el amoniaco o las aminas:

Fuerza relativa de ácidos y bases El grado de ionización o disociación, α, o porcentaje del ácido (o base) disociado, es una medida de la fortaleza de los ácidos o de las bases: α = número de moles ionizados/número total de moles. Según esto:

127

Antes de la disociación, el número de moles era: 1

0

0

1-α

α

α

En el equilibrio:

Si en vez de un mol se parte de una concentración inicial de ácido = C, las concentraciones en el equilibrio serán: [HA] = C(1 - α) [A–] = C α [H+ ] = C α

(base) OH– + H+ → H2 O (ácido) (base) NH3 + H+ → NH4+ (ácido) En esta teoría no cabe hablar de ácidos y bases como entes aislados, sino de pares ácido-base, ya que se asigna a cada ácido una base conjugada y a cada base un ácido conjugado. El ion cloruro es la base conjugada del ácido clorhídrico, el ion amonio es el ácido conjugado de la base amoniaco.

Reacciones químicas

La constante de equilibrio será, por tanto: K a = C α · C α / C (1 - α); Ka = C α2 /(1 - α) Las reacciones de neutralización de los ácidos y de las bases son reacciones de sus iones para llegar a la formación de agua. Por tanto, las reacciones de neutralización se pueden escribir como la reacción suma de las semirreacciones del ácido y la base. K=

[ácido1 ][base2 ] = Ka Kb [ácido2 ][base1 ]

Ácido1 ↔ base1 + H+ [base1 ][H+ ] Ka = [ácido1 ]

Considerada como una reacción irreversible, Ka Kb son infinitos. Ello implica que las reacciones de ácidos fuertes (con las bases), y de las bases fuertes (con los ácidos), son siempre completas. En general, es posible predecir el desplazamiento de un equilibrio ácido-base: el equilibrio estará desplazado siempre que reaccione un ácido con la base conjugada de un ácido más débil. Los ácidos que, al disociarse, sólo pueden proporcionar un ion hidrógeno reciben el nombre de ácidos monopróticos. Los ácidos que pueden disociarse dando más de un protón reciben el nombre de ácidos polipróticos, que sufren disociaciones sucesivas:

De forma análoga, para una base se determina su constante de basicidad,

HSO4 → H+ + HSO4– HSO4– → H+ + SO42–

– Ácidos fuertes son los que presentan una disociación prácticamente total. Son ácidos fuertes, entre otros, el ácido sulfúrico, el nítrico, el clorhídrico, el perclórico, etc. – Los hidróxidos de los metales alcalinos son bases fuertes y también se encuentran disociados totalmente. En general, cada sistema ácido-base conjugado es un equilibrio cuya constante, para un ácido, recibe el nombre de constante de acidez, Ka :

Ionización del agua

Base2 + H+ ↔ ácido2 [ácido2 ] Kb = [base2 ][H+ ]

La autoionización del agua se puede considerar como un equilibrio ácido-base:

El grado de ionización y la constante de equilibrio se relacionan de la siguiente forma:

H2 O + H2 O ←→ H3 O + + OH– ácido1 base2 ácido2 base1

Si se parte de un mol de un ácido HA, la disociación se realizará: HA ↔ A– + H+

Por este motivo, el agua puede actuar como dadora de iones H+, frente a las bases, o como aceptora de iones H+ , frente a los ácidos.


128

QUÍMICA

____________________________________________________________________________________________________

HCl + H 2 O ←→ Cl– + H3 O + ácido base

En el agua pura: [H+ ] = [OH–] = 10–7, y su pH = 7. En general, una disolución se considera:

NH3 + H 2 O ====== NH4+ + OH– base ácido

Ácida: [H3 O+] > 10–7; pH < 7 Básica: [H3 O+]< 10–7; pH > 7 Neutra: [H3 O+] = 10–7; pH = 7

Las sustancias que, como el agua, presentan este comportamiento, reciben en nombre de anfóteras, anfipróticas o anfolitos. Son sustancias de este tipo los iones intermedios de la ionización de ácidos polipróticos y ácidos con más de un hidrógeno. ácido H3 PO4

base ácido H2 PO4– ↔ HPO42– base | | ácido Anfóteras

base PO43–

De la misma forma que se define el pH, se define también el pOH: pOH = –log [OH–]. Es evidente que pH + pOH = 14 Los límites del pH y pOH en disoluciones acuosas vienen dados por el máximo y mínimo valor de la concentración de iones [H3 O + ]. El máximo valor viene dado por la concentración de agua pura [H2 O]= 1.000/18 = 55,5 molar. Por tanto pH = –log (55,5) = –1,74. Este es el motivo por el que, en disoluciones acuosas, la escala de pH tiene por límites los valores entre –1,74 y 15,74.

Concepto de pH (potencial de hidrógeno) El agua puede comportarse como ácido o como base, cediendo o captando protones. En disoluciones acuosas, las concentraciones de los iones H3 O + y OH– están ligados por el producto iónico del agua y, por tanto, con expresar una de estas concentraciones, la otra queda automáticamente determinada. Normalmente se suele utilizar la concentración de iones H3 O +, que varía entre los límites: [H3 O + ] = 1 para una disolución 1N de un ácido fuerte [H3 O + ] = 10–14 para una disolución 1N de un ácido fuerte Para expresar las concentraciones mediante números sencillos se introdujo el concepto de pH, definido como menos el logaritmo decimal de la concentración de iones H3 O + (o ion H+ en la notación simplificada). Es una medida de la acidez de la disolución: +

pH = –log [H3 O ]

Ejemplo. Determinar el pH de una disolución cuya concentración de iones H+ es 0,02 mol/l. pH = –log [H+ ] = –log (2 · 10–2) = 1,69 Las sustancias orgánicas que presentan diferente coloración en función del medio, ácido o básico, en el que se encuentren, es decir, que tienen la propiedad de variar su color al modificarse el pH de la disolución donde se encuentran, se llaman indicadores. En general son ácidos o bases débiles, caracterizados por presentar diferente color el ácido que su base conjugada. Esta diferencia de coloración es la base de su utilización en las reacciones ácido-base. Un cambio de color indica el punto final de la reacción. Los indicadores más utilizados son los que se recogen en el recuadro inferior. Los indicadores utilizados de forma individual sólo pueden determinar aproximadamente la zona de pH en la que se produce el cambio de color, por lo que si

Indicadores Indicador

Medio ácido

Medio básico

Intervalo de pH del cambio de color

Azul de timol Naranja de metilo Rojo de metilo Tornasol Azul de bromotimol Rojo neutro Rojo cresol Fenolftaleína Timolftaleína Amarillo de alizarina Nitramina

Rojo Rojo Rojo Rojo Amarillo Rojo Amarillo Rojo Incoloro Amarillo Incoloro

Amarillo Amarillo Amarillo Azul Rojo Amarillo Rojo Azul Azul Lila Pardo-anaranjado

1,2-2,8 3,2-4,4 4,2-6,3 4,5-8,3 6,0-7,6 6,8-8,0 7,2-8,8 8,5-10,0 9,2-10,5 10,1-12,0 11,0- 1 3 , 0


__________________________________________________________________________________________

se desea hacer un seguimiento continuado de la variación de pH de una disolución, habrá que prepararse una mezcla capaz de cubrir un intervalo más amplio. No obstante, este método no es muy preciso y se recurre a técnicas instrumentales, basadas en los potenciales de electrodo, con los que se obtienen medidas más fiables.

Volumetrías ácido-base El análisis volumétrico es una de las técnicas utilizadas para determinar la concentración o riqueza de un ácido o de una base existentes en una disolución dada. Para ello se hace reaccionar una disolución problema con una disolución de normalidad, N, conocida. Esta disolución patrón se vierte, gota a gota, por medio de una boreta sobre la disolución problema, a la que se somete a agitación. El punto final de la reacción lo indica el viraje del color del indicador utilizado. En dicho punto se suspende el goteo y se lee la cantidad de disolución gastada. Si Np y Vp son la concentración y el volumen de la disolución patrón y Nx y Vx los de la disolución problema, se puede obtener la concentración de la disolución problema:

Reacciones químicas

129

La constante de hidrólisis es también la relación entre el producto iónico del agua y la constante de acidez del ácido del anión. En este tipo de disoluciones, la concentración de H3 O + es inferior a la del agua pura, por lo que la disolución será básica al presentar el medio un pH superior a 7. Sal de ácido fuerte y base débil. Las sales que provienen de ácidos fuertes y bases débiles presentan hidrólisis ácida, es decir, la hidrólisis de una sal de base débil y ácido fuerte da lugar a una disolución que tendrá un pH ácido. Ejemplo. El cloruro de amonio, NH4 Cl, se disocia al disolverse en agua según la reacción: NH4 Cl ↔ NH4+ + Cl– Los iones cloruro tienen carácter básico muy débil (base conjugada de un ácido, HCl), por lo que no interaccionan con el agua. Los iones amonio, sin embargo, dado su carácter ácido (ácido conjugado de una base débil como es el amoniaco), sí interaccionan con el agua. NH4+ + H2 O ↔ NH3 + H 3 O + dando un exceso de iones hidrógeno. La constante de equilibrio, constante de hidrólisis en este caso, es:

N p · Vp = Nx · Vx → Nx =

Np · Vp Vx

Hidrólisis El término hidrólisis significa ruptura por el agua. Al disolver una sal en agua, ésta se disocia en sus iones, que pueden presentar características ácidas o básicas y reaccionar con el agua. Sal de ácido débil y base fuerte. Las sales que provienen de ácidos débiles (carbonatos, bicarbonatos, acetatos, cianuros, etc.) y bases fuertes tienen hidrólisis básica, es decir, la hidrólisis de un ácido débil y una base fuerte dan lugar a una disolución que tendrá un pH básico. Ejemplo. Al disolver acetato sódico, CH3 - COONa en agua, se disocia totalmente en los iones Na+ y los aniones acetato CH3 -COO– CH3 - COONa ↔ CH3 -COO– + Na+ El ion sodio tiene carácter ácido muy débil, ácido conjugado del NaOH, y no interacciona con el agua. El ion acetato, como procede de un ácido débil, será una base fuerte que reaccionará con el agua con arreglo a la reacción: CH3 -COO– + H2 O ↔ CH3 -COOH + OH– [CH3 -COOH] · [OH–] La constante de hidrólisis es Kh = [CH3 -COO–]

Kh =

[NH3 ] · [H3 O +] [NH4+]

La disolución tendrá una concentración de iones H3 O + , mayor que la del agua pura y por tanto será básica. Sal de ácido débil y base débil. Las disoluciones de sales de ácido débil y base débil, como el acetato de amonio, presentan una doble hidrólisis. El carácter ácido o básico de estas disoluciones dependerá de la fortaleza relativa de ambos iones. Estos ácidos tienen poca tendencia a captar iones procedentes de la ionización del agua y por tanto tienden a dar lugar a disoluciones neutras, débilmente básicas o ácidas, según el grado de hidrólisis de los iones originados por la sal. Sal de ácido fuerte y base fuerte. Las disoluciones de sales de ácido fuerte y base fuerte, como el cloruro, son neutras, no se produce la hidrólisis y por tanto sus iones no reaccionan con el agua.

Teoría de Lewis de ácidos y bases Conocido el comportamiento de los ácidos y de las bases, y definido el enlace covalente coordinado (formación de enlaces por compartición de electrones), Lewis propuso que las reacciones ácido-base consisten en el proceso de transferencia de pares electrónicos entre un dador, base, y un aceptor, ácido. Por tanto: – Ácido es toda sustancia capaz de aceptar un par de electrones. – Base es toda sustancia capaz de ceder un par de electrones.


130

QUÍMICA

____________________________________________________________________________________________________

Un ejemplo del comportamiento ácido o básico de las sustancias lo constituye el amoniaco y el trifluoruro de boro. El comportamiento básico del amoniaco es debido a su capacidad de ceder un par electrónico de uno de sus orbitales, dando lugar a un enlace covalente coordinado. El trifluoruro de boro es el ácido, por ser capaz de aceptar un par de electrones en uno de sus orbitales vacíos. BF3 + :NH3 ↔ F3 B : NH3 Las reacciones ácido base de Brönsted y Lowry quedan justificadas de forma similar: H + + : OH– ↔ H : OH La teoría de Lewis amplía considerablemente el número de sustancias ácidas y básicas.

Equilibrios de oxidación-reducción Conceptos de oxidación-reducción Desde el punto de vista clásico, oxidación es la reacción química en la que se combina una sustancia con el oxígeno, es decir, existe una ganancia de oxígeno, y reducción es la reacción química en la que se produce una disminución del contenido de oxígeno de una sustancia. La oxidación y la reducción son procesos simultáneos, es decir, siempre que se produce una reducción tiene lugar una oxidación y viceversa. El compuesto que gana el oxígeno es el reductor, y el que lo pierde es el oxidante. C + O2 → CO2 Oxidación ZnO + C → Zn + CO Reducción Como este concepto de oxidación y reducción es muy restringido, se amplió a otros procesos en los que no participa el oxígeno, pero sí hay un intercambio de electrones. Por tanto, las reacciones de oxidación-reducción son procesos en los que existe una transferencia de electrones entre diferentes especies químicas (ion, átomo, molécula). Una oxidación es una reacción en la que una sustancia cede electrones, denominándose agente reductor a la especie química que cede o pierde los electrones. Una reducción es una reacción en la que una sustancia acepta uno o más electrones. El agente oxidante es la especie química que capta o gana electrones. El equilibrio entre oxidante y reductor es : Oxidante1 + reductor2 ↔ reductor1 + oxidante2 El oxidante2 es la forma oxidada del reductor2, y el reductor1 es la forma reducida del oxidante1.

Oxidante1 — gana e– → reductor1 Reductor2 — pierde e– → oxidante2 Estos equilibrios son similares a los equilibrios ácido-base. De igual forma que un ácido al ceder un protón da una base conjugada y una base al captar dicho protón da su ácido conjugado, un oxidante cuando gana electrones pasa a ser su forma reducida, y el reductor al perder electrones se convierte en su forma oxidada. A este par oxidante-reductor se le denomina par redox.

Número de oxidación Debido a los electrones ganados o cedidos por un compuesto, cada átomo de dicho compuesto se caracteriza por un estado de oxidación con respecto a dicho átomo aislado, también denominado número de oxidación. Por tanto, se define como número de oxidación la carga formal asignada a ese átomo según unas reglas establecidas: 1. El estado de oxidación de una especie química monoatómica es igual a la carga del átomo. 2. En los elementos libres, cada átomo tiene un número de oxidación igual a cero. 3. El número de oxidación del hidrógeno en sus compuestos es +1, salvo en los hidruros metálicos que es –1. 4. El estado de oxidación del oxígeno en todos sus compuestos es –2, excepto en los peróxidos, que es –1, y en las combinaciones con el flúor, que es +2. 5. El número de oxidación de los metales alcalinos es +1 y el de los alcalinotérreos es +2. 6. En los haluros, el número de oxidación es –1 (aunque cuando se combinan con el oxígeno o con un halógeno más electronegativo puede ser positivo). 7. La suma algebraica de los estados de oxidación positivos y negativos de los átomos de un compuesto es cero y si se trata de un ion, es igual a la carga del ion. Con estas reglas se puede calcular el número de oxidación (n.o.) de cualquier elemento de un compuesto. Por ejemplo, para el ClO3–, el número de oxidación será: n.o. (ClO3–) = n.o. (Cl) + 3 · n.o. (O) = –1; n.o. (Cl) = –1 – (3 · –2) = –1 – (–6) = +5 Un elemento se oxida cuando aumenta su número de oxidación y se reduce cuando disminuye.

Ajuste de reacciones redox. Método del ion-electrón El método del ion-electrón es el más utilizado para el ajuste de las reacciones de oxidación-reducción; se basa en el hecho de que el número de electrones que cede el agente reductor es equivalente al que acepta el agente oxidante. En este método se debe seguir un orden. Se utilizará como ejemplo la reacción:


__________________________________________________________________________________________

MnO2 + HCl → MnCl2 + Cl2 + H2O 1 átomo de Cl

4 átomos de Cl

1. Calcular los números de oxidación de los átomos que aparecen en la reacción, y a partir de ellos determinar qué especies se oxidan y cuáles se reducen: +4 –2

+1 –1

+2 –1

0

+1 –2

MnO2 + HCl → MnCl2 + Cl2 + H2O Reducción

Oxidación

2. Se escriben las semirreacciones del oxidante y del reductor (pero el átomo no se pone aislado, sino que se pondrá la molécula de la que procede. Si es una sal se escribirá el ion al que pertenece): Oxidación

Cl → –1

Cl02

HCl → Cl2

Reducción

Mn → Mn MnO2 → (MnCl2 → Mn2 + Cl–2) MnO2 → Mn2+ +4

+2

3. Se ajusta el número de átomos de las especies, excepto el oxígeno y el hidrógeno: HCl → Cl2 → 2HCl → Cl2

MnO2 → Mn2+

4. Se ajusta el oxígeno, añadiendo para ello H2O en el miembro de la semirreacción donde se da una deficiencia de oxígeno: no se necesita ajustar el n.º de O2 2HCl → Cl2 MnO2 → Mn2+ + H2O ⇒ MnO2 → Mn2+ + 2H2O 5. Se ajusta el hidrógeno, bien en medio ácido o en medio básico. Para hacerlo en medio ácido, se adicionarán protones en el miembro de la semirreacción que tenga deficiencia de hidrógeno. En medio básico, en vez de adicionar protones, se añade H2O y se colocan en el miembro opuesto tantos OH– como protones se necesiten: 2HCl → Cl2 + 2H+ MnO2 → Mn2+ + 2H2O ⇒ MnO2 + 4H+ → Mn2+ + 2H2O 6. Se ajusta la carga de los dos miembros poniendo tantos e– como sean necesarios en el miembro donde hay exceso de carga positiva: 2HCl → Cl2 + 2H+ ⇒ 2HCl → Cl2 + 2H+ + 2e–

carga 0 carga 0 2+

MnO2 + 4H+ → Mn2+ + 2H2O 4+

2+

MnO2 + 4H+ + 2e– → Mn2+ + 2H2O

Reacciones químicas

131

7. Para igualar el número de electrones en las dos semirreacciones se multiplica cada semirreacción por el número adecuado. En el ejemplo no es necesario multiplicar por ningún número, dado que son iguales. 8. Se suman las dos semirreacciones y se simplifican las especies que aparecen en ambos miembros: 2e– 2HCl → Cl2 + 2H+ + ∅ MnO2 + 4H+ + ∅ 2e– → Mn2+ + 2H2O 2H+ + 2HCl + MnO2 → Cl2 + Mn2+ + 2H2O La reacción se pasa de iónica a molecular: 2HCl + 2HCl + MnO2 → MnCl2 + Cl2 + 2H2O 4HCl + MnO2 → MnCl2 + Cl2 + 2H2O 9. Se ajustan, por tanteo, las especies que no intervienen en la reacción (en el ejemplo está ajustada): 4HCl + MnO2 → MnCl2 + Cl2 + 2H2O

Relaciones entre reacciones redox y corriente eléctrica. Procesos electroquímicos Los procesos electroquímicos son reacciones a través de las cuales se puede transformar la energía química en eléctrica o la energía eléctrica en química. Estos procesos son de dos tipos: – Pilas electroquímicas o voltaicas: aprovechan las reacciones redox para dar corriente eléctrica. – Electrólisis: se provocan reacciones redox mediante la corriente eléctrica. Pilas electroquímicas. Las pilas electroquímicas pueden ser galvánicas o electrolíticas. Las galvánicas proporcionan energía eléctrica a partir de energía química. La más sencilla es la de Daniell. En principio, toda reacción de oxidación-reducción se puede separar en dos reacciones parciales, a partir de las cuales se genera la energía eléctrica en una pila. La pila Daniell consiste en dos disoluciones, una de sulfato de cobre y otra de sulfato de zinc. La condición fundamental es que los dos agentes, oxidante y reductor, se encuentren separados para que la transferencia de electrones tenga que verificarse a través de un conductor, que puede ser un puente salino donde hay una disolución conductora de KCl o NaNO3, o mediante un tabique poroso que puede ser de arcilla o porcelana. En la disolución de sulfato de cobre se sumerge una lámina de cobre que se denomina electrodo. En la disolución de sulfato de zinc se pone otro electrodo de zinc metálico. Los electrodos se llaman ánodo y cátodo. En el ánodo se produce la oxidación y en el cátodo, la reduccción. Cuando se conectan los electrodos fluye una corriente a través del conductor exterior.


132

QUÍMICA

____________________________________________________________________________________________________

Voltímetro

Bombilla

Zn

Cu Cátodo

Puente salino Zn2+

Cu2+

Pila Daniell

}

Ánodo

Ánodo: Cl– – 1e– → 1/2 Cl2 ↑ se desprenderá Cátodo: Na+ + 1e– → Na(l) Cl– + Na+ → 1/2 Cl2 + Na ClNa En el caso de efectuarse la electrólisis en disolución acuosa, se obtiene Cl2 en el ánodo y H+ en el cátodo.

Equilibrios de precipitación

Se producen los siguientes procesos:

En el cátodo, semirreacción de reducción: Cu2++ 2e– → Cu y la reacción total: Zn + Cu2+ → Zn2+ + Cu Las pilas se representan mediante diagramas, en los que las líneas verticales designan los límites de las fases. Los puentes salinos se representan mediante doble línea vertical. Por convenio, se escribe el ánodo a la izquierda: Zn | Zn2+ || Cu2+| Cu

+

+

Se rompe la unión de los iones

-

-

+

+

-

Electrólisis. La electrólisis es el proceso contrario al que se produce en una pila galvánica, es decir, se produce energía química a partir de energía eléctrica mediante reacciones redox no espontáneas. La energía necesaria para que se lleven a cabo las reacciones se obtiene aplicando un voltaje a un par de electrodos inertes sumergidos en una disolución. La reacción de electrólisis origina la descomposición de un compuesto en sus elementos. Pueden darse electrólisis de sales, de ácidos y de bases. A continuación, se analiza la electrólisis del cloruro de sodio, que se puede efectuar en disolución acuosa o con cloruro de sodio fundido. En el caso de la electrólisis del cloruro de sodio fundido se obtiene Cl(g) y Na(l), que, al ser menos denso que el NaCl fundido, sube a la superficie.

Se define la solubilidad de un soluto en un disolvente como la cantidad de soluto máximo que puede disolverse en un volumen de disolvente determinado. Una disolución saturada es aquella que se encuentra en equilibrio con un exceso de soluto. Algunos solutos son muy solubles en un determinado disolvente, mientras que otros, como ciertas sales, tienen un valor de solubilidad tan bajo que pueden considerarse insolubles para ciertos procesos químicos. Una sustancia se considera soluble cuando la concentración del soluto es superior a 0,1 M en una solución saturada. Una sustancia es poco soluble cuando la concentración de soluto en una solución saturada es menor que 0,1 M y mayor que 0, 001 M. Una sustancia se considera insoluble cuando la concentración de soluto es inferior a 0,001 M en solución saturada. Cuando una sal se disuelve en agua, se rompe la red cristalina (la unión de los iones). Para ello hay que vencer las fuerzas de atracción entre los iones de carga opuesta o, lo que es lo mismo, es necesario superar la energía reticular de la sal mediante la hidratación (las moléculas del agua rodean a las partículas del sólido que se disuelve en ella):

-

Zn – 2e– → Zn2+

Solubilidad y precipitación

+

electrolítica

+

-

-

+ + -

+ -

Atraídos Cl -

Cuba

+

En el ánodo, semirreacción de oxidación:

Na+

Electrodos

Atraídos

Sal fundida o en disolución

Cuando se mezclan dos disoluciones que contienen iones de una sal insoluble, se produce una precipitación, que consiste en la formación de un sólido, denominado precipitado, dentro del seno de la disolución. La solubilidad de un compuesto depende de varios factores:


__________________________________________________________________________________________

– Temperatura. Como se indicó en párrafos anteriores, para que una sustancia se disuelva es necesaria una energía de hidratación que suele ser menor que la energía reticular, por lo que el proceso, aunque con excepciones, suele ser endotérmico. Este hecho explica que la solubilidad de las sustancias aumente con la temperatura. – Tamaño de los iones. La solubilidad de los compuestos iónicos es, en general, mayor cuanto mayor es la diferencia de tamaño de los iones que lo forman. Los iones más grandes están más próximos dentro de la red cristalina, con lo que aumenta la repulsión entre ellos y por consiguiente disminuirá la energía reticular y aumentará la solubilidad: Tamaño grande → aumenta la solubilidad Tamaño pequeño → disminuye la solubilidad – Densidad de carga. Es la relación entre la carga y el tamaño del ion. Si el ion es grande y la carga pequeña, la densidad es pequeña y favorece la solubilidad, ya que el disolvente puede romper la unión electrostática con mayor facilidad: Pequeña → aumenta la solubilidad Grande → disminuye la solubilidad – Constante dieléctrica del disolvente. La fuerza de atracción entre dos cargas opuestas viene dada por la ley de Coulomb. Si se aumenta la constante dieléctrica, la fuerza disminuye y se disuelve más: Grande → sustancias iónicas muy solubles Pequeña → sustancias iónicas no solubles En el recuadro superior se expone la solubilidad de algunas sustancias.

Reacciones químicas

133

Solubilidad Sales solubles – Todos los iones negativos dan compuestos solubles con los metales alcalinos, + alcalinotérreos, H+ y NH4 . – Los acetatos y nitratos son todos solubles. – Cloruros, bromuros, ioduros (excepto los de Ag+ , Pb2+, Hg2+ y Cu+). – Sulfatos (excepto de Ba2+, Sr2+ y Pb2+ ) . Sales insolubles – Los sulfuros son insolubles, salvo los alcalinos, alcalinotérreos y de amonio. – Carbonatos y fosfatos, salvo los alcalinos y de amonio que son solubles. – Hidróxidos, salvo los compuestos por iones alcalinos, alcalinotérreos, H+ y NH+4.

Ejemplo. Si se disuelve cloruro de cobre en agua hasta la saturación, se obtiene el equilibrio: CuCl (s) ↔ Cu+ (a) + Cl– (a) Aplicando al equilibrio la ley de acción de masas se obtiene: K=

[Cu+ (a)] + [Cl– (a)] [CuCl (s)]

Como el cloruro de cobre está disuelto en una cantidad mínima, [CuCl (s)] se puede considerar constante, y por tanto K · [CuCl (s)], el producto de solubilidad será: Ks = [Cu+ (a)] + [Cl– (a)]

Producto de solubilidad El concepto de producto de solubilidad se aplica a sustancias poco solubles en agua, que presentan enlaces iónicos (parcial o totalmente) y en consecuencia pueden liberar iones en disolución: A x By ↔ xA– + yB+ El producto de solubilidad, Ks , es un valor fijo para cada sustancia a una determinada temperatura (normalmente se toma la temperatura de 25 ºC). En general, si se tiene una sustancia poco soluble Ax By, su producto de solubilidad será: K s = [A–] x [B+ ] y El producto de solubilidad sólo se puede aplicar en equilibrios iónicos de sustancias insolubles y disoluciones saturadas. Para sustancias poco solubles, Ks es pequeño, mientras que para sustancias muy solubles, Ks es grande.

Por otra parte, para una sal poco soluble, la solubilidad en mol/l, representada como s, será igual a la concentración del catión y del anión: AB(s) ↔ AB ↔ A– (a) + B+ (a) s = [A– (a)] = [B+ (a)]; como Ks = [A– (a)] · [B+ (a)] si se sustituye Ks = s · s = s2 s = Ks

Efecto del ion común En los equilibrios de disolución de sustancias poco solubles, la concentración de los iones permanece constante. Si se añade un ion común a los ya existentes en la disolución, el equilibrio se rompe variándose la solubilidad, con lo que la cantidad de sustancia disuelta sería menor. Es decir, disminuye la solubilidad de una sal por la presen-


134

QUÍMICA

____________________________________________________________________________________________________

cia de iones comunes de la sal. (La precipitación sólo se consigue mediante este efecto.) El efecto del ion común tienen numerosas aplicaciones, entre otras conseguir una precipitación completa de un ion, para lo que se utiliza un exceso de agente precipitante.

Equilibrios de formación de complejos

Un complejo o compuesto de coordinación es toda sustancia que está constituida por grupos de moléculas y/o iones, denominados ligandos, enlazados a un átomo o ion central. El átomo central actúa como aceptor de pares de electrones, por lo que la mayoría de las veces proviene de la unión de un ion metálico que tiene un orbital vacante con otro que generalmente no es metal y tiene un par de electrones para compartir. Los átomos que se unen directamente al átomo central se llaman átomos dadores, ya que ceden los electrones. Se ha establecido una clasificación de los ligandos atendiendo al número de átomos que se unen al central. Así, serán monodentados si presentan un solo átomo dador y polidentados (bi, tri, tetradentados, etc.) si se unen a través de un átomo dador. Este tipo de compuestos se llaman quelatos. Algunas sustancias naturales como la hemoglobina de la sangre, con el hierro presente en ella, forman quelatos. Los iones metálicos que con más frecuencia forman los complejos son los metales de transición, porque tienen un orbital d sin completar. Los ligandos están unidos al átomo central mediante enlaces covalentes coordinados. Este complejo se une al átomo que formará el compuesto mediante enlace iónico. El número de ligandos que se une al átomo central se denomina número de coordinación. En el ion [Ni(NH3 ) 4 ] 2+, el Ni(II) es el átomo central que acepta pares electrónicos del NH3 , y su número de coordinación es 4. Los grupos coordinados junto con el átomo central constituyen la esfera de coordinación: +

2

H | H – N – H

Ni

H – N – H | H

[AgCl2 ] – → (+1) de la plata + (–2) de los cloros = –1 [Cu(NH3 ) 4 ] 2+ → (+2) del cobre + (0) de los aminos = +2 [Al(H2 O)6 ] 3+ → (+3) del aluminio + (0) del agua = +3

Nomenclatura y formulación

Compuestos de coordinación

H | H – N | H

La carga de un ion complejo es la suma algebraica de los números de oxidación del átomo central y los ligandos. Según la carga resultante, los complejos pueden ser catiónicos, aniónicos o neutros:

H | N – H | H

Para escribir la fórmula de los iones complejos, en primer lugar se coloca el símbolo del ion central y a su derecha se van anotando los ligandos iónicos y después los neutros, siguiendo un orden alfabético, basado en los símbolos de los átomos unidos directamente al ion central. Para nombrar los complejos se siguen las siguientes reglas: 1. En primer lugar, se nombra el ion negativo seguido del ion positivo. 2. Los ligandos o grupos de coordinación se nombran antes que el átomo central. Cuando hay ligandos negativos y neutros, se nombran primero los ligandos negativos y después los neutros. Cuando hay varios ligandos neutros o negativos en el mismo complejo, se nombran con los prefijos di, tri, tetra, etc., y se nombran por orden alfabético. Para citar los ligandos neutros o catiónicos se utiliza su nombre corriente, a excepción de los ligandos H2 O y NH3 , que se denominan “aqua” y “ammina”. 3. Los aniones complejos se nombran con la terminación -ato agregada al nombre apocopado del átomo central, seguida por el estado de oxidación expresado en números romanos y entre paréntesis (notación de Stock). 4. Si el ion complejo es positivo, no se añade ningún sufijo, pero se sigue la notación de Stock. Veamos algunos ejemplos: Cl2 [Co(NH3 ) 5 Cl]: cloruro de cloropentaminocobalto (III) [Cr(H2 O)3 Cl3 ]: triclorotriacuocromo (III) [Cu(H2 O)4 ] 2+: tetracuocobre (II) SO4[Cr(H2 O)2 (NH3 ) 3 Cl ]: sulfato de clorotriaminodiacuocromo (III) K2 [PtCl6 ]: hexacloroplatinato (IV) de potasio

Formación de iones complejos La formación de un complejo se efectúa añadiendo cierta cantidad de ligando a una disolución del ion central. Los iones complejos pueden ser estables en disoluciones o, por el contrario, pueden tener tendencia a disociarse en


__________________________________________________________________________________________

sus componentes, por lo que se establece un equilibrio de disociación. Si M es un ion metálico y l un ligando, M 2+ + L ↔ (ML)2+, K1 =

[(ML)2+] [M2+][L]

(ML)2+ + L ↔ (ML)2+, K2 =

[(ML)2+] [(ML)2+][L]

(ML2 ) 2+ + L ↔ (ML3 ) 2+, K3 =

[(ML3 ) 2+] [(ML2 ) 2+][L]

(ML3 ) 2+ + L ↔ (ML4 ) 2+, K4 =

[(ML4 ) 2+] [(ML3 ) 2+][L]

Reacciones químicas

135

Los complejos de mayor estabilidad son los que presentan valores elevados de β y reducidos de β‘. La estabilidad de un ion complejo está determinada por la naturaleza del ion central. Los cationes que mejor actúan son los de volumen pequeño y carga elevada. Por consiguiente, los metales de transición producen los complejos más estables. La gran estabilidad de muchos complejos les confiere gran utilidad en numerosos procesos químicos, tanto analíticos como industriales, utilizándose para la extracción de metales, como catalizadores, para obtener caucho, también en reacciones bioquímicas, etc.

La constante de formación del complejo β se obtiene mediante las constantes parciales. Será: M 2+ + 4L ↔ (ML4 ) 2+ [(ML4 ) 2+] β= [M2+][L]4 En términos generales, si n es el número de coordinación y c la carga del complejo, la constante de formación del complejo o constante de estabilidad es: c n) ] M + nL ↔ (MLn ) = [(ML [Mc ][L]n c

c

Las reacciones de iones complejos tienen tendencia a formarse en disolución acuosa, cuyo ion central forma acuicomplejos. Los equilibrios de formación de un ion complejo son el resultado de la competición entre las moléculas de agua y las del agente complejante que pretende sustituir a las de agua que forman el acuicomplejo: M(H2 O)2+ + 4L ↔ (ML4 ) 2+ + 4H2 O Si se considera el equilibrio de forma inversa se obtienen la constante de disociación o de inestabilidad, β’, que se expresa: (MLn ) c ↔ M c + nL [L]n [Mc ] β‘ = [(MLn ) c ]

_ Preguntas de repaso 1. Escribir la ecuación ajustada que describe el proceso de combustión del butano, C4H10, en presencia de oxígeno, O2. 2. Calcular el pH de una disolución 0,01 M de KOH. 3. ¿Cuál es el número de oxidación del azufre en el ácido sulfúrico? ¿Y el del carbono en el carbonato de sodio? 4. El residuo de CaCO3 obtenido al evaporarse 500 cc de una disolución de carbonato cálcico preparada a 25 ºC es de 3,5 mg. ¿Cuál es el producto de solubilidad a 25 ºC? 5. Nombrar los siguientes complejos de coordinación: a) [Co(NH3 ) 6 Cl3] b) [CrCl2 (H2 O)4 NO3 ] c) [PtCl4 ] [Ag (NH3 ) 2 ] 2 d) [Co(NH3 ) 6 ] 3+


ELEMENTOS DE LA TABLA PERIÓDICA

A

lo largo del presente capítulo se estudiarán las propiedades de la mayoría de los elementos químicos de los grupos representativos. Estas propiedades se analizarán de forma comparativa en función de su situación en el sistema periódico, es decir, de su configuración electrónica, responsable en gran medida de conferir muchas de estas propiedades. Para una mejor comprensión de las propiedades de cada grupo de los que constituyen la tabla periódica, en las pá-

Propiedades de los elementos Propiedades de los metales

– Mala conductividad eléctrica

– Elevada conductividad térmica

– Aislantes del calor

– Aspecto gris-metálico (excepto cobre y oro)

– No dúctiles, quebradizos

– Maleables y dúctiles – Enlace metálico en estado sólido – Capas electrónicas externas con pocos electrones

– Sólidos, líquidos y gases – Enlace covalente (excepto gases nobles) – Capas electrónicas externas con más de 4 electrones (con excepciones) – Oxidantes

– No electronegativos – Reductores

– Alta afinidad electrónica

– Bajas energías de ionización

– Forman aniones

– Formación de cationes – Óxidos básicos o anfóteros

N CH3

CH3

N

Hidrógeno Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radio atómico (Å) Potencial redox Electronegatividad Energía de ionización (eV) Punto de ebullición (ºC) Punto de fusión (ºC)

Hidrógeno H 1 1s1 +1, –1 0,32 0,00 2,1 13,5 –257,7 –259,14

ginas siguientes se expondrán las más significativas características en cuadros sinópticos correspondientes a las diversas categorías de elementos. A este respecto, la principal distinción dentro de la tabla es el carácter metálico o no metálico de los elementos. En el recuadro de la izquierda se exponen las principales propiedades metálicas y no metálicas de los elementos.

Hidrógeno

– Electronegativos – Altas energías de ionización

– Baja afinidad electrónica

O

N

Propiedades de los no metales

– Elevada conductividad eléctrica

– Sólidos (excepto mercurio y cesio)

O HN

– Óxidos ácidos

El hidrógeno puede compararse formalmente con los metales alcalinos por tener un electrón en su capa de valencia, o con los halógenos por su tendencia a ganar un electrón. Sus propiedades son más próximas a las de los halógenos, dado que pierde con mucha dificultad su electrón de valencia. Son relativamente frecuentes los compuestos del hidrógeno con estado de oxidación –1 (hidruros metálicos). En la naturaleza se encuentra casi exclusivamente combinado con el oxígeno, formando agua. Se presenta, en baja proporción, en forma de molécula diatómica de ba-

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


__________________________________________________________________________________

jos puntos de ebullición y fusión y de pequeño tamaño. Se conocen tres isótopos del hidrógeno: hidrógeno, 11 H; deuterio, 21 H, y tritio, 31 H. Este elemento se obtiene industrialmente por descomposición del agua, mediante electrólisis, añadiendo al agua unas gotas de ácido sulfúrico o hidróxido sódico. En uno de los electrodos se libera hidrógeno (cátodo) y el oxigeno en el otro (ánodo):

Elementos de la tabla periódica

Reaccionan con oxidantes (oxígeno, halógeno, etc.), y de igual forma reaccionan con el agua desprendiendo H+ : 4M + O2 → 2M2 O M + X → MX 2M + 2H2 O → 2M(OH) + H2 Sus óxidos tienen carácter básico:

2H2 O → 2H2 + O2 También se obtiene industrialmente por reducción del vapor de agua con coque calentado a 1.000 ºC, para obtener una mezcla de hidrógeno y monóxido de carbono: C + H2 O → H2 + CO En el laboratorio se pueden obtener pequeñas cantidades de hidrógeno a partir de compuestos que lo contengan, tales como ácidos, agua, etc., mediante diferentes métodos, entre los que cabe citar: Zn + 2 H2 O ↔ Zn2+ + 2 OH– + H2 Al + 2 H 2 O → Al3+ + 2 OH– + H2 Entre las principales aplicaciones del hidrógeno cabe citar la fabricación de amoniaco, metanol y otros productos orgánicos, como alcoholes o gasolinas; la obtención de margarina comestible y de jabón; su uso como agente reductor en la obtención de metales a partir de sus óxidos, y su empleo como gas para llenar globos sonda y para soldar metales con alto punto de fusión.

Grupo I A (1): metales alcalinos Todos los metales alcalinos se comportan como fuertes reductores, ya que tienden a perder el electrón de su capa externa. Este carácter reductor aumenta cuando lo hace su volumen.

M 2 O + H2 O → 2 (M+ + OH–) No son elementos electronegativos y pierden su electrón de valencia con facilidad, por lo que su único estado de oxidación es +1 y sus compuestos son de carácter iónico (hidruros, óxidos, haluros, hidróxidos, sulfuros, así como oxoaniones, sulfatos, nitratos, etc.). Dada su elevada capacidad de reacción, no se encuentran libres en la naturaleza, sino que se hallan formando sales marinas y en rocas salinas. Es muy difícil la obtención del metal libre como consecuencia de su escasa afinidad por su electrón de valencia. Todos los métodos de obtención se basan en la reacción de reducción de los iones: M + + e– → M En general, el procedimiento más utilizado es la electrólisis de sus compuestos. El litio se utiliza en síntesis orgánicas y en química nuclear, así como en metalurgia como desoxidante, desulfurante y desgasificante. El sodio se emplea como agente reductor en la obtención de metales raros, en síntesis orgánicas, como conductor eléctrico, etc. Las sales de potasio y sodio tienen una importancia esencial en el mantenimiento del equilibrio electrolítico del organismo humano. El cesio se utiliza en la fabricación de células fotoeléctricas.

Grupo I A (1): metales alcalinos Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Potencial redox Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

137

Litio

Sodio

Potasio

Rubidio

Cesio

Francio

Li 3 2s1 +1 1,52 5,3 –3,05 1,0 1.340 179,1

Na 11 3s1 +1 1,86 5,1 –2,71 0,9 885 97,5

K 19 4s1 +1 2,31 4,3 –2,93 0,8 775 63,5

Rb 37 5s1 +1 2,44 4,1 –2,93 0,8 690 39,0

Cs 55 6s1 +1 2,62 3,8 –2,92 0,7 671 28,5

Fr 87 7s1 +1 2,6 – – 0,7 – –


138

QUÍMICA

____________________________________________________________________________________________________

Grupo II A (2): metales alcalino-térreos Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Potencial redox Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

Berilio

Magnesio

Calcio

Estroncio

Bario

Radio

Be 4 2s2 +2 1,11 9,3 –1,85 1,5 2.780 1.285

Mg 12 3s2 +2 1,6 7,6 –2,37 1,2 1.100 650

Ca 20 4s2 +2 1,97 6,0 2,87 1,0 1.245 840

Sr 38 5s2 +2 2,15 5,6 –2,89 1,0 1.160 800

Ba 56 6s2 +2 2,17 5,2 –2,90 0,9 1.140 725

Ra 88 7s2 +2 2,2 5,2 –2,92 0,9 1.145 700

Grupo II A (2): metales alcalino-térreos Se caracterizan por su naturaleza fuertemente metálica, que aumenta con el número atómico. En general son menos reactivos que los metales alcalinos y más duros. Forman iones M2+, aunque con menor facilidad que los metales alcalinos. Sus compuestos tienen un marcado carácter iónico, excepto los compuestos del berilio (por la alta densidad del ion Be2+). El berilio forma compuestos lineales con hibridación “sp”(BeCl2 ). Todos los alcalino-térreos son fuertemente reductores y reaccionan para formar esencialmente óxidos, hidróxidos y sales. Con el oxígeno forman óxidos de carácter iónico, excepto el óxido de berilio (BeO), que tiene carácter covalente. La fórmula general es: 2M + O2 → 2MO Tanto los óxidos como los hidróxidos son tanto más básicos cuanto mayor es el volumen iónico, excepto el óxido de berilio, que es anfótero, por lo que puede presentar características químicas tanto ácidas como básicas. La fórmula general de hidróxido es: 2MO + H2 O → 2M(OH)2 Con los halógenos forman haluros que, con excepción de los fluoruros de calcio, estroncio y bario, son fácilmente solubles en agua. Su fórmula general es: M + X2 → MX2 Combinados con nitrógeno, forman los nitruros de fórmula general N2 M 3, que se hidrolizan con el agua originando hidróxidos y amoniaco: N 2 Mg3 + 6 H2 O → 3Mg(OH)2 ↓ + 2NH3

Con agua (Ba, Ca, Sr) forman hidróxidos: M + 2H2 O → M(OH)2 + H2↑ De igual modo que los metales alcalinos, y debido a su gran reactividad, no se encuentran libres en la naturaleza. Se obtienen por medio de procesos electrolíticos de sus sales fundidas, basándose, por tanto, en la reducción de sus iones: M 2+ + 2e– → M El berilio se utiliza en la industria química para la fabricación de aleaciones ligeras con cobre o níquel. El magnesio también se utiliza en aleación con pequeñas cantidades de zinc y aluminio. Se emplea así mismo en lámparas para fotografía, en la fabricación de cohetes, como desoxidante y como desgasificador en metalurgia. El calcio se utiliza como desoxidante y también en aleaciones, mientras que el bario se usa en pirotecnia, y sus compuestos, en procesos radioscópicos. Los compuestos del radio tienen todos aplicación derivada de su radiactividad. Buena parte de las sales de metales alcalino-térreos tienen, además, numerosas aplicaciones clínicas y farmacéuticas.

Grupo III A (13) En este grupo, las propiedades varían desde el carácter no metálico del boro –cuyo estado de oxidación es +3 y sus compuestos son covalentes– hasta el carácter metálico del talio, con su estado de oxidación +1, de mayor estabilidad y que forma compuestos iónicos. El boro presenta en la mayoría de sus compuestos la hibridación sp2 (moléculas plano-triangulares como el BCl3 ). Con el estado de oxidación +3, la mayoría de ellos son covalentes. El galio, indio y talio en disolución se encuentran como M3+ y M+. Reaccionan:


__________________________________________________________________________________

Elementos de la tabla periódica

139

Grupo III A (13) Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Potencial redox Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

Boro

Aluminio

Galio

Indio

Talio

B 5 2s2p1 +3 0,88 8,3 –0,9 2,0 2.550 2.300

Al 13 3s2p1 +3 1,43 8,6 –1,65 1,5 1.800 660

Ga 31 4s2p1 +3, +1 1,62 5,9 –0,53 1,6 1.983 30

In 49 5s2p1 +3, +1 1,62 5,7 –0,34 1,7 2.000 155

Tl 81 6s2p1 +1, +3 1,71 6,0 –0,34 1,8 1.457 300

– Con el oxígeno a elevadas temperaturas:

El aluminio se obtiene mediante electrólisis de alúmina por descomposición de la bauxita:

4M + 3O2 → 2M2 O 3

2 Al2 O 3 → 3O2 + 4 Al

– Con los halógenos (excepto el boro): 2M + 3X2 → 2MX3 – Con ácidos (H+ ), liberando H2 . La basicidad de sus óxidos aumenta al incrementarse el número atómico. El óxido de boro es ácido y el de aluminio tiene carácter anfótero. Los demás son básicos. El aluminio es el metal más abundante en la corteza terrestre, donde se encuentra combinado en numerosos minerales. El boro es muy escaso y no se presenta en estado libre. Los boratos de calcio y sodio son las combinaciones más abundantes. El galio y el indio son muy escasos y se encuentran en forma de impurezas en minerales de aluminio y zinc. El talio se encuentra en piritas. El boro se obtiene por tratamiento industrial del bórax, por descomposición de halogenuros o bien reduciendo el óxido bórico con magnesio:

El galio, talio e indio se obtienen al purificar algunos metales de aluminio y zinc, donde se encuentran como impurezas. En cuanto a la utilización de los metales que conforman el grupo III A, el boro se usa en aleaciones especiales, como moderador de neutrones; como antiséptico; en la preparación de dentífricos; en soldadura; en ciertos jabones; fabricación de vidrio, etc. El aluminio se utiliza en construcción, en la industria farmacéutica, como antiácido, en utensilios de cocina, en líneas de alta tensión, para fabricar pinturas, etc. El galio, el indio y el talio se utilizan en la investigación de semiconductores y en la fabricación de fotocélulas.

Grupo IV A (14) Las propiedades de los elementos de este grupo varían desde el comportamiento no metálico del carbono, con esta-

B 2 O 3 + 3Mg → 2B + 3MgO

Grupo IV A (14) Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Potencial redox Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

Carbono

Silicio

Germanio

Estaño

Plomo

C 6 2s2p2 +4, +2 0,77 11,2 0,39 2,5 3.200 >3.500

Si 14 3s2p2 +4 1,17 8,1 0,1 1,8 2.600 1.430

Ge 32 4s2p2 +4, +2 1,22 0,0 0,0 1,8 2.700 960

Sn 50 5s2p2 +2, +4 1,41 –0,13 –0,13 1,8 2.260 232

Pb 82 6s2p2 +2, +4 1,53 –0,12 –0,12 1,8 1.744 327


140

QUÍMICA

____________________________________________________________________________________________________

do de oxidación más estable (+4) y compuestos covalentes, a las propiedades metálicas del estaño y del plomo en su estado de oxidación más estable (+2) y compuestos iónicos. El germanio y el silicio son elementos semiconductores. A la vista de los valores de la energía de ionización, es muy poco probable la existencia de iones M4+; por ello, los compuestos de estos elementos con un estado de oxidación +4 son predominantemente covalentes (a excepción del PbF4 y PbCl4 ). Los compuestos con estado de oxidación +2 son también covalentes, a excepción de las sales de plomo y ciertas sales del estaño. En algunas sustancias se ha detectado la presencia del ion C4– (carburos) y del ion Si4– (siliciuros). Los átomos del carbono tienen gran tendencia a unirse entre sí formando cadenas carbonadas. Esta propiedad también la presenta el silicio, pero en menor medida. El carbono se presenta en dos variedades alotrópicas: el grafito, que tiene una estructura hexagonal y es conductor, y el diamante, cuya estructura es tetraédrica y que es el material más duro que se ha hallado en estado natural. La hibridación de los compuestos del carbono puede ser sp (estructura lineal), sp2 (estructura plano-triangular) y sp3 (estructura tetraédrica). El carbono es ligeramente reductor, por lo que se emplea como reductor de óxidos de metales poco reactivos (Fe2 O 3 ). A diferencia del carbono, el silicio no forma dobles enlaces, aunque puede formar orbitales híbridos con los orbitales d más próximos (sp3 d). Estos elementos reaccionan con :

El estaño puede encontrarse libre o en combinación, formando minerales como la casiterita, que se puede concentrar por lavado o tostación, y cuyo óxido resultante se reduce con carbón: SnO2 + 2C → Sn + 2CO El plomo se encuentra combinado en minerales como la galena o la cerusita. Se obtiene del tostado del concentrado de estas combinaciones, en presencia de aire, por lo que parte del sulfuro se convierte en óxido que se mezcla con carbón o chatarra de hierro y se funden: 2PbS + 3O2 → 2PbO + SO2 , PbO + C → Pb + CO PbS + Fe → Pb + FeS El germanio es un elemento poco abundante, pero se encuentra ampliamente distribuido en la naturaleza, en asociación con minerales sulfurados. Se obtiene de los residuos de la metalurgia del zinc y plomo. En cuanto a la utilización industrial de estos elementos, el diamante se utiliza en perforadoras como abrasivo y como materia de talla en joyería; el grafito se emplea en la fabricación de electrodos, crisoles, lubricantes, lapiceros, como aditivo en plásticos, etc; el silicio y el germanio se usan en electrónica como semiconductores para fabricar transistores, fotocélulas, etc.; el estaño y el plomo se usan fundamentalmente en metalurgia y construcción. En el caso del estaño, su principal uso es la fabricación de hojalata, bronce, latones, etc.

Grupo V A (15)

– Oxígeno (a elevadas temperaturas): M + O2 → MO2 (El carbono puede dar también CO.) – Halógenos: M + 2X2 → MX4 – Con oxidantes fuertes (como HNO3 ), dando MO2 (el germanio y estaño) y Pb2+ (el plomo). Los óxidos de carbono y silicio (CO2 y SiO2 ) son ácidos, los óxidos de germanio y estaño (GeO2 y SnO2 ) son anfóteros y el óxido de plomo es ligeramente básico. El carbono se encuentra libre en la naturaleza, y es uno de los elementos más abundantes; en la atmósfera se encuentra formando CO2 . El silicio no está libre en la naturaleza, sino en forma de silicatos, que son los minerales más abundantes en la corteza terrestre. Uno de los procedimientos de obtención del silicio es por reducción de sílice mediante agentes reductores fuertes, como el magnesio: SiO2 + 2Mg → 2MgO + Si

De igual forma que en los grupos precedentes, en los elementos del grupo V A existe una transición regular entre las propiedades no metálicas del nitrógeno y las metálicas del bismuto. Por ser muy elevadas las energías de ionización, no existen los iones M5+. El nitrógeno puede presentar hasta tres enlaces covalentes (hibridación sp3, como en el amoniaco). Los restantes elementos del grupo pueden presentar además covalencias superiores debido a la participación de orbitales d próximos. El nitrógeno, y en menor medida el fósforo, son los únicos elementos que presentan el estado de oxidación –3 (nitruros y fosfuros de metales muy reactivos). Sólo el bismuto y el antimonio tienen propiedades metálicas, formando cationes M3+. Los óxidos de nitrógeno, fósforo y arsénico son ácidos, mientras que los de antimonio y bismuto tienen carácter anfótero, a excepción del Bi2 O 3 , de carácter básico. Todos los elementos reaccionan con el hidrógeno formando los compuestos MH3. En el estado de oxidación +5, todos los óxidos presentan propiedades ácidas, aunque la acidez disminuye al aumentar el número atómico. En el estado de oxidación +5, el óxido de bismuto es


__________________________________________________________________________________

Elementos de la tabla periódica

141

Grupo V A (15) Nombre

Nitrógeno

Fósforo

Arsénico

Antimonio

Bismuto

N 7 2s2p3 +3, +5 0,7 14,5 3 –195,8 –209

P 15 3s2p3 +3, +5 1,1 10,5 2,1 280,5 44,1

As 33 4s2p3 +3, +5 1,2 9,8 2,1 610 814

Sb 51 5s2p3 +3, +5 1,4 8,6 1,9 1.380 631

Bi 83 6s2p3 +1, +5 1,46 7,3 1,8 1.450 271

Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

el agente oxidante más fuerte. De igual forma, el amoniaco es el compuesto más reductor, con estado de oxidación +3. El nitrógeno es el único elemento gaseoso, y debido a su elevada energía de enlace es muy poco reactivo (son necesarias elevadas temperaturas para que reaccione). Se encuentra formando las cuatro quintas partes de la atmósfera y está constituido por los isótopos 14N y 15N. También se halla en la corteza terrestre formando nitrato sódico y potásico. Se puede obtener por destilación fraccionada de aire líquido o por oxidación del ion amonio, oxidación del amoniaco, etc. NO2– + NH4+ → N2 + 2H2 O 2NH3 + 3CuO → N2 + 3Cu + 3H2 O

Proteínas animales

M eta an bol im ism al o

Bacterias

desnitrificantes

d

Suelo (NO-3 , NO-2NH+ 4)

Putrefacción

n

ció

fac tre

Proteínas vegetales

Pu

o

m lis bo tal eta ege M v

Ciclo del nitrógeno

El fósforo se utiliza, además de para la formación de compuestos, para la fabricación de cerillas, raticidas y ciertos bronces. El arsénico, el antimonio y el bismuto se encuentran en sulfuros minerales, de los que se obtiene la materia prima mediante reducción de los óxidos con el carbono: reducción

Sulfuro → SO2 + óxido → elemento Las sales de estos tres elementos presentan diferentes aplicaciones en medicina. En la industria, el arsénico se emplea en metalurgia, en la fabricación de vidrio y en la manufactura de ciertos tipos de bronce y en diversas aleaciones; el antimonio se utiliza en la fabricación de aleaciones de usos especiales, y el bismuto se emplea para la obtención de aleaciones de bajo punto de fusión que se usan para alarmas de fuego y duchas automáticas.

Grupo VI A (16)

nitBact rif eri ica as nte s

N2 atmosférico

2Ca3 (PO4 ) 2 + 6SiO2 → 6CaSiO3 + P4 O 10 P 4 O 10 + 10C → 10CO + P4

tostación

Entre otras aplicaciones, el nitrógeno se utiliza en la industria para la obtención de amoniaco, ácido nítrico y cianamida cálcica. A presión atmosférica y a –195 ºC de temperatura se obtiene el nitrógeno líquido, empleado en criogenia y criocirugía, ramas de la investigación centradas en las aplicaciones de las bajas temperaturas. Es un elemento esencial para la vida, puesto que es un constituyente esencial de las proteínas, aunque ningún animal es capaz de asimilar directamente el nitrógeno de la atmósfera, sino que necesita una serie de transformaciones: s s ria nte cteifica a B itr n es

El fósforo no se encuentra en estado libre, pero en forma de fosfatos se halla en la naturaleza en cantidad considerable. Se obtiene preparando estos fosfatos con coque o sílice en un horno eléctrico:

Al aumentar el número atómico decrece el poder oxidante del elemento. En este grupo, todos los elementos tienden a formar iones –2(E2-), aunque los procesos de formación son endotérmicos. Los óxidos tienen un marcado carácter iónico (con excepción de los grupos precedentes y los óxidos de los halógenos). Los compuestos del azufre, selenio y teluro con estado de oxidación –2 son los metales más reactivos y tienen carácter iónico. Todos los elementos del grupo reaccionan


142

QUÍMICA

____________________________________________________________________________________________________

Grupo VI A (16) Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Potencial redox Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

Oxígeno

Azufre

Selenio

Teluro

Polonio

O 8 2s2p4 –2, –1 0,66 – 0,40 3,5 –183 –219

S 16 3s2p4 –2, +2, +4, +6 1,04 – –0,48 2,5 444 119

Se 34 4s2p4 –2, +2, +4, +6 1,17 – –92 2,4 688 217

Te 52 5s2p4 –2, +2, +4, +6 1,37 – –1,14 2,1 1.390 452

Po 84 6s2p4 –2, +6 1,4 – – 1,9 – –

con el hidrógeno dando compuestos covalentes de formula EH2 . Existe otro óxido de hidrógeno (H2 O 2 , peróxido de hidrógeno o agua hidrogenada), con propiedades oxidantes y en el que el estado de oxidación del oxígeno es –1. A excepción del oxígeno, estos elementos pueden presentar más de dos enlaces, al poder utilizar orbitales d próximos a su capa de valencia. El polonio es radiactivo y el único que presenta propiedades metálicas. Los elementos de este grupo se encuentran en diversas variedades alotrópicas: O2 y O3 ; S (rómbico y monoclínico); Se (gris y rojo). El azufre y el selenio se encuentran en la forma molecular S8 y Se8 . En general reaccionan con los metales, los halógenos y el hidrógeno. Sólo el oxígeno tiene capacidad para formar dobles enlaces, y el azufre en escasos compuestos. El azufre se puede encontrar en forma elemental en grandes yacimientos y también formando parte de sulfuros y sulfatos (galena, pirita, blenda, cinabrio, etc.). Se obtiene calentando las rocas que lo contienen en hornos especiales de donde se separa el azufre para purificarlo posteriormente. La utilización del azufre es muy variada: como antiparasitario en agricultura; aislante eléctrico en la vulcanización del caucho; en la fabricación de fertilizantes; en la industria del papel, y en la elaboración de pólvora, colorantes, cementos y materiales de construcción y cerillas. Tanto el selenio como el teluro pueden hallarse en estado libre combinado, pero en muy pequeña cantidad. Se obtienen generalmente como subproductos de diversos procesos industriales y ambos se emplean en las industrias electrónica e informática, dado su carácter de semiconductores. El selenio se utiliza fundamentalmente en la fabricación de rectificadores eléctricos, esmaltes, colorantes y para colorear el vidrio de semáforos. El oxígeno es el elemento más abundante en la naturaleza. Se encuentra en estado libre en la atmósfera y com-

binado con el hidrógeno formando agua. Se obtiene de forma natural en el proceso de la fotosíntesis. Industrialmente se alcanza mediante diferentes procesos, como puede ser la destilación fraccionada del aire líquido o la electrólisis del agua: 2H2 O → 2H2 + O2 En el laboratorio existen numerosas reacciones para obtener oxígeno. Los métodos más usados suponen la descomposición térmica de los compuestos menos estables del oxígeno. El oxígeno suministra la energía para que se produzca la vida animal y vegetal. En la industria se utiliza para conseguir temperaturas elevadas. En medicina se emplea en el tratamiento de enfermedades respiratorias e intoxicaciones. En su forma alotrópica (ozono, O3) se utiliza para desinfectar y como agente blanqueante, además de para purificar el aire y esterilizar agua.

Grupo VII A (17): halógenos Todos los elementos halógenos son no metales y tienen una gran tendencia a completar su capa electrónica externa mediante la incorporación de un electrón. Esta tendencia se manifiesta ganando un electrón y formándose por tanto el ion haluro correspondiente, o bien con la formación de un enlace covalente. Como se puede esperar de los altos valores de sus potenciales redox, los halógenos son oxidantes enérgicos, disminuyendo su fuerza al aumentar su número atómico. Forman enlaces iónicos con los metales reactivos y enlace covalente en sus uniones entre sí, con el oxígeno, con el hidrógeno y con otros no metales. Sus puntos de fusión y ebullición aumentan al incrementarse el número atómico, ya que aumentan las fuerzas intermoleculares o de Van der Waals. Así, el flúor y el cloro son gases, el bromo es líquido y el yodo es un sólido que sublima con facilidad.


__________________________________________________________________________________

Elementos de la tabla periódica

143

Grupo VII A (17): halógenos Nombre Símbolo Número atómico Configuración electrónica Estado de oxidación Radios atómicos (Å) Energía de ionización (eV) Potencial redox Electronegatividad Punto de ebullición (ºC) Punto de fusión (ºC)

Flúor

Cloro

Bromo

Yodo

Astato

F 9 2s2p5 –1 0,72 17,4 2,87 4 –188 –223

Cl 17 3s2p5 –1, +1, +3, +5, +7 0,99 13 1,36 3 –34,6 –102

Br 35 4s2p5 –1, +1, +3, +5, +7 1,14 11,8 1,06 2,8 58 –7

I 53 5s2p5 –1, +1, +3, +5, +7 1,33 10,2 0,53 2,5 185 114

At 85 6s2p5 –1, +1, +3, +5, +7 – – – – – –

A excepción del flúor, los halógenos tienen covalencias superiores a la unidad. El flúor es un elemento con elevada reactividad, debido a su gran electronegatividad, poder oxidante y pequeño tamaño. Reaccionan con el agua de dos formas diferentes: 2X2 + 2H2 O → 4H + X + O2 (reacción muy enérgica con el flúor) +

El bromo se encuentra en disolución en el agua de mar, aunque también forma parte de compuestos minerales. El método más utilizado para obtener el bromo es la cloración del agua de mar a pH ácido: 2Br– + Cl2 → Br2 + 2Cl–

El yodo es proporcionalmente escaso y se encuentra en forma de yodatos y peryodato sódico. Se obtiene mediante diferentes métodos, uno de los cuales es a partir del yodato sódico por reducción con bisulfito:

X 2 + H2 O → H+ + X– + HOX (Cl, Br, I) Reaccionan con los metales formando haluros; con el hidrógeno dando origen a los halogenuros de hidrógeno, y con otros halógenos X2 + nX’2 → 2XX’n Los halogenuros de hidrógeno (HF, HCl, HBr y HI) son covalentes y sus disoluciones tienen carácter ácido. Este carácter ácido aumenta con el número atómico del halógeno. Todos los halógenos se presentan en forma molecular diatómica estable. El cloro es el más abundante del grupo y se encuentra fundamentalmente en forma de cloruros metálicos, como el cloruro sódico o sal común, de la que se obtiene en su mayor parte este elemento.

2IO3– + 5HSO3 → 3HSO4– + H2 O + I2 Todos los halógenos pueden obtenerse por oxidación de sus iones haluro. El flúor ha de obtenerse electrolíticamente. El flúor se utiliza en la preparación de derivados fluorados de los hidrocarburos y se emplea como refrigerante en máquinas frigoríficas, como extintor, para la obtención de plásticos, etc. El bromo se utiliza para obtener dibromuro de etileno, que se emplea como aditivo en la gasolina, para obtener bromuros metálicos, colorantes, etc. El cloro se usa como agente blanqueante para el papel

Grupo VIII A (18): gases nobles Nombre Símbolo Número atómico Configuración electrónica Radios atómicos (Å) Energía de ionización (eV) Punto de ebullición (ºC) Punto de fusión (ºC)

Helio

Neón

Argón

Kriptón

Xenón

Radón

He 2 2s2 0,93 24,6 –268,9 –272,2

Ne 10 2s2p6 1,60 21,6 –245,9 –248,7

Ar 18 3s2p6 1,91 15,8 –185,7 –189,2

Kr 36 4s2p6 2,0 14 –152,9 –157

Xe 54 5s2p6 2,2 12,1 –107,1 –112

Rn 86 6s2p6 – 10,7 –61,8 –71


144

QUÍMICA

____________________________________________________________________________________________________

y tejidos de algodón, para purificar agua potable, fabricación de colorantes, drogas y explosivos, etc. El yodo se utiliza como antiséptico (tintura de yodo) y en la síntesis de compuestos orgánicos.

Grupo VIII A (18): gases nobles Los gases nobles son muy escasos en la naturaleza. Debido a su poca reactividad, se presentan en forma monoatómica. Tienen puntos de fusión y ebullición muy bajos (fuerzas interatómicas o de Van der Waals muy pequeñas), por lo que, incluso a muy bajas temperaturas, se encuentran en estado gaseoso. Los puntos de fusión y ebullición aumentan al incrementarse su número atómico. Todos, excepto el radón, forman parte de la composición de la atmósfera, aunque en bajos porcentajes. El helio se encuentra en el gas natural. Se han conseguido aislar combinaciones de xenón con

flúor y con oxígeno mediante reacciones a elevadas temperaturas o con descargas eléctricas. El helio se obtiene de su extracción de gas natural. El resto de los gases nobles se obtiene de la destilación fraccionada del gas licuado. El helio se utiliza para llenar globos sonda y bombonas de buceo. De este modo, todos ellos se utilizan como medio de difusión en lámparas fluorescentes e incandescentes.

Metales de transición y elementos de transición interna Los elementos de transición, metálicos y de transición interna quedan englobados en los grupos del sistema periódico comprendidos entre el III B y el II B, correspondientes a las columnas ubicadas en los órdenes tercero a decimosegundo, de izquierda a derecha. Dentro de este gran grupo, el escandio, el itrio y el lantano se incluyen en la serie de los lantánidos y el actinio en la de los actínidos, que constituyen las dos series de elementos de transición interna, que agrupa elementos

Metales de transición y elementos de transición interna

Nombre

Número Configuración Símbolo atómico electrónica

Escandio Itrio Lantano Actinio Titanio Circonio Hafnio Vanadio Niobio Tántalo Cromo Molibdeno Wolframio Manganeso Tecnecio Renio Hierro Rutenio Osmio Cobalto Rodio Iridio Níquel Paladio Platino Cobre Plata Oro Zinc Cadmio Mercurio

Sc Y La Ac Ti Zr Hf V Nb Ta Cr Mo W Mn Tc Re Fe Ru Os Co Rh Ir Ni Pd Pt Cu Ag Au Zn Cd Hg

21 39 57 89 22 40 72 23 41 73 34 42 74 25 43 75 26 44 76 27 45 77 28 46 78 29 47 79 30 48 80

3d14s2 4d15s2 5d16s2 6d17s2 3d24s2 4d25s2 4f145d26s2 3d34s2 4d45s1 4f145d36s2 3d54s1 4d55s1 4f145d4 3d54s2 4d55s2 4f145d56s2 3d64s2 4d75s1 4f145d66s2 3d74s2 4d85s1 4f145d76s2 3d54s2 4d10 4f145d96s1 3d104s1 4d105s1 4f145d106s1 3d104s2 4d105s2 4f145d106s2

Estado de oxidación +3 +3 +3 +3 +2, +3, +4 +4 +4 +2, +3, +4, +5 +3, +5 +5 +2, +3, +6 de +2 a +6 +4, +6 +2, +3, +4, +7 +4, +6, +7 +4, +6, +7 +2, +3 +2, +3, +4, +6, +8 +2, +3, +4, +6, +8 +2, +3 +2, +3, +4 +3, +4 +2, +3 +2, +4 +2, +4 +1, +2 +1 +1, +3 +2 +2 +1, +2

Radios atómicos (Å)

Energía de ionización (eV)

Punto de ebullición (ºC)

Punto de fusión (ºC)

1,51 1,81 1,86 – 1,45 1,58 1,66 1,31 1,43 1,42 1,24 1,36 1,37 1,24 – – 1,23 1,32 – 1,25 1,34 1,35 1,24 1,37 1,38 1,27 1,44 1,40 1,32 1,48 1,46

6,56 6,6 5,6 – 6,83 6,95 5,5 6,74 6,77 – 6,75 7,18 – 7,43 – 7,87 7,89 7,5 8,7 7,86 7,7 9,2 7,63 8,33 8,96 7,72 7,57 9,22 9,39 9,0 10,43

2.400 2.500 1.800 – 3.000 3.000 3.200 3.000 3.500 4.100 2.500 4.800 5.900 1.900 – – 3.000 2.700 5.300 2.900 2.500 4.800 2.850 2.200 4.300 2.300 1.950 2.600 907 767 357

1.200 1.490 826 1.600 1.800 1.860 1.700 1.710 2.200 3.000 1.900 2.620 3.370 1.260 – 3.167 1.535 2.450 2.700 1.495 1.970 2.450 1.450 1.550 1.773 1.083 961 1.063 419 321 –38,8


__________________________________________________________________________________

de características químicas muy similares dentro de cada una de ellas. Por cuanto respecta a los metales de transición, son elementos de alta energía de enlace y gran fuerza de cohesión. Todos ellos tienen estados de oxidación variables y propiedades metálicas muy acentuadas, por lo que son duros y buenos conductores térmicos y eléctricos, y presentan puntos de fusión y ebullición elevados, con la excepción del mercurio, que es líquido a temperatura ambiente. Dado que se trata de un conjunto muy numeroso de elementos, es conveniente destacar las características de los más abundantes y utilizados, ya que otros como el niobio, el tántalo o el hafnio son proporcionalmente muy escasos y, en consecuencia, de interés secundario. El titanio se extrae del mineral denominado rutilo y tiene aplicación en la elaboración de cosméticos y dentífricos, así como en la fabricación de aleaciones ligeras. El cromo, por su parte, se obtiene de minerales como la cromita y se aplica en el proceso de protección de superficies metálicas denominado cromado. El wolframio constituye la materia prima para la fabricación de los filamentos de las lámparas incandescentes, mientras que el níquel se emplea en recubrimientos metálicos, y el cobre, contenido en minerales como la cuprita, la malaquita y la calcopirita, tiene como aplicación fundamental la de servir como materia prima para los filamentos de los cables eléctricos. El hierro, contenido en minerales como la magnetita o el oligisto, es uno de los materiales de construcción y manufactura más empleados en distintas aleaciones, como el acero (mezcla de hierro y carbono), de gran dureza, resistencia y elasticidad. El mercurio se usa en la fabricación de termómetros y de lámparas de mercurio, que se emplean como fuentes de rayos ultravioleta. Por último, los metales nobles, como la plata, el oro o el platino, presentan gran resistencia a la corrosión y suelen encontrarse en estado libre en la naturaleza. Tradicionalmente se han empleado en joyería y, en la antigüedad, en la acuña-

Elementos de la tabla periódica

145

ción de moneda (han llegado a nuestros días como patrón comparativo de todas las unidades monetarias). Más modernamente, las sales de plata han hallado aplicación en la industria fotográfica. En aleaciones, la plata, el oro y el platino se aplican también en conexiones electrónicas de precisión, como la de las grandes redes telefónicas o las de las naves espaciales. Forman parte también de los materiales empleados en odontología para elaborar puentes y coronas. Por cuanto se refiere a las series de transición interna, cabe destacar el uranio y el plutonio, metales radiactivos que constituyen la materia prima para la industria nuclear.

_ Preguntas de repaso 1. Citar alguno de los métodos de obtención del hidrógeno. 2. Indicar si las siguientes frases son verdaderas o falsas: a) El grafito es una forma alotrópica del carbono. b) De todos los gases nobles, sólo el radón forma parte de la composición de la atmósfera. c) El cloro se usa como agente de blanqueo del papel y tejidos de algodón. d) Todos los elementos halógenos son no metales y tienen una gran tendencia a completar su capa electrónica externa adicionando un electrón. 3. Indicar si el hidrógeno tiene isótopos y, en caso afirmativo, cuáles. 4. ¿Cuál es el método más utilizado para la obtención de metales alcalinos?


146

QUÍMICA

____________________________________________________________________________________________________


O

QUÍMICA ORGÁNICA

HN

N

O

N CH3

Generalidades Se conoce como química orgánica a la química de los compuestos del carbono. El nombre de química orgánica se debe a que en un principio estos compuestos se obtenían solamente de los seres vivos, animales o vegetales, diferenciándose de la llamada química inorgánica, cuyos compuestos se obtenían de los minerales. Se pensaba que los compuestos orgánicos no se podrían obtener en el laboratorio, ya que sería necesaria la intervención de un ser vivo para su formación. En 1828, el químico alemán Wöhles logró obtener en laboratorio una sustancia orgánica, la urea, y a partir de ese momento se modificaron las teorías anteriores, iniciándose el gran desarrollo de la química orgánica, que se aceleró de una manera impresionante en el siglo XX. Hasta hace relativamente poco tiempo, la mayoría de los compuestos orgánicos se obtenían de los vegetales. En 1925, más de un 80% de los productos orgánicos obtenidos en la industria se generaban a partir de la fermentación de sustancias vegetales y más de un 10%, de la destilación de la madera. En la actualidad, buena parte de estas sustancias se obtienen a partir de la destilación fraccionada del petróleo. Otra fuente de productos orgánicos es el carbón, aunque no tan fundamental como la anterior. La cantidad de sustancias que contienen carbono como componente principal es tan elevada que es necesario que su estudio se haga por separado del resto de los elementos. Si el número de compuestos de los elementos restantes conocidos no sobrepasa los cincuenta mil, los compuestos del carbono son más de un millón, y continuamente se están sintetizando otros nuevos y encontrando en la naturaleza nuevas sustancias que aún no se conocían. Ello se debe a la facilidad de los átomos de carbono para unirse entre sí formando largas cadenas, que hace posible el gran número de compuestos existentes. La característica fundamental que distingue a los compuestos orgánicos de los inorgánicos es su sensibilidad al calor. La mayoría de las sustancias orgánicas se descomponen cuando se someten a temperaturas elevadas, carbonizándose por encima de los 400 ºC. Hay que destacar también que la mayoría de las sustancias orgánicas son combustibles, es decir, arden con facilidad.

CH3

N

Los compuestos orgánicos desempeñan un papel fundamental en los procesos químicos que tienen lugar en los seres vivos, interviniendo en todos los procesos vitales. Los productos farmacéuticos, detergentes, plásticos, pinturas, combustibles, etc., son ejemplos de la utilidad de los derivados del carbono para el hombre.

Enlaces del carbono Enlace simple El carbono es un elemento situado en la columna 14, según la IUPAC, en el centro del segundo período, y su número atómico es el 6: 1 H 3 4 Li Be

2 He 5 6 7 8 9 10 B C N O F Ne

La configuración electrónica del átomo de carbono en estado fundamental es: 1s2 2s2 2p2: 1s

2s

2px 2py 2pz

La capa k está completa, con dos electrones en el orbital 1s y cuatro electrones en la capa externa (2s2 2p2 ); sin embargo, estos últimos no son equivalentes, ya que dos de ellos están en orbitales 2s y los otros dos desapareados, uno en un orbital 2px y otro en un orbital 2py , quedando el orbital 2pz vacío. Estos orbitales p son de un mayor contenido energético. Sin embargo, el átomo de carbono presenta una valencia 4 en los compuestos orgánicos, lo que se explica considerando que uno de los electrones del orbital 2s puede saltar y ocupar el orbital 2pz con un aporte mínimo de energía, quedando la estructura modificada de la siguiente forma: 1s

2s

2px 2py 2pz

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


____________________________________________________________________________________________

Estos orbitales, con un electrón cada uno, pueden dar lugar a cuatro enlaces covalentes por compartición de electrones con átomos de otros elementos o con otros átomos de carbono. Al formarse esta nueva estructura, los orbitales donde se mueven los electrones 1s y 3p cambian de forma y se superponen modificando su orientación espacial, dando lugar a 4 nuevos orbitales, con la misma energía. Se denominan sp3 , híbridos ente los orbitales s y p. Al combinarse el carbono con el hidrógeno, estos enlaces se orientan en el espacio en la dirección de los vértices de un tetraedro regular en cuyo centro se encuentra el átomo de carbono y en cada vértice un átomo de hidrógeno. El ángulo que forman entre sí cada dos enlaces es de 109º 28’. Cuando se unen dos o más carbonos entre sí para dar lugar a una cadena se puede pensar que se unen una serie de tetraedros por un vértice. Esto no es exactamente la realidad, pero da una idea de cómo son las uniones entre carbonos. La realidad es que los orbitales híbridos de ambos carbonos se unen entre sí para dar lugar a un orbital molecular muy estable denominado orbital sigma. Los tetraedros se unen por vértices, pero no es una unión plana, sino que formaría un zig-zag, donde los carbonos se sitúan a una distancia de 1,5 Å en estos enlaces sencillos, formando una cadena de carbonos con estructura zigzagueante

Enlace doble El átomo de carbono se puede unir a otro átomo de carbono compartiendo dos pares de electrones. Este tipo de enlace se denomina no saturado y se realiza uniéndose los dos tetraedros por una arista. Este tipo de enlace se representa por dos rayitas y se llama doble enlace: | | –C=C– | | Los carbonos unidos por un enlace doble presentan menos movilidad que los enlaces simples, ya que los tetraedros están unidos por la arista en lugar de por el vértice. Este enlace se forma por el solapamiento de dos zonas perpendiculares al plano del papel, dando lugar a un enlace π, formado por los orbitales p, y un enlace σ más fuerte que el π, formado al unirse los orbitales paralelos al plano del papel. Esta doble unión se conoce con el nombre de hibridación sp2 : π

H

H

σ

σ C

σ H

σ

C σ H

Este doble enlace impide la rotación de los carbonos, modificando también el ángulo entre el doble enlace y los enlaces del carbono con los hidrógenos, que es de 120º,

Química orgánica

147

quedando entre sí más próximos que en el enlace sencillo, siendo la distancia de separación de 1,34 Å. Este enlace no sólo se da entre carbonos, sino también en las uniones del carbono con el oxígeno y con el nitrógeno.

Enlace triple Además de los dos tipos de enlace anteriormente expuestos, existe una tercera forma de unirse entre sí dos carbonos; es el denominado enlace triple, llamado así porque los dos carbonos comparten entre sí tres pares de electrones que se colocan en orbitales híbridos sp. En este enlace, las moléculas no tienen movilidad, y la unión se realiza mediante un enlace de tipo σ y da enlaces más débiles de tipo π. Este enlace ordinariamente se representa por dos carbonos unidos entre sí por tres rayitas (– C ≡ C –). Se considera que los dos tetraedros se unen entre sí por una cara. Sobre estas bases moleculares se asientan las leyes que regulan la formulación y la nomenclatura de los compuestos orgánicos.

Formulación orgánica En cualquier sustancia, conocidos los porcentajes en peso de los elementos que la componen y sus pesos atómicos, se puede establecer su fórmula empírica. Sin embargo, en las sustancias orgánicas muchas veces esto no es suficiente, al existir compuestos con propiedades muy diferentes, pero cuya fórmula empírica coincidiría. En química orgánica, para que una sustancia quede bien definida es necesario conocer la denominada fórmula estructural. En ella se representan los diferentes átomos que la componen y la disposición que tienen unos de otros con los diferentes enlaces que les unen. Esta fórmula estructural se presenta a veces en forma desarrollada y, más comúnmente, semidesarrollada. El compuesto llamado butano se representa: Fórmula molecular

C4 H10

Fórmula semidesarrollada

CH3 - CH2 - CH2 - CH3

Fórmula desarrollada

H H H H | | | | H–C–C–C–C–H | | | | H H H H

A veces, cuando una sustancia es muy característica, se recurre a la representación geométrica, sin llegar a especificar los átomos que la componen. La fórmula del benceno se representa esquemáticamente:


148

QUÍMICA

____________________________________________________________________________________________________

También se recurre a los llamados modelos moleculares, con los que se pueden representar las moléculas en tres dimensiones; son maquetas formadas por varillas que representan los enlaces y esferas de diferentes colores para encarnar los distintos átomos:

Las esferas de mayor tamaño, representan los átomos de carbono y las de menor tamaño, los átomos de hidrógeno.

Estructuras resonantes

Isomería

En la práctica se da muchas veces el fenómeno en función del cual para una misma molécula es posible representar más de una fórmula, cumpliendo cada una de ellas los requisitos de la teoría de Lewis sobre el enlace covalente, pero sin explicar completamente el tipo de enlace. A este fenómeno se le denomina resonancia y se presenta en moléculas con dobles y triples enlaces. La estructura molecular del benceno, compuesto orgánico de fórmula C6 H 6 , fue estudiada por Kekulé, que llegó a la conclusión de que correspondía a un híbrido de resonancia entre las fórmulas: C–H

C–H

H–C

C–H

H–C

C–H

H–C

C–H

H–C

C–H

C–H

que permanece inalterable, y por otro el grupo funcional -OH, que es el que va a modificarse en las reacciones químicas. La mayor o menor longitud de la cadena hidrocarbonada va a influir muy poco en el comportamiento del grupo -OH. Todos estos compuestos en los que únicamente varía dicha longitud van a formar lo que se conoce con el nombre de serie homóloga. Cada serie homóloga vendrá determinada por el grupo funcional que intervenga. La fórmula para cada compuesto en una serie homóloga se diferencia del anterior o del posterior únicamente porque tiene un grupo -CH2 - más que el anterior y menos que el siguiente.

C–H

Este fenómeno se debe a la movilidad de los electrones en determinados enlaces. La resonancia determina la zona del espacio en la que puede variar la estructura de una molécula. Una molécula es más estable cuanto más parecidas sean las diferentes estructuras resonantes y mayor sea su número.

Grupos funcionales Se llama grupo funcional al átomo o grupo reemplazante que determina las propiedades químicas del compuesto formado, comunicándole identidad propia. Los compuestos más sencillos en química orgánica son los hidrocarburos, que están formados únicamente por átomos de carbono e hidrógeno. El resto de los compuestos orgánicos están constituidos por una cadena de carbono e hidrógeno llamada cadena hidrocarbonada y un grupo de átomos que le confiere entidad, que constituye lo que se conoce como grupo funcional. Ejemplo. El propanol de fórmula CH 3 - CH 2 CH2 OH, o alcohol propílico, está formado por dos partes bien diferenciadas; por un lado, el radical propilo

A diferencia de lo que sucede en los compuestos inorgánicos, en química orgánica, una misma fórmula empírica puede corresponder a varios compuestos diferentes. A estos compuestos se les llama isómeros. Generalmente, el fenómeno de isomería se debe a las distintas reagrupaciones que pueden presentar los átomos, teniendo en cada caso una fórmula estructural diferente. Hay dos tipos genéricos de isomería: – isomería plana, que a su vez puede ser de cadena, de posición y de función; – isomería espacial, que puede ser geométrica, óptica o especular. Isomería de cadena. La única diferencia que presentan los isómeros es la distinta estructuración de la cadena hidrocarbonada. Ejemplo. El butano y el metil propano tienen la misma fórmula empírica, C4 H10, y sin embargo son sustancias distintas y con propiedades bien diferenciadas:

CH3 – CH2 – CH2 – CH3 butano

CH3 | CH3 – C – CH3 metil propano

Isomería de posición. La isomería de posición se presenta en compuestos formados por una misma cadena carbonada, pero que muestran colocado en diferentes posiciones un mismo grupo funcional o un doble enlace. Ejemplos. El buteno-1 y el buteno-2 tienen de fórmula empírica C4 H8 . Sus fórmulas estructurales respectivas son: H | CH2 = C – CH2 – CH3 buteno-1

H H | | CH3 – C = C – CH3 buteno-2

Estos dos compuestos se diferencian en la posición del doble enlace en la cadena hidrocarbonada. El ortodiclorobenceno y el paradiclorobenceno son un


____________________________________________________________________________________________

Química orgánica

149

Grupos funcionales orgánicos más usuales Grupo funcional

Nombre

Fórmula

Tipo de compuestos

Ejemplo

–OH

Hidroxi

R-OH

Alcoholes

CH3 - O H Metanol

– SH

Sulfhidrilo

R-SH

Tioles

CH3 -CH2 - S H Etanotiol

–O –

Oxi

R-O-R’

Éter

CH3 -CH2 -O-CH2 Etano-oxi-metano

– S–

Sulfuro

R-S-R’

Sulfuro

CH3 -S-CH2 Sulfuro de dimetilo

– Hl

Halo

R-Hl

Haluro

CH3 -Cll Cloruro de metilo

– NH2

Amino

R-NH2

Aminas

CH3 -CH2 -NH2 Etilamina

– NO2

Nitro

R-NO2

Derivados nitrados

CH3 -NO2 Nitrometano

– C≡N

Ciano

R-CN

Nitrilo

CH3 -CH2 - C N Propanonitrilo

– C=O

Carbonilo

R-CO-R’

Cetonas

CH2 -CO-CH3 Propanona

Aldehído

R-CHO

Aldehído

CH3 -CHO Etanol

Carboxilo

R-COOH

Ácidos

CHOOH Metanoico

Éster

R-COO-R’

Éster

CH3 -COOCH3 Etanoato de metilo

Amida

R-CONH2

Amina

CH3 -CH2 -CONH2 Propanamida

O || – S–

Sulfoxi-

R-SO=R’

Sulfóxido

CH3 -SO-CH3 Dimetil sulfóxido

\ //O S / \\O

Sulfona

R-SO2 -R’

Sulfona

CH3 -CH2 -SO2 -CH3 E t i l - metil sulfona

–C

–C

–C

–C

//O \H //O \OH //O \ O – R’ //O \ NH

2

ejemplo de isomería de posición debida a la distinta colocación del grupo funcional, los dos átomos de cloro, según esté colocado en carbonos consecutivos u opuestos: Cl

Cl Cl

ortodiclorobenceno

tintas; sin embargo, su fórmula empírica resulta ser la misma: C3 H 6 O: O // CH3 – CH2 – C \ H propanal

Cl paradiclorobenceno

Isomería de función. Se da en compuestos con idéntica fórmula molecular, pero que pertenecen a grupos funcionales distintos. Ejemplo. El propanal y la propanona son un aldehído y una cetona, respectivamente, con propiedades muy dis-

O || CH3 – C – CH3 propanona

Isomería geométrica. Se presenta en compuestos que tienen un doble enlace entre carbonos, sin posibilidad de rotación en torno a él. Cuando los grupos unidos a cada uno de los átomos de carbono que presentan el doble enlace son diferentes, resultan dos compuestos distintos según se coloquen de forma simétrica o no respecto del doble enlace. Cuando presentan simetría se nombran anteponiendo el prefijo


150

QUÍMICA

____________________________________________________________________________________________________

cis y en caso contrario con el prefijo trans: R H

C=C cis

R'

R

H

H

O

trans

H R'

O C

OH

C=C

C=C

H

C OH H

ácido cis-butenodioico

O C HO H

C=C

H C

O OH

ácido trans-butenodioico

Si los carbonos pudiesen girar libremente en torno al doble enlace, estas dos fórmulas serían la misma. Al no poder hacerlo, las posiciones son fijas. Un caso típico es la isomería del ciclo-hexano, C6 H 12, que presenta dos configuraciones características, pudiendo pasar de una a otra por simple torsión. Estas dos estructuras son conocidas con el nombre de silla y de barca, siendo la de silla la más estable:

forma de silla

forma de barca

La isomería geométrica también se llama estereoisomería y esteroisómeros a los isómeros, por tratarse de una distribución diferente en el espacio. Isomería óptica o especular. La isomería óptica se da en aquellos compuestos que presentan dos estructuras espaciales que no se pueden superponer, pero que son simétricas con respecto al plano que las separa, como si fuese una de ellas la imagen reflejada de la otra en un espejo. De ahí el nombre de isomería especular con que también se le conoce. Se presenta en aquellos compuestos que tienen un átomo de carbono asimétrico, es decir, que tienen ocupados sus enlaces por radicales diferentes. Estos isómeros reciben el nombre de enantiomorfos, y ambos tienen las mismas propiedades químicas y físicas excepto las diferentes formas de polarizar la luz. Uno de ellos desvía el plano de polarización un cierto ángulo en el sentido de las agujas del reloj, a la derecha (dextrógiro), y el otro lo desvía en sentido antihorario, hacia la izquierda (levógiro). Si se mezclan dos disoluciones de la misma concentración molar en ambos isómeros ópticos, no presenta actividad óptica y se denomina mezcla racémica. Al isómero dextrógiro se le llama d, y al levógiro, l, siendo la mezcla racémica dl. Dicha mezcla se define, pues, como el compuesto constituido por cantidades iguales de los isó-

meros dextrógiro y levógiro de una sustancia orgánica. En consecuencia, la mezcla resulta ópticamente inactiva. Ejemplo. El ácido propanodiol-dioico presenta isomería óptica: OH | C=O | OH – C – H | H – C – OH | C=O | OH

HO | O=C | H – C – OH | HO – C – H | O=C | HO

forma d – dextrógira

forma l – levógira

Separación de los dos isómeros ópticos Al ser prácticamente todas sus propiedades iguales, es muy difícil separar dos isómeros de la mezcla racémica. A este proceso de separación se le llama resolución del racémico y se puede lograr de varias formas: a) Mecánica. Se realiza cuando la sustancia cristaliza en formas de tamaño apreciable. Al ser como un objeto y su imagen, se puede separar con la mano o con pinzas. Este método lo utilizaba Pasteur. b) Por microorganismos. Ciertos hongos o bacterias destruyen uno de los dos isómeros, dejando el otro intacto. Presenta la desventaja de perder totalmente uno de los dos isómeros. c) Por cristalización selectiva. Consiste en añadir un pequeño cristal de uno de los dos isómeros a una disolución saturada de la mezcla racémica. d) Añadiendo un compuesto ópticamente activo. Se trata de obtener sales de ambos isómeros neutralizando un ácido o una base del racémico con una base o un ácido, respectivamente, y obteniendo dos sales diferentes y fáciles de separar, de las que luego, mediante hidrólisis, se recuperan cada uno de los isómeros.

Reacciones orgánicas Mecanismos de las reacciones orgánicas Las reacciones químicas se realizan mediante la ruptura de enlaces en unas sustancias para formar otras nuevas. Como la mayoría de los enlaces en las moléculas orgánicas son covalentes, es decir, bastante fuertes, el mecanismo de las reacciones orgánicas está basado en cómo romper este tipo de enlaces, teniendo en cuenta que al ser un enlace fuerte, para lograr la ruptura se necesita un gran aporte energético, por lo que la energía de activación de estos procesos será elevada. La ruptura del enlace covalente de las moléculas se puede realizar únicamente de dos formas:


____________________________________________________________________________________________

a) Ruptura homolítica, en la que el par de electrones compartido se reparte entre los dos átomos que integraban el enlace, dando lugar a la formación de radicales libres. Los radicales libres son neutros, no llevan carga eléctrica, pero poseen un electrón libre que se puede utilizar para compartir con otro átomo: A : B → A. + B. Estas reacciones tienen lugar a temperaturas elevadas, en estado gaseoso y en presencia de luz. b) Ruptura heterolítica, en la que el par electrónico es retenido completamente por uno de los dos átomos, dando lugar a la formación de iones: A : B → A:. + B+ El compuesto A se queda con el par de electrones, quedando cargado negativamente, y se llama combustión. Y el compuesto B pierde un electrón, quedando cargado positivamente, y recibe el nombre de ion carbónico. Estas reacciones tienen lugar a temperatura adecuada y en presencia de un catalizador.

Reactivos e intermedios en las reacciones orgánicas La mayor parte de las reacciones orgánicas no tiene lugar de forma espontánea. Existen sustancias orgánicas que facilitan la realización de la reacción y otras que permiten controlar el proceso. Estas sustancias reciben el nombre de reactivos e intermedios. Los primeros intervienen en las reacciones y los segundos se forman como productos intermedios en el transcurso de la reacción. Reactivos nucleófilos. Los reactivos nucleófilos poseen en su capa externa un par de electrones no enlazantes, que actúan sobre otro átomo formando un enlace covalente, es decir, actúan como bases de Lewis sin serlo en sentido estricto. La mayor o menor actividad del reactivo está determinada, entre otros factores, por la polaridad de los electrones, por la basicidad del reactivo y por el disolvente en el que actúa. Los reactivos nucleófilos son de gran interés en química orgánica, ya que intervienen en la mayor parte de las reacciones orgánicas que se realizan en la industria. Reactivos electrófilos. Los reactivos electrófilos presentan orbitales de valencia vacíos, es decir, tienen carencia de electrones, por tanto aceptan electrones. Su comportamiento es el de un ácido de Lewis sin serlo realmente, ya que no se puede identificar acidez con electrofilia. En la reacción con reactivos electrofílicos se emplean catalizadores inorgánicos como el ácido sulfúrico, cloruro de aluminio, cloruro férrico, etc. Los reactivos de adición entre hidrocarburos no saturados son reacciones electrofílicas. Intermedios de reacción. Son compuestos inestables que se forman durante el proceso de determinadas reacciones químicas. Debido a su inestabilidad reaccionan inmediatamente, dando lugar a la siguiente fase de la reac-

Química orgánica

151

ción, por lo que no pueden ser aislados. Los intermedios de reacción son los radicales libres, los iones carbonio y los carbocationes. Los radicales libres proceden de un enlace destruido homolíticamente. Son átomos neutros, pero que conservan uno de los electrones del par enlazante. Este electrón desapareado les va a permitir reaccionar fácilmente. La formación de radicales libres está condicionada por el aporte energético, ya que es necesaria una gran cantidad de energía y son muy inestables. Los iones carbonio o carbocationes son reactivos electrofílicos formados por un átomo o conjunto de átomos, donde uno de sus átomos de carbono presenta una deficiencia electrónica: en su capa externa faltan electrones, por lo que tienen un marcado carácter iónico. Los carbaniones son producto de rupturas heterolíticas de enlaces y están formados por un átomo o grupo de átomos, siendo uno de ellos un átomo de carbono que conserva el par electrónico, por lo que su carga es negativa y por tanto actúan como reactivos nucleófilos muy inestables. Los radicales libres, los iones carbonio y los carbaniones se clasifican, según el tipo de carbono enlazante, en primarios, secundarios o terciarios. La estabilidad es máxima en los primarios y mínima en los terciarios.

Tipos de reacciones El número de compuestos orgánicos actualmente conocidos supera el millón, y el número de reacciones que entre ellos pueden producirse es aún mayor. No obstante, los mecanismos de estas reacciones no se encuentran muy diversificados, lo que permite clasificarlos en un número reducido de grupos, que se exponen a continuación: Reacciones de sustitución. Son las de mayor interés químico e industrial. Se llaman también de desplazamiento. Consisten, fundamentalmente, en la sustitución de un átomo o grupo de átomos por otro en una molécula. Dentro de este grupo de reacciones se encuentran: – Reacciones homolíticas. Se producen en los hidrocarburos saturados, es decir, en los compuestos de carbono e hidrógeno que tienen todos los enlaces de carbono cubiertos y, por consiguiente, no tienen enlaces dobles ni triples. Estas reacciones consisten en sustituir un átomo de hidrógeno por otro átomo o grupo de átomos de Cl, Br, etc., en los que se da la formación de radicales libres y se producen en cadena. Por ejemplo, el cloro reacciona con el metano para dar cloruro de metilo y ácido clorhídrico. CH4 + Cl2 → CH3 Cl + HCl El mecanismo de la reacción es el siguiente: ••

••

••

••

• • • • • Cl • → • Cl • + • Cl • 1.º •• Cl •• •• •• ••

El cloro por la acción de la luz solar se disocia, y los átomos que actúan como radicales libres reaccionan rápidamente con el metano.


152

2.º

QUÍMICA

____________________________________________________________________________________________________

H

H ••

••

••

••

••

H •• Cl •• H + • Cl •• → HCl + H •• C • ••

H

H

El cloro se une con uno de los hidrógenos de hidrocarburo saturado formando ácido clorhídrico y un radical alquilo con gran capacidad de reacción. 3.º

H

H

••

••

••

H Cl + Cl Cl • •

• •

••

H

• •

• •

••

••

más rápidas cuanto mayor carácter ácido tenga el reactivo atacante: HCl < HBr< HI Ejemplo:

• •

••

••

••

••

→ H C. •• Cl + •• Cl •• • •

H

El radical metilo reacciona rápidamente con una molécula de cloro para dar cloruro de metilo y un átomo de cloro libre. Estos átomos de cloro libre pueden reaccionar con otra molécula de metano y repetir el proceso anterior indefinidamente, dando lugar a una reacción en cadena. La energía liberada en cada una de estas reacciones es la misma, ya que el proceso es el mismo: ruptura de un enlace Cl-Cl y otro C-H, y formación de un enlace C-Cl y otro Cl-H.

CH3 – CH = CH2 + Cl → CH3 – CH – CH2 | | Cl H Según la regla de Horkownikov, el cloro, que es el polo negativo, se une al carbono más sustituido, en este caso el intermedio, y el hidrógeno al menos sustituido, deshaciendo el doble enlace. Las reacciones de adición se realizan mediante un mecanismo iónico, en fase líquida y a temperatura ordinaria. Además de los tipos de reacciones expuestos anteriormente, existen otros tipos de reacciones orgánicas, como las de condensación, en las que se elimina una molécula pequeña entre dos sustancias reaccionantes, expulsándose el agua. – Reacciones de transposición. Se produce una reorganización de la molécula, obteniéndose un isómero de la original:

– Reacciones de eliminación. Estas reacciones se caracterizan por la pérdida o separación de una molécula pequeña de otra mayor, dando lugar a la formación de enlaces múltiples en la molécula mayor:

H O | // CH2 = C – OH ↔ CH3 – C \ H el etanol se transforma en etanal

H H H H | | | | H – C – C – H → H – C = C – H + HCl | | H Cl

– Reacciones de combustión. Son oxidaciones de una sustancia en presencia de oxígeno; es una reacción violenta, que se realiza con desprendimiento de luz y calor. Los productos son dióxido de carbono y agua:

El cloroetano se rompe, dando lugar al etano y al ácido clorhídrico.

CH4 + 2O2 → CO2 + 2H2 O + calor

– Reacciones de adición. Son el proceso inverso a las reacciones de eliminación, y consisten en agregar una molécula a través de un enlace múltiple, pasando de triple a doble o de doble a sencillo. Esta molécula se incorpora al enlace de los dobles o triples enlaces debido a que el enlace es de poca energía y fácilmente polarizable. Si se realiza por la poca energía del enlace es una reacción homolítica y si tiene lugar por la polarización del enlace es heterolítica. Cuando un ion positivo o el extremo positivo de una molécula polarizada se acerca a un doble o triple enlace, los electrones móviles del enlace se aproximan hacia uno de los carbonos, que se apropiará del par de electrones que anteriormente estaban compartidos. Éste es el denominado efecto electrómero, que es instantáneo y se produce en el momento del choque con una molécula polar. Reacciones típicas de adición son las realizadas entre un haluro de hidrógeno y un hidrocarburo etilénico. Se realizan siguiendo la regla de Horkownikov, por la que el halógeno se une siempre al carbono más sustituido y el hidrógeno al menos sustituido. Estas reacciones son

– Reacciones de oxidación-reducción. Son mucho más complejas que las correspondientes a los productos inorgánicos, ya que los compuestos orgánicos presentan diversos grados de oxidación según el hidrocarburo saturado de igual número de átomos de carbono.

_ Preguntas de repaso 1. ¿Qué es la función química? 2. Indicar cinco de las funciones orgánicas más importantes. 3. ¿Qué son compuestos isómeros? 4. ¿Qué tipo de reacción ocurre en el gas butano cuando arde al cocinar los alimentos?


O

HIDROCARBUROS

HN

O

N

N CH3

L

os hidrocarburos son sustancias orgánicas compuestas únicamente por carbono e hidrógeno. Se obtienen fundamentalmente del petróleo y del gas natural. Se pueden clasificar en los siguientes grupos:

Hidrocarburos

{ {

hidrocarburos saturados normales, alcanos o parafinas alifáticos hidrocarburos cíclicos o cicloalcanos alquenos alquinos o hidrocarburos aromáticos acetilénicos

Los hidrocarburos alifáticos son los que se encuentran en las grasas naturales. Los hidrocarburos aromáticos son derivados del benceno y la mayor parte están dotados de un cierto aroma.

Hidrocarburos saturados normales o alcanos Están formados únicamente por átomos de carbono unidos por enlaces simples y átomos de hidrógeno; se les llama también parafinas. Este nombre hace referencia a su falta de reactividad. Tienen gran interés en la industria, principalmente como combustibles. Su fórmula general es la siguiente: CnH2n + 2, siendo n un número entero El primero y más sencillo de los alcanos es el metano, cuya fórmula es: H | H–C–H | H

(CH4)

La molécula es tetraédrica, estando el carbono situado en el centro y los hidrógenos hacia los vértices.

CH3

N

El resto de los hidrocarburos se puede decir que son derivados del metano por sustitución de átomos de hidrógeno por grupos metilo, formando cadenas. Se llama carbono primario a aquel que está unido solamente a otro átomo de carbono; carbono secundario, al que está unido a dos átomos de carbono; carbono terciario, a tres, y cuaternario, a cuatro. En las cadenas carbonadas que forman los alcanos, todos los átomos de carbono mantienen la estructura tetraédrica de sus moléculas determinadas por los enlaces sp3. La longitud del enlace C – H es de 1,07 Å y la del C – C, de 1,5 Å.

Nomenclatura La Unión Internacional de Química Pura y Aplicada (IUPAC) establece las normas aceptadas por todos los países para nombrar los compuestos orgánicos, aunque a veces se siga utilizando para algunos compuestos el nombre vulgar con el que tradicionalmente se le ha conocido a lo largo de la historia. Las moléculas de los hidrocarburos saturados se nombran anteponiendo el prefijo numeral latino o griego correspondiente al número de átomos de carbono y la terminación -ano. En el primer recuadro de la página siguiente, se especifican los cinco primeros elementos. A partir del término sexto, inclusive, se utiliza el prefijo griego que indica el número de carbonos (v. segundo recuadro de pág. 150). Los radicales alquilos normales se nombran como el hidrocarburo saturado de igual número de carbonos, pero terminado en -il o -ilo CH3– metil o metilo CH3 – CH2– etil o etilo CH3 – CH2 – CH2– propil o propilo Cuando existe una cadena ramificada, para nombrarla correctamente se debe determinar primero cuál es la cadena principal y cuál es el carbono por el que se van a empezar a numerar los carbonos, pasando a continuación a numerar el resto. Se considera cadena principal la que tiene mayor nú-

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


154

QUÍMICA

____________________________________________________________________________________________________

Nomenclatura de hidrocarburos saturados: primeros elementos N.º de carbonos

Fórmula desarrollada

1

H | H–C–H | H

2

HH | | H–C–C–H | | HH

3

HHH | | | H–C–C–C–H | | | HHH

4

5

Fórmula semidesarrollada Nombre CH4

CH3 – CH3

Metano

Etano

CH3 – CH2 – CH3 Propano

CH3 – CH2 – HHH H | | | | H–C–C–C–C–H CH2 – CH3 | | | | HHH H

zadores de las cadenas laterales. En caso de obtener el mismo número al empezar por cualquiera de los extremos, se empezará a numerar por el extremo cuyo radical más cercano se nombre primero. Antes del nombre de la cadena principal se escriben por orden alfabético los nombres de los radicales alquilo sin la o final. Si hay varios radicales iguales se utilizan los prefijos di-, tri-, tetra-, etc., indicadores de su número. Delante del nombre del radical y separados por guiones se colocan los números correspondientes al carbón en que está situado el radical; estos números se llaman localizadores. Ejemplo:

Butano

H H H H H CH3 – CH2 – | | | | | H–C–C–C–C–C–H CH2 – CH2 – CH3 Pentano | | | | | HHH HH

mero de carbonos. En caso de que haya varias cadenas con igual número de carbonos, la principal es la que tenga mayor número de ramificaciones. Determinada la cadena principal, se numeran sus carbonos, empezando por el extremo en que se consiga el número decimal más bajo, formado por los locali-

Nomenclatura de hidrocarburos saturados (desde el sexto elemento)

H H | | 6 H – C – C | | H H

H | H–C–H | H H–C–H | | H–C–H | | | – 5C – 4C – | | H H

H H H | | | 2 1 C – C – C – H | | | H H–C–H H | H La cadena más larga tiene 7 carbonos. Se empiezan a nombrar los carbonos por la derecha, ya que el número obtenido con los localizadores es 2 – 4 – 5, menor que el 5 – 4 – 2 que se obtendría empezado por el carbono de la izquierda. Aparecen dos radicales metil y uno etil. Se nombra primero el etil, ya que se utiliza el orden alfabético. Por tanto, este compuesto sería el 2-etil-2-5-dimetil heptano. El caso contrario sería, dado el nombre de la molécula, escribir su fórmula. Para ello: 7

3

1. Se escribe la cadena principal con los enlaces, pero sin los hidrógenos. 2. Se numeran los carbonos; es indiferente el extremo por el que se empiece. 3. Se escriben los radicales, situándolos en el carbono que indica su localizador. 4. Se completan los enlaces que queden libres con átomos de hidrógeno. Ejemplo: 4-etil-3-3-4-trimetilheptano: 1. La cadena es de siete carbonos, prefijo hept-:

6 7 8 9 10 11 12 13 14 15 16 20

carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos

Hexano 21 Heptano 22 Octano 23 Nonano 30 Decano 31 Undecano 40 Dodecano 50 Tridecano 60 Tetradecano 70 Pentadecano 80 Hexadecano 90 Eicosano 100

carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos carbonos

Heneicosano Dicosano Tricosano Triacontano Entriacontano Tetracontano Pentacontano Hexacontano Heptacontano Octacontano Nonacontano Hectano

| | | | | | | –C–C–C–C–C–C–C– | | | | | | | 2. Se numeran los carbonos por la izquierda: | | | | | | | – 1C – 2C – 3C – 4C – 5C – 6C – 7C – | | | | | | | 3. Se sitúan los radicales:


________________________________________________________________________________________________

H | H–C–H | CH3H–C–H | | | | | | | – 1C – 2C – 3C – 4C – 5C – 6C – 7C – | | | | | | | CH3 CH3 4. Se completan los enlaces libres con hidrógenos:

H H | | 2 H –C – C | | H H 1

CH3 | CH3 CH2 | | – 3C – 4C – | | CH3 CH3

H H H | | | 6 7 C – C – C – H | | | H H H

5

En la nomenclatura tradicional, si el compuesto tiene un carbono terciario se antepone el prefijo iso- y si contiene un carbono cuaternario se denomina neo-: CH3 – CH – CH3 | CH4 CH3 | CH3 – CH – CH3 | CH4

isobutano

neopentano

Sin embargo, esta nomenclatura no se emplea para compuestos de cadenas más largas.

Propiedades físicas de los hidrocarburos saturados Los cuatro primeros hidrocarburos –metano, etano, propano y butano– son gaseosos; los siguientes hasta el heptadecano son líquidos, y el resto son sólidos de contextura cérea. Los de cadena lineal tienen puntos de fusión más altos que sus isómeros de cadena ramificada.

Hidrocarburos saturados Fórmula

Nombre

Punto de fusión

Punto de ebullición

CH4 C2H6 C3H8 C4H10 C5H12 C6H14 C7H16 C8H18 C9H20 C10H22

Metano Etano Propano Butano Pentano Hexano Heptano Octano Nonano Decano

–182,6 ºC –172,0 ºC –187,1 ºC –135,0 ºC –129,7 ºC –94,0 ºC –90,5 ºC –56,8 ºC –53,7 ºC –29,7 ºC

–161,6 ºC –88,5 ºC –42,2 ºC –0,5 ºC 36,8 ºC 68,8 ºC 98,4 ºC 125,6 ºC 150,7 ºC 174,0 ºC

Hidrocarburos

155

Suelen distinguirse características diferenciadas entre los compuestos con cadenas de números par de carbonos y los que presentan cadena de número impar. Los hidrocarburos de cadena impar son menos estables, en estado cristalino, que los de cadena par y por tanto los puntos de fusión son más bajos. Al hacer una representación gráfica se observa que los puntos de fusión crecen al aumentar el número de carbonos, pero en forma de escalera; sin embargo, los puntos de ebullición aumentan uniformemente. Desarrollando los datos expuestos en la tabla anterior, obtendríamos estos gráficos:

T ºC 160 140 120 100 80 60 40 20 0 –20 –40 –60 –80 –100 –120 –140 –160 –180

1 2 3 4 5 6 7 8 9 n.º carbonos Puntos de ebullición

T ºC 0 –10 –20 –30 –40 –50 –60 –70 –80 –90 –100 –110 –120 –130 –140 –150 –160 –170 –180 –190

1 2 3 4 5 6 7 8 9 10 11 12 n.º carbonos Puntos de fusión

Todos los alcanos son insolubles en agua. Ello es debi-


156

QUÍMICA

____________________________________________________________________________________________________

do al carácter no polar de sus moléculas.

CH3 – CH2 – CH3 → CH2 = CH2 + CH4

Propiedades químicas de los alcanos Los alcanos presentan carácter inerte, es decir, no tienen tendencia a reaccionar con otros compuestos. Los ácidos y las bases fuertes no actúan sobre ellos a temperatura ambiente. Las reacciones químicas de los alcanos son fundamentalmente las de oxidación, las de sustitución, las de isomerización y la pirólisis. Cuando un reactivo ataca a un alcano, tiene más facilidad para hacerlo sobre un átomo ligado a un carbono terciario que sobre uno ligado a uno secundario, y más sobre éste que sobre uno ligado a un carbono primario. Reacción de oxidación. La principal reacción de oxidación es la combustión, que se realiza en presencia de oxígeno, con gran desprendimiento de energía. Los productos resultantes en esta reacción son dióxido de carbono (CO2) y agua (H2O).

Esta reacción se verifica a una temperatura de unos 600º C

Hidrocarburos cíclicos o cicloalcanos Si se eliminan los hidrógenos en cada uno de los carbonos situados en los extremos de una cadena carbonada (de tres o más carbonos), y ésta se gira en torno al enlace, los carbonos extremos quedan muy juntos y se forma un enlace que cierra la cadena carbonada. En el pentano, esta reacción se representa esquemáticamente de la siguiente manera:

Pentano

– Combustión del metano CH4: CH4 + 2O2 → CO2 + 2H2O

Se produce la rotación

∆H = –189,2 Kcal

Se cierra la cadena al unirse los dos carbonos primarios

– Combustión del heptano: C7H16 + 11O2 → 7CO2 + 8H2O

∆H = –1.149,9 Kcal

Se observa que estas reacciones son exotérmicas y desprenden gran cantidad de calor. Sin embargo, para iniciar la combustión hay que calentar el sistema hasta la temperatura de ignición. A partir de esta temperatura, la reacción se mantiene por sí misma, llegando a una reacción en cadena con formación de radicales libres. Reacción de sustitución. Recibe este nombre debido a que en ella se sustituye un hidrógeno por otros átomos. La principal reacción de sustitución es la halogenación, es decir, el cambio de un átomo de hidrógeno por otro de flúor, cloro, bromo o yodo. Con los hidrocarburos de mayor número de carbonos se forman distintos compuestos, ya que se puede realizar la sustitución en diversos carbonos. Sin embargo, la reacción se hace más lenta al aumentar el número de estos últimos. Con flúor, cloro y bromo, las reacciones de sustitución son exotérmicas, mientras que con yodo son endotérmicas: CH3 – CH3 + F2 → CH3F – CH3F Reacción del etano con el flúor

Reacción de isomerización. Es el proceso en virtud del cual un alcano de cadena larga se transforma en un isómero de cadena ramificada, aumentando así su poder antidetonante. Pirólisis. Este tipo de reacción se produce cuando se calientan los hidrocarburos saturados a elevadas temperaturas en ausencia de oxígeno. El proceso consiste en la ruptura del hidrocarburo, obteniéndose un hidrocarburo saturado de cadena más corta y otro no saturado. Ejemplo:

Se forman compuestos de cadena cerrada y fórmula CnH2n y se nombran con el prefijo ciclo- colocado ante el nombre del alcano normal (en la industria del petróleo son conocidos como naftenos): pentano C5H12 → ciclopentano C5H10 Ejemplos: CH2 | C – CH2 CH2

CH2 – CH2 | | CH2 – CH2

ciclopropano

ciclobutano

Estos compuestos cíclicos presentan gran estabilidad y se unen mediante reacciones de sustitución a otros compuestos, sin descomponer el anillo. En el ciclopropano, la variación de los ángulos de enlace respecto de los de las cadenas de enlace es mínima. Sin embargo, para compuestos de mayor número de carbonos, la variación es muy grande, pues las moléculas no adoptan una estructura plana, sino que se pliegan tratando de aminorar las tensiones. Un caso interesante es el ciclohexano, de fórmula C6H12, que forma una molécula muy estable con dos estructuras posibles, que reciben los nombres de silla y de barca, convirtiéndose de una en otra venciendo una barrera relacional de 41,8 KJ/mol. La conservación de los ángulos de enlace (109 ºC) es lo que les confiere a los cicloalcanos la estabilidad. En los laboratorios se han conseguido cicloparafinas con más de treinta átomos de carbono en el anillo. También existen cicloparafinas con varios anillos unidos.


________________________________________________________________________________________________

C

157

C

C

C

C

C

C

C

C

Hidrocarburos

Aplicaciones de los hidrocarburos

C

Configuración de cicloparafina formada por dos anillos (decalina)

Obtención de hidrocarburos saturados El petróleo y el gas natural son las principales fuentes de obtención de estas sustancias. El petróleo en un líquido oleoso que se encuentra formando bolsas en el interior de la tierra; tiene color variable, desde el pardo al negro, y está formado por una gran cantidad de hidrocarburos de diversa composición, correspondiendo la parte de bajo punto de ebullición a los hidrocarburos saturados. Para poder aprovechar el petróleo crudo (según se obtiene de la naturaleza), es necesario someterlo a un proceso de refinado mediante destilación fraccionada. Cada fracción es una mezcla de hidrocarburos, cuyo peso molecular queda comprendido entre determinados límites. Los restos obtenidos de la destilación fraccionada son sometidos a un nuevo proceso, denominado cracking, por el cual se rompen las largas cadenas hidrocarbonadas, dando lugar a hidrocarburos de cadena más corta. Este proceso se realiza a altas temperaturas y en presencia de catalizadores. En función del número de carbonos que contienen en su fórmula, los hidrocarburos presentan distintas características químicas y diferentes aplicaciones. El recuadro superior indica alguna de las más significativas para los productos de destilación del petróleo más importantes. Con el nombre de gas natural se hace referencia a una acumulación de gases presente en grandes depósitos en el interior de la tierra y formada principalmente por metano (el componente de mayor proporción), etano, propano y butano, que se utiliza fundamentalmente como combustible doméstico. Químicamente se obtienen los hidrocarburos mediante: – Hidrogenación de alquenos y alquinos, utilizando el platino como catalizador: R – CH = CH2 + H2 → R – CH2 – CH2 – R’ – Mediante tratamiento de los halogenuros de alquilo por reducción con hidrógeno, usando como catalizador un metal activo en medio ácido: Br CH2 – CH2 Br + 2H2 → CH3 – CH3 + 2 HBr dibromoetano

etano

ácido bromhídrico

– Reacción de Grignard. Los alcanos se pueden preparar tratando el reactivo de Grignard RMgX con compuestos que contengan hidrógeno débilmente ácido, como los alcoholes y los ácidos orgánicos.

Número de carbonos

Fracción

Aplicaciones

C1–C4

Gases (metano, etano, propano, butano)

Calefacción

C5–C6

Éter de petróleo

Disolvente

C6–C7

Ligroína (nafta ligera) Disolvente

C6–C12

Gasolina

Combustible

C12–C18

Queroseno

Combustible para aeronaves

C16–C32

Vaselina

Base para cremas y pomadas; lubricante

C18–C40

Gas-oil y fuel-oil

Combustible

C18–C40

Aceite lubricante

Lubricante

C15–C40

Alquitrán, betún asfáltico

Pavimentación de carreteras; impermeabilización de techados

Alquenos Los alquenos o hidrocarburos etilénicos son sustancias orgánicas que presentan algún doble enlace como unión entre dos carbonos; son conocidos también con el nombre de olefinas. Se consideran formados por la eliminación de dos átomos de hidrógeno en dos átomos de carbono consecutivos. Su fórmula general es: Cn H2n. Se nombran como los hidrocarburos saturados, pero sustituyendo la terminación -ano por -eno, indicando, cuando sea necesario, mediante un localizador, la posición del doble enlace. Se empieza a numerar la cadena por el carbono más próximo al doble enlace. El localizador corresponde al carbono de número más bajo. El primero de la serie es el eteno, de fórmula C2H4: H

H

C=C H

H

Presenta una molécula plana, con ángulos de enlace de 120º, correspondiente a la hibridación sp2 de los orbitales que forman el enlace σ. El enlace π correspondiente al otro enlace está formado por dos zonas aplanadas, una por encima y otra por debajo del plano donde está situado el enlace C – C:


158

QUÍMICA

____________________________________________________________________________________________________

H

CH3

H

H

H

CH3

H

C=C

C=C

C–C H

CH3 H

cis-2-buteno

H

CH3

trans-2-buteno

Nubes aplanadas que forman el enlace

Algunos alquenos conservan los nombres tradicionales; así, el etano es también conocido como etileno; el propeno, como propileno, y así sucesivamente, butileno, etc. Los radicales derivados de los hidrocarburos etilénicos se nombran con la terminación -enil; cuando sea necesario, hay que señalar la posición del doble enlace mediante un localizador: CH2 = CH– etenil CH2 = CH – CH2– 1-propenil Estos dos radicales también tienen nombres especiales; el etenil se conoce en la industria con el nombre tradicional de vinilo y el propenil, con el de alilo. Cuando el doble enlace se presenta en moléculas de cadena cerrada se denomina cicloalqueno. El más sencillo es el ciclopropano, que tiene estructura triangular: CH2 CH

CH

Cuando se presenta más de un doble enlace, son los alquenos polifuncionales o polienos. Los más sencillos son los dienos, que llevan dos dobles enlaces en la molécula: H

H H H | | C=C–C=C

H

1-3 butadieno

H

En el 1-3 butadieno, el cuantificador di indica la existencia de dos dobles enlaces en la molécula y el 1 y el 3 son los localizadores que señalan la posición de dichos dobles enlaces. Si los dobles enlaces en una molécula son consecutivos, se les llama acumulados. Cuando se alternan con enlaces sencillos, se llaman conjugados. Las estructuras en las que un carbono soporta dos dobles enlaces, aunque teóricamente son posibles, en la realidad son muy inestables. Sin embargo, las que presentan enlaces conjugados son más comunes y estables, teniendo además propiedades características. Un ejemplo de enlaces conjugados es el 1-3-5 triexeno. CH2 = CH – CH = CH – CH = CH2 La rigidez del doble enlace hace que los alquenos presenten isomería geométrica. Así, el 2-buteno tiene las formas cis y trans: cis cuando las formas iguales están próximas y trans cuando están opuestas:

Cuando los isómeros se diferencian sólo en la posición del doble enlace, aquélla se indica tradicionalmente con letras griegas en orden creciente. Según la posición del doble enlace en el buteno se tiene:

Nombre científico

Fórmula

Nombre tradicional

1-buteno

CH2 = CH–CH2–CH3

α-butileno

2-buteno

CH3–CH = CH–CH3

β-butileno

Propiedades físicas de los alquenos Los puntos de fusión de casi todos los alquenos son semejantes a los de los alcanos correspondientes. Tienen poca densidad, y son gaseosos los de hasta 4 carbonos, líquidos los de 4 a 16 y sólidos los de 16 en adelante. Son insolubles en agua y solubles en alcohol y se mezclan bien con líquidos orgánicos. El punto de ebullición aumenta a medida que la cadena se hace mayor.

Propiedades químicas de los alquenos La existencia de un enlace en el doble enlace de los alquenos confiere a éstos una considerable actividad química. Las reacciones de los alquenos son similares a las de los alcanos y además se dan otras en las que únicamente se rompe el enlace π (más débil), quedando el enlace σ (más fuerte) intacto. Este tipo de reacciones reciben el nombre de reacciones de adición. En general, esta reacción es: H H H H | | | | R – C = C – R’ + X– Y → R – C – C – R’ | | X Y Son reacciones en que dos moléculas se unen para formar una sola; tienen lugar en fase líquida y a temperatura ambiente. En ellas, el doble enlace cede un par de electrones a un sustancia electrolítica, es decir, capaz de captar electrones. Los principales tipos de reacciones de adición son los siguientes: Hidrogenación catalítica. La hidrogenación se realiza mediante la ruptura de un enlace H – H de la molécula de hidrógeno H2 y la formación de dos enlaces C – H, uno en cada carbono que formaba el doble enlace. Esta reacción es exotérmica, pero necesita la presencia de un catalizador metálico (Ni, Pt, etc.).


________________________________________________________________________________________________

CH3 – CH = CH2 + H2 → CH3 – CH2 – CH3 1-propeno

propano

El alqueno toma los hidrógenos en presencia de níquel a alta temperatura. Adición de haluros de hidrógeno. Los alquinos se unen con los ácidos hidrácidos para dar el correspondiente haluro de alquilo. En general, estas reacciones se realizan siguiendo la regla de Maskownikov. En ellas, el carbono que tiene más hidrógenos tiende a quedarse con el par electrógeno, fenómeno que recibe el nombre de acción dirigida. Ejemplo. Reacción del propeno con el ácido yodhídrico para formar yoduro de propilo o 2-iodo-propano. CH3 – CH = CH2 + IH → CH3 – CHI – CH3 propeno

A. Yodhídrico

Br | CH2 = CH – CH3 + Br2 → H – C – | H

Br | C – CH3 | H

1-2-dibromo propano

Reacciones de hidratación. La hidratación o adición de agua es una reacción de un alqueno con el agua en presencia de ácido fosfórico (H3PO4 ) como catalizador. Se obtiene un alcohol con el mismo número de carbonos que el alqueno: CH2 = CH2 + H2O → CH3 – CH2OH eteno

159

Las reacciones de condensación del isopreno, sustancia que forma parte de numerosos compuestos de gran importancia para el hombre (caucho), son muy complejas y dan lugar a dos grupos importantes, que son los terpenos y los carotenos.

Obtención y utilización Como para los alcanos, el petróleo es la fuente fundamental de obtención de alquenos. El eteno es un gas incoloro, de olor agradable; se usa como anestésico en medicina y para la maduración de frutas y verduras. Los polímeros del eteno son los denominados vulgarmente plásticos, de importancia capital en la industria. En el laboratorio se pueden obtener:

Yoduro de propilo

Adición de halógenos. Los alquenos se unen con los halógenos, formando conjuntos naturales con dos átomos del halógeno, uno en cada carbón de los que formaban el doble enlace. Estas reacciones se realizan a temperaturas ordinarias y en un medio inerte:

1-propeno

Hidrocarburos

agua

– Haciendo reaccionar los halogenuros de alquilo con hidróxido potásico, KOH: CH3 – CH2Cl + KOH → CH2 = CH2 + KCl + H2O – Por deshidratación de alcoholes. Se realiza a 400º C y en presencia de óxido de aluminio como catalizador: CH3 – CH2 – CH2OH → CH3 – CH = CH2 + H2O

Alquinos o hidrocarburos acetilénicos Son hidrocarburos no saturados que presentan un triple enlace entre dos de los carbonos de su cadena. Su fórmula general es: CnH2n-2. El elemento más sencillo es el etino o acetileno, cuya fórmula H – C ≡ C – H corresponde a una molécula lineal. Es el que tiene mayor importancia. El triple enlace de la molécula está formado por un enlace σ y dos π.

etanol

Nomenclatura Además de las reacciones anteriores, los alquenos dan lugar a otras, entre ellas las de polimerización y las de condensación del 2-metil-1,3 butadieno, llamado también isopreno, de fórmula: CH2 = C – CH = CH2 | CH3 En las reacciones de polimerización, los alquenos se unen entre sí por adición, en una reacción en cadena con formación de radicales libres, para dar los denominados polímeros, radicales libres bivalentes de elevado número de carbonos: CH2 = CH2 + CH2 = CH2 → – CH2 – CH2 – CH2 – CH2 – Dos moléculas de eteno se unen para formar una cadena de cuatro carbonos con dos enlaces libres. Este proceso se puede repetir indefinidamente. Como estas reacciones son exotérmicas, de no controlarse adecuadamente pueden llegar a ser explosivas.

Los alquinos se designan como los hidrocarburos saturados, pero sustituyendo la terminación -ano por -ino y señalando mediante un localizador la situación del triple enlace.

H | H–C≡C–C– | H

H | C–H | H

1-butino

H H | | H–C–C≡C–C–H | | H H 2-butino

Los radicales derivados de los compuestos acetilénicos se nombran mediante la terminación -inil:


160

QUÍMICA

____________________________________________________________________________________________________

H – C ≡ C -etinil HC ≡ C – CH2– → 1 → propinil

la mezcla de ambos, se obtiene una llama que puede llegar hasta los 3.500 ºC. Se utiliza para fundir metales, soldar, etc. Reacciona con el ácido clorhídrico para dar cloruro de vinilo, importantísimo en la fabricación de plásticos.

Propiedades físicas y químicas Los alquinos presentan prácticamente las mismas propiedades físicas que los alcanos y los alquenos. Son insolubles en agua y solubles en disolventes orgánicos. Tienen menos densidad que el agua. Desde el punto de vista químico, el triple enlace se considera formado por eliminación de hidrógeno en dos carbonos consecutivos.

Reacciones de los alquinos Son debidas a la polarización del triple enlace, por lo que actúan como ácidos débiles. Los tipos de reacciones son fundamentalmente de adición, oxidación y polimerización. Reacciones de adición. En este tipo de reacción, el triple enlace tiene menos reactividad para el ataque electrofílico que el doble enlace: O // CH ≡ CH + H2O → CH2 = CHOH → CH3 – C \ etino

etanol

etanal

H

El producto final de esta reacción es el etanal, pero en el proceso, como paso intermedio, se forma el etanol. También se reducen fácilmente a alquenos por adición de hidrógeno: CH ≡ CH + H2 → CH2 = CH2 Reacciones de oxidación. La oxidación en este ámbito es equivalente a la combustión. Reacciones de polimerización. Análogamente a las de los alquenos, las reacciones de polimerización son uniones entre sí de moléculas de alquinos para dar sustancias de peso molecular elevado: 3 HC ≡ CH → C6 H6

Obtención y utilización Los alquinos no se encuentran en estado natural y se obtienen de sustancias dihalogenadas de los hidrocarburos, o bien a partir del etino aumentando el número de carbonos de la cadena. El acetileno se obtiene por la unión del carburo de calcio con el agua: CaC2 + H2O → CH ≡ CH + Ca(OH)2 El alquino más importante es el propio acetileno. Es un gas incoloro y tóxico, y arde con llama luminosa. En el soplete oxiacetilénico, el combustible utilizado es el acetileno, siendo el carburante el propio oxígeno; al quemarse

Hidrocarburos aromáticos. El benceno Se conoce por hidrocarburos aromáticos a un conjunto de sustancias, la mayoría de las cuales se obtienen de los vegetales, y que se caracterizan todas ellas por incluir en su fórmula al menos un anillo bencénico. El benceno, de fórmula molecular C6 H6 y estructura cíclica, fue encontrado por primera vez en el gas del alumbrado y posteriormente en el alquitrán de hulla. Es un compuesto característico muy estable. Al tratar de determinar la fórmula estructural del benceno, hay que tener en cuenta diversas consideraciones de tipo experimental: – El benceno da solamente un derivado monosustituido, lo que quiere decir que todos los hidrógenos son equivalentes. – Según la colocación de los sustituyentes en la molécula, se obtienen tres tipos de derivados de sustituidos. – Las reacciones de sustitución son características del benceno. – El benceno presenta tres dobles enlaces, sin embargo la longitud de los enlaces C – C no se corresponde ni con la del enlace sencillo ni con la del doble enlace, sino que es intermedia: 1,39 Å. – Se mantiene la tetravalencia del carbono: H | C H–C H–C C | H

H | C C–H

H–C

C–H

H–C

C–H C–H C | H

Los carbonos tienen hibridación sp 2 y se unen mediante enlaces a los carbonos inmediatos y al hidrógeno, quedándole a cada uno de ellos un orbital p con su electrón. Estos electrones forman dos nubes de electrones, una por encima de la molécula y otra por debajo. Todo ello forma un conjunto estable, que explica sus propiedades.

Nomenclatura Los hidrocarburos aromáticos se constituyen al sustituir alguno de los hidrógenos del benceno por radicales hidrocarbonados o grupos funcionales. Si solamente se sustituye uno de los hidrógenos, se obtienen los llamados compuestos monosustituidos, que se designan situando en primer lugar el nombre del grupo sustituyente y después el del benceno:


________________________________________________________________________________________________

CH3 | C

H | C

NO2 | C

H–C

C–H

H–C

C – CH2 – CH3 H – C

H–C

C–H

H–C

C–H

C–H C | H nitrobenceno

C | H etilbenceno

C | H metilbenceno (tolueno)

C–H

H–C

2

H– C 1

C | H

C | H

C

H | C

H | C

C | H

C | H

C

C–H

difenil

5

Cuando son dos los sustituyentes (disustituidos), se utilizan los siguientes prefijos: orto-: cuando los carbonos sustituidos son consecutivos. Se abrevia como o; meta-: cuando existe sólo un carbono sin sustituir entre los sustituidos. Se utiliza m de forma abreviada; para-: cuando los sustituyentes están en carbonos opuestos; se abrevian como p. Todos ellos son isómeros de posición. Cl | C

Cl | C H–C

C – Cl

H–C

H–C

C–H

H–C

C–H

C – Cl C | H metadiclorobenceno (m-diclorobenceno) Cl | C C–H

H–C

C–H C | Cl paradiclorobenceno (p-diclorobenceno)

En ciertas moléculas, el benceno también puede aparecer unido a otros anillos bencénicos, formando los llamados hi-

H–C

C–H

H–C

C–H C | H tolueno

H–C

H–C

C – NH2

H–C

C–H C | H ácido benzoico

C–H C | H anilina

CH3 | C H–C

COOH | C H–C C–H

H | C

CH3 | C

4

C – NO2 C | H 5-nitro-3-metil-1-clorobenceno

H–C

H | C

Muchos de los derivados del benceno poseen nombres propios (tradicionales) y se les conoce como:

6

C | H ortodiclorobenceno (o-diclorobenceno)

H | C H–C

C–H

Cl – C

161

drocarburos polinucleares; entre éstos, los más importantes son los que presentan los anillos adosados: con sólo dos anillos adosados, el naftaleno; con tres, el antraceno. Cuando el benceno actúa como sustituyente, lo hace en forma de radical C6 H5– y se llama radical fenilo o fenil-.

Cuando existen dos o más sustituyentes (polisustituidos), hay que numerar los carbonos del benceno, empezando por el correspondiente al sustituyente principal y siguiendo en la dirección de las agujas del reloj: CH3 | 3 C

Hidrocarburos

COOH | C H–C C–H

OH | C C – CH3

H–C

C–H C | H xileno (o-xileno)

H–C

C – CH3

H–C

C–H C | H ácido benzoico

H–C

C–H C | H cresol

A veces, la cadena cerrada no está integrada sólo por carbonos, sino que uno de ellos está sustituido por azufre, oxígeno o nitrógeno, formando los llamados compuestos aromáticos heterocíclicos. Algunos son anillos de cinco átomos, como el pirrol; otros de seis, como la piridina, e incluso pueden estar unidos uno de seis y uno de cinco (adosados): H | C H–C

C–H

H–C

C–H N | H pirrol

H–C

H–C

C–H C–H N

piridina

Propiedades físicas El benceno es un líquido incoloro, inflamable y tóxico. No se disuelve en el agua, pero sí en disolventes orgánicos. Disuelve bien las grasas, por lo que se utiliza para la limpieza. Es de baja densidad, menos que el agua, y su punto de ebullición es 80 ºC. Los compuestos bencénicos presentan, en la mayoría


162

QUÍMICA

____________________________________________________________________________________________________

de los casos, propiedades similares a las del benceno.

siste en la sustitución de un hidrógeno por un radical alquilo en la molécula del benceno:

Propiedades químicas. Reacciones Los compuestos aromáticos, aunque también tienen dobles enlaces, se diferencian de los alquenos en que dan reacciones de sustitución electrofílica. Reacciones de sustitución. En estas reacciones, se sustituye uno de los hidrógenos del anillo por un grupo con capacidad para aceptar electrones. Estos grupos pueden ser los ácidos nítrico y sulfúrico, los halógenos o algún radical alquílico. Reacciones con el ácido nítrico. El ácido nítrico concentrado y el benceno reaccionan en estado líquido formándose nitrobenceno y agua.

H | C

H–C

C–H

H–C

C–H

+ HNO3 →

H–C

C – NO2

H–C

C–H

+ H2O

C | H

C | H

El benceno puede seguir nitrándose, hasta incorporar dos o tres radicales NO2– a su molécula. Reacciones del ácido sulfúrico con el benceno. El proceso es similar al de las reacciones anteriores, siendo los productos resultantes ácido bencenosulfónico y agua: H | C

H | C H–C

C–H

H–C

C–H

+ H2SO4 →

C – SO3H

H–C H–C

C–H

H–C

C–H C | H

+ Cl2 →

H–C

C–H

+ ClCH3 →

C | H

H–C

C – CH3

H–C

C–H

+ HCl

C | H

Este proceso es similar al anterior. A esta reacción se la conoce con el nombre de reacción de Friedel y Crafts.

Tradicionalmente se conocía la existencia de los compuestos aromáticos en la naturaleza animal, y principalmente vegetal, siendo fácil su obtención. El tomillo y en general las plantas aromáticas son ricas en estos compuestos, aunque no todos tengan olor agradable. Son innumerables las aplicaciones que estos compuestos tienen en la actualidad. Las industrias de colorantes, insecticidas, perfumes, nailon, disolventes, explosivos, etc., tienen como base el benceno y sus derivados. El trinitrotolueno (TNT) es un explosivo de gran poder. En medicina, otros derivados del benceno tienen gran aplicación por su capacidad de actuar sobre el sistema nervioso.

_ Preguntas de repaso

H | C

H–C

C–H

C–H

Reacción del benceno con los halógenos. Esta reacción se realiza en ausencia de luz y en presencia de catalizadores: H | C

H–C

C | H

C | H

H | C

Obtención y utilización del benceno y los hidrocarburos aromáticos

C6H6 + HNO3 → C6H5 – NO2 + H2O H | C

H | C

H–C

C–H

H–C

C–H

1. Calcular la composición centesimal del benceno, C6H6. 2. Escribir y ajustar la reacción de combustión del butano.

+ HCl

C | H

Reacción de alquilación del benceno. Esta reacción con-

3. Escribir y ajustar la reacción del barburo cálcico con el agua para formar acetileno (etino) e hidróxido cálcico. ¿Cuánto acetileno se obtendrá en 1 kg de carburo cálcico?


ALCOHOLES, FENOLES Y ÉTERES

Alcoholes Con el nombre de alcoholes se designa a las sustancias que resultan de sustituir un hidrógeno en un hidrocarburo saturado por un grupo hidroxilo (–OH). También se pueden considerar como el resultado de sustituir un hidrógeno del agua por un grupo alquilo. En ambos casos lo que se constituye es un compuesto de fórmula general R–OH, donde R es un grupo alquilo. Los alcoholes serán primarios, secundarios o terciarios según el carbono al que vayan unidos, ya que el grupo –OH se puede unir en cualquier lugar de la cadena, dando lugar a isomería de posición: R

R – CH2 OH

R'

alcohol primario

C – OH

alcohol secundario

R R' R''

C – OH alcohol terciario

El enlace entre el carbono y el oxígeno se realiza por interacción de dos orbitales híbridos sp3, que dan lugar a un enlace σ.

Nomenclatura Según la nomenclatura de la IUPAC, para nombrar los alcoholes hay que localizar la cadena más larga que contiene un grupo hidroxilo, indicando con un localizador la posición del grupo. Se empiezan a numerar los carbonos de forma que al grupo hidroxilo le corresponda el número más bajo. Se designan en primer lugar las cadenas laterales, indicando mediante un localizador su posición y, a continuación, la cadena que contiene el grupo hidroxilo, a la que se le añade el prefijo -ol seguido del localizador de dicho grupo: H | H – C – OH | H

H OH H | | | H–C–C–C–H | | | H H H

H H CH3OH | | | | H–C–C–C–C–H | | | | H H H H

metanol

propanol-2

2 metil-butanol-1

O HN

O

N

N CH3

CH3

N

Se llaman polialcoholes aquellas sustancias que llevan más de un grupo –OH. En ellas nunca pueden estar dos grupos hidroxilo unidos a un mismo carbono, porque se unirían entre sí para formar agua. Según el número de grupos hidroxilo que contengan se les añade el prefijo di, tri, etc.: OH OH OH | | | H–C – C – C–H | | | H H H Propanotriol

Algunos alcoholes todavía conservan el nombre tradicional. Tal es el caso, por ejemplo, del metanol, que se conoce como alcohol metílico; del etanol, como alcohol etílico, y del propanotriol, como glicerina, etc.

Propiedades físicas El grupo –OH en la molécula hace que las propiedades físicas de los alcoholes sean muy diferentes de las de los correspondientes hidrocarburos con el mismo número de carbonos. Los puntos de ebullición son más elevados, y aumentan con el número de carbonos. En los polialcoholes, la dificultad de desplazamiento de las moléculas hace que éstas tengan carácter viscoso. Los alcoholes de menor peso molecular son líquidos que se disuelven en el agua. Al aumentar el número de carbonos, la solubilidad disminuye hasta desaparecer, en cuyo caso son sólidos carentes de olor.

Propiedades químicas. Reacciones Las propiedades químicas de los alcoholes son similares a las del agua. Al existir una considerable polaridad en la molécula, los dos electrones del enlace del grupo –OH se aproximan al oxígeno, y aunque el hidrógeno se une a éste, dicha unión no es fija, ya que se puede unir a oxígenos de otras moléculas mediante puentes de hidrógeno. Las reacciones químicas de los alcoholes se deben a la electronegatividad del oxígeno y a la facilidad del hidrógeno para separarse de la molécula, originando el radical R–O–, de carácter ácido. Las posibles reacciones son:

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


164

QUÍMICA

____________________________________________________________________________________________________

– Reacciones de sustitución del H por un metal alcalino, para dar lugar a los alcoholatos o alcóxidos: H H | | 2H – C – OH + 2Na → 2H – C – ONa + H2 | | H H – Reacciones de esterificación. Es la reacción característica entre un alcohol y un ácido orgánico para formar un éster y agua: H H O H O H | | || | || | H – C – OH + H – C – C – OH → H – C – O – C – C – H | | | | H H H H CH3O H + CH3 – CO OH → CH3OOC – CH3 + H2O H2O Otro tipo de reacciones son aquellas en las que se separa el grupo –OH, y el alcohol actúa como una base. En este grupo de reacciones se encuentran:

El metanol es tóxico y se emplea en medicina como desinfectante y en la preparación de cloroformo, disolventes, anticongelantes y jabones. El etanol se usa fundamentalmente como desinfectante y en la industria de las bebidas, ya que no es tóxico, a diferencia del metanol. Tiene aplicaciones como componente de productos farmacéuticos, y es un producto de partida para la elaboración de colorantes, disolventes y explosivos. Tanto el metanol como el etanol son combustibles. La glicerina o propanodiol es un líquido viscoso que tiene gran aplicación en cosmética y farmacia, en la fabricación de explosivos y como anticongelante.

Fenoles Los fenoles son los compuestos que se obtienen al sustituir un hidrógeno de un hidrocarburo aromático por un grupo hidroxilo –OH. El compuesto más simple es el fenol, de fórmula C6 H 5 OH: OH | C H–C

C–H

H–C

CH3 – CH2 OH → H2 O + CH3 = CH2 – Reacciones de oxidación. Dependen del tipo de alcohol; los alcoholes primarios se oxidan a aldehídos y después a ácidos; los secundarios, a cetonas, y los terciarios presentan ruptura de cadena: H / 2CH3 – CH2 – CH2 OH + O2 → 2CH3 – CH2 – C + 2H2 O \\ O propanol 1

propanal

O || 2CH3 – CHOH + CH3 + O2 → 2CH3 – C – CH3 + 2H2 propanol 2

propanona

Obtención y utilización Los alcoholes se han obtenido tradicionalmente a partir de productos vegetales. Así, el alcohol metílico era conocido con el nombre de alcohol de madera porque se obtenía de su destilación. Por su parte, el etanol está presente en todas las bebidas alcohólicas y se obtiene mediante fermentación de sustancias que contienen glucosa:

C–H C | H

– Reacciones de deshidratación, que pueden ocurrir con formación de un éter o de un doble enlace, según sea el mecanismo de reacción:

Los restantes fenoles se consideran derivados de este anterior y se nombran sustituyendo la palabra benceno de los hidrocarburos aromáticos por la palabra fenol: OH | C H–C

C – CH3

H–C

C–H C | H ortometil fenol, conocido tradicionalmente como o-cresol

También se les puede nombrar anteponiendo el prefijo hidroxi- al del radical. De esta forma, el compuesto anterior se llamaría hidroximetilbenceno. Los fenoles también admiten la sustitución de más de un hidrógeno por grupos –OH, con lo que se obtendrán mono, di, o tri sustituidos. OH | C H–C

C–H

H–C

C 6 H 12O 6 → 2C2 H 5 OH + 2CO2

C–H C | OH paradifenol o paradihidroxibenceno (tradicionalmente hidroquinona)

En el laboratorio se puede preparar por reducción del hidrógeno de los aldehídos y cetonas.

Los sustituyentes más comunes en los fenoles son los halógenos, aminas, sulfonas, etc.


______________________________________________________________________________________

Alcoholes, fenoles y éteres

165

Propiedades

Propiedades

Las propiedades físicas varían de forma análoga a las de los alcoholes alifáticos respecto de sus hidrocarburos correspondientes. Químicamente también son parecidos a ellos. Sin embargo, al ser más fuerte la unión del grupo –OH, son difíciles de producir. Reaccionan con los hidróxidos para dar dos fenóxidos o fenatos, debido a su carácter ácido:

Los éteres orgánicos son líquidos volátiles, muy inflamables. Presentan isomería funcional con los alcoholes, diferenciándose los isómeros en el grupo funcional. Los puntos de ebullición no muestran gran variación respecto de los hidrocarburos saturados de igual número de carbonos.

OH | C H–C

C–H

H–C

C–H

+ NaOH →

ONa | C H–C C–H H–C

C | H

C–H

Obtención y utilización + H2O

C | H

Los éteres se obtienen mediante el procedimiento de Williamson, que consiste en hacer reaccionar un haluro de alquilo con un alcóxido de sodio: CH3 – CH2 ONa + CH3 – CH2 I →

Obtención y utilización

alcóxido sódico

Se obtienen principalmente a partir del alquitrán de hulla. En el laboratorio se obtienen mediante la reacción del ácido bencenosulfónico con el hidróxido sódico. Se utilizan como antisépticos, en la preparación de barnices y en fotografía.

Éteres Son los compuestos que resultan de sustituir el hidrógeno del grupo –OH de un alcohol por un radical alquilo. La molécula de éter queda formada por dos radicales alquilos unidos por un oxígeno: R – O – R’

yoduro de etilo

→ CH3 – CH2 – O – CH2 – CH3 + NaI éter

yoduro de sodio

También se pueden obtener haciendo reaccionar ácido sulfúrico con un alcohol, con producción de agua. El más utilizado de los éteres es el éter sulfúrico, que se emplea como anestésico. En general, los éteres se utilizan como disolventes en la industria, y algunos como fungicidas.

Nomenclatura Según la IUPAC, se nombran intercalando el prefijo oxientre los nombres de ambos radicales. Se considera la cadena de mayor número de carbonos la que sustituye el H: CH3 – O – CH3 → metoxi-metano CH3 – CH2 – O – CH3 → etoxi-metano Otra forma de nombrarlos es utilizando la palabra éter seguida de los nombres de ambos radicales: CH3 – O – CH3 → éter dimetílico CH3 – CH2 – O – CH3 → éter metil-etílico Si los dos radicales son iguales, los éteres se denominan simétricos. El CH3 – CH2 – O – CH2 – CH3 es el éter dietílico o etoxietano. Es simétrico y conserva su nombre tradicional de éter sulfúrico. El hidrógeno también se sustituye en un fenol: H | C

C | H

C – O – CH3 C | H

1. Nombrar los siguientes compuestos: a) CH3 – CH – CH2OH | CH3 b) H | C C – CH2 – OH H–C H–C

C | H

C

c) CH3 – CH2 – CH2 – O – CH2 – CH3 2. Escribir las fórmulas de:

H | C

H–C

_ Preguntas de repaso

fenil oximetil o anisol

a) 2-metil 2-propanol; b) éter dipropílico. 3. Calcular la composición centesimal del fenol.


OTROS COMPUESTOS ORGÁNICOS

Derivados halogenados Los derivados halogenados más simples son aquellos en los que el hidrógeno de un hidrocarburo alifático se sustituye por un halógeno (F, Cl, Br, I). Son los llamados halogenuros de alquilo. Estos compuestos se caracterizan por tener la molécula muy polarizada, lo que hace que sean capaces de reaccionar con facilidad.

O HN

O

H Cl H | | | H–C–C–C –H | | | H H H

yodo metano

dicloro etano

2 cloro propano

Los más sencillos a veces se nombran como haluros del radical al que van unidos. El yodo-metano sería el yoduro de metilo y el dicloro etano, dicloruro de etilo. Otras veces conservan el nombre tradicional; de este modo, el triclorometano es conocido popularmente como cloroformo.

N

CH3 – CH2 I → CH2 = CH2 + IH Cuando el halógeno sustituye a un hidrógeno de un anillo bencénico, se obtienen los haluros de arilo: Cl | C H–C

C–H

H–C

C – Cl C | H metadiclorobenceno

Obtención y utilización Los derivados hidrogenados se pueden obtener directamente añadiendo el halógeno al hidrocarburo. Son múltiples las aplicaciones de estas sustancias. Se utilizan como disolventes, fumigantes, refrigerantes y para la obtención de otras sustancias orgánicas más complejas. El cloroformo se emplea como anestésico.

Aldehídos y cetonas

Propiedades La mayor parte de estos compuestos son líquidos incoloros, que reaccionan más fácilmente cuanto más corta sea la cadena del hidrocarburo al que van unidos. Dan lugar a dos tipos de reacciones muy diferentes: las de sustitución y las de eliminación. Entre las reacciones de sustitución se encuentra la hidrólisis, en la que el ion OH – sustituye al halógeno, dando lugar a un alcohol. Como catalizador se utiliza el hidróxido potásico en disolución acuosa: CH3 – CH2 Cl + H2 O → CH3 – CH2 OH + HCl cloruro de etilo

CH3

En las reacciones de eliminación, el halógeno desaparece de la molécula, dando lugar a dobles y triples enlaces:

Según la IUPAC, se designan con el nombre del halógeno precedido de un localizador, cuando sea necesario, y seguido del nombre del hidrocarburo: Cl Cl | | H–C–C–H | | H H

N CH3

Nomenclatura

H | H–C–I | H

N

etanol

Son dos tipos de compuestos con muchas semejanzas. Ambos se caracterizan por tener unido un oxígeno a un carbono mediante un doble enlace. Es el grupo carbonilo. La diferencia está en que, en los aldehídos, el oxígeno está unido a un carbono primario y, en las cetonas, la unión se efectúa en un carbono secundario: O // R – C \ H aldehídos

O || R – C – R’ cetonas

Fotografías de cabecera: modelo molecular de la hélice de ácido desoxirribonucleico (izq.) y fórmula estructural de la teobromina (der.).


____________________________________________________________________________________

Los aldehídos reaccionan más fácilmente que las cetonas. En estas moléculas, el oxígeno atrae los dos electrones compartidos, por lo que el carbono al que va unido queda con carencia de electrones y presenta mayor facilidad para unirse a sustancias nucleófilas. A su vez, el oxígeno, sobrecargado de electrones, reacciona fácilmente con sustancias electrófilas. Los aldehídos se forman a partir de alcoholes primarios y las cetonas, a partir de alcoholes secundarios, por oxidación.

Nomenclatura Los aldehídos orgánicos se nombran cambiando la terminación -o del alcano por la terminación -al. Como el oxígeno está unido a un carbono primario, no necesita localizador para indicar su posición, ya que en las cadenas se inicia la numeración por el carbono que lleva el grupo carbonilo. El más sencillo es el derivado del metanol: O // R – C \ H

O H // | H – C – C | \ H H

metanal

etanal

En la nomenclatura tradicional, se utilizaba el nombre del ácido que generan, terminado en la palabra aldehído. Así, el metanol, que da lugar al ácido fórmico, se denomina también formaldehído, y el etanal es conocido como acetaldehído. Las cetonas se nombran utilizando la terminación -ona. En estos compuestos sí es necesario utilizar localizadores para conocer la posición del doble enlace, teniendo en cuenta que se empieza a numerar la cadena de forma que el grupo carbonilo tenga el número más bajo. La cetona más sencilla es la propanona, también conocida como acetona: O || CH3 – C – CH3

O O || || CH3 – C – C – CH3

acetona

butadiona

O || CH3 – CH2 – C – CH2 – CH3 3-pentanona

Otros compuestos orgánicos

167

O O–H // | CH3 – CH2 – C + CNH → CH3 – CH2 – C – C ≡ N \ H propanal

ácido cianhídrico

cianhidrina del propanal

En las reacciones de sustitución de aldehídos y cetonas se deshace el grupo carbonilo y uno de los productos resultantes acapara todo el oxígeno: O // CH3 – C + PCl5 → CH3 – CH2 + POCl3 \ H Oxidación de aldehídos y cetonas. Los aldehídos se oxidan dando ácidos con el mismo número de carbonos. Sin embargo, la oxidación de las cetonas es más difícil, ya que se produce la ruptura de la cadena, con conformación de dos ácidos: O O // // 2CH3 – C + O2 → 2CH3 – C \ \ H OH etanal

etanoico o ácido acético

O O // || CH3 – C – CH3 + 2O2 → CO3H2 + CH3 – C \ OH propanona

etanoico

Obtención y utilización Los aldehídos y cetonas se obtienen por oxigenación de los alcoholes. En el laboratorio, se pueden obtener por reducción de ácidos. Los aldehídos y cetonas tienen importancia como productos intermedios en la formación de otros productos. El metanal se usa como desinfectante. Otros aldehídos son utilizados en cosmética y perfumería. En cuanto a las cetonas, la propanona se emplea como disolvente y para obtener plexiglás. Otras cetonas se utilizan en perfumería.

Propiedades El metanal es un gas. Por el contrario, el resto de los aldehídos y cetonas son líquidos. Los de menor número de carbonos en su cadena principal tienen un fuerte olor y son miscibles en agua. Los aldehídos pueden formar polímeros y las cetonas no. Químicamente, pueden dar lugar a reacciones de adición y de sustitución. Típicas reacciones de adición son las de hidrolización, la unión con el hidrógeno formando alcoholes primarios y secundarios, la unión con ácido cianhídrico, etc. En la reacción del propanol con el ácido cianhídrico, el oxígeno rompe el doble enlace para unirse al hidrógeno:

Ácidos orgánicos Son sustancias que presentan un oxígeno con un doble enlace y un grupo –OH unidos a un carbono primario. A este conjunto se le llama grupo carboxilo: O // R – C \ OH


168

QUÍMICA

____________________________________________________________________________________________________

CH3 – COOH + CH3 – CH2OH →

Nomenclatura

etanoico

Se designan con el nombre del hidrocarburo terminado en -oico. Al ir colocados en carbonos primarios, no necesitan localizador de posición, iniciándose la numeración de la cadena por el carbono que contienen el grupo carboxilo: O // CH3 – C \ OH

O // R – C \ OH metanoico

O || → CH3 – C – O – CH2 – CH3 + H2O etanoato de etilo

Los halógenos de ácidos se forman cuando un ácido reacciona con compuestos halogenantes, como puede ser el tricloruro de fósforo. En esta reacción, el cloro sustituye al grupo –OH del ácido:

etanoico

O // CH3 – CH2 – C \ OH

O O // \\ C – C / \ HO OH

propanoico

etanodioico

La mayoría de estos ácidos conservan su nombre tradicional, así: Metanoico → ácido fórmico Etanoico → ácido acético Propanoico → ácido propiónico Etanodioico → ácido oxálico Si el grupo carboxilo está presente en un anillo bencénico se obtienen los ácidos aromáticos. El más importante desde el punto de vista de sus características químicas es el ácido benzoico, C 6 H 5 COOH: H | C

O

H–C

C–C

H–C

C–H

Obtención y utilización La mayoría de los ácidos orgánicos se encuentran en la naturaleza, ya sea de forma animal o vegetal. Al metanol se le conocía como ácido fórmico porque se había encontrado en las hormigas; el ácido acético se halla en el vinagre; el ácido oxálico se halla en plantas como la acedera, etc. En el laboratorio se pueden obtener por oxidación de un alcohol o un aldehído. La utilización de estos ácidos es muy variada. Son fundamentales en la industria de los jabones que se emplean para la limpieza. Se llaman jabones las sales metálicas de los ácidos grasos. Se obtienen haciendo reaccionar dichos ácidos con hidróxidos metálicos, en una reacción denominada saponificación. Otros ácidos se utilizan para obtener fármacos, en la fabricación de fibras sintéticas y en trabajos de síntesis orgánica.

Ésteres

Propiedades Los ácidos orgánicos de cadena con bajo número de carbonos son líquidos con olor fuerte y penetrante; el resto son sólidos. Debido a su elevado carácter ácido, reaccionan con las bases para formar sales. Son las llamadas reacciones de neutralización: O O // // H – C + KOH → H – C + H2O \ \ OH OK hidróxido potásico

O O || // 3CH3 – C – OH + PCl3 → 3CH3 – C + H3PO3 \ Cl

OH

C | H

metanol

etanol

metanoato de potasio

agua

Otra reacción típica de los ácidos es la esterificación o formación de un éster al reaccionar un ácido con un alcohol:

Son sustancias que se obtienen al reaccionar un ácido con un alcohol eliminando agua. El radical correspondiente al alcohol se une al oxígeno del grupo –OH del ácido. Se puede decir que los ésteres son equivalentes a las sales en química inorgánica.

Nomenclatura Se designan con el nombre del ácido terminado en -ato y seguido del nombre del radical: H O H | || | H–C–C–O–C –H | | H H

H H O | | || H – C – C – C – O – CH2 – CH3 | | H H

etanoato de metilo

propanoato de etilo

Los ésteres se encuentran en la naturaleza. Son los que hacen que las flores tengan olores agradables.


____________________________________________________________________________________

Sustancias nitrogenadas Las sustancias orgánicas en las que interviene el nitrógeno son las amidas, las aminas y los nitrilos. Amidas. Las amidas se consideran el resultado de sustituir el grupo –OH de un ácido por el grupo NH2 . Por tanto, su grupo funcional es: O || R – C – NH2 Son sustancias neutras que se nombran añadiendo el sufijo -amida al nombre del radical del ácido del que provienen: O || H – C – NH2

O || CH3 – C – NH2

O || NH2 – C – NH2

metanoamida

etanoamida

metanodiamida (urea)

La más importante es la metanodiamida, más conocida como urea. Es un producto resultante de la descomposición de las proteínas. Tiene gran utilidad como abono nitrogenado. Aminas. Las aminas se consideran compuestos derivados del amoniaco, de fórmula NH3, donde se han sustituido uno, dos o los tres hidrógenos por radicales alquílicos. Según estas sustituciones, las aminas serán primarias, secundarias o terciarias:

N

H H R

amina primaria

N

H R R'

N

amina secundaria

R R' R''

amina terciaria

Se nombran añadiendo el sufijo -amina al nombre del radical o radicales a los que va unida, señalando mediante un localizador su posición: NH2 | H–C–H | H metilamina

H | H – C C C– NH2 H – C C C– H | H fenilamina o bencenoamina

N

H CH3 CH2 – CH2 – CH3 metil - etil - amina

NH2 | CH3 – CH – CH2 – CH3

butanoamina

Otros compuestos orgánicos

169

Algunos compuestos conservan los nombres tradicionales. La bencenoamina es conocida como anilina. Tienen gran aplicación como colorantes en la industria de teñidos. Se obtienen al reaccionar el amoniaco con los haluros orgánicos Nitrilos. Los nitrilos son sustancias orgánicas que poseen el grupo ciano –CN incorporado a su estructura. Se nombran añadiendo la palabra nitrilo al nombre del radical, o bien como cianuros de alquilo: CH3 – C ≡ N

CH3 – CH2 – C ≡ N

etano nitrilo o cianuro de metilo

propano nitrilo o cianuro de etilo

Los nitrilos se utilizan en la síntesis de sustancias orgánicas por su facilidad para reaccionar. El metanonitrilo es tóxico, tiene un olor característico y al unirse con los metales alcalinos forma productos venenosos, como el cianuro potásico, KCN.

_ Preguntas de repaso 1. ¿Cómo se nombran las siguientes fórmulas? O O || || a) H – C – C – H O || b) CH3 – CH2 – C – O – CH3 O || c) CH3 – CH2 – CH3 – C – NH2 O H CH3 O || | | || d) OH – C – C = C – C – OH 2. Escribir las fórmulas de los siguientes compuestos químicos: a) Butanoato de propilo. b) Metil etil propil amina. c) Propanonitrilo. 3. Explicar la diferencia entre las cetonas y los aldehídos. 4. ¿Cuántos gramos de éster se obtienen en la reacción de 100 gramos de ácido metanoico en exceso de etanol? 5. Escribir y nombrar tres aminas, una primaria, otra secundaria y otra terciaria.


GLOSARIO

Ácido: Compuesto químico que, en disolución acuosa, incrementa la concentración de iones hidrógeno de la misma (definición de Arrhenius). También se define como el compuesto capaz de ceder protones cuando reacciona con metales u otras sustancias de carácter básico (ácido de Brönsted-Lowry). Según el concepto propuesto por Lewis, un ácido es toda sustancia que, al formar un enlace químico con otra, actúa como dadora del par de electrones que ambas comparten. Ácido-base: Grupo de compuestos químicos complementarios que interaccionan entre sí por las llamadas reacciones de ácido-base. En estas reacciones, uno de los compuestos, el ácido, cede protones o cationes hidrógeno H+, mientras que el otro, la base, acepta dichos protones (o, en sentido equivalente, libera aniones hidroxilo OH– para formar agua con los cationes H+). Actínidos: Grupo de elementos químicos de la serie 14, que comprende desde el torio (número atómico 90) al lawrencio (103). Se distinguen por la presencia en su estructura electrónica de orbitales 5f, y son elementos de transición interna por lo general de carácter radiactivo y altamente inestables. Ocupan en la tabla periódica simplificada el lugar del actinio. Afinidad electrónica: Tendencia que muestran los átomos de un elemento o un compuesto químico para capturar electrones ajenos y transformarse en iones cargados negativamente (aniones). Alquino: Hidrocarburo acetilénico, compuesto químico orgánico constituido únicamente por átomos de carbono e hidrógeno en cadena abierta y con existencia de un triple enlace, como mínimo, entre dos de sus carbonos. La fórmula empírica general de los alquinos es CnH2n-2. Los alquinos se denominan con el sufijo -ino, y los primeros compuestos de la serie son el acetileno o etino (CH–CH), el propino (CH3-C CH), el 1-butino (CH C-CH2-CH3) y el 2-butino (CH3-C C-CH3). Amida: Compuesto químico orgánico derivado de las aminas, y de fórmula empírica general R-CO-NH2, siendo R un radical orgánico. Anión: Ion dotado de carga eléctrica negativa. En los procesos electrolíticos es atraído por el ánodo (electrodo positivo). Base: Compuesto químico que, en disolución acuosa, incrementa la concentración de iones hidrógeno de la misma (definición de Arrhenius). También se define como el com-

puesto capaz de ceder protones cuando reacciona con metales u otras sustancias de carácter básico (definición de Brönsted-Lowry). Según Lewis, una base sería toda aquella sustancia que, al formar un enlace químico con otra, actúa como dadora del par de electrones que comparte. Catalizador: Sustancia que, sin intervenir directamente en los procesos de un intercambio químico, modifica la velocidad de reacción e influye en las características de los productos obtenidos. Un catalizador puede actuar como moderador o acelerador de una reacción química, e incluso muchos de estos procesos no llegan a activarse sin la presencia de una sustancia que ejerza esta función. Catión: Ion dotado de carga eléctrica positiva que, en las reacciones electrolíticas, es atraído por el electrodo negativo o cátodo. Concentración: En una disolución, relación que existe entre la cantidad de soluto y de disolvente, o entre la cantidad de soluto y la total de la disolución. Se mide según diversas magnitudes, como molaridad, molalidad y normalidad. Condensación: Cambio de estado de vapor a líquido en una sustancia. Densidad: Magnitud definida como la masa existente de una sustancia por unidad de volumen o de superficie. Destilación: Separación por vaporización de los componentes que integran una mezcla de sustancias líquidas. Disolvente: Componente mayoritario de una disolución. Electrólisis: Proceso consistente en la descomposición de un compuesto químico, o electrólito, por su sometimiento al paso de una corriente eléctrica. Se basa en la apropiación de electrones del electrólito por el electrodo positivo (ánodo) y su cesión por parte del electrodo negativo (cátodo). Electrón: Partícula subatómica elemental, de carga negativa igual a 1,602 x 10–19 culombios y con una masa casi nula (1.836,2 veces inferior a la del protón), presente en los átomos en la región llamada corteza electrónica y objeto de los intercambios entre moléculas conocidos como reacciones químicas. Electronegatividad: Capacidad por la cual un átomo, una molécula o un ion muestran tendencia a atraer hacia sí electrones de otras partes del grupo al que pertenecen. Equilibrio químico: Situación que se alcanza en una reacción química cuando se igualan las velocidades directa e inversa de reacción. De este modo, la creación de produc-


______________________________________________________________________________________________________

tos de reacción y la descomposición de éstos para formar los reactivos originales se compensan de manera que el proceso global se hace estacionario. Evaporación: Sinónimo de vaporización, paso de una sustancia del estado líquido al de vapor. Fusión: Cambio del estado sólido al estado líquido en una sustancia. Gel: Sistema coloidal de aspecto sólido que se comporta como un líquido al ser sometido a presiones y deformaciones. Grupo funcional: Átomo o agrupación de átomos característica que, presente en un determinado compuesto orgánico, confiere a éste estructura y propiedades químicas propias y diferenciativas. Algunos ejemplos de grupos funcionales son alquilo, característico de los alcanos o hidrocarburos saturados; carbonilo, de los aldehídos y cetonas; carboxilo, de los ácidos orgánicos, etc. Hidruro: Combinación de hidrógeno con otro elemento químico de electronegatividad inferior o semejante a la suya. Por ejemplo, hidruro de sodio o hidruro de níquel. En un sentido amplio, también se consideran hidruros compuestos como el agua (H2O) y el amoniaco (NH3). Iatroquímica: Química primitiva, floreciente durante los siglos XVI a XVIII, aproximadamente, que se dedicaba a la preparación de remedios y medicamentos a partir del estudio de los procesos químicos naturales. Ion: Átomo o conjunto de átomos que ha adquirido o cedido algún electrón. Los iones que capturan electrones se cargan negativamente y reciben el nombre de aniones; los que ceden electrones adquieren carga positiva y se conocen por cationes. Isótopo: Cada una de las especies atómicas de un elemento químico que, aun compartiendo un mismo número atómico, difieren en su número másico; es decir, dos isótopos diferentes de un elemento poseen igual cantidad de protones y distinto número de neutrones en su núcleo atómico. Licuefacción: Cambio de estado de gas a líquido de una sustancia sometida a una presión exterior inferior a la temperatura crítica. También se denomina licuación. Mol: Unidad elemental de cantidad de sustancia en el Sistema Internacional, definida como la cantidad cuya masa en gramos equivale numéricamente a la masa molecular del compuesto. Molalidad: Medida de la concentración de una disolución, expresada como la cantidad de sustancia de soluto dividida por la cantidad de disolvente en kilogramos. Su unidad es el mol por kilogramo. Molaridad: Medida de la concentración de una disolución expresada como la cantidad de sustancia de soluto por litro de disolución. Su unidad es el mol por litro. Neutrón: Nucleón de carga eléctrica neutra, partícula subatómica presente en los núcleos de los átomos, cuya masa en reposo es igual a 1,00136 veces la del protón. La suma del número de protones y neutrones de un átomo se conoce por número másico y es una de las propiedades características de los distintos isótopos de los elementos químicos. Normalidad: Medida de la concentración de una disolución expresada como el número de equivalentes químicos de soluto por litro de disolución.

Glosario

171

Número atómico: Cantidad que expresa el número de protones presentes en el núcleo atómico de un elemento químico. Es una característica invariable para cada elemento, y en los átomos de carga eléctrica neutra coincide con el número de sus electrones. Número de Avogadro: Constante que expresa el número de moléculas contenidas en un mol y el número de átomos que contiene un átomo-gramo de una sustancia. Equivale a 6,023 x 1023. Orbital: Región del espacio ocupado por un átomo donde se confina un par electrónico. Los dos electrones que, como máximo, ocupan un orbital atómico poseen idénticos números cuánticos principal, magnético y acimutal, aunque distinto espín (principio de exclusión de Pauli). pH: Medida del grado de acidez de una disolución, definida como el logaritmo decimal del valor inverso de la concentración de iones hidronio (H3O+). Si el pH es inferior a 7, la solución tiene carácter ácido, y es básica cuando el pH es superior a 7. Polaridad: Fenómeno por el cual los electrones compartidos por dos átomos mediante un enlace covalente son atraídos con mayor fuerza por el elemento más electronegativo de dicho enlace. Ello confiere al compuesto propiedades electroquímicas específicas. Polímero: Sustancia química constituida por millares o millones de moléculas, conforme a una estructura definida por la repetición múltiple de unidades funcionales básicas. Los polímeros poseen numerosas aplicaciones industriales en la fabricación de plásticos, vidrio, papel y otros materiales. Presión de vapor: Presión que ejerce un vapor que se encuentra en equilibrio con la fase líquida o sólida de la que emana. Cuando un líquido alcanza la temperatura de ebullición, la presión de vapor se iguala con la atmosférica. Presión osmótica: Presión que se requiere para evitar la ósmosis de disolvente a través de una membrana semipermeable que separa dos disoluciones de distinta concentración. Protón: Nucleón, partícula subatómica de carga positiva igual a 1,602 x 10–19 culombios (idéntica a la del electrón, aunque de signo contrario) y masa de 1,673 x 10–24 gramos. La cantidad de protones de un núcleo, o número atómico, es la propiedad que distingue a unos elementos químicos de otros. La suma de protones y neutrones del núcleo se conoce por número másico. Punto de fusión: Temperatura para la cual se equilibran las fases sólida y líquida de una sustancia, y por debajo de la cual se produce un cambio de estado de líquido a sólido. El punto de fusión del agua (0 ºC) es el origen de la escala centígrada o Celsius de temperaturas. Sal: Compuesto químico formado por la reacción de un ácido y una base o elemento metálico. En disolución o fundidas, las sales se disocian para formar iones. Valencia: Número entero que expresa la capacidad de reacción de un elemento químico. Se define como el número de electrones que dicho átomo puede capturar, ceder o compartir cuando interacciona con otros elementos de su misma u otra especie.


RESPUESTAS A LAS PREGUNTAS DE REPASO

El estudio de la química 1. El angloirlandés Robert Boyle, en su obra El químico escéptico, publicada en 1661. 2. Lavoisier resolvió el problema de la diferencia de peso de las distintas sustancias al considerar al oxígeno como constituyente gaseoso esencial de los ácidos y de las bases. Además desarrolló todos los conocimientos químicos de la época, creando la base de la química moderna y concibiendo un sistema detallado de nomenclatura química. 3. La química puede ser inorgánica, que analiza los elementos y sus compuestos, excepto los integrados por cadenas de carbono; orgánica, que estudia los compuestos del carbono; analítica, que trata sobre los métodos para determinar la composición de las sustancias; física, que se ocupa de las relaciones entre la estructura y las propiedades de las sustancias, y técnica o industrial, que describe los procedimientos industriales para obtener las sustancias.

Estructura atómica 1. El número de protones es igual al número atómico, es decir, 38. Como el número másico es la suma del número de protones más el número de neutrones, se obtiene restando el número atómico del número másico: número de neutrones = 90 – 38 = 52 2. La masa molecular es la suma de las masas o pesos atómicos de los elementos que componen la molécula, por tanto: masa molecular H 2 SO4 = 32 + (4 · 16) + (2 · 1 ) = 98 u 3. n = 2

l = 0 → m = 0 orbital 2s, esférico m = –1 orbital 2px, dos lóbulos orientados según el eje x. l = 1 m = 0 orbital 2py , dos lóbulos orientados según el eje y m = 1 orbital 2pz, dos lóbulos orientados según el eje z

{

Estructura electrónica y sistema periódico 1. He: 1s2 Ne: 2s2 2p6 Ar: 3s2 3p6 Kr: 3d10 4s2 4p6 Xe: 4d10 4s2 5p6 Rn: 4f14 5d10 6s2 6p6 2. El número atómico z del sodio es 11. N.º Orbital que electrón ocupa Representación 1 1s 1s 2 1s 1s 3 2s 1s 2s 4 2s 1s 2s 5 2p 1s 2s 2p 6 2p 1s 2s 2p 7 2p 1s 2s 2p 8 2p 1s 2s 2p 9 2p 1s 2s 2p 10 2p 1s 2s 2p 11 3s 1s 2s 2p

3s

3. El neón es un gas noble y por tanto presenta el máximo potencial de ionización. El cloro y el bromo son muy electronegativos, al estar a la derecha del sistema periódico, y mayor es el del cloro, por situarse por encima del bromo. El litio y el sodio son los menos electronegativos, ya que se encuentran a la izquierda del sistema periódico: Ne > Cl > Br > Li = Na La electronegatividad aumenta a lo largo del sistema periódico de izquierda a derecha y, dentro de cada grupo, en sentido ascendente. 4. Ca > Se > Ga > Fe.

Nomenclatura y formulación 1. a) H 3 PO 4 ; b) H 2 S; c) FeO; d) Rb 2 O; e) Al(OH) 3 ; f) Ba(OH)2 ; g) H 2 O 2 ; h) NaHCO3 ; i) K 2 SO4 ; j) H 2 S. 2. a) óxido de magnesio; b) monóxido de carbono; c) hidróxido de calcio; d) hidrogenosulfato de sodio; e) ácido yódico; f) óxido cuproso (I); g) ácido nítrico; h) permanganato de potasio.


______________________________________________________________________________

3. a) ion sulfato; b) tetrahidruroaluminato de litio; c) sulfuro de berilio; d) tiosulfato de hierro (II); e) trióxido doble de magnesio-titanio (IV); f) carbonato de magnesio-disodio; g) ácido tetrafluorobórico; h) cloruro de tionilo o cloruro de sulfinilo; i) tetracloroferrato (II) de sodio o tetracloruro de hierro (II)-disodio. 4. a) VO(ClO4 ) 3 ; b) MgSO4 ; c) PtPHO3 ; d) H 2 S 2 O 5 ; e) PBr3 .

Enlaces atómicos y moleculares 1. El átomo de flúor presenta la configuración electrónica 1s2 2s2 2p5. Al realizar la representación gráfica, se ve que hay un electrón desapareado en el orbital pz de cada átomo y, por tanto, cuando se aproximan los dos átomos a lo largo del eje z, se originará un solapamiento de dichos orbitales atómicos pz , produciéndose la formación de un nuevo orbital molecular donde se sitúan los electrones con espines opuestos: 1s

2s

2px

2py

2pz

+

F

F

F2

Respuestas a las preguntas de repaso

173

Vi = 100 cm3 Pi = 700 mm Ti = 273 + 27 = 300 ºK Pf = 760 mm Tf = 273 ºK Vf = [(700 mm · 100cm3) /760 mm] · (273 ºK/300 ºK) = = 83,82 cm3 3. Peso molecular del O2 = 32 dO2 = (32 g/mol)/(22,4 l/mol) = 1,428 g/l 4. En primer lugar hay que considerar el aporte necesario para llegar hasta los 0 ºC: Q1 = masa · calor específico (Tf – Ti ) Q1 = 30g · 1cal/g ºC · 18 ºC = 540 cal Como el calor de fusión del H2 O es 334,4 julios/kilogramo, para fundir 30 g se necesitarán: Q2 = 334,4 J/kg · 30 g = 10,032 J Q2 = 10,032 J · 0,24 Kcal/J = 2.408 cal Por tanto, el calor para fundir el cubito de hielo será la suma de los dos procesos anteriores: Q = 540 cal + 2.408 cal = 2.948 cal

Química de disolución

••

• •H 2. H2O = H •• O •• La diferencia de electronegatividad hace que aparezca momento dipolar. Si la molécula de agua fuese lineal, se anularían los dos momentos dipolares, pero como es angular, esto no sucede.

3. a) Cierto; los sólidos cristalinos no presentan conductividad, puesto que no tienen cargas libres. b) Cierto; los sólidos moleculares están unidos por fuerzas de Van der Waals, más débiles que las electrostáticas, que mantienen unidos a los iones de una red cristalina. c) Falso; están deslocalizados y a ello se debe su conductividad, brillo y maleabilidad, es decir, su propiedades más características. d) Falso; al aumentar la temperatura, se incrementa la movilidad de los electrones y la de los núcleos, por lo que también aumenta el número de choques entre ellos, lo que facilita la movilidad y hace descender la conductividad.

Estados de agregación de la materia 1. Según la ley completa de los gases, (P1 · V1)/T1 = P2 · V2 /T2 P1 = 1,7 atm T1 = 20 + 273 = 293 K T2 = 83 + 273 = 356 K Como el neumático no tiene cámara, mantiene el volumen constante. Se sustituye en la fórmula y se obtiene: (1,7 atm · 17 litros)/293 K = (P2 atm · 17 litros)/356 K P2 = 2,06 atm 2. P i Vi / Ti = Pf Vf / Tf

Vf = (Pi Vi /Pf ) (Tf / Ti)

1. El peso molecular del Na OH = 1 · 23 + 1 · 16 + 1 · 1 = 40 u; de este modo, la masa de 1 mol de Na OH es de 40 gramos, luego los moles de Na OH equivalentes a 3 gramos son: 3 g Na OH · 1mol Na OH/40 g Na OH = 3/40 moles de Na OH = 0,075 moles de Na OH, es decir, la disolución es 0,075 molar 2. La masa de la disolución es 1.060 g (1.000 g H2 O y 60 g NaCl) C (%) = (peso de soluto/peso disolución) · 100 C (%) = (60 g/1.060 g) · 100 = 5,6 g Por tanto, el 5,6% de la disolución es sal y el 94,4% restante es agua 3. 2N = 2 (eq/g) · NaOH/1 litro de disolución. 1 litro de disolución tendrá 2 eq/g de NaOH. 15 litros de disolución tendrán 15 · 2 eq/g = 30 eq/g NaOH.

Reacciones químicas 1. C4H10 + O2 → CO2 + H2O 2C4H10(G) + 13O2(G) → 8CO2(G) + 10H2O(L) Dos moléculas de butano se combinan con trece de oxígeno para formar ocho moléculas de dióxido de carbono y diez moléculas de agua. De igual forma se pueden interpretar en moles y en gramos: Moles Gramos

C4H10 2 2 · (4 · 12 + 10 · 1) 2 · 58 = 116

O2 13 13(16 · 2) 13 · 32 = 416

CO2 8 8(12 + 16 · 2) 8 · 44 = 358

H2O 10 10(1 · 2 + 16) 10 · 18 = 180

2. Dado que el hidróxido potásico es una base fuerte, su disociación es total: KOH ↔ K+ + OH–


174

QUÍMICA

____________________________________________________________________________________________________

La concentración de iones OH– es 0,001, por lo que su pOH será: pOH = –log [OH–] = –log (0,01) = 2 Como pH + pOH = 14, pH = 12 3. H2SO4 → (–2) · 4 del oxígeno + 1 · 2 del hidrógeno + x del azufre = 0 → x = 6. Na2CO3 → (–2) · 3 del oxígeno + 1 · 2 del sodio + x del carbono = 0 → x = 4. 4. [CaCO3 ] = (3,5 · 10–3)/ (0,5 · 100) = 7 · 10–5 mol/l. Como el carbonato de calcio está en equilibrio en la disolución, el producto de solubilidad será: K s = [Ca2+] · [CO3 2–] = s · s = s2 = = (7 · 10–5) 2 = 49 · 10–10 5 · 10–9 5. a) b) c) d)

Cloruro de hexaminocobalto (III). Nitrato de dicloro tetracuocromo (III). Tetracloroplatinato (II) de diaminoplata (I). Ion hexaminocobalto (III).

Elementos de la tabla periódica 1. El hidrógeno se puede obtener mediante métodos industriales y de laboratorio.

1. La función química es el conjunto de compuestos orgánicos que tienen propiedades comunes, debido a la presencia de un grupo de átomos común a todos ellos llamado grupo funcional. 2. Para responder a esta pregunta basta mirar la tabla de grupos funcionales y elegir cinco de ellos. Como ejemplo pueden ser: alcohol, éter, aldehído, cetona y éster. 3. Isómeros son compuestos que tienen la misma fórmula empírica, pero distintas propiedades. 4. Es un reacción de combustión, en la que el calor desprendido se utiliza como energía para calentar los alimentos. También se desprende dióxido de carbono y agua.

Hidrocarburos 1. Se calcula el peso molecular del benceno (C = 12, H = 1) = 78: en 78 g de benceno ———— 72 C 100 ––––––––––––––––––––––– x x = (100 · 72)/78 = 92, 3% de C 100 – 92,3 = 7,7% de hidrógeno 2. 2C4 H 10 + 13O2 → 8CO2 + 10H2 O. 3. CaC 2 + 2H2 O → CH ≡ CH + Ca(OH)2 Pm CaC2 = 64

a) Métodos industriales: Por descomposición del agua, mediante electrólisis, añadiendo al agua unas gotas de ácido sulfúrico o hidróxido sódico. En uno de los electrodos se libera hidrógeno (cátodo) y el oxígeno en el otro (ánodo): 2H2 O → 2H2 + O2 Por reducción del vapor de agua con coque calentado a 1.000 ºC, para obtener una mezcla de hidrógeno y monóxido de carbono: C + H2 O → H2 + CO b) En el laboratorio se pueden obtener pequeñas cantidades a partir de compuestos que contengan hidrógeno, tales como ácidos, agua, etc., mediante diferentes métodos, como, por ejemplo: Zn + 2H2 O ↔ Zn2+ + 2OH– + H2 Al + 2H 2 O → Al3+ + 2OH– + H2 2. a) Verdadero. b) Falso; el radón es el único gas noble que no forma parte de la composición de la atmósfera. c) Verdadero. d) Verdadero. 3. Se conocen tres isótopos del hidrógeno: hidrógeno, 11 H; deuterio, 21 H, y tritio, 31 H. 4. El método que más se utiliza es la electrólisis de sus compuestos.

Química orgánica

Pm acetileno = 26

con 64 g CaC2 ————- 26 g de acetileno 100 g de CaC2 ——————— x x = 2.600/64 = 406,25 g de acetileno

Alcoholes, fenoles y éteres 1. a) 2-metil propanol. b) Hidroximetilbenceno. c) Etoxipropeno o éter etil propílico. 2. a)

CH3 | CH3 – C – CH3 | OH

b) CH3 – CH2 – CH2 – O – CH2 – CH2 – CH3 3. C6 H 6 O

H | H – C C C– OH H – C C C– H | H Pm: 12 · 6 = 72; 6 · 1 = 6; 16 · 1 = 16

Pm: 72 + 6 + 16 = 94

en 94 g de fenol hay 72 g de C en 100 g de fenol ———— x x = (72 · 100)/94 = 76,6% de carbono en 94 g de fenol hay 6 g de hidrógeno en 100 g de fenol ———— x


______________________________________________________________________________

x = (6 · 100)/94 = 6,49% de carbono en 94 g de fenol hay 16 g de oxígeno en 100 g de fenol ———— x x = (16 · 100)/94 = 17% de oxígeno

Peso molecular del metanoico de fórmula CHOOH = 46: (C = 12; H = 1 · 2 = 2; O =16 · 2 = 32) El éster es el metanoato de etilo y su fórmula es la siguiente: H - COO - C2 H 5, cuyo peso molecular resultante es: 74 (C = 12 · 3 = 36; H = 6; O =16 · 2 = 32). Con 46 g de metanoico se obtienen 74 g de éster, luego en 100 g se obtendrán: x = 100 · 74 / 46 = 160,87 g

2. a) CH3 – CH2 – CH2 – COO – CH2 – CH2 – CH3 b) N

CH3 CH2 – CH3 CH2 – CH2 – CH3

c) CH3 – CH2 – C ≡ N 3. Los aldehídos llevan el oxígeno unido con doble enlace a un carbono primario y las cetonas a un carbono secundario. 4. Se produce la siguiente reacción de esterificación:

175

O HH O H H || | | || | | H–C–OH + H–C– C–OH → H–C–O–C– C–H + H2O | | | | HH H H

Otros compuestos orgánicos 1. a) Etanodioico. b) Propanoato de metilo. c) Butanamida. d) 2 - metil - 2 - butenodioico.

Respuestas a las preguntas de repaso

5. Entre otras muchas, se pueden citar las siguientes aminas: N

H H CH2 – CH3

etil-amina (amina primaria)

N

CH2 – CH3 CH2 – CH3 H dietilamina (amina secundaria)

N

CH3 CH3 CH3

trietilaminatrimetil (amina terciaria)


MATEMÁTICAS e

A

b B

d

Y f (x)

h a

x c x+ h

X C B

A

g→

f→ g (y) = f (x) = y x

)

g o f (x

3y

=5

y

3 2 1

7x –

O

← Solu ció del sist n ema

1 2 3 4

x

y= 23

•Variables aleatorias

c

a

–3

•Probabilidad

f

4x

•Historia de las matemáticas •Conjuntos y subconjuntos •Álgebra de Boole. Leyes de Morgan •Aplicaciones y relaciones entre conjuntos •Estructuras algebraicas •Números naturales, enteros y fraccionarios •Números primos •Proporciones y porcentajes •Polinomios •Ecuaciones de primer grado •Ecuaciones de segundo grado •Matrices y sistemas de ecuaciones lineales •Sucesiones y límites •Números complejos y logaritmos •Derivadas •Integrales •Ecuaciones diferenciales •Elementos de geometría plana •Geometría poligonal •Geometría circular •Cuerpos geométricos •Geometría analítica •Trigonometría •Teoremas angulares y triangulares •Estadística •Cálculo combinatorio

z



f a e

c A

b B

Y

HISTORIA DE LAS MATEMÁTICAS

d

Las matemáticas en la antigüedad En las postrimerías del siglo XX, las matemáticas se conciben como una rama del saber humano caracterizada por su contenido altamente simbólico, abstracto y sistematizado tanto desde un punto de vista lógico como formal. Sin embargo, en sus comienzos esta ciencia nació con el propósito de resolver cuestiones concretas muy inmediatas y próximas al devenir de sociedades agricultoras y ganaderas todavía incipientes. La medida de la extensión de las tierras de cultivo de un agricultor o la determinación de la riqueza de un rebaño por el número de animales que contenía fueron origen de algunas de sus disciplinas básicas, como son la geometría (del griego, medida de tierras) o el cálculo (palabra derivada de calculus, o piedra, por constituir este elemento la unidad de recuento más arcaica registrada). Contar y medir fueron dos de los objetivos prioritarios de las matemáticas. China, Mesopotamia, Egipto o Persia se constituyeron en los primeros focos importantes del desarrollo del saber humano en la historia de esta ciencia, principalmente en la aritmética y la geometría. Pero los primeros grandes filósofos conocidos en el ámbito del pensamiento matemático fueron griegos. Así, Tales de Mileto, Anaximandro o Pitágoras sentaron las bases de la geometría analítica, la trigonometría y el cálculo. Y entre los siglos IV y II a.C. sobresalieron otros extraordinarios filósofos que, como Euclides, Arquímedes y Apolonio, plantearon y resolvieron problemas de geometría aplicada que aún hoy se consideran bases sólidas de la matemática moderna. También destacó, aunque muy posterior a ellos y ya en el período helenístico, Diofanto de Alejandría (siglo III d.C.), quien profundizó en el área de la resolución de ecuaciones. En la edad media, y en plena decadencia cultural europea, fueron los pueblos árabes quienes heredaron y extendieron el saber helénico, al que, en el terreno de las matemáticas, supieron unir los conocimientos aprendidos de los pensadores indios. Así, la numeración decimal hoy universalmente extendida procede de la India y fue propagada por los árabes (de donde se deriva el nombre de cifras arábigas). La traducción de textos griegos y la aportación propia de grandes matemáticos como Abul Waffa, al-Batani y Omar Khayyam permitieron el pro-

f (x)

O

h a

x c x+ h

X

greso de las matemáticas y, al mismo tiempo, la penetración de estos conocimientos en los nacientes reinos cristianos de Europa a través de las regiones meridionales de este continente. Algunas figuras europeas aisladas, como Leonardo de Pisa, también preludiaron la

La moderna concepción de la ciencia matemática contó con aportaciones de grandes figuras del pensamiento científico como Galileo Galilei. En la imagen, retrato de Galileo por Justus Justermans (Galería de los Uffizi, Florencia). Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


180

MATEMÁTICAS

______________________________________________________________________________________________

eclosión de la ciencia moderna que se produciría en Europa a partir del Renacimiento italiano.

La matemática moderna El redescubrimiento del mundo clásico que se vivió en Italia y otras regiones europeas desde el siglo XIV no sólo se redujo al mundo artístico y literario. Incluyó también la revisión de las obras filosóficas de autores griegos y, en particular, de los tratados de geometría y aritmética, por lo general conocidos a través de su traducción por los árabes. Así mismo, la invención de la imprenta permitió una difusión más amplia de textos hasta entonces poco accesibles. En este período de resurgir del interés por la ciencia brillaron con luz propia varias generaciones de extraordinarios matemáticos, en especial originarios de Italia (como Girolamo Cardano y Niccolò Tartaglia, entre otros). A su vez, el nacimiento del pensamiento moderno cimentado en la revolución científica abanderada por Nicolás Copérnico, Johannes Kepler y Galileo Galilei cristalizó en la búsqueda de modelos filosóficos más rigurosos desde un punto de vista formal, que impulsaron ambiciosos desarrollos matemáticos en campos de actividad cada vez más amplios. Así, en el siglo XVII, el francés René Descartes elaboró un modelo matemático, llamado geometría analítica, que se basaba exclusivamente en la razón y el método deductivo y que partía de dos ideas fundamentales: los sistemas de coordenadas rectangulares, conocidos en su honor como cartesianos, y las magnitudes variables. Por su parte, el británico John Napier publicó las primeras tablas de logaritmos, que permitieron una enorme simplificación de los cálculos en geometría. A finales de este siglo, y gracias a las investigaciones desarrolladas por separado por el británico Isaac Newton y el alemán Gottfried von Leibniz, nació la disciplina de las matemáticas conocida como cálculo diferencial e integral (o análisis infinitesimal). La sistematización lograda gracias a los postulados de Newton y Leibniz permitió un extraordinario avance de las ciencias de la naturaleza, en particular la mecánica y la óptica. En la vía de investigación abierta por estos dos científicos profundizaron muchos otros posteriores, como el alemán Leonhard Euler, los suizos Daniel, Johann y Jakob Bernouilli y los franceses Jean Le Rond d’Alembert y Joseph-Louis Lagrange, todos ellos en el siglo XVIII. También en este siglo destacaron los trabajos de Abraham de Moivre y Pierre-Simon de Laplace, a quienes se deben los primeros desarrollos de los conceptos sobre cálculo de probabilidades y estadística, tan extendidos posteriormente en los estudios demográficos, la economía, la biología, las teorías de errores y otros muchos campos de la ciencia y la industria.

El siglo XIX vivió innumerables avances en el terreno de las matemáticas. El desarrollo de las estructuras algebraicas complejas (grupos, anillos, cuerpos, etc.) nacido de los trabajos de Évariste Galois y Niels-Henrik Abel; el estudio sistemático de geometrías no euclidianas debido a Bernhard Riemann, Gustav Dirichlet y otros; los trabajos de Joseph Fourier sobre series matemáticas complejas; el álgebra de Boole, así llamada en honor de su inventor, George Boole, y base de la lógica binaria usada en las computadoras actuales, o los estudios sobre topología y análisis matemático debidos a August-Louis Cauchy y, sobre todo, Carl Friedrich Gauss son sólo algunas muestras del extraordinario progreso experimentado por las diversas ramas de las matemáticas durante estas décadas. La sucesión continua y acelerada de descubrimientos prosiguió durante el siglo XX. De este modo, las matemáticas se convirtieron a un tiempo en producto y motor de los avances vividos en otras áreas de la ciencia. Teorías físicas de complejidad formal tan enorme como la relatividad general y la mecánica cuántica no hubieran podido ver la luz sin el soporte de elaborados modelos matemáticos. También el progreso tecnológico, en particular de las computadoras en el último tercio del siglo, multiplicó las posibilidades de investigación de los equipos de matemáticos tanto en el terreno teórico como en las aplicaciones prácticas. La búsqueda de modelos matemáticos perfectos y autocontenidos en álgebra, geometría, cálculo, probabilidades, estadística, teoría de los números, etc., centró buena parte de las investigaciones de estos equipos a lo largo del siglo. En ellas descollaron figuras tan relevantes como David Hilbert, Bertrand Russell, Andréi Kolmogórov o Kurt Gödel. Fruto de estos trabajos son los intentos de axiomatización de la teoría de conjuntos, la lógica difusa, la teoría de las catástrofes, las geometrías de dimensiones fraccionarias (objetos fractales), las hipótesis del caos y otras múltiples facetas que constituyen algunos de los nuevos desafíos a que se enfrenta la matemática contemporánea en sus diversas disciplinas.

_ Preguntas de repaso 1. ¿Cuáles son las dos ideas básicas en las que se sustenta la elaboración matemática de Descartes? 2. En el presente siglo, ¿qué dos teorías físicas fundamentales han tenido su soporte en la ciencia matemática?


f a e

c A

b B

Y

CONJUNTOS Y SUBCONJUNTOS

d

Definición de conjunto Un conjunto es una colección de objetos o entes cualesquiera. Los días de la semana forman un conjunto, como también los números menores que diez o los animales del zoológico. Los conjuntos están formados por elementos; el “lunes” es un elemento del conjunto “días de la semana”, el “dos” es un elemento del conjunto “números menores que diez”, la “a” es un elemento del “conjunto vocales”. Para indicar que un elemento pertenece a un conjunto, se escribe el signo . Así: a {vocales} quiere decir que a es un elemento del conjunto de las vocales. Para indicar que un elemento no pertenece a un conjunto, se escribe el mismo signo , pero cruzado por una raya . Al escribir z {vocales}, se indica que la letra z no pertenece al conjunto de las vocales. Los conjuntos se representan por letras mayúsculas y los elementos por letras minúsculas. Cuando se escribe a A, se indica que a es un elemento del conjunto A. Si S es el conjunto días de la semana, se escribe lunes S y reloj S. En matemáticas, los conjuntos de números más importantes se designan con determinadas letras: – N → representa al conjunto de los números naturales: 0, 1, 2, 3, 4, 5… – Z → representa al conjunto de los números enteros: –4, –3, –2, –1, 0, 1, 2, 3, 4… – Q → representa al conjunto de los números racionales (enteros y fraccionarios): 1/2, 3/5, 5/7, 2, 27… – I → representa al conjunto de los números irracionales: 2, 3, π, e… – R → representa al conjunto de los números reales, que engloba a todos los anteriores. – C → representa al conjunto de los números complejos, que son los de la forma: a + bi, siendo a y b números reales e i un número imaginario, tal que i2 = –1: 3 + 2i, 1 – i… A lo largo de este tema y en los sucesivos se empleará con frecuencia el lenguaje matemático, que utiliza determinados signos propios que permiten definir las proposiciones de una forma más concreta, precisa y rápida:

f (x)

O

h a

x c x+ h

X

– El cuantificador universal, cuyo signo es ∀, se lee “para todo”, “para cualquier”. Si se escribe ∀ x N, se está indicando “para todo número natural” o “para cualquier número natural”. – El cuantificador existencial, cuyo signo es ∃, se lee “existe”. Si se escribe ∃ x N, x < 8, se esta indicando que “existe al menos un número natural menor que ocho”. El ; o una raya inclinada / significa “tal que”. – También se utilizan los signos de implicación hacia la derecha (→) o condición necesaria, el de (←) implicación hacia la izquierda o condición suficiente y el de equivalencia (↔) o condición necesaria y suficiente. Cuando se escribe p → q, significa que, siempre que ocurre p, necesariamente ocurre q. El signo de equivalencia ↔ se lee “si y sólo si”. La expresión p ↔ q indica que ocurre q sólo si ocurre p. Ejemplo: la condición necesaria y suficiente para que un número sea múltiplo de dos es que acabe en cero o en cifra par, y se puede expresar como: “x es múltiplo de 2” ↔ x acaba en cero x acaba en cifra par Conjunto unitario es el formado por un solo elemento. El conjunto “Capital de España” tiene un solo elemento: Madrid. Conjunto binario es el que tiene dos elementos, y así se definen también los conjuntos ternarios, cuaternarios, etc. Existen dos formas distintas para determinar o definir un conjunto: por extensión y por comprensión: Por extensión. Para determinar un conjunto por extensión se citan o escriben todos y cada uno de sus elementos, separándolos por comas y encerrándolos entre dos llaves. Por ejemplo, el conjunto de las vocales será: A = {a, e, i, o, u} Por comprensión. Para determinar un conjunto por comprensión se indican todas las propiedades comunes a los elementos del conjunto, de forma que todo elemento que está en el conjunto posee dichas propiedades y

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


182

MATEMÁTICAS

____________________________________________________________________________________________

todo elemento que posee esas propiedades está en el conjunto. El mismo conjunto anterior escrito por comprensión sería:

Relación entre conjuntos Igualdad de conjuntos

A = {vocales}

Representación de conjuntos Para un mejor entendimiento del concepto de conjunto, así como de las relaciones entre conjuntos, se recurre a representaciones gráficas que permiten adquirir, con una mirada, una idea general del conjunto y de sus propiedades. Los más utilizados son los denominados diagramas de Venn. Estos gráficos son una representación de los elementos del conjunto mediante puntos situados en el interior de una línea cerrada.

Dos conjuntos A y B son iguales si ambos tienen los mismos elementos. El conjunto A = {a, e, i, o, u} y el conjunto B = {vocales} son iguales. En realidad, son el mismo conjunto definido por extensión y por comprensión, respectivamente. Esta relación se escribe: A = B. El conjunto de los triángulos equiángulos, o triángulos con los tres ángulos iguales, es el mismo conjunto que el de los triángulos equiláteros, que son los triángulos que tienen los lados iguales: a

.a .i .u

.e .o

l

l

a

a l Triángulo equilátero

Triángulo equiángulo

Diagrama de Venn representativo del conjunto de las vocales

Ejemplo: Sea A el conjunto: A = {divisores del número 12} (definido por comprensión) = {1, 2, 3, 4, 6, 12} (definido por extensión)

.2

.1 .4

El hecho de que dos conjuntos tengan los mismos elementos significa que cualquier elemento de uno de ellos es también elemento del otro y viceversa. En forma matemática, se escribe: A=B↔ y

.3

.6

.12

Diagrama de Venn

Que 1 A indica que el 1 es un divisor de 12. Si 5 A quiere decir que el 5 no es un divisor de 12.

Conjunto vacío Se define conjunto vacío como aquel que no tiene ningún elemento. Se representa por ∅. Sea B el siguiente conjunto: B = {triángulos rectángulos equiláteros}. Ningún triángulo rectángulo es equilátero, pues la hipotenusa siempre es mayor que los catetos y, por tanto, B = ∅. Sea A el siguiente conjunto definido por comprensión: A = {números divisores de 12 y que sean mayores que 15}. Evidentemente, no existe ningún numero que cumpla a la vez ambas condiciones; por tanto, el conjunto A no tiene ningún elemento, luego A = ∅. El conjunto ∅ no es el conjunto {o}, ya que este último tiene un elemento que es el cero y el conjunto ∅ no tiene ningún elemento. El conjunto formado por los números naturales que son pares e impares a la vez es otro ejemplo de conjunto vacío.

∀x A

se verifica que x B

∀y B

se verifica que y A

Es decir, la condición necesaria y suficiente para que los conjuntos A y B sean iguales es que cualquier elemento del conjunto A sea también elemento del conjunto B, y cualquier elemento del conjunto B lo sea también del conjunto A. Cuando dos conjuntos no son iguales, se escribe con el signo ≠. Así, si A = {a, e, i, o, p} y B = {a, e, i, o, u} escribiremos A B. Se lee: A es distinto de B o A no es igual a B. Por definición, el conjunto A es distinto del conjunto B si existe al menos un elemento de A que no está en B, o existe al menos un elemento de B que no está en A.

.p A

.a

.e .o .i

.u

B

En el ejemplo, p, que es un elemento de A, no está en B

Propiedades de la igualdad de conjuntos. Son las siguientes: a) Propiedad reflexiva. La propiedad reflexiva para una relación en general indica que todo elemento está relacionado consigo mismo (A R A). En el caso de la relación de igualdad de conjuntos, significa que todo conjunto es igual a sí mismo. A=A


________________________________________________________________________________________

b) Propiedad simétrica. La propiedad simétrica para una relación cualquiera indica que si un elemento está relacionado con otro, éste está relacionado con el primero (A R B → B R A). Para la relación de igualdad de conjuntos, indica que si el conjunto A es igual al B, entonces el conjunto B es igual al A: A=B→B=A c) Propiedad transitiva. La propiedad transitiva para cualquier relación indica que si un elemento está relacionado con un segundo y este segundo lo está con un tercero, entonces el primero está relacionado con el tercero: A R B y B R C → A R C. Para la relación de igualdad de un conjunto, indica que si un conjunto A es igual a un conjunto B y este conjunto B es igual a un conjunto C, entonces el conjunto A es igual al conjunto C: A=ByB=C→A=C Por tanto, se puede decir que la igualdad de conjuntos es una relación de equivalencia, ya que cumple todas las propiedades anteriormente expuestas.

Relación de inclusión Se dice que el conjunto A esta incluido en el conjunto B cuando todos los elementos del conjunto A están en B. La relación de inclusión se representa por el signo , y así escribiremos A B Matemáticamente, la definición se expresa como: A B↔∀x A→x B Por ejemplo, el conjunto A ={a, e, i} está incluido en el conjunto B = {vocales}, relación que puede expresarse también con diagramas de Venn en la forma:

.a .e A .i

.o .u

B

A B, ya que los elementos de A: a, e, i son también elementos del conjunto B, que está formado por las letras a, e, i, o, u. Para indicar que un conjunto no está incluido en otro se utiliza el signo de inclusión cruzado por una raya: . Decimos que el conjunto A no está incluido en B si existe al menos un elemento de A que no esta en B. Ejemplo: A = {a, e, p} B = {a, e, i, o, u}

.p

.a .e A

.i .u . o A B

B

Conjuntos y subconjuntos

183

El elemento p está en A, pero no en B. En forma matemática, se escribe la definición: A B↔∃x Ay/x B Esta expresión significa que el conjunto A no está incluido en B si existe al menos un elemento de A que no es elemento de B. Propiedades de la relación de inclusión entre conjuntos. Son las siguientes: a) Propiedad reflexiva. Para la inclusión de conjuntos, la propiedad reflexiva indica que cualquier conjunto está incluido en sí mismo, es decir: A A Demostración: Si esta propiedad no fuese cierta y A no estuviera incluido en A, existiría un elemento de A que no pertenecería a A, lo que es absurdo y por tanto se verifica la propiedad: ∀ x A → x A, luego A A b) Propiedad antisimétrica. La propiedad antisimétrica para cualquier relación R se verifica siempre que un elemento está relacionado con otro y este otro lo está con el primero, en cuyo caso ambos elementos son iguales: (a R b y b R a → a = b) Para la relación de inclusión entre conjuntos, la propiedad antisimétrica se verifica cuando se tienen dos conjuntos A y B en los que A está incluido en B y B lo está en A, entonces A = B Esta propiedad es una condición necesaria y suficiente para que dos conjuntos sean iguales, es decir A = B ↔ A ByB A Demostración: Hay que demostrar que se verifica la equivalencia, es decir, la implicación en cada sentido: 1.º Implicación hacia la derecha. Si el conjunto A es igual al B, se verifica que el conjunto A está incluido en el conjunto B y que el B está incluido en el A: A=B→A ByB A Por definición de igualdad entre los conjuntos A y B (A = B) se verifica que cualquier elemento de A es un elemento de B, luego el conjunto A está incluido en el conjunto B, y análogamente cualquier elemento de B es un elemento de A, luego el conjunto B está incluido en el A. En términos matemáticos: A = B → ∀ x A, se verifica que x B, luego A B y análogamente ∀ y B, se verifica que y A, luego B A 2.º Implicación hacia la izquierda. Si A y B son dos conjuntos cualesquiera que verifican que el conjunto A está


184

MATEMÁTICAS

____________________________________________________________________________________________

incluido en el conjunto B y el B está incluido en el A, entonces ambos conjuntos son iguales: A = B. Si el conjunto A está incluido en el B, se verifica que cualquier elemento de A es un elemento de B, y si el conjunto B está incluido en el A, se verifica que cualquier elemento de B lo es también de A, que son las dos condiciones que se han de cumplir para que dos conjuntos sean iguales. En términos matemáticos:

Gráficamente:

.a .e N .i

.u .o

M

c) Propiedad transitiva. La propiedad transitiva para la relación de inclusión de conjuntos se cumple siempre que se verifique que si A, B y C son tres conjuntos tales que el A está incluido en el B y el B está incluido en el C, entonces se cumple que el conjunto A esta incluido en el conjunto C:

El conjunto ∅ es subconjunto de cualquier otro conjunto. Si A es un conjunto cualquiera, se verifica que ∅ A. Esta afirmación es cierta, ya que, si ∅ no estuviera incluido en A (∅ A), existiría un elemento en ∅ que no estaría en A, pero como ∅ no tiene ningún elemento, esto no ocurre y ∅ A. Subconjunto propio. Si A es un subconjunto de B y A es distinto de B, se dice que A es un subconjunto propio de B. Ejemplo. Si B = {conjunto de todos los triángulos} y A = {conjunto de los triángulos rectángulos}, entonces A es un subconjunto propio de B, ya que A B y A ≠ B, pues hay triángulos que no son rectángulos. Conjunto de las partes de un conjunto. Sea U un conjunto cualquiera fijo. Se define el conjunto de las partes de U como el formado por todos los subconjuntos de U. Se representa con una P seguida de la U entre paréntesis, P (U):

A ByB C→ A C

P (U) = {A / A es el subconjunto de U}

A ByB A→A=B Por ser A B: se verifica que ∀ x A, x B Por ser B A: se verifica que ∀ y B , y A

}

→A=B

Ejemplo. Si U = {1, 2, b}, los elementos del conjunto

Gráficamente:

P (U) serían: el conjunto ∅, todos los conjuntos unitarios

C

B

A

Demostración: Por estar el conjunto A incluido en B (A B), se verifica que cualquier elemento x de A está contenido en B y, como cualquier conjunto B está incluido en el conjunto C, se verifica que cualquier elemento de B también está contenido en C, luego x pertenecerá también al C y, por tanto, el conjunto A está incluido en el C. En términos matemáticos: A ByB C→ A C como A B ∀ x A → x B y, como B C, también pertenecerá a C Luego si ∀ x A, x C se verifica que A C Por verificar estas tres propiedades, se puede decir que la relación de inclusión entre conjuntos es una relación de Orden.

Subconjuntos Dados dos conjuntos M y N, se dice que M es un subconjunto de N si todos los elementos de M están en N, es decir, M N. Así: M = {a, e, i} N = {a, e, i, o, u} M N

formados por elementos de U, {1}, {2}, {b}, todos los conjuntos binarios, {1,2}, {1,b}, {2,b} y el propio conjunto U. Es decir:

P (U) = {∅, {1}, {2}, {b}, {1,2}, {1,b}, {2,b}, U}

_ Preguntas de repaso 1. Escribir por comprensión los siguientes conjuntos: A = {2, 4, 6, 8, 10…} B = {1, 3, 5, 7, 9, 11, 13, 15…} 2. Dado el conjunto A = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}, dibujar mediante un diagrama de Venn el complementario del subconjunto de A, B, definido así: B = {x / x impar y x < 10} 3. Sea

C = {c / c es triángulo} P = {p / p es triángulo equilátero} Q = {q / q es un polígono} R = {r / r es un polígono regular} S = {s / s es un triángulo rectángulo} Relacionar estos conjuntos por la relación de inclusión.

4. Escribir los diferentes elementos del conjunto P (A), siendo: A = {a, b, c}


f a e

c A

b B

Y

ÁLGEBRA DE BOOLE. LEYES DE MORGAN

f (x)

h

O

d

E

l álgebra de conjuntos encuentra una de sus expresiones más genuinas en la denominada álgebra de Boole, base de numerosas aplicaciones en el ámbito científico y técnico. Por su parte, las leyes de Morgan, deducibles así mismo del álgebra de conjuntos, actúan como fundamento del área de las matemáticas especializada en probabilidades.

a

x c x+ h

X

Ejemplo: Si se consideran los conjuntos A = {a, e, i} y B = {i, o, u} A B = {a, e, i, o, u} Gráficamente: A B

Operaciones con conjuntos

o

A a e

Sea U un conjunto fijo o referencial y P (U) el conjunto de las partes de dicho conjunto. En este conjunto se definen dos operaciones:

i

B u

Si se verifica que : A B → A B = B

– Unión de conjuntos. – Intersección de conjuntos.

Ejemplo:

Unión de conjuntos Dados dos conjuntos A y B, pertenecientes a P (A), se define la unión de los conjuntos A y B como el conjunto formado por todos los elementos que pertenecen a A o pertenecen a B. Se representa por A B, donde el signo significa unión de conjuntos. En forma matemática se escribe:

A = {3, 4, 6} B = {1, 2, 3, 4, 5, 6, 7} A B = {1, 2, 3, 4, 5, 6, 7} Gráficamente: 5

B

A B = {x U / x A o x B Atendiendo a la definición de unión, se observa que el conjunto A B también pertenece a P (U), es decir, A B P (U), ya que está formado por elementos de U. La representación de la unión de dos conjuntos mediante diagramas de Venn es la siguiente:

1

7

A

2 3

4 6

Propiedades de la unión de conjuntos Son las siguientes:

A

B

A B

a) La unión de conjuntos es conmutativa, es decir, el orden en que se produce la unión no altera el resultado de la misma: A B=B A

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


186

MATEMÁTICAS

______________________________________________________________________________________________

Para demostrar esta propiedad, hay que comprobar que se verifica la doble inclusión, es decir: 1. A B B A 2. B A A B Para comprobar la primera inclusión, A B B A, es preciso demostrar que cualquier elemento de A B es también un elemento de B A: x A B→

x A→x B A → x B→x B A →A B B A

o

La comprobación de la segunda inclusión, B A A B, se realiza de forma análoga a la anterior: x B A→

x B→x A B → x A→x A B →B A A B o

Ejemplo: Si A = {a, b, d, f} y B = {a, b, c, d, e}, se tiene: A B = {a, b, c, d, e, f} B A = {a, b, c, d, e, f} b) La unión de conjuntos es asociativa, es decir, se pueden agrupar varios conjuntos mediante su unión: (A B) C = A (B C)

Así pues, queda demostrada la propiedad asociativa para la unión de conjuntos. c) Propiedad de idempotencia: la unión del conjunto A consigo mismo es el conjunto A: A A=A Para comprobar esta propiedad, se sigue el mismo proceso que con las propiedades anteriores, la doble inclusión: 1. A A A x A A→

x (A B) C → x A → x A (B C) x A B→ o x B → x B C → x A (B C) → o x C → x B C → x A (B C)

Intersección de conjuntos Dados dos conjuntos A y B pertenecientes a P (U), la intersección de A y B se define como el conjunto formado por todos los elementos que pertenecen a A y a B a la vez. Se representa por A B, donde el signo significa intersección de conjuntos. En forma matemática se escribe: A B → {x U; x A y x B} Atendiendo a la definición, se observa que el conjunto intersección pertenece a P (U), ya que es un subconjunto formado por elementos de U. La representación de la intersección de dos conjuntos mediante diagramas de Venn es la siguiente:

A (B C) (A B) C x A (B C) → x A → x (A B) → x (A B) C → o x B→x (A B)→ x (A B) C x (B C) → o x C → x (A B) C

A

A B

B

Ejemplo: Si A y B son los conjuntos:

Así pues, queda probada la primera inclusión. Para demostrar la segunda inclusión, se razona análogamente:

→ A A A

2. A A A x A→x A A→A A A

Como siempre que aparezca una igualdad de conjuntos, se realiza la comprobación mediante un sistema analítico que demuestre la doble inclusión. Primera inclusión: (A B) C A (B C)

o xx AA

A = {a, e, i} B = {i, o, u} A B = {i} Gráficamente: B A a e

A B i

o u

Si los dos conjuntos A y B son disjuntos, es decir, si no tienen ningún elemento común, la intersección es el conjunto vacío.


______________________________________________________________________________

Si A y B son conjuntos disjuntos, es decir, no existe ningún elemento de U: ∃x U/x Ayx B→A B= /

187

Álgebra de Boole. Leyes de Morgan

(A B) C = A (B C)

x (A B) C → y

Si se verifica que: A B → A B = A

x A y x A B → y x B → x C x C

→x B C

Ejemplo: Una vez efectuada la demostración, se verifica la propiedad asociativa.

A = {3, 4, 6} B = {1, 2, 3, 4, 5, 6, 7} A B = {3, 4, 6,}

c) Propiedad de idempotencia. La intersección del conjunto A consigo mismo es el conjunto A

Gráficamente:

A A=A Para comprobar esta propiedad se sigue el mismo proceso que con las propiedades anteriores, la doble inclusión:

B 7

5 A 1 6

2

1. A A A

4

x A A→ y

Propiedades de la intersección de conjuntos. Son las siguientes: a) Al igual que la unión, la intersección de conjuntos cumple también la propiedad conmutativa:

x A →x A→A A A x A

2. A A A x A→x A A→A A A

Propiedades combinadas de la unión y la intersección

A B=B A

En este epígrafe se estudian la unión y la intersección conjuntamente mediante dos nuevas propiedades de simplificación:

Para comprobar esta propiedad, se sigue un proceso análogo al utilizado para la unión de conjuntos; se verifica la doble inclusión:

a) La primera propiedad de simplificación es la de la unión respecto de la intersección, matemáticamente expresada como:

1. A B B A

x A x A B→ y →x B A→A B B A x B 2. B A A B x B x B A→ y →x A B→B A A B x A

b) La intersección de conjuntos es asociativa:

Para probarlo, es preciso demostrar la doble inclusión:

Demostración: 1. A ( B A ) A

x A (B A) → o

x A → x B A

y xx BA

Así pues, en ambos casos x A, con lo que queda demostrada la primera inclusión.

A (B C ) = (A B) C

1. A (B C ) (A B) C x A x A (B C) → y x B C→

A (B A) = A

x B →

y x C

x A B → y → x (A B) C x C Así pues, queda probada la primera inclusión. 2. Se razona análogamente para la segunda inclusión:

2. A A (B A) x A → x A (B A) Por pertenecer a A, pertenece a la unión de A con cualquier otro conjunto, por tanto A A (B A). b) La segunda de las propiedades simplificativas corresponde a la intersección respecto de la unión: A (B A) = A Se demuestra la doble inclusión:


188

MATEMÁTICAS

1. A (B A) A

______________________________________________________________________________________________

x A x A (B A) → y → A (B A) A x B A 2. A A (B A) x A → x (B A) y, como x A, → x A (B A)

Este conjunto tiene las propiedades:

Estructura de retículo Se dice que un conjunto tiene estructura de retículo cuando están definidas en él dos operaciones que cumplen, cada una de ellas, las propiedades asociativa, conmutativa e idempotente y, ambas combinadas, la de simplificación. Por tanto, la terna [P (U), , ] tiene estructura de retículo. Cuando las operaciones combinadas presentan además la propiedad doblemente distributiva, es decir, la unión respecto de la intersección y la intersección respecto de la unión, el retículo es distributivo. Por tanto, la terna [P (U), , ], es decir, el conjunto de las partes de U, junto con la unión e intersección de conjuntos, tiene estructura de retículo distributivo.

Elementos neutros

=A y = Teniendo en cuenta la primera de ambas propiedades, se observa que es el elemento neutro de la unión de conjuntos.

Complementariedad La existencia en el conjunto P (C) de los elementos universal (U) y nulo ( ) conduce a la idea de conjunto complementario de uno determinado. Dado un conjunto A perteneciente a P (U), se define conjunto complementario del conjunto A respecto de U, y se representa por A¯ o A’, como el conjunto formado por todos los elementos de U que no están en A: A¯ = {x / x U y x A} Ejemplo: Si U = {a, e, i, o, u} A = {a, e}, el complementario de A sería ¯ = {i, o, u} A U

El conjunto U que pertenece también a P (U) contiene a cualquier otro conjunto de P (U), y se denomina conjunto universal o referencial. En lenguaje matemático:

A

.e

.a

A

.i . o .u

A P (U) / A U Este conjunto presenta las siguientes propiedades: A U=U y A U=A De esta segunda propiedad se deduce que U es el elemento neutro de la intersección. Por definición, elemento neutro para una operación es aquel que operado con cualquier otro elemento nos da ese otro elemento:

Ejemplo: En el conjunto de los seres humanos, el complementario del conjunto varones sería el conjunto hembras:

Seres humanos =

Varones

Hembras

U es el elemento neutro ↔ A P (U) → A U = A Como A U, A U = A:

Propiedades de la complementariedad Son las siguientes:

U A

a) La unión del conjunto A y su complementario es el conjunto universal: U: A A¯ = U

Entre los elementos de P (U), uno está presente en todos los demás conjuntos, el conjunto vacío ( ), denominado también elemento nulo, que verifica:

b) La intersección del conjunto A y su complementario es el conjunto vacío:

A P (U) P (U) / A

A A¯ =


______________________________________________________________________________

c) El complementario del conjunto universal es el conjunto vacío: U¯ = d) El complementario del conjunto vacío es el conjunto universal:

e) El complementario del complementario de un conjunto es el propio conjunto: = ∀ A U →A = A f) Si un primer conjunto está incluido en otro, el complementario del segundo está incluido en el complementario del primero: – – A B→ B A

– – (A B) = A B Demostración mediante la doble inclusión:

U

U C

A

– –– → x A B

– – 2. A B A B – – x A B.

– x A x A –→ → y x B x B

Por pertenecer a la intersección pertenece a ambos conjuntos, es decir:

U A

x (A B) → x A B → y

– – x A B →

B

189

a) El complementario de la unión de dos conjuntos es igual a la intersección de los complementarios de cada uno de ellos:

– – 1. A B A B

¯ =U

B

Álgebra de Boole. Leyes de Morgan

y

– x A –→ x B

x A

y x B

→x A B

Y si x no pertenece a A B, tiene que pertenecer a su —— complementario, es decir, x A B, con lo que queda demostrada la segunda inclusión. b) El complementario de la intersección de dos conjuntos es igual a la unión de los complementarios de cada uno de ellos: – – (A B) = A B

g) Cuando se tienen dos conjuntos disjuntos, cada uno de ellos está incluido en el complementario del otro, y viceversa. Si un conjunto está incluido en el complementario del otro, ambos son disjuntos: – A B = ↔ A B – A B= ↔B A U A

B B

Demostración: – – 1. (A B) A B

x (A B) → x A B → o – – → x A B

– x A x A –→ → o x B x B

– – 2. A B A B – – – x A x A – → o → x A B→ o x B x B

→x A B→x A B h) Dados dos conjuntos cuya unión es el conjunto universal, el complementario de cada uno de ellos estará incluido en el otro conjunto: – A B=U↔ A B – A B=U↔ B A

Álgebra de Boole Se dice que un conjunto con dos operaciones internas es un álgebra de Boole o tiene estructura de álgebra de Boole si, además de ser un retículo distributivo, posee elementos neutros para ambas operaciones, y si cada elemento tiene su complementario. Así pues, la terna [P (U), , ] es un álgebra de Boole.

Leyes de Morgan Continuando con las propiedades de la complementariedad de conjuntos, mediante las leyes de Morgan se sienta la base del principio de dualidad. Por tanto, mediante estas leyes se puede pasar con facilidad de uniones a intersecciones:

Diferencia de conjuntos Dados dos conjuntos A y B, se llama diferencia de A y B, y se representa por A – B, al conjunto formado por los elementos de A que no están en B:


190

MATEMÁTICAS

______________________________________________________________________________________________

c) Ninguno de los subconjuntos es el conjunto vacío. A

Ejemplo: i Ai

A–B

B A4 A1

A – B = {x A / x B}

A2

Ai

An

A

A3

Diferencia aritmética Dados dos conjuntos A y B cualesquiera, se llama diferencia aritmética de A y B, y se representa por ∆, al conjunto (A – B) (B – A), es decir, a la unión de las diferencias entre ambos conjuntos, o la unión de ambos conjuntos sin la intersección de los mismos: A ∆ B = (A – B) (B – A) A

B

A–B

B–A

Dado el conjunto A= {a, e, i, o, u}, una partición del mismo puede ser la formada por los conjuntos: A1 = {a}, A2 = {e, i}, A3 = {o, u}: a) A1 A2 = , A1 A3 = , A2 A3 = Es decir, son disjuntos entre sí; no hay ningún elemento que esté en dos subconjuntos a la vez. b) A1 A2 A3 = {a, e, i, o, u} = A La unión de todos los subconjuntos forma el conjunto total.

A–B

B–A

c) A1 = {a} , A2 = {e, i} , A3 = {o, u} Ningún subconjunto está vacío.

En el gráfico anterior se observa claramente y se puede comprobar que A ∆ B = B ∆ A

Partición de un conjunto Una partición de un conjunto A es una serie de subconjuntos de dicho conjunto, A1, A2, …, An, que cumplen las siguientes condiciones: a) Son disjuntos dos a dos: Ai Aj = ; i j b) La unión de todos los subconjuntos es el conjunto total A: n

U A =A i=1 i

_ Preguntas de repaso 1. Dados los conjuntos: Hallar dos particiones diferentes del conjunto U U = {1, 2, 3, 4, 5, 6, 7, 8, 9} A = {1, 2, 3} 3. Dados los conjuntos: B = {2, 5, 6, 7} A = {1, 3, 5, 7, 9} C = {3, 4, 8, 9} B = {2, 4, 6, 8, 10} C = {4, 5, 6, 7, 8, 9} Calcular: – Calcular: a) U ––––– a) (A B) b) A B b) (B C) c) (A B) C c) (A B) C 2. Dado el conjunto: d) (A B C) e) A ∆ B U = {0, 2, 4, 6, 8, 10, 12}


f a e

c A

b B

d

APLICACIONES Y RELACIONES ENTRE CONJUNTOS

Cuantificadores y pares ordenados El cuantificador universal indica, al colocarlo delante de una expresión, que afecta a todos los elementos a los que se hace referencia. se lee “para todo” o para cualquiera. El cuantificador existencial ∃ indica la presencia de al menos un elemento que verifica la condición a que se hace referencia. ∃ se lee: “existe o hay algún”. Los conjuntos de los seres vivos y de los hombres, esto es, A = {seres vivos} y B = {hombres}, al escribir x B, x A, se está diciendo que todo hombre es un ser vivo. Si se escribe ∃ x A, x B, quiere decir que existe o hay algún ser vivo que no es hombre. Por su parte, dados dos conjuntos A y B, se llama par ordenado a una expresión matemática de la forma (x, y) donde x es un elemento del conjunto A e y es un elemento del conjunto B. A x, por tanto, se le llama primera componente, y a y, segunda. El par (x, y) es distinto que el par (y, x). El resultado de un partido de fútbol es un ejemplo de par ordenado. Si este resultado es (2-3), quiere decir que el conjunto local consiguió dos goles y el visitante tres. El resultado (3-2) nos indica algo muy diferente, ya que es el equipo visitante el perdedor.

Producto cartesiano de dos conjuntos Dados dos conjuntos A y B no vacíos, se llama producto cartesiano de dichos conjuntos, y se representa como A x B al conjunto de todos los pares ordenados que se pueden formar, siendo la primera componente un elemento de A, y la segunda, un elemento de B. En términos matemáticos:

Y f (x)

O

h a

x c x+ h

El conjunto A tiene tres elementos; el conjunto B, cuatro, y el producto cartesiano de A · B, doce. En general, si el conjunto A tiene p elementos, y el B, q elementos, el conjunto A · B posee p · q elementos. Dos pares ordenados son iguales cuando sus primeros componentes son iguales y sus segundos componentes también: (x, y) = ( x’, y’) ↔ x = x’ e y = y’ Al ser distintos los pares (x, y) e (y, x), el producto cartesiano no es conmutativo y A · B es distinto de B · A.

Representación gráfica del producto cartesiano El producto cartesiano de dos conjuntos se puede representar en un sistema de ejes cartesianos, mediante un diagrama de árbol, en una tabla de doble entrada y en un diagrama sagital. Si A y B son los conjuntos A = {x, y, z} y B = {1, 2, 3, 4}, la representación gráfica del producto cartesiano de A · B podrá expresarse en los cuatro modos siguientes: a) En un sistema de eje cartesiano. En el eje horizontal o de abscisas, se sitúa el conjunto A, y en el vertical o de ordenadas, el B: 4

(x, 4)

(y, 4)

(z, 4)

3

(x, 3)

(y, 3)

(z, 3)

A · B = {(a, b) / a A y b B}

2

(x, 2)

(y, 2)

(z, 2)

Ejemplo. Sea A = {x, y, z} y B = {0, 1, 2, 3}. El producto cartesiano de A x B es:

1

(x, 1)

(y, 1)

(z, 1)

A · B = {(x, 0), (x, 1), (x, 2), (x, 3), (y, 0), (y, 1), (y, 2), (y, 3), (z, 0), (z, 1), (z, 2), (z, 3)}

X

x

y

z

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


192

MATEMÁTICAS

______________________________________________________________________________________________

b) Mediante un diagrama de árbol:

A·B

El subconjunto de A · B formado por los pares ordenados (x, 2), (y, 2), (y, 3), (z, 2), (z, 3) es una correspondencia. Se dice que al elemento x de A le corresponde el elemento 2 de B, al elemento y de A le corresponden los elementos 2 y 3 de B y al elemento z de A le corresponden los elementos 2 y 3 de B. Es decir:

A

B

x

1 2 3 4

(x, 1) (x, 1) (x, 1) (x, 1)

y

1 2 3 4

(y, 1) (y, 1) (y, 1) (y, 1)

f (x) = 2 f (y) = {2, 3} f (z) = {2, 3}

z

1 2 3 4

(z, 1) (z, 1) (z, 1) (z, 1)

Se puede representar esta correspondencia mediante un diagrama sagital: A

c) Mediante una tabla de doble entrada: A

B

1

2

3

B

f→

x

1

4

2

y x

(x, 1)

(x, 2)

(x, 4)

(x, 3)

3 z

y

z

(y, 1)

(y, 2)

(z, 1)

(z, 2)

(z, 4)

(z, 3)

d) Mediante un diagrama sagital, representando ambos conjuntos por medio de diagramas de Venn y unido con flechas cada elemento del primer conjunto con todos los del segundo: A·B

x

4

(y, 4)

(y, 3)

1 2

y

3

A es llamado conjunto inicial y B conjunto final. Se dice conjunto origen al conjunto formado por elementos de A que tienen imagen en B. En este ejemplo coinciden el conjunto original e inicial. Se representa por orig (f). Se llama conjunto imagen de la correspondencia al formado por elementos de B que son imágenes de algún elemento de A. Se representa por im (f): Conjunto inicial A orig (f) = {x, y, z} = A

Conjunto final B im (f) = {2, 3}

Grafo de una correspondencia es el subconjunto del producto cartesiano que define. En el ejemplo anterior, el grafo es:

4

z

Grafo = {(x, 2), (y, 2), (y, 3), (z, 2), (z, 3)}

Correspondencia entre conjuntos Dados dos conjuntos no vacíos A y B, se llama correspondencia entre conjuntos A y B, representada por A f → B, a cualquier subconjunto del producto cartesiano A · B. Si A = {x, y, z} y B = {1, 2, 3, 4} 4

Correspondencia inversa Dada una correspondencia f de A en B (A f → B), se llama correspondencia inversa o recíproca de f y se representa por f–1 a la correspondencia de B en A, en la que a los elementos de B que son imágenes por f de algún elemento de A, se les hace corresponder sus originales. En el ejemplo: A = {x, y, z} y B = {1, 2, 3, 4}

3 A 2

x

1

B f→

1 2

y

3 x

y

z

z

correspondencia

4


__________________________________________________________________________

Su correspondencia recíproca o inversa sería: A f →

Aplicaciones y relaciones entre conjuntos

193

El elemento x de A tiene dos imágenes en B:

B

A

B

x

x

1

y

y

–1

1 2

2

3

3 z

4

4

z

correspondencia inversa

Si el grafo de f es: {(x, 2), (y, 2, (y, 3), (z, 2), (z, 3)}, el grafo de f–1 es: {(2, x), (2, y), (2, z), (3, y), (3, z)}. Elemento a elemento se tiene que: f–1 (2) = {x, y, z} f–1 (3) = {y, z}

f (x) = 2y f (y) = {2, 3} f (z) = {2, 3}

Aplicaciones Se denomina aplicación entre dos conjuntos a una correspondencia en la que cada elemento del conjunto origen tiene una imagen y solamente una. Por ejemplo: A

B

x

1 2

y

3 4

z aplicación

Esta correspondencia es una aplicación, pues todos los elementos del conjunto A tienen imagen y además cada uno de ellos sólo tienen una. Aunque dos elementos posean la misma imagen, si sólo tienen una será una aplicación. En cambio, si un elemento tiene varias imágenes será una correspondencia, pero no una aplicación:

Hay un elemento de A que no tiene imagen en B, el z. Existen varios tipos de aplicación, que se exponen seguidamente. Aplicación constante. Es aquella aplicación en la que todos los elementos del conjunto origen tienen la misma imagen: A

B

x

1 2

y 3 4

z aplicación constante

El grafo de esta aplicación es: {(x, 2), (y, 2), (z, 2)}. Aplicación inyectiva. Una aplicación entre dos conjuntos A y B es inyectiva cuando cada elemento de B es imagen de un solo elemento de A. También se puede decir que en esta aplicación no hay dos elementos de A que tengan la misma imagen en B: A

B

x

1 2

y

3 A

B

x

1

4

z aplicación inyectiva

2 y z

3 4

Para demostrar que una aplicación es inyectiva bastaría probar que si a y b son dos elementos de A tales que f (a) = f (b), entonces a = b. F es inyectiva ↔ a, b A tal que f (a) = f (b) → a = b. Por ejemplo, la aplicación f (x) = 3x x R f (a) = f (b) → 3a = 3 b → a = b, luego f es inyectiva.


194

MATEMÁTICAS

______________________________________________________________________________________________

En las aplicaciones inyectivas, el número de elementos del conjunto origen es menor o igual que el número de elemento del conjunto imagen. Aplicación sobreyectiva. La aplicación f de A en B es una aplicación sobreyectiva o suprayectiva si todos los elementos de B son imagen de algún elemento de A, es decir, todos los elementos de B tienen algún elemento origen en A. f: A → B es sobreyectiva ↔ ∀ y B ∃ x A/f (x) = y

Países

Capitales

España

Madrid

México

México D.F.

Perú

Caracas

Ecuador

Quito

Venezuela

Lima

Ejemplo. Sea A = {x, y, z, t} y B = {1, 2, 3}:

Composición de aplicaciones A x

B f→

1

Sean A, B y C tres conjuntos no vacíos y sean f y g dos aplicaciones f: A → B y g: B → C:

y 2

A

z t

f→

B

g→

C

3 x

g (y) = z

f (x) = y

aplicación sobreyectiva

Esta aplicación es sobreyectiva, no importa que el elemento 2 sea imagen de dos elementos de A. En las aplicaciones sobreyectivas, el número de elementos del conjunto origen es mayor o igual que el de los elementos del conjunto imagen. Aplicación biyectiva. Se dice que una aplicación f del conjunto A en el conjunto B es biyectiva siempre que sea a la vez inyectiva y sobreyectiva. Sea A = {x, y, z, t} y B = {1, 2, 3, 4}, entonces:

A

B

x

1

y

2

z

3

t

4 aplicación biyectiva

g o f (x)

Se llama composición de las aplicaciones f y g, representada por g o f, a la aplicación que a los elementos de x A le hace corresponder otro elemento z C de tal forma que Z = g (y) = g [f (x)] = (g o f) (x). La composición de aplicación biyectiva es una aplicación biyectiva: A

f→

B

g→

x

m

1

y

n

2

z

p

3

t

q

4

aplicación compuesta

En la aplicación biyectiva, el conjunto A y el conjunto B tienen el mismo número de elementos. Ejemplo: Países = {España, México, Perú, Ecuador, Venezuela}. Capitales = {Madrid, México D.F., Caracas, Quito, Lima}

C

(g o f) (a) = g [f (a)] = g (m) = 3 (g o f) (b) = g [f (b)] = g (n) = 1 (g o f) (c) = g [f (c)] = g (p) = 2 (g o f) (d) = g [f (d)] = g (q) = 4


__________________________________________________________________________

Funciones Las correspondencias en las que cada elemento del conjunto origen tiene una sola imagen y, además, los conjuntos de origen e imagen son el conjunto de los números reales R o un subconjunto de él, se denominan funciones. La función expresa una idea de dependencia que, en muchas ocasiones, está presente en la naturaleza. El espacio recorrido por un móvil depende del tiempo que ha estado circulando. La superficie de un círculo depende del radio. El tiempo que tarda un péndulo en hacer una oscilación, por su parte, depende de la longitud del péndulo. En las funciones, el conjunto origen se denomina dominio de definición y sus elementos son las variables independientes. Al conjunto imagen se le llama recorrido, y a sus imágenes, variables independientes, pues sus valores están condicionados por los de las variables independientes. Sea la función:

195

La correspondencia R+ → R, definida por y = f (x) = x, no es función, pues todos los elementos, menos el cero, tienen dos imágenes: y

x

f (x) = x

Relaciones entre conjuntos

f: R → R+ x →y = f (x) = x2

[x → y = f (x) = x2 ]

Aplicaciones y relaciones entre conjuntos

El conjunto origen es todo R , pero el conjunto imagen son los números reales positivos (R+ ). En la gráfica: y

Para indicar que dos elementos del conjunto A están conectados mediante la relación R, se hace indicando que el par (x, y) pertenece a la relación (x, y) R, o también que x está relacionado con y mediante dicha relación, es decir, x R y. Las relaciones más importantes son las de equivalencia y las de orden.

Relación de equivalencia Una relación R definida en un conjunto A, es de equivalencia si cumple las propiedades reflexiva, simétrica y transitiva:

x

2

f (x) = x

x serían las variables independientes; y serían las variables dependientes. La imagen del 0, es decir, cuando x = 0, sería y = f (0) = 02 = 0 La imagen de x = 1 sería y = f (1) = 12 = 1. La correspondencia f: R → R, definida por f (x) = 1/x, no es aplicación, pues no existe imagen para el elemento 0:

a ) Propiedad reflexiva. R es reflexiva si y sólo si x A, x R x, es decir, todo elemento está relacionado consigo mismo. b) Propiedad simétrica. R es simétrica si para cada dos elementos x e y A en los que se verifica que x R y → y R x. c) Propiedad transitiva. R es transitiva si dados tres elementos x, y, z A en los que se verifica que x R y e y R z, entonces x R z. La relación de igualdad en el conjunto de los números naturales N es una relación de equivalencia, ya que: Reflexiva: x N x = x. Simétrica: Dados x e y N, tales que x = y → y = x. Transitiva: Dados x, y, z N, se verifica que x = y, e y = z → x = z.

y

x

f (x) = 1 x

En el ámbito de los conjuntos, la igualdad entre conjuntos es una relación de equivalencia. En el conjunto de las vocales A = {a, e, i, o, u}, la relación R definida como R = {(a, a), (a, e), (e, a), (e, e), (a, o), (o, a), (e, o), (o, e), (o, o), (i, i), (i, u), (u, i), (u, u)} es una relación de equivalencia.


196

MATEMÁTICAS

______________________________________________________________________________________________

El cociente A/R estaría formado por sólo dos clases:

.a .e

A/R = {Ca, Ci}

.o

.u .i

relaciones entre conjuntos

Clases de equivalencia. Sea A un conjunto cualquiera y R una relación de equivalencia definida en él. Se llama clase de equivalencia del elemento a de A, lo que se representa por Ca, al conjunto formado por todos los elementos de A relacionados con él: Ca = {x A/x R a} Dos clases son iguales si sus elementos están relacionados: Ca = Cb ↔ a R b. El conjunto de las clases de equivalencia del conjunto A mediante R es una partición del conjunto A, ya que se verifica: 1. a A, Ca A y Ca ≠ ∅, es decir, las clases de equivalencia son subconjuntos no vacíos de A. 2. A Ca, a A. El conjunto A está contenido en la unión de todas las clases de equivalencia. 3. Dados a y b A, entonces existen dos posibilidades: Ca Cb = ∅. O bien la intersección de dos clases es el conjunto vacío o bien ambas son la misma clase.

Relación de orden Una relación R definida en un conjunto A es de orden si cumple las propiedades reflexiva, antisimétrica y transitiva. Las propiedades reflexiva y transitiva están definidas en las relaciones de equivalencia. Propiedad antisimétrica. La relación R definida en el conjunto A es antisimétrica si x, y A, tal que se verifica que x R y e y R x → entonces x = y. La relación (menor o igual que) en el conjunto de los números naturales es una relación de orden. Reflexiva: x N, x x Antisimétrica: x N, tales que x y e y x → x = y. Transitiva: Dados x, y, z N, tales que verifican x < y e y z → x z. La relación de inclusión de conjuntos en el conjunto P (u)x es un ejemplo de relación de orden. Una relación de orden en un conjunto A es una relación de orden total si en (x, y) A se verifica que bien x R y o bien y R x. La relación menor que, definida en el conjunto N de los números naturales, es de orden total, pues para cada dos números naturales x e y se obtiene que bien x < y o bien y < x.

_ Preguntas de repaso

Conjunto cociente. Dado un conjunto A y una relación de equivalencia R definida en A se llama conjunto cociente de A, por la relación R, y se representa A/R, al conjunto formado por todas las clases de equivalencia de elementos de A:

1. Escribir el producto cartesiano A x B, siendo A = {2, 4, 6, 8} y B = {m, n, ñ, o, p}. Representarlo mediante un sistema de ejes cartesianos y encontrar una aplicación inyectiva entre ambos conjuntos.

A/R = {Ca; a A}

2. Demostrar que la aplicación f: N → N, definida como f (n) = u + 3, es inyectiva, pero no sobreyectiva.

Ejemplo. En el conjunto de las vocales, A = {a, e, i, o, u}, se define una relación de equivalencia R = {(a, a), (a, e), (e, a), (e, e), (a, o), (o, a), (e, o) (o, e), (o,o), (i, i), (i, u) (u, i), (u, u)}. Las clases Ca, Ce y Co son la misma, y están formadas por los elementos a, e, o: Ca = Ce = Co= {a, e, o} Ci = Cu = {e, u)

3. Sea el conjunto E = {1, 2, 4, 6, 8, 10} con la relación R = {(1, 1), (1, 2), (2, 1), (2, 2), (4, 4), (4, 6), (6, 4), (4, 8), (8, 4), (6, 8), (8, 6), (6, 6), (8, 8), (10, 10)}. Representar mediante flechas esta relación. Comprobar que es de equivalencia y calcular el conjunto cociente.


f a e

c A

b B

Y

ESTRUCTURAS ALGEBRAICAS

f (x)

O

d

E

l estudio de las estructuras algebraicas o entidades definidas en torno a leyes denominadas de composición constituye una de las ramas de las matemáticas que mayor interés han despertado desde los inicios del siglo XIX. Base de la lógica formal, las estructuras algebraicas ayudan a construir modelos teóricos extensos de las magnitudes y los fenómenos de la realidad.

Leyes de composición Se distinguen dos tipos de leyes de composición: interna y externa.

Leyes de composición interna Dado un conjunto A no vacío, se llama ley de composición interna u operación interna a cualquier aplicación T de A · A → A: A·A→A T: (a , b) → T (a, b) = C A A todo par (a, b) A · A, le hace corresponder T (a, b) = C A, en lugar de T (a, b) se escribe a T b y se lee “a operado mediante T con b”. En el conjunto de los números naturales, la suma es una ley de composición interna, donde el signo de la operación T se sustituye por el +: +: N · N → N (n, n’) → n + n’ La suma es interna en N, ya que al sumar dos números naturales se obtiene otro número natural. Propiedades de las leyes de composición interna. Son las siguientes: a) Asociativa. La ley de composición interna T en un conjunto A es asociativa si dados tres elementos a, b, c A cualquiera, se verifica que: (a T b) T c = a T (b T c).

h a

x c x+ h

X

b) Conmutativa. La ley de composición interna T es conmutativa si para cada dos elementos a, b de A se verifica que: a T b = b T a. c) Elemento neutro. El elemento neutro para la operación interna T es e si se verifica que : a A; a T e = e T a = a, es decir, al operar cualquier elemento a con el neutro, a queda invariable. En el conjunto de los números naturales, el elemento neutro para la suma es el 0, ya que n + 0 = 0 + n = n. Cuando existe elemento neutro para una operación interna, éste será único. Demostración: sea e el elemento neutro para la operación T. Si e no fuese único, existiría otro elemento neutro e’. Operando entre sí estos elementos: e T e’ = e por ser e’ neutro e T e’ = e por ser e neutro Por ser T aplicación: e = e’, es decir, estos dos elementos e y e’ serían el mismo. d) Elementos simétricos. Se dice que a’ es el simétrico de a para la ley de composición interna T si: a T a’ = a’ T a = e; es decir, si al operarlos entre sí se obtiene el elemento neutro. En el conjunto de los números naturales, el único elemento simétrico es el 0. Sin embargo, en el conjunto de los números enteros Z todo elemento tiene su simétrico: el simétrico de a Z sería el –a Z, ya que a + (–a) = 0. Los elementos simétricos se conocen también como opuestos y, si la operación es la multiplicación, inversos. Teorema: dado un conjunto A con una ley interna T asociativa, si existe el simétrico de cualquier elemento, éste será único. Demostración: para demostrar que es único, se supone que no lo es, es decir, que existen dos elementos simétricos para un mismo elemento: a’ y a’’ serían los simétricos de a: – Por ser a’ simétrico de a se tiene: a T a’ = a’ T a = e. – Por ser a’’ simétrico de a se tiene: a T a’’ = a’’ T a = e. – Por ser la operación asociativa se tiene: (a’ T a ) T a’’ = a’ T (a T a’’).

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


198

MATEMÁTICAS

______________________________________________________________________________________________

Operando por separado cada uno de los dos miembros de la igualdad se obtiene: (a’ T a) T a’’ = e T a’’ = a’’ a’ T (a T a’’) = a’ T e = a’ donde se deduce que a’ = a’’, es decir, los dos simétricos son iguales y, por tanto, el simétrico es único. Teorema: en A con la ley interna T, se verifica que el simétrico del simétrico de un elemento a es el mismo a, es decir, (a’)’ = a: a T a’ = a’ T a = e Luego a = (a’)’ (a’)’ T a’ = a’ T (a’)’ = e e) Distributiva. En un conjunto A no vacío puede haber definida más de una operación interna. Se supone que son dos, T y ⊥, las operaciones internas, por lo que en este conjunto para dichas operaciones se verifica la propiedad distributiva cuando ∀ a, b, c A: T (b ⊥ c) = (a T b) ⊥ (a T c) a ⊥ (b T c) = (a ⊥ b) T (a ⊥ c)

Leyes de composición externa Dado un conjunto A no vacío, y otro conjunto K, se llama ley externa a toda aplicación de: K · A →A

(k, a) → k · a A

Si, además, se verifica la propiedad conmutativa, el grupo se dice conmutativo o abeliano. Ejemplo: el conjunto de los número enteros Z, con la operación suma de los números enteros (+), es un grupo conmutativo. 1.º Propiedad asociativa: a, b, c Z, a + (b + c) = (a + b) + c. 2.º Elemento neutro. El elemento neutro con la suma, en Z, es 0: a Z a + 0 = a. 3.º Elemento simétrico: el elemento simétrico del elemento a Z es el –a Z, ya que a + (–a) = 0. 4.º Propiedad commutativa: a, b Z, se verifica: a + b = b + a. 5.º Propiedad de simplificación: Si {G, T} es un grupo, se verifica la propiedad de simplificación. Esta propiedad dice que a, b, c G, tal que a T c = b T c, entonces a = b. Demostración: operando los dos miembros de esta igualdad con c’, por la derecha, se tienen: (a T c) T c’ = (b T c) Tc’ Por la propiedad distributiva a T (c T c’) = b T (c T c’). Pero c T c’ = e, luego queda a T e = b T e, de donde a = b, ya que a T e = a y b T e = b. Subgrupo. Sea {G, T} un grupo, y S un subconjunto no vacío de G, S G, S ≠ ∅, además si T, ley interna del grupo, es también ley interna para S, y S con T tiene estructura de grupo, el par {S, T} se dice que es un subgrupo de {G, T}.

Al par (k, a) se le hace corresponder el elemento k · a de A.

G S

Estructuras algebraicas Una estructura algebraica es un conjunto en el que se ha definido, al menos, una ley de composición. Estas estructuras, según las leyes de composición definidas y las propiedades que se verifiquen, son: semigrupo, grupo, anillo, cuerpo, etc.

Semigrupo El par {S, T} donde S es un conjunto no vacío y T una ley de composición interna, se llama semigrupo. Si, además, existe elemento neutro para los elementos de S, el semigrupo se llama monoide.

Grupo Un conjunto G no vacío con una ley de composición interna tiene estructura de grupo cuando la operación T con los elementos de G tiene las propiedades: Asociativa. Elemento neutro. Elemento simétrico.

.e Si {S, T} es un subgrupo del grupo {G, T}, entonces: 1. El elemento neutro de S es el elemento del grupo G. Sea e el elemento neutro del grupo G y e’ el elemento neutro del subgrupo S. Se tienen a T e = a y a T e’ = a, luego a T e = a T e’ y por la propiedad de simplificación e = e’. Por tanto, los dos elementos neutros son el mismo. 2. El simétrico de a en el subgrupo es el mismo que en el grupo. Sea a’ el simétrico de a en el grupo y a’’ el simétrico en el subgrupo. Hay que demostrar que son el mismo. a S ∃ a’’ S: a T a’’ e, y como a G también se verifica que ∃ a’; a T a’ = e, de donde a T a’ = a T a’’ y, por la propiedad de simplificación, a’ = a’’, luego coinciden. Teorema: la condición necesaria y suficiente para que un subconjunto S de un grupo G, S G, sea un subgrupo es que a, b S; a T b’ S; es decir, a operado con el simétrico de b es también un elemento de S. Demostración: hay que demostrar la equivalencia o doble implicación. Primero, la implicación hacia la derecha o con-


________________________________________________________________________________________

dición necesaria (→): S es subgrupo, entonces ∀ a, b S; a T b’ S:

1.º El elemento neutro de G está en S. a S se verifica que a T a’ S, pero a T a’= e, luego e S. 2.º El simétrico de a también pertenece a S. Por hipótesis se tiene que a T a’ S si en particular se toman e y a S, se verifica que e T a’ S, pero e T a’ = a, luego a’ S. 3.º Hay que comprobar que la operación de dos elementos cualesquiera de S pertenece también a S. Entonces a, b S se verifica que a T b’ S, luego por hipótesis a T (b’)’ S, pero (b’)’ = b, de donde a T b S. Proposición: la intersección de cualquier familia no vacía de subgrupos de un grupo G es un subgrupo de G. Es suficiente con demostrarlo para la intersección de dos subgrupos de G. Sean éstos S1 y S2 . Hay que demostrar que a, b S1 S2 , se verifica que a T b’ S1 S2. Por ser a y b elementos de S1 y S2 se verifica que: a S 1 y b S1 a S2 y b S2

} de donde

a T b’ S 1 a T b’ S2

Pertenecen a ambos, por tanto, a T b’ S1 S2. Grupos finitos. Sea {G, T} un grupo, donde el conjunto G tiene un número finito de elementos. Entonces, se dice que el par {G, T} es un grupo finito, y el número de elementos de G recibe el nombre de orden del grupo. Teorema de Lagrange. Si G es un grupo finito y S un subgrupo de G, entonces el orden de G es un múltiplo de orden de S.

199

suma {R+, ·}: log: {R +, ·} → {R, +} a, b R + log (a · b) = log a + log b

a S b S y b’ S, entonces a T b’ S, pues la operación entre los dos elementos de S es otro elemento de S y a y b’ son de S. Implicación hacia la izquierda o condición suficiente (←); es decir, a, b S, tales que a T b’ S → entonces S es subgrupo. Para la demostración hay que comprobar:

Estructuras algebraicas

Un endomorfismo es un homomorfismo de (G, T) en sí mismo. Por su parte, el monomorfismo es un homomorfismo inyectivo, epimorfismo es un homomorfismo suprayectivo; se llama isomorfismo a un homomorfismo biyectivo y un automorfismo es un endomorfismo biyectivo. Núcleo de un homomorfismo es el conjunto de todos los elementos de G cuya imagen es el elemento neutro de G’. Se representa como N (h) o Kern (h): N (h) = {x G/ h(x) = e’} G

G'

N(h) x y z

. . .

.e'

Si x, y, z N (h) h (x) = e’ h (y) = e’ h (z) = e’

Imagen del homomorfismo. El conjunto imagen de un homomorfismo, escrito im (h), es el conjunto formado por todos los elementos de G’ que son imagen de algún elemento de G: Im (h) = {x’ G’/ ∃ x G y h (x) = x’} Los conjuntos N (h) e im (h) son subgrupos de G y G’, respectivamente. Propiedades de los homomorfismos. Sean (G, T) y (G’, ⊥) dos grupos y h: G → G’ un homomorfismo, entonces se tiene: a) La imagen por h del elemento neutro de G es el elemento neutro G’:

Homomorfismos de grupos Sean {G, T} y{G’, ⊥} dos grupos. Se llama homomorfismo de G en G’ a toda aplicación h: G → G’ que verifica: h (a T b)= h (a) ⊥ h (b) {G, T}

.a .aTb .b

h

{G', ⊥}

.h (a) .h (aTb) = h (a) ⊥ h (b) .h (b)

El logaritmo decimal es un homomorfismo entre el conjunto de los números reales positivos con la multiplicación {R+, ·}, y el conjunto de los números reales con la

h (e) = e’ Demostración: a G, a T e = e T a = a, mediante el homomorfismo se tiene: h (a T e) = h (a) ⊥ h (e) = h (a) h (e T a) = h (e) ⊥ h (a) = h (a) Es decir, h (e) deja h (a) como está, luego h (e) debe de ser el neutro y como el neutro es único h (e) = e’. b) La imagen del simétrico para un homomorfismo es el simétrico de la imagen. Se representa el simétrico o inverso de a como a-1: h (a-1) = [h (a)]-1 a G


200

MATEMÁTICAS

______________________________________________________________________________________________

Demostración: a G ∃ a–1 G; a T a–1 = e y a–1 T a = e, luego h (a T a–1) = h (a) ⊥ h (a–1) = h (e) = e’; h (a–1 T a) = h (a–1) ⊥ h (a) = h (e) = e’. Al realizarse la operación de h (a) con h (a–1) se obtiene el elemento neutro e’, luego h (a–1) debe ser el simétrico de h (a) y, como el simétrico es único, entonces h (a–1) = [h (z)]–1. c) La imagen por h de un subgrupo de G es un subgrupo de G’. Es decir, S G; S es subgrupo h (S) G’ y h (S), también subgrupo. Demostración: a, b S se verifica que a T b–1 S, luego h (a T b–1) h (S). Por otra parte, h (a T b–1) = h (a) ⊥ h (b–1) = h (a) ⊥ [h (b)]–1; por tanto, h (a) ⊥ [h (b)]–1 h (S), luego h (S) es subgrupo de G’. Teorema: la condición necesaria y suficiente para que un homomorfismo sea inyectivo es que el núcleo tenga un solo elemento y éste sea el elemento neutro de G, e.

Condición necesaria. Es evidente, pues si S es anillo, –y S y x · y S. Condición suficiente. Hay que probar que si x – y S y x · y S, entonces S es subanillo. 1.º Si x – y S, entonces S es un subgrupo. 2.º Si x · y S, quiere decir que al multiplicar dos elementos de S, se obtiene otro elemento también de S, y como en el anillo la multiplicación es asociativa, en S también lo es. ∀ a, b, c S A se tiene a · (b · c) = (a · b) · c. Por la misma razón también será distributiva. a · (b + c) = a · b + a · c (b + c) · a = b · a + c · a, luego S es anillo Ejemplo de subanillo. El conjunto unitario formado por el neutro de la operación + en A es un subanillo de A: S = {0} A, {0} es subanillo

Anillo Sea A un conjunto no vacío con dos operaciones internas (se cambia la notación de las operaciones y en lugar de T y ⊥ se utiliza + y ·). La estructura a {A, +, ·} se dice que es un anillo si: 1.º { A, +} es un grupo abeliano o conmutativo. 2.º {A, ·} es un semigrupo. 3.º La operación · es distributiva respecto de la operación +, es decir, a, b, c A se verifica: a · (b + c) = a · b + a · c (b + c) · a = b · a + b · c Si además es conmutativa, se dice que el anillo es conmutativo. Si existe elemento neutro para la operación, se dice que es un anillo unitario: {A, +, ·} es un anillo si: {A, +}

{A, ·}

1.º asociativa 1.º asociativa 2.º elemento neutro 3.º elemento simétrico 4.º conmutativa {A, +, ·} distributiva de · respecto de + a · (b + c) = a · b + a · c (b + c) · a = b · a + b · c

Subanillo. Dados un anillo {A, +, ·} y un subconjunto no vacíos de A, S A, S ≠ ∅, se dice que S es un subanillo del anillo {A, +, ·} cuando S, con las dos operaciones de A, tiene también estructura de anillo, es decir, {S, +, ·} es anillo. Teorema: La condición necesaria y suficiente para que un subconjunto S de A sea subanillo es que: x, y S se verifica que x – y S (condición de subgrupo) y, x · y S

Hay que ver si se verifican ambas condiciones: 0–0=0 S 0 · 0 = 0 S, luego es subanillo Ideal de un anillo. Dado un anillo {A, +, ·}, se dice que un subconjunto I de A, I A es un ideal de A si se verifica: x, y I y a A

}

x–y I a·x I x·a I

Es decir, {I, +} es un subanillo de A si el producto de un elemento de I por cualquier elemento de A es un elemento de I. Proposición: todo ideal de A es un subanillo de A. La demostración es evidente, ya que la primera condición de subanillo se cumple y la segunda también, puesto que x I y a A, x · a I, en particular cuando a I también se cumplirá. Sin embargo, no todo subanillo es ideal. La intersección de ideales de un anillo {A, +, ·} es otro ideal. Se llama ideal engendrado por un subconjunto no vacío de A al ideal de intersección de todos los ideales de A que contienen al subconjunto. Ideal principal de A es el generado por un solo elemento de A. El conjunto de los números pares en el anillo de los enteros es un ideal principal generado por el elemento 2. Un ideal es máximo cuando únicamente está contenido en el anillo A. I es un ideal primo de un anillo A conmutativo si para cada dos elementos de A, a, b A, el producto a · b I, o bien a I, o bien b I. Por su parte, un anillo conmutativo a es principal si todos sus ideales son principales. Dado un anillo A, se dice que dos elementos a y b de A, {a, b A}, son divisores de cero cuando el producto de a por b es cero (a · b = 0) y, sin embargo, a y b no son cero ninguno de los dos, es decir, a ≠ 0 y b ≠ 0.


________________________________________________________________________________________

Por su parte, se llama dominio de integridad a todo anillo unitario sin divisiones de cero; es decir, si el producto de dos elementos cualesquiera es cero, entonces al menos uno de ellos tiene que ser cero. Un anillo conmutativo {A, T, ·} se dice que es euclídeo si para cada elemento a existe un número positivo f (a) tal que la función cumple: 1.º Si a es múltiplo de b, es decir existe c A tal que a = b · c, entonces f (a) f (b). 2.º Para dos elementos a, b de A cualesquiera, siendo b cero, existen q y r, elementos de A, de forma que se verifica que a = b q + r, y f (r) < f (b).

Estructuras algebraicas

201

Subcuerpos. Sea K con + y · {K, +, ·}, un cuerpo y S un subconjunto de K no vacío. S K, S ≠ ∅, se dice que S es un subcuerpo de K si S con las operaciones de K, es decir {S, +, ·}, tienen estructura de cuerpo. La condición necesaria y suficiente para que S ≠ ∅ sea un subcuerpo de K es que se verifique: 1.º a, b, S; 2.º a, b, S;

a – b S. b ≠ 0 sea a · b–1 S.

La estructura de un cuerpo es fundamental para la definición de espacio vectorial. El conjunto R de los números reales tiene estructura de cuerpo.

En el anillo de los enteros, la función f es la función valor absoluto que se define x z como: |x| =

{

– x si x es negativo (x < 0) 0 si x es cero (x = 0) x si x es positivo (x > 0)

En realidad, esta función lo que hace es transformar a los números enteros negativos en positivos, dejando al cero y a los enteros positivos tal como están.

Cuerpos Sea un conjunto K en el que se han definido dos operaciones internas: + y ·. Se dice entonces que la expresión {K, +, ·} tiene estructura de cuerpo o es un cuerpo si: 1.º {K, +} es un grupo abeliano o conmutativo. 2.º El conjunto K menos el elemento neutro de la suma con la operación ·, es decir, {K, – {0}, ·}, tiene estructura de grupo. 3.º La multiplicación es distributiva respecto de la suma: a · (b + c ) = a · b + a · c (a + b) · c = a · c + b · c Si la operación · es conmutativa, se dice que el cuerpo es conmutativo. Un cuerpo no tiene divisores de cero.

_ Preguntas de repaso 1. Comprobar que el conjunto de los números enteros pares es un subanillo del conjunto de los enteros Z. 2. Demostrar que la interacción de ideales de un anillo (A, T, ·) es también un ideal de dicho anillo. Hacer la demostración para la intersección de dos ideales. 3. Comprobar que el conjunto formado por las clases de restos módulo 5 (Z/5) con la operación suma de clases tiene estructura de grupo abeliano. El conjunto Z/5 = {0, 1, 2, 3, 4}. La tabla para sumar en Z/5 es: + 0 1 2 3 4

0 0 1 2 3 4

1 1 2 3 4 0

2 2 3 4 0 1

3 3 4 0 1 2

4 4 0 1 2 3


f a e

c

Y f (x)

A

b B

NÚMEROS NATURALES, ENTEROS Y FRACCIONARIOS

d

L

a necesidad de contar es común al hombre desde las primeras civilizaciones. Saber el número de ovejas de su rebaño y la cantidad de tierras que poseían obligó a los hombres primitivos a crear sistemas de medida y numeración. En principio, cada país y cada pueblo tenían unidades de medida propias, lo que presentaba grandes dificultades en el intercambio de productos. Para evitarlo, se creó un sistema de unidades único y común para todos: el sistema métrico decimal.

Números naturales Los números naturales son los primeros que utilizó el hombre. Aparecieron con la necesidad de contar rebaños, los componentes de una tribu, etc. Indican el número de elementos de un conjunto, es decir, su cardinal. Así, cardinal de un conjunto se define como el número de elementos que componen dicho conjunto. Si A es el conjunto de las vocales: A = {a, e, i, o, u}, card (A) = 5

O

x c x+ h

X

b) Propiedad simétrica. Si un conjunto A es equipotente con otro, entonces el otro es equipotente con el primero. A B → B A, A B → f: A → B: f es biyección, luego ∃ f –1: B-A tal que f –1 es biyección, luego B A: f

A a e i o u

B m n p q r

f –1

c) Propiedad transitiva. La propiedad transitiva dice que si A, B y C son tres conjuntos tales que A B y B C, entonces se verifica que A C. Es evidente, pues la composición de aplicaciones biyectivas es una aplicación biyectiva. A

B f

Dos conjuntos se dicen equipotentes, si entre ellos se puede establecer una aplicación biyectiva. Por tanto, los dos conjuntos tienen el mismo número de elementos, el mismo cardinal. La relación de la equipotencia de conjunto se representa por el signo . Escribir A B quiere decir que los conjuntos A y B son equipotentes:

h a

C g

gof

A B ↔ ∃ f: A → B; f es biyectiva La equipotencia de vectores es una relación de equivalencia que cumple las propiedades reflexiva, simétrica y transitiva. a) Propiedad reflexiva. Todo conjunto es equivalente consigo mismo, A A. Es evidente, pues la aplicación identidad que, a cada elemento le hace corresponder el mismo es una biyección.

Toda relación de equivalencia en un conjunto establece una clasificación donde los elementos son las clases de equivalencia. Estas clases de equivalencia son los números naturales. A la clase formada por el conjunto vacío se le llama cero y se le asigna el número 0; a la clase formada por los conjuntos unitarios se le llama número uno y se representa por 1; a la clase formada por los conjuntos de dos números se le llama número dos y se representa por 2, y así sucesivamente. Por tanto, el conjunto de los

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


________________________________________________________________________

números naturales, que se designa por N, es el conjunto de las clases de equivalencia: N = {0, 1, 2, 3, 4…}.

Operaciones con números naturales Adición o suma de números naturales Sean A y B dos conjuntos tales que card (A) = a y card (B) = b y además A B = ∅. Se define la suma de a y b, y se representa por a + b, como el cardinal del conjunto A B: a + b = card (A B), A B = ∅ donde a y b son los sumandos, y el resultado se denomina suma. Propiedades de la suma. Son las siguientes: a) Propiedad uniforme. Si m, n, m’, n’ son números naturales tales que m = m’ y n = n’, entonces m + n = m’ + n’. Esta propiedad dice que si se suman miembro a miembro dos igualdades, se obtiene otra igualdad. b) Propiedad conmutativa. Si m y n N, entonces m + n = n + m. c) Propiedad asociativa. Si m, n y p son números naturales, se verifica que: m + (n + p) = (m + n) + p d) Existencia de elemento neutro. El cero es el elemento neutro para la suma de números naturales: n+0=n e) Propiedad monótona. Sumando miembro a miembro dos desigualdades del mismo sentido, se obtiene otra desigualdad del mismo sentido; es decir, si m, n, m’, n’, son números naturales que verifican: m < m’ y n < n’, entonces m + n < m’ + n’

Sustracción o resta de números naturales Para cada dos números naturales m y n, se llama diferencia de m y n a otro número natural p que verifica que m = n + p; m y p se llaman, respectivamente, minuendo y sustraendo y p es la resta o diferencia. La resta no es operación interna en el conjunto de los números naturales, ya que sólo se puede realizar cuando m > n. Ejemplo: 9 – 3 = 6, pues 9 = 6 + 3. Esta operación se puede realizar, pues 9 > 3. Sin embargo 6 – 8 = no se puede realizar en N. La resta no es asociativa ni conmutativa.

Números naturales, enteros y fraccionarios

203

Multiplicación de números naturales Dados dos números naturales llamados multiplicando y multiplicador (ambos denominados factores), se llama multiplicación al resultado de sumar el multiplicando tantas veces como indica el multiplicador. A este resultado se le llama producto. La multiplicación se indica con el signo “·” o “ ”. Si m y n son dos números naturales: m · n = m + m + m +… (n)… + m. Ejemplo: 7 · 4 = 7 + 7 + 7 + 7 = 28. La multiplicación es operación interna en el conjunto de los números naturales. Siempre que se multiplican dos números naturales se obtiene otro número natural. También es asociativa, conmutativa y posee elemento neutro para N* conjunto de los números naturales menos el cero. N* = N – {0}. Este elemento neutro es el 1, llamado elemento unidad: ∀ n N, n · 1 = n Además, la multiplicación es distributiva respecto de la suma. Si m, n y p son números naturales se verifica: m · (n + p) = m · n + m · p

División de números naturales División es la operación matemática por la que se conoce el número de veces que un número contiene a otro. En la división de números naturales se distinguen dos casos: la división exacta y la división inexacta. División exacta. Dados dos números naturales m y n, siendo n ≠ 0, y m < n, se llama división exacta de m por n, y se representa por m : n, a otro número natural c llamado cociente que verifica que m = n · c. La división se representa por la igualdad: m : n = c. División inexacta. Dados dos números naturales m y n, con n ≠ 0 y m n, se llama división inexacta de números naturales a la operación por la cual se obtienen dos números naturales c y r con r < n que verifican la igualdad: m = n · c + r. El cociente de la división es c y r es llamado resto. La división exacta se puede considerar como un caso específicamente particular de la división inexacta, aquel en que el resto es cero.

Potencias de números naturales Una potencia de base a y exponente n es el resultado de multiplicar a por sí mismo n veces. Se escribe a n, siendo a y n números naturales. Por ejemplo:


204

MATEMÁTICAS

______________________________________________________________________________________________

an = a · a · a …(n) … a 43 = 4 · 4 · 4 = 64 25 = 2 · 2 · 2 · 2 · 2 = 32 Casos particulares: cuando el exponente es cero, el resultado es 1: 0

30 = 1

a =1 1000 = 1

a N a≠0 3270 = 1

Cualquier número elevado a 1 es el mismo número → a1 = a a N . 41 = 4; 51 = 5 Propiedades de las potencias. Las propiedades de las potencias son las siguientes: a) Al multiplicar potencias que tienen la misma base, se obtiene otra potencia con la misma base y cuyo exponente es la suma de los exponentes: a, m, n N con a ≠ 0 am · an = am + n, por ejemplo: 3 7 · 34 = 311 b) Al dividir potencias que tienen la misma base, se obtiene otra potencia con la misma base y cuyo exponente es la diferencia de los exponentes: a, m, n N tal que a ≠ 0 y m > n a m · an = am – n Ejemplo: 37 : 32 = 37 – 2 = 3 5 . c) El producto de potencias con idéntico exponente es otra potencia con el mismo exponente y base, el producto de las bases: a, b, n N con a ≠ 0 y b ≠ n se verifica an · bn = (a · b)n Ejemplo: 27 · 57 = (2 · 5)7 = 107 . d) El cociente de potencias con el mismo exponente es otra potencia con el mismo exponente y cuya base es el cociente de las bases: a, b, n N con a ≠ 0 y b ≠ 0 se verifica an : bn = (a : b)n Ejemplo: 94 : 34 = (9 : 3)4 = 3 4 .

e) La potencia elevada a otra potencia es una potencia con la misma base y su exponente es el producto de los exponentes: a, m, n N con a ≠ 0 se verifica (am ) n = an · m Ejemplo: (32 ) 4 = 32 · 3 2 · 3 2 . 3 2 = 3 8.

Descomposición polinómica de un número natural Todo número natural se puede descomponer como suma de la cifra de las unidades más la de las decenas por 10 más la de las centenas por 100 o 102 más la de las unidades de millar por 1.000 o 103, y así sucesivamente. Por ejemplo: 984 = 4 + 8 · 10 + 9 · 102.

Los números enteros En la práctica existen situaciones que no se pueden explicar utilizando los números naturales. Si se dice que una temperatura es de 4 ºC no queda completamente determinada, pues pueden ser por encima o por debajo de cero. Los números rojos, o saldo deficitario en la cuenta corriente, no se expresan claramente con los números naturales. Situaciones como las anteriores crean la necesidad de ampliar el campo numérico. Esta ampliación lleva al concepto de número entero. El conjunto de los números enteros se representa por la letra Z y está formado por los números naturales y los números negativos: Z = {..., – 4, – 3, – 2, –1, 0, 1, 2, 3, 4, 5, ...} Formalmente, se define el conjunto de los enteros, Z, como el producto cartesiano de N · N ( Z = N · N), luego los elementos de Z son los pares ordenados (a, b) N · N: Z = {(a, b); a N y b N} Los pares ordenados en los que la primera componente es mayor que la segunda, a > b, forman los números positivos. El par (7, 3) será el número entero 4. Los pares cuya primera componente es menor que la segunda, a < b, formarán los números negativos. El par (3, 7) será el número entero –4, y los pares ordenados que tengan ambos componentes iguales formarán el cero. En la operación Z = N · N, se define una relación de la siguiente forma: (a, b) R (m, n) ↔ a + n = b + m Ejemplo: (5, 4) R (7, 6), pues 5 + 6 = 4 + 7; 11 = 11.


________________________________________________________________________

Esta relación es de equivalencia, ya que cumple las propiedades reflexiva, simétrica y transitiva: a) Propiedad reflexiva. (a, b) N · N (a, b) R (a, b). Todo par está relacionado consigo mismo. En efecto (a, b) R (a, b) ↔ a + b = b + a , y como la suma en N es conmutativa, la igualdad anterior es cierta. b) Propiedad simétrica. Para cada dos pares (a, b) y (m, n) de N · N tales que (a, b) R (m, n), entonces se verifica que (m, n) R (a, b). Por verificarse que (a, b) R (m, n) se cumple que a + n = b + m, pero como la suma es conmutativa en N se tiene que n + a = m + b, de donde (m, n) R (a, b). c) Propiedad transitiva. (a, b), (m, n) y (c, d) N · N, tales que se verifica: (a, b) R (m, n) y (m, n) R (c, d)

→ (a, b) R (m, n)

(a, b) R (m, n) ↔ a + n = b + m (m, n) R (c, d) ↔ m + d = n + c →

a+n+m+d= =b+m+n+c

de donde a + d + (n + m) = b + c + (m + n), luego a + d = b + c y por tanto (a, b) R (c, d). Esta relación de equivalencia induce una partición de N · N en clases de equivalencia. Dos elementos están relacionados si pertenecen a la misma clase, donde cada una de estas clases de equivalencia va a ser un número entero. Como representante de la clase se toma aquel par en el que alguno de sus componentes es cero. El conjunto de las clases de equivalencia es el conjunto cociente. Los pares (2, 0), (3, 1), (4, 2), (5, 3), ..., forman una clase de equivalencia. El representante canónico de la clase es el (2, 0), que en la práctica se representa solamente como 2. Los pares (0, 4), (1, 5), (2, 6), (3, 7), ..., forman una clase de equivalencia. El representante es el (0, 4), que en la práctica se expresa por –4. Los pares (0, 0), (1, 1), (2, 2), (3, 3), ..., forman una clase de equivalencia cuyo representante es el (0, 0) y, en la práctica, se representa por 0. En general, el par (a, 0) es el número entero a y el par (0, a) es el número entero –a.

Valor absoluto de un número entero Sea z Z. Se llama valor absoluto de Z, y se representa por |z|, a la función siguiente: |Z| =

z si z > 0 0 si z = 0 –z si z < 0

Operaciones con números enteros Adición de números enteros Se define la suma de pares ordenados de la siguiente forma: (a, b) + (c, d) = (a + c, b + d).

Números naturales, enteros y fraccionarios

205

Ejemplo: (3, 5) + (4, 7) = (3 + 4, 5 + 7). Si se hace mediante los representantes canónicos: (0, 2) + (0, 3) = (0, 5) = –5. En general, para sumar dos números, si ambos son positivos o negativos, se suman y se pone el signo que tienen. Si uno es positivo y otro negativo, se restan y se pone el signo del mayor de ambos en valor absoluto. Ejemplo: 8 + 7 = 15; (–8) + (–7) = –15; 8 + (–3) = 5; (–9) + (4) = –5. Para restar dos números enteros, basta sumar al minuendo el opuesto al sustraendo: a – b = a + (–b); 7 – (–3) = 7 + 3 = 10.

Producto de números enteros El producto de números enteros se define mediante pares ordenados como: (a, b) + (c, d) = (a · c + b · d, a · d + b · c). Por ejemplo: (3, 7) · (6, 4) = (18 + 28, 12 + 42) = (46, 54). Efectuando la operación mediante los representantes canónicos: (0, 4) · (2, 0) = (0, 8); de donde (–4) · 2 = –8. En general, para multiplicar dos números enteros se tiene: si ambos son del mismo signo (ambos positivos o ambos negativos), el producto es positivo e igual al producto de los valores absolutos de dichos números. Si los dos números son uno positivo y el otro negativo, el producto es negativo e igual al producto de los valores absolutos de dichos números. Por ejemplo: (+3) · (+7) = +21; (+3) · (–7) = –21;

(–3) · (–7) = +21; (–3) · (+7) = –21

El conjunto de los números enteros con la multiplicación así definida tiene las propiedades asociativa y conmutativa, y posee elemento unidad para todos los números enteros, salvo el cero. No existe elemento inverso de la multiplicación en Z. La multiplicación es distributiva respecto de la suma: a · (b + c) = a · b + a · c Por tanto, el conjunto Z con la suma y productos definidos (Z, + .) tiene estructura de anillo conmutativo y unitario.

División de enteros La división se realiza análogamente a la de los números naturales; sin embargo, han de tenerse en cuenta los signos. Si se dividen dos números de igual signo, el resultado es positivo; si son de signos contrarios, el resultado es negativo: (+9) : (+3) = +3 (–9) : (–3) = +3 (+9) : (–3) = –3 (–9) : (+3) = –3


206

MATEMÁTICAS

______________________________________________________________________________________________

Regla de los signos para la multiplicación y división: Multiplicación +·+=+ –·–=+ +·–=– –·+=–

División +:+=+ –:–=+ +:–=– –:+=–

Potencias de números enteros La potencia de números enteros se realiza de forma análoga a la de los números naturales. La diferencia consiste en que es preciso tener en cuenta los signos: a n = a · a · a · (n )… a Si la base de la potencia es positiva, el resultado es positivo (3)3 = 27. Si la base es negativa, hay que tener en cuenta la paridad del exponente, es decir, si el exponente es par el resultado es positivo, y si es impar, el resultado es negativo. Por ejemplo: (–2)4 = (–2) · (–2) · (–2) · (–2) = 16 (–2)3 = (–2) · (–2) · (–2) = –8

Los números racionales Los números enteros, si bien amplían el campo numérico de los números naturales, no bastan para cubrir todas las necesidades que se presentan en la realidad. Al medir, no siempre se tiene un número exacto de veces la unidad. En el conjunto de los números enteros Z, los elementos no tienen inverso respecto de la multiplicación, etc. Estos hechos motivaron la necesidad de ampliar el ámbito de estos números. Ello se consigue con los números racionales, cuyo conjunto se representa por Q. Sea Z* = Z – {0}. En el conjunto producto Z · Z* se establece una relación R, definida : (a, b), (c, d) Z · Z*; (a, b) R · (c, d) ↔ a · d = b · c. Esta relación así definida es de equivalencia, es decir, cumple las propiedades reflexiva, simétrica y transitiva: a) Propiedad reflexiva. (a, b) Z · Z*, se verifica que (a · b) R (a · b). Esto es cierto pues a · b = b · a, por ser conmutativo el producto de números enteros. b) Propiedad simétrica. (a, b), (c, d) Z · Z*, que verifica que (a, b) R (c, d) → (c, d) R (a, b). Por estar (a, b) R (c, d), se verifica que a · d = b · c, de donde c · b = a · d, luego (c, d) R (a, b). c) Propiedad transitiva. (a, b), (a’, b’), (a”, b”) Z · Z*, tales que se verifica (a, b) R (a’, b’), entonces (a, b) R (a”, b”) (a’, b’) R (a”, b”). Por estar (a, b) R (a’, b’) y (a’, b’) R (a”, b”) se verifica a · b’ = b · a’ · a’ · b” = b’ · a” de donde , multiplicando miembro a miembro, a · b’ · a’ · b” = b · a’ · b’ · a”, cambiando el or-

den de los términos por la conmutatividad en Z, se tiene: a · b” · (b’ · a’) = b · a” · (b’ · a’), y por la propiedad de simplificación en Z, se tiene: a · b” = b · a” y, por tanto: (a, b) R (a”, b”) Esta relación de equivalencia en Z · Z* establece una partición en clases de equivalencia. Al conjunto de cociente Z · Z*/R, cuyos elementos son las clases de equivalencia, se le llama Q. Los pares ordenados (a, b), con b ≠ 0, se escriben de la forma a/b y se les llama fracciones: a la primera componente, a , numerador y a la segunda componente, b, denominador. Un ejemplo de equivalencia sería: (2, 3), (4, 6), (6, 9), (8, 12), (10, 15), …; o también 2/3, 4/6, 6/9, 8/12, 10/15, … De todos los elementos mostrados, existe uno, el 2/3, en que sus elementos son primos entre sí, el 2 y el 3. Este sería el representante canónico de todos los expuestos. A la operación de hallar el representante canónico, dado un elemento de la clase, se llama simplificación de fracciones. Los enteros se pueden considerar como fracciones en las que el denominador es la unidad: –3/1, –2/1, –1/1, 0/1, 1/1, 2/1

Operaciones con números racionales Suma de números racionales Dadas dos fracciones cualesquiera a/b y c/d, se define la suma de fracción como: a/b + c/d = (a · d + b · c) / b · d; por tanto, la suma es una operación interna. En forma de pares ordenados, esta operación se define: (a, b) + (c, d) = (a · d + b · c , b · d). El conjunto de los números racionales con la operación suma (Q, +) tiene estructura de grupo abeliano. Reducción de fracciones a común denominador. Se llama reducción de fracciones a común denominador a la operación por la cual se eligen representantes de las fracciones en que los denominadores son el mismo. Se puede hacer de dos formas: 1.º Las nuevas fracciones se obtienen multiplicando los dos términos (numerador y denominador) por los denominadores de los demás: 2/5, 3/4, 7/10 (2 · 4 · 10)/(5 · 4 · 10), (3 · 5 · 10)/(5 · 4 · 10), (7 · 5 · 4)/(5 · 4 · 10) 80/200, 150/200, 140/20 2.º Se calcula el mínimo común múltiplo de los denominadores de las fracciones, que será el denominador de las nuevas fracciones. El numerador de cada una de ellas se obtiene multiplicando el numerador original por el re-


________________________________________________________________________

sultado de dividir el mínimo común múltiplo entre el denominador primitivo: 2/5, 3/4, 7/10, m. c. m. (5 · 4 · 10) = 20 (2 · 4)/20, (3 · 5)/20, (7 · 2)/20 → 8/20, 15/20, 14/20 20 : 5 = 4; 20 : 4 = 5; 20 : 10 = 2 Práctica de la suma algebraica de fracciones. Se distinguen dos casos: 1.º Las fracciones tienen el mismo denominador. Se obtiene otra fracción que tiene el mismo denominador y, como numerador, la suma de los numeradores: a/b + a’/b – a”/b = (a + a’ – a”)/b Ejemplo: 6/7 + 5/7 – 3/7 = (6 + 5 – 3)/7 = 8/7. 2.º Las fracciones tienen distinto denominador. Para sumarlas se reducen primero a común denominador y después se suman como en el caso anterior: 2/3 + 3/4 – 7/10 = 8/20 + 15/20 – 14/20 = = (8 + 15 – 14)/20 = 9/20

Números naturales, enteros y fraccionarios

207

El elemento inverso de la fracción a/b con a ≠ 0, es b/a, ya que a/b · b/a = a · b/b · a = 1/1. Propiedad distributiva. La multiplicación de números racionales es distributiva respecto de la suma: a/b · (a’/b’ + a”/b”) = a/b · a’/b’ + a/b · a”/b” Por tanto, el conjunto de los números racionales con las operaciones suma y producto (Q, +, ·) tiene estructura de cuerpo.

División de números racionales Para dividir dos fracciones basta multiplicar el multiplicando por el inverso del multiplicador: Sean a/b, c/d Q con c ≠ 0; a/b : c/d = a/b · d/c = = (a · d)/(b · c)

Potencia de números racionales Las propiedades son las mismas que para la potenciación de números enteros, teniendo en cuenta que:

m. c. m. (5, 4, 10) = 20 Comparación de fracciones. Dadas dos fracciones de igual denominador, es mayor la que tiene el numerador más alto. Así, dadas 4/5 y 3/5, como 4 > 3, entonces 4/5 > 3/5. Si las fracciones tienen distinto denominador, se reducen previamente a común denominador y después se sigue la regla anterior: 2/5, 3/4; m. c. m. (5, 4) = 20: 2/5 = 8/20; 3/4 = 15/20; 15/20 > 8/20, luego 3/4 > 2/5

Multiplicación de números racionales El resultado de multiplicar dos fracciones es otra fracción cuyo numerador es el producto de los numeradores, y el denominador, el producto de los denominadores: a/b · c/d = (a · c)/(b · d) 3/4 · 5/7 = (3 · 5)/(4 · 7) = 15/28 La multiplicación así definida también es operación interna. Si se define en forma de pares ordenados (a, b), (c, d) Q: (a, b) · (c, d) = (a · c, b · d) El conjunto de los números racionales con la operación multiplicación (Q, ·) tiene las propiedades: asociativa y conmutativa. El elemento neutro unidad es la fracción 1/1, ya que a/b · 1/1 = a/b.

a) Para elevar una fracción a una potencia, se elevan el numerador y el denominador a dicha potencia: (a/b)n = a/b · a/b · —(n)— · a/b = = a · a —(n)— a/b · b —(n) — b = an /bn b) Toda potencia de exponente negativo es una fracción en la que el numerador es la unidad y el denominador la misma potencia, pero con exponente positivo: a–n = 1/an .

Fracciones decimales Se llaman fracciones decimales a aquellas en las que el denominador es la unidad seguida de ceros: 3/10, 245/100, 125/10.000. En estas fracciones, si se efectúa la división del numerador por el denominador, se obtienen números decimales con un número finito de cifras. Por ejemplo: 3/10 = 0,3;

245/100 = 2,45;

125/10.000 = 0,0125

Las cifras que quedan a la izquierda de la coma se llaman parte entera, y las que quedan a la derecha son la parte decimal. Multiplicación por la unidad seguida de ceros. Se desplaza la coma tantos lugares a la derecha como ceros tiene el multiplicador. Por ejemplo: 3,27 · 10 = 32,7; 42,8 · 100 = 4.280 0,3296 · 1.000 = 329,6


208

MATEMÁTICAS

______________________________________________________________________________________________

División por la unidad seguida de ceros. Para dividir por la unidad seguida de ceros, se desplaza la coma tantos lugares a la izquierda como ceros tiene el divisor. Por ejemplo, 32 : 10 = 3,2; 42,5 : 1.000 = 0,0425. Todo decimal finito se puede convertir en fracción decimal. Basta con quitar la coma y dividir por la unidad seguida de tantos ceros como cifras decimales haya. Así, por ejemplo:

Esta expresión se multiplica por la unidad seguida de tantos ceros como cifras tiene el período (por 1.000 en este caso): 100.000 x = 425.374,374 (2) a (2) se le resta (1): 100.000 x = 425.374,374 – 100 x = 425.374 99.900 x = 924.849 →

0,32 = 32/100; 3,2 = 32/10

Números decimales periódicos Se llama decimales periódicos a los que poseen cifras decimales, donde a partir de una determinada cifra o un grupo de cifras se repiten. Estas cifras que se repiten reciben el nombre de período; para indicar que se repiten se sitúa el signo sobre el período. Si el período comienza en la primera cifra decimal, ésta se llama periódica pura, y si existe alguna cifra decimal que no se repite, se conoce periódica mixta (la parte que no se repite se llama anteperíodo). Por ejemplo: 3, 28 = 3,28282828.................. = 4,25374374374 4,25374

luego: 4,25374 = 424.849 99.900

Raíces Se llama raíz de índice n y radicando a, y se representa n a, a un número x que verifica que xn = a: por el signo n

a = x ↔ xn = a La raíz es la operación inversa de la potenciación:

Ejemplo de transformación de un número decimal periódico puro en fracción. Sea “x” el número decimal: x = 3, 28 (1) Se multiplican los dos miembros de la igualdad por la unidad seguida de tantos ceros como cifras tiene el período (en este caso 100): 100 x = 328, 28 (2)

5

32 = 2, pues 25 = 32 Cuando el índice de la raíz es 2, la raíz se llama cuadrada y generalmente no se indica expresamente. En el conjunto de los números reales no se puede calcular la raíz cuadrada de un número negativo: – 3 = no tiene sentido en R Todo número positivo tiene dos raíces cuadradas, una positiva y otra negativa:

a (2) se le resta (1): 100 x = 328, 28 – x = 3, 28

99 x = 325 → x = 325/99 luego 3, 28 = 325/99

Ejemplo de transformación de un número decimal periódico mixto en fracción. Sea “x” el número decimal: x = 4,25374

4 = 2, pues 22 = 4 pero también 4 = –2, pues (–2)2 = 4 Si n = 3, la raíz se llama cúbica. Para introducir factores dentro de una raíz, se eleva el factor al índice de la raíz. Por ejemplo: 2

Se multiplican los dos miembros de la igualdad por la unidad seguida de tantos ceros como cifras tiene el anteperíodo (en este caso por 100): 100 x = 425,374 (1)

x = 424.849 99.900

3

2 3 4 = 3 · 4 ; 5 6 = 5 · 6 3

Para extraer factores fuera de la raíz, se divide el exponente del factor por el índice de la raíz: 3

2

8 46 · 5 = 42 · 5 ; 3 · 2 = 34 · 2


________________________________________________________________________

Toda potencia de exponente fraccionario se puede considerar como una raíz en la que el índice es el denominador del exponente de la potencia, y el radicando, la base de la potencia elevada al numerador de la fracción: q

ap a p/q = Reducción de raíces a índice común. Para modificar varias raíces de forma que todas tengan el mismo índice, se calcula el mínimo común múltiplo de los índices, que será el índice de las nuevas raíces, de modo que el radicando será el original elevado al cociente, entre el mínimo común múltiplo y el índice inicial: 3

4

4

6

9

5

m.c.m. (3, 4, 6) = 12 3

12

12 : 3 = 4

4

12

12 : 3 = 4

6

12

12 : 6 = 2

4 = 44 9 = 94 5 = 52

3

3

209

Racionalizar raíces Se llama racionalizar a quitar raíces del denominador de una fracción. Pueden darse tres casos: a) En el denominador existe una raíz cuadrada como factor; entonces, para racionalizar se multiplican numerador y denominador por la raíz del denominador. Por ejemplo: 3 3 · 5 3 · 5 3 · 5 3 · 5 —–— = ——–—— = ——–—2 = ——— = ——— 2·5 10 2 5 2 5 · 5 2 ( 5) b) En el denominador existe un binomio, en cuyo caso se multiplican numerador y denominador por el conjugado del denominador. Por ejemplo: 2 2 (3 + 7) 2 (3 + 7) —–— = ——–—–——–— = ————– = 3 – 7 (3 – 7) · (3 + 7) 32 – ( 7)2 2 (3 + 7) 2 (3 + 7) = –———–— = ————– = 3 + 7 9–7 –2

Raíces semejantes son las que tienen el mismo índice y el mismo radicando. Para sumar raíces, éstas tienen que ser semejantes y se obtiene otra raíz semejante, cuyo coeficiente es la suma algebraica de los coeficientes: 3

Números naturales, enteros y fraccionarios

3

3

4 + 8 4 – 5 4 = (3 + 8 – 5) 4 = 6 4 3

c) En el denominador existe una raíz de índice n como factor. Para racionalizar, se multiplican numerador y denominador por una raíz del mismo índice y cuyo radicando es el de la raíz, pero elevado a la diferencia entre el índice y el exponente: 7

34 3 3 ——— = —————— = 7 3 7 3 7 4 3 2 3 · 3 2 7 4 7 4 3 3 3 3 34 = ——— = ——— = —— 7 7 3 2·3 2 2

Propiedades de las raíces a) La raíz de índice n de un producto es igual al producto de las raíces de índice n de cada uno de los factores: n

n

n

n

a · b c · = a · b · c b) La raíz de índice n de un cociente es igual a la raíz de índice n del dividendo dividida por la raíz de índice “n” del divisor: n

n

n

p / q = p / q c) La potencia de una raíz es la raíz del mismo índice de la potencia del radicando: n

n

p)m = pm ( d) La raíz de una raíz es otra raíz con el mismo radicando e índice igual al producto de los índices.

_ Preguntas de repaso 1. Transformar en fracción los siguientes números decimales: a) 0,37 b) 12,47 c) 25,37 2. Calcular: 2 – — 3 — (–———–— 3 5)

2

1 / 4 + 7

3. Una persona compra los 5/9 de una finca y otra los 2/12: a) ¿Cuál de las dos compró un trozo mayor? b) Si la finca era de 2,7 ha y el metro cuadrado de tierra está a 750 unidades monetarias, ¿cuánto pagó cada uno?


NÚMEROS PRIMOS

f a e

c A

b B

Y f (x)

O

d

Múltiplos y divisores Dados dos números a y b Z, si al dividir b entre a la división es exacta, es decir, el resto es cero, entonces se dice que b es múltiplo de a y a es divisor de b. Por ejemplo: si b = 35 y a = 7, al dividir 35 entre 7, se obtiene un resto cero y, por tanto, se puede decir que 35 es múltiplo de 7 y que 7 es divisor de 35: 35|7 0 5 b es múltiplo de a cuando lo contiene un número exacto de veces y a es divisor de b cuando a divide a b exactamente. Un múltiplo de un número se obtiene multiplicando dicho número por cualquier entero; así, múltiplos de tres son: 3 · 2 = 6, 3 · 3 = 9, 3 · 5 = 15, 3 · 13 = 39. El 6, el 9, el 15 y el 39 son múltiplos de 3. Luego b = m · a, m Z. Si a es divisor de b, –a también es divisor de b, pues si b = m · a, también se verifica que b = (–m) · (–a). Para indicar que b es múltiplo de a se coloca un punto sobre a: b = a.· Para indicar que a divide a b se coloca un segmento vertical entre ambos: a|b.

Propiedades de la divisibilidad a) Propiedad reflexiva: Todo número es múltiplo de sí mismo: a = a. Todo número es divisor de sí mismo: a|a. La unidad divide a cualquier número: 1|a. Estas tres afirmaciones son ciertas, pues: a = a · 1.

h a

x c x+ h

X

Demostración: Si a/b, entonces ∃ m Z; b = m · a. Si b/c, entonces n Z; c = n · b. De donde c = n · b = n · (m · a) = (n · m) · a. Y como n · m Z, entonces a/b. Ejemplo:

5 divide a 25 entonces 5 divide a 625 25 divide a 625 25 : 5 = 5; 625 : 25 = 25; 625 : 5 = 125 Las tres divisiones son exactas. c) Si a divide a dos números, a divide a su suma y a su diferencia: a/b y a/b, entonces a/(b + b’) y a/(b – b’) Demostración: por dividir a a b y b’, ∃ m y m’ Z; b = m · a y b’ = m’ · a. De donde (b + b’) = m · a + m’ · a = (m + m’) · a. Y como m + m’ Z, entonces a divide b + b’. Ejemplo: 5 divide a 125 y a 625, entonces 5 divide (625 + 125) y 5 divide a (625 – 125); (625 + 125) = 750; 750 : 5 = 150; (625 – 125) = 600; 600 : 5 =120. d) Si un número a divide a dos números b y b’ entonces a divide a su producto: Demostración: a divide a b y b’, entonces existen m y m’ Z; tales que b = a · m y b = a · m’. Multiplicando miembro a miembro estas dos igualdades se tiene, b · b’ = a · m · a · m’, de donde b · b‘ = (a · m · m’) · a y como a · m · m’ Z, a/b · b’. Ejemplo: 5 divide a 125 y 625; 125 · 625 = 78.125; 78.125 : 5 = 15.625. Para el cociente no siempre ocurre. e) Si un número a divide a otro b, entonces a divide a todos los múltiplos de b:

b) Propiedad transitiva: Si a divide a b y b divide a c, entonces a divide a c. Si a/b y b/c, entonces a/c.

Demostración: a divide a b, entonces b = m · a y cualquier múltiplo de b será h · b = h · m · a con h Z; luego a divide a h · b.

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


______________________________________________________________________________________________

Criterios de divisibilidad Los criterios de divisibilidad son unas reglas por las que se puede conocer si un número divide a otro sin necesidad de hacer la división: a) Un número es divisible por 2 si termina en 0 o en cifra par: 10 : 2 = 5; 14 : 2 = 7. b) Un número es divisible por 3 cuando la suma de sus cifras es 3 o un múltiplo de 3. Por ejemplo: para comprobar si el número 1.956 es un múltiplo de 3, se suman sus cifras: 1 + 9 + 5 + 6 = 21. El 21 es un múltiplo de 3, luego 1.956 también lo es; se ratifica mediante la división, 1.956 : 3 = 652. c) Un número es divisible por 4 cuando el número formado por sus dos últimas cifras es un múltiplo de 4 o dichas cifras son dos ceros. Ejemplo: para saber si el número 512 es un múltiplo de 4, se toma el número formado por sus dos últimas cifras, el 12, que es un múltiplo de 4; por tanto, 512 es múltiplo de 4 y también lo será 500, pues termina en dos ceros: 512 : 4 = 128; 500 : 4 = 125 d) Un número es divisible por 5 cuando acaba en 0 o en 5. Ejemplo: Según este criterio, el 425 y el 550 serán múltiplos de 5. e) Un número es divisible por 6 cuando lo es a la vez por 2 y por 3. Ejemplo: el número 750 es múltiplo de 2 por acabar en 0, y es múltiplo de 3 porque la suma de sus cifras, 7 + 5 + 0 = 12, es múltiplo de 3; por tanto, lo será de 6. Se comprueba que 750 : 6 = 125. f) Un número es divisible por 7 cuando restando sucesivamente a sus decenas el doble de sus unidades, al final queda 0 o un múltiplo de 7. Ejemplo: para comprobar si el número 14.938 es múltiplo de 7 se procede así: 14.938 – 16 14.877 – 14 133 –6

7 7

Como la unidad es 8, se resta a centenas y decenas 16, eliminando la cifra de las unidades. Como la unidad es 7, se resta a centenas y unidades 14, eliminando la cifra de unidad. Como la unidad es 3, se resta 6 a las decenas y se elimina la cifra de las unidades. Como el residuo es un múltiplo de 7, el número también lo es.

En efecto, 14.938 : 7 = 2.134. g) Un número es divisible por 8 cuando el número formado por sus tres últimas cifras sea un múltiplo de 8 o tres ceros. Por ejemplo: los números 31.408 y 31.000 son múltiplos de 8. El primero, porque 408 es múltiplo de 8, 408 : 8 = 51, y el segundo, porque termina en tres ceros. En efecto: 31.408 : 8 = 3.926 y 31.000 : 8 = 3.875. h) Un número es divisible por 9 cuando la suma de sus cifras es 9 o un múltiplo de 9. Por ejemplo: el número 11.277 es un múltiplo de 9, pues la suma de sus cifras: 1 + 1 + 2 + 7 + 7 = 18, y el 18 es un múltiplo de 9. En efecto: 11.277 : 9 = 1.253.

Números primos

211

i) Un número es múltiplo de 10 cuando termina en 0. El número 3.120 es múltiplo de 10; en efecto, al efectuar la división: 3.120 : 10 = 312. j) Un número es múltiplo de 11 cuando la suma de sus cifras de lugar impar menos la suma de sus cifras de lugar par, empezando a contar desde la derecha, sea 0, 11 o un múltiplo de 11. Ejemplo: El número 90.794 es múltiplo de 11. Para comprobarlo según el criterio, se suman las cifras de lugar impar: 4 + 7 + 9 = 20, y se suman las cifras de lugar par: 0 + 9 = 9. Se restan estas dos sumas: 20 – 9 y se obtiene 11; por tanto, dicho número, efectivamente, es múltiplo de 11. Se comprueba: 90.794 : 11 = 8.254. k) Un número es divisible por 13 cuando sumando sucesivamente a sus decenas el cuádruple de sus unidades, se obtiene 0 o un múltiplo de 13. Ejemplo: el número 32.981: 32.981 –4 3.302 –8 338 32 65

Como la unidad es 1, se suma 4 a sus decenas.

la unidad es 2, se suma 8 a sus Como decenas. la unidad es 8, se suma 32 a sus de Como cenas.

En efecto, 65 : 13 = 5. Como 65 es un múltiplo de 13, entonces el 32.981 también lo es. Al comprobar, se aprecia que: 32.981 : 13 = 2.537 l) Un número es múltiplo de 25 cuando sus dos últimas cifras sean ceros o múltiplos de 25. Por ejemplo: los números 31.200 y 31.275 son múltiplos de 25. En efecto, 31.200 : 25 = 1.248 y 31.275 : 25 = 1.251.

Números primos Se llama números primos a aquellos que sólo son divisibles por sí mismos o por la unidad. Los números que no son primos reciben el nombre de compuestos. Dos números son primos entre sí cuando el único divisor común a ambos es la unidad. Todo número compuesto se puede descomponer como producto de números primos. En efecto, si un número a es compuesto y admite varios divisores, el menor de todos ellos, b, sería el primo, ya que si éste fuese compuesto admitiría otros divisores menores que él: a = b1 · a1 con a1 < a Si a1 fuese primo ya bastaría. Si fuera compuesto, por lo anteriormente señalado, admitiría un divisor primo b2 y, por tanto, a = b1 · b2 · a2 con a2 < a1; aplicando este proceso repetidamente, se llegaría a un divisor que sería el último y, por tanto, primo. Luego: a = b1 · b2… bn.


212

MATEMÁTICAS

______________________________________________________________________________________________

El 15 se descompone en 3 · 5 , donde ambos números son primos. Si algún factor se repite, se escribe en forma de potencia: 75 = 52 · 3.

Método para descomponer un número en sus factores primos Se coloca el número y, a su derecha, un segmento vertical. A la derecha del segmento se coloca el menor número primo que es divisor del número, se realiza la división y el resultado se coloca bajo el número, volviéndose a repetir el proceso hasta llegar a la unidad. Por ejemplo: 840 2

840 2 420

840 2 420 2 210

840 420 210 105 35 7 1

2 2 2 3 5 7

Por tanto, 840 = 23 · 3 · 5 · 7.

Máximo común divisor Se llama máximo común divisor, escrito m. c. d., de varios números al mayor número que divide a todos ellos. Ejemplo. Sean los números 40 y 60: Divisores de 40 = 1, 2, 4, 5, 8, 10, 20. Divisores de 60 = 1, 2, 3, 4, 5, 6, 10, 20, 30. Los números, 1, 2, 4, 5, 10, 20, son divisores comunes a 40 y 60. De todos ellos, el mayor es el 20, que sería el máximo común divisor. Para calcular el máximo común divisor de varios números, se descomponen éstos en factores primos y se toman los factores comunes a todos ellos elevados al menor exponente con el que aparezcan. Ejemplo: m. c. d. (40, 60) = 222 · 5 = 4 · 5 = 20: 40 2 20 2 10 2 5 5 1 40 = 23 · 5

60 2 30 2 15 3 5 5 1 60 = 22 · 3 · 5

Los factores comunes son el 2 y el 5. El 2 se tomaría al cuadrado.

Mínimo común múltiplo Se llama mínimo común múltiplo, escrito m. c. m., de varios números al menor de los múltiplos comunes a dichos números.

Ejemplo: Múltiplos de 40 = 40, 80, 120, 160, 200, 240, … Múltiplos de 60 = 60, 120, 180, 240, … Los números 120 y 240 son múltiplos comunes de 40 y 60. El menor de todos ellos es el 120, luego será el mínimo común múltiplo de 40 y 60. Para calcular el mínimo común múltiplo de varios números, se descomponen éstos en producto de factores y se toman los factores comunes y los no comunes elevados a los máximos exponentes con que aparezcan. Ejemplo: 40 = 23 · 5; 60 = 22 · 3 · 5. Se toman el 23 y el 5, como factores comunes, y el 3, que no es común. Luego m.c.m. (40, 60) = 23 · 3 · 5 = 120.

Propiedades del máximo común divisor y mínimo común múltiplo a) Si uno de los números es divisor de todos ellos, ése es el máximo común divisor: m. c. d. (15, 30, 45, 60) = 15, pues 15 es divisor de 30, 45 y 60. b) Si uno de los números es múltiplo de todos ellos, ése es el mínimo común múltiplo: m. c. m. (15, 30, 60) = 60, pues 60 es múltiplo de 15 y de 30. c) Si los números son primos entre sí, su máximo común divisor es la unidad, y su mínimo común múltiplo el producto de todos ellos: m. c. d. (2, 3, 5) = 1; m. c. m. (2, 3, 5) = 30. d) Todo divisor del m. c. d. de varios números es un divisor común a todos ellos. Todo múltiplo del m. c. m. de varios números es un múltiplo común a todos ellos. El 10 es un divisor de 20, que es m. c. d. (40, 60), por lo que 10 es también divisor de 40 y 60; el 360 es un múltiplo de 120, que es el m. c. m. (40 y 60). También es múltiplo de 40 y 60. e) El producto del máximo común divisor por el mínimo común múltiplo de dos números es igual al producto de ambos números. Sean los números a y b Z, si d = m. c. d. (a, b) y D = m. c. m. (a, b), entonces d · D = a · b. Ejemplo: a = 40, b = 60, d = m. c. d. (40, 60) = 20, D = m. c. m. (40, 60) = 120, d · D = 20 · 120 = 2.400; a · b = 40 · 60 = 2.400. f) Si se dividen dos números por su máximo común divisor, los resultados obtenidos son primos entre sí: 40 : 20 = 2; 60 : 20 = 3; m. c. d. (2, 3) = 1. Algoritmo de Euclides para el cálculo del máximo común divisor de dos números. Este método está basado en el hecho de que el m. c. d. de dos números es el mismo que el m. c. d. del menor de ellos y del resto por defecto o por exceso de la división entre ambos. Sean dos números a, b, Z. El procedimiento es dividir a entre b; después, b por el resto de la división, r; posteriormente, r entre el resto de la división anterior, r 1, y así sucesivamente hasta que se llega a una división exacta. El último divisor es el m. c. d. de los dos números. Por sencillez, este proceso se realiza en un gráfico:


______________________________________________________________________________________________

C

C1

C2

C3

a

b

r

r1

r

r1

r2

r3

Ejemplo: a) m. c. d. (40, 60) = 20:

1

2

60

40

20

0

Números primos

213

Existen dos divisores del grado: el minuto y el segundo. El minuto corresponde a la 60ª parte del grado, y su símbolo es una tilde (’) en posición análoga a la del símbolo del grado. Un grado tiene sesenta minutos (1º = 60’). El segundo corresponde a la 60ª parte del minuto, y su símbolo son dos tildes (‘’) en la misma posición que los símbolos del grado y minuto (1’ = 60’’; 1º = 3.600’’). Para medir los ángulos, se utiliza el transportador de ángulos, que es una semicircunferencia graduada:

20

90º

180º

b) m. c. d. (1.375, 1.050) = 25:

25 es el m. c. d. 1

3

4

3

1.375

1.050

325

75

325

75

25

0

Medida del tiempo 25

Sistemas métricos no decimales El sistema métrico decimal debe su nombre a que las relaciones entre unidades se expresan mediante potencias de 10. Pero éste no es el único sistema de medidas. Existen dos tipos de magnitudes que utilizan unidades aceptadas por todos y que, sin embargo, no utilizan el sistema decimal, sino el sexagesimal. La utilización del 60 como base de un sistema se debe a la cantidad de divisores que posee, así como a la relativa facilidad para calcularlos y, sobre todo, relacionarlos. Estas dos magnitudes son la medida superior y la medida del tiempo:

Medida angular La unidad de este sistema es el grado, que corresponde a la medida de un ángulo central de circunferencia cuyo arco corresponde a 1/360 de la circunferencia. El símbolo con que se designa el grado es un cero minúsculo (º) colocado en la parte superior derecha de la cantidad:

Una circunferencia tiene 360º

Para medir el tiempo, la unidad que se utiliza es el día, que corresponde al período que tarda la Tierra en dar una vuelta completa alrededor de su eje. Como múltiplo del día se utilizan las semanas y los meses, aunque estos últimos no tengan todos la misma duración, y como múltiplo de éstos se utiliza el año solar, que tiene, aproximadamente, 12 meses y 365 días. El día se divide en 24 unidades más pequeñas llamadas horas. Cada una de estas horas se divide en 60 partes más pequeñas llamadas minutos, y cada minuto en 60 partes más pequeñas llamadas segundo.

Complejos e incomplejos La medida de ángulos se expresa mediante el empleo de varias unidades a la vez, en una forma de expresión compleja (p. ej., 30º 16’ 15’’). Si se expresa esta misma magnitud con una sola unidad, se habla de forma incompleja. Paso de forma compleja a incompleja. Para expresar el complejo 30º 16’ 15’’ en segundos, hay que pasar cada una de las cantidades a segundos: 30º · 3.600 = 108.000’’; 16’ · 60 = 960’’; 15’’ = 15’’. Por tanto, al sumar estas cifras se obtiene la equivalencia: 30º 16’ 15’’ = 108.975’’. Paso de incomplejo a complejo. Expresar 354.580’’ en forma compleja. Para pasar a complejo los segundos, se divide por 60. El resto de la división serán los segundos, y el cociente serán los minutos (los ceros no se simplifican en la división): 354.580 |60 545 5.909 es el cociente, los minutos 0580 40 es el resto, los segundos


214

MATEMÁTICAS

______________________________________________________________________________________________

El cociente, 5.909, se pasa a grados dividiendo por 60 y el resto de esta división serán los minutos, y el cociente, los grados: 5.909|60 509 98 es el cociente, los grados 29 es el resto, los minutos Por tanto, 354.580’’ = 98º 29’ 40’’.

Multiplicación de un número complejo por un número natural. Para multiplicar un complejo por un número, se multiplican separadamente los grados, minutos y segundos del complejo por dicho número, y después, se reducen los incomplejos a complejos. Por ejemplo: 48º 53’ 18”

Se efectúa la reducción (90º : 60” = 1’ y 30”; 266’ : 60” = 4º y 26’)

5 240º 265’ 90” = 244º 26’ 30’’

Operaciones con números complejos Suma. La suma de números complejos se realiza colocando los sumandos, uno debajo del otro, de forma que coincidan las respectivas unidades. Una vez efectuada la suma, se reducen las unidades correspondientes: 60º 34’ 41’’ 15º 42’ 12’’ 75º 76’ 53’’ = 76º 16’ 53’’ puesto que 76’ es igual a 1º y 16’ (se han reducido los segundos a grados dividiendo por 60). El resto de la división equivale a los minutos, y el cociente se suma a los grados. Resta de complejos. Para restar ángulos, se sitúan éstos de forma análoga a la suma: en la parte superior, el minuendo, y en la inferior, el sustraendo. Es preciso tener en cuenta que las cantidades del minuendo deben ser mayores que las correspondientes del sustraendo. Si en alguna columna esto no ocurriese, se restaría una unidad a la de las unidades superiores que, multiplicado por 60, se añadiría a la columna deficitaria:

División de un complejo por un número natural. Para dividir un complejo por un número natural, se dividen primero las unidades superiores del complejo por el número, el resto se transforma en unidades inmediatamente inferiores y se suma a los existentes. Esta suma se divide por el número y se repite el proceso anterior: 63º 13 3 · 60

12' 180 192' 42 2 · 60

33" 5 120 12º 38' 30" 153 03

_ Preguntas de repaso 1. Comprobar si los siguientes números son divisibles por 2, 3, 5 y 7: 13.528, 34.353, 625.

96º 18’ 43’’ – 45º 53’ 40’’

2. Descomponer en producto de factores los siguientes números: 75, 256, 90, 936.

La cantidad de los minutos es inferior en el minuendo; entonces se quita una unidad de la columna de los grados, que quedaría en 95º. Esta unidad son 60’, que sumados a los 18’ que había dan 78’ y así se puede efectuar la resta:

3. Hallar el m. c. d. y el m. c. m. de los siguientes grupos de números: a) 100 y 90; b) 200, 160 y 130.

96º 78’ 43’’ – 45º 53’ 40’’ 51º 25’ 3’’

4. Pasar de forma compleja a incompleja y viceversa: a) 25D 8h 30’ 46’’; b) 18.369’’. 5. Realizar las siguientes operaciones: a) restar 180º – 85º 43’ 18’’; b) multiplicar 12º 58’ 49’’ · 9.


f a e

c A

b B

PROPORCIONES Y PORCENTAJES

f (x)

O

d

Proporciones Dados dos números cualesquiera a y c, se llama razón de dichos números a su cociente, indicado como a/c. Los términos de este cociente reciben nombres especiales: a se denomina antecedente, y c, consecuente. La expresión se leerá: “a es a c”, es decir, antecedente es a consecuente. Una razón es una fracción, por lo que las propiedades de las fracciones son aplicables a las razones. La igualdad entre dos razones se denomina proporción. Sus términos se designan como cuartos proporcionales: m/n = p/q → proporción La proporción se lee: “m es a n como p es a q”. Los términos m y q se denominan extremos, y los términos n y p, medios. Ejemplo: 4/5 = 8/10. “Cuatro es a cinco como ocho es a diez”. Los medios son 5 y 8, y los extremos, 4 y 10. Los antecedentes, 4 y 8, y los consecuentes, 5 y 10. Por la propiedad uniforme de la multiplicación se obtiene la propiedad fundamental de las proporciones: en toda proporción, el producto de los medios es igual al de los extremos: m/n = p/q;

mq = np

q = np/m;

n = mq/p;

h a

x c x+ h

X

Se llama medio proporcional al que se repite en una proporción continua. Dados dos números, se puede encontrar otro que sea su medio proporcional: m/p = p/q;

p2 = m · q;

p = m · q

Ejemplo: 5/x = x/45; x2 = 5 · 45; x2 = 225; x = 2 2 5 = 15; luego 5/15 = 15/45 Si se dividen los dos términos de una fracción por su máximo común divisor, se obtiene la razón de proporcionalidad. Si se tiene la fracción 15/45, el m. c. d. (15, 45) = 15, luego 15/45 = 15 : 15 / 45 : 15 = 1/5. La razón de proporcionalidad es de uno a cinco. En una proporción, la suma o resta de antecedentes dividida por la suma o resta de consecuentes es igual a una cualquiera de las razones. De este modo, dada la proporción 2/3 = 4/6, se verifica que 2 + 4 / 3 + 6 = 2/3. En efecto, 6/9 = 2/3, ya que 18 = 18. Para la resta se sigue un procedimiento análogo: 4 – 2 / 6 – 3 = 4/6 ; 2/6 = 2/6, 12 = 12.

Magnitudes proporcionales

Siempre se puede despejar uno de los términos en función de los otros tres: m = np/q;

Y

p= mq/n

Así, conocidos tres términos de una proporción, se puede conocer el cuarto. A éste se le llama cuarto proporcional. Con tres números es posible encontrar un cuarto, de forma que los cuatro constituyan una proporción. Una proporción en la que los medios son iguales se llama proporción continua: m/p = p/q. Ejemplo: 2/6 = 6/18 → proporción continua.

Magnitud es todo aquello que admite medida. El tiempo, la velocidad, la longitud, etc., son magnitudes. Si se tienen dos magnitudes tales que al variar una de ellas la otra se modifica en la misma proporción, se dice que son dependientes. Esta dependencia puede ser de dos formas: de proporcionalidad directa o de proporcionalidad inversa. Magnitudes directamente proporcionales. Se considera que dos magnitudes son directamente proporcionales cuando al aumentar una de ellas en una cantidad, la otra lo hace en la misma proporción, y cuando disminuye una en una cantidad, la otra también disminuye proporcionalmente.

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


216

MATEMÁTICAS

______________________________________________________________________________________________

En las magnitudes que son directamente proporcionales, la razón de dos cantidades de una de ellas forma proporción con la razón de las cantidades correspondientes de la otra. La regla de tres simple directa es una aplicación de las magnitudes directamente proporcionales. Con ella se resuelven problemas en los que se conocen tres cantidades de dos magnitudes directamente proporcionales y se trata de conocer la cuarta. Ejemplo:

– Conocida la cantidad y el tanto por ciento que se presenta hallar el total. El 25% de un número es 800, ¿de qué número se trata?: 25 —————— 100 800 —————— x x = 800 · 100/25 = 3.200 – Si a un número dado se le suma un tanto por ciento, se puede saber en que número se convierte. El número 800 se aumenta en un 35%, ¿en qué número se convierte?:

Si 5 kg de manzanas cuestan 250 pesos, 8 kg de manzanas costarán x

El 100 se transformará en el 135 El 800 ———— x x = 800 · 135/100 = 1.080

Se establece la proporción 5/8 = 250/x, y se calcula x despejando: 5x = 250 · 8; x = 250 · 8/5 = 2.000/5; x = 400 pesos Magnitudes inversamente proporcionales. Dos magnitudes son inversamente proporcionales cuando al aumentar o disminuir una de ellas en una cantidad, la otra disminuye o aumenta en una cantidad proporcional. En las magnitudes inversamente proporcionales, la razón de dos cantidades forma proporción con la razón inversa de las otras. La velocidad y el tiempo, el número de obreros y el tiempo que se tarda en hacer una obra, etc., son ejemplos de magnitudes inversamente proporcionales. La regla de tres inversa es una aplicación de magnitud inversamente proporcional. Resuelve problemas en los que se conocen tres cantidades de dos magnitudes inversamente proporcionales y se trata de calcular la cuarta. Ejemplo: Si 2 grifos llenan un estanque en 6 horas, 4 grifos lo llenarán en x horas Se forma la proporción invirtiendo la razón:

Interés simple El banco paga por el dinero que se deposita en una libreta o cuenta de ahorros una cantidad, que se expresa en % y se denota por R. Esta cantidad se llama rédito y depende del tiempo que ha estado depositado el dinero, bien sea en años, en meses o en días. Interés simple es la cantidad que produce un capital, C, colocado en un banco a determinado rédito, R, durante cierto tiempo, t. Si el tiempo es en años, la fórmula para calcular el interés, I, es: I = CRt/100 Despejando, se pueden calcular las otras cantidades: C = 100 · I/Rt R = 100 · I/Ct t = 100 · I/CR Si el tiempo se expresa en meses: I = CRt/1.200; si es en días: I = CRt/36.000. El capital final será el que se tenía, llamado capital inicial, más los intereses: Cf = Ci + I

2/4 = x/6; x = 12/4 = 3 horas.

Porcentaje Cuando en una reunión se dice que el 20% de las personas asistentes son niños, se quiere decir que si el número de asistentes hubiera sido 100, 20 de ellos habrían sido niños. El tanto por ciento se expresa con el signo %. Son proporciones referidas a 100, es decir, el consecuente de la razón es 100. Algunos ejemplos de problemas que se pueden presentar son:

Ejemplo: Se colocan 200.000 pesos durante 20 meses en un banco al 6%. Calcular el capital final. Como el tiempo se expresa en meses, la fórmula para hallar el interés simple es: I = CRt/1.200 luego: Cf = Ci + I = Ci + CRt/1.200 = 200.000 + 20.000 · 6 · 20/1.200 = = 200.000 + 20.000 = 220.000 pesos


______________________________________________________________________________________

Descuento

217

produce una unidad monetaria en un año. El tanto por uno se obtiene dividiendo el tanto por ciento entre cien:

Si al comprar una mercancía se adelanta el tiempo de pago acordado, el vendedor, por el hecho de recibir el dinero antes de la fecha prevista, debe desquitar una cantidad igual al interés que produce el capital durante la diferencia de tiempo. A esta rebaja que se hace sobre el valor total de la deuda se le llama descuento. En el caso de deudas, el valor total de la deuda, que es el capital prestado, se llama valor nominal. Este valor nominal menos el descuento es la cantidad que se paga en realidad. A esta cantidad se le llama efectivo. El descuento, d, se calcula con las mismas fórmulas que para el interés simple, teniendo en cuenta que C se sustituye por el valor nominal, N: d = NRt/100 Tiempo en años

Proporciones y porcentajes

d = NRt/1.200 Tiempo en meses

d = NRt/36.000 Tiempo en días

Valor efectivo = Valor nominal – descuento (VE = N – d)

r = %/100 Si C es el capital, r el tanto por uno y t el tiempo en años, la fórmula para hallar el capital final del interés compuesto es: Cf = C (1 + r)t Ejemplo: ¿En cuánto se convertirán 250.000 pesos colocados en un banco durante seis años al 7% de interés compuesto?: r = 7/100 = 0,07 Cf = C (1 + r)t = 250.000 · (1 + 0,07)6 = 250.000 · 1,076 = = 250.000 · 1,50 = 375.000 pesos

Ejemplo: Calcular la cantidad que hay que pagar para cancelar una deuda de 300.000 pesos al 8% en cien días antes de lo previsto: VE = N – d como el tiempo es en días, la fórmula para el descuento será: d = NRt/36.000 luego: VE = 300.000 – (300.000 · 6 · 100)/36.000 = = 300.000 – 5.000 = 295.000 pesos

Interés compuesto Se llama interés compuesto a un tipo particular de interés en el que los intereses producidos al cabo de un año se suman al capital. Esta nueva cantidad produce interés durante el segundo año, y así en años posteriores. Para el cálculo del interés compuesto, se utiliza en lugar del tanto por ciento el tanto por uno, r, que es la cantidad que

_ Preguntas de repaso 1. Se pone un capital a un interés del 8% durante 12 años. Si al cabo de ese tiempo el capital es de 1.260.000 pesos, ¿cuál fue el capital inicial? 2. ¿Durante cuánto tiempo hay que colocar un capital de 150.000 pesos en el banco a un interés simple del 4% para llegar a obtener unos intereses de 90.000 pesos? 3. ¿Qué cantidad se recibirá al cabo de un año por un capital de 350.000 pesos colocado al 6%, si en concepto de impuestos se retiene el 25% de los intereses? 4. Calcular: a) La media proporcional a 5 y 45. b) La cuarta proporcional a 13,39 y 65. 5. Calcular: a) ¿Cuántos kilogramos de tomates se podrían comprar con 12.000 pesos, si 5 kg valen 100 pesos? b) ¿Cuál es el número de horas que tardan 6 obreros en descargar un camión, si 4 obreros emplean 18 horas?


Y f a e

c A

b B

f (x)

POLINOMIOS O

d

Introducción Dado el conjunto de los números reales R y un elemento indeterminado x R , se llama polinomio de grado n, con n N, y coeficientes reales, con una indeterminada, a toda expresión de la forma : a 0 + a1 x1 + a2 x 2 + … + an x n con an ≠ 0, siendo a 0 , a1 , an , los coeficientes. Ejemplo: P (x) = 3 + 2x – 3x2 + 7x3 + 8x4 Se denomina grado de un polinomio al mayor exponente (n ) al que aparece elevada la indeterminada x . Este concepto se representa por grad. En el ejemplo, el grado es 4. Se denomina monomio a un polinomio en el que los coeficientes son todos cero menos uno, por ejemplo, 6x2 ; si los coeficientes son todos nulos menos dos, el polinomio se llama binomio; si posee tres términos es un trinomio, etc. El grado de un monomio es el exponente de su indeterminada. En 2x2 , el grado es 2. Un polinomio también se puede definir como la suma algebraica de monomios. El monomio que no tiene indeterminada, a 0 , se denomina término independiente, considerándose que la indeterminada está elevada a cero, a 0 x 0 , y es, por tanto, el término de grado cero. Un polinomio se llama mónico cuando el coeficiente del término de mayor grado a n es 1. Se denomina nulo cuando todos sus coeficientes son cero, es decir, ai = 0 ∀ i = 1, 2 … n . Al conjunto de todos los polinomios con una indeterminada x y coeficientes reales, se le representa por R (x). Dos polinomios son iguales si son del mismo grado y, además, los coeficientes de los términos del mismo grado son también iguales. Si se representan por P(x) y Q(x) dos polinomios: P(x) = a0 + a1 x 1 + a2 x 2 + … + anxn Q(x) = b0 + b1 x 1 + b2 x 2 + … + bmxm

h a

x c x+ h

X

La relación de igualdad de polinomios es una igualdad de equivalencia, donde el representante de las clases de equivalencia es el polinomio que tiene sus términos ordenados según potencias crecientes de x.

Operaciones con polinomios Suma de polinomios Dados dos polinomios P(x) y Q(x), se llama suma de estos polinomios a otro polinomio, S(x), en el que los coeficientes son la suma algebraica de los coeficientes de los términos de P(x) y Q(x) de igual grado. El grado del polinomio suma es menor o igual que el grado mayor de los grados de P(x) y Q(x): P(x) = a0 + a1 x 1 + a2 x 2 + a3 x3 + ... grad P(x) = n Q(x) = b0 + b1 x 1 + b2 x 2 + b3 x3 + ... grad Q(x) = m S(x) = P(x) + Q(x) = (a0 + b0 ) + (a1 + b1 )x + (a2 + b2 )x2 + + ... grad [S(x)] supremo {m, n} El grado del polinomio suma es menor cuando m = n y a n = – bn , es decir, si tienen el mismo grado y los coeficientes de los términos de mayor grado son opuestos. Ejemplo: P(X) = 3 – x + 2x2 – 4x4 – 6x5 Q(x) = 1 + 2x + 3x2 + 4x4 + 3x5 + 8x6 S(x) = P(x) + Q(x) = (3 + 1) + (– 1 + 2)x + (2 + 3 ) x2 + + (0 + 0)x3 + (– 4 + 4)x4 + (– 6 + 3 )x5 + 8x6 = = 4 + x + 5x2 – 3x5 + 8x6 El conjunto de los polinomios, con la operación suma de polinomios, [R(x), +], tiene estructura de grupo abeliano donde el polinomio nulo es el elemento neutro; el polinomio simétrico de otro es el que resulta de cambiar de signo todos sus términos.

Entonces P(x) = Q(x) si:

Multiplicación de polinomios

a) grad [P(x)] = grad [Q(x)], es decir, m = n. b) a i = bi ∀ i.

Producto de monomios. El producto de dos monomios es otro monomio cuyo coeficiente es el producto de los coe-

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________________________

ficientes, y cuya indeterminada está elevada a la suma de los exponentes de cada uno de los monomios: a n x n · bm x m = (an · bm )xn + m

Polinomios

219

anillo conmutativo y unitario. Además, es anillo de integridad, ya que si P(x) · Q(x) = 0, tiene que ser P(x) = 0 o Q(x) = 0.

División de polinomios Ejemplo: 3x5 · 6x4 = (3 · 6)x5 +4 = 18x9 Producto de un monomio por un polinomio. El producto de un monomio por un polinomio es el polinomio resultante de multiplicar el monomio por cada uno de los términos del polinomio: a 0 x n (b0 + b1x 1 + b2 x2 + … + bm xm) = = a0 · b 0xn + a0 · b 1 x n+1 + a0 · b 2 x n+2 + … + a0 · bn xn+m Ejemplo: 6x3 · (3 + 7x – 8x2 – 4x3 ) = 18x3 + 42x4 – 48x5 – 24x6 Producto de polinomios. El producto de dos polinomios es el polinomio resultante de multiplicar cada uno de los términos de uno de los polinomios por todos los del otro, agrupando después los términos semejantes: P(x) = a0 + a1 x 1 + a2 x 2 + ... + an xn Q(x) = b0 + b1 x 1 + b2 x 2 + ... + bm xm P(x) · Q(x) = a0 · Q(x) + a1 x 1 · Q(x) + a2 x 2 · Q(x) + + an xn · Q(x) Se reduce así la multiplicación de polinomios a la multiplicación de monomios por polinomios. Para efectuar la multiplicación de dos polinomios se aplica la siguiente regla: se sitúan uno debajo del otro ordenados y se van multiplicando los monomios del multiplicador por los del multiplicando, y se colocan los monomios del mismo grado en columna para después efectuar la suma. Ejemplo: P(x) = 6x3 – 5x2 + 3x – 2; Q(x) = 2x2 + 5x – 7 Entonces para obtener P(x) · Q(x): 6x3 – 5x2 + 3x – 2 2x2 + 5x – 7 – 42x3 + 35x2 – 21x + 14 30x4 – 25x3 + 15x2 – 10x 5 12x – 10x4 + 6x3 – 04x2 12x5 + 20x4 – 61x3 + 46x2 – 31x + 14 P(x) · Q(x) = 12x5 + 20x4 – 61x3 + 46x2 – 31x + 14 El conjunto [R(x), ·] es un semigrupo abeliano, cuya unidad es el polinomio P(x) = 1. Además, la multiplicación de polinomios es distributiva respecto de la suma: Si P(x), Q(x), T(x) R(x), entonces P(x) · [Q(x) + T (x)] = P(x) · Q(x) + P(x) · T(x); luego [R(x), +, ·] tiene estructura de

Se llama división de polinomios a la operación por la cual, dados dos polinomios D(x) y d(x), con grad [D(x)] grad [d(x)], se obtienen otros dos polinomios C(x) y R(x), con grad [R(x)] < grad [d(x)], de tal forma que se verifica: D(x) = d(x) · C(x) + R(x) Si R(x) es el polinomio nulo, entonces se dice que la división es exacta y D(x) = d(x) · C(x). División de dos monomios. Al dividir dos monomios, se obtiene otro monomio cuyo coeficiente es el cociente de los coeficientes y la indeterminada está elevada a la diferencia entre los grados de los monomios: Si bm ≠ 0 anxn/bmxm = (an/bm)xn-m Ejemplo: 6x4 : 3x3 = (6/3) · x4-3 = 2x División de un polinomio por un monomio. Para dividir un polinomio, se divide cada uno de los términos del polinomio por el monomio. Para realizar la división de dos polinomios, se efectúan los siguientes pasos: a) Se ordenan los polinomios según potencial decreciente de la indeterminada, colocándose como en cualquier división de números. b) Se divide el primer término del dividendo entre el primer término del divisor (división de monomios). El resultado será el primer término del cociente. c) Se multiplica este cociente (monomio) por el divisor y el producto obtenido se resta del dividendo. d) Con la resta, anteriormente indicada, se repite el proceso desde el paso 2, hasta llegar a un resto nulo o un resto de menor grado que el divisor. Ejemplo: P(x) = 12x5 + 20x4 – 61x3 + 46x2 – 31x + 14 Q(x) = 6x3 + 5x2 + 3x – 2 12x5 + 20x4 – 61x3 + 46x2 – 31x + 14 |6x3 – 5x2 + 3x – 2 12x5 + 10x4 + 6x3 – 4x2 2x2 + 5x – 7 30x4 – 67x3 + 50x2 – 31x + 14 30x4 – 25x3 + 15x2 – 10x – 42x3 + 35x2 – 21x + 14 – 42x3 + 35x2 – 21x + 14 0 Un polinomio es divisible por otro cuando al efectuar la división el resto es cero. Las propiedades de la divisibilidad de polinomios son las mismas que para la divisibilidad de números enteros.


220

MATEMÁTICAS

______________________________________________________________________________________________

División por Ruffini. Un caso particular de división se refiere a cuando el divisor es el binomio x + a. En lugar de realizar esta división normalmente, se puede efectuar de forma más sencilla y rápida por el método de Ruffini. Esta forma de dividir consiste en situar los coeficientes del polinomio ordenados según potencias decrecientes, y colocando un cero cuando algún término falte. A la izquierda, y con el signo cambiado, se pone el término independiente del binomio x + a, es decir, + a. El primer coeficiente es igual al primer coeficiente del dividendo y se sitúa debajo. El segundo coeficiente del cociente se obtiene multiplicando el primer coeficiente por ± a, y sumando este producto al siguiente coeficiente del dividendo. Así sucesivamente, se obtienen los restantes coeficientes. El último resultado corresponde al resto de la división. El grado del cociente es una unidad menor que el del dividendo. Ejemplo: Dividir x4 – 7x3 + 8x entre x – 2:

|

1

2

–7 2 –5

1

0 – 10 – 10

8 – 20 – 12

–3 – 24 – 27 → resto

Cociente = 1x3 – 5x2 – 10x – 12

Valores numéricos de un polinomio Dado un polinomio P(x), se llama valor numérico del polinomio para x = a, y se representa por P(a), al resultado que se obtiene al sustituir la x por a y efectuar las operaciones:

valor numérico del polinomio es cero, es decir, r es raíz del polinomio P(x) si P(r) = 0. Por ejemplo: 2 es una raíz del polinomio P(x) = x2 – 5x + 6, pues P(2) = 22 – 5 · 2 + 6 = 4 – 10 + 6 = 0. Las raíces de polinomios de primer y segundo grado son fáciles de calcular, cuando existen, sin más que resolver la ecuación que resulta de igualar el polinomio a cero. En los restantes casos, lo que se hace es probar con aquellos valores que sean divisores del término independiente. En el ejemplo anterior, el 2, que es raíz, es un divisor del término independiente. Un polinomio de grado n se anula, como máximo, para n raíces.

Factorización de polinomios Si a 1, a2 , a3 , ..., an , son raíces de un polinomio P(x) de grado n , entonces P(x) puede descomponerse en producto de factores de la forma: P(x) = a (x – a1 ) (x – a2 ) ... (x – an ) , siendo a el coeficiente del término de mayor grado. Al dividir P(x) por (x – a), como a es raíz, se obtiene un cociente C 1 ( x) de grado una unidad menos que P(x), luego P(x) = (x – a1 ) · C1 ( x). Como a 2 ≠ a1 , y a 2 es raíz de P(x), resultará que P(a2 ) = (a2 – a1 ) · C1 ( a2 ) = 0, luego a 2 es una raíz de C 1 ( x); por tanto, al dividir C 1 ( x) entre x – a2 se tiene C 1 (x) = (x – a2 ) · C2 (x), siendo C 2 ( x) el cociente de la división y P(x) quedará sustituyendo C 1 ( x) de la siguiente forma: P(x) = (x – a1 ) (x – a2 ) · C2 ( x)

Si P(x) = a0 + a1x 1 + a2 x 2 + … + an xn P(a) = a0 + a1 a 1 + a2 a 2 + … + an an R

Repitiendo este proceso para cada una de las raíces se tiene:

Teorema del resto o de Ruffini. El resto de la división de un polinomio por x – a es igual al valor numérico del polinomio para x = a. Demostración: Si C(x) y R(x) son el cociente y el resto de la división del polinomio P(x) por el binomio x – a, se tiene:

P(x) = (x – a1 ) (x – a2 ) ... (x – an ) · Cn ( x)

P(x) = (x – a) C(x) + R(x) Si se calcula el valor numérico del polinomio para x = a, se tiene P(a) = (a – a) C(a) + R(a), y como a – a = 0, resulta P(a) = R(a). Ejemplo: Hallar el resto de dividir el polinomio P(x) = 3x3 – 6x2 + 8x – 2 entre x – 3. Se efectúa la división por Ruffini: 3

|

3

3

–6 9 3

8 9 17

–2 51 49

Resto = 49

Se calcula el valor numérico del polinomio para x = 3: P(3) = 3 · 33 – 6 · 32 + 8 · 3 – 2 = 81 – 54 + 24 – 2 = 49 Resto = 49 Raíz de un polinomio. Las raíces de un polinomio son aquellos valores de la indeterminada para los cuales el

siendo grad [Cn ( x)] = 0, pues para cada raíz el grado ha disminuido en una unidad, y C n ( x) = an. El polinomio no podría anularse para ningún valor más, distinto de las n raíces. Como los restos serían todos distintos de cero, tendría que ser cero el valor a n , pero éste es el coeficiente del término de mayor grado, a n ≠ 0. Polinomio irreducible. Un polinomio P(x) = a0 + a1 x 1 + a2 x 2 + … + an xn con n > 1, es decir, grad [P(x)] > 1 es irreducible cuando no puede descomponerse en producto de dos factores de grado mayor o igual que uno. El polinomio P(x) = x2 + 1 es irreducible.

Representación gráfica de polinomios Dado un polinomio P(x) R(x), se llama función polinómica a aquella aplicación P : R → R que, a cualquier valor a R, la hace corresponder el valor numérico del polinomio para dicho valor, a → P(A). Las funciones polinómicas se representan en unos ejes cartesianos. Las raíces del polinomio son los puntos en que la gráfica corta al eje de las abscisas. Si bien los polinomios de grado par pueden no tener ninguna raíz, los de grado impar tienen que poseer al


__________________________________________________________________________________________________

menos una, ya que si el recorrido son todos los números reales R , tendrá que cortar en algún punto al eje x . Para los de grado par, el recorrido puede no ser todo R . Por ejemplo, para la función P(x) = x2 , el recorrido es R +, y para P’ (x) = – x2 , el recorrido es R – {0}. Sin embargo, el dominio de definición de las funciones polinómicas es todo R. Lo que caracteriza fundamentalmente a las funciones polinómicas de grado mayor que uno es el número de concavidades que presentan, siempre una unidad menos que el grado del polinomio. Gráfica de la función polinómica de grado cero. Si P(x) = a0 , la gráfica de esta función es una recta paralela al eje de abscisas, en la que todos los puntos tienen por ordenada a 0 . Se llama también función constante: y

|

a0

x

Si a 0 es positivo, la gráfica está en la parte positiva del eje y; si a 0 es negativo, la gráfica está en la parte negativa de dicho eje. Gráfica de la función afín. Si el polinomio P(x) es de grado uno, P(x) = a1 x + a0 , la función se llama afín. Su gráfica es una recta con inclinación menor de 90º si a es positivo y mayor de 90º si a es negativo. El término independiente es la ordenada en el origen, es decir, el punto (0, a 0 ) es el lugar por donde cortará al eje de ordenadas; si a 0 > 0, lo cortará en su parte positiva; si a 0 < 0, lo hará en su parte negativa. Para representar la gráfica, se compone una tabla de valores [x, P(x)]. Ejemplo:

Polinomios

221

y

x

Gráfica de la función polinómica de grado dos. La función polinómica de grado 2 es de la forma: P(x) = ax2 + bx + c. La gráfica de esta función es una parábola cuyas ramas se dirigen hacia arriba si a > 0, y hacia abajo si a < 0. Su vértice está situado en el punto [(– b/2a, P(– b/2a)]. Es simétrica respecto al eje dado por la recta x = – b/2a y corta al eje de abscisas en los puntos solución de la ecuación ax2 + bx + c = 0. Al ser una función polinómica de grado dos, presenta sólo una concavidad. La más sencilla es la función P(x) = x2. Su gráfica es una parábola con las ramas hacia arriba, el vértice en el origen de coordenadas y simetría respecto al eje y: eje y

x P(x) = x2

La función P(x) = – x2 es simétrica respecto al eje de abscisas de la anterior:

P(x) = 2x – 3 x P(x)

|

0 –3

|

1 –1

| | 2 1

y

–1 –7

y x

x

Un caso particular de la función afín se obtiene cuando a 0 = 0, P(x) = a1 x . Ésta es la llamada función lineal o función de proporcionalidad. Su gráfica es una recta que pasa por el origen de coordenadas (0, 0), y es simétrica respecto del origen. Ejemplo: y = 2x x y

| | 0 0

1 2

| | 2 4

–1 –2

P(x) = – x2

Si P(x) = x2 + c con c > 0, la función aparece desplazada c unidades hacia la parte positiva del eje y, y si c < 0, hacia la parte negativa, es decir, el vértice está en el punto (0, c): y

P(x) = – x2 + c

(si c > 0)

c x

(si c < 0)

Si P(x) = ax2 , el valor de a da a la gráfica mayor o menor apertura:


222

MATEMÁTICAS

a'

______________________________________________________________________________________________

y

y

a

–1

x

1

x

P(x) = ax2, siendo a' < a

Si P(x) = a (x – m)2 , la parábola está desplazada horizontalmente; si m > 0, hacia la derecha, y si m< 0, hacia la izquierda:

En general, un polinomio de grado n es más fácil de representar en su descomposición factorial, pues se elimina el problema del cálculo de las raíces:

y

P(x) = 3x (x – 2) (x + 2) y x

(0, m)

2

–2

2 x

Si P(x) = a (x – m) + c, la parábola está desplazada en sentido vertical y horizontalmente siendo el vértice el punto (m, c): y

c

(m, c) m

x

Gráfica de la función polinómica de grado 3. La función polinómica de grado 3 presenta dos concavidades y, a lo sumo, tendrá tres raíces. La más sencilla es la función P(x) = x3 , cuya gráfica es: y

Otra forma de determinar las raíces, de una forma aproximada, sería observar los cambios de signo de los valores de P(x), pues al ser continua la función, cuando cambia de signo existe un punto en el que vale cero. Gráfica de la función polinómica P(x) = x (x + 2) (x – 2) (x + 7):

_ Preguntas de repaso 1. Dados los polinomios A = x4 – 8x3 + 7; B = 2x4 – 8x3 + 7x – 9. Calcular: a) A · B; b) B – 2A.

x

P(x) = x3

Si P(x) = x3 – x2, las raíces son: x 3 – x2 = 0; x (x2 – 1) = 0; x = 0; x2 – 1 = 0; x = 1; x1 = + 1; x2 = – 1:

2. Calcular el cociente y el resto de la siguiente división de polinomios: (2x8 – 8x7 + x5 + 26x4 – 8x3 – 21x2 + 20x – 9) : (x4 – 3x + 1). 3. Comprobar por Ruffini que las raíces del polinomio: x 4 – 14x3 + 71x2 – 154x + 120, son 2, 3, 4 y 5, y descomponerlo en factores. 4. Calcular m, n y p en la siguiente igualdad: 5x2 – 20x + 23 = m (x – n)2 + p


f a e

c A

b B

Y

ECUACIONES DE PRIMER GRADO O

d

Introducción Se llama igualdad a la expresión formada por dos miembros matemáticos situados a ambos lados del signo igual. La parte que está a la izquierda se llama primer miembro; situada a la derecha es el segundo miembro. Identidad es una igualdad que se cumple siempre. Por ejemplo, 3 + 4 = 5 + 2; (x + y)2 = x2 + 2xy + y2, son identidades. Esta última se cumple para cualquier valor que se atribuya a x e y. Ecuación es una igualdad que se cumple únicamente para determinados valores de las incógnitas o letras que forman parte de la igualdad. Resolver una ecuación es encontrar sus soluciones, es decir, aquellos valores que hacen que se verifique la igualdad. Se llaman ecuaciones equivalentes las que tienen las mismas soluciones. Para resolver una ecuación, se cambian las ecuaciones por otras equivalentes hasta despejar la incógnita. Una ecuación de primer grado con una incógnita es un polinomio de grado 1 igualado a 0: ax + b = 0, con a ≠ 0.

f (x)

h a

x c x+ h

X

o dividiendo. El que está multiplicando pasa dividiendo, y el que está dividiendo pasa multiplicando.

Resolución de ecuaciones de primer grado La secuencia que ha de seguirse para resolver una ecuación es la siguiente: a) Se quitan denominadores, si los hubiera, multiplicando toda la ecuación por el mínimo común múltiplo de los mismos. b) Se quitan paréntesis, si los hubiese, efectuando las operaciones que correspondan. c) Se pasan al primer miembro los términos que tengan la incógnita x, y al segundo, los que no la tengan. d) Se reducen términos semejantes. e) Se despeja la incógnita. Ejemplo:

Propiedades de las ecuaciones a) Si a los dos miembros de una ecuación se les suma o resta un mismo número, se obtiene otra ecuación equivalente. Si a los dos miembros de la ecuación 3x + 8 = 9 se les resta 8, se tendría 3x + 8 – 8 = 9 – 8 o, lo que es lo mismo, 3x = 9 – 8. En la práctica, esto se conoce como pasar un término de un miembro a otro o transponer términos, de tal forma que el que está sumando pasa restando, y el que está restando pasa sumando. b) Si los dos miembros de una ecuación se multiplican o dividen por un mismo número distinto de 0, se obtiene otra ecuación equivalente. Si en lugar de un número se tratara de una expresión algebraica, se podrían añadir soluciones. Sea la ecuación 3x = 1, si los dos miembros se dividen por 3, queda 3x/3 = 1/3, de donde x = 1/3. Esta propiedad permite en la práctica quitar denominadores y transponer términos que están multiplicando

3 (x – 1) + (x + 1)/2 = (2x + 1)/3 1.º Se quitan denominadores; m. c. m. (2, 3) = 6: 6 · 3 (x – 1) + 6 (x + 1)/2 = 6 (2x + 1)/3 18 (x – 1) + 3 (x +1)= 2 (2x + 1) 2.º Se quitan paréntesis: 18x – 18 + 3x + 3 = 4x + 2. 3.º Se pasan al primer miembro los términos que tengan x y al otro los demás: 18x + 3x – 4x = 2 – 3 + 18. 4.º Se reducen términos semejantes: 17x = 17. 5.º Se despeja la incógnita: x = 17/17 = 1. Si al resolver una ecuación de primer grado se llega a una identidad numérica, la ecuación tiene infinitas soluciones, pues para cualquier valor que se dé a x, se verifica la ecuación. Se dice en tal caso que una ecuación es compatible, ya que tiene soluciones infinitas o indeterminadas. Si se llegase a una expresión del tipo 0x = b o 0 = b, la ecuación no tiene solución y se dice que es incompatible.

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


224

MATEMÁTICAS

______________________________________________________________________________________________

Si sólo existe una única solución, se dice que es compatible y determinada.

ax + by = c a’x + b’y = c’

Ecuaciones de primer grado con dos incógnitas

Soluciones del sistema son aquellos pares ordenados (x, y) que verifican ambas ecuaciones a la vez. Resolver un sistema es encontrar sus soluciones. Si los sistemas no tienen solución, se llaman incompatibles; si tienen soluciones, son compatibles. Cuando la solución es única, se dicen determinados, y si tienen infinitas soluciones, indeterminados.

Se llama ecuación de primer grado con dos incógnitas a toda aplicación f : R → R, tal que ∀ x R; se hace corresponder f(x) = ax + b, con a ≠ 0. Generalmente f(x) se representa por y. La aplicación queda así: y = ax + b; x se conoce con el nombre de variable independiente, siendo la variable dependiente, ya que depende de los valores dados a x. Para cada valor de x se obtiene el correspondiente valor de y. Si: y1 = ax1 + b y2 = ax2 + b

x = x1 x = x2

Estos valores, en forma de pares ordenados (x1 , y1 ), (x2 , y2 ), se representan en un sistema de ejes cartesianos que consta de dos rectas perpendiculares: una horizontal, en la que se representan los valores de x (eje de abscisas), y otra vertical, donde se representan los valores de y (eje de ordenadas). El punto (0, 0) se denomina origen de coordenadas: y y1

Estas ecuaciones se dicen de primer grado porque tanto x como y están elevadas a uno. Poseen infinitas soluciones, ya que para cada valor de x se obtienen otro de y, donde ambos verifican la ecuación cuya gráfica es una recta. Ejemplo: y = 2x – 1. Se forma una tabla de valores, se representan los pares y se unen los puntos obtenidos:

| | | | 1 1

0 –1

Existen diversos métodos para resolver un sistema de ecuaciones de primer grado: reducción, sustitución, igualación y resolución gráfica del sistema.

Método de reducción Consiste en transformar cada una de las ecuaciones mediante ecuaciones equivalentes hasta conseguir que una de las incógnitas tenga coeficientes opuestos en ambas ecuaciones. Este sistema será más o menos complicado dependiendo de los coeficientes. Ejemplo; en el sistema: 4x + 5y = 23 7x – 3y = 5

x

x1

x y

Resolución de sistemas de primer grado

–1 –3

2 3

(2, 3) x

(0, –1) (–1, –3)

7 (4x + 5y) = 7 · 23 28x + 35y = 161 28x + 35y = 161 → → 4 (7x – 3y) = 4 · 5 28x – 12y = 20 –28x + 12y = –20 El siguiente paso es sumar miembro a miembro ambas ecuaciones: 28x + 35y = 161 –28x + 12y = –20 0 + 45y = 141

y

(1, 1)

para conseguir que x tenga los coeficientes opuestos en cada una de las ecuaciones basta multiplicar cada una de ellas por el coeficiente de la otra, multiplicando posteriormente por –1 (cambio de signo) una de las dos ecuaciones:

y = 141/47 = 3

Una vez conocida una de las incógnitas, se sustituye su valor en una de las dos ecuaciones, y se despeja: 4x + 5 · 3 = 23; 4x + 15 = 23; 4x = 23 – 15; 4x = 8; x = 8/4 = 2 Por tanto, es un sistema compatible y determinado, y su solución es el par (x, y) = (2, 3).

Sistemas de ecuaciones de primer grado Un sistema de ecuaciones de primer grado, es un conjunto de dos ecuaciones de primer grado con dos incógnitas:

Método de sustitución El método de sustitución consiste en despejar una cualquiera de las incógnitas en una de las ecuaciones y susti-


____________________________________________________________________________________

las rectas que representa a cada una de las ecuaciones será la solución del sistema. Para representar cada ecuación, se despeja y, y se halla una tabla de valores. En el ejemplo anterior: Primera ecuación: 4x + 5y = 23; 5y = 23 – 4x y = (23 – 4x)/5

se despeja una incógnita en una de las ecuaciones, por ejemplo, y, en la ecuación 4x + 5y = 23: 5y = 23 – 4x;

y = (23 – 4x)/5

Este resultado se sustituye en la otra ecuación:

x y

| | | 2 3

Sustituyendo este valor en la ecuación de sustitución, se obtiene y : y = [23 – (4 · 2)]/5 = (23 – 8)/5 = 15/5 = 3 La solución es el par (x, y) = (2, 3), la misma que se obtuvo por el método de sustitución.

|

0 23/5

7x – 3y = 5; 3y = 7x – 5 y = (7x – 5)/3 x y

| | | 2 3

–1 –4

y

0 –5/3

3y =

35x – 3 (23 – 4x) = 25 35x – 69 + 12x = 25; 47x = 25 + 69; 47x = 94; x = 94/47 = 2

1 19/5

Segunda ecuación:

7x – 3 · [(23 – 4x)/5] = 5 Esta ecuación tiene sólo una incógnita y es más fácil de resolver:

–3 7

5

4x + 5y = 23 7x – 3y = 5

225

3 2 1

7x –

tuir en la otra ecuación la incógnita por la expresión algebraica obtenida. Por sustitución, el sistema del ejemplo anterior se resolvería así:

Ecuaciones de primer grado

← Solución del sistema x 4x – 1 2 3 4 3y = 23

Método de igualación Consiste en despejar la misma incógnita en ambas ecuaciones e igualar (de ahí el nombre) estos resultados. Para resolver el sistema del ejemplo anterior por este método, se despeja x en ambas ecuaciones: 4x + 5y = 23 → 4x = 23 – 5y → x = (23 – 5y)/4 7x – 3y = 5 → 7x = 5 + 3y → x = (5 + 3y)/7 Se igualan los resultados obteniendo la ecuación: (23 – 5y)/4 = (5 + 3y)/7, que tiene una sola incógnita. Se halla entonces el m. c. m. (4, 7) = 28, luego 7 (23 – 5y) = 4 (5 + 3y); eliminando paréntesis: 162 – 35y = 20 + 12y. Se continúa transponiendo términos: –35y – 12y = 20 – 161; –47 = –141; y = –141/–47 = 3. Esta solución se sustituye en cualquiera de las expresiones donde x está despejada: x = [23 – (5 · 3)]/4 = (23 – 15)/4 = 8/4 = 2 El sistema queda resuelto, obteniéndose el mismo resultado que mediante los sistemas anteriores.

Resolución gráfica del sistema Este método consiste en representar las dos ecuaciones en un mismo eje cartesiano. El punto de intersección de

Resolución de problemas mediante ecuaciones y sistemas Gran variedad de problemas se pueden resolver mediante el planteamiento de una ecuación o un sistema. La dificultad para el planteamiento se presenta al elegir las incógnitas y, posteriormente, en transcribir el lenguaje ordinario del enunciado al lenguaje matemático. Para resolver los problemas es necesario leer el enunciado con detenimiento hasta comprender su significado perfectamente. Los pasos que se han de seguir después son: a) Elegir bien las incógnitas. b) Plantear las ecuaciones con los condicionantes del enunciado. c) Resolver la ecuación o el sistema. d) Verificar si los resultados cumplen el enunciado. En los problemas de geometría suele ser fundamental realizar el dibujo. Ejemplo: En un corral hay un total de 46 cabezas entre gallinas y conejos. Si el número de patas es de 142, ¿cuantas gallinas y conejos hay?


226

MATEMÁTICAS

______________________________________________________________________________________________

El problema se puede resolver mediante una ecuación o un sistema. a) Mediante una ecuación: sea x el número de gallinas. Como en total son 46, el número de conejos será: 46 – x: Cabezas

Patas

Gallinas

x

2x

Conejos

46 – x

4 (46 – x)

46

142

Total

En la tabla se observa que el número de patas de gallina es igual al número de gallinas por dos. El número de patas de conejo es el número de conejos multiplicado por 4. Luego la ecuación es: 2x + 4 (46 – x) = 142

que se puede resolver por cualquier método. Por sustitución, se despeja x en la primera ecuación: x = 46 – y, sustituyendo en la otra ecuación: 2 (46 – y) + 4y = 142; 92 – 2y + 4y = 142; –2y + 4y = 142 – 92; 2y = 50; y = 50/2 = 25 y como: x = 46 – y; x = 46 – 25 = 21 que son los mismos resultados del apartado a).

_ Preguntas de repaso 1. Resolver las siguientes ecuaciones:

resolviendo: 2x + 184 – 4x = 142; –2x = 142 – 184; –2x = –42; x = –42/ –2 = 21 Luego hay 21 gallinas y 25 conejos (46 – 21 = 25). b) Mediante un sistema de ecuaciones. Las incógnitas son x = número de gallinas e y = número de conejos; total, 46. Planteándolo mediante una tabla: Cabezas

Patas

Gallinas

x

2x

Conejos

y

4y

Total

46

142

a) 3(x – 4) + 4 = 2x + 5 (2 – x) – 6. b) (6 – x)/2 x/2 = 2x – 3 (10 x)/2 – 9. 2. Resolver los siguientes sistemas de ecuaciones: a) Por reducción: 2x + y = 7 4x – 2y = 2 b) Por igualación: 3x + 5y = 8 7x – 2y = 5 c) Por sustitución: x – 3y = 7 2x + 9y = 29 3. La suma de dos números es 36 y su diferencia 18. Hallar los números. 4. Resolver gráficamente el sistema:

El sistema es:

x + y = 4600 2x + 4y = 142

4x + y = 16 4x – 3y = 0


f a e

c A

b B

Y

ECUACIONES DE SEGUNDO GRADO

f (x)

O

d

Resolución de ecuaciones de segundo grado

X

4a2 x 2 + 4abx + b2 = b2 – 4ac d) El primer miembro de la igualdad es equivalente a un binomio al cuadrado (2ax + b)2, luego: (2ax + b)2 = b2 – 4ac

2

a) Cuando b = c = 0, la ecuación es de la forma ax = 0, y la única solución que presenta es x = 0, como solución doble. b) Si el término de grado 1 es 0: b = 0, estas ecuaciones son de la forma ax2 + c = 0 y se resuelven sin más que des a. Ejemplo: pejar c · ax2 = –c; x2 = –c/a; x = ± – c / 3x2 – 27 = 0; 3x2 = 27; x2 = 27/3; x2 = 9; x = ± 9; x1 = + 3; x2 = –3 c) Si el término independiente es 0, c = 0, la ecuación sería: ax2 + bx = 0. Para resolverla, se saca factor común a x, x (ax + b) = 0, obteniéndose un producto de dos factores igualado a 0. Esto significa que o bien x = 0, con lo que ya se tiene una solución, o bien ax + b = 0, de donde despejando x se obtiene la segunda solución: x = –b/a

Por tanto, las soluciones son x = 0 y x = –b/a. Ejemplo: 3x2 – 15x = 0; x (3x – 15) = 0 x = 0 y 3x – 15 = 0; 3x = 15; x = 15/3; x = 5 Sin embargo, el caso general es la ecuación ax2 + bx + c = 0, con a ≠ 0, b ≠ 0, c ≠ 0. Para llegar a una fórmula con la que encontrar una solución, se siguen los siguientes pasos: a) Se multiplican los dos miembros de la ecuación por 4a: 4a (ax2 + bx + c) = 4a · 0, de donde 4a2 x 2 + 4abx + 4ac = 0. b) Se suma b2 a los dos miembros de la ecuación: 4a2 x 2 + 4abx + 4ac + b2 = b2

x c x+ h

c) El término 4ac se transpone al segundo miembro de la ecuación:

Se llama ecuación de segundo grado a un polinomio de segundo grado igualado a 0: ax2 + bx + c = 0. Como máximo, este tipo de ecuaciones tiene dos soluciones reales. Al resolver una ecuación de segundo grado se tienen en cuenta las siguientes premisas:

ax = –b;

h a

e) Se despeja x: 2 2 – 4 a c; 2ax = –b ± b – 4 a c (2ax + b) = b 2 x = (–b ± b – 4 a c)/2a

Este resultado es la fórmula que permite obtener la solución general en una ecuación de segundo grado. Ejemplo. Hallar la solución de x2 – 5x + 6 = 0: 2 – 4 · 6 )/2 · 1 = (5 ± 1)/2 x = (+ 5 ± 5 x 1 = (5 + 1)/2 = 3 y x2 = (5 – 1)/2 = 2

Las soluciones corresponden cada una de ellas al signo de la raíz cuadrada: 2 – 4 a c)/2a; x2 = x 1 = (–b + b 2 (–b – b – 4 a c)/2a

Discusión de las soluciones. Al término incluido dentro de la raíz, b2 – 4ac, se le llama discriminante y se representa por la letra griega ∆, luego ∆ = b2 – 4ac. Si ∆ es mayor que 0 (∆ > 0), la ecuación tiene dos soluciones reales: Si ∆ = 0, la ecuación tiene una única solución, que se dice que es una solución doble. Si ∆ <0, la ecuación no tiene soluciones reales.

Cálculo de la ecuación de segundo grado a) La suma de las raíces de una ecuación de segundo grado es:

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


228

MATEMÁTICAS

______________________________________________________________________________________________

2 2 x 1 + x2 = (–b + b – 4 a c)/2a + (–b – b – 4 a c)/2a = 2 2 = (–b + b – 4 a c – b – b – 4 a c)/2a = –2b/2a = –b/a

Ejemplo. La ecuación bicuadrada x4 – 13x2 + 36 = 0 se transforma en la ecuación de segundo grado z2 – 13z + 36 = 0. Al resolver ésta: z = (13 ± 1 69 – 1 4 4 )/2 = (13 ± 2 5 / 2 ) = (13 ± 5)/2

luego: x1 + x2 = S = –b/a

de donde:

b) Producto de las raíces de una ecuación de segundo grado es, por su parte: x1 · x2 = (–b + b – 4 a c)/2a · (–b – b – 4 a c)/2a = 2 2 – 4 a c) · (–b – b – 4 a c)/4a2 = (–b + b 2

2

El numerador es el producto de una suma por una diferencia que es igual a la diferencia de sus cuadrados; por tanto: 2 – 4 a c)2 /4a2 = (b2 – b2 + 4ac)/4a2 = (–b)2 – ( b = 4ac/4a2 = c/a

z1 = 9 y z 2 = 4 Como x2 = z, para z1 se tendrá x2 = 9; x = 9. Luego: x1 = 3; x2 = –3 y para el valor z2 : x2 = 4; x = 4; x3 = 2; x4 = –2 Luego 2, –2, 3 y –3 son las cuatro soluciones de la ecuación inicial.

luego:

Función de segundo grado o función cuadrática x1 · x 2 = P = c/a Si en la ecuación de segundo grado se dividen los dos miembros de la igualdad por a se obtiene: ax2 + bx + c/a = 0/a de donde ax2 /a + b/ax + c/a = 0

Se llama función de segundo grado o cuadrática a una función f : R → R que a x R le hace corresponder f (x) = ax2 + bx + c. Normalmente f (x) se sustituye por y, quedando y = ax2 + bx + c. Descomposición factorial. Si x1 y x2 son las soluciones de ax2 + bx + c = 0, entonces la función y = ax2 + bx + c, se puede descomponer en producto de factores como y = a (x – x1 ) (x – x2 ). Así, por ejemplo, la función y = x2 – 6x + 8 cuyas soluciones son 2 y 4, se descompone factorialmente como y = 1 (x – 2) (x – 4).

pero b/a = –S y c/a = P por tanto, la ecuación queda como: x 2 – Sx + P = 0 Donde S y P son la suma y el producto de las raíces. Ejemplo. Si las soluciones de una ecuación de segundo grado son 2 y 4, calcular la ecuación. La suma de las soluciones serán 2 + 4 = 6, y el producto, 2 · 4 = 8; luego la ecuación es x2 – 6x + 8 = 0.

Ecuaciones bicuadradas Las ecuaciones bicuadradas son polinomios de cuarto grado igualados a 0, pero son polinomios incompletos: les faltan los términos de grado tres y de grado uno; luego son de la forma ax4 + bx2 + c = 0. Estas ecuaciones se transforman en ecuaciones de segundo grado mediante el cambio de variable z = x2 , quedando como az2 + bz + c = 0.

Función de proporcionalidad inversa o hipérbola equilátera Esta función tiene como ecuación x · y = K, cuyos términos están en proporcionalidad inversa (al aumentar uno de ellos disminuye el otro, y viceversa). Al representar la gráfica de la función x · y = 1, generalmente escrita en la forma y = 1/x, se obtiene una gráfica simétrica respecto al origen de coordenadas donde los ejes son asíntotas, no estando definida para x = 0. La recta y = x es el eje de simetría: y

y=x

y=

1 x x


______________________________________________________________________________________

La elipse La elipse es la figura geométrica que se obtiene al cortar todas las generatrices de un cono mediante un plano:

Ecuaciones de segundo grado

229

Se define la hipérbola como el conjunto de puntos del plano cuya diferencia de distancias a dos puntos llamados focos es constante:

Hipérbola Elipse

Se define la elipse como el conjunto de los puntos del plano cuya suma de distancias a dos puntos fijos llamados focos es constante:

P (x, y) d1

d2

F´(–c, 0) P (x, y)

Á (–a, 0)

d

A(–a, 0)

bd´

F

(–c, 0)

F (–c, 0) A´(–a, 0)

A (a, 0)

(c, 0)

  A los segmentos PF y PF’ se les llama radios vectores de la elipse. La distancia de los puntos A (a, 0) y A’ (–a, 0) en los focos es 2a, luego d + d’ = 2a. La ecuación de la elipse en forma reducida es x2 /a2 + y2 /b2 = 1, expresión de una elipse centrada en el origen de coordenadas y simétrica respecto a los ejes, que son también ejes de simetría, y respecto al origen. Se llama excentricidad de la elipse al cociente c/a, que refleja un mayor o menor “aplastamiento”. Cuando c = a, la excentricidad es uno y se trata de una circunferencia. En forma explícita (despejada y), la ecuación de la elipse queda como: y = ± b/a a2 – x 2 que no es una función, pues a cada valor de x corresponden dos de y, según el signo de la raíz cuadrada. Los planetas al girar en torno al Sol siguen una trayectoria en forma de elipse.

La hipérbola La figura geométrica denominada hipérbola se obtiene al cortar un cono con un plano paralelo a dos generatrices.

F y F’ son los focos, siendo d1 – d2 = 2a. La ecuación reducida de la hipérbola es x2/a2 – y2/b2 = 1, cuya excentricidad es c/a. A los puntos (a, 0) y (–a, 0) se les llama semiejes de la hipérbola, siendo a el semieje real y b el semieje imaginario. La gráfica de esta función es simétrica respecto al origen y a los ejes de coordenadas. En forma explícita, la ecuación queda como: y = b/a x 2 – a 2

La parábola Aunque la ecuación de segundo grado tiene por gráfica una parábola, en general las parábolas son curvas que se obtienen al cortar la superficie de un cono por un plano paralelo a una generatriz.


230

MATEMÁTICAS

______________________________________________________________________________________________

Se define la parábola como el conjunto de puntos del plano que equidistan de un punto llamado foco y de una recta llamada directriz:

Luego si: x1 = –3 , y = –3 + 1 = –2; si x1 = 2, y = x + 1 = 3 Las soluciones del sistema son (–3, –2) y (2, 3), correspondientes a los puntos de corte entre una recta y una elipse. b) Sistemas en que las dos ecuaciones son del mismo grado: se pueden resolver por sustitución o reducción, según convenga, si las dos ecuaciones tienen el mismo grado. Siempre que se pueda, se resolverá por reducción. Ejemplo:

p (x, y) directriz → d d´ F (P/2, 0) eje x

p

x2 + y 2 = 7 x – y2 – 9x = –11 2x2 – 9x + 4 = 0 2

2x2 – 9x = –4; d = d´ eje y

Si p es la distancia del foco a la directriz, la ecuación reducida de la parábola es y = x2/2p. Las parábolas tienen gran aplicación en óptica para la construcción de lentes, y presentan la propiedad de que los rayos que inciden paralelos emergen por el foco y a la inversa. Por tanto, si se coloca el ojo en el foco, se puede ver por toda la lente.

Resolución de sistemas de ecuaciones de segundo grado Para resolver este tipo de sistemas, se actúa de forma análoga a los sistemas de primer grado. Las intersecciones de una recta con una hipérbola, parábola, elipse o circunferencia, y los de estas curvas entre sí, son sistemas de este tipo. El método que se utiliza en cada caso dependerá de cómo sean las ecuaciones, siendo los más adecuados los de reducción y sustitución. Se distinguen varios casos posibles: a) Sistema formado por una ecuación de primer grado y una de segundo: se resuelve por sustitución, despejando la variable en la ecuación de primer grado y sustituyendo en la de segundo. Ejemplo:

x – y = –1 Despejando y, y = x + 1 y sustituyendo x2 + (x + 1)2 = 25, x 2 + y2 = 25 x2 + x2 + 2x + 1 = 25 2

2x + 2x – 24 = 0 es una ecuación de segundo grado cuyas soluciones son: x = (–2 ± 4 + 9 6 )/4 = (–2 ± 10)/ = –3 ó 2

Resolviendo: x = (+9 ± 8 1 – 3 2 )/4 = (+9 ± 4 9 )/4 = (+9 ± 7)/4 x1 = 4, x2 = 1/2 sustituyendo en la primera ecuación:

4 2 + y2 = 700 y 2 = 7 – 16 y = – 9 no tiene soluciones reales (1/2)2 + y2 = 7; 1/4 + y2 = 7; 1 + 4y2 = 28; 4y2 = 27; y2 = 27/4 y = 2 7/4 = (+3 3)/2 o (–3 3)/2 luego las soluciones son los pares:

(1/2, 3 3/2); (1/2, –3 3/2)

_ Preguntas de repaso 1. La suma de las edades de dos niños es 14, y su producto 45. Calcular las edades de cada uno. 2. Descomponer factorialmente la función: y = 3x2 + 15x – 42 3. Resolver las siguientes ecuaciones: a) x2 – 49 = 0 b) x2 – 2x = 0 c) x4 – 37x2 + 36 = 0


MATRICES Y SISTEMAS DE ECUACIONES LINEALES

f a e

c A

b B

d

Generalidades

Se define matriz numérica como un conjunto de números ordenados en filas y columnas de forma que todas las filas tengan el mismo número de elementos y todas las columnas también, siendo los elementos los números que forman la matriz. Si una matriz tiene m filas y n columnas, se dice que es de orden m · n. Cuando m > n, se la llama matriz vertical; si m < n, matriz horizontal, y si m = n, matriz cuadrada. Los elementos de las matrices se representan mediante letras acompañadas de dos subíndices indicadores de su posición en la matriz; el primero señala la fila, y el segundo, la columna; así, el elemento aij quiere decir que está situado en la fila i y en la columna j. El conjunto ordenado de los elementos de la matriz se representa entre paréntesis o corchetes. En general, una matriz de orden m · n se escribirá:

(

f (x)

O

h a

x c x+ h

X

Si es de orden 1 · n, se llama matriz columna, pues sólo tiene una columna; si es de orden m · 1, se conoce como matriz fila:

Matriz numérica

A=

Y

a12 a13 . . . a1i . . . . a1n a 11 a 21 a22 a23 . . . a2i . . . . a2n ...........................… a j1 aj2 aj3 . . . . aji . . . . ajn ...........................… a m1 am2 am3 . . . ami . . . . amn

)

con 1≤j≤m 1≤i≤n

Matriz fila (a1 a2 … am ) a1 a2 Matriz columna … an

()

Matriz diagonal En una matriz cuadrada, se llama diagonal principal a la formada por los elementos que tienen los dos subíndices iguales; la otra diagonal es secundaria:

A=

(

)

a12 …… a1n a11 a21 a22 …… a2n diagonal principal ……………………… an1 an2 …… ann

Cuando en una matriz cuadrada son nulos todos los elementos excepto los de la diagonal principal, se llama matriz diagonal. Si los elementos no nulos de una matriz diagonal son todos 1, se la llama unidad:

(

El conjunto de los números que forman los elementos de la matriz será el cuerpo de los números reales R.

1 0 0 …… 0 0 1 0 …… 0 0 0 1 …… 0 …………………………… 0 0 0 …… 1

)

Matriz triangular Matriz nula La matriz en que todos sus elementos son 0 se llama matriz nula.

(

0 0 ……. 0 0 0 ……. 0 ……………… 0 0 ……. 0

)

Una matriz cuadrada en la que los elementos que están debajo o encima de la diagonal principal son nulos se dice matriz triangular:

(

1 0 0

2 4 0

–3 1 5

) (

–1 3 –5

0 4 1

matrices triangulares de orden 3

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).

0 0 3

)


232

MATEMÁTICAS

____________________________________________________________________________________________

Matriz simétrica Una matriz cuadrada en que los elementos simétricos respecto de la diagonal principal son iguales se dice matriz simétrica, es decir:

(

i, j

aij = aji

4 3 1 0

3 5 2 9

1 2 –4 6

0 9 6 1

)

matriz simétrica de orden 4

Matriz traspuesta Dada una matriz A de orden m · n, se llama matriz traspuesta de la matriz A, y se representa por At, a la que resulta de cambiar las filas por las columnas en A · At será de orden n · m:

A=

(

1 –1 2 7

2 0 3 9

3 5 –4 6

orden A = 4 · 3

) ( →A = t

1 2 3

–1 0 5

2 3 –4

7 9 6

)

El conjunto de las matrices de orden m · n sobre el cuerpo de los números reales con la operación suma (representado como Mm · n, +) tiene estructura de grupo abeliano, siendo el elemento neutro la matriz nula de orden m · n, y el elemento simétrico de cada matriz, la matriz simétrica de la dada. La matriz simétrica es la formada por los elementos opuestos a los de dicha matriz, es decir: si A (aij) es una matriz y B (bij) su opuesta, entonces aij = –ij. Propiedad. La traspuesta de una suma de dos matrices A y B es igual a la suma de las traspuestas de cada una de las matrices (A + B)t = At + Bt . Una matriz A se llama antisimétrica cuando su traspuesta y su opuesta son iguales. Producto de un número real por una matriz. Al multiplicar un número real por una matriz A, se obtiene una matriz que resulta de multiplicar todos los elementos de A por dicho número:

(

4 7 3 · 1 –1 2 1

0 –2 3 5 0 3

orden At = 3 · 4

=

Igualdad de matrices Dos matrices del mismo rango son iguales si los elementos situados en la misma posición en cada una de ellas son iguales, es decir: A = (aij) y B = (bij) con i = 1, … m; j = 1, … n, A = B si aij = bij

Operaciones con matrices

La suma sólo puede realizarse entre matrices del mismo orden. Dadas dos matrices A y B de orden m · n, se llama matriz suma de A y B y se representa por A + B, a otra matriz también del mismo orden, cuyos elementos están formados por la suma de los correspondientes de A y de B:

A=

( (

a 11 a12 …a1n a 21 a22 …a2n A+B= ……………… a m1 am2 …amn

=

(

) ( ) ( B=

+

b11 b12 … b1n b21 b22 … b2n ………………… bm1 bm2 … bmn b11 b12 … b1n b21 b22 … b2n ………………… bm1 bm2 … bmn

a11 + b11, a12 + b12 … a1n + b1n a21 + b21, a22 + b22 … a2n + b2n ……………………………… am1 + bm1, am2 + bm2 … amn + bmn

12 3 6

)

) )

21 –3 3

3·7 3 · 0 3 (–2) 3 · (–1) 3 · 3 3·5 3·1 3·0 3·3 0 9 0

–6 15 9

=

)

Para que se puedan multiplicar dos matrices, el número de columnas de la primera tiene que ser igual al número de filas de la segunda. Si A es de orden m · n, B tendrá que ser de orden n · p para que la multiplicación sea posible. El producto de la matriz A:

(

b11 b12 …b1p a11 a12 …a1n b21 b22 …b2p A = …………… por la matriz B = …………… am1 am2 amn bn1 bn2 …bnp

)

es otra matriz

(

C1p C11 C12 C21 C22 C2p C= ………………… Cm1 Cm2 Cmp

)

de orden m · p y en la que:

=

)

Multiplicación de matrices

(

Suma de matrices

a11 a12 …a1n a21 a22 …a2n ……………… am1 am2 …amn

(

)(

3·4 = 3·1 3·2

C11 = a11 b11 + a12 · b21 + ... + a1n · bn1 C22 = a11 · b12 + a12 · b22 + ... + a1n · b2n y así sucesivamente. En general: C ij = ai1 · b1j + ai2 · b2j ... + ain · bnj

)


__________________________________________________________________________

1 0

2 1

3 –1

4 2

)

·

2·4 =

233

Determinante de segundo orden

Ejemplo:

(

Matrices y sistemas de ecuaciones lineales

(

1 2 4 –1

1 3 –1 2 4·2

[

)

=

]

=

(

12 8 2·2

)

Determinantes de una matriz Se llama permutación principal a la ordenación creciente de los n primeros números naturales 1, 2, 3, 4, 5, .... n. Si sólo se toman dos números naturales, el 1 y el 2, la permutación principal es 1, 2. Si se toman en el orden, 2, 1, se dice que se ha realizado una inversión. Una permutación es par si presenta un número par de inversiones. Una permutación es impar si presenta un número impar de inversiones. Si se toman los tres primeros números naturales: 1, 2, 3: permutación par, pues presenta número par de inversiones. 1, 3, 2: permutación impar, presenta una inversión. 3, 1, 2: permutación par, porque presenta dos inversiones. 3, 2, 1: permutación impar, pues presenta tres inversiones. Se llama determinante de una matriz cuadrada al número que resulta de sumar algebraicamente todos los productos que se pueden formar tomando cada vez un elemento de cada fila y uno de cada columna en la matriz. El signo de cada producto vendrá dado por la paridad de la permutación que forman los subíndices de los elementos que componen el producto, positivo si la permutación es par y negativo si es impar. Se eligen los elementos de cada producto de forma que los subíndices de las filas estén en el orden natural; por tanto, la paridad vendrá dada por la colocación de los subíndices de las columnas. El determinante de la matriz A se representa por |A|: |A| =

|

n

|

= ∑ a1i1 a 2i2 a nin · sig [i1 , i2 , ..., in ] i=1

=

Ejemplo:

|

2 4

3 –1

|

= (2 – 1) –3 · 4 = –2 – 12 = –14

Determinante de tercer orden

El producto de matrices no es conmutativo, sí tiene elemento unidad, que es la matriz unidad, y se denotará por I. Matriz inversa de una dada. Dada una matriz A, se llama matriz inversa de A por la derecha, y se representa por A–1, a aquella matriz que verifica: A · A–1 = I. Análogamente, se define matriz inversa por la izquierda.

a12 . . . . . . a1n a11 a21 a22 . . . . . . a2n ……………………… an1 an2 . . . . . . ann

|

a12 a 22

a11 a11 = a11a22 – a12a 21

1 · 1 + 2 · 2 + 3 · 4 + 4 · (–1); 1 · 1 + 2 · 3 + 3 · (–1) + 4 · 2 = 0 · 1 + 1 · 2 + (–1) 4 + 2 (–1); 0 · 1 + 1 · 3 + (–1) · (–1) + 2 · 2 13 –4

|

|A| =

|A| =

a12 a22 a32

a13 a23 a33

|

=

= a11 a 22 a 33 + a 12 a 23 a 31 + a 21 a 32 a 13 – a 13 a 22 a 31 – a 12 a 21 a 33 – – a 11 a 23 a 32 Regla de Sarrus para el cálculo de los determinantes de orden tres. Se toman como productos positivos los de los tres elementos de la diagonal principal y los de los dos elementos paralelos a ella por el vértice opuesto, y como negativos, los de la diagonal secundaria y los de los elementos paralelos a ellos por el vértice opuesto:

producto con signo +

producto con signo –

Ejemplo: |A| =

|

1 0 2

2 1 1

3 –1 5

|

=

= 1 · 1 · 5 + 2 (–1) · 2 + 0 · 1 · 3 – 2 · 1 · 3 – 2 · 0 · 5 – – (–1) · 1 · 1 = 5 – 4 + 0 – 6 – 0 + 1 = –4

Propiedades de los determinantes a) El determinante de una matriz es igual al determinante de su traspuesta |A| = |At|. b) Si un determinante tiene dos filas o dos columnas iguales, su valor es 0: |A| =

=

|

a 11 a 21 a 31

|

a b c

a b c

|

a’ b’ = 0 c’

c) Si se multiplican todos los elementos de una fila o columna por un mismo número, el determinante queda multiplicado por dicho número:


234

MATEMÁTICAS

|

a |A| = a’ a”

b b’ b”

____________________________________________________________________________________________

c c’ c”

||

Ka a’ a”

Kb b’ b”

|

Kc c’ c”

= K · |A|

Adjunto de un elemento es su menor complementario multiplicado por menos uno elevado a la suma de los subíndices del elemento. Se representa por Adj:

|

d) Al cambiar entre sí dos filas o dos columnas, el determinante cambia de signo:

|

a a’ a”

b b’ b”

c c’ c”

||

b = – b’ b”

a a’ a”

|

c c’ c”

|

Ka c Ka’ c’ Ka” c”

| | =K·

a a’ a”

b a’ a”

A=

|

c c’ c”

=0

|

a a’ a”

b b’ b”

|

=

|

|

a b x1 a’ b’ x1 a” b” x’2

b b’ b”

x1 + x2 x’1 + x’2 x”1 + x”2

|| +

a a’ a”

b b’ b”

|

x2 x’2 x”2

|

b b’ b”

c c’ c”

|| =

a + bK a’ + b’K a” + b”K

|

b b’ b”

c c’ c”

|

|

=

Para obtener el valor de un determinante de orden n, se anulan, mediante las propiedades anteriores, todos los elementos de una fila o columna menos uno. Desarrollando por los elementos de esa fila o columna, quedará únicamente el producto correspondiente al elemento no nulo por su adjunto, que será un determinante de orden (n – 1). Se sigue así sucesivamente hasta llegar a un determinante de orden 3 que se resuelve por la regla de Sarrus.

|

menor complementario de a23 = a12 a13 a 14 a 11 a12 a14 a22 a23 a 24 = a 31 a32 a34 a32 a33 a34 a 41 a42 a44 a42 a43 a 44

|

2 0 5 0 3

|

| | |

3 0 –1 2 –2 1 3 0 = (–1) · (–1) · –1 2 0 5 0 –3 1 3 4

sumando a la segunda columna la cuarta:

|

= –

3 –2 –1 0

2 1 7 0

–1 3 0 1

2 0 5 3

sumando a la cuarta columna la tercera por (–3): =–

Menor complementario de un elemento es el determinante que resulta de suprimir la fila y la columna donde está dicho elemento:

||

|

La suma de los elementos de una fila o columna por los adjuntos de otra paralela a ella es 0.

3 0 –1 3 –2 1 3 0 –1 2 0 2 0 0 0 –1 0 –3 1 4

Desarrollo de un determinante por los elementos de una fila o columna

a11 a = 21 a31 a41

a13 a23 a33

Ejemplo: =

h) Cuando a los elementos de una fila o columna se les suman los de otra paralela a ella multiplicados por un mismo número, el valor del determinante no varía: a a’ a”

|

a12 a22 a32

a11 a21 a31

Regla para calcular un determinante

=0

g) Si todos los elementos de una fila o columna representan una suma de dos elementos, el valor del determinante es igual a la suma de dos determinantes en la que todos los elementos son iguales excepto la de los sumandos, que estará formada en uno de ellos por los primeros sumandos y en el otro por los segundos: a a’ a”

|

= a 11Adj(a11) + a21Adj(a23) + a31Adj(a31)

f) Si todos los elementos de una fila o columna son nulos, el determinante es nulo: 0 0 0

a14 a34 a44

El valor de un determinante es igual a la suma de los productos de cada elemento de una fila o columna por su adjunto. Por ejemplo:

e) Cuando un determinante tiene dos filas o dos columnas proporcionales, su valor es 0: a a’ a”

a12 a32 a42

a11 Adj (a23) = (–1)2 + 3 · a 31 a41

|

3 –2 –1 0

2 –1 5 1 3 –9 7 0 5 0 1 0

|

| |

= –1 · (–1)4 + 3

3 –2 –1

2 5 1 –9 7 5

|

Ahora se puede resolver por la regla de Sarrus:

|

3 = + –2 –1

2 1 7

5 –9 5

=

= 15 – 70 + 18 – (–5) – (–20) – (–189) = 15 – 70 + 18 + 5 + + 20 + 189 = 247 – 70 = 177


__________________________________________________________________________

Matrices y sistemas de ecuaciones lineales

Se llama menor de una matriz de orden m · n al valor del determinante que se forma tomando h filas y h columnas de dicha matriz. Si a un menor se le añade una fila y una columna distintas de las que componen el menor, se obtiene otro menor de orden una unidad mayor, que se denomina menor orlado:

(

|

a12 a22 a42

a11 a21 a41

a13 a23 a43

a 14 a 24 a 44

a 15 a 25 a 45

|

a12 a22

a11 a21

Matriz adjunta de una dada de orden n es la que resulta de sustituir cada elemento por su adjunto: A=

|

AdjA =

Un menor es:

[

Adj(a11) Adj(a21) Adj(a31)

|

a 15 a 25 a 45

|

|

3 –1 0 2

A=

|

1 3

|

=6–2=4

–1 1 0 4

|

4 5 1 3

5 1 1 2

( 02

1 1

|

2 1 2

| | | |

|A| =

1 3 2

3 –1 0

er

1. C – 2.º C =

|

|

|

2 0

1 =2–0=2 1

1 3 –1 –2 –1 1 1 1 2

|

= –60

Luego el rango es 4. No se puede seguir más, pues se ha encontrado un menor no nulo de orden máximo.

0 1

2+1

] ( 01 –12 )

(–1)1 + 2 · 1 = (–1)2 + 2 (2)

·0

( 10

)

–1 2 2

) = ( 1/2 0

–1/2 1

)

Comprobación: A · A-1 = I

=

|

( 12

1+1

Adj (At ) = A = |A|

A · A–1 =

=

1 1 3 –1 –2 3 –1 1 = 0 2 0 6 +2 –2 2 4

| |

1 3 –1 –2 –1 1 = –2 · 2 2 2 4

[ (–1) (–1)

–1

Este menor se orla con la última fila y una columna hasta encontrar un menor no nulo si lo hubiese:

= 2 (–1)3 + 2

)

At = Adj At =

= 0 – 2 + 6 – 18 – (–4) – 0 = = 0 – 2 + 6 – 18 + 4 = 10 – 20 = –10

2 1 3 –1 1 3 –1 1 2 2 0 0 0 –2 2 4

]

Matriz traspuesta de A:

Para calcular el rango de una matriz se comienza con un menor de orden 2 no nulo, y después este menor se va orlando: 2 1

Adj(a13) Adj(a23) Adj(a33)

Ejemplo. Sea la matriz:

Se llama rango de una matriz al orden del mayor menor no nulo. Ejemplo. Calcular el rango de la matriz: 1 3 2 –2

Adj(a12) Adj(a22) Adj(a32)

)

A –1 = Adj (At )/A

Rango de una matriz

2 1 2 0

a13 a23 a33

Cálculo de la matriz inversa de una matriz cuadrada. Para que una matriz cuadrada A tenga inversa es condición necesaria y suficiente que el valor de su determinante no sea 0: |A| ≠ 0. En este caso la matriz inversa de A se obtiene mediante la fórmula:

|

a12 a22 a42

a12 a22 a32

a11 a21 a31

y un menor orlado de este menor es: a11 a21 a41

235

( 02

+0 ( 20 ·· 1/2 1/2 + 0

( 1/20 2 (–1/2) + 1 1 = ( 0 (–1/2) + 1 ) 0

1 1

)

·

) 0 1 )

–1/2 = 1

Resolución matricial de sistemas de n ecuaciones con n incógnitas Sea el sistema de n ecuaciones con n incógnitas: a11x 1 + a12x 2 + … + a1nx n = C1 a21x 1 + a22x 2 + … + a2nx n = C2 ………………………………… an1x 1 + a n2x 2 + … + annx n = Cn Y sea M la matriz formada por los coeficientes de las incógnitas:


236

MATEMÁTICAS

M=

(

____________________________________________________________________________________________

a11 a12 ……… a 1n a21 a22 ……… a 2n ………………………… an1 an2 ……… a nn

)

1.º Si r(M’) > r(M), entonces el sistema es incompatible, no tiene solución. 2.º Si r(M’) = r(M), el sistema es compatible, pero hay que distinguir dos casos:

M’ es la matriz M ampliada con la columna de los términos independientes:

M’ =

(

a12 a 1n C1 a11 a21 a22 a 2n C2 …………………………… an1 an2 a nn Cn

)

a) r(M’) = r(M) = número de incógnitas, el sistema es compatible y determinado. Tiene solución única. b) r(M’) = r(M) < número de incógnitas, sistema compatible indeterminado con infinitas soluciones. La regla de Cramer también se puede aplicar a los sistemas compatibles e indeterminados. Sea el sistema:

El sistema se puede escribir en forma matricial como M X = C:

(

a12 a 1n a11 a21 a22 a 2n ………………… an1 an2 a nn

) ( ) ( ) ·

x1 x2 … xn

=

C1 C2 … Cn

a 11x 1 + a12x 2 + a13x 3 + a14x 4 = C1 a 21x 1 + a22x 2 + a23x 3 + a24x 4 = C2 a 31x 1 + a 32x 2 + a 33x 3 + a34x 4 = C3 Si se supone que r(M) = r(M’) = 2, y que:

|

Si |M| ≠ 0, entonces el sistema tiene solución. La regla de Cramer permite hallar dichas soluciones.

|

a12 a 1j-1 C1 a 1j+1 a 1n a11 a21 a22 a 2j-1 C2 a 2j+1 a 2n ………………………………………………… an1 an2 a nj-1 Cn a nj+1 a nn Xj = |A|

|

a12 a22

a11 a21

|

≠ 0

Entonces se elimina la última ecuación, quedando: a 11x 1 + a12x 2 + a13x 1 + a14x 4 = C1 a 21x 1 + a22x 2 + a23x 3 + a24x 4 = C2 Los sumandos con incógnitas x3 y x4 se pasan al segundo miembro de las ecuaciones:

Ejemplo: a 11x 1 + a12x 2 = C1 – a 13x 3 – a14x 4 a 21x 1 + a22x 2 = C2 – a 23x 3 – a24x 4

2x + 3y = 14 3x – 4y = 4 A=

(

2 3

3 –4

)

|A| =

|

|

|

|

|

2 3

3 –4

|

= –8 – 9 = –17

14 3 14 · (–4) – 12 –68 4 –4 x = –––––––––– = ––––––––––– = ––––= 4 –17 –17 –17 2 14 8 – 42 –34 3 4 y = –––––––––– = –––––– = –––– = 2 –17 –17 –17

Teorema de Rouché-Fröbenius

Y ahora se puede resolver por medio de la regla de Cramer:

x1 =

|

C1 – a 13x 1 – a14x 4 C2 – a 23x 3 – a24x 4 a11 a12 a21 a22

x2 =

|

a11 a21

| |

Sea M la matriz de los coeficientes, y M’, la matriz ampliada:

|

C1 – a 13x 1 – a14x 4 C2 – a 23x 3 – a24x 4 a12 a22

|

| |

Ejemplos: x + 2y + 3z = 12 4x – y – z = –3 6x + 3y + 5z = 21

Dado el sistema de ecuaciones con n incógnitas: a11x 1 + a12x 2 + … + a1nx n = C1 a21x 1 + a22x 2 + … + a2nx n = C2 ………………………………… am1x 1+ a m2x 2 + …+ amnx n = Cm

a11 a21

a 12 a 22

M=

(

1 4 6

2 –1 3

|

3 –1 5 1 4

) ( M’ =

2 –1

|

1 4 6

–2 –1 3

= –1 – 8 = –9

3 –1 5

12 –3 21

)


__________________________________________________________________________

|

1 4 6

2 –1 3

3 –1 5

|

|

2 –1 3

12 –3 21

|

( 6–7– λ , 51 –7 13 λ , λ) Sistemas homogéneos

= –21 – 36 + 144 + 72 + 9 – 168 = = –225 + 225 = 0

luego r(M’) = 2. Por tanto, r(M) = r(M’) = 2 < número de incógnitas. Sistema compatible indeterminado, se elimina la última ecuación y queda: x + 2y + 3z = 12 4x – y – z = –3

x + 2y = 12 – 3z 4x – y = –3 + z

Son sistemas homogéneos aquellos en que los términos independientes de las ecuaciones son todos nulos. En ellos siempre existe la solución trivial x1 = 0, x2 = 0, …, xn = 0, luego todos son compatibles. El sistema homogéneo será compatible y determinado si r(M) = número de incógnitas. Este caso no tiene mucho interés, dado que la única solución es la trivial. El sistema homogéneo es compatible e indeterminado si r(M) < número de incógnitas. Se resuelve entonces utilizando un número de parámetros igual al número de incógnitas no principales.

de donde:

Mediante la regla de Cramer:

x=

y=

| |

12 – 3z –3 + z –7

1 4

2 –1

12 – 32 –3 + z –7

237

y llamando a z se tiene la solución, que es: = –5 – 12 + 36 + 18 – 40 + 3 = 0

luego r(M) = 2. 1 4 6

Matrices y sistemas de ecuaciones lineales

| |

–12 + 3z – 2 (–3 + z) = –7 –12 + 3z + 6 – 2z = z – 6 = = –7 6–Z = –7

=

–3 + z – 4(12 – 3z) = = –7 –3 + z – 48 + 12z = = –7 –51 + 13z 51 – 13z = = –7 7

_ Preguntas de repaso 1. Efectuar el producto de las siguientes matrices: 2 5 1 –2 3 0 –1 –1 A= 2 1 5 0 B= 0 3 –1 –2 1 4 –3 2

(

( )

)

2. Calcular el determinante A: 1 0 –1 3 2 1 1 –1 |A| = 0 2 3 4 –1 –3 5 2

|

3. Resolver el siguiente sistema: x+y–z=0 3x + y + z = 0 2x + 2z = 0

|


SUCESIONES Y LÍMITES

f c

a e

A

b B

Y f (x)

O

d

Generalidades

1

x c x+ h

X

Operaciones con sucesiones

Se llama sucesión a toda aplicación del conjunto de los números naturales N en el conjunto de los números reales R o en un subconjunto de él. Los elementos de la sucesión se representan con la letra a y un subíndice i, que es el origen de la aplicación: a1, a2, …, an; donde a1 es el primer término de la sucesión, a2 el segundo y así sucesivamente. El término general se denota an. sucesión: N  f → R

h a

2

2

4

3

6

n

2n

En la sucesión del gráfico: a1 = 2; a2 = 4; a3 = 6; …, an = 2n, las sucesiones se representan: (an)n N. Ejemplo: 1/2, 1/3, 1/4 … 1/n + 1; donde (1/n + 1) es el término general, con n N. Una sucesión es creciente si cada término es mayor o igual que el anterior, es decir: an ≤ an + 1, n N, si se verifica que an < anN n N, se llama estrictamente creciente, la sucesión de los números pares es estrictamente creciente: 2, 4, 6, 8, …, 2n. Una sucesión es decreciente si cada término es menor o igual que el anterior: an ≥ an + 1, n N, y estrictamente decreciente si an > an + 1, n N. La sucesión (an)n N = (1/n)n N es estrictamente decreciente: 1 · 1/2, 1/3, 1/4, …, 1/n. Una sucesión es monótona cuando es creciente o decreciente. Dos sucesiones son monótonas convergentes entre sí cuando: a) Una es creciente y la otra decreciente. b) Cualquier término de la creciente es menor que cualquier término de la decreciente. c) La diferencia entre dos términos, uno de la creciente y otro de la decreciente, puede llegar a ser tan pequeña como se quiera.

Las operaciones con sucesiones se efectúan mediante su aplicación con los términos correspondientes. Si (an)n N y (bn)n N son dos sucesiones, la suma se define como: (an) + (bn) = (an + bn) Por ejemplo, si: (an) = 2, 4, 6, 8, …, 2n y (bn) = 3, 5, 7, 9, …, 2n + 1, entonces: (an) + (bn) = 2 + 3, 4 + 5, 6 + 7 …, 2n + 2n + 1 Por su parte, el producto es: (an) · (bn) = (an · bn) que, en el ejemplo: (an) · (bn) = 2 · 3, 4 · 5, 6 · 7, …., 2n · (2n + 1). La resta y el cociente se realizan de forma análoga, teniendo en cuenta que para la divisón ha de ser bn ≠ 0, n N. Se dice que una sucesión está acotada superiormente si existe un número real que es mayor que todos los de la sucesión; a la menor de las cotas superiores se le llama extremo superior y, si pertenece a la sucesión, máximo. Una sucesión está acotada inferiormente si existe un número que es más pequeño que todos los de la sucesión; este número es una cota inferior. La mayor de las cotas inferiores se llama extremo inferior, y mínimo si pertenece a la sucesión. Por ejemplo, la sucesión (1/n) está acotada superior e inferiormente, 1 es el máximo y el extremo inferior es el 0. 1, 1/2, 1/3, 1/4, …, 1/n 2, 3, 4, 1 son cotas superiores; 0, –1, –3, son cotas inferiores

Límite de una sucesión Generalidades Intuitivamente, el límite de una sucesión puede definirse como el número al que se va aproximando la sucesión.

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________________

Sucesiones y límites

239

1, 1/2 = 0,5, 1/3 = 0,3, 1/4 = 0,25, 1/5 = 0,2, 1/6 = 0,16, 1/7 = 0,142, 1/8 = 0,125, …

d) Si bn ≠ 0 n N y b ≠ 0, nlim a /bn = a/b; es decir, en → n las condiciones expresadas, el límite del cociente entre dos sucesiones es el cociente entre sus límites. a bn = ab. e) Si b ≠ 0 y a ≠ 0 nlim → n

Son todos positivos si se representan en una recta:

Cálculo de límites

Por ejemplo, los términos de la sucesión an = (1/n) son:

|

| 1 6

0

| 1 5

| 1 4

| 1 3

| 1 2

| 1

Para calcular el límite de una sucesión, se sustituye la n del término general por infinito, teniendo en cuenta las siguientes expresiones determinadas e indeterminadas: Determinaciones:

Se van acercando al cero, que será el límite de la sucesión. Una definición más rigurosa sería: una sucesión an se dice que tiende a un límite a cuando n tiende a infinito, a = a, si ε > 0, ε R, ∃ no N tal que y se expresa lim n→ n n ≥ no se verifica que |an – a|≤ ε. Es decir, a es el límite de la sucesión an, si para cualquier número que se elija, todo lo pequeño que se quiera, existe un término de la sucesión, el correspondiente a n0, a partir del cual todos los siguientes de la sucesión están a una distancia del límite inferior que el número ε elegido: | a1

| a3

ε ε (| | ) an a

| an

| a2

n ≥ no, d (an, a) ≤ ε Si una sucesión tiene límite se llama convergente. El límite de una sucesión, si existe, es único. Si una sucesión tiene límite está acotada y toda sucesión monótona y acotada es convergente. Se dice que una sucesión es divergente cuando, dado un número real M, tan grande como se quiera a partir de un término en adelante, todos los de la sucesión son mayores que M en valor absoluto: lim an = ± si ∃ no N tal que |an|≥ M n ≥ no n→

Las sucesiones que no son convergentes ni divergentes se llaman oscilantes. Así, por ejemplo, (an) = (2n) es divergente y la sucesión (bn) = [(–1)4(2n)] es oscilante. Todo número real se puede definir como límite de dos sucesiones monótonas convergentes: 1 ≤ 1,7 ≤ 1,73 ≤ 1,732 ≤ … ≤ 3 ≤ … ≤ 1,733 ≤ 1,74 ≤ 1,8 ≤ 2

Operaciones con límites

Si r > 0

Si r < 0

r/0 = – r · = – r · – = + r/± = 0 r = 0 ±r= – ± r = –

r = r = 0 Si 0 < r < 1 r– = r – = 0 + = , – – = – , · = , – · = – , = , – = 0 Si r ≥ 1

Indeterminaciones: – , / , 0/0, · 0, 1 , 0 y 00 Para resolver las indeterminaciones, es preciso efectuarlo particularmente en cada caso. Por ejemplo, si (an) = (n2) y (bn) = (n) lim (an ± bn) = lim (n2 ± n) = 2 ± =

n→

n→

lim (an · bn) = lim (n2 · n) = lim n3 = 3 =

n→

n→

n→

lim (an/bn) = lim (n /n) = lim n = 2

n→

n→

n→

lim (1/n) = 1/ = 0 (Las sucesiones con límite nulo se n→ llaman infinitésimos.) Resolución de indeterminaciones: a) De la forma / , se elimina la indeterminación dividiendo numerador y denominador por n elevado a la mayor potencia. Por ejemplo:

Si (an) y (bn) son dos sucesiones con nlim (an) = a y nlim b = b, → → n se verifican las siguientes propiedades: lim

(an + bn) = a + b, el límite de la suma de dos sua) nlim → cesiones es igual a la suma de sus límites. (an – bn) = a – b, el límite de la diferencia de dos b) nlim → sucesiones es igual a la resta de sus límites. (an · bn) = a · b, el límite del producto de dos suc) nlim → cesiones es igual al producto de sus límites.

r/0 = 0 r· = r · – = r/± = 0 r = ±r= – ± r = –

n→

3 n3 + 3n2 = 3 + 3 2 = , luego dividiendo por n n3 – 2

n3 + n3 1+ 3 1+ 3 1+0 1 n n3 n3 lim ––––––– = lim ––––– = ––––– = ––––– = – = 1 3 n→ n→ 2 2 1–0 1 n + 1+ 3 1– 2 n n3 n3


240

MATEMÁTICAS

______________________________________________________________________________________________

b) La indeterminación de la forma – se resuelve multiplicando y dividiendo por el conjugado del término general. Por ejemplo: – n =

lim

n→

lim

– n = lim

n→

– = – . Por tanto (

– n)(

+ n) + n

n→

=

2 2 n+1–n = lim ( n + 1) – ( n) = lim = n→ n → n + 1 + n n + 1 + n

1 = 1=0 – c) Las indeterminaciones de la forma 1 se resuelven teniendo en cuenta que: lim (1 + 1 = n)n e 2,7182818284… n→ base de los logaritmos neperianos; entonces si: lim an = 1 n→ y lim (bn) = : =

n→

lim abn = 1 , indeterminación que se resuelve de la siguiente forma: n→

lim abn = ep, donde p = lim (an – 1) · bn

n→

n→

Interpolación aritmética Dados dos números, interpolar es obtener algunos términos intermedios de forma que todos ellos estén en progresión aritmética. Para interpolar, es necesario conocer la diferencia despejando en la fórmula del término general, con lo que: d = (an – a1)(n – 1). Por ejemplo, para interpolar tres términos aritméticos entre 25 y 45: 25…45, d = (45 – 25)/(5 – 1) = 20/4 = 5, luego los términos son 30, 35 y 40 En toda progresión aritmética finita, la suma de dos términos equidistantes de los extremos es igual a la suma de los extremos: 4, 7, 10, 13, 16, 19, 22, 25, 28 Los extremos son 4 y 28 y su suma 4 + 28 = 32, 7 y 25 equidistan de los extremos 7 + 25 = 32 análogamente: 10 + 22 = 32, 13 + 19 = 32. En este caso, en que la progresión tiene un número impar de términos, el central se suma consigo mismo, 16 + 16 = 32.

Por ejemplo: lim ( n – 1 ) 2n = 1 ; luego an = n – 1 y bn = 2n, de donde n n

n→

p = lim ( n – 1 – 1) 2n = lim ( n – 1 – n ) 2n = lim –2n = –2; n→ n→ n→ n n n finalmente, lim ( n – 1 ) 2n = ep = e–2 = 12 n→ n e

Suma de n términos de una progresión aritmética La suma de n términos es: S = a1 + a2 + a3 + … + an – 1 + an y también: S = a n + an – 1 + an – 2 + … + a2 + a1 Luego: 2S = (a1 + an) + (a2 + an – 1) + (a3 + an – 2) + … +( an + a1)

Progresión aritmética Se llama progresión artimética a una sucesión de números en los que cada término se obtiene del anterior, sumándole una constante llamada diferencia de la progresión. La sucesión 1, 3, 5, 7, …, 2n – 1 es una progresión aritmética, donde cada término n se obtiene sumando 2 al anterior, 3 = 1 + 2, 5 = 3 + 2, 7 = 5 + 2, …, luego 2 es la diferencia de la progresión. Si d > 0, la progresión es creciente y decreciente si d < 0.

Todas las sumas que están entre paréntesis son iguales, pues se trata de la suma de dos términos equidistantes de los extremos, luego: 2S = (a1 + an) + (a1 + an) + … + (a1 + an) = n (a1 + an), y despejando S: S = (a1 + an) · n/2 Por ejemplo, para calcular la suma de los diez primeros términos de la sucesión de los números pares: 2, 4, 6…, se calcula el término a10 = 2 + (9) · 2 = 20 y luego la suma S = (2 + 20) · 10/2 = 110.

Cálculo del término general Si a1, a2, a3, …, an, es una progresión aritmética de diferencia d, se tiene que: a2 = a1 + d, a3 = a2 + d = a1 + d + d = a1 + 2d, a4 = a3 + d = = a1 + 2d + d = a1 + 3d… de donde a1 = a1 + (n – 1)d Así, por ejemplo, el término general de la sucesión 3, 7, 11, 15,…, corresponde a: an = 3 + (n – 1) 4 = 3 + 4n – 4 = = 4n – 1.

Progresión geométrica Se conoce por progresión geométrica a una sucesión en la que cada término se obtiene multiplicando el anterior por una constante llamada razón de la progresión. La sucesión 3, 12, 48, 192, 768 … es una progresión geométrica donde cada término se obtiene multiplicando el anterior por 4:12 = 3 · 4, 48 = 12 · 4 … Para hallar la razón, se divide un término entre el anterior (an : an – 1), como, por ejemplo, 768 : 192 = 4.


__________________________________________________________________________________________

Término general de una progresión geométrica Dada la progesión geomérica: a1, a2, a3, … an de razón r, como cada término se obtiene multiplicando el anterior por la razón: a2 = a1 · r, a3 = a2 · r = a1 · r · r = a1 r2, a4 = a3 · r = a1 r2 · r = = a1 · r3 y en general an = a1 · rn – 1 Así, en la progresión 3, 12, 48, 192 … an = 3 · 4n – 1, si se quiere hallar el término octavo, será: a8 = 3 · 47 = 49.152.

Sucesiones y límites

241

Por ejemplo, el producto de los siete términos de la progresión: 2

(2.128) 7 = 268.435.456 2, 4, 8, 16, 32, 64, 128 es P =

Suma de n términos de una progresión geométrica La suma de n términos de una progresión geométrica es: S = a 1 + a2 + a3 + … + an Si se multiplica por r:

Interpolación geométrica Dados dos números, se llama interpolación geométrica a la operación consistente en calcular otros términos intermedios de forma que todos ellos estén en progresión geométrica. Para interpolar es necesario conocer la razón de la progresión despejando en la fórmula el término general: n–1

r = an

S · r = a 1 · r + a 2 · r + a 3 · r + … + a n – 1 · r + an · r Restando miembro a miembro estas igualdades, y teniendo en cuenta que: a1 · r = a2, a1 · r = a3, …, an – 1 r = an, se llega a: Sr – S = an · r – a1. Sacando factor común a r, S(r – 1) = an – r – a1, y despejando S: S = (an · r – a1)/(r – 1). Así, por ejemplo, la suma de 2, 4, 8, 16, 32, 64, 128 es: S = (128 : 2 – 2)/(2 – 1) = 254

Por ejemplo, para interpolar cuatro medios proporcionales entre 4y 1 4 4

r = 1/4 = 4

= 1 2

Luego los términos son: 4 · 1/2 = 2, 2 · 1/2 = 1 y 1 · 1/2 = 1/2; y la progresión: 4, 2, 1 · 1/2, 1/4. En toda progresión geométrica finita, el producto de dos términos equidistantes de los extremos es igual al producto de los extremos. Así, 2, 4, 8, 16, 32, 64, 128, se tiene el producto de los extremos 2.128 = 256; si se van multiplicando los términos equidistantes de los extremos, se tiene: 4 · 64 = 256, 8 · 32 = 256, y si el término central se multiplica por sí mismo, 16 · 16 = 162 = 256.

Producto de n términos de una progresión geométrica

La suma de los infinitos términos de una progresión geométrica ilimitada decreciente se obtiene por la fórmula S = a1/1 – r; así, en la progresión: 4, 2, 1, 1/2, 1/4… de razón r = 1/2 se tiene que: S = 4(1 – 1/2) = 4/1/2 = 8.

_ Preguntas de repaso 1. Calcular los siguientes límites: 3 2 a) lim n +3n – 5 n→ 2n + 7 b) lim

n→

2 n + 1 – n2 – 1 2

(

)

2 c) lim n2 + 1 3n2 n→ n + 1 2. Dada la sucesión 1, 1/4, 1/9, 1/16, 1/25, …: a) Hallar su término general. b) Decir si está acotada y si lo está calcular las cotas superiores e inferiores.

Dada la progresión geométrica a1 · a2 · a3 … an, el producto de sus términos es P = a1 · a2 · a3 … an – 1 · an y también P = an · an – 1 · an – 2 … a2 · a1. Multiplicando miembro a miembro ambas expresiones:

3. Dada la progresión aritmética 4, 10, 16, 22, … Hallar: a) La diferencia. b) El término general. c) La suma de los 15 primeros términos.

P2 = (a1 · an) · (a2 · an – 1) … (an – 1 · a2) · (an · a1)

4. Interpolar 3 medios proporcionales entre 2 y 1.458.

todos estos paréntesis son productos formados por dos términos equidistantes de los extremos, luego:

5. Aplicando las propiedades de las progresiones geométricas, calcular la fracción generatriz del número decimal 4, 3.

2

n (a1 · a P2 = (a1 · an)n, P = n)


NÚMEROS COMPLEJOS Y LOGARITMOS

f a e

c A

b B

d

Números complejos Los números complejos nacen de la imposibilidad de encontrar soluciones en el conjunto de los números reales R a ecuaciones del tipo x2 + 1 = 0, pues en R las raíces cuadradas de números negativos no existen. Se llama número complejo a cualquier elemento del conjunto producto R · R, compuesto por pares ordenados de números reales. A R · R se le denomina C. Dado (a, b) C, a es la parte real y b la parte imaginaria. Para resolver las ecuaciones de la forma x2 + 1 = 0, se despeja x, x = – 1 , y se llama a – 1 = i. Escribiendo los números complejos de la forma (a, b), y dado que a + bi es la llamada forma binómica de expresar los elementos de C, si b = 0 se obtienen los números reales. Si a = 0, los elementos de la forma bi se llaman imaginarios puros. En C se define la suma de números así: (a + bi) + (c + di) = (a + c) + (b + d) i. El producto de un número real por un complejo se calcula: k R: k(a + bi) = ka + kbi. El producto de números complejos es: (a + bi) · (a’ + b’i) = (aa’ – bb’) + (ab’ + ba’) · i. El conjunto (C, +, ·) tiene estructura de cuerpo, siendo el elemento neutro el 0 y el inverso de un elemento (a + bi): a –––––– + a 2 + b2

Y f (x)

h

O

a

x c x+ h

X

Forma polar de un número complejo. Se llama módulo de un número complejo z, y se representa por |z| a |z| = a 2 + b 2 . Argumento de un número complejo es el ángulo que forma con la parte positiva del eje x. Se representa por α, luego el complejo a + bi se puede representar como rα, donde r = a 2+ b 2 y tgα = b/a. Fórmula trigonométrica. Como a = r cosα y b = r senα, el número complejo a + bi se puede expresar como r (cosα + i senα), o forma trigonométrica. División de números complejos en forma binómica. Para calcular el cociente a + bi a’ + b’i se multiplica el numerador y el denominador de la fracción por el conjugado del denominador: (a + bi) (a’ – b’i) (a’ + b’i) (a’ – b’i) siendo el resultado (aa’ + bb’) (ba’ – ab’)i + (a’)2 – (b’)2 (a’)2 – (b’)2

–b ––––– · i a2 + b 2

Representación de los números complejos

Operaciones con números complejos en forma polar:

Los elementos de C se representan en un eje cartesiano, con la parte real en el eje de las abscisas y la imaginaria en el de ordenadas:

Producto: rα · r’α’ = (r · r’) α + α’ Cociente: rα · r’α’ = (r/r’) α – α’ Potencia: (rα)n = rnn · α n n Raíz enésima: r α = r α + 360k , k = 0, 1, 2, … , n – 1

z = (a + bi)

n

La función exponencial b

r

α a

La función exponencial es la función y = ex , donde e es la base de los logaritmos neperianos. El eje x es una asíntota horizontal. La función es creciente:

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


________________________________________________________________________________

y = ex (1, e)

Números complejos y logaritmos

d) El logaritmo de una raíz es igual al logaritmo del radicando dividido por el índice de la raíz (transforma raíces en divisiones):

(0, 1)

m

logb a =

0

gráfica de la función exponencial

Son numerosos los fenómenos de la realidad que presentan un crecimiento exponencial: el aumento de poblaciones animales y vegetales, la desintegración del carbono 14, etc. Aunque se ha considerado como función exponencial y = ex , por ser la más frecuente, son también funciones exponenciales las de la forma: y = ax , siendo crecientes cuando a >1 y decrecientes cuando a < 1.

Logaritmos Se llama logaritmo de un número N en una base b al exponente al que es preciso elevar la base para obtener el número. El logaritmo se representa por logb , siendo b la base: logb N = x ↔ bx = N

243

logb a m

Cambio de base de logaritmos. La fórmula que permite relacionar el logaritmo de un número en dos bases distintas, b y b’, es: logb N = logb’ N / logb’ b

Función logarítmica Es una función f : R+ → R / que x R+ → logb x R. El dominio de definición de la función logarítmica es el conjunto R+ , pues los números negativos no tienen logaritmo. La función inversa de la función logarítmica es la función exponencial, luego ambas funciones son simétricas respecto de la bisectriz del primer cuadrante. Si la base de los logaritmos es e, la gráfica de la función inversa de y = ex se obtiene como: y = ex x

y = loge = ln e

x

Cuando la base es el número 10, el logaritmo se llama decimal, y no se suele escribir la base log10 100 = 2, pues 102 = 100.

Propiedades de los logaritmos a) El logaritmo de un producto es igual a la suma de los logaritmos de cada uno de los factores (transforma productos en sumas): logb p · q = logb p + logb q b) El logaritmo de un cociente es igual al logaritmo del numerador menos el logaritmo del denominador (transforma cocientes en restas): logb p/q = logb p – logb q c) El logaritmo de una potencia es igual a la multiplicación del exponente por el logaritmo de la base de la potencia (transforma potencias en productos): logb a n = n logb a

_ Preguntas de repaso 1. Si Z1 = 2 – 3i y Z2 = 3 + i. Calcular: a) Z1 + Z2 . b) Z1 · Z2 . c) Z1 / Z2. 5

2. Calcular 3 2 6 0 . º 3. Dado el número complejo en forma polar, 230º, expresarlo en forma binómica. 4

4. Calcular log3 (27 · 92 ) / 7 2 9. 5. Resolver la siguiente ecuación logarítmica: log (x + 5) – 2 log (x + 4) = log 4 – log 9


Y f a e

A

b B

f (x)

DERIVADAS

c

O

d

Derivada de una función

tg α’ =

La noción de derivada surge al intentar encontrar la recta tangente a una función en un punto. Si y = f(x) es una función definida en R o en un subconjunto de R, y x0 un punto, el valor x0 + h es el x0 incrementado en una cantidad h. A la diferencia f(x0 + h) – f(x0) se le conoce por incremento de la variable independiente, y al cociente [f(x0 + h) – f(x0 )]/h se le llama cociente incremental. Se define la derivada de la función f en el punto x0 como el límite del cociente incremental cuando h (incremento de la variable independiente) tiende a cero. La derivada de f en x0 se representa por f’(x0 ). f ’(x0) =

lim f(x0 + h) – f(x0) h

h→0

h a

x c x+ h

X

f(x0 + h) – f(x0) h

f (x0 + h)

f (x0 + h) α'

f (x0)

x0

x0 + h

La tgα ‘ es la pendiente de la recta secante a la función en los puntos [(x0 , f(x0 )], [(x0 + h), f(x0 + h)], y el límite cuando h → 0 es la pendiente de la recta tangente; luego si m es la pendiente, m = tg α = f’(x0 ) y la ecuación de la tangente será: y – f(x0 ) = f’(x0 )(x – x0 )

f (x0 + h) f (x0 + h) – f (x0)

Ejemplo. Hallar la ecuación de la recta tangente a la función f(x) = x2 en x = 1: f(1) = 12 = 1, f(1 + h) = (1 + h)2 = 1 + h2 + 2h f ’(x) = lim [(f(1 + h ) – f(1))/h] = lim [(1 + h2 + 2h – 1)/h] =

f (x0)

h→0

h x0

h→0

x0 + h

La ecuación de la recta tangente es:

derivada de una función

y – 1 = 2(x – 1), y = 2x – 2 + 1 y = 2x – 1

Ejemplo. Hallar la derivada de la función f(x) = x en x0 = 3: f(3) = 3, f(3 + h) = 3 + h f ’(3) = lim [f(3 + h) – f(3)/h] = lim [(3 + h – 3)/h] = lim h/h = h→0

h→0

= lim [(h (h + 2))/h] = 0 + 2 = 2

h→0

y = x2

h→0

= lim 1 = 1, luego f’(3) = 1 h→0

Ecuación de la recta tangente a una función en un punto La derivada de una función en un punto es la pendiente de la recta tangente a la curva en dicho punto:

1 y = 2x – 1

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________________________

Derivadas

245

Función derivada

Derivada de una constante por una función

Si la función y = f(x) es derivable en R y en cada punto x0 existe la derivada f ’(x0 ), se llama función derivada a la función que a cada x0 le hace corresponder f ’(x0 ), y se representa por f ’(x):

Si u(x) es una función derivable, K R y f(x) = Ku(x), entonces: f ’(x) = Ku’(x)

f ’(x) = lim [f(x + h) – f(x)/h] h→0

La derivada de una constante por una función es igual a la constante por la derivada de la función.

Diferencial de una función Si se tienen en cuenta los incrementos de la variable dependiente, f (x0 + h) – f(x0 ), y de la variable independiente, h, el primero representa los sucesivos incrementos que toma la ordenada para los sucesivos valores de h. Si se considera la función que, para los valores de h, le hace corresponder f ’(x0 ) · h , y llamando dy a f(x0 + h) – f(x0 ) y dx a h, se establece la función diferencial: dy = f ’(x0 ) · dx

Derivada de un producto Si f(x) = u(x) · v(x), entonces f ’(x) = u’(x) · v(x) + u(x) · v’(x).

Derivada de un cociente Si f(x) = u(x)/v(x), un cociente, f’(x) = [u’(x) · v(x) – u(x) · v’(x)]/[v(x)]2

donde dy es la diferencial de y, dx es la diferencial de x.

Derivada de la función compuesta dy

La derivada de la función compuesta se calcula por la llamada regla de la cadena: Si f(x) = u [v(x)], f ’(x) = u [v(x)]’ = u’ [v(x)] · v’(x)

x0

x0 + h

Derivada de las funciones elementales

diferencial de una función

Derivada de una constante

Derivada de la suma, diferencia, producto y cociente Derivada de la suma y/o diferencia de dos funciones Sean u(x) y v(x) dos funciones derivables, y f(x) = u(x) ± v(x), luego f(x + h) = u(x + h) ± v(x + h). Por la definición de derivada se tiene que: f ’(x) = lim [(f(x + h) – f(x))/h] = h→0

= lim [(u(x + h) ± v(x + h)) – (u(x) ± v(x))/h] = h→0

= lim [(u(x + h) – u(x))/h ± lim (v(x + h) – v(x))/h] = h→0

h→0

= u’(x) ± v’(x) Luego la derivada de la suma es la suma de las derivadas.

La derivada de una constante es igual a cero: f(x) = K, siendo K constante, f(x + h) = K, luego f´(x) = lim [f(x + h – f(x)/h] = lim [(K – K)/h] = lim 0 = 0 h→0

h→0

h→0

Derivada logarítmica f(x) = Lx (Lx es el logaritmo neperiano de x), f(x + h) = L (x + h) f ’(x) = lim [(L(x + h) – L(x))/h] = lim [1/h · h→0 h→0 L ((x + h)/x)]. Multiplicando y dividiendo por x: f’(x) = lim [x/h · 1/x · L(1 + h/x)] = h→0

= lim [1/x · L(1 + h/x)x/h] = lim [1/x · Le] h→0

h→0

Aplicación de los logaritmos a la derivada. Sea y =


246

MATEMÁTICAS

______________________________________________________________________________________________

f(x)g(x). Tomando logaritmos en la igualdad: Ly = Lf(x)g(x), de donde Ly = g(x) · Lf(x), derivando y’/y = g’(x) · Lf(x) + g(x) · f ’(x)/f(x), y’ = [g’(x) · Lf(x) + g(x) · f ’(x)/f(x)] · y, y finalmente y’= [g’(x) · Lf(x) + g(x) · f ’(x)/f(x)] · f(x)g(x). En general, la derivada del logaritmo neperiano de una función es el cociente entre la derivada de la función y la propia función.

Derivada de una potencia Si y = xn , se verifica que y’ = nxn-1. En general: Función exponencial:

Principales funciones y sus derivadas Función

Derivada

y = cte. (constante) y=x y=f±g±h y=f·g f y=g y = cte · f

y’ = 0 y’ = 1 y’ = f ’ ± g’ ± h’ y’ = f ’ · g + g’ · f f ’ · g – g’ · f y’ = g2 y’ = cte · f ’ y’ = n f’ n f n – 1 f’ y’ = · logae f f’ y’ = f y’ = af · ln a · f ’ y’ = f ’ · ef y’ = f g · ln f · g’ + g · f g – 1 · f ’ y’ = f ’ · cos f y’ = –f ’ · sen f f’ y’ = cos2 f f’ y’ = 1 – f 2 –f ’ y’ = 1 – f 2 f’ y’ = 1 + f2 y’ = f ’ · Ch f y’ = f ’ · Sh f f’ y’ = 1 + f 2 f ’ y’ = f 2 – 1

n

y = f

y = ex, y’ = ex y = ax, y’ = ax · La

y = logaf y = ln (f)

Derivada de funciones trigonométricas Función circular: y = sen x → y’ = cos x y = cos x → y’ = –sen x y = tg x → y’ = 1 + tg2 x = 1/cos2 x

y = af y = ef y = fg y = sen f y = cos f y = tg f y = arc sen f

Función circular inversa: y = arc sen x y’ = 1/ (1 – x2 ) y = arc cosen x y’ = –1/ (1 – x2 ) y = arc tg x y’ = 1/(1 + x2 )

y = arc cos f y = arc tg f y = Sh f y = Ch f

Derivada de una raíz n

y = u ( x ) . La raíz se deriva como una potencia, ya que: n

y = u ( x ) = [u(x)]1/n

n

y = arg Sh f y = arg Ch f

y’ = [u’(x)]/[n u ( x ) n –1 ]

Derivadas sucesivas Si la función derivada y’ = f(x) es una función derivable, se llama derivada segunda a y” = f ’(x), es decir, la derivada de la derivada. Ejemplo:

x0 E(x0 , r). A la izquierda del mínimo, la función es decreciente, y a la derecha, creciente. La función y = x2 presenta un mínimo en x0 = 0.

y = x3 , y’ = 3x2, y” = 6x. y = x2

Si cada vez se obtiene una función derivable, se puede continuar de forma análoga. y = –x2

Máximos y mínimos Una función f(x) presenta un máximo en un punto x0 cuando f(x) ≤ f(x0 ) x E(x0 , r). Entonces, la función y = –x2 presenta un máximo en x0 = 0. A la izquierda del máximo, la función es creciente, y a la derecha, decreciente. Una función f(x) presenta un mínimo en x0 si f(x) ≥ f(x0 ),

máximo

mínimo

Cálculo de máximos y mínimos Si f(x) es una función derivable dos veces, entonces f(x) presenta un máximo en x0 si f ’(x0 ) = 0 y f ”(x0 ) < 0; f(x) pre-


__________________________________________________________________________________________________

senta un mínimo en x0 si f ’(x0 ) = 0 y f ”(x0 ) > 0. La teoría de máximos y mínimos permite resolver problemas de optimización. Ejemplo. De todos los rectángulos de área 9 cm2 , ¿cuál es el de perímetro mayor? Si se llama x a uno de los lados, el otro será 9/x, y el perímetro P(x) = 2 · 9/x + 2x = 18/x + 2x. Se trata de hallar un máximo, luego se calcula la derivada P respecto de x y se iguala a cero.

247

gún punto del intervalo abierto (a, b) y además g(a) ≠ g(b), entonces existe por lo menos un punto x0 (a, b) que verifica: f(b) – f(a) f ’ (x0 ) = g(b) – g(a) g’(x0 ) Para demostrarlo se construye la función F(x) de la siguiente forma:

P’(x) = –18/x2 + 2, P’(x) = 0, –18/x2 + 2 = 0 18/x2 = 2, 2x2 = 18, x2 = 9, x = 9 = + 3 y –3 Si x = 3, 9/x = 3, luego el rectángulo de perímetro máximo es el cuadrado.

Derivadas

F(x) = [f(b) – f(a)] g(x) – [g(b) – g(a)] f(x) F(a) = F(b), que se comprueba sin más que sustituir x, primero por a y después por b. En estas condiciones, F(x) verifica el teorema de Rolle, luego: x0 (a, b) tal que F’ (x0 ) = 0, y por tanto, F’(x0 ) = [f(b) – f(a)] g’ (x0 ) – [g(b) – g(a)] f’(x0 ) = 0

Teoremas de Rolle, de Cauchy y del valor medio

Como g(b) ≠ g(a) y f ’ y g’ no se anulan simultáneamente, entonces:

Teorema de Rolle Sea f(x) una función continua en un intervalo cerrado [a, b] y derivable en el intervalo abierto (a, b), y que verifica que f(a) = f(b); entonces existe al menos un punto x0 (a, b) tal que f’(x0 ) = 0

f(b) – f(a) f ’ (x0 ) = g(b) – g(a) g’(x0 )

Teorema del valor medio

f (a)

f (b)

a

x0

x'0

Este teorema se conoce también con el nombre de teorema de los incrementos finitos o de Lagrange. Si f(x) es una función continua en [a, b] y derivable en (a, b), entonces existe por lo menos un punto x0 (a, b) que verifica: f(b) – f(a) = f ’(x0 ) (b – a)

b

teorema de Rolle

Si f es una función constante f ’(x) = 0, x (a, b). Si f no fuese constante y f ’(x) ≠ 0, x (a, b), al ser f continua en [a, b] alcanza en algún punto su máximo, M, o su mínimo, M’, pero estos puntos no pertenecen a (a, b), pues se ha partido de que f ’(x) ≠ 0, en (a, b); luego f tiene que alcanzar el máximo y el mínimo en a o b, y como f(a) = f(b), tendrá que ser M = M’ y f constante contra la hipótesis de partida. Por tanto, existirá x0 (a, b); f ’(x0 ) = 0. Geométricamente, el teorema de Rolle indica que, en algún punto del intervalo, la tangente a la curva es horizontal.

Este teorema es un caso particular del teorema de Cauchy cuando la función g(x) = x. La función F(x) sería entonces: F(x) = [f(b) – f(a)] x – [b – a] f(x) que cumple las condiciones del teorema de Rolle, luego tenemos: ∃ x0 (a, b); F’(x0 ) = [f(b) – f(a)] – (b – a) f ’(x0 ) = 0, de donde

Teorema de Cauchy Si f y g son dos funciones continuas en el intervalo cerrado [a, b] y derivables en el intervalo abierto (a, b), verificando que f ’ y g’ no se anulan simultáneamente en nin-

f(b) – f(a) = f ’(x0 ) b–a Este teorema indica, para una función con las hipótesis


248

MATEMÁTICAS

______________________________________________________________________________________________

iniciales, que existe un punto x0 (a, b) en el que la tangente a la curva es paralela a la recta que pasa por [a, f(a)], [b, f(b)]:

ces f(x) se puede aproximar de forma única por el siguiente polinomio: f(x) = f(a) + f ’(a) (x – a) +

f ”(a) fn(a) (x – a)n (x – a)2 +…+ 2! n!

Esta expresión recibe la denominación de polinomio de Taylor. Cuando a = 0, el polinomio obtenido recibe el nombre de McLaurin:

f (b)

f (a)

f(x) = f(0) + f ’(0) x + a x0

b

teorema del valor medio

Regla de l’Hôpital. Una aplicación del teorema de Cauchy al cálculo de límites de sucesiones, fundamentalmente para resolver indeterminaciones de la forma 0/0, es la llamada regla de l’Hôpital. Si f(x) y g(x) son dos funciones que cumplen las condiciones del teorema de Cauchy, y además existe x0 (a, b) tal que

f ”(0) 2 f n(0) n x x +…+ 2! n!

Si en vez de calcular la aproximación polinómica de la función en el punto a se hace en un punto x próximo al a, se comete un error que sería la diferencia entre el valor de la función y el valor del polinomio. A este error se le llama resto de orden n de x. Rn (x) = f(x) – P(x), en virtud de lo cual la fórmula de Taylor queda de la siguiente forma: f(x) = f(x) + f ’(x)(x–a) + +

f(x0 ) = g(x0 ) = 0, entonces lim [f(x)/g(x)] = x → x0

f ”(x) (x – a)2 + … + 2!

f n(x) (x – a)n + Rn (x) n!

= lim [f ’(x0 )/g’(x0 )] cuando existen ambos límites x → x0

Formas de determinar el resto del desarrollo del teorema de Taylor

Ejemplo: lim [(ex – 1)/x2] = (e0 – 1)/02 = (1 – 1)/0 = 0/0

x→0

Aplicando la regla de l’Hôpital: lim [(ex – 1)/x2] = lim (ex /2x) = e0 /0 = 1/0 =

x→0

x→0

Mediante transformaciones convenientes, las indeterminaciones / , 0 . y – se transforman en otras de la forma 0/0 y por tanto se les puede aplicar la regla de l’Hôpital. Las indeterminaciones de la forma 10 , 00 y 0 se transforman aplicando logaritmos.

Teorema de Taylor Las funciones más conocidas y sencillas son las llamadas polinómicas. Muchas funciones se pueden aproximar mediante funciones polinómicas con un margen de error muy pequeño que, además, se puede acotar. El teorema de Taylor es un medio de calcular estas aproximaciones. Sea f(x) derivable hasta el orden n en un punto a; enton-

Resto de Lagrange. Si f es derivable n + 1 veces, existe x0 (a, x), que verifica: Rn(x) =

f (n+1)(x0 ) (x – a)n+1 (n + 1)!

Resto de Cauchy. Si f es derivable n + 1 veces, entonces x0 (a, x), que verifica:

Tn(x) =

f (n+1)(x0 ) (x – x0 ) n (x – a) n!

El desarrollo de la función ex se realiza mediante la fórmula de McLaurin con resto de Taylor: x2 x3 xn ex0 ex = 1 + x + –– + –– + … + –– + –––––– · xn + 1 2! 3! n! (n + 1)! siendo 0 < x0 < x.

Aplicaciones de la fórmula de Taylor


__________________________________________________________________________________________________

Las aplicaciones de las distintas formas del desarrollo de una función en polinomio de Taylor son variadas y están condicionadas por el hecho de que el margen de error sea mínimo al calcular el resto. Algunas de estas aplicaciones son: Cálculo de valores numéricos de diferentes funciones. El valor de e0,1 aproximado por un polinomio de grado 3 será: e x = 1 + x + x2 /2! + x3 /3! + R4 e 0,1 = 1 + 0,1 + 0,12 /2 + 0,13 /6 + R4 = 1,10516 + R4 R 4 = [ex0 (0,1)4 ]/4! = 0 < x0 < 0,1 y como e0,1 < 1, 2, el error es R4 < 0,000005 Aplicación a la representación gráfica de funciones. El estudio de la concavidad o convexidad de una función en sus diferentes puntos se realiza respecto a la recta tangente a la función en cada uno de ellos. Si la tangente queda por encima de la función, ésta es convexa respecto al eje x, y si queda por debajo respecto al mismo eje, es cóncava. La diferencia entre la ordenada de la tangente y la ordenada de la función en un entorno del punto es positiva en el primer caso, y en el segundo, negativa. Si se aproxima la función f(x) mediante polinomio de Taylor de primer grado en un punto x0, se tiene que:

Derivadas

249

En el caso de máximos y mínimos se efectuaría un estudio análogo. Como (x – x0)n es positivo cuando n es par, el signo viene determinado por el de f n (x0), y, por tanto, si f ’(x0) = 0, n es par. Si f n (x0) < 0, existe un máximo y si f n (x0) > 0 existe un mínimo. Ejemplo. Hallar máximos y mínimos de la función: y = x5 /5 – 13x3 /3 + 36x + 3 y’ = x4 – 13x2 + 36, y’ = 0, x4 – 13x2 + 36 = 0, de donde x1 = = 2, x2 = –2, x3 = –3, x4 = 3 Se calcula la derivada segunda y” = 4x3 – 26x. Si x = 2y” = 4 · 8 – 26 · 2 = 32 – 52 = – 20 < 0, en x = 2 existe un máximo. Si x = –2, y” = 4 (–2)3 – 26 (–2) = –32 + 52 = 20 > 0, en x = –2 existe un mínimo. Si x = 3, y” = 4(3)3 – 26(3) = 108 – 78 = 30 > 0, en x = 3, un mínimo. x = –3, y” = 4 (–3)3 – 26 (–3) = –108 + 78 = –30 > 0, en x = –3, un máximo. Haciendo f”(x) = 0 4x3 – 26x = 0, x(4x2 – 26) = 0 13 / 2 y x = – 13 / 2 x = 0, 4x2 – 26 = 0, x2 = + 13/2, x = + Los puntos de abscisa x = 0, x = + 1 3 / 2 , x = – 1 3 / 2 son puntos de inflexión, pues, si f’’’(x) = 12 x2 – 26, se verifica f ’’’(0) = –26 ≠ 0, f ’’’( 1 3 / 2 ) = 12 ( 1 3 / 2 )2 – 26 =

f(x) = f(x0) + f ’(x0) (x – x0) + R1 luego R 1 = f(x) – f(x0) + f ’(x0) (x – x0), que es la diferencia entre la función y la ordenada de la recta tangente a la función en el punto x0. Como R1 = [f ”(x0)/2!] (x – x0) 2 , el signo de R1 viene dado por el de la derivada segunda en el punto, f”(x0). Si f ”(x0) > 0 → R1 > 0 y la gráfica se conserva por encima de la tangente, luego es cóncava. Si f ”(x0) < 0 → R1 < 0 y la gráfica se conserva por debajo de la tangente, es convexa. Si f ”(x0) = 0 es necesario tomar el polinomio de Taylor de grado dos. El resto será R2 = [f 3 (x0)/3!](x – x0)3 si f 3 (x0) ≠ 0, la tangente atraviesa la curva, siendo convexa a un lado y cóncava al otro. Por tanto, en x0 existe un punto de inflexión. Si f 3 (x0) = 0, se toma el polinomio de Taylor de grado superior, repitiéndose el proceso cuantas veces fuese necesario.

_ Preguntas de repaso 1. Calcular las derivadas de las siguientes funciones: a) y = sen x3

b) y = xx

c) y = sen x/ecos x

2. Dada la función y = x2 – 5x + 6, hallar el punto en que la tangente a dicha función es paralela a la cuerda que pasa por los puntos (0, 6), (2, 0). 3. Calcular, aplicando la definición, la derivada de la función y = x3 + 3, en x = 1. 4. Desarrollar, aplicando la fórmula de McLaurin, la siguiente función: y = sen x.


Y f a e

A

b B

f (x)

INTEGRALES

c

O

d

Integral indefinida Función primitiva Dada una función f(x), se llama función primitiva de f(x) a otra función F(x), si existe, que verifica que F’(x) = f(x). La función F(x) = x4 /4 es una primitiva de f(x) = x3 . Si F(x) es una primitiva de f(x), entonces F(x) + C, donde C es una constante, también lo es, ya que [F(x) + C]’ = f(x), pues la derivada de C es cero. Conocida la función primitiva de f(x), calcular todas las demás es fácil. Al conjunto de todas las primitivas de una función f(x), que se representa por f(x) dx, se le llama integral indefinida de dicha función: f(x) dx = F(x) + C Al signo se le llama signo de integración, y a f(x), integrando.

Propiedades básicas de la integración Las propiedades básicas de la integración son: a) Al calcular la primitiva de una función se obtienen infinitas funciones que se diferencian entre sí en una constante: f ’(x) dx = f(x) + C b) La integral del producto de una constante por una función es igual a la constante por la integral de la función: Kf(x) dx = K f(x) dx c) La integral de la suma (o resta) es la suma (o resta) de las integrales: [f(x) ± g(x)] dx = f(x) dx ± g(x) dx

h a

x c x+ h

X

Integrales indefinidas Dado un diferencial, el cálculo de una integral indefinida consiste en obtener la función primitiva de donde proviene.

Obtención de integrales indefinidas Integral

Función primitiva

xn · dx

xn + 1 n + 1 + C, siendo n ≠ –1 ab · x b · ln(a) + C, siendo a > 0 y a ≠ 1

ab · x · dx dx x sen x · dx cos x · dx tg x · dx ex · dx 1 · dx 1 – x 2 1 · dx 1 + x2 Sh x · dx Ch x · dx Th x · dx dx Ch2x cotg x · dx sec x · dx cosec x · dx

ln(x) + C –cos x + C sen x + C –ln(cos x) + C ex + C arc sen x + C arc tg x + C Ch x + C Sh x + C ln Ch x + C Th x + C ln|sen x| + C x π ln tg 2 + 4 x ln tg 2 + C

| ( )| | |

+C

Métodos generales de integración Integración por descomposición Se basa en las propiedades 1 y 2 de la integración Así, por ejemplo:

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________________________

(3x2 + 7x – 3)dx = 3x2 dx + 7x dx – 2 dx = = 3 x2 dx + 7 x dx – 2dx = x3 + 7x2 /2 + C = = x3 – 7x2 /2 – 2x + C

Integración por sustitución En ocasiones, determinadas integrales se transforman, mediante un cambio de variable adecuado, en integrales inmediatas. A este método se le conoce con el nombre de método de sustitución. La dificultad estriba en encontrar el cambio adecuado que se ha de realizar. Después de calcular la integral es necesario deshacer el cambio. Por ejemplo, en: 2x ex2 dx, el cambio que se hace es z = x2 de donde:

Integrales

251

I = ex sen x dx = sen x ex – ex cos x dx = u = sen x, du = cos x dx dv = ex dx, v = ex Se vuelve a aplicar el método por partes a esta última integral: u = cos x, du = –sen x dx dv = ex dx, dv = ex Luego I = sen x ex – [cos x ex – ex (–sen x) dx] = = sen x ex – cos x ex – ex sen x dx. Pasando al primer miembro de la igualdad este último sumando integral, se tiene: 2 ex sen x dx = ex (sen x – cos x) luego, despejando y añadiendo la constante queda:

dz = 2x dx, dx = dz/2x Sustituyendo, se obtiene: 2x ex2 dx = 2x ez dz/2x = ez dz = ez + C = ex2 + C

Integración por partes Mediante la fórmula por la que se obtiene la derivada de un producto:

e x sen x dx = ex /2(sen x – cos x) + C

Integración de funciones racionales Las integrales de funciones racionales son de la forma P(x)/Q(x) dx, donde P(x) y Q(x) son polinomios con coeficientes reales. Se pueden presentar dos casos: a) grad P(x) ≥ grad Q(x). b) grad P(x) ≤ grad Q(x).

[u(x) · v(x)]’ = u’(x) · v(x) + u(x) · v’(x) se despeja u(x) · v’(x) y queda u(x) · v’(x) = [u(x) · v(x)]’ – u(x) · v’(x)

El primer caso se reduce al segundo efectuando una división: P(x) = Q(x) · C(x) + R(x) y dividiendo por Q(x) P(x)/Q(x) = C(x) + R(x)/Q(x)

Integrando los dos miembros de la igualdad: u(x) · v’(x) dx = [u(x) · v(x)]’ dx – u’(x) · v(x) dx, y finalmente: u(x) · v(x)’ dx = u(x) · v(x) – u’(x) · v(x) dx

el grado de R(x) es menor que el grado de Q(x). Para resolver este tipo de integrales, es necesario conocer las raíces del polinomio Q(x). Para descomponer la fracción en suma de fracciones se distinguen los siguientes casos:

u dv = u · v – v du

a) Todas las raíces del denominador son reales y no se repite ninguna. Si x1 , x2 , x3 , ...., xn son las raíces reales simples de Q(x), la fracción admite la siguiente descomposición:

Así, para el cálculo de x ex dx, se llama u = x y dv = ex dx, de donde du = dx y v = ex . Aplicando la fórmula:

P(x)/Q(x) = A1 /(x – x1 ) + A2 /(x – x2 ) + A3 /(x – x3 ) + ... + + An /(x – xn )

x ex dx = x ex – ex dx = x ex – ex + C = x(ex – 1) + C

Siendo la integral de cada uno de los sumandos una integral logarítmica. Por ejemplo:

que generalmente se expresa:

Algunas veces es necesario repetir el método de integración por partes en una misma integral. El llamado método de reducción no es, por tanto, sino una repetición sucesiva del método por partes en las que los exponentes se reducen cada vez en una unidad. Por ejemplo:

C B A 3x2 – 2 dx = –––– dx + –––– dx + –––– dx ––––––––––––– 3 x – 3x2 – 4x +12 x–2 x+2 x–3 pues x3 – 3x2 – 4x + 12 = (x – 2)(x + 2)(x – 3)


252

MATEMÁTICAS

______________________________________________________________________________________________

Es necesario calcular A, B, y C. 3x 2 – 2 –––––––––––––– x3 – 3x2 – 4x + 12

A = ––––– (x – 2)

B C + ––––– + ––––– = (x + 2) (x – 3)

A(x + 2)(x – 3) + B(x – 2)(x – 3) + C(x – 2) (x + 2) = –––––––––––––––––––––––––––––––––––––––––– = (x – 2)(x + 2)(x – 3)

––-[–––––|–––––|–––––|––––––––––––––]— a = x0 x1 x2 x3 … xn = b La longitud de cada uno de estos intervalos es xi – xi – 1 = (b – a)/n, i = 0, 1, 2, ..., n. Se llama mi al mínimo de la función f(x) en cada uno de los intervalos y Mi al máximo:

(A + B + C)x2 + (–A – 5B)x + (–6A + 6B – 4C) = –––––––––––––––––––––––––––––––––––––– (x – 2)(x + 2)(x – 3)

y = f(x)

A+B+C=3 –A – 5B = 0 –6A + 6B – 4C = –2

Resolviendo el sistema: A = –5/2, B = 1/2, C = 5

Luego: 3x – 2 5/2 1/2 5 dx = ––––– dx + ––––– dx + ––––– dx = x–––––––––––––– – 3x – 4x + 12 (x – 2) (x + 2) (x – 3) 2

3

2

dx dx dx = –5/2 ––––– dx + 1/2 –––––– + 5 ––––– = (x – 2) (x + 2) (x – 3) = –5/2 L|x – 2| + 1/2 L|x + 2| + 5 L|x – 3| + C b) El denominador tiene raíces múltiples. Si, por ejemplo, la primera raíz x1 es triple, la descomposición de P(x)/Q(x) sería: 2

3

A 1 ’/(x – x1 ) + A1 ”/(x – x1 ) + A1 ’’’/(x – x1 ) + + A2 /(x – x2 ) + … + An /(x – xn ) Para calcular las constantes A1 ’, A1 ”, A1 ’’’, se procede del mismo modo que en el caso anterior. c) Si en el denominador aparecen raíces imaginarias, es decir, aparece un polinomio de segundo grado irreducible, la descomposición de la fracción es: P(x)/Q(x) = A1 /(x – x1 ) + A2 /(x – x2 ) + … + + An – 2/(x – xn – 2) + (Mx + N)/(ax2 + bx + c) En el caso de raíces imaginarias múltiples, uno de los sumandos es de la forma (Mx + N)/(ax2 + bx + c)2 . La integral de este sumando se resuelve mediante el método de reducción.

Integral definida La integral definida surge como solución al cálculo del área de un rectángulo especial en el que uno de sus lados es una función cuya gráfica es curva. Sea y = f(x) una función continua definida en un intervalo cerrado [a, b]. Se llama división del intervalo a una subdivisión del mismo en intervalos iguales más pequeños, definidos por los puntos a = x0 , x1 , ..., xn = b:

Mi

mi

Los denominadores son iguales; por tanto, los numeradores también y, por la igualdad de polinomios, se tiene:

a x 1 x2

b

La superficie limitada por la función y = f(x), las rectas x = a y x = b y el eje x estará comprendida entre la suma de las áreas de todos los rectángulos de área (xi – xi – 1) mi y las de los rectángulos de área (x i – x i – 1) M i , es decir, (x1 – x0 ) m1 + (x2 – x1 ) m2 + ... + (xn – xn – 1) mn ≤ S ≤ (x1 – x0 ) M1 + (x2 – x1 ) M2 + ... + (xn – xn – 1) Mn . La suma en que las alturas de los rectángulos son los mínimos (mi) de la función se llama suma inferior de Riemann, (sn ), y cuando son máximos (Mi ), se llama suma superior de Riemann (Sn ): n

sn = ∑ (xi – xi – 1) mi i=1 n

Sn = ∑ (xi – xi – 1) Mi i=1

Se verifica que cualquier suma inferior es menor que cualquier suma superior, y que para una división de [a, b] en m intervalos más pequeños, n < m, es: sn ≤ sm ≤ Sm ≤ Sn Además, por ser f(x) continua lim (Sn – sn ) = 0 n →

En estas condiciones, se llama integral definida de la función f(x) en un intervalo [a, b] al límite de las sucesiones s n y S n , que existe, pues ambas son monótonas y acotadas y que, además, es el mismo para sn y S n . La integral definida se representa por ab f(x) dx. A a y b se les llama límites de integración: a b f(x) dx = lim sn = lim Sn n →

n →

Como para cualquier punto interior del intervalo x’i , se verifica que, con mi ≤ f(x’i ) ≤ Mi , se puede escribir: a b f(x) dx = lim , n →

n

∑ (xi – xi – 1) f(x’i )

i=1

Propiedades de la integral definida Es posible describir las propiedades de las integrales definidas en forma simbólica del modo siguiente:


__________________________________________________________________________________________________

F(a) + C= 0, de donde C = – F(a), → a x f(x)dx = F(x) – F(a)

b) a b [f(x) ± g(x)] dx = a b f(x) dx ± a b g(x) dx

tomando x = b a b f(x) dx → a x F(b) – F(a). El resultado F(b) – F(a) se representa como [F(x)]a b. Ejemplo:

c) a b Kf(x) dx = K a b f(x) dx d) Si c [a, b]; y a < c < b, entonces a b f(x) dx = a c f(x) dx + c b f(x) dx

1 3 x2 dx = [x3 /3]1 3 = 33 /3 – 13 /3 = 9 – 1/3 = 26/3

e) a b f(x) dx = – ba f(x) dx f) | a b f(x) dx|≤ a b| f(x) dx g) Si m y M son el mínimo y el máximo, respectivamente, de la función f en [a, b], entonces se verifica que existe x’ (a, b) tal que a b f(x) dx = (b – a) f(x’). Se tiene que m ≤ f(x) ≤ M, x (a, b), luego a b m dx ≤ a b f(x) dx ≤ a b M dx, pero a b m dx = m (b – a) y a b M dx = M (b – a), luego m (b – a) ≤ a b f(x) dx ≤ M (b – a), de donde m ≤ ( a b f(x) dx)/(b – a) ≤ M, y por ser f continua, existe x’, con m ≤ f(x’) ≤ M, tal que [ a b f(x) dx]/(b – a) = f(x’), luego a b f(x) dx = (b –a) f(x’), x’ (a · b).

Si al calcular una integral definida para obtener la función primitiva se aplica el método del cambio de variable, habría que volver a calcular la variable original. Sin embargo, esto no es necesario, pues el cambio de variable se puede aplicar también a los límites de integración. Si se desea calcular el área limitada por dos curvas f(x) y g(x) en [a, b], siendo g(x) ≥ 0 y f(x) ≥ g(x), x [a, b]: S = a b [f(x) – g (x)] dx f(x) g(x) S

A esta propiedad se la conoce con el nombre de teorema del valor medio del cálculo integral.

a

Volumen de un cuerpo de revolución

Se define la función F(x) de la siguiente forma: F(x) = a x f(x) dx

Al girar una curva alrededor del eje x genera un volumen que se puede calcular mediante la fórmula:

Siendo f continua, entonces se verifica que F’(x) = f(x): lim F(x + h) – F(x) lim = h+0 h+0 h

ax+h

f(x)dx – h

b

Aplicaciones de la integral definida

Teorema fundamental del cálculo integral

=

253

y como a a f(x) dx = 0, se verifica:

a) a b f(x) dx = 0

F’(x) =

Integrales

ax

f(x)dx

V = π a b [f(x)]2dx

=

y = f(x)

lim xx+h f(x) dx lim (x + h – x) f(x’) = f(x’) = h+0 h+0 h h

Regla de Barrow La regla de Barrow permite calcular integrales definidas conociendo una primitiva de la función, cuando ésta exista. Si F(x) es una primitiva de f(x) en [a, b], entonces: a b f(x) dx = F(b) – F(a) Al ser F(x) una primitiva, también lo es F(x) + C. Luego:

a

b

Longitud de un arco de curva La longitud del arco de curva de la función y = f(x) entre los puntos de abscisas a y b se obtiene con la fórmula: L = a b 1 + ( y ’ ) 2 dx l

a x f(x) dx = F(x) + C haciendo x = a, se tiene: a a f(x) dx = F(a) + C

a

b


254

MATEMÁTICAS

______________________________________________________________________________________________

Área de la superficie de revolución El área de la superficie de revolución generada por el arco de la curva y = f(x) al girar sobre el eje x se halla mediante la fórmula: S = 2π a b y 1 + ( y ’ ) 2 dx

Se resuelve el sistema formado por ambas curvas: y=x y = x3

3

xx =–xx = 0 3

x(x2 – 1) = 0, luego x = 0 x 2 – 1 = 0, luego x = + 1 y x = –1

Ejemplos: Calcular el área limitada por la curva y = 1/x y las rectas x = 1 y x = 4. Área = 1 4 1/x dx = [ln x]1 4 = ln 4 – ln 1 = ln 4

y = 1/x 1

4

El volumen generado por dicha curva al girar sobre el eje x es: v = π 1 4 (1/x)2 dx = π 1 4 dx/x2 = [–1/x]1 4 = = π [–1/4 – (–1/1)] = 3π/4

–1

S1 1

Para calcular la superficie, basta determinar la que existe en el primer cuadrante, S1, y multiplicar por 2, ya que las dos partes son iguales: S 1 = 0 1 (x – x3 ) dx = [x2 /2 – x4 /4] 10 = = (1/2 – 1/4) – 0 = 1/4 luego S = 2S1 = 2 · 1/4 = 1/2

_ Preguntas de repaso 1. Integrar las siguientes funciones: a) tg x dx. b) x2 sen x dx. c) [3/(x2 – 5x + 6)] dx.

1 4

2. Hallar la superficie de la circunferencia x2 + y2 = 1. 3. Hallar la superficie limitada por la curva y = 1/x e y = x2 , entre los puntos de abscisas x = 1/2 y x = 5. 4. Hallar el volumen de la esfera engendrada al girar la circunferencia, x2 + y2 = 1, sobre el eje x.

Hallar el área limitada por las curvas y = x e y = x3 .


f a e

c A

b B

Y

ECUACIONES DIFERENCIALES

d

Introducción Las ecuaciones diferenciales son funciones de la forma F(x, y, y’, y”, ..., yn ) = 0, donde x es la variable independiente, y es la variable dependiente e y’, y”, ... yn , las derivadas sucesivas de y. A n se le denomina orden de la ecuación diferencial, o derivada de orden mayor que figura en la ecuación diferencial. Solución de una ecuación diferencial es una función y = f(x) y sus derivadas tales que, al sustituir en la ecuación a la función y sus derivadas, la transforma en una identidad. Resolver una ecuación es encontrar su solución general. Todas las soluciones de una ecuación diferencial son de la forma f(x, y, C) = 0, donde C es una constante arbitraria. El conjunto f(x, y, C) = 0 se denomina haz de curvas planas; por cada punto del plano pasa una sola curva de la familia f(x, y, C). Una familia de curvas planas se transforma por derivadas sucesivas en una ecuación diferencial. Se deriva hasta eliminar C. Si se tiene la familia de curvas x2 + y2 = C, se trata de circunferencias concéntricas en el origen, y radio C. Derivando se tiene 2x + 2yy’ = 0, que es una ecuación diferencial de primer orden.

f (x)

O

h a

x c x+ h

X

Ecuaciones diferenciales de variables separadas Estas ecuaciones tienen la forma P1 (x) dx = P2 (y) dy, donde P1 (x) y P2 (y) son dos polinomios en cada una de las variables, respectivamente. La ecuación x · y’ + y = 0 es una ecuación diferencial de variables separadas, pues x · dy/dx = –y; dx/x = –dy/y. Las soluciones de estas ecuaciones se obtienen integrando ambos miembros de la igualdad: P1 (x) dx = P2 (y) dy

Ecuaciones diferenciales homogéneas de primer orden En general, una función F (x, y) es homogénea de grado n si F(tx, ty) = tn · F(x, y). La función F(x, y) = x2 – y2 es homogénea de grado dos, pues F(tx, ty) = (tx)2 – (ty)2 = t2 (x2 – y2 ) = t2 F(x, y). En particular, una ecuación diferencial y’ = f(x, y) es homogénea si la función f(x, y) es homogénea de grado cero: f(tx, ty) = tº f(x, y)

Aplicaciones de las ecuaciones diferenciales Las ecuaciones diferenciales tienen numerosas aplicaciones en las distintas ramas de la ciencia. Por ejemplo, si x = x(t) es la función que relaciona el espacio con el tiempo, la definición de F = m · a se expresa como F = m dx2 /df 2 o por F = m x”, que es una ecuación diferencial.

Ecuación diferencial de primer orden

Las ecuaciones homogéneas pueden escribirse de la forma y’ = dy/dx g(y/x) y, haciendo el cambio de variable, y = v · x se transforman en ecuaciones de variables separadas. Son ecuaciones diferenciales homogéneas de primer orden las que presentan la forma y’ + f(x) · y = 0. Se sustituye y’ por dy/dx; dy/dx = – f(x) · y. Separando las variables dy/y = –f(x) · dx e integrando después los dos miembros, dy/y = – f(x) dx, de donde: ln y + ln C = – f(x) dx, ln y · C = – f(x) dx, e y · C = e– f(x) dx

Las ecuaciones diferenciales de primer orden son de la forma F (x, y, y’) = 0, y su solución general es de la forma y = f(x, C). Se resuelven fácilmente cuando se pueden separar las variables.

Haciendo C = 1/K, queda finalmente y = K · e– f(x) dx. Si la ecuación diferencial es y’ + (x – 2) y = 0, la solución es y = K · e– (x-2) dx = K · ex2/2 + 2x.

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


256

MATEMÁTICAS

______________________________________________________________________________________________

Ecuaciones lineales de primer orden

Para hallar una solución particular de la ecuación lineal completa, se hace K = K(x):

Son lineales aquellas ecuaciones en que las variables no aparecen multiplicadas entre sí ni elevadas a exponentes mayores que 1. Son ecuaciones diferenciales que presentan la forma: P(x) · y’ + Q(x) · y + R(x) = 0 O también y’ + f(x) · y = g(x) Se llama ecuación homogénea asociada a la ecuación lineal de primer orden a la ecuación y’ + f(x) · y = 0. La solución de la ecuación se obtiene sumando a la solución general de la ecuación homogénea asociada una solución particular de la ecuación lineal. Para ello, se procede del siguiente modo: a) Se calcula la solución general de la homogénea, que será: y = K · e– f(x) dx b) Para hallar la solución particular de la ecuación lineal completa, se supone que la constante K es una función de x, K(x), y se le hace cumplir la ecuación: y = K(x) · e– f(x) dx

y=

K(x) x

y’ = k’(x) · x2– K(x) = K’(x) – K(x) x x x2 Se sustituye en la ecuación x · y’ + y = x sen x: K’(x) x · K’(x) ____ K(x) x _____ – _______ + = x sen x x x2 x Simplificando queda K’(x) = x sen x, que integrando K’(x) = x sen x: –x cos x + sen x K(x) = –x cos x + sen x y, por tanto, y = ––––––––––––– x La solución general es: k1 –x cos x + sen x –x cos x + sen x + k ____________ y = __ = _______________ x + x x solución general de la homogénea

solución particular de la completa

solución general de la completa

Derivando: y’ = K’(x) · e– f(x) dx – K(x) · f(x) e– f(x) dx y sustituyendo en la ecuación y’ + f(x) · y = g(x): K’(x) · e– f(x) dx – K(x) · f(x) · e – f(x) dx + f(x) · K(x) · e– f(x) dx = g(x)

Ecuaciones diferenciales totales Se distinguen dos casos posibles: ecuaciones diferenciales totales exactas y ecuaciones diferenciales reducibles a exactas.

Ecuaciones diferenciales totales exactas Simplificando, queda: K’(x) · e– f(x) dx = g(x) de donde K’(x) =

g(x) y K’(x) = g(x) · e+ f(x) dx, e– f(x) dx

integrando K(x) = g(x) · e+ f(x) dx dx, luego: y = [ g(x) · e+ f(x) dx dx + K1 ] · e– f(x) dx. Este resultado sería la solución particular de la ecuación lineal completa. La solución general es: y = K · e– f(x) dx + [g(x) · e+ f(x) dx dx + K1 ] · e– f(x) dx Para hallar la solución general de la ecuación lineal de primer orden, xy’ + y = x sen x, se calcula primero la solución general de la ecuación homogénea asociada: x · y’ + y = 0; y’ + 1/x · y = 0; dy/dx = –y/x; dy/y = –dx/x; ln y = –ln x + ln K, ln y = ln K/x; y = K/x

La ecuación diferencial de forma P(x, y) dx + Q(x, y) dx = 0 es exacta si existe una función U(x, y) que verifica que dU (x, y) = P(x, y) dx + Q(x, y) dx = 0. La condición necesaria y suficiente para que P(x, y) dx + Q(x, y) dx = 0 sea exacta es que se verifique la igualdad de las derivadas parciales cruzadas: αP αQ = αy αx siendo α el símbolo de la derivada parcial. Además, en este caso, la solución de la ecuación es U(x, y) = C, siendo:

αU αU αU αU dU(x, y) = ___ dx + ___ dy, P = ___ y Q = ___ αx αx αx αy Para hallar esta solución, se integran los dos miembros de la ecuación respecto de una variable, suponiendo la otra constante: P(x, y) dx + C(y) = U(x, y)


________________________________________________________________________________________

Siendo α (y) una función desconocida que hay que calcular, derivando respecto a y, se tiene: α P(x, y)dx + C’(y) = Q(x, y) αy

Ecuaciones diferenciales

257

αU = Q, despejando ϕ’(y) = 3y 2 e integrando ya que, ––– αy ϕ(y) = y3 + C, finalmente se obtiene la función: U(x, y) = x4 /4 – (5/2) x2 y 2 + x2 y + yx + y3 + C

y despejando:

solución de la ecuación inicial. C’(y) = Q(x) – α P(x, y)dx 2y

Ecuaciones diferenciales reducibles a exactas Son aquellas de la forma P(x, y) dx + Q(x, y)dy = 0, en las que:

al integrar esta función se obtiene: C’(y) = Q(x, y) – α P(x, y)dx dy 2y

αP αQ ≠ αy αx

Si se deriva con respecto a x, se obtiene el segundo miembro:

y que, sin embargo, multiplicando la ecuación por una función λ (x, y) se transforman en exactas; a λ (x, y) se le denomina factor integrando y se verifica:

[

]

αQ α α αQ α α ––– – –– –– P(x, y)dx = ––– – –– –– P(x, y)dx · αx αx αy αx αy αx

[

]

[

]

αQ αP · ––– – ––– = 0 αx αy y U(x, y) = P(x, y)dx + Q(x, y) – α P(x, y)dx dy = C 2y

[

]

En la práctica se elige P o Q, según sean más sencillas. Ejemplo. La ecuación diferencial:

α(λ, P) = α(λQ) αy αx La solución de la ecuación diferencial es la misma que la solución de la ecuación multiplicada por el factor integrante.

Ecuaciones diferenciales de segundo orden reducibles a primer orden

(x3 – 5xy2 + 2xy + y) (dx + x2 – 5x2 y + 3y2 + x)dy = 0 Las ecuaciones diferenciales de segundo orden son aquellas de la forma:

Siendo: P = x3 – 5xy2 + 2xy + y · y Q = x – 5x2 y + 2xy2 + x es exacta, ya que αP = –10xy + 2x + 1 αy y αQ = 2x – 10xy + 1 αx 2

de donde:

αP αQ = αy αx

Integrando respecto a x se obtiene: (x3 – 5xy2 + 2xy + y)dx + ϕ(y) = U(x, y) de donde: x4 – 5y2x2 + x2y + y · x + ϕ(y) = U(x) 4 2 y derivando respecto a y: –5x2y + x2 + x + ϕ’(y) = αU = x2 – 5x2y + 3y2 + x αy

F(x, y, y’, y”) = 0 En determinados casos, estas ecuaciones pueden disminuirse de grado, quedando reducidas a ecuaciones de primer orden: a) Ecuación en la que falta y; F(x, y, y’, y”) = 0. Se hace el cambio y’ = u; y” = u’ y se obtendría una ecuación de primer orden: F(x, u, u’) = 0. b) Ecuaciones en las que falta x. Son de la forma F(y, y’, y”) = 0. El cambio es y’ = u, y” = y’ du/dy = u du/dy; la ecuación que resulta, F(y, u, udu/dy) = 0, es de primer orden. c) Ecuaciones en las que no están presentes ni x ni y. Son de la forma F(y’, y”). El cambio y’ = u, y” = du/dx las transforma en ecuaciones de primer orden: F(u, du/dx) = 0 d) Ecuaciones en las que no están presentes ni x ni y’. El cambio y’ = u, y” = u du/dy las transforma en ecuaciones de primer orden: F(u, du/dy) = 0


258

MATEMÁTICAS

______________________________________________________________________________________________

La ecuación y” + y = 0 es del tipo 4.º, en las que no existen ni x ni y’; si se hace el cambio y’ = u, y” = u du/dy, la ecuación queda u du/dy + y = 0, que es una ecuación de primer orden. Separando las variables u du = –y dy e integrando des y ,2 y como pués u2 /2 = –y2 /2 + C1 u 2 = C2 – y2 , u = C 2 – 2 y , que es una ecuación de vau = dy/dx, dy/dx = C 2 – 2 y , = dx, integrando queda: riables separables dy/ C 2 – C2 = sen(x, C3 ), luego arc sen y/ C2 = +C3 , de donde y/ y = C2 sen (x + C3 ).

Ecuaciones diferenciales homogéneas de segundo orden Las ecuaciones homogéneas de segundo orden con coeficientes constantes son de la forma y” + ay’ + by = 0. La solución general de esta ecuación depende de dos constantes arbitrarias. Se demuestra que si y1 e y2 son dos soluciones de la ecuación, cualquier combinación lineal de ellas también lo es, es decir, z = C1 y1 + C2 y 2 es solución de la ecuación. En efecto, calculando z’ y z” y sustituyendo se tiene: (C1 y 1 ” + C2 y2 ”) + a(C1 y’1 + C2 y 2 ’) + b (C1 y 1 + C2 y 2 ) = C1 (y1 ” + ay1 ’ + by) + C2 (y2 ” + ay1 ’ + by) = C1 · 0 + C2 · 0 = 0. Cualquier solución de esta ecuación homogénea es de la forma y = erx, donde r es una constante; luego y’= rerx, y” = r2 · erx. Sustituyendo en la ecuación r2 e x + arerx + berx = erx(r2 + ar + b) = 0, como erx ≠ 0, necesariamente r2 + ar + b = 0, si r1 y r2 son las soluciones distintas de esta ecuación, y1 = er1 x e y2 = er2 x son dos soluciones particulares e y = C1 er1 x + C2 er2 x es la solución general. Sea la ecuación y” –4y’ + 3y = 0 de donde r2 – 4r + 3 = 0, r = 4 ± 4/2; r1 = 3, r2 = 1, y = C1 e3x + C2 e x + C2 e x es la solución general de la ecuación. Si una ecuación característica tiene una raíz doble r0 , las soluciones particulares son y1 = er 0 x e y2 = x er 0 x . Si las raíces de la ecuación característica son complejas, tienen que ser conjugadas α + iβ y α – iβ, y como eiβx = (cos βx + isenβx), la solución general es: y = C1e(α+iβ)x + C2e(α – iβ)x = eαx · [K1 cosβx + K2 senβx]

Ecuaciones diferenciales no homogéneas de segundo orden Entre las ecuaciones diferenciales no homogéneas de segundo orden se encuentran las ecuaciones lineales con coeficiente constante. Son de la forma: F(x, y, y’, y”) = 0, o también a0 y” + a1 y’ + a2 y + f(x) = 0

Método de variación de las constantes para resolver este tipo de ecuaciones Si y = C1 e r1x + C2 e r2x es la solución de la ecuación general homogénea asociada, se supone que las constantes son

función de x, así C1 = C1 (x) y C2 = C2 (x) y se les hace verificar la ecuación a través del sistema: C1’(x)er1x + C2’(x)er2x = 0 C1’(x)(er1x)’ + C2’(x)(er2x)’ = –f(x) Resolviendo el sistema se obtiene C1 ’ (x) y C2 ’ (x), que mediante integración permiten obtener C1 (x) y C2 (x), y la solución general es y = C1 (x) y1 + C2 (x)y2, siendo y1 e y2 la solución de la ecuación homogénea asociada. La ecuación diferencial y” – 4y’ + 3y = x · e2x tiene como ecuación homogénea asociada a y” – 4y’ + 3y = 0, cuya solución general es y = C1 e 3x + C2 e x .

Sistemas de ecuaciones diferenciales con coeficientes constantes Se llama sistema diferencial de primer orden a un sistema de la forma: y ’ 1 = f1 (x1 , y1 , y2 , … yn ) y ’ 2 = f2 (x1 , y1 , y2 , … yn ) y ’ n = fn (x1 , y1 , y2 , … yn ) Una solución de un sistema es un conjunto de n funciones y 1 , y2 , …, yn de la variable x, derivables respecto a x y con derivadas primeras y’1 , y’2 , …, y’n, y que verifican las n igualdades del sistema. Toda ecuación diferencial de orden n, de la forma y(n) = f(x, y, y’, y”, …, y(n-1)) se puede transformar en un sistema sin más que hacer el cambio y = y1 , y’ = y2 , …, y(n-1) = yn . El sistema formado sería y’1 = y2 , y’2 = y3 , y’n-1 = yn e y’n = f(x, y1 , y2 , …, yn ). Un sistema diferencial de primer orden es lineal si es de la forma yi = fi (x, y1 , … yn ), i = 1, …, n, siendo las funciones fi lineales en y1 , y2 , …, yn. Dicho sistema se escribirá en la forma: y’i = ai1(x) y1 + … + ain(x) yn + bi (x), i = 1, …, n Cuando ai1(x), …, ain(x), i = 1, … n son constantes, es decir, ai1(x) = ai1, …, ain (x) = ain, i = 1, …, n, se tiene un sistema de n ecuaciones lineales con coeficientes constantes. Sea el sistema lineal con coeficientes constantes: x’(t) + a1 x + b1 y = f1 (t) y’(t) + a2 x + b2 y = f2 (t) El método de variación de las constantes se basa en calcular primero la solución general del sistema homogéneo asociado: x’(t) + a1 x + b1 y = 0 y’(t) + a2 x + b2 y = 0 que será de la forma x = m ert e y = nert, siendo m, n y r constantes, x’ = m r et e y’ = n r et ; sustituyendo en el sistema queda:


________________________________________________________________________________________

m r ert + a1 m ert + b1 n ert = 0 n r ert + a2 m ert + b2 n ert = 0 simplificando por ert:

Ecuaciones diferenciales

259

y como el determinante:

|

x1 y1

x2 y2

|

≠0

(r + a1 ) m + b1 n = 0 a 2 m + (r + b2 )n = 0

el sistema tiene solución para C ’ 1 (t) y C’ 2 (t), que una vez integrados darán la solución del sistema completo. Si las soluciones de la ecuación característica del sistema homogéneo hubieran sido imaginarias, serían conjugados entre sí. El sistema quedaría como:

que tienen solución no nula cuando el determinante es cero:

[a – (a + bi)]m + n = 0 m + [(a – bi) + bi]n = 0

m r + a1 m + b1 n = 0 n r + a2 m + b2 n = 0

|

|

b1 (a 1 + r) =0 a2 (r + b2 )

La ecuación obtenida con el determinante es de segundo grado. Si r1 y r2 son las soluciones, se sustituyen en el sistema y se obtienen valores para m = m1 y n = n1 y m = m2 y n = n2. Luego las soluciones son x1 = m1 er1, y 1 = n1 er1 y x 2 = m2 er2 e y2 = n2 er2. La solución general del sistema homogéneo es: x = C1 m1 er1 + C 2 m2 er2 y = C1 n1 er1 + C2 n2 er2 Para hallar la solución del sistema completo, se supone que las constantes de la solución del sistema homogéneo son función de t, C1 = C1 (t) y C2 = C2 (t). Se buscan soluciones de la forma: x = C1 (t) m1 er1 + C 2 (t) m2 er2 y = C1 (t) n1 er1 + C2 (t) n2 er2 y efectuando la sustitución en el sistema, teniendo en cuenta que x1 = m1 er1, x 2 = m2 er2, y 1 = n1 er1 e y2 = n2 er2 son soluciones de las ecuaciones homogéneas, queda: C ’ 1 x 1 + C ’ 2 x2 = f1 (t) C ’ 1 y 1 + C ’ 2 y2 = f2 (t)

y se prosigue de forma análoga, pero teniendo en cuenta que eait = cos at + i sen at. Si la solución hubiera sido doble, se buscarían soluciones de la forma: x = (m1 + n1 t) ert y = (m2 + n2 t) ert

_ Preguntas de repaso 1. Hallar la familia de curvas solución de la ecuación diferencial y’ = 1. 2. Resolver la ecuación diferencial: (x + e2x) y2 y’ = 1 + 2e2x 3. Resolver la ecuación diferencial: y’ + 1/x · y = ex 4. Un cuerpo parte de reposo con un movimiento en el que la ecuación de la velocidad es V = 3t2 + 5m/seg, siendo t el tiempo. Hallar la fórmula que da el espacio, y el espacio recorrido en 8 segundos.


f a e

c A

b B

Y

ELEMENTOS DE GEOMETRÍA PLANA

f (x)

O

d

h a

x c x+ h

X

G

eometría es la ciencia que estudia la forma, posición y magnitudes de las líneas, superficies y volúmenes. Superficie es el límite que separa a un cuerpo del resto del espacio, o también la separación entre dos partes contiguas de un cuerpo. Un volumen es la porción de espacio encerrada por diferentes superficies que interseccionan entre sí. Una línea es la intersección entre dos superficies, o bien es la separación entre dos partes contiguas de una superficie. Un punto es la intersección entre dos líneas o la separación entre dos partes contiguas de una línea. Los puntos se suelen representar por letras mayúsculas. Las líneas, por letras minúsculas o señalando dos o más de sus puntos, y las superficies, indicando las líneas que los limitan. Por ejemplo: A A

B B

C

A A

B

superficie curva

superficie recta

La recta y el plano Las líneas rectas satisfacen las siguientes propiedades: a) Por un punto pasan infinitas rectas. b) Entre dos puntos sólo puede existir una línea recta. c) Para determinar una recta son necesarios dos puntos. d) Existen infinitos puntos que pertenecen a una recta e infinitos que no pertenecen a ella. e) Las líneas rectas son ilimitadas, a pesar de que se suelen limitar para trabajar con una parte de ellas. A las líneas rectas limitadas por ambos extremos se les llama segmentos, y se denotan por sus puntos límites:

E C D

A

La líneas se dividen en rectas y curvas. Una recta es una línea que tiene todos sus puntos en una misma dirección y constituye la distancia más corta entre dos puntos. Las líneas curvas tienen sus puntos en diferentes direcciones y reciben algunos nombres particulares según la forma que tengan. Las superficies se dividen en planas y curvas. Las primeras sólo pueden ser cortadas por una recta en un punto. En cambio, una superficie curva sí puede ser cortada por una recta en más de un punto. línea recta

B segmento de una recta

Un punto de una recta la divide en dos partes, llamadas semirrectas. Éstas se representan por el punto en cuestión y por otro cualquiera situado sobre alguna de las semirrectas, unidos por una flecha; por ejemplo:

A

B → AB = semirrectas A y B

Dos puntos dividen a una recta en tres partes, siendo una de ellas un segmento: A

línea curva

B

semirrecta dividida en tres partes

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________

Dos segmentos son iguales si al colocarlos uno encima de otro coinciden ambos extremos. Si sólo coincide un extremo se dice que los segmentos son desiguales y el segmento cuyo extremo no coincidente sobresale se dice que es el mayor:

A

B C segmentos iguales

D

Elementos de geometría plana

261

b) Una recta y un punto fuera de ella determinan un plano: p

l

c) Por una recta pasan infinitos planos:

=

pues A

B

C

D l

A

B C segmentos desiguales <

pues A

B

D

C

D

Para sumar dos segmentos, deben colocarse sobre una recta de manera que se hagan coincidir un extremo de cada segmento y los otros dos en dirección opuesta; es decir, se deben poner en prolongación uno de otro. Por ejemplo: + A

B

= C D

A

D

d) Dos rectas que se cortan determinan un plano: l2 l1

e) Un plano contiene infinitas rectas y, por tanto, infinitos puntos:

suma de segmentos l1

Dos segmentos se pueden restar, colocando uno sobre otro coincidentes en un extremo. La diferencia será la porción de segmento mayor que sobresalga. Por ejemplo: – A

B

f) Una recta sobre un plano lo divide en dos semiplanos:

= C

l2

D

E

F

resta de segmentos

l

La multiplicación entre segmentos no tiene sentido, pero sí se puede multiplicar un segmento por un número, obteniéndose el segmento ampliado en tantas veces como indique dicho número. Geométricamente, esto se puede conseguir dibujando una recta, fijando un origen y a partir de él reproduciendo el segmento tantas veces como indique el número. Por ejemplo:

B

Todo punto de un plano dividido en dos semiplanos pertenece a uno de dichos semiplanos o a la recta divisoria. Además, un segmento o bien tiene un extremo en cada semiplano y corta a la recta de división o bien es paralelo o está contenido en dicha recta: A

x3= A

l3

l4

O

multiplicación de un segmento

Las propiedades que identifican a los planos y a las rectas son las siguientes: a) Tres puntos determinan un plano: C

A B

p B

C

Los ángulos Cuando dos rectas se cortan, forman entre ellas un ángulo. Estos ángulos se suelen denotar con letras griegas: α, β, γ, etc. Cuando dos segmentos forman un ángulo, éste se puede representar por las letras que componen los segmentos, escribiendo en el centro el punto de intersección, por ejemplo ABC:


262

MATEMÁTICAS

______________________________________________________________________________________________

A

Ángulo agudo. Mide menos de 90º:

α

B

C

Las medidas más usuales de ángulos son los grados sexagesimales, o grados simplemente, y los radianes. La escala de grados sexagesimales va desde 0º (ángulo nulo) hasta 360º (ángulo completo). La escala de radianes considera el ángulo completo como 2π. Para hacer una conversión entre grados y radianes se utiliza una regla de tres. Por ejemplo, 90º en la escala sexagesimal corresponde a: 90º . 2π = π radianes 360 4

α O

Ángulo obtuso. Mide entre 90 y 180º:

β O

Ángulo extendido o llano. Es el ángulo que mide 180º:

π , por su parte, equivale a π · 360 = 60º. 3 3 2π La escala de grados sexagesimales se divide en minutos (‘) y segundos(“). Así, 1º es igual a 60’ e igual a 3.600”. De ello se desprende que 1’ equivale a 60”.

β O

Ángulos complementarios. Son los que al sumarlos resulta un ángulo recto:

Tipos de ángulos

α + β = 90º

Según la posición y la magnitud de los ángulos, éstos se clasifican en: Ángulos adyacentes. Son los que tienen el vértice y un lado comunes y los otros lados están sobre una misma recta. Por ejemplo:

β α O

Ángulos suplementarios. Son los que al sumarlos resulta un ángulo llano:

β

α

α + β = 180º

O

Ángulos consecutivos. Tienen el vértice y un lado comunes: β

α O

β α O

Ángulo recto. Se forma un ángulo recto cuando dos ángulos adyacentes son iguales. Por tanto, debe medir 90º (o π/4). Todos los ángulos rectos miden lo mismo, por eso se suele hablar de 90º como de 1 recto:

Propiedades de los ángulos a) Si a un mismo lado de una recta y por uno de sus puntos se trazan otras varias rectas, la suma de los ángulos sucesivos que forman todas ellas es igual a 180º: α + β + γ + δ + ε = 180º γ ε

β

δ

α O

O

b) La suma de todos los ángulos consecutivos que se forman alrededor de un punto por varias rectas que concurran en él es igual a 360º:


__________________________________________________________________________________

α + β + γ + δ + ε = 360º

α ε

δ

c) Dadas dos rectas que se cortan en un punto, se formarán cuatro ángulos, que, según lo dicho, suman 360º. Todos los ángulos adyacentes son suplementarios. Además, los ángulos opuestos por el vértice miden lo mismo y las bisectrices de los cuatro ángulos formados por las rectas que se cortan son perpendiculares: α = γ; β = δ; α + β = 180º; β + γ = 180º β

γ

δ

α

Posiciones relativas de las rectas en el plano En un mismo plano, dos rectas pueden: ser coincidentes, cuando tienen todos sus puntos en común; intersecarse, formando cuatro ángulos, o ser paralelas, si no se cortan o lo hacen en el infinito. El último caso, que se representa por l1 || l2, muestra las siguientes propiedades: a) Una recta puede tener infinitas paralelas. b) Por un punto fuera de una recta siempre se puede trazar una única paralela. c) Si una recta se intersecta con otra, entonces necesariamente lo hará también con todas sus paralelas. d) Si una recta corta en un cierto ángulo α a otra recta, entonces cortará a todas sus paralelas en el mismo ángulo α.

α

α

α

α l1

O5

l2

l3

β’ γ’ α’ δ’ β γ α δ

Internos: los cuatro ángulos que están en el interior de las rectas l1 y l2: α’, δ’, β y γ. Externos: los ángulos que se encuentran en el exterior: α, δ, β’ y γ’. Alternos internos: los ángulos internos que están en distinto lado de la secante y que no son adyacentes: β y δ’, α’ y γ. Alternos externos: los ángulos externos de distinto lado de la secante no adyacentes: α y γ’, β’ y δ. Correspondientes: son los ángulos que están al mismo lado de la secante, siendo uno interno y el otro externo: α y α’, β y β’, γ y γ’, δ y δ’. Supongamos ahora que l1 y l2 y son paralelas. Entonces se tendrán las siguientes relaciones: a) Los ángulos alternos internos son iguales: α’ = γ, β = δ’. b) Los ángulos alternos externos son iguales: α = γ’, β’ = δ. c) Los ángulos correspondientes son iguales: α = α’, β = β’, γ = γ’, δ = δ’. d) Los ángulos internos del mismo lado de la secante son suplementarios: α’ + β = 180º, γ + δ’ = 180º. e) Los ángulos externos del mismo lado de la secante son suplementarios: α + β’ = 180º, γ’ + δ = 180º. l3 β’ γ ’ α’ δ’

β γ α δ

l1

l2

l4

La última propiedad sirve para establecer una relación entre todos los ángulos que se forman al cortar dos paralelas por una recta. Pero previamente conviene definir los diferentes ángulos que se forman al cortar dos rectas cualesquiera por una tercera. Supóngase que las rectas l1 y l2 son cortadas por una tercera, l3, llamada secante: l3

263

Entonces se forman los ángulos que se describen a continuación:

β γ

Elementos de geometría plana

l1

_ Preguntas de repaso 1. ¿En qué se diferencian las líneas rectas y las líneas curvas? 2. ¿Cuántos puntos son necesarios para definir una recta? ¿Y un plano? 3. ¿Qué son ángulos complementarios? ¿Y suplementarios?

l2

4. ¿Qué elementos geométricos son los que determinan un plano?


GEOMETRÍA POLIGONAL

f a e

c A

b B

Y f (x)

O

d

Conceptos generales Se llama polígono a la porción de superficie cerrada, confinada por rectas que se cortan formando segmentos unidos por un extremo:

h a

x c x+ h

X

gulos, con letras griegas (α, β, γ, ...) o también con la letra del vértice. Los polígonos pueden ser convexos o cóncavos. Un polígono es convexo si al prolongar cualquiera de sus lados, la línea queda siempre fuera del polígono. En caso contrario, es decir, cuando la prolongación de uno de sus lados corta a otro lado cualquiera, es cóncavo:

polígonos

Los segmentos se llaman lados del polígono, cuyo perímetro es la suma de todos los lados. Los puntos de unión son los llamados vértices del polígono. Los ángulos del polígono son formados por cada dos lados unidos en un vértice. Las diagonales son los segmentos que unen dos vértices no consecutivos. Los ángulos que se forman en cada vértice entre un lado y la prolongación del otro se dicen externos: E D A

B

C

elementos de un polígono

Un polígono tiene tantos lados y tantos ángulos como vértices. Si tiene n lados entonces tendrá: n (n – 3) diagonales 2 La suma de los ángulos de un polígono de n lados viene dada por: S = (n – 2) · 180º y la suma de los ángulos exteriores de todo polígono es igual a 360º. Los lados se denotan con letras minúsculas (a, b, c, ...); los vértices, con letras mayúsculas (A, B, C, ...) y los án-

polígono cóncavo

polígono convexo

El área de un polígono es la porción de plano que cubre su figura. Un polígono se llama equilátero si todos sus lados son iguales; equiángulo, si lo son todos sus ángulos, y regular, si es equilátero y equiángulo. Los polígonos que no cumplen estas condiciones se llaman irregulares. Los polígonos regulares de n lados tienen diversas propiedades particulares. Por ejemplo, se puede determinar el valor de sus ángulos, ya que todos ellos son iguales, en virtud de la expresión: α=

(n – 2) · 180º 360 = 180º – n n

Los ángulos externos, β, por su parte, se miden todos mediante la expresión: b=

360º n

El perímetro de un polígono regular viene dado por P = n · a, donde a es la longitud de cada lado. Además, las bisectrices de todos los ángulos de un polígono regular concurren en un mismo punto, llamado centro del polígono. Las rectas que unen el centro con los vértices se denominan radios. Las rectas que unen el cen-

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________________

tro con el punto medio de cada lado se llaman apotemas, y cortan a los lados en ángulo recto. Por último, los ángulos formados entre cada dos radios consecutivos son los denominados ángulos en el centro.

Geometría poligonal

265

Una propiedad importante de los triángulos es que la suma de sus ángulos internos es siempre 180º. Los triángulos pueden ser equiláteros, si tienen todos sus lados iguales; isósceles, si sólo dos de sus lados son iguales, y escalenos, si todos sus lados son diferentes:

Clases de polígonos

clases de triángulos

En general, dos polígonos cualesquiera son iguales si se pueden superponer todos los vértices de forma que coinciden. Dos polígonos se dicen equivalentes si tienen el mismo área, pero no coinciden por tener distinta forma. Para formar un polígono se requieren por lo menos tres lados, si bien no existe un número máximo:

Tabla de polígonos

equilátero

escaleno

isósceles

Según los ángulos, los triángulos se clasifican en acutángulos, si tienen tres ángulos agudos; obtusángulos, si poseen un ángulo obtuso, y rectángulos, si tienen un ángulo recto: clases de triángulos según sus ángulos

N.º de lados

Nombre

N.º de diagonales

Suma de sus ángulos

3 4 5 6 7 8 9 10 12 15 20

triángulo cuadrilátero pentágono hexágono heptágono octógono nonágono decágono dodecágono pentadecágono icoságono

0 2 5 9 14 20 27 35 54 90 170

180° 360° 540° 720° 900° 1.080° 1.260° 1.440° 1.800° 2.340° 3.240°

acutángulo obtusángulo

rectángulo

Elementos de un triángulo Alturas. Son las perpendiculares trazadas desde los vértices a los lados opuestos. El punto de intersección de las tres alturas se llama ortocentro: C

En general, el área de un polígono regular convexo es igual a la mitad del producto de la longitud del perímetro por la apotema. Así, por ejemplo, el área de un icoságono regular de lado igual a 8 unidades y apotema –3 mide: A=

1 8 · 20 · 3 = 240 2

A

B

alturas de un triángulo

Mediatrices. Son las perpendiculares trazadas desde el punto medio de los lados. El punto de intersección de las tres mediatrices se llama circuncentro: C

Triángulos Se llama triángulo a los polígonos de tres lados. Se suelen representar por las tres letras de sus vértices precedidas por un triángulo pequeño, por ejemplo ∆ABC. Sus lados se expresan con las minúsculas de las letras de los vértices opuestos:

A

C

a

b

c

mediatrices de un triángulo

Medianas. Son los segmentos que van desde los vértices al punto medio de los lados opuestos. El punto de intersección de las tres medianas se llama baricentro:

C

A

B

B

triángulo

A

B

medianas de un triángulo

Bisectrices. Son las líneas rectas que dividen por la mi-


266

MATEMÁTICAS

______________________________________________________________________________________________

tad a cada uno de los tres ángulos del triángulo y su punto de intersección se llama incentro: γ/2

a = a’ b = b’ γ = γ’

a = a’ b = b’ a > b’ α = α’

base · altura 2

Como alternativa, se puede aplicar también la siguiente fórmula: A = s (s – a) (s – b) (s – c)

A = 9 (9 – 8) (9 – 5) (9 – 5) = 1 5 4 = 12,41

Congruencia de triángulos Se dice que dos triángulos son iguales o congruentes (∆ABC ∆CDE) si, al superponerlos, todos sus vértices coinciden. En dos triángulos congruentes, los lados y ángulos iguales, respectivamente, se llaman homólogos. Para comprobar que dos triángulos son congruentes no es necesario verificar que coinciden los tres lados y los tres ángulos de ambos. Supongamos que tenemos los siguientes triángulos: C

C' a

b'

γ'

α'

β c

B

A'

α = α’ β = β’ γ = γ’

esto es, el semiperímetro. Así, por ejemplo, el perímetro del triángulo isósceles de base 8 y lados iguales todos ellos a 5 es 8 + 5 + 5 = 18; por tanto, su área es:

α

∆ABC

∆A’B’C’

∆A’B’C’

a b c –– = –– = –– a’ b’ c’ C'

C b

γ

α A

a

b'

β c

B

A'

γ'

a' β'

α' c'

B'

Al igual que para la congruencia, tampoco es necesario comprobar todas las proporciones e igualdades para demostrar la semejanza de triángulos. Supongamos que tenemos dos triángulos de vértices ABC y A’B’C’, respectivamente, y ángulos α β γ y α’β’γ’. Entonces, ∆ABC ∆A’B’C’ si se verifica alguno de los casos siguientes: Caso 1. Tienen dos ángulos iguales, respectivamente: α = α’ β = β’ γ = γ’

∆ABC

∆A’B’C’

Caso 2. Tienen un ángulo igual y los lados que lo forman son proporcionales:

a' β'

c'

∆ABC

Dos triángulos se dicen semejantes (∆ABC ∆A’B’C’) si tienen sus ángulos iguales y los lados proporcionales:

s= a+b+c 2

A

∆A’B’C’

Semejanza de triángulos

donde:

γ

a = a’ b = b’ c = c’

El área de un triángulo viene dada por la expresión:

b

∆ABC

Caso 3. Tienen dos lados iguales, respectivamente, e igual ángulo opuesto al mayor de estos lados:

Área de un triángulo

A=

Caso 2. Tienen los tres lados iguales, respectivamente: bisectrices de β/2 un triángulo

α/2

B'

Para que sean congruentes, basta con que se verifique alguno de los siguientes casos:

α = α’ c = b c’ b’

∆ABC

∆A’B’C’

Caso 3. Tienen todos los lados proporcionales: Caso 1. Tienen dos lados iguales, respectivamente, y el ángulo comprendido entre ellos es también igual:

a b c –– = –– = –– → a’ b’ c’

∆ABC

∆A’B’C’


__________________________________________________________________________________________

Por ejemplo, los triángulos de lados 2, 4, 6 y 8, 16, 24 son semejantes, ya que: a b c –– = –– = –– a’ b’ c’

Paralelogramos: cuadriláteros con lados paralelos dos a dos. Rombos: paralelogramos con dos lados contiguos iguales. Trapezoides: cuadriláteros cuyos lados no son iguales ni paralelos.

Este tipo de triángulos se trata en forma separada debido a lo singular de sus propiedades. En un triángulo rectángulo, los lados que forman el ángulo recto se llaman catetos y el lado opuesto se conoce por hipotenusa:

clases de cuadriláteros

γ a

b A

267

Casos particulares de los paralelogramos son los rectángulos. Éstos tienen todos los ángulos rectos. Y si además tienen todos los lados iguales, se llaman cuadrados.

Propiedades de los triángulos rectángulos

C

Geometría poligonal

β

α c

trapecio

rombo

trapezoide

B

triángulo rectángulo

a) Los dos ángulos agudos son complementarios. b) El punto equidistante de los tres vértices es el punto medio de la hipotenusa. c) Las tres alturas se cortan en el vértice del ángulo recto. d) Dos triángulos rectángulos son congruentes si tienen iguales: los catetos, un lado cualquiera y un ángulo agudo o la hipotenusa y un cateto. e) Dos triángulos rectángulos son semejantes si tienen un ángulo agudo igual, los catetos proporcionales o la hipotenusa y un cateto proporcionales. f) El área de un triángulo rectángulo es igual a la mitad del producto de los catetos: A= b·c 2 Teorema de Pitágoras. En un triángulo rectángulo, el cuadrado de la hipotenusa es igual a la suma de los cuadrados de los catetos: a2 = b 2 + c 2 Por ejemplo, en el triángulo rectángulo de catetos 3 y 4, la hipotenusa vale: a = 9 + 1 6 = 2 5 = 5

Cuadriláteros

paralelogramo

rectángulo

cuadrado

Paralelogramos Algunas propiedades de los paralelogramos son las siguientes: a) Los lados opuestos son iguales. b) Los ángulos que tienen un lado común son suplementarios y, por tanto, los ángulos opuestos son iguales. c) Las diagonales se cortan en dos partes iguales. En un rombo, además de las propiedades de los paralelogramos, se cumple que las diagonales se cortan en ángulo recto y son bisectrices de los ángulos cuyos vértices unen. El rectángulo, además de las propiedades del paralelogramo, tiene sus diagonales iguales. En cuanto al cuadrado, como es a la vez rectángulo y rombo, sus diagonales son iguales, perpendiculares y bisectrices de los ángulos que unen, y se cortan en partes iguales.

Trapecios Los cuadriláteros son polígonos de cuatro lados. Se pueden distinguir los siguientes tipos de cuadriláteros: Trapecios: cuadriláteros con dos de los cuatro lados paralelos.

En los trapecios, la recta que une los puntos medios de los lados no paralelos es paralela a las bases. El segmento comprendido entre estos lados es igual a la semisuma de las bases, y el segmento que forman las diagonales al cor-


268

MATEMÁTICAS

______________________________________________________________________________________________

tar a esta recta es igual a la semidiferencia de la mismas bases. En términos matemáticos:

b

D

a) EF AB DC.

B

E

C

h

h

AB + DC . 2 AB – DC . c) GH = 2 b) EF =

C

B

A

b

F

trapecio

El área de este último será, como se ha visto:

Área de los cuadriláteros A = base · altura En virtud de la clasificación de los cuadriláteros el área se puede calcular de diversas formas. En un paralelogramo, si se traza una diagonal podrán observarse dos triángulos congruentes que tienen la misma altura. Entonces, el área del paralelogramo es el doble de la de cada uno de esos triángulos:

En este caso: A = AF · h, la cual constituye justo el doble que la del trapecio. Como AF = B + b, el área del trapecio será: A=

B+b ·h 2

A = base · altura Por ejemplo, el área de un paralelogramo rectángulo de lados 3 y 4 será: 3 · 4 = 12: D

C

Es decir, el área de un trapecio es igual a la semisuma de los lados paralelos (o de la base mayor y la base menor) por la altura del trapecio. Por su parte, no existe una forma general para calcular el área de un trapezoide. Como norma, conviene dividir su área en porciones que sean triángulos y rectángulos, al igual que se hizo con el trapecio, y sumarlas:

3

C D

A

B

4 rectángulo

En un rombo, el área se puede calcular de idéntica manera que en el paralelogramo. Se obtiene una fórmula alternativa si se observa que al trazar las diagonales d1 y d2 (d1 > d2) se forman dos triángulos rectángulos, con áreas iguales a la mitad del producto de los catetos. Por tanto, el área del rombo es: A=

d 1 · d2 2

trapezoide

B

_ Preguntas de repaso 1. ¿Cuánto suman los ángulos de un icoságono? 2. ¿Cuál es el área de un triángulo de lados de longitudes 6, 5 y 3 cm?

D

A

A

d2 d1

C

3. Calcular el área de un rombo sabiendo que sus diagonales son d1 = 5 mm, d2 = 3 mm. 4. Calcular el área del trapecio de la figura: 6 cm

B rombo

En un trapecio, se puede calcular el área colocando otro trapecio imaginario a continuación y en posición invertida, de forma tal que se forme un paralelogramo:

4 cm 10 cm


GEOMETRÍA CIRCULAR

f a e

c A

b B

Y f (x)

h

O

d

a

x c x+ h

X

La circunferencia Se llama circunferencia a una curva cerrada cuyos puntos equidistan de un punto interior, que se denomina centro:

O cuerda

O circunferencia

Diámetro es la cuerda que pasa por el centro de la circunferencia. Mide dos radios y es la mayor de todas las cuerdas. Las dos partes iguales en que queda dividida la circunferencia por un diámetro reciben el nombre de semicircunferencias:

A toda recta que une el centro con cualquier punto de la circunferencia se le llama radio. Igual nombre recibe la distancia del centro a la circunferencia. O

Elementos de una circunferencia

diámetro

Arco es la partición de la circunferencia existente entre dos radios cualesquiera. Se representa por los puntos en la circunferencia que limitan dicho arco, por ejemAB: plo,

Tangente es la recta que sólo tiene un punto en común con la circunferencia. Este punto se le conoce por punto de tangencia:

A B

O

P

O

tangente a una circunferencia

arco de circunferencia

Secante es toda recta que corta a la circunferencia:

Normal es la recta perpendicular a la tangente en el punto de tangencia. Ésta siempre pasa por el centro de la circunferencia:

O secante

Cuerda es la parte de la secante que está dentro de la circunferencia:

O

P normal

Círculo es el plano que encierra la circunferencia:

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


270

MATEMÁTICAS

______________________________________________________________________________________________

e) En un mismo círculo, las cuerdas iguales equidistan del centro; de las cuerdas desiguales, la mayor dista menos del centro que las otras: O

E A

círculo C

Sector circular es la parte del círculo comprendida entre dos radios:

AB = CD → d(AB, O) = d(CD, O) AC < EF → d(AB, O) > d(EF, O)

O F

D

B

f) El diámetro perpendicular a una cuerda divide a ésta y a los dos arcos que subtiende en dos partes iguales: O A

sector circular

D

Segmento circular es la parte del círculo que encierra un arco y la cuerda que une sus extremos:

O

OC ⊥ AB →

C

AC = CB AD < DB

B

g) Por un punto de una circunferencia puede trazarse siempre una única tangente. Además, esa tangente es paralela a todas las cuerdas, según las cuales el diámetro que pasa por el punto de tangencia divide en partes iguales:

O

segmento circular

Semicírculos son las dos porciones en que queda dividido un círculo por un diámetro: O

O

semicírculos

h) Dos rectas forman en una circunferencia arcos iguales: A

Propiedades de las circunferencias a) Dos circunferencias y dos círculos son iguales si tienen igual radio. b) Dos arcos del mismo radio son iguales si se pueden superponer de modo que coincidan sus extremos. c) Por tres puntos no colineales siempre se puede trazar una única circunferencia. d) En una misma circunferencia, los arcos iguales son subtendidos por cuerdas iguales; de los desiguales, al mayor le corresponde cuerda mayor: B

A

O C

AB = BC → AB = BC AC > AB → AC > AB

A

O

B

O

C

O

B AB = AB

AC = AC

AC = BC

Posiciones relativas de dos circunferencias Dos circunferencias pueden no tener puntos en común. En tal caso estarán o bien separadas (exteriores) o bien inscritas una dentro de otra (interiores). Si dos circunferencias interiores tienen el mismo centro, se llaman concéntricas, y la parte comprendida entre las dos líneas es la corona o anillo circular:


______________________________________________________________________________________________

Geometría circular

271

O'

O

O

O'

circunferencias exteriores

Respecto a los radios, se dan estas propiedades: O O'

O

a) En dos circunferencias exteriores, la suma de los radios es menor que la línea de los centros, es decir:

circunferencias interiores

OO’ > r + r’

Dos circunferencias pueden tener un punto en común, llamándose en tal caso circunferencias tangentes, y también pueden ser exteriores o interiores:

b) En dos circunferencias tangentes exteriores, la suma de los radios es igual a la línea de los centros: OO’ = r + r’

O

O'

O O'

circunferencias tangentes

Dos circunferencias pueden tener dos puntos en común. En este caso se llaman secantes:

c) En dos circunferencias secantes, la suma de los radios es mayor que la línea de los centros y la resta de los radios es menor: OO’ > r – r’ y OO’ < r + r’ d) En dos circunferencias tangentes interiores, la diferencia de los radios es igual a la línea de los centros: OO’ = r – r’ e) En dos circunferencias interiores, la diferencia de los radios es mayor que la línea de los centros:

O

OO’ > r – r’

O'

circunferencias secantes

Si dos circunferencias tienen más de dos puntos en común serán una misma, pues por tres puntos sólo puede pasar una circunferencia. En todas las posiciones, la recta que une los centros de las circunferencias se llama línea de los centros. En dos circunferencias secantes, la línea de los centros corta perpendicularmente a la cuerda común en su punto medio: OO’ ⊥ AB y BC = AC B

f) En dos circunferencias concéntricas no existe línea de los centros: OO’ = 0

Ángulos en el círculo Todo ángulo mide lo mismo que el arco comprendido entre sus lados y descrito con un radio trazado desde el vértice como centro. Se requiere que se tome como unidad de ángulo aquella que tenga el correspondiente arco de igual radio tomado como unidad de arcos. Se pueden definir los siguientes ángulos respecto a un círculo: Ángulo en el centro, formado por dos radios:

O

O' A

En dos circunferencias tangentes, la línea de los centros pasa por el punto de tangencia y corta perpendicularmente en este punto a la tangente común de las dos curvas:

O ángulo en el centro


272

MATEMÁTICAS

______________________________________________________________________________________________

Ángulo inscrito, el vértice sobre la circunferencia: β

O

O

α

O

α + β = 180º ángulo inscrito

c) Todo ángulo inscrito en una semicircunferencia es un ángulo recto: Ángulo con el vértice en algún punto dentro del círculo:

O O ángulo con vértice en el círculo

Ángulo con el vértice fuera del círculo. En este caso, los lados pueden ser secantes de la circunferencia o bien tener un lado tangente o los dos. Este último es el ángulo circunscrito:

d) Los ángulos formados por dos secantes que se cortan en un punto del círculo miden igual que la semisuma de los arcos comprendidos por sus lados y por sus prolongaciones: ACB = AB’B + B’AA’ = A'

B'

O

O

Propiedades de los ángulos de un círculo a) El arco que comprenden los lados de un ángulo en el centro es la medida del ángulo (α). Todo ángulo inscrito en una circunferencia mide la mitad que el ángulo del centro que comprende el mismo arco (β):

C B

O

O

ángulo con vértice fuera del círculo

1 1 AB + A’B’ 2 2

A

e) Los ángulos formados por dos secantes que se cortan en un punto fuera del círculo miden igual que la semidiferencia entre el mayor y el menor de los arcos comprendidos por sus lados: ACB = AB’B – A’AB’ =

1 1 AB – A’B’ 2 2

A' A

C

α O β

α=

β 2

b) Todos los ángulos inscritos que comprenden un mismo arco son iguales. Dos ángulos inscritos en cada uno de los arcos que determinan una cuerda son suplementarios:

O

B'

B

Longitud de una circunferencia y área de un círculo Supongamos que se tiene un polígono regular de n lados. Cada lado del polígono es una cuerda de la circunferen-


______________________________________________________________________________________________

cia. Si aumentamos n, dichas cuerdas serán cada vez más pequeñas y estarán más cerca de la circunferencia. En el límite, cuando n es muy grande (se dice “cuando n tiende al infinito”, n → ) coincidirán el polígono y la circunferencia. Por tanto, la circunferencia se puede tomar como un caso límite de un polígono regular. Por las propiedades de los polígonos regulares, puede concluirse que el área del círculo que comprende la circunferencia es igual a la mitad de la apotema (que, en este caso, es el radio) multiplicada por la longitud de la circunferencia. Como la longitud del arco es igual al ángulo cuyos radios lo forman, en una semicircunferencia el arco medirá π (se suele expresar la longitud de arco en radianes), suponiendo que el radio de la circunferencia es la unidad. Si el radio mide r, la longitud es l = 2πr; π = 3,1416. De lo anterior puede concluirse que el área de un círculo es igual a la mitad del producto del radio por la longitud de la circunferencia:

A=

2πr = longitud de 360º 2πr = longitud de un arco de 1º 360º Por tanto, la longitud de un arco de aº es igual a: l=

2·π·r·a π·r·a = 360º 180º

El área de un sector circular es igual a la mitad del producto de su longitud de arco por el radio:

273

A = lr 2 Si un arco mide aº, entonces: A=

A aº 360º

donde A es el área de la circunferencia. Finalmente, el área de una corona circular se obtiene como la diferencia de las áreas de los círculos circunscritos: A = π (r’2 – r2)

r' r área de una corona circular

r · 2πr = π · r2 2

Por otra parte, para obtener la longitud de un arco de la circunferencia, sabiendo que la amplitud de arco es a, basta con usar una regla de tres:

Geometría circular

_ Preguntas de repaso 1. ¿En qué se diferencian la cuerda y la secante de una circunferencia? 2. Calcular el área de un sector circular de 50º de una circunferencia de radio 6 cm. 3. Calcular el área de una corona circular comprendida entre dos circunferencias concéntricas con radios de 3 y 5 cm.


f a e

c A

b B

Y

CUERPOS GEOMÉTRICOS

f (x)

O

d

Conceptos generales Un cuerpo geométrico o volumen es un espacio limitado por superficies. Estas superficies pueden ser curvas, como en la esfera; planas y curvas, como en el cono y el cilindro, o planas, para formar los poliedros. Las caras de un poliedro están constituidas por cada una de sus superficies y están limitadas por las aristas, cuyos extremos son los vértices. En cada arista se forma un diedro, o figura formada por dos planos, y en cada vértice, un ángulo poliedro:

h a

x c x+ h

X

das sus caras son polígonos regulares y sus ángulos poliedros son iguales, e irregulares, en caso contrario. Los poliedros que tienen cuatro, cinco, seis, siete, ocho, doce y veinte caras se denominan tetraedro, pentaedro, hexaedro, heptaedro, octaedro, dodecaedro e icosaedro, respectivamente. Todos los poliedros tienen un número par de caras que poseen un número impar de lados; es decir, no existe ningún poliedro que tenga un número impar de caras formadas por triángulos, pentágonos, heptágonos, etc. Por otra parte, no existen más que cinco poliedros regulares convexos: tetraedro, hexaedro, octaedro, dodecaedro e icosaedro. En todo poliedro regular convexo, la suma de las caras y los vértices es igual al número de aristas más 2: C+V=A+2

diedro

Un ángulo poliedro es, en general, la unión de varios planos que sólo tienen un punto común. Se llama diagonal del poliedro a la recta que une dos vértices y que no es una arista ni diagonal de ninguna de las caras. Un vértice y una arista pueden formar, además de las caras, el plano diagonal:

Dentro de las clasificaciones anteriores existen poliedros que reciben además nombres particulares, por su importancia y usos en las diferentes disciplinas.

Pirámide Se llama pirámide a todo poliedro en que una de sus caras es un polígono cuyos lados sirven de base a otros tantos triángulos con un vértice común exterior al plano del polígono:

plano diagonal pirámide

El volumen de un cuerpo es la medida del espacio que ocupa. Si al prolongar una cara indefinidamente, el poliedro queda siempre al mismo lado, se llama poliedro convexo. Es cóncavo en caso contrario. Además, los poliedros pueden ser regulares cuando to-

El polígono se llama base, las caras triangulares son las caras laterales, el vértice común de éstas es el vértice de la pirámide y la altura es la perpendicular trazada desde el vértice a la base.

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


__________________________________________________________________________________________

El área lateral de una pirámide es la formada por todas sus caras laterales. El área total es la lateral más el área del polígono de la base. Una pirámide se llama triangular, o tetraedro, si su base es un triángulo; cuadrangular, si es un cuadrilátero; pentagonal, si es un pentágono, etc. En un tetraedro, la base es cualquiera de sus caras. Una pirámide es regular si el polígono de la base es regular y la altura coincide con el centro de dicho polígono. Las aristas laterales son todas iguales y las caras, por tanto, son triángulos isósceles. La altura de cualquiera de estos triángulos es la apotema de la pirámide. Un tetraedro es la más sencilla de las pirámides y el poliedro de menos número de caras, dado que con menos de cuatro caras no se puede cerrar un espacio. Un tetraedro no admite rectas ni planos diagonales:

275

Áreas y volumen. El volumen de una pirámide es igual al tercio del producto del área de la base por su altura: 1 A ·h base 3

V=

El volumen de un tronco de pirámide es igual a un tercio del producto de su altura por la suma de las áreas de sus bases más una media geométrica de ellas:

V=

1 h · (A1 + A2 + A 1 A 2 ) 3

donde A1 y A2 son las áreas de las dos bases. Por otra parte, el área de la superficie lateral de una pirámide es la suma de las áreas de los triángulos que forman sus caras. Si la pirámide es regular, el área es igual a la mitad del producto del perímetro p de la base por la apotema a: Al =

tetraedro

En todo tetraedro se verifica que los planos bisectores de los seis diedros se cortan en un punto que equidista de las cuatro caras. Si por los puntos medios de las aristas de un tetraedro se trazan planos perpendiculares a las respectivas aristas, estos planos se cortan en un punto que equidista de los cuatro vértices. En todo tetraedro, las rectas que unen cada vértice con el punto de intersección de las medianas de la cara opuesta se cortan en un mismo punto. Este punto se encuentra en dichas rectas a una distancia igual a la cuarta parte desde la cara. Supongamos que se corta una pirámide cualquiera por un plano paralelo al de la base. Entonces, la sección es un polígono semejante al de la base. Estos polígonos tienen sus áreas proporcionales a los cuadrados de sus distancias al vértice. Además, las aristas laterales, la altura y demás rectas trazadas desde el vértice hasta la base quedan cortadas en partes proporcionales. Se llama tronco de la pirámide a la porción que queda comprendida entre la base y la sección plana de la pirámide. Cuando la pirámide es regular, el polígono de la sección es también regular. Además, las caras laterales de todo tronco de pirámide regular de bases paralelas son trapecios isósceles iguales:

Cuerpos geométricos

p ·a 2

El área lateral de un tronco de pirámide regular es igual al producto de la semisuma de los perímetros de las bases por la apotema. El área total de una pirámide regular cuya base tiene apotema a’ viene dada por: Al =

p · (a + a’) 2

El área total de un tronco de pirámide regular de bases paralelas es igual a: Al = h’ ·

p + p’ 2

donde h’ es la altura de los trapecios, y p y p’ son los perímetros de las bases, respectivamente. Por ejemplo, el volumen de la pirámide de altura 5 y cuya base es un cuadrado de lado 2 es: V=

1 · 22 · 5 = 10 2

h=5

2

tronco piramidal

2

Si se corta la pirámide con un plano paralelo al de la base a una altura 3, el área de los cuadrados de la base y


276

MATEMÁTICAS

____________________________________________________________________________________________

de la sección son proporcionales a las distancias al vértice al cuadrado: Asecc = Abase

() 2 5

2

Prisma Se llama prisma a un cuerpo en el que dos de sus caras son polígonos iguales con lados que se corresponden, respectivamente paralelos, y las restantes caras formadas por los planos que determinan cada par de lados paralelos. Estas últimas caras, que son paralelogramos, se denominan caras laterales, y los dos polígonos anteriores son las bases. La distancia entre éstas es la altura del prisma:

3

Por tanto, el área del cuadrado de la sección se calcula mediante la fórmula: Asecc = 4 ·

4 = 0,64 25

lo que significa que este cuadrado tiene de lado 0,8. Así, el volumen del tronco resultante es: V=

1 3 · (4 + 0,64 + 4 · 6 0, 3 ) = 6,79 3

Para calcular el área lateral se necesita la apotema, que se obtiene del triángulo rectángulo de catetos 2 y 5: a = 4 + 2 5 = 5,39

a

5

prisma

Un prisma se llama triangular, cuadrangular, pentagonal, respectivamente, etc., según sus bases sean triángulos, cuadriláteros, pentágonos, etc. Si las bases son paralelogramos, el prisma se llama paralelepípedo. Las secciones creadas en un prisma por planos paralelos son polígonos iguales. Se dice que el prisma es recto si las aristas laterales de un prisma son perpendiculares a los planos de las bases. En este caso, las aristas son iguales a la altura. Si además las bases son polígonos regulares, el prisma se dice también regular. Todo prisma oblicuo es equivalente a un prisma recto que tiene por base la sección del oblicuo y por altura la arista lateral del mismo. Por su parte, los paralelepípedos en que las bases y las caras laterales son rectángulos se llaman paralelepípedos rectángulos. Si las bases y las caras son cuadrados, el prisma se llama cubo:

2

Entonces, el área lateral viene dada por: Al = 4 · 5,39 = 21,54 y su área total:

paralelepípedo

Al = Al + Abase = 21,54 + 4 = 25,54 Para calcular el área total del tronco de pirámide se calcula la apotema de la pirámide que se ha formado sobre la sección a partir del triángulo rectángulo de catetos 2 y 2: a’ = 8 = 2,83, y se resta de la apotema de la pirámide total: 5,39 – 2,83 = 2,56, con lo que se obtiene la altura de los trapecios laterales del tronco. Entonces, el área total es: Al = 2,56 · 4 (2 + 0,8) = 14,34 2

cubo

En todo paralelepípedo, las caras opuestas son iguales y paralelas. Además, las diagonales se cortan en un mismo punto y en partes iguales.


__________________________________________________________________________________________

Cuerpos geométricos

277

En un paralelepípedo rectángulo, el cuadrado de la diagonal es igual a la suma de los cuadrados de las tres aristas que concurre en un mismo vértice. En el paralelepípedo de la figura, por ejemplo, de la4 + 4 + 9 = 4,12: dos 2, 2 y 3, sus diagonales miden

2

El cilindro 3

2

Áreas y volumen. El área de la superficie lateral de un prisma es igual al producto de su arista lateral por el perímetro de la sección recta. Si el prisma es recto, su área lateral será igual al producto del perímetro de la base por la altura:

En un cilindro, los círculos que lo limitan se llaman bases, y el eje de rotación es igual a su altura. Se llama generatriz a cualquier recta trazada perpendicularmente entre las bases y también mide igual que su altura:

Al = p · h El área lateral del paralelepípedo rectángulo del ejemplo anterior es 3 · 4 · 2 = 24. El volumen de un prisma es igual al producto del área de la base por su altura: V = Ab · h Si el prisma es un paralelepípedo, su volumen será el producto de sus tres dimensiones, es decir, de las tres aristas que concurren en un mismo vértice. Si el prisma es un cubo, su volumen es el cubo de la arista: V = a3. En la misma figura del ejemplo anterior, el volumen viene dado por 3 · 2 · 2 = 12.

h r

cilindro

Las secciones rectas de un cilindro son círculos, y sus secciones meridianas, rectángulos. El plano tangente a la superficie lateral de un cilindro es el que sólo contiene una de las generatrices de esta superficie:

h plano tangente lateral de un cilindro

Cuerpos de revolución Se llama cuerpos de revolución a los engendrados por la rotación de una línea alrededor de una recta fija. El cuerpo de revolución es la porción de espacio limitado por una superficie de revolución cerrada. Las superficies de revolución pueden ser cilíndricas, cónicas o esféricas. Cuando una recta gira alrededor de otra a la cual se mantiene siempre paralela, se genera un cilindro. Si la recta corta oblicuamente al eje de rotación y forma con él un ángulo constante, la superficie generada es un cono. Por último, si una semicircunferencia gira en torno a su diámetro, se genera una esfera. Se llama cilindro de revolución al espacio limitado por una superficie cilíndrica de revolución y por dos planos perpendiculares. El cono de revolución es el sólido limitado por una superficie cónica de revolución y por un plano perpendicular al eje de rotación. La esfera es el cuerpo de revolución limitado por una superficie esférica:

Áreas y volumen. El área lateral de un cilindro es igual al producto de su altura por la longitud de la circunferencia de su base: Al = 2 · π · r · h donde r es el radio de la circunferencia de su base, y h, su altura. El área total de un cilindro es igual a su área lateral más la suma de las áreas de sus bases: Al = 2 · π · r · h + 2π · r2 = 2 · π · r · (h + r) El volumen de un cilindro es igual al producto del área de la base por su altura: V = A · h = π · r2 · h


278

MATEMÁTICAS

____________________________________________________________________________________________

Así, por ejemplo, el área lateral de un cilindro con una altura 4 y cuyas circunferencias de las bases tienen un radio 2 es:

Al =

1 ·g·π·r 3

donde r es el radio de la base y g es la longitud de la generatriz. El área total de un cono viene dada por:

Al = 2 · π · 2 · 4 = 16π Y su área total es:

Al = π · r · g + π · r2 = π · r · (g + r)

Al = 2 · π · 2 · (4 + 2) = 24π

El volumen de un cono de revolución es igual al tercio del producto del área de la base por su altura:

Además, dicho cilindro tiene volumen: V = π · 4 · 4 = 16π

V=

1 · π · r2 · h 3

Cono Un cono es una superficie de revolución engendrada por un triángulo rectángulo al girar en torno a uno de sus catetos. El vértice de la superficie cónica es el vértice del cono, el círculo que lo limita es su base, y la recta que une el vértice con el centro de la circunferencia es el eje del cono. Una generatriz del cono es cualquier recta trazada desde el vértice hasta el círculo sobre la superficie cónica:

Por ejemplo, en un cono de altura 4 y cuya base tiene radio 3, la generatriz mide 5 (usando el teorema de Pitágoras). Entonces: Al = 1 · 5π · 3 = 7,5π 2 Al = π · 3 · (5 + 3) = 24π V = 1 · π · 9 · 4 = 12π 3

Esfera h

g r

cono

Las secciones rectas de un cono son circunferencias de radio menor que la base. Las secciones meridionales son triángulos isósceles, con alturas iguales a la del cono. En todo cono de revolución cortado por un plano paralelo a su base se verifica que las circunferencias de la sección y de la base son proporcionales a sus distancias respectivas al vértice. Además, las áreas de la sección y de la base son también proporcionales a sus distancias al vértice:

La superficie esférica es el lugar geométrico de los puntos del espacio que equidistan de un punto dado. Toda recta comprendida entre el centro de la esfera y un punto de la superficie esférica se llama radio de la esfera. Por su parte, las rectas que determinan dos puntos de la superficie y pasan por el centro se llaman diámetros. Todos los radios de la esfera son iguales entre sí y todos los diámetros miden el doble que cualquier radio:

r

esfera

Zona esférica es la porción de superficie esférica engendrada por un arco de círculo menor que una semicircunferencia, al girar alrededor del diámetro de ésta. Las zonas de una sola base reciben el nombre de casquetes esféricos:

h cono truncado

Un plano tangente a la superficie lateral de un cono es el plano que sólo contiene a una generatriz de esta superficie. Áreas y volumen. El área lateral de un cono de revolución es igual a la mitad de su generatriz multiplicado por la circunferencia de la base:

h

r

h r

zona esférica

casquete esférico


__________________________________________________________________________________________

Sector esférico es el sólido que se genera por un sector circular al girar en torno a un eje que pasa por el centro de la esfera y que es externo a su superficie. La zona engendrada por el arco del sector circular será la base del sector esférico. El huso esférico es la porción de superficie esférica limitada por dos semicircunferencias máximas que tienen su diámetro común:

Cuerpos geométricos

279

El área de un huso esférico es igual a la cuarta parte del producto del área total de la esfera por la medida α del arco del huso. En términos de ángulo, esta área se puede escribir como: A =

1 Aesf · α · 4 360º

El volumen de una esfera es igual al tercio del producto de su radio por el área de su superficie: V =

α

huso esférico

1 4 · 4 · π r3 = πr3 3 3

Por ejemplo, dada una esfera de radio 3, el área de su superficie mide: A = 4π · 9 = 36π

Toda sección plana de una esfera es un círculo cuyo centro es la proyección del centro de la esfera sobre el plano secante y su radio es menor o igual al de la esfera. El plano tangente a una superficie esférica es el plano que la toca en un solo punto:

Si formamos una zona de altura 1, su área es: A = 2 · π · 3 · 1 = 6π Un huso de ángulo 30º tiene área: 1 36π · 30º 3π A = – · ––––––– = –– 4 360º 4 Por último, el volumen de la esfera está dado por:

plano tangente a una esfera

Áreas y volumen. El área de la superficie esférica es igual al producto de su diámetro por la circunferencia máxima:

V = 4 π · 27 = 36π 3

_ Preguntas de repaso

A = 2 · r · 2 · π · r = 4πr2 El área de una zona esférica viene dada por el producto de su altura por la circunferencia máxima: A=2·π·r·h El área de un casquete esférico también se puede calcular como el área del círculo cuyo radio es la cuerda del arco generador de dicho casquete.

1. Calcular el volumen de una pirámide de 5 cm de altura y base rectangular de 4 x 3 cm de lados. 2. ¿Cuánto miden las diagonales de un cubo de 3 cm de lado? 3. Calcular el área lateral de un cilindro de altura 5 cm y base una circunferencia de 3 cm de radio. 4. Determinar el volumen de un cono de 10 cm de altura y base una circunferencia de 3 cm de radio.


GEOMETRÍA ANALÍTICA

f c

a e

A

b B

Y f (x)

L

a geometría analítica tiene por objetivo estudiar las propiedades de las figuras geométricas por medio del cálculo algebraico. La geometría analítica plana estudia las propiedades de los puntos y líneas que están situados en un mismo plano. La geometría analítica espacial se preocupa de los puntos, líneas y superficies en el espacio.

y1

El punto

y x

O

O

x

ejes coordenados

Cuando estos ejes son perpendiculares entre sí, se llaman ejes rectangulares. Las rectas pueden estar provistas de una escala que determina las longitudes de los segmentos que se forman a partir del sistema. Por convención, los valores de estas escalas serán positivos a la derecha del eje x y arriba del eje y. Un punto se representa por los valores de sus coordenadas. Por ejemplo, el punto P(1,1) tiene por abscisa 1 y ordenada 1: y P(x, y) x O

x

coordenadas de un punto

X

Q P x1

y

x c x+ h

y

Geometría analítica en el plano

La posición de un punto en el plano determinado por un sistema de ejes coordenados queda fijada por las longitudes de dos segmentos que se encuentran en el punto paralelos a los ejes y cuyos extremos son el punto y cada uno de esos ejes. El sistema de ejes coordenados consiste en dos rectas que se cortan, representadas por x e y y llamadas abscisa y ordenada. El punto de corte de ambos ejes se llama origen y se representa por un cero:

a

La distancia entre dos puntos dados, P(x1, y1) y Q(x2, y2), se puede determinar considerando que la línea que une esos puntos es la hipotenusa de un triángulo rectángulo:

y2

y

h

O

d

distancia entre dos puntos

x

x2

Por el teorema de Pitágoras, se tiene que: d2 = (x2 – x1)2 + (y2 – y1)2 → → d = (x2 – x1)2 + (y2 – y1)2

Vectores Se llama vector a un segmento dotado de longitud, dirección y sentido. La longitud es una medida que toma algún segmento como unidad. La dirección es la recta que contiene al vector. Su sentido representa el movimiento del vector. El punto de partida de un vector se llama origen. A la longitud se le suele llamar módulo del vector. El sentido se indica con una flecha: P v

n

O

Este vector se denota por OP. También se puede denotar por letras minúsculas coronadas por una flecha, por ejemplo v . El módulo de un vector se denota por el vector entre líneas verticales, por ejemplo | v|. Dos vectores que están en diferentes rectas tendrán la misma dirección si esas rectas son paralelas, y poseerán el mismo sentido si, teniendo la misma dirección, las flechas apuntan hacia el mismo lado:

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


____________________________________________________________________________________________

P O

P'

O

vectores paralelos

Geometría analítica

Dos vectores se pueden sumar, restar y multiplicar por un escalar. El vector Suma de vectores. Sean los vectores a y b. suma se obtiene situando sobre el destino del primero el origen del segundo. El vector suma une el origen del primero con el destino del segundo:

Si la flecha apunta hacia el lado contrario, se dice que los vectores son opuestos:

a b

+

b

a + b

=

P

a

suma de vectores

O

281

O'

P'

vectores opuestos

Dos vectores son iguales si tienen igual dirección, sentido y longitud: P O

Con referencia a un sistema de ejes coordenados, de coordenadas (a1, a2) y la suma de los vectores a y b, (b1, b2), es igual a: (a1 + b1, a2 + b2). Por ejemplo si a = (2, 3) y b = (4, 5), entonces sucede que a + a = (6, 8). Diferencia de dos vectores. Para restar los vectores a y b , es necesario sumar el vector a más el opuesto de b:

P' –b

O

vectores iguales

a

En un sistema de ejes coordenados, un vector se puede representar por sus puntos de origen y destino: y P Q x O representación de un vector en un sistema de ejes coordenados

Por tanto, v tendrá dos coordenadas, v1 y v2, en donde v1 = x2 – x1 y v2 = y2 – y1. La representación será más sencilla si se sitúa el vector con el origen sobre el del sistema. En este caso, v tendrá coordenadas x e y: y P

x O vector con origen en el origen de coordenadas

El módulo de un vector es la distancia existente entre los puntos que lo determinan; es decir, si a = (x1, y1) y b = (x2, y2) determinan el vector v = (x2 – x1, y2 – y1), entonces: | v| = (x2 – x1)2 + (y2 – y1)2

b

a

=

+ –b =

a a – b

resta de vectores

La resta de los vectores a = (a1, a2) y b = (b1, b2) viene dada por (a1, – b1, a2, – b2). Producto de un vector por un escalar. Multiplicar el vector a por una constante n es lo mismo que sumar a n veces. Por tanto, el producto se obtiene dibujando el vector sobre la recta de la dirección n veces: a

·

3

=

3a

producto de un vector por un escalar

Si a = (a1, a2), entonces n · a = (n · a1, n · a2). Producto escalar de dos vectores. Sean los vectores a = (a1, a2) y b = (b1, b2). Se define el producto escalar a · b como: a · b = a1 · b1 + a2 · b2 lo que obviamente es un escalar. Por ejemplo: (2, 3) · (3, –1) = 6 – 3 = 3.

Ecuación de la recta En general, una recta se representa por la ecuación de primer grado: y = mx + n


282

MATEMÁTICAS

______________________________________________________________________________________________

donde m es la pendiente de la recta, o ángulo que forma con el eje horizontal, y n es el punto donde corta al eje y. La pendiente de una recta indica la inclinación respecto al eje x. Para determinar la recta es necesario obtener los valores de m y n. Se dice que un punto cualquiera satisface la recta y = mx + n si, al sustituir sus coordenadas en la recta, los términos a ambos lados de la igualdad tienen el mismo valor. En resumen: Ecuación general de la recta: y = mx + n. Si el primer punto está sobre la recta: y1 = mx1 + n. Si el segundo punto está sobre la recta: y2 = mx2 + n. Restando cada ecuación de la anterior:

Punto de corte de dos rectas. El punto de corte (x0, y0) deberá satisfacer ambas ecuaciones, es decir: y = m1x + n1, y = m2x + n2 Igualando estas ecuaciones, se tiene: m1x0 + n1 = m2x0 + n2

n2 – n1 x0(m1 – m2) = n2 – n1 → x0 = m – m 1 2 y0 se obtiene reemplazando el valor de x0 en cualquiera de las ecuaciones. Así, por ejemplo, la recta y = 2x – 3 corta al eje y en y = –3, ya que el sistema

y1 – y = m(x1 – x) y2 – y1 = m(x2 – x1)

y = 2x – 3 x=0

y dividiendo miembro a miembro: y1 – y x1 – x y2 – y1 = x2 – x1

tiene como solución el punto (0, –3):

lo que equivale a: y – y1 x – x1 y2 – y1 = x2 – x1 que es la ecuación de la recta. Se suele escribir de la siguiente forma: y –y y – y1 = x2 – x1 (x – x1) 2 1 El término

y2 – y1 es la pendiente de la recta. x2 – x1

Además, se puede construir la ecuación de la recta conociendo un punto y su pendiente. y –y Se reemplaza la pendiente m en x 2 – x 1 y se tiene 2

y

y = 2x – 3

O

x

–3

Distancia de un punto a una recta. Dada la recta y = mx + n y un punto fuera de ella (x0, y0), puede trazarse por este punto la perpendicular a la recta, a la que cortará en un punto (x1, y1). La distancia de (x0, y0) a (x1, y1) será también la distancia del punto a la recta. Este procedimiento nos conduce a concluir que la distancia d entre (x0, y0) e y = mx + n es:

1

y – y1 = m(x – x1), que es la ecuación de la recta que pasa por un punto. Por ejemplo, puede construirse la ecuación de la recta perpendicular a y = 2x – 3 en el origen del sistema de ejes coordenados. La pendiente de la recta dada es m1 = 2; por tanto, la de la recta buscada es m2 = –1/2. Así, la recta perpendicular tiene por ecuación: y – 0 = m2(x – 0); y = –1/2 x y

x

d=

y0 – mx0 – n 1 + m2

Si la distancia es negativa, el punto está debajo de la recta; en caso contrario, está por encima. Bisectriz de un ángulo formado por dos rectas. Cualquier punto (x, y) situado sobre la bisectriz de las rectas y = m1x + n1 e y = m2x + n2 está separado de ambas rectas por una misma distancia. Por tanto, dicha bisectriz se obtiene a partir de la igualdad: y – m1x – n1 y – m2x – n2 = 1 + m21 1 + m22 De hecho, entre dos rectas que se cortan existen dos bisectrices, donde la segunda es:


____________________________________________________________________________________________

Geometría analítica

283

Por ejemplo, la intersección de la recta y = 2x + 3 con la circunferencia x2 + y2 = 9 se obtiene sustituyendo:

y – m1x – n1 y – m2x – n2 = – 1 + m21 1 + m22

2

2

x + (2x + 3) = 9

Por ejemplo, si se tienen las rectas y = 2x – 3 e y = x, una bisectriz viene dada por:

3

y – 2x + 3 y–x = 1 + 4 1 + 1 lo que, multiplicando cruzado y agrupando los términos, da: y=

(

2 2 – 5

) (

3 5

x–

)

Ecuación de la circunferencia La circunferencia es el lugar geométrico de los puntos del plano que equidistan de un punto dado. Esta distancia es el radio. Sea el punto P(a, b). Para que su distancia a otro punto, Q(x, y), sea r, debe ser: (x – a)2 + (y – b)2 = r Elevando ambos términos de la igualdad al cuadrado, se obtiene la ecuación general de la circunferencia de centro (a, b) y radio r: 2

2

(x – a) + (y – b) = r

2

Un caso particular se produce cuando el centro es el origen del sistema de ejes coordenados: x 2 + y = r2

–3

3

O

–3

lo que nos genera la ecuación de segundo grado 5x2 + 12x = 0 que tiene soluciones x = 0 y x = –12/5. De la ecuación de la recta se obtiene y = 3 e y = –9/5, respectivamente. Entonces, los puntos de intersección de la recta y la circunferencia son (0, 3) y (–12/5, –9/5). Ecuación de la circunferencia que pasa por tres puntos dados. Recuérdese que por tres puntos no colineales siempre puede pasar una única circunferencia. Sean los puntos (x1, y1), (x2, y2), (x3, y3). Para que la circunferencia pase por ellos, su ecuación debe satisfacer: (x1 – a)2 + (y1 – b)2 = r2 (x2 – a)2 + (y2 – b)2 = r2 (x3 – a)2 + (y3 – b)2 = r2 Se tienen así tres ecuaciones con tres incógnitas: a, b y r. La solución será única, a no ser que dos de las ecuaciones sean linealmente dependientes, lo que sólo se puede producir si dos puntos son uno mismo, lo cual queda descartado al haber escogido tres puntos. Las tres ecuaciones no pueden ser linealmente dependientes, al haber escogido tres puntos no colineales. Por ejemplo, la circunferencia que pasa por los puntos (1,2), (–3,2) y (2,2) se obtiene resolviendo el siguiente sistema:

y

r

r

O

x

r ecuación canónica de la circunferencia

(1 – a)2 + (2 – b)2 = r2 (–3 – a)2 + (2 – b)2 = r2 (2 – a)2 + (–2 – b)2 = r2 La solución es a = –1, b = –5/8 y r2 = 697/64. Por tanto, la circunferencia es:

(

(x + 1)2 + y + Para hallar la intersección de una recta con una circunferencia basta con igualar sus respectivas ecuaciones. Si no existe solución es por que no se cortan; si existe una solución, la recta es tangente a la circunferencia, y si hay dos, la recta es secante. Análogo razonamiento se usa para hallar la intersección de dos circunferencias.

5 8

) = 69764 2

Tangente en un punto de la circunferencia. La pendiente de la recta tangente a la circunferencia que tiene centro en el origen en el punto (x1, y1) tiene valor m = –x1/y1, y la recta es:


284

MATEMÁTICAS

______________________________________________________________________________________________

x · x1 + y · y1 = r

2

x2 y2 + =1 a2 b2

y

Un caso particular de esta ecuación se produce cuando a = b, con lo que la elipse se convierte en una circunferencia.

(x1, y1) x

O

Hipérbola

Si la circunferencia tiene centro en el punto (a, b), la recta tangente en (x1, y1) se obtiene a partir de:

La hipérbola es el lugar geométrico de los puntos cuyas distancias a dos puntos fijos se diferencian en una constante:

(y – y1) (y1 – b) + (x – a) (x1 – a) = r2

R'

R

A'

A

Por ejemplo, la tangente a (x – 2)2 + y2 = 16 en el punto (2, 4) es: F'

(y – 4) (4 – 0) + (x – 2) (2 – 2) = 16 → y = 8

F

Lo cual es una recta paralela al eje x: hipérbola

x

En la hipérbola, F y F’ son los focos y su distancia (focal) se representa por 2c. Los segmentos que unen los focos con cualquier punto de la curva son los radios vectores. Las rectas R y R’ son las asíntotas de la hipérbola. La distancia entre los vértices A y A’ se denota por 2a. La ecuación de la hipérbola viene dada por:

8

y

2

x2 y2 – 2 =1 2 a b

Elipse La elipse es el lugar geométrico de los puntos de un plano cuyas distancias a dos puntos fijos, llamados focos, tienen suma constante:

Un caso particular de esta ecuación se produce cuando a = b, lo que representa una hipérbola equilátera.

Parábola La parábola es el lugar geométrico de los puntos de un plano que equidistan de un punto llamado foco y una recta exterior llamada directriz:

B r' A'

F2

r O

F1

A d

B'

elipse

Los puntos fijos se llaman focos. En la elipse de la figura, F1 y F2 son los focos. Su distancia mide, por definición, 2c; r y r’ son los radio vectores y su suma se representa mediante 2a. AA’ es el eje mayor y mide 2a. BB’ es el eje menor y mide 2b. Se define la excentricidad de la elipse como el cociente c/a. Por último, la ecuación de la elipse está dada por:

v

F

parábola

La distancia del foco a la directriz se representa por p. El punto medio de esta distancia es el vértice de la parábola. La ecuación de la parábola viene dada por:


____________________________________________________________________________________________

y2 = p(2x – p)

Geometría analítica

285

Por ejemplo, la distancia entre los puntos (1, 1, 3) y (–1, 0, 2) es:

Un caso particular se produce, nuevamente, cuando el vértice de la parábola se encuentra sobre el origen del sistema de ejes coordenados y la directriz es paralela al eje y. En tal caso:

d = (–1 – 1)2 + (0 – 1)2 + (2 – 3)2 = 6

Ecuación de la recta en el espacio

y2 = 2px

Geometría analítica en el espacio

Una recta puede determinarse por dos puntos. Si se tienen los puntos (x1, y1, z1) y (x2, y2, z2), puede realizarse un desarrollo similar al de la recta en el plano, obteniendo:

En el espacio, el sistema de ejes coordenados tendrá un tercer eje llamado cota y denotado por Z, que se añade a las abscisas (X) y a las ordenadas (Y), y que corta a éstos en el origen:

x – x1 y – y1 z – z1 x 1 – x 2 = y 1 – y 2 = z1 – z2

z

Ésta es la ecuación general de la recta en el espacio. En realidad, son dos las ecuaciones que determinan una recta. Una forma más sencilla de escribir esta ecuación se obtiene despejando dos variables en función de la tercera:

O

y = bz + q

x = az + p

x

Por ejemplo, la ecuación de la recta que pasa por los puntos (2, 3, 3) y (1, 4, 2) es:

y sistema de ejes coordenados en el espacio

Si estos tres ejes son perpendiculares dos a dos, el sistema se llama rectangular. Un punto P queda totalmente determinado por rectas paralelas a los ejes que forman sus coordenadas (x, y, z). Así, el punto se denota por P(x, y, z):

x–2 = y–3 = z–3 ↔ 2–1 4–3 2–3 x – 2 y – 3 ↔ = = z–3 ↔ 1 1 –1 ↔ x–3 = y–3 = 3–z O bien: x=3–z+2=5–z y=3–z+3=6–z

y

Por tanto:

P O

x

z

Las coordenadas se suponen positivas cuando están tomadas en los sentidos OX, OY y OZ, y negativas cuando están tomadas a partir del mismo punto O, pero en sentido contrario.

Distancia entre dos puntos Si se quiere determinar la distancia entre los puntos A(x1, y1, z1) y B(x2, y2, z2), ha de considerarse que la recta que los une es la diagonal de un paralelepípedo con lados paralelos a los ejes. La longitud de dicha diagonal es la distancia: d = (x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2

x–2=y–3=3–zy

xy == 56 –– zz

son ecuaciones de una misma recta: la que pasa por los puntos dados.

Ecuación del plano La ecuación general del plano viene dada por: Ax + By + Cz + D = 0 es decir, está formada por una combinación lineal de las coordenadas de los tres ejes. Casos particulares son los planos que forman dos ejes coordenados, lo cual se consigue cuando el tercero es cero: x = 0 o bien y = 0 o bien z = 0. Estas ecuaciones se escriben así directamente o Ax + By + D = 0, Ax + Cz + D = 0, By + Cz + D = 0.


286

MATEMÁTICAS

______________________________________________________________________________________________

(1 – a)2 + (3 – b)2 + (0 – c)2 = r2

Intersección de dos planos La intersección de dos planos es una recta. De hecho, dichos planos forman un diedro. Por ejemplo, puede construirse la intersección de los planos 3x + y + 2z – 6 = 0 y x – y + 2z = 0. Tenemos, por tanto, el sistema: 3x + y + 2z – 6 = 0 x – y + 2z = 0 que son dos ecuaciones con tres incógnitas. Si los planos fueran paralelos, no habría solución para este sistema. Si no son paralelos, se cortarán en una recta, por lo que no habrá un único punto que satisfaga a ambas ecuaciones. Desarrollando el sistema se tienen las siguientes soluciones, que corresponden a una recta:

x = 6 – 4z 4 4z +6 y= 4

Despejando a, b, c y r, se llega a la siguiente ecuación de la esfera:

(x – 7130 ) + (y – 107 ) + (z – 1930 ) 2

2

2

= 6.803 900

La intersección de una esfera y un plano es una circunferencia si el plano es secante y un punto si el plano es tangente. Por ejemplo, la esfera de ecuación (x – 2)2 + (y + 3)2 + (z – 1)2 = 4 y el plano z = 0 (es decir, con el plano XY) forman al cortarse una circunferencia de centro en (2, –3) y radio 3: (x – 2)2 + (y + 3)2 = 3

z

Distancia de un punto a un plano De forma análoga a la distancia entre un punto y una recta en el plano, la distancia del punto P(x1, y1, z1) al plano Ax + By + Cz + D = 0 viene dada por

x(2, –3) x

d=

Ax1 + By1 + Cz1 + D A2 + B2 + C2

r

(2, –3, 1)

Ecuación de la esfera La esfera es el lugar geométrico de todos los puntos en el espacio que equidistan de un punto dado llamado centro. Si esa distancia es el radio r y el centro de la esfera puede expresarse como (a, b, c), su ecuación viene dada por: (x – a)2 + (y – b)2 + (c – z)2 = r2 Cuando el centro de la esfera es el centro del sistema de ejes coordenados, la ecuación se transforma en: x 2 + y 2 + z2 = r 2 Para determinar una esfera son necesarios cuatro puntos. Por ejemplo, determinemos la ecuación de la esfera que pasa por los puntos (1, 1, 3), (2, –2, 1), (0, 1, 2) y (1, 3, 0). Como la esfera debe satisfacerlos a todos, se obtiene el siguiente sistema: (1 – a)2 + (1 – b)2 + (3 – c)2 = r2 (2 – a)2 + (–2 – b)2 + (1 – c)2 = r2 (0 – a)2 + (1 – b)2 + (2 – c)2 = r2

_ Preguntas de repaso 1. ¿Cuál es la distancia entre dos puntos P(–3, 5) y Q(–1, –1)? 2. Determinar la ecuación de la recta que pasa por los puntos (1, 1) y (3, 5). 3. Calcular la distancia de la recta y = 2x – 3 al origen de coordenadas. 4. Determinar la ecuación de la circunferencia de centro (2, 3) y radio 3. 5. Calcular la distancia del punto (–1, 1, 4) al plano 2x + 3y – 2z + 4 = 0


Y f a e

A

b B

f (x)

TRIGONOMETRÍA

c

h

O

d

Conceptos generales La trigonometría es la ciencia que estudia la relación entre los lados de los triángulos y sus ángulos. La dificultad de medir exactamente los arcos y ángulos y operar con ellos en los cálculos necesarios se aborda utilizando ciertas relaciones entre magnitudes rectilíneas. Estas relaciones se denominan funciones circulares o trigonométricas. Se toman los vértices de ángulos como centro y se describen dos arcos de circunferencia con el mismo radio. La relación entre la amplitud de los ángulos es igual a la relación existente entre las longitudes de sus arcos respectivos. En trigonometría, se toman como unidades para medir los arcos tanto el radián como el grado. Pero en el estudio de las funciones circulares se suelen usar los radianes y, con el fin de simplificar los cálculos, se considera y supone que el radio del círculo vale siempre la unidad. Este círculo adopta el nombre de círculo trigonométrico Consideremos un círculo trigonométrico de centro 0. Su circunferencia puede ser recorrida en dos sentidos por un punto m cualquiera: en el sentido contrario de las agujas del reloj, en cuyo caso se consideran positivos, y en el mismo sentido de las agujas del reloj, negativos. En la fiAB es positivo y el arco AB’ es negativo: gura, el arco B

O B'

x c x+ h

X

Además, se puede determinar el valor de los ángulos por medio de las razones de dos segmentos. Tomemos un ángulo cualquiera. Hagamos centro en su vértice y tracemos arcos de radios distintos con sus correspondientes ordenadas: D" D'

D

C A

O

C' A'

C" A"

Los triángulos formados, DCO, D’C’O y D”C”O, son semejantes (tienen sus tres ángulos iguales). Por tanto, pueden establecerse las siguientes razones: DC D’C’ D”C” = = OD OD’ OD” OC OC’ OC” b) = = OD OD’ OD” DC D’C’ D”C” c) = = OC OC’ OC” a)

Estas razones se denominan trigonométricas o goniométricas. Consideremos el triángulo ∆DCO, de ángulos α, 90º y 90º –α, catetos x e y e hipotenusa r (que tiene longitud 1):

+ M

a

A D

M –

arcos positivos y negativos

El punto M puede llegar otra vez al punto de partida, recorriendo así todos los arcos con valores compartidos entre 0 y 2π.

Razones trigonométricas Un ángulo se puede determinar conociendo su amplitud o su longitud y el radio con el cual ha sido trazado.

r

O

α

y C

x

Respecto al ángulo α, pueden definirse: • el seno o razón entre el cateto opuesto y la hipotenusa: sen α =

y r

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


288

MATEMÁTICAS

______________________________________________________________________________________________

• el coseno o razón entre el cateto adyacente y la hipotenusa: cos α =

x r

• la tangente o razón entre el cateto opuesto y el cateto adyacente: tgα =

senα y = x cosα

Además, se tienen los inversos de los valores anteriores:

0

π/2

π

3π/2

seno

r 1 = senα y

• la secante o inversa del coseno: secα =

1

–1

• la cosecante o inversa del seno: cosecα =

Entre π/2 y π el seno sigue siendo positivo, ya que y es positivo, pero va decreciendo hasta que en π vuelve a valer 0: senπ = 0//x = 0. Entre π y 3π/2 vuelve a crecer, pero se mantiene con signo negativo, llegando a sen3 π/2 = –1. Entre 3π/2 y 2π se va acercando cada vez más a 0, hasta que, finalmente, sen2π = sen0 = 0. En definitiva, –1 ≤ senα ≤ 1. Gráficamente:

r 1 = cosα x

1 0

π/2

π

3π/2 2π

–1

• la cotangente o inversa de la tangente:

coseno

1 x cotgα = = tgα y 1

Variaciones de las razones trigonométricas Como las razones trigonométricas son funciones de los ángulos y, por tanto, de los arcos, al variar estos últimos también se alterarán las razones, tanto en sus magnitudes como en sus signos. Tomemos un círculo trigonométrico fijándonos principalmente en las variaciones en los diferentes cuadrantes:

0

2.º cuadrante π 3.er cuadrante

O

1.er cuadrante

π

3π/2

tangente

1 0

π/2

π/2

–1

π/2

π

3π/2

–1 cosecante

4.º cuadrante 3π/2

Variaciones en el signo. Variando el ángulo α, se tiene que: a) El seno es positivo en el primer y segundo cuadrante y negativo en el tercero y cuarto. b) El coseno es positivo en el primer y cuarto cuadrante y negativo en el segundo y tercero. c) La tangente es positiva en el primer y tercer cuadrante y negativa en el segundo y cuarto. Los signos de las tres razones restantes son los mismos que sus correspondientes inversos. Variaciones en magnitud. El seno vale 0 cuando α = 0, ya que en ese caso la ordenada vale 0/ y sen0 = 0/x = 0. A medida que el arco crece, el seno crece. Cuando llega a π/2 vale 1, pues en este extremo la hipotenusa y el cateto opuesto del ángulo α se confunden, siendo sen π/2 = y/y = 1.

1 0

π/2

π

3π/2

–1 secante

1 0

π/2

π

3π/2

–1 cotangente

– Si el arco se forma al moverse en el sentido de las agujas del reloj, se tienen las siguientes relaciones: sen (–α) = –senα, cos (–α) = cosα, tg(–α) = –tgα cosec (–α) = –cosecα, sec (–α) = secα, cotg(–α) = –cotgα – Para ángulos complementarios (adviértase que π/2 – α


________________________________________________________________________________________________

289

1 . cos2α 1 . e) 1 + cotg2α = sen2α

d) tg2α + 1 =

Tabla de valores trigonométricos

seno coseno tangente cosecante secante cotangente

Trigonometría

π 2

π

3π 2

0 1 0 ± 1 ±

1 0 ± 1 ± 0

0 –1 0 ± –1 ±

–1 0 ± –1 ± 0

0 1 0 ± 1 ±

y α son complementarios, ya que π/2 – α + α = π/2), se tiene: senα = cos (π/2 – α), cosα = sen(π/2 – α), tgα = cotg (π/2 – α), cosecα = sec (π/2 – α), secα = cosec (π/2 – α), cotgα = = tg (π/2 – α) – Para ángulos suplementarios, se tiene que:

Las dos primeras relaciones se conocen por definición. La tercera se obtiene a partir de la ecuación de la circunferencia. Las restantes resultan de dividir la tercera expresión por cos2α y sen2α, respectivamente. Estas fórmulas sirven para obtener todas las razones trigonométricas a partir de una dada. Por ejemplo, conociendo senα, se tiene que: cosα = ± 1 – sen2α senα ± 1 – sen2α 1 cosecα = senα

tgα =

secα =

1 ± 1 – sen2α

2 cotgα = ± 1 – sen α

senα = sen (π – α), cosα = –cos (π – α), tgα = –tg (π – α), cosecα = cosec (π – α), secα = –sec (π – α), cotgα = –sec (π – α) – Por último, para ángulos que difieren en π se tienen las siguientes relaciones: sen (π + α) = sen (–α) = –senα, cosec (π + α) = cosec (–α) = = –cosecα, cos (π + α) = –cos (–α) = -cosα, sec (π + α) = = –sec (–α) = –secα, tg (π + α) = tg (–α) = –tgα, cotg (π + α) = = cotg (–α) = cotgα

_ Preguntas de repaso

Relaciones entre las funciones trigonométricas

1. Sabiendo que el seno de 45º = 2 / 2 , calcular el coseno de 45º.

Las funciones trigonométricas de un mismo ángulo guardan entre sí ciertas relaciones, que se llaman identidades:

2. Calcular la tangente de 45º a partir del ejercicio anterior.

senα . cosα cosα b) cotgα = . senα a) tgα =

c) sen2α + cos2α = 1.

3. Indicar los signos que adopta la cosecante de un ángulo en cada uno de los cuatro cuadrantes. 4. ¿Qué funciones trigonométricas son continuas?


TEOREMAS ANGULARES Y TRIANGULARES

f a e

c A

b B

d

Conceptos generales senα = En un triángulo existen seis elementos básicos: tres ángulos y tres lados. Una de las aplicaciones de la trigonometría consiste en obtener todos los elementos de un triángulo, conociendo sólo algunos de ellos. Se llama resolución de un triángulo al cálculo del valor de todos sus lados y ángulos. Antes de resolver triángulos, conviene analizar algunas relaciones de interés, como son las funciones circulares de la suma y diferencia de ángulos, así como del doble de un ángulo y su mitad. Las funciones trigonométricas no son funciones lineales, por lo que, por ejemplo, sen(α + β) ≠ senα + senβ (salvo que α = 0, que representa un caso particular y no se puede generalizar).

Operaciones con ángulos Suma de dos ángulos. Sean los ángulos α y β tales que AC puede verse que: α + β < π/2. Al trazar un arco senα = BG, senβ = CD cosα = OG, cosβ = OD sen (α + β) = CE cos (α + β) = OE Además: sen (α + β) = CE = CF + FE = CD + DH. Pero en el triángulo rectángulo OHD:

Y f (x)

h

O

a

x c x+ h

DH → DH = OD · senα = cosβ · senα OD

y en el triángulo rectángulo CFD, FCD = α, por lo que: cosα =

CF → = CF = CD · cosα = senβ · cosα CD

Así pues: sen (α + β) = cosβ · senα + senβ · cosα. Análogamente se obtiene la expresión para cos (α + β). El resto de las funciones trigonométricas resulta de aplicar los cocientes adecuados y desarrollar las expresiones en los casos en que se pueda: sen (α ± β) = senα · cosβ ± cosα · senβ cos (α ± β) = cosα · cosβ senα · senβ tgα ± tgβ tg (α ± β) = 1 – tgα · tgβ Doble del ángulo. Dado el ángulo α, y considerando que 2α = α + α, las relaciones trigonométricas del doble del ángulo son las siguientes: sen (2α) = 2 · senα · cosα cos (2α) = 2 · cos2α – sen2α 2tgα tg (2α) = 1 – tg2α Ángulo medio. Las relaciones trigonométricas de α/2 son las siguientes:

C 1 β α O

α F

B

sen

α =± 2

cos

α =± 2

tg

α =± 2

1 + cosα

D

E H GA suma de dos ángulos

X

1 – cosα 2

1 + cosα 2

1 – cosα

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


________________________________________________________________________________

Triángulos rectángulos

α a

β c

a = 12, b = 9,19, c = 7,71, α = 90º =, β = 50º, γ = 40º Conocidos la hipotenusa y un cateto, b. Usando senβ = b/a, se obtiene el ángulo β a partir de la función inversa, sen–1 b/a. Las funciones trigonométricas inversas se denominan con el prefijo arco (arco seno, arco coseno, etc.) y se representan, por ejemplo, como sen–1 (b/a) = arcsen (b/a). El tercer ángulo es γ = 90 – β y el tercer lado resulta de aplicar el teorema de Pitágoras:

C

A

B

c = a2 – b2

triángulo rectángulo

En el triángulo de la figura, senγ = c/a, por lo que c = a · senγ. Análogamente, senβ = b/a, con lo que b = a · senβ. En todo triángulo rectángulo, un cateto es igual al otro cateto multiplicado por la tangente del ángulo opuesto al primero:

Conocidos un cateto y un ángulo (fuera del ángulo recto). Si conocemos γ, puede calcularse β. La hipotenusa se obtiene a partir de senβ = b/a → a = b/senβ. Ahora se puede calcular c a partir del teorema de Pitágoras o c = a · senγ. Por ejemplo, para b = 29 y γ = 60º, tenemos: β = 90º – 60º = 30º

c tgγ = → c = b · tgγ b tgβ =

291

En resumen:

En cualquier triángulo rectángulo, un cateto es igual a la hipotenusa multiplicada por el seno del ángulo opuesto:

b

Teoremas angulares y triangulares

b → b = c · tgβ c

Además, en todo triángulo rectángulo un cateto es igual a la hipotenusa multiplicada por el coseno del ángulo comprendido entre ambos e igual al otro cateto multiplicado por la cotangente del ángulo adyacente al primero.

Casos de resolución de triángulos rectángulos Conocidos la hipotenusa y el ángulo γ (fuera del ángulo recto). El tercer ángulo, β, se obtiene sabiendo que en un triángulo la suma de los ángulos es 180º, por lo que β = 180º – 90º – γ = 90º – γ. Para calcular los catetos se usan las expresiones:

a=

29 b = = 58 senβ sen30º

c = 582 – 292 = 50,23 En resumen: a = 58, b = 29, c = 50,23, α = 90º, β = 30º, γ = 60º Conocidos los dos catetos. Sabemos que tgγ = c/b, por lo que γ = arcotg (c/b). β se obtiene por diferencia y la hipotenusa por el teorema de Pitágoras. Por ejemplo, los catetos de un triángulo rectángulo miden b = 80 y c = 60. Entonces, la hipotenusa vale a = 802 + 602 = 100 y los ángulos: y = arctg (60/80) = 36,87 y β = 90 – 36,87 = 53,13

c = a · senγ y b = a · senβ Por ejemplo, si a = 12 y γ = 40º, se obtiene el tercer ángulo: β = 90º – 40º = 50º y los catetos: c = a senγ = 12 · sen 40º = 7,71 b = a senβ = 12 · sen 50º = 9,19

Resumiendo: a = 100, b = 80, c = 60, α = 90º, β = 53,13º, γ = 36,87º

Casos de resolución de triángulos cualesquiera Para resolver los problemas referentes al cálculo de los elementos de un triángulo cualquiera es preciso establecer fórmulas que relaciones sus elementos entre sí. Teorema del seno. En el triángulo ∆ABC, tracemos las alturas h y h’ correspondientes a los lados c y a:


292

MATEMÁTICAS

______________________________________________________________________________________________

Análogamente:

C γ b

E

h' h

α c

A

b2 = a2 + c2 – 2ac · cosβ c2 = a2 + b2 – 2ab · cosγ

a β

D

B

demostración del teorema del seno

Estas expresiones constituyen el teorema del coseno, que es una extensión del teorema de Pitágoras al caso de triángulos cualesquiera. Con todo lo anterior, es posible resolver cualquier tipo de triángulo. En particular, pueden resolverse triángulos conociendo:

Se pueden observar las siguientes relaciones: – un lado y los ángulos adyacentes a él; – dos lados y el ángulo comprendido entre ellos; – dos lados y el ángulo opuesto a uno de ellos.

En ∆ACD, senα = h/b. En ∆DBF, senβ = h/a. Por tanto, h = b · senα = a · senβ → b/senβ = a/senα. En ∆AEC, senγ = h’/b. En ∆ABE, senβ = h’/c.

Los siguientes ejemplos darán una idea de cómo se opera en estos tres casos y tomarán como base el siguiente triángulo: C

Por tanto, h’ = b · senγ = c · senβ → = b/senβ = c/senγ.

γ

Así, reuniendo lo anterior, se obtiene el llamado teorema del seno:

b

a

a b c = = senα senβ senγ A

Teorema del coseno. Dado un triángulo ∆ABC cualquiera, tracemos la altura correspondiente al lado AB. Supongamos que la altura CM mide h, y descompongamos el lado AB en AM + MB = y + x. C

a h

α c

y

c

β

B

a) En el triángulo ABC se sabe que el lado a mide 2, y los ángulos α y β, 60º y 50º, respectivamente. Sabiendo que en un triángulo la suma de sus ángulos interiores es 180º, se obtiene: α = 180º – 60º – 50º = 70º

γ b

A

α

M

Por el teorema del seno: β

x

B

c a b = = senα senβ senγ

demostración del teorema del coseno

Se tienen las siguientes relaciones: En ∆CMB, por ser rectángulo, a2 = h2 + x2 = h2 – (c – y)2 = = h2 + c2 + y2 – 2cy En ∆ABC, también por ser rectángulo, h2 = b2 – y2. Además y = b · cosα. Sustituyendo, se tiene que: a2 = h2 + c2 – 2cy = = b2 – y2 + c2 + y2 – 2cb · cosα = = b2 + c2 – 2bc · cosα

pueden determinarse los otros dos lados: 2sen60º 2 b = →b= = 1,84 sen70º sen60º sen70º 2 c 2sen50º = →c= = 1,63 sen70º sen60º sen70º En resumen, en ∆ABC se tiene: a = 2, b = 1,84, c = 1,63, α = 70º, β = 60º, γ = 50º b) En ∆ABC se sabe que a = 3 y b = 5, además γ = 45º.


________________________________________________________________________________

Por el teorema del coseno: c2 = a2 + b – 2ab · cosγ = 9 + 25 – 2 · 3 · 5 · cos45º = 12,79 → → c = 12,79 = 3,58 Por el teorema del seno: a c 3 3,58 3 · sen45º = ↔ = ↔ senα = = 0,59 senα senγ senα sen45º 3,58 lo cual nos da el ángulo α: α = arcsen (0,59) = 36,39

Teoremas angulares y triangulares

293

de lo cual se deduce el ángulo α: α = arcsen (0,56) = 34,32º Usando la relación α + β + γ = 180º, se obtiene: γ = 180º – 34,32º – 70º = 75,68º Usando nuevamente el teorema del seno, se tiene que: c b c 5 = ↔ = ↔ senβ senγ sen70º sen75,68º ↔c=

5 · sen75,68º = 5,16 sen70º

Por otra parte: Entonces, en ∆ABC se tiene que: b c 5 3,58 5 · sen45º = ↔ = ↔ senβ = = 0,99 senβ senγ senβ sen45º 3,58

a = 3, b = 5, c = 5,16, α = 34,32º, β = 70º, γ = 75,68º

de lo que se deduce el ángulo β: β = arcsen (0,99) = 81,39 Resumiendo, en ∆ABC se tiene: a = 3, b = 5, c = 3,58 α = 36,39º, β = 81,39º, γ = 45º c) En el ∆ABC, a = 3, b = 5 y b = 70º. Por el teorema del seno: 3 · sen70º a b 3 5 = ↔ = ↔ senα = = 0,56 senα senβ senα sen70º 5

_ Preguntas de repaso 1. Sabiendo que cos90º = 0, calcular cos45º. 2. Sabiendo que un cateto mide 14 y la hipotenusa 18, calcular el valor del otro cateto y de los ángulos del triángulo rectángulo. 3. Resolver un triángulo no rectángulo sabiendo que uno de sus lados mide 6 y sus ángulos adyacentes son ambos de 60º.


Y f a e

A

b B

f (x)

ESTADÍSTICA

c

O

d

Conceptos generales

h a

x c x+ h

X

tender los resultados del muestreo a toda la población inicialmente considerada.

La estadística es una ciencia cuyo objeto es la obtención de interpretaciones y conclusiones a partir de series de datos extraídos de un experimento o prueba. El estudio estadístico se realiza sobre un conjunto de elementos de partida denominado población o universo, cuyo tamaño puede ser finito o infinito (en términos estrictos, ilimitado o extraordinariamente grande). Se conoce como muestra al subconjunto de una población sobre el que se aplica un estudio estadístico concreto. La muestra se caracteriza por su tamaño y se extiende a un ámbito de trabajo definido por leyes o propiedades determinadas que recibe el nombre de espacio muestral. Por su parte, se conoce como muestreo al conjunto de operaciones destinadas a obtener muestras significativas dentro de una población estadística. Cada ocurrencia de un espacio muestral se conoce como valor de muestra, y el número de veces que tiene lugar este valor en la muestra recibe el nombre de frecuencia absoluta del mismo. Como objetivo último, un estudio estadístico pretende, a partir de las conclusiones obtenidas de las muestras, ex-

Formas de representación de resultados Los resultados de un estudio estadístico pueden presentarse en forma de tablas que contengan el detalle o el resumen, según diversos criterios, de los valores de las muestras. Sin embargo, estos resultados suelen acompañarse de representaciones gráficas que ilustran y aclaran el significado de los valores y sus tendencias. Así, existen múltiples formas de diagramas y esquemas gráficos representativos de las distribuciones estadísticas. A grandes rasgos, estos esquemas pueden dividirse en: 1. Gráficas de distribución, entre las que se cuentan los diagramas de líneas, los gráficos de barras o histogramas y, las más habituales variedades de estos últimos, los diagramas de frecuencias acumuladas. Este tipo de representaciones resultan particularmente valiosas cuando se pretende conocer la evolución en el tiempo de una variable o un conjunto de variables estadísticas:

80 70 60 50 40 30 20 10 0 Valor 1

Valor 2

Valor 3

Valor 4

Valor 5

Serie 1 diagrama de líneas Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


____________________________________________________________________________________________________

Estadística

295

80 70 60 50 40 30 20 10 0 Valor 1

Valor 2

Valor 3

Valor 4

Valor 5

Serie 1 histograma o gráfico de barras

1,00 0,80 0,60 0,40

05 2,0

65 1,9

25 1,9

85 1,8

45 1,8

05 1,8

1,7

65

25 1,7

85 1,6

45 1,6

1,6

05

0,20

diagrama de frecuencias acumuladas

2. Gráficas de repartición, como los diagramas de tartas (o sectores) y de barras, cuyo fin es ilustrar los datos comparados de los diversos valores de una o varias series estadísticas: Valor 5 7% Valor 4 15%

Valor 1 24%

Valor 2 9%

Valor 3 45%

Medidas estadísticas Dada una determinada muestra estadística de variables numéricas, del análisis de los datos se desprenden diversos resultados. Un primer grupo de ellos, conocidos como medidas de tendencia central, ofrece una idea sobre los valores y las frecuencias más repetidos en la distribución. Sin embargo, los parámetros de tendencia central no son por sí mismos suficientes para expresar de forma sintética el contenido de la muestra. Como complemento a las medidas o parámetros de tendencia central, se manejan también las llamadas medidas de dispersión, que reflejan el ámbito de extensión de los resultados del muestreo y el grado de proximidad entre los mismos.

Medidas de tendencia central gráfico de tarta o de sectores

Como parámetros de tendencia central de un estudio estadístico se dispone básicamente de tres conceptos: la


296

MATEMÁTICAS

______________________________________________________________________________________________

moda, la mediana y la media. A su vez, pueden distinguirse cuatro clases de valores promedio, conocidos respectivamente como medias aritmética, geométrica, armónica y cuadrática. Moda es el valor de una muestra que se repite con mayor frecuencia. En un estudio estadístico pueden existir varias modas (esto es, varios valores con frecuencia máxima e igual), una moda o ninguna. Mediana es el valor que ocupa el lugar central en una muestra. En caso de que el número de observaciones de la muestra sea par, existirán dos medianas. Media aritmética de una distribución se define como el cociente entre la suma de todos sus valores y el número de sucesos u observaciones de la muestra. En términos matemáticos, dada una distribución {x1, x2,…, xn}, donde la frecuencia absoluta de cada suceso es f1, f2,…, y f n, respectivamente, la media aritmética se define como:

nocidos como medidas de dispersión, fundamentalmente el recorrido o amplitud, las desviaciones media y típica y la varianza. Recorrido es la diferencia existente entre los valores extremos de la muestra. En el ejemplo citado, en la primera muestra sería 9 – 1 = 8, y en la segunda 6 – 4 = 2, notablemente inferior. Desviación media de una distribución {x1, x2, …, xn}, donde la frecuencia absoluta de cada suceso es f1, f2, …, y fn, respectivamente, es la desviación global con respecto a la media aritmética de los valores de la distribución. En términos matemáticos, se expresa como: σm =

f1|x1 – x¯ a| + f2 |x2 – x¯ a| + … + fn |xn – x¯ a| = f1 + f2 + f3 + … + fn n

∑ fi|xi – x¯ a|

=

i=1

n

n

x1 f1 + x2 f2 + ... + xn fn = f1 + f2 + f3 + ... + fn

x¯a =

∑ xi fi

i=1

n

Media geométrica de una distribución es la raíz enésima del producto de todos sus valores, cada uno de ellos elevado a su frecuencia absoluta respectiva y siendo n el número total de sucesos de la distribución. En el mismo conjunto anterior, la media geométrica se definiría: n

x¯g = x1 · x2 … xn f f1

f2

n

Media armónica de la anterior distribución es el resultado de aplicar la siguiente expresión matemática:

Desviación típica o cuadrática de una distribución es la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones con respecto a la media de la distribución. Es decir:

σt =

n

∑ fi (xi – x¯ a)2

i=1

n

Varianza. La varianza de una distribución puede definirse como el cuadrado de la desviación típica o cuadrática. Es decir: n

x¯h =

f1 + f2 + … + fn

Media cuadrática de la distribución anterior será el resultado de la siguiente expresión matemática:

x¯ c =

V = σ t =

fn f2 f2 x2 + x2 + … + xn

n

∑ xi2 fi i=1 , siendo n = f1 + f2 + … + fn n

Medidas de dispersión Las medidas de centralización o de tendencia central expuestas en el apartado anterior no son suficientes para expresar los resultados de un estudio estadístico. Baste decir que las muestras {1, 5, 5, 9} y {4, 5, 5, 6} poseen iguales valores de moda, mediana y media aritmética, aun cuando en la primera serie los valores se hallen claramente más “dispersos” que en la segunda. Para conocer con mayor precisión el comportamiento de una muestra es preciso considerar los parámetros co-

∑ fi (xi – x¯ a)2

i=1

n

_ Preguntas de repaso 1. Sea la siguiente distribución estadística de valores: Valor 5 10 15 20 25

Frecuencia absoluta 3 4 2 2 1

Expresar gráficamente estos resultados. 2. Determinar las medidas de tendencia central de la distribución del ejercicio anterior. 3. En el ejercicio anterior, determinar las medidas de dispersión de la distribución.


f a e

c A

b B

Y

CÁLCULO COMBINATORIO

f (x)

O

d

Conceptos generales La combinatoria es la rama de las matemáticas que estudia las diferentes formas de agrupación y ordenación de los elementos de un conjunto. Se trata de una metodología para contar de manera sistemática, y sirve para resolver problemas del tipo de los siguientes: – ¿Cuántos números diferentes pueden escribirse usando los dígitos 2, 3 y 4? – ¿Cuántos números pueden escribirse usando los 10 dígitos del sistema decimal? – ¿Cuántas formas distintas adopta el código genético? – ¿Cuáles son las variaciones posibles cuando se dispone de ciertos gametos? Para ello se utilizan diversos conceptos, conocidos básicamente como variaciones, permutaciones y combinaciones.

Variaciones Dado un conjunto A con n elementos, se llama variaciones de los n elementos tomados de k en k a las distintas ordenaciones de los n elementos tomados en grupos de k, de modo que cada una de ellas difiera de las restantes en alguno de los elementos que la componen o en su orden de colocación. El número de variaciones se representa por Vnk y viene dado por: Vnk =

n! (n – k)!

h a

x c x+ h

X

Por ejemplo, si se quiere realizar una ordenación de las 26 letras del alfabeto en grupos de a 2, se tendrá que: V262 =

26! = 26 · 25 = 650 (26 – 2)!

Variaciones con repetición. Las variaciones con repetición de n elementos tomados de k en k son las ordenaciones de elementos de un grupo, permitiéndose la repetición de los mismos. Se representan por VRnk. En el caso de las variaciones con repetición, una ordenación se distingue de las restantes por los elementos que la constituyen o por su orden. El número de variaciones con repetición viene dado por: VRnk = nk En este caso, por permitirse la repetición, el valor de k puede ser mayor, menor o igual que el de n. Por ejemplo, el total de variaciones con repetición que se podrían hacer con los números 1, 2, 3 y 4, tomando conjuntos de dos elementos es: VR42 = 24 = 16 y son las siguientes: 11 12 13 14

21 22 23 24

31 32 33 34

41 42 43 44

Permutaciones

Es decir, es igual al cociente entre el factorial del número total de elementos disponibles y el factorial del número de elementos que no participan en la ordenación. El factorial de un número n, representado por n!, equivale a:

Las permutaciones son las agrupaciones o variaciones sin repetición que pueden formarse con todos los elementos de un conjunto. Se denotan por Pn y su número viene dado por Pn = n! Así, por ejemplo, el número de permutaciones que se puede hacer con los elementos del conjunto {a, b, c, d} es:

n! = n (n – 1) (n – 2) … 1

P4 = 4! = 24

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


298

MATEMÁTICAS

______________________________________________________________________________________________

Dichas permutaciones son las siguientes: abcd, abdc, acbd, acdb, adbc, adcb, bacd, badc, bcad, bcda, bdac, bdca, cabd, cadb, cbad, cbda, cdab, cdba, dabc, dacb, dbac, dbca, dcab, dcba Permutaciones con repetición. Dado un conjunto A de elementos: {a1, a2, …, an}, las permutaciones con repetición de orden k1, k2, … kn, son las agrupaciones de los elementos de A tales que a1 se repita k1 veces; a2, k2 veces; …; an, kn veces. Se representan por PRpk1, k2, …, kn, donde:

Estas combinaciones son las siguientes: 3, 5, 7; 3, 5, 11; 3, 5, 14; 3, 7, 11; 3, 7, 14; 3, 11, 14; 5, 7, 11; 5, 7, 14; 5, 11, 14; 7, 11, 14 El número Cnm se suele expresar también de la forma: C mn = ( mn ) El término de la derecha recibe el nombre de número combinatorio. Para el cálculo de las combinaciones pueden ser útiles las propiedades de los números combinatorios:

k1 + k 2 + … + k n = p Entonces, el número de permutaciones con repetición viene dado por: PR pk1, k2, … , kn

p! = k1! · k2!, …, kn!

Por ejemplo, si se quieren hacer permutaciones de los elementos del conjunto {a, b, c, d}, pudiéndose repetir la letra a 3 veces, y la d, 2, el total de posibilidades es: PR73, 1, 1, 2 =

7! = 1.680 3! · 1! · 1! · 2!

( n0 ) = 1 ( n1 ) = n ( nn ) = 1 ( mn ) = ( n –nm ) ( mn ) = ( m –n 1 ) + ( n m+ 1 ) ( mn ) = ( np –– 11 ) + ( np –– 21 ) + … + ( pp –– 11)

Por ejemplo: aaabcdd, aaacbdd, aaacdbd, adadcba… Por otra parte, el número de permutaciones de los elementos del conjunto {a, a, a, b, c, c} está dado por: PR3,6 1, 2 =

6! = 60 3! · 1! · 2!

Combinaciones Dado un conjunto A, las combinaciones de sus n elementos tomados de m en m son el número de subconjuntos de tamaño m que se pueden formar, considerando que dos subconjuntos son diferentes cuando difieren en al menos un elemento, pero no en el orden en que están los mismos. Se representan por Cnm. Su valor numérico viene dado por:

C nm

n! n! Vmn (n – m)! = = = m! (n – m)! Pm m!

Por ejemplo, el número de maneras en que se pueden extraer tres elementos del conjunto {3, 5, 7, 11, 14} es: C 53 = 5! = 10 3! · 2!

_ Preguntas de repaso 1. De un grupo de veinte personas, se designa un comité de tres. ¿De cuántas maneras es posible hacerlo? 2. ¿Cuántos números de tres cifras diferentes pueden escribirse con los dígitos 3, 4 y 5? 3. ¿De cuántas maneras diferentes pueden colocarse en una estantería 4 libros blancos, 3 rojos y 5 negros? 4. Hay 3 libros de estadística, 2 de matemáticas y 4 novelas. ¿De cuántas maneras se pueden colocar en una librería si los libros sobre el mismo tema deben quedar juntos? 5. ¿De cuántas maneras diferentes pueden sentarse seis personas en una mesa redonda? 6. ¿Cuántos números pares de 3 cifras diferentes pueden escribirse con los dígitos 0, 1, 2, 3, 4 y 5?


Y f a e

c A

b B

f (x)

PROBABILIDAD O

d

Conceptos generales Cada vez que se realiza un experimento, se obtiene un resultado. Cuando dicho resultado se puede predecir exactamente, se dice que el experimento es determinístico; en cambio, si no se puede predecir, pero sí enumerar todos los resultados posibles, el experimento se llama aleatorio. El conjunto de todos los resultados posibles recibe el nombre de espacio muestral y se representa por Ω. Los subconjuntos del espacio muestral se denominan sucesos o eventos, y se representan por las primeras letras mayúsculas del alfabeto: A, B, C, etc. Estos sucesos pueden ser analizados por medio de la teoría de conjuntos. En particular, son de interés para la teoría de las probabilidades las siguientes propiedades de los conjuntos: 1. A B se compone de todos los elementos que están en A, en B o en ambos conjuntos a la vez. 2. A B se compone de todos los elementos que se encuentran en A y en B al mismo tiempo. 3. A y B se dice que son excluyentes, disjuntos o incompatibles cuando carecen de elementos en común, es decir, A B = ∅. 4. Ac es el conjunto complementario de A y contiene todos los elementos del espacio muestral que no están en A. Así, por ejemplo, si se tiene una caja con 12 fichas numeradas y se extrae una, el espacio muestral estará formado por todos los posibles números que se pueden extraer: Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} Sea A el suceso “se extrae una ficha mayor que 5”, y B, “la ficha extraída es de número par”. Entonces: A = {6, 7, 8, 9, 10, 11, 12} B = {2, 4, 6, 8, 10, 12} A B = {2, 4, 6, 7, 8, 9, 10, 11, 12} A B = {6, 8, 10, 12} Ac = {1, 2, 3, 4, 5}

h a

x c x+ h

X

Probabilidad de un suceso Realizado un experimento aleatorio, a cada suceso A se le hace corresponder un número P(A), llamado probabilidad del suceso A, que obedece las siguientes propiedades: 1. P(A) ≥ 0 (de hecho, es 0 cuando A = ∅, es decir, el suceso es el conjunto vacío). 2. P(A) = 1 si y sólo si A = Ω (es decir, el suceso es todo el espacio muestral). 3. Para dos sucesos excluyentes cualesquiera A y B, P(A B) = P(A) + P(B). Como consecuencia inmediata de esta definición, se puede concluir que P(A Ac) = P(A) + P(Ac) = 1. Esta propiedad se utiliza generalmente cuando por problemas de cálculos es más fácil calcular la probabilidad de Ac que de A, en cuyo caso P(A) = 1 – P(Ac). Analógicamente, en un experimento aleatorio que puede generar varios sucesos igualmente probables, llamados equiprobables, se define la probabilidad como: p=

número de casos favorables número de casos posibles

Por otra parte, la probabilidad de un suceso A cualquiera asociado a un espacio muestral Ω viene dada por: P(A) =

≠A ≠Ω

En el ejemplo en que se extrae una ficha de una caja con 12 numeradas, se tiene que: ≠ Ω = 12 ≠A = 7 ≠B = 6

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).


300

MATEMÁTICAS

______________________________________________________________________________________________

Así: P(A) = 7/12 P(B) = 0,5 A su vez, puede calcularse: P(A B) = 9/12 P(A B) = 4/12 P(Ac) = 1 – 7/12 = 5/12

Por ejemplo, supongamos que se lanza un dado dos veces. Sea A el suceso “sale un 6 en el primer lanzamiento”, y B, “sale un 6 en el segundo lanzamiento”. Como el espacio muestral está formado por todos los resultados posibles al lanzar el dado, P(A) = 1/6 y P(B) = 1/6. Así, al ser independientes los resultados del primer y segundo lanzamiento, P(A B) = P(A) · P(B) = 1/36. Teorema de la probabilidad total. Supongamos que un espacio muestral está compuesto por n sucesos disjuntos A1, A2, …, An:

Por otra parte, si A y B son dos sucesos cualesquiera, se tendrá que:

A3 A1

P(A B) = P(A) + P(B) – P(A B) En el ejemplo anterior, sería:

A6

A4

A2

A5 A

B

A1

A

P(A B) = 7/12 + 6/12 – 4/12 = 9/12

A9 A10

P(A|B) =

P(A B) P(B)

Volviendo al ejemplo de las fichas numeradas del 1 al 12, calculemos P(A|B), es decir, la probabilidad de que salga una ficha mayor que 5, sabiendo que es par:

P(A|B) =

4/12 2 = 1/2 3

A7

A8

Probabilidad condicional. Supongamos que tenemos los sucesos A y B asociados a cierto espacio muestral Ω. Se define la probabilidad de A condicionada a B (sabiendo que ha ocurrido B) como:

Ai

espacio muestral

Entonces, la probabilidad de un suceso cualquiera se puede calcular a partir de: P(B) = P(B|A1) · P(A1) + P(B|A2) · P(A2) + … + P(B|An) · P(An) Un caso particular se tiene cuando Ω se descompone en A y Ac. Entonces, la probabilidad de un suceso cualquiera del mismo espacio muestral viene dada por: P(B) = P(B|A) · P(A) + P(B|Ac) · P(Ac)

Se dice que los sucesos A y B son independientes si se cumple que P(A B) = P(A) · P(B). En términos de probabilidad condicional, A y B son independientes si: P(A|B) = P(A) P(B|A) = P(B) A

B

A

c

En el ejemplo anterior, los sucesos A y B no son independientes. Se tienen así dos formas de calcular P(A B): 1. Si A y B son dos sucesos cualesquiera, entonces sucede que: P(A B) = P(A|B) · P(B), o bien P(A B) = P(B|A) · P(A). 2. Si A y B son independientes, entonces: P(A B) = P(A) · P(B).

Por ejemplo, supongamos que en un curso el 60% de los alumnos disponen de una calculadora para los exá-


__________________________________________________________________________________________________

menes. De los que tienen calculadora, el 90% acaba un determinado examen a tiempo, y de los que no la tienen, sólo el 30% termina a tiempo. Calculemos la probabilidad de que un alumno determinado acabe el examen a tiempo. Si no sabemos de antemano si tiene o no calculadora, podemos usar el teorema de la probabilidad total. Definamos los sucesos: A: el alumno tiene calculadora. B: el alumno acaba el examen a tiempo. Por tanto, Ac es el suceso “el alumno no tiene calculadora”. Queremos calcular P(B). Por el teorema tenemos que: P(B) = 0,9 · 0,6 + 0,3 · 0,4 = 0,66 Teorema de Bayes. Dada la situación anterior, es decir, Ω formado por n sucesos disjuntos (a lo que se denomina partición), supongamos ahora que sabemos que el suceso B ha ocurrido y queremos calcular la probabilidad de que ocurra alguno de los sucesos de la partición, digamos Ai; entonces, por definición de probabilidad condicionada, tenemos que: P(Ai|B) = P(Ai B) y utilizando la misma definición en el numerador y el teorema de la probabilidad total en el denominador, se obtiene la fórmula siguiente, conocida como teorema de Bayes: P(B|Ai) · P(Ai) P(Ai|B) = P(B|Ai) · P(Ai) + … + P(B|An) · P(An) De ella también se obtiene el siguiente caso particular:

P(A|B) =

P(B|A) · P(A) P(B|A) · P(A) + P(B|Ac) · P(Ac)

En el ejemplo de los alumnos con y sin calculadora, supongamos que se escoge un alumno y se observa que ha

Probabilidad

301

acabado el examen; calculemos la probabilidad de que haya usado calculadora: P(A|B) =

0,54 0,90 · 0,60 = = 0,82 0,90 · 0,60 + 0,30 · 0,40 0,66

_ Preguntas de repaso 1. Se fabrican artículos hasta producir diez no defectuosos. Se cuenta el número total de artículos manufacturados. Describir el espacio muestral asociado a este experimento. 2. Un alumno se presenta a un examen sin haber estudiado. El examen consta de diez preguntas, cada una con cuatro alternativas. El alumno escoge al azar una alternativa en cada pregunta. ¿Cuál es la probabilidad de que conteste exactamente la mitad en forma correcta? 3. Una caja contiene dos bolitas blancas y tres negras. Se extraen simultáneamente dos, se examinan sus colores y se devuelven a la caja. Calcular la probabilidad de tener que repetir la operación más de una vez para lograr observar dos bolitas blancas. 4. Las máquinas A y B, de igual capacidad de producción diaria, elaboran en promedio un 5% y un 10% de piezas defectuosas. Se extrae una pieza de la producción de un día al azar. Calcular la probabilidad de que sea defectuosa. 5. En el ejercicio anterior, si se observó que la pieza no era defectuosa, calcular la probabilidad de que haya sido producida por la máquina A. 6. En el ejercicio anterior, si se observan dos piezas y se ve que no son defectuosas, calcular la probabilidad de que hayan sido producidas por la máquina A.


VARIABLES ALEATORIAS

f a e

c A

b B

h

O

Las variables aleatorias discretas se suelen representar en tablas de distribuciones de probabilidad o por su función de cuantía [P(X = x)]. Por ejemplo, construyamos una tabla de distribución de probabilidades donde X es el número que sale al lanzar un dado. X toma los valores 1, 2, 3, 4, 5 y 6, todos ellos con igual probabilidad, lo que se resume en la siguiente tabla:

| | | | | | 2 1 6

3 1 6

x c x+ h

X

4 1 6

5 1 6

probabilidad

0,15 0,1 0,05 0 1

2

3

4

5

6

caras del dado

Variables aleatorias continuas Las variables aleatorias continuas se representan por medio de las funciones de densidad. Una función f(x) se dice que es de densidad si cumple con los siguientes requisitos:

Variables aleatorias discretas

1 1 6

a

0,2

Cuando un espacio muestral está formado por números, es decir, se puede construir un isomorfismo entre Ω y S, donde S R, se dice que los resultados posibles son variables aleatorias. Las variables aleatorias se suelen representar por las últimas letras mayúsculas del alfabeto (X, Y, Z) y los valores que pueden tomar se denotan por las mismas letras, pero minúsculas (x, y, z). Al conjunto de X y sus probabilidades se le llama distribución. Según los valores que pueden tomar las variables aleatorias, éstas se clasifican en discretas y continuas.

P(X = x)

f (x)

d

Conceptos generales

x

Y

6 1 6

a) f(x) ≥ 0; esto es, la función es positiva. b) - f(x) dx = 1; es decir, la probabilidad total de la función extendida a todo el conjunto de los números reales es igual a la unidad. La segunda condición indica también que el área bajo la curva es 1. Como se trata de una variable continua, el área bajo un punto es nula, por lo que no tiene sentido calcular probabilidades puntuales. Se suelen calcular, en cambio, probabilidades de intervalos según el área comprendida bajo el intervalo dado. Por ejemplo, la función f(x) = 3x2 para 0 ≤ x ≤ 1 es la función de densidad que se puede ver en el siguiente gráfico: f(x)

En una tabla de distribución de probabilidades, siempre se cumple que

3

n

∑ P(X = xi) = 1

i=1

Gráficamente, la tabla del ejemplo se puede representar como sigue:

0

1

Fotografías de cabecera: relación de pertenencia entre dos conjuntos (izq.) y representación cartesiana de una función en geometría analítica (der.).

x


____________________________________________________________________________________________

Si se quiere calcular, por ejemplo, P (0,3 ≤ x ≤ 0,6), basta con determinar el área entre 0,3 y 0,6:

303

Variables aleatorias

cuyo gráfico es: F(x)

2 3 0,6 P (0,3 ≤ x ≤ 0,6) = 0,6 0,3 3x dx = [x ]0,3 = 0,189

Función de distribución

1

Se llama función de distribución F(x) de una variable aleatoria a la función de probabilidad acumulada P(X ≤ x): j

P(X = xi) si x es discreta y F(x) = - x f(x)dx si x es F(xj) = i∑ =1 continua. F(x) se suele escribir por intervalos. Por ejemplo, para la variable aleatoria discreta definida en el ejemplo anterior, se tiene que:

0

x

1

Cuando X es variable aleatoria continua, se pueden calcular probabilidades de intervalos usando la siguiente propiedad:

0 si x < 1 1 6 2 6 3 6 4 6 5 6

F(x) =

P(a ≤ X ≤ b) = F(b) – F(a)

si 1 ≤ x < 2

Por ejemplo, P(0,3 ≤ X ≤ 0,6) puede calcularse también:

si 2 ≤ x < 3 si 3 ≤ x < 4

P(0,3 ≤ X ≤ 0,6) = F(0,6) – F(0,3) = 0,63 – 0,33 = 0,189

si 4 ≤ x < 5

La esperanza matemática si 5 ≤ x < 6 Dada una variable aleatoria definida por una distribución de probabilidades o una función de densidad, la esperanza matemática, o esperanza simplemente, es el valor medio de la distribución:

1 si x ≥ 6 con la siguiente representación gráfica:

E(X) = 1 0,83

n

∑ xi · P(X = xi) (variable discreta)

i=1

- x · f(x) dx (variable continua)

Para los ejemplos anteriores, en el primer caso se tiene:

0,67 0,5

E(X) = 1 ·

0,33 0,17

1 1 1 1 1 1 +2· +3· +4· +5· +6· = 3,5 6 6 6 6 6 6

y en el segundo: 0

1

2

3

4

5

6

E(X) = 10 3x3dx = Y para la variable aleatoria continua definida antes, se tiene que:

F(x) =

0 si x < 0 x3 si 0 ≤ x < 1 1 si x ≥ 1

1

[ ] = 34 3x4 4

0

La varianza En términos de variable aleatoria, se define la varianza como la media de las desviaciones cuadráticas de X a E(X), es decir: V(X) = E[X – E(X)]2.


304

MATEMÁTICAS

______________________________________________________________________________________________

A efectos de cálculo, puede ser útil la siguiente fórmula:

La esperanza de una distribución de Bernoulli es p y su varianza p · q. En el ejemplo:

V(X) = E(X2) – [E(X)]2 E(X) = 1/6 y V(X) = 5/36 Al término E(X2) se le llama segundo momento de X y se calcula de forma análoga a E(X):

2

E(X ) =

Distribución binomial

n

∑ x2i · P(X = xi) (variable discreta)

i=1 - x2

· f(x) dx (variable continua)

Por ejemplo, calculemos la varianza para los dos ejemplos utilizados: 1 1 1 1 1 1 1.º E(X2) = 1 · + 4 · + 9 · + 16 · + 25 · + 36 · = 6 6 6 6 6 6 = 15, 17. Entonces, V(X) = 15,17 – 3,52 = 2,92. 3 2.º E(X2) = 10 3x4 dx = . 5 3 3 2 Por tanto, V(X) = – ( ) = 0,0375. 5 4

Distribuciones estadísticas Existen distribuciones estadísticas que en general tienen un comportamiento similar y que se distinguen entre sí por los parámetros que las definen.

Supongamos que un experimento de Bernoulli se repite n veces bajo las mismas condiciones. Nos interesa ahora el número de éxitos en esos n ensayos independientes. La distribución que define la variable aleatoria X que describe el número de éxitos en los ensayos independientes se conoce como binomial, y depende de dos parámetros: el número de repeticiones n y la probabilidad de éxito p en cada ensayo. Se representa por X ~ B(n, p), y su función de cuantía viene dada por: P(X = x) = (nx) · px · qn – x; x = 0, 1, 2, …, n Por ejemplo, calculemos la probabilidad de que al lanzar un dado diez veces, salga cinco veces el 6. En este caso, X ~ B(10, 1/6) y P(X = 5) = ( 10 ) · ( 1 )5 · ( 5 )5 = 0,0130 5 6 6 En una distribución binomial, la esperanza es n · p, y la varianza, n · p · q. En el ejemplo, como promedio saldrán E(X) = 10 · 1/6 = 1,67 “seises” en diez lanzamientos, con varianza igual a:

Distribución de Bernoulli Cuando, al realizar un experimento, la variable aleatoria sólo puede tomar dos valores, llamados éxito o fracaso, y representados por 1 y 0, en que el éxito sucede con probabilidad p y el fracaso con probabilidad q = 1 – p, se dice que X obedece a una distribución de Bernoulli de parámetro p –denotado X ~ Ber(p)–. La prueba realizada recibe el nombre de experimento de Bernoulli. La tabla de distribución de probabilidades es la siguiente: x P(X = x)

| | 0 p

1 q

De forma análoga, su función de cuantía viene dada por P(X = x) = px · q1 – x; x = 0, 1. Por ejemplo, supongamos que al lanzar un dado nos interesa que salga el 6. Entonces X ~ Bern(1/6), con la tabla siguiente: x P(X = x)

| | 0 1 6

1 5 6

V(X) = 10 ·

1 5 · = 1,39 6 6

Distribución de Poisson Si un experimento de Bernoulli se repite indefinidamente en un intervalo continuo (p. ej., en un período de tiempo), se dice que la variable aleatoria X “número de éxitos en el intervalo” sigue una distribución de Poisson con parámetro λ –simbolizada por X ~ P(λ)–, donde λ es una media conocida. Su función de cuantía es: P(X = x) =

λx · e-λ x!

; x = 0, 1, 2, …

Además, si X ~ P(λ), se tiene que E(X) = V(X) = λ (la distribución de Poisson es la única distribución cuya esperanza y varianza coinciden). Como ejemplo de una distribución de Poisson, consideremos el número de llamadas a una centralita en una


____________________________________________________________________________________________

hora. Supongamos que se sabe que en promedio se realizan cuarenta llamadas. Calculemos la probabilidad de que en una hora se produzcan 43 llamadas: P(X = 43) =

4043 · e–40 43!

= 0,054

También se puede calcular la probabilidad de que en media hora se produzcan sólo quince llamadas. Para esto ha de tenerse en cuenta que si en una hora se realizan en promedio cuarenta llamadas, en media hora es de esperar que haya veinte. Representemos por Y a la variable aleatoria “número de llamadas en media hora”. Entonces Y ~ P(20) y: P(Y = 15) =

2015 · e–20 15!

Variables aleatorias

305

Si, por ejemplo, se sabe que de cierta estación sale un tren cada diez minutos, al llegar en un momento cualquiera una persona puede suponer que el tiempo x de espera hasta que salga el próximo tren es una variable aleatoria distribuida uniformemente en el intervalo (0, 10). Por tanto, la probabilidad de que tenga que esperar menos de tres minutos hasta que pase el próximo tren sería: 3

[ ]

P(X < 3) = 30 1 dx = x = 0,3 10 10 0 El valor esperado de una variable uniforme en (a, b) es E(X) = a + b/2, y la varianza V(X) = (b – a)2/12. En el ejemplo, la persona tendrá que esperar en promedio cinco minutos, con una varianza de 8,3.

= 0,052

Distribución exponencial Se puede demostrar que, cuando n es grande, la distribución binomial tiende a aproximarse a la de Poisson con parámetro λ = n · p. Por tanto, se suele utilizar esta aproximación cuando, por la magnitud de n, los cálculos resultan muy prolijos si se utiliza directamente una distribución binomial.

Distribución geométrica Si se repite el mismo experimento de Bernoulli hasta obtener éxito por primera vez, la distribución se llama geométrica y se representa por X ~ G(p). Su función de cuantía viene dada por P(X = x) = qx – 1 · p; x = 1, 2, 3, … En virtud de esta definición, para tener éxito en el ensayo es necesario haber tenido fracasos en los x – 1 ensayos anteriores. No se conoce el valor máximo de x, ya que se podría estar repitiendo el experimento indefinidamente y no ganar nunca, como suele ocurrir en el juego de la lotería: Si X ~ G(p), entonces E(X) =

q 1 y V(X) = 2 p p

Por ejemplo, si lanzamos un dado hasta que aparezca el 6, necesitaremos hacer seis lanzamientos en promedio, con una varianza igual a 30.

Distribución uniforme

Se dice que el intervalo continuo existente entre dos éxitos consecutivos tiene distribución exponencial con parámetro λ, lo que se suele representar por X ~ exp(λ). Esta distribución se puede obtener a partir de una distribución de Poisson en que en un intervalo continuo se producen 0 éxitos. Su función de densidad viene dada por: f(x) = λ · e–λx; x ≥ 0 Además, si X ~ exp(λ), entonces E(X) = 1/λ y V(X) = 1/λ2 (la distribución exponencial es la única distribución cuya varianza es igual al cuadrado de su esperanza). Por ejemplo, supongamos que el tiempo medio entre llamadas a una centralita es de 1,5 minutos; entonces: X ~ exp(1/1,5). La distribución exponencial posee la “propiedad de falta de memoria”: sabiendo que un éxito no ha sucedido en un tiempo t, la probabilidad de que suceda en un tiempo adicional x es la probabilidad de que suceda en un tiempo x sin considerar que no haya sucedido en el tiempo t. Analíticamente, esta propiedad se puede escribir de la siguiente forma: P(X < t + x | X > t) = P(X < x)

Se dice que X obedece a una distribución uniforme en el intervalo (a, b) [X ~ U(a, b)] si, en cualquier momento de dicho intervalo, la variable puede suceder con igual probabilidad –el intervalo puede ser cerrado también, es decir [a, b]–. Su función de densidad viene dada por:

Por ejemplo, supongamos que en el caso de la centralita no se han producido llamadas durante dos minutos; la probabilidad de que se realice una llamada dentro de los próximos tres minutos viene dada por:

f(x) = 1 ; x (a, b) b–a

P(X < 5 X > 2) = P(X < 3) = 30 (1/1,5) · e–x/1,5 dx = 0,86


306

MATEMÁTICAS

______________________________________________________________________________________________

Distribución normal o de Gauss Considerada muchas veces como una de las distribuciones más importantes, la distribución normal depende de dos parámetros: la media aritmética µ y la varianza σ2. Se presenta cuando se tiene una gran cantidad de medidas referidas a individuos con características similares, por ejemplo las estaturas de los niños de diez años, el tiempo de respuesta a una pregunta, etc. Se representa por medio de X ~ N(µ; σ), y su función de densidad es la siguiente: 1

– ( 1 f(x) = ·e 2 2 πσ

x–µ 2 ) σ ;

– < x <

Una característica importante de esta distribución es que es simétrica con respecto a la media. A su gráfica se le suele llamar “campana de Gauss”. El siguiente gráfico es un ejemplo de una distribución normal N(0, 10):

0,04

Otra característica importante es que la distribución normal se puede utilizar para aproximar otras distribuciones cuando se dispone de una muestra muy grande. En particular, si X ~ B(n, p) y n es lo suficientemente elevado como para que los cálculos directos sean muy complejos (digamos n ≥ 60), entonces se puede usar la aproximación X ~ N(np; n p q) y efectuar los cálculos a partir de la distribución normal estándar. Esta aproximación puede resultar adecuada incluso cuando n no es muy grande, pero p es cercano a 1/2. Por ejemplo, si X ~ B(25; 0,48) y se quiere calcular P(11 ≤ X < 15), mediante cálculos directos resulta 0,5664, y utilizando la aproximación normal, el resultado nos da 0,5403.

_ Preguntas de repaso 1. Construir la tabla de distribución de probabilidades para la variable aleatoria “suma de las caras al lanzar un dado dos veces”. Calcular la esperanza y la varianza.

0,03 0,02 0,01 0 –50 –40 –10

10

30

50

2. Suponiendo que X está definida por la función f(x) = k · (x – 2) para 2 ≤ x ≤ 5, calcular k de modo que f(x) sea función de densidad; calcular también su función de distribución, su esperanza y su varianza.

distribución normal o campana de Gauss

3. Si X ~ B(150; 0,2), calcular: Un caso particular de la distribución normal se produce cuando se tiene una media µ = 0 y una varianza σ2 = 1. De cualquier distribución normal se puede llegar a una Z ~ N(0; 1) mediante la transformación Z = X – µ/σ, proceso que se llama estandarización de X. Se dice, entonces, que Z tiene distribución normal estándar o típica. Existen tablas de las que es posible extraer probabilidades acumuladas P(Z ≤ z). Así, se pueden calcular probabilidades de cualquier distribución normal simplemente por estandarización y consulta en tabla. Por ejemplo, supongamos que la estatura X de los niños de diez años sigue una distribución normal con media 1,20 m y varianza 0,40 m al cuadrado. Si se escoge un niño al azar, calculemos la probabilidad de que mida a lo sumo 1,30 m. Como X ~ N(1,20; 0 ,4 0 ), se tiene que: 1,30 – 1,20 P(X ≤ 1,30) = P(Z ≤ ) = P(Z ≤ 0,16) = 0,5636 0,40 donde 0,5636 se obtuvo a partir de una tabla N(0; 1).

a) P(X > 30). b) P(25 < X < 42). c) P(X = 29). 4. Calcular la probabilidad de necesitar exactamente diez lanzamientos de una moneda para obtener seis caras, si en los tres primeros aún no se ha obtenido ninguna cara. 5. Una cajera de supermercado atiende a los clientes con un tiempo de servicio exponencial de valor esperado de dos minutos por persona. Una persona que está en octavo lugar para pagar, ¿cuál es la probabilidad de que tenga que esperar más de diez minutos para ser atendida? 6. Una variable aleatoria X está distribuida uniformemente con media 6 y varianza 0,75. Calcular la probabilidad de que x2 – 9x + 20 sea negativo.


GLOSARIO

Álgebra: Rama de las matemáticas que se dedica al estudio de las estructuras algebraicas, entendidas éstas como generalizaciones abstractas de los conjuntos aritméticos. Álgebra de Boole: Sistema lógico simbólico definido por el filósofo inglés George Boole a mediados del siglo XIX para representar las relaciones entre conceptos, entidades y objetos. Se basa en el empleo de estructuras sobre las que se definen dos operaciones internas binarias conmutativas (normalmente llamadas suma y producto o multiplicación) que verifican ciertas reglas. El álgebra de Boole constituye la base del cálculo de probabilidades y la lógica informática. Análisis matemático: Rama de las matemáticas aplicada a la resolución de problemas mediante métodos de aproximación. Tradicionalmente, se ha dividido en cálculo infinitesimal, análisis de funciones, ecuaciones diferenciales e integrales, etc. Ángulo: Figura geométrica formada por dos semirrectas que se cortan en un punto llamado vértice. Anillo: Estructura algebraica que, con respecto a dos operaciones internas definidas sobre la misma, cumple las propiedades siguientes: a) es un grupo conmutativo con respecto a la primera operación; b) tiene estructura de semigrupo para la segunda operación, y c) la segunda operación cumple la propiedad distributiva con respecto a la primera. Aplicación: Correspondencia entre dos conjuntos o estructuras algebraicas, de modo que a cada elemento del conjunto origen le corresponde uno y sólo un elemento en el conjunto imagen. Aritmética: Parte de las matemáticas que se dedica al estudio de los números, sus relaciones y sus operaciones, aplicada a la resolución de problemas. Asociatividad: Propiedad de los conjuntos matemáticos por la cual, tomados tres de sus elementos a, b y c, se verifica que el resultado de operar un elemento a con la operación de un elemento b con c es igual al que se obtiene al operar primero a con b y el resultado de tal operación con c. Base: En estructuras matemáticas, colección de elementos a partir de la cual es posible generar todos los restantes elementos que integran un conjunto dado. Cálculo infinitesimal: Rama de las matemáticas dedicada al estudio de las funciones diferenciales e integrales. Cardinal: Número de elementos de un conjunto.

Combinación: Dado un conjunto de m elementos, se llaman combinaciones de los m elementos tomados de n en n a los distintos grupos que pueden formarse de n elementos tales que cada grupo difiere de los restantes en el contenido, con independencia de su orden de colocación. Combinatoria: Rama de las matemáticas especializada en el estudio de las permutaciones, las combinaciones, las variaciones y los números combinatorios. Complementariedad: Dos conjuntos se dicen complementarios cuando: a) la intersección entre ambos es nula; b) su unión forma el conjunto universal. Cónica: Curva geométrica plana generada por una ecuación de segundo grado. Una cónica se suele definir como el lugar geométrico de los puntos cuya relación de distancias a un punto fijo llamado foco y a una recta denominada directriz es una constante. Gráficamente, las cónicas pueden construirse mediante la intersección de un cono de revolución con un plano que no corta al cono por su vértice. Existen tres grandes familias de cónicas: elipses (entre las que se incluyen las circunferencias), parábolas e hipérbolas. Conjunto: Estructura algebraica constituida por una reunión de elementos que comparten unas características comunes. Cuando dicho conjunto contiene todos los elementos del espacio de referencia se denomina universal; por el contrario, si no contiene ningún elemento se dice vacío. Conjuntos disjuntos: Dícese de dos o más conjuntos cuyas intersecciones son conjuntos vacíos. Conmutatividad: Propiedad de una operación definida en una estructura algebraica por la cual el orden en que se toman los operandos no afecta al resultado final. Continuidad: Propiedad de las funciones matemáticas que puede expresarse intuitivamente como la ausencia de saltos bruscos e interrupciones en su representación gráfica en un sistema de coordenadas. Según una definición topológica más estricta, es continua toda función definida sobre un conjunto cerrado de elementos que, a su vez, es también cerrada. Correspondencia: Relación establecida entre dos conjuntos o estructuras algebraicas: el de partida se denomina origen, y el de llegada se conoce por conjunto imagen. Cosecante: En trigonometría, función inversa del seno de un ángulo.


308

MATEMÁTICAS

______________________________________________________________________________________________

Coseno: En un triángulo rectángulo, razón entre el cateto contiguo a un ángulo dado y la hipotenusa del triángulo. Cotangente: Razón trigonométrica existente entre el coseno y el seno de un ángulo. Valor inverso de la tangente. Cuerpo: Conjunto algebraico con definición de dos operaciones internas, llamadas suma y multiplicación o producto, tales que: a) el conjunto tiene estructura de anillo con respecto a estas dos operaciones; b) todo elemento del anillo, salvo el elemento neutro de la suma, posee un elemento inverso según la multiplicación. Deducción: Forma de razonamiento matemático que, a partir de un conjunto de premisas o hipótesis de partida y aplicando condiciones lógicas, llega a una conclusión demostrable. Derivada: Dada una función matemática continua en un punto dado, se llama derivada de la función en dicho punto a la pendiente del gráfico de la función en el mismo. La derivada de una función, entendida intuitivamente como el grado de aproximación entre la curva que la representa y su recta tangente en cada uno de sus puntos, ofrece una idea de la rapidez del cambio de la función con respecto a aquélla de sus variables para la cual se obtiene la derivada. Matemáticamente, la derivada en un punto a se expresa como el límite de la función [f(a + h) – f(a)]/h cuando h tiende a 0. Desviación típica: Medida estadística de dispersión definida como la raíz cuadrada del valor de la varianza. Determinante: Dada una matriz cuadrada de n filas y n columnas, su determinante es la suma de los n! (factorial de n) términos que pueden obtenerse multiplicando los elementos individuales de la matriz de manera que: a) en cada término del determinante aparezca uno y sólo un elemento de cada fila y uno y sólo un elemento de cada columna; b) el signo del término del determinante será positivo cuando la permutación de los índices de las filas sea par en el orden de su escritura, y negativo cuando dicha permutación sea impar. Ecuación: Igualdad definida entre dos funciones matemáticas de una o más variables o incógnitas. Los valores de las variables para los cuales se cumple la igualdad reciben el nombre de raíces o soluciones de la ecuación. Ecuación diferencial: Igualdad entre dos funciones matemáticas en la que participan tanto variables como sus diferenciales y derivadas parciales o totales. Elemento inverso: Dado un elemento e de una estructura algebraica para la que se ha definido una operación interna dada, se llama elemento inverso de e con respecto a esta operación a aquel que, operado con e, da como resultado el elemento neutro. Elemento neutro: En una estructura algebraica para la que se ha definido una operación interna, se llama elemento neutro a aquel que, operado con cualquier otro elemento e del conjunto, da como resultado este mismo elemento e. Elipse: Lugar geométrico de los puntos de un plano para los que la suma de sus distancias a dos puntos fijos llamados focos es una constante. Pertenece a la familia de las cónicas. Una circunferencia es un caso particular de elipse cuyos ejes mayor y menor poseen la misma longitud.

Elipsoide: Superficie cuádrica cuya intersección con cualquier plano es una elipse. Los elipsoides poseen tres ejes de simetría. Estadística: Disciplina científica que se dedica al estudio del comportamiento de los fenómenos de masa o colectivos. Posee numerosas aplicaciones en investigaciones científicas, económicas, demográficas, etc. Frecuencia: Cantidad de veces que se produce un suceso objeto de un estudio estadístico. Función matemática: Aplicación matemática definida entre dos conjuntos cuyos elementos son números. Geometría: Rama de las matemáticas que se dedica al estudio del comportamiento de los espacios, o colecciones de estructuras matemáticas, y de sus transformaciones. Grupo: Estructura algebraica en la que se ha definido una operación interna con respecto a la cual cumple las propiedades de asociatividad y existencia de elementos neutro e inverso. Si, además, la propiedad es conmutativa, el grupo se dice abeliano. Hipérbola: Lugar geométrico de los puntos del plano cuyas distancias a dos puntos fijos denominados focos difieren en un valor constante. Hiperboloide: Superficie cuádrica cuya intersección con un plano secante puede ser bien una hipérbola o bien una elipse. Homomorfismo: Aplicación definida entre dos estructuras algebraicas, de manera que si a los elementos a y b de la primera les corresponden imágenes a’ y b’ en la segunda, a la operación (ab) de la primera estructura se le asocia como imagen el resultado de la operación (a’b’) en la segunda. Infinitésimo: Dícese de toda sucesión numérica que tiende a cero. Integral: Inversa de la derivada de una función. Numéricamente, la integral de una función en un cierto intervalo coincide con el área de la superficie situada entre el gráfico de la función y el eje horizontal. Intersección de conjuntos: Conjunto constituido exclusivamente por los elementos comunes a los conjuntos de partida. Isomorfismo: Homomorfismo de naturaleza biyectiva. Límite: Valor al que tiende una sucesión cuando el número de sus elementos tiende a infinito. En análisis matemático, punto al que tiende una función cuando alguna de sus variables se acerca indefinidamente a un cierto valor dado. Logaritmo: Exponente o potencia a la que ha de elevarse un elemento numérico llamado base para dar un cierto número. En particular son muy utilizados los logaritmos decimales (base 10) y los neperianos o naturales (cuya base es el número e = 2,718281828...). Matriz: Colección de números ordenados en filas y columnas según una distribución rectangular. Una matriz de n filas y m columnas posee dimensión n x m; cuando el número de filas y columnas coincide, la matriz se dice cuadrada. Máximo: Valor máximo de una función. Cuando se extiende al dominio completo de la misma, se llama máximo absoluto; si se aplica sólo a un entorno de un punto, el máximo se dice relativo o local.


______________________________________________________________________________________________________

Media: Valor promedio central de un estudio estadístico. Comúnmente se utilizan varios tipos de medias: la media aritmética se define como la suma de todos los valores de una distribución dividida por el número de observaciones; la media geométrica es la raíz enésima del producto de los n valores de una distribución, y la media cuadrática es igual a la raíz cuadrada de la media aritmética de los valores de la distribución elevados al cuadrado. Mínimo: Valor mínimo que alcanza una función. Cuando este concepto se extiende a todo el dominio de definición de la función, el mínimo se dice absoluto; si se aplica al entorno de un punto, se llama mínimo relativo o local. Moda: En una muestra estadística, valor más frecuente del espacio muestral. Número combinatorio: Concepto de la combinatoria definido como el número de combinaciones de m elementos tomados en grupos de n. Número complejo: Cada uno de los elementos del conjunto de los números complejos, que engloba a los números reales y a los imaginarios (que resultan de extraer la raíz cuadrada de números reales negativos). Cada uno de los elementos de los números complejos puede expresarse como a + bi, siendo a y b números reales e i la base de los números imaginarios, igual a la raíz cuadrada de –1. Número entero: Cada uno de los elementos del conjunto de los números enteros, integrado por los números naturales, el elemento neutro (cero) y los números negativos. El conjunto de los números enteros se denota por Z. Número natural: Cada uno de los elementos de la sucesión 1, 2, 3, 4, 5, ... El conjunto de los números naturales se denota por N. Número primo: Dícese del número natural divisible únicamente por sí mismo y por la unidad. Número racional: Número que puede describirse como la razón entre dos números enteros. El conjunto de los números naturales, denotado por Q, incluye al de los enteros como un subconjunto. Número real: Número que puede expresarse con una cantidad finita o infinita de cifras decimales. El conjunto de los números reales, denotado por R, incluye a los racionales (enteros y fraccionarios) y a los irracionales (número π, nú— mero e o base de los logaritmos neperianos, 2, etc.). Parábola: Lugar geométrico de los puntos del plano cuyas distancias a un punto fijo llamado foco u origen y a una recta denominada directriz son iguales. La distancia existente entre el foco y la directriz recibe el nombre de parámetro de la parábola. Esta curva pertenece a la familia de las cónicas. Paraboloide: Superficie cuádrica cuya intersección con un plano secante puede ser bien una parábola o una hipérbola (paraboloide hiperbólico) o bien una parábola o una elipse (paraboloide elíptico). Permutación: Dado un conjunto de m elementos, se llaman permutaciones de los m elementos a los distintos grupos que pueden formarse de manera que cada uno difiera de los restantes sólo en el orden de colocación. Plano: Lugar geométrico de los puntos del espacio que se rigen por una ecuación de primer grado con tres variables.

Glosario

309

Polinomio: Suma de un número finito de términos, donde cada uno de los cuales está constituido por el producto de un coeficiente y una variable elevada a una potencia entera no negativa. El máximo valor de esta potencia entre todos sus términos define el grado del polinomio. Probabilidad: Rama de las matemáticas que se dedica al estudio de los fenómenos aleatorios. Punto: Cada uno de los elementos pertenecientes a un espacio, un plano o una recta. Punto de inflexión: Cada uno de los puntos de una curva donde la pendiente cambia de signo; en estos puntos, la curva pasa de ser cóncava a convexa, o viceversa. Raíz: Solución de una ecuación. Recta: Lugar geométrico de los puntos de un plano que se rigen por una ecuación de primer grado con dos variables. Secante: En trigonometría, valor inverso del coseno de un ángulo. Semigrupo: Estructura algebraica en la que se ha definido una operación interna que cumple la ley asociativa. Seno: En un triángulo rectángulo, razón numérica existente entre el cateto opuesto a un ángulo dado y la hipotenusa del triángulo. Sucesión: Conjunto de tres o más números clasificados según un cierto orden y que cumplen una ley predefinida. Se trata de una aplicación del conjunto de los números naturales en otro conjunto, por lo común el de los números reales. Tangente: En trigonometría, razón entre el seno y el coseno de un ángulo. En geometría, recta que corta a una curva en un punto dado. Topología: Rama de las matemáticas que se encarga del estudio de las propiedades de las estructuras compuestas por elementos abstractos o físicos que permanecen invariantes cuando son sometidas a operaciones de distorsión definidas por homomorfismos matemáticos. Triángulo: Figura geométrica plana provista de tres lados y tres ángulos. Los triángulos se llaman acutángulos cuando sus tres ángulos son agudos (menores de 90º); obtusángulos, cuando existe un ángulo obtuso (mayor de 90º), y rectángulos, de particular interés en trigonometría, cuando poseen un ángulo recto (90º). Trigonometría: Parte de las matemáticas que estudia las relaciones entre los lados y los ángulos de un triángulo, ya sea éste plano (trigonometría plana) o esférico (trigonometría esférica). Unión de conjuntos: Dada una serie de conjuntos de partida, su unión es el conjunto constituido por la agregación de todos los elementos de cada uno de los conjuntos. Variación: Dado un conjunto de m elementos, se llaman variaciones de los m elementos tomados de n en n a los distintos grupos de n elementos que pueden formarse, de tal modo que cada grupo difiere de los restantes bien en el contenido o bien en el orden de colocación. Varianza: Medida de dispersión estadística definida como el momento de segundo orden centrado en la media. Se calcula como la media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a la media aritmética de la muestra. Su raíz cuadrada es la llamada desviación típica o estándar de la distribución.


RESPUESTAS A LAS PREGUNTAS DE REPASO

y otra sería, por ejemplo:

Historia de las matemáticas 1. El modelo matemático de Descartes, llamado geometría analítica, se basa en la razón y el método deductivo, y parte de dos ideas fundamentales: los sistemas de coordenadas rectangulares, llamados cartesianos en su honor, y las magnitudes variables. 2. Las dos teorías físicas de gran complejidad del siglo XX para cuya elaboración han servido de base los conocimientos matemáticos son la teoría de la relatividad general y la mecánica cuántica.

Conjuntos y subconjuntos

U’1 = {0, 2, 4, 6, 8, 10} U’2 = {12} 3. A B = ∅ B C = {4, 6, 8} (A B) C = ∅ C = C (A B C ) = ∅ A ∆ B = (A – B) (B – A) A–B=A ya que A B = ∅ B–A=B Por tanto: A ∆ B = A B = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

Aplicaciones y relaciones entre conjuntos

1. A = {números pares}. B = {números impares}. 2. A

.0 .8 B .5 .1 .4 .2 .3 .6 .10 .9 .7

1.

3. S C Q P C Q R Q P R Q

p o ñ n m 2

4

6

8

Una aplicación inyectiva entre A y B sería: A 2

4. P(A) = {∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, A}

B p o ñ n m

f

4 7

Álgebra de Boole. Leyes de Morgan 1. a) b) c)

A¯ = {4, 5, 6, 7, 8, 9} A B = {2} → A B = {1, 3, 4, 5, 6, 7, 8, 9} A B = {1, 2, 3, 5, 6, 7} (A B) = {3}

2. Una partición podría ser: U1 = {0, 2, 4} U2 = {6, 8} U3 = {10, 12}

8

2. Es inyectiva, pues f (n) N, y n, m N; F (n) = f (m). Se verifica que n + 3 = m + 3, de donde n = m. No es sobreyectiva porque el 1 y el 2 no son imagen de ningún elemento. 3. 1

.

2

.

4

.

. 10

. 6 . 8


______________________________________________________________________________

– Propiedad reflexiva. Cada elemento está relacionado consigo mismo: (1, 1), (2, 2), (4, 4), (6, 6), (8, 8), (10, 10). – Propiedad simétrica. Si a R b → b R a. Los pares (1, 2), (2, 1), (4, 6) (6, 4) (4, 8), (8, 4), (6, 8), (8, 6) verifican esta propiedad. – Propiedad transitiva. Si a R b y b R c, entonces a R c: 4R8 6R8 8R6 Luego se verifica la propiedad transitiva, y al verificarse las tres propiedades R es de equivalencia. El conjunto cociente E/R estaría formado por la clase del 1, la del 4 y la del 10:

c)

x = 25,3 7 7; 10 x = 2.53,

2.

(2/3 – 3/5)2 1 /4 + 2

Números naturales, enteros y fraccionarios 1. a) 0,37 = 37/100 b) x = 12,47 100 x = 1.247,47;

se resta: 100 x = 1.247,47 x = 12, 47 99 x = 1.235 x = 1.235/99

=

(

10 – 9 15

=

Estructuras algebraicas

3. (Z/5, +) es un grupo. La operación es interna, pues al sumar dos elementos cualesquiera de Z/5 da otro elemento de Z/5, ya que los resultados de la tabla son to¯ los dos pertenecientes a Z/5. El elemento neutro es el 0; ¯ 1, ¯ 2, ¯ 3, ¯ 4¯ son, respectivamente, 0, ¯ 4, ¯ 3, ¯ simétricos de 0, ¯2, 1. ¯ La propiedad conmutativa se verifica, pues la tabla es simétrica con respecto a la diagonal principal.

100 x = 2.537, 7 10 x = 253, 7 90 x = 2.284 x = 2.284/90

se resta:

E/R = {[1], [4], [10]}

2. Hay que demostrar que se cumplen las dos condiciones de ideal: a) a, b I I2 se verifica por definición de intersección que a y b I1 y a y b I2 , por ser I1 e I2 ideales se verifica que a – b I1 y a – b I2 y por definición de intersección a – b I1 I2 , luego queda probada la primera condición. b) Sean a, I1 I2 cualquiera, y x A. Por definición de intersección a I1 y a I2 y, como I1 e I2 son ideales, se verifica que x A, a · x I1 y a · x I2 , luego a x I1 I2 , y queda probada la segunda condición.

311

se multiplica por 10, pues el anteperíodo sólo tiene una cifra. 7; se multiplica por 10, pues el pe100 x = 2.537, ríodo tiene una sola cifra.

}

1. El conjunto de los números enteros pares se representa por 2Z y está formado por los números: … –8, –6, –4, –2, 0, 2, 4, 6, … Hay que comprobar que se verifican las dos condiciones de subanillo: a) Dados m, n Z, 2m y 2n son dos números pares pertenecientes a 2Z; entonces 2m – 2n = 2(m – n) 2Z, pues m – n Z; queda probada la primera condición. b) Hay que ver que el producto de dos elementos de 2Z es otro elemento de 2Z. Si m, n Z, 2m, 2n 2Z, entonces 2m · 2n = 2(m · 2 · n) 2Z, pues m · 2 · n · Z por ser Z anillo queda probada la segunda condición, por tanto (2Z, +, ·) es un subanillo de {Z, +, ·}.

Respuestas a las preguntas de repaso

¯¯ 1+8

2

)

1 225

:

:

3 2

4

:

=

2

1

2

( 15 )

:

¯ 9

5

=

675

3. a) Hay que comparar las dos fracciones 5/9 y 2/12. Para ello se reducen a común denominador: m. c. m. (9,12) = 36: 5/9 = 20/36 2/12 = 6/36 Compró mayor parte de finca el que adquirió 5/9. b) Se pasan las hectáreas a metros cuadrados: 1 ha = 1 hm2 = 10.000 m2 : 2,7 ha = 2,7 · 10.000 = 27.000 m2 Se calcula la parte que compró cada uno: 5/927.000 = 135.000/9 = 15.000 m2 2/1.227.000 = 54.000/12 = 4.500 m2 El primero pagó 15.000.750 = 11.250.000 unidades monetarias. El segundo pagó 4.500.750 = 3.375.000 unidades monetarias.

Números primos 1. Solamente el 13.528 es divisible por 2. El 34.353 es el único que es divisible por 3. El 625 es divisible por 5. Ninguno de los tres es divisible por 7. 2.

75 3 25 5 5 5 1

75 = 3 · 52 3. a) 100 50 25 5 1

2 2 5 5

256 2 128 2 64 2 32 2 16 2 8 2 4 2 2 2 1 256 = 28

90 45 15 5 1

2 2 3 5

936 2 468 2 234 2 117 3 39 3 13 13 1

90 = 2 · 32 · 5 936 = 23 · 32 · 13

90 2 m. c. d. (100, 90) = 2 · 5 = 10 45 3 m. c. m. (100, 90) = 22 · 52 · 32 = 900 15 3 5 5 1 100 = 22 · 52 90 = 2 · 32 · 5 Algoritmo de Euclides 100 |90 90 |10 10 1 00 9 m. c. d. (100, 90) = 10


312

MATEMÁTICAS

______________________________________________________________________________________________

1 100 10

b) 200 100 50 25 5 1

9 90 0

5 kg –––––– 100 pesos x –––––– 12.000 pesos se forma la proporción directa: 100/12.000 = 5/x: x = 12.000 · 5/100 = 600 kg b) Es una proporción inversa: a más obreros, menos horas: 4 obreros –––––– 18 horas 6 obreros –––––– x horas se forma la proporción inversa: 6/4 = 18/x: 6x = 4 · 18; x = 4 · 18/6 = 12 horas

10

2 2 2 5 5

160 2 130 2 80 2 65 2 40 2 13 13 20 2 1 10 2 5 5 1 160 = 25 · 5 130 = 2 · 5 · 13 200 = 23 · 52 m. c. d. (200, 160, 130) = 2 · 5 = 10 m. c. m. (200, 160, 130) = 25 · 52 · 13 = 10.400

1. a) A · B = 2x8 – 24x7 + 64x6 + 7x5 – 51x4 + 16x3 + 49x – 63. b) B – 2A = 8x3 + 7x – 23.

4. a) 25D · 24 · 3.600 8h · 3.600 30’ · 60 46”

= 2.160.000” = 28.800” = 1.800” = 46” 2.190.646” 25D 8h 30’ 46” = 2.190.646” b) 18.369 |60 0369 306 |60 09 06 5 18.369” = 5º 6’ 9”

5. a) 180º =179º 85º 94º b) 12º 58’

59 60” 43’ 18” 16’ 42” 49” 9 108º 522’ 441” 529’ 21” 106º 49’ 21”

Polinomios

2. Cociente = 2x4 – 8x3 + 7x – 9; resto = 0. 3. 2 3 4 5

441 |60 21 7 529 |60 49 8

Proporciones y porcentajes 1. Cf = Ci (1 + r)t; r = 8/100 = 0,08; Ci = Cf/(1 + r)t = = 1.260.000 / (1 + 0,08)12 = 1.260.000/1,0812 = = 1.260.000/2,52 = 500.000 pesos. 2. Se pide el tiempo; la fórmula es: t = I · 100/RC = = 90.000 · 100/4 · 150.000 = 15 años. 3. I = CRt/100 = 350.000 · 6 · 1/100 = 21.000. El interés son 21.000, pero como en concepto de impuestos se retiene el 25% de los intereses, de los 21.000 sólo se cobrará el 75%: 100 –––––––– 75 21.000 –––––––– x x = 21.000 · 75/100 = 15.750 Efectivos, recibe 15.750 pesos, que sumados al capital inicial dan: 350.000 + 15.750 = 365.750 pesos. 4. a) 5/x = x/45; x2 = 5 · 45 = 225; x = 2 2 5 = 15; 5/15 = 15/45. b) 13/39 = 65/x; 13x = 65 · 39; x = 65 · 39/13 = 195; 13/39 = 65/195. 5. a) Es una proporción directa: cuanto mayor sea el número de tomates, más cantidad de dinero se necesita; luego:

| | | |

1 1

1

–14 2 –12 3 9 4 –5 5 0

+71 –24 47 –27 20 –20 0

–154 94 –60 60 0

+120 –120 0 Resto Resto Resto Resto

x–5=0 x=5 P(x) = (x – 2) (x – 3) (x – 4) (x – 5) 4. m (x – n)2 + p = m (x2 – 2nx + n2 ) + p = mx2 – 2mnx + mn2 + p, luego 5x2 – 20x + 23 = mx2 – 2mnx + (mn2 + p). De la igualdad se deduce: m = 5; 2mn = + 2; 2 · 5 · n = 20; n = 20/10 = 2; mn2 + p = 23; 5 · 22 + p = 23; 20 + p = 23 ; p = 3

|

m=5

|

n=2

|

|

p= 3

Ecuaciones de primer grado 1. a) 3 (x – 4) + 4 = 2x + 5 (2 – x) – 6 3x – 12 + 4 = 2x + 10 – 5x – 6 3x – 8 = –3x + 4 3x + 3x = 4 + 8 6x = 12 x = 12/6 = 2 x=2 b) 6 – x – x = 2x – 3 (10 – x) – 9 2 2 2 m. c. m. (2, 1) = 2 (6 – x) – x = 4x – 3 (10 – x) – 18 6 – x – x = 4x – 30 + 3x – 18 6 – 2x = 7x – 48 –2x – 7x = –48 – 6 –9x = –54 x = –54/–9 = 6 x=6 2. a) (2x + y = 7) 4x – 2y = 2 2·2+y=7 x = 2; y = 3

→ 4x4x +– 2y2y

= 14 = 2 8x = 16 y=7–4=3

x=2


______________________________________________________________________________

b) Despejando x en otra ecuación:

8 – 5y 3x + 5y = 8 → 3x = 8 – 5y → x = 3 7x – 2y = 5 → 7x = 5 + 2y → x = 5 + 2y 7 8 – 5y 5 + 2y → = 3 7 m. c. m. (3, 7) = 21 7 (8 – 5y) = 3 (5 + 2y) 56 – 35y = 15 + 6y –35y – 6y = 15 – 56 –41y = –41 y = –41/–41 = 1 y=1 8 – 5y 8 – 5 3 x= = = =1 3 3 3 x=1 y = 1; x = 1

c) Despejando x en la primera ecuación: x = 7 + 3y y sustituyendo en la segunda ecuación: 2 · (7 + 3y) + 9y = 29 14 + 6y + 9y = 29 15y = 29 – 14 15y = 15 y = 15/15 = 1 x = 7 + 3 · 1 = 10 x = 10; y = 1

1. Se puede plantear un sistema de ecuaciones: x + y = 14 x · y = 45

o bien se puede sustituir directamente en x2 – Sx + P = 0 y resolver. Sería: x2 – 14x + 45 = 0 x = (14 ± 196 – 180)/2 = (14 ± 16)/2 = (14 ± 4)/2 → x1 = 9; x2 = 5 Las edades son de 5 y 9 años. 2. y = 3 (x2 + 5x – 14), y las raíces del polinomio son:

x = 2 x = –5 ± 25 + 56 = 5 ± 9 → x1 = –7 2 2 2 y = 3 (x – 2) · (x + 7) 3. a) x2 = 49; x = 4 9 ; x1 = 7 y x2 = –7 b) x (x – 2) = 0; x = 0; x – 2 = 0; x = 2 c) x 2 = z; z2 – 37z + 36 = 0

Matrices y sistemas de ecuaciones lineales

2x = 54 → x = 27

1. Como A es de orden 3 · 4 y B, de orden 4 · 2 , se puede efectuar el producto de A · B: A·B=

Sustituyendo en la primera ecuación: 27 + y = 36 → y = 9 4. Se despeja y en otra ecuación:

A=

Se calcula una tabla de valores: y = 16 – 4x

x y

| | | 4 0

2 8

y = –4x/3 0 3 0 –4

–3 4

| | |

=

3.

y 6

–8

)( )

5 + 2 + 9 +0 4 16 10 – 1 + 15 + 0 = 3 24 –5 + 1 + 3 + 8 –12 8

x

(6, –8)

| | (

| |

1 2 0 –1

0 1 2 –3

–1 1 3 5

3 –7 4 1

0 3 3 4

0 1 2 –3

–1 1 3 5

0 3 1 –7 –7 = (–1) · (–1)1+3 3 2 4 = 4 4 –3 –1 –1

primera columna + tercera columna =

| |

= –[–6 + 16 + 63 – (–56) – (–3) – (–36)] = = –(–6 + 16 + 63 + 56 + 3 + 36) = –168

)

1 1 –1 1 1 3 1 1 , = 1 – 3 = –2 3 1 2 0 2 1 1 –1 3 1 1 =2+2+0+2–6+0=0 2 0 2 r(M) = 2 < número de incógnitas M=

Solución del sistema

(

2 +2 +0 + 2 4 – 1 +0 + 0 –2 + 2 + 0 – 12

2. A la cuarta columna se le suma la primera multiplicando por (–3)

y = 16 – 4x 3y = –4x y = –4x/3

3 4

1.369 – 144) /2 = (37 ± 35)/2 = z = (37 ± = 72/2 = 36 ó 2/2 = 1 z1 = 36 y z2 = 1 x 2 = 36, x = 36; x1 = 6, x2 = –6 x = 1; x3 = 1, x4 = –1 x 2 = 1,

Se resuelve por reducción, sumando la ecuación:

x y

313

Ecuaciones de segundo grado

3. Se plantea un sistema: x + y = 36 x – y = 18 x + y = 36 x – y = 18

Respuestas a las preguntas de repaso

|

|

|

|


314

MATEMÁTICAS

______________________________________________________________________________________________

5. El número 4, 3 es igual a 4 + 0,3 + 0,03 + 0,003 + … Los términos 0,3 + 0,03 + 0,003 forman una progresión geométrica ilimitada decreciente, de razón 1/10, luego su suma se obtiene por la fórmula:

Se desprecia la última ecuación: x+y=0 → x+y=0 3x + y + z = 0 3x + y = –z

z

1

z+2 x = | –z 1| = = –z –2 2

1

z

–z – 3z –4z y = | –3 –z| = = = –2z –2 2

0,3 0,3 S = a1 = = = 0,3 = 3 = 1 9 3 1 – r 1 – 1/10 (10 – 1)/10 9/10 Por tanto: 4,3 = 4 + 1/3 = (12 + 1)/3 = 13/3

2

Números complejos y logaritmos

Haciendo z = λ, se tiene la solución (–λ, –2λ, λ).

Sucesiones y límites 1. a) Es una indeterminación de la forma / . Se resuelve dividiendo numerador y denominador por n3: 3 3 2 3 3 3 lim n /n +3 3n3 /n – 5/n = nlim = 1 + 3/n – 5/n = → 2n /n + 7/n3 2 + 7/n3

n→

5 5

Indeterminación de la forma – . Se resuelve multiplicando y dividiendo por el conjugado de n2 + 1 – n2 – 1 lim

n→

2 = n + 1 – n2 – 1 2

= nlim

2( n2 + 1 + n2 – 1) = n2 + 1 – n2 – 1)( n2 + 1 + n2 – 1) (

= nlim

2( n2 + 1 + n2 – 1) = 2 2 n + 1) – ( n2 – 1)2 (

= nlim

2( n2 + 1 + n2 – 1) = (n2 + 1 – n2 + 1)

Pues 32 – i2 = 9 – (–1) = 10 5

2. 3 2 6 0º = 3 2 (60 + 360K)/ 5, con K = 0, 1, 2, 3, 4

1+0–0 1 = 1 + 3/ – 5/ = = 2+0 2 2 + 7/ b)

1. a) Z1 + Z2 = (2 – 3i) + (3 + i) = 5 – 2i b) Z1 · Z2 = (2 – 3i)(3 + i) = (6 + 3) + (–9 + 2)i = 9 – 7i c) Z1 / Z2 = (2 – 3i)/(3 + i) = [(2 – 3i)(3 – i)]/ /[(3 + i)(3 – i)] = [(6 – 3) + (–2 – 9)i]/(32 – i2) = = (3 – 11i)/10 = 3/10 – 11i/10

5

3 2 = 2 5 = 2 Para K = 0 60/5 = 12º → 212º Para K = 1 (60 + 360 ) / 5 = 84º → 284º Para K = 2 (60 + 720 ) / 5 = 156º → 2156º Para K = 3 (60 + 1.080 ) / 5 = 228º → 2228º Para K = 4 (60 + 1.440 ) / 5 = 300º → 2300º Las cinco raíces son: 212º, 2 84º, 2 156º, 2 228º, 2 300º 3. Para pasar de forma polar a binómica, es necesario primero pasar a trigonométrica: 230º = 2 (cos 30 + i sen 30) = 2 ( 3/2 + 1/2 · i) = = 2 · 3/2 + 2/2 · i = 3 + i 4

n2 + 1 + n2 + 1 = + = = nlim →

c) Es un indeterminación de la forma 1 , luego: 2 2 2 P = nlim ( n 2 + 1 – 1) · 3n2 = nlim ( n + 12 – n + 1 ) · 3n2 = → n – 1 → n +1 2

2

= nlim 6n = 6, luego nlim ( n 2 + 1 ) n2 = ep = e6 → n2 + 1 → n – 1 3

2. La sucesión es la misma que 1/12, 1/22, 1/32, 1/42, 1/52: a) El término general es an = 1/n2. b) La sucesión está acotada superior e inferiormente. El 1 es el máximo y el extremo inferior es el 0. Cualquier número mayor que 1 es una cota superior y cualquier número menor que 0 es una cota inferior. 3. a) La diferencia es 10 – 4 = 6. b) El término general an = a1 + (n – 1) d = 4 + (n – 1) · 6 = = 4 + 6n – 6 = 6n – 2. c) a15 = 6 · 15 – 2 = 88. S15 = [(4 + 88) · 15]/2 = 690. 4

4

4. 2 … 1.458. Se calcula la razón r = 1.458/2 = 729 = 3 3, luego la sucesión es 2, 6 3, 54, 162 3, 1.458.

4

4. log3 (27 · 92 )/ 7 2 9 = log3 (27 · 92 ) – log3 7 2 9 = log3 27 + log 729 log 3 6 = log3 3 3 + 2log3 3 2 – 3 = 3log3 3 + + log3 92 – 3 4 4 + 4log3 3 – 6log3 3/4, 3 + 4 – 6/4 = (12 + 16 – 6) = 22/4 = = 11/2, ya que log3 3 = 1 5. Aplicando las propiedades de los logaritmos, queda: log [(x + 5) – log (x + 4)2 ] = log (4 / 9) log [(x + 5)/(x + 4)2 ] = log (4/9), luego (x + 5)/(x + 4)2 = = 4 / 9; por tanto, 9x + 45 = 4 (x2 + 8x + 16) → 4x2 + 32x + + 64 – 9x – 45 = 0 → 4x2 + 23x + 19 = 0 x = (–23 ± 529 304 – )/8 = (–23 ± 15)/8 = –38/8 = –19/8. Se comprueban las soluciones y x = –1 es la que verifica la ecuación.

Derivadas 1. a) y’ = 3x2 cos x3. b) y = xx, tomando logaritmos Ly = Lxx, Ly = xLx. y’/y = 1Lx + x1/x, y’ = (Lx + 1) y, y’ = (Lx + 1)xx c) y = sen x/ecos x es un cociente cos x + sen2 x · ecos x = cos x + sen2 x y’= cos x · e cos (e x) 2 ecos x


______________________________________________________________________________

2. Aplicando el teorema del valor medio [f(b) – f(a)]/(b – a) = f’(c) (0 – 6 )/(2 – 0) = 2x – 5, –3 = 2x – 5, 2x = 1, x = 1 → y = 12 – 5 1 + 6 = 1 – 5 + 6 = 15 2 2 2 4 2 4 3. f(x) = x3 + 3, f(1) = 13 + 3 = 4, f(1 + h) = (1 + h)3 + 3 f ’(1) = lim [f(1 + h) – f(1)]/h = lim [(1 + h)3 + 3 – 4]/h = h→0

h→0

= lim (1 + h3 + 3h2 + 3h + 3 – 4)/h = lim (h3 + 3h2 + 3h)/h = h→0

h→0

= lim h2 + 3h + 3 = 0 + 0 + 3 = 3, f ’(1) = 3

Respuestas a las preguntas de repaso

315

1 – x2 Despejando y: y = S1 = 0 1 1 – x2 dx = 0 π/2 1 – s e n 2 cost dt = 0 π/2 cost · cost dt = 0 π/2 cos2 t dt = 1/2 0 π/2 (1 – cos 2t) dt = 1/2 0 π/2 dt – – 1/2 0 π/2 cos 2t dt = [1/2t]0π/2 1/4 0 π/2 2 cost dt = [t/2]0π/2 – – [sen 2t/4]0π/2 = π/4 + [0] = π/4 Haciendo el cambio x = sen t, dx cos t dt x = 0 t = 0 x = 1 t = π/2. Y como cos2 t = 1 – cos 2t; la superficie pedida S = 4 S1 = 4/4 = π. 3. Se representan las gráficas

h→0

y = x2

4. f(x) = sen x sen x = x – x3 /3! + x5 /5! – x7 /7! + x9 /9! + …

Integrales

y=1 x

1. a) tg x dx = (sen x/cos x) dx = (sen x du)/u(–sen x) = = – du/u = –lnu + C = –ln cos x + C, llamando u = cos x, du = –sen x dx, de donde dx = du/–sen x. b) Se integra por partes, llamando du = 2x dx u = x2 dv = sen x dx v = – cos x x2 sen x dx = –x2 cos x + 2 cos x · x dx Para resolver la integral del segundo miembro, se vuelve a aplicar el método por partes, haciendo u = x, du = dx, dv = cos x dx, v = sen x = –x2 cos x + 2 [x sen x – sen x dx] = –x2 cos x + 2x sen x + 2 cos x + C c) 3/(x2 – 5x + 6) = A/(x – 2) + B/(x – 3) = = [A(x – 3) + B(x – 2)]/[(x – 2)(x – 3)] Resolviendo x2 – 5x + 6 = 0, se tiene x1 = 2; x2 = 3 3 = A (x – 3) + B(x – 2), 3 = (A + B)x + (–3A – 2B) Se obtiene el sistema: A+B=0 –3A – 2B = 3 Resolviendo se llega a: B = 3, A = –3, luego: 3 dx/(x2 – 5x + 6) = [–3/(x – 2)] dx + 3 dx/(x – 3) = = –3 ln x – 3 + C

1/2

1

5

El área rayada es la pedida. Como el punto de corte de ambos gráficos es el (1, 1), entre 1/2 y 1, la gráfica de la función y = 1/x está por encima de la y = x2 y entre 1 y 5 es al revés, luego: S = 11 /2 (1/x–x2 ) dx + 1 5 (x2 –1/x)dx = [ln x–x3 /3]11 /2 + + [x3 /3 – ln x]1 5 = (ln 1 – 13 /3 ) – [ln 1/2 – (1/2)3 /3] + + (53 /3 – ln 5) – (13 /3 – ln 1) = 0 – 1/3 – 0 + ln 2 + + 1/24 + 125/3 – ln 5 – 1/3 + 0 = ln 2/5 + 985 /24 4. La fórmula para hallar el volumen es V = π a b [f(x)]2 dx Se despeja y en la función, y = 1 – x 2 la función corta al eje x en los puntos (–1, 0) y (1, 0), luego: V = π – 11 ( 1 – x 2 )2 dx = π – 11 (1 – x2) dx = = π [x – x3/3]– 11 = π (1 – 1/3) – [(–1) – (–1/3)] = 4π/3

Ecuaciones diferenciales 1. dy/dx = 1. dy = dx, integrando y = x + C, para el punto (0,0), C = 0, y = x. La familia son todas las rectas paralelas a la recta y = x:

2. Se representa la circunferencia:

S1

y=x (1, 0)

El radio es 1; la superficie será 4 veces la del área rayada.


316

MATEMÁTICAS

______________________________________________________________________________________________

2. Es una ecuación en variables separables: (x + e2x) y2 dy/dx = 1 + 2e2x separando las variables: y2 dy = (x + e2x) dx 1 + e2x luego: y3 /3 = ln (x + e2x) + ln C, y3 = 3 ln (x + e2x)C y = ln [(x + e2x) · C] 3. Es una ecuación lineal de primer orden. Se calcula la solución de la ecuación homogénea: y’ + y/x = 0 dy/dx = –y/x, separando las variables: dy/y = –dx/x ln Cy = –ln x, Cy = e–lnx = 1/elnx = 1/x; y = 1/Cx = K/x

3. A =

d1 · d2 5 · 3 = = 7,5 mm2. 2 2

4. A = B · b = 10 · 6 · 4 = 32 cm2. 2 2

Geometría circular 1. La cuerda es la porción de la secante incluida dentro de una circunferencia:

AB = cuerda

A

O

haciendo K = K(x), y’ = [K’(x)x – K(x)]/x2 , sustituyendo en la ecuación completa: [K’(x)x – K(x)]/x2 + K/x2 = ex , de donde K’x/x2 = ex K’ = xex integrando por partes K = x ex – ex + C, luego la solución general es: y = (x ex – ex + C)/x. 4. V = dx/dt, dx/dt = 3t2 + 5, separando las variables dx = (3t2 + 5) dt; integrando x = t2 + 5t + C. Como parte de reposo, para t = 0, x = 0, luego C = 0 y la ecuación del movimiento es x = t2 + 5t A los 8 segundos: x(8) = 83 + 5 · 8 = 552 metros.

B

secante

2. As = Ac · a , 360 siendo As el área del sector, Ac el área de la circunferencia, y a, el ángulo del sector expresado en grados. Es decir: As =

πr2a π · 62 · 50 = = 5π cm2. 360 360

3. A = π (r’2 – r2) = π (52 – 32) = 16π cm2.

Elementos de geometría plana 1. Todos los puntos de una línea recta se encuentran en una misma dirección; no sucede así en las curvas. 2. Para definir una recta basta con dos puntos; un plano queda perfectamente definido por medio de tres puntos. 3. Los ángulos complementarios son aquellos que suman 90º. Los suplementarios son los que suman 180º. 4. Tres puntos o una recta y un punto fuera de ella.

Geometría poligonal 1. Un icoságono tiene 20 lados. Aplicando la fórmula: S = (n – 2) · 180º se tiene: S = (20 – 2) · 180 = 18 · 180 = 3.240º 2. El perímetro es: P = 6 + 5 + 3 = 14 cm, por lo que el semiperímetro es S = 7 cm. Aplicando la fórmula:

A = S(s – a) (s – b) (s – c) A = 7(7 – 6) (7 – 5) (7 – 3) = 7 · 1 · 2·4= = 56 = 7,48 cm2

Cuerpos geométricos 1. V = Abase · h = 4 · 3 · 5 = 60 cm3. 3l2 = 3 · 32 = 3 3 cm = 5,2 cm. 2. d = 3. Al = 2πrh = 2π · 3 · 5 = 30π cm2. 4. V = 1 Abase · h = 1 πr2 · h = 1 π · 32 10 = 30π cm3. 3 3 3

Geometría analítica 1. d = (–1 + 3)2 + (–1 5) – 2 = 4 + 36 = 40 2. y – 1 = 5 – 1 (x – 1) → y – 1 = 2(x – 1) → y = 2x – 1 3–1 3. d =

y0 – mx0 – n 0 – 2 + 3 3 3 5 = = = 1 + m2 1 + 4 5 5

4. (x – 2)2 + (y – 3)2 = 9 5. d =

Ax1 + By1 + Cz1 + D 2 · (–1) + 3 ·1 + (–2) · 4 + 4 = = A2 + B2 + C2 4 + 9 + 4 =

3 17


______________________________________________________________________________

Respuestas a las preguntas de repaso

317

Trigonometría 2 1. sen2α + cos2α = 1 → cosα = 1 – sen α

Entonces: cos 45º = 1 – sen2 45º = =

1–2 = 4

60º

( )

2 1 – 2 = 2

1 = 2 2 2

c

a

senα 2/2 2. tgα = cosα = =1 2/2

α

60º

3. Al igual que su inversa, el seno, es positiva en los cuadrantes I y II, y negativa en los cuadrantes III y IV. 4. Solamente el seno y el coseno. Las restantes funciones (tangente, cotangente, secante y cosecante) presentan puntos de discontinuidad, donde se hacen infinitas (con valor positivo o negativo).

b

Estadística 1. 5 4 3 2 1

Teoremas angulares y triangulares 1. Dado que 45º es la mitad de 90º, aplicamos las relaciones del ángulo mitad: cos

α =± 2

1 + cosα = ± 2

1+ 0 =± 2

1 = ± 2 2 2

(α = 90) como estamos en el primer cuadrante, el coseno es positivo, luego:

5

2

5 · 3 + 10 · 4 + 15 · 2 + 20 · 2 + 25 · 1 3+4+2+2+1

x¯ a =

=

= 15 + 40 + 30 + 40 + 25 = 150 = 12,5 12 12

2. a = 18, b = 14 → c = a – b = 18 – 14 = 11,31 2

25

2. Moda: 10 (se repite 4 veces). Mediana: 15. Media aritmética:

cos45 = 2 2 2

10 15 20 gráfico de líneas

2

Media geométrica: 12

12

x¯ g = 53 · 104 · 152 · 202 · 25 = 16.875 · 1012 = 22,50

β

Media cuadrática:

a = 18 c

x¯ c =

α

3 · 52 + 4 · 102 + 2 · 152 + 2 · 202 + 1 · 252 = 3 + 4 + 2 + 2 +1

= b = 14

75 + 400 + 450 + 800 + 625 = 13,99 12

Media armónica: 14 senβ = 18 = 0,77 → β = arcsen (0,77) = 51,06º α = 90 – β = 90 – 51,06 = 38,94º 3. α = 180 – 60 – 60 = 60. Los tres ángulos son iguales, luego los tres lados también han de serlo: a = b = c = 6

x¯ h =

3+4+2+2+1 = 12 = 9,45 3/5 + 4/10 + 2/15 + 2/20 + 1/25 1,27

3. Recorrido: 25 – 5 = 20 Desviación media: σm = 3 · |5 – 12,5| + 4 ·|10 – 12,5| + 2 · |15 – 12,5| + 2 · | 20 – 12,5| + 1 · | 25 – 12,5| = 12 = 5,42


318

MATEMÁTICAS

______________________________________________________________________________________________

Desviación típica:

Probabilidad

2 2 2 2 2 σt = 3 · (5 – 12,5) + 4 · (10 – 12,5) + 2(15 – 12,5) + 2(20 – 12,5) + (25 – 12,5) = 12 = 6,29 Varianza: V = σt = 2,51

Cálculo combinatorio 1. Dado que cualquiera de las 20 personas puede ser seleccionada para el comité, el problema consiste en calcular las combinaciones de 20 personas tomadas de 3 en 3: 20! = 1.140 3! · 17! 2. Un número de 3 cifras es diferente de otro por los dígitos que lo constituyen y por su orden. Se trata entonces de variaciones con repetición de 3 elementos en grupos de 3: VR33 = 33 = 27 (203) =

3. Se trata de hacer ordenaciones con los 12 libros, con los que se forman grupos de 4, 3 y 5 libros iguales, respectivamente. Se trata, pues, de permutaciones con repetición: 12! = 27.720 4! · 3! · 5! Los 12 libros se pueden colocar de 27.720 maneras diferentes.

1. Por lo menos se producen 10 artículos, cosa que sucederá si los primeros 10 son no defectuosos. Si aparece uno defectuoso se producirán 11; si hay dos, se producirán 12, y así sucesivamente. Como no hay condición de fin para la producción más que el hecho de producir 10 no defectuosos, se podrían seguir fabricando artículos indefinidamente. Entonces Ω = {10, 11, 12, 13, …}. 2. Como el alumno responde al azar, podemos suponer que las respuestas son independientes entre sí y sólo una es correcta. De haber diez preguntas, contestará exactamente cinco correctas si contesta también cinco incorrectamente. Además, como puede responder a cinco cualesquiera de todas las preguntas, existen (105) = 252 posibilidades diferentes. Así, la probabilidad pedida es: p = (105) · ( 1 4

5. Como en una mesa circular no se puede determinar un principio y un final, debemos fijar un punto de partida, en el que sentaremos a una persona. Al resto de personas lo podemos sentar de P5 = 5! = 120 formas diferentes. 6. La solución de este problema es semejante a la del ejercicio 2, teniendo en cuenta que: a) para que los números sean pares deben acabar en un dígito par o en 0; b) el número 000 es 0, por lo que no sirve; c) todos los números que empiezan con un 0 (p. ej., el 054) tienen un dígito menos, ya que el 0 a la izquierda no cuenta (en el ejemplo, 054 es 54). Así, para el primer dígito se tienen 5 posibilidades (no puede haber un 0); para el segundo, 6 (puede ser cualquiera), y para el tercero, sólo 3 (debe ser par o el 0).

5

= 0,058

3. En una extracción, la probabilidad de observar dos bolitas blancas viene dada por: p=

PR124, 3, 5 =

4. Los tres libros de estadística se pueden ordenar de P3 = 3! = 6 maneras diferentes; los 2 de matemáticas, de P2 = 2! = 2, y las 4 novelas, de P4 = 4! = 24. Además, como se dispone de 3 bloques de libros, éstos se pueden poner de P3 = 3! = 6 formas distintas. Entonces, los 9 libros se pueden colocar de 6 · 2 · 24 · 6 = 1.728 maneras diferentes.

5

) · ( 34 )

(22) · ( 30) 1 = 10 ( 52)

Si no se observan dos bolitas blancas, tendrá que repetirse la operación; por tanto, la probabilidad pedida es: 1–p= 9 10 4. Sean los sucesos A = {la pieza proviene de la máquina A}, B = {la pieza proviene de la máquina B} y D = {la pieza es defectuosa}. Se sabe que: P(A) = P(B) = 0,5, P(D|A) = 0,05 y P(D|B) = 0,10. Como se pide P(D), se utiliza el teorema de la probabilidad total: P(D) = P(D|A) · P(A) + P(D|B) · P(B) = = 0,05 · 0,5 + 0,10 · 0,5 = 0,075 5. Se pide P(A|Dc). Por el teorema de Bayes, tenemos que:

P(A|Dc) = =

P(Dc|A) · P(A) = P(D |A) · P(A) + P(Dc|B) · P(B) c

0,95 · 0,5 = 0,5135 0,95 · 0,5 + 0,9 · 0,5

6. En el ejercicio anterior, si se observan dos piezas y se ve que no son defectuosas, se puede calcular la probabilidad de que haya sido producida por la máquina A. Suponiendo que las piezas son independientes entre sí, P(2D|A) = 0,052 = 0,0025 y P(2D|B) = 0,102 = 0,01. Así:

5 · 6 · 3 = 90 90 números pares de 3 cifras se pueden formar con los dígitos dados.

P(A|2Dc) =

0,9975 · 0,5 = 0,5019 0,9975 · 0,5 + 0,99 · 0,5


______________________________________________________________________________

Variables aleatorias 1. La variable aleatoria toma por lo menos el 2. P(X = 2) =

P(25 < X < 42) = 0,992857 – (1 – 0,8461) = 0,838957

1 1 2 P(X = 3) = 2 · · = 6 6 36 ya que la suma puede ser 3 si primero sale el 1 y luego el 2 o viceversa, etc. La información se resume en la siguiente tabla:

P(X = x)

|

2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 5 4 3 2 1 36 36 36 36 36 36 36 36 36 36 36

c) Utilizando la distribución binomial, se tiene que: 29 121 p(X = 29) = (150 = 0,08 29) 0,2 0,8

Si hubiésemos utilizado la aproximación de Poisson, habríamos tenido que: 29 –30 p(X = 29) = 30 e = 0,07 29!

Y, por aproximación normal, esta probabilidad es 0, ya que el área bajo un punto es siempre 0. 4. Sea X = “número de lanzamientos necesarios hasta que salgan 6 caras, entonces X ~ G(1/6); por tanto:

Entonces: E(X) = 2 ·

1 2 1 +3· + … + 12 · =7 36 36 36

Para calcular la varianza, se necesita calcular primero E(X2) = 4 ·

1 + 9 · 2 + … + 144 · 1 = 54,83 36 36 36

Con lo que se tiene:

2. Para que f(x) sea función de densidad debe cumplirse primero que f(x) ≥ 0, lo cual se cumple exigiendo que k ≥ 0. La segunda condición es 52 f(x)dx = 1. Es decir: 52 k(x – 2)dx = k · 9 2 2 que vale 1 si y sólo si k = . 9 Calculemos, ahora, su función de distribución:

0

P(X = 10) P(X = 10|x > 3) = P(X = 10 X > 3) = = P(X > 3) P(X < 3) P(X = 10) = P(X = 10) = = 1 – P(X ≤ 3) 1 – P(X = 3) – P(X = 2) – P(X = 1) =

V(X) = 54,83 – 49 = 5,83

F(x) =

319

Como Z ~ N(0; 1) = 1, que es simétrica respecto al 0, se tiene que P(Z ←1,02) = 1 – P(Z < 1,02). Por consulta en tablas resulta, finalmente:

1 1 1 · = 6 6 36

ya que X = 2 cuando en ambos lanzamientos sale un 1;

x

Respuestas a las preguntas de repaso

(5/6)9 (1/6) = 0,0558 1 – (5/6) (1/6) – (5/6) (1/6) – (1/6) 2

Nótese que esta probabilidad es igual a (5/6)6 (1/6), ya que la distribución geométrica también posee la propiedad de la falta de memoria. 5. Para que la persona sea atendida, la cajera debe haber atendido a las siete personas que están antes en la fila. Si una persona es atendida en un promedio de dos minutos, siete lo son en catorce, por lo que el tiempo medio de espera es de catorce minutos. Suponiendo distribución exponencial, se tiene que:

si x < 2

2 2 2 (x – 2)dx = (x – 2) 9 9 1 x

si 2 ≤ x ≤ 5 si x > 5

El valor esperado es: 2 E(X) = 52 9 x(x – 2)dx = 4 2 Y, por último, sabiendo que E(X2) = 25 9 x2(x – 2)dx = 16,5, tenemos: V(X) = 16,5 – 16 = 0,5 3. a) Como n es muy grande usamos aproximación normal: X ~ N(30; 4,9); por tanto, P(X > 30) = 0, ya que la distribución normal es simétrica respecto a la media. 25 – 30 < Z < 42 – 30 = ) 4,9 4,9 = P(Z < 2,45) – P(Z < –1,02).

b) P(25 < X 42) = P(

– 1 P(X > 10) = 1 – P(X ≤ 10) = 100 1 e 14 xdx = 0,51 14

6. Primero es preciso determinar a y b. Para eso se utiliza la información de E(X) y V(X): 2 E(X) = a + b = 6; V(X) = (b – a) = 0,75 12 2

Resolviendo este sistema de dos ecuaciones con dos incógnitas, se tiene que a = 4,5 y b = 7,5, con lo que: f(x) = 1 para x (4,5, 7,5) 3 Ahora, nos fijamos en x2 – 9x + 20 < 0, lo cual sólo se cumple si 4 < x < 5; por tanto, la probabilidad pedida es equivalente a P(4,5 < x < 5): 5 1 dx = 0,17 P(4,5 < x < 5) = 4,5 3


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.