Temas de física fís ica
Mecánica Libro 1
Mecánica Libro 1
Fermín Alberto Viniegra Heberlein
FACULT FACULTAD DE CIENCIAS, CIENCIAS , UNAM UN AM
Mécanica. Libro 1 1º edición, 2007
D.R. © Universidad Nacional Autónoma de México Facultad de Ciencias Circuito exterior s/n Ciudad Universitaria, México 04510, D.F.
[email protected] ISBN obra obra completa: completa: 978-970-32-4 978-970-32-4498-0 498-0 ISBN 1er. libro: 978-970-32-4499-7
Diseño de portada: Laura Uribe Tipografía Tipografía y figuras: Mauricio Vargas Díaz Impreso y hecho en México
A la memoria de mi madre Anna Helene Helene Heberlein Heberlein Lang
(1910-1967)
CONTENIDO
Prólogo . . . . . . . . . . . . . . . . . . . . . .
ix
. . . . . . . . . . . . . . . . . . .
xv
1. Antecedentes de la mecánica . . . . . . . . . . . .
1
Introducción
1.1. El orto de la mecánica . . . . . . . 1.2. El sistema ptolemaico . . . . . . . 1.3. Nicolás Copérnico . . . . . . . . 1.4. Johannes Kepler y Tycho Brahe . . . 1.5. Descartes, Stevin de Brujas y Grassmann 1.6. Galileo Galilei . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1 6 9 12 15 25
2. Newton y su mecánica . . . . . . . . . . . . . . .
29
2.1. Newton y sus leyes . . . . . . . . . . . . . . . 29 2.2. La cinemática: marcos inerciales y la primera ley de la mecánica . . . . . . . . . . . . . . . . . . . . 31 2.3. Las fuerzas: segunda ley . . . . . . . . . . . . . 49 2.4. Torcas y momento angular . . . . . . . . . . . . 63 2.5. Tercera ley de la mecánica y la estática . . . . . . . . 70 2.6. Sistemas de partículas . . . . . . . . . . . . . . 84 2.6.1. Despegue, vuelo e inyección en órbita de un cohete 96 2.7. Problemas del capítulo . . . . . . . . . . . . . . 103 3. Las ecuaciones de movimiento . . . . . . . . . . .
3.1. Trabajo y energía cinética . . . . . . 3.2. Sistemas conservadores . . . . . . . 3.3. El problema de los dos cuerpos . . . 3.4. Campo central . . . . . . . . . .
vii
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
111
111 116 129 137
Contenido
3.5. La teoría newtoniana de la gravitación . . . . . . . . 3.6. Movimiento en un campo de fuerza repulsivo: dispersión de Rutherford . . . . . . . . . . . . . . . . . . 3.7. Inyección en órbita de un satélite artificial . . . . . . 3.7.1. Los parámetros keplerianos . . . . . . . . . 3.7.2. Tamaño de la órbita . . . . . . . . . . . . 3.7.3. La forma de la órbita . . . . . . . . . . . . 3.7.4. Orientación del plano orbital en el espacio . . . . 3.7.5. Orientación de la órbita . . . . . . . . . . . 3.7.6. El argumento del perigeo . . . . . . . . . . 3.7.7. La localización instantánea del satélite en su órbita 3.8. Astrodinámica . . . . . . . . . . . . . . . . . 3.9. Problemas del capítulo . . . . . . . . . . . . . .
151 175 180 189 189 192 193 194 197 202 203 229
4. El cuerpo rígido . . . . . . . . . . . . . . . . . 233
4.1. El cuerpo rígido . . . . . . 4.2. Marcos de referencia acelerados 4.3. Cinemática del cuerpo rígido . 4.4. Dinámica del cuerpo rígido . . 4.5. Satélites artificiales . . . . . 4.6. Problemas del capítulo . . . .
viii
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
233 250 270 289 315 339
PRÓLOGO
Hace ya un buen tiempo que estoy pensando en ti. Trato de imaginar cómo eres: tu edad, tu profesión, tus gustos científicos. Se trata de una cuestión muy importante para mí, porque si ya estoy decidido a escribir este libro, debo formar en mi mente una imagen tan clara como sea posible de tu persona, para que lo que yo escriba te sea útil e interesante. Así, el objetivo fundamental de este libro se alcanzará cabalmente: tú aprenderás este hermoso tema de la Mecánica; sus fundamentos, la historia de su desarrollo, sus técnicas de ataque y resolución de los problemas y sus aplicaciones. Quizá consiga apasionarte por este tópico tanto como yo lo estoy y tal vez logre convencerte de que se trata de una parcela del pensamiento científico y de la investigación teórica que vale la pena explorar, pues, en contra de lo que algunos piensan, se trata de un tema que a más de cuatrocientos años de haber visto la luz, aun guarda secretos y reserva sorpresas espléndidas. Déjame intentarlo: tú eres un joven estudiante de alguna de las carreras del área de las físico-matemáticas, como dicen por allí. Tal vez estás próximo a obtener un grado de maestría en ciencias, en ingeniería o en química, así que tu edad debe ser entre los veintitrés y treinta años. Tu ambición es obtener un puesto en una universidad, o bien llegar a dirigir alguna línea de producción, o tal vez una planta, dentro del ámbito industrial de tu país. Eres inteligente, estudioso y, sobre todo, desde pequeño has tenido una enorme curiosidad; has buscado siempre hallar explicación a la pregunta de por qué funcionan las cosas en nuestro universo y tal vez te has planteado esa otra de cómo podrían funcionar mejor. Me atrevo a pensar que tú has sido uno de esos niños que destripan juguetes, inundan sus habitaciones y se han quemado los dedos manejando sustancias peligrosas. Muy probablemente cuando muy joven, pusiste en serios aprietos a tus atribulados padres por las preguntas que les hacías acerca de temas que en algunas ocasiones ni siquiera habían reparado. Te gusta leer, dominas la computado-
ix
Prólogo
ra sin haber tenido que llevar curso alguno sobre su manejo y tienes buen humor. Sientes la alegría del conocimiento nuevo como el gozo de llegar a la cima de un cerro, nomás por haber llegado allí y por la oportunidad de ver todo el paisaje desde las alturas. Pero también puede ser que tú seas una persona mayor. Si, creo que vislumbro a alguien que es de mi profesión. Un profesor, un docente que busca material para su cátedra. Alguien que siente el placer de enseñar, de presentar el conocimiento de forma novedosa y variada; que trata de agarrar la atención de sus estudiantes y no soltarla más en el curso. Inducir en sus pupilos la misma pasión por el conocimiento que enseña, que la que él mismo siente y darles una formación sólida y duradera que les permita en adelante, cuando egresen de las aulas, atacar y resolver los problemas que enfrenten, incluso el de formar a su vez a otros estudiantes. No sé si mi visión haya sido correcta. No sé si tú, quien ahora lees estos renglones, realmente sientas que lo que acabo de escribir te describe aunque sólo sea un poco. Espero sinceramente que sí. Ojalá haya acertado al dibujar con letras el perfil de quien ha decidido gastar un poco de su tiempo para buscar aquí respuestas a sus inquietudes científicas y aprender (o recordar) ese bellísimo modelo de la física que se conoce como la mecánica. Por otra parte, ¿qué te puedo ofrecer yo con este libro que no lo encuentres en otros? Pensándolo con cuidado, hay cientos de libros que han aparecido desde finales del siglo XVII sobre este mismo tema. Algunos de ellos han resultado ser obras maestras por su lucidez o por la profundidad de los conocimientos que ofrecen. Autores de la talla de A. Sommerfeld o de L. D. Landau y E. M. Lifshitz, sin contar con el propio I. Newton, representan monumentos científicos y literarios muy difíciles de superar. Lo que yo intento con este libro es simplificar el aprendizaje de la mecánica, optimizar el material que debe aprenderse y hacer ameno el proceso de aprendizaje. Como seguramente ya te habrás enterado, la mecánica puede enfocarse desde muy variadas perspectivas. Las hay que buscan, por ejemplo, tocar el fondo de las cosas. Los autores de esta línea nos llevan verdaderamente a las profundidades abisales; a los terrenos de la topología diferencial, de los espacios fibrados y los grupos extraños. Hay gustos para todo en este mundo y la mecánica fundamental es un tema con un atractivo muy especial para algunos. Hay otros que, por el contrario, les gustan solamente las aplicaciones y de ellas, esas que se pueden encontrar ya resueltas en tablas o en paquetes computacionales. Para estas personas, las
x
Prólogo
inmersiones en aguas profundas de la mecánica no son atractivas y no están dispuestos a dar su tiempo en aras de la “metafísica” de la mecánica. Mi intención es la de proporcionarte un material didáctico que tú ciertamente puedas estudiar en dos semestres normales de mecánica dentro de alguno de los planes de estudio de posgrados en ciencias o ingeniería que se ofrecen en el mundo. Con los conocimientos de nivel universitario que muy probablemente ya tienes de álgebra, de geometría analítica, de cálculo y de ecuaciones diferenciales, no deberás enfrentar problemas mayores para asimilar el contenido de este libro. Si en algún capítulo vamos a requerir de cierto material no tan “ortodoxo”, entonces lo desarrollaremos de tal modo que tu aprendas ese tema matemático allí mismo, sin tener que acudir a otras fuentes bibliográficas. Tengo el deseo de desarrollar este libro en cuatro vertientes básicas: la primera es la histórica; en la medida de lo posible, trataré de contarte historias breves que sirvan de soporte al tema que en ese momento estudies, con el objetivo de hacer amena la lectura, darte un descanso y permitirte que te distraigas momentáneamente del rigor del desarrollo científico. Así mismo, quiero que te ubiques históricamente en aquellas épocas en las que esos tópicos se hicieron. Estoy seguro que esas anécdotas te serán de utilidad cuando llegue el momento de dar una clase o dictar alguna conferencia sobre ello. A lo largo de treinta y cinco años, a mí me ha servido mucho invocar, en un determinado momento de mis exposiciones, a una historia o a un cuento para “aflojar” el ambiente, sobre todo, cuando hay que hacer una zambullida en aguas profundas de la física o las matemáticas. La segunda vertiente que desarrollaré es la de los conceptos fundamentales; es decir, que trataré de exponerte las ideas básicas con la mayor amplitud y claridad que me sea posible. Así, las leyes de Newton que en la mayoría de los libros solamente se enuncian para que el estudioso del tema las recite como una oración, en mi libro te voy a exponer las ideas que subyacen a las leyes y quiero mostrarte también sus alcances y sus limitaciones. En fin, que deseo aprovechar la oportunidad para recrear el pensamiento prístino que desemboca en tal o cual idea y echar un vistazo a sus detalles e implicaciones. La tercera línea que pretendo seguir en este libro es la de las aplicaciones. Para expresarlo lo más claro que sea posible, deseo aterrizar toda la teoría que voy a exponerte, invocando a ejemplos y ejercicios de la vida real, en la medida en que el tema lo permita. Estoy pensando en ti, como ya lo men-
xi
Prólogo
cioné al principio y debo imaginar que tú, siendo un ingeniero o un científico, debes estar ansioso de dar respuesta a varios problemas que te han planteado o te han estado dando vueltas en la cabeza, desde hace algún tiempo, sobre esos rubros que aquí estudiarás. Bueno, tal vez con los ejercicios, los ejemplos y los comentarios puedas alcanzar tus metas. Finalmente, la cuarta vertiente de este libro será la de hilvanar a la mecánica con otros grandes temas de la ciencia. Deseo que me permitas, al final de ciertas unidades, mencionar la forma cómo ese tópico dio lugar a ideas dentro de otras áreas de la ciencia, o bien, cómo fue posible comprender ciertos fenómenos que están fuera de la mecánica, pero que a partir de las ideas de la mecánica pudieron esclarecerse. Entiéndeme bien, no se va a tratar de que me ponga yo a escribir ahora sobre electromagnetismo o sobre relatividad o termodinámica. Sería tanto como salirme del tema y en cierto modo traicionar a la idea original. No, lo que deseo hacer es indicarte aquí y allá, a manera de pequeñas disgresiones, las ramificaciones que han brotado de la mecánica y que finalmente han dado lugar al desarrollo de nuevos temas de la ciencia, pero sin entrar en ellos propiamente. Espero haber acertado al imaginarte. Ojalá el material que aquí te presento sea de utilidad y ayude a darte los conocimientos, las destrezas científicas y la habilidad para afrontar los problemas de la ciencia o la técnica que se presentarán en tu vida profesional. La escritura de este libro ha sido para mí la realización de un anhelo largamente acariciado y muchas veces pospuesto. La mecánica fue un legado que me dejó mi viejo profesor Juan B. de Oyarzabal cuando un día sintió que había llegado el momento de pasar la estafeta a un joven docente, después que él mismo la había recibido muchos años antes de su mentor y la había expuesto ante sus estudiantes en las aulas. Ese día me llamó a su cubículo de la universidad y sin más me invitó a tomar su cátedra e impartir la materia en los siguientes períodos lectivos. Me sentí abrumado por aquel inesperado honor, máxime que en el claustro docente había en aquellos momentos una buena cantidad de profesores; muchos estupendos y de excelentes calificaciones. Desde entonces, cada vez que tengo oportunidad, imparto mi curso. Han pasado ya treinta años y sigo haciéndolo con el mismo entusiasmo y emoción con que lo hice desde el inicio. Siempre he querido materializar en la forma de un libro el conocimiento que trato de meter en las cabezas de mis estudiantes y al mismo
xii
Prólogo
tiempo dejar una obra tangible que pueda ser utilizada por otros que también serán mis estudiantes aunque no necesariamente lleguemos a conocernos personalmente. Ahora lo he logrado, después de casi dos años de escritura. Por las mañanas, muy temprano, antes del inicio de mis actividades en la UNAM, en mi casa, me propuse la tarea de escribir este libro. Y si tú vas a poder abrir las páginas y estudiar esta obra quiero que tomes en cuenta que, ante todo, es a aquel viejo profesor mío a quien en última instancia le debemos, tanto tú como yo la posibilidad de tenerlo en las manos. Tú, porque el conocimiento, el entusiasmo y la pasión por enseñar el tema me fue transmitida por él; esos fueron dos ingredientes indispensables que hicieron posible este libro. Por mi parte, sin ellos nunca hubiera tenido ese impulso para sentarme a escribirlo; me hubiera perdido el placer que su escritura me causó. Pero para ser justo tengo que decirte que este libro tampoco hubiera podido llegar a ver la luz del día si no hubiera yo contado con la ayuda de otras personas. Muy particularmente debo expresar aquí mi sincero y profundo agradecimiento a la M. en C. Barbarela Dávila, quien actualmente se encuentra desarrollando su tesis doctoral bajo mi dirección, y que en una forma absolutamente desinteresada, se echó a cuestas la fatigosa tarea de transcribir mi manuscrito a una vieja y achacosa computadora; de importar las figuras que yo dibujé y de dibujar otras muchas. Una tarea, digo, que solamente por el entusiasmo por la lectura del tema y por el gusto por el trabajo, realizó a lo largo de estos meses. No puedo menos que expresar aquí mi agradecimiento y reconocer la invalorable ayuda que me prestó. Sin ella, esta obra, como decía, nunca hubiera podido llegar a ser. Fermín A. Viniegra Heberlein
México, 2002
xiii
INTRODUCCIÓN
La ciencia es una disciplina teórico-experimental que busca conocimiento nuevo y verdadero acerca de la naturaleza y sus procesos. Mientras mayor es ese conocimiento, las posibilidades de aplicarlo para el provecho del ser humano son mayores también y, al menos idealmente, estas aplicaciones permiten mejorar la calidad de la vida, su duración y la trascendencia de la especie en el universo. Para hacer ciencia hay que seguir una estrategia general que, excepto por pequeñas diferencias propias de cada campo del conocimiento, es la misma siempre. Esta estrategia se conoce como el método científico. Se trata de un esquema conceptual que desde su estructuración primitiva, allá por la segunda mitad del siglo XVI ha sido la guía con la cual se consigue el objetivo de esta rama de la actividad humana. No nació de golpe y porrazo y tampoco apareció ya totalmente estructurado hasta sus mínimos detalles. El método científico mismo ha venido evolucionando al través del tiempo, haciéndose cada vez más preciso y más específico para cada parcela del conocimiento. Hoy en día, en efecto, esta estrategia tiene diferencias, según que se aplique a la ciencia básica que a la ingeniería o a la medicina, por citar tan solo tres de todos los ámbitos del saber donde ha sido utilizado y ha rendido resultados positivos. En términos generales, el método científico debe ejercitarse, siguiendo tres grandes etapas sucesivas; estas son, la etapa de acumulación, análisis y síntesis de la información pertinente, seguida por la de la inducción y se concluye con la etapa de la deducción. Como se indica, la primera etapa consiste en el trabajo de hacerse de la información que concierne a ese fenómeno, ese experimento; en fin, ese hecho que se desea investigar. Todo aquello que se juzgue a priori pertinente al objeto de la investigación y que se tenga a la mano, como son libros, artículos, reportes; así como los resultados de observaciones hechas por el interesado, o por otras personas,
xv
Introducción
se debe acumular. Todo ese material debe ser estudiado cuidadosamente para hacer una primera clasificación y evaluación de su contenido. Hay que descartar lo que no sea relevante y hay que conservar lo importante. Aquí comienza el conocimiento, cuando de pronto, en toda aquella maraña de libros, artículos, fotos, gráficas, comienzan a notarse ciertos rasgos; ciertas tendencias sistemáticas. Esta es la fase de la síntesis del conocimiento. Con toda esa información clasificada y analizada; con todos esos detalles y rasgos importantes sintetizados, el científico está en condiciones de dar el segundo gran paso en su trabajo: establecer ciertos asertos generales, a partir de la experiencia acumulada. Esta es la fase de la inducción. Esta es, quizá, la etapa más difícil y azarosa de todo el proceso, pues inducir; esto es, afirmar (o negar) cuestiones generales a partir de datos particulares; ir de lo particular a lo general, es algo que al humano le cuesta mucho trabajo y con frecuencia se equivoca. Hay una buena cantidad de dolorosos ejemplos de equivocaciones conocidas en distintas partes del ámbito científico, como aquella que se dio recientemente, cuando se descubrió que las piedras fundamentales para la vida no necesariamente son aquellas que se habían establecido en la primera mitad del siglo XX y que se referían al bióxido de carbono, en particular, que junto con el agua y el amoniaco deben conducir a la formación de amino ácidos y estas moléculas, a su vez, enlazarse e imbricarse con otros compuestos para dar lugar a las macromoléculas que adquieren la facultad de auto repetirse. Estas ideas, desarrolladas a partir de las inducciones de un bioquímico ruso: A. I. Oparin (1894-1980) fueron, por ejemplo, las que llevaron a los exploradores del planeta Marte a afirmar que en ese mundo no hay vida, allá por los 70´s del siglo pasado. Hoy en día, con la evidencia acumulada aquí mismo, en el planeta Tierra, en las profundas chimeneas volcánicas del fondo del mar, se ha podido comprobar que no sólo de bióxido de carbono, sino también de óxidos de azufre se puede dar el fenómeno de la vida. Estos descubrimientos echaron abajo toda aquella teoría y dieron nuevos bríos a la búsqueda de vida extraterrestre. Aquella inducción, fundamentada en evidencias ciertas, pero insuficientes, condujeron a errores que obligaron a regresar al punto de partida, buscar más información, hacer una nueva clasificación de ella y realizar una síntesis de mayor alcance; más potente, por decirlo de alguna manera. Entonces, la inducción permitió dar un concepto de los fundamentos de la vida más amplio. Hoy en día, a la luz de estas investigaciones, se sabe que la vida, en formas diversas, surge con
xvi
Introducción
facilidad en una dilatada gama de condiciones: desde los gélidos ambientes polares y estelares, hasta las ardientes aguas de las chimeneas abisales. Ello ha llevado a pensar, así mismo, que casi en cualquier lugar del universo donde existan condiciones para la formación de compuestos básicos, puede haber vida. El camino de la creación se ha bifurcado; cada vez más y con mayor evidencia se ve que aquel acto divino que colocaba al planeta Tierra en el mero centro del universo, fue mucho más amplio ya que involucró a todo él en ese formidable plan de dotarlo de inteligencia. Y como en un tobogán por el cual se deslizan los niños, así el método científico permite al investigador acceder a conocimiento nuevo n uevo una vez que ha ascendido por la empinada y peligrosa escalera de la inducción. Así, una vez que se han alcanzado alcanzado esos hitos a partir partir del proceso proceso inductivo inductivo,, la tercera etapa del proceso: la fase deductiva, da comienzo. Aquí por lo contrario de la parte inductiva, hay que partir p artir de aquellos asertos generales a los que se había llegado y realizar el descenso (como en un tobogán), hasta alcanzar las conclusiones menudas y prolijas que permitió el modelo. Nuevamente, Nuevamente, la experimentación y la observación aparecen en el proceso. Cada resultado de una deducción hay que contrastarlo, en el laboratorio o en el observatorio, con los datos, con las fotografías y gráficas que se obtienen aquí, para estar cada vez más seguros de aquel modelo teórico que se había estructurado a partir de la síntesis, con asertos inductivos. Estos hallazgos constituirán más tarde, los elementos que otros investigadores usarán como puntos de partida para hacer sus propios ascensos por las montañas de la inducción y llegar a proponer hipótesis más generales, con las cuales el modelo actual amplíe sus alcances y fortalezca su estructura; o bien, en el caso de que algún resultado experimental contradiga de algún modo a la teoría, se deba demoler ésta completa o parcialmente y se tenga que iniciar de nueva cuenta el trabajo de construir un modelo teórico teórico que remonte remonte las fallas fallas que el anterior anterior exhibió y que no tenga tenga puntos de disdi screpancia con la naturaleza. Así es el camino de la ciencia. El método científico comenzó a ser estructurado en su forma más primitiva en el siglo XVI, cuando Nicolás Copérnico inició la práctica de observar el cielo con una tabla ranurada, anotar ordenadamente los datos de sus observaciones en hojas h ojas y hojas de registro, a lo largo de treinta años, para luego con ellos, hacer dibujos con las posiciones de los planetas, referidas al Sol. Fue así como Copérnico pudo, al fin de tantos años de paciente trabajo, llegar a la afirmación de que los planetas giran alrededor
xvii
Introducción
del Sol y no, como se creía hasta entonces, que la Tierra es el centro del sistema y a su alrededor, tanto el Sol, como la Luna y el resto de los planetas conocidos, conocidos, giran describiendo describiendo sus trayectorias trayectorias.. Así fue como nació el sistema heliocéntrico que hoy por hoy se da como un hecho elemental. El mismo procedimiento general siguió Johanes Kepler cincuenta años después, cuando paciente, tozudamente convirtió los datos astronómicos de su colega, Tycho Brahe, en puntos sobre un papel y demostró que las órbitas de los planetas, en su tránsito alrededor del Sol no son círculos, como Copérnico había propuesto, sino elipses, en uno de cuyos focos se encuentra esta estrella. Luego, haciendo una y otra vez los mismos cálculos a partir de relaciones geométricas sintetizadas de aquellas figuras, pudo proponer como postulados colosales, sus otras dos leyes: que los planetas al recorrer esas órbitas oblongas alrededor del Sol barren áreas iguales en tiempos iguales y que al hacerlo, el cuadrado de sus periodos de orbitación son proporcionales al cubo de las distancias medias que los separa del centro de atracción. Así, esa empinada escalera que se asciende, pisando los peldaños de la recopilación de la información pertinente, seguido por la selección y ordenación de la misma, para después hacer el análisis y la síntesis del conocimiento y culminar con el establecimiento de asertos generales, como resultado de una inducción, fueron cumplidos meticulosamente por aquel gigante alemán. A partir partir de su suss tres tres formid formidabl ables es leyes leyes sobre sobre el movim movimien iento to planet planetari arioo se pud pudoo entonces descender, descender, como en un tobogán, por por la llana superficie superficie de la deducción. Decenas, si no es que cientos de resultados se siguieron de ellas, con los cuales fue posible dar precisión al calendario, construir efemérides y predecir eclipses, entre muchas otras cosas. El método científico empezó en aquella época a producir cantidad de resultados ciertos, precisos y confiables, con los cuales la agricultura, la ingeniería y otras ramas del conocimiento se enriquecieron e hicieron posible importantes avances en la civilización. De Polonia Polonia y Alemania, el método científico viajó v iajó al sur de Europa y se hizo presente en Pisa y Venecia; Venecia; dos hermosas ciudades de Italia. Allí, en distintas épocas de su vida, un pelirrojo algo chaparro y fortachón, pendenciero y malediciente, jugando con esferas y otros objetos de piedra o de madera que dejaba resbalar cuesta abajo por planos inclinados que él mismo había construido, construido, provocó provocó un salto gigantesco gigantesco en el conocimiento conocimiento científico al establecer los principios de eso que hoy en día se conoce como la cinemática; aquella parte de la mecánica que estudia el movimiento de los cuerpos cuerpos materiales materiales..
xviii
Introducción
Galileo Galilei, usando nuevamente esa formidable herramienta intelectual que Copérnico y Kepler utilizaron con tanto tan to éxito, llegó al concepto de aceleración como el cambio de la velocidad de los objetos y echó las bases de las leyes de la mecánica que otro genio habría de usar para estructurar su propio modelo teórico. Isaac Newton tomó, en efecto, esos estupendos resultados que habían sido hallados por Copérnico, por Kepler, Kepler, por Galileo y otros gigantes de la misma talla que éstos, y en un acto impresionante de potencia intelectual construyó constr uyó la estructura que hoy, hoy, y desde hace cerca de trescientos cincuenta años, se conoce como la mecánica clásica. Este es el tema del primer libro. En 1668, Newton sintetizó su teoría en un conjunto de axiomas fundamentales que conciernen a la estructura del espacio físico; el escenario de los acontecimientos naturales, como un espacio euclideo de tres dimensiones, donde los observadores pueden realizar sus medidas sin interferir con los objetos y los fenómenos que observan. Esta es la base para definir el concepto de marco de referencia, que es esencial en la teoría. Así mismo, Isaac Newton Newton postuló al tiempo como un ente que transcurre en forma monótona y absoluta para todos los observadores obser vadores del universo, de tal suerte que en cualquier punto de él y en todo instante, un lapso sea exactamente igual para todos los demás, sin importar sus ubicaciones, ni sus condiciones cinemá cinemátic ticas. as. Y el objeto objeto único único sobre sobre el cuál cuál se manifies manifiestan tan todos todos los agentes agentes físicos físicos que existen en el mundo es la masa. Todo cuerpo material posee masa y ésta la definió el genio británico como aquella reticencia que exhiben los cuerpos a cambiar sus respectivos estados de movimiento. Tanto mayor será ésta, cuanto más masivo sea el cuerpo y mutatis mutandi. Al espacio, espacio, al tiempo y a la la masa, masa, Newton Newton adicionó adicionó un cuarto elemento, un cuarto axioma: la fuerza. fuerza. Para Para él, la fuerza es la causante prístina prístina de todos los fenómenos naturales. Los cuerpos materiales que en el universo se mira cómo ejecutan toda toda suerte de virajes, aceleraciones, aceleraciones, piruetas piruetas y machincuepas, lo hacen por una y solamente una razón; ésta es que se encuentran actuados por alguna o algunas fuerzas. Las fuerzas están allí, en todo el ámbito del universo; un iverso; sus orígenes pueden ser varios, pero todas ellas se manifiestan sobre los cuerpos materiales de una sola forma: cambiando el estado de su movimiento. Las fuerzas, tal como las postuló Newton, son entes con existencia física definida, independientemente de quién, o desde qué marco de refe-
xix
Introducción
rencia las observe. Por eso se dice que, dentro del marco conceptual de la mecánica, las fuerzas tienen realidad objetiva, aludiendo al concepto cartesiano. Finalmente, las fuerzas son, desde el punto de vista matemático, vectores; esto es, que poseen, además de magnitud, dirección y sentido de aplicación. Como tales, las fuerzas deben entonces manipularse; descomponiéndose en sus componentes independientes, sumándose, restándose o multiplicándose de acuerdo con las reglas para los vectores. Así, con esta tetralogía tetralogía de elementos esenciales: el espacio euclideo euclideo tridimensional, el tiempo absoluto, la masa y las fuerzas vectoriales, Newton construyó su mecánica. En este libro se muestra en detalle la génesis, la construcción y las aplicaciones más importantes del modelo newtoniano. Uno de los objetivos que persigue el autor con este nuevo texto de mecánica, en efecto, consiste en mostrar al lector interesado en el tema, la forma como se construyó; las ideas prístinas que dieron lugar a él y luego, los problemas que atacó y con los cuales fue posible contemplar la escena del mundo desde una nueva y brillante perspectiva. Siguiendo la historia, se muestra en forma prolija la teoría de la gravitación newtoniana y se llega al encuentro encuent ro de las tres leyes de Kepler Kepler.. Aquellos asertos, que con tanto trabajo y sufrimiento fueron propuestos por el astrónomo alemán en los albores del siglo XVII, aparecen como teoremas en el formidable juego matemático de Newton. Newton. Encontrarlos, demostrar demostrar que en efecto, se trata de teoremas a los que se llega como resultado de un proceso intelectual de deducción de de las leyes de de la mecánica, fue vital para el genio británico. co. Por una parte, parte, fue la confirmación confirmación a posteriori de la validez de su modelo. Sin esos resultados toda la teoría hubiera sido totalmente inútil, excepto por su bellísima estructura, así que muy bien pudo haber quedado como una pieza del del museo de la mente mente humana (que es muy muy posible que por ningún lugar del planeta se pueda hallar). Las leyes de Kepler, una vez demostradas, fueron, en efecto, la prueba fehaciente de que la mecánica mecánic a clásica funciona. Pero no nada más probaron eso, que en sí ya había constituido un espléndido logro del talento científico. Probaron, así mismo, que aquel método que Newton había ensayado por primera vez en su totalidad; desde sus primeros pasos en la búsqueda de la información, hasta el establecimiento de las leyes en forma inductiva y luego seguir la pendiente del proceso deductivo; esos
xx
Introducción
pasos del incipiente método científico, conducen, en efecto, al encuentro de la verdad (así, con minúsculas). Mostrar la deducción de las leyes de Kepler es también una parte p arte esencial, ineludible de cualquier libro sobre la mecánica. Es por ello que aquí se muestra al estudioso del tema, la forma como, a de partir de aquellos primeros principios, se puede llegar a ellas, siguiendo un procedimiento matemático simple y directo. El conocimiento de la mecánica de los planetas fue la llave con la cual se cerró definitivamente y para siempre la controversia sobre si el sistema planetario es geocéntrico o heliocéntrico. Después de que estos resultados vieron la luz, ya ningún ser inteligente y sensato pudo objetar que el sistema planetario verdaderamente se mueve alrededor del gran astro solar en ese ballet celestial de inefable belleza. También También quedó claro que las órbitas oblongas de los planetas (tal como las había llamado Kepler), no se deben a traviesos ángeles que las sacan de sus caminos originales; que deforman las órbitas inicialmente circulares en sus juegos espaciales, cuando usan a estos cuerpos celestes como bolas de un billar astronómico y les dan empujones y jalones colosales. No, las órbitas planetarias son, ni más ni menos, que la conclusión natural natur al de una interacción que sigue una proporcionalidad con el inverso del cuadrado de las distancias. La mecánica planetaria llevó desde aquel entonces y hasta el presente, a desarrollar la llamada astrodinámica; esto es, a comprender cabalmente el movimiento de todos los cuerpos que en el espacio se mueven bajo la acción de la fuerza gravitacional propuesta por Newton. No nada más los planetas fueron desde entonces objetos de estudio de la mecánica. Satélites, asteroides y cometas fueron también puestos pues tos en las platinas de los microscopios de los hombres y mujeres de ciencia para hallar hasta los más nimios detalles de sus conductas. Este estudio habría de abrir las puertas de la investigación espacial que hoy por hoy tiene a la humanidad a un tris de convertirse en habitante de otros planetas; de liberarse finalmente de las cadenas que desde los albores de la historia la han tenido atada a la Tierra. En este libro, naturalmente, se dedica una buena parte par te al estudio de la astrodinám astrodinámica. ica. El cuerpo rígido fue otro de los más sonados éxitos que se anotó la mecánica newtoniana. El problema de describir los giros y cabeceos de cuerpos rígidos materiales bajo la acción de fuerzas y torcas, en efecto, fue uno de los grandes retos que se plantearon los investigadores desde el final del
xxi
Introducción
siglo XVII que comenzaron a ensayar el modelo de Newton. No fue fácil. Su planteamiento, ataque y resolución desafió a grandes talentos durante doscientos años, sin resultados importantes. impor tantes. Fue hasta las postrimerías del siglo XIX que una bella cuanto talentosa mujer, Sonia Kowalewskaia pudo al fin alcanzar la cima de este tema, al describir matemáticamente la rotación, la precesión y la nutación de trompos pesados, simétricos, que pivotean sobre puntos fijos, debido a la torca gravitacional que la Tierra ejerce sobre ellos. Hoy en día, el tratamiento del trompo continúa siendo un tema obligado en el estudio de la mecánica clásica. Un tema que no siempre se expone correctamente en los libros de texto y que es causa de frecuentes confusiones y equivocaciones entre los estudiosos. Aquí se expone con profundidadd este bello tema. da Mas no se crea que con esta formidable máquina teórico-matemática que se conoce como la mecánica clásica, todos los problemas relativos al movimiento de los cuerpos materiales actuados por agentes físicos quedaron automáticamente resueltos y listos para su utilización en la búsqueda de mayor conocimiento o en la utilización de sus resultados para la confección de artefactos mecánicos. ¡Nada de eso! Por el contrario, ante cada avance que se dio en este tema, nuevos problemas, nuevos retos y desafíos aparecieron para ocupar a las brillantes inteligencias de los científicos. El problema de muchos cuerpos materiales, o el problema de describir el movimiento desde marcos de referencia no inerciales sumieron en profundas cavilaciones a decenas o centenas de hombres y mujeres de ciencia de los años que pasaron después que la teoría había quedado completa y estructurada por el genio británico. La dinámica de un sistema de muchas partículas es fundamental para la mecánica clásica. No hubiera sido muy útil la teoría si solamente hubiese servido para estudiar a una sola partícula puntual. Ni existe, ni es importante, un solo corpúsculo como el que se plantea en el tópico correspondiente y sobre todo, el universo está hecho de miríadas y miríadas de cuerpos que interactúan interactúan entre sí, de de manera que el evento de de uno solo, aislado del resto, resulta absolutamente improbable. Por otra parte, el problema de un sistema de muchos cuerpos, si bien se plantea con relativa facilidad, no admite soluciones analíticas, cerradas, excepto cuando son sólo dos los cuerpos, o bien en casos muy especiales, cuando se tienen tres.
xxii
Introducción
Con más cuerpos, el e l problema se vuelve imposible impos ible de resolver, excepto en forma aproximada. El asunto de los marcos de referencia no inerciales, igualmente reviste una importancia toral para la mecánica. Pensándolo bien, aunque el concepto de un observador inercial es la base de la teoría y la existencia de él es la esencia de la primera ley de Newton, sin lo cual el esquema teórico no puede estructurarse, da la casualidad que en el universo, por lo visto, no existe un solo sitio donde pueda colocarse un observador y clamar que se trata de un marco de referencia inercial. ¡Es claro! Aquí todo es un mar de interacciones de la más variada índole. Todo Todo son choques, empellones, roces de unos cuerpos contra otros. Por ninguna parte se puede encontrar un lugar que durante un lapso razonable esté exento de fuerzas y torcas, así que no deja de ser tan solo una bella utopía la exigencia del dichoso marco inercial. Pero entonces, si no se puede hallar un sitio del universo donde pueda anclarse un sistema de coordenadas c oordenadas cartesiano, desde el cual se ratifiquen las leyes de la mecánica, parecerá que la teoría completa queda condenada a ser no más que una bellísima pieza del intelecto, sin mayor m ayor utilidad. Una retícula de postulados básicos y leyes; una formidable estrategia estrat egia lógica que habrá de ver pasar los años desde atrás de las paredes de vidrio de algún museo de la ciencia en algún ignoto pueblo del mundo, tal como se mencionó anteriormente. Gustave Gaspard de Coriolis salvó este ominoso obstáculo. Su trabajo fue transcribir toda la mecánica clásica de Newton a marcos acelerados (se dice fácilmente, pero se hizo dolorosamente). Así pudo describirse el movimiento desde una perspectiva más real , más apegada a las condiciones que verdaderamente enfrenta un observador cuando desea registrar el paso de cuerpos masivos por el espacio. En este libro se aborda el tema de los marcos de referencia en rotación y se muestra al lector interesado la manera como aparecen las mal llamadas fuerzas inerciales; esas fuerzas ficticias que resultan de la adopción de un sistema coordenado que gira. Conforme se resolvían más y más problemas, las barreras al conocimiento se remontaban una a una y éste se hacía cada vez mayor y más preciso. La astronomía se desarrolló desarrolló como nunca antes lo había hecho y el movimiento de los cuerpos materiales se comprendió en su cabal c abal dimensión. Pero tal parece que en la ciencia hay una suerte perversa que por
xxiii
Introducción
cada velo que disipa aparece un obstáculo aun mayor que el que acaba de ser sorteado; un velo todavía más oscuro y espeso que impide el siguiente avance y el nuevo conocimiento. c onocimiento. Cuando parecía que las fuerzas se conocían y sus fórmulas habían sido establecidas. Una clase nueva de estos agentes físicos apareció en escena y se negó durante cerca de cuarenta años a todo intento de caracterizarlas. Las fuerzas de reacción, esas que fueron predichas por el propio Isaac Newton en su tercera ley de la mecánica, resistieron todo intento de descripción mediante alguna fórmula general. Una y otra vez, testarudamente, uno de los grandes de la mecánica: D´Alembert, intentó someter esta clase de fuerzas al imperio de la teoría a través de alguna fórmula general que las sintetizara a todas. Una y otra vez fracasó. Las fuerzas de reacción se negaron en forma aún más tozuda a ser descritas. Al final fueron esas las que ganaron la batalla. D´Alembert tuvo que desistir del intento y hubo de aceptar la evidencia: las fuerzas muertas (como él las llamó), no permiten formulación generalizada alguna. Pero da la circunstancia que las fuerzas de reacción aparecen en todas partes. Siempre que un agente físico actúa sobre un cuerpo, éste reacciona instantáneamente oponiendo su fuerza de reacción contra aquella, tratando de nulificarla. Así es en el caso de un péndulo o de una leva o de cualquier mecanismo. Entonces, la falta de una fórmula general para tratar estas fuerzas que, en vez de propiciar el movimiento de los cuerpos, lo obstruyen, aparecía, de nueva cuenta, como un colosal obstáculo al desarrollo del tema y a la obtención de aplicaciones prácticas. Parecía el fin de la mecánica. Pero he aquí que fue el propio D´Alembert quien sacó a la teoría del atolladero. atolladero. Agudo en sus observaciones y deducciones, propuso un principio con el cual fue posible remontar el problema; aquel que parecía insalvable y permitir que la teoría pudiera continuar adelante con sus logros. El principio del trabajo trabajo nulo de las fuerzas fuerzas de reacción es, hoy por hoy, hoy, una de las herramientas más útiles para la resolución de una amplísima variedad de problemas de la mecánica. En este contexto se trata el principio de D´Alembert. Pero este principio no nada más sirvió para resolver una dilatada variedad de problemas de la mecánica. Fue el medio del que se valieron Lagrange y Euler, Euler, dos gigantes de la ciencia cien cia del siglo XVIII, para marcar un nuevo hito en la historia de este tema. Con el principio de D´Alembert
xxiv
Introducción
fue posible generalizar las ecuaciones de la mecánica para cualquier sistema de coorden coordenada adas. s. Así, la llamada llamad a mecánica mecán ica analítica analí tica surgió surgi ó como una nueva descripdescr ipción; un nuevo esquema teórico, con el cual se pudieron plantear en forma mucho más simple y elegante los problemas que tratan sobre el movimiento de los cuerpos materiales. Con la mecánica analítica de Lagrange y Euler las fuerzas de reacción, o de constricción, en un sentido más general; lejos de ser los más temidos íncubos de la dinámica, ante cuya presencia los científicos cient íficos e ingenieros se santiguaban y corrían despavoridos, se convirtieron, por el contrario, en dóciles mascotas, que causaron la alegría y el regocijo, pues su presencia significa un trabajo matemático menor; una carga menos, con lo cual se hace ligera la marcha para ellos. Las fuerzas de constricción disminuyen los grados de libertad y por ende, el número de ecuaciones diferenciales que es necesario resolver. resolver. Pero no nada más esa ventaja se tiene de la formulación de la mecánica analítica. La descripción en términos de coordenadas generalizadas de un espacio homogéneo de configuración, permite atacar cada problema de propias variables; en sus particulares simetrías . Y si se da el mecánica en sus propias caso de que ciertas variables son ignorables —esto es que debido a esas simetrías peculiares del sistema que se trata, las coordenadas generalizadas correspondientes no aparecen explícitamente en la función del estado dinámico del sistema— entonces de inmediato se obtiene una ley de conservación. Así, las leyes leyes de conserva conservació ciónn vienen vienen a ser, ser, dentro dentro del formali formalismo smo de LagranLagrange, las expresiones objetivas de las simetrías del sistema dinámico. Por Por cada una de éstas, una ley de conservación se sigue. Emmy Nöther, Nöther, matemática de la segunda mitad del siglo XIX y la primera del XX, propuso el célebre teorema que lleva su nombre, en el cual describe explícitamente esa relación inextricable entre las simetrías de un sistema dinámico y las leyes de conservación. Ese teorema ha resultado esencial para la física de las partículas elementales, ya que debido a su ínfima pequeñez resulta imposible observarlas y solamente sus leyes de conservación conservaci ón pueden registrarse. La energía, la carga, la paridad y otras características invariantes de ellas pueden detectarse cuando, a la salida de los gigantescos aceleradores, se realizan esas catastróficas colisiones entre corpúsculos nucleares y sus detritos se registran en cámaras fotográficas inmersas en campos electromagnéticos controlados a fin de conocer sus
xxv
Introducción
simetrías. Así, no obstante que las partículas elementales no pueden ser vistas, a través del conocimiento de sus leyes de conservación y por consiguiente, de sus simetrías, de acuerdo con el teorema de Nöther, un retrato difuso pero verdadero de ellas emerge. La mecánica analítica de Lagrange y Euler, basada en el principio de D´Alembert y el teorema de Nöther, son los temas que se abordan en los capítulos quinto, sexto y séptimo de este libro. En este último, por cierto, se muestra, como una aplicación directa de los conceptos y desarrollos teóricos de la mecánica, uno que inexplicablemente no forma parte de los tratados sobre este tema. Se trata de la mecánica de los fluidos, ese modelo que G. G. Stokes sintetizó a partir de los postulados de Newton. En efecto, G. G. Stokes dio estructura, en la segunda mitad del siglo XIX, al modelo que se conoce actualmente como la mecánica de los fluidos. Para hacerlo, tomó íntegramente los postulados de Newton de la mecánica, así como la primera ley de la termodinámica y les adicionó otro conocido como la hipótesis del medio continuo. Con este juego básico pudo proponer sus célebres ecuaciones diferenciales de balance de masa, momento (lineal) y energía. En total, se trata de un sistema de cinco ecuaciones diferenciales, acopladas, que una vez resueltas, proporcionan toda la información concerniente al flujo de los fluidos. Este modelo ha funcionado desde hace ciento cincuenta años en forma por demás exitosa, resolviendo una innumerable cantidad de problemas de ingeniería; desde el diseño de ductos, represas y válvulas, hasta la teoría del vuelo supersónico. Se puede afirmar que sin un modelo como éste, la actual ingeniería jamás hubiera sido posible. Tal vez la razón por la cual este este tema fundamental no haya sido incluido inc luido hasta hoy en los textos de mecánica, es porque, por una parte par te se ha llegado a pensar que la mecánica de los fluidos ya dio todo lo que podía p odía dar desde el punto de vista teórico y lo único que puede extraerse de ella son cantidades adicionales de resultados prácticos, en forma de gráficas o tablas numéricas que sólo sirven al diseño, pero nada tienen que dar al conocimiento científico básico. ¡Nada más falso! El estudio de este tema depara al investigador curioso una buena variedad de temas de investigación, que fácilmente ocuparán su vida entera y aun permitirá brindar a sus pupilos gran cantidad de trabajo intelectual interesante y con aplicaciones aplicacion es potenciales. De hecho, quien estudie esta parte par te de la mecánica de fluidos en la
xxvi
Introducción
segunda mitad de este libro, podrá percatarse de la enorme cantidad de trabajo teórico que aún requiere este tema para poder afirmar que ha sido explotado en su mayoría y que ya no tiene más que dar de sí. Otra razón por la cual el tema de los fluidos no aparece comúnmente en los libros de mecánica, es que el enfoque que tradicionalmente se da a este tópico va dirigido en la dirección de otros modelos de la física teórica, como son la mecánica cuántica o la relatividad. Ciertamente el signo de los tiempos en el siglo pasado fueron estos dos temas, así que, considerando que los autores de los tratados de mecánica que aparecieron a lo largo de esos años tenían en sus mentes utilizar utili zar a la mecánica clásica como una suerte de trampolín para dar el salto hacía aquellos otros rubros de la física, y su motivo consistía en mostrar los métodos propios de ese tema para dar herramientas que pudieran utilizarse en las teorías modernas, entonces es explicable por qué el énfasis se puso tanto tant o en las asociaciones con la mecánica cuántica de Schrödinger y Heisenberg o bien en los métodos que condujeron a la teoría especial de la relatividad de Einstein y poco o nada se mencionaron implicaciones hacia la comprensión del fenómeno de fluir flui r. En este libro, sin descuidar ciertos resultados que desembocan en las teorías mencionadas y comentar de soslayo sus implicaciones históricas, el acento se ha puesto precisamente sobre las posibilidades que el gran tema de la mecánica clásica abrió para el estudio y la comprensión de la conducta de esos cuerpos materiales; los más comunes del universo macroscópico, que se conocen como los fluidos. De hecho, como ya se podrá imaginar el lector, el autor de este trabajo ha sido durante la mayor parte de su vida un entusiasta de la mecánica de los fluidos. Al través de muchos años ha podido desarrollar desarrollar una estructura teórica alternativa para esos cuerpos deformables, a la cual le ha llamado la mecánica analítica de los fluidos. Esta teoría, por el contrario de la de Stokes, está fundamentada en el aparato de la mecánica analítica de Lagrange, Euler, Hamilton y Nöther. El enfoque analítico ofrece ventajas variadas e interesantes. Desde aquellas evidentes que ofrecen al investigador toda una teoría basada en un juego mucho más compacto de postulados y con una potencia formidable, como el principio de Hamilton o el teorema de Nöther, que llevan a una formulación generalizada, del tipo de las ecuaciones de Lagrange y que, adicionalmente y por primera vez, ofrecen un método para el esta-
xxvii
Introducción
blecimiento de las ecuaciones constitutivas; esto es, de las fórmulas para los esfuerzos que operan sobre los fluidos, hasta las que ofrece toda teoría lagrangiana-hamiltoniana, como son los métodos de cálculo e integración de las ecuaciones diferenciales con algoritmos iterativos, iterati vos, muy propios para el cálculo numérico electrónico. La mecánica analítica de los fluidos forma parte de este libro y se expone al lector interesado en dos capítulos: el octavo y el décimo primero. La primera parte (capítulo 8), se presenta como una secuencia didáctica lógicamente hilvanada hilvanada con los capítulos inmediatamente precedentes, precedentes, en los que se desarrolló el formalismo de Lagrange de la mecánica de partícupar tículas y cuerpos rígidos. rígidos. El capítulo capítulo 11, en cambio, cambio, muestra el tema tema desde la la perspectiva del formalismo de Hamilton. Viene a ser, igualmente, una aplicación natural de las ideas contenidas cont enidas en los capítulos noveno y décimo, en los cuales se ve esta parte de la mecánica, atribuida a Hamilton. William Rowan Hamilton Hamilt on es otro de los gigantes gigan tes del pensamient pensa mientoo científico. Su formulación de la mecánica es un tema obligado en todos los textos sobre la materia, desde su publicación publicac ión en la alborada del siglo XIX y hasta hoy en día. Hoy por hoy se considera a ésta como la estructura teórica más avanzada de la mecánica ; con ella, en cierto sentido, senti do, el viaje a través de las distintas formulaciones lleva de vuelta al punto de partida, cerrando esa tautología de inefable belleza. Sin embargo, a pesar de que en todos los textos sobre el tema se menciona, en ninguno de ellos se alcanza a vislumbrar la dimensión de este científico formidable. En primer lugar fue él quien propuso p ropuso un principio que, con el paso del tiempo, ha venido mostrando más y más su potencia, hasta convertirse hoy en día en el rector de casi todos los procesos naturales. No importa si se habla de física, o de biología, o bien se está dentro del ámbito de las ciencias económicas, o incluso in cluso de la muy discutible “ciencia” de la guerra; en todas partes parece confirmarse la validez de este principio que afirma, en pocas palabras, que la naturaleza invierte tan pocos esfuerzos en sus procesos, como sea posible, de modo que cuando ocurren, lo hacen optimizando; esto es, reduciendo al mínimo su propio desgaste. Así, la evolución de cualquier enfermedad, por citar un ejemplo dramático del principio de Hamilton, seguirá un curso tal que al final, con o sin medicamentos, el paciente se habrá recuperado, o bien habrá sucumbido al mal, de manera que la acción sobre su organismo fue extremal.
xxviii
Introducción
Igual ocurre con los sistemas materiales sobre los cuales actúan fuerzas. Como respuesta a ellas, estos cuerpos cambian sus estados de movimiento y evolucionan por el espacio. Pues bien, esos movimientos, por más que parezcan azarosos y desordenados, se llevan a cabo siguiendo obedientemente el principio de acción extrema de Hamilton. A partir de este simple pero poderoso principio, es posible deducir las ecuaciones que Lagrange, Euler y D´Alembert, con tantos sudores y fatigas, habían encontrado. Lo único que se necesita para hallarlas es postular este aserto y luego, con la ayuda del cálculo, en forma por demás directa, se encuentran. Pero no se vaya a creer que el trabajo de ese genio se redujo a establecer su postulado. ¡Nada de eso! A partir del principio de Hamilton se abre todo un universo. De él se sigue en forma directa, un juego de ecuaciones diferenciales ordinarias, de primer orden, que son una nueva opción para la resolución de problemas de movimiento de cuerpos materiales. Pero lo realmente novedoso es que las ecuaciones de Hamilton, como se llama a este sistema de ecuaciones diferenciales, se expresan en forma natural en un espacio llamado de las fases , por el propio autor de ellas y ese parece ser el escenario en el cual ocurren los fenómenos dinámicos que conciernen a los cuerpos materiales. Es un espacio dentro del cual, embebido, se halla un campo físico: el campo de la función hamiltoniana. Este campo escalar posee información, así que todo cuerpo en presencia de él, recibe esa información y actúa consecuentemente, cambiando su estado de movimiento. En aquellos tiempos, en los albores del siglo XIX, la idea de un campo físico era totalmente desconocida. Pensar que en el más absoluto vacío del espacio hubiera cierta propiedad física que paradójicamente lo llena y se encuentra embebida hasta el último resquicio en él, era impensable. Más aún, esa propiedad: el campo físico, posee información dinámica y es capaz de transmitirla a los cuerpos materiales, constituyendo éste el mecanismo mediante el cual cambian sus estados de movimiento. Esto era realmente ajeno a todas las maneras de pensar de aquellos tiempos. Hamilton fue un precursor en muchos aspectos de la ciencia. Él propuso una matemática nueva y poderosa, a la que llamó cuaterniones y se adelantó a otras mentes brillantes por casi un siglo al introducir en la física teórica el concepto de campo físico (aunque él no lo nombró de esta ma-
xxix
Introducción
nera). Ese mismo que hoy por hoy es la base de todas las teorías acerca de las interacciones entre los cuerpos. Con estas bases, otro científico llamado Sophus Lie, propuso la teoría de los grupos continuos de transformaciones del espacio de las fases en él mismo, a las cuales se les nombró inicialmente las transformaciones de contacto y en la actualidad se les conoce como las transformaciones canónicas. Con estas bases físico-teóricas se pudo dar un nuevo paso en el conocimiento del movimiento, al verlo desde el punto de vista de transformaciones que mapean puntos en puntos, dentro del propio espacio de las fases del sistema. Mapeos generados por una particular función generadora que, a posteriori , resultó ser ni más ni menos, la acción, aquella que fue postulada años atrás por Hamilton, para encontrar las ecuaciones diferenciales del movimiento. Así, el viaje de la mecánica llegó después de tantos estudios, después de tantas formulaciones, al punto de partida: a la acción y el principio de Hamilton. De todas las transformaciones canónicas que puedan plantearse a priori y que mapean puntos en puntos, dentro del espacio de las fases de un sistema dinámico, la acción es la que lo hace en forma más simple y genera la trayectoria que en verdad sigue ese sistema. Para encontrar la forma explícita que debe exhibir esa función generadora: la acción, es necesario resolver una ecuación diferencial. Se le conoce como la ecuación de Hamilton-Jacobi y es una expresión en términos de las primeras derivadas parciales de la función principal de Hamilton (la acción). Resolverla no es asunto fácil en general; sin embargo, en algunos problemas de dinámica, es la única opción que queda cuando otras formulaciones han sido impotentes para conducir a una solución. La gran virtud de la ecuación de Hamilton-Jacobi es que casi siempre se puede tratar con métodos como el de separación de variables, con el cual, al menos algunas de las soluciones pueden ser halladas. En este libro se ha hecho una presentación suscinta de la formulación de Hamilton-Jacobi y se ofrecen al estudioso del tema métodos de solución de ella, como son las teorías de las perturbaciones, tanto dependientes del tiempo, como independientes de él. A grandes rasgos, estos son los temas que habrán de encontrarse en esta obra.
xxx
CAPÍTULO 1 ANTECEDENTES DE LA MECÁNICA
1.1. El orto de la mecánica
La mecánica forma parte de un cuerpo de conocimientos más amplio que se conoce como la física. Es el modelo teórico más antiguo; el primero que se estructuró y es también el esquema que ha servido como patrón para construir las demás teorías que integran la física. La mecánica se ocupa del estudio de los movimientos de cuerpos materiales en el espacio, así como de los agentes causantes de esos movimientos. Para hacerlo, establece un esquema en general; una estrategia que conduce a ciertas expresiones matemáticas, llamadas las ecuaciones de movimiento, con las cuales es posible trazar curvas que representan las trayectorias que siguen los cuerpos en el espacio. Ese esquema es siempre el mismo y consta de un con junto de etapas que es necesario cubrir ordenadamente para arribar a las soluciones deseadas. En la figura 1.1.1 se muestra un diagrama con esas etapas sucesivas. La primera es la que consiste en establecer en forma matemática las fórmulas generales para describir el movimiento. Se trata de la maquinaria fundamental, imprescindible para atacar cualquier problema de la mecánica. Más adelante en este libro, se desarrollará con detalle esa herramienta teórica. La formulación general se muestra en el diagrama de la figura 1.1.1 como el primer bloque en la parte superior. Esa formulación general sirve para todos los problemas de la mecánica, sin importar si se trata de una sola partícula o un conjunto de cuerpos articulados, o un planeta o una galaxia. Para hacer funcionar esa formulación es necesario alimentarla con la información pertinente de cada caso particular que se considera. Esa información concierne a los agentes físicos que causan el movimiento. En la mecánica clásica se consideran dos clases de ellos: las fuerzas y las torcas (En este libro se hablará ampliamente
1
Antecedentes de la mecánica
Formulación general Ecuaciones constitutivas
Ecuaciones diferenciales
Condiciones iniciales
Ecuaciones de movimiento
Figura 1.1.1 Esquema general de la
mecánica para resolver problemas.
de estos conceptos más adelante). Es necesario proveer a la maquinaria matemática fundamental de fórmulas para las fuerzas y las torcas que urgen a los cuerpos. Fórmulas matemáticas con las cuales se plantee el problema a tratar y que se vaya a resolver para hallar el movimiento correspondiente. A esas fórmulas se les llama genéricamente ecuaciones constitutivas. Las ecuaciones constitutivas son, como se ha afirmado en el párrafo anterior, fórmulas matemáticas que representan a las fuerzas y a las torcas que actúan sobre los cuerpos materiales y que son las causantes de su movimiento; o mejor dicho, de los cambios en los estados de movimiento de ellos. Se trata de fórmulas empíricas; esto es, que no surgen de teoría alguna; ni siquiera de la propia mecánica, sino que han sido sintetizadas a partir de observaciones y medidas cuidadosas y prolijas en una gran cantidad de experimentos. Así pues, las ecuaciones constitutivas sirven para alimentar a las fórmulas generales. Al hacerlo, se obtienen ecuaciones diferenciales; las llamadas ecuaciones diferenciales de movimiento. Éstas forman generalmente un sistema que es necesario integrar. Una vez concluido el proceso de inte-
2
El otro de la mecánica
gración, es necesario imponer las condiciones iniciales; es decir, establecer matemáticamente el valor de ciertos parámetros que identifican al sistema de cuerpos que se esté estudiando, en ciertos valores temporales de referencia. Generalmente se proponen valores de la posición en dos instantes dados, o bien valores de la posición y la velocidad de los cuerpos en un instante inicial. Con este último paso de la secuencia se arriba a la meta: obtener expresiones matemáticas en forma de funciones de la posición y el tiempo, con las cuales, como se mencionó al principio, se pueden trazar curvas en un espacio tridimensional, que representan las trayectorias que deben seguir en el espacio físico los cuerpos estudiados, urgidos por la acción de agentes físicos dados. Estas funciones matemáticas se conocen como ecuaciones de movimiento o ecuaciones de trayectorias . Alcanzar este objetivo: las ecuaciones de movimiento, es la meta de la mecánica. Al llegar a las ecuaciones de trayectorias se dice que el problema de mecánica que se atacó, ha concluido. Las ecuaciones de movimiento, hay que recalcarlo, son expresiones matemáticas que representan las trayectorias que trazan los cuerpos en el espacio, como consecuencia de las fuerzas y/o las torcas que los urgen. Son expresiones que aparecen generalmente parametrizadas por el tiempo, en una forma como la siguiente: r
r
r r (t ) . La mecánica es una teoría predictiva; es decir, que permite adelantarse a los acontecimientos y responder a la pregunta de cómo se moverá un cuerpo o un conjunto de cuerpos y dónde se encontrarán en un instante futuro, sabiendo sus localizaciones y estado de movimiento actual o pretérito. Pero también es posible ir hacia el pasado y conocer el estado que guardaba el cuerpo tiempo atrás, sabiendo su ubicación y su movimiento actuales. Pues si bien el tiempo fluye solamente en la dirección del pasado al futuro, la teoría exhibe lo que se conoce como reversibilidad temporal ; es decir, permite invertir el sentido del parámetro temporal para hurgar en el pasado y conocer el estado de las cosas hace tiempo. El esquema de la mecánica, tal como el que se muestra en la figura 1.1.1 fue desarrollado por una persona en el siglo XVII: Isaac Newton (1642-1727). Forma parte del llamado método científico y es empleado actualmente en una buena cantidad de esquemas teóricos de la física, como la termodinámica o el electromagnetismo.
3
Antecedentes de la mecánica
Verdaderamente la mecánica se ha venido constituyendo y estructurando desde hace buen tiempo. No debe pensarse que nació de pronto, como en un destello luminoso instantáneo en la mente genial de Newton y que él se aplicó frenéticamente a la tarea de escribir toda la materia y publicarla. La mecánica comenzó su largo camino desde hace muchos años. No se sabe con certeza cuando ocurrió aquel evento que puede ser llamado el orto de la mecánica. Tal vez pudiera afirmarse que la mecánica nació cuando algún homínido usó una rama seca y dura de un árbol como palanca para mover un cuerpo pesado, o bien cuando algún antepasado del hombre inventó el arco y la flecha; o también pudo ser aquel portentoso instante en el que el ser humano levantó su mirada al cielo y empezó a estudiar el movimiento de los astros a través de la bóveda celeste, tratando de comprenderlo y luego asociarlo a las estaciones, a los climas y a la vida en la Tierra. Desde el siglo III a.C. Aristóteles (384-322 a.C.) comenzó a estudiar un tema que hoy se sabe que forma parte de la mecánica: la teoría del sonido. Aristarco de Samos ( 270 a.C.) propuso un sistema heliocéntrico en su trabajo Sobre el tamaño y las distancias del Sol y de la Luna . Posteriormente en Siracusa, Arquímedes (287-212 a.C.) hizo exhaustivos estudios sobre palancas, levas, poleas y polipastos, así como sobre elasticidad y fluidos, sentando las bases de lo que hoy es la ingeniería mecánica y sus aplicaciones a la agricultura y la industria. Por la misma época, Eratóstenes de Alejandría (276-194 a.C.) calculó por primera vez la circunferencia de la Tierra, observando la sombra proyectada por el Sol a medio día en el solsticio de verano, en dos sitios distantes (Siena y Alejandría). Para hacer su cálculo, Eratóstenes tuvo que proponer alguna hipótesis de trabajo, tal como se hace hoy en día, con el objetivo de simplificar el tratamiento. Así, supuso que los rayos solares llegan a los dos puntos de observación (Siena y Alejandría) paralelamente. Además, propuso que ambas ciudades están sobre un mismo meridiano y, finalmente, que la Tierra es una esfera perfecta. Así, aceptando las hipótesis anteriores, se puede deducir de inmediato y con la ayuda de la figura 1.1.2, la expresión para el radio terrestre R , conociendo la distancia l medida entre los dos puntos y el ángulo de los rayos de luz solar incidentes, que proyectan una sombra en Ale jandría.
4
El otro de la mecánica
Alejandría Siena
Figura 1.1.2. Al medio día del solsticio de verano dos estacas, una clavada en
Alejandría y otra en Siena (800 Km al sur) proyectan diferentes sombras.
R l .
De consideraciones así de sencillas, Eratóstenes fue capaz de deducir el tamaño de la Tierra. Su resultado, traducido a las unidades actuales fue muy cercano al correcto (según las medidas de Eratóstenes, la distancia entre Alejandría y Siena es de 5000 “estadios” y el ángulo proyectado por la estaca de Alejandría a las doce del día del 21 de junio fue de un cincuentavo de una circunferencia completa. Si se toma como 163 m la equivalencia de un estadio en el SI se obtiene que el radio terrestre es de 6 485.6 Km y su circunferencia es de 40750 Km). La mecánica tuvo que esperar, después de Arquímedes y Eratóstenes cerca de mil quinientos años. La razón es fácil de comprender si se considera que en la época de aquellos genios aún no había nacido el álgebra. Esta formidable herramienta fue desarrollada por árabes a partir del siglo III d.C. en el norte de África, en el cercano oriente y en Persia. Fue hasta el siglo X que su uso comenzó a extenderse lentamente por Europa.
5
Antecedentes de la mecánica
1.2. El sistema ptolemaico
Cuatrocientos años después de Eratóstenes las ideas sobre el movimiento de los cuerpos habían progresado muy poco. Aquella concepción heliocéntrica de Aristarco de Samos había sido olvidada por carecer de sustento y porque muy fácilmente se podía rebatir la cuestión de que la Tierra no esta fija en el firmamento, sino que viaja alrededor del Sol. Si así fuera, decían entonces los estudiosos de la astronomía, se podría ver el paralaje de las estrellas; esto es que una misma estrella, tomada como punto de referencia se vería en posiciones diferentes en relación a un observador terrestre en dos posiciones diametrales de la órbita de la Tierra. Como este efecto no se observaba, entonces se concluyó que, por el contrarío, la Tierra debe estar fija, en tanto que los demás cuerpos celestes: estrellas, planetas, la Luna y el Sol giran en órbitas distintas en torno de ella. Por supuesto, ningún paralaje podía observarse, dadas las enormes distancias a las que se encuentran todos los cuerpos celestes entre sí y a la carencia de instrumentos de observación otros que los ojos. Además, la idea de que la Tierra fuese simplemente otro cuerpo celeste más en el universo, repugnaba a la razón, sobre todo si se toma en cuenta que este planeta y sólo éste es el asiento de la vida humana y el hombre es la criatura privilegiada ante la religión. Ferviente partidario del sistema geocéntrico fue Claudio Ptolomeo (85-151 d.C.), el último científico importante de la antigüedad. Él sostenía, en efecto, que el Sol, la Luna, los planetas y las estrellas giran alrededor de la Tierra, ocupando órbitas concéntricas sucesivas. Para explicar las conductas tan extrañas de los planetas; sobre todo de Marte, que a veces se adelantan y otras parecen descansar y se retrasan en sus vuelos al través de la bóveda celeste, Ptolomeo propuso la idea de que cada planeta gira en una órbita circular llamada epiciclo, que está centrada en una esfera mayor, concéntrica con la Tierra, a la cual llamó deferente (véase figura 1.2.1). Con esa superposición de círculos concilió dos aspectos importantes de su teoría: en primer lugar pudo, en efecto, dar una explicación, al menos cualitativa, del movimiento que se observa en los planetas; en segundo término pudo resolver airosamente el asunto de que solamente esferas o circunferencias podían explicar tales movimientos. Como se sabe, el círculo es la figura perfecta, la única que puede ser atribuible a Dios, y como Él y sólo Él fue quien creó el mundo y lo echó a andar,
6
El sistema ptolemaico
epiciclo La Tierra
deferente
Figura 1.2.1. Epiciclo y deferente de un planeta que orbita a la Tierra en el siste-
ma geocéntrico de Ptolomeo.
entonces, el movimiento que imprimió a los cuerpos celestes, en torno a la Tierra, tuvo que ser perfecto; esto es, órbitas generadas por círculos. Por otra parte, Ptolomeo fue el primero que dibujó meridianos y paralelos sobre un mapa para ubicar con precisión la localización de los sitios geográficos. Fue este acto, el que marcó la costumbre de establecer sistemas de coordenadas para referir lugares, cosas y acontecimientos a un origen o punto de referencia. Este científico griego-egipcio también propuso que la Tierra presentaba un pequeño efecto de cabeceo alrededor del polo norte geográfico. Un movimiento que hoy por hoy se conoce como la precesión de los equinoccios y que se sabe, tiene un período de alrededor de 26000 años. Hay que recalcar el hecho de que estos resultados los obtuvo sin más ayuda que sus ojos y su profunda, su brillante inteligencia. No se debe olvidar que en el siglo II d.C. no existían ni telescopios, ni el álgebra y aún tendrían que pasar más de mil quinientos años para contar con una teoría con la cual se pudiera comprender por qué un cuerpo masivo con simetría axil, sujeto a la acción de la gravedad precede como lo hace la Tierra.
7
Antecedentes de la mecánica
Actualmente la figura de Claudio Ptolomeo ha caído (indebidamente) en el descrédito y muchas veces se le ha tachado de farsante. Nada más lejano a la verdad, pues él, en verdad fue uno de los científicos más completos de su época. Lo que ha pasado es que su modelo geocéntrico, esa concepción del sistema de planetas resultó ser equivocada y en el siglo XVI fue olvidada para dar paso el “nuevo modelo”; el heliocéntrico, el de Copérnico y Aristarco de Samos. La otra razón por la cual Claudio Ptolomeo lleva hasta esta época el estigma de la charlatanería, es por haber sido el creador de la astrología; ese conocimiento que pretende adscribir caracteres peculiares a la personalidad de los individuos, en relación con la fecha y hora de su nacimiento, debido a la influencia que en cada instante ejercen los astros sobre las personas. En este sentido es preciso aclarar que Ptolomeo, como toda la gente de su época y una inmensa cantidad de personas después de él y hasta esta fecha, creen en estas cosas como resultado de un cierto proceso de inducción: si el Sol tiene influencia sobre el clima, sobre las estaciones en la Tierra y si el clima y las estaciones influyen en forma importante sobre una buena cantidad de rasgos de las personas, entonces cada cuerpo celeste lo hace en forma especial. Hasta ahora no ha sido posible probar tal creencia. Por el contrario, abundan las evidencias de que la presencia de la Luna o de Saturno en nada influye para determinar la personalidad de los individuos que han nacido bajo su “signo”. De hecho, debido precisamente a la precesión de los equinoccios, los signos zodiacales ya no corresponden con los que Ptolomeo asoció hace cerca de dos mil años a los meses del año, de modo que nacer en el mes de marzo, por ejemplo, ya no significa estar en la casa de Aries, etc. Pero lo peor de todo no se debe a Ptolomeo mismo, sino a la tergiversación que se ha hecho de sus ideas, pues hoy en día abundan los ignorantes, los supersticiosos que no dan un paso fuera de sus hogares por las mañanas, antes de salir con rumbo a sus labores cotidianas, sin haber leído primero su horóscopo. Así que los astros no nada más determinan el carácter o la personalidad de los individuos a la hora del nacimiento (que en todo caso debería ser al momento de la concepción, que es cuando el ser humano comienza a ser), sino que también establece el destino; se proyectan al futuro. Entonces, al leer el horóscopo se pueden enterar de las travesuras que los veleidosos astros han maquinado para ese día y la persona que lo lee, previsora e “inteligente”, está en condiciones de alterar
8
El sistema ptolemaico
ese destino si se percata a tiempo de lo que le espera. Esta propiedad de vaticinar el futuro que tienen los “astrólogos” leyendo las posiciones de los astros es totalmente ajena a aquellos estudios de Ptolomeo, de modo que los actuales seguidores del Almagesto (el libro de astrología de Ptolomeo), no sólo han equivocado aquellas de por sí discutibles enseñanzas, sino que las han convertido en un cúmulo de tonterías. Lo realmente trágico de todo esto es que con sus charlatanerías han hecho que una respetabilísima figura como la de Ptolomeo, el último gran científico de la edad antigua, haya caído en el desprecio de la actualidad. 1.3. Nicolás Copérnico
La obra de Claudio Ptolomeo quedó como parte del acervo de la biblioteca de Alejandría; la más grande, la más importante de la antigüedad, junto con las obras originales de Arquímedes, de Eratóstenes y otros científicos contemporáneos. En el año 415, el 90% de las más de 500000 obras que allí se guardaban con cuidado y respeto, se convirtieron en cenizas, cuando una turba de enardecidos cristianos, azuzados por el obispo de Alejandría, Cirilo, incendiaron la biblioteca y lapidaron a sus ocupantes. Casi todo se perdió en aquel incendio. De las 123 obras de Sófocles, solamente se salvaron de la chamusquina veinte; entre ellas Edipo Rey y Medea. Camelleros que pasaron por allá, rescataron de entre las pavesas todas las obras que pudieron. Cerca de cincuenta mil rollos de papiro fueron salvados de aquel atentado a la inteligencia y fueron a parar a otra biblioteca: la de Bagdad. Durante los siguientes mil años la razón fue borrada de Egipto. De hecho, Europa vivió durante ese lapso uno de los periodos más obscuros de su historia. Pero el conocimiento y la ciencia en general no murieron. Desde Bagdad, los restos de la malhadada biblioteca de Alejandría dieron lugar a nuevos hallazgos; a nuevos desarrollos intelectuales. La química recibió un fuerte impulso y con ella la minería y la metalurgia. Pero el más importante paso en la ciencia lo dieron los árabes que desarrollaron el álgebra. Se puede entender hoy en día que la ciencia tuvo después de Alejandría un receso; un necesario descanso para dar oportunidad a que la numeración y el álgebra surgieran con los árabes, para poder continuar adelante. Hoy se
9
Antecedentes de la mecánica
reconoce que las matemáticas son el lenguaje en el que se expresa propiamente la ciencia, así que sin ese precioso ingrediente no hubiera podido dar sus siguientes pasos. Las matemáticas, la química y en general la ciencia, entraron a Europa desde España. Lentamente, este conocimiento comenzó a propagarse no sin oposición. La iglesia católica opuso feroz resistencia al conocimiento científico. Decenas de personas fueron enviadas a la hoguera, lapidadas o encarceladas de por vida por sus “herejías” científicas. No obstante, la ciencia continuó su expansión. En un pequeño pueblo de Europa oriental llamado Torun, en lo que hoy en día es Polonia, nació el 14 de febrero de 1473 quien más adelante sería conocido como Nicolás Copérnico. Estudió leyes y medicina, obteniendo su doctorado en la Universidad de Padua en Italia, después de haberse ordenado sacerdote. Después de graduarse regresó a Polonia para encargarse del curato de Frauenburg. Allí vivió siempre, hasta su muerte en 1543, a la edad de 70 años. Copérnico fue siempre un estudioso del cielo. Estando en Frauenburg recibió una invitación del Papa en Roma para integrarse a un equipo científico del más alto nivel que se encargara de corregir el viejo calendario establecido por Julio César desde el principio de la era cristiana y que aceptaba la duración del año, de 365.25 días. Después de mil quinientos años, pequeños errores se habían acumulado, haciendo que las fiestas sacras tuvieran lugar en fechas totalmente distintas a aquellas que marcaban las Sagradas Escrituras. Para corregir esos errores había que establecer un nuevo calendario, más preciso. Pero éste sólo podía calcularse con base en observaciones de los planetas que también fuesen mucho más exactas. Copérnico declinó con gran cortesía la invitación del Papa, pero de inmediato se abocó a la tarea de observar y registrar el movimiento de los planetas. Mandó construir una tabla ranurada, recta y plana y la dotó con una plomada y un sistema de compases, para conocer la ascensión recta y la declinación de los objetos que observara. Todas las noches, durante los siguientes treinta años, observó el cielo y anotó sus resultados. Para su sorpresa, sus datos presentaban discrepancias enormes con respecto a las predicciones que se hacían con el modelo de Ptolomeo vigente. Algo realmente malo estaba pasando. Se trataba de errores de fondo, de esencia con el modelo ptolemaico.
10
Nicolás Copérnico
Copérnico se puso a estudiar. En particular, le llamó poderosamente la atención aquel trabajo de Aristarco de Samos, sobre el tamaño y las distancias del Sol y de la Luna, donde proponía en forma por demás general y vaga, sin mayores fundamentos, un sistema de planetas orbitando al Sol. Tanto se interesó por esas ideas tiempo atrás olvidadas, que se puso a dibujar sobre grandes pliegos de papel las posiciones de la Tierra y de los planetas tomando como referencia al Sol. Salvo pequeñas discrepancias atribuibles naturalmente a la crudeza de sus observaciones desde la tabla ranurada, muy pronto se le hizo claro a Copérnico que en efecto, tanto la Tierra, como los planetas parecían obedecer a un sistema heliocéntrico. Sin esos epiciclos, ni deferentes ni ecuantes que era necesario aceptar en el sistema ptolemaico; sino simplemente con círculos concéntricos alrededor del Sol, los planetas seguían sus caminos. La verdad de las cosas es que con el modelo heliocéntrico de Copérnico no mejoraron los vaticinios, ni fueron más confiables las efemérides que aquellas que se hacían con el modelo geocéntrico de Ptolomeo. Las órbitas de los planetas no se ajustaban completamente a los círculos y el Sol parecía resistirse a quedar justo en el centro de aquellos, pero era innegable que el nuevo sistema era mucho más simple. Mejorando las observaciones y haciendo pequeños ajustes se le pudo dar mayor confiabilidad al modelo, aunque no fue posible darle mayor exactitud a las predicciones. No obstante al publicarse los primeros resultados, rápidamente se generalizó en Europa el uso del modelo. En 1536, el cardenal Nicolás Schonberg de Capúa, envió una carta a Copérnico, alentándolo para hacer una nueva publicación, más formal y más prolija, pues juzga que ese trabajo será de grandísima utilidad para la ciencia. En 1582, casi cuarenta años después de la muerte de Copérnico, el Papa Gregorio XVIII reformó el calendario, haciendo un ajuste a la duración del año que se pudo hacer sobre la base del sistema heliocéntrico. Desde el 15 de octubre de ese año y hasta hoy la duración del año es de 365 días, 5 horas, 48 minutos y 46 segundos.1 1
Nota sobre la duración del año: según los cálculos de aquella época, el año tiene una duración de 365 días, 5 horas, 48 minutos y 46 segundos, o sean: 31556926 segundos. Por lo tanto, cada cuatro años es bisiesto, cada cien años no es bisiesto, excepto si el año es múltiplo de 400. Cada 4000, febrero tiene sólo 27 días y cada 20000 años febrero tiene 26 días. Así en 20000 años se tienen 631138521600 segundos, que son 1600 segundos más de la cuenta exacta. Pero tomando en cuenta que la Tierra se retrasa aproximadamente 1 600 segundos cada 20000 años, la cuenta se compensa. En resumen: son bisiestos los años
11
Antecedentes de la mecánica
1.4. Johannes Kepler y Tycho Brahe
Sólo tres años habían pasado desde la muerte de Copérnico, cuando nació Tycho Brahe. El 14 de diciembre de 1546, en Dinamarca, vio la primera luz quien sería el más grande astrónomo de su época. De muy buena cuna y mejor fortuna creció y se educó en los mejores centros de estudio de Europa y posteriormente obtuvo del rey de Dinamarca el uso de una isla de más de 500 ha de extensión, con todo y sus habitantes, para instalar un observatorio; el de Uraniborg, dotado con los mejores instrumentos de observación y medición que se podían tener en aquel entonces. Entre otros, Brahe contaba con una especie de sextante de 12 m de diámetro, con el cual podía dar la ubicación de un cuerpo celeste con un poco menos de un minuto de error. Dotado de una extraordinaria visión, así como de un espíritu metódico y sistemático que lo hicieron sin lugar a dudas el primer auténtico científico de su época, Tycho Brahe acumuló a lo largo de cuarenta años de trabajo, una lista de más de mil cuerpos celestes, clasificados y ubicados con una exactitud nunca antes alcanzada. Él fue quien identificó y dio nombre por primera vez a una nova y demostró sin lugar a dudas, que se trataba de un fenómeno translunar, esto es, que ocurrió más allá de la esfera de la Luna. Este hecho le valió una enorme notoriedad y representó un acontecimiento de gran importancia, pues quedó demostrado, en contra de las creencias religiosas, que el universo no es inmutable. Así mismo, Brahe estableció con toda precisión las posiciones de los planetas Mercurio, Venus, Júpiter y Saturno. Por su parte, Marte no pudo ser ubicado correctamente. Todo intento de Tycho Brahe por determinar su órbita falló debido a su errática trayectoria por la bóveda celeste, con aceleraciones imprevistas y luego retrasos marcados, dando la impresión de ser, al mismo tiempo ortógrado y retrogrado. Estos hechos desconcertantes obligaron al astrónomo a retrasar la publicación de su propio modelo planetario “semi heliocéntrico” (véase figura 1.4.2). En 1589 Tycho Brahe aceptó la oferta de convertirse en el matemático y astrónomo del rey Rodolfo II de Checoslovaquia. Se trasladó a Praga y allí estableció el más importante centro de estudios astronómicos de la época. Así mismo, aprovechó la generosa oferta del soberano para contratar al 1600, 2000, 2400, 2800; febrero tendrá 27 días los años 4000, 8000; en el año 20000 febrero tendrá 26 días.
12
Johannes Kepler y Tycho Brahe
Figura 1.4.1. El sistema heliocéntrico de Nicolás Copérnico (1473-1543), con los
periodos de revolución alrededor del Sol. Todas las órbitas son circulares y el Sol está al centro.
más brillante teórico de la astronomía: al alemán Johannes Kepler. Con este joven científico a su lado Tycho Brahe pensó que el problema de Marte y su extraña trayectoria se podría finalmente resolver. De hecho, cuando el encuentro entre el danés y el teutón se produjo, el primer trabajo que Tycho dio al joven astrónomo fue precisamente que se encargara de resolver el dilema de Marte a la brevedad posible. Esto fue hacia 1600. Johannes Kepler nació en el pequeño pueblo de Weil, dentro del estado de Wurtemberg, en Alemania, el 27 de diciembre de 1571. Se graduó en teología en 1591 y se dedicó a la docencia y a la investigación. Sobre todo, Kepler se destacó por ser un formidable matemático, pues era capaz de resolver complicados problemas que involucraban extensas operaciones, con gran habilidad y rapidez. Su fama llegó a oídos del astrónomo danés y puesto que el problema de la órbita de Marte había resistido todo intento de solución, juzgó que su colega alemán lo resolvería finalmente. Por su parte, Kepler estaba particularmente interesado en trabajar al lado del gran Tycho Brahe por dos razones muy poderosas: en primer lu-
13
Antecedentes de la mecánica
Figura 1.4.2. Sistema planetario “semi heliocéntrico” de Tycho Brahe (1546-
1601). La Tierra es el centro del sistema, pero el Sol, girando en torno a ésta, es a su vez el centro alrededor del cual giran Mercurio, Venus, Marte, Júpiter y Saturno.
gar, porque se sabía que éste había acumulado a lo largo de muchos años de intensa labor observacional, una impresionante lista de datos muy precisos y confiables sobre las posiciones de los planetas. Datos que él precisaba con desesperación para probar sus propias ideas sobre la relación que guardan las órbitas con las dimensiones de los sólidos perfectos y que podrían servir de explicación al profundo misterio acerca de por qué los radios de las órbitas guardan ciertas proporciones entre sí (casi dos siglos después, en 1766, otro astrónomo alemán llamado Johann Elert Bode (1747-1826) propuso una regla empírica para dar las distancias relativas entre los planetas, conocida como “Regla de Bode”. Más adelante, en este contexto se tratará nuevamente esta cuestión). Esos datos que necesitaba Kepler, jamás podría haberlos obtenido él mismo, pues requerían de instrumentos de observación muy precisos y costosos, y él era una persona sin recursos económicos para adquirirlos y, por otra parte, aunque hubiera podido hacerlo, el alemán era miope como topo; no podía distinguir a un gato de un conejo a cuatro metros de distancia. Por otra parte, la paga que
14
Johannes Kepler y Tycho Brahe
le ofreció Tycho Brahe representaba la solución a todos sus apremios económicos presentes y futuros, así que ante esta oportunidad Johannes Kepler no lo pensó dos veces y se puso de inmediato a las órdenes del danés. En la primera entrevista, pedantemente ofreció a su nuevo patrón que resolvería el problema de Marte en una semana. La verdad es que pudo resolverlo en tres años. En todo caso, ya para cuando Kepler pudo contar con cálculos confiables sobre las posiciones del llamado planeta rojo, Tycho Brahe había muerto, así que el modelo semi heliocéntrico nunca vio la luz (en realidad sí fue publicado, pero a nombre de otra persona: un plagiario de los documentos de Brahe). Curiosamente, aquellos datos que Kepler necesitaba tanto para resolver su problema con las órbitas planetarias, jamás se los dio Tycho Brahe, porque éste tenía su propio modelo del mundo y no podía permitir que otro se sirviera de ellos para robarle sus ideas. El hecho es que Brahe murió sin haber mostrado ni uno solo de esos resultados de sus desvelos. Kepler, en un acto temerario y desesperado, penetró por la fuerza al observatorio de quien había sido su jefe mientras sus restos eran velados en otra parte y sustrajo los volúmenes conteniendo la preciosa información planetaria. Su hazaña tuvo éxito y sólo de ese modo pudo este personaje proseguir con su propia teoría. La verdad es que Kepler nunca pudo ajustar las distancias planetarias relativas a las proporciones entre las aristas de los sólidos regulares. Hasta el fin de sus días estuvo intentándolo sin éxito. Pero en el intento fue sintetizando una a una las tres leyes fundamentales del movimiento planetario. Posteriormente se regresará al tema de las leyes de Kepler, cuando la mecánica deba ser comprobada a la luz de la gravitación. Kepler murió el 15 de noviembre de 1630 en Ratisbona, Alemania. 1.5. Descartes, Stevin de Brujas y Grassmann
Kepler revolucionó la concepción del universo con tres simples leyes empíricas: las órbitas de los planetas alrededor del Sol son elipses y no círculos como creía Copérnico, o como deseaba la Iglesia. Son elipses y en uno de sus focos, no en el centro, se encuentra el Sol, el que atrae a todos con su inmensa fuerza (“kraft”). A veces los planetas van más deprisa y otras más
15
Antecedentes de la mecánica
despacio; pues el Sol atrae más intensamente cuando están cerca de él y más suavemente cuando están lejos. A veces el tirón gravitacional se hace más fuerte (en el perihelio) y otras más leve pero siempre el planeta barre áreas a una rapidez constante. Finalmente, conforme la distancia media a la que se halla un planeta del Sol aumenta, su período también se dilata pero en una proporción tal que el cubo de la distancia es proporcional al cuadrado del período; i.e.:
R 3 kT 2 siendo k una constante que es la misma en todo el Sistema Solar: 18
k ≡ 3.39610
m3 2 . s
Curiosamente, Kepler no conocía suficientemente la geometría. Cuando publicó su célebre obra Mysterium cosmographicum, donde mencionó sus leyes, no se refiere a las elipses en relación con las órbitas de los planetas, sino simplemente escribe que los cuerpos celestes recorren órbitas “oblongas” en su tránsito alrededor del Sol. Aún tendría que pasar cierto tiempo para que el uso de la geometría en la ciencia se generalizara. El 31 de marzo de 1579 nació en la ciudad de la Haya, René Descartes y aunque por nacimiento fue holandés y radicó en Holanda durante un buen tiempo en su madurez, se le considera como francés porque allí fue llevado desde su tierna infancia y allí, en Francia, en la Universidad de Poitiers se graduó de abogado después de su ordenación como jesuita. Nunca ejerció su profesión. En vez de ello se enlistó en el ejército y viajó por Europa como oficial de estrategia. Aquejado por la mala salud se retiró del ejército y se estableció en Alemania; en la ciudad de Neuberg para meditar y escribir. Allí desarrolló la geometría analítica (1619) pero por temor no la publicó hasta 1629, pues se enteró del juicio que la Santa Inquisición le fincó a Galileo Galilei en Roma. Fueron 14 años que tuvieron que pasar para que Descartes publicara sus cuatro obras fundamentales, de las cuales, la que mayor impacto tuvo para la mecánica en particular fue su Discurso del método
16
Descartes, Stevin de Brujas y Grassmann
Planeta Sol
Figura 1.5.1. Los planetas describen elipses. El Sol está en
barren áreas iguales en tiempos iguales.
un foco. Los planetas
para guiar propiamente a la razón en la búsqueda de la verdad dentro de la ciencia (1637).2 Si bien el álgebra y la geometría se asociaron desde sus comienzos, René Descartes fue el primero que la desarrolló como un lenguaje geométrico sistematizado diciendo que “Cualquier problema de geometría se puede reducir a tales términos que solamente se requiere el conocimiento de las longitudes de ciertos (segmentos de) rectas para su construcción. Así como la aritmética consiste de sólo cuatro o cinco operaciones, a saber, suma, resta, multiplicación, división y extracción de raíces… así también es la geometría, pues para encontrar las líneas requeridas sólo hay que sumar o sustraer líneas…”
Ha sido un avance muy importante el asociar a operaciones con segmentos de líneas rectas las operaciones aritméticas de suma, resta, multiplicación y división. En la siguiente figura se muestran estas operaciones geométricas. Por cierto, Descartes fue quien usó letras para simbolizar las distancias, tal como se muestra en la figura 1.5.2. Pero seguramente la contribución más espectacular de René Descartes a la ciencia fue la invención de la geometría analítica. 2
Los siguientes párrafos fueron tomados de: Hestenes, David: New Foundations for Classical Mechanics , Kluwer Academic Press (1990), pp. 5-12.
17
Antecedentes de la mecánica
a
a
b
a b
b
a b
Figura 1.5.2. Suma y resta geométrica de segmentos de recta tal como los propo-
ne René Descartes.
En su encierro en Neuberg, cuando se sumió en las meditaciones, escribió frenéticamente, como si ello fuese un asunto de vida o muerte. Al salir de aquel enclaustramiento, todas las ideas sobre geometría habían sido puestas en orden. Así, la idea de proponer la llamada recta numérica; esa recta que “contiene” a todos los números reales, se propuso por primera vez. También estableció el llamado sistema de coordenadas cartesiano, constituido por dos rectas numéricas trazadas perpendicularmente una a la otra, donde un punto cualquiera puede ser ubicado mediante sus “coordenadas”; su abscisa y su ordenada… y su cota, si se trata de un sistema de tres ejes coordenados mutuamente perpendiculares. Con los sistemas coordenados cartesianos fue posible hacer representaciones geométricas precisas de líneas, planos, volúmenes y otras figuras que ocurren o se imaginan en el espacio real de dos o tres dimensiones, adscribiéndoles valores numéricos a sus lados. El movimiento mismo se pudo representar como líneas; las llamadas “trayectorias”, en sistemas coordenados cartesianos. Sin lugar a equivocaciones se puede afirmar que sin la geometría analítica de René Descartes, la mecánica no habría podido estructurarse. Después de Descartes, el uso de la geometría analítica se expandió con una pasmosa rapidez por el mundo. Sin embargo aún faltaban elementos esenciales por incorporar a aquella espléndida estructura para hacerla más apta para su uso en la ciencia y particularmente en la física. La generalización del número para incorporar la noción geométrica de dirección tuvo que esperar aun un buen tiempo. Descartes murió el 11 de febrero de 1649. En realidad, el concepto de vector , como un ente geométrico, algebraico nació casi contemporáneo con la geometría analítica de Descartes y
18
Descartes, Stevin de Brujas y Grassmann
E
C
B D
A
Figura 1.5.3. Multiplicación de segmentos de rectas. Si el segmento
BD tiene longitud a y BC tiene longitud b, el segmento BE tiene longitud ab. Para mostrarlo supóngase que el segmento AB tiene tamaño unidad.
muy cerca de éste. En Brujas, una bella ciudad de Bélgica, nació en 1548 (casi medio siglo antes que Descartes) Simón Stevin o Stevinius de Brujas, como también se le conoce. Fue burócrata y llegó a ser director de la oficina de caminos y canales de Bélgica. Pero se distinguió como militar. En el ejército propuso métodos para inundar los campos mediante sistemas de represas y esclusas, que se usaban con el fin de entorpecer y detener el avance del enemigo cuando intentaba invadir el país, anegando extensiones de tierra. Pero la importancia de Stevinius de Brujas para este contexto radica en el hecho de que él fue quien introdujo por primera vez el concepto de vector y las reglas para la suma y resta de estos entes. Él propuso, en efecto, que un vector es un segmento de línea recta dotada de un tamaño y un sentido. Se dice que la idea le vino a este individuo cuando se enfrentó al problema de jalar un cuerpo muy pesado, como un cañón de artillería por un terreno difícil. Se percató que para tirar de él había que ejercer fuerzas en varias direcciones específicas, con el objeto de hacer la tarea más eficiente. Además, se dio cuenta que la intensidad y el sentido de cada una de esas fuerzas se podían componer, de acuerdo con una regla de adi-
19
Antecedentes de la mecánica
x
a
90°
b
Figura 1.5.4. Dados dos segmentos con longitudes
a y b se construye un círcuab. Así se extraen raíces lo de diámetro a b. La semicuerda x tiene longitud √ geométricamente.
ción simple, para encontrar la resultante. Esta es la ahora bien conocida regla de suma de vectores, de acuerdo con la regla del paralelogramo (véase figura 1.5.5). Adicionalmente, Stevin asignó a sus vectores letras, tal como lo hizo Descartes con los segmentos de recta, y de esa manera pudo dar una descripción simbólica de estos entes geométricos, apta para su manipulación algebraica. El trabajo y las ideas de Stevinius de Brujas solamente fueron conocidos en su ciudad natal y no fueron divulgados hasta mucho tiempo después. La razón de este retraso fue que hasta 1586 publicó un muy breve panfleto titulado Thiende que trataba, entre otras cosas, de los vectores. No obstante, su obra se conoció hasta bien entrado el siglo XVII, cuando Isaac Newton usó el concepto de vector y sus axiomas aritméticos para el desarrolló de su mecánica. Stevin murió en Holanda en 1620. Muchos años después, en 1844, Hermann Grassmann desarrolló aquellas prístinas ideas de René Descartes y de Simón Stevin y publicó su traba jo en un libro. Hermann Günther Grassmann nació el 15 de abril de 1809 en Stetin, antes, Alemania (hoy Polonia) y murió allí mismo el 26 de septiembre de 1877. Su libro se tituló Die ausdehnungslehre o tratado sobre las extensiones. En ese libro se establece finalmente y con precisión la idea de un vector, así como de las operaciones matemáticas y sus interpretaciones geométricas: Para Grassmann un simple segmento de recta, como el que propuso Descartes es un escalar y se representa por medio de una letra latina minúscula
20
Descartes, Stevin de Brujas y Grassmann
2a
2a
λ a ; λ escalar
a
Figura 1.5.5. Vectores con la misma dirección pero con diferentes magnitudes o
sentidos. Se denotan por letras minúsculas con una flecha encima.
como a , b… o bien mediante letras griegas minúsculas, como , ,… Cada escalar positivo designa una clase de equivalencia de segmentos de recta congruentes. Esta es la regla usada por Descartes para relacionar números con segmentos de rectas. Por su parte, un vector es un segmento de recta dirigido. Se representa mediante flechas cuya longitud corresponde (en las unidades adecuadas) a la magnitud de ese vector. Además, los vectores poseen dirección y sentido. Así, dos flechas paralelas son vectores con la misma dirección. Si además las puntas de esas flechas están en los mismos extremos de esos segmentos de recta, se dice que son dos vectores que apuntan en el mismo sentido, además de tener la misma dirección. Si por el contrario, las dos flechas paralelas tienen sus puntas en extremos opuestos, se dice que estos vectores tienen la misma dirección pero con sentidos contrarios. Los vectores se denotan mediante letras latinas minúsculas con una pequeña flecha encima, como a , u , w ,…. Todo vector a se puede descomponer en el producto de su magnitud y su dirección
r r a ≡ a a ˆ
(1.1)
ˆ es un vector unitario, tal que | a ˆ | es donde | a | denota la magnitud y a siempre igual a la unidad.
21
Antecedentes de la mecánica
b
a
r
a
r
b
Figura 1.5.6. Adición de dos vectores. Las flechas
a y b se pueden “sumar” geométricamente, bien sea, uniendo la punta del primero con la cola del segundo y luego trazando el vector resultante r , o bien, siguiendo la regla del paralelogramo de Stevinius, como se muestra a la derecha. Como la resultante es la misma, se ve que los vectores son deslizantes.
La suma de dos vectores a y b da como resultado un vector r que geométricamente se encuentra de acuerdo con la figura 1.5.6. Algebraicamente esta operación se escribe como:
r
r
r
a b r
(1.2)
se ve de lo anterior que la suma es conmutativa; esto es: r
r
r
r
ab ≡ ba
(1.3)
Así mismo, a partir de su construcción en la figura 1.5.6, se puede ver que añadiendo un nuevo vector c :
r
r
(a b ) c ≡ a (b c ). r
r
r
r
(1.4)
También se ve que el vector 0 (así, sin flecha encima), es tal que al sumarlo a otro vector a cualquiera, lo deja igual
r
r
r
a 0 ≡ 0 a a
(1.5)
y si dos vectores a y b al sumarse producen el vector cero como resultante, entonces uno de ellos es el negativo del otro:
r
r
r
r
a b 0 ⇒ b a
22
(1.6)
Descartes, Stevin de Brujas y Grassmann
a
α b
Figura 1.5.7. El producto escalar de dos vectores es igual a la proyección de la mag-
nitud de uno de ellos sobre el otro, multiplicada por la magnitud de este otro.
esto es que b es un vector de igual magnitud e igual dirección que a , pero que apunta en sentido contrario a él. Los vectores también se pueden multiplicar. De hecho hay varios tipos de productos de vectores. El producto interno de dos vectores a y b se denota como a b y es igual a un escalar que se construye con el producto de las magnitudes de cada uno de los vectores, multiplicado por el coseno del ángulo que forman los dos (véase figura 1.5.7):
r
r
r
r
a ⋅ b a b cos .
(1.7)
Se puede ver de su definición que el producto escalar es conmutativo; esto es que r
r
r
r
a ⋅ b b ⋅ a .
(1.8)
En particular, si el producto escalar de dos vectores es igual a cero, entonces de acuerdo con (1.7) se ve que los vectores son ortogonales. Otro es el producto vectorial. Dados dos vectores a y b , su producto vectorial se denota por
23
Antecedentes de la mecánica
c
b
B a
Figura 1.5.8. El producto vectorial de dos vectores
perpendicular a ellos y cuyo sentido es directo.
a y b da un nuevo vector c
r
r
a b
y da como resultado un nuevo vector c que es ortogonal a los dos vectores originales. La magnitud del vector resultante | c | es numéricamente igual al área del paralelogramo generado por los vectores originales, tal como se muestra en la figura 1.5.8. El sentido del vector c queda establecido por la llamada regla de la mano derecha: poniendo los dedos pulgar, índice y medio de la mano derecha rígidos, de modo que apunten en tres direcciones mutuamente perpendiculares y suponiendo que el dedo índice coincide con la dirección del vector a , en tanto que el dedo medio lo hace con la dirección del vector b , entonces el vector producto vectorial c apuntará en la dirección del pulgar. De acuerdo con la figura 1.5.8, si el área del paralelogramo generado por los vectores a y b es B , entonces
r
c B. Y puesto que c es normal a a y b , entonces se debe cumplir que
24
(1.9)
Descartes, Stevin de Brujas y Grassmann
r
r
r
r
a ⋅ c b ⋅ c 0.
(1.10)
Finalmente, el producto vectorial de dos vectores es antisimétrico; esto es: r
r
r
r
a b b a .
(1.11)
Existen otros productos que se pueden definir entre vectores; algunos de ellos muy interesantes e importantes para la mecánica. Grassmann exploró, por ejemplo, el producto externo r
r
a ∧ b B
(1.12)
cuyo resultado es un bi-vector , que representa una superficie plana dirigida. 1.6. Galileo Galilei
El siglo XVI fue prolijo en talentos. Gran número de pintores y científicos vieron la luz en ese tiempo. En la bella ciudad de Pisa, en Italia, nació otro de los grandes talentos que habrían de contribuir a la estructuración de la mecánica. Se trata de Galileo Galilei (15 de febrero de 1564-8 de enero de 1642). Hijo de un noble venido a menos, Galileo inició estudios de medicina en la universidad de su ciudad natal, pero pronto los abandonó, pues sintió que esa no era su vocación, además de que nunca le convencieron las ideas aristotélicas con las que se enseñaba esa profesión. Su pasión, en cambio, fue la investigación. Desde muy joven comenzó a pensar en ese problema que hoy en día se conoce como la cinemática ; esto es, el estudio del movimiento de los cuerpos materiales, sin atender a sus causas. En aquella época, de acuerdo con las ideas de Aristóteles, que habían pervivido por cerca de dos mil años, se pensaba, por ejemplo, que los cuerpos masivos caen con tanta mayor rapidez cuanto mayor sea su peso. Así, si un cuerpo pesa el doble que otro, debería caer, según estas ideas, con el doble de rapidez que aquel. Galileo rechazaba estos conceptos y de una manera simple pero rotunda, demostró su equivocación. Su razonamiento era más o menos este: supóngase que, en efecto, los cuerpos más masivos caen con una celeridad
25
Antecedentes de la mecánica
mayor que los ligeros, entonces es posible pensar en un experimento de caída libre en el cual, después de haber dejado caer uno pesado y uno leve, se haga la tercera acción de unir a ambos y dejarlos caer nuevamente, el uno atado al otro. Siendo el cuerpo compuesto de los dos originales, su masa es mayor que la de cada uno de ellos y por lo tanto, siguiendo las ideas aquellas, deberá caer con una celeridad mayor que la que se observó en los anteriores. Sin embargo, pensando que el cuerpo ligero cae más lentamente que el pesado, se debe concluir igualmente que al unirse a éste va a tender a retardar su caída, así que muy bien podría esperarse que al momento de dejar caer a los dos cuerpos adheridos entre sí, lo que se observara sería que, por el contrario, cayera más lentamente que el cuerpo masivo original. Por lo tanto, es de concluirse que aquellos conceptos acerca de la caída de los graves están equivocados. Los cuerpos materiales al caer libremente lo hacen con la misma aceleración, independientemente de sus masas. Galileo era un individuo más bien bajo de estatura, de facciones toscas, pelirrojo, de espaldas anchas y caminaba balanceándose de un lado a otro, con los pies muy abiertos. Era un tipo desaliñado que muy pocas veces se bañó y nunca se peinó el cabello. Su carácter era jovial y dicharachero, pero con cualquier pretexto abandonaba la discusión para entrar al terreno de los puñetazos. Así que a lo largo de su vida hizo buenos amigos, pero también enemigos, algunos de ellos muy poderosos por cierto. Fue profesor de matemáticas en la universidad de Pisa durante un tiempo, pero tuvo que buscar otras opciones que le dejaran mejor salario pues, a la muerte de su padre, quedaron en la miseria tanto él como su madre y numerosas hermanas y tuvo que ver por ellas desde entonces. De Pisa pasó a Venecia y luego a Padua, la misma universidad donde Copérnico había estudiado y donde se sentía un ambiente de veneración hacia aquel célebre astrónomo que había cambiado la concepción del mundo. Allí pasó Galileo sus mejores años. En Padua desarrolló la cinemática y fue allí donde adquirió aquella experiencia tan importante para pulir lentes y fabricar telescopios que le valió fama internacional al descubrir que Júpiter, el quinto planeta del sistema, posee sus propias Lunas que lo orbitan, con lo cual quedó una vez más demostrado que la Tierra no es el centro del universo. Observó también que la Luna no es una esfera perfecta, sino que se encuentra tachonada de cráteres, montañas y hondonadas y finalmente, descubrió que las estrellas son mucho más distantes que los planetas, con lo cual se pudo explicar la falta de paralaje en las observaciones de esos cuerpos celestes en dis-
26
Galileo Galilei
tintas épocas del año, así que la más importante objeción al sistema heliocéntrico se derrumbó. Todas sus observaciones las publicó en un libro titulado El mensajero sideral . Se puede decir que este libro fue el que marcó el inicio de las desgracias para el italiano Galileo, pues escrito en tono de burla contra la Iglesia y de desprecio hacia la religión católica, desagradó sobremanera a los jerarcas eclesiásticos, quienes empezaron a mover los hilos sutiles de las intrigas y los chismes contra él. Pero la gota que derramó el vaso fue el segundo libro de Galileo: Diálogos sobre los dos principales sistemas del mundo , publicado en 1632. En esta obra, Galileo expone sus puntos de vista sobre el movimiento de los cuerpos materiales; eso que hoy en día se conoce como cinemática. Lo hace en forma clara, usando un lenguaje simple y preciso, con lo cual cualquier persona es capaz de leerlo y entenderlo. El punto que causó toda la tragedia fue que para desarrollar sus argumentos, Galileo creó tres persona jes que sostienen una discusión sobre la física. Uno, Salvati, es un individuo sensato, analítico e inteligente; es el que encarna al propio autor: Galileo. El otro personaje es Sagredo, quien representa un papel neutral, sin tomar partido a favor o en contra de los otros dos y juega el rol de moderador en las discusiones. Pero el tercer personaje, Simplicio, es un aristotélico que sostiene tozudamente puntos de vista retrógrados y que denotan profunda ignorancia sobre las ideas del mundo aceptadas en los medios científicos de aquella época. Este personaje caricaturiza al Papa. Ante esos sarcasmos, la Iglesia reaccionó ferozmente. Fue acusado de hereje ante el Santo Oficio, que en 1633 le instruyó juicio: “Por cuanto a ti, Galileo Galilei, hijo de Vincento Galilei, de setenta años de edad, fuiste demandado a este Santo Oficio por sostener como verdadera una falsa doctrina, a saber, que la Tierra se mueve y posee también movimiento diurno (de rotación alrededor de su eje norte-sur); así como por tener discípulos a quienes instruyes en las mismas ideas; así como por mantener correspondencia sobre el mismo tema con matemáticos alemanes (Johannes Kepler); así como por publicar ciertas cartas sobre las manchas del Sol;…; así como por responder a las objeciones que se suscitan continuamente, acerca de las Sagradas Escrituras, en el sentido que (1) el Sol es el centro del mundo y está inmóvil en su sitio; lo cual es filosóficamente falso y formalmente herético. Y (2) por cuanto a que después de haber aparecido un libro tuyo, publicado en Florencia, a saber, Los diálogos de Galileo Galilei sobre los dos sistemas principales del mundo, el de Ptolomeo y el de Copérnico; y por cuanto a que la Sagrada Con-
27
Antecedentes de la mecánica
gregación ha oído que va ganando terreno diariamente la opinión falsa del movimiento de la Tierra y la estabilidad del Sol, se ha examinado cuidadosamente el mencionado libro y se ha hallado en él una violación manifiesta (de las ideas verdaderas). Por ello pronunciamos nuestra final sentencia: que el libro “Diálogos” de Galileo Galilei sea prohibido y sea inscrito en el Index expurgatorius (que es el mismo lugar donde años atrás se había inscrito el libro Sobre las revoluciones de las esferas celestes de Nicolás Copérnico) y a ti te condenamos a prisión formal (y perpetua)”.
En atención a su avanzada edad y a su ceguera, así como a su pobre estado de salud, el Santo Oficio conmutó la sentencia de prisión en la cárcel, por un arresto domiciliario de por vida. Galileo tuvo que dictar su abjuración: “Yo, Galileo Galilei, de setenta años de edad, hijo de Vincento Galilei, arrodillado ante vos, los eminentes y reverendos cardenales de este Santo Oficio; inquisidores generales de la República Universal Cristiana, contra la depravación herética, teniendo ante mí los Sagrados Evangelios que toco con mis propias manos, juro que siempre he creído (en) todos los artículos que la Sagrada Iglesia Católica Apostólica Romana sostiene, enseña y predica y… abjuro, maldigo y detesto los errores y las herejías en los que he incurrido y juro abandonar para siempre la opinión falsa de que el Sol es el centro inmóvil y que la Tierra no es el centro inmóvil, y en testimonio de ello, con mi propia mano, he suscrito este presente escrito de mi abjuración, en Roma, en el Convento de Minerva, en el 22 de junio de 1633…”
Galileo regresó a Pisa, su ciudad natal y allí permaneció en su prisión domiciliaria hasta su muerte, el 8 de enero de 1642. Sus libros permanecieron inscritos en el Index expurgatorius por más de doscientos años, sin poderse publicar. En 1992 el Papa Juan Pablo II rectificó finalmente el fallo de aquel tribunal y absolvió a Galileo. En 1999, nuevamente el Papa Juan Pablo II, a nombre de la Iglesia Católica, pidió perdón a Galileo y a todas los miles de personas que fueron injustamente juzgadas por la Iglesia. Después de aquel brutal golpe a la inteligencia y al talento científico y por los trescientos años siguientes, ningún otro italiano se atrevió a cometer otros “delitos” de ese género.
28
CAPÍTULO 2 NEWTON Y SU MECÁNICA
2.1. Newton y sus leyes
El genio, esa aura que ilumina a ciertos individuos y les da el encargo, la pesada responsabilidad de levantar en vilo a toda la humanidad para lanzarla a alturas cada vez mayores de conocimiento y de cultura, viajó por el continente europeo como nunca antes lo había hecho. Pasó de Polonia a Alemania y Dinamarca, tocó Francia y tuvo una dolorosa caída en Italia, con el juicio a Galileo. En el mismo año que murió el genio italiano, el 24 de diciembre de 1642, en la brumosa Inglaterra, nació Isaac Newton. Hijo de un humilde agricultor analfabeto, que murió tres meses antes que él naciera y de una inculta mujer que al contraer nuevas nupcias dejó en encargo permanente a su hijo con su madre, Newton creció y se desarrollo en un ambiente bucólico. Su futuro natural hubiera sido el convertirse a su vez en granjero y cuidar de la granja de su abuela; sin embargo, desde muy temprano dio muestras de talento; así que un pariente de él, un pastor, lo envió a Londres para continuar sus estudios en Cambridge. Allí obtuvo una especie de beca con la cual obtenía comida y alimentación a cambio de realizar tareas de intendencia: borrar los pizarrones después de las clases y servir a sus profesores y condiscípulos a la hora de la comida. En el verano de 1665, a los veintitrés años, Newton obtuvo su licenciatura en artes. Ese mismo año apareció en Inglaterra la peste bubónica, así que todos los centros escolares del país fueron cerrados de inmediato como una medida para evitar la propagación de la terrible enfermedad. Newton regresó a la granja de su abuela en el condado de Woolsthorpe. Allí permaneció por espacio de dos años hasta que las autoridades sanitarias abrieron nuevamente las escuelas y universidades del país, cuando la epidemia
29
Newton y su mecánica
desapareció. En ese lapso Newton se dedicó a crear. Metido en una buhardilla que había acondicionado como su estudio, allí en la casa de su madre adoptiva pensó, dedujo, realizó algunos experimentos caseros y tomó nota de sus hallazgos y deducciones. En ese lapso de poco más de dos años Newton realizó una obra monumental, como nunca antes se había hecho; como nunca después ser humano habría de conseguir: propuso una teoría sobre la luz y los colores, estableció, estructuró y construyó la mecánica clásica; inventó el cálculo diferencial y sentó las bases para una teoría de la gravitación universal, entre otras cosas. Este trabajo de dos años, hoy en día hubiera dado cinco o más premios Nobel a otros tantos científicos; no obstante, Newton no publicó su obra sino veintiún años después. De hecho, quién se tomó todo el trabajo de compilar y redactar la obra de Newton fue su amigo Edmond Halley. Él mismo llevó los manuscritos a la imprenta y supervisó la impresión. En 1687 se publicó Philosophiae naturalis principia mathematica , a los cuarenta y cinco años del autor. Las razones de ese enorme retraso son de dos tipos: por una parte, el carácter retraído y huraño de Newton, así como su enorme desagrado por la crítica, hicieron que se resistiera a dar a conocer su trabajo. Ante la insistencia de su amigo Halley se negó una y otra vez, aduciendo a que la gente aún no estaba preparada para recibir ese conocimiento y que se corría el riesgo de que sus hallazgos pudieran ser utilizados para hacer el mal. Por otra parte, la obra aun adolecía de ciertos puntos débiles: el cálculo diferencial e integral aún no había sido desarrollado totalmente; en particular, el problema de integrar volúmenes. Así mismo, en su teoría de la gravitación todavía quedaba por demostrar que la fuerza gravitacional que ejerce un cuerpo masivo, esférico, uniforme, sobre una pequeña partícula exploradora lejana es idéntica a la fuerza ejercida por un punto material que tenga la misma masa que aquella. Por su parte, a Halley le interesaba sobremanera que Newton echara a la luz pública su trabajo, pues él mismo sería el primer beneficiado. Desde hacía algún tiempo había estudiado los arribos de ciertos cometas a la Tierra; particularmente había uno de ellos que aparecía con gran regularidad cada setenta y seis años. Halley quería demostrar que se trataba, en efecto, de un mismo cuerpo y deseaba calcular su órbita para predecir futuros arribos; el más próximo sería en 1759. Fue por esta razón que urgió a su amigo para que publicara su obra y fue por lo mismo que él se encargó de todo el trabajo, una vez que Newton finalmente accedió a hacerlo.
30
Newton y sus leyes
En realidad solamente se publicaron los dos primeros volúmenes de los Principia mathematica en ese año. El tercero apareció hasta 1704. En el volumen 1, Newton establece los principios de la mecánica, así como la ley de la gravitación y deduce las tres leyes de Kepler. En el segundo volumen presenta el primer tratamiento serio sobre la mecánica de fluidos. En el tercero, el más tardío, describe el movimiento de satélites en órbita alrededor de los planetas y de éstos alrededor del Sol; calcula el achatamiento de la Tierra y con ello da explicación al efecto de precesión de los equinoccios, que si bien desde la antigüedad había sido conocido, nunca había sido explicado. Propone así mismo, en este su volumen señero la explicación de las mareas terrestres y describe las órbitas de los cometas alrededor del Sol, con lo cual allanó el camino a su amigo Halley para describir al cometa que ahora lleva su nombre y que, por cierto, él mismo nunca vio, pues murió antes de su siguiente paso por la Tierra. Fueron de tal envergadura las consecuencias de la obra de Newton, que desde entonces se ha adoptado una visión mecanicista del mundo, que propone que su pasado y su futuro se puedan conocer a partir de la mecánica. Después de haber publicado su obra, Newton perdió todo interés en la ciencia y no volvió a trabajar más en un asunto científico. En secreto, se dedicó a la astrología y a la alquimia. En 1699 se le confirió el cargo de alcalde de la casa de moneda de Inglaterra. En este puesto rindió grandes servicios a la corona, pues él fue quien unificó la moneda y estableció las bases para una economía más racional, más “científica”. Se convirtió en un hombre rico y poderoso y en 1703 la Real Academia de Inglaterra lo nombró su presidente. En 1705 fue nombrado caballero por la reina Ana de ese país. El 20 de marzo de 1727 murió el más brillante genio de todos los tiempos. 2.2. La cinemática: marcos inerciales y la primera ley de la mecánica
Para establecer la mecánica, Newton postuló un conjunto de axiomas acerca del espacio, del tiempo y de la materia, así como las características que debe poseer un observador: aquellos que miden y registran las cosas que ocurren. Así, propuso que el espacio es el escenario de los acontecimientos
31
Newton y su mecánica
físicos; se trata de un recinto de tres dimensiones y que es euclideo, esto es, que se satisfacen en él todos los postulados de Euclides: Postulado 1: Por dos puntos en el espacio puede pasar una recta. La distancia del primer punto al último es la misma que la distancia de este punto a aquel. Postulado 2: Por tres puntos no colineales en el espacio puede pasar un plano. Postulado 3: Dos planos no paralelos se intersectan en una línea recta. Postulado 4: Una línea recta no paralela a un plano, lo intersecta en un punto. Postulado 5: Dos líneas rectas no paralelas que están en un plano se intersectan en un punto (si las líneas son paralelas no se intersectan). Si una tercera línea se traza sobre ese plano y no es paralela a ninguna de las anteriores, se forma un triángulo cuyos ángulos interiores siempre suman 180°. Con estos cinco postulados se genera toda una geometría, la llamada geometría de Euclides o euclidiana. Newton postuló, así mismo que el espacio físico es homogéneo e isótropo. Con estos axiomas quiso poner énfasis en el hecho de que en ese escenario no hay puntos privilegiados, ni direcciones privilegiadas, así que cualquier lugar del universo es igual, desde el punto de vista de las cualidades del espacio y en cualquier dirección que se vea se hallará esencialmente lo mismo. En pocas palabras, el espacio, ese recinto de los acontecimientos físicos, no tiene estructura intrínseca. En cuanto al tiempo, Newton postuló que se trataba de un fenómeno que ocurre siempre en el sentido de pasado a futuro, que es uniforme (esto es que un segundo es igual a otro segundo, por cuanto a su duración) y que es absoluto. Esto último significa que la medida del tiempo se puede hacer desde cualquier punto del universo y cualquiera sea el estado de movimiento del observador, un segundo es igual a otro segundo y las medidas del tiempo simultáneas hechas por dos o más observadores situados en lugares distintos del universo serán simultáneas entre sí. Finalmente, si dos acontecimientos son simultáneos para un observador, lo serán también para cualquiera otro que los observe.
32
La cinemática: marcos inerciales inerciales y la primera ley de la mecánica
Un observador, observador, por su parte, es esencialmente una persona dotada de una escala de medida, con la cual puede registrar distancias, y de un reloj, con el que puede medir lapsos. Así mismo, un observador debe estar equipadoo con todos aquellos aparatos pad aparatos necesarios para tomar medidas medidas de otras entidades físicas pertinentes; como la masa de los cuerpos. Un observador puede, en fin, ser todo un laboratorio de física, físic a, sí así se requiere, pero, por otro lado, hay una característica esencial que debe poseer un observador en la mecánica de Newton: no debe estorbar al fenómeno que observa. Sus acciones acciones deben ser cuidadosas cuidadosas y lejanas de manera que esos cuerpos, esas fuerzas que él observa y mide, ocurran libremente; libremente; igual que si no estuviera presente. La idea de un observador se complementa como un marco de referencia, si se le dota, adicionalmente, de un sistema de coordenadas cartesiano en cuyo origen se coloca al observador mismo y desde el cual se hacen todas las medidas necesarias. Así pues, en la mecánica newtoniana, ne wtoniana, un marco de referencia es un sistema de coordenadas cartesiano, en cuyo origen se encuentra un observador ideal, como el que se definió. Más aún, Newton definió un marco de referencia inercial como aquel que durante cierto lapso puede considerarse que se encuentra en una posición fija en el espacio, con relación relación a las estrellas estrellas lejanas; esas esas que se llaman estrellas fijas, debido a su enorme lejanía, o al menos se mueve con una velocidad uniforme con relación a ellas. De acuerdo con esta definic definición, ión, aquí, sobre la Tierra, sólo de manera instantánea puede construirse un marco de referencia inercial pues, debido a la rotación terrestre, las estrellas fijas se miran como si tuviesen una cierta aceleración. Una mejor opción puede ser situar, al menos idealmente, un marco de referencia en el centro del planeta; así, el efecto debido a la rotación diurna desaparece. Un marco así, en efecto, puede considerarse inercial durante lapsos mayores. Sin embargo, dado que la Tierra orbita al Sol, tampoco resulta, a la larga, una buena elección pues con instrumentos refinados puede detectarse el paralaje de las estrellas. Se puede notar en tal caso que este sistema, en verdad está sujeto a una aceleración, así que no cumple cabalmente con el requisito de ser inercial. A plaz plazos os mayore mayoress y con mayor mayor refinami refinamiento ento se pueden pueden imagina imaginarr marc marcos os de referencia colocados sucesivamente en el centro cen tro del Sol, en el centro de la Vía Láctea, en el centro del cúmulo local, etc. En cada uno de estos intentos se puede ratificar que cumplen con la condición de inercialidad de
33
Newton y su mecánica
manera más y más precisa; durante lapsos cada vez mayores y aún haciendo las mediciones más y más refinadas, las estrellas lejanas parecerán cada vez más, como si estuvieran, en efecto, fijas. Por un proceso ideal de tendencia a un límite, se puede llegar a la conclusión de que debe existir un lugar del universo; un punto donde se pueda colocar el origen de un marco de referencia y desde el cual, sin importar durante cuánto tiempo se observe, o con qué precisión se hagan las medidas, las estrellas fijas se verán, en efecto, fijas. Ese marco es el llamado marco de referencia inercial primario; el más absolutamente inercial de todos los marcos de referencia. Claramente, la localización de ese sitio tan especial del universo ha tenido que ver con cierto proceso de promediación, en el cual se ha tomado en cuenta a todos los planetas, a todos los sistemas solares, a todas las galaxias, cúmulos galácticos, etc.; a toda la materia; materia que provoca interacciones gravitacionales, para ubicar esa región en la cual todas esas influencias parecen cancelarse. También ha sido necesario tomar en cuenta a la radiación de todas las longitudes de onda, a las partículas cargadas y en fin, toda forma de energía que pudiera influir sobre el estado de movimiento de algún cuerpo testigo, sobre algún observador. Independientemente de que una tarea como esta pudiera llevarse a cabo con los medios observacionales más adelantados del momento, para hacer semejante promedio es necesario que (valga la perogrullada) sea posible, al menos en principio, hacerse. Desgraciadamente, todo parece indicar que en verdad ese procedimiento no puede p uede conducirse, por varias razones: en primer lugar el universo esta literalmente lleno de la llamada materia obscura . Un noventa por ciento de todo aquello que está dotado de inercia es esta materia obscura, de la cual lo único que se sabe y no muy ciertamente es que se puede tratar de neutrinos “masivos”; partículas sin carga eléctrica y con masas extraordinariamente pequeñas, pero dotadas de altísimas energías, que viajan a velocidades muy próximas a la de la luz; que los demás cuerpos del universo son prácticamente transparentes a ellas y que, que, por consiguiente, consiguiente, son muy difíciles difíciles de detectar detectar y cuantificar. Por otra parte, también se ha vuelto cada día más y más evidente que el universo en bulto no está localizado en un escenario euclideo, sino en un espacio curvo, con curvaturas negativas, negativas, como una gigantesca silla de montar, así que hacer un censo de sus cuerpos se complica aún más por el hecho de que la ponderación tendrá que hacerse sobre las distan-
34
La cinemática: marcos inerciales inerciales y la primera ley de la mecánica
cias relativas y ocurre que enormes regiones están desconectadas del cúmulo local donde donde está el Sol y su sistema sistema planetario, planetario, así que de nueva cuenta, cuenta, el proceso de promediación se complica. Finalmente, nadie puede afirmar afirm ar ahora que el universo sea acotado, con lo cual cabe la posibilidad de que tal cálculo ni siquiera sea posible llevarse a cabo en esencia. En todo caso, si fuese posible plantar en alguna parte del universo ese marco de referencia inercial primario; el más absolutamente inercial de todos los marcos de referencia, se tendría un patrón: un sistema de coordenadas euclideo patrón y un observador patrón que serviría para realizar observaciones y medidas sin importar qué tan grandes o qué tan pequeñas fuesen las distancias o los lapsos, o las masas que se observen desde él. Además, y esto es quizá quiz á lo más importante impor tante,, cuando cuan do se tiene ti ene un patrón, patró n, se pueden hacer copias fieles de él, así que en el caso c aso del marco de referencia inercial primario, se puede, puede, igualmente, construir otro igual a él aquí, aquí, sobre la superficie de la Tierra, o muchos, uno para cada pequeño lapso y para distancias moderadamente grandes, desde los cuales se pueda eliminar cualquier influencia extraña, porque son copias del marco inercial primario. Hacer esto: copiar un marco de referencia, es relativamente simple; todo es cosa de hacer transformaciones de coordenadas. Transformaciones de coordenadas que, según se verá más adelante, son lineales, es decir, fáciles de llevar a cabo. Desde un marco de referencia inercial, copia exacta de aquel primario en el “centro del universo”, se tiene ahora forma de observar acontecimientos sin influir en lo observado y sin verse influido por “impurezas” intrínsecas del marco de referencia; aquellas que en uno no inercial inevitablemente están presentes por el hecho de que el observador está sujeto a interacciones. Desde un marco de referencia inercial se puede, ahora, establecer lo que será el movimiento patrón; aquel que servirá para clasificar otros movimientos de los cuerpos. El movimiento que servirá de patrón para estudiar todos los demás y compararlos contra éste es el movimiento rectilíneo uniforme. Es el movimiento rectilíneo uniforme el más simple de todos; se trata de aquel con el cual un cuerpo recorre distancias iguales en tiempos iguales, sobre una trayectoria rectilínea, observado obser vado desde un marco de referencia inercial. En otras palabras, el movimiento rectilíneo uniforme es aquel que está caracterizado porque el cuerpo lleva impresa una velocidad constante.
35
Newton y su mecánica
Como se recordará, la velocidad se define como un vector y se obtiene analíticamente como la derivada, con respecto al tiempo, tiemp o, del vector de posición instantánea de un cuerpo cualquiera que se mueve por el espacio. En la figura 2.2.1. se muestra un marco de referencia inercial, en cuyo origen 0 se encuentra el observador; aquel que mide y registra sin influir en lo observado. obser vado. El marco está dotado de tres ejes coordenados, mutuamente perpendiculares, construidos con tres rectas numéricas, cuyo cero coincide en el origen y con unas puntas de flecha que indican hacia donde progresa la secuencia de números reales en sentido positivo, tal como se hace en la geometría analítica. También se muestra en la figura 2.2.1, un cuerpo cualquiera, que se mueve en el espacio describiendo una trayectoria arbitraria. Obviamente, el cuerpo que se dibujó en 2.2.1 no lleva un movimiento rectilíneo uniforme. Por el contrario, ese cuerpo c uerpo cambia en forma caprichosa la dirección y sentido de su movimiento. movimiento. La figura 2.2.1 se ha dibujado, específicamente, para mostrar lo que son el vector de posición y el vector velocidad de un cuerpo. El vector de posición es aquel que parte del origen del sistema coordenado y su punta llega hasta el interior interior del cuerpo, en cada cada instante. Así el vector de posición va cambiando de dirección, de magnitud y aun de sentido, conforme conforme el cuerpo se desplaza por el espacio. espacio. Se acostumbra denotar denotar al vector de posición por el símbolo r
r (t ) [m]. Por otra parte, el vector velocidad parte del cuerpo y apunta en cada momento en la dirección y sentido en que se mueve; su magnitud cambia conforme el cuerpo se desplaza con mayor (o menor) rapidez. El vector velocidad, pues, es un vector tangente a la trayectoria que sigue el cuerpo en el espacio. Se acostumbra denotar al vector velocidad como
[ ]
v (t ) m . s r
El vector velocidad, adicionalmente, se define como igual a la derivada temporal del vector de posición; esto es: r
d r (t ) r v (t ) ≡ . dt
36
(2.1)
La cinemática: marcos inerciales inerciales y la primera ley de la mecánica
z
p
r
y
0
x Figura 2.2.1. Marco de referencia referencia inercial desde el cual
en movimiento.
se observa un cuerpo
Por todo lo anterior, se puede ahora establecer en forma matemática precisa, la expresión para el movimiento rectilíneo uniforme. Simplemente, este movimiento es tal, que el vector velocidad del cuerpo es constante: r
v (t ) ≡ const.
(2.2)
Entiéndase bien, lo que la expresión (2.2) afirma es que el vector, con todas sus cualidades, permanece constante a través del tiempo; su magnitud, su dirección y su sentido son constantes a lo largo del movimiento rectilíneo uniforme. El valor de su magnitud es conocido como la rapidez ; esto es: r
v ≡ v (const.).
(2.3)
En particular, el reposo se puede entender como un caso particular del movimiento rectilíneo uniforme, cuando la rapidez del cuerpo es igual a
37
Newton y su mecánica
z
p
r
0
y
x Figura 2.2.2. Trayectoria Trayectoria que
forme.
sigue un cuerpo con movimiento rectilíneo uni-
cero. Así, movimiento rectilíneo uniforme y reposo son dos estados de la misma clase. Regresando a la definición anterior, desde un marco de referencia inercial, el movimiento rectilíneo uniforme de un cuerpo se describe matemáticamente mediante su vector de velocidad, afirmando que es constante. Un cuerpo moviéndose así describe en el espacio una trayectoria recta dada por la expresión siguiente: r
r
r
r (t ) b t r0 .
(2.4)
Ésta, es el resultado de integrar (2.2) con respecto al tiempo, donde b y r 0 son vectores constantes y t es el tiempo. La ecuación (2.4) es, en efecto, la expresión vectorial, parametrizada por el tiempo, para una trayectoria recta en el espacio euclideo de tres dimensiones. La constante de integración vectorial b da información sobre la pendiente de la recta, en tanto que r 0 expresa la posición de la partícula en el instante in stante t igual a cero.
38
La cinemática: marcos inerciales inerciales y la primera ley de la mecánica
Se acostumbra dotar a cada uno de los ejes coordenados de un sistema euclideo de vectores unitarios que apuntan apunt an en cada una de las direcciones; esos vectores se describen como:
iˆ, jˆ, k ˆ
(2.5)
y tienen las siguientes propiedades:
iˆ ˆj k ˆ 1,
(2.6 a)
iˆ ⋅ ˆj iˆ ⋅ kˆ ˆj ⋅ kˆ 0 ,
(2.6 b)
iˆ ˆj kˆ; ˆj kˆ iˆ; kˆ iˆ ˆj .
(2.6 c)
Es decir, decir, que tienen magnitud unidad uni dad (no tienen dimensión alguna), según se muestra en (2.6 a); son ortogonales entre sí, tal como se escribe en (2.6 b) y forman un sistema derecho (2.6 c). En términos de ellos, cualquier vector A se puede escribir como:
r
r
A i A1 ˆj A2 kˆ A3 , c oor A1, A2, A3) las componentes del vector A a lo largo de los ejes coorsiendo ( A denados (ver figura 2.2.3). Así, el vector de posición; ese que parte del origen 0 y apunta a la posición instantánea del cuerpo, descrito en términos de sus componentes se escribe así:
r r (t ) iˆx (t ) ˆj y (t ) kˆz (t ) ,
(2.7)
siendo x (t ), ), y (t ), ), z (t ) las coordenadas instantáneas de un punto del cuerpo. Igualmente, el vector velocidad v descrito en términos de sus component nentes es es: es:
r v (t ) iˆv1(t ) ˆj v2 (t ) kˆv3 (t ) ,
39
(2.8)
Newton y su mecánica
z A3
A
ˆ k i ˆ
j ˆ
A2 y
0
A1
x FIGURA 2.2.3. Componentes de un vector A y vectores unitarios.
donde v 1(t ), v 2(t ) y v 3(t ) son las componentes instantáneas del vector, tales que
dxi (t ) vi (t ) ≡ ; i 1,2,3 ; dt
(2.9)
esto es, que cada componente de la velocidad es la derivada de la correspondiente componente del vector de posición, con respecto al tiempo. Existe en la mecánica otra entidad vectorial que es sumamente importante para la teoría. Esta es la aceleración. Se define como la primera derivada temporal del vector velocidad, o bien, como la segunda derivada temporal del vector de posición; esto es: r
d v (t ) r a (t ) ≡ , dt
40
(2.10 a)
La cinemática: marcos inerciales y la primera ley de la mecánica
(2.10 b)
d 2 r (t ) r a (t ) ≡ . 2 dt r
Igualmente, si a 1(t ), a 2(t ) y a 3(t ) son las componentes cartesianas de la aceleración, entonces d v i (t ) a i (t ) ≡ , i 1, 2, 3 , (2.11 a) dt
a i (t ) ≡
d 2 x i (t ) 2
dt
, i 1, 2 , 3 ,
a (t ) iˆ a1(t ) ˆj a2 (t ) kˆ a3 (t ) m . s
[ ]
r
(2.11 b)
(2.12)
La expresión (2.12) exhibe el carácter vectorial de la aceleración, referida a un marco de referencia inercial. Este comentario es pertinente porque en verdad la aceleración no es un auténtico vector. Solamente cuando se expresa desde un marco de referencia inercial la aceleración es un auténtico vector. Referida a otro tipo de marcos pierde su calidad de vector. Este hecho se verá más adelante en este libro. Volviendo una vez más al movimiento rectilíneo uniforme, que se introdujo páginas atrás, es posible dar una descripción matemática completa del mismo, en términos de los vectores de aceleración, de velocidad y de posición: Movimiento rectilíneo uniforme
Vectorial
Componentes
a 0
a 1 a 2 a 3 0 v 1 const. v 2 const. v 3 const. x b1t x 0 y b2t y 0 z b3t z 0
v const.
r (t ) b t r 0 b const. r 0 const.
41
Newton y su mecánica
Así, desde un marco inercial, un cuerpo que se observa moviéndose con movimiento rectilíneo uniforme, tiene una aceleración nula (no está acelerado), su vector velocidad es constante, así como cada una de las componentes de éste y su vector de posición es lineal en el tiempo; sus componentes son las ecuaciones paramétricas de una recta en el espacio tridimensional euclideo, con parámetro t (el tiempo). El marco de referencia inercial es un marco que sirve como patrón; es aquel desde el cual se describen los acontecimientos en su forma prístina, es decir, sin influencias extrañas. Desde ese marco, un cuerpo simple, que se encuentre a su vez libre de toda interacción debe observarse con un movimiento que sea el más simple de todos. Esto es lo que intuyó Newton; es la esencia de la primera ley de la mecánica: Desde un marco de referencia inercial, todo cuerpo sin interacciones externas se observará en reposo o en movimiento rectilíneo uniforme.
Newton tenía una personalidad sombría y retraída; no era buen conversador, ni tenía amigos, a excepción de Halley, como ya se relató. Al escribir su manuscrito, aquel que sería el primer volumen de los Principia , dijo lo menos que pudo. No quería que su conocimiento llegara a todos; solamente a aquellos capaces de pensar profundamente y llegar por sí mismos a las conclusiones importantes. En particular, las leyes de la mecánica las escribió compactas y herméticas. Después de él, cientos o quizá miles de libros han sido escritos sobre el tema de la mecánica. Llama la atención que tales leyes se hayan trascrito en forma idéntica a aquella como fueron escritas por primera vez. Casi ningún autor las discute; simplemente se escriben para que el lector las aprenda y sea capaz, posteriormente de recitarlas. De aquellos, son pocos los que han osado dar interpretación y sumergirse más en el contenido de las leyes, hay una buena proporción de ellos que muestran una falta de comprensión impresionante. Así, ha habido quien ha dicho que la primera ley de Newton, en realidad no es ley, sino que se trata de un corolario de la segunda (que se verá en seguida). Otros, entre los que se encuentran personalidades del mundo de la ciencia, han mencionado que la primera ley sólo sirve para definir a la fuerza nula (cuando no hay interacciones). La verdad de las cosas es que la primera ley no es un corolario sino un postulado fundamental de la mecánica. Un postulado imprescindible que
42
La cinemática: marcos inerciales y la primera ley de la mecánica
establece, por decirlo de alguna manera, las reglas del juego: Al caso más simple desde el punto de vista de interacciones, que es el caso llamado de partícula libre , se le hace corresponder el movimiento rectilíneo uniforme; o dicho de otra manera: un cuerpo al que nada le ocurre, se le observa con la más simple de todas las trayectorias: el reposo, o el movimiento rectilíneo uniforme, pero todo esto, desde un marco de referencia inercial. De hecho, lo que propone Newton con esta ley es una forma práctica de hallar un lugar en el espacio y construir allí un marco de referencia inercial. Sólo es cosa de observar un cuerpo que se mueva libremente, sin interacciones. Un marco inercial será aquel desde el cual ese cuerpo se observe con movimiento rectilíneo uniforme. Por otra parte, un cuerpo que desde un marco de referencia inercial se observa con un movimiento distinto al rectilíneo uniforme, no es un cuerpo libre de interacciones. Un cuerpo así esta acelerado. Pueden darse muchos casos de cuerpos acelerados: puede ser, por ejemplo, que se mueva con movimiento rectilíneo, pero no uniforme, en cuyo caso se dice que el “movimiento es rectilíneo acelerado” (o decelerado, en el caso en que tienda al reposo). También puede ser que se mueva ejecutando una trayectoria circular uniformemente; en este caso, recorre distancias iguales en tiempos iguales sobre una circunferencia, sin embargo se halla acelerado. A este tipo de movimiento se le llama circular uniforme y la aceleración es centrípeta (esto es hacia el centro de la trayectoria). Obviamente hay una infinidad de movimientos posibles. Todos ellos pueden ser estudiados desde un marco de referencia inercial. Al estudio del movimiento de cuerpos materiales macroscópicos en el espacio euclideo de tres dimensiones, sin atender a las causas o a los agentes físicos que los obligan a ejecutar tales movimientos, se le llama la cinemática . Por ejemplo, un cuerpo que se desplaza por el espacio, con un movimiento uniformemente acelerado y en línea recta, su trayectoria está descrita mediante la simple expresión vectorial: r
a const.
(2.13)
Para hallar las expresiones para la trayectoria de ese objeto, es necesario recordar de (2.10) que la aceleración es igual a la segunda derivada del vector de posición instantánea, así que para alcanzar este objetivo, habrá que
43
Newton y su mecánica
integrar dos veces a aquel vector. En una primera integración se obtiene el vector velocidad; esto es: t
r
∫ t
r
r
r
r
v (t ) v0 adt v0 a (t t0 ) ,
(2.14)
0
donde el proceso de integración se ha llevado a cabo entre un instante inicial dado, t 0 tomado como referencia, hasta cualquier otro posterior t . La constante de integración v 0 es, a su vez, la velocidad del cuerpo en aquel instante inicial t 0. Estas son las constantes que hay que aceptar como condiciones iniciales del problema. Muchas veces se acostumbra dar a t 0 el valor cero; es decir, que la cuenta del tiempo se inicia en el instante cero. En tal caso la fórmula (2.14) adquiere la bien conocida expresión:
r
r
r
v (t ) v0 a t ,
(2.15)
aunque (2.14) es más general. Integrando de nueva cuenta el resultado (2.14) se obtiene ahora la expresión para el vector de posición instantánea: r
r (t )
(
)
r r0 v0 t t 0 12 a r
r
2
(t t 0 ) ,
(2.16)
donde r 0 es la nueva constante de integración que representa la posición del cuerpo en el instante t 0. Haciendo otra vez t 0 igual a cero se obtiene:
r
r (t )
r 2 1 r0 v0 t 2 a t , r
r
(2.17)
que es la bien conocida fórmula para describir las posiciones instantáneas de un cuerpo que se mueve en el espacio con una aceleración constante. Se debe apreciar de (2.15) que la velocidad del cuerpo aumenta (si a es positiva) en una forma uniforme en el transcurso del tiempo. Considérese ahora que ese objeto cuyo movimiento se estudia, se mueve con una aceleración constante sobre un plano; por ejemplo, el plano cartesiano xOy , e imagínese que partió con velocidad igual a cero en el instante
44
La cinemática: marcos inerciales y la primera ley de la mecánica
t 0 igual a cero. En este caso la fórmula (2.17), escrita por componentes tiene el siguiente aspecto: x (t ) x 0 12 a x t 2 ,
(2.18 a)
y (t ) y 0 12 a y t 2 ,
(2.18 b)
donde x (t ) y y (t ) son las componentes del vector de posición en dos dimensiones y a x y a y son las correspondientes componentes de la aceleración. Despejando el tiempo de la segunda fórmula se consigue:
t ±
1 2a y ( y y 0 ) a y
sustituyendo ahora este resultado en la primera componente del vector de posición se llega a lo siguiente:
x (t ) x 0
a x y y 0 ) ( a y
(2.19)
que es una expresión lineal. Así, se puede ratificar que el movimiento uniformemente acelerado es rectilíneo. Si bien aquí se ha demostrado para dos dimensiones y con una velocidad inicial nula, es posible demostrar que, en general, el movimiento es rectilíneo. Se deja como ejercicio demostrar este resultado. Otro movimiento interesante es el llamado circular uniforme . Un cuerpo que gira con movimiento circular uniforme, describe, en efecto, trayectorias circulares alrededor de un punto fijo que es el centro de movimiento. Además, recorre la circunferencia barriendo ángulos iguales en tiempos iguales, tal como se muestra en seguida, en la figura 2.2.4. Es relativamente directo percatarse que éste es un movimiento acelerado, pensando que, al contrario de lo que prescribe la primera ley de la mecánica, el movimiento que aquí se estudia no es libre, puesto que cambia de dirección instantáneamente; por consiguiente su aceleración no puede ser nula, como en el movimiento rectilíneo uniforme. En otras palabras: si bien la magnitud del vector velocidad es constante, su dirección cambia
45
Newton y su mecánica
0
Figura 2.2.4. Un cuerpo se mueve en sentido directo con movimiento circular
uniforme, alrededor del centro 0.
siempre, así que el vector no es el mismo. Si se recuerda que el cambio del vector velocidad con respecto al tiempo es la aceleración, entonces es claro que este movimiento está acelerado. Más aún, la magnitud de la aceleración depende de las magnitudes de los vectores de velocidad y de posición (esto es, del radio de giro del cuerpo, si se supone al origen del sistema de coordenadas en el centro de la circunferencia). Para demostrar esto obsérvese el detalle del movimiento que se muestra en la figura 2.2.5. Supóngase que en algún instante el cuerpo se encuentra en el punto A. Un lapso muy pequeño después t , el cuerpo se encuentra en el punto C . Si se compara el movimiento que tiene el cuerpo en cuestión con el que llevaría si estuviese desplazándose con movimiento rectilíneo uniforme, , en ese mismo lapso t , se verá que, dado por el segmento de recta AB en efecto, el cuerpo ha “caído” hacia el centro del movimiento. La “caída” está dada por ε. Ahora, en la misma figura 2.2.5, y usando el teorema de Pitágoras, se entiende que:
46
La cinemática: marcos inerciales y la primera ley de la mecánica
B
t
A
C r
r
0
Figura 2.2.5. Comparación del movimiento circular uniforme con el rectilíneo
uniforme.
(r ε )
2
r 2 v 2∆ t 2 .
Despejando se consigue:
v 2 2 v 2 2 r ε r 1 2 ∆t ≈ r ∆t , 2r r o bien, que la “caída” es 2 v ε 12 ∆ t 2 . r
(2.20)
Si bien el resultado (2.20) ha surgido como una aproximación al desarrollar el radical y tomar solamente los primeros dos términos de la serie, al
47
Newton y su mecánica
hacer tender el lapso t a cero, se obtiene una expresión exacta, lo que el resultado (2.20) sugiere, es que la distancia ε que separa las posiciones del cuerpo en su movimiento circular uniforme con el que tendría en el caso que hubiese seguido la línea recta en ese mismo lapso, es como una caída, en efecto, que ha tomado lugar, debida a una aceleración uniforme
v 2 a c ≡ (2.21) r que tiende hacia el centro del movimiento. Esta es la llamada aceleración centrípeta . Como se ve, se trata de un efecto que puede representarse mediante un vector dirigido hacia el centro del movimiento, cuya magnitud está dada por la fórmula (2.21). Se trata, pues, de un movimiento acelerado, con una aceleración constante. Por otra parte, su carácter centrípeto queda plenamente demostrado con las siguientes figuras. En ellas se observa cómo superponiendo dos vectores velocidad, de igual magnitud, correspondientes a dos posiciones sucesivas del cuerpo que se desplaza con un movimiento circular uniforme, la diferencia de ellos da como resultado un vector que apunta precisamente en la dirección del centro de movimiento. Este resultado es tanto más exacto, cuanto más próximas se tomen las posiciones del cuerpo. Así, la diferencia r
r
r
∆v ≡ v (2) v (1 ) da como resultante, al tender al límite r
r
∆v d v lím . ∆t →0 ∆t dt
(2.22)
Este es el vector aceleración del cuerpo. Como se aprecia en la figura 2.2.6, este vector va en la dirección del radio y apunta hacia el centro del movimiento. Esta es la aceleración centrípeta. Por supuesto, se puede dar una infinidad de movimientos diferentes en la naturaleza. Aquí solamente se han descrito tres de ellos: el movimiento rectilíneo uniforme, el uniformemente acelerado y el circular uniforme.
48
Las fuerzas: segunda ley
(1)
v (1)
v (2)
0
(2)
v (2)
Figura 2.2.6. Un cuerpo se mueve con movimiento circular uniforme. Compa-
rando (restando) los vectores velocidad se encuentra v . Este vector va en la dirección radial y apunta al centro del movimiento.
En general, al estudio del movimiento de los cuerpos, sin atender a las causas que los originan se le llama la cinemática . Más adelante se estudiaran otras clases de movimientos, que son igualmente interesantes para la mecánica, pero ello se hará tomando en consideración las causas que los originaron; es decir, las fuerzas. 2.3. Las fuerzas: segunda ley
Como se vio en la sección anterior, un cuerpo al que nada le ocurre, se observa desde un marco de referencia inercial, en estado de reposo o de movimiento rectilíneo uniforme. Reposo o movimiento rectilíneo uniforme son, de hecho, situaciones equivalentes desde el punto de vista que ambas corresponden a una aceleración nula. Este es el contenido de la primera ley de la mecánica.
49
Newton y su mecánica
Por otra parte, si desde un marco de referencia inercial se observa a un cuerpo desplazarse por el espacio con un movimiento acelerado, entonces debe pensarse que ese cuerpo no es libre, en el mismo sentido que se explicó arriba. Por el contrario, si un cuerpo se mueve aceleradamente, cualquiera que sea su aceleración, hay que inferir que algún ente físico está urgiéndolo; algún tipo de interacción está experimentando, de modo que su respuesta ante ella ha sido a cambiar su velocidad. Esto es el contenido de la segunda ley de la mecánica: Cualquier tipo de interacción que experimenta un cuerpo es una fuerza que lo urge a cambiar su estado de movimiento.
Tan escueta, tan simple en su enunciado, la segunda ley de la mecánica encierra, sin embargo, varios detalles sutiles que es necesario aclarar. En primer lugar hay que decir que todo el juego de la mecánica debe llevarse a cabo desde marcos de referencia inerciales; aquellos que han servido como patrón para realizar las observaciones y los registros “limpios”; esto es, sin influir en lo que se observa y sin estar el observador mismo influido por agentes ningunos que distorsionen sus mediciones. En particular, la segunda ley se expresa implícitamente desde un marco de referencia inercial, aunque no lo mencione. Cabe anotar que muchos años después de Newton, en la primera mitad del siglo XIX, Gaspard Gustave de Coriolis (1792-1843) de quién se hará mención más adelante, complementó la mecánica con un formidable trabajo donde introdujo los marcos de referencia no inerciales; los acelerados, con lo cual esta teoría se pudo desarrollar mucho más. Esto se discutirá después. Pero en un principio, al establecer los fundamentos de la mecánica, Newton siempre se basó en los marcos de referencia inerciales para proponer sus axiomas. El segundo ingrediente en el establecimiento de la segunda ley es el concepto de cantidad de movimiento. Varios han sido los nombres que ha recibido este concepto a lo largo del tiempo: ímpetu, momentum, momento lineal, son tal vez los más conocidos. Se trata de un vector que se forma con el producto de la masa del cuerpo, m y su velocidad v . A la cantidad de movimiento se le acostumbra denotar por:
50
Las fuerzas: segunda ley
r
[kg ⋅ m s ].
r
p ≡ mv
(2.23)
El estado de movimiento de un cuerpo se define ahora como el valor instantáneo del vector de cantidad de movimiento. Así, la magnitud, la dirección y el sentido de p determinan en cada instante su estado de movimiento. Por supuesto, si la masa del cuerpo es constante, entonces el estado de movimiento es proporcional a su velocidad; en caso contrario, cuando la masa varía, entonces ambos: masa y velocidad juntos determinan ese estado de movimiento. En otros contextos, al estado de movimiento de un cuerpo se le llama también su inercia . Se dice entonces que todo cuerpo posee inercia y se añade que esta propiedad es la que se preserva cuando al cuerpo nada le ocurre y que cambia cuando sufre alguna interacción. Se trata de un concepto muy ilustrativo de esa reticencia que tienen todos los cuerpos materiales a cambiar su movimiento: bien sea al pasar del reposo al movimiento, o de pasar del movimiento al reposo, o bien, de pasar de un estado de movimiento a otro diferente. También sirve para hacer ver cómo dos cuerpos, con iguales velocidades, pueden oponer muy diferentes resistencias a cambiar sus respectivos estados de movimiento. Así, una locomotora, moviéndose a la misma velocidad que un mosquito, evidentemente es mucho más difícil de detener que éste, debido a la enorme inercia que le da su masa. Un cuerpo libre de interacciones se observará moverse, tal como se menciona en la primera ley con un movimiento rectilíneo uniforme. Esto se describe simplemente por
r
p const.,
(2.24)
en el caso de que su masa sea constante. Sin embargo, si su masa varía, aunque esté exento de interacciones externas, el cuerpo sufrirá una aceleración. Ello se interpreta afirmando que en este caso, si bien no hay interacciones externas, si las hay de carácter interno, como sería el caso de un cohete que viaja por el espacio sideral perdiendo masa debido a la combustión de sus componentes internos (oxígeno e hidrógeno, por ejemplo). En efecto, si de acuerdo con (2.24), p es constante, entonces al derivar
51
Newton y su mecánica
este vector con respecto al tiempo se obtiene cero, pero, debido a su definición3 (2.23): r
1 d v r d v ≠ 0, ln m ) ( d t d t
(2.25)
Un movimiento así, es acelerado y en consecuencia el cuerpo no es libre en el sentido de la primera ley de la mecánica. Por lo tanto, la expresión (2.24) es equivalente a la primera ley sólo en el caso de que el cuerpo que se estudia tenga masa constante. Finalmente, al enunciar la segunda ley aparece el concepto de fuerza. Para Newton la fuerza es la única causa de que los cuerpos cambien sus estados de movimiento. No importa si se trata del contacto físico de cuerpos en colisión, o de la acción a distancia que un cuerpo ejerce sobre otro, o de la interacción que un campo físico genera sobre un cuerpo; todo se reduce a un mismo concepto: la fuerza. La fuerza es la intensidad con que un agente físico (colisión, acción a distancia, campo físico, etc.) actúa sobre un cuerpo. Se trata de una entidad física que tiene realidad objetiva; esto es, existe, independientemente de quien o cómo lo observen. La fuerza es un vector, así que tiene magnitud y está caracterizada por una dirección de aplicación y un sentido definidos. La fuerza, independientemente de su origen, tiene un solo efecto general sobre los cuerpos: cambiar su estado de movimiento. Finalmente, dependiendo de su procedencia, la fuerza puede describirse matemáticamente mediante alguna fórmula vectorial empírica que describe su efecto particular en los cuerpos; en sus parámetros constitutivos. Estas fórmulas vectoriales empíricas son las llamadas ecuaciones constitutivas . De ellas se tratará con detalle más adelante. Baste por el momento agregar que las ecuaciones constitutivas no se deducen de la mecánica, sino que son independientes de ella; se obtienen de la experimentación, de 3
Esta ecuación puede integrarse de inmediato: r
r
m 0 , m
v (t ) v 0
así que en el caso de un cuerpo que pierde masa (m0m), se ve que la velocidad aumenta con el transcurso del tiempo.
52
Las fuerzas: segunda ley
la observación, o bien, recientemente, de las llamadas teorías fundamentales, y se incorporan a la mecánica para la resolución de los problemas. Se acostumbra denotar por F a las fuerzas. La fuerza F es, pues, un vector, cuya unidad en el sistema internacional de unidades ( si ) es el Newton.
1 N 1 Kg ⋅
m , 2 s
esto es, un Newton es aquella unidad que equivale a la fuerza que es necesario aplicar a una masa de un kilogramo, para imprimirle una aceleración de un metro por segundo, en cada segundo. Así que la segunda ley de Newton se establece en forma matemática como: r
dp F ; d t r
(2.26)
es decir, que en efecto, la fuerza causa en cada cuerpo un cambio en su estado de movimiento. En particular, si sobre un cuerpo no actúa fuerza alguna, entonces, de acuerdo con (2.23) y (2.26) se obtiene que: r
F 0,
(2.27)
y si adicionalmente su masa es constante, entonces se mueve en línea recta y con velocidad constante (movimiento rectilíneo uniforme). Este resultado ha confundido a muchas personas, incluso a celebridades del mundo de la física, quienes han llegado a afirmar que (2.27) demuestra el hecho de que la primera ley de la mecánica no es ley en sentido estricto, sino solamente un corolario, un caso particular de la segunda ya que surge de ésta cuando se considera una fuerza nula. Tal afirmación es incorrecta por varias razones: en primer lugar hay que percatarse de que la primera ley es la que establece las reglas básicas del juego de la mecánica. La existencia de un marco de referencia inercial primario y su posibilidad de fabricar réplicas instantáneas de él en todo punto del universo y en cada instante, son sólo una parte de los axiomas que se requiere aceptar para establecerla. En segundo lugar, la primera ley postula el movimiento patrón: rectilíneo uniforme y lo adscribe al
53
Newton y su mecánica
estado físico patrón: el cuerpo libre, no urgido por agente alguno. Por último, el hecho de que para un cuerpo con masa constante, sin interacción, se obtenga que su movimiento es el que está dado por (2.27), o sea movimiento rectilíneo uniforme, significa que la segunda ley es compatible con la primera desde un marco de referencia inercial. Newton se pasó veintiún años repasando cada punto de su teoría, cavilando sobre todas las posibles implicaciones que traería hasta el mínimo detalle, cuidando que en ningún asunto, por nimio que fuera, pudiera haber el más pequeño indicio de error o contradicción. Así era este hombre. Tenía verdadero terror a la crítica y no podía, por lo tanto, tomar nada a la ligera. No es, por lo tanto, un asunto de capricho o de dejadez que la ley más importante de la mecánica —la que sirve para atacar prácticamente todos los problemas de los cuerpos en movimiento sujetos a fuerzas, la ley que se enunció anteriormente y que se expresa matemáticamente con la fórmula (2.26)— haya sido propuesta por el genio británico como la segunda. ¡No la primera! Lo que ocurre es que, pensándolo detenidamente, se llega a la conclusión de que esta ley: la segunda, carecería de pleno significado si no se hubiera propuesto antes la ley de la inercia; la primera ley. Muchos de los problemas de la mecánica tienen que ver con cuerpos cuyas masas no varían a lo largo del tiempo. En tales casos, la expresión (2.26) se puede rescribir en una forma más simple y que es muy conocida: r
r
F ma ,
(2.28)
siendo a la aceleración del cuerpo y m su masa. En la práctica, todos los problemas de mecánica que se plantean, comienzan por (2.26) o (2.28). Estas son las expresiones fundamentales para el proceso de resolución. Como se dijo desde el principio de este capítulo, para plantear un problema hay que proponer una fórmula para la fuerza; esto es, las ecuaciones constitutivas de las que ya se ha escrito. Allí en donde se ha puesto la letra F para la fuerza, allí es que hay que sustituir la ecuación constitutiva particular, que corresponde al cuerpo y a la interacción de que se trata. En ese momento, (2.26) o (2.28), según sea el caso, se convierte en una ecuación diferencial. Esta ecuación, al integrarse, proporciona toda la información pertinente del problema.
54
Las fuerzas: segunda ley
Ahora bien, hay varias ecuaciones constitutivas, correspondientes a otros tantos casos de interacciones. Llama la atención el hecho de que sean tan pocas pensando que en el universo hay una infinita variedad de posibilidades pues en contra de lo que dicta el sentido común, ni siquiera llegan a diez las fórmulas que se han hallado hasta ahora. De éstas, dos fueron propuestas por el propio Isaac Newton. Tuvo que hacerlo, pues necesitaba probar su teoría, así que fue indispensable arrancar toda su maquinaria teórica para ver cómo marchaba. Las ecuaciones constitutivas que propuso Newton; las primeras en usarse en la mecánica, corresponden a la atracción gravitacional que la Tierra ejerce sobre los cuerpos masivos; la primera es la que se identifica con el peso de un cuerpo de masa m, r
r
F mg,
g 9.806 m 2 , s r
(2.29)
al nivel del mar. La segunda es la fuerza de atracción gravitacional entre dos cuerpos, de masas M y m, alejados entre sí una distancia r :
Mm r F G 3 r , r r
(2.30)
siendo G una constante universal que, en el sistema internacional de unidades (si ) tiene el siguiente valor:
N ⋅ m2
11
G 6.668 10
2.
Kg
En realidad ambas fórmulas son equivalentes en cierto ámbito. Si se considera a aquellos cuerpos que se encuentran muy cercanos a la superficie terrestre; esto es, que la magnitud del vector r sea del orden del radio terrestre,
r⊕ 6.3782 106 m , y se toma a la masa terrestre con el valor:
55
Newton y su mecánica
m
r
M
Figura 2.3.1. Un cuerpo masivo, con masa M , atrae a otro de masa
vector r va del centro del primero al centro del segundo.
m. El radio
M 5.976 1024 Kg , entonces la expresión (2.30) adquiere la misma forma que (2.29); esto es, que
g ≡ GM 2 r ⊕ r
(2.31)
siendo r el radio medio terrestre. Posteriormente un militar francés; Charles Augustine Coulomb (17361806), pudo establecer una fórmula para la fuerza con que dos cuerpos cargados eléctricamente se atraen o se repelen. Esta es la llamada ley de Coulomb. r
F
1
qQ r r 3 4 ∈0 r
56
(2.32)
Las fuerzas: segunda ley
q
r
Q
Figura 2.3.2. Un cuerpo cargado eléctricamente, con carga
otro con carga q de acuerdo con la ley de Coulomb.
Q atrae o repele a
Aquí, Q y q sirven para denotar los valores de las cargas eléctricas de cada uno de los cuerpos que experimentan la interacción, r es el radio vector desde el centro de una de las cargas, hasta la otra y ∈0 es una constante que representa la permitividad eléctrica del vacío
e 2
12
∈0 8.854 10
N ⋅ m2
con esta constante, el valor de 1/4 ∈0 es: 1 4 ∈0
9
8.987 10
N ⋅ m2 . 2 C
Si bien Coulomb se guió en gran medida en Newton para proponer su fórmula, como puede apreciarse comparando (2.30) y (2.32), a la postre ha resultado que la fórmula de Newton no es tan acertada, tan precisa para
57
Newton y su mecánica
describir el fenómeno gravitacional, en tanto que la de Coulomb, no obstante haber sido sometida a escrutinio muy severo, ha pasado hasta hoy todas las pruebas. Es quizá la fórmula más exacta que hay para medir una interacción. Por su parte, la fórmula de Newton (2.30) para la interacción gravitacional, presenta una falla leve al aplicarse a la atracción entre masas muy grandes, como la del Sol, actuando sobre los planetas. Desde la mitad del siglo XIX se pudo observar que el más cercano de los planetas al Sol: Mercurio, no parece obedecer la ley de la atracción gravitacional (2.30) en una forma satisfactoria. Su órbita alrededor del Sol no es exactamente la que se predice con base en los cálculos a partir de (2.30) sino que precede lentamente, con una precesión del perihelio de aproximadamente 42 segundos de arco, por cada 100 años terrestres. Este efecto, aunado a otros, como la observada deflexión de los rayos de luz que pasan cerca del Sol provenientes de estrellas lejanas y el corrimiento de las rayas espectrales de las estrellas masivas hacia la zona del rojo, son muestras de que la célebre fórmula newtoniana (2.30) no es tan precisa como parece. Estos efectos, si bien son extraordinariamente pequeños, llamaron la atención de los científicos del siglo XIX. En los primeros años del siglo XX Albert Einstein (1879-1955) pudo dar explicación a todos ellos al proponer una teoría alternativa a la de Newton: la llamada teoría de la relatividad generalizada . Años después de Coulomb, otro investigador, el físico holandés Hendrik Antoon Lorentz (1853-1928), ganador del premio Nobel en 1902, propuso otra ecuación constitutiva. La fórmula que propuso sirve para describir la fuerza que experimenta un cuerpo con una carga eléctrica q, que se mueve por el espacio a una velocidad instantánea v y que lo hace en presencia de un campo de inducción magnética, con una intensidad dada por el vector B . Esa fórmula se escribe así:
q r r F v B , c r
(2.33)
siendo c la constante que representa la rapidez de propagación de la luz en el vacío
58
Las fuerzas: segunda ley
c 2.99793 108 m . s Robert Hooke (1635-1703), contemporáneo de Newton descubrió la elasticidad de los cuerpos sólidos y propuso su célebre ley Ud tensio sic vis (a tal tensión, tal fuerza)
que transcrita a una fórmula matemática se puede escribir así: r
F k xiˆ
(2.34)
siendo k la llamada constante de rigidez del material o, tratándose de un resorte como el que se muestra en la figura 2.3.3, es la constante (de rigidez) del resorte. El vector unitario i ˆ se ha utilizado en (2.34) para darle carácter vectorial a la expresión; se trata del vector unitario correspondiente al eje de las abscisas. La variable x , por su parte, representa la elongación (positiva) o la compresión (negativa) del resorte, respecto de su configuración de equilibrio (no deformada). En el mejor de los casos, podrían incluso incluirse dos fórmulas más para agregar a la exigua colección que se tiene; fue propuesta por un japonés de apellido Yukawa que intentó con ella describir la interacción que ocurre dentro de los núcleos atómicos entre dos nucleones; la llamada interacción fuerte y la otra es una expresión que ha servido bien hasta la fecha, para la fuerza entre dos moléculas con simetría esférica cuando se aproximan entre sí. Esta es la fórmula de Lenard-Jones. Sin embargo, dada su escasa utilidad no se menciona con detalle aquí. En realidad, no más de cinco fórmulas son las que se tienen para ponderar las fuerzas de interacción que experimentan los cuerpos materiales. La segunda ley de la mecánica, tal como se escribe en forma matemática en (2.26) y (2.28), tiene una apariencia muy sencilla. Muchas personas, aun aquellos entrenados en el tema, expresan su sencillez y simplemente la recitan tal como fue propuesta más de trescientos años atrás: la fuerza es igual al cambio del momento lineal en el tiempo, o aún más simplemente, en el caso de cuerpos con masa constante, la fuerza es igual a la masa por la aceleración.
59
Newton y su mecánica
x
Figura 2.3.3. Un resorte en equilibrio (arriba)
y elongado (abajo).
En honor a la verdad, tras una reflexión cuidadosa, se puede apreciar que la segunda ley NO es la definición de la fuerza, como algunos creen. No, la segunda ley iguala aritméticamente la fuerza F , al producto de la masa por la aceleración, pero esto no significa que ambas cosas sean físicamente iguales. La fuerza, si se piensa un poco, es un ente siempre ajeno al cuerpo que se observa. Es el resultado de la presencia de otros cuerpos masivos, o de un campo electromagnético externo, que, en todo caso, actúan sobre el cuerpo. Es la intensidad con que un impacto dado por un martillo, por ejemplo, urgió a un cuerpo, o la tensión que se aplica a un resorte, para que se elongue. En todo caso, la fuerza no proviene del cuerpo que se estudia. Por otra parte, el cambio del momento lineal, o su equivalente en el caso de masas constantes: el producto de la masa por la aceleración, son efectos observados en el cuerpo; su masa y su velocidad cambian como respuesta a la fuerza aplicada. Son, en pocas palabras, el resultado de la fuerza. Así pues, se entenderá ahora que la segunda ley enfrenta dos clases muy diferentes de entes: la fuerza ajena al cuerpo, por cuanto a su origen, pero
60
Las fuerzas: segunda ley
que se aplica a él y la respuesta a esa fuerza que, según lo afirma Newton, sin importar el origen de aquella, siempre se traducirá en un cambio del estado de movimiento del cuerpo. Claro que la igualdad debe ser correcta aritméticamente y también deben ser equivalentes ambos miembros de ella desde el punto de vista de sus dimensiones. Por ello es que la fuerza es un vector con unidades iguales al del producto de masa por aceleración; es decir, Newtons ( N ): 1 N ≡ 1Kg ⋅m 2 . s La segunda ley en su forma matemática, pone en correspondencia entidades esencialmente diferentes. A esa correspondencia se le da el nombre de dinámica . Así pues, la dinámica es aquella parte de la mecánica que se ocupa de estudiar, predecir y vaticinar las conductas de los cuerpos materiales sujetos a la acción de agentes físicos. Un último comentario es pertinente en este punto, acerca de la segunda ley: como se mencionó, las fórmulas (2.26) y (2.28) son meramente recetas para resolver los problemas de describir movimientos de cuerpos materiales. En sí mismas, sin embargo, estas fórmulas, estas recetas, de nada sirven si no se ponen en acción mediante las ecuaciones constitutivas. Así por ejemplo: r
r
F m a de ninguna utilidad será para hallar el movimiento de un cuerpo con masa m que se ve urgido por un resorte al que está sujeto, si no se propone previamente cuál es la fuerza que ese cuerpo experimenta al elongarse y comprimirse, sucesivamente, el resorte mismo. Estableciendo que r
F kxiˆ,
(2.34)
—esta es la ley de Hooke— y sustituyendo esta ecuación constitutiva en la fórmula general de la segunda ley, se pone en marcha, ahora sí, la maquinaria teórica de la mecánica. Ahora se tiene que kxiˆ ma r
61
Newton y su mecánica
y, recordando que la aceleración es igual a la primera derivada de la velocidad, o bien, la segunda derivada de la posición, se tiene que
d 2 x 2 0 x 0 2 d t
(2.35)
para la componente vectorial a lo largo del eje de las abscisas (las otras dos componentes dan resultados triviales), siendo 0 la llamada frecuencia angular fundamental del cuerpo, definida como 20
≡ k m
[ ]
s 2 .
(2.36)
Ahora, lo que se tiene es una ecuación diferencial para x como función del tiempo. Integrándola, y después de establecer las condiciones iniciales del problema físico, se hallará específicamente la solución; esto es, la expresión matemática que describirá las posiciones sucesivas de ese cuerpo, con masa m y adherido a un resorte de constante k , a lo largo del tiempo. Para este caso, como se verá con todo detalle más adelante, la solución es:
x (t ) A cos 0t ,
(2.37)
donde A es la amplitud máxima de este mecanismo, al que por cierto se le llama el oscilador armónico simple , y t es, como de costumbre, la letra que se usa para denotar el tiempo. La expresión (2.37) es la ecuación de la trayectoria del oscilador armónico simple. Esta ecuación muestra cómo la masa se desplaza en un movimiento de vaivén alrededor de cierto punto de equilibrio, con una amplitud A, que es la máxima elongación del resorte y con una frecuencia angular 0 que viene dada en radianes en cada segundo. Así pues, x (t ) indica la posición instantánea de esa masa conforme transcurre el tiempo. En este caso, la condición inicial que se impuso sobre la solución de la ecuación diferencial (2.35) fue que el instante inicial, a partir del cual se comienza a observar el movimiento, es el instante cero y en ese momento el oscilador exhibía su máxima amplitud A. Como se vio desde el principio de este libro, esta es la estrategia general que debe usarse para atacar y resolver los problemas de mecánica.
62
Torcas y momento angular
2.4. Torcas y momento angular
El problema del oscilador armónico que se mostró en la sección anterior de este trabajo constituye un ejemplo claro y simple de resolución de problemas de mecánica; es un mecanismo que se mueve en una sola dimensión uniformemente y sigue una trayectoria también muy sencilla, dada por la función coseno. Desafortunadamente no todos los problemas de la mecánica son así de sencillos. En general será necesario considerar las tres dimensiones del espacio euclideo y, como se verá más adelante, plantear solamente las ecuaciones diferenciales a partir de la segunda ley de Newton, no es siempre suficiente. Casi siempre será necesario acudir a otras expresiones diferenciales complementarias para hacerlo. Tales expresiones aparecen en el modelo teórico de la mecánica como resultado de otro tipo de razonamiento que se desarrollará en seguida. Para hacerlo, es preciso regresar de nueva cuenta a (2.26) o (2.28) y contemplar estas expresiones desde una perspectiva un poco diferente. En primer lugar es necesario percatarse de algunos hechos relativos al vector de momento lineal p . Este vector, como ya se mencionó, es definido como el producto de un escalar: la masa del cuerpo, multiplicada por el vector de velocidad instantánea v , tal como se hizo en (2.23). Ahora hay que notar que por su definición, este vector es, en cada punto de la trayectoria del cuerpo, tangente a ella. No importa qué tan uniforme o qué tan curvada sea esa trayectoria; el hecho es que, punto a punto de ella, el vector momento lineal es tangente. Esto es importante de notarse en este momento porque la expresión (2.26) puede muy bien considerarse como la expresión diferencial de primer orden para obtener la familia de vectores tangentes a la trayectoria
r
r
p ≡ p (t ) . Ahora bien, tratándose de trayectorias de las llamadas planares ; esto es, aquellas curvas en el espacio que pueden ser dibujadas sobre una superficie plana, como la que se muestra en la figura 2.4.1, la familia de vectores tangentes p (t ) describe completamente a la trayectoria, ya que en cada punto están bien definidas (siempre y cuando la curva no ejecute un rizo), tanto en su magnitud y su dirección, como en su sentido. De hecho para este tipo de curvas (sin rizadura), llamadas no alabeadas y plana
63
Newton y su mecánica
p
z
p
p
p
p
p
y x Figura 2.4.1. Trayectoria de un cuerpo en el espacio euclideo 3D. Se muestra
el plano de la trayectoria y los vectores tangentes p.
res (que están dibujadas sobre una superficie 2D plana), los vectores tangente p , la “generan”; esto es, al ir transcurriendo el tiempo son ellos los que van dibujando la trayectoria en el espacio. Sin embargo, puede ocurrir y de hecho ocurre con cierta frecuencia, que una trayectoria sea “no-planar”; o sea, que la superficie sobre la cual se dibuja no sea plana, sino curvada, como la que se muestra en la figura 2.4.2. En este caso, la familia de vectores tangentes a la trayectoria; los vectores de momento lineal, ya no son suficientes para dar una descripción completa de la trayectoria por sí solos. En este caso, según se sabe de la geometría, es necesario dar, punto a punto de la trayectoria, dos vectores: el vector tangente y el llamado vector normal o perpendicular. En este sentido, la ecuación diferencial (2.26) no posee toda la información necesaria para conocer completamente una trayectoria cualquiera. Sólo en el caso de trayectorias planares es suficiente con integrar (2.26). En este punto Newton tuvo que detenerse. Se percató de que algo aún faltaba en su modelo de la mecánica; una pieza importante sin la cual la
64
Torcas y momento angular
z
0
y x
Figura 2.4.2. Trayectoria “no–planar”. La superficie sobre la cual se dibuja la
trayectoria es curva.
solución general al problema de la mecánica, esto es, el estudio del movimiento de los cuerpos materiales atendiendo a sus causas, no podría tener una solución completa. Si las fuerzas son la causa de que el vector de cantidad de movimiento cambie y éste es el vector que va generando las curvas en el espacio, entonces —pensó— debe haber otra expresión diferencial más; debe ser aquella que describa de alguna manera los planos de las trayectorias y sus cambios, sus curvaturas, como resultado de algún nuevo tipo de agente físico; algún ente que aún no ha sido definido. Bueno, si las fuerzas fuerzan al vector tangente, defínanse a esos nuevos entes como las torcas . Las torcas serán, por lo tanto, la manifestación de ciertos entes físicos que tuercen los planos de las trayectorias. Más aún, si h representa a la familia de vectores normales al plano de trayectoria, en cada punto de la misma, entonces se puede muy bien proponer una expresión diferencial parecida en su estructura a aquella que se estableció para describir matemáticamente a la segunda ley (2.26), y que tendría la siguiente forma:
65
Newton y su mecánica
z h
h
h
h
0
y
x Figura 2.4.3. Una trayectoria se dibuja sobre una superficie curva. Este es el
plano (curvo) de la trayectoria. Los vectores h son normales al plano.
r
dh N dt r
m2 Kg ⋅ 2 , s
(2.38)
siendo N un vector que representa a la torca y h el vector normal al plano de la trayectoria. Así, un movimiento planar; esto es, uno que se desarrolla a lo largo de una trayectoria en una superficie plana, corresponde a un vector normal h constante, que no cambia. Por lo tanto, de acuerdo con (2.38), un movimiento así es aquel no sujeto a torcas ; i.e .:
r
r
h const ⇔ N 0.
(2.39)
Por otra parte, si sobre un cuerpo actúan torcas, su efecto se podrá observar de inmediato porque el plano de movimiento de ese objeto se curvará, se torcerá.
66
Torcas y momento angular
Además, conociendo, tanto el vector tangente p , como el vector normal h , en cada punto, la trayectoria del cuerpo será totalmente dada. Así, el problema de la mecánica ha quedado resuelto… …hasta cierto punto, porque si bien técnicamente el movimiento puede ser conocido con esta pareja de vectores p y h por el simple y directo procedimiento de integrar (2.26) y (2.38), otra dificultad ha surgido: no se sabe qué cosa es la torca ni qué clase de objeto cinemático es el vector normal h . La dificultad no es menor. De hecho, la proposición que hizo Newton acerca de la existencia de las torcas, representa una profunda contradicción en su modelo. En efecto, para proponer la segunda ley, Newton aceptó que el resultado de las interacciones naturales con cuerpos materiales son, ni más, ni menos, que las fuerzas. Ellas y sólo ellas son, según lo afirmó, las causantes de los cambios de estado de movimiento de los cuerpos. Ahora, a la luz de las consideraciones precedentes, resulta que no hay un solo tipo de agentes físicos que actúan sobre los cuerpos, sino dos: las fuerzas y las torcas. La naturaleza ejerce su acción modificando trayectorias mediante el expediente de cambiar vectores tangentes y vectores normales. Esto no puede ser así, pensó Newton; la naturaleza es vasta y rica en recursos, pero ciertamente no tiene poder de discernimiento; no es posible que ella “sepa” y “decida” cuándo cambiar tangentes y cuándo hacerlo con los planos de movimiento, cambiando vectores normales. Este problema retrasó la culminación del trabajo de estructurar la mecánica clásica, pero no lo detuvo. Fue uno de los dos grandes obstáculos a los que se enfrentó el genio de Woolsthorpe (Inglaterra). La solución al asunto de las torcas fue como sigue: El vector normal h puede definirse de forma operativa, como un momento del vector p , ponderado por el radio vector r . En efecto, si se propone que
r
r
r
h ≡ r x p,
(2.40)
entonces se consigue que, punto a punto, h sea un vector perpendicular a p , de tal suerte que se resuelve automáticamente la necesidad de contar con uno tangente y uno normal para dejar completamente definida la trayectoria de la partícula que se estudia.
67
Newton y su mecánica
Ahora pudo Newton definir a h como el momento de la cantidad de movimiento, o también, tal como se le conoce actualmente, como el momento angular . Con esta definición Newton, se puede afirmar, mató tres pajaritos con un mismo disparo: por una parte da una definición operacional del vector normal; ese que había imaginado, pero que no había puesto hasta este momento en términos de cantidades cinemáticas. Ahora, escrito en términos del vector de posición y del vector de cantidad de movimientos instantáneos, el momento angular ha adquirido significación cinemática; esto es, que sirve como complemento para describir el movimiento. En segundo lugar, es claro que los dos vectores, r y p definen en todo punto un plano (excepto que r y p sean paralelos, cuando el movimiento es radial); este es el plano de movimiento del cuerpo. Así, si al principio del trabajo, cuando se mencionó la idea de un plano de movimiento no se había establecido cuál de todos los planos imaginables es ése, ahora se puede describir con todo detalle como aquel que se genera con el vector radial, que va del origen del sistema de coordenadas al cuerpo, y con el vector tangente a la trayectoria; el vector de cantidad de movimiento, tal como se muestra en la figura 2.4.4. En ella se observa una trayectoria, así como el plano instantáneo de movimiento, generado por r y p . El vector de momento angular h , por definición, es perpendicular, tanto a r como a p . Para conocer el sentido de h se acude a la regla de la mano derecha: si el dedo índice de esta mano se pone recto, apuntando en el sentido de r y el índice medio se hace apuntar en el sentido del vector p , entonces el pulgar, erecto y perpendicular a los otros dos apuntará en el mismo sentido que h . El tercer pajarito que Newton abatió con el mismo disparo, según se había escrito anteriormente en un sentido jocoso, tuvo que ver con la definición misma del vector de torca. En efecto, al haber propuesto a h como el momento de la cantidad de movimiento, automáticamente lo llevó a la definición de la torca, así como de su significado. Si se acepta la relación diferencial (2.36), entonces, de acuerdo con (2.40) se tiene que:
r
d r r r d p N (r p) r . dt dt r
68
(2.41)
Torcas y momento angular
z
0
y
x Figura 2.4.4. El plano instantáneo
de movimiento generado por r y p . El vector de momento angular es perpendicular a éste.
Pero ahora, de acuerdo con la expresión para la segunda ley (2.26), la derivada del momento lineal debe asociarse con la fuerza F ; por lo tanto, si (2.41) ha de ser consistente con la segunda ley, debe cumplirse que la torca N es el momento de la fuerza; esto es:
r
r
r
N ≡ r x F .
(2.42)
Con esta definición, la última duda acerca de la naturaleza de las torcas ha quedado automáticamente disipada. Las torcas no son un nuevo y extraño tipo de agente físico que urge a los cuerpos; se trata, ni más ni menos, que de una forma alternativa como actúan las fuerzas. Esta vez, no se trata, empero, de un ente que cambia el vector tangente, sino de aquel que tuerce los planos de movimiento. ¡El mismo origen: las fuerzas!, pero diferente efecto. Así, puede verse ahora con toda claridad que existen fuerzas que si bien cambian al vector tangente p de acuerdo con (2.26), no tienen efecto
69
Newton y su mecánica
alguno sobre el plano de la trayectoria; esto es, no afectan al vector normal, de manera que éste permanece constante a lo largo del movimiento del cuerpo. Este tipo de movimiento ocurre cuando la fuerza es radial, o bien, tal como se dice en el argot de la mecánica: es una fuerza central . En efecto, si r
r
r
F / / r ⇒ N 0 y por consiguiente h es constante (movimiento planar). En algún momento, cuando Newton escribía su monumental obra, los Principia , como se le conoce en el mundo de la ciencia, pensó en establecer una ley adicional para describir el movimiento de los cuerpos, esa era la ley para la torca y el cambio del momento angular (2.38). Sin embargo, cuando se percató de que el origen de las torcas no es distinto del de las fuerzas, decidió no darle la jerarquía de ley a esa expresión matemática. A la fecha, la fórmula general (2.38) se conoce simplemente así, como la relación de la torca con el cambio del momento angular. Como se verá más adelante, al atacar los problemas de la dinámica, esta fórmula resultará imprescindible para llegar a alguna solución. Sin ella sería imposible en la mayoría de los casos. El modelo de la mecánica prácticamente ha quedado completo; no obstante es necesaria una última ley para considerarlo cerrado. Esta es la tercera ley de Newton que se estudiará en seguida.
2.5. Tercera ley de la mecánica y la estática
Falta aún algo por establecer, en efecto, para que el modelo teórico de la mecánica pueda considerarse concluido y cerrado, desde el punto de vista estructural. La primera ley, para expresarlo en pocas palabras, es de carácter puramente cinemático, pues concierne exclusivamente al movimiento, a su descripción desde un marco de referencia inercial. Por su parte, se dice que la segunda ley es dinámica, por cuanto a que enfronta al movimiento y mejor dicho al cambio del estado de movimiento de los cuerpos materiales con aquello que lo causa: las fuerzas (y las torcas, en una visión ampliada a las dos fórmulas previamente estudiadas). Es la segunda ley una proposición híbrida que iguala entre sí las causas (ajenas al cuerpo), con los efectos de ellas en los cuerpos mismos, en una simple y compacta fórmula.
70
Tercera ley de la mecánica y la estática
La tercera ley es una proposición que concierne a las fuerzas únicamente, sin atender a sus efectos cinemáticos. Como todo mundo lo sabe, la tercera ley se enuncia de la siguiente forma: Tercera ley de la mecánica: a toda acción, corresponde una reacción igual y de sentido contrario.
Así la estableció Newton en sus Principia y así se ha venido escribiendo, de libro en libro desde la segunda mitad del siglo XVII, haciendo traducciones literales de su postulado. Lo que la tercera ley afirma es que siempre que una fuerza se aplica sobre algún cuerpo, éste reacciona en forma instantánea a ella, oponiendo una resistencia al cambio de su estado de movimiento original. Esa resistencia es, a su vez, una fuerza que se aplica sobre aquello que causó la fuerza primera y que vectorialmente es de la misma magnitud y de la misma dirección que ella, pero con un sentido opuesto. Matemáticamente hablando, si se escribe como r
F 12 a la fuerza con que un cuerpo 1 actúa sobre un cuerpo 2 , sin importar de qué tipo de interacción se trata, entonces el cuerpo 2 reaccionará instantáneamente con una fuerza r
F 21 sobre el primero, siendo ésta, una fuerza igual a aquella en magnitud y dirección pero con sentido opuesto; esto es: r
r
F12 F 21 .
(2.43)
Hay por allí, en el mundo ciertas personas, ciertos caracteres, espíritus hechos para crear dificultades, para hallar el pero, el detalle en todas las cosas; sobre todo cuando éstas no surgieron de su propia inteligencia y creatividad. En la ciencia parece ser que estos individuos se han dado cita. Basta con que un nuevo teorema, un nuevo esquema lógico haya aparecido por ahí, que venga a representar un paso más que da el intelecto hu-
71
Newton y su mecánica
mano en el camino del conocimiento, para que espontáneamente aparezcan sus detractores; científicos de diversas partes del mundo que opinan acerca de ese teorema, de esa teoría, aduciendo las más variadas fallas al logro aquel: que si el teorema esta mal planteado, que si viola tal o cual otro resultado archicomprobado, etc. Todo podría estar bien. La ciencia es afortunadamente una lucha que trata de derribar logros pasados y obtener nuevos, más ambiciosos, de mayor alcance; más precisos. Así son las cosas; no bien una fórmula aparece para calcular tal o cual hecho experimental, cuando otro investigador publica un artículo exhibiendo otra fórmula aún mejor que la anterior. Todo estaría muy bien si la lucha se limitara a una competencia por hallar la verdad y ensanchar el universo del conocimiento, por más feroz que ésta fuera. Lo malo es que se incurra en la insidia o en la mentira y sobre todo, se mezclen los asuntos personales con el trabajo científico. La razón de todo esto y sobre todo, por la aparente impertinencia del comentario, cuando se ha estado viendo el desarrollo de las leyes de Newton, es precisamente porque a la hora de sacar a la luz su pensamiento científico en los Principia , se le vino el mundo encima al pobre genio británico. Desde la burla de la chusma por su forma de vestir y su lenguaje engolado y afectado, hasta acusaciones de plagio de ideas le llovieron de todas partes… hasta la fecha, a más de doscientos cincuenta años de su muerte. Aquí y allá han aparecido libros, algunos de importantes científicos, que tratan de lanzar tierra sobre el pensamiento y la obra de Newton. De toda esa crítica malsana y estéril, la más socorrida, la que más se ha difundido en el mundo científico es la que gira en torno a la paternidad de las leyes de la mecánica. Gente conspicua en el ámbito de la ciencia ha osado publicar afirmaciones verdaderamente inverosímiles acerca de ellas. Eddington, el genio británico de la física contemporánea, alguna vez expresó que la primera ley de la mecánica, ni es ley, ni es de Newton. No es ley, dice Eddington, porque es en realidad un teorema que se deduce de la segunda ley para el caso de la fuerza nula. En un tono jocoso, se puede parafrasear la primera ley diciendo que todo cuerpo conservará su estado de reposo o de movimiento rectilíneo uniforme, a menos que deje de hacerlo. Con esta expresión, ha rebajado la primera ley y todo su contenido; todo aquello que significa, a la categoría de una vulgar perogrullada.
72
Tercera ley de la mecánica y la estática
Otros autores también han contribuido con su granito de arena (pero inútilmente) al descrédito de la obra de Newton. En varios libros sobre el tema, que preferiblemente no mencionaremos de ellos ni su autor, ni su título, pero que andan aún por allí en el mundo, regando la duda, se dice que en apego a la verdad, Newton no fue el autor de la primera ley, ya que Galileo la había propuesto varios años antes. Galileo, al realizar aquellos importantes experimentos con cuerpos que se deslizaban en planos inclinados, llegó a conclusiones trascendentales para la mecánica. En particular, al disminuir gradualmente la inclinación de los planos hasta llevarlos a la horizontalidad, pudo inferir que la aceleración de los objetos que se deslizan a lo largo de ellos disminuye, de manera que en el límite, cuando el plano se vuelve paralelo al piso, un cuerpo que se mueve sobre él lo hará con aceleración cero; esto es, con velocidad constante y aún más: que preservará ese mismo estado de movimiento indefinidamente, a menos que otra fuerza se le oponga (la fricción contra el piso, por ejemplo). Allí estaba, en efecto, si bien en estado embrionario, la primera ley. No hay que perder de vista, sin embargo, que el contenido y los alcances de esta ley, tal como la propuso Newton, son mucho más profundos, mucho más altos. En el mejor de los casos se puede decir del resultado de Galileo que fue, en efecto, el antecedente de la primera ley, pero, jamás que éste haya sido el autor de ella. Por cuanto a la segunda ley tampoco faltan los detractores de Newton, quienes de nueva cuenta arremeten contra él, afirmando que fue Galileo quien la propuso por primera vez. Nuevamente y sin ánimo de restarle importancia al genio de Pisa, cabe aquí la misma apreciación que se hizo para la primera ley: Galileo fue quien, en efecto, descubrió que es la aceleración y no la velocidad, como se pensaba entonces, la repuesta a las fuerzas. En aquellos tiempos poca gente había concebido siquiera que hubiese algo como la aceleración; esto es, el cambio de la velocidad y, por otra parte, reinaba una absoluta confusión por cuanto a las fuerzas. Había muchas personas que igualmente le daban el nombre de fuerza a lo que es energía y viceversa. Galileo fue el primero que empezó a poner orden en aquel caos de conceptos y dio el significado correcto a las fuerzas; el mismo que hoy en día se tiene de estos entes físicos. Él mismo propuso, adicionalmente, que hay un vínculo directo entre las fuerzas y la aceleración de los cuerpos y llegó a darse cuenta que la constante de proporcionalidad
73
Newton y su mecánica
entre ambas entidades es, en efecto, la masa, tal como se propone en (2.28). Sin embargo, a diferencia de Newton, Galileo siempre pensó en 1) fuerzas de contacto: empujones o jalones directos sobre el cuerpo que se observa, 2) escalares; esto es, que nunca se le ocurrió que las fuerzas tienen componentes y que, en general no se pueden representar por medio de escalares ya que tienen varios atributos, aparte de su magnitud, como son: su dirección, su sentido, su punto de aplicación y su carácter deslizante. Cierto que en aquella época los vectores aún no se conocían, pero Galileo, en todo caso, no alcanzó a percatarse de su complejidad. Así pues, tampoco en este caso se puede decir otra cosa que Galileo sentó las bases de la mecánica con sus experimentos y sus definiciones, lo que no es poca cosa, pero definitivamente, la segunda ley con toda su generalidad, con su amplísimo concepto de fuerza como un vector y cuya naturaleza puede ser variada, no sólo de contacto sino de acción a distancia, establece una enorme diferencia con aquellas ideas originales del italiano. Por contraste con lo anterior, la tercera ley de la mecánica no tiene ni objeción ni demérito alguno. Nadie ha puesto siquiera en duda la paternidad de esta ley. No parece haber en toda la historia anterior a Newton, o contemporánea a él, registro alguno de otro postulado siquiera parecido a la tercera ley. Se cuentan historias, por cierto falsas, de cómo fue que este genio llegó a la ley, pero la esencia es que, en efecto, su postulación fue enteramente debida a él. Con el ánimo de llamar la atención de quien estudie este tema, se propone a continuación un ejemplo teórico que puede servir para clarificar aún más los alcances de esta, en apariencia, sencilla ley de la mecánica. Considérese el ejemplo de dos cuerpos materiales; el cuerpo 1 y el cuerpo 2 que se hallan en medio del espacio sideral, en un sitio donde ninguna interacción debida a agente físico externo alguno los alcanza. La única interacción posible es aquella que uno de los cuerpos ejerce sobre el otro y viceversa, debida a sus respectivas masas, a sus cargas eléctricas o a sus momentos magnéticos. Así, el sistema de dos cuerpos está totalmente aislado del resto del universo, si bien, internamente existen esas fuerzas de interacción: F 12 es la fuerza con que el cuerpo 1 urge al cuerpo 2 , y F 21 es, por el contrario, la fuerza de interacción del cuerpo 2 sobre el 1. En la figura 2.5.1 se han dibujado estas fuerzas como vectores que apuntan en cualesquiera direcciones. Posteriormente se encontrarán las magnitudes, direcciones y sentidos relativos correctos. Ahora, debido a
74
Tercera ley de la mecánica y la estática
F 12
2
1
F 21
Figura 2.5.1. Dos cuerpos interactúan entre sí con fuerzas
vamente.
F 12 y F 21, respecti
que el sistema de dos cuerpos está aislado de toda interacción externa, la cantidad de movimiento total debe ser constante, de acuerdo con la segunda ley de la mecánica; esto es: r
P TOT cons tan te. Así debe ser también de acuerdo con la primera ley de la mecánica. Más aún, como se trata de un sistema de dos cuerpos, entonces r
r
r
PTOT P1 P 2 , es decir, que la cantidad de movimiento del sistema P TOT debe descomponerse como la suma de los vectores de momento lineal de cada uno de los cuerpos. Si ahora se deriva con respecto al tiempo la igualdad anterior, tomando en cuenta que P TOT es constante, se obtiene que
75
Newton y su mecánica
F 12
2
1
F 21
Figura 2.5.2. Los mismos cuerpos de la
acción tales como marca la tercera ley.
figura anterior, con las fuerzas de inter-
r
r
d p1 d p2 . dt dt Pero, de acuerdo con la segunda ley de la mecánica (2.26), se pueden sustituir estas derivadas por las fuerzas que dieron origen a los respectivos cambios de los estados de movimiento: r
r
F21 F 12 . Este resultado muestra que en la circunstancia que aquí se ha analizado, la acción de un cuerpo sobre el otro, cualquiera que haya sido su origen, es igual vectorialmente, pero en sentido opuesto a la fuerza que aquél haya ejercido sobre el primero. ¡Esta es la tercera ley de Newton! ¡Así que, utilizando las leyes primera y segunda se ha podido “demostrar” la tercera ley! ¿Qué está pasando aquí? Si se considera con cuidado, parece que la tercera ley no lo es; se trata de un teorema que puede ser demostrado con la ayuda de las otras dos leyes. ¿Qué le pasó a Newton? ¿Se le escapó este detalle?
76
Tercera ley de la mecánica y la estática
No parece creíble, sobre todo recordando que este individuo, temiendo a la crítica, revisaba una y otra vez sus escritos; pensaba y repensaba hasta disipar la más mínima duda sobre su trabajo. En particular ésta, la tercera ley, que, como se ha establecido, no tenía antecedente alguno, sino que fue producto enteramente del genio de Newton. La verdad es que aquí ha habido trampa. Para comenzar, debe ser claro que en la “demostración” de este teorema han sido propuestas como válidas dos cuestiones que nunca antes habían sido discutidas: la primera es que el momento lineal del sistema de cuerpos es la suma de los momentos lineales de cada uno de ellos. Se trata de un principio de superposición de estados. Si no se acepta a priori este principio, entonces no puede ser demostrado el teorema. En segundo lugar, si este mismo “teorema” se quiere demostrar para más de dos cuerpos, ya no es posible hacerlo. Las cosas deben entonces ponerse en su sitio: la tercera ley es, en efecto, una ley; esto es, un postulado fundamental de validez universal en la mecánica clásica. No importa qué número de cuerpos estén involucrados, las interacciones serán así siempre que un cuerpo, ejerciendo una fuerza sobre cualquiera otro, experimenta la reacción de ése como una fuerza igual a la ejercida, pero en sentido contrario, tal como se muestra en la figura 2.5.3. Además, si un sistema de N cuerpos, formando un cúmulo, se encuentra en el espacio, no sujeto a interacción externa alguna; no importa cuántos cuerpos sean, ni cuál es la interacción interna de uno sobre el otro; siempre se cumplirá que r
r
Fij F ji ,
(2.44)
siendo i y j índices que pueden adquirir cualesquiera valores {1, 2, 3,…, N } con la única excepción de que no se pueden tomar valores iguales; esto es: F 11, F 22,…, ya que ello representa la interacción de un cuerpo con él mismo. En este contexto se considerarán únicamente cuerpos simples, supuestamente inertes químicamente o nuclearmente, que no experimenten auto interacción alguna. En particular, para dos partículas se cumple el “teorema”. En este caso también se llega a otros resultados básicos para la teoría: así si, como se describe, se tiene un cúmulo de N cuerpos materiales en el es
77
Newton y su mecánica
k
i 2
F ji
3 1
F ij
j
Figura 2.5.3. En un sistema de
contrario a F ji .
N cuerpos la fuerza F ij es igual pero en sentido
pacio, todas sus interacciones serán internas si, en efecto, se encuentran aisladas del mundo exterior. En tal caso las únicas fuerzas que actúan sobre cada uno de ellos son aquellas debidas a la presencia de los demás cuerpos. Por ejemplo: el cuerpo número 1 (cualquiera que éste sea) experimenta fuerzas debidas a los cuerpos 2 , 3,…, N , r
r
r
F21 , F31, K , F 1N pero él mismo ejerce fuerzas de reacción sobre esos cuerpos; i.e .: r
r
r
F12 , F13 , K , F 1N de acuerdo con la tercera ley de la mecánica. Si se toma la suma de todas las fuerzas de interacción interna en el cúmulo y se suman, se obtiene que
78
Tercera ley de la mecánica y la estática N
r
F ij 0 ∑ i, j 1
(2.45)
( i ≠ j )
puesto que, de acuerdo con la tercera ley, se van a cancelar por parejas; la fuerza F 12 con la F 21, la F 13 con la F 31, etc. Así, el resultado (2.45) lleva a la conclusión de que en un cúmulo de N cuerpos materiales, donde N puede ser cualquier número natural, las interacciones mutuas entre parejas de cuerpos, de acuerdo con la tercera ley, se cancelan por pares, de manera que la fuerza neta total interna en el cúmulo es siempre cero.
r
F TOT 0.
(2.46)
En todo lo anterior, de una manera casi imperceptible, se han venido utilizando un par de axiomas fundamentales para la estructuración de la mecánica: uno es el llamado principio de superposición de estados, el otro es aquel que da a los vectores su carácter deslizante . En efecto, para dar sentido pleno a la expresión (2.45) es necesario aceptar que las fuerzas, así como el resto de las entidades vectoriales que se manejan en este modelo teórico se pueden sumar o restar de acuerdo con aquellas viejas recetas de Stevin de Brujas que se discutieron en (1.1) a (1.4). Pero lo novedoso no es tanto que las fuerzas que actúan sobre un mismo cuerpo se sumen para dar una resultante; lo realmente nuevo es que se pueda hablar de una resultante de un conjunto de fuerzas que actúan sobre varios cuerpos. Es claro que para sumarlas será necesario invocar a las reglas del paralelogramo o del polígono de Stevinius; esto es un principio de superposición de estados, pero lo que subyace a toda esta argumentación es que los vectores deben poderse desplazar paralelamente a sí mismos para poder realizar esta suma. Este es el principio sobre el carácter deslizante de los vectores. Así pues, en el caso de N cuerpos se puede hablar de una fuerza resultante; la F TOT. El punto que aún está por resolverse es acerca de dónde se aplica la fuerza resultante. Este asunto se tratará en la siguiente sección de este capítulo. Por otra parte, volviendo al caso de un solo cuerpo sobre el cual actúan varias fuerzas, haciendo uso de la regla de suma vectorial, es posible, como se mencionó arriba, obtener una resultante. Esta es, a su vez un vector fuerza que es igual a la suma vectorial de aquellos.
79
Newton y su mecánica
Si la resultante de un conjunto de vectores que actúan sobre un cuerpo es cero, se dice entonces que ese cuerpo se encuentra en equilibrio traslacional . Esto significa que, a pesar de todas las fuerzas que lo urgen, el cuerpo no cambiará su estado de movimiento; así, si estaba en movimiento rectilíneo uniforme, preservará ese mismo movimiento y si estaba en reposo, continuará en reposo. Matemáticamente, la condición de equilibrio traslacional se expresa así: r
∑i F i 0,
(2.47)
siendo F 1, F 2,…, F n, las fuerzas que actúan sobre un mismo cuerpo ¿Y qué se puede decir de las torcas, en el mismo sentido que se han estudiado las fuerzas? Para comenzar, considérese nuevamente el caso de dos cuerpos masivos que forman un sistema aislado en el espacio; esto es, exento de interacciones externas. Llamando de nuevo por F 12 a la fuerza con que el cuerpo 1 (ver figura 2.5.3) urge al 2 y F 21 la inversa; esto es, la fuerza con la cual el cuerpo 2 actúa sobre el 1, se tiene que la torca total es, de acuerdo con el principio de superposición vectorial estudiado anteriormente:
r
r
r
N TOT ≡ N 21 N 12 ,
(2.48)
o bien, recordando la definición de la torca vista en (2.42): r
r
r
r
r
N TOT ≡ r1 F21 r2 F12 ,
(2.49)
siendo r 1 y r 2 los radios vectores que van desde el origen de coordenadas del marco de referencia inercial desde el cual se observa al sistema, hasta cada uno de los cuerpos, respectivamente. Ahora, de acuerdo con la tercera ley, expresada matemáticamente en (2.43), se puede escribir la torca total (2.49) como:
r
r
N TOT ≡ (r2 r1 ) F12 . r
r
(2.50)
Pero, la diferencia de los vectores de posición en la expresión anterior se puede sustituir por el vector relativo
80
Tercera ley de la mecánica y la estática
r 12
r 1
r 2
Figura 2.5.4. El vector relativo entre dos cuerpos
1 al 2.
r
r
r 12 es aquel que va del cuerpo
r
r12 ≡ r2 r 1 .
(2.51)
Este es un vector que, por definición, va del cuerpo 1 al cuerpo 2 , tal como se muestra en la figura 2.5.4. Sustituyendo (2.51) en (2.50) se obtiene ahora: r
r
r
N TOT r12 F 12 .
(2.52)
Así, la torca total resulta tener la misma estructura que se dio en (2.42), pero lo que describe es un plano nuevo; el plano formado por el vector relativo r 12 y el vector tangente p 2. La torca total N TOT tiende a torcer este plano. Evidentemente, debido a la tercera ley, así como a la definición del vector relativo (2.51), la torca total se puede escribir igualmente como
81
Newton y su mecánica r
r
r
(2.53)
N TOT r21 F 21
y su significado se refiere ahora a la tendencia a torcer el plano generado por r 21 y p1. Esto significa que un observador situado en el cuerpo 2 ve una situación enteramente equivalente a la que observa el que esté parado en el cuerpo 1. Pero lo realmente interesante es que ahora, la torca total N TOT no es nula, no obstante que las fuerzas son opuestas, de acuerdo con la tercera ley. Bueno, no es nula, a menos que la fuerza de interacción F 12 sea paralela al vector relativo. En este caso
r
N TOT 0
(2.54)
Este caso se conoce como fuerzas centrales . Se trata de pares de fuerzas de acción y reacción que actúan en la misma dirección que el vector relativo. Pueden ser atractivas o repulsivas, según que apunten hacia dentro o hacia fuera de los cuerpos sobre los cuales actúan (véase figura 2.5.5). Este tipo de fuerzas es muy importante en la mecánica. La fuerza gravitacional de Newton (2.30) y la fórmula de Coulomb para la fuerza de atracción o de repulsión entre dos cuerpos cargados eléctricamente (2.32) son fuerzas centrales. Por su parte, la fórmula para la fuerza debida a H. A. Lorentz (2.33) no es central. Las fuerzas centrales tienen torca nula; por lo tanto, el vector normal h (el momento angular) permanece constante cuando estas fuerzas actúan, así que el movimiento que generan es planar. No así las fuerzas que no son centrales, como la de Lorentz, éstas cambian al vector normal; tuercen el plano del movimiento. Sobre un cuerpo material en el que actúan las torcas, en general, se puede obtener la torca resultante con el mismo criterio que se utilizó para las fuerzas; es decir, haciendo la suma vectorial de ellas
r
N TOT ≡
r
∑i N i .
(2.55)
Nuevamente, puede ocurrir que al hacer dicha suma vectorial, la torca resultante sea nula; esto es, que:
82
Tercera ley de la mecánica y la estática
b
a
a
b
Figura 2.5.5. Fuerzas centrales;
repulsivas.
a y a son atractivas; en tanto que b y b son
r
N TOT 0,
(2.56)
en este caso, se dice que el cuerpo se halla en equilibrio rotacional . Lo anterior significa que ese cuerpo no tiene la tendencia a girar (y su plano de movimiento permanece apuntando en una misma dirección). Ahora, si sobre un cuerpo material cualquiera actúa un conjunto de fuerzas y torcas, pero las resultantes de ellas son ambas nulas; o sea que el cuerpo está en equilibrio traslacional y rotacional, simultáneamente, entonces se dice que ese cuerpo esta en equilibrio mecánico. Así pues, equilibrio mecánico significa que la suma vectorial de las fuerzas es cero y simultáneamente, que la suma de las torcas que actúan sobre él también es igual a cero: r
∑i N i 0, 83
(2.57 a)
Newton y su mecánica r
∑i N i 0.
(2.57 b)
Un cuerpo en equilibrio mecánico ni tiende a desplazarse en el espacio, ni tiende a girar. Un cuerpo así está estático. Por la misma razón, la parte de la mecánica que estudia a los cuerpos materiales en equilibrio mecánico se llama la estática . Se trata de una parte muy importante, sobre todo para la ingeniería, pues ella es la que permite proyectar, diseñar y construir estructuras estáticas que ni se desplacen, ni giren. 2.6. Sistemas de partículas
El modelo de la mecánica clásica ha quedado prácticamente completo desde el punto de vista axiomático. Con las tres leyes, la ley de las torcas y el cambio del momento angular; con el principio de superposición y el axioma sobre el carácter deslizante de los vectores, se puede ya, en principio, abordar cualquier problema que concierna a un solo cuerpo. No obstante, aún queda cierto camino por recorrer. Una parte muy importante; fundamental, es aquella que trata con un sistema de N cuerpos materiales que se mueven en el espacio euclideo tridimensional, actuados, en general por fuerzas y torcas, tanto internas como externas. Considérese pues, un cúmulo de N partículas que se encuentran en el espacio, moviéndose bajo la influencia de fuerzas y torcas, tanto externas (esto es, debidas a agentes físicos externos al cúmulo), como internas (debidas a las interacciones entre ellas de tipo gravitacional, electromagnéticas, por impacto directo u otra). Supóngase que se designa a las masas de cada una de ellas como m1, m2, m3,…, mn. Si en un instante t sus posiciones son r 1(t ), r 2(t ), r 3(t ),…, r N (t ), se puede escribir, para cualquier partícula i de ese cúmulo, de acuerdo con la segunda ley de la mecánica, que:
r
F (i a )
d 2ri (t ) r
N
ƒ ji mi ∑ j 1
( j ≠ i )
con i 1, 2, 3,…, N
84
2
dt
,
(2.58)
Sistemas de partículas
donde F i (a ) es el vector que representa a la fuerza neta resultante de todas las fuerzas externas que se aplican instantáneamente sobre la partícula i-ésima del cúmulo. A este vector se le llamará la fuerza aplicada . Por su parte, los vectores ƒ ij representan la fuerza interna con la cual la partícula j-ésima del cúmulo actúa sobre la i -ésima. La sumatoria se extiende, pues, sobre todas las partículas del cúmulo, excepto, por supuesto, la i-ésima, pues, como ya se mencionó antes, hay que descartar las autointeracciones. Por cierto, de aquí en adelante y por sencillez se adoptará una taquigrafía para denotar las derivadas temporales, que se usa casi en todos los textos sobre este tema y que resulta de gran utilidad. Las derivadas temporales se describirán mediante un punto encima del símbolo de la variable:
r
˙r ≡ d r , d t
(2.59 a)
2 ˙˙r ≡ d r , i d t 2
(2.59 b)
r
r
r
así que la fórmula (2.58) se puede rescribir utilizando esta convención como: r
F (i a )
N
∑ j 1
ƒ ji mi r˙˙i ; i 1, 2, 3, , N . r
K
(2.58)
( j ≠ i )
Si las fórmulas para la fuerza aplicada, así como para las fuerzas de interacción interna ƒ ij se conocen, entonces (2.58) representa un sistema de N ecuaciones diferenciales vectoriales de segundo orden, acopladas. Una vez resuelto este sistema, e impuestas las condiciones iniciales sobre cada una de las partículas del cúmulo, se hallarán las soluciones. Éstas tendrán la forma general siguiente:
r
r
ri ≡ ri (t ) i 1, 2, 3, K , N .
(2.60)
Se trata, por supuesto, de las N ecuaciones de las trayectorias; esto es, de aquellas que describen el sendero que cada una de las partículas del cúmulo
85
Newton y su mecánica
sigue en el espacio, como resultado de todos los agentes físicos que la urgen, al través del tiempo. En la generalidad de los casos es imposible resolver el sistema de ecuaciones diferenciales (2.58) para un sistema de más de dos cuerpos en el espacio y tres cuerpos en el plano, con ciertas restricciones. Las fuerzas de interacción complican enormemente su tratamiento. El caso más trivial, desde luego, es aquel en el que no hay fuerzas de interacción internas ƒ ij ; este es el llamado sistema incoherente de partículas. Cada una se mueve, en este caso, como si las demás no existieran , sujeta únicamente a la fuerza externa que actúa sobre ella. En esta circunstancia, todas las ecuaciones (2.58) están desacopladas, pudiéndose tratar a cada una por separado para integrarla y hallar la solución. Tal vez el ejemplo físico que más se asemeja al caso incoherente es el de ciertos polvos, como esos que se usan para apagar fuegos; las pequeñas partículas de polvo fluyen casi libremente en chorros que no presentan una interacción interna apreciable. Por otra parte, si el número de partículas es muy, muy grande y éstas son tan pequeñas como las moléculas, entonces es posible sustituir a las fuerzas de interacción en (2.58) por un término que surge de un tratamiento estadístico y que macroscópicamente se interpreta como el gradiente de la presión. Este tratamiento y estos resultados dan lugar a la famosa ecuación de Euler para los fluidos perfectos. 4 En general se pueden obtener resultados interesantes para un sistema de N partículas si se lleva a cabo cierto proceso estadístico de promediación. Por ejemplo, se define el llamado centro de masa de un cúmulo de partículas, como el lugar del espacio donde parece concentrarse la masa de todo ese sistema. Matemáticamente se define el centro de masa como un radio vector R dado por la siguiente fórmula:
∑i mir i R . ∑i mi r
r
(2.61)
Se trata, en efecto, de un promedio de las posiciones de las partículas, ponderado por las masas. Si se le llama 4
Véanse los capítulos 6 y 9 de este texto.
86
Sistemas de partículas
z
m1 m3
m2 r 3
r 1 r 2
C.M.
R
mi r i
y
0
x Figura 2.6.1. Un cúmulo de N partículas con masas m1, m2,…, mi ,…, mN . Se mues-
tran los radios vectores y el vector R al centro de masa del cúmulo.
M ≡
N
mi ∑ i 1
(2.62)
a la masa total del cúmulo de N partículas, la fórmula (2.61) se puede rescribir en una forma ligeramente diferente, de la siguiente manera: r
MR ≡
N
∑ i 1
r
mir i .
(2.63)
Ahora, derivando ambos miembros de (2.63) con respecto al tiempo y suponiendo que las masas de las partículas del cúmulo permanecen constantes a lo largo de su movimiento, se obtiene que
87
Newton y su mecánica
˙ MR r
∑i
mi r ˙i . r
(2.64)
Esto viene a representar dos cosas: por una parte, se trata nuevamente de un promedio; es el promedio de las velocidades de las partículas, ponderado sobre sus respectivas masas; por otra parte, comparando el miembro de la izquierda de (2.64) con la definición (2.23) se ve que es el momento lineal. En efecto, este producto representa el momento lineal o cantidad de movimiento neto total del sistema de N cuerpos. Uniendo estos dos conceptos, se puede apreciar que este producto al que se viene aludiendo en este párrafo es un vector que se puede dibujar a partir del centro de masa (C.M .) del cúmulo; es pues, el momento del centro de masa. Derivando nuevamente con respecto al tiempo, se obtiene ahora: ˙˙r MR
∑i
˙˙ mi r i r
(2.65)
que representa 1) la aceleración promedio del cúmulo, 2) la aceleración del centro de masa y 3) si se invoca a las expresiones (2.58) donde se establecen las ecuaciones de movimiento de las partículas, se puede constatar fácilmente, de acuerdo con (2.65) que
∑i
r
Fi ( a )
˙˙r ƒ ji MR .
∑i j∑≠ i
r
(2.66)
Pero, revisando la doble sumatoria en el miembro de la izquierda de (2.66), se ve que al desarrollarlo da como resultado lo siguiente: r
r
r
∑i j∑≠ i ƒ ji ƒ12 ƒ13
r
K
r
ƒ 21 K ƒ 31 K 0. (2.67)
Si se piensa un poco, se llegará a la solución de que cada término de este desarrollo se cancela con su reacción correspondiente, de acuerdo con la tercera ley de la mecánica, así que la contribución de esta doble sumatoria
88
Sistemas de partículas
al movimiento del cúmulo de partículas como un todo, es nula. Por lo tanto, regresando a la expresión (2.66) se tiene que: r
F TOT ≡
∑i
˙˙ Fi ( a ) MR . r
r
(2.68)
Esto significa que lo único que contribuye al movimiento de un cúmulo de partículas es la resultante de las fuerzas aplicadas y esta resultante es un vector que se “aplica” sobre el centro de masa ( C.M.), provocando su cambio de estado de movimiento. Son notables varias características de este resultado (2.68). En primer lugar, debe llamar la atención que se ha vuelto a la estructura original de la segunda ley, donde la fuerza se hace igual, matemáticamente al producto de la masa por la aceleración. Solamente que ahora se trata de la fuerza neta aplicada y de la masa total del sistema, multiplicada por la aceleración del centro de masa. En segundo lugar, es importante hacer notar que la única fuerza que provoca el movimiento del sistema como un todo, es la fuerza neta aplicada. Las fuerzas de interacción internas no son capaces de cambiar el estado de movimiento de ese cúmulo. Pero debe tenerse cuidado de no mal interpretar el resultado. Una cosa es que las fuerzas internas no cambien el estado de movimiento del cúmulo como un todo y otra cosa muy diferente es que no provoquen movimiento alguno. Una nube es un magnífico ejemplo de un cúmulo de N partículas (las moléculas de agua o las pequeñas gotas de este líquido que se hallan en suspensión). Pues bien, la nube como un todo se mueve y cambia de dirección debido a la fuerza (aplicada) del viento. Las miríadas de partículas que componen este sistema, ejercen entre sí fuerzas de atracción o de repulsión eléctrica; estas son las fuerzas de interacción internas del tipo ƒ ij . Pueden ser extraordinariamente intensas y violentas, sobre todo en las tempestades. No obstante, estos agentes físicos, de acuerdo con (2.67), no pueden provocar el cambio del movimiento de la nube como un todo debido a que en todo instante se cancelan por pares, según lo establece la tercera ley. Pero es claro también que a escala local, las fuerzas de interacción si actúan. Todos los vórtices y torbellinos; las rachas y las descargas internas son el resultado de las fuerzas de interacción. Así, aunque el mo
89
Newton y su mecánica
vimiento de la nube, como un todo, es únicamente la respuesta a las fuerzas externas aplicadas, sus cambios de forma y sus movimientos internos son el resultado de las fuerzas de interacción interna. Finalmente, cabe recalcar que la fuerza neta total, F TOT se aplica sobre el centro de masa del sistema, según se puede observar en (2.68). Este punto, como se vio, es el lugar en el que la masa de todo el sistema se concentra aparentemente, y puede ser un sitio que esté ocupado por alguna partícula del cúmulo, pero también puede ocurrir que sea un sitio vacío. Por ejemplo, un proyectil que se dispara desde un cañón de artillería, está dotado de un sensor barométrico que lo hace estallar en cientos de pedazos cuando a su caída, alcanza cierta altura. Esto se hace, desgraciadamente para causar mayor daño. El ejemplo sirve, sin embargo, para mostrar objetivamente el resultado que se menciona anteriormente. Mientras va en vuelo el proyectil es un cuerpo sólido que tiene su centro de masa en algún punto de su interior, donde hay materia. Sin embargo, en todo momento, desde que fue disparado, hasta que sus pedazos tocaron tierra, el movimiento de este cuerpo ha sido determinado por la fuerza de gravedad y la fuerza de resistencia del aire (que son fuerzas aplicadas), aplicadas sobre su centro de masa. Al estallar el proyectil se liberaron gigantescas fuerzas de interacción, pero ellas no tuvieron papel alguno en el movimiento del cúmulo como un todo. Cierto es que los fragmentos volaron y se desperdigaron por todas partes con enormes velocidades, pero el sistema de N partículas que resultó de esta explosión continuó su movimiento y su centro de masa siguió en el mismo curso que llevaba originalmente el proyectil cuando estaba completo, como si nada hubiera pasado, pues las fuerzas internas son inútiles para modificar el estado de movimiento del sistema. En cuanto a las torcas, se puede abordar el problema para N partículas de una manera enteramente semejante a lo que se hizo para las fuerzas. Así, si sobre un sistema de N corpúsculos actúan fuerzas internas y fuerzas aplicadas, de acuerdo con la fórmula (2.58), se obtiene, multiplicando vectorialmente por cada radio vector r i que:
r
ri Fi ( a ) r
N
∑ j 1
r
r r ri ƒ ji ri mir˙˙i . r
( j ≠ i )
90
(2.69)
Sistemas de partículas
Entonces, denotando por N i (a ) a la torca neta aplicada para la partícula i -ésima del cúmulo; r
N i ( a )
r
≡ ri F i ( a ) r
(2.70)
y haciendo la definición de h i para el momento angular de esa misma partícula
r
r r hi ≡ ri mi r˙i
(2.71)
se puede reescribrir (2.69) de la siguiente manera: r
N i ( a )
N
∑ j 1
˙ ri ƒ ji hi . r
r
r
(2.72)
( j ≠ i )
Esta es la ecuación para las torcas y el cambio de momento angular de la i -ésima partícula de un cúmulo. Para obtener la fórmula correspondiente al cúmulo total, es necesario sumar, de la misma forma que se hizo para las fuerzas; esto es; haciendo r
a ) N (TOT ≡
N
N i ( a ) ∑ i 1
(2.73)
r
h≡
N
r
hi ∑ i 1
(2.74)
se obtiene ahora: r
( a )
N
∑ j, i 1
N TOT
˙ r h ( i ƒ ji ) . r
r
r
(2.75)
( i ≠ j )
Observado ahora con mayor cuidado las torcas internas, es posible ver que si se desarrollan las dos sumatorias y se agrupan de acuerdo con la tercera ley, por parejas de acción y reacción, se obtiene lo siguiente:
91
Newton y su mecánica
N
N
r
r
ri ƒ ji ∑ r ji ƒ ji , ∑ i , j 1 j < i r
r
(2.76)
( i ≠ j )
donde se ha usado de nueva cuenta la definición (2.51) para el vector relativo entre parejas de partículas r
r
r
r ji ≡ ri r j .
(2.77)
Como puede apreciarse de (2.76), la torca neta total que resulta de la aplicación de todas las torcas internas entre parejas de corpúsculos, no tiene por qué ser nula en general. No obstante que las fuerzas internas se aplican por pares y se cancelan al sumarse, de acuerdo con la tercera ley, no ocurre lo mismo con las torcas internas. Las moléculas del agua son un ejemplo de lo que se ha descrito anteriormente. Cada molécula, como es bien sabido, está constituida por un átomo de oxígeno que tiene adheridos dos átomos de hidrógeno, formando un triángulo, como el que se muestra en la figura 2.6.2. Esta molécula, debido a su estructura y composición contiene dos electrones de valencia que están siendo intercambiados incesantemente entre un átomo de hidrógeno y el átomo de oxígeno, de manera que en cada instante parece como si el sistema presentara una dipolaridad de cargas; esto es, que tiene un momento dipolar electrostático instantáneo. Este hecho explica por qué las moléculas de agua se encuentran constantemente en movimiento. Chocan unas contra otras, giran y se desplazan de un punto a otro incesantemente. Se enlazan y se destraban para irse a topar inmediatamente con otra en una danza frenética que parece como si estuvieran presas del mal de San Vito. Debido a su estructura y a la disposición de los átomos en esa forma, con un ángulo de 104°, el agua posee también un momento magnético que da como resultado una fuerza no central y torcas no nulas. Este hecho implica que las moléculas de agua están en constante movimiento; giros y vueltas, choques y rebotes forman la existencia de estos cuerpos. Es precisamente debido a ello que las moléculas de agua tienen tan grande proclividad a combinarse con otras sustancias para formar compuestos más pesados. Es por ello que se dio la vida con tan pasmosa rapidez en la Tierra, una vez que hubo agua.
92
Sistemas de partículas
O
H
H
104˚
Figura 2.6.2. Molécula de agua. Los enlaces de los átomos de hidrógeno con
el átomo central de oxígeno forman un ángulo de 104°. Este hecho hace que la molécula de agua tenga momento dipolar.
Por supuesto, si las fuerzas de interacción interna son centrales, entonces los vectores relativos y aquellas serán siempre paralelas, en cuyo caso las torcas debidas a este tipo de interacción son cero, esto es, si r
r
r
r ij ƒ ij 0 ; ∑ j < i r
rij / / ƒ ij →
en tal caso, la expresión para las torcas y el cambio de momento angular del sistema de N partículas (2.75) se reduce a la forma: ˙ N TOT h r
( a )
r
(2.78)
que es la misma fórmula que (2.38) para un solo cuerpo. En este caso, la torca neta total debida a las fuerzas aplicadas es la única responsable por el cambio del momento angular del sistema. Pero aún no es posible saber
93
Newton y su mecánica
dónde se aplica esta torca neta total y dónde debe dibujarse el vector de momento angular del sistema de N partículas. Para hacerlo considérese ahora la siguiente transformación de coordenadas: r
r
r r r R .
i
(2.79)
i
Lo que significa (2.79) es que se toma al centro de masa ( C.M.) del sistema como el punto desde el cual se tiran vectores r i hasta cada una de las partículas. Es como hacer una traslación del marco de referencia a un nuevo marco anclado en el centro de masa. Multiplicando miembro a miembro de (2.79) por la masa correspondiente mi , se obtiene ahora
r
r
r mi ri mi R miri ,
(2.80)
sumando sobre todas las masas, se encuentra el siguiente resultado:
∑i
r
mi r i 0,
(2.81)
donde se ha hecho uso de la definición del centro de masa dada en (2.61) y (2.63). Este resultado era de esperarse si se piensa que el centro de masa es el punto del espacio donde se han promediado todas las posiciones de los corpúsculos. Así que un observador situado allí encontrará que, en efecto, la posición promedio de todos los cuerpos del sistema es el punto donde se halla: en el origen. Pero regresando a (2.79) y (2.80), es de verse que el vector de momento angular de la i-ésima partícula se puede rescribir como: r
(
r
hi ri
r˙i R˙ ; R ) mi r
r
r
o bien, desarrollando: r r r r ˙ ˙ r r ˙ ˙ hi ri mi ri ri mi R R mi ri R mi R (2.82) r
r
r
94
Sistemas de partículas
z
mi r i
C.M. r i
R
y x Figura 2.6.3. Desde el centro de masa ( C.M.) de un cúmulo de N partículas se di-
buja el vector r i hasta la i -ésima del sistema.
sumando sobre todos los valores del índice i se obtiene ahora lo siguiente: r
r
r h ≡ h h CM ,
(2.83)
donde r
h ≡
∑i
r
hi
∑i
r r ri mi r˙i
(2.84)
es el vector de momento angular total del sistema de N cuerpos, con respecto al centro de masa del mismo. Igualmente, se define ˙ h CM R MR r
r
95
r
(2.85)
Newton y su mecánica
como el vector de momento angular del centro de masa, medido desde el origen del sistema de coordenadas, O . Por otra parte, es muy fácil demostrar que los términos segundo y tercero de la derecha en (2.82), al sumarse sobre todas las masas dan cero, debido a (2.81). La fórmula (2.83) establece que el momento angular total de un cúmulo de N corpúsculos se “reparte” en un vector de momento angular de todo el cúmulo, pero medido desde el centro de masa, más otro vector que es el momento angular del centro de masa, medido desde el origen. Por ejemplo, el Sistema Solar puede entenderse muy bien como un sistema de N cuerpos. Desde un marco de referencia inercial local anclado instantáneamente en algún lugar de la superficie terrestre (por ejemplo en un observatorio astronómico), se pueden establecer las posiciones y las cantidades de movimiento de los planetas y del Sol, incluyendo a la Luna, los asteroides y las lunas de los planetas. Con estos datos se calculan entonces los momentos angulares de cada uno de estos cuerpos. Sumándolos se halla el momento angular total del Sistema Solar, referido al marco de referencia inercial terrestre. Como el centro de masa del sistema está muy cerca del centro geométrico del Sol, debido a la enorme masa de este cuerpo en relación a los demás, se puede calcular aproximadamente el momento angular del centro de masa desde el mismo marco de referencia, de acuerdo con (2.85). Entonces, invocando a la fórmula (2.83), se puede saber cuál es el momento angular del sistema, medido desde el centro de masa. 2.6.1. Despegue, vuelo e inyección en órbita de un cohete
Una de las aplicaciones espectaculares de la mecánica clásica de Newton en problemas de movimiento de cuerpos, es la que se hace para estudiar el despegue de un cohete. Como se sabe, los cohetes son actualmente los vehículos con los cuales se puede transportar cargas al espacio. Se trata de artefactos que en su interior llevan, tanto el combustible, como el oxidante que se requiere para encender y mantener una combustión muy rápida, que produzca grandes cantidades de gases. Estos gases son conducidos por unas toberas con formas y diámetros cuidadosamente calculados
96
Despegue, vuelo e inyección en órbita de un cohete
2 1
3
4
5 Figura 2.6.4. Esquema
de un motor cohete del tipo Walther, con propelantes líquidos, 1) tanque de oxidante, 2) tanque de combustión, 3) tanque de alta presión de gas inerte de acarreo, 4) cámara de combustión y 5) tobera convergente-divergente de De Laval.
para provocar que esos gases se aceleren aún más y emerjan por la salida a velocidades supersónicas. Las toberas convergentes-divergentes de de Laval son pues, aceleradores de partículas. Sin tratar de entrar en mayores detalles, ya que el tema que aquí se trata no es el de la ingeniería de cohetes, se muestra en la figura 2.6.4 el esquema de un motor de cohete del tipo Walther a base de propelantes líquidos. Como se ve, un motor como éste lleva su combustible en un recipiente y en otro debe cargar con el oxidante para llevar a cabo la combustión. Para forzar la entrada de ambas sustancias a la cámara, un tanque adicional se instala en el vehículo. Este recipiente lleva a muy alta presión un gas inerte
97
Newton y su mecánica
M >1
M <1
M 1
Impulso Figura 2.6.5. Esquema de una tobera convergente–divergente de De Laval. Los
gases subsónicos que provienen de la cámara de combustión, a la derecha, son forzados hacia la garganta, donde adquieren velocidades sónicas ( M 1). A la izquierda, en la parte divergente, son llevados a velocidades mayores a la velocidad del sonido local ( M 1). M es el número de Mach; M 1 es la velocidad del sonido. La aceleración de los gases da el impulso a los vehículos espaciales.
como el helio o el argón, para acarrear al oxidante y al combustible hacia la parte baja del cohete. Por su parte, la cámara de combustión es el espacio donde confluyen los componentes de la mezcla. Allí, mediante una bujía se enciende y la combustión ocurre. Los gases de esta reacción química son encauzados por la tobera hacia la salida y se desechan en el espacio. En 1888 un científico e ingeniero sueco, de nombre Carl Gustaf Patrik de Laval (1835-1913) inventó, entre otras cosas, la tobera que lleva su nombre y que hoy por hoy es la parte más importante del motor de un cohete. En la tobera, los gases de la combustión, a alta velocidad sin ser supersónicos, son acelerados simplemente, mediante la estrangulación de un tubo, hasta alcanzar a la salida velocidades supersónicas. Por ello es que se afirma que la tobera convergente-divergente es un acelerador de gases. Es esa aceleración la que se aprovecha para mover al vehículo. Por la tercera ley de Newton, la reacción del artefacto ante la acción de los gases acelerados en la tobera es la que brinda la aceleración (en sentido opuesto a los gases) del cohete. Adicionalmente, un cohete es un vehículo con masa variable. En la medida en que ocurre la combustión del oxidante y el combustible, los
98
Despegue, vuelo e inyección en órbita de un cohete
Figura 2.6.6. Un cohete asciende verticalmente. Libera en cada
cantidades de gases a gran velocidad.
lapso elemental,
tanques que almacenan estas sustancias se van vaciando con gran celeridad. Este hecho, como se verá en seguida, contribuye en forma muy importante al impulso que permite al cohete elevarse por el espacio. Considérese pues, un cohete que asciende verticalmente desde la superficie de la Tierra, debido al impulso que recibe como reacción de los gases acelerados que salen por la boca de la tobera y con la contribución adicional que le da su pérdida de masa, tal como se muestra en la figura 2.6.6. Supóngase que los gases que emergen de sus toberas, salen a una velocidad u constante, en dirección opuesta al ascenso del cohete, con respecto a un observador situado en alguna parte del vehículo. De acuerdo con la mecánica, si en algún instante t de su vuelo, la magnitud de la cantidad de movimiento del cohete es
p(t ) m(t )v (t )
99
(2.86)
Newton y su mecánica
un instante t t posterior, su momento será:
p(t ) ∆p (m(t ) ∆m)(v (t ) ∆v )
(
)
∆m v (t ) ∆v u ,
siendo el último término de la derecha, el que representa el momento lineal de los gases expelidos en ese lapso. Por lo tanto, el cambio experimentado en ese pequeño intervalo temporal por el sistema del cohete y sus gases es, aproximando los infinitésimos hasta el primer orden:
∆ p m∆v u∆m .
(2.87)
Por supuesto en la obtención de la expresión anterior se han ignorado los efectos de la resistencia del aire y otros. Ahora, de acuerdo con la segunda ley de la mecánica, el cambio del momento lineal del cuerpo es equivalente a la fuerza que actúa sobre él: su peso, así que, utilizando (2.87) se obtiene la ecuación diferencial con la cual se describe este movimiento:
dv d g u (lnm) , dt dt
(2.88)
siendo g la constante de la m aceleración de la gravedad, que al nivel del mar tiene el valor de 9.80665 s 2. Integrando la ecuación diferencial (2.87) se obtiene:
m v (t ) v0 gt uln , m0
(2.89)
donde v 0 es la velocidad inicial al despegue del cohete, en el instante t 0. Por su parte, m0 es la masa inicial en el mismo momento del inicio del vuelo. Si la masa del combustible y el oxidante se van consumiendo a un ritmo constante; esto es, si se supone que
m˙ k ,
100
(2.90)
Despegue, vuelo e inyección en órbita de un cohete
entonces
m(t ) m0 kt ,
(2.91)
donde k es una constante que puede ser evaluada. Si se conoce la masa del cohete al instante inicial, m0, cuando sus tanques con los propelantes se encontraban repletos y se sabe cuál es la masa del cohete me , cuando el oxidante y el combustible se han agotado completamente al tiempo T después del encendido inicial, entonces
k
m0 me . T
(2.92)
Además, en cualquier instante intermedio t , la proporción es
m(t ) 1 m 1 1 e t . m0 T m0
(2.93)
Por lo tanto, si el cohete partió del reposo y un lapso T después se agotó su combustible, la velocidad alcanzada en ese momento fue, de acuerdo con (2.89) y (2.93), la siguiente:
v (t ) gT uln
me . m0
(2.94)
Así, si se considera que la velocidad con la que salen los gases por la boca de la tobera es de unos 3500 m/s con respecto al cohete, si el tiempo que lleva para que el oxidante y el combustible se agoten es de 3.5 minutos y si la masa del cohete vacío es un 10% de la que tenía cuando sus tanques estaban llenos al inicio del vuelo, entonces
v (T ) 6000 m
s
o sean unos 21600 km/h. Integrando la expresión (2.89) se obtiene la fórmula para la altura alcanzada desde la superficie terrestre, partiendo del reposo:
101
Newton y su mecánica
y (t )
12
kt um0 kt gt 1 ln1 . (2.95) 1 1 k m0 m0 2
El cohete sigue ascendiendo después que sus motores se apagan al terminarse el combustible. Para calcular el tiempo que le lleva al cohete llegar a lo más alto de su trayectoria, hay que plantearse lo siguiente: en t T 0 la velocidad del cohete, con sus tanques ya vacíos, es igual a cero:
v0 (T 0 ) 0 ;
(2.96)
entonces, de acuerdo con (2.89):
uln
m0 gT 0 ; me
(2.97)
despejando al tiempo, se obtiene, para los datos que se propusieron anteriormente:
T0 821.79 s ≈ 13. 7 min. O sea que en menos de catorce minutos después que se apagaron los motores, el cohete alcanza su máxima altura. La altura máxima se alcanza en el instante T 0, cuando el ascenso inercial, ya sin el impulso de los motores, cesa debido a la atracción de la Tierra. Si se considera que una vez que se han apagado los motores, el movimiento del cohete es exactamente igual al del tiro vertical con una velocidad inicial v (T ); la misma que se calculó al fin del combustible, entonces:
y (T0 ) y (T ) v (T )T0 12 gT 02 ,
(2.98)
donde y (T ) es la altura alcanzada al final de la combustión; misma que se obtiene de (2.95) cuando se calcula con el tiempo T y la masa m m0.
y (T ) 330.719 Km
102
Problemas del capítulo
(ver el problema 2 al final del capítulo). Con estos datos la altura alcanzada se calcula de inmediato:
y (T 0 ) 1, 950.05 Km . Por supuesto, este cálculo es aproximado. Para realizarlo se ha hecho uso de varias suposiciones que en la realidad no son tan ciertas, con el objeto de volver sencillo el cálculo. Por ejemplo, se ha considerado que la aceleración de la gravedad es constante a lo largo de todo el trayecto. Esto no es correcto. A 1950 Km por encima del nivel medio del mar, la gravedad es casi la mitad de lo que es su valor aceptado. A esa altura g vale aproximadamente 5.73 m/s2. Así, el haber supuesto a g como una constante lleva a un resultado que no es el correcto. Por otra parte, se ha ignorado un efecto que en la realidad juega un papel muy importante en los lanzamientos reales: la resistencia del aire. Esta es una fuerza que se opone al movimiento; es una fuerza disipadora que, según se sabe, es proporcional al cuadrado de la velocidad del cuerpo y la geometría del cohete tiene mucho que ver en ella. Finalmente está el efecto de la rotación terrestre. 2.7. Problemas del capítulo 2.1. Explicar
la razón por la cual dos marcos de referencia inerciales deben traducir sus observaciones de uno al otro mediante transformaciones de coordenadas lineales. 2.2. Escribir la fórmula para una transformación de coordenadas que mapea un segmento de recta en otro segmento de recta desplazado una distancia a (constante) con respecto al primero y que está girado /2 radianes respecto de aquél. 2.3. Si el marco de referencia inercial del problema 2.2 es inercial, demostrar que el marco de referencia transformado también lo es. 2.4. Desde un marco de referencia inercial la velocidad de una partícula es
r v 5.27iˆ 2.63 ˆj 0kˆ
103
[m s ] 2
Newton y su mecánica
encontrar las componentes del vector velocidad de la partícula desde el marco inercial que está girado, respecto al primero, alrededor del eje OZ con un ángulo de 30° en sentido directo. 1 2.5. Encontrar la ecuación de la trayectoria para una partícula que se mueve con la velocidad descrita en el problema 1.4. Hacer un dibu jo en 2D de esta trayectoria. 1 2.6. Un cuerpo se desplaza siguiendo una trayectoria en el espacio, sujeto a una aceleración
a 0iˆ 0 ˆj 9.81kˆ r
[m s ]. 2
Si partió en el origen del marco de referencia con una velocidad inicial r v0 180iˆ 0 ˆj 0kˆ
[m s ] ,
encontrar la ecuación de la trayectoria y hacer un dibujo mostrando este movimiento. ¿Qué ejemplo de la vida real podría ser similar a este problema? 1 2.7. Un cuerpo gira uniformemente describiendo un círculo de radio 10 m, realizando una vuelta completa cada 2 minutos sobre un mismo plano. Describir en coordenadas cartesianas su velocidad. ¿Cuál es su vector de aceleración? 1 2.8. Demostrar que en el caso anterior se cumple que la aceleración centrípeta de ese cuerpo está dada por la fórmula
v 2 a c . r m1 y m2 y con velocidades iniciales v 01 y v 02, respectivamente, chocan elásticamente. Si sus masas se conservan, encontrar las velocidades finales, después del choque, en función de v 01 y v 02, para cada uno de ellos. 2.10. Una partícula de agua cae libremente en un medio de neblina. En su caída va capturando moléculas de agua de modo que su masa 1 2.9. Dos cuerpos de masas
104
Problemas del capítulo
aumenta a una tasa constante. Si la partícula es en todo momento esférica, demostrar que su aceleración de caída en la Tierra es de un séptimo de g , donde g es la constante de la aceleración gravitacional terrestre, al nivel del mar. 2.11. Un cohete, con masa inicial m0 asciende verticalmente, impulsado por sus motores, desde el reposo sobre la superficie terrestre. Si consume masa a una tasa constante, demuestre que, despreciando la resistencia del aire, su velocidad vertical en cualquier instante antes de agotar su combustible está dada por la fórmula
m0 , m(t )
v (t ) v0 V ln
(2.99)
siendo m(t ) la masa en cualquier instante t y V la velocidad de los gases eyectados por los motores del cohete, relativa al cohete. 2.12. Un resorte de constante k cuelga del techo. En su extremo inferior tiene adherido un cuerpo de masa m. Si se le estira hacia abajo y luego se le suelta en el instante t 00, comenzará a oscilar. Plantear y resolver las ecuaciones diferenciales para este caso, ignorando la resistencia del aire. 2.13. Dos masas m1 y m2 cuelgan de los extremos de una cuerda inextensible y sin masa que da vuelta sobre una polea, como se muestra en la figura 2.7.1. Si se supone que la masa m2 es mayor que m1 y denotando por X a la distancia desde el centro de la polea hasta la masa m2 encontrar: (a ) La aceleración de las masas (una hacia abajo y la otra de igual magnitud hacia arriba). (b) La tensión de la cuerda (es una fuerza que reacciona al peso). Supóngase que la polea puede girar sobre su eje sin fricción, libremente. Despreciar la resistencia del aire. Este es un ejemplo de una máquina elemental, se le llama la máquina de Atwood . 2.14. Un tabique resbala por un plano inclinado como se muestra en la figura 2.7.2. Si el tabique tiene una masa m y, además de la fuerza debida a su propio peso, existe una fuerza de rozamiento que se opone al movimiento con una magnitud que es proporcional a la magnitud de la fuerza de reacción del plano inclinado sobre el tabique:
105
Newton y su mecánica
X m1 m1 g
m2 m2 g
Figura 2.7.1. La máquina de Atwood: dos masas están unidas
cuerda de longitud l que pasa sobre una polea.
mediante una
ƒ µ N , siendo N la magnitud de la fuerza de reacción, normal al plano y el llamado coeficiente de fricción. Demostrar que hay un ángulo r límite para que el tabique comience a deslizarse, tal que tanθr µ . 2.15. Calcular la fuerza de atracción gravitacional entre un electrón y un
protón, cuando se hallan a una distancia de 0.5 Å (1Å 108 cm) entre sí. Comparar esta fuerza de atracción con la fuerza electrostática que ejercen debida a sus cargas, a la misma distancia. Los valores de las constantes que se requieren son:
G 6.6726 1011
106
m3
s 2
Problemas del capítulo
N
f
C.M.
mg
Figura 2.7.2. Un cuerpo resbala con fricción por un plano inclinado. Se muestran
las fuerzas que actúan sobre él.
me 9.1093897 1031 Kg m p 1837 me e 1.6022 1019 C
∈0 8.8542 1012 2.16. Suponiendo que la Tierra se mueve
F
m
en una órbita circular de radio igual a 149 millones de kilómetros y que su periodo es de 365 días, 5 horas, 42 minutos y 46 segundos, calcular la masa del Sol. 2.17. Una partícula cargada con una carga de 0.5 C y masa de 0.02 kg se mueve con una velocidad
107
Newton y su mecánica
y
3.75m
F 35N 20˚
F 42N
F 25N
2.35m
60˚ 0
x F 18N
Figura 2.7.3. Un cuerpo plano uniforme es actuado por cuatro fuerzas aplicadas. r v 7.5 103 iˆ 0 ˆj 0kˆ
m
s ,
cuando entra a un campo magnético uniforme dado por el vector de inducción magnética r
B 0.27k ˆ [ gauss]. Calcular la fuerza de Lorentz, establecer las ecuaciones diferenciales y demostrar que la trayectoria del cuerpo es helicoidal. 2.18. Calcular la torca que experimenta la partícula cargada del problema anterior cuando pasa por el punto r r 0iˆ 10 ˆj 10kˆ [m].
¿Qué se puede decir del plano de la trayectoria de esta partícula? 2.19. Encontrar el radio vector al centro de masa en el problema anterior y calcular la torca neta total. 2.20. Un cuerpo rectangular uniforme como el que se muestra en la figura 2.7.3 se ve actuado por las fuerzas que se indican. Calcular la fuerza resultante y establecer su punto de aplicación
108
Problemas del capítulo
2.21. Encontrar el centro de
masa del sistema Tierra-Luna, sabiendo que la
masa terrestre es de
m⊕ 5.976 1024 Kg , en tanto que la masa de la Luna es
m⊂ 7.350 1022 Kg , y la distancia media entre ambos cuerpos es de r 3.840 108 m . 2.22. El núcleo de un átomo, inicialmente en reposo, se desintegra espon-
táneamente, emitiendo un electrón con momento lineal de magnitud MeV/C y perpendicular a él se encuentra un neutrino con momento de 1.00 MeV/C (1 MeV es un millón de electrones Volt; es una cantidad de energía, igual a 1.60 1012 ergs. La constante “C ” representa a la velocidad de la luz en el vacío y es igual a 2.99891010 cm/s). ¿En que dirección recula el núcleo, si su masa residual, después de la desintegración, es de 3.901022 gr? ¿Cuál es la energía cinética del electrón?
109
CAPÍTULO 3 LAS ECUACIONES DE MOVIMIENTO 3.1. Trabajo y energía cinética
La estrategia general para resolver problemas de mecánica se estableció desde el principio del Capítulo 1. Es una regla general que es necesario seguir para alcanzar el objetivo final que consiste en obtener las expresiones matemáticas para las llamadas ecuaciones de movimiento. Y si bien esa estrategia es absolutamente simple y directa, muchas veces resulta enormemente compleja, si no imposible de llevarla a cabo, por no mencionar que las fórmulas para la fuerza son escasas. Tratando de hallar nuevos métodos, tácticas más eficaces, más profundas y de alcance mayor, los físicos y los matemáticos, los ingenieros y los químicos, literalmente se han devanado los sesos en los últimos trescientos años. Así, han aparecido reglas, definiciones, teoremas y hasta teorías completas; obras maestras del genio y del talento humanos, con los cuales la mecánica se ha visto enriquecida a escalas difíciles de comprender; al menos para la gran mayoría de la gente. De los primeros atajos, caminos cortos que se ensayaron para intentar arribar a soluciones a partir de las ecuaciones diferenciales originales, trata éste que ahora se explora. Considérese el caso de un solo cuerpo, con una masa constante, que se ve urgido por una fuerza F conocida. De acuerdo con (2.28), las ecuaciones diferenciales que se plantean son las siguientes:
d 2r F m 2 . dt r
r
(3.1)
Se trata, en efecto, de tres ecuaciones diferenciales ordinarias, de segundo orden, en general acopladas (en (3.1) se muestra una sola fórmula,
111
Las ecuaciones de movimiento
pero hay que recordar que es vectorial y por lo tanto contienen en general tres componentes). Un camino que se puede tomar ahora consiste en convertir el sistema de ecuaciones diferenciales (3.1) en una sola ecuación escalar, mediante el • recurso de multiplicarla, miembro a miembro, escalarmente por r ; esto es, por el vector velocidad del cuerpo. Al hacerlo, se obtiene de inmediato lo siguiente: r r ˙ r d r r d r ˙ F ⋅ mr ⋅ . dt dt
O bien, considerando únicamente los elementos diferenciales a uno y otro miembro de la igualdad anterior: 2 1 ˙ F ⋅dr d 2m r . r
r
r
Ahora, integrando entre dos posiciones contiguas de la trayectoria del cuerpo en el espacio:
W (1, 2) T (2) T (1 )
(3.2)
siendo W (1,2) el trabajo desarrollado por la fuerza F para llevar al cuerpo de la posición 1 a la posición 2 en el espacio, y que se define de la siguiente manera:
2
r
∫ 1
r
W (1, 2) ≡ F ⋅ d r .
(3.3)
Por su parte, T (1) o T (2) se definen como la energía cinética del cuerpo, evaluada en 1 o en 2: r
2
T ≡ 12 m v .
(3.4)
Cuatro años después del nacimiento de Isaac Newton, en Alemania, nació el 1 de julio de 1646 Gottfried Wilhelm Leibniz. Fue un ser brillan-
112
Trabajo y energía sinética
te; tanto, que después de sus estudios elementales el resto de su educación media fue autodidáctica. A los ocho años ya leía en latín y algo de griego. Estudió leyes y posteriormente matemáticas. En París conoció a Pascal, quien exhibió una ingeniosa máquina para sumar y restar, de su invención. Leibniz se puso a trabajar en una propia y muy pronto pudo construirla y mostrar la superioridad de su invento, pues ésta multiplicaba, dividía y extraía raíces. Por aquella época, también se dedicó a construir lo que ahora se conoce como el cálculo diferencial e integral. De hecho, la notación que hasta la fecha se usa para denotar una derivada ordinaria o una integral es invención del propio Leibniz. Él publicó su desarrollo, pero ello le acarreó por el resto de sus días más desdichas y sinsabores que los éxitos que hubiese soñado. El terrible Newton lo acusó de haber plagiado una obra suya: el cálculo de las fluxiones y lo persiguió por carta por toda Europa, desprestigiándolo y amenazándolo con llevarlo a la horca si alguna vez ponía pie en Inglaterra, cosa que Newton no dudaría en hacer, pues ya había ahorcado a más de cinco desde su poderosísima posición de Conserje de la Casa de Moneda de ese país. Leibniz, por su parte, se cuidó mucho de jamás acercarse al país de su adversario y eludió toda la vida cualquier probabilidad de caer en sus manos. Todo ese asunto lo llevó a una profunda depresión y a la muerte el 14 de noviembre de 1716. Pero la razón principal por la cual se menciona a Leibniz aquí es porque el autor de la expresión (3.2) fue él. A la fecha se le conoce como el teorema del trabajo y la energía cinética y poca gente conoce el origen de esta expresión. De hecho, Leibniz utilizó la fórmula (3.2) para postular su propia ley de la mecánica; de una mecánica muy parecida en su estructura a la de Newton. Si se observa con cuidado, el teorema del trabajo y la energía es, al igual que la segunda ley de Newton, una relación de causa a efecto; la causa del movimiento es el trabajo que se realiza sobre un cuerpo y éste responde cambiando su energía cinética. Así, ante un agente físico, los cuerpos cambian su estado de movimiento ¡igual que la segunda ley! Pero en tanto que Newton invoca a la fuerza como la causa de ese cambio, Leibniz postula a la función trabajo W . La fuerza es un vector y el trabajo es un escalar; más fácil de manejar que aquella. Además, la segunda ley postula segundas derivadas de la posición (la aceleración), en tanto que el teorema de trabajo y energía cinética propone como respuesta el cambio de esta entidad (vista desde la perspectiva de las ecuaciones diferenciales,
113
Las ecuaciones de movimiento
se trata de una ecuación diferencial de primer orden, sólo que de segundo grado en las componentes del vector de posición) a la función trabajo. En realidad, el teorema del trabajo y la energía cinética es una primera integración de la segunda ley, de manera que buena parte del camino se ha recorrido ya al postularlo; sólo falta una integración. Pensándolo bien, es fácil convencerse que postular el llamado teorema del trabajo y la energía cinética hubiera sido mucho mejor; tendría más ventajas que la segunda ley. Entonces surge la pregunta de por qué la mecánica es de Newton y no de Leibniz; por qué se inicia con un sistema de ecuaciones diferenciales vectoriales de segundo orden y no por una sola ecuación diferencial escalar de primer orden. Por qué, en fin, si posee tantas ventajas se optó finalmente por el esquema de Newton en vez del de Leibniz. La respuesta es simple: la mecánica de Newton es más general. No debe olvidarse que para demostrar el teorema del trabajo y la energía hubo necesidad de hacer una hipótesis muy fuerte, a saber, que se trata de un cuerpo con masa constante. Si se trata de cuerpos con masa variable el teorema ya no funciona. Por lo tanto, aunque más simple y con ventajas sobre la estructura de Newton, el postulado de Leibniz no es tan general. Este hecho cargó las preferencias hacia el británico, en contra del teutón. La energía cinética definida en (3.4) es muy similar a lo que Leibniz había llamado vis viva . En realidad, la vis viva de Leibniz es el doble de la energía cinética. Escrita en coordenadas cartesianas, T tiene el aspecto de derivadas, pues
(
)
T ≡ 12 m x˙ 2 y˙ 2 z˙ 2 ,
(3.5)
de allí que se haya contemplado a (3.2) como una expresión diferencial de primer orden y de segundo grado. En esta representación, se puede ver de la definición que se hizo en (2.23) del vector de cantidad de movimiento o momento lineal, que la energía cinética (3.5) se puede escribir también como r
T ≡
2
p 2m
114
(3.6)
Trabajo y energía sinética
esto es, como el cuadrado de la norma de ese vector, por unidad de masa, dividido por dos. Con esta definición se desea hacer ver que T mide la intensidad del momento lineal, o al menos algo proporcional a ella. A esa intensidad se le dio el nombre de energía cinética . En particular el segundo nombre de “cinético” tiene que ver con movimiento. En los textos se acostumbra “explicar” que (3.5) o (3.6) representa la energía debida al movimiento. Las unidades para la energía son el Joule;
m2 1 J ≡ 1Kg ⋅ 2 ≡ 1N ⋅ m . s Por su parte, la función W es un escalar que pondera la capacidad que representa un agente físico cualquiera para provocar un trabajo, entendido éste como el ejercicio de una fuerza a lo largo de cierto sendero en el espacio euclideo tridimensional. Por supuesto, las unidades de W son también los Joules en el Sistema Internacional. En el caso de una fuerza constante, la función trabajo se puede evaluar con facilidad, al menos desde el punto de vista matemático, pues, de acuerdo con la definición (3.3) se tiene que: r
r
W (1, 2) F ⋅ l 1 → 2
(3.7)
esto es, que el trabajo es simplemente el producto de la fuerza por el sendero recorrido entre el punto 1 y el punto 2, l 1→2. Cuando la fuerza F no es constante; en otras palabras, cuando F cambia de punto a punto a lo largo de la trayectoria del cuerpo, entonces la expresión para el trabajo W ya no se puede calcular fácilmente. En este caso el producto de
r
r
F ⋅ d r
(3.8)
se conoce en las matemáticas como una forma diferencial de Pfa ff. Estas formas, en general presentan serias dificultades para ser integradas por una razón simple: para poder llevar a cabo la integración es preciso conocer punto a punto el camino por el cual se desplaza el cuerpo, para calcular entonces el valor local de la forma diferencial anterior. Sólo así se puede
115
Las ecuaciones de movimiento
conducir este proceso de suma de elementos diferenciales que es la integral. Pero resulta que el camino de integración es, ni más ni menos, que la trayectoria del cuerpo y esto es precisamente lo que se busca conocer mediante las leyes de la mecánica. O sea que dicho camino no se conoce. Y viceversa, si el sendero fuera conocido, entonces no se necesitaría calcular el trabajo, pues el problema estaría resuelto de antemano. Así, una primera integración de las ecuaciones diferenciales ha presentado lo que a primera vista parece ser una barrera infranqueable. Pero el talento humano es más agudo que estos obstáculos… 3.2. Sistemas conservadores
En efecto, el problema de la integrabilidad de la función trabajo definida en (3.3) se puede resolver de manera brillante, al menos para ciertos casos; los llamados sistemas conservadores . El planteo del problema es realmente simple: para que la integral (3.3) pueda realizarse de manera unívoca, es necesario que la forma diferencial (3.8) sea equivalente al elemento diferencial de una función escalar U ; esto es: r
r
F ⋅ d r ≡ dU .
(3.9)
Es obvio que en tal circunstancia, la función trabajo, definida en (3.3) puede ser expresada en forma compacta y clara como
W (1, 2) U (2) U (1 ) ,
(3.10)
en tal caso, no importa cuál sea la trayectoria que sigue el cuerpo en el espacio, pues el trabajo resulta ser igual sólo a la diferencia de la función escalar U , evaluada en los puntos inicial y final de su recorrido. El punto importante ahora es proponer la estructura que debe tener ese escalar U para cumplir con su propósito. Para ello considérese una función V , la cual se supondrá continua y con derivadas continuas de sus argumentos, que será llamada la energía potencial generalizada y que, por hipótesis, se hará depender de la posición y de la velocidad del cuerpo;
116
Sistemas conservadores
V (r , r ˙ ) . r
r
Tomando el elemento diferencial de la energía potencial generalizada se consigue: 3
dV
∂V i ∂V ˙ i i dx i d x ∂ x ˙ i 1 ∂ x
∑
(3.11)
donde las x i son las coordenadas del vector de posición; esto es, se ha hecho la identificación de x 1 por x , x 2 por y y x 3 por z , para poder manejarlas en forma compacta. Los superíndices NO indican potenciación. Ahora se puede manipular el segundo término de la derecha en la expresión (3.11) para poder reducirla:
∂V ˙ i ∂V ˙ i d ∂V i d x d i x i dx i ∂ x ˙ dt ∂ x ˙ ∂ x ˙ con lo cual (3.11) se puede reescribir en una forma diferente pero sugestiva:
3 ∂V i 3 d ∂V ∂V i ˙ i dx . d dt ˙ i i 1 ∂ x ˙ i x V ∂ x ∂ x i 1
∑
∑
(3.12)
Comparando ahora el resultado (3.12) con la expresión (3.9) se puede observar que aparecen semejanzas interesantes. En efecto, si se hacen las identificaciones formales
3 ∂V i dU ≡ d x˙ V i i 1 ∂ x ˙
∑
117
(3.13)
Las ecuaciones de movimiento
y las componentes F i (i 1.2.3) del vector fuerza
F i ≡
d ∂V ∂V ; i 1, 2, 3 i i dt ∂ x ˙ ∂ x
(3.14)
se tiene en (3.12) una relación que coincide con aquella. En estas circunstancias, la función trabajo, definida en (3.3), se puede integrar con sólo imponer los extremos del movimiento. Haciéndolo y recordando el teorema de trabajo y energía cinética de Leibniz, se obtiene finalmente que: 3 3 ∂V ˙ i ∂V ˙ i x T V x . T V i i ˙ ˙ i 1 ∂ x i 1 ∂ x
∑
∑
1
2
Esto es que, evaluada en la posición 1 o en la posición 2, cualesquiera sean éstas, sobre la trayectoria de la partícula, sus valores numéricos deben ser iguales. Y como los puntos 1 y 2 son en realidad arbitrarios, entonces debe concluirse que en cualquier punto de su trayectoria se ha de cumplir que: 3
T V
∑ i
∂V ˙ i x E i ∂ x ˙
(3.15)
o bien, de acuerdo con la identidad (3.13):
T U E .
(3.16)
Siendo E una constante a la cual se denominará en adelante la energía total del cuerpo. Las expresiones (3.15) y (3.16) son las fórmulas para la conservación de la energía total. Lo que (3.15) o (3.16) representa es el resultado de la primera integración de las ecuaciones diferenciales de movimiento (3.1). Debe apreciarse que (3.15) o (3.16) son, en sí mismas, ecuaciones diferenciales también;
118
Sistemas conservadores
sólo que se trata ahora de ecuaciones de primer orden en las componentes del radio vector del cuerpo. Integrando nuevamente se habrá llegado a la meta deseada; esto es, hallar las expresiones de esas componentes en función del parámetro temporal. Estas funciones son las que se denominan ecuaciones de la trayectoria. Por otra parte, (3.15) o (3.16) expresan la existencia de una constante; la energía total E que curiosamente se ha convertido en una de las más importantes de la física. De acuerdo con (3.15) o (3.16) hay movimientos de cuerpos materiales que son “conservadores” ; esto es, conservan la energía total. Se trata de una expresión del balance entre la energía gastada por el cuerpo en su movimiento: la energía cinética y la energía que aún tiene en reserva para, eventualmente, gastarla también: la energía potencial U . No hay manera de excederse, todo cuerpo que se mueve debido a fuerzas conservadoras gasta energía potencial moviéndose o pierde movimiento, ganando energía potencial, pero siempre conservando la energía total E . No hay manera de violar este principio en estos casos. Claro, no todas las fuerzas son conservadoras; esto es, no todas las fuerzas pueden expresarse en términos de un escalar de energía potencial generalizado como en (3.14). Fuerzas que no pueden escribirse en términos de un escalar V como en (3.14) son las llamadas fuerzas no-conservadoras , o también, fuerzas disipadoras . Por supuesto, este tipo de fuerzas no satisface la expresión de conservación de la energía (3.15) o (3.16). Para analizar este caso se puede suponer que sobre un cuerpo dado actúan fuerzas, tanto conservadoras como no conservadoras, de tal suerte que la forma diferencial (3.8) se pueda descomponer en dos partes: r
r
F ⋅ d r dU q;
(3.17)
es decir, una parte (conservadora) que da lugar a una energía potencial U , tal como se propuso en (3.9), más un término adicional que representa la parte disipadora de estas fuerzas y que se ha representado en (3.17) por q . Cabe notar que este término no puede ser una diferencial, pues, por hipótesis, las fuerzas que han dado lugar a él son de las que no pueden resolverse independientemente de la trayectoria del cuerpo. Por el contrario, las fuerzas que han originado el término adicional q son de aquellas que dependen punto a punto del camino que sigue el cuerpo en el espacio.
119
Las ecuaciones de movimiento
Al realizar la integración de (3.17), entre el punto 1), y el punto 2) (cualesquiera que sean éstos), se obtiene entonces
W (1, 2) ∆U Q (1, 2)
(3.18)
siendo Q (1,2) toda la disipación que ocurrió entre esos dos puntos. Se acostumbra definir a esta cantidad como el calor disipado entre los puntos 1) y 2) debido a las fuerzas no-conservadoras (debe entenderse claramente que Q no es en el sentido matemático estricto una integral de q ya que, como se mencionó, la parte disipadora depende del camino de integración). Rescribiendo (3.18) se obtiene, equivalentemente, que:
∆U Q W .
(3.19)
Se aprecia ahora en (3.19) la celebérrima fórmula para la primera ley de la termodinámica , al menos formalmente. Cabe mencionarse, sin embargo, que tal como se ha obtenido, es muy restringida, pues solamente toma en cuenta a la energía potencial generalizada U . En la expresión general y universal para la primera ley de la termodinámica U se refiere al cambio de la energía interna de los sistemas (macroscópicos) termodinámicos. Y si bien la energía interna es también cierta forma de la energía potencial; aquella que poseen los átomos y moléculas de un cuerpo y que se traduce en movimientos oscilatorios, rotatorios y vibratorios de ellas, no es toda la energía potencial que tiene el cuerpo. Por otra parte, si ese objeto se desplaza al través del espacio, entonces también posee energía cinética. Tal como se postula la primera ley de la termodinámica, tiene el siguiente aspecto:
∆E Q W,
(3.20)
siendo E el incremento de la energía total, la cual, a su vez, viene dada por la suma de las energías cinética, potencial e interna del cuerpo. Sin ánimo de profundizar más en este tópico que ciertamente es importantísimo, pues se trata de la ley “más” universal que se ha hallado, aplicándose igualmente a sistemas microscópicos que a galaxias y cúmulos completos y a cerca de doscientos años de haber comenzado a establecerse, primero por Robert Mayer (1814-1878) y posteriormente por James
120
Sistemas conservadores
Prescott Joule (1818-1889), nunca en todo este tiempo ha sido siquiera puesta en duda su validez. Sin abundar más, como se escribió anteriormente, valga sólo el comentario que se trata de un postulado, pero que, al igual que ocurre en muchos ámbitos de la física, es compatible con resultados que se deducen en temas aparentemente inconexos. En todo caso, la primera ley de la termodinámica ha sido deducida de la mecánica clásica, pero deben apreciarse las debilidades de la deducción y, por otra parte, la generalidad de la ley tal como se escribió en (3.20), de modo que no debe caber duda en la mente del lector que en efecto la primera ley es un espléndido postulado. Considérese, como un ejemplo de (3.15); esto es, de un movimiento conservador que satisface la expresión de conservación de la energía mencionada, el caso de una partícula con masa m y con carga eléctrica e , que se mueve en presencia de un campo electromagnético arbitrario, caracterizado por los campos vectoriales E (r ,t ) y B (r ,t ); esto es, el vector de intensidad del cam po eléctrico y el vector de inducción magnética , respectivamente. Como se sabe, la fuerza que actúa sobre la partícula se puede describir de una manera precisa en el vacío, mediante las ecuaciones constitutivas conocidas como la fuerza de Lorentz en recuerdo de quien las sintetizó por primera vez: Hendrick Antoon Lorentz (1853-1928):
r e r˙ r r r ˙ F (r, r, t ) eE (r, t ) r B (r, t ) , c r
r r
(3.21)
siendo c la constante para la velocidad de la luz en el vacío. Ahora bien; los campos E y B a su vez, satisfacen las célebres ecuaciones de Maxwell (James Clerck Maxwell (1831-1879)):
r
1 ∂B rot E c ∂t r
r
div B 0
(3.22 a) (3.22 b)
r
1 ∂E 4π r j rot B c ∂t c r
121
(3.22 c)
Las ecuaciones de movimiento r
div E 4πρ
(3.22 d)
siendo la densidad volumétrica de carga eléctrica y j el llamado vector de densidad de corriente eléctrica . De la ecuación (3.22 b), llamada también la ecuación de la inexistencia de polos magnéticos aislados, pues expresa que toda línea del campo de inducción magnética es necesariamente cerrada, se puede ver que, para que sea satisfecha siempre, debe existir algún campo vectorial A (r ,t ), al que se conoce como el vector potencial magnético, tal que
r
r
r
r
B (r, t ) ≡ rot A(r, t ).
(3.23)
En efecto, sustituyendo (3.23) en (3.22 b) se puede demostrar de inmediato que esta definición del potencial vectorial magnético es consistente, pues la divergencia del rotacional de cualquier vector es siempre nula; i .e.: r
div rot A ≡ 0. Pero si se sustituye la misma definición (3.23) en la ecuación de Faraday , como también se conoce a (3.22 a), en recuerdo de quien la propuso por primera vez: Michael Faraday (1791-1867), se puede expresar como: r
1 ∂ A rot E 0, c ∂t r
en donde se ha hecho uso de la propiedad conmutativa de la derivada parcial con respecto al tiempo, con las derivadas parciales con respecto a las coordenadas. La expresión anterior sugiere de inmediato que una posible solución consiste en suponer que la suma de las funciones que están encerradas dentro del paréntesis puede identificarse con el gradiente de algún campo escalar (r ,t ), al que se conoce como el potencial electrostático escalar ; o bien:
r
r
1 ∂ A(r, t ) E (r, t ) grad φ (r, t ) . c ∂t r
r
r
122
(3.24)
Sistemas conservadores
De esta manera ha sido posible expresar a los campos vectoriales E y B , en términos de los potenciales electromagnéticos y A . Ahora, sustituyendo (3.23) y (3.24) en la fuerza de Lorentz (3.21), se tiene que
r
r
r e ∂ A(r, t ) e r˙ r r rot A(r, t ) . F (r, t ) e grad φ (r, t ) c ∂t c r
r
r
Esta expresión puede reducirse con la ayuda del cálculo vectorial. Existe una fórmula que puede emplearse aquí con éxito; ésta se refiere al gradiente del producto escalar de dos vectores: r
r
r
r
r
r
r
r
r
r
grad (a ⋅ b ) a ⋅ grad b b ⋅ grad a a rot b b rot a . (3.25) Aplicando esta fórmula general al producto escalar del vector velocidad r por el vector potencial magnético A se obtiene, de acuerdo con (3.25): •
r r r r r ˙ ˙ ˙ grad (r ⋅ A ) r ⋅ grad A r rot A . r
(3.26)
Así que usando este resultado (3.26) en (3.24) se consigue ahora: r
e r˙ r e d A ˙ F (r, r, t ) grad eφ r ⋅ A . c dt c r
r r
(3.27)
En donde la derivada total del vector potencial magnético se ha construido, de acuerdo con el cálculo diferencial como: r
r
r d A ∂ A r˙ r ⋅ grad A . dt ∂t
(3.28)
Sea ahora el operador gradiente de velocidad, definido para las componentes cartesianas de la velocidad como:
123
Las ecuaciones de movimiento
∂ ˆ∂ ˆ∂ ˆ gradv ≡ i j k . ∂ x ˙ ∂ y ˙ ∂z ˙ r
(3.29)
Entonces, si y A son funciones de la posición y el tiempo únicamente, es claro que e r˙ r e r gradv e φ r ⋅ A A , (3.30) c c
r
por lo tanto, las ecuaciones constitutivas para la fuerza de Lorentz, en términos de los potenciales electromagnéticos se pueden escribir en la siguiente forma: r d F ( grad v V ) gradV, (3.31) dt r
donde V es la energía potencial generalizada definida anteriormente. En el caso estacionario; esto es, cuando el campo electromagnético externo es independiente del tiempo el escalar V esta dado por:
e r˙ r ˙ V (r,r ) eφ r ⋅ A . c r r
(3.32)
Debe reconocerse que (3.31) escrita, componente a componente, tiene la misma forma que (3.14), así que se trata de las ecuaciones (vectoriales) para una fuerza conservadora en el sentido generalizado, que se discutió anteriormente. Así mismo, de acuerdo con toda esta argumentación, existe una función escalar U ; la energía potencial, definida como en (3.14) y (3.15): r r r r r r r U (r, r˙ ) ≡ V (r, r˙ ) r˙ ⋅ grad V (r, r˙ ) (3.33) r
v
tal que el teorema de conservación de la energía (3.15) se satisface idénticamente con esta energía potencial. En este caso, recordando el resultado (3.30) y de acuerdo con (3.32) se obtiene que
124
Sistemas conservadores
r
r
U (r ) eφ (r )
(3.34)
y la expresión explícita del teorema de conservación de la energía total para el caso de una partícula masiva, cargada eléctricamente, que se mueve en presencia de un campo electromagnético arbitrario, pero en estado estacionario es, según (3.15): 1 m rr˙ eφ (rr ) E . 2
(3.35)
Llama la atención que en la expresión (3.35) solamente aparezca la energía potencial debida al campo eléctrico, en tanto que la contribución debida al campo magnético esté ausente. Este hecho se menciona en muchos textos aduciendo correctamente a que el campo magnético “no trabaja”. Pero una cosa es que el campo magnético, en efecto, no trabaje y otra muy diferente es que no tenga efecto alguno sobre el movimiento de un cuerpo cargado eléctricamente en movimiento. Muy claramente se aprecia en (3.21) que la fuerza experimentada por una partícula tiene contribución, tanto del campo eléctrico, como del magnético. Si se omite este último de la fórmula (3.21) el movimiento resultante será bien diferente. Entonces hay que comprender el resultado (3.35) correctamente. La fuerza magnética que se expresa en la segunda parte de la fórmula de Lorentz (3.21) aparece aquí como un nuevo tipo de agentes físicos. Forma parte de una clase más amplia a la que se les conoce como fuerzas de constricción o fuerzas de ligadura . Éstas se caracterizan precisamente porque los cambios en el estado de movimiento de los cuerpos que provocan, ocurren de manera que el trabajo desarrollado por aquellas es siempre nulo. Como se verá más adelante, estas fuerzas son muy importantes para la ulterior estructuración de la mecánica. Por su parte, para N cuerpos es necesario establecer un sistema de ecuaciones diferenciales vectoriales de movimiento: r
Fi ( a )
∑ j ≠ 1
r
ƒ ji mi r˙˙i ; r
125
i 1, 2, K, N .
(3.36)
Las ecuaciones de movimiento
Siguiendo la misma estrategia que para una sola partícula, es posible convertir cada una de estas ecuaciones vectoriales en una forma diferencial escalar, susceptible de ser integrada, si se multiplica miembro a miembro escalarmente por el vector velocidad de la partícula: r
Fi ( a )
⋅ r˙i r
∑ j ≠ 1
r
ƒ ji ⋅ r˙i mi r˙i ⋅ ˙˙ri ; i 1, 2, , N . r
r
r
K
(3.37)
Ahora, multiplicando por dt e integrando, se obtiene:
Wi ( a ) (1, 2)
W ji (1, 2) ∆Ti ; ∑ j ≠ i
i 1, 2, K, N
(3.38)
donde W i (a )(1,2) es el trabajo desarrollado por la fuerza aplicada que actúa sobre la partícula i -ésima del sistema, para llevarla desde una posición inicial 1 hasta otra posición 2 definido como:
Wi ( a )
2
r
(1, 2) ≡ ∫
r ( a ) Fi ⋅ d ri
i 1, 2, K, N .
(3.39)
1
Igualmente, W ij (1,2) debe entenderse como el trabajo desarrollado por la j -ésima partícula al interactuar sobre la i -ésima del sistema (i ≠ j ), cuando ésta última se desplaza por el espacio desde la posición 1, hasta la 2 . Aquí debe aceptarse que: 2r
∫ 1
r
w ji (1, 2) ≡ ƒ ji ⋅ d ri
i 1, 2, K, N .
(3.40)
Finalmente, en el miembro de la derecha de (3.38) aparece el incremento de la energía cinética de la i -ésima partícula
∆Ti ≡ Ti (2) T i (1 ) donde T i es, por definición:
126
(3.41)
Sistemas conservadores
Ti ≡ 12 mi r˙
r
2
i 1, 2, K, N .
(3.42)
Sumando sobre todos los valores de i se alcanza finalmente la expresión para el teorema del trabajo y la energía cinética, para un sistema de N partículas
W ( a ) w ∆T siendo W (a ) el trabajo total desarrollado por todas las fuerzas aplicadas sobre las N partículas; w es el trabajo debido a las fuerzas de interacción y T es la energía cinética total del sistema. Ésta es igual a la suma de las energías cinéticas de cada una de las partículas, respectivamente:
W
( a )
N
∑ i 1
(3.43)
w ji ∑ j < i
(3.44)
≡
W i ( a )
w≡
T ≡
N
N
∑ ∑ i 1 i 1 Ti ≡
r 2 1 m r ˙ . i 2
(3.45)
Ahora se puede seguir un razonamiento parecido al que sirvió para encontrar la ecuación de conservación de la energía total en el caso de sistemas conservadores. Así, las fuerzas aplicadas pueden ser derivables de un escalar de energía potencial de cada partícula r
Fi ( a ) gradiVi
i 1, 2, K, N
(3.46)
siendo V i esa función escalar que depende de la posición instantánea del i -ésimo cuerpo; i.e.:
Vi ≡ Vi ( xi yi z i )
127
i 1, 2, K, N
(3.47)
Las ecuaciones de movimiento
y el símbolo del gradiente con el índice i significa que la energía de la i -ésima partícula debe derivarse con respecto a las coordenadas de ella misma; esto es, que
∂ ∂ ∂ gradi ≡ i ˆ j ˆ k ˆ . ∂ x i ∂ y i ∂z i
(3.48)
En el caso que ahora se ha considerado, de fuerzas aplicadas conservadoras, las funciones de trabajo correspondientes son integrables, de manera que; de acuerdo con (3.43) se tiene que: 2
( a ) ( a ) W ≡ Fi ⋅ d ri Vi . i 1 1 i 1 1 N 2
r
∑ ∫
N
∑
r
(3.49)
Si, adicionalmente, las fuerzas de interacción mutua entre las partículas ƒ ij fueran a su vez conservadoras, entonces también se les puede asociar una función escalar de energía potencial a cada una de ellas del tipo
(
r
r
v ji ≡ v ji r j ri
)
(3.50)
para garantizar que en todo momento y para cualquiera que sea el par de cuerpos que se considere, se satisfaga la tercera ley de Newton. Estas funciones escalares de energía potencial de interacción mutua entre las partículas deben ser tales que r
r
ƒ ji gradivij grad jv ij ƒ ij .
(3.51)
Por consiguiente, el trabajo neto total desarrollado por las fuerzas de interacción mutua entre las partículas es, de acuerdo con (3.40) y (3.43) 2
w gradivij ⋅ d ri vij j < i 1 j < i 1 2
∑ ∫
r
128
∑
(3.52)
El problema de los dos cuerpos
como puede demostrarse fácilmente. Entonces, la energía potencial total del sistema de N partículas que se mueven debido a la acción de fuerzas conservadoras aplicadas y de interacción mutua es, de acuerdo con los resultados (3.38), (3.40), (3.44) y (3.45)
V≡
N
Vi ∑ v ij ∑ i 1 j < i
(3.53)
así que, nuevamente, se arriba a la expresión para la conservación de la energía total:
T V E
(3.54)
3.3. El problema de los dos cuerpos
Como un caso particular de estudio de un sistema de N partículas, considérese el problema de dos cuerpos ( N 2). Supóngase, para comenzar, que se trata de dos partículas puntuales, con masas m1 y m2, que viajan por el espacio libremente (sin interacción alguna) y que de pronto chocan entre sí, cambiando su trayectoria. Si se supone que el choque es instantáneo, la única interacción que se dio fue durante un brevísimo lapso, así que, para los fines del análisis de este problema, muy bien puede tomarse la situación de los cuerpos antes y después del choque, e ignorar ese instante en el que estuvieron en contacto. A éste, se le conoce en la literatura como el problema de las colisiones elásticas . Así pues, una colisión elástica entre dos partículas es aquella que consiste en una breve pero intensa interacción en la cual, los cuerpos, originalmente libres, vuelven a moverse libremente después del choque, tal como se muestra en la figura 3.3.1. Si los cuerpos viajan antes de la colisión libremente, ello significa que ninguna fuerza actúa sobre ellos. Por lo tanto, de acuerdo con la primera ley, vistos desde un marco de referencia inercial, sus respectivos vectores de cantidad de movimiento son constantes y, por supuesto, la suma vectorial de ellos también lo es:
129
Las ecuaciones de movimiento
r
r
r
m1v10 m2v 20 p (const.)
(3.55)
siendo v 10 y v 20 los vectores velocidad de las partículas antes de la colisión. Por otra parte, puesto que ninguna fuerza actúa sobre las partículas, entonces, de acuerdo con la expresión (3.54) para la conservación de la energía total del sistema, la energía cinética es constante; esto es:
r r2 1 m vr 2 1 m v T 2 1 10 2 2 20
( const.)
(3.56)
donde v 120 es la norma cuadrada del vector de velocidad de la partícula m1 antes del choque. Después de la colisión se da nuevamente la situación de que las partículas se mueven libremente, así que la cantidad de movimiento total del sistema es constante y la energía cinética total también. Esto plantea, como se ve, un sistema de ecuaciones algebraicas simultáneas; la (3.55) y la (3.56) m1 v 1
0
v 2
m2
m1
v 1
v 2
0
m2 Figura 3.3.1. Colisión elástica de dos partículas. El momento lineal y la energía
cinética totales se conservan.
130
El problema de los dos cuerpos
que se pueden expresar de la siguiente forma, considerando un movimiento planar; esto es, en 2-D: r
r
r
r
m1v10 m2v 20 m1v1 m2v2 ,
(3.57)
1 m v2 1 m v2 1 m v2 1 m v2 , 2 1 10 2 2 20 2 1 1 2 2 2
(3.58)
siendo v 1 y v 2 las velocidades de las partículas de la colisión. Factorizando la expresión para la energía cinética total del sistema dada por (3.58), se puede rescribir como:
m1(v1 v10 ) ⋅ (v1 v10 ) m2 (v2 v20 ) ⋅ (v2 v20 ) r
r
r
r
r
r
r
r
pero, de acuerdo con la fórmula (3.57) para la conservación del momento lineal total, el miembro de la derecha de la ecuación anterior se rescribe como:
m1(v 2 v 20 ) ⋅ (v1 v10 ) , r
r
r
r
así que es posible cancelar de ambos miembros los términos iguales. Lo que resulta es lo siguiente: r
r
r
r
v 2 v1 v10 v20 .
(3.59)
Ahora, sustituyendo este resultado en la expresión para la conservación de la cantidad de movimiento total (3.57), se consigue finalmente arribar a un resultado interesante:
m1 m2 r 2m2 r v 1 v v m1 m2 10 m1 m2 20 r
(3.60)
que expresa la velocidad con la que sale disparada la partícula m1 después de la colisión elástica, en función de las masas de ambas, así como de sus velocidades iniciales. Sustituyendo nuevamente en la fórmula para la conservación del momento lineal (3.57) el resultado (3.60), se halla ahora:
131
Las ecuaciones de movimiento
r
v 2
m m1 r 2m1 r v 10 2 v 20 m1 m2 m1 m2
(3.61)
que expresa, así mismo, la velocidad que tendrá la partícula m2 como función de las masas y las velocidades iniciales. Las fórmulas (3.60) y (3.61) son generales y se aplican siempre que se trate de un choque elástico. Dos casos particulares se pueden mencionar aquí: el primero es el de dos cuerpos con masas iguales que chocan elásticamente. En este caso, por hipótesis
m1 m2 , así que, a partir de (3.60) y (3.61) se obtiene que r
r
v1 v 20 r r v 2 v 10 ,
(3.62)
esto es que, después del choque las partículas han intercambiado sus velocidades: la primera posee ahora la misma velocidad que llevaba la segunda y viceversa. El otro caso particular de interés es aquel donde una de las partículas posee una masa mucho mayor que la otra; por ejemplo
m1 >> m2 . En estas condiciones es muy fácil ver de (3.60) y (3.61) que se obtienen los siguientes resultados aproximados:
2m2 2m2 v 1 ≈ 1 v 10 v 20 m m 1 1 r
r
r
(3.63 a)
m2 2m2 v 2 ≈ 21 v 10 1 v 20 m m 1 1 r
r
r
(3.63 b)
en donde se ha tomado la aproximación hasta un primer orden, suponien-
132
El problema de los dos cuerpos
m2 v 2
0
m1m2 v
v 1
0
m1 Figura 3.3.2. Colisión inelástica entre dos cuerpos. Se conserva
lineal y salen despedidos juntos después de la colisión.
el momento
do que las potencias superiores a la primera, de la relación de las masas m2 /m1 son despreciables. Las colisiones inelásticas, por otra parte, son aquellas que no conservan la energía cinética total, aunque la cantidad de movimiento lineal de las dos partículas que interactúan es la misma, antes y después de la colisión; esto es: r
r
(const.)
P0 P
Adicionalmente, si la colisión es absolutamente inelástica, entonces, los dos cuerpos, después del choque, salen despedidos juntos, como si se tratase de un solo cuerpo con una masa que es igual a la suma de las masas de las partículas originales. En la figura 3.3.2, se muestra un diagrama de una colisión absolutamente inelástica. De acuerdo con su definición, si las masas de los cuerpos son m1 y m2 y sus respectivas velocidades iniciales se denotan, igual que en el problema anterior, por v 10 y v 20, en tanto que la velocidad final del cuerpo compuesto es , entonces, se tiene que
133
Las ecuaciones de movimiento
r
r
r
(m1 m2 )v m1v10 m2v20 ,
(3.64)
de tal modo que la velocidad final se conoce de inmediato a partir de (3.64), si las masas y las velocidades iniciales se toman como datos. Nuevamente, en el caso de que las dos masas sean iguales, se tiene que r
r
r
2v v10 v 20
(3.65)
esto es, que la velocidad final es la media de las velocidades iniciales. Si, por el contrario, las masas son diferentes entre sí y una de ellas se supone mucho mayor que la otra; por ejemplo:
m1 >> m2 , entonces, procediendo como en el caso de las colisiones elásticas, hasta primer orden de aproximación en los desarrollos de potencias de la relación m2 /m1, se tiene de (3.64) que r
v ≈ 1
m2 r m2 r v v 20 , 10 m1 m1
(3.66)
lo cual indica que la velocidad a la salida, después de la colisión, prácticamente es igual a la velocidad que llevaba el cuerpo masivo antes de ella. Así, para cambiar la velocidad de un cuerpo masivo como la Tierra, después del impacto de un cuerpo que llegara desde el espacio exterior, como se ha especulado últimamente, se requeriría que la relación de las masas fuese apreciable. Si por ejemplo, se supone que
m2 103 , m1 esto es, que el asteroide fuese una esfera enorme, con un radio de la décima parte del radio terrestre (suponiendo que tiene la misma densidad que la Tierra) y que chocara contra el planeta, perpendicularmente a él con una rapidez igual a la que lleva a lo largo de su órbita, causaría una desviación de menos de una milésima en su trayectoria original. Si bien esto llevaría a
134
El problema de los dos cuerpos
z
C.M. r 1
R
r 2
0
y
x Figura 3.3.3. Dos cuerpos masivos, sus radio vectores y
sus vectores complementarios: el radio vector al centro de masa, R y el vector relativo r 12.
la Tierra a una nueva órbita, tal vez más excéntrica, ciertamente el impacto causaría el aniquilamiento casi instantáneo de toda forma de vida. Pero es necesario pasar en este punto a un nuevo asunto, con relación al problema de los dos cuerpos. Se trata de un tema que tiene gran interés, sobre todo para la gente que estudia dispersión y colisiones de partículas subatómicas; esos fenómenos que se dan en los aceleradores de los laboratorios de altas energías en todo el mundo. Considérense nuevamente a dos cuerpos masivos m1 y m2 que instantáneamente se encuentran ocupando ciertas posiciones en el espacio, señaladas por los vectores de posición r 1 y r 2, tal como se muestra en la figura 3.3.3. Se define el vector relativo r 12, como aquel que en todo momento parte del cuerpo m1 y llega al cuerpo m2. Este vector se define matemáticamente como la diferencia de los vectores de posición
r
r
r
r1 2 ≡ r2 r 1 .
(3.67)
Por otra parte, el vector al centro de masa de ese sistema de dos cuerpos se define, de acuerdo con (2.61) como:
135
Las ecuaciones de movimiento r
r
m r m2r2 R ≡ 1 1 . m1 m2 r
(3.68)
Ahora bien, puede entenderse que las dos fórmulas anteriores son las expresiones para una transformación; un cambio de descripción del sistema de dos cuerpos. Así, originalmente los dos vectores de posición r 1 y r 2 fueron usados para localizar a cada uno de ellos, pero, igualmente es posible estudiar el movimiento del sistema mediante la nueva pareja r 12 y R . La inversa de la transformación dada por (3.67) y (3.68) se puede obtener de estas fórmulas mediante un simple proceso algebraico, obteniéndose lo siguiente:
m2 r r1 R r m1 m2 1 2 r
r
r
r
r1 R
m1 r r 1 2 . m1 m2
(3.69 a) (3.69 b)
En términos de estas expresiones, es posible ahora describir al sistema de dos cuerpos de una manera interesante. Por ejemplo, la energía cinética total del sistema, definida en (3.45) se expresa ahora, como:
T
m m r˙ 2 ˙ 1 (m1 m2 )R 2 1 1 2 r 2 2 m m 12 1 2 r
(3.70)
o bien, si se define la masa del sistema, sencillamente como la suma de las masas de cada uno de los cuerpos,
M ≡ m1 m2
(3.71)
y se le llama la masa reducida del sistema a la media armónica de las masas de cada uno de los cuerpos 1
1 1 , µ m1 m2
≡
136
(3.72)
Campo central
entonces la fórmula (3.70) para la energía cinética total del sistema es
T
r ˙ 12 MR 2 12 µ r˙122 . r
(3.73)
Lo que expresa (3.73) es que en este caso de dos cuerpos masivos que se mueven por el espacio, siempre es posible descomponer la descripción de la energía cinética total en dos términos: el primero da la energía cinética del centro de masa, como si fuera un punto material con la masa total del sistema y el otro es la energía cinética de uno de los cuerpos, como se calcula desde el otro, teniendo la masa reducida . 3.4. Campo central
De todos los casos de fuerzas conservadoras, el más interesante y el más famoso es el llamado campo central . Se trata de una fuerza que no depende de la velocidad del cuerpo. Tampoco depende explícitamente del tiempo. El campo central corresponde a una fuerza de tipo claramente atractiva o repulsiva que actúa a distancia sobre los cuerpos y cuya intensidad depende únicamente de lo cercano o lo alejado que se encuentra del cuerpo del origen de la fuerza. Así, si se sitúa el orto de la fuerza en el origen del sistema coordenado, por razones de sencillez, la fuerza se puede expresar como r
r
r
F (r ) gradV (r )
(3.74)
de acuerdo con (3.31). En este caso, la expresión para la conservación de la energía total es, siguiendo (3.16): 1m 2
˙r 2 V (rr )E . r
(3.75)
Nuevamente, lo que (3.75) representa es una ecuación diferencial de primer orden (la primera derivada del vector de posición de la partícula).
137
Las ecuaciones de movimiento
Se trata de una primera integral de las ecuaciones diferenciales de movimiento (3.1). En sí misma, la expresión (3.75) posee información interesante acerca del movimiento. Tal como se mencionó anteriormente, la fórmula (3.75) da un balance de energía cinética y energía potencial. La partícula posee una cierta cantidad E de energía que puede emplear, bien como energía cinética; es decir, como movimiento, o bien la puede “guardar” en forma de energía potencial, para emplearla luego, pero nunca podrá usar ni más, ni menos que esa energía total E . Al moverse, emplea energía potencial para su movimiento; al disminuir su movimiento, acumula energía potencial. Así, una partícula en presencia de una fuerza conservadora central está obligada a moverse eternamente en algún movimiento que le imprime velocidad o se la resta, pero siempre gastando o acumulando energía potencial de modo que se cumpla (3.75). Pero ¿cómo es ese movimiento? Para contestar a esta pregunta, habría que retomar la expresión (3.75), entendida como una ecuación diferencial de primer orden e integrarla; solamente así será posible conocer finalmente la relación funcional del vector de posición de la partícula con el tiempo, así como los parámetros particulares de la fuerza que lo urge. Más he aquí que esta última etapa, tal como está expresada en la fórmula (3.75), no es posible alcanzarla. La razón es muy simple: desarrollando • r 2 por componentes (cartesianas) se tiene que:
x˙ 2 y˙ 2 z˙ 2
( E V ( x , y , z )) .
Se trata, en efecto, de una sola ecuación diferencial para tres funciones, no lineal. No se puede integrar a menos que se trate de un movimiento en una sola dimensión. Claramente, en un problema unidimensional es posible destrabar el problema y expresar la ecuación diferencial como:
dx dt
2 m
( E V ( x )) .
(3.76)
Ahora sí es posible llevar a (3.76) hasta una cuadratura ; es decir una integral:
138
Campo central x
∫ x
t t 0
0
dx 2 m
( E V ( x ))
(3.77)
siendo x 0 la posición del cuerpo en el instante t 0. Claro, la cuadratura (3.77) puede muy bien ser tan simple que su integración sea inmediata, o puede ser tan complicada que requiera de mucho sufrimiento, de una paciencia de Job y un talento newtoniano para ser resuelta. Puede ocurrir, inclusive, que no sea posible realizar la integración y que en el mejor de los casos, sólo se pueda hacer una burda aproximación para salvar la situación. Al menos, lo que puede afirmarse de (3.77) es que, una vez resuelto el asunto de la integración, se tendrá finalmente que la posición es cierta expresión, cierta función del tiempo, de la masa y del parámetro o parámetros característicos de esa peculiar interacción; es decir:
x x (t , m, K)
(3.78)
así como de las condiciones iniciales. Esta es la ecuación de la trayectoria. Aquí termina el problema matemático y todo lo que resta es trazar la trayectoria en una hoja de papel y compararla con una foto de la trayectoria real, o bien tabular los resultados de (3.78) y contrastarlos con los datos observacionales. Pero regresando al caso general en tres dimensiones del campo central, es de verse que, tal como está expresado en (3.75), no es posible intentar una integración. Sin embargo, es factible hallar una salida colateral que, como se verá en seguida, permitirá acceder a una cuadratura. Esta salida tiene que buscarse en otro orden de ideas; particularmente en la información contenida en las torcas. En efecto, el campo central posee propiedades muy interesantes cuando se estudia bajo la perspectiva de las torcas. Como se vio anteriormente, la torca es aquel vector que se construye como el momento de la fuerza: r
r
r
N ≡ r F .
(3.79)
Si la fuerza es central; esto es, que solamente depende del vector de posición al cuerpo, entonces debe ser claro que, usando un sistema de coor-
139
Las ecuaciones de movimiento
denadas polares , en el cual una de las coordenadas sea precisamente la distancia radial que separa al cuerpo del origen, se debe tener que la fuerza es del tipo r
r
r
F (r ) ≡ F (r )rˆ
(3.80)
siendo r ˆ un vector unitario en la dirección radial, definido como r
ˆr ≡ r r r
(3.81)
y F (r ) es la magnitud de la fuerza radial. Por lo tanto, de acuerdo con (3.79), (3.80) y (3.81) debe ser evidente ahora que en este caso, la torca es nula:
r
N ≡ 0.
(3.82)
Es decir, que para toda fuerza central, la torca es nula. Esto a su vez conduce de inmediato a otro resultado: debido a la ley para la torca y el momento angular expresada matemáticamente en (3.76), se debe concluir para las fuerzas centrales, que el momento angular de los cuerpos es constante en esos casos; esto es r
r r h ≡ r mr˙ const.
(3.83)
a lo largo de su movimiento. Pero, recordando aquella discusión sobre el significado del momento angular que se dio antes, este hecho conduce a afirmar que todo cuerpo que se mueve bajo la acción de una fuerza central, lo hace sobre una superficie de movimiento plana; se trata de un movimiento planar . Aún nada se sabe sobre la trayectoria del cuerpo, pero ahora se ha descubierto que es planar; esto es, que ocurre sobre una superficie 2D, plana. Si esto es así, entonces muy bien puede tomarse en lo sucesivo al plano del movimiento como uno de los planos coordenados; por ejemplo, el plano XOY . Así, un movimiento originalmente entendido como tridimensional, se puede estudiar de ahora en adelante como aquel que queda descri-
140
Campo central
z
r
x
0
y Figura 3.4.1. Plano de movimiento y trayectoria de un
central.
cuerpo en un campo
to solamente con dos coordenadas. La tercera permanecerá nula a lo largo de la trayectoria, tal como se ha escogido el sistema cartesiano. Pero esta veta aún no se ha agotado. El siguiente paso es utilizar ahora una descripción más adecuada para el movimiento. En vez de continuar con el uso de coordenadas cartesianas, conviene explorar las llamadas coordenadas polares . Como se recordará, las coordenadas polares son una distancia radial r y un ángulo , tal como se muestra en la figura 3.4.2. En seguida se establecen las transformaciones (directa e inversa) para relacionar las coordenadas polares con las cartesianas: Directa:
r x 2 y 2
141
(3.84 a)
Las ecuaciones de movimiento
y
p
r
y
0 Figura 3.4.2. Un punto
denadas polares r ,.
x
x
P sobre el plano cartesiano se localiza mediante coor-
y . x
θ arc tan
(3.84 b)
Inversa:
x r cosθ
(3.85 a)
y r senθ .
(3.85 b)
En particular, tomando la transformación inversa (3.85) y derivando miembro a miembro con respecto al tiempo, se ve que:
x˙ r˙ cosθ r θ˙senθ
142
(3.86 a)
Campo central
y
(t t ) r
r
(t )
r
x
0
Figura 3.4.3. Dos radios vectores apuntan a las posiciones sucesivas de una par-
tícula sobre una trayectoria.
y˙ r˙ senθ r θ˙ cosθ
(3.86 b)
así que, elevando al cuadrado cada una de esta expresiones y sumando, se puede demostrar rápidamente que la energía cinética de la partícula es: 1m 2
(
)
(
x˙ 2 y˙ 2 12 m r˙2 r 2θ ˙ 2
)
(3.87)
en términos de las coordenadas polares y sus derivadas temporales. Por su parte, el cambio del vector de posición, cuando se observa a la partícula en dos posiciones sucesivas, se puede descomponer, tal como se muestra en la figura 3.4.3 y 3.4.4, en dos componentes: una radial y otra tangencial: r
r
r
∆r ≡ r r eˆr ∆r eˆθ r∆θ
143
(3.88)
Las ecuaciones de movimiento
e ˆ r
e r r ˆ
r
r
Figura 3.4.4. La diferencia de los vectores de posición se descompone en una
parte radial y otra tangencial.
así que dividiendo miembro a miembro de la igualdad anterior, entre el lapso t que transcurrió para que la partícula ocupara las dos posiciones sucesivas sobre la línea de su trayectoria y haciendo tender este lapso a cero, se obtiene, de acuerdo con la definición de derivada del cálculo diferencial, lo siguiente: r
∆r ˆ ˙ ˆ ˙ e r r eθ rθ . r ˙ ≡ lím ∆t → 0 ∆t r
(3.89)
Ésta es la expresión para el vector velocidad en coordenadas polares. Los vectores e ˆr y e ˆ son unitarios y apuntan, uno en la dirección radial y el otro en la dirección perpendicular a aquella, en el sentido del movimiento del cuerpo. En la fórmula (3.89) se debe reconocer que r • representa la rapidez con que el cuerpo se acerca o se aleja del origen de las coor• denadas; esta es la llamada velocidad radial ; en tanto que representa la rapidez con la cual el cuerpo barre el ángulo a partir del origen. A este ob-
144
Campo central
jeto matemático se le llama la velocidad angular : Cabe hacer notar en este punto que la velocidad radial tiene, en efecto, unidades de velocidad (distancia entre tiempo), en tanto que la velocidad angular debe medirse en • unidades de ángulo (radianes o grados) entre tiempo. Si bien no tiene dimensiones de velocidad, el producto
r θ ˙
(3.90)
sí tiene las unidades de velocidad adecuadas. A este producto se le conoce como la velocidad tangencial del cuerpo. Ahora bien, regresando al estudio del momento angular, en la representación de coordenadas polares se tiene para este caso que:
eˆr eˆθ r r r h ≡ r mr˙ ≡ r 0 mr˙ mrθ ˙
k ˆ 0 0
(3.91)
siendo k ˆ el vector unitario normal a la superficie del movimiento. Entonces, desarrollando el determinante (3.91) se obtiene lo siguiente: r
ˆ 2 θ ˙ . h kmr
(3.92)
Este resultado muestra varias cosas interesantes. En primer lugar, el momento angular aparece como un vector que apunta en la dirección de la línea normal al plano de la trayectoria. Se trata, como ya se demostró, de un vector constante, cuya magnitud h es también una constante a lo largo del movimiento, de modo que, de (3.92) se puede obtener que: θ ˙
h . 2 mr
(3.93)
Según esto, mientras más alejado se encuentra el cuerpo del centro de la fuerza, su velocidad angular disminuye y viceversa. Además, si se conociera la dependencia de la magnitud del radio vector con el tiempo, entonces se podría establecer de inmediato una cuadratura
145
Las ecuaciones de movimiento t
h dt θ (t ) θ 0 m t r 2 (t ) 0
∫
(3.94)
con la cual, una vez integrada, se hallará al ángulo como función del tiempo. Con este acto, el problema quedará resuelto. Finalmente, se puede decir que la fórmula (3.93) exhibe el hecho de que la coordenada angular no es independiente sino que, por el contrario, depende del radio r . En estas circunstancias es posible regresar a (3.75) y expresar la ley de conservación de la energía como:
2 1 m r ˙ 2
h 2 V (r ) E . 2 2 m r
(3.95)
Se trata de una ecuación diferencial ordinaria, de primer orden, en una sola variable. Esta ecuación conduce de inmediato a una cuadratura, como se verá en seguida: r
t t 0
∫ r 0
dr 2 h 2 E V r ( ) 2 2 m m r
.
(3.96)
Así, realizando la integración (3.96) para la función energía potencial V (r ) particular, se obtiene a la coordenada radial r como función del tiempo, de los parámetros dinámicos y de las condiciones iniciales del problema. Esta información, sustituida en (3.94) permite obtener a como función del tiempo y, tal como se mencionó, el problema analítico ha quedado resuelto. Nuevamente, la tabulación y graficación de los resultados y la comparación con los datos experimentales, permitirá decidir si el problema estuvo bien planteado, bien desarrollado y bien resuelto. En caso de hallarse discrepancias habrá de comenzar de nuevo. De hecho, es posible simplificar aún más el procedimiento y en vez de plantear dos cuadraturas: la (3.94) y la (3.96), establecer una sola. Para ello hay que recordar que de acuerdo con los resultados anteriores, r y tienen una relación funcional entre sí, de manera que es posible manipular la derivada de una de ellas, en términos de la otra; esto es:
146
Campo central
r ˙
dr ˙ θ , d θ
o bien, usando (3.93):
r ˙
h d 1 . m dθ r
(3.97)
Así que, sustituyendo (3.97) en (3.95) se obtiene una ecuación diferencial para r y , que ya no exhibe explícitamente al tiempo:
h 2 d 1 1 2 E V (r ) . 2m dθ r r 2
(3.98)
Esta ecuación diferencial conduce de inmediato a la siguiente cuadratura: u
θ θ 0
∫ u 0
du 2m 2 E V u u ) ( ) ( h2
(3.99)
en donde se ha utilizado la llamada variable de Binet ,
u≡
1 r
(3.100)
para facilitar la escritura de la expresión matemática. Una vez integrada, la fórmula (3.99) conduce a una función de la variable radial en términos de la coordenada angular
r r (θ )
(3.101)
conocida como la ecuación de las órbitas . En la teoría newtoniana de la gravitación que se desarrollará extensamente en la sección siguiente se hará uso de la ecuación de órbitas para el potencial newtoniano y se podrán obtener
147
Las ecuaciones de movimiento
las bien conocidas órbitas de diferentes cuerpos celestes. En este contexto se mostrará asimismo, cómo, sin necesidad de integrar (3.96) o (3.99), una valiosísima información acerca del movimiento de cuerpos masivos sujetos a la atracción gravitacional de otro aún mayor, se puede inferir del estudio de la ecuación de la energía (3.95). Por el momento y antes de cerrar este capítulo, vale la pena hacer un último y muy interesante hallazgo en relación con el momento angular de los cuerpos materiales que se mueven bajo la acción de campos centrales. Para alcanzar este último objetivo del capítulo es necesario recordar una propiedad del producto vectorial, a saber que cuando dos vectores se multiplican vectorialmente, el resultado es (en 3 dimensiones) un nuevo vector, perpendicular a los dos primeros y cuya magnitud es igual al área generada por ellos (ver por ejemplo, la figura 1.5.7). Entonces, si se propone el producto vectorial r
r ∆r , siendo r el vector diferencia de dos vectores de posición sucesivos del cuerpo en un lapso t , tal como se explicó en (3.88), se obtiene como resultado el vector normal al plano de la trayectoria, cuya magnitud es, de acuerdo con la figura 3.4.5, el doble del área elemental barrida por el cuerpo a lo largo de ese mismo lapso. Entonces, llamando A al área barrida en ese pequeño intervalo temporal, se tiene que:
1r ∆ A r ∆r r . 2 Pero ahora, con la ayuda de cierto maquillaje matemático, que consiste en dividir miembro a miembro de la expresión anterior por t y someter al proceso de límite cuando t tiende a cero, se ve de inmediato que
dA h dt 2m
(3.102)
como se aprecia fácilmente de la definición de momento angular (2.45). Puesto que el momento angular h es una constante de movimiento para todos los cuerpos que se encuentran bajo la urgencia de una fuerza central;
148
Campo central
r r
r
r
0
r
Figura 3.4.5. El producto vectorial de
r y r genera un área que es el doble de A. Esta es el área barrida por el cuerpo en el lapso t .
la que sea y cualquiera sea su origen, entonces se puede ver de (3.102) que el área barrida por esos cuerpos; por unidad de tiempo, es siempre una constante. O dicho de otra manera: Todo cuerpo material que se mueve bajo la acción de una fuerza central, barre áreas iguales en tiempos iguales en su trayectoria alrededor del centro de la fuerza . Debe reconocerse en el enunciado anterior, la expresión de la famosa segunda ley de Kepler . Bueno, en realidad este enunciado es aún más general, pues en tanto que Johannes Kepler (1571-1630) la formuló dentro del contexto de la teoría planetaria de la gravitación, aquí ha sido demostrada como un resultado general para todos los cuerpos que se mueven bajo la influencia de una fuerza central. Aquel famoso resultado surgió poco a poco, penosamente, casi en contra de la voluntad del astrónomo alemán, cuando se percató de que las órbitas de los planetas no son circulares, como lo había propuesto Copérnico años atrás.
149
Las ecuaciones de movimiento
A la muerte de Tycho Brahe, el 24 de octubre de 1601, Kepler, que había trabajado con él los últimos dieciocho meses, se hizo de las bitácoras donde el danés había anotado las posiciones de los planetas a lo largo de treinta años. Brahe nunca accedió a darle esa información a Kepler por miedo a que éste se le adelantara y publicara su propio sistema del mundo. Así que al morir Brahe, se le presentó la oportunidad a Kepler; mientras los parientes se desgañitaban y arañaban peleándose la pingüe herencia del astrónomo, el teutón se introdujo, por la noche y sin ser visto, al estudio que ocupó Tycho en el observatorio de Benatek, en Checoslovaquia y sustrajo aquellos preciosos documentos. Ya a salvo y en su estudio, Kepler se dio a la tarea de ubicar en un gran pliego de papel las posiciones sucesivas de cada uno de los planetas con referencia al Sol, al que colocó en el centro. Así, con paciencia y esmero fueron apareciendo, una tras otra, las órbitas planetarias. Para su asombro, las trayectorias de los cuerpos celestes alrededor del Sol no resultaron ser círculos. Según sus propias palabras, se trataba de órbitas “oblongas ” (cabe apuntar que Kepler desconocía las elipses en aquel entonces. Poco después, un antiguo profesor que había tenido en la universidad le aclaró el concepto). No se trataba de un error de observación. Tycho Brahe había observado una y otra vez a lo largo de muchos años, con sus instrumentos, los más precisos de la época y con su privilegiada vista, sus datos eran tan exactos como ningunos otros en el mundo. Por su parte, Kepler dibujó veinte veces cada trayectoria y sin excepción, aparecieron en sus pliegos de papel esas “extrañas” órbitas oblongas. Para colmo, el Sol nunca apareció exactamente en el centro de esos círculos achatados, sino que siempre quedó situado a un lado, sobre la línea de los ápsides (la línea de los semi ejes mayores). Muy a su pesar y en contra de todos los argumentos teológicos que aseguraban que las órbitas debían ser círculos, ya que éstos son las figuras perfectas y como Dios creó, entre otras cosas, a los planetas y les imprimió sus movimientos, entonces necesariamente debió haberlos puesto en órbitas circulares, Kepler tuvo que rendirse ante la evidencia observacional: las órbitas que trazan los planetas en el espacio, en su tránsito alrededor del Sol, son elipses. El Sol, se encuentra en uno de los focos de esas elipses; ésta fue su primera ley . Pero no se crea que éste fue el único resultado de su trabajo: los puntos que trazó en aquellas hojas de papel mostraron también otras característi-
150
La teoría newtoniana de la gravitación
A
t
A t Figura 3.4.6. Los planetas describen órbitas elípticas, en uno de cuyos focos está
el Sol. En su tránsito, barren áreas iguales ( A) en tiempos iguales ( t ).
cas notables; una de ellas fue que al pasar cerca del Sol, los planetas apresuran el paso, así que los puntos aparecen más próximos entre sí, en tanto que al alejarse del Sol, caminan más y más lentamente, hasta llegar al punto más distante (el afelio). A partir de allí, nuevamente aceleran el paso y así sucesivamente. Pero esa eterna rutina de aceleraciones y desaceleraciones guarda una armonía, un ritmo preciso; Kepler pudo comprobar, haciendo medidas cuidadosas sobre el papel, que siempre, el planeta, cualquiera sea éste, barre áreas iguales en tiempos iguales. Ésta es su famosa segunda ley . También de sus observaciones surgió la tercera ley; aquella que tiene que ver con los períodos de tránsito alrededor del Sol y su vínculo con los radios medios. Más adelante, al abordar el problema de la gravitación, se regresará a estudiar estos resultados con detalle y amplitud. 3.5. La teoría newtoniana de la gravitación
Con las tres leyes de la mecánica, se puede decir que la estructura fundamental de la teoría está completa. Para 1667, Newton tenía todo este bagaje de conocimientos. Sin embargo, era evidente para él que así, simple-
151
Las ecuaciones de movimiento
mente establecida como una lista de leyes naturales, no iba a ser suficiente para convencer a los remisos ni a cambiar las conciencias de los científicos de su época que tenían sus pensamientos plagados de supersticiones y miedos religiosos. Por otra parte, resolver problemas simples de mecánica tal vez gustase a los académicos, pero no sentía que fuera suficiente. Tenía que demostrar que su modelo podía ayudar a resolver en forma espectacular un problema importante. ¿Qué mejor que aquel viejo problema del sistema del mundo? Copérnico, Tycho Brahe, Galileo y Kepler fueron gigantes que se habían asomado por primera vez al espacio exterior y con actitudes desafiantes se habían hecho por primera vez la pregunta de por qué el mundo es así y por qué funciona de la manera como lo hace, sin temor a sufrir las llamas del infierno por su osadía. Independientemente de si Dios es o no y sin tomar en cuenta lo que puede hacer o deshacer, estos cuatro gigantes quisieron saber por qué. Por qué los planetas están donde están; por qué se desplazan en forma tan armoniosa, tan estable alrededor del Sol; por qué se encuentran a esas distancias unos de los otros; por qué, por qué. Newton decidió montarse sobre los hombros de esos gigantes y caminar con ellos, viendo más lejos, más alto que ningún otro. Llegó a la conclusión de que los fenómenos celestes estaban al alcance de su mano. Para comenzar, propuso que la fuerza que mantiene a los planetas girando alrededor del Sol es la misma que tiene a todas las cosas atadas sobre la Tierra, adheridas a su superficie; ésta es la misma que hace que la Luna orbite a este planeta. La fuerza es la gravitación. Es una interacción que ocurre entre los cuerpos con masa y que ocurre a distancia, sin necesidad de un contacto físico entre ellos y aún, en el más absoluto vacío cósmico, se deja sentir. La fuerza de gravitación es, pues, una interacción universal entre cuerpos masivos. Dados dos cuerpos en el espacio, instantáneamente se establece entre ellos una atracción que trata de unirlos. La fuerza de atracción gravitacional depende de las masas de los cuerpos, así que se puede escribir algo como
F ~ Mm es decir, que depende del producto de las masas M y m. También hay que percatarse que la gravitación depende en forma inversa de alguna potencia
152
La teoría newtoniana de la gravitación
de la distancia que separa a esos cuerpos; mientras más alejados se encuentren entre sí, más débil es la interacción y viceversa. Estudiando las trayectorias; aquellas que Kepler había trazado sobre sus pliegos de papel de estrasa, Newton dedujo, con esa genialidad nunca igualada ni antes, ni después de él, que la relación debía ser de inversos del cuadrado de las distancias relativas entre los cuerpos. Así, situando a uno de ellos en el origen del sistema de coordenadas y colocando al otro en un punto cualquiera sobre el plano cartesiano, a una distancia r del primero, la fuerza de atracción gravitacional debe ser del tipo
F ~
1 . 2 r
Finalmente, la expresión para la fuerza de atracción gravitacional pudo ser sintetizada magistralmente por el genio de Woolsthorpe de la siguiente manera: r
Mm r F G 2 . r r r
(3.103)
Aquí se tiene una ecuación constitutiva ; esto es, una fórmula empíricamente deducida a partir de observaciones, con la cual se representa la interacción gravitacional entre dos cuerpos masivos, con masas M y m, respectivamente, situados a una distancia r entre sus centros de masa. Es una fórmula típicamente central y atractiva; siendo este rasgo distintivo de la gravitación el que se representa en (3.103) mediante el signo menos. La constante G es universal. Se trata de una cantidad que siempre tiene el mismo valor numérico y cuyas unidades son aquellas que dan consistencia dimensional a ambos miembros de la fórmula. Medidas precisas realizadas recientemente, dan como valor de esta constante de gravitación universal el siguiente: 11
G 6.6726 10
153
N ⋅ m2 . 2 (Kg )
(3.104)
Las ecuaciones de movimiento
y m
r
M
0
x Figura 3.5.1. Dos masas, M y m, situadas a una distancia r entre sí, interactúan
gravitacionalmente.
La ecuación constitutiva (3.103) posee interesantes características: por ejemplo, es evidente que se trata de una fuerza central, tal como las que se definieron anteriormente. También se puede observar de inmediato que cumple con la tercera ley de la mecánica, pues, la misma fuerza experimenta el cuerpo de masa m debida al otro; el de masa M , que la que percibe éste debido a la presencia de aquel, sólo que los sentidos de las fuerzas de atracción son opuestos. También es evidente que esta fuerza provoca en un cuerpo una aceleración que es independiente de su masa, tal como lo aseguró Galileo Galilei en sus Diálogos sobre los dos nuevos mundos . Esto último queda claro cuando se usa la ecuación constitutiva (3.103) en la expresión para la segunda ley (2.28). Al hacerlo, se puede cancelar la masa del cuerpo que experimenta la aceleración r M r a G 3 r . r
154
(3.105)
La teoría newtoniana de la gravitación
Así que, recordando aquella célebre anécdota del florentino Galileo Galilei cuando, según alguno de sus biógrafos, subió a lo alto del campanille de la torre inclinada de Pisa, dejando caer a continuación objetos de diferentes materiales, tamaños y consistencias, que fueron a dar con estrépito a los pies de algunos azorados transeúntes, para ratificar su aserto que, sin importar su masa, todo cuerpo cae con la misma celeridad, en contra de lo que la lógica aristotélica afirma,5 se puede observar que (3.105) contiene, en efecto dicho resultado. Finalmente, si se toma en cuenta que la masa de la Tierra es de
M ⊕ 5.9764 1024 Kg
(3.106)
R⊕ 6.3782 106 m
(3.107)
y su radio ecuatorial
entonces resulta que la aceleración que este planeta imprime a todo objeto que se encuentra cerca de su superficie es
g ≡
GM ⊕ m ≡ 9 . 7985 ; 2 2 R ⊕ s
(3.108)
la llamada aceleración de la gravedad terrestre .6 Este es el bien conocido valor de la constante para calcular el peso de los objetos materiales sobre la Tierra. Como toda fuerza central, ésta es conservadora y sólo depende de la distancia del objeto que la experimenta al centro de la fuerza. Es muy fácil demostrar que (3.103) proviene de la energía potencial
V (r )
5
GM r
(3.109)
En verdad, este “experimento” nunca se llevó a cabo. La anécdota fue inventada años después por algún biógrafo exaltado. m 6 El valor que se toma por convención para esta constante es de 9.81 s 2. Este corresponde a un radio medio terrestre de R 6,375106m.
155
Las ecuaciones de movimiento
tal que r
F grad V
(3.110)
de acuerdo con (3.31), o bien, usando la llamada variable de Binet:
u≡
1 r
se tiene que
V (u) GMu . Para calcular las órbitas de cuerpos masivos sujetos a la acción de la fuerza de gravitación (3.103), simplemente se debe sustituir la expresión de esta ecuación constitutiva en la fórmula general que se dedujo en (3.99). Haciéndolo se tiene lo siguiente: u
θ θ 0
∫ u 0
du 2m 2 E GMmu u ) ( h2
.
(3.111)
Ahora, completando el trinomio cuadrado perfecto dentro del radical, en el denominador de (3.111) y factorizándolo, se obtiene de inmediato lo siguiente: θ θ 0
u
1 2 Em 2 h
2 2 4 ∫ G M m u 0
h4
du
2 GMm u 2 h 1 2 2 4 EM G M m 2 h 2 h4
2
.
Tal como ha quedado esta cuadratura, se puede integrar fácilmente, pues se trata de una expresión del tipo
156
La teoría newtoniana de la gravitación
dx
∫ 1 x 2
que da como resultado una función del tipo genérico de arco seno o arco coseno, según el signo que se elija. Escogiendo el signo menos se obtiene entonces: GMm 2 u 2 h θ θ 0 arg cos 2Em G 2 M 2m 4 h 2 h4
u
. u 0
(3.112)
El signo del integrando en (3.111) tiene que ver con el sentido del movimiento del cuerpo alrededor del centro de la fuerza y el hecho de que aparezca uno positivo y otro negativo significa que hay dos posibles soluciones (como debe ser, ya que se partió de una ecuación diferencial de segundo grado). Por lo tanto, escoger uno o el otro signo, en este nivel de desarrollo de la solución es irrelevante. Por otra parte, el valor 0 para el ángulo inicial, a partir del cual se lleva cuenta del movimiento del cuerpo, se puede escoger convenientemente como aquel para el cual u0 (el inverso de la distancia inicial) anula a la función arg cos; i.e.: GMm 2 u0 2 h arg cos 2Em G 2 M 2m4 h 2 h4
0
por lo tanto, la solución a la que se arriba finalmente es la siguiente: 2 Eh 2 1 2 2 3 1 cos (θ θ 0 ) 1 G M m . 2 r h GMm 2
157
(3.113)
Las ecuaciones de movimiento
Pero (3.113) exhibe claramente la misma estructura que la ecuación general de las cónicas, de la geometría analítica del plano, cuando se expresa en coordenadas polares: 1 1 ∈cos (θ θ 0 ) r l
(3.114)
siendo ∈ la excentricidad de la cónica y l el semi lado recto. Así, la ecuación de órbitas que es solución del problema de la interacción gravitacional newtoniana es, ni más ni menos, que aquella para las cónicas. En este caso, la excentricidad de las cónicas gravitacionales está dada, de acuerdo con (3.113) y (3.114) por 2 Eh 2 ∈≡ 2 2 3 1 . G M m
(3.115)
De la misma manera, el semi lado recto es
h2 l ≡ . 2 GMm
(3.116)
Como se recordará de la geometría analítica, la excentricidad de una cónica es un número positivo y es el que determina de qué figura se trata. Así, si la excentricidad es igual a cero, se trata de un círculo; si, en cambio, su valor es mayor que cero, pero menor que uno, se trata de una elipse. A continuación se enlistan estas propiedades: Círculo: ∈ 0 Elipse: 0 < ∈< 1 Parábola : ∈1 Hipérbola : ∈> 1.
158
La teoría newtoniana de la gravitación
Observando con cuidado (3.113) se verá que dentro del radical aparece una expresión donde todas las literales son positivas, a excepción de la energía total E que si bien puede ser positiva, pero también puede adquirir valores negativos, o incluso puede tener el valor cero, dependiendo de la clase de movimiento de que se trate. Se puede ver, adicionalmente que:
i ) La órbita seguida por un cuerpo urgido por la fuerza gravitacional de Newton (3.103) será circular si: G 2 M 2m3 ∈ 0 ⇒ E 0 , 2 2h
(3.117)
es decir, cuando la energía total del cuerpo sea negativa y posea precisamente el valor dado por (3.117) en términos de la masa central M , de la masa del cuerpo que orbita a ese, m y de su momento angular h. ii ) Por su parte, la órbita será elíptica si
G 2 M 2m3 0 < ∈< 1 ⇒ < E1 < 0 , 2 2h
(3.118)
esto significa que, nuevamente, la energía total de la partícula es negativa y está acotada entre los valores que se exhiben en (3.117). iii ) En el caso especialísimo, cuando
∈1 ⇒ E 2 0
(3.119)
y la trayectoria del cuerpo es una parábola. Aquí se puede imaginar que la partícula llega desde el infinito; se acerca al centro de la fuerza a una distancia mínima y luego se aleja nuevamente al infinito. Cuerpos celestes como ciertos cometas que entran al Sistema Solar, provenientes del espacio exterior y después de pasar por las cercanías del Sol, se alejan para nunca más volver, son ejemplos de órbitas abiertas. Sin embargo, para que una trayectoria sea precisamente una parábola, se requiere, como se ve en (3.119) un valor de la ener-
159
Las ecuaciones de movimiento
gía total que sea precisamente cero; ni más, ni menos. Esto es un caso sumamente improbable en la naturaleza. En la inmensa mayoría de los casos, la energía total del cuerpo será, bien un poco menor que cero, en cuya circunstancia la órbita estará acotada (una elipse), tal como se ve en (3.117), o bien, iv ) Puede ser que la órbita sea una hipérbola, cuando
∈> 1 ⇒ E 3 > 0.
(3.120)
Elipses e hipérbolas son las trayectorias que suelen observarse con frecuencia en la astronomía. Círculos y parábolas no. Curiosamente, aquellas órbitas perfectas: los círculos, que durante cerca de dos mil años se supuso que eran los senderos destinados por el Altísimo para los planetas; aquellas trayectorias que suscitaron discusiones y enconos y que llevaron a algunos infelices a la hoguera, o al menos a prisión, resulta ahora, a la luz de la gravitación de Newton que son totalmente improbables. Que alegría debió haber sentido aquel genio inglés cuando al resolver sus ecuaciones resultó que las órbitas de los planetas, tal como la descubrió Kepler casi sesenta años antes, son elipses, en uno de cuyos focos se encuentra el Sol y que barren áreas iguales en tiempos iguales. En particular, las órbitas elípticas tienen un conjunto de características muy interesantes. Así, de la figura 3.5.2 se puede distinguir:
i ) El radio desde el foco (ocupado por el Sol) hasta el planeta es la variable r de (3.113). Este radio es, instantáneamente, la distancia desde el centro del Sol al centro del planeta. ii ) La elipse contiene siempre dos focos; uno está ocupado y el otro está vacante. iii ) La distancia desde el foco ocupado, hasta el punto más cercano de la órbita al Sol es el perihelio. En el caso de que se estudie la órbita elíptica de un satélite de la Tierra, entonces el punto de mayor acercamiento a ella es el perigeo y en un caso general, un cuerpo que orbita a otro, cuando está en ese punto; el más cercano al centro de la fuerza, se dice que se encuentra en el periapsis . iv ) Por el contrario, el punto de mayor alejamiento es, en el caso del sistema planetario, el afelio; en el caso de la Tierra es el apogeo y en el caso general es el apoapsis .
160
La teoría newtoniana de la gravitación
y
r
0
x
Figura 3.5.2. Movimiento elíptico de un planeta alrededor del Sol.
v ) En general, los puntos extremos de la elipse son los ápsides y la distancia entre ambos es el eje mayor “2a” . La mitad de esta longitud; esto es, la distancia del centro de la elipse a un ápside es el semi eje mayor a . Así, si R p es la distancia del foco ocupado al perihelio y R A es la distancia del foco ocupado al afelio, entonces 1 a ( R p R A ) . 2
(3.121)
vi ) El eje menor es la distancia perpendicular al eje mayor que pasa por el centro de la elipse; se denota por b. vii ) La distancia entre los focos es 2c y se puede ver fácilmente que 2c R A R p
(3.121 a)
viii ) La anomalía verdadera es el ángulo medido a partir del periapsis (o perihelio) hasta el punto sobre la órbita, donde se encuentra instantáneamente el cuerpo. En la figura 2.5.2. la anomalía verdadera es el ángulo más 180°.
161
Las ecuaciones de movimiento
De acuerdo con (3.111), la distancia al afelio es cuando se toman 0 y iguales a cero: 1
2Eh 2 1 1 2 2 3 G M m R A h2 2 GMm
(3.122)
en tanto que la distancia al perihelio es cuando 0 es igual a cero, en tanto que adquiere el valor de 180°: 1
2Eh 2 1 1 2 2 3 G M m , R p h2 2 GMm
(3.123)
por lo tanto, los valores de los semiejes mayor y menor se obtienen de (3.122), (3.123) y (3.121), en términos de las masas, la energía total y la magnitud del momento angular. ix ) La excentricidad se define como la relación entre la distancia entre los focos y el eje mayor:
∈
2c . 2a
(3.124)
Como se recordará, la excentricidad, es el parámetro que define a la cónica.
x ) Tomando como punto de partida la ecuación general de las cónicas (3.112), así como la expresión para el semieje mayor (3.122) en términos de los radios apsidales, se puede ver de inmediato que el semi lado recto l puede expresarse en términos de a y de la excentricidad ∈:
162
La teoría newtoniana de la gravitación
a 12
l 1 l 1 (R A R p ) 2 1 ∈ 1 ∈ 1 ∈2
así que, despejando:
(
)
l a 1 ∈2 . Por otra parte, puesto que la interacción gravitacional newtoniana es central, entonces cumple con la segunda ley de Kepler enunciada y demostrada en (3.102). Por lo tanto, si se integra a toda la duración de un periodo de traslación completa sobre su órbita, la expresión (3.102) da como resultado τ
dA hτ dt A dt 2m 0
∫
así que el periodo de tránsito se puede expresar también en términos de los parámetros de la órbita; en particular, recordando que el área de la elipse está dada por
A π ab , se tiene que
m τ 2π ab . (3.125) h De la figura 3.5.3. se puede observar que, por construcción de la elipse a c 2 b2 , así que se puede expresar al semieje menor b en términos de a y ∈ como:
b a 1 ∈2
163
(3.126)
Las ecuaciones de movimiento
P b
F
F
a 2C Figura 3.5.3. Para construir una elipse se usa el hecho de
que todos sus puntos FP es una distancia constante. son el lugar geométrico tal que el segmento 2
de manera que el periodo de tránsito (3.125) es τ 2π a 2 1 ∈2
m h
(3.127)
ahora, de acuerdo con (3.113) y (3.122) se puede ver con gran facilidad que:
a
GMm 2 E
(3.128)
y por lo tanto: 1 ∈2
h 1 m aGM
(3.129)
así que sustituyendo (3.129) en (3.127) se consigue finalmente el resultado:
164
La teoría newtoniana de la gravitación
2
τ
4π 2 µ
a 3
(3.130)
siendo 3
µ ≡ GM⊗ 3.98506 1014 m 2 s
(3.131)
para el caso del Sol y se le conoce como el parámetro gravitacional . Se debe reconocer en (3.130) la expresión matemática de la tercera ley de Kepler , que establece que: El cuadrado de los períodos de tránsito alrededor del centro de la fuerza, es proporcional al cubo de las distancias . Esta ley ha resultado ser de enorme ayuda en astronomía, ya que los períodos de tránsito se pueden observar directamente de los planetas; entonces, mediante la regla (3.130) se calcula de inmediato la distancia al Sol. Muchas de las propiedades esenciales de las trayectorias de cuerpos sujetos a la acción de la gravitación newtoniana pueden ser conocidas sin necesidad de integrar la expresión para la conservación de la energía total (3.75), cuando se sustituye en ella la fórmula para la energía potencial
V (r )
µ m
r
;
(3.132)
la misma que se empleó en la integral (3.111) para las órbitas. Haciendo esta simple operación, la ecuación para la conservación de la energía total adquiere el siguiente aspecto:
l 2 h2 µ m E mr ˙ 2 r 2 2mr
(3.133)
en donde se ha hecho uso de la conservación del momento angular. El segundo sumando a la izquierda de la igualdad en (3.133) se conoce como la barrera centrífuga . En términos generales se puede considerar a la expresión (3.133) como la ley de conservación de la energía total del cuerpo, compuesta por su
165
Las ecuaciones de movimiento
energía cinética radial y una energía potencial efectiva V ef que a su vez está constituida por la suma de la energía potencial gravitacional (3.132) y el término de barrera centrífuga; es decir
h2 µ m Ve f (r ) ≡ 2 r 2mr
(3.134)
siendo este último siempre positivo, en tanto que el otro: la energía potencial gravitacional es siempre negativo, de modo tal que habrá ciertos valores del radio r para los cuales domine la barrera centrífuga, en tanto que para otros, la atracción gravitacional será preponderante. Para ver mejor esta competencia entre ambas funciones, vale la pena hacer una gráfica de las mismas. Ésta se ha dibujado en la figura 3.5.4. Lo que muestra esta figura es la superposición de las dos funciones: la barrera centrífuga (positiva) y la energía potencial gravitacional (negativa). El resultado de esa superposición es la curva que corre entre las dos anteriores, y que exhibe la peculiaridad de tender al infinito (positivo) para valores muy pequeños de la distancia r al centro de la fuerza, para volverse nula y luego negativa a medida que r aumenta. La forma de esta función es como de una concavidad, por lo cual se le conoce como El pozo de la energía potencial . El punto interesante de esta gráfica, y del hecho que la energía potencial efectiva tenga un dominio en el cual es positiva y otro en el cual es negativa en particular, es que para la región positiva, la energía total E debe ser, así mismo, positiva, de acuerdo con (3.133) ya que, por su parte, la energía cinética radial siempre es positiva. Sin embargo, en la región donde la energía potencial efectiva es negativa, (en el semi plano inferior) el valor de la energía total deberá estar acotado por ciertos valores, ya que 1 mr˙2 E V 0 e f 2
(3.135)
esto es, que la energía cinética radial debe ser siempre positiva (o nula). Puesto que V ef es negativa en esta región, entonces se ve de (3.135) que E debe ser, a su vez, negativa, de tal manera que el caso de r • 0 sea la cota inferior de esa desigualdad. En este caso límite, la energía total y
166
La teoría newtoniana de la gravitación
V ef h2 / 2mr 2
0
r
m/r Figura 3.5.4. Gráfica de la energía potencial efectiva
vs la distancia.
la energía potencial efectiva son de la misma magnitud, de modo que el movimiento del cuerpo es aquel en el cual, ni se acerca ni se aleja del centro de la fuerza; se trata de un movimiento circular. En la figura 3.5.5 se ha dibujado de nueva cuenta el pozo de energía potencial; allí se aprecia el caso de que la energía total sea negativa y tenga un valor E 0 que sea igual al valor mínimo de la energía potencial efectiva. Evidentemente, en este caso, la energía cinética radial es nula, de acuerdo con (3.135), de modo que el movimiento del cuerpo es circular y ocurre a una distancia r o del centro de la fuerza. Este caso corresponde al valor dado en (3.117) para la energía total. Por otra parte, si la energía total adquiere un valor E 1 que es negativo, acotado entre
E 0 < E 1 < 0 tal como se muestra en la figura 3.5.6, se puede observar que todos los puntos que se encuentran a la izquierda de la intersección de la curva de energía potencial efectiva con el nivel de energía E 1, igual que todos los
167
Las ecuaciones de movimiento
V ef
r o r
0
E o Figura 3.5.5. El nivel de energía E 0 corresponde al mínimo de la energía poten-
cial efectiva V ef .
puntos que se encuentran a la derecha de la intersección de esa gráfica con el nivel de energía; esto es
r < r p r > r a corresponden a ciertas distancias al centro de la fuerza que están “prohibidas” para la partícula. Es decir, el cuerpo dotado con una energía total E 1 jamás podrá, ni acercarse al centro de la fuerza, más allá de r p, ni alejarse más allá de r a . Esto es así porque para todos estos puntos
E1 < V ef que significa que la energía cinética radial debería ser negativa; lo cual es físicamente imposible, pues implicaría la existencia de velocidades radiales imaginarias, como puede apreciarse de (3.135). Por lo tanto el movimiento de un cuerpo dotado de una energía con valor E 1 solamente puede ocurrir cuando la distancia al centro de la fuerza está acotada entre los valores
168
La teoría newtoniana de la gravitación
V ef
E 3 r p
r a
E 2 r
0
E 1
Figura 3.5.6. Niveles de energía para las cuatro clases de
bajo la acción de la fuerza gravitacional newtoniana.
movimiento de cuerpos
r p r r a estos son los radios apsidales; el radio del perihelio y del afelio, respectivamente, para el caso del Sistema Solar, tal como se describió anteriormente.
r 0
Figura 3.5.7. Correspondiente al nivel de energía E 0, se da la órbita circular, con
un radio r 0.
169
Las ecuaciones de movimiento
r p
r a
Figura 3.5.8. Al nivel de energía E 1 le corresponde una órbita elíptica con ra-
dios apsidales r a y r p.
Este hecho se muestra en la figura 3.5.8. Se trata, en efecto de una órbita elíptica. Considerando ahora un nivel de energía E 2, con valor cero como el que se muestra en la figura 3.5.6, se ve que el movimiento del cuerpo nuevamente se halla acotado por la izquierda. Todos los puntos que sean más cercanos al centro de la fuerza, que el punto de intersección de la curva de energía potencial efectiva con la línea que representa el nivel de energía E 20, son prohibidos para el movimiento, porque implican un valor no físico de la velocidad radial. Por el lado de la derecha ambos, el nivel E 2 y la curva se intersecan en el infinito. Como ya se mencionó, estos movimientos corresponden a cuerpos que llegan al Sistema Solar de allende sus fronteras, tal vez del llamado cinturón de Kuiper, donde se encuentran grandes concentraciones de hielo y polvo cósmico aglutinados, o de más lejos y que por alguna colisión con otro cuerpo, inician de pronto su viaje hacia el Sol. Lentamente al principio pero cada vez más velozmente se acercan al astro rey hasta que pasan rasantes a él a velocidades enormes. Dan la vuelta debido a la atracción gravitacional y se alejan entonces de regreso al infinito. También se hizo la anotación de que en particular, órbitas parabólicas son extraordinariamente improbables, ya que una energía total E 2 que sea exactamente igual a cero parece que nunca se dará en verdad. Pero otras
170
La teoría newtoniana de la gravitación
r a
r p
Figura 3.5.9. Cuando el cuerpo tiene el nivel de energía E 1, el movimiento está
acotado entre dos círculos con radios apsidales r a y r p.
órbitas sí son posibles. Un cuerpo con una energía E 4 positiva sí se puede dar. Nuevamente, son cuerpos que provienen del espacio exterior al Sistema Solar y que de pronto entran al campo de atracción del Sol. Se acercan hasta casi rozar su superficie para salir despedidos con fuerza, de vuel-
r p
r a
Figura 3.5.10. Para un nivel de energía E 30, la órbita es abierta; se trata de
una parábola, con un radio apsidal r p cercano al centro de la fuerza y el otro en el infinito.
171
Las ecuaciones de movimiento
ta a las profundidades del espacio infinito. Una trayectoria así, corresponde a una hipérbola. En este punto es necesario parar, para aclarar algunos detalles que se han soslayado hasta ahora, pero que, tanto desde el punto de vista conceptual, como desde el punto de vista histórico tienen mucha relevancia para comprender profundamente la teoría newtoniana de la gravitación y darle su justo sitio dentro de la ciencia. En primer término es necesario aclarar que el asunto de la gravitación, tal como se ha atacado aquí es de un solo cuerpo, urgido por una fuerza central. La verdad es que se trata justamente de un problema de (al menos) dos cuerpos: un cuerpo masivo, como el Sol, que atrae y pone en movimiento a otro (u otros) menores. Aquí debe hacerse una primera corrección a la teoría. Es necesario considerar dos cuerpos que, de acuerdo con lo que se vio en la sección 3.3, orbitan, ambos, alrededor del centro de masa del sistema. Este será el tema que se desarrollará a continuación. Posteriormente se tratará el otro punto: el hecho de que los cuerpos son macroscópicos; no necesariamente son esferas uniformes de materia, sino, tal vez, cuerpos amorfos que interactúan gravitacionalmente. Finalmente, para concluir con el capítulo, habrá que mencionar un poco, los llamados efectos finos de la gravitación. En efecto, considerando el problema de la gravitación entre dos masas puntuales m1 y m2 en el espacio, observadas desde un marco de referencia inercial, tal como se ve en la figura 3.5.11, la fuerza de atracción mutua es ahora la siguiente:
mm r r F G r 1 2 3 (r2 r 1 ). r2 r 1 r
(3.136)
Es decir, que depende del producto de las masas e inversamente del cuadrado de la distancia que las separa. Para recalcar su carácter central, en (3.136) se ha hecho uso del vector unitario r
r
(r2 r 1 ) r r r2 r 1 que yace sobre la línea de m1 a m2 y apunta en la dirección de esta masa.
172
La teoría newtoniana de la gravitación
z m1 C.M. r 12
r 1
m2
R
r 2
0
y
x Figura 3.5.11. Dos cuerpos, de masas
m1 y m2 interactúan gravitacionalmente.
Recordando aquellos resultados que se obtuvieron en la sección 3.3, cuando se trató el problema general de los dos cuerpos, se ve que es posible usar el vector relativo r 12 para describir la interacción gravitacional (3.136) en forma más compacta:
mm r F G 13 2 r 12 r 12 r
(3.137)
con r
r
r
r12 ≡ r2 r 1 . También debe ser claro que, siendo conservadora la fuerza gravitacional newtoniana dada en (3.137), existe la función escalar de energía potencial del sistema y que ésta debe depender de la magnitud del vector relativo:
mm V ≡ G 1 2 . r 12
(3.138)
Así que invocando a la expresión de la energía total del sistema y tomando la descripción para el sistema de dos cuerpos en términos de los
173
Las ecuaciones de movimiento
vectores al centro de masa y relativo, dada en (3.73), se ve que en este caso se tiene:
l ˙ 2 l 2 mm MR ηr˙12 G 1 2 E r 12 2 2
(3.139)
siendo nuevamente M la masa total del sistema y la masa reducida. Si la única interacción que experimentan los cuerpos es aquella que se debe a su mutua atracción gravitacional y ninguna otra fuerza aplicada los urge, entonces, el •centro de masa del sistema se desplazará por el espacio a una velocidad R uniforme, tal como se vio en la sección 2.6 cuando se estudió la dinámica de un cúmulo de muchas partículas. Por lo tanto, en estas circunstancias, el primer término de la izquierda en la fórmula (3.139) es una constante y puede incorporarse a la energía total E si se hace la definición 1 E * E MR˙ 2 (3.140) 2 siendo E * la energía total gravitacional del sistema. Así, el problema se ha reducido considerablemente, pues ahora sólo hay que abordarlo, como se hizo al principio de esta sección, como el estudio del movimiento de un solo cuerpo que gravita alrededor del centro de la fuerza. Hay que notar, sin embargo, tal como se expresa en (3.139), haciendo uso de la definición (3.140): mm 1 2 η r˙12 G 1 2 E * (3.141) r 12 2 hay que atender a ciertas pequeñas diferencias con el problema tratado anteriormente. En efecto, ahora la energía cinética que aparece en el primer término de la izquierda de (3.141) corresponde a la energía cinética de un cuerpo que tiene la masa reducida del sistema y que se mueve bajo la influencia del campo de energía potencial gravitacional debido a la presencia de m1 y m2. Más aún, de la definición dada en (3.72) se ve que el producto de las masas participantes en esta interacción se puede escribir, en términos de la masa reducida y de la masa total del sistema, como:
174
Movimiento en un campo de fuerza repulsivo
m1m2 ηM ; M ≡ m1 m2
(3.142)
así que el problema es el de un cuerpo con masa que se mueve bajo la acción de otro con masa M (la masa total del sistema). Claramente, el procedimiento para resolverlo es esencialmente igual al que se siguió en el principio de esta sección para el campo gravitacional central anclado en el origen del sistema de coordenadas. Por ello, no merece la pena hacer el desarrollo para este caso nuevamente. El resultado final será que las órbitas que sigue la masa están dadas por: 2E *h 2 1 2 2 3 1 cos(θ θ 0 ) G M η 1 . 2 r 12 h GM η 2
(3.143)
Por supuesto, si la masa de uno de los cuerpos es muy grande, en comparación con la otra, entonces los resultados (3.113) y (3.143) son idénticos. 3.6. Movimiento en un campo de fuerza repulsivo: dispersión de Rutherford
Hay una aplicación física importante que concierne al movimiento de una partícula en un campo central, en el cual la ley de fuerza es del tipo de inverso del cuadrado de la distancia, pero repulsiva. Esta aplicación fue sugerida cuando se iniciaron experimentos para descubrir la estructura atómica de la materia mediante el “bombardeo” de muestras de sustancias conocidas, con partículas nucleares de altas energías, como protones, partículas alfa (núcleos de helio), electrones y otras más. Se observó desde estos primeros intentos, que al hacer incidir sobre una delgada lámina de algún material puro, como el oro, un haz de partículas con carga eléctrica positiva, lo que se daba es un fenómeno de dispersión del haz. Este hallazgo mostró que la materia está constituida por átomos con un núcleo central, positivamente cargado. El haz de partículas cargadas positivamente y disparado a altas energías contra el blanco, se encuentra con los núcleos
175
Las ecuaciones de movimiento
Figura 3.6.1. Un haz de partículas alfa, de alta energía incide sobre una delgada
placa de oro desde la izquierda. Las partículas salen por la derecha del blanco, dispersas. Este es el experimento de Rutherford.
atómicos del material, que también están dotados de una carga eléctrica positiva. Debido a este hecho, ocurre una repulsión eléctrica que desvía a las partículas alfa o a los protones y los obliga a ejecutar una trayectoria hiperbólica, alejándose del núcleo atómico, tal como se ve en las figuras 3.6.1. y 3.6.2. Para tratar este problema, considérese una partícula puntual de carga q y masa m que incide desde la izquierda a alta velocidad y que pasa cerca de otra partícula puntual (el núcleo de un átomo) que se encuentra fija y cuya carga eléctrica es q . De acuerdo con la fórmula de Coulomb, la partícula incidente sufre una repulsión (si ambas cargas son del mismo signo) dada por la magnitud:
F
qq r 2
donde la posición r se mide desde el origen de coordenadas, O (aquí se omite el factor 1/40 por razones de simplificación). De acuerdo con lo visto anteriormente, la ecuación diferencial de órbitas para este caso es la siguiente:
176
Movimiento en un campo de fuerza repulsivo
o
r min
a 0
Figura 3.6.2. Trayectoria hiperbólica de una partícula cargada que se mueve en
el campo repulsivo de otra partícula con carga, en reposo.
d 2u qq u . 2 2 d θ mh
(3.144)
Esta ecuación diferencial se resuelve fácilmente siguiendo los mismos procedimientos que se emplearon para el caso atractivo, gravitacional. Lo que se obtiene es lo siguiente: 2mh 2 E 1 1 2 2 cos(θ θ 0 ) q q 1 . 2 r mh qq
(3.145)
Se observa de la fórmula (3.145), que la excentricidad de esta órbita es
∈≡ 1
2mh 2 E
(qq ) 177
2
>1
(3.146)
Las ecuaciones de movimiento
V ef
E 0 0
r
r min
Figura 3.6.3. Interacción entre una partícula con energía total positiva y un pozo
de potencial. La órbita es abierta.
de modo que se trata de una hipérbola. Esto se puede ver del hecho de que la energía de esta interacción es siempre positiva (en el caso de repulsiones la energía es positiva). Si se dibuja un esquema de potencial efectivo Uef contra distancia r se obtiene un pozo de potencial como el de la figura 3.6.3., y un nivel de energía E que es la línea recta horizontal, por encima del eje de las abscicas (E 0). Este esquema muestra cómo la partícula se acerca desde el infinito hasta una distancia mínima del centro de la fuerza, r min, y luego se aleja nuevamente hasta el infinito. Esto corresponde precisamente al fenómeno de dispersión que se ha ilustrado en la figura 3.6.1 y en la figura 3.6.2. La partícula incidente se aproxima desde una asíntota y luego se aleja siguiendo la otra rama de esta misma figura geométrica. En la figura 3.6.2 se ha dibujado la primera asíntota de modo tal que la partícula viene desde r con un ángulo 0. El valor mínimo de la distancia al centro de la fuerza r min ocurre cuando cos(0)1; esto es, cuando 0. Y puesto que r en 0, entonces, de la fórmula B se ve que la distancia también se vuelve infinita para 20. Por lo tanto, el ángulo entre las dos asíntotas es 2 0 y el ángulo por el cual ocurre la dispersión de la partícula es , dado por φ π 2θ 0
178
(3.147)
Movimiento en un campo de fuerza repulsivo
como se ve en la figura 3.6.2. Más aún, si se toma en cuenta que, a partir de las condiciones iniciales establecidas, se cumple que ε cos θ 0 1
entonces se demuestra de inmediato que φ 2mh 2 E tanθ 0 ≡ cot . ≡ 2 2 2 q q
(3.148)
La fórmula anterior puede usarse para contrastar la teoría con el experimento. El ángulo puede ser medido si, por ejemplo, a la salida del haz se coloca una pantalla luminiscente, que emite destellos luminosos cada vez que una partícula cargada, dispersa, choca contra ella. La carga de los proyectiles así como su energía y su masa también pueden ser conocidas a priori , así que en la fórmula (3.148), la carga de los núcleos atómicos, q puede inferirse despejándola de ella. La única dificultad es evaluar la magnitud del momento angular de las partículas incidentes, h, pero, como se verá en seguida, esta dificultad puede remontarse si se hacen ciertas consideraciones adicionales. Como se sabe, en ausencia de torcas, el momento angular de las partículas es una constante; así pues, la magnitud de esta cantidad es r
r
h ≡ r mν const. a lo largo del movimiento, antes y después de la dispersión (aun en presencia del núcleo, el momento angular es constante puesto que se trata de un campo de fuerza central). Si se calcula el momento angular cuando el proyectil está muy lejos del blanco y se acerca a él con una alta velocidad 0 entonces
h pmν 0 siendo p el llamado parámetro de impacto, igual a la distancia perpendicular desde el origen (que es el centro de la dispersión, donde se encuentra el núcleo atómico) hasta la línea de movimiento original de la partícula, que no es otra cosa que la asíntota izquierda de la hipérbola en la figura 3.6.2.
179
Las ecuaciones de movimiento
Por lo tanto, la fórmula anterior puede volverse totalmente predictiva si se toma en cuenta el parámetro de impacto y se evalúa la energía cinética del proyectil 1 E mν 02 . 2
(3.149)
Tomando en cuenta estas consideraciones se consigue la siguiente fórmula de dispersión:
m 2ν 02 cot 2 2 p . 2 q q φ
(3.150)
Esta fórmula predijo con bastante buena concordancia los resultados experimentales y constituye un triunfo más de la mecánica clásica. 3.7. Inyección en órbita de un satélite artificial
Cabe recordar en este momento que como resultado de la fuerza gravitacional cuya fórmula propuso Newton en el siglo XVII:
Mm r F G 3 r , r r
se obtiene una ecuación diferencial; la que se muestra en términos de la masa reducida del sistema de dos partículas. Resolviendo la ecuación diferencial se arriba a una expresión general para las trayectorias de los cuerpos sujetos a esa fuerza. Es la ecuación de las órbitas
r
∈ d . θ 1 ∈cos
Para situar en una órbita preestablecida a un cuerpo, es necesario calcular cuidadosamente los parámetros iniciales con los cuales se hará el disparo desde un lugar determinado de la Tierra.
180
Inyección en órbita de un satélite artificial
Figura 3.7.1. Un satélite artificial es colocado en una órbita elíptica alrededor de
la Tierra, situada en el foco F; F es el foco no ocupado, O es el centro de la elipse, a el semi eje mayor, b el semi eje menor, c la distancia focal, d el semi lado recto, u es la anomalía verdadera del satélite, es el ángulo del vector velocidad con la tangente en el punto r y v la velocidad.
Si la órbita va a ser una elipse, el centro de la Tierra es necesariamente uno de los focos de esta cónica; el foco ocupado. El disparo inicial del cohete portador deberá hacerse a cierto ángulo 0: la llamada anomalía verdadera inicial, que es ese ángulo que se mide con respecto a la dirección del perigeo; esto es, el punto de máximo acercamiento de la órbita a la Tierra. Normalmente los cohetes se disparan hacia el este, debido a que en esa dirección gira la Tierra, así que al momento del disparo el cohete lleva, aparte de la velocidad que sus motores le imprimen, una buena componente de velocidad adicional debida a la rotación de la Tierra. Por alguna razón se puede dar el caso que se desee poner a un cuerpo en una órbita retrograda; esto es, que el cuerpo recorra su camino en sentido opuesto a la rotación terrestre. En tal caso habrá que lanzarlo con una dirección inicial hacia el Oeste. Sin embargo, en este caso habrá que hacerlo de modo que el efecto de rotación de la Tierra se anule. Esto significa necesariamente el gasto de mucho mayor combustible para dar al cuerpo una energía extra que cancele esa velocidad inicial. Es por esta razón que las estaciones de lanzamiento de cohetes; todos los astródro-
181
Las ecuaciones de movimiento
Los parámetros de la órbita son:
Origen de la elipse : O Foco ocupado por la Tierra : F Foco vacío: F Directriz de la elipse : DD´ Línea apsidal : AA Semi eje mayor : a Semi eje menor : b Distancia focal : c Excentricidad : ∈ Distancia del foco ocupado a la directriz : d Anomalía verdadera : Ángulo de vuelo: Vector de posición del satélite : r y
r 0
F
0
r p
x
Figura 3.7.2. La anomalía verdadera inicial 0 es el ángulo al que se debe lanzar
el cohete para que entre en órbita. r 0 es el radio vector de posición para la inyección en órbita. El origen de este sistema de coordenadas es F ; el foco ocupado de la elipse. r p es el radio vector al perigeo.
182
Inyección en órbita de un satélite artificial
0
0
0
r 0
F
r p
Figura 3.7.3. Condiciones iniciales para la inyección en órbita de un objeto lanza-
do desde la Tierra; en el foco ocupado, F .
Velocidad inicial de inserción en la órbita: 0 Ángulo inicial de vuelo: 0. Vector de posición para la inyección en órbita: r 0 Anomalía verdadera inicial: 0. Radio vector al perigeo: r 0.
mos y cosmódromos, de preferencia deben ubicarse lo más ecuatoriales que sea posible, para aprovechar el giro de la Tierra al máximo y lo más cercanos a la costa oriental que se pueda, para que al hacer los lanzamientos y al caer a Tierra los desechos, no pongan en peligro a los humanos. Así pasa con cabo Cañaveral o con la Guyana Francesa. Si México construyera una estación para el lanzamiento de cohetes, debería hacerlo en un sitio que estuviera al sur; lo más al sur que fuese posible y al este; lo más al este que se pudiera. Esto último es imposible, desgraciadamente, debido a que más allá de las costas orientales del país existe una enorme cantidad de islas pequeñas y grandes que estarían en la ruta de descenso de los cohetes disparados desde México y que quedarían en situación de gran peligro si se diese el evento de abortar un despegue o simplemente al caer los desperdicios de cada lanzamiento. No es posible, en definitiva, situar una estación de disparo de cohetes en punto alguno sobre la vertiente oriental del país.
183
Las ecuaciones de movimiento
Hay sin embargo, un punto extraordinariamente interesante que podría servir estupendamente al propósito de construir un cosmódromo mexicano, que cuenta con las características precisas para ese objetivo: en primer lugar, está situado muy cerca del Ecuador; a 10° de latitud norte, de manera que allí, la rotación terrestre casi es la máxima que se puede tener; del orden de unos 1400 Km/hr hacia el oriente y que serviría como velocidad adicional para los cuerpos que se deseara situar en órbitas directas o derechas. Por otra parte, se trata de una isla; una pequeña isla en el océano Pacífico a unos mil doscientos kilómetros de la costa occidental de México más cercana, cuyas coordenadas son 10°17’N, 109°13’ W, de modo que los disparos podrían hacerse con mucha seguridad hacia el oriente, sin el peligro de afectar con los detritos a otros países o comunidades humanas. Se trata de la isla de Clipperton. Esta pequeña cresta de tierra que emerge desde el fondo marino por encima del nivel medio del océano Pacífico es la isla más occidental y la más austral del país. Estuvo habitada desde finales del siglo XIX y hasta la segunda guerra mundial por una veintena de familias mexicanas que trabajaron allí con ahínco y dedicación, edificando una pequeña colonia de pescadores y agricultores; en condiciones verdaderamente heroicas con apenas el mínimo apoyo de las autoridades del gobierno mexicano. En la segunda gran guerra, Francia utilizó la isla como una base donde acumuló pertrechos bélicos y maquinaria pesada. Al finalizar el conflicto armado, los franceses aparentemente se retiraron de la isla, dejando una gran cantidad de desechos: maquinaria, armamento y chatarra que con el paso del tiempo se ha convertido en un montón de óxido inútil. Desgraciadamente, a partir de entonces y tal vez por derecho de conquista (¡!), Francia tiene por suya esa isla, cuando en la realidad y desde hace más de tres siglos, pertenece a México. En todo caso, considérese el caso que en aquella isla perdida en el océano pacífico; tan pequeña que no aparece en los mapas; tan insignificante que ni siquiera en los libros que sobre el territorio mexicano ha editado el propio gobierno, aparece mención alguna a su presencia; que en esa diminuta isla, México tuviera una base para hacer lanzamientos de cohetes que permitiesen poner en órbitas bajas, artefactos para percepción remota del territorio y los mares continentales. En tales circunstancias habría que calcular con sumo cuidado y con anticipación el despegue, el vuelo inicial y la inyección en órbitas precisas,
184
Inyección en órbita de un satélite artificial
v
0
r 0
0
F
r p
Figura 3.7.4. Un objeto se inyecta en una órbita elíptica. Se lanza desde la
base espacial en la isla de Clipperton, México (aprox. 10°N, 105°W), donde está el foco F .
los cuerpos que habrán de servir al ser humano en el espacio, tal como se menciona al principio de este relato. Para establecer estas cuestiones con precisión, habrá que situar a priori el punto del espacio donde se dará el perigeo de la órbita; esto es, el punto de mayor acercamiento del cuerpo a la Tierra, una vez que se encuentre en su órbita. Hacia esa dirección habrá que tender el radio vector; al perigeo r p como el que se ha dibujado en las figuras (3.7.2), (3.7.3) y (3.7.4). Con respecto a este vector, una vez establecido, se tenderá otro; el radio vector al punto de inyección del cohete en su órbita r 0 y se determinará con gran cuidado y precisión el ángulo que estos dos vectores: r p y r 0, forman entre sí. Este es el ángulo 0 que se muestra en las figuras. Adicionalmente y para completar las condiciones iniciales para la inyección a órbita, es necesario establecer el ángulo de vuelo inicial. Este parámetro es el ángulo que formará el vector de velocidad inicial del cuerpo en órbita,
185
Las ecuaciones de movimiento
v 0 con la normal al vector de posición inicial r 0, en el punto de inyección. Se acostumbra denotar por 0 al ángulo inicial de vuelo. A partir de estos datos iniciales, la órbita queda completamente determinada, como se verá en seguida. En particular, la excentricidad de la cónica se podrá calcular. De la fórmula general para las cónicas que se obtuvo como resultado de la integración de las ecuaciones diferenciales de movimiento, para el caso gravitacional newtoniano, dada anteriormente;
1 1 ∈cos θ r l
(3.151)
2 Eh 2 ∈≡ 1 2 2 G M m
(3.152)
h2 l ≡ ∈d GM
(3.153)
donde la excentricidad es:
y el semi lado recto:
se ve fácilmente que para 0, la distancia al perigeo es r p tal que:
h2 r p (1 ∈) GM
(3.154)
así que regresando a la expresión general para las cónicas, escrita anteriormente, se puede rescribir como: 1 1 ∈cos θ . r r p (1 ∈)
(3.155)
Por otra parte, la magnitud de la proyección de la velocidad inicial, 0, escrita en términos del ángulo de vuelo inicial es
186
Inyección en órbita de un satélite artificial
v0 cos β0 r 0θ ˙0
r 0
(3.156)
ya que se trata de la componente tangencial de la velocidad. La otra componente de la velocidad inicial también se puede encontrar de inmediato:
d 1 MG ∈ senθ 0 (3.157) r d θ r v β cos θ θ 0 0 0 0
v0 sen β 0 ≡ r˙0 h
en donde se ha hecho uso de las dos fórmulas anteriores. Regresando a la penúltima fórmula anterior, es posible despejar al momento angular h; así que, con la ayuda de la ecuación de órbita, se obtiene en forma directa, la siguiente relación:
r0v 02 cos 2 β0 ≈ 1 ∈cos θ 0 . MG
(3.158)
Entonces de estas dos últimas fórmulas es posible despejar una expresión que ya no contenga a la excentricidad ∈ y que la dependencia de la anomalía verdadera inicial 0 en términos del ángulo de inyección 0 sea la siguiente:
r0v 02 MG sen β0 cos β 0 tan θ 0 . 2 r0v 0 2 MG cos β 0 1
(3.159)
Ahora sumando los cuadrados de ∈sen0 y ∈ cos0, se obtiene una fórmula para la excentricidad:
∈
r0v 02 r0v 02 2 0 1 cos 1 2 . MG MG
187
(3.160)
Las ecuaciones de movimiento
Finalmente, comparando esta expresión, con la que se obtuvo en general para la excentricidad, se ve que:
Er 0 r0v 02 1 , MG 2 MG
(3.161)
que da una fórmula para la energía total E , por unidad de masa del cuerpo, en función de los parámetros de inyección al concluir la combustión. En particular, si 00, entonces, θ 0 0 ,
(3.159 a)
r0v 02 1. ∈ MG
(3.160 a)
En este caso, una órbita circular ( ∈0) se daría si
r0v 02 1. MG
(3.161 a)
La órbita será elíptica cuando
r0v 02 <2 1< MG
(3.162)
y será una hipérbola que escape de la Tierra para valores mayores que dos de r 0v 02/ MG . La velocidad de escape es precisamente cuando este cociente es igual a 2. En cualquier caso, basta con la velocidad y la posición del cohete, en el punto en el que termina la combustión, para tener la excentricidad y la energía total que debe tener el cuerpo en la órbita. De hecho las cosas son al revés, pues lo primero que se hace normalmente es establecer la órbita y a partir de los valores de ∈ y E se obtienen la posición y la velocidad al término de la combustión. Con estos valores se procede a diseñar el portador; esto es, el cohete que, con la carga deseada, cumpla con estas especificaciones.
188
Inyección en órbita de un satélite artificial
3.7.1. Los parámetros keplerianos
Pero no se vaya a creer que con el conocimiento de la excentricidad y de la energía ya se sabe todo lo necesario para poner un objeto en el espacio, en una órbita predeterminada. Aún hay varias incógnitas por despejar antes de dar la orden de partida. En general, dentro del ambiente espacial se dice que es necesario especificar los llamados parámetros keplerianos de un cuerpo en órbita, o también se les refiere como los elementos orbítales clásicos . Se trata de un conjunto de seis parámetros que se requieren para especificar totalmente las órbitas de los cuerpos que viajan alrededor de la Tierra. Básicamente estos parámetros keplerianos permiten determinar cuatro características importantes de una órbita: su tamaño, su forma, su orientación y la localización instantánea del satélite en la órbita . Algunos de los parámetros han sido estudiados ya en secciones anteriores de este libro, pero es interesante traerlos aquí a colación para tener una idea unificada de estas cuestiones. El tamaño de la órbita queda dado con el semie je mayor de la elipse (aquí solamente se considerará el caso de órbitas cerradas), descrito mediante la literal a . La forma de la órbita, a su vez, se establece con un solo parámetro: la excentricidad ∈. Por su parte, la orientación requiere de tres parámetros: los dos primeros deben dar la orientación del plano de la órbita en el espacio y el tercero debe informar acerca de la orientación de la órbita misma en ese plano. Con éste, se tienen en total cinco parámetros. El sexto es el que da la ubicación del cuerpo en su órbita. A continuación se estudian los parámetros keplerianos. 3.7.2. Tamaño de la órbita
Para estudiar el tamaño de la órbita es necesario retroceder un poco y ubicarse de nuevo en la ecuación diferencial de órbitas que se obtuvo en (3.144) como resultado de la fuerza gravitacional de Newton. Como se recordará, esta ecuación diferencial tiene la siguiente estructura: ν2
2
µ
r
189
e
(3.163)
Las ecuaciones de movimiento
donde es la magnitud de la velocidad instantánea del cuerpo en órbita. La letra griega se emplea muchas veces para denotar el producto de la constante gravitacional G por la masa de la Tierra M 3 m3 14 m µ ≡ GM 2 3.986005 10 2 s s
(3.164)
y se le llama el parámetro gravitacional y e es la energía total por unidad de masa, del cuerpo que se estudia. Por supuesto, r es la distancia desde el origen del sistema coordenado hasta el lugar que ocupa instantáneamente el cuerpo sobre su órbita. Por otra parte, el vector de momento angular del cuerpo, por unidad de masa es r
r
r
h ≡ r v
(3.165)
y según se recordará, se trata de un vector constante en el caso newtoniano. Por otra parte, es posible evaluarlo en cualquier lugar de la trayectoria del cuerpo; en todos tiene el mismo valor. Así por ejemplo, si se evalúa en el perigeo orbital, se tiene que: (3.166)
h r pv p
ya que en este punto los vectores de posición (r p ) y de velocidad (v p ) son perpendiculares. La velocidad del cuerpo en el perigeo se puede despejar entonces, en términos de r p ; así que
h2 2 v p 2 r p
(3.167)
sustituyendo este resultado en la fórmula para la energía que se escribió anteriormente, cuando las variables son calculadas en el perigeo, da como resultado: h 2 µ e . (3.168) 2 2r p r p
190
Inyección en órbita de un satélite artificial
Por otra parte, la ecuación de las cónicas se puede escribir como: 1 1 ∈c cos θ , 2 r a 1 ∈
(
)
(3.169)
siendo, como de costumbre, a la longitud del semi eje mayor. Este resultado se halla simplemente, recordando que el semi eje mayor de una elipse es la medida de las distancias apsidales; esto es:
a 12 (ra r p ) ,
(3.170)
siendo r a la distancia desde el foco ocupado hasta el apogeo de la elipse. Y como perigeo y apogeo corresponden al caso en que 0 y , respectivamente, entonces de la ecuación de órbitas se obtiene de inmediato que el semi lado recto de la elipse, en términos del semi eje mayor y de la excentricidad, es
(
)
l a 1 ∈2 ,
(3.171)
que es lo que aparece en el denominador de la ecuación anterior. Ahora, si en ella se hace 0 (perigeo) se obtiene que
r p a (1 ∈).
(3.172)
Pero el semi lado recto l aparece en la fórmula original de la ecuación de órbitas como:
l
h2 µ
,
(3.173)
así que comparando las dos expresiones que se tienen para este mismo parámetro, se consigue ahora que:
(
)
h 2 µ a 1 ∈2 .
191
(3.174)
Las ecuaciones de movimiento
Por lo tanto, la ecuación de órbitas puede rescribirse en función fun ción de los resultados anteriores como:
(
µ a 1 ∈2
2r p
) µ e r p
(3.175)
o lo que es equivalente:
(
µ 1 ∈2
)
2a (1 ∈)
2
µ
a (1 ∈)
e .
(3.176)
De donde, haciendo un poco de álgebra simple, se encuentra
e
µ
. 2a
(3.177)
Esta relación es muy importante y muestra que la energía total por unidad de masa, a lo largo de una órbita elíptica, es inversamente proporcional al semi eje mayor; mayor; esto es, al tamaño de la órbita. órbita. Órbitas pequeñas pequeñas requieren gran energía e y viceversa. Esto se debe a que, de acuerdo con la tercera ley de Kepler, órbitas pequeñas deben tener periodos pequeños de revolución, así que los cuerpos situados en estas órbitas son muy rápidos (gran energía cinética). Por el contrario, un cuerpo en una órbita grande, requiere poca energía por unidad de masa, por la misma razón, ya que su periodo es grande. Curiosamente, si se desea cambiar de una órbita pequeña a una órbita mayor, mayor, lo que es necesario hacer es frenar al cuerpo. 3.7.3. La forma de la órbita
El segundo elemento orbital clásico o parámetro kepleriano es aquel que determina la forma de la órbita. Éste ya fue definido, se trata de de la excentricidad ∈ y como se ha visto, se define en términos de la energía y el mo-
192
Inyección en órbita ó rbita de un satélite artificial
mento angular, angular, o bien en función de los valores iniciales de inyección: la posición inicial r 0 y la velocidad inicial 0, así como del ángulo inicial de vuelo 0, tal como se muestra en (3.160). (3.160 ). Para determinar la orientación es necesario establecer tres parámetros keplerianos; dos de ellos tienen que ver, como ya se mencionó, con la orientación del plano orbital en el espacio y el último es para determinar la orientación del satélite en su órbita. 3.7.4. Orientación Orientación del plano orbital en el espacio
Esta cuestión se resuelve, naturalmente, cuando el plano de la órbita se compara con un plano patrón; esto es, un plano de referencia. Tal Tal plano de referencia es normalmente aquel que tiene como origen al centro de la Tierra y que es perpendicular al eje de cotas que coincide con la línea imaginaria que cruza al planeta de sur a norte; nor te; el eje polar. Este plano es el plano ecuatorial terrestre. Entonces la orientación del plano orbital debe hacerse con respecto al plano ecuatorial terrestre. En la figura 3.7.5 se ilustra el plano orbital y su relación con el ecuatorial. Para medir esta orientación se toman los ejes perpendiculares a estos planos y se comparan. Así, el eje perpendicular del plano orbital, que en la figura 3.7.5 se ha designado por h (la misma literal que en el momento angular del satélite), forma un ángulo i con respecto al eje perpendicular perpendicular al plano ecuatorial ecuatorial terrestre; terrestre; se trata por supuesto, supuesto, del eje polar; el eje de las cotas que en la figura 3.7.5 se ha denotado por z . Si el vector unitario en la dirección del eje de las cotas del sistema ecuatorial terrestre se denota, como es costumbre por k ˆ, entonces, la magnitud del ángulo de inclinación i del plano orbital se puede medir sencillamente mente mediante mediante la siguiente fórmula: fórmula:
r ˆ 1 k ⋅ h i cos h
(3.178)
donde h es el vector de momento angular específico del satélite en su órbita, cuyas unidades son m2/s y corresponde a la dirección normal al plano orbital para una órbita kepleriana, como ya se mencionó.
193
Las ecuaciones de movimiento
z h
i perigeo
0
x
apogeo l a t a t i b r o o n a a p l
Figura 3.7.5. El plano orbital del satélite tiene cierta orientación relativa al plano
ecuatorial terrestre. Si h es el eje de las cotas perpendicular al plano orbital, orbital , la inclinació naciónn es el ángulo ángulo i que hay entre éste y el plano ecuatorial terrestre.
3.7.5. Orientación de la órbita
El cuarto parámetro kepleriano es aquel que da, en efecto, la orientación de la órbita. Nuevament Nuevamente, e, para hablar de orientación orientación se debe aclarar con resrespecto a qué dirección para que el término tenga sentido. sent ido. Volviendo al plano ecuatorial terrestre, hay una dirección que se puede establecer como fija. El eje de las abscisas de este plano, debe ser obviamente, perpendicular el eje polar OZ y además debe estar sobre el plano ecuatorial mismo y apuntar a cierto lugar del espacio que sea fácilmente observable. ble. Este Este es el punto vernal equinoccial (). El día 21 de marzo, es el equinoccio de primavera. En ese día la Tierra Tierra está en una posición especial y aunque se ha venido desviando con el tiempo, a las cero horas de ese día, mirando al cenit, era posible observar la
194
Inyección en órbita ó rbita de un satélite artificial
z
plano
ecuatorial
Figura 3.7.6. El punto vernal equinoccial ( ) está en la dirección de la conste-
lación de Aries ( ) y se observa en el cenit, la media noche del 21 de marzo. Esta es la dirección que se ha adoptado para el eje de las abscisas del sistema coordenado geocéntrico. geocéntrico.
constelación de Aries si se hacía desde el ecuador terrestre. Ese es el punto vernal equinoccial. Mirando a ese punto se puede, en efecto, trazar una línea imaginaria que parte del centro de la Tierra Tierra y apunta en esa dirección. Esa línea constituye el eje de las abscisas del sistema geocéntrico como se ve en la figura 3.7.6. Ahora, Ahora, también también es posible posible imaginar imaginar que el el plano plano de la órbita órbita del del satélisatélite interseca al plano ecuatorial ecuatorial terrestre terrestre en una línea recta recta que pasa por el centro de la Tierra, Tierra, como se ve en la figura 3.7.7. 3. 7.7. Esta es la línea de nodos (l.n.). El ángulo que forma la línea de nodos ( l .n.) con el eje de las abscisas del sistema coordenado geocéntrico se conoce como longitud del nodo ascendente y se denota por la letra . Es necesario apuntar que la longitud del nodo ascendente debe medirse desde el eje de las abscisas del plano
195
Las ecuaciones de movimiento
z perigeo
l.n.
apogeo Figura 3.7.7. El plano orbital y el plano ecuatorial terrestre se intersecan en la
línea de nodos ( l .n.). El ángulo que forma el eje de las abscisas del sistema geocéntrico con la línea de nodos se conoce como la longitud del nodo ascendente y se denota por .
ecuatorial terrestre hasta aquel segmento de la línea de nodos que interseca al plano de la órbita del satélite, cuando éste emerge rumbo hacía su perigeo. Esta aclaración es pertinente ya que por el otro lado, cuando el satélite ha pasado por su perigeo y se encamina hacia el apogeo de su órbita, la línea de nodos forma forma un ángulo que es 180° mayor que el anterior anterior. Este sería el ángulo llamado longitud del nodo descendente ; este parámetro no se usa. Así pues, la longitud longit ud del nodo ascendente ascen dente es el cuarto elemento orbital clásico de los seis requeridos para especificar totalmente la órbita de un cuerpo alrededor de la Tierra. Tierra. Si se denota por n al vector que apunta desde el centro de la Tierra hacia el espacio, a lo largo de la línea de nodos ( l .n.), en el sentido ascendente del satélite, entonces
196
Inyección en órbita ó rbita de un satélite artificial r ˆ i n ⋅ Ω cos1 r n
(3.179)
siendo i ˆ el vector unitario del eje de las abscisas del sistema geocéntrico. Si las condiciones iniciales de lanzamiento del cohete portador fueron tales que la inyección de la órbita es en el perigeo de la trayectoria; esto es que 00 y 00, como se planteó en (3.159 a), (3.160 a) y (3.161 a), entonces el vector de posición inicial r 0 es perpendicular al vector de la línea de nodos n , y como h (el momento angular específico) también es normal a n , entonces se puede definir este vector en términos de aquellos como
r
n ≡ r0 h r0 (r0v0 ) r02v0 r
r
r
r
(3.180)
con lo cual el ángulo en (3.172) queda perfectamente definido para este caso:
Ω cos1[cos (iˆ, r0 ) sen (iˆ, r0 )] ; r
r
(3.181)
es decir, decir, que la longitud del nodo ascendente es proporcional al ángulo que forma el eje de las abscisas del sistema geocéntrico (aquel que apunta en la dirección del punto vernal en la constelación de Aries), con el radio vector al perigeo r 0.
3.7.6. El argumento del perigeo
El quinto parámetro kepleriano, necesario para determinar completamente una órbita alrededo alrededorr de la Tierra Tierra es el argumento del perigeo . Se trata nuevamente de un ángulo. Es aquel que se mide desde la línea de nodos de la órbita, hasta el perigeo, tal como se muestra en la figura 3.7.8. Es importante recalcar que este ángulo debe ser medido desde el segmento de la línea de nodos que corresponde al nodo ascendente, hasta la línea de las ápsides ápsides en la dirección dirección del perigeo. perigeo. Para Para poder dar una definición matemática precisa de este parámetro, es necesario introducir ahora el llamado vector de excentricidad de la órbita ∈ ∈.
197
Las ecuaciones de movimiento
z perigeo
l.n.
l.n.
apogeo Figura 3.7.8. El argumento del perigeo es el ángulo que forman la línea de no-
dos y el eje apsidal, desde el nodo ascendente al perigeo.
Para ello es conveniente regresar a la bien conocida ecuación diferencial del movimiento: ˙r˙ µ r r 0 . r r 3
(3.182)
Multiplicando Multiplicando miembro a miembro de esta ecuación diferencial, vectorialmente por el momento angular específico h, se tiene que:
r r ˙rr˙ h µ (h r r ) r 3
(3.183)
y como este vector es una constante de movimiento, debido a la ausencia de torcas, entonces el miembro de la izquierda de la expresión anterior se puede rescribir como una derivada total con respecto al tiempo:
198
Inyección en órbita de un satélite artificial
d r˙ r µ r r r h ) 3 (h r ). ( dt r
(3.184)
El miembro de la derecha de la ecuación (3.183) también puede ser simplificado si se recuerda que r
r r r r r 2 ˙ rr (rr ⋅rr˙ ), h r ≡ (r r˙ )r rr
(3.185)
así que µ
µ r˙ 2 r r r˙ r h r rr r (r ⋅ r ) , ) 3( 3 r r r
(
)
pero hay que percatarse que el miembro de la derecha no es otra cosa que la derivada total: r d r µ r˙ 2 r r r˙ (3.186) µ 3 rr r (r ⋅ r ) . dt r r
(
)
Con esto, ha sido posible demostrar que ambos términos de (3.182) son expresiones de derivadas temporales totales, así que es posible integrarlas de inmediato, después de haber hecho la multiplicación vectorial por h :
r
r ˙r h µ r b , r r
r
(3.187)
donde b es algún vector constante que aparece como resultado de la integración. Si ahora se multiplica escalarmente por r a ambos miembros de la expresión (3.187) se obtiene:
r
r
r r ⋅ (r˙ h ) µ r b ⋅ r r
r
199
Las ecuaciones de movimiento
pero usando la propiedad del triple producto escalar, que consiste en intercambiar la multiplicación escalar por la vectorial sin alterar el resultado, se observa que el miembro de la izquierda del resultado anterior es el cuadrado del momento angular; r
2
r
h µ r b ⋅ r , despejando a la distancia radial r , se llega finalmente a la siguiente fórmula: 1 r
1 b cos θ
µ h
(3.188)
,
2
µ
que no es otra cosa que la expresión general para las cónicas en el plano; la misma fórmula que se había obtenido anteriormente siguiendo un procedimiento ligeramente diferente. Del procedimiento seguido aquí para deducir esta célebre ecuación de las cónicas, es posible inferir otros resultados interesantes. Así por ejemplo, se puede definir ahora el vector de excentricidad r
∈≡ b µ r
(3.189)
que tiene como magnitud a la excentricidad de la cónica, tal como se aprecia en (3.188). Si se despeja la constante de integración b de (3.187), se tiene que:
r
1 r˙ r r ∈ (r h ) µ r r
o bien, escribiendo explícitamente el vector de momento angular y desarrollando el triple producto vectorial en el miembro de la derecha de la expresión anterior:
200
Inyección en órbita de un satélite artificial
1 ˙ ∈ r r µ r
r
2
r r
r˙ (r˙ ⋅ r ) r r
r
r
factorizando, se obtiene finalmente que
1 2 µ ∈ r ˙ r (r ⋅ r˙ ) r˙ . µ r r
r
r
r
r
r
(3.190)
Esta es la fórmula para el vector de excentricidad de la órbita. Como se ve de (3.190), es posible extender el concepto de excentricidad desde cualquier punto de la trayectoria del cuerpo en su órbita. En particular en el perigeo, cuando los vectores de posición y velocidad son perpendiculares r
1 ˙ 2 µ 1 ˙ 2 r p ∈ r p r p rp r p . r p µ µ r p r
r
r
r
r
(3.191)
El vector de excentricidad ∈siempre apunta desde el centro de la Tierra hacia el perigeo, sin importar en qué punto de la órbita se calcule. Ya para concluir con este punto del desarrollo, sólo hay que tomar el producto escalar del vector de excentricidad con el vector de la línea de nodos n que se definió previamente. De la definición del producto escalar se tiene que
r
r
∈⋅ n ∈n cos w
(3.192)
donde es al ángulo que forman estos vectores. Pues bien, este ángulo es el elemento orbital clásico que hace falta: el argumento del perigeo r
r
∈⋅ n ω cos1 . ∈n
201
(3.193)
Las ecuaciones de movimiento
3.7.7. La localización instantánea del satélite en su órbita
El último parámetro kepleriano que aún falta para tener una descripción completa del movimiento de un cuerpo puesto en órbita circunterrestre es la anomalía verdadera . Pero resulta que este elemento orbital ya había sido calculado anteriormente. De hecho, fue el primero que surgió al resolver el problema de Kepler de un cuerpo que se mueve urgido por la gravitación terrestre newtoniana. Se le denotó por la letra griega y es ese parámetro que aparece en la expresión para las cónicas en (3.144), (3.155), (3.169) y (3.188). En resumen, los seis elementos orbitales clásicos son: 1. Tamaño de la órbita : Semi eje mayor “a ” fórmula: e
µ
. 2a
2. Orientación del plano orbital en el espacio: La inclinación i r ˆ 1 k ⋅ h fórmula: i cos h
0 i π .
3. La forma de la órbita : La excentricidad “∈” fórmula: ∈ 1
2eh 2 2
µ
.
círculo: ∈ 0 elipse: 0 < ∈< 1 parábola : ∈1 hipérbola : ∈> 1 4. Orientación de la órbita respecto al sistema geocéntrico :
202
Astrodinámica
La longitud del nodo ascendente “ ” ˆ 1 i ⋅ n fórmula: Ω cos n r
0 Ω 2π
este parámetro esta indefinido para i 0; 5. Orientación de la órbita en su plano orbital : El argumento del perigeo: “” r
r
∈⋅ n fórmula: ω cos1 ; ∈n
0 ω 2π
este parámetro queda indeterminado cuando i 0, o bien en el caso de una órbita circular; i.e.: ∈0. 6. Ubicación del satélite en su órbita : Anomalía verdadera “”.
1 1 fórmula: θ cos ; ∈r ∈ 1
0 θ 2π
este parámetro está indefinido para órbitas circulares; i.e.: ∈0. 3.8. Astrodinámica
Si bien el problema teórico acerca de por qué los cuerpos masivos se mueven tal como lo había descrito Johannes Kepler en 1603 con sus leyes planetarias, había quedado resuelto, aún faltaba un buen número de detalles por explicar. Aparte de ese que tiene que ver con que la gravitación atañe al menos a dos cuerpos y que se discutió anteriormente, otro problema preocupó a Isaac Newton durante cierto tiempo: éste era el problema de incorporar a la teoría los cuerpos macroscópicos, con formas no necesariamente esféricas, ni distribuciones de masa uniformes. Cuentan los biógrafos de Newton que este problema fue el que indujo al genio inglés a desarrollar aquello que él llamó el cálculo de las fluxiones inversas y que hoy en
203
Las ecuaciones de movimiento
día se conoce como el cálculo integral. Se dice que cuando su único amigo Edmond Halley comenzó a acosarlo para que publicara su obra, Newton se resistió una y otra vez, aduciendo a que aquello, (la mecánica), era un conocimiento muy peligroso, que el mundo aún no estaba en condiciones de obtener y que era mejor que continuara guardado en la gaveta de su destartalado escritorio, allí, en el ático de la casa de la abuela materna en Woolthorpe, en vez de darlo a la luz pública para su publicación. Lo cierto parece ser que fue, en efecto, que el problema de la gravitación aún no estaba suficientemente aclarado y ante el temor de la crítica, Newton prefirió guardar sus resultados. De todos modos, Halley siguió presionando a su amigo periódicamente y Newton continuó negándose a las solicitudes de aquel, al mismo tiempo que trabajaba en secreto sobre las fluxiones inversas… hasta que resolvió el problema. Bueno, la verdad sea expresada, no lo resolvió de manera general; solamente pudo demostrar que la atracción gravitacional que ejerce una esfera uniforme, con masa, sobre un cuerpo distante es idénticamente igual a la de un punto, con la misma masa que aquella, sobre el cuerpo distante. En verdad se trataba de un problema colosal para su tiempo, que Newton resolvió brillantemente. Para alcanzar este resultado aquí se procederá en una forma muy parecida a aquella que empleó Isaac Newton. Supóngase un cuerpo masivo, dotado de una distribución de materia arbitraria, tal como se muestra en la figura 3.8.1. Imagínese que ese cuerpo se compone de un enorme número de pequeños elementos diferenciales de masa, de modo que la masa total M de ese cuerpo es igual a la integral de sus elementos de masa dm; esto es
∫
M ≡ dm
(3.194)
o bien, dividiendo y multiplicando el integrando en (3.194) por el elemento diferencial de volumen dV :
M
∫V
dm dV ≡ ρ dV , dV V
∫
(3.195)
siendo la densidad volumétrica de masa , cuyas unidades son de kg/m3 en el SI, definida como se indica en (3.195). Si de alguna manera se puede conocer la distribución de materia dada por ( x , y , z ), entonces se esta-
204
Astrodinámica
dm
M
Figura 3.8.1. Un cuerpo amorfo y con una distribución de materia arbitraria
tiene una masa total M . Un elemento de masa es dm.
blece la integral (3.195). Al integrar sobre todo el volumen ocupado por el cuerpo, V , se encuentra su masa total. Ahora supóngase que uno de esos cuerpos masivos, amorfos y una pequeña partícula puntual de masa m se encuentran ubicados en ciertas posiciones iniciales en el espacio, tal como se ve en la figura 3.8.2; cada elemento diferencial de masa interactúa gravitacionalmente con la partícula, con una fuerza gravitacional elemental, dada por
dm ⋅ m r r df G r r 3 (r r ) r r r
(3.196)
que es la fórmula propuesta originalmente por Newton (ver 3.103), modificada para el caso en que el cuerpo que genera el campo no esté en el origen del sistema de coordenadas, sino que se trate de un elemento de masa dm ubicado en algún punto del espacio. El radio vector r va desde el origen hasta el centro del elemento de masa. Por su parte, la partícula puntual tiene una masa m y se localiza en el punto señalado por el radio vector r . Por consiguiente, el vector diferencial r r es aquel que va desde la masa que “provoca” el campo gravitacional, hasta la masa m que lo “perci
205
Las ecuaciones de movimiento
z
M
dm
r r
r
r
y
0
x Figura 3.8.2. Un cuerpo masivo, amorfo, de masa M interactúa gravitacional-
mente con una partícula puntual de masa m.
be”. Entonces, integrando (3.196) sobre todos los elementos de masa que constituyen al gran cuerpo, se obtiene la fuerza gravitacional neta total que genera el campo. De hecho, haciendo nuevamente el truco de dividir y multiplicar al elemento de masa por su correspondiente elemento de volumen, se obtiene la fórmula definitiva para la fuerza gravitacional r
r
r
r r )ρ (r )dV ( r F (r ) Gm . r r 3 r r V r
∫
(3.197)
La fórmula anterior debe entenderse bien para utilizarse sin riesgo de cometer equivocaciones. Así, la integración se lleva a cabo sobre el volumen V ocupado por el cuerpo macroscópico que genera el campo gravitacional. El elemento de volumen dV se ha denotado con una prima para recalcar que las coordenadas del cuerpo, así como el radio vector desde el origen de coordenadas a cada punto del mismo son también pri-
206
Astrodinámica
madas. Así mismo, la densidad volumétrica de masa , es una función de r por la misma razón. Puede verse, tal como está escrita la fórmula (3.197), que hay un escalar de energía potencial, que aquí se denotará como U (r ), tal como se hace en los casos de fuerzas conservadoras, como el negativo de su gradiente; esto es:
r
r
r
F (r ) grad U (r )
(3.198)
siendo r
ρ (r )dV
∫ V r r
r
U (r ) ≡ Gm
r
(3.199)
r
donde el gradiente debe operarse sobre la función U (r ) con respecto a las componentes del vector de posición r . Más cómoda resulta para su manipulación matemática, la función definida a partir de (3.199) y que se llama el potencial gravitacional de la distribución de materia
r
r
ρ (r )dV
∫ V r r
Φ(r ) G
r
r
(3.199 a)
tal que la energía potencial se obtiene de éste multiplicándolo por la masa de la partícula, m, que “percibe” el campo gravitacional de la distribución. Si bien se trata de una simple operación de multiplicar a (r ) por la masa m, su significado es más profundo: lo que (3.199 a) expresa es que, en efecto, la distribución de materia genera un campo gravitacional que permea todo el espacio físico. Este hecho se vuelve evidente cuando otro cuerpo, como la masa m se coloca en su presencia; entonces aparece una fuerza gravitacional dada por (3.197) que actúa sobre este cuerpo. Pero ahora, si la masa de la partícula m pudiera disminuirse gradualmente, hasta desaparecer, lo que quedará será nueva y únicamente el campo gravitacional de la distribución, dado por el potencial gravitacional (r ).
207
Las ecuaciones de movimiento
z
P
r
dm r
R
0
y
x Figura 3.8.3. Un cuerpo esférico, de masa uniforme está centrado en el origen
del sistema de coordenadas.
Ahora bien, con el objeto de aprender cómo calcular el potencial gravitacional (3.199) para una distribución particular de materia, supóngase el caso de una esfera uniforme de radio R y con densidad de masa (constante), que se halla en reposo con su centro de masa en el origen del sistema de coordenadas, tal como se aprecia en la figura 3.8.3. Utilizando para este caso coordenadas esféricas polares, se tiene que el elemento diferencial de volumen es:
dV r 2 senθ dr dθ dφ
(3.200)
siendo r , , las coordenadas para puntos del cuerpo, como ya se mencionó. Por otra parte, el valor absoluto de la diferencia de los radios vectores que aparece en el denominador del integrando en (3.199), expresado en coordenadas esféricas es:
r r r 2 r 2 2rr( sen θ senθ cos (φ φ ) cosθ cosθ ) r
r
(3.201)
208
Astrodinámica
donde r , , , son las coordenadas del punto de observación, mismo que en la figura 3.8.3 se ha denotado por P . Realmente, la ubicación de este punto es arbitraria e indiferente, dado que el cuerpo que genera el campo es esférico y uniforme. Por lo tanto, ninguna generalidad se pierde si se sitúa sobre el eje OZ positivo y fuera de la esfera. Haciendo esto se consigue una buena simplificación en el tratamiento del problema, ya que para este caso: θ 0
así que la fórmula (3.201) se convierte en:
r r r 2 r 2 2rr cos θ . r
r
(3.202)
El potencial gravitacional (3.199) se puede calcular ahora con las consideraciones hechas; en primer lugar, la integración que es necesario realizar es: π R r
r 2 senθ dr dθ
∫ 0 ∫ 0 r 2 r 2 2rrcos θ .
Φ(r ) 2π G ρ
(3.203)
La integración sobre la coordenada cenital se puede efectuar de inmediato si se observa que manteniendo r y r constantes:
d r 2 r 2 2rr cos θ
rr sen θ d θ r 2 r 2 2rr cos θ
de modo que tomando los límites de esta integración se llega al siguiente resultado: R
G ρ 2 4πGρ R 3 r Φ(r ) 4π r dr . r 0 3r
∫
Finalmente, si el cuerpo tiene masa uniforme, su densidad es una constante cuyo valor es, simplemente, la razón de la masa M al volumen:
209
Las ecuaciones de movimiento
ρ
M 4 π R 3 3
así que el potencial gravitacional de la esfera resulta ser, para cualquier punto exterior a ella:
Φ(r )
GM . r
(3.204)
¡Que es el mismo que tenía para una masa puntual! Con este resultado en la mano Newton pudo, ahora sí, publicar su teoría. Toda la construcción había quedado consistente. Pero suponiendo que el cuerpo es amorfo, con una distribución de masa no uniforme ¿qué se puede hacer? Para resolver el problema hubo de pasar mucho tiempo. Tuvo que esperar hasta el desarrollo de las llamadas funciones especiales, en el siglo XIX. Para proseguir en forma ordenada y didáctica, considérese ahora un cuerpo macroscópico con masa M , que presenta simetría axil; esto es que si se gira alrededor del eje OZ del sistema de coordenadas donde se encuentra su centro de masa, el cuerpo ejerce exactamente la misma atracción gravitacional local sobre una partícula exploradora que se sitúe en su proximidad. Así mismo, supóngase por facilidad, que el punto de observación P se sitúa sobre el eje OZ , fuera del cuerpo, tal como se observa en la figura 3.8.4. Entonces, de acuerdo con la fórmula general (3.199) para el potencial gravitacional y recordando los resultados (3.200) y (3.202) se ve que para este caso: r
∫ V
ρ (r , θ )dV
Φ(r ) G
2
2
.
(3.205)
r r 2rr cos θ
Ahora el denominador en (3.205) se puede desarrollar como una serie de potencias en r y . Para hacerlo hay que proceder de la siguiente forma:
210
Astrodinámica
z P
dm r
0
y
x Figura 3.8.4.: Una distribución de masa con simetría axil alrededor de
nera un campo gravitacional.
OZ ge-
1 2 2
r 1 2r ≡ 1 cos θ 2 r r 2 r 2 2rr cos θ r r 1
y de acuerdo con la fórmula general para el binomio de Newton se tiene que: 1 2 2
r 1 2r 1 cos θ 2 r r r
2
1 r 3 r 2 2r cos θ 1 cos θ 2 2 r r r 2r 8 r 3 2 5 r 2r cos θ 2 r 6 r r 2
K
desarrollando y agrupando de acuerdo a las potencias de 1r se obtiene lo siguiente:
211
Las ecuaciones de movimiento
r 2 1 r ≡ 1 cos θ 2 3 cos2 θ 1 2r r 2 r 2 2rr cos θ r r (3.206) r 3 3 3 5 cos θ 3 cos θ K . 2r 1
(
)
(
)
Ahora, sustituyendo el resultado (3.206) en la fórmula (3.205) se obtiene el potencial gravitacional de la distribución de materia considerada. Como se ve, el resultado será una serie infinita de términos con potencias cada vez mayores de 1r . El primero de ellos debe reconocerse como el término newtoniano para el potencial gravitacional de un punto material puesto que, de acuerdo con (3.195), la integral volumétrica de la densidad de masa es, simplemente, la masa total del cuerpo. Por lo tanto: r
Φ(r )
GM G 2 ρ (r, θ )r cos θ dV r r V
∫
G 3 ρ(r , θ )r 2 3 cos 2 θ 1 dV K 2r V
(
∫
)
(3.207)
Al desarrollo anterior se le conoce como la expansión multipolar del potencial gravitacional y cada uno de los términos del mismo es conocido, sucesivamente, como el potencial monopolar o newtoniano, el potencial dipolar, el potencial cuadripolar, etc., respectivamente: r
Φ0 (r ) ≡ r
Φ1(r ) ≡
GM r
(3.208)
G rρ(r , θ ) cos θ dV 2 r V
∫
G 2 Φ 2 (r ) ≡ 3 r ρ(r , θ ) 3 cos2 θ 1 dV 2r V r
(
∫
212
)
(3.209)
(3.210)
Astrodinámica
r
Φ3 (r ) ≡
G 3 3 r ρ r θ θ 3 cos θ 1 dV , 5 cos ) ( 4 2r V
(
∫
)
(3.211)
En particular, el término dipolar, se puede demostrar que siempre ha de ser nulo. Para hacerlo basta con observar que (r ,) es una función siempre positiva y que la integración en (3.209) se escribe como: π R
2π G Φ1(r ) 2 ρ (r, θ )r 3 cos θ sen θ dr dθ r 0 0
∫ ∫
r
y en particular, la integración sobre es equivalente a 0
∫ 0 (
)(
)
ρ r , sen 2 θ d sen 2 θ ≡ 0 .
Por lo tanto, en general, para cualquier distribución axilmente simétrica de materia, el potencial gravitacional desarrollado en una serie multipolar como (3.207) exhibe el término newtoniano, luego el cuadripolar, el octupolar, etc., pero no posee término dipolar. Se puede entender este desarrollo multipolar del potencial gravitacional como un proceso de gradual refinamiento en la medida de la masa de un cuerpo. Así, si a un objeto masivo se le considera a gran distancia, con toda tosquedad se afirma que tan solo posee una masa M , sin entrar en mayores detalles acerca de cómo está distribuida en su volumen. De hecho, si el cuerpo se halla muy distante, se ve como un mero punto masa en el espacio. Sin embargo, a medida que se mira más y más de cerca, el cuerpo comienza a exhibir su estructura. Por ejemplo, podrá aparecer ante los ojos del observador que no es esférico, sino que es más achatado de un lado que del otro. También comenzará a hacerse evidente que es más denso en ciertas regiones y más bofo en otras. Así pasa con la Tierra, que a distancia parece esférica, pero que al acercarse a ella se ve que está achatada de los polos, pero es más ancha del ecuador; como un elipsoide de revolución; tiene lo que se llama oblatez . Pero si se observa con mayor cuidado, resulta que en realidad tiene la forma de una pera, que es más
213
Las ecuaciones de movimiento
gruesa en su hemisferio sur que en el norte. Tiene la forma de un geoide . Así, a medida que se le observa con mayor detalle, su potencial gravitacional no nada más contiene el término newtoniano que corresponde a una esfera, ese que el propio Newton calculó y que se ve en (3.204), sino que van apareciendo otros más; los términos cuadripolar, octupolar, etc., a medida que se refina más y más la medida sobre su geometría y la distribución de su masa. Actualmente, debido a la necesidad que se tiene de cálculos precisos del potencial gravitacional terrestre para la colocación de satélites y estaciones orbitales en el espacio que orbiten la Tierra en forma estable y predecible, se han considerado grandes cantidades de detalles acerca de la geometría terrestre así como de su masa. Así por ejemplo, se ha tomado en cuenta la presencia de masa en los polos debida a los casquetes de hielo. También se han descubierto concentraciones anómalas de materia en el subsuelo de Brasil y de Siberia, provenientes, posiblemente, de grandes asteroides que en épocas pasadas se impactaron contra la Tierra cuando ésta se hallaba aún en estado viscoplástico y que quedaron alojados allí. En total, se han podido calcular más de trescientos términos multipolares del potencial gravitacional de este planeta. Pero regresando al desarrollo de potencias (3.206) es interesante en este punto hacer ver que cada uno de los términos que aparecen a la derecha, como funciones de la variable cenital de la distribución, forman parte de una familia de polinomios generados por una misma fórmula general. Se les conoce como los polinomios de Legendre , en honor a su inventor Adrien Marie Legendre (1752-1833), quien en 1783 publicó su trabajo sobre la determinación de las órbitas de los cometas y en el cual los propuso. La familia se genera mediante la fórmula de Rodrígues: n 1 d n 2 Pn ( x ) ≡ n x 1 n 2 n! dx
(
con
n 0, 1, 2, 3, K Así, para
214
)
(3.212)
Astrodinámica
n 0:
P0 ( x ) ≡ 1
n 1:
P1( x ) ≡ x 1 P2 ( x ) ≡ 2 1 P3 ( x ) ≡ 2 1 P4 ( x ) ≡ 8 1 P5 ( x ) ≡ 8
n 2: n 3: n 4: n 5:
(3.213)
(3x 2 1) (5x 3 3x 2 ) 4 2 3) x x 35 30 ( 5 3 15x ) , 3x x 6 70 (
etcétera. Si se sustituye en lo anterior cos por la variable x , se obtiene precisamente la familia de términos cenitales en los cuales se descompone la función en (3.206). Estas funciones (los polinomios de Legendre) poseen, además, una cierta cantidad de propiedades que las hacen muy interesantes para tratar, en general, problemas que involucran simetría axil de cuerpos y se usan lo mismo en la mecánica, que en el electromagnetismo y otras ramas de la física matemática. Sin entrar en mayores detalles que desviarían demasiado la atención de lo que aquí se trata, a continuación se exhiben, sin demostración, algunas de esas propiedades de los polinomios de Legendre. Los lectores interesados en profundizar en este tópico pueden acudir a alguno de los muchos textos que han sido publicados sobre el tema general de las funciones especiales. Así por ejemplo, se puede demostrar que toda función continua y con derivadas continuas de cualquier orden se puede expresar en términos de los polinomios de Legendre, pues estos forman un conjunto completo. Por lo tanto, dada una función ƒ ( x ), se puede escribir como:
ƒ ( x )
∞
an Pn ( x ) ∑ n 0
donde las a n son ciertos coeficientes constantes.
215
(3.214)
Las ecuaciones de movimiento
Además, los polinomios de Legendre son funciones “ortogonales” pues satisfacen la propiedad de que en el intervalo [1,1]: 1
∫ 1
Pn ( x )Pm ( x )dx
2 δ nm 2n 1
(3.215)
donde, en el miembro de la derecha de (3.215) aparece la llamada delta de Kronecker , que es el símbolo que se usa para denotar conjuntamente al cero y al uno; así, si los valores de los índices n y m son iguales, el símbolo adquiere el valor uno; en tanto que si los índices tienen valores distintos, la delta de Kronecker vale cero. Haciendo uso de la propiedad de ortogonalidad (3.215) en la expansión (3.214) se pueden calcular los valores de los coeficientes, pues, si la función ƒ ( x ) es conocida entonces, multiplicando miembro a miembro de (3.214) por P m( x ) se tiene que: ∞
an Pn ( x )Pm ( x ) ∑ n 0
ƒ ( x )Pm ( x )
ahora, integrando miembro a miembro entre 1 y 1 y aplicando la propiedad de ortogonalidad (3.215) de los polinomios de Legendre, se obtiene 1
∞ 1
∫ 1 ƒ ( x )Pm ( x )dx n∑0 ∫ 1an Pn (x )Pm (x )dx .
El miembro de la derecha se reduce con la ayuda de la condición de ortogonalidad (3.215) quedando: 1
∫ 1
2a n 2a m δ nm 2m 1 n 0 2n 1
ƒ ( x )Pm ( x ) dx
∞
∑
en donde se ha hecho uso de la definición de la delta de Kronecker. Por lo tanto, cada uno de los coeficientes de la expansión (3.214), en efecto,
216
Astrodinámica
se puede conocer a partir de la función ƒ ( x ) original y de los polinomios de Legendre: 1
2m 1 a m ƒ ( x ) Pm ( x )dx . 2 1
∫
(3.216)
Con el conocimiento adquirido ahora acerca de los polinomios de Legendre y algunas de sus más importantes propiedades, es posible regresar al estudio del potencial gravitacional y su expansión multipolar. Claramente, de (3.206) se puede ver, por ejemplo que: 1
r 2 r 2 2rr cos θ
n
1 ∞ r P n (cos θ ) r n 0 r
∑
(3.217)
así que el potencial (3.207), a su vez, se puede escribir en términos de esos polinomios como:
r GM 2π ∞ r r 1 , Φ(r ) ρ θ ( ) r r M n 01 0 1 R
n2
∑ ∫ ∫
Pn (cos θ )dr d (cos θ ). (3.218)
En el caso de la Tierra, su interior parece estar constituido por materiales metálicos incandescentes; níquel, fierro, aluminio y otros como el sílice, formando lo que se conoce como el núcleo y el manto. Hasta el momento no se conocen con precisión mayor los detalles de su estructura fina. Sin embargo, es posible aceptar que está formada por capas poco diferenciadas en continuo flujo convectivo. Sobre su superficie y hasta una profundidad de más o menos treinta kilómetros se encuentra la corteza; una capa sólida y el agua que forma los océanos y los mares. La densidad promedio de la Tierra es de ρ
≡ 5.579 gr cm3 .
217
(3.219)
Las ecuaciones de movimiento
Por otra parte, si bien se desconocen los detalles de su estructura, como se mencionó anteriormente, es posible suponer que la distribución de masa en su volumen es simétrica y continua, de modo que la función densidad de masa (r ,) pueda desarrollarse, a su vez, en términos del conjunto completo de funciones ortogonales: los polinomios de Legendre como: ∞
ρk (r ) P k (cos θ ) ∑ k 0
ρ(r , θ )
(3.220)
de tal suerte que su dependencia en la distancia radial r y en la coordenada cenital pueda separarse en dos clases de funciones. En particular, las que se expresan en (3.220) como k (r ) se conocen como funciones radiales de distribución de masa . Entonces, si en la fórmula para el potencial gravitacional r
Φ(r )
∞ π R
n
r 2π G ρ (r, θ ) Pn (cos θ )r 2 sen θ dr dθ r r n 0 0 0
∑ ∫ ∫
se incorpora (3.220), se obtiene lo siguiente: r
Φ(r )
∞
n
∞ π R
r 2π G ρ(r ) r 2dr Pk (cos θ )Pn (cos θ ) senθ dθ . r r n 0 k 0 0 0
∑ ∑ ∫ ∫
Ahora, haciendo uso de la propiedad de ortogonalidad de los polinomios de Legendre que se enunció en (3.215), la integración sobre el ángulo cenital se realiza rápidamente y resulta: R
∞
n
r 2 2π G 2 ρ (r ) r dr Φ(r ) r r n 0 2n 1 0 r
∑
∫
(3.221)
en donde se ve que el potencial gravitacional, medido en algún punto externo al cuerpo que lo genera, situado sobre el eje de las cotas del sistema coordenado, es únicamente función de la distancia r , multiplicado por
218
Astrodinámica
una serie de factores que dependen, a su vez de la distribución radial de materia del cuerpo. Se definen ahora los llamados armónicos gravitacionales R
n
r 2 4π J n ≡ ρ (r ) r dr M (2n 1) 0 n R
∫
(3.222)
como un conjunto infinito de coeficientes adimensionales, tales que el potencial gravitacional se escribe en función de ellos como:
Φ(r )
n
∞
GM R J n r n 0 r
∑
(3.223)
siendo R el radio ecuatorial de la distribución de masa que genera el campo. Ya para concluir con este problema, lo que falta es situar ahora el punto de observación del campo gravitacional en cualquier otro lugar del espacio. Este detalle se puede cumplir muy fácilmente si se acude de nueva cuenta a aquella propiedad de las funciones continuas que se estableció en (3.214), donde se explicó que en tales circunstancias, habiendo simetría axil, siempre es posible escribir a cualquiera de esas funciones como una serie, en términos de los polinomios de Legendre. El potencial gravitacional que aquí se ha considerado cae totalmente en esta categoría, así que también puede ser descrito mediante este conjunto completo de funciones ortogonales. Más aún, el resultado (3.223) puede verse como tal desarrollo cuando el ángulo cenital tiene el valor cero; esto es, cuando el punto de observación yace precisamente sobre el eje de las cotas, ya que en ese caso todos los polinomios de Legendre tienen en valor uno. Por lo tanto, en el caso en el que el punto de observación esté situado en cualquier lugar del espacio, fuera de la distribución de masa, se debe tener forzosamente que:
Φ(r , θ )
∞
n
GM R J n P n (cos θ ) . r n 0 r
∑
219
(3.224)
Las ecuaciones de movimiento
Cuando un cuerpo es totalmente esférico y uniforme, la serie anterior solamente posee el primer término; esto es, el potencial newtoniano con
J 0 ≡ 1;
(3.225)
el segundo término, el dipolar, nunca aparece; nunca ha sido observado en cuerpo alguno, así que se debe aceptar que
J 1 ≡ 0 ,
(3.226)
lo cual implica que (de acuerdo con la definición dada en (3.136) ), el correspondiente término de la distribución radial debe ser siempre nulo; i.e.: ρ 1(r ) ≡ 0 .
(3.227)
Los demás armónicos gravitacionales se obtienen a partir de observaciones sobre la gravedad local de los cuerpos, realizadas por satélites artificiales puestos en órbitas bajas, o bien, mediante otros métodos, uno de los cuales se discutirá aquí posteriormente. En el caso de la Tierra, a la fecha, se han podido medir más de trescientos armónicos. En seguida se muestran algunos, los primeros del desarrollo (3.224) que son, por cierto, los más importantes:
J 2 1.083 103 J 3 2.5 106 J 4 1.6 106 J 5 0.2 106 . Todos ellos, después de J 2, son del mismo orden y todos son positivos , aunque su valor principal va disminuyendo, de manera que son menos y menos significativos para el cálculo del potencial gravitacional. El armónico J 2 está muy fuertemente vinculado a la oblatez (el achatamiento polar) de la Tierra. Así, desarrollando el potencial gravitacional (3.224) hasta su término cuadripolar se tiene:
220
Astrodinámica
GM 1 R 2 3 cos θ 1 , Φ(r , θ ) 1 J 2 r 2 r 2
(
)
de suerte que si la fuerza de gravitación con la que un cuerpo masivo como la Tierra atrae a otro de masa m es: r
∂ ˆ 1 ∂ e θ Φ(r ) ; ∂r r ∂θ
F m grad Φ m eˆr entonces: r
GMm ˆ 3GMm 2 2 ˆr e J R θ 1 e 3 cos 2 r 2 4 r 2r 3GMm 2 J R sen θ cos θ e ˆθ 2 4 r
(
F
)
(3.228)
que exhibe, además del término newtoniano, dos más, asociados a J 2; uno radial y el otro angular. Claramente, este último es el responsable de que el cuerpo de masa m experimente además de la fuerza de atracción central, una fuerza tangencial y con ella una torca. En (3.228) los términos radiales no contribuyen a la torca, el único que sí lo hace es el término angular, así que se puede calcular esta cantidad considerando únicamente este sumando:
eˆr eˆθ r N r 0 3 MGm 0 4 J 2 R 2 sen θ cos θ r 3 MGm 2 ˆ. J R θ θ k sen cos 2 r 4
k ˆ 0 0 (3.229)
Se trata, de un efecto pequeño que es inversamente proporcional a la cuarta potencia de la distancia de un satélite al centro de la Tierra. Este efec-
221
Las ecuaciones de movimiento
to causa que el plano de la órbita de los satélites artificiales en torno al planeta no se mantenga fijo en el espacio, como se predice con los términos puramente newtonianos. Por el contrario, el plano orbital se observa que precede lentamente alrededor del eje polar de la Tierra. ¿Pero cuál es la forma de la Tierra? Esta pregunta también puede ser contestada una vez que se tiene la expresión completa para su potencial gravitacional en cualquier punto del espacio exterior a la distribución. Considérese que la Tierra no es enteramente sólida, sino que esencialmente es un fluido que gira alrededor de su eje polar con una velocidad angular tal, que la velocidad con la que se mueve cualquier partícula de este fluido, observada desde un marco de referencia geocéntrico (es decir, anclado en el centro geométrico del planeta), es:
r
r
Ω r . Por lo tanto esa partícula se ve sujeta, en todo momento, por una parte, al potencial gravitacional local y por la otra, a una aceleración debida al estado de rotación del fluido. Se puede ver que el potencial efectivo al que se ve sujeta esa partícula es una superposición de los dos efectos:
Ψ(r , θ ) ≡ Φ(r , θ )
12
r
(Ω r ) r
2
.
Ahora, como la Tierra está en equilibrio, es de verse que cada partícula que la compone no debe estar sujeta a fuerza alguna que la saque de su posición de equilibrio; esto es, que no debe haber tendencia a desplazarse tangencialmente. Esto se puede expresar matemáticamente afirmando que la superficie de la Tierra (cualquiera sea su forma) es una superficie equipotencial. Por lo tanto, para todos los puntos que están sobre su superficie se debe tener que ψ ( R , θ ) const.
Entonces, la ecuación que describe el lugar geométrico de los puntos sobre la superficie terrestre es la siguiente:
222
Astrodinámica
n 1 ∞ GM R 1 J n Pn (cos θ ) Ω2r 2 (1 cos2 θ ) k , r n 0 r 2
∑
siendo k constante. Esta es la ecuación de un geoide . Supóngase que a es el radio ecuatorial del la Tierra, c su radio polar y considérese la ecuación del geoide hasta J 2 solamente. Para todos los puntos sobre el ecuador (cos0):
GM J 2 1 2 2 1 Ω a k . a 2 2
(A)
Así mismo, para los puntos en el polo norte (cos1):
GM J 2a 2 1 2 k . c c
(B)
Por lo tanto, igualando (A) y (B) se obtiene ahora; aproximando hasta primeros órdenes de magnitud en : ε
≈ 12 (3 J 2 β )
siendo la razón del potencial centrífugo al potencial gravitacional newtoniano en el ecuador. Así, tomando como valores terrestres
M 5.9764 1024 Kg a 6.37822 106 m
Ω 0.0007272s 1 se consigue un valor para el achatamiento de ε ≈
1 2 8.2
que es muy acertado.
223
Las ecuaciones de movimiento
La astrodinámica es, sin lugar a dudas, la corona de oro que ciñe la testa de la mecánica. Con el estudio y la comprensión de los movimientos de la Tierra y el resto de los planetas del Sistema Solar, el ser humano dio un paso gigantesco en su conocimiento acerca del universo y su propio papel dentro de él. Así, se pudo liberar de supersticiones y leyendas falsas, como aquella de que las órbitas de los cuerpos celestes debían ser circulares porque Dios las estableció y, como todo lo que Él hace, es perfecto, entonces por eso debían ser así, ya que el círculo es la figura perfecta. O también aquella que decía que si los planetas ejecutan órbitas oblongas esto se debe a que los ángeles los empujan fuera de sus trayectorias perfectas, pues se “sabe” que son juguetones. La mecánica celeste, que antes era la mecánica celestial, mágica, divina y por ende, un tanto prohibida para el entendimiento y la comprensión humana, de pronto, por virtud de la matemática vectorial y las leyes de Newton, quedó al alcance de la mano para cualquier persona. Todos los movimientos de los cuerpos celestes son el resultado de la ley de atracción gravitacional propuesta por él mismo. Otro de los resultados interesantes de la teoría, tiene que ver con la explicación de las mareas. Se observa a diario que la marea sube, sobre todo durante las noches y baja en el día. En algunos sitios de la Tierra, la diferencia de alturas entre la pleamar (marea alta) y la bajamar (marea baja) puede ser de un par de metros, así que es un fenómeno muy notable. Desde tiempos de los fenicios se conoce y se atribuye a la Luna, pero solamente con ayuda de la mecánica newtoniana se puede dar una explicación de él, no sólo cualitativa, sino cuantitativa. En la figura 3.8.5 se ha dibujado esquemáticamente y sin atenerse a escala alguna, un círculo que representa a la Tierra y otro más pequeño, que representa a la Luna. El radio vector del centro de la Tierra al centro de la Luna es r y es en la dirección de la fuerza de atracción gravitacional entre los dos cuerpos. Considérese un pequeño elemento de masa sobre la superficie de la Tierra; por facilidad supóngase que este cuerpo tiene una masa unitaria (un kilogramo). La Luna ejerce sobre el elemento unitario de masa una fuerza dirigida hacia su centro, al mismo tiempo que la Tierra lo fuerza hacia su propio centro de masa, así que el cuerpo se halla sujeto a varias fuerzas que se superponen vectorialmente. Si M es la masa de la Tierra y m es la de la Luna, entonces, de acuerdo con la segunda ley de la mecánica:
224
Astrodinámica
m
r
M f
Figura 3.8.5. La Luna ejerce una atracción sobre la
fuerza ƒ causante de las mareas.
superficie terrestre. Es una
r
a
r
r
GM r R mM r R GM G r , r 3 3 3 r r R r R r
(3.230)
donde a representa al vector aceleración del elemento unitario de masa sobre la superficie terrestre. El primer término de la derecha en (3.230) representa la fuerza de atracción que ejerce la Tierra sobre el elemento unitario de masa en su superficie. El siguiente representa la fuerza de atracción que la Luna ejerce sobre ese mismo elemento y el tercero es la fuerza de atracción que ejerce la Tierra sobre la Luna. Ahora, desarrollando el segundo término de la derecha, de acuerdo con la fórmula general del teorema del binomio de Newton y considerando solamente hasta términos de orden 1r , recordando que R r , se obtiene que:
225
Las ecuaciones de movimiento
r
r
r
32
r R r R 2r ⋅ R R 2 3 1 2 2 3 r r r r R r
r
r
r
r
≈
r
r 3r ⋅ R 1 2 ; 3 r r r
r
así que, sustituyendo esta aproximación en (3.230) se obtiene: r
a ≈
r
r
GM GMm r r ⋅ R r R r Gm r . 3 3 5 R r r r
(3.231)
El primero y el segundo término de la derecha en (3.231) son los que describen la fuerza gravitacional del elemento unitario de masa sobre la superficie terrestre y la interacción Tierra-Luna, respectivamente, tal como se explicó en el párrafo anterior. El tercer término da la descripción de la fuerza de marea. Dependiendo del ángulo que forman los vectores r y R , la interacción puede ser hacia fuera de la Tierra (pleamar), o hacia adentro (bajamar) a noventa grados entre máximos y mínimos, tal como se muestra en la figura 3.8.6. En realidad lo que se observa es un retraso entre el paso de la Luna por el cenit y el máximo de la pleamar, debido a la viscosidad del agua. El mar no responde de inmediato a la atracción lunar. Adicionalmente, parte de la energía gravitacional se disipa en alguna forma no muy bien estudiada hasta la fecha, de manera que la altura máxima de la marea es inferior a la calculada en (3.231). Esta disipación tiene un efecto también notable en el sistema Tierra-Luna: la Tierra lentamente disminuye su período de rotación alrededor del eje norte-sur. Este retraso es de cerca de dos segundos por siglo, así que el día terrestre ha venido aumentando lentamente a lo largo del tiempo. Pero no nada más se trata de que el planeta rote cada vez más lento, pues esto significa que su cantidad de movimiento angular es también, cada vez menor y como el momento angular del sistema Tierra-Luna se debe conservar (si se ignora la torca inducida por el Sol sobre el sistema y otras torcas adicionales debidas a la presencia del resto de los cuerpos celestes del Sistema Solar, que son todavía menos importantes), entonces se concluye que el movimiento de la Luna alrededor de la Tierra también ha venido afectándose al través de los eones. De hecho, lo que se observa es que, en efecto, la distancia que separa a la Luna de la Tierra ha aumentado gradualmente, así que el momento angular lunar alrededor de la Tierra aumenta.
226
Astrodinámica
m
r
M
Figura 3.8.6. Las fuerzas de marea debidas a la atracción gravitacional de la Luna
se distribuyen en la superficie terrestre como se muestra (exageradamente) aquí.
El problema es que la distancia de la Tierra a la Luna no puede crecer indefinidamente, pues, por virtud de la tercera ley de Newton ha de llegar un momento en que la Luna alcance el radio medio máximo en el cual su período de traslación alrededor de la Tierra, que es igual al de rotación terrestre, se vuelva, si no infinito, cuando menos, muy dilatado. Esto ocurrirá cuando el día terrestre, a su vez sea de una duración casi infinita. Entonces, las pequeñas perturbaciones debidas al Sol y otros cuerpos del Sistema Solar operarán para que el movimiento se restituya. La Tierra, primero en forma casi imperceptible y cada vez con mayor velocidad, comenzará a girar alrededor de su eje polar, sólo que esta vez lo hará en sentido opuesto al que solía hacerlo antes. El Sol será visto a partir de entonces, como si apareciera en el poniente y se verá ponerse en el oriente; al revés de lo que ocurre hoy. Por su parte, la Luna, en un punto muy ale jado de la Tierra, iniciará también el camino de regreso: su movimiento de traslación invertirá el sentido; primero muy lentamente y conforme la Tierra aumente su velocidad de rotación retrógrada, así lo hará igualmente la Luna con su velocidad de traslación. Simultáneamente, la distancia entre la Luna y la Tierra comenzará a disminuir. Entonces el efecto gravitacio-
227
Las ecuaciones de movimiento
nal de la Luna sobre las mareas terrestres se volverá a sentir y cada vez más intensamente, hasta que de nueva cuenta la disipación viscosa sirva de freno al proceso. Tal vez esto ocurra cuando Tierra y Luna estén tan próximas entre sí que la altura que alcance la marea terrestre permita el paso de agua al satélite. Aquí, un ciclo completo de alejamiento-acercamiento se iniciará nuevamente entre los dos cuerpos. La posibilidad de que la Luna se haya acercado a la Tierra en el pasado y que lo haya hecho de tal manera que el transporte de agua de los mares terrestres pudiera haber llegado hasta aquella, ha sido la razón por la cual en los viajes que se hicieron al satélite terrestre en la década de los setentas del siglo XX, se buscó de una manera tan insistente el líquido. No se tuvo éxito entonces; sin embargo, observaciones gravimétricas realizadas en los noventas parecen indicar, con poco margen de error, que en el subsuelo lunar, aquí y allá hay agua solidificada. Tal vez aquella parte del agua que no se percoló al subsuelo lunar, sino que quedó sobre su superficie cuando se dió aquel probable flujo del líquido al satélite, con el paso del tiempo se perdió. No hay que olvidar que la gravedad lunar es tan solo una sexta parte de la terrestre, así que las moléculas de agua, por sus movimientos al azar, tuvieron suficiente energía cinética como para salir despedidas de la Luna gradualmente, hasta que el cuerpo perdió completamente su contenido superficial de agua, quedando solamente aquella que se hundió en las profundidades. Otra pregunta interesante es ¿cuántas veces ha ocurrido este ciclo de alejamiento-acercamiento entre la Luna y la Tierra? Haciendo cuentas alegres, si la tasa de desaceleramiento del día terrestre ha sido constante desde que la Tierra sufrió aquel colosal choque —que casi la licuó y con la materia expelida se formó eventualmente la Luna, iniciando el ciclo— el cambio de sentido de rotación terrestre ha ocurrido unas 230 ocasiones en los últimos 4600 millones de años. De ellas, unas ciento cincuenta pudieron dar lugar a intercambio de agua; no hay que olvidar que los mares terrestres se formaron hace unos 3800 millones de años. Por lo tanto, de ser cierta la hipótesis de los ciclos de alejamiento-acercamiento, debe hallarse agua en el subsuelo lunar cuya antigüedad se remonta a aquel primer encuentro. Por supuesto, todas estas no son más que eso: cuentas alegres, ya que el proceso completo nunca ha sido uniforme. Comienza en forma extraordinariamente lenta, se acelera y luego vuelve a ser casi imperceptible.
228
Problemas del capítulo
3.9. Problemas del capítulo 3.1.
Un cuerpo masivo se mueve a lo largo de una trayectoria circular, urgido por una fuerza dada por la expresión r
F
k r r 3 r
(k const.),
siendo r el radio vector desde el centro de la radiocircunferencia hasta el punto ocupado instantáneamente por el cuerpo. Calcular el trabajo desarrollado por esta fuerza para llevar a ese objeto a lo largo de una órbita completa. Explique. 3.2. Las fuerzas disipadoras de Reyleigh se definen mediante la fórmula general:
n r˙ ˙ F k r r , r
r
siendo k una constante y n un número entero, positivo. ¿Un cuerpo de masa m que se mueve bajo la acción de una fuerza de Reyleigh satisface la ecuación de conservación de la energía en su forma generalizada como se describió en (3.15)? Explique. ¿Cuál es la energía potencial generalizada? 3.3. Una partícula de masa m se mueve bajo la acción de una fuerza dada por la fórmula:
h2 r F 4 r , mr r
siendo h la magnitud de su momento angular y r el radio vector desde el origen del sistema coordenado hasta la posición instantánea. Calcule las órbitas posibles de esta fuerza. 3.4. Un cuerpo puntual de masa m se mueve en una órbita circular, actuado por una fuerza que tiene su origen en algún punto de la órbita y que es puramente atractiva. Demuestre que esta fuerza debe estar descrita por una fórmula del tipo
229
Las ecuaciones de movimiento
r
F
k r r , 6 r
donde k es una constante. 3.5. Una pequeñísima gota de agua esférica cae bajo la acción de la gravedad. Si a lo largo de su caída, la gota captura agua del vapor que hay a su alrededor y va aumentando uniformemente su volumen a medida que cae, pero conservando siempre una forma esférica, demuestre que su aceleración es de un séptimo de la gravedad. 3.6. El valor del parámetro gravitacional del Sol es: µ ≡ GM ⊗ 3.98506 1014 m3 s 2 ;
si el año sideral de la Tierra es de 365 días, cinco horas, 48 minutos y 46 segundos, calcular el semieje mayor de su órbita, haciendo uso de la tercera ley de Kepler. Con este dato, calcule la energía total de la Tierra, sabiendo que su masa es
m 5.9764 1024 Kg . Calcule así mismo la excentricidad de la órbita. 3.7. Calcular la distancia a la cual está el centro de masa del centro geométrico del Sol en el sistema Tierra-Sol. 3.8. Supóngase que la densidad de masa de la Tierra está dada por la siguiente función de distribución:
r 2 ρ(r ) ρ 0 exp 2 , 2R siendo 0 y R constantes. Calcular el potencial gravitacional hasta el cuadripolo. Explique sus resultados. 3.9. Desarrollando en una serie de potencias la fórmula para la distribución de masa dada en el problema anterior, se tiene, hasta los primeros términos del desarrollo que:
230
Problemas del capítulo
r 2 r 4 r 6 ρ(r ) ρ 0 1 2 4 6 2 R 8R 48R
.
K
Usar este desarrollo para calcular los primeros tres armónicos gravitacionales de la Tierra, J 2, J 3 y J 4. Sustituyendo los valores de 0 y R : ρ 0 5.5794 103 Kg m 3
R 6.3782 106 m calcular los valores numéricos de estos coeficientes. Comparar los resultados con los valores dados en el contexto. Use estos valores para calcular los primeros términos del potencial gravitacional dado por la fórmula (3.137): φ (r )
∞
n
R J n . r n 0 r
µ
∑
¿Podría calcularse aproximadamente la altura máxima que tiene la marea terrestre, cuando la Luna está directamente en el cenit, a partir de la fórmula (3.145)? 3.11. Calcular los parámetros de lanzamiento e inyección en órbita para un vehículo que deberá moverse en una órbita geoestacionaria que esté en el cenit de la Ciudad de México. Supóngase que se hizo el lanzamiento desde la isla de Clipperton (10°19’N, 109°13’W). La Ciudad de México tiene por coordenadas (19°15’N, 99°10’W). 3.10.
231
CAPÍTULO 4 EL CUERPO RÍGIDO
4.1. El cuerpo rígido
El otro problema en el cual la mecánica clásica logró resultados extraordinarios y se consolidó como la teoría más completa de su época es la mecánica del cuerpo rígido. Un cuerpo rígido es, según la definición aceptada, un sistema de muchas partículas que se encuentran vinculadas unas con otras de tal manera, que en todo instante sus distancias relativas son constantes. Para decirlo en pocas palabras, las partículas materiales que constituyen un cuerpo rígido se hallan siempre a distancias relativas invariantes. Así, dados dos puntos materiales cualesquiera de un cuerpo rígido, la distancia entre ellos, medida desde un marco de referencia anclado en algún punto del espacio es, de acuerdo a la figura 4.1.1: r
r
ri r j const.
(4.1)
No importa la forma como se desplace el cuerpo por el espacio, esos puntos (todos) se moverán de manera tal que sus distancias relativas permanecerán inalterables. La expresión (4.1) es válida para todos los puntos de ese cuerpo; esto es para
i , j 1, 2, K, N , siendo N el número total de partículas materiales que integran ese cuerpo rígido. La definición anterior sirve para distinguir a los cuerpos rígidos de su contraparte, los llamados cuerpos deformables, para los cuales, al contrario
233
El cuerpo rígido
z
r j r i
r i
0
r j
y x
Figura 4.1.1. Dos puntos cualesquiera de un cuerpo rígido permanecen siempre
a distancia invariable entre sí.
de aquellos, las distancias entre sus puntos materiales constitutivos no permanecen fijas, sino que cambian a lo largo del tiempo. Pero antes de proseguir más con el desarrollo de la formulación matemática de la mecánica de los cuerpos rígidos, es muy importante establecer ciertos conceptos, ciertas definiciones, con las cuales será posible avanzar en tal desarrollo. Lo primero que es necesario puntualizar es el hecho, ya descrito, de que un cuerpo rígido es un sistema de partículas. Esto significa que, cuando se ve urgido por fuerzas aplicadas, su estado de movimiento cambiará, tal como se demostró en el capítulo anterior, como si todas las fuerzas aplicadas se concentraran en su centro de masa y todas las partículas que lo integran siguieran a ese centro de masa. Ahora, puesto que este sistema de partículas es muy peculiar y todas ellas se hallan a distancias invariantes entre sí (por la definición misma de cuerpo rígido), conocer el cambio de estado de movimiento del centro de masa es indicativo del cambio de movimiento de todo el sistema. En otras palabras, el cuerpo se desplaza por el espacio siguiendo la trayectoria de su centro de masa. De hecho, si la trayectoria del centro de masa es conocida, entonces cualquier otro punto material del cuerpo rígido, el que sea, se moverá
234
Antecedentes
Figura 4.1.2. Un cuerpo rígido se desplaza al través del espacio y pivotea (cambia
su orientación).
siguiendo al centro de masa y a lo más podrá desplazarse en relación a él, moviéndose sobre una esfera centrada en ese punto (el centro de masa) y cuyo radio sea igual a la distancia relativa entre esa partícula y el propio centro de masa. Así, si se supone por el momento que hay un sistema de coordenadas anclado en el centro de masa, cualquier otro punto material sólo puede moverse alrededor de él sobre una superficie esférica, ejecutando giros o, como se debe expresar propiamente, pivoteos alrededor del centro de masa del cuerpo. Todo punto del cuerpo rígido, por consiguiente, se mueve con un movimiento de traslación (siguiendo al centro de masa) y un pivoteo (alrededor del centro de masa). El cuerpo rígido en su totalidad, al ser urgido por agentes físicos externos, se desplaza y pivotea, tal como se muestra en la figura 4.1.2., donde se han dibujado dos posiciones sucesivas de un cuerpo rígido en el espacio. Estas cualidades acerca del movimiento fueron estudiadas por primera vez por un poco conocido matemático francés: Michel Chasles (1793-1880); profesor de la Sorbona de París, quien propuso estos resultados como un teorema. Hasta la fecha se le conoce como el teorema de Chasles y se enuncia diciendo que: El movimiento más general del cuerpo rígido se puede descomponer en una traslación
235
El cuerpo rígido
y un pivoteo. La traslación más sencilla de describir es la del centro de masa del cuerpo y el pivoteo igualmente se puede referir al centro de masa o a algún otro punto del cuerpo rígido. Este último efecto; el del pivoteo, es un cambio de orientación del cuerpo en el espacio. Últimamente y debido a la fuerte influencia que el lenguaje inglés ha tenido sobre el resto de las lenguas del mundo y en particular sobre el español, al cambio de orientación de un cuerpo en el espacio se le refiere frecuentemente como un cambio en su actitud (del inglés attitude ). El teorema de Chasles es de gran importancia en la mecánica del cuerpo rígido porque permite hacer una síntesis del movimiento más general de cualquier cuerpo rígido en sus dos clases: la traslación del centro de masa y el pivoteo. La gran ventaja de esta síntesis es que la traslación del centro de masa, en particular, es el problema del movimiento de un solo punto material; aquel que tiene la masa de todo el cuerpo. El movimiento de un punto material en el espacio, como respuesta a fuerzas aplicadas es un problema relativamente simple, pues sólo hay que plantear un sistema de tres ecuaciones diferenciales de movimiento, tal como se hizo al principio del capítulo 2. Se trata pues, de un problema que está bien entendido y cuyo planteamiento y resolución al menos son perfectamente claros y directos. Por lo tanto, el problema general, el de describir el movimiento general de un cuerpo rígido, en realidad puede desglosarse en dos problemas independientes: uno es el que involucra al centro de masa y se plantea y resuelve con los métodos de la mecánica de una sola partícula puntual, y el otro es el que concierne a la descripción de los pivoteos de un cuerpo rígido. Esto es lo nuevo; esto es a lo que hay que avocarse en lo sucesivo, ya que el otro: la traslación del centro de masa está, en principio, resuelto, al menos teóricamente. Lo que procederá en adelante es suponer que el cuerpo rígido no via ja por el espacio; únicamente se considerarán los pivoteos ignorando las traslaciones. ¿Pero qué es exactamente un pivoteo? Un pivoteo es una rotación de un cuerpo alrededor de cierto eje y sobre un punto fijo. En efecto, al ocurrir un pivoteo, hay un eje, una línea recta en el espacio que, al menos instantáneamente, permanece fija y alrededor de la cual, todos los puntos del cuerpo ejecutan movimientos circulares. Puede ser que esa línea recta; ese eje instantáneo de giro solamente lo sea por breves instantes y al cabo, un nuevo eje sirva para que las partículas del cuerpo giren a su alrededor.
236
Antecedentes
Figura 4.1.3. Un cuerpo rígido de forma caprichosa gira
alrededor del eje instantáneo de giro. Parte del eje está fuera del cuerpo y parte dentro de él.
Puede ser que el eje se mueva continuamente y con él el cuerpo cambie su pivoteo. Es muy importante precisar dos cosas más acerca del eje instantáneo de giro: la primera es que el eje puede ser una línea imaginaria en el espacio, o bien, puede ocurrir que esté formada por puntos materiales del propio cuerpo; esto es, que el eje esté dentro del cuerpo rígido mismo; o parte dentro de él y otra parte fuera. En la figura 4.1.3. se muestra un cuerpo rígido con una forma caprichosa que gira alrededor de un eje instantáneo de giro que parcialmente atraviesa al cuerpo. El segundo punto que es necesario aclarar acerca de los ejes instantáneos de giro de un cuerpo rígido, es que todos ellos tienen un punto fijo común. Un punto fijo en el espacio que es común a todos los ejes instantáneos de giro de un cuerpo rígido que solamente gira, sin trasladarse en el espacio. Este punto fijo común es el llamado pivote del movimiento. Nuevamente hay que aclarar que el pivote puede estar en el cuerpo rígido o fuera de él, pero se trata, en todo caso, de un punto que permanece fijo a lo largo del movimiento.
237
El cuerpo rígido
r
r 0
0 Figura 4.1.4. Un cuerpo rígido pivotea alrededor del eje de
giro. El pivote está en O . Un punto material se localiza mediante el radio vector r 0. Un instante después esta en r .
Así mismo, todos los puntos del cuerpo por los que pasa el eje instantáneo de giro, están momentáneamente en reposo; tan pronto como el eje cambia, ellos vuelven a moverse. Ahora, supóngase que se observa algún punto material de un cuerpo rígido en rotación, desde el origen de un sistema coordenado que coincide con el pivote (recuérdese que las traslaciones del cuerpo se han ignorado y que se considera al cuerpo girando sobre un punto fijo), tal como se ve en la figura 4.1.4. El cuerpo gira alrededor de un eje instantáneo y con él giran todos sus puntos materiales, a excepción de aquellos que yacen sobre ese eje. Así que si se observa un punto material del cuerpo, en un instante t 0 se encuentra en la posición marcada por el radio vector r 0. Al girar, va ocupando diferentes posiciones sucesivas en el espacio. En un instante posterior t , se hallará en la posición marcada por el nuevo radio vector r . Ambos vectores; el inicial r 0 y el final, r , tienen el mismo origen y apuntan al mismo punto material del cuerpo rígido, pero al girar, y ocupar distintas posiciones en el espacio, el punto material es señalado por vectores distintos. Se puede asociar el cambio de posición del punto material del cuerpo,
238
Antecedentes
con una transformación del radio vector, con el cual se le ubica desde el origen O . Una transformación que mapea el vector r 0 a t t 0, con el vector r en un instante posterior se representa en general así:
r
r
T : r0 → r (t ). Pero es mucho más conveniente invocar a la representación de matrices para expresar matemáticamente esta operación que consiste en girar un radio vector alrededor de un eje y sobre un punto fijo. Esta transformación, llamada una rotación se escribe como sigue: r
r
r (t ) R(t ) ⋅ r0
(4.2)
en donde R(t ) representa una matriz de 33, función del tiempo, que al operar sobre r 0 lo transforma en r (t ). A tal matriz se le llama matriz de rotación y posee una colección de propiedades que la hacen sumamente interesante. En primer lugar hay que destacar que para un mismo punto material hay todo un conjunto de matrices de rotación que al operar sobre alguna de sus posiciones instantáneas lo mapea; lo “desplaza” a una nueva ubicación en el espacio euclideo tridimensional. El conjunto de matrices de rotación es infinito,
≡ R1 , R2 , R3 , K
{
}
(4.3)
ya que el número de posiciones sucesivas de un punto material es equivalente a una matriz de rotación. Si no, piénsese que una rotación se puede descomponer en dos etapas; en dos rotaciones sucesivas que llevan al punto desde una posición inicial, a otra intermedia, y luego a una posición final en el espacio; o sea que para cualesquiera dos matrices de rotación R1 y R2 del conjunto se tiene que R1
o
R2 R3
∈ .
(4.4)
En otras palabras, la composición de dos matrices de rotación da como resultado una nueva matriz de rotación. La regla de composición es la multiplicación matricial de renglones por columnas.
239
El cuerpo rígido
La matriz unidad 1 ; aquella que está formada por ceros y unos, 1 0 0 1 ≡ 0 1 0 0 0 1
(4.5)
también pertenece al conjunto ; es aquella que no provoca rotación alguna en el punto material, lo deja en el mismo sitio. Esta matriz tiene la propiedad de que al actuar sobre alguna otra matriz de rotación o al ser actuada por alguna matriz de rotación, las deja sin cambio; esto es
⋅ ≡ R ⋅ 1 R.
1 R
(4.6)
Finalmente, dada una matriz R del conjunto , que representa la rotación de un punto material de un cuerpo rígido, tal como se mencionó anteriormente, la matriz R1 es aquella que representa una rotación en sentido contrario a la anterior pero que es de igual tamaño; así que, aplicando R y a continuación R1 es como llevar a un punto material en un sentido y luego hacerlo seguir el mismo camino en sentido contrario hasta llegar al punto de partida. Matemáticamente esta situación se representa así: dada una matriz R de , existe otra R1 del mismo conjunto, llamada inversa de R , tal que
⋅
R R
1
≡ R1 ⋅ R 1 .
(4.7)
Estas propiedades; esto es, que el conjunto esté formado por elementos (matrices) que satisfacen la cerradura (4.4), la existencia del elemento (matricial) neutro ante la operación de composición de los elementos de ese conjunto (multiplicación matricial), definido en (4.5) y (4.6) y la existencia del elemento inverso para cada una de las matrices de , dado por (4.7), constituyen una estructura algebraica muy conocida de las matemáticas y muy importante en la física llamado grupo. En el caso que aquí se estudia, se trata del grupo de rotaciones en tres dimensiones . Así que los pivoteos de un cuerpo rígido se describen con este grupo. En adelante, el grupo de rotaciones de un cuerpo rígido en el espacio euclideo tridimensional se representará como
240
Antecedentes
(3)
(4.8)
y se leerá igualmente como grupo de rotaciones de un cuerpo rígido en 3D , o también grupo ortogonal en tres dimensiones . En seguida se aclarará porque se le llama “ortogonal”. Se trata, de un grupo infinito, ya que el número de elementos que lo componen es infinito. También hay que mencionar que se trata de un grupo de los llamados continuos o de Lie ; esto último en recuerdo de Sophus Lie, un físico noruego (1842-1899) que en 1896 publicó un traba jo monumental sobre estos grupos. Otra característica importante del grupo ortogonal en tres dimensiones, es que debe preservar la distancia entre puntos de un cuerpo rígido. Si la distancia entre dos puntos cualesquiera está dada por (4.1), pero al ocurrir una rotación cada uno de los puntos emigra a otro sitio en el espacio, de acuerdo con (4.2), entonces
r j ri R ⋅ (r j 0 ri 0 ) , r
r
r
r
así que, tomando el cuadrado del valor absoluto de esta diferencia de vectores se debe tener, de acuerdo con (4.1) que: 2
T
r j ri (r j 0 ri 0 ) ⋅ R ⋅ R ⋅ (r j 0 ri 0 ) ≡ r j 0 ri 0 r
r
r
r
T
r
r
r
r
2
(4.9)
en donde una T en la parte superior derecha de una matriz significa que se trata de la matriz transpuesta ; esto es, aquella matriz que se obtiene de la original (la que no lleva la T ), intercambiando renglones por columnas y viceversa. La expresión anterior hace uso, además, de la regla que establece que la transpuesta del producto de dos matrices es igual al producto de las transpuestas de las matrices, pero tomados en orden contrario; esto es, dadas dos matrices A y B , entonces T
( ⋅ ) a B
BT
⋅ AT .
(4.10)
Regresando a (4.9), se puede observar que para que se satisfaga el requisito que el cuadrado de la norma de la diferencia de los vectores sea invariante ante una rotación se debe satisfacer que
241
El cuerpo rígido
T
⋅ R 1 .
R
(4.11)
En palabras, lo que significa (4.11) es que las matrices R del grupo (3) son, en efecto auto ortogonales; esto es que su producto interno da la identidad. Pero la propiedad de ortogonalidad (4.11) implica a su vez dos resultados muy interesantes: en primer lugar, comparando (4.11) con (4.7) se ve que T
R
≡ R1
(4.12)
es decir, que la transpuesta de una matriz del grupo de rotaciones en 3D es igual a su inversa. Este resultado también se pudo haber obtenido de (4.11) si se hubiera multiplicado miembro a miembro, desde la derecha, por la matriz inversa. Entonces, invocando a las propiedades (4.6) y (4.7), se obtiene de nueva cuenta (4.12). El segundo hecho relacionado con la condición de ortogonalidad de las matrices de rotación se hace evidente si se calcula a ambos miembros de (4.11) el determinante: det
(
T
R
⋅ R ) (det RT ) (det R ) (det R )
2
1
(4.13)
puesto que el determinante del producto de matrices es igual al producto de los determinantes de las matrices y, además, el determinante de una matriz transpuesta es igual al determinante de la matriz original. Por lo tanto, de (4.13) se infiere de inmediato que todas las matrices de (3) tienen un determinante no nulo; esto es, son no-singulares y su valor es det R 1.
(4.14)
El grupo ortogonal tiene dos piezas : la pieza propia , que está constituida por todas las matrices de rotación que tienen determinante igual a (1) y la pieza impropia , que consta de todas las matrices de rotación con determinante igual a (1). Se dice que estas dos piezas, (3)
y (3)
242
Antecedentes
z x
R_
0
0
y
y
x z
Figura 4.1.5. Un ejemplo de una transformación R de la pieza impropia de (3)
es una inversión total.
están topológicamente desconectadas entre sí, pues no es posible, por una sucesión de rotaciones propias, obtener una rotación impropia, ni viceversa. Más aún: la pieza propia, en sí misma, forma un subgrupo de (3); el llamado grupo propio (3), puesto que la sucesión de dos rotaciones propias es, a su vez, una rotación propia, la transpuesta de una rotación propia es a su vez propia y la matriz unidad es propia (det 1 1). Por el contrario, la pieza impropia no forma grupo ya que carece del elemento neutro. Un ejemplo de una transformación R que pertenece a la pieza impropia de (3) es una inversión total , como la que se muestra en la figura 4.1.5. Una inversión total ocurre cuando los ejes coordenados de un sistema cartesiano se transforman en su negativo; esto es:
x → x x y → y y z → z z . En este caso, la matriz que opera la transformación es, evidentemente
243
El cuerpo rígido
1 R
≡ 0 0
0 0 1 0 , 0 1
(4.15)
cuyo determinante es igual a menos uno. Las rotaciones impropias juegan un papel de poca importancia dentro de la teoría del cuerpo rígido, por lo tanto en este contexto no se mencionarán más. En cambio, el subgrupo de rotaciones propias es sumamente relevante es este estudio. Una rotación propia es cualquier pivoteo de los tres ejes coordenados, sobre el origen, que preserva la ortogonalidad entre ellos. En particular, una rotación simple , es un ejemplo de una rotación propia. En la figura 4.1.6. se representa una operación así. Se trata de girar los ejes coordenados OY y OZ , alrededor de OX , rígidamente por un ángulo . El eje de giro es el eje de las abscisas en este ejemplo, pero una rotación simple puede realizarse igualmente alrededor del eje de las ordenadas o de las cotas. Los otros dos ejes giran, preservando su ortogonalidad, ya sea en el sentido de las manecillas del reloj (rotación simple, directa), o en contra de las manecillas del reloj (rotación simple, inversa). En el ejemplo que se exhibe en la figura 4.1.6., la matriz de rotación es 1 0 0 R 0 sen β cos α 0 cos α sen α
(4.16)
como se puede comprobar a partir de simples consideraciones de trigonometría. También resulta inmediato demostrar que la matriz R en (4.16) tiene un determinante igual a uno; que deja al eje de las abscisas invariante y que su inversa es precisamente igual a su transpuesta: 1 0 0 T R 0 sen α cos α 0 cos α sen α
(4.17)
ya que al multiplicar (4.16) por (4.17) o viceversa, se obtiene como resultado la matriz unidad, que es el elemento neutro multiplicativo del grupo.
244
Antecedentes
z
z
R
0
y
0
y
x x
Figura 4.1.6. Un ejemplo de una transformación R del subgrupo propio de (3) es una rotación simple. Aquí se representa una rotación simple por un
ángulo , tomando como eje de giro al OX .
Finalmente, es preciso notar que una rotación simple, se representa mediante una matriz monoparamétrica ; esto es, que sus elementos se expresan en términos de un solo parámetro. En el ejemplo que se vio, el parámetro es el ángulo de la rotación. Se trata de un número real, acotado entre 0 y 2. En el caso de pivoteos generales, se podrá mostrar en seguida que más de un parámetro es necesario para describirlos. Los grupos continuos, como es el caso del grupo (3) tienen una propiedad adicional que los hace muy interesantes desde el punto de vista de su manejo analítico: pueden ser construidos a partir de ciertos elementos básicos por un proceso de integración. En efecto, el grupo continuo de transformaciones en 3D tiene entre sus elementos, las llamadas rotaciones infinitesimales . Éstas pueden ser imaginadas, en efecto, como pivoteos extraordinariamente pequeños de un cuerpo rígido con respecto a cierto eje instantáneo de giro. Tan pequeños son estos pivoteos, que casi son imperceptibles; esto es, que difieren de la matriz identidad (no-pivoteo), por un término infinitesimal, de tal suerte que pueden ser representados matemáticamente de la siguiente forma:
245
El cuerpo rígido
(4.18)
R 1 ε
como la suma de la matriz identidad, más otra que representa la parte infinitesimal del pivoteo. Ahora, de acuerdo con la propiedad de ortogonalidad de las matrices de rotación que se exhibió en (4.11), se debe satisfacer para estas transformaciones que:
(1 εT ) ⋅ (1 ε ) 1 ;
(4.19)
o bien, desarrollando este producto, cancelando la matriz idéntica a ambos miembros y conservando solamente aquellos de primer grado en la parte infinitesimal se obtiene que: ε ≈ ε T .
(4.20)
El resultado (4.20) demuestra que la parte infinitesimal de la transformación (4.18) es, en sí mismo, una matriz antisimétrica. Por lo tanto, se trata de un arreglo en cuya diagonal principal se hallan ceros y los tres elementos fuera de la diagonal principal y por arriba de ella son iguales numéricamente, pero de signos opuestos a los tres elementos que se encuentran abajo de la diagonal principal; algo de la forma siguiente: 0
ε1
ε ε1 0 ε 2 ε 3
ε 2 ε 3 .
(4.21)
0
De esta manera, una transformación infinitesimal queda totalmente descrita si se conocen tres cantidades: 1, 2 y 3. Más aún tratándose de una transformación finita (lo contrario de una transformación infinitesimal), ésta puede concebirse como compuesta por una sucesión muy grande de transformaciones infinitesimales. Supóngase que, en efecto, un pivoteo finito se lleva a cabo mediante una sucesión de N pequeños pivoteos, tales que si la posición inicial del radio desde el origen del sistema coordenado hasta un punto material cualquiera del cuerpo rígido (excepto uno que esté sobre el eje instantáneo
246
Antecedentes
de giro), es r 0, entonces, al realizar el primer pivoteo pequeño, el punto material ocupa una nueva posición r (1) dada por
ε r 1 ⋅ r 0 N r
(1)
r
(4.22)
en donde es la pequeña rotación y se ha dividido entre N para garantizar su pequeñez. Ahora, una vez que se ha llegado a r (1), mediante una nueva rotación pequeña se lleva el punto material a su nueva posición r (2)
r ( 2) 1 r
ε r(1) ⋅ r
(4.23)
N
muy próxima a la anterior. Pero recordando el resultado (4.22), sustituyendo en (4.23) se tiene que:
r ( 2) 1 r
ε ⋅ 1 ⋅ r 0 ; N N ε
r
(4.24)
es decir, que a la segunda posición del punto material se ha llegado mediante una sucesión de dos pequeños pivoteos. Debe ser claro ahora que si el punto al que se desea acceder es r , mediante la sucesión de N pequeños pivoteos, entonces (ver la figura 4.1.7.): r
r 1
ε ⋅ 1 ⋅ N N ε
ε ⋅ 1 ⋅ r 0 N r
K
N
,
o bien; si el número de ellos se hace mayor hasta tender al infinito, entonces: N
ε r lím 1 ⋅ r 0 . N → ∞ N r
r
247
(4.25)
El cuerpo rígido
r (n)
r
r 0
r (1) r (2)
0 Figura 4.1.7. Un pivoteo finito se descompone en una sucesión de
pequeños.
N pivoteos
Pero la fórmula (4.25) se puede rescribir en una forma compacta recordando la célebre expresión debida a Weierstrass [Karl, Theodor Wilhelm von Weierstrass (1815-1897)]:
N → ∞
N
lím 1
x ≡ e x ; N
(4.26)
así que para un pivoteo finito cualquiera de un cuerpo rígido se tiene que: r
r
r exp(ε ) ⋅ r 0 .
(4.27)
Ahora, recordando (4.2), que es la fórmula donde se estableció matemáticamente por primera vez la expresión para un pivoteo de un punto material de un cuerpo rígido y comparándola con (4.27) que dice exactamente lo mismo que aquella, pero desglosada en términos de la parte infinitesimal de un pivoteo, se puede ver que, en general:
248
Antecedentes
R
≡ exp(ε ) .
(4.28)
Esta fórmula es sumamente interesante, pues muestra cómo un pivoteo general de un cuerpo rígido puede ser generado a partir de otro infinitesimal. Así, no obstante que el grupo (3) es infinito, sus elementos surgen como el proceso de exponenciación de pivoteos infinitesimales. O para expresarlo correctamente: el grupo (3) se “integra” con los generadores infinitesimales . Cabe recordar que la exponencial es una serie de potencias de su argumento, de manera que otra forma de escribir la fórmula (4.28) es:
R ≡
∞
1 N 1 1 ε ) 1 ε 2 ε 3 K, ( 2! 3! N 0 N !
∑
(4.29)
donde, por supuesto ε N ≡ ε ⋅ ε ⋅ ε
⋅ ε K
N
(4.30)
es la multiplicación matricial de por sí misma N veces. El resultado es nuevamente una matriz de rotación. Por otra parte, el hecho de que 1) el grupo se pueda integrar completamente a partir de sus elementos infinitesimales y 2), que los elementos mismos estén compuestos de no más de tres parámetros reales (∈1, ∈2 y ∈3), significa que, en general, para describir cualquier pivoteo de un cuerpo rígido, es necesario hacerlo en términos de no más que tres parámetros. Hay diferentes criterios para definir los tres parámetros independientes que se requieren para describir completamente un pivoteo de un cuerpo rígido. Se puede afirmar que para cada estudio que se emprenda sobre este tema hay una terna de parámetros idóneos. Por ejemplo, si se desea describir el movimiento de un brazo manipulador robótico; de esos que se utilizan cada vez con mayor frecuencia en la industria manufacturera, es necesario determinar primero, cuántos eslabones lo componen (puede ser un brazo con un solo eslabón, con dos, tres, o más) y para cada uno de ellos, considerado como un cuerpo rígido, proponer el juego de parámetros que mejor se adaptan para describirlo. En la figura 4.1.8. se muestra el esquema de uno de estos manipuladores. So-
249
El cuerpo rígido
z
0
y
x Figura 4.1.8. Un brazo manipulador robótico, con un solo eslabón tiene dos
grados de libertad: un giro horizontal y otro vertical.
lamente consta de un eslabón (su brazo) y sólo puede girar en torno a la vertical un ángulo que puede ser de hasta 360° en cualquier sentido. Este es lo que se llama un grado de libertad del manipulador. Además, el brazo puede girar alrededor de un eje horizontal por un ángulo que puede variar entre cero y 180° en sus dos sentidos; este es otro grado de libertad del manipulador. En total para describir este movimiento, no se han requerido más de dos parámetros (grados de libertad) independientes. 4.2. Marcos de referencia acelerados
Leonhard Euler (nació el 15 de abril de 1707 en Basilea, Suiza y murió el 18 de septiembre de 1783 en San Petersburgo, Rusia), propuso una técnica para descomponer un pivoteo cualquiera de un cuerpo rígido en tres rotaciones simples sucesivas, cada una de las cuales, como ya se mencionó, requiere de un solo parámetro para describirla. Esta técnica, que se conoce como los ángulos de Euler , ha resultado ser de extraordinaria ayuda para es-
250
Marcos de referencia acelerados
tudiar y comprender los movimientos de un cuerpo rígido cuando se le supone libre de traslaciones. A continuación se verá con detalle la descomposición de los pivoteos por los ángulos de Euler. Para alcanzar este objetivo es necesario hacer ciertas consideraciones preliminares: en primer lugar se supondrá que el cuerpo rígido no se traslada; únicamente pivotea alrededor de un punto fijo en el espacio. La razón por la cual pivotea no viene aquí a cuento; esto es parte de la dinámica que se estudiará más adelante. En segundo término, supóngase la existencia de un marco de referencia inercial, dotado de un sistema coordenado cartesiano tridimensional, desde el cual se observa el movimiento del cuerpo rígido. El origen del sistema coordenado se ubica precisamente en el punto fijo; en el pivote, alrededor del cual gira el cuerpo. A este sistema se le llamará el marco de referencia fijo en el espacio . Un segundo marco de referencia es necesario. Se trata de un observador fijo en el pivote del cuerpo rígido y dotado de un sistema coordenado cartesiano, tridimensional que se mueve con el cuerpo rígido. Este es el llamado marco de referencia fijo al cuerpo. El sistema de coordenadas del marco de referencia fijo al cuerpo no es inercial en general, pues al seguir al cuerpo rígido en sus pivoteos está sujeto, igual que éste, a aceleraciones. En la figura 4.1.9 se exhibe un cuerpo rígido de forma arbitraria que pivotea alrededor de un punto fijo O . En este punto se han asentado dos sistemas de coordenadas: el del marco de referencia fijo en el espacio, cuyos ejes se han etiquetado con letras minúsculas Ox , Oy , Oz ; y el marco de referencia fijo al cuerpo cuyos ejes son OX , OY , OZ . Para construir el marco de referencia fijo al espacio, se ha tomado como eje de las cotas a la línea vertical; es decir, la que emerge del origen y apunta en sentido opuesto al centro de la Tierra (suponiendo que el cuerpo rígido se estudia sobre la superficie terrestre. Claramente esta idea se puede trasladar a cualquier otro lugar del universo). Los otros dos ejes coordenados se escogen de manera que sean perpendiculares al eje de las cotas y ortogonales entre sí, pero fuera de esta restricción, hay completa libertad acerca de su dirección específica. Por su parte, el sistema coordenado del marco de referencia fijo al cuerpo se construye tomando como eje de las cotas al eje de giro del cuerpo y que parte igualmente del pivote, donde está el origen. Los sistemas cartesianos, fijo en el espacio (inercial) y fijo al cuerpo (no inercial), jugarán un papel muy importante para la cinemática y la dinámi-
251
El cuerpo rígido
z
Z
X y
0
x Y Figura 4.1.9. Un cuerpo rígido pivotea alrededor de un punto fijo
O . Se muestran, el marco de referencia fijo al cuerpo ( X , Y , Z ) y el marco de referencia fijo al espacio ( x , y , z ).
ca del cuerpo rígido, de modo que se debe tener en cuenta a lo largo de este contexto y no perder de vista cuál de ellos es el que está sirviendo como marco de referencia en cada parte del desarrollo. Algunas veces será muy conveniente aludir al primero, en tanto que otras, por razones que en su tiempo se aclararán, será pertinente invocar a la descripción desde el otro, el marco fijo en el cuerpo. ——o—— Tal vez uno de los más importantes postulados de la mecánica newtoniana es aquel que tiene que ver con los marcos de referencia inerciales. La primera ley, de hecho, es aquella que establece su existencia y fija por vez primera y para toda la teoría, las reglas de asociación entre un marco de referencia inercial y el movimiento de los cuerpos masivos, cuando establece
252
Marcos de referencia acelerados
que el caso más simple de todos los movimientos que se observan desde este marco: el movimiento rectilíneo uniforme, corresponde al caso más simple de todas las fuerzas, que es la ausencia de ella. Así, si se sabe que un cuerpo está libre de fuerzas y se le ve con un movimiento rectilíneo uniforme, entonces, sin lugar a dudas, el observador que lo registra es inercial; y viceversa: si se está ciertamente en un marco de referencia inercial, entonces al observar un cuerpo que se mueve en forma rectilínea y uniforme, se dice sin lugar a dudas que ese cuerpo está libre de fuerzas. El razonamiento no podría ser más claro y directo. Sin embargo tiene un pero: en la práctica no existen los marcos de referencia inerciales. No, no ha sido posible hasta ahora hallar un lugar del universo donde un marco de referencia establecido sea auténtica y definitivamente inercial. En forma local e instantánea un observador parado en algún lugar sobre la Tierra puede considerarse inercial. Si las medidas de distancias que desea hacer no exceden de unos cuantos centímetros y los lapsos que registra no son superiores a algunos segundos, puede, en efecto, decirse inercial cuando compara su propio estado de movimiento (reposo) con respecto a las estrellas lejanas. Pasados unos segundos, los efectos debidos a la rotación de la Tierra se harán presentes y el encanto de la inercialidad desaparecerá. Cuerpos libres se observarán como si estuvieran acelerados; las propias estrellas lejanas comenzarán a dar “vueltas” alrededor del observador y, por supuesto, los fenómenos que se trata de observar y medir se verán contaminados por la no-inercialidad del marco de referencia. Una posible estrategia podría ser la de instalar un marco de referencia en el centro mismo de la Tierra. De hecho, en forma teórica al menos, los marcos de referencia geocéntricos se usan frecuentemente en la astrodinámica de los satélites artificiales, estaciones orbitales y viajes espaciales desde este planeta. En un marco así, el efecto de la rotación terrestre alrededor de su eje de giro se elimina automáticamente, así que, al menos esa no-inercialidad desaparece. Distancias mucho mayores, del orden de cientos o quizá miles de metros y lapsos de varios minutos pueden ser las cotas al movimiento rectilíneo uniforme o su caso particular, el reposo. No obstante, pasados estos límites, de nueva cuenta las aceleraciones aparentes de las estrellas lejanas volverán a hacerse importantes, debido a que la Tierra misma se encuentra sujeta a la aceleración centrípeta hacia el Sol, en su viaje orbital alrededor del centro del Sistema Solar.
253
El cuerpo rígido
También esas no inercialidades pueden ser eliminadas si ahora se piensa en instalar un marco de referencia teórico en el centro del Sol; el llamado marco heliocéntrico inercial. Desde él, observadores ubicados en su origen podrían considerarse como inerciales durante lapsos aún mayores; tal vez de decenas de años. Pero nunca llega la felicidad completa. El Sol es una de tantas centenas de miles de millones de estrellas que giran alrededor del gigantesco hoyo negro en el centro de la galaxia Vía Láctea haciéndolas moverse a su alrededor en trayectorias que se cierran aproximadamente en periodos variables y que para el caso de la Tierra es de unos ciento cincuenta millones de años. Así que también el Sol experimenta una aceleración y por lo tanto, en su centro, un marco de referencia tampoco es inercial. El proceso no tiene fin. Del centro del Sol se puede pensar en trasladar el marco de referencia al centro de la galaxia, pero resulta que la Vía Láctea forma parte de un conjunto de galaxias llamado el cúmulo local , el cual a su vez es parte de un conjunto de cúmulos, etc. Quizá pudiera concluir este cansado proceso, este peregrinar por el universo, si en un momento dado se encontrara ese sitio único, donde todas las interacciones, todas las atracciones, todas las colisiones, la radiación de todas las longitudes de onda, todo, hubiera sufrido un proceso de interferencia destructiva y allí en verdad, eternamente, no pasara nada. Allí, armados de tres reglas y un reloj se podría instalar el marco de re ferencia primario, el más prístino de todos los marcos de referencia, donde, ahora sí, las leyes de Newton pudieran ser ratificadas de una vez y para siempre. Ese sería el punto del universo donde ciertamente nada ocurre jamás y en consecuencia permite observar, libre de toda interferencia, el resto del universo. Una vez encontrado ese punto; una vez que ese marco inercial primario se haya establecido, se pueden construir réplicas de él en otras partes del universo, sin problemas. Es como tener un marco de referencia patrón y luego fabricar copias de él y llevarlas a otro sitio: a los laboratorios terrestres, por ejemplo, para desde allí realizar observaciones confiables y seguras de los acontecimientos. Hacer una copia y llevarla a algún punto de la superficie terrestre es la cosa más simple si se cuenta con el álgebra lineal. Hacer una transformación de coordenadas que mapea marcos de referencia en marcos de referencia es un asunto que tiene que ver con una traslación y un pivoteo rígido; eso es todo. Una traslación que lleve el origen
254
Marcos de referencia acelerados
del sistema inercial primario, desde allá donde se encuentra, en el centro del universo, hasta un punto movedizo sobre la Tierra. Un pivoteo rígido que oriente continuamente los ejes coordenados del marco terrestre para que apunten en las direcciones de aquellos que están en el confín del espacio, inmutables y enhiestos. El resultado de esta transformación es, como se dijo, hacer copias de aquel marco de referencia inercial primario en puntos sobre la Tierra. De hecho, con esta tecnología algebraica es posible, al menos en teoría, cubrir literalmente el universo de marcos inerciales que sean, todos y cada uno de ellos, copias fieles de aquel; así que la Tierra y su gente, en su tránsito a través del cosmos, puede estar segura de que en cada punto que pase hallará un marco de referencia inercial del cual se pueda servir para hacer mecánica. Bueno, la verdad sea dicha, todo lo anterior suena bien en teoría, pero es claro que es absolutamente impracticable. Para comenzar, ese punto del universo donde las cosas han dejado de ocurrir, quién sabe donde estará. Muy probablemente ni siquiera exista, pues para que pudiera darse, tendría que haber, en efecto, un promedio de interacciones nulo. Pero para poder realizar tal promedio sobre cuerpos, campos y espacio se requiere ¡vaya la perogrullada! que el promedio se pueda realmente hacer; esto es, que el universo sea finito y cerrado. De otra manera carece de sentido esta operación y el sitio del marco de referencia inercial primario ni siquiera existe. Gaspard Gustave de Coriolis, un ingeniero y científico francés que nació en París el 21 de mayo de 1792 y que tuvo una vida difícil, acosado por enfermedades y finalmente una temprana muerte en 1843, fue quien se planteó este problema de la mecánica; aquel que tiene que ver con que, para su funcionamiento requiere de marcos de referencia inerciales, pero éstos no existen en forma general, sino localmente. El trabajo de Coriolis consistió en traducir la mecánica clásica de Newton a marcos de referencia no-inerciales; marcos acelerados traslacional y rotacionalmente. Para hacerlo, Coriolis parte del establecimiento de la mecánica, tal como lo hizo Newton originalmente, refiriendo sus leyes a observadores inerciales y en seguida transforma esas expresiones a sistemas de coordenadas que se desplazan o que giran. Aquí se seguirá un procedimiento muy parecido al original para realizar tales transformaciones. Supóngase para iniciar, que se tienen dos sistemas de coordenadas; uno de ellos es inercial y se encuentra en reposo, en tanto que el otro se
255
El cuerpo rígido
y y
vt
x 0
x
0
Figura 4.2.0. Un sistema de coordenadas se mueve con una aceleración cons-
tante a hacia la derecha de otro que es inercial y está en reposo.
mueve con una aceleración constante, en línea recta y hacia la derecha del primero, tal como se muestra en la figura 4.2.0. Por facilidad se han dibujado dos sistemas de coordenadas bidimensionales y se propone que el marco acelerado se mueva a lo largo de la dirección mutua de abscisas; sin embargo, como se apreciará, estas consideraciones se pueden generalizar de inmediato. Imagínese que en algún instante inicial tomado arbitrariamente como t 0 igual a cero, el marco no inercial se encontraba a la derecha del inercial, de manera que su origen O tuviera las coordenadas inerciales ( x 0, 0) y que se viajara en ese mismo sentido con una velocidad horizontal v 0 y una aceleración a 0. En cualquier instante posterior, el origen O tendría por coordenadas inerciales 1 x x x0 ν 0t a 0t 2 , 2
(4.31 a)
y y .
(4.31 b)
256
Marcos de referencia acelerados
Estas fórmulas son las expresiones para la ley de transformación de los sistemas coordenados. Se les conoce como la transformación de Galileo y dan la regla para traducir entre dos marcos de referencia, la posición instantánea de una partícula en el espacio. Si la partícula se mueve urgida por algún agente físico, entonces, desde el marco de referencia inercial y de acuerdo con la segunda ley de la mecánica, existe una relación directa entre la fuerza que actúa sobre ella y su aceleración: r
r
F ma .
(4.32)
Sin embargo, las cosas no se observan enteramente de la misma manera desde el otro sistema de coordenadas; desde el no inercial. Para determinar esto, basta con derivar la expresión para la transformación de Galileo a ambos miembros, con respecto al tiempo; lo que se obtiene es lo siguiente:
a x
d 2 x ≡ 2 ax a 0 , dt a y a y .
(4.33 a) (4.33 b)
Por lo tanto, de acuerdo con (4.32) y (4.33) se tiene que, desde el marco no inercial, si la segunda ley de Newton sigue siendo válida: r
r
ma F ;
(4.34)
ahora la fuerza F no representa al mismo agente físico que en (4.32), pues debe satisfacerse que
r
r
r
F ≡ F ma 0 .
(4.35)
Es decir, que para el observador no-inercial, que se mueve aceleradamente con respecto al marco inercial, la partícula no nada más se encuentra sujeta a la acción de la fuerza que registra el observador inercial, sino que aparece un término adicional
257
El cuerpo rígido
r
ma 0 ,
(4.36)
como si una fuerza extra urgiera a la partícula, proyectándola hacia el origen O con la aceleración a 0. Esta fuerza inercial adicional por supuesto no existe, pero el observador la registra debido a su propia “no inercialidad”. Así, si se está situado en un marco de esta naturaleza (lo cual siempre ocurre), será necesario tomar en cuenta este hecho para descontar a las observaciones el término de fuerza inercial anterior y poder así conocer la fuerza que “realmente” actúa sobre un cuerpo. Se acostumbra llamar genéricamente a esas fuerzas ficticias que aparecen por virtud del carácter no inercial de los marcos de referencia fuerzas inerciales . El nombre no es adecuado, pues deberían llamarse, en todo caso, “fuerzas no-inerciales”, puesto que provienen de un marco no-inercial, pero el nombre, aunque inadecuado, se ha generalizado y así es como se les denomina en toda la literatura sobre el tema. Es interesante percatarse de algunos detalles con respecto a las transformaciones (4.31). Uno muy interesante es aquel cuando se supone que la aceleración a 0 con la que se desplaza el sistema coordenado no inercial respecto al que se ha supuesto fijo, es igual a cero. En este caso se tiene la transformación de Galileo simple
x x x0 v 0t ,
(4.37 a)
y y .
(4.37 b)
Ahora, si un cuerpo se observa desde ambos marcos de referencia, es de verse que las leyes de Newton se cumplen igualmente, pues, calculando la aceleración en ambos miembros de (4.37) se obtiene que: r
r
a a . Esto es, que desde los dos marcos se observa la misma respuesta del cuerpo observado a la fuerza que actúa sobre él; así que la mecánica de Newton resulta ser invariante ante transformaciones de Galileo simples, como la (4.37) y en tal caso se dice que los dos marcos de referencia son inerciales.
258
Marcos de referencia acelerados
Otro punto interesante de las transformaciones (4.31) es que en el caso x 0 igual a cero; esto es, cuando se supone que ambos sistemas coordenados tienen el mismo origen en el instante t igual a cero, entonces, se dice que esta transformación es homogénea. Más aún, suponiendo ahora no dos sistemas, sino tres que se desplazan aceleradamente uno respecto del otro en forma sucesiva, la composición de las dos transformaciones de coordenadas a que da lugar este caso es igual a una transformación del mismo tipo; esto es de la forma (4.31) con
a0 a 0 a 0 , v0 v0 v 0 , siendo a 0 y v 0 la aceleración y la velocidad del segundo marco de referencia no inercial con respecto al primero, respectivamente, en tanto que a 0 y v 0 son las cantidades tomadas con respecto al marco inercial. Dada una transformación como la (4.31), es posible regresar al punto de partida, simplemente cambiando de signo a la velocidad v 0 y la aceleración a 0, de manera que, para cada transformación del tipo (4.31) se puede construir su inversa. Finalmente, es claro que la transformación idéntica existe y es aquella que se da cuando v 0 y a 0 son nulas. En otras palabras, el conjunto de transformaciones no inerciales de Galileo (4.31) forma un grupo. Se trata de un grupo continuo, monoparamétrico, cuyo parámetro es el tiempo. En el caso en que la aceleración a 0 sea nula, se forma, a su vez, un grupo que es llamado de Galileo y que “conecta” a los sistemas de coordenadas inerciales entre sí. Por otra parte, un marco de referencia que gira en torno a un eje, como en el caso de un laboratorio terrestre que, junto con la Tierra, tiene un movimiento de rotación diurno alrededor del eje polar, es un marco no inercial, como ya se explicó. Si se ignoran por el momento las traslaciones y se supone que dos sistemas de coordenadas comparten el mismo origen, pero, en tanto que uno es inercial y permanece inmóvil, el otro pivotea respecto del primero, entonces, un punto del espacio observado desde ambos marcos tendrá por coordenadas ( x , y , z ) para el inercial y ( x , y , z ) para el no inercial que pivotea y ambas observaciones se pueden poner en correspondencia
259
El cuerpo rígido
mediante una matriz de rotación, como se vio en los párrafos precedentes, de tal modo que si R es tal matriz, entonces r
r
r R ⋅ r ,
(4.38)
siendo r el radio vector al punto del espacio que se observa desde el marco inercial, y r el radio vector a ese mismo punto del espacio, pero desde el marco en rotación. La expresión (4.38) es la fórmula de transformación de coordenadas del marco inercial al no inercial y claramente, la transformación inversa, si existe, debe ser la siguiente:
r r ⋅ R1 . r
r
(4.39)
Derivando con respecto al tiempo la expresión (4.38) a ambos miembros, se obtiene la transformación de velocidades: r r r r˙ R ⋅ r˙ R˙ ⋅ r ,
(4.40)
en donde un punto encima de la literal significa la derivada total con respecto al tiempo. En (4.40) no nada más se ha derivado al radio vector r ; también ha sido necesario tomar la derivada de los elementos de la matriz de transformación, puesto que, por hipótesis, el marco de referencia no inercial se encuentra pivoteando con respecto al inercial, así que la regla de correspondencia entre ambos cambia de un instante a otro, en general. Ahora, si la matriz de transformación R posee inversa, tal que
RR
1
≡ R1R 1 ,
(4.41)
entonces es posible rescribir (4.40) en la siguiente forma: r r r r˙ R ⋅ r˙ R1R˙ ⋅ r .
(
)
•
(4.42)
El producto de la matriz inversa por R tiene una propiedad interesante; para aclararla, considérese la expresión (4.41) y tómese a ambos miembros de la derivada con respecto al tiempo; lo que se obtiene es:
260
Marcos de referencia acelerados
˙ R˙ R
1
R
1
R 0,
o bien que ˙ R˙ R
1
R
1
R.
Si se trata de matrices de rotación, entonces la inversa y la transpuesta son iguales, de acuerdo con (4.12), así que: ˙ R
1
R
(R
T ˙ R .
1
)
(4.43)
Lo que expresa el resultado (4.43) es que el producto de esas dos matrices da como resultado una matriz antisimétrica. Así, llamando
Ω ≡ R TR˙ ,
(4.44)
entonces, de acuerdo con (4.43):
ΩT Ω .
(4.45)
Por lo tanto, la matriz tiene a lo más tres elementos independientes y su estructura es la siguiente: 0
Ω≡
ω3
ω 3 ω 2 0 ω 1 ,
ω2
ω 1
(4.46)
0
en donde los elementos se han colocado en sus posiciones y con sus signos, con toda mala fe, para que el resultado final sea el que se espera. La verdad de las cosas es que hasta este momento nada se ha expresado sobre el significado de la matriz definida en (4.44), así que conocer cuál es la secuencia de sus elementos y cuáles son sus signos, es totalmente irrelevante. Lo
261
El cuerpo rígido
único que podría empezar a sugerir ciertos rasgos de la matriz y sus elementos es el hecho de que sus unidades son de inverso del tiempo, como se puede deducir muy fácilmente. Por otra parte, proponer la estructura de , tal como se muestra en (4.46), significa que al sustituirla en (4.42) se obtiene muy convenientemente lo siguiente: r r r˙ R ⋅ (r˙ ω r ) , r
(3.47)
siendo el vector cuyos elementos son aquellos que aparecen en la matriz de (4.46). Este vector, por sus dimensiones y por su estructura, se identifica en la mecánica del cuerpo rígido como la velocidad angular . Lo que expresa la fórmula (4.47) es que, para describir el vector velocidad de un cuerpo cualquiera desde un marco de referencia que pivotea • respecto de otro fijo en el espacio (r ), es necesario adicionar a la observación de la velocidad, realizada desde el marco inercial, un término
r
r
ω r
llamado velocidad tangencial de la partícula y que aparece precisamente por el carácter no-inercial del observador. En otras palabras: un observador que gira, ve a un cuerpo con una velocidad que es igual a la velocidad “real” (aquella que se observa desde un marco inercial), más otra, que es la llamada velocidad tangencial y que aparece debido a la no-inercialidad de él. Si ahora se regresa a la fórmula (4.47) para la transformación del vector velocidad y se deriva miembro a miembro de ella con respecto al tiempo, se obtiene la expresión para la transformación de la aceleración, entre un marco de referencia inercial y otro que pivotea respecto de aquel: r r r r r r r r r r˙˙ R ⋅ (˙˙r ω r˙ ω˙ r ) R˙ ⋅ (r˙ ω r ) .
Pero haciendo el mismo truco algebraico que se hizo para la transformación de la velocidad, que es multiplicar al segundo término a la derecha
262
Marcos de referencia acelerados
en la expresión anterior, por la matriz unidad, entendida como el producto de la matriz R por su transpuesta, se obtiene ahora (de acuerdo con la definición (4.44) para la matriz : r r r r r r r r r r˙˙ R ⋅ (r˙˙ ω r˙ ω˙ r Ω ⋅ (r˙ ω r )) .
Pero recordando una vez más la estructura que se le dio a la matriz antisimétrica, se puede demostrar muy rápidamente que la aplicación de esta matriz al término entre paréntesis, al extremo derecho de la expresión anterior es equivalente al producto vectorial del vector de velocidad angular por ese mismo factor; esto es:
˙˙rr R ⋅ (r˙˙r 2ωr rr˙ ωr˙ rr ωr (ωr rr )) .
(4.48)
Nuevamente ha resultado que al realizar una transformación de coordenadas desde un marco de referencia inercial a otro no-inercial, que se encuentra en rotación respecto al primero, con una velocidad angular , aparecen términos nuevos que es necesario adicionar al vector “inercial” para hacerlo equivaler••al correspondiente vector “no-inercial”. En este caso, al vector aceleración r , medido desde el marco fijo al espacio, hay que sumarle tres términos no-inerciales para hacer la transformación a un marco pivoteando. O sea que un observador desde un marco de referencia •• no-inercial, al medir la aceleración r de un objeto que surca el espacio, se equivoca. Para corregir su error de medida es necesario que haga lo siguiente: en primer lugar, debe multiplicar miembro a miembro de (4.48) por la rotación transpuesta RT ; de esta manera queda:
r r r r r r r r r T ˙ ˙˙ ˙˙ ˙ R ⋅ r r 2ω r ω r ω (ω r )
••
y finalmente debe despejar la aceleración “correcta” r :
˙˙rr RT ⋅ ˙˙rr ωr˙ rr 2ωr rr˙ ωr (ωr rr ).
263
El cuerpo rígido
Esto es, que su propia medida de la aceleración debe ser orientada para •• que sus componentes coincidan con las de la aceleración r . En seguida debe restarle a este resultado las tres aceleraciones espúreas que aparecen en su marco debido a su carácter no-inercial. Los términos que es nece•• •• sario restar a la aceleración r para obtener r son:
1) La aceleración de Coriolis: ˙ 2ω r
(4.49)
˙ r ω
(4.50)
r
r
2) La aceleración transversa: r
r
3) La aceleración centrífuga: r
r
r
ω (ω r )
(4.51)
Para comprender cabalmente cada una de estas aceleraciones es necesario primero tener perfectamente claro el concepto de velocidad angular. Tal como se ha introducido aquí, se trata de un vector formado por los términos fuera de la diagonal principal de una matriz antisimétrica que a su vez provino del producto expresado en la fórmula (4.44). Pero resulta que tiene una interpretación física precisa. Se trata de un vector que da cuenta del número de vueltas que realiza un cuerpo alrededor de su eje de giro en la unidad de tiempo; de hecho sus unidades son radianes entre segundo. El carácter vectorial de la velocidad angular se debe a que, además de su magnitud, especifica una dirección y un sentido. La dirección viene dada por el eje de rotación y el sentido es directo o inverso, según que la rotación sea en sentido opuesto a las manecillas del reloj o en el mismo sentido que se mueven ellas, respectivamente. Por ejemplo, la Tierra gira alrededor del eje que une a los polos sur y norte, en sentido directo, con una velocidad angular cuya magnitud es r
ω 7.27220 105 rad ,
s
264
Marcos de referencia acelerados
N
S
Figura 4.2.1. El vector de velocidad angular de la Tierra apunta hacia fuera a
partir del polo norte.
así que el vector de la Tierra se puede representar emergiendo del polo norte hacia fuera, como se muestra en la figura 4.2.1.
ˆ. ω 7.27220k r
Pero regresando al tema de las aceleraciones inerciales; esas que surgen como consecuencia de observar el movimiento de los cuerpos desde marcos de referencia no inerciales y particularmente de los que se encuentran girando, tal como se describió anteriormente, vale la pena ahora comprender a cada una de las que se definieron en (4.49) y (4.50). Para estudiar la aceleración de Coriolis (4.49), considérese un proyectil como esos que se disparan desde los grandes acorazados y que son capaces de recorrer distancias de 75 km o más en su vuelo antes de llegar a tierra y explotar, regando la muerte a su alrededor. Supóngase, por ejemplo, que ese obús ha sido disparado en algún punto del hemisferio norte de la Tierra, • de manera que el vector velocidad r forme cierto ángulo con el eje de giro del planeta. Por especificar aún más el ejemplo, imagínese que el proyec
265
El cuerpo rígido
•
r
•
2r
Figura 4.2.2. La•aceleración de Coriolis aparece cuando se observa una partícu-
la con velocidad r desde un marco que se halla en estado de rotación.
til vuela rasante a lo largo de un meridiano terrestre y su sentido es de sur a norte. En la figura 4.2.2 se ha dibujado esta situación para comprender mejor el caso que aquí se presenta. El hecho es que debido a la rotación de la Tierra aparece una aceleración espúrea; es decir que el proyectil no sigue la trayectoria que se hubiera calculado a partir de la gravedad terrestre, sino que presenta una tendencia a desviar su curso de vuelo hacia el poniente, de acuerdo con la expresión (4.49). Este efecto es tanto más notable, cuanto más al norte se haga el disparo. Sobre el ecuador el efecto de la aceleración de Coriolis es nulo, debido a que allí ambos vectores: el de la velocidad angular y el vector • velocidad r son paralelos (en un disparo hacia el norte). Los artilleros navales deben conocer muy bien este fenómeno para corregir la desviación y hacer certeros sus disparos. De hecho, Gaspard Gustave de Coriolis se hizo famoso por sus estudios sobre el efecto de desviación de los proyectiles en la artillería naval. Pero esta aceleración permite también comprender otras cosas muy importantes para la humanidad: la formación de los ciclones.
266
Marcos de referencia acelerados
En efecto, pensando que la aceleración de Coriolis opera sobre cualquier cuerpo que se mueve sobre la Tierra, con al menos una componente de su velocidad en sentido hacia el norte en el hemisferio norte o hacia el sur, en el hemisferio austral, se puede imaginar las grandes masas de nubes que se forman en el verano debido a la evaporación del agua de los océanos y el efecto que tiene sobre ellas la rotación terrestre: mientras más septentrional se desplace un macizo de nubes, mayor será el “tirón” de Coriolis que recibirá hacia el oeste, de manera que una mancha nubosa que se extiende del ecuador hacia el norte, experimentará aceleraciones hacia el oeste que crecen más y más mientras más al norte se desplace. Por lo tanto, se generará una diferencia de movimientos que dará lugar, eventualmente, a la formación de un remolino; esto es, un ciclón. Así, también los meteorólogos deben estar bien empapados en el conocimiento de la aceleración de Coriolis; la gran diferencia es que éstos trabajan salvando vidas, en tanto que los otros, por el contrario, tratan de segar tantas como sea posible. El siguiente término en (4.48) es, como se definió en (4.50), la aceleración transversa o trasversal. Se trata de un término que tiene que ver con el cambio temporal de la velocidad angular, así que en marcos de referencia que giran uniformemente, esta contribución no existe. Mencionando nuevamente al planeta Tierra, se sabe que su movimiento de rotación diurno no es absolutamente uniforme. A lo largo de 26000 años, el eje norte-sur ejecuta un movimiento de precesión que describe un cono como se muestra en la figura 4.2.3. Este movimiento se conoce como la precesión de los equinoccios . Era conocido desde la antigüedad, pues ya Ptolomeo lo describió en forma bastante acertada. Observando la figura 4.2.3, se aprecia que no cambia de magnitud, sólo de dirección y sentido, así que
˙ 8.86335 1017 rad ω s 2 r
y apunta en la dirección normal a , sobre el círculo de precesión. Por lo tanto, un cuerpo libre sobre la superficie terrestre debe experimentar una aceleración transversa que es muy pequeña:
r ˙ ω R 8.86 1017 6.37 106 5.64 1010 m r
267
s 2
El cuerpo rígido
•
N
0
S
Figura 4.2.3. La precesión de los equinoccios es el movimiento que tiene el eje
sur-norte terrestre. Su periodo es de 26 000 años aproximadamente.
y apunta siempre en la dirección del meridiano local y hacia el norte o hacia el sur, según que se esté situado en el hemisferio septentrional o austral, respectivamente. Finalmente, la aceleración centrífuga, definida en (4.51), es tal vez la más conocida de las aceleraciones inerciales. Un ejemplo de ella, que resulta muy ilustrativo es el caso de un auto que toma una curva cerrada, a gran velocidad, hacia la izquierda. El pasajero no inercial que va sentado al frente, en el llamado asiento del copiloto, experimenta, en efecto, una aceleración que tiende a expulsarlo de su asiento y lo presiona fuertemente contra la portezuela derecha. Es una aceleración que él percibe como normal al automóvil y hacia afuera. En la figura 4.2.4. se muestra un esquema de esta situación. El vector de velocidad angular sale de la figura, perpendicularmente a ella, por lo cual no se ha dibujado. El radio vector apunta del centro de la curva hasta el centro del auto. Entonces el producto r
r
ω r
268
Marcos de referencia acelerados
(r )
r
Figura 4.2.4. Un auto toma una curva cerrada hacia la izquierda, a gran velo-
cidad. El pasajero siente la aceleración centrífuga. En la figura sale perpendicularmente de la hoja de papel.
da como resultado un vector que apunta en la misma dirección que lleva instantáneamente el automóvil; esto es, hacia arriba en la figura 4.2.4. y, al hacer la multiplicación vectorial r
r
r
ω (ω r ) ,
lo que se obtiene es un nuevo vector que, en efecto, al hacer el cambio de signo, apunta hacia afuera del camino, radialmente. Esta es la aceleración centrífuga que el observador, desde su marco de referencia percibe. Se dice que se trata de una aceleración ficticia que aparece solamente por el hecho de que quien la observa o la percibe, como es el caso del pasajero en el automóvil, es un observador no inercial. Todo esto es correcto, más no se piense que por ser ficticia esta aceleración no tiene efecto alguno. Tan es así que la intensa compresión que el copiloto ejerce sobre la portezuela puede lastimarle el brazo. Si al momento de tomar la curva, la portezuela del automóvil, de pronto desapareciera, el pasajero no sal-
269
El cuerpo rígido
dría despedido del vehículo radialmente hacia afuera de éste, sino que seguiría una trayectoria rectilínea tangente al auto en ese punto. Así que, a pesar de que la aceleración centrífuga apunta radialmente, como se mostró en la figura 4.2.4., tan pronto como el observador se ve libre, deja de sentir esa aceleración y su “vuelo” es, simplemente rectilíneo y uniforme (excepto por la resistencia del aire y la gravedad terrestre). Lo que realmente le ocurre al pasajero al tomar el auto una curva cerrada, es que él mismo, en todo instante, tiende a ser un observador inercial, pero el auto viene a su encuentro, la portezuela lo fuerza a cambiar su estado de movimiento, impidiéndole seguir una trayectoria rectilínea. El marco de referencia no inercial (el auto) crea la sensación sobre el pasajero de que él está urgido por una aceleración centrífuga, cuando en realidad es todo lo contrario: el auto lo constriñe, mediante su aceleración centrípeta, a permanecer en el interior y tomar la curva. Es por ello que se dice que las anteriores son aceleraciones ficticias. 4.3. Cinemática del cuerpo rígido
Considérese ahora, de nueva cuenta, el problema de un cuerpo rígido que no traslada su pivote sino que gira con un punto fijo en el espacio, tal como se había explicado anteriormente. Debe tomarse en cuenta, así mismo, la existencia de dos sistemas coordenados asociados al cuerpo rígido y sus movimientos: el sistema de coordenadas (inercial) fijo en el espacio y el sistema de coordenadas (no-inercial) fijo al cuerpo. Como ya se mencionó, es posible describir los pivoteos desde cualquiera de los dos sistemas coordenados cartesianos, cada uno de ellos ofrece ciertas ventajas pero carga con ciertas desventajas también. Más adelante, en este contexto, se ponderarán ambos factores y se optará por una estrategia de ataque al problema de describir el movimiento del cuerpo rígido, que será la más fácil de todas. Por el momento hay varios detalles respecto al movimiento, que es necesario aclarar antes de hacer el ataque frontal al problema. Por ejemplo, si se describe el estado de rotación de algún punto material del cuerpo rígido, cualquier punto que no esté sobre el eje instantáneo de giro y esa descripción se realiza desde el sistema de coordenadas fijo al cuerpo ¿qué es lo que se observará?
270
Cinemática del cuerpo rígido
Recordando la ley de transformación (4.2) que establece la correspondencia entre el radio vector r de un punto desde el sistema fijo al espacio y el correspondiente r del mismo punto desde el sistema fijo al cuerpo, derivando respecto del tiempo a ambos miembros, se obtiene:
r r r r r˙ R ⋅ (r˙ ω r ) ;
(4.47)
tal como se demostró en los párrafos precedentes. Esto ya no es nuevo. Lo que en cambio sí representará un avance en el conocimiento del cuerpo rígido y su mecánica es lo siguiente: si, en efecto, r es la velocidad de un punto material cualquiera del cuerpo y si el marco de referencia es, en efecto, el que está fijo a él y gira con él, entonces esa velocidad debe ser nula en todo instante; esto es:
r r ˙ ≡ 0 .
(4.52)
Por lo tanto, cuando se observa un cuerpo rígido pivotear sobre un punto fijo, desde un marco inercial, la velocidad de cualquiera de sus puntos materiales constitutivos, de acuerdo con (4.147) y (4.52) es: r r ˙r ω r . r
(4.53)
Este vector es conocido como la velocidad tangencial del punto material. Todos los puntos materiales giran con una velocidad tangencial como la que se definió en (4.53), pero es necesario percatarse que para cada uno de ellos la velocidad tangencial cambia porque el radio vector r desde el origen es distinto en general. Lo que es igual para todos los puntos materiales es la velocidad angular . Para demostrar este aserto se puede partir de suponer lo contrario; esto es, que cada punto del cuerpo rígido, fuera del eje de giro, da vueltas con diferente velocidad angular y luego, demostrar que la afirmación es falsa. Supóngase para tal efecto dos puntos del cuerpo, cuyos radios vectores desde el origen sean r 1 y r 2, e imagínese que cada uno de ellos gira, en efecto, con una velocidad angular diferente, 1 y 2, respectivamente. Entonces, de acuerdo con el resultado (4.53) se tiene que:
271
El cuerpo rígido r r r r˙1 ω 1 r 1
(4.54 a)
r r r r˙2 ω 2 r 2 .
(4.54 b)
Así que tomando en cuenta la diferencia de los vectores velocidad se obtiene lo siguiente: r r d r r r r r r ω r ω r ( 2 1) ( 2 2) ( 1 1), dt
o bien, haciendo un poco de manipulación algebraica sencilla: r r r d r r r r r ω ω ω r r r r r (4.55) ( 2 1) 2 (2 1) ( 2 1) 1. dt Ahora, si se multiplica miembro a miembro del resultado anterior, escalarmente por la diferencia de los vectores de posición, se consigue que: r r d r r r r r r r r r ω ω r r r ⋅ ⋅ ( 2 1 ) dt ( 2 1 ) [( 2 1) 1 ] ( 2 1 ) , r
r
(4.56)
en donde el primer término de la derecha en (4.55) ha desaparecido debido a la propiedad básica del triple producto escalar, que permite intercambiar el punto por la cruz y el hecho de que el producto vectorial de un vector por sí mismo es siempre igual a cero. Haciendo uso de la misma propiedad fundamental del triple producto escalar, así como del hecho de que dos puntos materiales cualesquiera de un cuerpo rígido, por definición, permanecen siempre a la misma distancia mutua, se obtiene de (4.56) que: 1 2
r d r r 2 r r r r2 r1 (ω 2 ω 1 ) ⋅ (r2 r1 ) 0 dt
(4.57)
si los dos puntos que se consideran son arbitrarios y no necesariamente colineales con el origen, para que el resultado (4.57) sea válido siempre, es necesario que
272
Cinemática del cuerpo rígido r
r
ω1 ω 2 .
(4.58)
En palabras, el resultado (4.58) muestra que, en efecto, los puntos materiales de un cuerpo rígido que pivotea alrededor de un punto fijo giran con la misma velocidad angular . Regresando a (4.53), existe otra circunstancia que es necesario traer a cuento aquí en relación con la descripción de los vectores asociados con el movimiento de un cuerpo rígido. Hay que percatarse primero que cualquier entidad auténticamente vectorial; cualquier vector A que exprese alguna propiedad del cuerpo rígido, al igual que el radio vector r , al describirse desde el marco de referencia (no inercial) fijo al cuerpo, tiene una relación con el marco fijo en el espacio (inercial) que esencialmente es la misma siempre; esto es:
r
r
A R ⋅ A ,
(4.59)
siendo, como ya es costumbre, A el vector desde el marco fijo en el espacio; R la matriz que describe el pivoteo y A el correspondiente objeto vectorial descrito desde el marco fijo en el espacio. Ahora bien, si se calcula la derivada temporal a ambos miembros de (4.59) se tiene que, por las propiedades de la transformación:
r ˙ ˙ r r A R ⋅ A ω A , r
(4.60)
esto es, que nuevamente aparece la velocidad angular multiplicando vectorialmente al vector original A . Esto es así siempre. Por otra parte, si en efecto A es el •vector observado desde el marco fijo al cuerpo, entonces por definición, A debe ser nulo así que
˙ r r A ω A . r
(4.61)
Este resultado conduce a una conclusión interesante y que será en adelante de gran utilidad para el desarrollo ulterior de la mecánica del cuerpo rígido, a saber, que la derivada temporal de cualquier ente vectorial que se use para describir propiedades físicas del cuerpo rígido, es equivalente a
273
El cuerpo rígido
multiplicar ese vector, vectorialmente por la velocidad angular. O expresado de otro modo: la derivada temporal es equivalente a multiplicar vectorialmente por :
d r ≡ ω . dt
(4.62)
Por el momento este resultado quedará aquí listo para ser utilizado posteriormente en la dinámica del cuerpo rígido. Para continuar con el tema es necesario ahora hacer otras consideraciones importantes. A estas alturas se está en posibilidad de iniciar el estudio de los parámetros que caracterizan los pivoteos de los cuerpos rígidos. Como ya se vio anteriormente, deben ser, a lo más, tres y las llamadas rotaciones simples —aquellas que toman como eje de giro a uno de los ejes coordenados— solamente requieren de un parámetro para describirse. Este parámetro es un ángulo; por lo tanto cabe pensar que un pivoteo general puede ser descompuesto en una sucesión de tres rotaciones simples para su estudio. Esto es precisamente lo que propuso Leonhard Euler a principios del siglo XVIII. La forma como Euler propuso las rotaciones simples con los ángulos que llevan su nombre es la siguiente: Considérese un cuerpo rígido cualquiera que pivotea en el espacio, con un punto fijo. Un sistema coordenado cartesiano fijo en el espacio (inercial) tiene su eje en el pivote del cuerpo rígido; es decir, en el punto que permanece fijo durante el movimiento y apunta en cierta dirección fija en el espacio; por ejemplo, en la dirección de la estrella polar, u otro cuerpo celeste lejano. El sistema coordenado cartesiano fijo al cuerpo (no-inercial) se construye, como ya se había explicado, tomando como eje de las cotas (OZ ) al eje de giro del cuerpo y una vez escogida esta dirección, los otros dos ejes del sistema se trazan simplemente perpendiculares a ese eje de las cotas y perpendiculares entre sí. El origen del sistema fijo en el cuerpo es el pivote, de manera que ambos sistemas coordenados coinciden en ese punto. La inclinación del eje de las cotas OZ del sistema fijo en el cuerpo, con respecto al eje Oz del sistema fijo en el espacio, se denotará en adelante por y este ángulo será llamado ángulo de nutación. Ahora bien, el eje OZ fijo al cuerpo, por construcción es normal al plano XOY de este mismo sistema, del mismo modo que el eje Oz del sistema fijo al espacio es perpendicular al plano xOy , así que al inclinarse el cuerpo
274
Cinemática del cuerpo rígido
z Z
plano XOY
0
plano xOy
l.n. Figura 4.3.1. El eje OZ del cuerpo y el eje Oz del sistema fijo en el espacio forman
un ángulo . Es el mismo que se forma entre el plano XOY del sistema fijo al cuerpo y xOy del fijo en el espacio. La línea común de ambos planos es la línea de nodos (l .n.).
rígido, con él se inclina su eje OZ y simultáneamente, su plano XOY con respecto al plano xOy del espacio; así que ambos planos también forman un ángulo entre sí, tal como se muestra en la figura 4.3.1. En esta figura y en las siguientes se omitirá al cuerpo y sólo se dibujarán los ejes y planos relevantes para no obscurecer la interpretación. Dos planos que se intersectan, lo hacen en una línea. En este caso, los planos xOy y XOY se intersectan en la llamada línea de nodos . Esta línea debe recordarse en lo sucesivo, es común a ambos planos en todo momento y no es fija, sino que gira u oscila alrededor del origen común O , conforme el cuerpo rígido pivotea. La línea de nodos no necesariamente corresponde al eje de las abscisas, ni del sistema fijo en el espacio, ni del sistema fijo al cuerpo. En algún breve instante puede ocurrir que ambas; la línea de nodos y el eje de las abscisas de alguno de los dos sistemas coordenados coincidan, pero, siendo móvil, un momento después apuntará en otra dirección.
275
El cuerpo rígido
z Z
y
0
X
x l.n. Figura 4.3.2. Se muestran los ángulos de precesión y rotación que genera la
línea de nodos ( l .n.) con los ejes de las abscisas de los sistemas fijo en el espacio y fijo al cuerpo, respectivamente. También se ha dibujado el ángulo de nutación .
En un instante, el eje de las abscisas del sistema fijo en el espacio forma un ángulo que se denotará por , con la línea de nodos; este ángulo es el segundo parámetro de Euler y se llama ángulo de precesión. De igual modo, el eje de las abscisas del sistema coordenado fijo al cuerpo forma un ángulo con la línea de nodos; este es el llamado ángulo de rotación. En la figura 4.3.2 se muestran estos dos ángulos. Tanto el ángulo de precesión como el ángulo de rotación son variables, pues mientras el cuerpo rígido pivotea, va barriendo diferentes valores de , desde cero hasta 2 y del mismo modo ocurre con el ángulo de rotación. Estos tres, son los ángulos de Euler: θ nutación φ precesión ψ rotación
Lo interesante de estos parámetros es que 1) sirven para describir completamente los pivoteos del cuerpo rígido y 2) se pueden definir en forma
276
Cinemática del cuerpo rígido
z Z
•
•
Plano XOY
0
Plano xOy
•
l.n. Figura 4.3.3. Se muestra cómo el sistema de coordenadas fijo en el cuerpo pre•
cede con una• velocidad angular , barriendo un ángulo ; nuta con• una velocidad angular , barriendo un ángulo y rota con velocidad angular , barriendo un ángulo .
sencilla mediante rotaciones simples; esto es, transformaciones del tipo que puede ser representado mediante matrices de rotación como las que se estudiaron y que involucran uno solo de esos parámetros a la vez. Así, un pivoteo, por más complicado que parezca, se puede entender como la superposición de tres rotaciones simples; cada una respecto de uno de los ángulos de Euler. En adelante se mostrará cómo es posible expresar matemáticamente cada una de estas rotaciones simples y de qué manera su superposición; esto es, su multiplicación matricial, da como resultado una matriz R que representa un pivoteo general. En la figura 4.3.3 se han dibujado parcialmente los dos sistemas coordenados. Por no ser indispensables en este momento los ejes de las ordenadas Oy y OY de ambos sistemas han sido omitidos. Con este dibujo se ha tratado de exhibir la forma como se barren los ángulos , y a lo largo del pivoteo de un cuerpo rígido. Nuevamente, el ángulo es el de inclinación del eje de giro con respecto a la vertical (el eje de cotas del sistema fijo en el espacio). Es, así mismo, el ángulo que forman en cada instante los dos planos: el XOY del sistema fijo al cuerpo y el xOy del sistema fijo al espacio.
277
El cuerpo rígido
El eje que genera el ángulo de nutación es la línea nodal (l .n.). Es como si se hubiese tomado a esta línea como eje de giro y rotándolo se obliga al plano XOY a inclinarse respecto del xOy . Igualmente, el eje de las cotas del cuerpo se aparta de la vertical y se inclina (nuta) con el ángulo . El ángulo (precesión) es, como ya se describió, el que barre el eje llamado línea nodal (l .n.) con respecto al eje de las abscisas del sistema fijo en el espacio. Se puede imaginar que este ángulo se genera desde el eje O z del sistema fijo en el espacio al rotarlo. Al hacer esta operación, el efecto es de desplazar a la línea nodal, aumentando o diminuyendo el ángulo . Este giro corresponde a la precesión que ejecuta el cuerpo rígido alrededor del eje Oz . Finalmente, el ángulo de rotación es el que barre el eje de las abscisas OX del sistema fijo al cuerpo con respecto a la línea de nodos ( l .n.) mientras gira alrededor de su eje de giro. Este, el eje de giro del cuerpo, es OZ y tal como se muestra en la figura 4.3.3, girando este eje, se logra ese efecto. También se puede apreciar en la figura 4.3.3 que la línea nodal (l .n.), tomada como eje de esa rotación simple, tiene como efecto inclinar el eje OZ del cuerpo respecto de la dirección vertical, al hacerlo, le imprime• una velocidad angular instantánea que desde ese marco de referencia es y se • llama velocidad angular de nutación , . Igualmente, al girar en torno de su eje de giro, el cuerpo lleva una ve• locidad angular de rotación , y• al preceder alrededor del eje Oz tiene una velocidad angular de precesión , tal como se muestra en la figura 4.3.3. Un pivoteo cualquiera de un cuerpo rígido es un giro alrededor de un punto fijo (el pivote). Tal como lo demostró Leonhard Euler, un pivoteo puede descomponerse en tres rotaciones simples: una nutación, una precesión y una rotación. Para entender cabalmente esta afirmación, supóngase que en algún instante arbitrario se obtiene la foto de un cuerpo que pivotea. Se pueden dibujar, superpuestos a la fotografía, los dos sistemas de coordenadas: el fijo en el espacio y el fijo al cuerpo. Ahora se hace la pregunta ¿cómo es posible transformar, mediante una sucesión de rotaciones simples, el marco de referencia fijo en el espacio de manera que llegue a coincidir con el marco de referencia fijo al cuerpo? Hacer esto es equivalente a transformar el primer sistema de coordenadas en el segundo; esto es, hallar la matriz R que permite poner en correspondencia observaciones de uno a otro sistema, tal como se hizo, por ejemplo, en (4.59).
278
Cinemática del cuerpo rígido
Observando nuevamente la figura 4.3.3, es posible hallar una secuencia de rotaciones simples que indefectiblemente conducen a la transformación deseada: se puede iniciar este procedimiento con una rotación simple por un ángulo alrededor del eje de las cotas del sistema fijo en el espacio. El ángulo debe ser tal, que al girar el eje de las abscisas Ox llegue a coincidir con la línea nodal (l .n.), sea D la matriz que represente esta rotación; entonces cos φ sen φ 0 D ≡ sen φ cos φ 0 0 0 1 .
(4.63)
Con esta transformación, en efecto, se ha llevado al eje de las abscisas del sistema fijo al espacio hasta la línea de nodos, que es la línea común a ambos planos; el xOy y el XOY . Así, un punto del cuerpo rígido, ubicado mediante el radio vector r del sistema inercial, ahora, por virtud de la transformación (4.63) queda ubicado también desde un nuevo marco que tiene como eje de las cotas al propio Oz anterior y su eje de las abscisas es la línea nodal. Sea r el radio vector desde el origen (común) hasta el punto, desde este nuevo marco de referencia. Entonces, de acuerdo con esta transformación se tiene ahora que:
r
r
r D ⋅ r .
(4.64)
Una vez plantado en este nuevo sistema de coordenadas (el de la línea de nodos), es posible realizar una rotación simple alrededor de la línea nodal por un ángulo , de tal forma que el eje Oz de este sistema gire y se abata sobre el eje OZ del sistema de coordenadas fijo en el cuerpo. Una rotación así queda descrita por una matriz C que deja invariante a la línea nodal y que gira al eje Oz de este marco hasta cumplir con su cometido: hacerlo coincidir con OZ : 1 0 0 C ≡ 0 cos θ sen θ 0 sen θ cos θ .
279
(4.65)
El cuerpo rígido
Nuevamente, un punto del cuerpo rígido, que en el sistema coordenado de la línea nodal quedaba localizado por el radio vector r , desde el nuevo sistema; éste que ha sido generado por el giro anterior (4.65), ahora se ubica mediante un radio vector r tal que:
r
r
r C ⋅ r .
(4.66)
Pero si éste es el mismo punto material que se había señalado desde el principio; ese que tenía el radio vector r desde el marco de referencia fijo en el espacio, entonces, por la transitividad de las rotaciones, y de acuerdo con (4.64) y (4.66), se tiene que:
r
r
r C ⋅ D ⋅ r .
(4.67)
Cada una de las matrices consideradas hasta ahora cumple con las propiedades para las matrices de rotación, como se puede comprobar directamente de su definición. Tanto la matriz D como la C satisfacen que: det D det C 1 T
DD
CC T 1
(4.68) (4.69)
por lo tanto, su producto también es una matriz de rotación; esto es que: T (C ⋅ D ) ⋅ (C ⋅ D ) DT ⋅ C T ⋅C ⋅ D 1
det(C ⋅ D ) (det C )(det D ) 1 .
(4.70) (4.71)
Explícitamente, el producto de ambas matrices da como resultado:
⋅
C D
cos φ sen φ 0 cos θ sen φ cos θ cos φ sen θ sen θ sen φ sen θ cos φ cos θ .
280
(4.72)
Cinemática del cuerpo rígido
Pero aún no se ha terminado la secuencia de rotaciones simples; aún queda una última por realizar. Para que finalmente se consiga el objetivo de llevar el sistema de coordenadas fijo en el espacio a coincidir con el sistema fijo en el cuerpo, es necesario operar una rotación simple más: tomando al eje de las cotas OZ , es necesario girarlo un ángulo tal que los ejes de las abscisas y de las ordenadas del sistema que se tenía, coincidan ahora con los respectivos ejes OX y OY del sistema fijo en el cuerpo. Sea B la matriz de rotación que representa esta operación; entonces: cos ψ sen ψ 0 B ≡ sen ψ cos ψ 0 0 0 1 .
(4.73)
Con esta rotación, el radio vector r al punto del cuerpo rígido (un punto cualquiera) sufre una última transformación:
r
r
R B ⋅ r .
(4.74)
Pero haciendo uso nuevamente de la propiedad transitiva de las rotaciones; de acuerdo con (4.67) y (4.74) se obtiene que: r
r
(4.75)
≡ B ⋅C ⋅ D
(4.76)
R B ⋅ C ⋅ D ⋅ r , o bien, definiendo R
se consigue la expresión r
r
R R ⋅ r
(4.77)
que liga al radio vector r a un punto material del cuerpo rígido desde el sistema coordenado fijo en el espacio, con el radio vector R a ese mismo punto material, desde el sistema coordenado fijo al cuerpo. Así, el objetivo se ha cumplido: transformar del sistema fijo al espacio, al sistema fijo al cuerpo mediante una sucesión de tres rotaciones simples. Un pivoteo
281
El cuerpo rígido
general, en efecto, se ha podido descomponer en tres rotaciones simples. Una matriz R que depende de tres parámetros ( , , ) se expresa así como el producto de tres rotaciones simples, monoparámetricas. Por supuesto, la transformación inversa, esto es, la que traduce las observaciones del marco de referencia fijo en el cuerpo al marco fijo en el espacio, se consigue, simplemente, tomando la transpuesta de R y aplicándola así:
r r ⋅ RT , r
r
(4.78)
donde T
R
≡ DT ⋅ C T ⋅ BT .
(4.79)
Hay un aspecto de los ángulos de Euler que es especialmente interesante para el estudio ulterior de la mecánica del cuerpo rígido: a primera vista parecería que Euler eligió los parámetros y las rotaciones simples asociadas a ellos de manera un tanto caprichosa y que tal vez se hubieran podido escoger estas cosas siguiendo otro criterio. La verdad es que, si se piensa un poco sobre ello, se verá que nada hay de caprichoso o arbitrario en la secuencia de rotaciones simples que propuso el genio suizo para hacer la síntesis de los pivoteos de un cuerpo rígido. Cuando un cuerpo así ejecuta sus movimientos alrededor de un punto fijo, se puede observar que, en efecto, además de girar alrededor de un eje de rotación instantáneo, precede y nuta. La composición de estos tres movimientos da como resultado el pivoteo. En la figura 4.3.4, se muestran esos tres movimientos y los ejes alrededor de los cuales se realizan: nutación alrededor de la línea de nodos, precesión, alrededor de la “vertical” (el eje de las cotas del marco inercial) y la rotación alrededor del eje instantáneo de giro del cuerpo. Para describir vectorialmente las velocidades angulares de nutación, de precesión y de rotación, se puede tomar cada uno de los ejes alrededor de los cuales se han definido estas cantidades; por ejemplo, la velocidad de • nutación ha quedado definida con respecto a un sistema coordenado cuyo eje de las abscisas es la línea de nodos ( l .n.). No es el sistema fijo al espacio, ni tampoco se trata del sistema fijo al cuerpo; es un sistema de coordenadas intermedio. Es aquel al que se llega después de haber girado alrededor del eje Oz del primero, por un ángulo . Desde este sistema inter-
282
Cinemática del cuerpo rígido
z Z •
•
0
•
l.n. Figura 4.3.4.
Asociadas a los movimientos de nutación,• precesión y rotación de un cuerpo rígido, hay tres clases de velocidades angulares: es la velocidad de nuta• • ción, es la de precesión y la de rotación.
medio, la velocidad de nutación es un vector cuyas componentes se expresan así: θ ˙
0 0 .
(4.80)
•
Por su parte, la velocidad de rotación se describe, desde el sistema de coordenadas fijo al cuerpo, como un vector con una sola componente no nula en la dirección del eje de las cotas OZ de este sistema coordenado:
283
El cuerpo rígido
0 0
(4.81)
•
ψ . •
Si se desea representar vectorialmente a la velocidad de precesión , hay que hacerlo desde el sistema de coordenadas fijo en el espacio, donde el eje de las cotas sirve como eje de giro, alrededor del cual precede el cuerpo: 0 0
(4.82)
•
φ .
El vector velocidad angular del cuerpo rígido; ese que describe la rapidez con que el cuerpo pivotea, así como la dirección y el sentido del pivoteo, debe estar descrita desde un solo marco de referencia; bien sea el fijo en el espacio o el que está fijo al cuerpo. No sirve tener tres expresiones para las velocidades angulares, como las (4.80), (4.81) y (4.82), si éstas se refieren a sistemas diferentes. Entonces hay que buscar la forma de expresarlas a todas ellas en un mismo marco de referencia, mediante la aplicación de las transformaciones adecuadas. Por ejemplo, si se desea describir los pivoteos desde el sistema de coordenadas fijo en el espacio; el sistema inercial, entonces es de observarse lo siguiente: Supóngase que el vector velocidad angular se escribe como la suma de uno que sea el vector de precesión PRE más el vector de nutación NUT, más el vector de rotación ROT; esto es:
r
r
r
r
ω ω PRE ω NUT ω ROT .
(4.83)
El primer término de la derecha en (4.83) debe reconocerse de inmediato como el vector (4.82):
284
Cinemática del cuerpo rígido
r
ω PRE
0 ≡ 0
(4.84)
•
φ
pues, en efecto, se tiene expresado ya en el sistema fijo al cuerpo. En cuanto al vector de nutación NUT , cabe recordar que las componentes (4.80) se describen desde el sistema de coordenadas de la línea nodal. Este sistema se habrá conseguido girando al sistema fijo en el espacio por un ángulo alrededor del eje de las cotas Oz , hasta hacer coincidir el eje de las abscisas con la línea de nodos. Entonces, para transformar el vector (4.80) al sistema fijo en el espacio lo que hay que hacer es girar de nuevo el eje de las cotas, en sentido opuesto al giro original, hasta llevar a la línea nodal a coincidir con el eje de las abscisas Ox . Esto no es otra cosa que la transpuesta de D ; así que el vector de nutación es:
•
θ r
ω NUT
≡ D T 0
(4.85)
0 o bien, explícitamente, a partir de (4.63):
ω NUT
cos φ sen φ 0 ≡ sen φ cos φ 0 0 0 1
•
θ
0 0 ,
esto es: •
θ cos φ ω NUT
•
≡ θ sen φ 0
285
(4.86) .
El cuerpo rígido
Estas son las componentes del vector de nutación, expresadas desde el sistema de coordenadas fijo en el espacio. El vector de rotación (4.81) ha sido expresado originalmente desde el sistema fijo al cuerpo, así que para transformar sus componentes al sistema fijo en el espacio es necesario hacer lo siguiente: r
ω ROT
≡ RT
0 0
(4.87)
•
ψ .
Lo anterior es equivalente, —si se recuerda (4.63), (4.65) y (4.73), así como la regla de transposición de un producto de matrices— a lo siguiente: cos φ sen φ 0 1 0 0 r ω ROT sen φ cos φ 0 0 cos θ sen θ 0 0 1 0 sen θ cos θ
0 0
(4.88)
•
ψ .
Este producto da como resultado lo siguiente: •
ψ sen θ sen θ r
•
ω ROT ψ sen θ cos θ
(4.89)
•
ψ cos θ
que son las componentes del vector de rotación, descritas desde el sistema de coordenadas fijo en el espacio. Ahora, regresando a (4.83), se puede dar la descripción completa del vector de velocidad angular del cuerpo rígido que pivotea alrededor de un punto fijo, desde el sistema coordenado fijo en el espacio. En efecto, sumando las tres contribuciones al vector velocidad angular (4.84), (4.86) y (4.89) se obtiene que:
286
Cinemática del cuerpo rígido
θ˙ cos φ ψ˙ sen θ sen φ ω θ˙ sen φ ψ˙ sen θ cos φ r
φ˙ ψ˙ cos θ
(4.90)
.
Si lo que se desea es expresar al vector de velocidad angular desde el sistema fijo al cuerpo, se puede proceder con la misma estrategia que se siguió anteriormente, pero ahora partiendo del hecho que la velocidad de rotación, tal como aparece en (4.81) es el punto de partida; esto es que esa velocidad no va a sufrir transformación alguna y se expresa tal como está: 0 r ω ROT 0 ˙ . ψ Ahora hay que transformar las demás expresiones inteligentemente, a fin de dejarlas correctamente formuladas en el mismo sistema de coordenadas. Al final, lo que va a resultar es lo siguiente:
θ˙ cos ψ φ˙ sen θ sen ψ
ω ≡ ω ROT ω NUT ω PRE θ˙ sen ψ φ˙ sen θ cos ψ (4.91) r
r
r
r
ψ˙ φ˙ cos θ
.
Estas son las componentes del vector velocidad angular expresadas desde el sistema coordenado fijo al cuerpo. Ambas representaciones: la dada en (4.90) y la (4.91) serán de gran utilidad para el desarrollo ulterior del tema. El resultado anterior se puede obtener, una vez conocidas las componentes de para el sistema fijo en el espacio (4.90), al aplicarles la rotación R dada en (4.76) y de acuerdo con la fórmula (4.77) adaptada a este vector:
287
El cuerpo rígido
z
Z
Y •
•
sen •
•
cos •
cos •
0
•
•
X sen sen cos •
•
cos sen sen
•
•
•
cos
l.n. Figura 4.3.5. Se muestra el sistema de coordenadas fijo al cuerpo, la línea nodal
(l .n.), y el eje de las cotas Oz del sistema fijo en el espacio. Se han dibujado los vectores de rotación, de precesión y de nutación. Tomando las proyecciones de estos vectores a lo largo de OX , OY y OZ se encuentran gráficamente las componentes de .
r
r
ω R ⋅ ω
(4.92)
se debe obtener el mismo resultado. Gráficamente es posible obtener las componentes de si se procede de acuerdo con la figura 4.3.5. En ella se han dibujado los tres ejes coordenados del sistema fijo al cuerpo: OX , OY y OZ . Además se dibuja la línea de nodos (l .n.) y el eje de cotas• del sistema fijo en el espacio Oz . • • Los vectores de rotación (), de precesión () y de nutación , se han dibujado a lo largo de los ejes OZ , Oz y l .n., respectivamente, a partir del origen O y apuntando en las direcciones y sentidos correspondientes. Ahora, tomando las proyecciones de cada uno de estos vectores sobre las direcciones coordenadas, se puede mostrar de inmediato que, en efecto, las componentes de la velocidad angular son:
288
Dinámica del cuerpo rígido
ω x θ˙ cos ψ φ˙ sen θ sen ψ
(4.93 a)
ω y θ˙ sen ψ φ˙ sen θ cos ψ
(4.93 b)
ω z ψ˙ φ˙ cos ψ
(4.93 c)
tal como se mostró en la expresión (4.236). 4.4. Dinámica del cuerpo rígido
En Suiza, en una bella ciudad llamada Basilea, nació un 15 de abril de 1707 una de las más brillantes inteligencias que han pisado el planeta Tierra: Leonhard Euler. Fue pupilo de otro gran talento suizo llamado Jean (Johannes) Bernoullí, quién alentó su pasión por la ciencia, la investigación y particularmente, las matemáticas. En la casa del tutor, donde acudía a recibir sus lecciones, conoció e hizo amistad con dos de los hijos de Jean: Daniel y Nicolás, quienes a su vez se estaban formando bajo la tutela del padre en las matemáticas. Juntos emprendieron investigaciones sobre el cálculo diferencial e integral, así como con la teoría de las variaciones. El grupo de jóvenes científicos se disolvió cuando Nicolás, el mayor de los hermanos Bernoullí, viajó a la capital de la Rusia imperial, San Petersburgo, para aceptar el trabajo de matemático de la corte de Catalina I. Desafortunadamente, una semana después de haber llegado allá, caminando descuidadamente sobre un río congelado, el hielo cedió y Nicolás cayó a las heladas aguas, donde murió ahogado. Tocó al hermano menor, Daniel, la muy penosa tarea de viajar desde Basilea hasta San Petersburgo para reclamar el cadáver de su hermano y realizar el papeleo para llevar su cuerpo de vuelta a Suiza. A ese viaje tan desagradable lo acompañó Leonhard Euler, siempre afectuoso y solidario con sus compañeros y amigos. Una vez en Rusia, Daniel Bernoullí se presentó ante la emperatriz para recibir las condolencias de la soberana y en esa ocasión recibió la invitación a permanecer allá, en San Petersburgo y tomar el puesto que su desdichado hermano apenas había ocupado. Daniel Bernoullí aceptó bajo dos condiciones: la primera fue que se le permitiera primero llevar los restos de su
289
El cuerpo rígido
hermano de vuelta a su natal Basilea y la segunda fue que permaneciera a su lado, en calidad de ayudante, su colega y gran amigo Leonhard Euler. Ambas fueron aceptadas, así que tan luego como concluyeron las exequias de Nicolás, regresaron ambos, y principiaron un fabuloso período de espléndidos desarrollos y descubrimientos. En aquella época, al ser nombrado asociado de la Academia de Ciencias de Rusia en San Petersburgo, Euler contaba con veinte años de edad. En 1733, sucedió a Daniel como matemático de la corte imperial, pues tras cinco años en Rusia, éste no se había podido acostumbrar al inclemente clima; al frío, nevadas y ventiscas frecuentes y su salud se había deteriorado notablemente. Así que con veintiséis años, Euler obtuvo uno de los más altos escaños en la Academia de las Ciencias de Rusia. De ahí en adelante, Euler hizo tres cosas durante su vida: en primer lugar se dedicó a escribir artículos y libros sobre física, astronomía, matemáticas, teoría de los números, etc. Es impresionante la cantidad de publicaciones originales, de teoremas, y demás ideas que produjo este excepcional hombre de ciencia. Sus jornadas eran absolutamente extenuantes, pues comenzaba muy temprano por la mañana, antes de que despuntara el Sol, a escribir y no terminaba sino hasta las altas horas de la noche. No tenía descanso en su frenética creación de ideas. En 1970, el gobierno de la que fue la Unión de Repúblicas Socialistas Soviéticas lanzó una convocatoria a nivel mundial para recabar fondos para compilar y editar la obra completa de Euler; mismas que se encontraban regadas por toda Europa, algunas de las cuales estaban perdidas y de algunas otras ni siquiera se sabía de su existencia. Un total de 250 tomos fueron editados. Sus intereses fueron variados. Igualmente escribió sobre geometría que sobre las funciones especiales de las matemáticas. Inventó la función que lleva su nombre; reunió a los tres símbolos básicos, i , y e en una sola expresión: e i 1; construyó la tabla de logaritmos y antilogaritmos que todavía hace algunos años debían manejar los escolapios de todo el mundo y muchas y muy variadas ideas más. Tan intenso era su trabajo, bajo muy pobres condiciones de iluminación (no había electricidad, así que toda la luz provenía de velas y candeleros), que a muy temprana edad, antes de cumplir sus treinta años, en 1735 perdió el uso de uno de sus ojos. Su otra pasión fue viajar. Se dice que recorrió toda la Europa de aquella época, dictando conferencias a las que era invitado. Se cuenta que a sus
290
Dinámica del cuerpo rígido
viajes se hacía acompañar de un par de secretarios quienes escribían todo lo que el jefe Euler les iba dictando, incluso cuando viajaban en las diligencias de la corte imperial rusa, por aquellos pésimos caminos. Los pobres y desafortunados ayudantes se zangoloteaban mientras tenían que hacer verdaderos actos de equilibrio para no derramar la tinta de los tinteros y seguir escribiendo lo que el genio les dictaba. Su tercera afición en la vida fue su familia. A los veintiséis años contra jo nupcias con una muchacha suiza y desde entonces y hasta su muerte fue un fiel y amoroso esposo y un excelente padre de trece hijos; de los cuales solamente cinco sobrevivieron a las enfermedades infantiles como la tosferina, el sarampión o las paperas, así como a las pestes que periódicamente asediaron Europa. De hecho, fue debido a las pésimas condiciones climáticas que se vivían en Rusia y la falta de calefacción, que Euler decidió abandonar la corte imperial y aceptar el puesto de matemático de otro emperador: Federico el Grande de Alemania. En 1741 viajó a ese país de la Europa occidental, con todo y su mujer, sus hijos y su voluminoso equipaje; durante los siguientes veinticinco años permaneció allí. Un buen día se hartó de las majaderías del déspota gobernante y regresó a Rusia. Hasta su muerte, el 18 de noviembre de 1783, Leonhard Euler siguió trabajando y produciendo ideas y descubrimientos científicos importantes. El problema de describir pivoteos de un cuerpo rígido fue uno de tantos que atacó Euler durante su estancia en Berlín, Alemania. En una conversación que tuvo con otro de los gigantes de la mecánica, a quien había invitado a visitarlo, el italo-francés Joseph Louis Lagrange (1736– 1813), se planteó el problema de la mecánica de los cuerpos rígidos. El vínculo entre estos dos genios dio por resultado el tratamiento matricial que aquí se ha propuesto para describir el movimiento de estos cuerpos. Un cuerpo rígido que pivotea alrededor de un punto fijo tiene una cantidad de momento angular h , tal como se mencionó en general para cualquiera otro cuerpo material en la mecánica. Para calcular esta cantidad vectorial se puede imaginar a ese cuerpo como si estuviera constituido por una gran cantidad de pequeñísimos elementos diferenciales de masa dm, tal como se puede apreciar en la figura 4.4.1. Suponiendo que r es el radio vector desde el origen •del sistema coordenado fijo en el espacio O y su velocidad instantánea es r , entonces el vector diferencial de momento
291
El cuerpo rígido
z
dm dm h
•
r
r r
0
y
x Figura 4.4.1. Un cuerpo rígido pivoteando alrededor de un punto fijo. Cada •
elemento de masa se mueve con velocidad r y posee un momento angular.
angular asociado a alguno de los elementos de masa del cuerpo (cualquiera de ellos) esta dado por r r r r˙ dm ;
(4.94)
esto es, el producto vectorial del radio vector por su cantidad de movimiento. Entonces, si se desea saber cuál es el vector de momento angular de todo el cuerpo, hay que integrar; r
h≡
r r r r ( ˙ ) dm .
∫ M
(4.95)
Realizar esta integración sobre la masa del cuerpo es, en general, imposible, ya que para hacerlo se debe conocer la dependencia que tienen el radio • vector r y la velocidad instantánea r en este escalar. Por ello, lo que se hace
292
Dinámica del cuerpo rígido
siempre es dividir y multiplicar el integrando en (4.95) por el elemento diferencial de volumen del cuerpo; de este modo, una integral sobre la masa M se convierte en una, más fácil en general, sobre el volumen del cuerpo: r
h (r r˙ ) dV
∫ V
r
r
(4.96)
donde es la llamada densidad de masa del cuerpo, definida como la razón de su masa a su volumen; i.e.:
dm ≡ . dV
(4.97)
Ahora bien, de acuerdo con el resultado (4.53), para un cuerpo rígi• do que pivotea alrededor de un punto fijo en el espacio, la velocidad r de cada uno de sus puntos materiales constitutivos se identifica con la velocidad tangencial, definida como el producto vectorial de la velocidad angular del cuerpo, por el radio vector desde el pivote O al punto material, de tal suerte que la expresión general (4.97), para el caso de un cuerpo rígido es equivalente a:
r
∫ V
r
h [r ρ(ω r )]dV . r
r
(4.98)
Desarrollando el triple producto vectorial que se ha presentado en el integrando de (4.98), de acuerdo con la bien conocida regla para tal caso, se obtiene:
h ρ r
∫ V
r
r
2
rr
1 r r
⋅ ω dV . r
(4.99)
En donde 1 es la matriz unidad. Dado que la velocidad angular es la misma para todos los puntos del cuerpo rígido, tal como se demostró en (4.58), entonces puede colocar
293
El cuerpo rígido
se fuera del integrando en (4.99), de modo que el momento angular h de un cuerpo rígido queda descrito por la siguiente fórmula:
r
r
h I ⋅ ω ,
(4.100)
siendo I el llamado tensor de inercia del cuerpo rígido, definido como: I
ρ r
∫ V
2
r
rr
1 r r
dV .
(4.101)
En la definición (4.101) para el tensor de inercia de un cuerpo rígido, aparece, entre otras cosas, el producto rr
r r ; se trata simplemente de la yuxtaposición de los vectores de posición. No es un producto escalar, ni un producto vectorial. Algunos autores le llaman producto directo; otros le nombran producto diádico. En fin, que lo único que representa es el acoplamiento de esos vectores, así que, representando las componentes de (4.101) se tiene algo como:
I ij ρ r δ ij xi x j dV
∫ V
r
2
(4.102)
con
i , j 1, 2, 3. O bien, matricialmente y usando coordenadas cartesianas:
I
≡
∫ ρ xzdV ∫V ρ( y 2 z 2 ) dV V∫ ρxydV V 2 2 x z ρ ∫ ρ xydV ( ) dV ∫ ρ yzdV ∫ V V V 2 2 x y ρ ∫ ρ xzdV ∫ ρyzdV ( ) dV . ∫ V V V
294
(4.103)
Dinámica del cuerpo rígido
No hay por qué alarmarse de ver una cosa con una apariencia tan feroz como esta que se muestra en (4.103). Se trata de una simple matriz. Es una matriz cuyos elementos deben calcularse. Son estos, en efecto, las integrales sobre el volumen del cuerpo rígido y que toman en cuenta, además, cuál es la distribución de masa del mismo, a lo largo y ancho de su propia geometría. A esta matriz se le conoce como el tensor de inercia del cuerpo. Los elementos del tensor de inercia (4.103) tienen las unidades de masa, multiplicadas por el área y si se observa con detenimiento, están agrupados en una forma singular dentro de la matriz. En efecto, a lo largo de la diagonal principal de (4.103) aparecen los términos
∫ V (
)
(4.104 a)
∫ V (
)
(4.104 b)
∫ V (
)
(4.104 c)
I xx ≡ ρ y 2 z 2 dV ,
I yy ≡ ρ x 2 z 2 dV ,
I zz ≡ ρ x 2 y 2 dV ,
a los cuales se les denomina momento de inercia alrededor del eje Ox, momento de inercia alrededor del eje Oy y momento de inercia alrededor del eje Oz , respectivamente. Por su parte, los términos fuera de la diagonal principal en la fórmula (4.103) se repiten por pares; son tres y tienen la forma:
∫ V
(4.105 a)
∫ V
(4.105 b)
P xy ≡ ρ xy dV ≡ Pyx ,
P xz ≡ ρ xz dV ≡ Pzx ,
295
El cuerpo rígido
∫ V
P yz ≡ ρ yz dV ≡ Pzy ,
(4.105 c)
estos son los llamados productos de inercia . Momentos de inercia y productos de inercia son, pues, los elementos de esa matriz de 33 a la que se ha llamado el tensor de inercia
I xx Pxy P xz I ≡ P xy I yy P yz P xz Pyz I zz .
(4.106)
Otro aspecto del tensor de inercia de un cuerpo rígido, que es necesario observar, es que durante su pivoteo, los valores de las coordenadas de los puntos materiales del cuerpo cambian si se observan desde el marco de referencia fijo en el espacio. En efecto, un observador inercial, parado justo en el origen de su sistema de coordenadas, verá cómo el cuerpo, con todos sus puntos materiales, le pasan enfrente una y otra vez mientras el cuerpo nuta, precede y gira, así que el cálculo de los momentos y los productos de inercia, aún que se trate de un cuerpo con densidad uniforme, se convierte en un problema complejísimo, ya que las coordenadas materiales son variables en el tiempo. Por lo tanto, independientemente de que los elementos del tensor de inercia puedan ser calculados, todos ellos son variables pues desde el marco fijo en el espacio cambiarán sus valores de un instante al siguiente. Por su parte, si ahora se imagina al observador cuyo sistema de coordenadas pivotea con el cuerpo, las cosas son muy distintas; para él las coordenadas de los puntos materiales parecen estar quietas, fijas y por lo tanto, para este observador, los momentos de inercia y los productos de inercia resultan ser constantes. Este es el resultado que será aprovechado para la descripción del movimiento de los cuerpos rígidos de inmediato, pues, si se escribe el vector de momento angular h desde el marco fijo al cuerpo, siguiendo la fórmula general (4.100):
r
r
h I ⋅ ω ,
296
(4.107)
Dinámica del cuerpo rígido
donde todas las literales llevan una prima en la parte superior derecha, indicando que son evaluadas desde el marco fijo en el cuerpo. Cabe recordar que la ley de transformación que permite expresar a las componentes de un vector desde este marco, a partir del marco fijo en el espacio, es aquella que se describió en general en (4.59), que si se aplica al vector de momento angular da como resultado lo siguiente: r
r
h R ⋅ h ,
(4.108)
siendo R la matriz de rotación. Pero la expresión anterior se puede rescribir como: r
r
T
h R ⋅ I ⋅ R ⋅ R ⋅ ω ,
(4.109)
que muestra claramente las propiedades de transformación: T
⋅ ⋅
(4.110 a)
I R I R r
r
ω R ⋅ ω .
(4.110 b)
Ahora se pueden usar las fórmulas (4.108), (4.109) y (4.110) para calcular la derivada temporal del vector de momento angular: r d ˙ ˙ T T ˙ r h R ⋅ I ⋅ R ⋅ R ⋅ ϖ R ⋅ I ⋅ R ⋅ R ⋅ ω dt r
(R ⋅ I ⋅ R ) ⋅ R ⋅ ω ; T
r
(4.111)
así que de acuerdo con (4.44) y (4.46): r
r r ˙ h I ⋅ ω ω I ⋅ ω , r
(4.112)
en donde se ha utilizado la idea de que el tensor de inercia calculado desde el marco fijo en el cuerpo es una constante. La demostración de este resultado sigue lógicamente de todo lo anterior. Se deja al lector interesado obtener, como un ejercicio algebráico, la fórmula (4.111) Por otra parte, de acuerdo con la ley para las torcas, estudiada anteriormente, en el caso de cualquier cuerpo material en el espacio euclideo de tres dimensiones se cumple siempre que:
297
El cuerpo rígido
˙ N h . r
r
(4.113)
Por lo tanto, igualando los miembros de la derecha de (4.112) y (4.113), se obtiene que r r r ˙ I ⋅ ω ω I ⋅ ω N . r
(4.114)
Estas son las célebres ecuaciones de Euler que permiten estudiar los pivoteos de cualquier cuerpo rígido alrededor de un punto fijo en el espacio. Las ecuaciones de Euler (4.114) son típicas de la mecánica clásica. Se trata de expresiones que vinculan las causas (las torcas) con los efectos que ellas provocan en los cuerpos que se encuentran en cierto estado inicial de rotación. Estos efectos son siempre del mismo tipo general; esto es: cambian su estado de pivoteo (su momento angular). Se les llama ecuaciones (4.114) porque no hay que olvidar que son vectoriales, así que se trata de tres componentes que es necesario plantear en general, para hallar el cambio de la conducta de rotación de un cuerpo rígido. Casi siempre, a excepción de ciertos casos extraordinariamente simples, simétricos e ideales, las ecuaciones diferenciales de Euler son muy complicadas. Tanto así, que a la fecha solamente unos cuantos problemas típicos han podido resolverse en forma analítica, cerrada. En principio, las fórmulas que se tienen para describir las torcas son escasas. A excepción de aquellas que provienen de las bien conocidas fuerzas conservadoras y que se discutieron en secciones anteriores, torcas más complicadas dan lugar a ecuaciones diferenciales sumamente complejas. Supóngase que, en efecto, cierta torca N se aplica sobre un cuerpo rígido. Para hacer posible una primera integral del movimiento imagínese que esa torca proviene de una fuerza conservadora F . Si se describe el sistema desde el sistema de coordenadas fijo en el cuerpo, se tiene que cumplir que:
r
r ˙ . N I ⋅ ω
(4.115)
Se ha escogido como marco de referencia al sistema fijo en el cuerpo para simplificar un poco las ecuaciones diferenciales, pues, como se recordará de la discusión previa, desde este sistema de coordenadas, los momentos de inercia y los productos de inercia del cuerpo son todos, constantes.
298
Dinámica del cuerpo rígido
Ahora multiplicando miembro a miembro de (4.115) por escalarmente se consigue:
r
ω ⋅ N
r d 1 r ) . I ω ω ⋅ ⋅ ( 2 dt
(4.116)
Se llama la energía cinética rotacional del cuerpo rígido al producto
T R ≡ 12 ω ⋅ I ⋅ ω . r
r
(4.117)
Se trata de un escalar, de modo que expresado desde cualquier sistema de coordenadas es exactamente el mismo. Así, si la energía cinética rotacional se describe de vuelta desde el sistema de coordenadas fijo en el espacio, su fórmula es r
r
T R ≡ 12 ω ⋅ I ⋅ ω ,
(4.118)
en otras palabras, la energía cinética rotacional es un invariante (no constante sino invariante) ante transformaciones de coordenadas, como puede demostrarse muy fácilmente si se aplica la transformación R a cada uno de sus elementos, de acuerdo con (4.110). Por su parte, el término de la izquierda en (4.116) también puede reducirse en el caso de fuerzas conservadoras, pues: r ˙ ω ⋅ N ≡ ω ⋅ (r F ) (ω r ) ⋅ F r ⋅ F r
r
r
r
r
r
r
r
r
y por consiguiente, si la fuerza en efecto, es conservadora, se tiene que: r
r
ω ⋅ N
dU , dt
(4.119)
siendo U la energía potencial correspondiente a la fuerza F . Entonces, sustituyendo el resultado (4.119) en (4.116) y haciendo uso de la definición (4.117), se llega a la siguiente fórmula:
299
El cuerpo rígido
TR U E R
(4.120)
que no es otra cosa que la fórmula para la conservación de la energía rotacional total E R , como la suma de la energía cinética rotacional y la energía potencial que genera la torca. En todo caso, se trata de una primera integral de las ecuaciones de movimiento de Euler (4.114). El fin último que se persigue al plantearse matemáticamente un problema sobre el movimiento de un cuerpo rígido que pivotea alrededor de un punto fijo, es la determinación de sus parámetros como funciones del tiempo. En este caso sería, pues, llegar a saber qué funciones del tiempo son los ángulos de Euler. Aquí se trata de aplicar nuevamente la rutina general, aquella estrategia que se estableció muy al principio de este libro para resolver los problemas de la mecánica: comenzando con las ecuaciones diferenciales de Euler (que son las que se deben utilizar siempre que se de un problema de esta naturaleza), se deben proponer las ecuaciones constitutivas; esto es, las fórmulas empíricas correspondientes al caso particular que se estudia. Aquí, hablar de ecuaciones constitutivas significa proponer las fórmulas para la torca vectorial. Una vez establecidas las ecuaciones diferenciales, se procede a integrarlas. Dado que se trata de ecuaciones diferenciales de segundo orden, es necesario realizar dos integraciones por cada una de ellas. Que las ecuaciones de Euler son, en efecto, de segundo orden se ve de inmediato si se observa que en el miembro de la izquierda de (4.114) aparece la primera derivada temporal de la velocidad angular y ésta, a su vez, contiene las primeras derivadas de los ángulos de Euler, como se aprecia en (4.91) o (4.92). Una vez realizada la doble integración e impuestas las condiciones iniciales correspondientes, se debe llegar a la meta deseada: expresar a los ángulos de Euler (o los parámetros que se hayan usado para describir el movimiento), en función del tiempo; esto es: θ
≡ θ t
φ ≡ φ t ψ
≡ ψ t .
300
Dinámica del cuerpo rígido
Volviendo al resultado anterior (4.120), es de observarse que, en efecto, es una integral de las ecuaciones de Euler. En esta expresión solamente aparecen las componentes de la velocidad angular, ya no sus derivadas. Incluso es posible despejar a la energía cinética rotacional y escribirla en función de la energía potencial como: r 1ω 2
r
⋅ I ⋅ ω E R U (θ , φ , ψ ).
(4.121)
Más aún, si se recuerda la fórmula (4.100) para el vector de momento angular, se puede ver que (4.121) se puede escribir como: r
r
ω ⋅ L 2( E R U (θ , φ , ψ )) .
(4.122)
Lo que la fórmula (4.122) expresa es que el vector de velocidad angular y el de momento angular guardan una relación: la proyección de sobre L es igual al miembro de la derecha. Si, por ejemplo, el escalar U de la energía potencial fuera constante, entonces y L guardarían una proyección recíproca constante también. Más aún, si la energía potencial U es constante, entonces la torca es nula, de modo que el vector de momento angular es constante, como se deduce de (2.38), así que su magnitud, su dirección y su sentido están fijos en el espacio. También es constante, como se aprecia de (4.100), así que en este caso, está simplemente a un ángulo fijo con respecto a h , como se aprecia en la figura 4.4.2. Por otra parte, si el escalar de energía potencial U no es constante, entonces precede alrededor de h y además el ángulo relativo entre ambos vectores cambia instantáneamente; desde un ángulo mínimo, cuando U adquiere el valor cero, hasta /2, cuando U es igual a E R . Pero en este caso, la velocidad angular se vuelve igual a cero, así que se puede imaginar que cabecea respecto a h pero, mientras mayor sea el ángulo relativo entre ambos vectores, más lentamente gira el cuerpo y viceversa. En el caso general, cuando la energía potencial es alguna función de los ángulos de Euler; el vector de velocidad angular precede y nuta con respecto al vector de momento angular, pero éste a su vez precede y nuta con respecto a la línea O z. Como puede verse, el problema general es sumamente complicado.
301
El cuerpo rígido
h
0 Figura 4.4.2. El vector velocidad angular precede alrededor del vector de mo-
mento angular.
Pero siempre hay salidas a todo problema de física; así se ha visto a lo largo de quinientos años. El ingenio del hombre es impresionante y por más cerrado, por más complejo que parezca un problema, tarde o temprano el genio humano se hace presente para remontar el obstáculo. Así ha sido y ojalá así siga siendo siempre. La supervivencia del género humano depende de ello. En este caso nuevamente, es posible simplificar en forma notable el tratamiento del problema de la mecánica del cuerpo rígido si se propone ahora otro sistema de coordenadas aún más particular. Se trata de un sistema coordenado fijo al cuerpo, de manera que todo lo que se ha escrito sobre este marco seguirá siendo válido para el nuevo. La característica adicional que se impondrá sobre este nuevo sistema de coordenadas es que las direcciones de sus ejes no sean cualesquiera tres líneas ortogonales sino que sean escogidas de tal modo, que el tensor de inercia I , definido anteriormente, exhiba momentos de inercia sobre su diagonal principal, pero los productos de inercia, esos escalares que aparecen fuera de ella, sean
302
Dinámica del cuerpo rígido
todos nulos. A este sistema de coordenadas se le llamará en adelante el sistema de ejes principales y se dirá que con respecto a este marco de referencia, el tensor de inercia está diagonalizado. Para hallar este sistema de ejes principales, se exige que el tensor de inercia I , proyectado sobre aquel, dé cómo resultado una simple dilatación; esto es, que: r
r
⋅ R λ R
I
(4.123)
o bien, lo que es equivalente: r
I
r
⋅ R λ 1 ⋅ R
(4.124)
Así, si R representa al vector cuyos elementos son cada uno de los tres vectores de la base del sistema de ejes principales, entonces, por su propia definición, al proyectarse el tensor de inercia I , sobre sus respectivas direcciones, dan como resultado a la matriz unidad 1 multiplicada por un factor que es la dilatación de los ejes. Pasando el miembro de la derecha de (4.124) a la izquierda y factorizando, se obtiene lo siguiente:
r
(I λ 1 ) ⋅ R 0.
(4.125)
La expresión anterior se puede contemplar ahora como un sistema de tres ecuaciones algebraicas lineales de primer grado, simultáneas, que son homogéneas. Para hallar los coeficientes que las resuelven, es necesario plantearse el hecho de que su determinante debe ser nulo, puesto que las componentes de R son linealmente independientes. Entonces:
det(I λ 1 ) 0 ,
(4.126)
I xx λ Pxy P xz I yy λ P yz 0 P xy P xz Pyz I zz λ .
(4.127)
o equivalentemente:
303
El cuerpo rígido
Al resolver el determinante anterior se llega a una ecuación de tercer grado en : λ3 Aλ2 Bλ C 0
(4.128)
llamada la ecuación característica , cuyos coeficientes A, B y C son los invariantes principales, definidos respectivamente como:
A ≡ Tr (I ) B ≡
(4.129 a)
∑ menores ( )
(4.129 b)
C ≡ det(I ).
(4.129 c)
I
Hace ya muchos años que se sabe cómo resolver una ecuación cúbica como la que se presenta en (4.128). De hecho, un joven nacido en 1499 en Bresia, una pequeña ciudad al noreste de Italia, cuyo nombre original era Níccolo Fontana, fue el primero en proponer un método para resolverla. En 1512, durante el saqueo que hizo el ejército francés que invadió Italia, el jovencito Níccolo quedó en medio de una estampida de los caballos montados por los franceses, que recorrían las lodosas y encharcadas calles de la ciudad, destruyendo todo lo que a su paso encontraban. Uno de los soldados, enloquecido por la lujuria del saqueo, asestó al niño varios sablazos en la cabeza, así nomás, sin saber ni quién era, ni por qué y siguió su loco galope hiriendo a otros desdichados que, al igual que Níccolo, habían tenido la pésima suerte de cruzarse en su camino. El pobre muchacho cayó al suelo en cuanto recibió los golpes. Otros caballos pasaron por encima de aquel bulto enlodado y ensangrentado y con sus cascos le provocaron varias fracturas; en el brazo, en el tórax y en el maxilar, que ya de por sí había sido cortado con uno de aquellos tajos. Cuando ya todo había pasado y la calma regresó al lugar, los aterrorizados habitantes de Bresia salieron poco a poco de sus escondites para tomar cabal conciencia de las pérdidas y los daños que aquellos bárbaros les habían infligido. La madre de Níccolo, después de buscarlo en varias partes lo halló medio muerto. Estaba casi irreconocible por el lodo y por la sangre y así
304
Dinámica del cuerpo rígido
lo llevó presurosa a lo que quedaba de su arruinada casa. Milagrosamente Níccolo Fontana sobrevivió a sus heridas y a las infecciones posteriores. Sus fracturas soldaron, pero nunca lo hicieron correctamente, pues ningún médico lo atendió para reducirlas y colocar los huesos en el lugar adecuado. Toda la vida tuvo problemas para caminar y nunca logró, después de aquella terrible experiencia, articular las palabras en forma normal; su paladar y su maxilar mal curados se lo impidieron. En la escuela donde acudía, sus compañeritos, despiadadamente, le decían que era un monstruo y lo llamaron Tartaglia: el tartamudo. Él mismo aceptó ese sobrenombre y en su vida lo llevó como seudónimo. Se convirtió al paso del tiempo en un algebrista formidable. En 1535, Tartaglia halló la solución de la ecuación cúbica. Para hacerlo, propuso la existencia de tres números cuyo cuadrado es negativo, adelantándose así muchos años a los números hipercomplejos y los cuaterniones de Grassmann, Hamilton y Clifford en el siglo XIX. Publicó sus trabajos en una revista italiana local (Nova Scientia ) y cobró notoriedad por ello en toda la región. Poco después de esta publicación, un médico, matemático y jugador empedernido llamado Girolamo Cardano se apareció en la casa de Tartaglia y se hizo su amigo, ofreciéndole atenciones y lisonjas. Así, llevándole obsequios y halagándolo durante las semanas que pasó en Bresia, Cardano se las ingenió para sonsacarle a Tartaglia los detalles sobre el procedimiento para resolver la ecuación cúbica (mismos que Tartaglia no había publicado por temor a ser víctima de algún plagiario de esos que en las grandes ciudades, agazapados detrás de los escritorios de las universidades, se daban y se siguen dando hasta el presente) y se los llevó bien guardados en su equipaje cuando, satisfecho, partió de la ciudad prometiéndole al matemático que los publicaría detalladamente en un libro que se encontraba en preparación y que aparecería pronto, dándole todo el crédito al minusválido aquel. Cardano se fue de Bresia y nunca regresó. Efectivamente publicó el libro sobre matemáticas y en uno de sus capítulos expuso, tal como se lo había dictado Tartaglia, la solución detallada a la ecuación cúbica, pero sin dar el debido crédito a su autor original. También incluyó en el libro algunas consideraciones acerca de una posible solución de la ecuación de cuarto grado que le había plagiado a otro infortunado talento; un joven matemático de apellido Ferrari, al cual lo había tomado como su ayudante a cambio de techo y comida.
305
El cuerpo rígido
Cuando Tartaglia se enteró de aquel libro y de la rapiña científica de la cual había sido víctima a manos de Cardano, su ira no conoció límites. Con sus escasos fondos, escribió a mano algunas decenas de inflamados avisos en sendos pliegos de papel estraza, notificando a todo aquel que pudiera y quisiera leerlos, que un tal Girolamo Cardano le había robado con engaños el procedimiento para resolver la ecuación cúbica y lo había publicado a su nombre. En el pliego también se leía un desafío: “…si de veras está por encontrar un método para resolver las ecuaciones cuárticas, lo reto a que se presente aquí, en Bresia, tal día a las tantas horas, en el centro, enfrente de la iglesia y del palacio de gobierno, para que en un duelo de hombres de ciencia veamos quién en verdad puede resolver tan compleja, como importante ecuación algebraica. De no presentarse, se le tendrá por farsante y cobarde”. Tartaglia mandó pegar esos avisos en varios lugares de la región y esperó a que el sinvergüenza de Cardano se presentara para enfrentarlo en aquel singular duelo de matemáticas. Pasó el tiempo y llegó la fecha establecida para aquel combate intelectual. Cardano nunca apareció. El que, en cambio, mostró la cara fue el joven Ferrari, quien para aquel entonces ya se había percatado del plagio del que él también había sido objeto a manos de su mentor. El combate no se llevó a cabo en Bresia; se trasladó a Milán, un lugar con mayor movimiento intelectual que aquella pequeña ciudad al pie de las montañas. Se dice que después de varias sesiones, ambos, Tartaglia y Lodovico Ferrari llegaron casi simultáneamente y por su lado a la solución de la ecuación de cuarto grado. Ambos se autodesignaron los vencedores, pero los jueces; profesores de la Universidad de Milán, después de deliberar, decidieron darle el triunfo a Ferrari. Tartaglia regresó a Bresia derrotado, frustrado y lastimado por la maldad de aquel hombre que lo despojó de su trabajo. Se dice que después de esa experiencia desarrolló aún algunos trabajos que publicó en revistas inglesas, para la artillería británica y dedicados a Enrique VIII. Níccolo Fontana (a) Tartaglia murió en 1559. Hasta hace algunos años, a los escolapios que cursaban el quinto o el sexto grado de primaria, aún se les enseñaba la fórmula de Cardano para resolver la ecuación cúbica. Todavía algunos viejos libros de texto de álgebra contienen las indicaciones para hallar las raíces de las ecuaciones de tercer grado y unos cuantos, muy pocos, hacen referencia al método
306
Dinámica del cuerpo rígido
como el de Cardano-Tartaglia. Hoy en día, ningún muchacho sabe cómo resolver la ecuación mencionada. No hay razón. Las calculadoras electrónicas, que por unos cuantos pesos se compran en cualquier parte, tienen forma de hallar (aproximadamente) las raíces de las ecuaciones algebraicas de cualquier orden (o casi). La historia no terminó allí, en aquella batalla de genios, en Milán. Todos los talentos de entonces, al enterarse de ella se excitaron con la posibilidad de encontrar soluciones a otras ecuaciones algebraicas de orden superior. Si aquel par de bizarros contendientes; uno tartamudo y deforme y el otro un joven semidesnutrido y casi iletrado de diecinueve años habían podido encontrar el tratamiento para las ecuaciones de cuarto grado, ¿por qué no se podía hacer lo propio con las de quinto, o sexto? Mentes brillantes, genios de las matemáticas, lucharon afanosamente, poniendo lo mejor de sus talentos para resolver las ecuaciones quínticas durante más de doscientos cincuenta años, sin éxito. En las revistas especializadas del mundo científico se recibían con cada vez menos frecuencia artículos de matemáticas de todas partes, clamando ser los autores de tal o cual solución a estas ecuaciones. Al revisarlos con cuidado, los árbitros encontraron siempre alguna falla, alguna consideración equivocada que echaba por tierra la “solución”. En 1820 un jovencito de dieciocho años creyó también haber encontrado la solución de la ecuación quíntica y preparó su artículo para enviarlo a alguna revista para su publicación. Sin embargo, un poco antes de ponerla en el correo para su envío, cuando ya tenía en sus manos el artículo en forma definitiva, de pronto, al dar un último repaso, descubrió una falla en el procedimiento de deducción que daba al traste con la solución. Rápidamente rompió el papel y regresó a su escritorio a tratar de enmendar el error y encontrar la deseada solución. Nunca lo logró. En cambio, lo que sí pudo demostrar y por ello cobró fama y notoriedad, fue que no es posible hallar una solución analítica y cerrada para las ecuaciones algebraicas generales de grado mayor que cuatro. El nombre de este joven fue Niels Henrik Abel, noruego; que nació el 5 de agosto de 1802 y murió de pulmonía el seis de abril de 1829, antes de haber cumplido sus veintisiete años. Hoy en día, casi cualquiera que sea el grado de una ecuación algebraica, puede resolverse y extraerse sus raíces haciendo uso de métodos muy poderosos del álgebra. No obstante, las soluciones para las ecuaciones de
307
El cuerpo rígido
mayor grado que el cuarto, solamente son aproximaciones. Claro, el orden de aproximación de estas soluciones puede ser tan grande que cualquiera que sea la finalidad para la cual se necesiten, la solución es prácticamente exacta, así que no resulta un impedimento aquella brillante demostración de Abel, de la no existencia de soluciones cerradas y generales para ecuaciones de grado superior a cuatro. En todo caso, regresando a la ecuación característica (4.128) y aplicándole alguno de los procedimientos de solución, como el de Tartaglia (no Cardano), se hallan sus raíces. De acuerdo con el teorema fundamental del álgebra, la ecuación cúbica posee tres raíces y puede ser escrita como el producto de tres binomios de primer grado:
(I1 λ ) (I 2 λ ) ( I 3 λ ) 0 ,
(4.130)
donde I 1, I 2 e I 3 son tales raíces, a las cuales en adelante se les nombrará los momentos principales de inercia del cuerpo rígido. La forma factorizada (4.130) se puede entender como la resolución del determinante original (4.126) para el caso en que la matriz I sea diagonal; esto es
I 1 0 0 I 0 I 2 0 0 0 I 3 .
(4.131)
Así pues, hay un sistema de coordenadas desde el cual los productos de inercia de un cuerpo rígido son todos nulos. Al primer término, a la izquierda y arriba en la matriz de inercia (4.131), I 1 se le llama en particular el momento principal de inercia alrededor del eje Ox . Del mismo modo, a los otros dos se les conoce como el momento principal de inercia alrededor del eje Oy y el momento principal de inercia alrededor de Oz , respectivamente. Usando la expresión (4.131) para el tensor de inercia diagonalizado, en la fórmula vectorial (4.114) para las ecuaciones de movimiento de un cuerpo rígido que pivotea sobre un punto fijo, se arriba a las siguientes:
308
Dinámica del cuerpo rígido
I1ω˙ x ( I 3 I 2 )ω yω z N x ,
(4.132 a)
I 2ω˙ y ( I1 I 3 )ω x ω z N y ,
(4.132 b)
I 3ω˙ z ( I 2 I1 )ω x ω y N z .
(4.132 c)
Así mismo, las demás fórmulas para la dinámica del cuerpo rígido se simplifican notablemente con la adopción del sistema de ejes principales. El vector de momento angular (4.107), por ejemplo, se escribe ahora así en coordenadas cartesianas: r
ˆ ω h iˆI1ω x ˆjI 2ω y kI 3 z
(4.133)
y la ley de conservación de la energía rotacional total (4.120), en términos de la energía cinética (4.118), se ve así: 1 2
(I1ω x2 I 2ω 2y I 3ω z2 ) U (θ , φ , ψ ) E R
(4.134)
en el caso que la torca provenga de una fuerza que a su vez se pueda expresar como el gradiente de la energía potencial U , tal como se demostró anteriormente. Ahora sí, con todo el herramental desarrollado hasta este punto, es posible comenzar a atacar algunos problemas de la mecánica del cuerpo rígido. De todos, el más simple, es el caso de un cuerpo rígido que gira sobre un punto fijo, pero que ninguna torca actúa sobre él. Claramente, si la torca es nula, entonces, de acuerdo con la ley para las torcas y el cambio de momento angular, éste último debe permanecer constante. Así, si h es constante, entonces se puede tomar al vector como referencia. Este vector determina así una dirección invariante en el espacio, tal como se muestra en la figura 4.4.3. Igualmente, recordando el resultado (4.122) que es aplicable en este caso, se observa que
r
r
ω ⋅ h const.,
309
El cuerpo rígido
h
poloda
0 Figura 4.4.3. El vector velocidad angular genera un plano invariante con
proyecciones sobre la dirección invariante h .
sus
es decir que tiene una proyección constante sobre la dirección invariante dada por h . Entonces puede preceder alrededor de h , tal como se muestra en la figura 4.4.3, generando así un plano que también es invariante. La línea que traza sobre el plano invariante se conoce como la poloda . Pero en la descripción de los ejes principales, el vector de momento angular es como se dio en (4.133), así que el producto escalar de este vector, por el de la velocidad angular da como resultado:
I1ω x2 I 2ω 2y I 3ω z2 2TR (const. ),
(4.135)
o bien, dividiendo por la constante, miembro a miembro de (4.135), se obtiene la sugestiva expresión siguiente:
310
Dinámica del cuerpo rígido
ω x 2
2
2T R I 1
ω y 2 2
2T R I 2
ω z 2
2
2T R I 3
1 ,
(4.136)
que es la fórmula para un elipsoide cuyos semi ejes están dados por los denominadores a ≡
2T R , I 1
(4.137 a)
b ≡
2T R , I 2
(4.137 b)
2T R c ≡ . I 3
(4.137 c)
Así, se puede imaginar que el movimiento del vector de momento angular sobre el plano invariante de la figura 4.4.3, que va trazando sobre la poloda, corresponde a la sucesión de puntos de contacto del elipsoide descrito en (4.136) con el plano invariante, tal como se muestra en la figura 4.4.4. Si bien el elipsoide se despliega en un espacio no físico, donde los ejes coordenados son x , y y z , permítase hacer la superposición de ambas figuras: el plano invariante y el propio elipsoide, con la finalidad de interpretar mejor los resultados. De acuerdo con la figura 4.4.4, el origen O donde parten los vectores h y en el espacio, se puede usar igualmente como el centro del elipsoide. El punto de contacto del elipsoide con el plano invariante es la punta del vector de velocidad angular
ˆω ω iˆω x ˆjω y k z r
311
El cuerpo rígido
h
plano invariante poloda
Figura 4.4.4. El elipsoide de Poinsot tiene un punto de contacto con el plano in-
variante. Ese punto traza la poloda mientras el elipsoide rueda sin resbalar sobre el plano.
generado por el elipsoide y al rodar éste, sin resbalar sobre el plano invariante, traza la poloda. Lo realmente importante de estas deducciones es que, conocido el momento angular h , se obtiene para este caso una dirección invariante en el espacio. Con las proyecciones del vector de velocidad angular sobre h se genera un plano, el plano invariante, sobre el cual el vector de velocidad angular traza la poloda. Y para poder resolver el vector de velocidad angular en sus tres componentes x , y y z (que por cierto es la finalidad de este estudio), se usa el hecho que ese punto que emigra sobre el plano invariante corresponde al rodamiento de un elipsoide que se construye con centro en el origen común de h y y cuyos semiejes están en las direcciones de x , y y z , respectivamente. Así, el problema del cuerpo rígido sin torcas puede tener una solución geométrica.
312
Dinámica del cuerpo rígido
Por cierto, al elipsoide, en muchos textos, se le da el nombre de elipsoide de Poinsot , en honor de quien lo propuso por primera vez como un método de solución. Por otra parte, al rodar sin resbalar en el plano invariante, el elipsoide de inercia va trazando sobre su propia superficie otra curva; es la curva que sigue el punto de contacto (la punta del vector de velocidad angular ) con el plano. Esta curva recibe el nombre de herpoloda . Además, si se acude ahora a la fórmula (4.133) para el vector de momento angular, tomando el cuadrado de la magnitud del vector se obtiene:
I12ω x2 I 22ω 2y I 32ω z 2 h 2 (const.) ;
(4.138)
o bien, arreglando de otra manera: ω x 2 2
h I 1
ω y 2
2
h I 2
ω z 2 2
h I
1.
(4.139)
3
La fórmula (4.139) representa otro elipsoide en el “espacio” de las s , con semi ejes
a * ≡
h , I 1
(4.140 a)
b*≡
h , I 2
(4.140 b)
c * ≡
h . I 3
(4.140 c)
Se trata de un nuevo elipsoide, con semi ejes diferentes a los del elipsoide de Poinsot. Este elipsoide tiene sus semi ejes orientados en las mismas di-
313
El cuerpo rígido
0
Figura 4.4.5. Los dos elipsoides del cuerpo rígido se intersecan en la herpoloda.
recciones que el anterior, así que es paralelo a él. Al igual que el elipsoide de Poinsot, éste también tiene un punto en contacto con el plano invariante. Es aquel punto donde apunta el vector de velocidad angular instantánemente. Y del mismo modo que el elipsoide de Poinsot, rueda sin resbalar sobre el plano invariante. Por consiguiente, en el nuevo elipsoide también se traza la herpoloda; la misma que se traza sobre la superficie del elipsoide de Poinsot. Entonces, la herpoloda es una línea común a ambas figuras; se trata, ni más, ni menos que de la línea de intersección de los dos elipsoides. Así pues, la herpoloda es la línea común, la intersección de los dos elipsoides, tal como se ve en la figura 4.4.5. Entonces, si se conoce el valor numérico (constante) de la energía cinética rotacional del cuerpo, y se sabe el valor de la magnitud del momento angular, así como de los momentos principales de inercia, el problema queda resuelto mediante el álgebra; es decir, hallando el lugar geométrico de los puntos que son comunes, tanto al elipsoide de Poinsot, como al otro.
314
Satélites artificiales
ˆ z k
0
x
y
x y
Figura 4.5.1. Un cilindro con masa uniforme gira con velocidad angular , libre
de torcas externas. El vector xy es la proyección de sobre el plano principal x 0 y del cuerpo.
4.5. Satélites artificiales
Considérese como un ejemplo de lo visto anteriormente el caso de un cuerpo rígido con simetría axil que se encuentra girando en el espacio, alrededor de un punto fijo, y que está libre de torcas externas. Sean I 1 e I 2 los momentos de inercia alrededor de los ejes Ox y Oy considerados como ejes principales (véase figura 4.5.1), respectivamente. Entonces, debido a su simetría axil, se supondrá que ambos momentos de inercia son iguales:
I1 I 2 ≡ I 0 ;
(4.141)
por su parte, el tercer momento principal de inercia, se supondrá diferente a los anteriores; sea:
315
El cuerpo rígido
I 3 ≡ I .
(4.142)
Las ecuaciones de Euler para este caso son, por consiguiente, las siguientes:
I 0ω˙ x ( I I 0 )ω yω z 0 ,
(4.143 a)
I 0ω˙ y ( I I 0 )ω x ω z 0 ,
(4.143 b)
˙ z 0 . I ω
(4.143 c)
Obviamente, la componente de la velocidad angular, a lo largo del eje de las cotas es constante, como se ve de inmediato de (4.143 c). Sea pues: ω z ≡ k (const.) .
(4.144)
Ahora, si se define la siguiente constante:
I I 0 k , I 0
J ≡
(4.145)
las ecuaciones diferenciales (4.143 a) y (4.143 b) se pueden rescribir de manera sencilla como: ω˙ x J ω y ,
(4.146 a)
ω˙ y J ω x .
(4.146 b)
Sea ahora 2 ω xy
≡ ω x2 ω 2y
316
(4.147)
Satélites artificiales
el cuadrado de la componente de la velocidad angular a lo largo del plano principal x 0 y (véase figura 4.5.1). Con esta definición el sistema de ecuaciones diferenciales (4.146) puede ser integrado de inmediato si se multiplica la primera por x , la segunda por y y luego se suman estos resultados. Lo que se obtiene después de este procedimiento es: ω xy const.,
(4.148)
o sea que x y y pueden variar en el transcurso del tiempo, pero deben hacerlo de tal modo que la suma de sus cuadrados sea constante, tal como se ve de (4.147) y (4.148). Además, de acuerdo con (4.144) y (4.148) se infiere que la magnitud de es constante también; esto es:
r
ω
2 k const. ≡ ω xy
(4.149)
Más aún, xy y k generan un plano que gira alrededor del eje de simetría del cuerpo, así que éste gira alrededor de xy y alrededor de k de modo que se cumpla (4.149): si gira con mayor rapidez a lo largo del eje de las cotas, su giro alrededor de la dirección perpendicular disminuye y viceversa. Regresando a las ecuaciones diferenciales (4.146); si se hace una nueva derivación con respecto al tiempo de (4.146 a) y se sustituye en su miembro de la derecha de la ecuación (4.146 b), se obtiene:
ω˙˙ x J 2ω x .
(4.150)
Integrando, se obtiene la solución (suponiendo que el tiempo se cuenta a partir de t 00): ˙ x 0 sen ( Jt ) , ω x (t ) ω x 0 cos( Jt ) J 1 ω
(4.151)
siendo x 0 la componente en x de la velocidad angular en el instante inicial y del mismo modo, • x 0 es la componente en x de la aceleración angular en ese mismo instante. Si se lleva a cabo el procedimiento con la componente en y se encuentra con facilidad que: ˙ y 0 cos ( Jt ). ω y (t ) ω y 0 sen ( Jt ) J 1 ω
317
(4.152)
El cuerpo rígido
Si se sigue la estrategia de los elipsoides de inercia, también se encuentran resultados interesantes en este caso. En efecto, aplicando este procedimiento se tiene que el elipsoide de Poinsot es (haciendo uso del resultado (4.144)): ω x 2
2
2T R I 0
ω y 2 2
2T R I 0
k 2 2
2T R I
1;
o bien, simplificando: 2T k ω x2 ω 2y R I 0
2
I
.
(4.153)
Lo que se ha obtenido no es un elipsoide, sino la ecuación de una circunferencia, centrada en el origen Oy con un radio 2TR k 2 r . I 0 La ecuación para el otro elipsoide de inercia, el que se mostró en general en la fórmula (4.139), sufre en este caso una transformación parecida, pues, usando esa fórmula, así como el resultado (4.144), se obtiene: 2 2 2 h k I ω x2 ω 2y I 02
(4.154)
que, según era de esperarse, coincide idénticamente con la ecuación (4.153), de manera que, comparando los miembros de la derecha en ambas ecuaciones de circunferencia, se debe cumplir que:
(
)
2 I 0 TR 12 Ik 2 h 2 I 2k 2 ,
318
Satélites artificiales
z
ˆ Ik
h
0
I 0 x y
Figura 4.5.2.
y h preceden sincrónamente alrededor del eje de simetría del cuerpo. Así se describe desde el sistema de coordenadas fijo al cuerpo.
de donde, la componente z de la velocidad angular debe ser la siguiente:
h 2 k 2 I 2 2 2 ω x ω y I 02
(4.155)
De los resultados anteriores se desprenden algunas consideraciones interesantes. Así, desde el sistema de coordenadas de ejes principales, fijo al cuerpo, el momento angular es un vector constante en magnitud, con una proyección constante sobre el eje principal de cotas y que siempre apunta en alguna dirección sobre el plano formado por las componentes xy y k , que gira con rapidez angular constante J . En la figura 4.5.2 se muestra este resultado. Pero por otra parte, si se observa al cuerpo desde el sistema de coordenadas fijo en el espacio, las cosas se ven un poco diferentes: Como no
319
El cuerpo rígido
z
h
0
Figura 4.5.3. Desde el sistema de coordenadas fijo en el espacio el
cede alrededor del vector constante h .
vector pre
hay torcas sobre el cuerpo, entonces su momento angular es constante; esto es, constante en magnitud, en dirección y sentido, así que imaginando ahora a h fijo en el espacio, el vector de velocidad angular precede alrededor de aquel y dado que el plano formado por xy y k contiene a h , entonces el eje de simetría del cuerpo también debe preceder alrededor de h con rapidez angular J constante, de tal suerte que la línea que va de k a xy debe cruzar siempre a h , tal como se muestra en la figura 4.5.3. Finalmente, es necesario ahora dar a este problema el enfoque de las componentes de la velocidad angular en función de los ángulos de Euler y sus derivadas temporales para tener la imagen completa de los recursos con los que se puede contar en la mecánica del cuerpo rígido para resolver problemas. Volviendo a las ecuaciones diferenciales de Euler (4.143) para el caso de un cuerpo rígido uniforme, con simetría axil y libre de torcas, que pivotea
320
Satélites artificiales
sobre un punto fijo en el espacio, se puede hacer la sustitución de las componentes de la velocidad angular dadas en las fórmulas (4.91) en términos de los ángulos de Euler para el sistema coordenado fijo en el cuerpo. Haciendo esto se obtiene para la tercera de las componentes de , tal como lo implica (4.143 c):
ψ˙ φ˙ cos θ k (const.).
(4.156)
Haciendo lo propio para las dos ecuaciones de Euler restantes en (4.143 a) y (4.143 b): ˙ ˙ sen ψ φ˙˙ sen θ sen ψ φψ ˙ ˙ sen θ cos ψ I 0 (θ˙˙ cos ψ θψ (4.157 a) ˙ ˙ cos θ sen ψ ) ( I I ) k (θ˙ sen ψ φ˙ sen θ cos ψ ) φθ 0; 0
˙ ˙ cos ψ φ˙˙ sen θ cos ψ φψ ˙ ˙ sen θ cos ψ I 0 ( θ˙˙ sen ψ θψ (4.157 b) ˙ ˙ cos θ cos ψ ) ( I I ) k (θ˙ cos ψ φ˙ sen θ cos ψ ) 0. φθ 0
Si ahora se multiplica miembro a miembro de (4.157 a) por sen , se multiplica la ecuación (4.157 b) por cos y se les suma, se obtiene lo siguiente: ˙ ˙ φ˙˙ sen θ φθ ˙ ˙ cos θ ) ( I I ) k θ˙ 0 . I 0 ( θψ 0
Multiplicando ahora miembro a miembro de la expresión anterior por sen , se obtiene, después de arreglar los términos de ella convenientemente,
321
El cuerpo rígido
d ˙ 2 I φ sen θ Ik cos θ 0 . dt 0
(
)
Esta ecuación puede ser integrada de inmediato, dando como resultado lo siguiente:
I 0φ˙ sen 2 θ Ik cos θ Ia ,
(4.158)
siendo a una constante de integración. Despejando la velocidad angular • de precesión : ˙φ I (a k cos θ ) . I 0 sen 2 θ
(4.159)
Así, ha sido posible despejar completamente las variables. Tal como aparece la expresión (4.159) se puede proceder a integrar siempre que se conozca qué función del tiempo es el ángulo . Para despejar aún más las variables y estar en condiciones de integrarlas, es necesario buscar otra información que pueda ser de utilidad. Este objetivo se puede cumplir con la fórmula (4.134) para la conservación de la energía total rotacional. Para este caso en el que no hay torcas externas y que el cuerpo tiene simetría axil, la expresión es particularmente simple: 1I 2 0
(ω x2 ω 2y ) 12 Iω z2 E R .
(4.160)
Sustituyendo en la fórmula anterior las expresiones (4.93) para las componentes de la velocidad angular descritas en términos de los ángulos de Euler y sus derivadas, para el sistema de coordenadas de ejes principales, fijo al cuerpo, se obtiene de (4.160) lo siguiente: 1I 2 0
2 2 2 2 1 ˙ ˙ ˙ ˙ θ φ sen θ 2 I (ψ φ cos θ ) E R .
(
)
322
(4.161)
Satélites artificiales
Entonces, recordando que la componente en z de la velocidad angular es constante, tal como se demostró en (4.156) y sustituyendo el resultado (4.159) en (4.161), es posible ahora despejar a la derivada del ángulo de nutación : 2
2 I a k cos θ ) ( 2 E Ik 2 R ˙ . θ 2 2 I 0 I 0 sen θ 2
(4.162)
Para poder proseguir se hará ahora el siguiente truco: multiplicando miembro a miembro de (4.162) por sen2 se consigue que en el miembro de la izquierda de esta expresión se tenga el cuadrado de la derivada temporal de cos ; así que definiendo:
u ≡ cos θ ; u ∈[1, 1]
(4.163)
se puede expresar todo en términos de esta nueva variable: 2
I 2 2E * u˙ 2 1 u 2 (a ku ) , I 0 I 0
(
)
(4.164)
en donde se ha definido como E * a la constante:
E * ≡ E R 12 Ik 2 .
(4.165)
Así, la expresión (4.164) ha quedado como una ecuación diferencial ordinaria en una sola variable, u, de la forma general
u˙ 2 f (u)
(4.166)
que puede ser convertida de inmediato en una cuadratura. La función f (u) es obviamente, la que aparece en el miembro de la derecha de (4.164); esto es:
(u)
f
2
I 2 2E * 1 u 2 (a ku) . I 0 I 0
(
)
323
(4.167)
El cuerpo rígido
Esta función posee algunos rasgos que la hacen interesante. Por ejemplo, se puede ver que cuando u adquiere los valores 1 o 1, que son las cotas superior e inferior para esta variable, la función es negativa; esto es:
(1) < 0 .
f
Pero si se calcula su primera derivada se puede observar que posee, así mismo, un extremo en 2
I 2k a I 0 ue ≡ 2 I 4 E * 2 k 2 , I 0 I 0 y calculando la segunda derivada de la función se llega a la conclusión de que se trata de un máximo. Entonces, si se traza la gráfica de esa función en un diagrama de f (u) vs u, tal como se muestra en la figura 4.5.4, se puede apreciar que se trata de una curva cuyas ramas se extienden, una en el tercer cuadrante y la otra en el cuarto cuadrante y tienden a . Esta curva, representando una función de segundo grado, exhibe dos raíces y un máximo en algún lugar del primer cuadrante. Así, no obstante que la función está acotada por los valores extremos de la variable u entre menos uno y más uno, solamente aquellos que rinden valores positivos de la función darán como resultado soluciones reales de la ecuación (4.166). Esta región es la que en la figura 4.5.4 se ha sombreado, entre las dos raíces u1 y u2. Para poder realizar la integración de la ecuación diferencial (4.166) es aconsejable agrupar las constantes que allí aparecen en una forma que permita su manipulación sencilla; así, se hará en adelante la siguiente convención: sean 2
A ≡
2E * I 2 a , I 0 I 0
324
(4.168 a)
Satélites artificiales
f(u)
1
1
u1
0
u2
u
Figura 4.5.4. Diagrama u vs f (u) de la función f (u) en (4.311). La región som-
breada es la única donde pueden darse soluciones reales al problema. 2
I B ≡ 2 ka , I 0
(4.168 b)
2
2 E * I 2 C ≡ k I 0 I 0
(4.168 c)
tales constantes. Con este arreglo de los coeficientes de la función, se puede ahora establecer la cuadratura a partir de (4.166) y (4.168): u
t t 0
du
∫ u A Bu Cu2 , 0
325
(4.169)
El cuerpo rígido
donde u0 es algún valor de referencia de la variable de integración. Por ejemplo, se puede adoptar aquel valor que corresponde a t 00. Una vez realizada la integración, lo que resulta es lo siguiente:
B 4 AC cos θ 1 1 2 cos 2C B
(
Ct ) .
(4.170)
Haciendo t 0 se consigue el valor inicial para la nutación:
B 4 AC cos θ 0 1 2C B 2
,
así que la solución, en forma compacta es: cos θ cos θ 0 cos
( Ct ).
(4.171)
Esta fórmula muestra que el cuerpo nuta periódicamente, con un período que es inversamente proporcional a la raíz de C (véase figura 4.5.5). T
2π . C
(4.172)
Conociendo la funcionalidad del ángulo de nutación con respecto al tiempo, tal como se obtuvo en (4.171), se puede regresar ahora a la expresión (4.159) e integrarla, para así conocer la forma como el cuerpo precede alrededor del eje Oz del sistema fijo en el espacio. No obstante, llevar a cabo este objetivo es complicado por la estructura misma de la fórmula (4.159). Afortunadamente hay una consideración que se puede hacer y que resulta en una importante simplificación del problema. En efecto, a partir de las definiciones (4.168) para los coeficientes de la forma cuadrática (4.169), se puede demostrar con cierta facilidad que:
I 2 4 AC k 2 a 2 . 1 2 1 2E * I 0 B
(
326
)
(4.173)
Satélites artificiales
z
1
2
Figura 4.5.5. El eje
OZ del sistema coordenado fijo al cuerpo precede y nuta alrededor del eje Oz , describiendo una figura como la que se muestra, sobre una esfera de radio unidad centrada en el origen común.
Por otra parte, el coeficiente a que apareció por primera vez en (4.158) es una constante aún sin determinar. Entonces se puede escoger en este momento, convenientemente, tal que
a 2 ≡ k 2
2 E * I 0 I 2
(4.174)
con lo cual el radical (4.173) se hace cero. En estas condiciones, lo que resulta en (4.170) es que la variable de nutación es constante; esto es: cos θ
B k ≡ 2C a
327
(4.175)
El cuerpo rígido
así que el cuerpo no nuta, es decir, no cabecea . Si originalmente tuvo cierta inclinación con respecto a Oz , esa misma exhibirá en todo momento posterior. Sustituyendo (4.175) en (4.159) y simplificando, se encuentra que
I a I 0
˙ ϕ
(4.176)
que hace ver que el cuerpo precede alrededor del eje vertical del sistema fijo en el espacio con una velocidad angular constante. Finalmente, con los resultados (4.175) y (4.176) es posible ahora regresar a la fórmula (4.156) y despejar la velocidad angular de rotación: ˙ ( ψ
I 0 I )k . I 0
(4.177)
Nuevamente ha aparecido que la velocidad de rotación del cuerpo alrededor de su eje de simetría es constante. El problema ha quedado resuelto. Bajo la perspectiva del plano invariante y el elipsoide de Poinsot y luego, haciendo uso de los ángulos de Euler, se ha podido concluir que un cuerpo con simetría axil que pivotea alrededor de un punto fijo en el espacio, libre de torcas externas, ejecutará un movimiento consistente en una rotación alrededor de su eje de simetría y una precesión alrededor de una dirección fija en el espacio, sin nutación. Un satélite artificial que está en una órbita alrededor de la Tierra puede servir como un ejemplo de un cuerpo rígido como el que se ha estudiado aquí. Si se fija el sistema de coordenadas al cuerpo, los resultados obtenidos anteriormente son perfectamente aplicables a ese objeto. De hecho, lo que se observa es precisamente el movimiento de rotación y de precesión que se obtuvieron en los resultados (4.176) y (4.177). Normalmente, la precesión se trata de eliminar mediante condiciones iniciales adecuadas. Así, si se le da suficiente energía cinética rotacional inicial alrededor del eje de simetría, se puede ver que en (4.165), la energía corregida E * puede hacerse pequeña; esto es, si
328
Satélites artificiales
1 Ik 2 2
≈ E R ,
entonces
E * ≈ 0 . En estas circunstancias, de (4.174) se infiere que ambas constantes de integración: a y k son cercanamente iguales en sus valores numéricos. Por lo tanto, observando (4.175) se ve que cos θ ≈ 1. En este caso, efectivamente, el cuerpo casi no precede y sólo exhibe una rotación rápida alrededor de su eje de simetría. Queda aún la pregunta de si este pivoteo: rotación más precesión, sin nutación, es un movimiento estable del cuerpo rígido. En seguida se atenderá este asunto: Nuevamente, considérese un cuerpo rígido que pivotea sobre un punto fijo del espacio, libre de torcas. Como ya se vio, las ecuaciones de Euler para este caso son:
I1ω˙ x ( I 3 I 2 )ω yω z 0 ,
(4.178 a)
I 2ω˙ y ( I1 I 3 )ω x ω z 0 ,
(4.178 b)
I 3ω˙ z ( I 2 I 1 )ω x ω y 0 .
(4.178 c)
Se puede apreciar de las ecuaciones anteriores que si los tres momentos principales de inercia son distintos entre sí, entonces: de (3.178 a ): ω˙ x 0 solo sí ω y ω z 0 , de (3.178 b): ω˙ y 0 solo sí ω x ω z 0
329
El cuerpo rígido
y de (3.178 c ): ω˙ z 0 solo sí ω x ω y 0. Por ejemplo, en el primer caso; esto es, el de un cuerpo que pivotea con su componente x de la velocidad angular constante; ω x ≡ ω 0 (const.)
(4.179)
y las demás componentes son nulas. Ahora imagínese que se perturba ligeramente el movimiento del cuerpo, de tal modo que su componente x de la velocidad angular ha cambiado a ω x ω 0 ∈,
(4.180)
las otras componentes del vector velocidad angular ya no tienen por qué ser nulas, así que las ecuaciones de Euler para este nuevo estado de pivoteo del cuerpo son: ˙ 0, I 1 ∈≈
(4.181 a)
I 2ω˙ y ≈ ( I 3 I 1 )ω 0ω z ,
(4.181 b)
I 3ω˙ z ≈ ( I1 I 2 )ω 0ω y ,
(4.181 c)
siempre que: 1), el parámetro de perturbación , sea pequeño y 2) que así mismo, las componentes y y z que han aparecido como resultado de la perturbación sean también pequeñas. Derivando (4.181 b) con respecto al tiempo y sustituyendo en el resultado la componente z de la aceleración angular despejada de (4.181 c), se obtiene fácilmente:
( ˙˙ ω y
I 3 I 1 ) ( I1 I 2 ) ω 0ω y , I 2 I 3 330
(4.182 a)
Satélites artificiales
y haciendo el mismo procedimiento con la ecuación (4.181 c), se obtiene:
( ω˙˙ z
I 3 I 1 ) ( I1 I 2 ) ω 0ω z . I 2 I 3
(4.182 b)
Entonces, si el movimiento de rotación del cuerpo es estable, cualquier pequeña perturbación debe eventualmente “apagarse”. Esto significa que, para el caso estudiado aquí, y y z deben tender a cero en el transcurso del tiempo. Para que ocurra esto se debe satisfacer que la constante que aparece en los miembros de la derecha de (4.182 a) y (4.182 b) sea negativa; esto es, que
( I1 I2 ) ( I 3 I 2 ) < 0 .
(4.183)
Pero esto significa una de dos posibilidades distintas:
i ) I 1 es el momento de inercia mayor ii ) I 1 es el momento de inercia menor Si, por el contrario, I 1 es el momento de inercia intermedio, entonces cualquier perturbación, por pequeña que sea, de x no se apagará espontáneamente. Por su parte, las componentes y y z adquirirán valores cada vez mayores, así que el cuerpo tenderá a oscilar en las otras dos direcciones, cada vez con mayor intensidad. Regresando al ejemplo que aquí se ha estudiado, de un cuerpo rígido con simetría axil, las ecuaciones de Euler que describen sus pivoteos son las (4.143). Supóngase que la componente en x de la velocidad angular, x , sea constante; esto es ω x ω 0
const.;
(4.184)
las ecuaciones de Euler para este movimiento perturbado son, de acuerdo con (4.143), las siguientes:
331
El cuerpo rígido
˙ ( I I 0 )kω y , I0 ∈
(4.185 a)
I 0ω˙ y ( I I 0 )k (ω y ∈) .
(4.185 b)
Derivando con respecto al tiempo la ecuación (4.185 b) e incorporando en su segundo miembro la ecuación (4.185 a) se consigue: 2
I I 0 2 ˙˙ ω y k ω y , I 0
(4.186)
así que, haciendo uso de los resultados (4.182) se puede afirmar que el movimiento de un cuerpo como este, es estable siempre y que cualquier perturbación que se introduzca en alguna de sus componentes de la velocidad angular; bien sea x u y , tenderán a apagarse espontáneamente. La dinámica del cuerpo rígido es de enorme utilidad para la ciencia y para la ingeniería mecánica. Muchos aparatos requieren para su diseño de las herramientas y los conceptos de esta disciplina. Más adelante, cuando se vea la llamada mecánica analítica, habrá de regresar al tema del cuerpo rígido con el enfoque nuevo que este formalismo permite. En el caso de los satélites artificiales que son lanzados al espacio para colocarlos en órbitas circunterrestres bajas, muchas veces se requiere que al girar en torno a la Tierra, su eje de simetría vaya girando también, de manera que el cuerpo presente siempre una misma cara hacia la superficie terrestre. Esto se hace en el caso de satélites de percepción remota que deben tomar fotografías de la superficie del planeta para fines meteorológicos o de prospección. El caso es que al satélite se le obliga a nutar a lo largo de su trayectoria orbital, con una velocidad de nutación constante (o casi constante), de modo que realice su objetivo. Adicionalmente, cualquier precesión del satélite alrededor del eje Oz es indeseable, así que desde el momento mismo en que se libera el satélite desde la bodega del transbordador que lo llevó al espacio, se le da una velocidad de rotación alrededor de su eje de simetría y se le libera con cuidado a fin de evitar en lo posible esa precesión. En la figura 4.5.6 se muestra esquemáticamente a un satélite artificial con simetría axil que orbita la tierra en una órbita circular y que ofrece siempre la misma cara hacia la superficie del planeta.
332
Satélites artificiales
z
•
Z
l.n.
•
Figura 4.5.6. Un satélite artificial de percepción remota viaja alrededor de la Tierra
en una órbita circular. El satélite debe presentar en todo punto de su trayectoria, la misma cara a la Tierra.
Si su precesión será nula, entonces ˙ ≈ 0 . φ
(4.187)
Así que, imponiendo esta condición sobre las fórmulas para las componentes de la velocidad angular en términos de los ángulos de Euler y sus derivadas, dadas en (4.91) y (4.92) para el sistema fijo al cuerpo, se tiene para este caso: ω x θ˙0 cos ψ ,
(4.188 a)
ω y θ˙0 sen ψ
(4.188 b)
˙ ≡ k (const.). ω z ψ
(4.188 c)
333
El cuerpo rígido
Una simplificación aún mayor se consigue en el planteamiento de este problema si se toma como eje de las abscisas del sistema fijo al cuerpo, la línea nodal. Esto es posible dado que, por hipótesis, el cuerpo carece de precesión (ver expresión (4.187). Desde este marco de referencia se obtiene que:
z
≡
ω x 0 ,
(4.189 a)
ω y 0,
(4.189 b)
cons . .
(4.189 c)
Ahora imagínese que el satélite es sacado de su estabilidad al imprimirle a la componente x de la velocidad angular x , una pequeña perturbación ∈, tal como se estudió en los párrafos anteriores, de manera que ahora sus componentes son: ˙, ω x θ˙ ≡ θ ˙0 ∈
(4.190 a)
ω y 0,
(4.190 b)
˙ k . ω z ≡ ψ
(4.190 c)
Pero a todo esto, es interesante preguntarse cómo fue que se le pudo cambiar la velocidad angular a este cuerpo rígido. Bueno, para hacerlo fue necesario aplicarle una torca. Esto es así, ya que, como se vio anteriormente, las torcas tienen como respuesta de los cuerpos el cambio en sus cantidades angulares. Supóngase entonces que una torca N fue aplicada sobre el satélite artificial, las ecuaciones de Euler para este caso se deducen directamente de las expresiones generales (4.132) y presentan el siguiente aspecto:
˙ N x , I0 ∈
334
(4.191 a)
Satélites artificiales
(I I 0 )k (θ ˙0 ∈) N y ,
(4.191 b)
como puede demostrarse fácilmente de (4.190). Ahora, despejando a ∈• de (4.191), así como a ∈ de (4.191 b), se obtienen las siguientes relaciones: ˙ ∈
N x , I
(4.192 a)
N y ˙ . θ ∈ (I 0 I )k 0
(4.192 b)
Por lo tanto, derivando (4.192 b) con respecto al tiempo y comparando el resultado obtenido con (4.192 a), se demuestra que las componentes de la torca deben satisfacer la siguiente condición diferencial:
dN y ( I 0 I )k N x . dt I 0
(4.193)
Para cumplir con el objetivo de generar una torca en el satélite, que tenga como efecto la perturbación de la velocidad angular de este cuerpo, se puede hacer girar en su interior una masa M , alrededor del eje de simetría del cuerpo, tal como se muestra en la figura 4.5.7. Observando esta figura se ve que la torca provocada por la masa en rotación es: r
r N r Mβ˙ 2l sen α kˆ ,
(
)
(4.194)
siendo el ángulo que forma el •vector de posición de la masa desde O , con la vertical OZ . Por su parte, es la velocidad angular con la que gira esta masa alrededor del mismo eje, y l es la distancia entre el origen O y el centro de la esfera, como se puede ver en la figura 4.5.7. El término entre paréntesis en (4.194) no es otra cosa que la llamada fuerza centrífuga
335
El cuerpo rígido
z •
M
l
y
x
Figura 4.5.7. Una masa M se pone a girar para provocar una torca
N en el cuerpo.
dada por el cuadrado de la velocidad angular, multiplicado por el brazo del par (l sen ) de la masa y esto, multiplicado a su vez por la masa M . Desarrollando (4.194) se consigue:
k ˆ r N l sen α cos β l sen α sen β l cos α 0 0 Ml β˙ 2sen α iˆ
ˆj
(4.195) ˆ 2 β˙ 2 sen 2 α sen β ˆjMl 2β˙ 2 sen2 α cos β kˆ ⋅ 0 . iMl De esta forma, sustituyendo en (4.193) las componentes de la torca obtenida en (4.195) para este arreglo mecánico interno del satélite, se obtiene que:
336
Satélites artificiales
I I 0 )k ˙ 2 ( d ˙ 2 β cos β β sen β , dt I 0
(
)
en donde se ha hecho la simplificación de las constantes que aparecen a ambos lados de la ecuación diferencial. Ésta, desarrollada y simplificada, da como resultado la siguiente expresión:
I I 0 ˙ k β tan β 0 . 2I 0
β˙˙ 12 β˙ 2 tan β
(4.196)
Esta ecuación posee soluciones interesantes desde el punto de vista matemático, pero una solución simple consiste en imaginar que la masa se encuentra girando en el interior del satélite con velocidad angular constante, así que ˙˙ 0 , β y por lo tanto
I I 0 k . I 0
˙ β
(4.197)
Así que basta con poner a girar esa masa con una velocidad angular constante, para conseguir una torca. Y para que esa torca sea la adecuada para provocar la perturbación que saque al satélite de su estado de movimiento original, es necesario adecuar los parámetros de giro, de modo que la ecuación (4.195) se satisfaga; esto es, que: 2
I I 0 2 2 2 N x M k l sen α sen β , I 0
(4.198 a)
2
I I 0 2 2 2 k l sen α cos β , I 0
N y M
337
(4.198 b)
El cuerpo rígido
N z 0,
(4.198 c)
y de acuerdo con (4.192 b), la perturbación que esta torca provoca en la velocidad angular de nutación es:
∈ M
I I 0 2 2 ˙ . kl α β θ sen cos 0 2 I 0
(4.199)
Finalmente, si la velocidad angular de nutación que se desea imprimir al satélite artificial es precisamente tal que al dar una órbita completa alrededor de la Tierra, el cuerpo gire alrededor de su propia línea de nodos por • 2 radianes (o 360°) entonces, suponiendo que originalmente 0 es cero:
∈≡
2π , T
(4.200)
siendo T el período del satélite en torno a la Tierra. Por lo tanto, de (4.199) y (4.200) se sigue que 1
2π I I 0 1 2 2 Ml sen α cos β 2 , T I 0 k o bien 2π I 02 I ∈ ≡ Mr ≡ Ml sen α T ( I 0 I )k 2
2
2
(4.201)
es el momento de inercia que debe tener la masa M para lograr su objetivo. Normalmente, al poner en órbita un satélite artificial, se echa a andar el mecanismo para generar la torca interna que lo llevará a tomar la orientación que se desea (en inglés, orientación se escribe como “attitude”, de donde algunos libros traducidos de ese idioma al español han denotado como control de actitud al control de orientación de los cuerpos que inor-
338
Problemas del capítulo
bitan la Tierra). Estos métodos para lograr que un satélite, como en el ejemplo aquí estudiado, presenten una misma cara a la Tierra para realizar sus tareas de percepción remota, son generalmente muy tardados pues requieren de varias semanas para conseguir sus objetivos. Existen otras formas que son más rápidas, como son los pequeños cohetes externos que se activan a control remoto desde la Tierra y que provocan torcas más intensas que llevan a estos cuerpos a su orientación deseada en menos tiempo. 4.6. Problemas del capítulo 4.1.
Considere una rotación simple de un sistema de coordenadas alrededor del eje de las cotas. Si esta rotación es infinitesimal, el ángulo de rotación es y se representa como 1
θ 0
θ 1
0
0 0 1 ;
si una rotación finita es una sucesión de rotaciones infinitesimales, usando esta aquí mostrada y la fórmula (4.28), encuentre la expresión para la rotación simple, finita, correspondiente. 4.2. Una piedra cae desde una altura de 150 m en la Ciudad de México. Calcular cuánto se desvía de la vertical al tocar el suelo, debido a la fuerza de Coriolis. 4.3. Calcular la matriz que representa a un pivoteo del cuerpo rígido, superponiendo las tres rotaciones simples de Euler. Use la fórmula (4.76) y las definiciones (4.63), (4.65) y (4.73). 4.4. Calcular las componentes del vector velocidad angular de un cuerpo rígido que pivotea sobre un punto fijo, en términos de los ángulos de Euler, expresadas desde el sistema fijo en el espacio. 4.5. Calcular los momentos de inercia principales para i) Un cilindro vertical recto, de sección circular, centrado en su centro de masa. ii) Una viga rectangular, recta, horizontal, con masa uniforme, centrada en su centro de masa.
339
El cuerpo rígido
iii) Una esfera uniforme de radio R. 4.6.
4.7.
Encontrar las expresiones para los momentos de inercia de los cuerpos mencionados en el problema anterior, pero ahora supóngase que el sistema de coordenadas se encuentra en uno de los extremos del cuerpo. Demuestre el teorema de los ejes paralelos , que dice que si un momento de inercia de un cuerpo es calculado con respecto a un eje que pasa por su centro de masa, entonces, el momento de inercia con respecto a otro eje, que es paralelo a aquel, está dado por la fórmula
I I Ma 2 ; siendo I el momento de inercia con respecto al eje que pasa por el centro de masa, I´ es el momento respecto del eje paralelo y I es la distancia entre los ejes, también llamado radio de giración. M es la masa total del cuerpo. 4.8. Supóngase que desde sistema de coordenadas, un cuerpo rígido tiene la siguiente matriz o tensor de inercia: 2.75 0.42 0 I 0.42 1.83 0 0 0 1 .
4.9.
Diagonalizar esta matriz, encontrar los momentos de inercia principales y demostrar que el sistema de coordenadas de ejes principales está orientado con su eje de cotas coincidente con el eje de cotas del sistema original, pero ha sufrido una rotación simple con respecto a aquel. ¿Cuál es el ángulo de rotación? Demostrar que, en efecto, los invariantes principales del tensor de inercia definido en (4.127) son: la traza de la matriz; la suma de sus menores de orden dos y su determinante, respectivamente, tal como se describe en (4.129) Demuestre que los productos de inercia no contienen información física relevante. Dar sus argumentos.
340
Problemas del capítulo
Supóngase un disco circular de masa uniforme que gira libremente alrededor de su eje de simetría; esto es, no sujeto a torca alguna. Establezca las ecuaciones de Euler para este caso. i) Demuestre que la componente z del vector velocidad angular del disco, desde el sistema fijo al cuerpo, es constante K . ii) Demuestre que para este caso se cumple la siguiente ley de conservación:
4.10.
Iφ˙ sen 2 θ I 0k cos θ I 0a (const .), donde I es el momento principal de inercia respecto de los ejes perpendiculares al eje de simetría del cuerpo; I 0 es el momento de inercia respecto del eje de simetría y a es alguna constante. iii) Demostrar que la ley de conservación de la energía total rotacional, en términos de los ángulos de Euler y sus derivadas temporales, está dada por la siguiente fórmula: 1I 2
4.11.
(
2
θ˙ 2 φ˙ sen 2 θ 12 I 0 (ψ˙ φ˙ cos θ ) E .
)
Tomando como punto de partida el problema anterior, manejando algebraicamente los resultados, demostrar que se obtiene de ellos la siguiente expresión: 2 u˙ 2
2
2 E 0 I 1 u 2 0 (a ku ) , I I
(
)
donde se ha hecho el cambio de variable:
u ≡ cos θ , E 0 ≡ E 12 I 0k 2 .
341
El cuerpo rígido
Ahora, haciendo un estudio de las propiedades algebraicas de la expresión anterior, encontrar los límites del movimiento e integrar la ecuación diferencial. Explicar los resultados. 4.12. La Tierra es un esferoide oblato; esto es, más ancha que alta. Suponiendo que tiene masa uniforme y que se trata de un auténtico cuerpo rígido (cosa que no es, pues es en realidad un fluido viscoelástico), plantear las ecuaciones de Euler libres de torcas. Resolver este problema. 4.13. Si en el problema anterior se toma en cuenta la presencia de la Luna, entonces ya no es posible considerar a la Tierra libre de torcas. Suponiendo que la Luna está siempre a la misma distancia del centro de masa terrestre (385000 km) y que gira alrededor de ésta en su plano ecuatorial, de manera uniforme, encuentre: i) La torca ejercida por la Luna. ii) Las ecuaciones de Euler para este caso. 4.14.
Con base en las anteriores consideraciones, calcular la llamada precesión de los equinoccios ; ese cabeceo que ejecuta la Tierra alrededor del eje de simetría norte-sur, con un período aproximado de 26000 años. Se dice que Ptolomeo (Claudio Ptolomeo (85-151 d.C.)) ya había observado este fenómeno.
342
Universidad Nacional Autónoma de México Facultad de Ciencias
Mécanica Libro 1 se terminó de imprimir en agosto de 2007 en los talleres de Publidisa Mexicana, S. A. de C. V. Calzada de Chabacano 69, planta alta. Col. Obrera. México 06850, D. F. El tiro fue de 500 ejemplares La edición estuvo al cuidado de Mercedes Perelló Está impreso en papel Bond de 90 gramos En su composición se emplearon tipos Adobe Garamond, Castellar, Frutiger y MathematicalPi de 13:13, 11:13 y 10:12 puntos de pica.