Эмил Ахмедов, Александр Громов. Картины фундаментальной физики.

Page 1

Библиотечка «Квант» Выпуск 138

Э. Т. Ахмедов, А. В. Громов

Картины фундаментальной физики

Москва Издательство МЦНМО 2021


УДК 530 ББК 22.3 A95

A95

Издано при поддержке Фонда развития теоретической физики и математики «БАЗИС»

Ахмедов Э. Т., Громов А. В. Картины фундаментальной физики. — М.: МЦНМО, 2021. — 192+8 (вкл.) с. — («Б-чка „Квант“»; Вып. 138). ISBN 978-5-4439-1571-5 Книга основана на цикле научно-популярных лекций, прочитанных в центре АРХЭ. Она состоит из трёх лекций — по специальной теории относительности, общей теории относительности и квантовой механике. В книге обсуждаются принципы, лежащие в основе этих теорий. Рассказывается о связанных с этими теориями парадоксах и мифах. Изложение рассчитано на учащихся старших классов средней школы; общие теории снабжены примерами их практических применений. Для учащихся старших классов, студентов младших курсов и учителей физики. ББК 22.3

ISBN 978-5-4439-1571-5

ffi Э. Т. Ахмедов, А. В. Громов, 2021 ffi МЦНМО, 2021


ОГЛАВЛЕНИЕ

О научном методе (вместо введения) . . . . . . . . . . . . . .

5

Лекция 1. Специальная теория относительности . . .

15

§ 1. О принципах работы систем глобального позиционирования . . . . . . . . . . . . . . . . . . . . . . . . . . § 2. Пространство-время . . . . . . . . . . . . . . . . . . . . . . . . § 3. Преобразования координат . . . . . . . . . . . . . . . . . . . § 4. Преобразования Лоренца . . . . . . . . . . . . . . . . . . . . § 5. О скорости света . . . . . . . . . . . . . . . . . . . . . . . . . . . § 6. О разности хода часов и лоренцевом сокращении длин . . . . . . . . . . . . . . . . . . . . . . . . . . . § 7. О парадоксе шеста и сарая . . . . . . . . . . . . . . . . . . . § 8. О парадоксе близнецов . . . . . . . . . . . . . . . . . . . . . . § 9. О смысле соотношения E0 = mc2 . . . . . . . . . . . . . . .

50 55 57 58

Лекция 2. Общая теория относительности . . . . . . . . .

62

§ 1. Об искривлении лучей света и принципе Ферма . . § 2. Об искривлении лучей света в присутствии Солнца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 3. Простейшие примеры искривлённых пространств . . 3.1. Сфера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Параллельный перенос и кривизна . . . . . . . . . 3.3. Гиперболоид Лобачевского . . . . . . . . . . . . . . . 3.4. Пространство-время де Ситтера . . . . . . . . . . . § 4. Уравнения Эйнштейна и их решения . . . . . . . . . . . 4.1. Поле . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Электромагнитное поле и частицы . . . . . . . . . 4.3. Уравнения для гравитационных полей . . . . . . § 5. Расширяющаяся Вселенная . . . . . . . . . . . . . . . . . . . 5.1. Метрика Фридмана на гиперболоиде . . . . . . .

63

16 25 29 37 46

66 71 71 74 77 83 86 87 94 95 96 98


4

Оглавление

5.2. О других типах расширения в нашей Вселенной . . . . . . . . . . . . . . . . . . . . . 5.3. О скорости света в расширяющейся Вселенной . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 6. Гравитационные волны . . . . . . . . . . . . . . . . . . . . . . 6.1. Геометрия гравитационной волны . . . . . . . . . 6.2. Регистрация гравитационных волн . . . . . . . . . § 7. О некоторых свойствах чёрных дыр . . . . . . . . . . . . 7.1. Переход в полярные координаты в двумерном плоском пространстве . . . . . . . . . . . . . . . . . . . 7.2. Переход в криволинейные координаты в двумерном плоском пространстве-времени . . 7.3. Пример мировой линии для неинерциального движения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4. Движение света в равноускоренной системе координат . . . . . . . . . . . . . . . . . . . . . . 7.5. Аналогия с чёрными дырами . . . . . . . . . . . . . .

103 105 107 109 111 118 118 120 124 129 131

Лекция 3. Квантовая механика . . . . . . . . . . . . . . . . . . . 136 § 1. § 2. § 3. § 4. § 5. § 6. § 7. § 8. § 9. § 10. § 11. § 12.

О различных типах волн . . . . . . . . . . . . . . . . . . . . . Интерференция . . . . . . . . . . . . . . . . . . . . . . . . . . . . Корпускулярно-волновой дуализм . . . . . . . . . . . . . . Комплексные числа . . . . . . . . . . . . . . . . . . . . . . . . . Математика интерференции . . . . . . . . . . . . . . . . . . Вероятностная интерпретация квантовой механики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Принцип Гюйгенса — Френеля и интеграл Фейнмана по путям . . . . . . . . . . . . . . . . . . . . . . . . . Переход от квантовой к классической механике (или что такое измерение) . . . . . . . . . . . . . . . . . . . Соотношение неопределённостей Гейзенберга . . . . Квантование уровней энергии и туннелирование . . Парадокс Эйнштейна — Подольского — Розена . . . . Парадокс кота Шрёдингера . . . . . . . . . . . . . . . . . . .

137 142 149 153 159 162 166 171 174 175 181 184

Список источников рисунков . . . . . . . . . . . . . . . . . . . . 187


О НАУЧНОМ МЕТОДЕ (ВМЕСТО ВВЕДЕНИЯ)

Нередко считается, что специальную и общую теории относительности, а также и квантовую механику понимали только их первооткрыватели. При этом предполагается, что современные учёные, уступая интеллектуально первооткрывателям, пользуются аппаратом этих теорий, не разбираясь в его сути. Получается что-то вроде мистики или фокуса, а не научного знания. Действительно, популяризаторы науки, среди которых были и первооткрыватели этих теорий, часто преподносили предмет своих исследований в парадоксальной форме. Очевидно, что те явления, которые они наблюдали, противоречили существующим на тот момент представлениям о природе. И таким образом первооткрыватели делились своей радостью от познания столь удивительных явлений, стараясь заинтриговать читателей и слушателей. Учёные, которые в начале XX века создавали обсуждаемые здесь теории, двигались в кромешной тьме, ведь им приходилось разбираться в предмете, в котором ещё никто ничего не понимал. Они нашли в себе силы абстрагироваться от своих предрассудков и устоявшихся стереотипов, сосредоточиться на строгом описании опытных данных. Это позволило им сформулировать взгляд на природу сделанных ими наблюдений, который теперь позволяет с высокой точностью, количественно, а не только качественно, описывать всё более широкий круг явлений. Представьте, что вы пробираетесь ночью через тёмный лес, не зная правильного направления, и только смутно чувствуете, что где-то там, далеко, возможно, что-то вас ждёт. Первопроходцы проделали этот путь, нашли, можно сказать, драгоценные залежи — круг удивительных явлений природы, а затем


6

О научном методе (вместо введения)

указали к ним направления. Их последователи, образно говоря, проложили там дороги, провели коммуникации, поставили уличное освещение. И теперь нам доступно огромное количество связанных друг с другом наблюдений, теоретических и экспериментальных, работающие на новых принципах приборы и механизмы, а не разрозненный набор двух-трёх парадоксальных фактов. Нынешнему студенту 3-го или 4-го курса можно уже как туристу двигаться вдоль новых широких проспектов и открывать бывший когда-то кромешно тёмным мир. Поэтому если он достаточно основательно изучил теорию относительности и квантовую механику, то уровень его знаний может оказаться намного выше уровня первооткрывателей. И не вследствие того, что он умнее, что, конечно, не исключено. А потому, что ему легче разобраться в сути теории, имея в своём распоряжение значительно больший массив взаимосвязанных данных. Представить, а потому и понять явления, описываемые механикой Ньютона, гораздо легче, чем теорию относительности или квантовую механику. Ведь механика Ньютона имеет дело с объектами, размеры и скорости которых привычны и легко представимы человеку, а их движения и взаимодействия происходят в гравитационных полях, сравнимых с земным. Современные теории также можно понять, выбрав подходящий угол зрения. Для этого необходимо подобрать адекватные ассоциации из нашей повседневной жизни. Но нахождение такого правильного угла требует от популяризатора науки и читателя некоторой работы ума и умения абстрагироваться. Формат научно-популярной книги не подразумевает использования сложной математики, без которой невозможна основательная разработка современных теорий. Поэтому здесь мы ограничимся небольшим количеством несложных формул, наглядными, упрощёнными картинками и рассказами о результатах экспериментов. Нам хотелось бы донести до старшеклассника, интересующегося физикой и математикой, достижения науки XX века и дать ему представление о том, куда двигаться, если он решит углубить свои знания фундаментальной физики 1 . 1 Мы предполагаем, что читатель этой книги знаком с механикой Ньютона, геометрией Евклида и тригонометрией. В частности, мы


О научном методе (вместо введения)

7

Для этого мы выбрали некоторые явления из современной фундаментальной физики, которые можно объяснить, не выходя за рамки школьного курса физики и математики. Основной сложностью при написании научно-популярного текста является именно необходимость избегать использования сколько-нибудь сложных формул и математических структур. При этом, в отличие от слов, формулы, благодаря математической строгости, не позволяют слишком большого произвола в их интерпретации: там, где в научной статье или книге можно показать одно уравнение или картинку и пару уточняющих предложений, в научно-популярном тексте придётся писать несколько абзацев или даже страниц с пояснениями. И при этом необходимо очень аккуратно подбирать слова и обговаривать условия, чтобы, с одной стороны, избежать использования научно-технического жаргона, а с другой — добиться хотя бы сколько-нибудь однозначного и корректного изложения материала для читателя, знакомого только со школьной физикой и математикой. Всё это стоит помнить при чтении данной книги. Ну а для начала во введении мы поделимся представлениями о том, как устроен научный метод познания. Представим себе предмет познания в виде многогранного и сложного кристалла. Одна и та же его грань под одним углом, в преломлённом свете, будет казаться непостижимо сложно изогнутой и многоцветной, а под другим — плоской и прозрачной поверхностью. Вопрос в том, как выбрать правильный угол. На начальном этапе создания любой теории круг явлений, которые она описывает, представляет собой нечто подобное бруску неизвестного материала, и исследователю надо каким-то способом понять, что же внутри него скрывается. Как это сделать? Можно, например, постучать по бруску в разных местах и посмотреть, как он откликнется на это воздействие. Можно пропустить через него ток, тепло или какое-то излучение и посмотреть на результаты всех этих воздействий в разных местах. В идеале следует использовать весь арсенал методов, имеющихся в распоряжении учёного. предполагаем, что ему знакомы такие понятия, как система отсчёта, декартова система координат, поворот системы координат, вектор, функция, график функции, производная, касательная к графику функции, асимптота гиперболы.


8

О научном методе (вместо введения)

Затем необходимо разработать математический аппарат, который количественно опишет проведённые наблюдения и даст предсказания о том, как брусок будет реагировать на другие воздействия. В конце концов надо проверить эти предсказания новыми экспериментами. Таким образом, постепенно усложняются и методы, и предмет исследования. Что-то подобное происходит с ребёнком, познающим окружающий его мир с помощью визуальных, слуховых, обонятельных и тактильных ощущений. Рассмотрим несколько важных наблюдений о том, как устроен научный метод. Начнём с простого примера. Все знают, что законы Ньютона следуют из опыта. Но что это значит? Например, второй закон, F~ = m~ a, не является результатом какого-то конкретного эксперимента, в котором независимо измерены сила, масса и ускорение, а затем установлена их данная формальная связь. На самом деле этот закон в краткой форме описывает некоторую совокупность взаимосвязанных экспериментов. При этом отдельно взятый опыт из этой совокупности, несомненно, можно объяснить, используя не законы Ньютона, а иные соотношения, как это и делали многие учёные ещё до Галилея. Но задача состоит в объяснении именно всей совокупности экспериментов вместе, а не каждого опыта по отдельности. Более того, если всю эту совокупность опытных данных можно объяснить иным способом, то он будет эквивалентен формулировке механики с использованием законов Ньютона. Например, студентам технических вузов известны по крайней мере ещё две формулировки классической механики, носящие имена Лагранжа и Гамильтона (созданные при участии и других выдающихся учёных, что верно, впрочем, и в случае законов Ньютона). В этих формулировках механики постулируются другие уравнения, а законы Ньютона возникают лишь как следствия. Среди постулатов в формулировке Лагранжа, например, присутствует так называемый принцип наименьшего действия. Однако все эти теории переходят одна в другую и эквивалентны ньютоновской. Что и не удивительно, ведь они описывают одну и ту же совокупность опытных данных. Приведём и другой пример, который поясняет то, в каком смысле физические законы описывают природные явления.


О научном методе (вместо введения)

9

Известно, что до гелиоцентрической системы Коперника в европейских научных кругах наибольшей популярностью пользовалась геоцентрическая система Птолемея, в которой планеты и Солнце вращались вокруг покоящейся Земли. И это звучит не так уж и безумно, если вспомнить аргументацию её апологетов: если Земля движется, да ещё и вращается, то почему мы этого не замечаем? Так ли уж очевиден ответ на этот вопрос, если никаких знаний о гравитации и механике тогда не было? Как вообще подступиться к этой проблеме, если у вас нет ни приборов, ни точного способа определения времени? Сейчас, когда нам известен ответ на этот вопрос и с ним согласны все окружающие нас разумные люди, нам легко поддерживать и защищать его в спорах. А в те времена? Кто пошёл бы на риск потери репутации, а то и свободы или даже жизни, защищая общепринятую сейчас, но противоречащую «здравому смыслу» в те времена точку зрения? И это ещё не все. Дело в том, что с экспериментальной точки зрения система Птолемея безупречно описывала движение планет. Во времена Галилея считалось, что планеты могут двигаться только по идеальным кривым, таким как прямые или окружности. Сам Галилей считал, что такое движение происходит по инерции. Но при этом не считалось логически противоречивым накладывать одно «инерциальное» движение на другое, как изображено на рис. 0.1. Если такие движения действительно являются инерциальными, то почему не могут существовать их композиции? В таком случае планета движется по окружности, центр которой, в свою очередь, движется по другой окружности, и так далее до последнего круга с центром внутри Земли. Такие окружности назывались эпициклами, а основной круг, с центром внутри Земли, назывался деферентом.

Рис. 0.1. Эпициклы в системе Птолемея. Большая окружность называется деферентом. По ней движется центр меньшей окружности, а по последней, в свою очередь, совершает движение планета (отмечена серым цветом)


10

О научном методе (вместо введения)

Было установлено, что, подбирая количество эпициклов, их радиусы и частоты вращения, можно описать любое движение планеты со сколь угодно высокой наперёд заданной точностью. Когда Коперник сформулировал свою систему, он тоже старался строго описать движение планет вокруг Солнца. И тоже использовал эпициклы. Это требовало титанических вычислений, а не голословного утверждения о гелиоцентричности. Но так как его система только зарождалась, а система Птолемея существовала и разрабатывалась уже около полутора тысяч лет, Коперник давал менее точное описание движения планет. Не говоря уже о том, что его система содержала логические противоречия. Например, центры деферентов некоторых планет находились за пределами Солнца. В принципе все эти противоречия можно было устранить, но в чём же тогда преимущество системы Коперника над птолемеевой? Ведь она не выглядит проще! Как нам теперь известно, в основе гелиоцентрической системы лежит один простой закон. А именно, закон всемирного тяготения: Mm | F~| = G 2 . R

Если допустить, как указывает эта формула, что сила притяжения между Солнцем и планетой обратно пропорциональна квадрату расстояния между ними, то из этого следуют все законы движения планет, полученные Кеплером. При этом планеты и Солнце вращаются вокруг общего центра масс, и не по эпициклам и деферентам, а по эллипсам. И делают они это только в приближении, в котором не учитывается воздействие планет друг на друга. Более того, всё это верно только для системы отсчёта, в которой центр масс Солнечной системы покоится. Перечисление условностей можно продолжать до бесконечности, потому что любое математически строгое описание природных явлений верно только в каком-то приближении. Важно, что закон всемирного тяготения универсален. Он описывает не только движения планет Солнечной системы и Луны, но и падение яблока на голову Ньютона, и вращение звёзд в галактиках и самих галактик в их скоплениях. Именно


О научном методе (вместо введения)

11

поэтому этот закон позволяет делать предсказания. А какие предсказания можно извлечь из системы Птолемея, кроме определения положений исключительно планет Солнечной системы? Итак, учёному всегда приходится иметь дело лишь с некоторым приближённым описанием реальных природных явлений. Ведь для математически строгого, количественного их описания необходимы идеализации. Иначе не избавиться от возникающих логических противоречий. Например, представьте себе, что у вас есть весы, которые могут измерять массу с точностью до трёх граммов. Тогда они не покажут разницы между грузиками с массами пять и семь граммов, а также между грузиками в семь и девять граммов. Но разницу между пятью и девятью граммами покажут. Таким образом, мы получим кажущееся логическое противоречие в виде a = b, b = c, но c > a. Поэтому учёному в формулировке своих утверждений необходимо прибегать к идеализациям. Например, в ситуации с грузиками считать, что мы можем измерить массу с любой наперёд заданной точностью, в то время как реально существующие весы позволяют сделать это ненамного точнее имеющегося разрешения их шкалы. Также в природе не бывает идеальных прямых и бесконечно тонких линий. Однако мы можем пользоваться такими идеализированными понятиями при проектировании зданий, расчётах площадей земель и ожидаемых урожаев. И делаем мы это всегда приближённо, как правило, считая абсолютно плоской территорию, с которой снимается урожай. Вопрос в том, какая точность нас устроит в каждом конкретном случае. Например, некоторые компоненты обычных зданий проектируются с точностью до нескольких миллиметров, достаточной для того, чтобы в окнах не было щелей. А компоненты детекторов частиц на ускорителях, которые по размерам сопоставимы с многоэтажными зданиями, проектируются с точностью до микрон (1/1 000 000 = 10−6 метра), чтобы была возможность получить достаточно точные треки частиц и воспроизвести положения так называемых вершин реакций — того места, где произошло взаимодействие частиц. Известно также, что идеальных инерциальных систем отсчёта не существует. Однако, в зависимости от постановки за-


12

О научном методе (вместо введения)

дачи, в некотором приближении можно использовать систему, связанную с тем или иным реально существующим объектом. А уже при создании теории можно допустить существование таких идеализированных систем отсчёта, как это и сделал Галилей при формулировке первого закона Ньютона. Не бывает также и точечных частиц. Однако мы можем считать даже спутник или планету точкой при расчёте их орбит. Все зависит от условий эксперимента и постановки задачи. Например, в лекции по квантовой механике мы обсудим, в каких случаях элементарную частицу можно считать материальной точкой, а в каких нет. Но и это обсуждение не даст исчерпывающей картины всего многообразия процессов, в которых проявляются свойства элементарных частиц. Попробуйте задуматься, почему у исследователя должна возникнуть мысль, что частица всегда и при всех условиях обязана вести себя как материальная точка или как шарик некоторого радиуса. Разве этот исследователь провёл эксперименты по выявлению свойств и поведения частиц при всех энергиях, на всех расстояниях и во всех возможных средах? Откуда мы берём интуитивное «предвидение», каким должен быть результат эксперимента, который ещё не был поставлен? Достаточно ли полагаться только на интуицию и на её основе формулировать «правдоподобную» теорию, не требуя независимой проверки? С одной стороны, без интуитивного предвидения результата невозможно двигаться вперёд, а с другой — любую интуитивную правдоподобную догадку необходимо проверять — с помощью вычислений, опытов, компьютерных экспериментов и наблюдений. Математические идеализации позволяют учёному найти простую модель, которая приближённо описывает некоторый круг явлений. А если этот круг явлений достаточно широкий, то модель превращается в «теорию». В идеале в своей научной статье учёный-естествоиспытатель производит расчёт не только результата эксперимента, но и приближения, с которым этот результат получен. И тогда любой другой исследователь в принципе может повторить такой эксперимент или вычисление и убедиться в верности или ложности обсуждаемых утверждений. Именно последнее и позволяет при создании аппаратов и механизмов получать


О научном методе (вместо введения)

13

заранее заданные характеристики их работы. Действуя определённым образом и при определённых условиях, вы получите соответствующий результат. Эта причинно-следственная связь представляет собой факт объективной реальности, а вот хорошо это или плохо и нравится кому-то или нет, является уже фактором субъективным. Далее подчеркнём, что любой фундаментальный физический закон природы имеет пределы применимости, насколько бы фундаментальным и общим он нам не представлялся. Например, как было сказано выше, законы механики и гравитации Ньютона применимы, только если мы обсуждаем движение объектов достаточно больших размеров со скоростями существенно меньше скорости света и в достаточно слабых гравитационных полях. А если мы перейдём к очень большим скоростям, очень маленьким объектам или очень сильным гравитационным полям, то механика Ньютона теряет свою применимость и её заменяют другие теории. Это не значит, что новые теории опровергают старую механику. Ведь квантовая механика и теория относительности практически совпадают с теорией Ньютона в пределах применимости последней. Новые теории, в свою очередь, тоже имеют свои пределы применимости. Например, квантовую механику и специальную теорию относительности обобщает квантовая теория поля. А квантовую теорию поля и общую теорию относительности должна обобщить квантовая гравитация или что-то вроде неё. Понятно, что ограниченная применимость любого фундаментального естественно-научного закона всегда оставляет неизведанной какую-то область природы. Это означает, что в любом исследовании, сколь бы основательным оно ни было, всегда остаются какие-то нерешённые проблемы. И нет рецепта, позволяющего решить все проблемы науки сразу. Занятие физикой — это не медитация буддийского монаха. Поэтому учёный и не может позволить себе стремиться познать всё и сразу. Хорошо это или плохо — каждый решает сам для себя, но именно поэтому познание является бесконечным процессом. Вернёмся теперь к сути наших рассуждений. На данный момент в квантовой механике и теории относительности нет ничего мистического. Не будет преувеличением сказать, что предмет этих теорий столь же хорошо изучен, как и механика


14

О научном методе (вместо введения)

Ньютона. Теперь в тумане находится квантовая гравитация. Там действительно многое непонятно, а вот квантовая механика и теория относительности уже давно являются основой прикладных технологий. В области применимости этих теорий человечеству не известен ни один достоверный экспериментальный факт, который бы их опровергал. Более того, без использования знаний, следующих из квантовой механики, инженер не сможет добиться того, чтобы работали мобильные телефоны и телевизоры, а без теории относительности — системы глобального позиционирования, такие как ГЛОНАСС и GPS, как мы расскажем в первой лекции. Не говоря уже о том, что без всех этих теорий невозможно было создать атомные электростанции. Мы хотели бы поблагодарить Валерия Анатольевича Рубакова, Валерию Ахмедову, Сергея Попова, Александру Анохину, Константина Кузнецова, Уго Москеллу, Ольгу Лубенченко, Александра Лубенченко, Игоря Полюбина и Арсения Полюбина за корректуру текста и за ценные замечания. Эмиль Ахмедов хотел бы поблагодарить руководство Института Альберта Эйнштейна в Потсдаме в лице Германа Николаи и Штефана Тайсена за гостеприимство во время работы над некоторыми частями этой книги.


ЛЕКЦ И Я 1 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ • • • • • • • • •

О принципах работы систем глобального позиционирования Пространство-время Преобразования координат Преобразования Лоренца О скорости света О разности хода часов и лоренцевом сокращении длин О парадоксе шеста и сарая О парадоксе близнецов О смысле соотношения E0 = mc2

Эту лекцию мы начнём с обсуждения работы систем глобального позиционирования. Конечно, инженер — специалист по ГЛОНАСС и/или GPS сообщил бы больше технических деталей. Мы же рассмотрим лишь общие принципы определения положения объектов на поверхности Земли и расскажем, почему для этого нужна теория относительности. Возможно, нам следует подчеркнуть, что конкретная техническая реализация различных элементов систем позиционирования может быть устроена не так, как изложено ниже. Это может быть связано с финансовыми или технологическими сложностями. В любом случае нашей задачей здесь является не рассказ о самих этих системах, а обсуждение причин, по которым для их работы необходимо знание теории относительности. После обсуждения ГЛОНАСС и GPS в этой и следующей лекциях мы расскажем о самой теории относительности (специальной и общей), а также о распространённых мифах на эту тему. Закончим мы первую лекцию формулировкой и объяснением некоторых известных парадоксов.


16

Лекция 1. Специальная теория относительности

§ 1. О принципах работы систем глобального позиционирования Начнём с небольшого отступления. Представим себе систему шарниров, соединённых стержнями. Для наглядности возьмём сначала плоские многоугольники, в вершинах которых находятся шарниры, а рёбра состоят из стержней, как изображено на рис. 1.1 и 1.2. Будем считать, что длины стержней меняться не могут.

Рис. 1.1

Чем выделяется треугольник из всех плоских многоугольников? Его невозможно деформировать. Например, четырёхугольник можно сжать или растянуть, не выходя за рамки плоскости, в которой он лежит, как изображено на рис. 1.2. Понятно, что и любой другой многоугольник с числом сторон больше трёх не является жёсткой фигурой.

Рис. 1.2

Главный вывод, который можно сделать из этого простого наблюдения, следующий. Допустим, нам надо найти положение некоторой точки в пределах заданной плоскости. Какая минимальная информация необходима для этого? Из сказанного выше следует, что достаточно знать положение как минимум двух реперных вершин (на рис. 1.3 они изображены


§ 1. Принципы работы систем глобального позиционирования

17

белыми кружками) и расстояния от них до 3 2 искомой точки, т. е. длины отрезков 2 и 3. Однако при таких условиях искомую точку можно перепутать с «паразитной», 1 которая изображена звездой. Действитель2 3 но, ведь по данному отрезку и длинам сторон можно построить два треугольника в плоскости. Как избавляться от паразитРис. 1.3 ной точки, мы расскажем ниже. Теперь представим пространственные фигуры из стержней и шарниров. Несложно увидеть, что в этом случае жёсткой фигурой будет пирамида с треугольными гранями (рис. 1.4).

Рис. 1.4

Действительно, многогранник, все грани которого имеют, например, четыре угла, можно деформировать (как изображено на рис. 1.5).

Рис. 1.5

Понятно, что и другие фигуры в пространстве, с большим числом граней, чем у пирамиды, не являются жёсткими. А также можно деформировать пирамиды, основания которых имеют больше углов, чем три (рис. 1.6).


18

Лекция 1. Специальная теория относительности

Рис. 1.6

Пирамида и треугольник, в отличие от других описанных здесь фигур, обладают тем важным свойством, что любая их вершина соединена стержнями со всеми остальными вершинами. Поэтому только треугольник и пирамида являются жёсткими. Соответственно, как и в двумерном случае, если известны положения трёх реперных вершин, а также длины трёх рёбер пирамиды (на рис. 1.7 это рёбра 4, 5 и 6), то можно найти координаты искомой точки в трёхмерном пространстве. Опять же, это получится сделать только с точностью до «паразитной точки». Действительно, ведь по заданному треугольнику в пространстве, как по основанию, можно построить две пирамиды с тем же набором рёбер: одну — над, а другую — под ним, как 6 4 изображено на рис. 1.7 («паразитная точ5 ка» обозначена ромбиком). 3 Аналогично для определения положе2 1 ния точки в четырёхмерном пространстве 5 6 нам понадобится четырёхмерная пирами4 да, состоящая из пяти вершин и десяти рёбер. При этом каждая из вершин пирамиРис. 1.7 ды соединена со всеми другими. Это необходимо для жёсткости фигуры. Задача опять же будет решена с точностью до неоднозначности в виде паразитной точки. В системах GPS и ГЛОНАСС в качестве реперных вершин используются спутники и антенны на Земле. Для определения положения объекта на поверхности Земли в данный момент времени необходимо, чтобы в так называемой зоне его радиовидимости были хотя бы четыре реперные вершины,


§ 1. Принципы работы систем глобального позиционирования

19

а для определения длин рёбер пирамиды используются радиосигналы, испускаемые спутниками и антеннами и получаемые смартфонами. Объект, положение которого определяется, и четыре реперные точки составляют пять вершин четырёхмерной пирамиды, аналогичной той, что обсуждалась в предыдущем абзаце, но помещённой в четырёхмерное пространство-время, а не пространство. Итак, представим себе, что имеются четыре спутника — реперные вершины — в космосе и смартфон на Земле — объект, положение которого требуется определить. Радиосигналы от спутников идут во все стороны и достигают смартфона (рис. 1.8). Они распространяются со скоростью света в вакууме. Мы пренебрежём тем, что часть пути радиосигнал идёт в атмосфере, где он распространяется несколько медленнее света. Для правильной работы системы позиционирования все эти явления учитываются, но нам важно показать, как эффекты именно теории относительности влияют на точность GPS и ГЛОНАСС. Пусть сигнал от спутника под номером i, где i может принимать значения 1, 2, 3, 4, распространяется до смартфона за Z

1 3

z

2 )

(

4 y

x

X Y Рис. 1.8. Спутники изображены белыми кружками, паразитная точка — звездой, поверхность Земли — шар с центром в начале координат


20

Лекция 1. Специальная теория относительности

время t − t𝑖 , где t𝑖 — это момент времени излучения сигнала спутником под номером i, а t — момент его получения смартфоном. Тогда программа в смартфоне определяет, что расстояния до спутников равны соответственно c(t − t1 ), c(t − t2 ), c(t − t3 ), c(t − t4 ), где c — это скорость света в вакууме. Как, зная расстояния и положения спутников, определить координаты смартфона? Тут вступает в игру алгоритм, встроенный в программу смартфона. Он должен достаточно быстро решить некоторую систему уравнений. При её определении мы и увидим, что если пренебречь эффектами специальной и общей теории относительности, то GPS и ГЛОНАСС не будут работать удовлетворительно. Действительно, посмотрим, что произойдёт, если пренебречь, например, следующими эффектами специальной и общей теории относительности. — Забудем, что спутники имеют некоторые ненулевые скорости. Это приводит к разности в показаниях часов на спутниках и на Земле. Специальная теория относительности предсказывает такое расхождение. — Забудем про искривление пространства-времени за счёт земной гравитации, т. е. не учтём разность в показаниях часов на спутниках и на поверхности Земли. Общая теория относительности предсказывает, что такая разность есть. — Забудем про вращение Земли. Это тоже приводит к расхождению в показаниях часов, как опять же предсказывает общая теория относительности. В этом случае алгоритм смартфона должен решить следующую систему уравнений: 0 = c2 (t − t1 )2 − (x − x1 )2 − ( y − y1 )2 − (z − z1 )2 , 0 = c2 (t − t2 )2 − (x − x2 )2 − ( y − y2 )2 − (z − z2 )2 , 0 = c2 (t − t3 )2 − (x − x3 )2 − ( y − y3 )2 − (z − z3 )2 ,

(1.1)

0 = c2 (t − t4 )2 − (x − x4 )2 − ( y − y4 )2 − (z − z4 )2 , где x, y, z — это искомые координаты смартфона, а x𝑖 , y𝑖 , z𝑖 — это координаты спутника под номером i, который, как сказано выше, пробегает значения 1, 2, 3, 4.


§ 1. Принципы работы систем глобального позиционирования

21

Z zi

z x

∆l

i

y yi

xi

Y

X Рис. 1.9

Данная система уравнений имеет следующее происхождение. В декартовых координатах (рис. 1.9) квадрат расстояния между смартфоном x, y, z и каждым из спутников (x𝑖 , y𝑖 , z𝑖 ), вычисляется по формуле ∆l𝑖2 = (x𝑖 − x)2 + ( y𝑖 − y)2 + (z𝑖 − z)2 . Знак ∆ здесь и далее является просто стандартным обозначением, т. е. расстояние между двумя точками в координатной сетке обозначают как ∆l, а не просто как l. С другой стороны, ∆l𝑖2 необходимо приравнять к c2 (t𝑖 − t)2 для каждого из значений i, что и приводит к записанной выше системе четырёх уравнений. Искомыми величинами у нас являются x, y и z. Ведь именно их знание и говорит нам, где находится смартфон. Подчеркнём, что положения спутников x𝑖 , y𝑖 , z𝑖 и моменты испускания сигналов t𝑖 известны. Отметим, что положения спутников постоянно меняются, ведь они вращаются вокруг Земли. Но их тоже можно определить относительно некоторых реперных вершин/антенн, закреплённых на поверхности Земли. Это также делается описываемым здесь способом. Таким образом, в системе глобального позиционирования имеется некоторый каркас из фиксированных на поверхности


22

Лекция 1. Специальная теория относительности

Земли и вращающихся вокруг неё реперных вершин. Положения всех вершин здесь определены. И мы хотим найти координаты смартфона по отношению к этому каркасу. Как мы объясняли выше, для этого необходимо, чтобы смартфон был в пределах радиовидимости хотя бы из четырёх реперных точек. Однако, чтобы найти координаты смартфона с удовлетворительной точностью, необходимо хорошо знать величины c2 (t − t𝑖 )2 для каждого значения i = 1, 2, 3, 4. Поэтому, помимо радиопередатчика и приёмника, за каждой из реперных вершин должен быть закреплён атомный хронометр. Действительно, ведь если нам известно t − t𝑖 , например, с точностью до одной миллионной доли секунды (1/1 000 000 = 10−6 с), то, умножив этот промежуток времени на скорость света 300 000 000 = 3 × 108 м/с, мы получим, что расстояние определено с точностью до 300 метров. Устроит ли нас, если система глобального позиционирования ошибётся в определении нашего положения на 300 метров? Наверное, нет. А ведь современные системы определяют положения предметов с точностью до 10 сантиметров или даже ещё точнее. Правда, делают они это для научных или военных целей, а не для смартфонов или автомобилей, но даже и для последних это необходимо делать хотя бы с точностью до нескольких метров. Таким образом, важно, чтобы величина t − t𝑖 была определена с точностью до одной миллиардной доли секунды (1/1 000 000 000 = 10−9 с) или близко к этой величине. Но ведь на смартфоне имеются только обычные часы. Соответственно, время t, показанное им, известно не с желаемой точностью. Его тоже требуется как-то определить. Получается, что в записанной выше системе уравнений на самом деле четыре неизвестных — t и x, y, z. Чтобы их определить, нужны четыре уравнения, что и отвечает четырём реперным вершинам. При этом у наших уравнений имеется два решения, так как эти уравнения квадратные. Одно — это искомые координаты смартфона, а второе — «паразитное». В сущности, здесь мы описали при помощи уравнений, или, как говорят, алгебраически, то, что выше было изображено геометрически при помощи фигур из стержней и шарниров. Как нетрудно догадаться, посмотрев, например, на рис. 1.8,


§ 1. Принципы работы систем глобального позиционирования

23

одно из решений будет либо на поверхности Земли, либо же, если речь идёт о самолёте, над ней, в пределах 10–20 километров, а второе, «паразитное», будет находиться в достаточно глубоком космосе. Алгоритм в программе смартфона отбросит «паразитное» положение и выдаст верные координаты. Теперь давайте убедимся в том, что при описанной выше точности работы атомных хронометров эффекты теории относительности оказывают существенное влияние на работу систем GPS и ГЛОНАСС. Как мы уже говорили, эти эффекты сказываются на точности определения времени распространения радиосигналов от реперных вершин до искомого положения. Мы проведём примерные оценки, которые, однако, показывают суть описываемых здесь явлений. В реальности, при расчётах, связанных с системами позиционирования, пользуются более тонкими вычислениями. Но нам будет достаточно оценить, насколько существенны релятивистские эффекты (явления, отличающие теорию относительности от механики Ньютона) по порядку величины. Во-первых, общая теория относительности, о которой речь пойдёт в следующей лекции, предсказывает, что из-за гравитации Земли имеется расхождение между показаниями часов, находящихся на разных высотах. Например, если на земле часы отсчитают промежуток времени ∆t𝑖 , то часы спутника покажут v u t (1 − r𝑔 /r) ∆t𝑖 , (1 − r𝑔 /R)

а не просто ∆t𝑖 . (Это значит лишь то, что система уравнений (1.1) верна приближённо и её следует поправить с учётом обсуждаемых здесь явлений.) Здесь R — это радиус Земли, r — это радиус орбиты спутника, который по порядку величины равен 10 000 км, а r𝑔 =

2MG c2

— это так называемый гравитационный радиус Земли, который определяется её массой M и гравитационной постоянной Ньютона G. Для тела с массой Земли он приблизительно равен одному сантиметру. (Сравните эту величину с радиусом Земли, который приблизительно равен 6,5 тысяч километров.)


24

Лекция 1. Специальная теория относительности

Отношение r𝑔 к r определяет величину гравитационного поля, создаваемого Землёй на расстоянии r от её центра. В частности, если какая-то сила сожмёт тело с массой Земли до размеров шара радиуса r𝑔 , то её гравитационное поле окажется столь большим, что она превратится в чёрную дыру, но это уже предмет лекции по общей теории относительности. Отношение 1 см к 10 000 км равно 1/1 000 000 000 = 10−9 , т. е. ∆t𝑖 отличается от v u t (1 − r𝑔 /r) ∆t𝑖 (1 − r𝑔 /R)

на величину, сравнимую с той, с которой атомные хронометры должны определять время, чтобы системы глобального позиционирования могли работать удовлетворительно, как мы увидели выше. Поэтому обсуждаемый здесь эффект общей теории относительности заведомо будет сказываться на работе GPS и ГЛОНАСС. Помимо этого, спутники двигаются, а не покоятся (для наших оценок не важно, что двигаются они не по прямой, а по орбите вокруг Земли). Как мы увидим дальше в этой лекции, это означает, что показания часов на спутнике будут отличаться от показаний часов, покоящихся на поверхности Земли. Покаp зания двигающихся часов будут равны не ∆t𝑖 , а ∆t𝑖 1 − V 2 /c2 , где c — скорость света в вакууме, а V — скорость движения часов (спутника), которая по порядку величины равна первой космической скорости 10 000 = 104 м/с. Как нетрудно посчитать, ∆t𝑖 опять отличается от промежутка времени, предсказываемого специальной теорией относительности, на величину, приблизительно равную 1/1 000 000 000 = 10−9 с. Более того, чем длиннее промежуток времени, тем больше разность между t и t𝑖 — скорректированным релятивистскими эффектами временем на спутнике, ведь часы на Земле и на спутнике постоянно ведут отсчёт по-разному, а мы выше делали оценки только для очень коротких промежутков времени. За сутки величина этой разности становится порядка нескольких десятков микросекунд, т. е. около 1/100 000 = 10−5 с, что, как мы уже видели, больше, чем требуемая точность определения промежутка времени, а потому эта поправка существенно сказывается и на точности работы систем позиционирования.


§ 2. Пространство-время

25

На самом деле GPS и ГЛОНАСС чувствительны и к другим релятивистским явлениям, например к разности в показаниях часов, вызванной вращением Земли. Но нашей задачей здесь было показать, что по крайней мере некоторые эффекты теории относительности принципиально важны для корректной работы систем глобального позиционирования. Теперь мы готовы к обсуждению самой теории относительности. § 2. Пространство-время Рассказывая о принципах работы систем глобального позиционирования, мы использовали понятие пространства с декартовой системой координат. Это было нужно для количественного описания положений реперных точек, смартфонов и для определения расстояний между ними (при этом для наших рассуждений совершенно не была важна природа пространства, например, из чего оно состоит или как устроено на микроскопическом уровне). А для определения расстояний важен был лишь выбор эталона измерений. Именно это мы и положили в основу нашего понятия пространства. Не более того! На философское изучение вопроса о природе пространства можно потратить целую жизнь. Но для физика важен вопрос, сформулированный естественно-научным образом. Во-первых, необходимо количественное, а не словесно-философское описание природных явлений. Во-вторых, даже в случае успеха на этом поприще природа пространства будет описана в каких-то новых терминах, т. е. объяснена через какое-то новое понятие. Тогда возникнет законный вопрос о природе этого нового понятия. И так до бесконечности‌ А важным для физика в итоге будет только количественное соотношение, составленное из характеристик пространства. Чтобы проиллюстрировать вышесказанное, рассмотрим, немного забегая вперёд, широко известное соотношение E0 = mc2 , которое связывает массу тела m и его энергию покоя E0 — два совершенно независимых друг от друга понятия. Но если копнуть глубже, то это только кажется, что мы с вами совершенно ясно пониманием, что такое масса и энергия. Например, гравитационная масса (отличие которой от инерциальной пока не обнаружено) определяется как вес — через силу, с которой


26

Лекция 1. Специальная теория относительности

она давит на чашу весов, т. е. опять же через другое соотношение F~ = m~ a и закон всемирного тяготения, иными словами — через понятие силы. А каково независимое определение силы? Можно и дальше продолжать в том же духе. Приведя здесь эту цепочку рассуждений, мы лишь хотели подчеркнуть, что для физика или инженера важно только знание двух формул E0 = mc2 и F~ = m~ a, а также определение единиц измерения (эталонов) соответствующих величин с удовлетворительной точностью. Именно это позволяет нам проводить вычисления и эксперименты и в итоге получать количественные соотношения между различными величинами и в дальнейшем создавать приборы и механизмы. Это не значит, что остальные вопросы не имеют право на существование. Опять же, их изучением может заниматься тот, кто считает это для себя важным. В конце концов, всё это отдельные части человеческой культуры. То же самое можно сказать и о природе времени. Мы определяем промежутки времени, относя их к эталону — некоему периодическому процессу, будь то колебания маятника в часах или атомов в молекуле. Инженерам для разработки систем глобального позиционирования важно только то, что атомный хронометр определяет промежутки времени на основе количества совершённых в этом промежутке колебаний какой-то конкретной молекулы. Если одна секунда определена, например, как примерно 10 000 000 000 = 1010 колебаний молекулы, то этого уже достаточно физику или инженеру, чтобы продолжать работу над своими теориями, экспериментами или механизмами. Подчеркнём, что за эталон времени берётся не секунда или час, а одиночное колебание молекулы. Итак, всегда должен быть какой-то эталон для измерения времени, длины и массы. Иногда говорят, что физика — это наука о соотношениях между величинами, которые можно измерить в граммах, сантиметрах и секундах. Теперь рассмотрим релятивистское расхождение в показаниях часов, т. е. расхождение обусловленное явлениями из теории относительности. Возьмём два атомных хронометра. Один из них оставим на Земле, а другой отправим в космос, скажем, на сутки, а затем вернём обратно на Землю. В результате мы


§ 2. Пространство-время

27

увидим, что один из хронометров насчитал 24 × 60 × 60 × ×10 000 000 000 колебаний, а другой, например, на 1 000 000= = 106 колебаний меньше. Всё зависит от того, с какими скоростями, ускорениями, на какие высоты поднимался и как долго совершал свои движения второй хронометр. В реальности расхождение между показаниями часов будет тем больше, чем дольше они двигались отличным друг от друга образом. Но никакие наручные часы никогда не заметят этой разницы в показаниях времени. Даже для того, чтобы расхождение было порядка нескольких секунд, нужны гораздо бо́льшие ускорения, скорости, гравитационные поля и продолжительность движения, чем те, с которыми мы имеем дело в обычной жизни. Подчеркнём, что расхождение в показаниях атомных часов возникает не из-за каких-то механических воздействий на молекулы. Атомные хронометры работают стабильно, а ускорения, создаваемые ракетами, и гравитационное поле Земли — это очень слабые возмущения на фоне молекулярных сил. Простые оценки показывают, что они намного меньше, чем обсуждаемые здесь релятивистские эффекты. Такие оценки может сделать и сам читатель, знакомый со школьной физикой. Итак, нам было необходимо определить пространство и время, чтобы количественно описывать поведение материальных тел под воздействием тех или иных сил. Например, мы можем находить траектории частиц — кривые, которые они описывают в пространстве под воздействием различных сил (рис. 1.10). Это, в свою очередь, позволяет формулировать и применять законы механики. Для формулировки механики Ньютона необходим способ определения расстояний в пространстве между двумя точками с координатами x1 , y1 , z1 и x2 , y2 , z2 . Мы определяли расстояния по формуле ∆l 2 = (x1 − x2 )2 + ( y1 − y2 )2 + (z1 − z2 )2 (рис. 1.9). Аналогично расстоянию мы применяли способ измерения промежутков времени: время, прошедшее между моментами t1 и t2 , было равно просто t2 − t1 . Однако, оказывается, совокупность опытных данных в том смысле, в котором мы обсудили это во введении, говорит


28

Лекция 1. Специальная теория относительности

Z

F~3

F~2

F~1

Y

X

Рис. 1.10

нам о том, что нет отдельного способа измерения времени и отдельного способа измерения расстояний в пространстве, а есть единый способ измерения расстояний в пространствевремени. А именно, расстояние между двумя точками в пространстве-времени (так называемыми событиями) t1 , x1 , y1 , z1 и t2 , x2 , y2 , z2 определяется по формуле ∆s2 = c2 ∆t 2 − ∆x 2 − ∆ y 2 − ∆z2 , где c — это скорость света в вакууме, ∆t = t2 − t1 ,

∆x = x2 − x1 ,

∆ y = y2 − y1 ,

∆z = z2 − z1 ,

а ∆s называется интервалом. Когда физики говорят о четырёхмерном пространствевремени или о пространственно-временном континууме, они имеют в виду не что иное, как представленный здесь способ определения расстояний (интервалов) между парами точек в пространстве и времени. Этот способ называется метрикой Минковского: ∆s2 = c2 ∆t 2 − ∆x 2 − ∆ y 2 − ∆z2 . Формула, задающая способ вычисления расстояний в декартовых координатах в трёхмерном пространстве, называется метрикой Евклида: ∆l 2 = (x1 − x2 )2 + ( y1 − y2 )2 + (z1 − z2 )2 .


§ 3. Преобразования координат

29

Обычное трёхмерное пространство при этом называется евклидовым. Посмотрим далее, что следует из такого взгляда на природу пространства и времени. § 3. Преобразования координат Утверждения кинематики специальной теории относительности следуют из формул, связанных с соотношением ∆s2 = c2 ∆t 2 − ∆x 2 − ∆ y 2 − ∆z2 = = c2 ∆t 2 − {∆x 2 + ∆ y 2 + ∆z 2 } = c2 ∆t 2 − ∆l 2 , которое, как мы обсудили выше, определяет интервал или расстояние между двумя точками (событиями) в четырёхмерном пространстве-времени. Опять же запомним, что эта формула называется метрикой Минковского и лежит в основе так называемой геометрии Минковского в том же смысле, в каком уравнение ∆l 2 = (x1 − x2 )2 + ( y1 − y2 )2 лежит в основе геометрии Евклида на плоскости. Многие из утверждений специальной теории относительности выглядят парадоксально лишь из-за того, что геометрия Минковского является необычной для человека, знакомого лишь с евклидовой геометрией, изучаемой в школе. Поэтому начнём мы с того, что рассмотрим основы геометрии Минковского и её физический смысл. Чтобы освоиться и определиться с терминологией, возьмём для наглядности двумерную евклидову плоскость. Все выводы не очень сложно перенести на трёхмерное пространство, но там ситуация менее наглядная. Построим на плоскости систему координат Декарта. Возьмём два луча, пересекающихся под прямым углом (рис. 1.11): ось, направленную горизонтально, принято обозначать X, а вертикальную обозначают Y. На оси Y отметим точки, находящиеся друг от друга на равных расстояниях, и проведём через них линии, параллельные оси X . Вдоль каждой из них координата по оси Y будет постоянной. Аналогично отметим на оси X точки, отступая


30

Лекция 1. Специальная теория относительности

Y

111 0

111

X

Рис. 1.11. Декартова ортонормированная координатная система

на то же расстояние, что и выше, и проведём через них линии, параллельные оси Y. Вдоль них неизменной будет координата X . Таким образом, мы получим сетку, состоящую из линий уровня, пересекающихся под прямым углом, на которых та или иная координата принимает постоянные значения. Эта сетка называется декартовой системой координат. Расстояние, на котором находятся друг от друга линии сетки, определяет единицу измерения, или эталон длины (рис. 1.11). Аналогичным образом можно построить координатную решётку и в трёх измерениях. Там вместо линий будут поверхности уровня. Например, координата Z будет принимать постоянные значения на любой плоскости, параллельной плоскости XY. В полученной на двумерной плоскости ортонормированной системе координат можно вычислить расстояние между двумя точками, например A и B, если известны их координаты. Для этого надо использовать теорему Пифагора, как изображено на рис. 1.12. Иногда формулу для расстояния записывают и в векторной форме: ∆l 2 = (~r𝐵 − ~r𝐴 )2 , где ~r𝐴 = (x𝐴 , y𝐴 ) и ~r𝐵 = (x𝐵 , y𝐵 ), а (~r𝐴 − ~r𝐵 )2 — скалярное произведение вектора (~r𝐵 − ~r𝐴 ) на себя, или квадрат его длины. Теперь, чтобы понять смысл и происхождение преобразований Лоренца, обсудим преобразования координат на евкли-


§ 3. Преобразования координат

31

Y

B

yyyyyBBBBBBBB

yyyyyAAAAAAAA

A xxxxxAAAAAAAA

xxxxxxBBBBBBBB

X

2 ∆lAB = (xB − xA )2 + ( yB − yA )2 = ∆ x 2 + ∆ y 2

Рис. 1.12. В ортонормированной системе расстояние между точками вычисляется по теореме Пифагора

довой плоскости. Рассмотрим для начала следующую замену: x 0 = ax

и

y 0 = by,

где a и b — некоторые числа. Для разностей координат получаем соотношения ∆x 0 = ax2 − ax1 = a(x2 − x1 ) = a∆x, ∆ y 0 = by2 − by1 = b( y2 − y1 ) = b∆ y. Нетрудно видеть, что при таком преобразовании формула, определяющая расстояния на плоскости, переходит в следующую: 0 2 ∆ y 0 2 (∆x 0 )2 (∆ y 0 )2 ∆x ∆l 2 = (∆x)2 + (∆ y)2 = + = + . 2 2 a

b

a

b

Заметим, что хотя формула и поменялась, но само расстояние между двумя точками A и B осталось прежним. Действительно, ведь при координатных преобразованиях мы не деформируем саму плоскость и соответственно отрезки на ней, а лишь меняем масштаб сетки на осях (рис. 1.13). Мы не оказываем физического воздействия на плоскость, а лишь иначе рисуем на ней сетку из линий. Если вначале линии отстояли друг от друга по осям, скажем, на дециметр в обоих направлениях, то после такого преобразования они могут отстоять, например, по оси X на сантиметр (a = 1/10), а по оси y — на метр (b = 10) или наоборот.


32

Лекция 1. Специальная теория относительности

Y0 B

A X Рис. 1.13. Координатная система с изменёнными масштабами по осям

В простейшем одномерном случае, т. е. если рассматривать ситуацию не на плоскости, а на прямой, аналогом такого преобразования является простая замена единиц измерения — разметки на прямой, например замена сантиметра на дециметр. Но длина отрезка на такой прямой от этого не изменилась. Изменились лишь единицы, в которых мы определяем его длину. Вот если растянуть линию, т. е. физически на неё воздействовать, то изменится не только разметка на ней, но и сам отрезок. Рассмотрим теперь линейное преобразование на плоскости общего вида: x = ax 0 + by 0 ,

y = cx 0 + dy 0 ,

где a, b, c, d — это некоторые не связанные друг с другом числа, постоянные во всём пространстве. Из этих уравнений видно, что ось x 0 является некоторой прямой, которая при произвольных a, b, c, d не будет перпендикулярной оси y 0 (рис. 1.14). Тогда координатная сетка, отвечающая осям X 0 и Y 0 и построенная по аналогии с осями X и Y, не является ортонормированной (рис. 1.15). Посмотрим теперь, как при таком линейном координатном преобразовании трансформируется формула, определяющая расстояние между двумя точками на плоскости. Для разности координат получаем соотношения x2 − x1 = ∆x = (ax20 + by20 ) − (ax10 + by10 ) = a∆x 0 + b∆ y 0 , y2 − y1 = ∆ y = (cx20 + dy20 ) − (cx10 + dy10 ) = c∆x 0 + d∆ y 0 .


§ 3. Преобразования координат

Y

33

Y0

Y0

X0

X0 X

Рис. 1.14

Рис. 1.15

Из этого следует, что ∆l 2 = ∆x 2 + ∆ y 2 = (a∆x 0 + b∆ y 0 )2 + (c∆x 0 + d∆ y 0 )2 = = a2 (∆x 0 )2 + b2 (∆ y 0 )2 + 2a∆x 0 b∆ y 0 + + c2 (∆x 0 )2 + d 2 (∆ y 0 )2 + 2c∆x 0 d∆ y 0 = = (a2 + c2 )(∆x 0 )2 + (b2 + d 2 )(∆ y 0 )2 + 2(ab + cd)∆x 0 ∆ y 0 . Как видно, последнее выражение не сильно похоже на формулу, следующую из теоремы Пифагора. Действительно, ведь здесь мы имеем дело с системой координат, оси которой не перпендикулярны друг другу, и шкалы длин на них не совпадают. Говорят, что такая система координат не является ортонормированной, в отличие от декартовой. Перейдём теперь к ещё более сложным, нелинейным преобразованиям. Рассмотрим, например, переход от ортонормированной декартовой к простейшей нелинейной, а именно полярной, системе координат (рис. 1.16), которая вводится Y r

y = r sin φ

φ x = r cos φ

X

Рис. 1.16. Картинка, поясняющая преобразование координат от декартовых к полярным


34

Лекция 1. Специальная теория относительности

по формулам x = r cos φ, y = r sin φ. Здесь ~r — это радиусвектор, проведённый из начала координат к точке, r — это его модуль или длина, а φ — угол между осью X и радиусом, отсчитываемым от оси X против часовой стрелки; r и φ являются теперь новыми координатами (т. е. они здесь играют такую же роль, как x и y ранее). Это преобразование называется нелинейным, потому что функции синус и косинус, стоящие в правых частях, не являются линейными. Чтобы не усложнять наше изложение, мы не будем выводить здесь формулу, определяющую расстояние в полярных координатах, но она, очевидно, отличается от формулы 2 ∆l𝐴𝐵 = ∆x 2 + ∆ y 2 ,

где ∆x = x𝐵 − x𝐴 и ∆ y = y𝐵 − y𝐴 . Подробно об этом преобразовании координат будет рассказано на лекции по общей теории относительности. При обсуждаемом нелинейном преобразовании расстояния между точками всё равно не меняются, ведь мы лишь иначе рисуем координатные линии на той же самой плоскости. Соответствующая координатная сетка изображена на рис. 1.17. Мы изложили здесь все эти наблюдения, чтобы подчеркнуть следующий факт, который теперь можно легко понять, 120◦

90◦

60◦

150◦

30◦ 0◦

180◦

210◦

330◦ 240◦

270◦

300◦

Рис. 1.17. Координатная сетка в полярных координатах. Лучи — это линии постоянного значения угла φ, а концентрические окружности — это линии постоянного значения радиуса r


§ 3. Преобразования координат

35

даже не рассматривая ещё более сложных преобразований и координатных сеток. А именно, несомненным является то, что при произвольном координатном преобразовании меняется формула, определяющая длину отрезка ∆l, и координатная сетка, но сама величина длины ∆l не меняет своего значения. Этот фундаментальный факт называется общей ковариантностью и лежит в основе даже не столько специальной, а скорее общей теории относительности. В последнем случае, конечно, обсуждаются преобразования координат в четырёхмерном пространстве-времени, а не просто на двумерной плоскости. Чрезвычайно важное понятие общей ковариантности понадобится нам уже при обсуждении положений специальной теории относительности. Итак, в чём же тогда особенность системы координат Декарта, в которой формула для расстояния принимает привычный нам вид: 2 ∆l𝐴𝐵 = (x𝐵 − x𝐴 )2 + ( y𝐵 − y𝐴 )2 = ∆x 2 + ∆ y 2 ,

кроме того, что она выглядит проще? Чтобы ответить на этот вопрос, рассмотрим линейное преобразование следующего вида: x = x 0 cos ϕ − y 0 sin ϕ,

y = x 0 sin ϕ + y 0 cos ϕ,

(1.2)

где ϕ — это угол, который не зависит от координат x и y. На рис. 1.18 продемонстрирован геометрический смысл обсуждаемого здесь преобразования. Если в системе XOY коY 0

Y

y 0

X 0

x

~ R 0

y

ϕ x

X

Рис. 1.18. Поворот системы координат


36

Лекция 1. Специальная теория относительности

~ были x, y, то в системе X 0 OY 0, повёрнуординаты вектора R той относительно исходной системы XOY на угол ϕ против часовой стрелки, координаты x 0 , y 0 этого же вектора в новой координатной сетке будут определяться по формуле (1.2). Используя указанные выше соотношения между x, y и x 0 , y 0 , получим формулу для расстояния, выраженную через новые (штрихованные) координаты: ∆x 2 = (∆x 0 cos ϕ − ∆ y 0 sin ϕ)2 = = (∆x 0 )2 cos2 ϕ − 2(∆x 0 cos ϕ)(∆ y 0 sin ϕ) + (∆ y 0 )2 sin2 ϕ, ∆ y 2 = (∆x 0 sin ϕ + ∆ y 0 cos ϕ)2 = = (∆x 0 )2 sin2 ϕ + 2(∆x 0 sin ϕ)(∆ y 0 cos ϕ) + (∆ y 0 )2 cos2 ϕ. Тогда ∆x 2 + ∆ y 2 = = (∆x 0 )2 cos2 ϕ + (∆x 0 )2 sin2 ϕ + (∆ y 0 )2 sin2 ϕ + (∆ y 0 )2 cos2 ϕ = = (∆x 0 )2 (cos2 ϕ + sin2 ϕ) + (∆ y 0 )2 (sin2 ϕ + cos2 ϕ), т. е. мы получаем, что (∆x 0 )2 + (∆ y 0 )2 = ∆x 2 + ∆ y 2 = ∆l 2 , так как верно соотношение cos2 ϕ + sin2 ϕ = 1. Таким образом, в обсуждаемом случае не поменялась не только длина ∆l 2 , но и формула Декарта или Пифагора, определяющая это расстояние. Помимо поворота, формулу для расстояния сохраняет и операция параллельного переноса — x 0 = x + a, y 0 = y + b, где a и b — некоторые числа. В этом заинтересованный читатель может убедиться самостоятельно. В нашем рассказе о теории относительности такое преобразование практически не будет использоваться. Ещё одной операцией, оставляющей неизменным как расстояние между точками, так и определяющую его формулу, является преобразование Галилея, которое в классической механике задаёт переход из одной инерциальной системы отсчёта в другую: ~r 0 = ~r − V~ t. Это утверждение легко проверяется прямым вычислением (рис. 1.19). Действительно, если ~r10 = ~r1 − V~ t и ~r20 = ~r2 − V~ t, то 2 (~r20 − ~r10 )2 = (~r2 − V~ t) − (~r1 − V~ t) = (~r2 − V~ t − ~r1 + V~ t)2 = (~r1 − ~r2 )2 .


§ 4. Преобразования Лоренца

37

Y0 Y

~r20

~r2 ~r10 ~r1

X0 X

Рис. 1.19. Преобразования Галилея

Итак повторим ещё раз, что при поворотах, переносах и преобразованиях Галилея не меняются не только длины отрезков, но и формула 2 ∆l𝐴𝐵 = (x𝐵 − x𝐴 )2 + ( y𝐵 − y𝐴 )2 = ∆x 2 + ∆ y 2

для их определения в виде суммы квадратов разностей координат точек. Для дальнейшего это очень важное замечание. § 4. Преобразования Лоренца Перейдём теперь к обсуждению пространствавремени. Для наглядности мы опять возьмём двумерное пространство-время с интервалом вида ∆s2 = c2 ∆t 2 − ∆x 2 . Все утверждения, которые мы обсудим ниже, могут быть обобщены на четырёхмерный случай. Как и в случае евклидова пространства, мы зададимся вопросом о виде преобразования, которое сохраняет формулу для интервала в пространстве-времени Минковского. Оно, как мы сейчас покажем, во многом похоже на поворот в евклидовом пространстве. Действительно, сравним два преобразования следующего вида. Пространство Евклида 0

x = x cos ϕ − y sin ϕ y 0 = y sin ϕ + y cos ϕ cos2 ϕ + sin2 ϕ = 1

Пространство-время Минковского ct 0 = (ct) ch ϕ + x sh ϕ x 0 = (ct) sh ϕ + x ch ϕ ch2 ϕ − sh2 ϕ = 1


38

Лекция 1. Специальная теория относительности

Введённые здесь функции определяются как ch ϕ =

eϕ + e−ϕ , 2

sh ϕ =

eϕ − e−ϕ 2

и называются гиперболическими косинусом и синусом соответственно. Как нетрудно проверить прямым вычислением, они удовлетворяют соотношению ch2 ϕ − sh2 ϕ = 1. Чтобы пояснить происхождение названия функций ch ϕ и sh ϕ, рассмотрим вектор с координатами (cos ϕ, sin ϕ) в двумерном пространстве (рис. 1.20). Если менять угол ϕ, то, так как верно уравнение cos2 ϕ + sin2 ϕ = 1, конец рассматриваемого вектора опишет окружность, поскольку уравнение окружности имеет вид X 2 + Y 2 = 1. y 1

0,5

ϕ −1

−0,5

0

0,5

1 x

−0,5

−1 Рис. 1.20. Вращение двумерного вектора на евклидовой плоскости

Уравнение же ch2 ϕ − sh2 ϕ = 1 задаёт гиперболу, поэтому в таком случае в евклидовой плоскости конец вектора (ch ϕ, sh ϕ) при изменении ϕ будет двигаться по гиперболе (рис. 1.21). Действительно, уравнение гиперболы имеет вид X 2 − Y 2 = 1. Однако в школьном курсе математики обычно имеют дело с гиперболами в другом представлении. Если в плоскости (X , Y )


§ 4. Преобразования Лоренца

39

ct

1

ϕ −2

−1

000

1

2 x

−1

Рис. 1.21. «Гиперболическое вращение» двумерного вектора на евклидовой плоскости

произвести следующую замену переменных: U = X − Y и V = = X + Y, то гипербола теперь принимает более знакомый читателям вид UV = 1. Действительно, в новых координатах такая фигура имеет хорошо известный график (рис. 1.22). Её асимптоты совпадают с осями U и V. После поворота к исходным осям Z и Y ветви гиперболы и её асимптоты развернутся на 45 градусов. Соответственно, в исходных осях её график будет выглядеть, как показано на рис. 1.23. U

V

U

Z

V

Рис. 1.22

Y

Рис. 1.23


40

Лекция 1. Специальная теория относительности

Теперь асимптоты гипербол совпадают с прямыми X = Y и X = −Y. Итак, обсуждаемое движение пространства-времени Минковского называется гиперболическим вращением, а функции ch ϕ и sh ϕ по аналогии называются гиперболическим косинусом и синусом. Проверим теперь, что в пространстве-времени Минковского преобразование, приведённое выше, сохраняет формулу интервала. При таком преобразовании разности координат изменяются следующим образом: x2 − x1 = ∆x = c∆t 0 sh ϕ + ∆x 0 ch ϕ, c(t2 − t1 ) = c∆t = c∆t 0 ch ϕ + ∆x 0 sh ϕ. Возводя эти соотношения в квадрат, получим ∆x 2 = (c∆t 0 sh ϕ + ∆x 0 ch ϕ)2 = = c2 (∆t 0 )2 sh2 ϕ + (∆x 0 )2 ch2 ϕ + 2∆x 0 sh ϕ · c∆t 0 ch ϕ, (c∆t)2 = (c∆t 0 ch ϕ + ∆x 0 sh ϕ)2 = = c2 (∆t 0 )2 ch2 ϕ + (∆x 0 )2 sh2 ϕ + 2∆x 0 ch ϕ · c∆t 0 sh ϕ. Тогда c2 ∆t 2 − ∆x 2 = = c2 (∆t 0 )2 ch2 ϕ + (∆x 0 )2 sh2 ϕ − (∆x 0 )2 ch2 ϕ − c2 (∆t 0 )2 sh2 ϕ = 0

0

= c2 ∆t 2 (ch2 ϕ − sh2 ϕ) − ∆x 2 (ch2 ϕ − sh2 ϕ) = c2 (∆t 0 )2 − (∆x 0 )2 . На последнем шаге мы учли, что ch2 ϕ − sh2 ϕ = 1, т. е. обсуждаемое здесь преобразование гиперболического поворота действительно сохраняет формулу, определяющую расстояние в пространстве-времени. Гиперболический поворот имеет важный физический смысл. Чтобы понять его, изобразим двумерное пространство-время на рис. 1.24. Для дальнейших рассуждений важно помнить, что на плоскости мы привыкли измерять расстояния по формуле Пифагора, тогда как в пространстве-времени расстояние вычисляется в соответствии с выражением ∆s2 = c2 ∆t 2 − ∆x 2 . Знак минус в последней формуле очень важен и отличает её от той, что возникает из теоремы Пифагора. В частности, любой отрезок, наклонённый под углом 45 градусов к осям


§ 4. Преобразования Лоренца

41

ct

Рис. 1.24. Двумерное пространство-время. Любой из отрезков, лежащих на серых линиях, которые наклонены по отношению к осям на 45 градусов, имеет длину нуль

x

в пространстве Минковского, имеет длину, равную нулю, потому что для такого отрезка c2 ∆t 2 − ∆x 2 = 0 (рис. 1.24). Более того, в пространстве-времени бывают и отрезки, квадрат длины которых меньше нуля. Это очень необычно с точки зрения евклидовой геометрии, и мы вернёмся к обсуждению этих нюансов ниже. Ну и наконец, следует помнить, что обсуждаемое здесь преобразование является гиперболическим, а не простым поворотом нашего пространства-времени. Глядя на рис. 1.24, следует иметь в виду все упомянутые здесь моменты и понимать, насколько условной является обсуждаемая здесь картинка. Но за неимением возможности изобразить прямо пространство-время, для наглядности нам придётся дальше пользоваться именно такими рисунками. Изобразим теперь в обсуждаемом пространстве-времени координатную сетку (рис. 1.25). Для этого рассмотрим на оси x в данный момент времени, скажем, в момент t = 0, сеть из материальных точек, отстоящих друг от друга на равные расстояния (например, на метр). Пусть эти материальные точки до момента t = 0 были в покое и таковыми и остаются. Тогда во все последующие и предыдущие моменты времени их координаты x не будут меняться и они опишут при эволюции во времени вертикальные сплошные прямые, как изображено на рис. 1.25. Эти прямые называются мировыми линиями материальных точек. Заметим, что мировая линия — это не то же самое, что траектория. Траектория является проекцией мировой линии на пространственную часть пространства-времени. Пусть теперь с каждой из материальных точек связаны часы и все они идут синхронно. Через каждую 1/300 000 000 долю секунды мы отметим точки на каждой из вертикальных


42

Лекция 1. Специальная теория относительности

ct

x

Рис. 1.25. Координатная сетка из сплошных линий отвечает покоящимся материальным точкам, а пунктирная сетка — двигающимся с постоянными скоростями

линий. Проведём через эти точки воображаемые горизонтальные сплошные прямые, как изображено на рис. 1.25. Эти прямые, как нетрудно видеть, тоже отстоят друг от друга на один метр вдоль вертикального направления. Таким образом, мы получим координатную сетку в пространстве-времени, которая ассоциирована с каким-то набором наблюдателей, или, что то же самое, с какой-то сетью материальных точек. Рассмотрим теперь в пространстве-времени другой набор материальных точек, которые будут двигаться равномерно и прямолинейно относительно точек, рассмотренных выше, которые мы полагали покоящимися. Ясно, что сеть движущихся точек, точно так же, как и сеть, составленная покоящимися точками, может быть основой для системы отсчёта. Сетка этой новой системы отсчёта изображена на рис. 1.25 пунктирными линиями. Частицы, конечно же, могут двигаться не только равномерно и прямолинейно, но и произвольным образом. В этом случае их мировые линии будут некоторыми кривыми, например такими, как изображённые на рис. 1.26.


§ 4. Преобразования Лоренца

43

ct

x

Рис. 1.26. Мировые линии частиц, двигающихся произвольным образом, изображены пунктирными вертикально направленными кривыми. Их можно взять за основу криволинейной координатной сетки в пространстве-времени

Координатные сетки можно составлять и на основе мировых линий частиц, которые двигаются произвольным образом. Такие сетки, очевидно, будут криволинейными, а не прямоугольными (рис. 1.26). Поэтому переход к криволинейным координатам в пространстве-времени в принципе означает переход к системам наблюдателей, двигающихся произвольным образом, а не с постоянной скоростью по инерции. Такую ситуацию мы подробнее обсудим на лекции по общей теории относительности. Теперь мы готовы к обсуждению физического смысла гиперболического поворота. Рассмотрим замену координат, отвечающую гиперболическому повороту: c∆t 0 = c∆t ch ϕ + ∆x sh ϕ, ∆x 0 = c∆t sh ϕ + ∆x ch ϕ. Здесь ∆t и ∆x — это смещения вдоль мировой линии частицы в системе отсчёта (t, x), а ∆t 0 и ∆x 0 — в системе координат (t 0 , x 0 ). Предположим, что частица покоится в системе отсчёта


44

Лекция 1. Специальная теория относительности

(t 0 , x 0 ). Тогда ∆x 0 = 0, а система (t, x) движется относительно (t 0 , x 0 ) с какой-то скоростью V. Пусть эта скорость направлена в отрицательном направлении оси x 0 , что будет соответствовать тому, что систему (t 0 , x 0 ) мы связали с какой-то частицей, двигающейся со скоростью V относительно системы (t, x) в положительном направлении оси x. Тогда вторая из обсуждаемых формул гиперболического поворота сведётся к соотношению 0 = ∆x ch ϕ + c∆t sh ϕ, откуда следует, что sh ϕ ∆x . =− c∆t ch ϕ

Отношение ∆x/∆t — это скорость частицы в системе отсчёта (t, x), которая равна V. Таким образом, sh ϕ V . =− c ch ϕ

Напомним, что ch ϕ и sh ϕ связаны равенством ch2 ϕ−sh2 ϕ =1. Тогда, подставляя в него найденное соотношение, получим V2 V2 ch2 ϕ − 2 ch2 ϕ = ch2 ϕ 1 − 2 = 1, c

c

откуда следует, что ch ϕ = p

1 . 1 − V 2 /c2

Мы выбрали только положительный корень для ch ϕ, так как эта функция всегда больше нуля в силу своего определения: ch ϕ =

eϕ + e−ϕ > 0. 2

Возвращаясь к преобразованию координат, с учётом найденных соотношений получим следующую цепочку равенств: x 0 = (ct) sh ϕ + x ch ϕ = V 1 = (ct) − p +p c

2

1 − V /c

2

x x − Vt =p . 2 2 1 − V /c 1 − V 2 /c2

Как видим, эта цепочка равенств привела нас к формуле, по которой, если известны координаты события в системе


§ 4. Преобразования Лоренца

45

(t, x), можно найти координату x 0 этого же события в системе (t 0 , x 0 ), движущейся в положительном направлении вдоль оси x системы (t, x): x0 = p

x − Vt . 1 − V 2 /c2

Что касается преобразования времени, то мы оставляем заинтересованному читателю возможность вывести соответствующую формулу самостоятельно и приведём лишь конечный результат: t − x · V /c2

t0 = p

1 − V 2 /c2

.

Соберём прямое и обратное преобразования вместе: t − x · V /c2

x0 = p

x − Vt , 1 − V 2 /c2

t0 = p

x=p

x 0 + Vt 0 , 1 − V 2 /c2

t= p

y 0 = y,

z = z0 .

1 − V 2 /c2

t 0 + x 0 · V /c2 1 − V 2 /c2

, ,

Преобразование от x к x 0 иногда называют прямым, а от x 0 к x — обратным. Видно, что обратные преобразования получаются из прямых заменой V на −V с одновременной переменой местами штрихованных и нештрихованных координат. Иначе обратные преобразования из прямых можно получить, решив систему уравнений в первой строке относительно x и t, т. е. выразив последние через x 0 и t 0, как и написано во второй строке. Рассмотрим теперь, что происходит с этими преобразованиями в пределе, когда V намного меньше скорости света c. В этом случае можно пренебречь любой величиной, в которой встречается отношение V/c, по сравнению с остальными величинами. Выше мы видели, что даже для космических скоростей это отношение составляет очень малые доли единицы. Тогда обсуждаемое преобразование координат переходит в x 0 = x − Vt и t = t 0, т. е. в преобразование Галилея. Итак, гиперболический поворот есть не что иное, как знаменитое преобразование Лоренца, задающее переход из одной инерциальной системы отсчёта в другую. В нашем случае


46

Лекция 1. Специальная теория относительности

вторая система отсчёта движется относительно первой с постоянной скоростью V в положительном направлении оси X . Это преобразование является релятивистским обобщением преобразований Галилея, лежащих в основе механики Ньютона. Точно так же, как преобразования Лоренца переходят в преобразования Галилея в так называемом нерелятивистском пределе, уравнения релятивистской механики переходят в уравнения классической в том же пределе. Подчеркнём ещё раз то, что было сказано выше. А именно, важным свойством преобразования Лоренца является то, что оно сохраняет формулу, определяющую интервал в пространстве-времени, а не просто длины отрезков. В этом смысле такое преобразование похоже на поворот в евклидовой плоскости. При этом преобразования Лоренца переводят координатную сетку одной инерциальной системы отсчёта в координатную сетку в другой, тоже инерциальной системе. В то же время переход в неинерциальную систему отсчёта описывается нелинейным преобразованием координат и меняет формулу, задающую интервал. Формальное обсуждение перехода в неинерциальные системы требует от читателя знаний математики, выходящих за рамки школьного курса, поэтому мы обсудим такой переход в конце лекции по общей теории относительности в качестве дополнительного сложного материала. Здесь же подчеркнём, что при нелинейном преобразовании меняется формула для интервала, но при этом длины отрезков не меняются, точно так же, как это было на евклидовой плоскости при произвольном, в том числе нелинейном преобразовании координат. § 5. О скорости света Обсудим ещё несколько свойств, следующих из геометрии Минковского. В ней имеется три типа векторов (отрезков или интервалов), которые называются времени-подобными, пространственно-подобными и свето-подобными. Их свойства мы сейчас и опишем. Те интервалы, отрезки или векторы, для которых ∆s2 > 0, называются времени-подобными. Для них c∆t > ∆x, и угол наклона такого вектора или отрезка по отношению к оси x


§ 5. О скорости света

47

больше 45 градусов. Вдоль таких векторов могут быть направлены скорости частиц с массами больше нуля. Дело в том, что такие частицы не могут двигаться быстрее скорости света, и за время ∆t они проходят расстояния меньшие c∆t. Подчеркнём, что помимо существования пространственновременного континуума в теории относительности постулируется, что скорость света является максимально возможной для передачи сигналов или энергии. Заметим, что, например, формулы, определяющие преобразования Лоренца, теряют свой смысл, если оказывается, что V > c. Подобрав систему отсчёта, можно поставить времени-подобный отрезок вертикально. Это означает, что относительно такой системы частица, двигающаяся вдоль этого отрезка в пространстве-времени, покоится. Как станет сейчас ясно, подобный отрезок нельзя сделать горизонтальным. Векторы, для которых ∆s2 <0, называются пространственноподобными. Для них c∆t < ∆x, и угол наклона таких векторов по отношению к оси x составляет меньше 45 градусов. Вдоль таких векторов не происходит распространения никаких частиц. Зато при помощи подобного вектора можно изобразить, например, стержень, толщиной которого можно пренебречь. Подобрав систему отсчёта, такой отрезок можно сделать горизонтальным, но его нельзя сделать вертикальным. Действительно, иначе преобразованием координат мы могли бы сделать из пространственно-подобного вектора времени-подобный или наоборот, что невозможно, так как при преобразованиях координат длины отрезков и/или векторов не меняются. И наконец, векторы, для которых ∆s2 = 0, называются свето-подобными, так как для них c∆t = ∆x и они определяют направления, вдоль которых может распространяться свет. Такие векторы имеют наклон 45 градусов по отношению к обеим осям. Рассмотрим теперь произвольную точку на произвольной мировой линии, которая изображена на рис. 1.27. Проведём световые лучи, которые проходят через эту точку и отвечают движению света слева направо и наоборот (крестики на рис. 1.27). Получившийся угол называется световым конусом для данного события — для данной точки на мировой линии.


48

Лекция 1. Специальная теория относительности

ct

x

Рис. 1.27. Световые конусы в разных точках мировой линии

Слово «конус» используется вместо слова «угол» по следующей причине. Если бы пространство-время имело два пространственных измерения x и y (а не одно x, как в нашем случае) и одно временно́е измерение, то, изобразив лучи света, проходящие через данную точку и идущие во всех возможных направлениях, мы получили бы два сходящихся в вершине конуса. В четырёхмерном же пространстве-времени нам пришлось бы иметь дело с трёхмерным, а не обычным двумерным конусом. Так как частица не может двигаться со скоростью, большей световой, касательная в любой точке её мировой линии не может иметь угол наклона больше чем 45 градусов по отношению к оси времени. Соответственно, можно показать, что сама мировая линия всегда целиком находится внутри светового конуса, проведённого через любую точку на ней. Далее, вдоль мировой линии фотона интервал равен ∆s2 = c2 ∆t 2 − ∆x 2 = 0, так как вдоль неё верно, что 1 c∆t = ∆x. В силу инвариантности (неизменности) интервала относительно координатных преобразований величина интервала будет равна нулю и во 1 Обратите внимание на уравнения (1.1), которые мы использовали при обсуждении систем глобального позиционирования.


§ 5. О скорости света

49

всех других инерциальных и даже неинерциальных системах отсчёта. При этом при переходах между инерциальными системами отсчёта интервал не меняет своего вида. Поэтому ∆s2 = c2 ∆t 2 − ∆x 2 = (c∆t 0 )2 − (∆x 0 )2 = 0, т. е. если ∆x/∆t = c, то и ∆x 0 /∆t 0 = c. Таким образом, свет в любой инерциальной системе отсчёта движется с одной и той же скоростью. Вот так, например, и получается широко известный вывод специальной теории относительности, который нередко в научно-популярной литературе преподносят в парадоксальной форме. Поясним данное утверждение. Во-первых, речь идёт о движении света в вакууме. Обычно мы имеем дело с движением света в среде, а там он двигается с меньшей скоростью. Более того, мы имеем дело с волновым пакетом, а не с отдельной монохроматической волной, имеющей одну определённую частоту 2 . Каждая из волн, составляющих пакет, двигается в среде с так называемой фазовой скоростью, а сам пакет перемещается со скоростью, называемой групповой. Групповая скорость не может превышать скорость света в вакууме, так как именно с этой скоростью волны переносят энергию и тем самым передают сигнал. При этом фазовая скорость может принимать любые значения, ведь она не отвечает никакой передаче сигнала или энергии. (Про волны мы поговорим подробнее на лекции по квантовой механике.) Во-вторых, скорость распространения света остаётся неизменной при переходе между инерциальными системами отсчёта. Как видно из приведённого выше рассуждения, это связано с инвариантностью формулы интервала при подобных переходах. В неинерциальных системах формула интервала может 2 Волновые пакеты обсуждаются подробнее в следующих лекциях. Мы упоминаем их здесь, чтобы описать хотя бы некоторые пределы применимости обсуждаемого здесь утверждения о скорости света. Итак, любой световой сигнал, с которым мы имеем дело в повседневной жизни, является не одной выделенной волной определённой частоты, двигающейся в данном направлении, а набором волн немного отличающихся частот, двигающихся в немного отличающихся направлениях. Например, белый свет является набором волн различного цвета, т. е. разных частот. Это и есть пример волнового пакета.


50

Лекция 1. Специальная теория относительности

значительно измениться. В таком случае скорость распространения света, понимаемая как отношение пространственного смещения вдоль его мировой линии к временно́му, может вообще оказаться зависящей от положения и направления в пространстве-времени и отличаться от величины c. Мы обсудим такие ситуации подробнее на лекции по общей теории относительности. В-третьих, формула для интервала, которую мы использовали выше, верна только для плоского пространства-времени Минковского. В присутствии тяжёлых и компактных гравитирующих тел, когда пространство-время испытывает существенное искривление, интервал имеет совсем другой вид. Иным будет вид интервала и в расширяющейся Вселенной. Во всех этих случаях утверждение о независимости скорости распространения света от системы отсчёта не является верным. Но максимальность этой скорости является постулатом. Никакой сигнал и никакая частица не может обогнать свет ни в плоском, ни в искривлённом пространстве-времени, ни в инерциальной, ни в неинерциальной системе отсчёта. По крайней мере, до сих пор не обнаружен ни один достоверный экспериментальный факт, опровергающий это утверждение. § 6. О разности хода часов и лоренцевом сокращении длин Рассмотрим опять поворот системы координат на евклидовой плоскости. На рис. 1.18 видно, что при таком повороте меняются проекции отрезков на оси координат, т. е. ∆x 6= ∆x 0 и ∆ y 6= ∆ y 0 . Но, как мы не раз подчёркивали, сумма квадратов этих величин при этом не меняется. Очевидно, то же самое будет происходить и при преобразованиях Лоренца в пространстве Минковского, т. е. ∆t 6= ∆t 0 и ∆x 6= ∆x 0 , но разность квадратов этих величин не меняется при замене координат. Именно этот простой факт и лежит в основе разности хода часов в разных системах отсчёта и в основе так называемого лоренцева сокращения длин. Обсудим эти явления немного подробнее. На рис. 1.28 изображены две мировые линии. Первая отвечает покоящейся частице, а вторая — двигающейся с постоянной скоростью V.


§ 6. О разности хода часов и лоренцевом сокращении длин

51

ct ct2 1

2

ct1 x1

x2

x

Рис. 1.28. Серая прямая мировая линия отвечает частице под номером 1, которая покоится. Чёрная прямая мировая линия отвечает частице под номером 2, которая двигается относительно покоящейся частицы 1

Событиями в этой ситуации будут наличия частиц в различных точках пространства в различные моменты времени. В покоящейся системе отсчёта координатами событий для первой частицы будут x1 , t1 и x1 , t2 , а для второй — x1 , t1 и x2 , t2 . Между моментами t2 и t1 часы покоящейся частицы покажут, что прошло время t2 − t1 , что есть просто длина мировой линии этой частицы между обсуждаемыми моментами времени, делённая на скорость света c: ∆t = t2 − t1 = ∆s1 /c. Возникает вопрос, сколько времени набежало на часах двигающейся частицы. Ответ t2 − t1 не будет верным. Действительно, перейдём в систему отсчёта, где вторая частица покоится. При таком переходе длины мировых линий каждой из частиц не поменяются, а по часам второй частицы в новой системе отсчёта пройдёт время t20 − t10 (рис. 1.29). При этом если в исходной системе отсчёта события x1 , t2 и x2 , t2 были одновременными, то в новой системе отсчёта эти события таковыми не являются, что и изображено на рис. 1.29. Как величина t20 − t10 выражается через координаты в исходной системе отсчёта? В исходной системе отсчёта длина мировой линии второй частицы между t1 и t2 определяется как ∆s212 = c2 ∆t 2 − ∆x 2 = V2 = c2 ∆t 2 − V 2 ∆t 2 = (c2 − V 2 )∆t 2 = 1 − 2 c2 ∆t 2 , c


52

Лекция 1. Специальная теория относительности

ct 0 ct20 1

2

ct10 x20

x10

X0

Рис. 1.29. В системе отсчёта, связанной со второй частицей (её мировая линия вертикальна и изображена чёрным цветом), концы мировых линий частиц не будут одновременными

где ∆x = x2 − x1 и ∆t = t2 − t1 . В силу неизменности интервала при замене системы отсчёта эта величина и равна c2 (t20 − t10 )2 . Таким образом, s t20 − t10 =

1−

V2 (t − t1 ). c2 2

В отличие от того, как это выглядит на рис. 1.28, длина мировой линии второй частицы на самом деле короче длины мировой линии первой частицы. Действительно, s ∆t >

1−

V2 ∆t. c2

Это и показано на рис. 1.29 и связано с тем, что двумерное пространство-время Минковского мы изображаем на евклидовой плоскости, а преобразование Лоренца представляем здесь просто поворотом координатной плоскости. При приближении V к скорости света второй отрезок на рис. 1.28 поворачивается к линии, наклон которой составляет 45 градусов по отношению к осям координат, и становится тем короче, чем ближе V к c. Подчеркнём, что часы, «прикреплённые» к частице, идут с частотой, никак не зависящей от того, из какой системы отсчёта она наблюдается, но с точки зрения систем, относительно которых эта частица движется, всё выглядит так, как будто часы, связанные с ней, идут медленнее. В рассмотренном выше случае всё выглядит так, как будто в системе


§ 6. О разности хода часов и лоренцевом сокращении длин

53

отсчёта первой частицы медленнее идут часы второй частицы, а в системе отсчёта второй частицы наоборот — медленнее идут часы первой частицы. Но длины мировых линий каждой из них при этом определены однозначно. Поэтому определено однозначно и то, сколько времени прошло по часам той или иной частицы, ведь эта величина равна лишь длине мировой линии, делённой на скорость света. Показания часов, двигающихся вместе с той или иной частицей, являются фактом объективной реальности. Время, прошедшее в системе отсчёта, сопутствующей некоторому телу, которое, кстати, не обязательно должно двигаться по инерции, называется собственным временем этого тела. Обсуждаемая ситуация абсолютно аналогична той, что возникает в случае с двумя отрезками на евклидовой плоскости, которые расположены под углом друг к другу (рис. 1.30). Ортогональная проекция первого отрезка на второй будет короче, чем длина второго отрезка. Аналогично проекция второго отрезка на первый короче, чем длина первого отрезка. Однако длины отрезков совершенно однозначно определены, и то, какой из них длиннее, а какой короче, не зависит от системы координат на плоскости. A

A B

O

A0

B

O

0

B

Рис. 1.30

Аналогичным образом объясняется и лоренцево сокращение длин, ведь проекция пространственно-подобного отрезка, который отвечает какому-нибудь стержню, на пространственную ось тоже зависит от системы отсчёта. А именно, специальная теория относительности утверждает, что если имеется стержень собственной длины l0 , т. е. такова его длина в той системе, где он покоится, то в системе отсчёта, которая движется относительно стержня со скоростью V, его длина


54

Лекция 1. Специальная теория относительности

будет меньше и будет равна l = l0

s 1−

V2 . c2

Вывод этой формулы содержится, например, в популярной книге Э. Тейлора и Дж. Уиллера «Физика пространства-времени». Мы не приводим его здесь, чтобы не загромождать ещё больше наше изложение техническими деталями. В теории относительности часто используют обозначение γ= p

1 , 1 − V 2 /c2

называемое релятивистским γ-фактором. С учётом этого обозначения формула лоренцева сокращения длины запишется в виде l = l0 /γ. Итак, в системе покоя стержня его длина равна l0 , а в системе, в которой он движется с постоянной скоростью V, его длина меньше. Ведь, как нетрудно видеть, γ всегда больше единицы. Утверждение о сокращении длины верно только при переходе из одной инерциальной системы отсчёта в другую. При переходах в неинерциальные системы отсчёта в искривлённом пространстве-времени ситуация может быть иной, но обсуждение деталей, лежащих в основе этого факта, выходит за рамки нашей книги. Сокращение длины стержня происходит не из-за того, что на него действует какая-то сила, которая его сжимает. Стержень может покоиться на Земле и одновременно двигаться относительно Солнца или Венеры. И тогда возникает естественный вопрос: как же так может быть, что сила одновременно присутствует и отсутствует? Ответ заключается в том, что никакой силы нет, обсуждаемое здесь сокращение является чисто геометрическим явлением, связанным со свойствами геометрии пространства-времени и с тем, что проекции отрезков на оси координат могут меняться при смене систем отсчёта. Оценим, насколько незначителен эффект такого явления в повседневной жизни. Представьте себе, что стержень движется со второй космической скоростью. Оценки, аналогичные тем, которые мы делали раньше для промежутков времени, показывают, что длина стержня изменится лишь на одну


§ 7. О парадоксе шеста и сарая

55

миллиардную долю от его собственной длины, так как V 2 /c2 в обсуждаемом здесь случае имеет такой порядок. В реальных обстоятельствах при длине стержня в системе покоя, скажем, равной 1 метру, подобное изменение мы даже и не сможем определить. Сокращение длины в таком случае сопоставимо с межатомными расстояниями. Чтобы сокращение длин было существенным, стержень должен двигаться со скоростью, составляющей хотя бы десятые доли от скорости света. § 7. О парадоксе шеста и сарая Теперь в качестве иллюстрации лоренцева сокращения длин рассмотрим так называемый парадокс шеста и сарая. Формулируется он следующим образом. Представим себе сарай собственной длины 6 метров. Собственная длина — это размер объекта в той системе отсчёта, в которой он покоится, т. е. в системе отсчёта, в которой его скорость равна нулю, расстояние между его левым и правым краями — 6 метров. Пусть с левой и правой стороны сарая нет стен (рис. 1.31), т. е. он сквозной. В этот сарай влетает шест, который имеет собственную длину 10 метров. Пусть скорость сближения шеста и сарая такова, что релятивистский γ-фактор равен 10/6. Тогда, как нетрудно посчитать, используя формулу, определяющую γ-фактор, скорость сближения шеста и сарая V составляет 8/10 от скорости света. Используя формулу для лоренцева сокращения длин, можно посчитать, что длина шеста в системе отсчёта сарая равна 6 метров и в какой-то момент времени он целиком помещается в сарай, т. е. если внутри сарая есть человек, то в некоторый момент по своим часам он увидит шест, целиком поместившийся в сарай. Мы обсуждаем здесь идеализированную ситуацию и считаем, что системы отсчёта, связанные и с шестом, и с сараем, являются инерциальными. В частности, мы пренебрегаем действием силы тяжести. Тогда заметим, что движение с постоянной скоростью относительно и если перейти в систему отсчёта шеста, то теперь сарай летит на него. Получается, что в силу той же формулы для сокращения длин в системе отсчёта шеста


56

Лекция 1. Специальная теория относительности

 метров метров  метров метров метров

V

10 10 метров 10 метров 10 метров 10 метров 10метров метров  метров метров  метров  метров метров метров V 10 10 метров 10 метров 10 метров 10 метров 10метров метров

, метра Рис. 1.31

длина сарая сокращается до 3,6 метра, т. е. в собственной системе отсчёта шест никак не может поместиться в сарай, так как он имеет длину 10 метров. Как же такое может быть? Парадокс возникает оттого, что по умолчанию предполагается, что если с точки зрения наблюдателя, связанного с сараем, шест поместился в сарай, то это должно иметь место и во всех других системах отсчёта, в том числе и для наблюдателя, связанного с шестом. Объяснение этого кажущегося парадокса достаточно простое и основано на следующем наблюдении: если в системе покоя сарая совпадение задней (левой) стенки сарая и заднего конца шеста произошло одновременно с совпадением передней (правой) стенки сарая с передним концом шеста, то в системе покоя шеста эти два события просто не являются одновременными. Заметим, что интервал между двумя событиями (совпадениями концов шеста с концами сарая) не зависит от системы отсчёта, а вот его проекции на пространственные и временны́е оси при переходах между системами отсчёта меняются.


§ 8. О парадоксе близнецов

57

§ 8. О парадоксе близнецов Теперь обсудим так называемый парадокс близнецов. Представьте себе двоих близнецов, например Василия и Петра. Пусть Василий остался на Земле, а Пётр слетал на космическом корабле на ближайшую звезду и вернулся обратно. В системе отсчёта Василия замедлялись часы Петра, а в системе отсчёта Петра вроде бы наоборот — замедлялись часы Василия. Вопрос: Кто из них окажется старше, когда они встретятся? В свете приведённого выше обсуждения ответ на этот вопрос прост — в чьей системе отсчёта прошло больше собственного времени, тот и старше, а собственное время — это длина мировой линии, делённая на скорость света. Мировые линии между моментами отправления и возвращения Петра у близнецов действительно разные, а длины линий никак не зависят от выбора системы отсчёта. (Собственное время, набежавшее на часах того или иного наблюдателя или частицы, не зависит от того в какой системе отсчёта мы изучаем их движение.) Казалось бы, из рис. 1.32 очевидно, что старше Пётр. Но это не так. На этом рисунке на евклидовой плоскости изображено пространство-время Минковского. Если разбить обе мировые линии на очень короткие и поэтому почти прямые сегменты горизонтальными линиями (рис. 1.33), то станет ясно, что младше будет Пётр: каждый из сегментов его мировой линии короче каждого из сегментов мировой линии Василия ct

Рис. 1.32. Мировые линии Василия и Петра. Для идеализации мы считаем, что Василий покоится. Эта идеализация является хорошим физическим приближением к реальной ситуации

В а с и л и й

Пётр

x


58

Лекция 1. Специальная теория относительности

ct

В а с и л и й

Пётр

x

Рис. 1.33. Нахождение полного времени между стартом и возвращением Петра. Мировые линии Василия и Петра разбиты на маленькие сегменты, которые приблизительно совпадают с прямыми отрезками. Каждому такому сегменту на мировой линии Василия отвечает сегмент мировой линии Петра, который всегда короче, чем у Василия. Ведь Пётр движется в данной системе отсчёта, а Василий покоится

(см. обсуждение после рис. 1.28 и 1.29) из-за того, что Пётр всё время движется в данной системе отсчёта. Следует отметить, что системы отсчёта братьев неравноценны. Если система Василия, который покоится, является инерциальной, то система Петра инерциальной не является. Чтобы слетать на звезду и вернуться обратно, ему необходимо разгоняться и тормозить. Ничего подобного в системе отсчёта Василия, который остался на Земле, не происходит. Только движения с постоянными скоростями являются относительными. Движение с ускорением уже является абсолютным. То, насколько короче мировая линия Петра, зависит от того, с какими ускорениями и как долго он двигался. Различия могут быть минимальными, если ускорения были небольшими и движение с ними было непродолжительным. А могут оказаться и колоссальными, вплоть до того, что у Петра могут пройти недели или месяцы, а у Василия — годы. Нужно лишь следить, чтобы у Петра не было слишком больших перегрузок, которые не совместимы с жизнью. § 9. О смысле соотношения E0 = mc2 Обсудим теперь знаменитую формулу Эйнштейна E0 = mc2 . Индекс 0 у энергии в этой формуле здесь существен, хотя его нередко опускают. Дело в том, что любая масса — это энергия, но не любая энергия — это масса.


§ 9. О смысле соотношения E0 = mc2

59

E0 — это энергия покоя частицы, т. е. её энергия в той системе отсчёта, в которой она не движется. Полная же энергия частицы, которая движется с импульсом p~, равна Æ E = (mc2 )2 + ( p~c)2 , и только когда p~ = 0, мы получим E0 = mc2 . Откуда возникает эта формула? В школе проходят понятия двумерного и трёхмерного векторов x~ = (x1 , x2 ) и x~ = (x1 , x2 , x3 ). В пространстве Минковского есть понятие четырёхмерного вектора (4-вектора). Например, простейшим 4-вектором является (ct, x1 , x2 , x3 ). Он указывает направление из начала координат в мировую точку (ct, x1 , x2 , x3 ). В обычном пространстве при замене координат все векторы (например, вектор импульса или силы) преобразуются единообразно, т. е. так же, как вектор x~ = (x1 , x2 , x3 ), вне зависимости от физического смысла их компонент. Это же имеет место и в теории относительности. Поэтому если мы знаем, как преобразуются координаты, т. е. 4-вектор (ct, x1 , x2 , x3 ), то мы также знаем и как преобразуются координаты любого другого 4-вектора. А также мы знаем, что длина вектора не меняется при преобразованиях координат. Как мы обсудили выше, пространство и время объединяются в так называемый единый континуум, в котором между событиями откладывается 4-вектор (ct, ~r ). Подобно этому импульс и энергия объединяются в единый 4-вектор энергии-импульса (E/c, p~). Его первая компонента связана с энергией, а другие три — с обычным импульсом частицы. Квадрат вектора есть инвариант (неизменная величина) при преобразованиях Лоренца, так как определяет его длину. Оказывается, квадрат 4-вектора импульса выражается через массу частицы и её импульс: m2 c2 =

E2 − p~2 . c2

Полученная формула является полным аналогом формулы для интервала ∆s2 = c2 ∆t 2 − ∆~r 2 и следует из совокупности опытных данных.


60

Лекция 1. Специальная теория относительности

Из этого соотношения следует, что (mc2 )2 = E 2 − c2 p~2 , а далее получается формула, которую мы привели выше: Æ E = (mc2 )2 + ( p~c)2 . Длина 4-вектора импульса не зависит от системы отсчёта и определяется только массой. Так что масса остаётся неизменной при переходе из одной системы отсчёта в другую. А вот энергия при преобразованиях Лоренца меняется подобно тому, как меняется время, — как первая компонента 4-вектора. Известно, что у фотона масса равна нулю, поэтому E2 − p~2 = 0 c2

и его энергия с импульсом связаны друг с другом соотношением E = c| p~|, где | p~| — это модуль импульса, т. е. его длина. Здесь, вероятно, следует подчеркнуть, что материальным является любой объект, несущий энергию. Именно такие объекты могут двигаться только со скоростями, меньшими или равными скорости света. В то же время, если частица имеет нулевую массу, это не значит, что она не несёт энергии и импульса, как мы только что и увидели. Соотношение между энергией и импульсом для фотона известно из оптики в форме ~ ω = c|k|. Здесь k~ — волновой вектор, а ω = 2πν — циклическая частота электромагнитной волны или фотона. Если умножить последнее соотношение на постоянную Планка }h, то получим ~ }hω = c}h|k|, ~ — модуль его импульса. Тагде }hω — энергия фотона, а }h|k| ким образом, получается то же соотношение, что и между импульсом и энергией для безмассовой частицы. В конце, вероятно, стоит сказать, что формула E0 = mc2 , которая следует из специальной теории относительности, много-


§ 9. О смысле соотношения E0 = mc2

61

кратно проверена и уже давно имеет технологическое применение. Например, исходя из неё было предсказано выделение энергии в виде тепла при ядерных реакциях, что легло в основу принципа работы атомных электростанций. Это является ещё одним технологическим применением теории относительности.


ЛЕКЦ И Я 2 ОБЩАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ • • • • • • •

Об искривлении лучей света и принципе Ферма Об искривлении лучей света в присутствии Солнца Простейшие примеры искривлённых пространств Уравнения Эйнштейна и их решения Расширяющаяся Вселенная Гравитационные волны О некоторых свойствах чёрных дыр

На прошлой лекции мы познакомились с важным элементом общей теории относительности — общей ковариантностью, утверждающей, что законы физики и геометрия пространства-времени не зависят от выбора системы координат. При этом выбор произвольной, не обязательно ортонормированной координатной сетки в пространстве-времени Минковского, как правило, отвечает системе отсчёта, связанной с некоторым набором наблюдателей, которые двигаются произвольным образом — не обязательно по инерции. Ввиду технической сложности этого вопроса переход в неинерциальные системы отсчёта мы рассмотрим в конце этой лекции. Там же мы раскроем некоторые свойства чёрных дыр на основе физики и геометрии в системе отсчёта, которая двигается не по инерции, а под действием постоянной силы. Читатель, который избегает слишком сложных формул, может опустить изучение этого последнего параграфа, а о свойствах чёрных дыр может узнать, например, из брошюры одного из авторов этих лекций под названием «О рождении и смерти чёрных дыр». Там изложение менее формальное и более наглядное.


§ 1. Об искривлении лучей света и принципе Ферма

63

Итак, общая ковариантность утверждает, что законы физики не должны зависеть от того, как двигаются те, кто наблюдает за физическими явлениями, — по инерции или под действием силы. Это важный момент для данной лекции! Основным же предметом изучения теперь будет искривление пространства-времени. § 1. Об искривлении лучей света и принципе Ферма Ещё с I века нашей эры, со времён Герона Александрийского, известен принцип, который в общем виде был сформулирован Пьером Ферма в XVII веке. Он утверждает, что свет движется от одной точки пространства до другой с минимальной затратой времени. Здесь имеется в виду траектория фотона в пространстве, а не его мировая линия в пространстве-времени и обычное координатное время. Что такое мировая линия, мы рассказали на прошлой лекции. Этот принцип следует из наблюдений — из обобщения совокупности экспериментальных данных (в том смысле, о котором говорилось во введении). Принцип Ферма лежит в основе геометрической оптики и позволяет определять, например, законы преломления света при переходе из одной среды в другую — скажем, из воздуха в воду. Он является частным случаем более общего «принципа наименьшего действия», применимого также и к таким частицам, как электрон, которые имеют массу и двигаются медленнее, чем свет. Мы обсудим этот принцип немного более подробно на лекции по квантовой механике. Зачем нужен принцип Ферма в нашем рассказе об общей теории относительности? Из него следует, что если свойства среды не меняются (коэффициент преломления в ней всегда и везде постоянен), то луч света в этой среде будет прямым. Это вполне очевидно из общих соображений. Среда, обладающая подобными свойствами, называется однородной. Вакуум тоже обладает такими свойствами. Таким образом, в рамках механики Ньютона луч света, проходящий в пустоте даже рядом со звездой, будет прямым (мы пока забываем, что у Солнца есть корона, которая может преломлять свет, и вернёмся к этому вопросу позже).


64

Лекция 2. Общая теория относительности

Однако в литературе можно встретить следующее широко известное рассуждение. Рассмотрим частицу массы m, пролетающую в окрестности Солнца. Зная силу Ньютона | F~| = G

Mm , R2

массу Солнца M и полагая, что частица движется со скоростью света, можно посчитать, что угол отклонения её траектории вблизи поверхности звезды будет равен 0,800 — менее одной угловой секунды. (Понятно, что при увеличении расстояния от Солнца R угол отклонения будет меньше ввиду ослабления воздействия гравитационного поля на частицу.) Мы оставляем этот расчёт читателю в качестве сложного упражнения. Очень важно, что величина этого угла не зависит от массы частицы m, так как в гравитационном поле от неё не зависит и ускорение свободного падения. Величина угла отклонения определяется только тем, на каком минимальном расстоянии R от центра Солнца пройдёт частица. Таким образом, делается вывод, что величина угла отклонения должна быть той же и для фотона (частицы с нулевой массой) и луч света (т. е. траектория фотона) в пустоте в окрестности звезды должен искривиться на упомянутые выше 0,8 угловые секунды. Кроме того, иногда добавляется, что в соответствии с формулой Эйнштейна E0 = mc2 фотон имеет массу, пропорциональную его энергии. И якобы можно применять приведённое выше рассуждение для фотона, используя соответствующую массу. Однако здесь мы приходим к логическому противоречию с принципом Ферма, ведь в окрестности звезды среда однородна. Чтобы разрешить это противоречие, вспомним конец прошлой лекции. Формула E0 = mc2 связывает энергию частицы в сопутствующей системе отсчёта с её массой. Масса фотона равна нулю. Системы отсчёта, сопутствующей фотону, не существует, так как она не может двигаться со скоростью света. Фотон с нулевой энергией фактически означает ничто. В плоском пустом пространстве-времени фотон, имеющий энергию, от-


§ 1. Об искривлении лучей света и принципе Ферма

65

личную от нуля, несёт импульс и движется со скоростью c в любой инерциальной системе отсчёта. Итак, применять формулу Эйнштейна для определения «массы» фотона совершенно некорректно. Более того, одновременное использование релятивистской формулы Эйнштейна и нерелятивистской механики Ньютона напоминает попытку поженить ужа с ежом. Мы уже не говорим о том, что в пределах применимости классической физики луч света — это траектория пакета электромагнитных волн. Тогда возникает вопрос, что может искривлять движение пакета волн в рамках механики Ньютона. Более того, совершенно непонятно, что может заставить отклониться частицу с нулевой массой в рамках механики Ньютона, в которой и само существование такой частицы сомнительно. Если масса равна нулю, но есть приложенная сила, то чему тогда равно ускорение? При этом безмассовая частица в теории относительности смотрится совершенно естественно, как объяснялось в конце предыдущей лекции, а воздействию гравитационного поля подвергается всё, что несёт энергию. Понятие же трёхмерного вектора силы возникает только в нерелятивистском приближении, где безмассовых частиц не может существовать. Подобная чехарда с одновременным использованием нерелятивистских и релятивистских формул и понятий была простительна сто лет назад, когда теория только зарождалась. Но сейчас современному учёному необходимо чётко понимать пределы применимости каждой из обсуждаемых теорий. Итак, отклонение траектории массивной частицы в окрестности звезды совершенно не применимо к свету. Соответственно в рамках механики Ньютона свет в пустоте в окрестности звезды будет двигаться по прямой, в согласии с принципом Ферма. Из этого возникает вопрос, а бывает ли вообще в природе ситуация, в которой свет в вакууме движется не по прямой. Совокупность накопленных за почти сто лет опытных данных говорит о том, что такая ситуация действительно возникает и что в этом случае принцип Ферма (а точнее, принцип наименьшего действия) остаётся в силе и свет в пространстве-времени движется по кратчайшему пути. При этом


66

Лекция 2. Общая теория относительности

в искривлённом пространстве-времени кратчайший путь уже не обязательно является прямым. На то оно и искривлённое. § 2. Об искривлении лучей света в присутствии Солнца Можем ли мы увидеть искривление лучей света, не покидая Земли? Солнце, очевидно, имеет самое сильное гравитационное поле в своей окрестности из ближайших к нам небесных тел. Поэтому если действительно возникает искривление пространства-времени за счёт массы (энергии) небесных тел, то лучи света, идущие к нам от далёких звёзд мимо Солнца, должны искажаться сильнее всего (рис. 2.1).

Рис. 2.1. За счёт гравитации Солнца мы можем увидеть смещения образов звёзд из их стандартных положений. При этом чем ближе к гравитационному центру проходит луч, тем сильнее его искривление

Тогда, увидев, как сместятся звёзды из их стандартных положений в ночном небе (рис. 2.2), мы можем определить, искривляются или нет лучи света за счёт гравитации. Однако Солнце своим свечением сильно затрудняет наблюдение звёзд. Чтобы улучшить ситуацию, проводить наблюдение следует во время солнечного затмения, как показано на рис. 2.1 и на рис. 2.2. И это ещё не все сложности. Дело в том, что у Солнца есть корона, состоящая из плазмы частиц, находящихся в движении, — нечто вроде атмосферы Земли. У неё могут быть неоднородности, и её свойства меняются в зависимости от времени и места, поэтому коэффициент преломления света в солнечной короне может также меняться во времени и в пространстве вокруг звезды. Это, в свою очередь, приведёт к хаотическим отклонениям луча.


§ 2. Об искривлении лучей света в присутствии Солнца

67

Рис. 2.2. На этой фотографии изображены смещения видимого положения звёзд из их стандартных позиций за счёт искривления лучей света в какой-то момент времени. Таким образом, здесь показаны положения звёзд в окрестности Солнца

А именно, прежде чем попасть в телескоп, свет от звёзд проходит через корону (если идёт в самой окрестности Солнца) и через атмосферу Земли, т. е. фотоны двигаются не совсем в вакууме. Поэтому видимые положения звёзд могут смещаться за счёт преломления из-за изменений свойств среды. При этом подобное искажение лучей будет хаотичным — во всех направлениях, т. е. в реальности мы увидим не такую чистую картину, как изображена на рис. 2.2, а скорее нечто вроде рис. 2.3. Как уже говорилось во введении, это совершенно нормальная ситуация — никогда не бывает абсолютно чистых, изолированных явлений природы. В реальных экспериментах всегда присутствует так называемый фон. В данном случае фоновым будет искажение лучей света при прохождения через среду.


68

Лекция 2. Общая теория относительности

Рис. 2.3. Из-за прохождения лучей света через солнечную корону и атмосферу Земли в некоторый момент времени смещения звёзд могут показаться совершенно хаотическими. В следующий момент времени картина может оказаться несколько иной, но аналогичной

Чтобы как-то отличить сам эффект от фона, в нашем случае окрестность Солнца можно, например, разбить на концентрические узкие кольца, как показано на рис. 2.4. Для каждого из колец необходимо найти средний угол смещения всех видимых в нём звёзд, что позволит избавиться от хаотических разносторонних смещений для данных значений радиуса, которые очень мало отличаются друг от друга. А затем надо построить график, где по вертикали отложен средний угол отклонения в кольцах, а по горизонтали — радиусы колец. Если в результате исследования многих фотографий, сделанных в разные моменты времени, получится то, что изображено на рис. 2.5, то можно утверждать, что мы имеем дело с отклонением света за счёт гравитации Солнца, потому что именно такое поведение и предсказывает общая теория относительности. Заметим при этом, что искривление лучей света за счёт преломления зависит от его частоты, тогда как искривление за счёт гравитации от частоты не зависит.


§ 2. Об искривлении лучей света в присутствии Солнца

69

Рис. 2.4

Гравитация Солнца даже в окрестности его границы относительно слаба. Поэтому и отклонение лучей света небольшое, и насколько нам известно, точности даже ныне существующих телескопов не хватает, чтобы их измерить достаточно хорошо. Из рис. 2.5 видно, что совпадение теоретической кривой и экспериментальных точек далеко не идеально. Вероятно, специалист в данной области может нас поправить и указать на более точные и свежие результаты. Здесь также стоит подчеркнуть, что мы только очень схематично описали то, как в принципе можно измерить отклонение лучей света в окрестности Солнца. Из графика на рис. 2.5 нельзя точно утверждать, что прямо на радиусе Солнца отклонение луча будет равно 1,7500 , а не 0,800 . Первый угол предсказывает общая теория относительности для света, а второй — механика Ньютона для частиц любой массы, двигающихся со скоростью света. Однако можно точно утверждать, как видно из рис. 2.5, что лучи света действительно отклоняются. А в свете всего вышесказанного должно быть ясно, что это отклонение происходит именно из-за гравитации, а не по какой-то другой причине. Безусловно, мы не считаем, что само по себе отдельное описанное в этом параграфе наблюдение является доказательством того, что пространство-время может искривляться. Подтверждают общую теорию относительности не отдельные


70

Лекция 2. Общая теория относительности

1,4

= вес 1 = вес < 1

Угол отклонения (угловые секунды)

1,2 1,0 0,8 0,6 0,4 0,2 0

−0,2 

R (радиус Солнца) Рис. 2.5. При увеличении радиуса угол отклонения уменьшается, так как притяжение к гравитационному центру становится слабее. Сплошная линия — теоретическая кривая, а точки — экспериментальные данные

эксперименты, а вся совокупность накопленных за сто лет опытных данных, как мы объясняли во введении. Действительно, искривление лучей света — далеко не единственный наблюдаемый факт, подтверждающий эту теорию. Вероятно, здесь следует подчеркнуть, что отдельные экспериментальные подтверждения общей теории относительности, такие как, например, отклонение лучей света в окрестности Солнца и смещение перигелия Меркурия, можно объяснить, видоизменяя гравитационную силу Ньютона, например, добавляя к силе, убывающей как квадрат расстояния до источника 1/R2 , вклады, которые имеют маленькие коэффициенты и убывают как более высокие степени расстояния R, скажем, как 1/R3 или 1/R4 . Подбирая нужное количество членов и величины со-


§ 3. Простейшие примеры искривлённых пространств

71

ответствующих коэффициентов, можно добиться сколь угодно высокого согласия с экспериментальной кривой. Однако такие манипуляции сродни добавлению эпициклов в планетарной модели Птолемея. Они не приведут к более глубокому пониманию природы, а позволят лишь описать конкретные эксперименты, а не всю их совокупность. Они не имеют предсказательной силы, в то время как общую теорию относительности можно применять для описания не только Солнечной системы, но и других объектов во Вселенной, да и всей Вселенной в целом. Возвращаясь к основной теме этого параграфа, заметим в конце, что мы рассмотрели отклонение траектории фотонов в пространстве в присутствии Солнца. Отметим, что это искривление, очевидно, связано с кривизной соответствующих мировых линий в пространстве-времени и, следовательно, с искривлением пространства-времени, а не просто пространства. § 3. Простейшие примеры искривлённых пространств Чтобы освоиться с новым материалом, мы сначала обсудим простейшие искривлённые пространства, а затем приведём пример простейшего искривлённого пространства-времени. При этом искривление в окрестности таких тел, как звёзды, не является простым примером ввиду недостаточно большой симметрии. Мы же сначала расскажем о самых симметричных случаях. 3.1. Сфера Простейшим двумерным искривлённым пространством является сфера (рис. 2.6). Она, как и евклидова плоскость, является максимально симметричной. Хотя симметричность сферы и понятна интуитивно, мы поясним, что означает симметричность пространства с математической точки зрения, — нам это понадобится для дальнейшего рассказа в боR лее сложных ситуациях. Произвольную точку плоскости можно переместить сдвигом в любое другое положение на этой же плоскости. При таком Рис. 2.6


72

Лекция 2. Общая теория относительности

сдвиге плоскость перейдёт сама в себя. Далее, при вращениях плоскости вокруг перпендикулярной оси положение точки основания этой оси не меняется. При этом плоскость переходит сама в себя, а одно направление из выделенной точки можно перевести в любое другое. Таким образом, все точки на плоскости тождественны друг другу и все направления из каждой точки эквивалентны, что является следствием симметрии плоскости. Такая формулировка в абстрактной форме позволит нам находить более сложные симметричные пространства. Если вращать сферу вокруг произвольной оси, проходящей через её центр, но не содержащей выделенную точку, последнюю можно переместить в любое другое положение, подобрав подходящую ось и угол поворота. При вращении же сферы вокруг оси, проходящей через её центр и выбранную точку на ней, положение этой точки не меняется. Однако тогда одно направление из неё переходит в другое. При таких преобразованиях сфера опять переходит сама в себя. Итак, с математической точки зрения сфера является пространством с постоянной положительной кривизной — её радиус не меняется от точки к точке. И этот факт напрямую связан с описанными выше симметриями, так как свойства пространства не меняются от точки к точке и от направления к направлению. Сравните сферу, скажем, с пространством, изображённым на рис. 2.7, у которого кривизна не постоянна.

Рис. 2.7


§ 3. Простейшие примеры искривлённых пространств

73

(Мы пока не даём определения того, что такое кривизна, но интуитивно понятно, что у фигуры на рис. 2.7 она не постоянная ввиду отсутствия симметрий, а у сферы — постоянная.) Точно так же в математике плоскость считают пространством со всюду нулевой кривизной. Бывает также пространство с постоянной отрицательной кривизной — так называемое пространство Лобачевского. Оно тоже максимально симметрично. Его мы обсудим чуть ниже. Как определить знак кривизны, мы тоже объясним ниже. Продолжим наш рассказ о сфере рассмотрением кратчайших путей на ней. На плоскости кратчайшим путём между двумя точками будет соединяющий их отрезок прямой. Кратчайший путь называется геодезической. Какой будет геодезическая на сфере? А именно, вдоль какой кривой расположится тонкая резинка, если натянуть её между двумя точками на сфере? Или по какой кривой должен лететь самолёт из Москвы в Нью-Йорк, чтобы израсходовать меньше топлива? Рассмотрим две точки A и B на сфере (рис. 2.8). Возьмём плоскость, проходящую через них и центр сферы O. Плоскость высечет на этой сфере дугу большой окружности, которая подобна экватору и которая соединяет A и B, как изображено на рис. 2.8. Можно показать, что эта дуга и будет кратчайшим путём, или геодезической. Для строгого доказательства этого факта необходимо знание высшей математики. Мы же здесь лишь

BB BB B B O O O O O O

AA AA A A

Рис. 2.8


74

Лекция 2. Общая теория относительности

подчеркнём, что для такого доказательства достаточно показать, что при небольших отклонениях от обсуждаемой кривой её длина будет только увеличиваться. Именно поэтому резинке будет энергетически выгодно тянуться вдоль геодезической. 3.2. Параллельный перенос и кривизна Мы видим, что сфера не плоская, наблюдая за ней со стороны. А как убедиться, что пространство искривлено, если вы находитесь внутри него? В пространстве-времени можно использовать уже знакомое нам отклонение лучей света, но нет ли универсального способа определения искривления, который применим и в пространстве? Рассмотрим треугольник на плоскости, изображённый на рис. 2.9. Произведём так называемый параллельный перенос вектора вдоль рёбер этого треугольника: сначала из точки A в точку B, затем из B в C, а потом обратно — из C в A. A C BBB

Рис. 2.9

При параллельном переносе угол между вектором и кривой, вдоль которой производится перемещение, всё время остаётся одним и тем же, если эта кривая является геодезической. Доказательство этого факта для произвольного кривого пространства потребует знаний, далеко выходящих за рамки наших лекций, поэтому примем его за определение. Незнание доказательства не помешает нам увидеть разницу между плоским и кривым пространством. Действительно, из рис. 2.9 очевидно, что при параллельном переносе на плоскости вектор вернётся в своё начальное


§ 3. Простейшие примеры искривлённых пространств

75

положение. А именно, обратно в то же положение вернётся не только его начало, но и конец. Теперь перейдём к обсуждению ситуации на сфере. Возьмём сегменты трёх различных больших окружностей в качестве частей замкнутого треугольного пути на сфере, состоящего из отрезков геодезических (рис. 2.10). Пусть все эти сегменты будут перпендикулярны друг другу (заметим мимоходом, что сумма углов треугольника на сфере больше 180 градусов). Можно использовать и любой другой путь, который должен состоять из геодезических, но они не обязаны быть перпендикулярны друг другу. Однако, как станет ясно из дальнейшего, для наглядности мы выбрали именно такой путь, как на рис. 2.10. B

A

C

Рис. 2.10

Напомним, что при параллельном переносе угол между вектором и касательной к геодезической, вдоль которой осуществляется перенос, остаётся одним и тем же. Как видно на рис. 2.10, вектор не возвратится в своё начальное положение, а повернётся на 90 градусов. Именно этот факт связан с тем, что сфера искривлена, в отличие от плоскости. Для пути на сфере произвольного вида угол поворота вектора будет пропорционален площади треугольника, вдоль рёбер которого осуществляется перенос, делённой на радиус сферы в квадрате. Более того, можно показать, что и для произвольного искривлённого пространства такой угол будет зависеть от отношения площади треугольника к квадрату радиуса кривизны пространства, если треугольник небольшой. Действительно, обсуждаемый способ определения кривизны можно использовать


76

Лекция 2. Общая теория относительности

не только в двумерных пространствах, но и в пространстве-времени произвольной размерности и кривизны. В общем случае кривизна может плавно меняться от точки к точке, а для её определения необходимо использовать очень маленькие треугольники в окрестности каждой точки. Здесь стоит сделать два любопытных замечания. Во-первых, если сегмент дуги большой окружности на сфере является аналогом прямого отрезка на плоскости, то аналогом всей прямой является окружность целиком. Нетрудно видеть, что через две точки на сфере никогда нельзя провести две большие окружности так, чтобы они не пересекались. В этом состоит важное отличие геометрии на двумерной сфере от геометрии Евклида на плоскости. А именно, параллельных «прямых» на двумерной сфере вообще не бывает. Во-вторых, если увеличивать радиус сферы, но при этом не менять расстояние между точками A и B, то дуга окружности всё больше и больше будет походить на прямой отрезок, а сама область сферы вокруг этих точек — на область плоскости. И наоборот, если не менять радиус сферы, а уменьшать расстояние между точками A и B, то дуга всё больше будет напоминать прямой отрезок, а область вокруг точек — часть плоского пространства. Действительно, ведь на Земле мы практически не замечаем кривизны нашей планеты, потому что размер видимой области до горизонта намного меньше радиуса Земли. Обобщим эти рассуждения: искривлённое пространство любой размерности и любой кривизны в достаточно малой области вокруг любой своей точки выглядит приблизительно плоским. Аналогично и искривлённое пространство-время в достаточно малой окрестности любой своей точки выглядит почти как пространство-время Минковского. И соответственно физика в такой малой области описывается в хорошем приближении специальной теорией относительности. При этом чем меньше окрестность, тем сильнее совпадение. В сущности эти наблюдения в том числе описывают то приближение, в котором уравнения общей теории относительности переходят в уравнения специальной теории относительности. В связи с этим введём новое обозначение. Как известно, расстояние между двумя точками, например на евклидовой


§ 3. Простейшие примеры искривлённых пространств

77

плоскости, вычисляется следующим образом: 2 ∆l𝐴𝐵 = ∆x 2 + ∆ y 2 ,

где ∆x = x𝐵 − x𝐴 , ∆ y = y𝐵 − y𝐴 .

Данная формула определяет длину прямого отрезка между точками A и B при сколь угодно большом расстоянии от A до B. В искривлённом же пространстве прямого длинного отрезка, соединяющего две точки, может и не быть. При этом в очень маленькой области пространства, размеры которой много меньше кривизны пространства, всегда можно построить практически прямой отрезок. Поэтому в дальнейшем мы будем писать формулы для очень коротких отрезков и вместо ∆x и ∆ y будем использовать обозначения dx и dy. Соответственно в декартовых координатах на плоскости длина очень короткого прямого отрезка, соединяющего точки (x, y) и (x + dx, y + dy), в новых обозначениях будет выглядеть так: dl 2 = dx 2 + dy 2 . Пока это лишь новое обозначение. Для дальнейшего важным является то, что речь идёт об отрезке, очень маленьком по сравнению с радиусом кривизны в окрестности точки (x, y). Формулы для длин очень коротких отрезков в кривых пространствах мы будем записывать в аналогичных обозначениях, но их явные выражения будут, конечно, отличаться от формулы для прямого отрезка в плоском пространстве. 3.3. Гиперболоид Лобачевского Перейдём к рассмотрению пространства Лобачевского. Обычно, представляя себе двумерную сферу, мы воображаем её помещённой в трёхмерное евклидово пространство, даже если не осознаём этого. Это представление отвечает тому, что двумерную сферу радиуса R можно задать как множество концов всевозможных векторов (X , Y, Z) длины R, т. е. это все такие значения X , Y и Z, что X 2 + Y 2 + Z 2 = R2 . Речь здесь идёт о векторах обычного трёхмерного евклидова пространства, метрика которого имеет стандартный и уже


78

Лекция 2. Общая теория относительности

хорошо знакомый нам вид dl 2 = dX 2 + dY 2 + dZ 2 . (Что такое метрика и евклидово пространство, мы обсудили в § 2 лекции 1.) По аналогии трёхмерная сфера радиуса R — это множество концов векторов (X , Y, Z, W ) четырёхмерного евклидова пространства с метрикой dl 2 = dX 2 + dY 2 + dZ 2 + dW 2 , длина которых равна R: X 2 + Y 2 + Z 2 + W 2 = R2 . В том же духе можно определить сферу произвольной размерности. С этой точки зрения окружность будет одномерной сферой, которая определяется как множество точек, удовлетворяющих соотношению X 2 + Y 2 = R2 и помещённых в двумерное пространство с метрикой dl 2 = dX 2 + dY 2 . Это вопрос не терминологический, а концептуальный, поскольку тогда окружность укладывается в некоторый класс пространств, все представители которого имеют некоторые общие свойства. Здесь мы имеем простейший пример ситуации, когда целесообразно иметь единый взгляд на, казалось бы, разные объекты. Учёные часто пользуются подобными обобщениями. Возможно, читатель и не заметил, но выше мы тоже в той или иной форме пользовались подобными обобщениями, только несколько более абстрактными. Приведённый здесь пример является лишь одним из простейших случаев подобной аргументации. Поэтому именно здесь, воспользовавшись случаем, мы решили подчеркнуть этот важный момент. Ведь нередко неискушённый читатель, теряя понимание, может узреть в подобных действиях «подмену логики». Однако никакого нарушения логики в этом нет, и, как мы только что увидели, даже математики используют этот подход. В конце концов, как утверждал Анри Пуанкаре, научное развитие проявляется


§ 3. Простейшие примеры искривлённых пространств

79

не столько в дедуктивной аргументации, сколько именно в индуктивном обобщении. И в момент такого обобщения просто требуется несколько более высокий уровень абстракции, чем был использован до данного момента. Аналогичным образом двумерное пространство Лобачевского проще всего представить как поверхность, вложенную в трёхмерное пространство-время Минковского. А именно, если оно имеет радиус R, то его можно задать как множество всех таких точек с координатами X , Y и Z, что Z 2 − X 2 − Y 2 = R2 .

(2.1)

При этом (X , Y, Z) являются компонентами вектора в трёхмерном пространстве-времени с метрикой ds2 = dZ 2 − dX 2 − dY 2 ,

(2.2)

а не в евклидовом пространстве, как в случае сферы. Подчеркнём, что это хорошо уже нам известное трёхмерное пространство-время Минковского, в котором мы обозначили буквой Z временну́ю координату, умноженную на скорость света, т. е. ct. Фигура, заданная уравнением (2.1), является так называемым двуполостным гиперболоидом (рис. 2.11). Действительно, Z

X

Y

Рис. 2.11. Двуполосный гиперболоид Лобачевского, вложенный в трёхмерное пространство-время


80

Лекция 2. Общая теория относительности

её сечения плоскостями с постоянной координатой Z — это окружности X 2 + Y 2 = Z 2 − R2 , ведь при фиксированном Z и при изменении X и Y конец вектора (X , Y, Z) описывает именно окружность, лежащую в плоскости (X , Y ). Радиус такой окружности растёт с увеличением модуля Z. Из уравнения следует, что фигура определена, когда Z > R или Z < −R, поскольку квадрат радиуса окружности не может быть меньше нуля. Поэтому пространство Лобачевского — это одна из частей двуполосного гиперболоида, скажем та, что отвечает неравенству Z > R, т. е. верхняя половина фигуры, изображённой на рис. 2.11. Сечение фигуры, заданной уравнением (2.1), плоскостями с постоянной координатой X — это гиперболы: Z 2 − Y 2 = R2 + X 2 . Действительно, как следует из этого уравнения, при фиксированном X конец вектора (X, Y, Z) описывает гиперболу, лежащую в плоскости (Y , Z). (Гиперболы и задающие их уравнения мы обсуждали на первой лекции.) Аналогично можно показать, что сечения гиперболоида плоскостями с постоянной координатой Y — это тоже гиперболы, лежащие на плоскости (X, Z). Гиперболоид Лобачевского является именно пространством, а не пространством-временем. При этом, в отличие от сферы, он вложен в трёхмерное пространство-время Минковского, а не в пространство Евклида. Действительно, если рассмотреть световой конус с вершиной в любой точке этого гиперболоида, то можно показать, что он целиком будет находиться вне этого конуса, как изображено на рис. 2.12, т. е. любой вектор, касательный к гиперболоиду, имеет наклон больше 45 градусов по отношению к оси времени Z. А это значит, что любые две его точки соединяются пространственно-подобными линиями, лежащими целиком внутри гиперболоида. Иными словами, для любого сегмента этих линий верно, что ds2 < 0, и, более того, на гиперболоиде нет ни времениподобных линий (ds2 > 0), ни свето-подобных линий (ds2 = 0). И наконец, пространство Лобачевского имеет постоянную кривизну, потому что является максимально симметричным в том же смысле, что сфера и плоскость. Сейчас мы это покажем.


§ 3. Простейшие примеры искривлённых пространств

81

Z

Y

X Рис. 2.12

Уравнение (2.1), задающее наше пространство, и метрика, определённая уравнением (2.2), не меняются при всевозможных комбинациях преобразований Лоренца в плоскостях (Z, X ) и (Z, Y ) и вращений в плоскости (X , Y ). Мы показали это на лекции 1 для разных частей формул (2.1) и (2.2). Теперь лишь надо обобщить факты, верные для разных двумерных плоскостей, на всё трёхмерное пространство-время. Нетрудно видеть, что последовательными преобразованиями Лоренца в плоскостях (Z, X ) и (Z, Y ), а затем вращениями в плоскости (X , Y ) точку (X , Y, Z) = (0, 0, 1) можно переместить в любое другое положение на гиперболоиде. При этом при вращениях в плоскости (X , Y ) положение точки (X , Y, Z) = (0, 0, 1) не изменяется, а направления из неё переходят друг в друга. Чтобы наглядно убедиться, что то же самое верно для любой другой точки на гиперболоиде, её нужно переместить в положение (0, 0, 1) движениями симметрии. Из предыдущего абзаца следует, что при всех этих преобразованиях гиперболоид переходит сам в себя. Итак, в пространстве Лобачевского, аналогично ситуации на сфере и на плоскости, любая его точка переводится преобразованиями симметрии в любую другую. То же самое верно для любого направления из каждой точки. Отличаются


82

Лекция 2. Общая теория относительности

только типы преобразований для всех трёх перечисленных пространств — плоскости, сферы и гиперболоида. Это значит, что любая точка на гиперболоиде неотличима от любой другой, а также и любое направление из произвольной точки неотличимо от любого другого направления из этой же точки. Таким образом, свойства обсуждаемого пространства не зависят от выбора точки на нём. В том числе это утверждение верно и для его кривизны. Можно понять, что кривизна пространства Лобачевского, будучи, в силу симметрии, одной и той же в любой его точке, не может быть такой же, как у сферы. Иначе гиперболоид и сфера были бы идентичны друг другу, что невозможно, ведь у гиперболоида Лобачевского площадь бесконечна, а у сферы конечна. Математическое определение знака кривизны устроено следующим образом. Чтобы найти этот знак у симметричного пространства, нужно из суммы углов любого треугольника, построенного по геодезическим, вычесть 180 градусов. Если результат равен нулю, то пространство плоское, если больше нуля, то это сфера, а, если меньше, то это гиперболоид Лобачевского. Радиус же кривизны — величина по определению всегда положительная. Далее, можно показать, что геодезическая на гиперболоиде Лобачевского находится аналогично тому, как это делалось на сфере. А именно, чтобы найти кратчайшую кривую, соединяющую две точки (скажем, A и B) на гиперболоиде, надо (как и в случае сферы) провести плоскость, проходящую через эти точки и начало координат, в объемлющем трёхмерном пространстве-времени. Такая плоскость и высечет на гиперболоиде искомую кривую, как изображено на рис. 2.13. Эта кривая будет сегментом гиперболы между A и B, целиком лежащим в пространстве Лобачевского. Таким образом, гипербола в пространстве Лобачевского является аналогом обычной прямой на плоскости. Можно показать, что через точку на гиперболоиде получится провести бесконечно много гипербол, которые не будут пересекаться с заданной гиперболой, не содержащей эту точку, т. е. все они будут удовлетворять условию параллельности. Это является одним из знаменитых свойств двумерной геометрии Лобачевского, отличающих её от евклидовой и геометрии на двумерной сфере.


§ 3. Простейшие примеры искривлённых пространств

A

83

B

O

Рис. 2.13

В заключение заметим, что аналогично тому, как мы получили многомерную сферу, можно определить и многомерное пространство Лобачевского. Например, трёхмерный случай — это множество концов векторов (X , Y, Z, W ) четырёхмерного пространства-времени Минковского: ds2 = dW 2 − dZ 2 − dX 2 − dY 2 , длина которых равна R: W 2 − Z 2 − X 2 − Y 2 = R2 . Аналогично ситуации с окружностью и сферами разной размерности полученные результаты обобщаются и на произвольное измерение (включая одномерную гиперболу). 3.4. Пространство-время де Ситтера Перейдём теперь к обсуждению простейшего (максимально симметричного) искривлённого двумерного пространства-времени. Оно называется гиперболоидом де Ситтера. Рассмотрим гиперболоид, заданный уравнением Z 2 − X 2 − Y 2 = −R2 вместо уравнения (2.1), который помещён в то же пространство Минковского с метрикой, определённой в уравнении (2.2). Он


84

Лекция 2. Общая теория относительности

Z

Y

X

Рис. 2.14. Однополостный гиперболоид де Ситтера

изображён на рис. 2.14. Действительно, сечения этой фигуры плоскостями с постоянной координатой Z — это окружности X 2 + Y 2 = Z 2 + R2 , радиус которых растёт с ростом модуля Z. Минимальный радиус R имеет окружность, лежащая в плоскости Z = 0. Сечения же этого гиперболоида, например, плоскостями с постоянной координатой X — это гиперболы, уравнение которых имеет вид Y 2 − Z 2 = R2 − X 2 . Заметьте, как меняются свойства и рисунки этих гипербол в зависимости от того выполняется ли неравенство |X | < R или |X | > R. То же верно и для сечений плоскостями с постоянной координатой Y. Рассуждая так же, как и выше, можно показать, что у обсуждаемого пространства-времени постоянная кривизна. Разбор этого факта тем же способом, что был применён выше дважды (для сферы и гиперболоида Лобачевского), мы оставляем читателю в качестве упражнения. Объясним теперь, почему гиперболоид де Ситтера — это именно пространство-время, а не пространство, как гиперболоид Лобачевского. Можно показать, что геодезические в нём


§ 3. Простейшие примеры искривлённых пространств

85

тоже получаются путём его сечения плоскостями, проходящими через начало координат объемлющего пространства-времени, как изображено на рис. 1 (см. вклейку). Геодезические на рассматриваемом гиперболоиде могут быть сегментами как эллипсов, так и гипербол или даже прямых (рис. 1 на вклейке). Действительно, как изображено на рис. 2 (см. вклейку) и как можно увидеть, взглянув на радиобашню Шухова в Москве у станции метро Шаболовская, гиперболоид заметается вращением в трёхмерном пространстве прямой вокруг оси, которая ей не параллельна и не пересекает её. Последняя и является осью симметрии гиперболоида. При этом вращающуюся прямую можно наклонить как в одну, так и в другую сторону, а гиперболоид получится тот же, если наклон в обе стороны произведён на одинаковый угол при неизменном радиусе вращения. В башне Шухова используются как раз отрезки прямых, наклонённых в обе стороны. Тут, однако, следует уточнить, что, во-первых, гиперболоид де Ситтера заметается в результате вращения прямой, наклонённой по отношению к вертикальной оси именно на угол 45 градусов, а не на произвольный угол. Во-вторых, в отличие от башни Шухова, гиперболоид де Ситтера погружён в трёхмерное пространство-время, а не в пространство. Ну и конечно, он продолжается бесконечно вверх и вниз по оси Z. Прямые, которые целиком лежат на гиперболоиде, являются свето-подобными, т. е. для любого отрезка на них ds2 = 0. Они ведь являются таковыми в объемлющем пространстве-времени, так как наклонены по отношению к вертикальной оси на 45 градусов. Тогда можно показать, что вдоль любого сегмента эллипса, изображённого на рис. 1 (см. вклейку), выполнено неравенство ds2 < 0, а вдоль сегмента гиперболы — неравенство ds2 > 0. Ведь чтобы получить из прямой эллипс или гиперболу, мы лишь меняем угол наклона плоскости сечения по отношению к оси времени в сторону увеличения или уменьшения соответственно. Таким образом, на гиперболоиде де Ситтера есть пространственно-подобные, времени-подобные, а также и свето-подобные интервалы, т. е. он действительно является именно пространством-временем, а не пространством, в отличие от гиперболоида Лобачевского.


86

Лекция 2. Общая теория относительности

Наконец, по аналогии с многомерной сферой и многомерным пространством Лобаческого можно представить и многомерное пространство-время де Ситтера. Например, трёхмерный случай — это гиперболоид W 2 − Z 2 − X 2 − Y 2 = −R2 , вложенный в четырёхмерное пространство-время Минковского: ds2 = dW 2 − dZ 2 − dX 2 − dY 2 . Здесь роль координаты времени, умноженной на скорость света, играет W. Сечения этого гиперболоида при постоянных значениях W — это двумерные сферы: Z 2 + X 2 + Y 2 = W 2 + R2 . Более подробное изучение свойств этого пространства, которые аналогичны свойствам сферы и пространства Лобачевского, мы оставляем читателю в качестве упражнения. § 4. Уравнения Эйнштейна и их решения До сих пор в физически значимых для темы этой лекции ситуациях мы рассматривали свето-подобные или времени-подобные геодезические в заданном пространстве-времени. Это необходимо, например, для сравнения движения частиц в этих пространствах с наблюдениями и экспериментами. Иными словами, пространство-время было фиксировано как сцена (фон), на которой происходит некоторая динамика, например движение частиц. При этом не обсуждалось, что и почему искривляет пространство-время. Основное нововведение общей теории относительности заключается именно в том, что пространство-время не является обычным фоном, а тоже динамически меняется, т. е. ведёт себя аналогично тому, как, например, электромагнитное поле. Что такое поле, мы обсудим подробнее в следующем параграфе, сейчас же подчеркнём, что полями в случае теории гравитации являются так называемые компоненты метрики — те функции от координат и времени, которые умножаются на dt 2 , dx 2 , dt dx и т. д. в выражении для ds2 : ds2 = f1 (t, x, y, z) dt 2 + f2 (t, x, y, z) dx dt + f3 (t, x, y, z) dx 2 + . . .


§ 4. Уравнения Эйнштейна и их решения

87

Рис. 2.15

А именно, здесь в качестве полей мы рассматриваем функции f1 (t, x, y, z), f2 (t, x, y, z), f3 (t, x, y, z), а также функции, которые стоят перед dt dx, dy dz и т. д. и обозначены в последней формуле многоточием. Иначе эти функции называются компонентами метрики. Они аналогичны компонентам векторов электрического и магнитного полей. Для работы со столь громоздкими выражениями, как в последней формуле, учёные разработали специальный аппарат — тензорный анализ, который выходит далеко за рамки нашего курса. Мы его упоминаем, чтобы читатель знал, в каком направлении двигаться для углубления своего понимания обсуждаемого предмета. Сравните выражение в последней формуле с видом метрики в неортогональных координатах на плоскости, которые обсуждались на лекции 1. Важное отличие нового случая заключается в том, что компоненты метрики f1 , f2 , f3 и т. д. больше не являются постоянными, а зависят от координат пространства-времени. Дело в том, что на лекции 1 мы рассматривали линейную замену координат в плоском пространстве. В случае же искривлённого пространства в окрестности разных его точек координатная сетка может быть перекошена различным образом, что и отражается на зависимости компонент метрики от координат. Для иллюстрации на рис. 2.15 мы показываем рядом перекошенные прямолинейные координаты на плоскости и координатную сетку на искривлённом двумерном пространстве. 4.1. Поле С понятием поля мы начнём знакомиться с помощью простой аналогии. Рассмотрим одномерную цепочку шариков одинаковой массы m, соединённых пружинами с оди-


88

Лекция 2. Общая теория относительности k

m 2

k

m

k

3

m 4

k

m 5

Рис. 2.16

наковыми коэффициентами Гука k. Пусть для простоты шарики могут колебаться только в одном направлении — вдоль цепочки (рис. 2.16), а концы цепочки закреплены. Эта модель является механической идеализацией одномерной кристаллической решётки атомов. Мы обсуждаем одномерную цепочку, а не двумерный батут или трёхмерный матрас лишь из соображений большей наглядности. Подчеркнём, что всё, что сказано ниже в этой части лекции, верно для большой решётки. В положении равновесия все шарики находятся на одинаковом расстоянии друг от друга. Пусть теперь кто-то рукой плавно потянет за один из них, возмутив тем самым решётку. Установится новое равновесие, в котором все пружины с одной стороны от смещённого шарика сожмутся (в той или иной степени), а с другой — растянутся. Если для каждого из шариков задано смещение из положения равновесия, то перед нами некоторый аналог поля. А именно, роль поля здесь играет полный набор величин φ𝑖 (t) для всех значений индекса i, где φ𝑖 (t) — это смещение шарика под номером i из положения равновесия в момент времени t. В случае постоянной силы, приложенной к одному из шариков, очевидно, что все φ𝑖 не зависят от времени, и получается статическое, т. е. не меняющееся во времени, поле. Оказывается, аналогичным образом покоящийся электрический заряд возмущает электромагнитное поле, а покоящаяся масса возмущает гравитационное поле. А именно, заряд и масса создают статические потенциальные поля Кулона и Ньютона соответственно. Аналогия будет более полной (но, безусловно, не абсолютной), если рассмотреть трёхмерную решётку, или, как мы её назвали выше, «матрас». Пусть теперь кто-то другой плавно потянет ещё какой-нибудь шарик в решётке. Тот, кто тянул первый шарик, почувствует дополнительную силу притяжения или отталкивания от второго места приложения руки в зависимости от того, с какой


§ 4. Уравнения Эйнштейна и их решения

89

стороны и в каком направлении по отношению к исходному смещению был передвинут второй шарик. Эта сила аналогична силам Кулона и Ньютона, возникающим между двумя зарядами или массами. Аналогия была бы точнее, если бы мы рассматривали трёхмерную решётку. А именно, можно показать, что в трёхмерном случае такая сила тоже убывает по величине как обратный квадрат расстояния между шариками, к которым приложено внешнее воздействие. И направлена она вдоль соединяющей их прямой. Здесь существенно, что мы обсуждаем ситуацию, в которой происходят очень маленькие смещения из положения равновесия и шарики, к которым приложены внешние воздействия, находятся очень далеко друг от друга. Если теперь кто-то из тех двоих, кто тянет шарики в решётке, резко сместит положение своей руки, то другой почувствует это не мгновенно, а только когда до него дойдёт волна возмущения. Это явление — аналог звуковой или упругой волны в кристалле, а также электромагнитных и гравитационных волн, которые рождаются двигающимися электрическими зарядами или массами соответственно. И электромагнитные, и гравитационные волны описываются уравнениями, похожими на те, что задают волны в трёхмерном кристалле, хотя они и являются возмущениями не решётки, а электромагнитных или гравитационных полей. Чтобы не быть голословными, давайте попробуем превратить приведённые выше рассуждения в формулы, которые окажутся полезными в дальнейшем. Уравнение второго закона Ньютона для шарика под номером i изображённой на рис. 2.16 решётки имеет вид m

d 2 φ𝑖 = k[φ𝑖+1 − φ𝑖 ] − k[φ𝑖 − φ𝑖−1 ]. dt 2

(2.3)

В его левой части стоит масса, умноженная на ускорение для i-го шарика. Ускорением является скорость изменения скорости, т. е. так называемая вторая производная d 2 φ𝑖 /dt 2 . В правой части уравнения (2.3) стоят две силы, действующие на шарик, — от левой и правой пружин. В положении равновесия и без внешних воздействий на решётку эти силы равны нулю, так как все φ𝑖 равны 0. Напомним, что φ𝑖 — это величина смещения i-го шарика из положения его равновесия.


90

Лекция 2. Общая теория относительности

Отметим, что (2.3) — это на самом деле не одно уравнение, а система уравнений, пронумерованная индексом i. Если в цепочке N шариков, то индекс пробегает значения от 1 до N и система (2.3) содержит N уравнений. При этом пружин в решётке N + 1 и крайние пружины имеют закреплённые внешние концы, как мы условились выше. Обсудим теперь так называемый непрерывный предел для этой решётки. А именно, представим себе, что количество шариков и пружин растёт, а расстояние между ними и их размеры уменьшаются, но общая длина цепочки остаётся неизменной. При этом будем рассматривать динамику волн в обсуждаемом одномерном кристалле, амплитуда |φ𝑖 | которых очень мала, а длина в сравнении с расстоянием между шариками, наоборот, очень велика. Уравнения, описывающие именно такие волны, не будут зависеть от тонкой структуры нашей решётки. Динамика очень коротких волн или волн с очень большими амплитудами обязательно будет чувствительной к этой структуре. Чтобы пояснить смысл непрерывного предела, подчеркнём, что любой реальный кристалл является однородным упругим телом. При этом звуковые и упругие волны в нём — это колебания плотности, которые практически не чувствительны к его кристаллической структуре. Именно волны такого типа, имеющие маленькую амплитуду и большую длину, и не способны разрушить или даже сильно деформировать кристалл. Итак, в непрерывном пределе φ𝑖 (t) переходит в φ(t, x), так как индекс i, пробегающий только целочисленные значения, теперь становится непрерывной координатой x, которая пробегает все действительные числа. Именно поэтому данный переход называется непрерывным пределом. Теперь φ(t, x) — это смещение из положения равновесия в момент времени t на величину |φ(t, x)| того сегмента рассматриваемого упругого тела, который находится между точками x и x + dx. Иными словами, φ(t, x) имеет смысл самого настоящего поля, которое в данном случае описывает упругие деформации тела в момент времени t в окрестности точки, имеющей координату x. Далее, в непрерывном пределе φ𝑖+1 (t) − φ𝑖 (t) переходит в φ(t, x + dx) − φ(t, x), что, в свою очередь, приблизительно


§ 4. Уравнения Эйнштейна и их решения

91

равно (∂φ(t, x)/∂x) dx, если воспользоваться тем, что dx — очень маленький отрезок, и вспомнить смысл и определение производной ∂φ(t, x)/∂x. Это выражение называется частной производной поля φ(t, x) по координате x. Она вычисляется при постоянном t и означает скорость изменения φ(t, x) с изменением только x. Иногда ∂φ(t, x)/∂x называют скоростью измерения или градиентом функции φ(t, x) вдоль направления x. Чтобы отличить частную производную от обычной, её обозначают с использованием значка ∂, а не d. Таким образом, уравнения, описывающие динамику шариков, принимают следующий вид: h i ∂2 φ(t, x) ∂φ(t, x) ∂φ(t, x − dx) ∂2 φ(t, x) m = k − dx = k dx 2 . 2 2 ∂t

∂x

∂x

∂x

Здесь ∂φ(t, x)/∂t — частная производная поля φ(t, x) по времени t. Она определяет скорость изменения φ(t, x) при изменении t, но при фиксированном значении x, или так называемый градиент вдоль направления t. Соответственно, ∂2 φ(t, x)/∂t 2 — это вторая частная производная по времени, или ускорение, которое тоже вычисляется при фиксированном x. Аналогично ∂2 φ(t, x)/∂x 2 — это вторая частная производная по x. Для упругих тел отношение m/(k dx 2 ), которое мы обозначим как 1/v 2 , остаётся конечным в непрерывном пределе, при том, что dx является очень маленькой величиной. Здесь v, как нетрудно видеть, имеет размерность скорости. Как мы сейчас увидим, это не что иное, как скорость звука в рассматриваемой кристаллической решётке. Таким образом, из уравнения (2.3) в непрерывном пределе мы получаем так называемое волновое уравнение: 2 2 1 ∂ φ(t, x) ∂ φ(t, x) − = 0. 2 2 v ∂t ∂x 2

(2.4)

Оно описывает изменение поля в пространстве и времени, т. е. его динамику. В обсуждаемом уравнении фигурирует ускорение изменения поля во всех направлениях во времени и пространстве, в данном случае в одномерном пространстве, так как мы стартовали с одномерной решётки. Решениями такого уравнения являются волны, в данном случае звуковые волны в кристалле.


92

Лекция 2. Общая теория относительности

Мы обсудим волны и их свойства более подробно на лекции 3, посвящённой квантовой механике. Сейчас же будет рассказано о некоторых их свойствах, которые понадобятся нам далее на этой лекции. Нетрудно показать, что решением уравнения (2.4) является, например, следующая функция: φ(t, x) = A cos[k(vt − x)]. Для этого надо вычислить вторую производную функции φ(t, x) по t при фиксированном x, поделить на v 2 , а затем вычесть из неё вторую производную по x при фиксированном t. Получится нуль, т. е. уравнение (2.4) действительно выполняется для обсуждаемой функции. В последней формуле A — некоторая константа, являющаяся её амплитудой. Эта функция определяет волну, двигающуюся в сторону увеличения x со скоростью v. Действительно, гребни косинуса, положение которых задаётся уравнением k(vt − x) = . . . − 2π, 0, 2π, 4π, . . ., смещаются в сторону увеличения x по мере увеличения t, чтобы оставалось верным последнее равенство. Здесь k — так называемый волновой вектор, который определяет длину волны. Это можно увидеть, решив последнее уравнение относительно x при данном t для двух ближайших гребней и найдя расстояние между ними. Из этих рассуждений следует, что длина волны равна 2π/k. Аргумент косинуса, т. е. k(vt − x), называется фазой волны. Далее, синус того же аргумента k(vt − x) описывает волну, двигающуюся в том же направлении, но её гребни смещены (говорят, что они сдвинуты по фазе) в сравнении с волной, отвечающей косинусу, так как π cos ϕ + = − sin ϕ. 2

А вот функции φ(t, x) = A cos[k(vt + x)]

или

φ(t, x) = A sin[k(vt + x)],

которые тоже решают волновое уравнение (2.4), уже описывают волны, двигающиеся в обратном направлении — в сторону уменьшения x.


§ 4. Уравнения Эйнштейна и их решения

93

Более того, буквально все эти функции также являются плоскими волнами и в чЕТЫРЁХМЕРНОМ пространстве-времени, т. е. они оказываются такими решениями четырёхмерного аналога уравнения (2.4), 2 2 2 2 1 ∂ φ(t, x, y, z) ∂ φ(t, x, y, z) ∂ φ(t, x, y, z) ∂ φ(t, x, y, z) − − − =0, v2 ∂t 2 ∂x 2 ∂ y2 ∂z2

которые не зависят от координат y и z. Подобные волны называются плоскими, потому что их фронт представляет собой всю плоскость ( y, z), ведь они зависят только от t и x. Безусловно, это лишь идеализация реальных волн, которые, как правило, имеют практически точечные источники и поэтому их форма скорее близка к сферической, чем к плоской. Ситуация здесь аналогична кругам на поверхности воды от упавшего камня, но только в последнем случае всё происходит в трёхмерном пространстве. Если же мы находимся очень далеко от источника сферических волн, то, когда их сферический фронт доходит до нас, он имеет настолько огромный радиус, что с хорошей точностью в окрестности нашего приёмника волну можно считать плоской. Обратите внимание, какую форму имеют волны, набегающие на берег моря. Они фактически плоские, ведь их фронт занимает всю линию берега, хотя их источник и является практически точечным — его размер, как правило, намного меньше расстояния от него до берега. В завершение посмотрим, как изменятся уравнения (2.3) и (2.4), если на шарики действуют какие-то внешние силы. При наличии внешних сил уравнение (2.3) принимает следующий вид: m

d 2 φ𝑖 − k[φ𝑖+1 − φ𝑖 ] + k[φ𝑖 − φ𝑖−1 ] = F𝑖 (t), dt 2

где F𝑖 (t) — сила, действующая на i-й шарик в момент времени t. Когда, например, кто-то тянет только за шарик под номером 8 с постоянной силой, то F𝑖 (t) равна нулю для всех i, кроме i = 8, и в этом случае F8 не зависит от времени. Теперь нетрудно догадаться, что в непрерывном пределе в ситуации с произвольными внешними силами, приложенными к каждому шарику, уравнение (2.4) принимает вид 2 2 1 ∂ φ(t, x) ∂ φ(t, x) − = F(t, x), 2 2 v ∂t ∂x 2

(2.5)


94

Лекция 2. Общая теория относительности

где F(t, x) уже называется источником, а не силой. Такова стандартная терминология. 4.2. Электромагнитное поле и частицы Оказывается, электромагнитные волны являются решениями похожих на (2.5) уравнений. Сформулированы они были Максвеллом. В них вместо скорости звука v входит скорость света c, а вместо двух измерений четыре. При этом вместо поля φ в уравнениях стоят, например, компоненты векторов электрического или магнитного полей. В присутствии заряда уравнения Максвелла будут похожи на уравнения (2.5), где вместо F(t, x) будет стоять некоторая величина, характеризующая электрические токи и заряды. Если заряд покоится, то и соответствующие уравнения с постоянной правой частью имеют не зависящие от времени решения. Примером такой ситуации как раз и является поле Кулона, как было рассказано выше. Если же источник поля зависит от времени (двигающийся заряд), то он может создавать волны. Таким образом, задача, которую решает классическая электродинамика, в идеале имеет следующую постановку. Есть замкнутая система зарядов, которые создают какие-то электромагнитные поля. Эти поля, в свою очередь, действуют на сами заряды и заставляют их двигаться. При этом требуется найти траектории частиц и определить, как меняются поля в пространстве и во времени. В словесной форме уравнения Максвелла были исходно сформулированы Фарадеем как результат экспериментальных открытий, сделанных им самим и другими учёными. В самой краткой форме эти уравнения звучат так. Ускорения изменения электромагнитных полей в пространстве и во времени определяются токами, созданными двигающимися зарядами. Такие уравнения являются аналогами уравнения (2.5). На всякий случай ещё раз подчеркнём, что это очень упрощённый взгляд на реальную ситуацию. Чтобы замкнуть систему, необходимо добавить уравнения, которые определяют действие полей на заряды. Последние


§ 4. Уравнения Эйнштейна и их решения

95

являются релятивистскими обобщениями уравнения Ньютона, содержащими так называемую силу Лоренца. Скорость изменения импульса заряженной частицы определяется так называемой силой Лоренца, которая является результатом действия на частицу электромагнитных полей, созданных другими зарядами в системе. Простейшим нерелятивистским примером такого уравнения является второй закон Ньютона, если сила в нём имеет электромагнитное происхождение, т. е., например, F~ = e E~, где e — это заряд частицы, а E~ — электрическое поле, в котором он находится. 4.3. Уравнения для гравитационных полей Аналогично можно схематично сформулировать и уравнения Эйнштейна для гравитации в рамках общей теории относительности: Кривизна пространства-времени определяется энергией, которую несут объекты, в него помещённые. Оказывается, при этом кривизна пространства-времени зависит от ускорения изменения компонент метрики f1 (t, x, y, z), f2 (t, x, y, z), f3 (t, x, y, z) и т. д. вдоль различных направлений, т. е. характеризует их динамику. Здесь также прослеживается аналогия с уже рассмотренными случаями, ведь у электрического и магнитного полей тоже есть компоненты, как у векторов. А в правой части уравнений Эйнштейна вместо токов, или в правой части уравнения (2.5) вместо F(t, x), стоит некоторая величина, характеризующая энергию всего того, что входит в систему. Это могут быть, например, частицы и электромагнитные поля. При этом энергия соответственно может иметь разную природу, что приводит и к различным решениям уравнений. Чтобы замкнуть систему, надо добавить уравнения, описывающие динамику частиц в кривом пространстве-времени. Здесь следует отметить, что ситуация в гравитации несколько сложнее, чем в случае электродинамики, и, чтобы её разъяснить во всех деталях, требуются знания, далеко выходящие


96

Лекция 2. Общая теория относительности

за рамки школьного курса физики и математики; поэтому мы обсуждаем динамику гравитации ещё более схематично, чем электромагнитных полей. Очевидно, что компоненты метрики для плоского пространства-времени Минковского решают уравнения Эйнштейна с нулевой правой частью. Более того, в том же смысле четырёхмерное пространство-время де Ситтера решает уравнения Эйнштейна с так называемой тёмной энергией в правой части (мы вернёмся к этому вопросу ниже). Она называется тёмной, потому что не может быть создана обычной материей — скажем, газом частиц. Однако её можно, например, создать каким-нибудь полем, если оно однородно возбуждено во всём пространстве-времени. Ну и наконец, гравитационные поля чёрной дыры и гравитационной волны тоже решают уравнения Эйнштейна. Мы переходим теперь к обсуждению свойств всех этих решений. § 5. Расширяющаяся Вселенная Согласно современным наблюдениям оказывается, четырёхмерный аналог рассмотренного выше двумерного пространства-времени де Ситтера, вероятно, имеет прямое отношение к нашей Вселенной: существуют косвенные наблюдения в пользу того, что ранняя стадия её развития была похожа на область внутри четырёхмерного гиперболоида де Ситтера с очень маленьким радиусом кривизны. Это пока является гипотезой, которая не подтверждена полностью экспериментальными наблюдениями. Предполагается, что радиус гиперболоида был столь мал, а кривизна соответственно велика, что Вселенная сильно отличалась от плоского пространства-времени даже для очень близких точек (в сравнении с привычными для человека размерами). Точное значение радиуса пока неизвестно, но он, скорее всего, был значительно меньше даже размеров атомных ядер. По принятой терминологии маленький радиус означает сильное искривление, т. е. большую кривизну. И наоборот, относительно большой радиус означает слабое искривление. В настоящее время (по вселенским масштабам) видимая часть нашей Вселенной опять становится похожей на область


§ 5. Расширяющаяся Вселенная

97

внутри гиперболоида де Ситтера, но со значительно бо́льшим радиусом, чем в ранний период своей эволюции. Таким образом, теперь она больше похожа на плоское пространство-время, чем на ранней стадии: чтобы увидеть её искривление, надо смотреть на очень большие расстояния даже по вселенским масштабам — больше размеров скоплений галактик. Радиус же гиперболоида сейчас составляет десятки миллиардов световых лет. Слово «похоже», которое мы используем для сравнения нашей Вселенной с гиперболоидом, в данном контексте означает, что разбегание галактик в ней может быть описано математически строго и в некотором приближении повторяет движение материальных точек на гиперболоиде. (Такое движение мы обсудим более подробно чуть ниже.) Сказанное, конечно, относится к случаю, когда радиус кривизны очень велик. В ситуации же с гиперболоидом очень маленького радиуса некоторые учёные предполагают такой период в эволюции Вселенной, интерпретируя некоторые косвенные наблюдения. Максимально симметричное пространство-время любой размерности является пустым, в том же смысле, что и плоское пространство-время Минковского с нулевой кривизной: оно не содержит ни межзвёздной пыли, ни галактик, ни даже излучения. Можно спросить, почему же пространство-время де Ситтера тогда вообще хоть как-то отличается от плоского пространства-времени. Дело в том, что оно содержит так называемую вакуумную, или тёмную энергию, которая и определяет его постоянную кривизну, как мы заметили в предыдущем параграфе. Учёные пока могут только строить догадки о том, какую именно природу имеет эта тёмная энергия в нашей Вселенной, но они точно видят её влияние на движение галактик. Наша Вселенная на любой известной нам стадии своей эволюции не является абсолютно пустой ни в каком смысле, ведь там есть материя — межзвёздная пыль (частицы), галактики, излучение и т. д. (в данном случае излучение тоже относят к материи). Поэтому здесь лишь обсуждается приближение, когда плотность тёмной энергии намного больше, чем та, которую несёт материя. Это значит, что искривление пространства-времени происходит в основном за счёт тёмной энергии, а его относительно слабым искривлением из-за


98

Лекция 2. Общая теория относительности

материи можно пренебречь. Только в таком приближении движение галактик во Вселенной похоже на поведение материальных точек на четырёхмерном гиперболоиде де Ситтера. 5.1. Метрика Фридмана на гиперболоиде Чтобы математически строго описать приближение, в котором поведение галактик в видимой части Вселенной подобно свободному движению материальных точек на части гиперболоида, необходимо знать метрику, или способ измерения расстояний, в самом пространстве-времени де Ситтера. Вывод этой метрики выходит далеко за рамки нашего курса (для этого надо решать уравнения Эйнштейна), но мы предъявим её и разъясним её смысл. Способ измерения расстояний в нашей Вселенной в приближении, которое мы опишем ниже, практически на любой стадии её эволюции хорошо передаётся следующей формулой: ds2 = c2 dt 2 − a2 (t)[dx 2 + dy 2 + dz2 ],

(2.6)

где a(t) — это некоторая функция времени, которую мы будем называть фактором Фридмана — в честь русского математика А. А. Фридмана, который первым нашёл решение уравнений Эйнштейна, описывающее расширяющуюся Вселенную. Различные виды этого фактора a2 (t) отвечают решениям уравнений Эйнштейна с разной формой энергии. Рассмотрим смысл и представим явный вид a(t) в некоторых ситуациях. Подчеркнём несколько важных моментов. Во-первых, уравнение (2.6) определяет расстояния между очень близкими точками в данном пространстве-времени, как мы объяснили в конце п. 3.2. При этом всё, конечно, надо понимать в сравнении. А именно, размеры самих галактик очень малы по сравнению с расстояниями между их скоплениями. Поэтому точки, удалённые друг от друга на расстояния порядка характерного размера галактик, можно считать очень близкими в масштабах скоплений. Чтобы проиллюстрировать ситуацию, описываемую в этом пункте, напомним, что Землю можно считать шаром только приближённо, даже если мы забываем про горы и впадины. При этом площадь своего приусадебного участка мы считаем, пользуясь евклидовой геометрией, т. е. всё зависит


§ 5. Расширяющаяся Вселенная

99

от обсуждаемых масштабов и от приближений, которые можно применять. Примерно такая аргументация работает и в обсуждаемом случае. Приводя эти доводы, мы надеемся, что читатель не только поймёт аналогию, но и поверит, что авторы этих лекций способны вернуться с небес на Землю, когда это требуется. Итак, на нынешней стадии эволюции Вселенной метрика (2.6) применима, если измерять расстояния больше размеров галактических скоплений, считая очень маленькими размеры самих галактик. Понятно, что они никак не являются маленькими по сравнению с привычными нам масштабами. Однако если смотреть в телескоп на видимую часть Вселенной в целом, то все галактики в ней можно рассматривать просто как частицы однородно распределённой пыли, как можно интуитивно понять, взглянув, например, на рис. 3 (см. вклейку). Во-вторых, как видно из уравнения (2.6), компоненты метрики, которые не равны нулю, зависят только от времени и никак не меняются с изменением положения в пространстве. Действительно, ведь фактор Фридмана зависит только от t. Такое свойство пространства-времени называется однородностью. При этом понятно, что внутри галактик в масштабах меньше размеров звёздных систем метрика никак не может быть однородной. Действительно, в окрестности любого массивного тела пространство в той или иной степени искривлено, и это искривление уменьшается по мере удаления от центра этого тела. Это значит, что вокруг каждой звезды имеется какое-то искривление, которое меняется от точки к точке в пространстве и такой простой формулой, как (2.6), описано быть не может. Вспомните аналогию с Землёй и приусадебным участком, которую мы упомянули выше. Если попытаться точно описать метрику во Вселенной вокруг каждой точки хотя бы на привычных нам расстояниях, то получится чрезвычайно сложная картина. В этом случае уравнения Эйнштейна тяжело решать даже с помощью компьютера. И только если мы будем увеличивать масштаб до размеров скоплений галактик, вид метрики всё точнее и точнее будет описываться уравнением (2.6). Это связано с тем, что только на таких расстояниях распределение материи во Вселенной является однородным с достаточно высокой степенью точности.


100

Лекция 2. Общая теория относительности

Подчеркнём, что в результате расширения Вселенной увеличиваются дистанции между удалёнными галактиками, но размеры самих галактик — частичек пыли — не меняются. Например, расстояние между Землёй и Солнцем не растёт, так как в пределах Солнечной системы плотности тёмной энергии и энергии галактической пыли пренебрежимо малы по сравнению с энергией небесных тел, формирующих эту систему. Солнечная система входит лишь в состав одной из пылинок, участвующих в формировании метрики (2.6) и изображённых на последнем рисунке. В-третьих, сравним формулу (2.6) с известной нам метрикой Минковского ds2 = c2 dt 2 − dx 2 − dy 2 − dz2 , которая тоже, очевидно, однородна, ведь её можно рассматривать как частный случай метрики (2.6) в ситуации, когда a2 (t) = 1. Тогда в заданный момент времени, т. е. при dt = 0, в пространственном срезе длина вычисляется по формуле dl 2 = dx 2 + dy 2 + dz2 , которая не меняется в зависимости от того, какой момент для измерения длины в пространстве выбран. В случае же метрики (2.6) мы имеем дело с пространственной частью метрики вида dl 2 = a2 (t)[dx 2 + dy 2 + dz2 ]. Поэтому расстояния между точками в пространстве в данном случае меняются в зависимости от того, в какой момент t мы их определяем, в соответствии с изменениями во времени фактора Фридмана a(t). Заметим, что сам пространственный срез является плоским в каждый данный момент времени, но при этом всё пространство-время с метрикой (2.6) в целом искривлено — имеет ненулевую кривизну. Как же такая метрика реализуется на гиперболоиде? При внимательном рассмотрении рис. 2.14 становится понятно, что двумерное пространство-время де Ситтера можно представить как результат несколько необычной динамики круглой резинки во времени Z. (Напомним, что Z совпадает с координатой времени, умноженной на скорость света.) Эта резинка,


§ 5. Расширяющаяся Вселенная

101

имеющая форму окружности, летит из прошлого в будущее, и её радиус уменьшается по определённому закону до момента Z = 0, а затем растёт. В этом процессе резинка и заметает гиперболоид. Для иллюстрации такого процесса на гиперболоиде можно изобразить координатную сетку, как на рис. 4 (см. вклейку). Здесь положения резинки в разные моменты времени её полёта нарисованы как горизонтально расположенные окружности. При этом вертикально направленные гиперболы — это мировые линии свободно плавающих в гравитационном поле, т. е. двигающихся по геодезическим, частиц. Так будут выглядеть линии, заметаемые точками, которые отмечены на резинке. Именно вдоль подобных линий на четырёхмерном гиперболоиде и двигаются галактики в нашей Вселенной. В случае многомерного гиперболоида вместо окружности его заметает уже сфера соответствующей размерности. Четырёхмерный гиперболоид, например, заметает трёхмерная сфера, как мы объяснили выше при обсуждении гиперболоида де Ситтера. Поэтому мы всё время говорим о четырёхмерном пространстве-времени, а рисуем для наглядности двумерный. Действительно, даже трёхмерный гиперболоид трудно изобразить, ведь он вложен не в трёхмерное, а в четырёхмерное пространство-время, как мы объяснили выше, а заметает его при этом двумерная сфера, а не окружность. Теперь, возможно, станет ясно, откуда берётся стандартная картина, которую обычно приводят, когда для широкой публики рассказывают про расширяющуюся Вселенную с разбегающимися в ней галактиками (рис. 5 на вклейке). Картина эта весьма условна, как ясно из рассказа в этом параграфе. Но, помимо упомянутых выше усложнений с многомерностью картины, галактики на гиперболоиде будут не только удаляться, но и сближаться до момента Z = 0, в то время как рис. 5 (см. вклейку) иллюстрирует только расширение. Как же тогда получить только разбегание галактик на гиперболоиде? Оказывается, если рассечь пространство-время де Ситтера плоскостью, которая имеет наклон 45 градусов по отношению к вертикальной оси Z и проходит через начало координат объемлющего пространства-времени, как изображено на рис. 6 (см. вклейку), то можно показать, что верхняя


102

Лекция 2. Общая теория относительности

его половина описывает только расширение, соответствующее именно метрике (2.6). При этом в данном случае она содержит фактор Фридмана определённого вида: ds2 = c2 dt 2 − e2𝑐𝑡/𝑅 [dx 2 + dy 2 + dz2 ]. 𝑐𝑡/𝑅

(2.7)

А именно, a(t) = e , где R — это радиус кривизны гиперболоида, который определяет так называемую постоянную Хаббла. Координатная сетка метрики (2.7) изображена на рис. 7 (см. вклейку). Можно показать, что в этой сетке срезы постоянного t получаются сечениями гиперболоида плоскостями, параллельными той, что отсекает указанную ранее половину пространства-времени де Ситтера, отвечающую расширению, как изображено на рис. 6. Заметим разительное отличие рисунков 4 и 5 от 6 и 7. В первых двух случаях пространственные срезы всего пространства-времени имеют конечные объёмы, площади или периметры, в зависимости от того, о какой размерности идёт речь. Действительно, это окружности или сферы. В то же время в случае рис. 7 пространственные срезы — это параболы или параболоиды, которые имеют бесконечные объёмы, площади или длины (опять же в зависимости от размерности). Итак, можно показать, что галактики в ситуации, когда доминирует тёмная (вакуумная) энергия, разбегаются друг от друга вдоль вертикально направленных гипербол, которые изображены на рис. 7 (см. вклейку). Они двигаются по времени-подобным геодезическим на гиперболоиде, и расстояние между ними вдоль пространственных срезов (парабол, высекаемых плоскостями, изображёнными на рис. 6, см. вклейку) растёт. Это происходит экспоненциально быстро в соответствии с формулой (2.7) и объяснениями, данными выше в этом пункте. Такое экспоненциальное расширение называется инфляцией. В завершение подчеркнём, что метрика (2.7) является решением уравнений Эйнштейна, а мы её наглядно представили как способ измерения расстояний на гиперболоиде, который погружён в плоское пространство-время на одну размерность больше. Данную метрику также можно реализовать и другими способами: например, вложив тот же гиперболоид в плоское пространство-время ещё большей размерности.


§ 5. Расширяющаяся Вселенная

103

Всё, что мы здесь старались сделать, — дать наглядное геометрическое представление данной метрики. Это не означает, что Вселенная, в которой мы живём, вообще куда-то вложена. Иными словами, мы не утверждаем, что в природе существует какое-то физическое пятимерное пространство-время с погружённой туда нашей четырёхмерной Вселенной в виде гиперболоида. Наша Вселенная вообще может быть никуда не вложена. Во всяком случае пока мы не видим никаких физических проявлений объемлющего пространства-времени в экспериментах и наблюдениях за звёздами. А если бы оно существовало, то, безусловно, проявляло бы себя, и учёным вполне известно как. Но это уже совсем другая история, требующая отдельного рассказа. 5.2. О других типах расширения в нашей Вселенной Однородная масса пыли, частичками которой являются галактики, и даже свет (излучение) несут какую-то энергию. Поэтому только в случае доминирования тёмной энергии над двумя этими вкладами в динамике Вселенной её видимая часть похожа на область внутри гиперболоида. Сейчас, смотря в телескоп, астрономы видят сектор Вселенной, от самых дальних областей которого свет на пути к нам летел более 13 миллиардов лет. Самые дальние области видимой части Вселенной одновременно являются и самыми ранними. Наблюдая за разбеганием галактик в видимой части нашего мира и сравнивая его с поведением материальных точек на гиперболоиде, учёные сделали вывод о том, что тёмная энергия составляет около 70–75 процентов от всей плотности во Вселенной. Более точного знания этой величины для нашего обсуждения не нужно. Во Вселенной помимо тёмной энергии имеется ещё и тёмная материя. (Не следует их путать между собой!) Плотность тёмной материи составляет 25–20 процентов от полной. Остальное — это плотность обычной материи (до 5 процентов). Именно из последней состоим мы, планеты и звёзды. Наблюдения говорят о том, что тёмная материя имеет те же гравитационные свойства, что и обычная. Однако, скажем, её электромагнит-


104

Лекция 2. Общая теория относительности

ные свойства сильно отличаются от электромагнитных свойств обычной материи. Заметим, что в ходе эволюции Вселенной были и другие стадии, когда, например, над тёмной энергией доминировал вклад пыли или даже света. А именно, наблюдения говорят о том, что на одной из ранних стадий была ситуация, когда лидирующий вклад в плотность энергии давало излучение. Тогда расширение описывалось той же метрикой, что и (2.6), но с фактором Фридмана вида a(t) = At 1/2 вместо экспоненты, где A — некоторый размерный коэффициент. На этом этапе Вселенная не вкладывается в гиперболоид де Ситтера, так как плотность энергии материи (в данном случае излучение тоже относят к материи) не приводит к постоянной кривизне. Затем наступила стадия, на которой доминировала плотность энергии за счёт пыли. Этот период в эволюции Вселенной опять описывается метрикой (2.6), но уже с фактором Фридмана вида a(t) = Bt 2/3 с некоторым другим размерным коэффициентом B. На этой стадии Вселенная тоже не вкладывается в гиперболоид де Ситтера. Оба только что описанных случая отвечают решениям уравнений Эйнштейна с соответствующими правыми частями — энергией излучения и энергией пыли. В процессе расширения Вселенной плотность энергии материи (и пыли, и излучения) уменьшается, в отличие от плотности тёмной энергии. Последняя не меняется, даже если происходит расширение; в частности, поэтому тёмная энергия и приводит к постоянной кривизне и симметричности пространства-времени. Возможно, стоит заметить, что в результате расширения энергия излучения уменьшается быстрее, чем энергия пыли. Это связано с тем, что излучение состоит из электромагнитных волн. Длина волны излучения растёт при расширении Вселенной. Соответственно, помимо численной плотно-


§ 5. Расширяющаяся Вселенная

105

сти уменьшается и энергия каждого из фотонов, что приводит к ускоренному уменьшению плотности энергии излучения по сравнению с пылью, состоящей из точечных частиц — связанных состояний атомов или даже планет со звёздами. (Напомним, что размеры связанных состояний не меняются в процессе расширения Вселенной, как мы объяснили выше. При этом на самой ранней стадии, когда расширение было очень быстрым, менялись длины волн не только фотонов, но и других элементарных частиц, ведь тогда не существовало связанных состояний и все частицы были релятивистскими.) В результате, если изначально было доминирование энергии излучения, в процессе расширения оно сменяется стадией доминирования пыли. 5.3. О скорости света в расширяющейся Вселенной Ранее мы говорили о том, что свет на гиперболоиде распространяется вдоль прямых, образующих его при вращении, как в Шуховской башне. Интересно, что в искривлённом пространстве-времени данного типа свет всё же движется по прямой, так как мы имеем дело с однородным в пространстве и постоянным во времени искривлением (в неоднородном случае картина будет иной). Напомним, что вдоль мировой линии света всегда выполняется равенство ds2 = 0. Действительно, как бы ни было искривлено пространство-время, в достаточно маленькой окрестности любой своей точки оно устроено так же, как пространство-время Минковского. В плоском пространстве-времени свет движется по закону ds2 = 0. Поэтому это верно и в любом искривлённом пространстве-времени. Таким образом, в метрике (2.6) свет движется по следующему закону: ds2 = c2 dt 2 − a2 (t)[dx 2 + dy 2 + dz2 ] = 0. Следовательно, скорость света равна

Æ

d~r

c , где |d~r | = dx 2 + dy 2 + dz2 ,

= dt

a(t)

т. е. она не совпадает с c и, более того, зависит от времени, если определять скорость света как пространственное прираще-


106

Лекция 2. Общая теория относительности

ние вдоль мировой линии света, делённое на временно́е, в данной метрике. Причина этого в кривизне пространства-времени. Наблюдатель, погружённый в гиперболоид, может экспериментально убедиться, что скорость распространения света внутри этого пространства-времени именно так и устроена. Интересно, что галактики при этом двигаются вдоль мировых линий, для любого сегмента которых верно, что ds2 > 0, как мы объяснили на лекции 1, т. е. для них

d~r

c .

< dt

a(t)

Соответственно они всегда двигаются медленнее, чем свет в данном пространстве-времени, как и должно быть. При этом из-за расширения Вселенной расстояние между галактиками растёт, т. е. если в момент времени t = 0 пространственное расстояние между двумя галактиками было a(t) равно L, то к моменту t оно стало равно L. Соответственa(0) но они удалились друг от друга на расстояние L[a(t)/a(0) − 1]. За тот же самый промежуток времени t свет в плоском пространстве пройдёт расстояние ct. В результате вполне может оказаться, что a(t) L − 1 > ct. a(0)

При экспоненциальном расширении, например, этого особенно легко добиться — читатель может проверить это самостоятельно. Таким образом, вполне может оказаться, что на гиперболоиде галактики удалились друг от друга на расстояние, которое больше, чем свет преодолевает в плоском пространстве-времени за то же время. Нередко этот факт приводится как парадокс, который противоречит аксиоме о максимальности скорости света. Но сравнивать перемещение галактик в искривлённом пространстве-времени с движением света в плоском — всё равно, что путать апельсины с мухами. Дело в том, что t в левой и правой частях последнего неравенства — это два промежутка времени, измеренные разными наблюдателями, движущимися различным образом в пространствах, которые совершенно не похожи друг на друга. Поэтому никакого противоречия здесь, конечно же, нет.


§ 6. Гравитационные волны

107

Эти наблюдения заключают наш рассказ о расширении Вселенной, и мы переходим к гравитационным волнам. § 6. Гравитационные волны Необходимость существования гравитационных волн предвидел ещё Ньютон. Из его рассуждений следовало, что между любой планетой и Солнцем существует сила, которая действует на расстоянии. В те времена учёные ещё не были знакомы с таким понятием, как поле, и считали, что воздействие может возникать только при непосредственном контакте тел. Позже возникло понятие гравитационного потенциального поля, но в гравитации Ньютона оно не было динамическим. В любом случае имелась проблема: сила Ньютона устроена так, что если, например, резко сместить положение Солнца, то мы на Земле почувствуем это мгновенно. Из общих соображений было понятно, что так быть не может. Должна быть какая-то волна возмущения гравитационного поля или что-то ещё, что пройдёт путь от Солнца до Земли. Но в рамках гравитации Ньютона этому просто неоткуда было взяться. Известно, что подобное логическое противоречие беспокоило Ньютона и он предполагал существование частиц, посредством которых идёт обмен между небесными телами. Поток таких частиц должен распространяться из центра тела симметрично во все стороны и поэтому убывать обратно пропорционально площади сферы. По всей видимости, это и привело Ньютона к мысли о том, что сила убывает как обратный квадрат расстояния до её источника. В этих рассуждениях непонятно, почему именно сила должна убывать как обратный квадрат расстояния до источника. Почему, например, не гравитационный потенциал? Все эти эвристические моменты, конечно, важны с точки зрения истории науки. Но для самой науки, для понимания природы, важно, что Ньютон не остановился на них, а проверил свои наблюдения вычислением, которое потом сравнил с экспериментом. Он разработал соответствующий математический аппарат, а затем из своей гравитационной силы вывел законы Кеплера. А именно, он сравнил свои вычисления


108

Лекция 2. Общая теория относительности

с данными, собранными Тихо Браге, в обработке и интерпретации Кеплера. Закон обратных квадратов предлагался и другими учёными, например Гуком, но Гук не проделал вычислений, потому что просто не умел этого (при всех своих достоинствах и нашем глубоком уважении к нему). Итак, какой бы природы ни были гравитационные волны, научное сообщество по большей части всегда было убеждено, что они просто обязаны существовать. Должна быть теория, которая содержит в себе гравитацию Ньютона и предсказывает динамику соответствующего поля, т. е. какие-то волны, иначе мы будем иметь действие на расстоянии. Это, безусловно, тоже лишь эвристический аргумент, потому что нельзя совсем исключить, что в какой-то ситуации картина воздействия посредством поля перестанет быть применимой. Поэтому совершенно необходима независимая проверка наших ожиданий и чаяний. Если гравитационные волны существуют, то они должны излучаться любыми двигающимися массивными телами. То, что они излучаются только теми телами, которые двигаются с меняющимся во времени ускорением, для нас сейчас является просто технической подробностью. В принципе гравитационное излучение возникает и в Солнечной системе, ведь в ней планеты вращаются вокруг Солнца. Однако массы и ускорения планет в этом случае столь малы, а гравитационное взаимодействие соответственно столь слабо, что интенсивность соответствующего излучения просто ничтожна. Поэтому можно пренебречь потерями энергии планет на это излучение и предсказывать свойства Солнечной системы в приближении механики Ньютона со статическим гравитационным полем. При этом в двойных звёздных системах бывают ситуации, когда небесные тела, их составляющие, имеют огромные массы и ускорения: они быстро вращаются вокруг общего центра масс на относительно малых расстояниях друг от друга. В этом случае потери энергии на излучение гравитационных волн оказывается вполне ощутимыми. Их проявление можно заметить, если достаточно долго наблюдать за такой двойной звёздной системой. Например, ещё с 70-х годов прошлого века учёные наблюдали, как звёзды в двойных системах (так


§ 6. Гравитационные волны

109

называемых радиопульсарах) теряют энергию и приближаются друг к другу. И закон, по которому происходят такие потери полной энергии в системе, хорошо согласуется с тем, что предсказывает общая теория относительности. Это было косвенным, а не прямым подтверждением существования гравитационных волн. Оставалось только найти их непосредственное проявление, что и произошло в конце 2015 года. Здесь мы обсудим, что именно увидели учёные и почему они убеждены, что действительно обнаружили гравитационные волны. При этом для упрощения изложения мы опустим большинство технических деталей и расскажем только о принципиальных вещах. 6.1. Геометрия гравитационной волны Одна выделенная плоская гравитационная волна, которая, например, движется вдоль координаты z, описывается следующей метрикой: ds2 = c2 dt 2 − (1 − A cos[k(ct − z)]) dx 2 − (1 + A cos[k(ct − z)]) dy 2 . Здесь, как и раньше A — это амплитуда волны, а k — это волновой вектор. Данное выражение приближённо решает уравнения Эйнштейна, если амплитуда A намного меньше единицы. В таком случае энергия волны очень мала и её вкладом в правую часть уравнения Эйнштейна можно пренебречь. Ситуация здесь абсолютно такая же, как и в уравнении (2.4), где в правой части как раз и стоит нуль. Заметим, что каждая из компонент обсуждаемой метрики решает такое уравнение, как (2.4), если заменить в нём x на z, а v на c. Как следует из приведённой выше формулы, гравитационная волна искривляет пространство-время так, как показано на рис. 8 (см. вклейку). Перпендикулярно направлению, вдоль которого она движется, происходит периодическое сжатие по вертикали и растяжение по горизонтали, а затем наоборот. Амплитуда такого процесса равна A, а его частота равна скорости света, делённой на длину волны, т. е. ck/(2π). Растяжения и сжатия вдоль плоскостей, перпендикулярных направлению распространения гравитационной волны, не сводятся к простой замене координатной сетки, так как


110

Лекция 2. Общая теория относительности

происходят вследствие реального физического воздействия на плоскости (x, y) в разные моменты времени и в разных положениях вдоль координаты z. Эти плоскости действительно растягиваются и сжимаются в перпендикулярных направлениях, ведь гравитационная волна приводит к искривлению пространства-времени. Иными словами, метрику, отвечающую гравитационной волне, нельзя свести к плоской какой-то заменой координат в плоскостях (x, y). Плоская метрика отвечает такой ситуации, в которой гравитационное поле реально отсутствует, тогда как, попав под воздействие гравитационной волны достаточно большой амплитуды, человек будет ощущать её, подобно приливным силам. Приливные силы возникают из-за разницы воздействия гравитационного поля на разные точки тела, находящегося в нём. Например, ближняя к Луне сторона Земли притягивается к ней сильнее, чем дальняя, потому что сила притяжения убывает с расстоянием. Это приводит к приливам и отливам в океане, как изображено на рис. 2.17, что и дало этим силам такое название.

Рис. 2.17

Нечто подобное происходит и в присутствии гравитационной волны, только тело растягивается не из-за различной удалённости его частей от какого-то центра, а по причине такого искривления пространства-времени, которое было описано выше в этом параграфе.


§ 6. Гравитационные волны

111

6.2. Регистрация гравитационных волн Как обнаружить гравитационные волны, не покидая Земли? Оказывается, этого можно добиться с помощью так называемого детектора, который по конструкции напоминает интерферометр Майкельсона — Морли (или Фабри — Перо), только очень большого размера, как изображено на рис. 9 (см. вклейку). На двух таких детекторах, расположенных один на юго-востоке, а другой на северо-западе США, на расстоянии около трёх тысяч километров друг от друга, и были впервые зарегистрированы гравитационные волны. Каждый из них имеет два перпендикулярных друг другу плеча длиной по четыре километра. Что произойдёт, когда через такой детектор пройдёт гравитационная волна? В идеале волна пойдёт вдоль направления, перпендикулярного его плоскости, а рукава детектора будут совпадать с направлениями осей x и y, в которых и записана метрика для волны в начале этого параграфа. Тогда одно плечо

Тоннель накопления света

Тоннель накопления света Зеркало

Зеркало

Светоделительная пластина Лазер

Рис. 2.18

Фотодетектор


112

Лекция 2. Общая теория относительности

детектора начнёт периодически сжиматься и растягиваться, а другое будет это делать с некоторым сдвигом по фазе, как изображено в нижней части рис. 2.18, а если точнее, то в противофазе: когда одно плечо сжато, другое растянуто, и наоборот. Однако реальная ситуация далека от идеальной. Главная проблема состоит в том, что амплитуды гравитационных волн, как правило, очень малы, а длины очень велики. Это приводит к ряду сложностей с их регистрацией. Первая зарегистрированная гравитационная волна возникла в результате слияния двух чёрных дыр, одна из которых несла массу порядка 36 масс Солнца, а другая — 29. Энергия, которая при этом излучилась в виде гравитационной волны, была порядка энергии покоя для трёх масс Солнца, потому что в результате обсуждаемого слияния образовалась чёрная дыра, составляющая 62 его массы. Произошло это на расстоянии 1,3 миллиарда световых лет от нас. Обладая таким огромным радиусом, дошедшая до нас сферическая волна на Земле выглядела как плоская. Однако её амплитуда настолько ослабла, что равнялась A = 10−21 . Можно показать, что для любой волны квадрат амплитуды определяет её энергию. Она уменьшается с ростом радиуса как его вторая степень, так как энергия равномерно распределена по всей площади расходящейся из центра сферической волны. Данное наблюдение позволяет оценить исходную амплитуду волны. Начнём с оценки длины волны, которую сделать проще. Радиус чёрной дыры, имеющей массу Солнца, равен приблизительно трём километрам. Соответственно, чёрные дыры с массами около тридцати масс Солнца имеют радиусы порядка 90 км. В момент слияния их общий радиус вращения приблизительно равен 200 км. Точнее для оценки этот радиус знать не нужно. Это и даёт характерную длину обсуждаемой гравитационной волны в 200 км. Те же оценки справедливы и для характерного размера исходного источника, где находилась вся энергия волны. Поэтому если взять отношение 200 км к 1,3 миллиарда световых лет и возвести его в квадрат, то получится величина порядка 10−44 . Как мы указали выше, квадрат амплитуды характеризует энергию волны. Получается, что энергия уменьши-


§ 6. Гравитационные волны

113

лась примерно в 1044 раз, т. е. амплитуда волны уменьшилась в 1022 раз, а значит, исходно она была порядка 10. Это, конечно, очень грубая оценка, так как, когда амплитуда A становится больше единицы, приведённые здесь рассуждения теряют свою применимость и учёные используют компьютерные симуляции происходящих процессов, а не аналитические вычисления. Однако, по крайней мере, она даёт представление о величине эффекта в окрестности источника. Например, почувствовали ли бы мы, если бы что-то нас растянуло в 10 раз? Да хотя бы и в 2 раза? Вспомните, что в гравитационное излучение ушла энергия, эквивалентная Mc2 , где M — величина порядка трёх масс Солнца. И эта энергия исходно была сосредоточена внутри области размером в 200 км. Сравните это с размерами Солнца — порядка 700 000 км. Как же зарегистрировать волну, длина которой в несколько десятков раз превышает плечо детектора, а амплитуда составляет 10−21 ? Последнее означает, что плечо детектора изменится на 4 × 103 метров × 10−21 = 4 × 10−18 метров, что меньше размеров атомного ядра. С такой точностью нельзя даже чётко определить границу твёрдого тела, не то что расстояние! Что же тогда было зарегистрировано на этих двух детекторах? И почему нельзя было ограничиться лишь одним из них? Во-первых, отметим, что если положения равновесия всех атомов в решётке твёрдого тела сместятся одновременно и вместе, то это уже представляет собой некоторое явление, каким бы малым это смещение ни было. Во-вторых, детектор типа Фабри — Перо устроен следующим образом. Лазером подаётся луч света, который проходит через «светоделительную пластину», как изображено на рис. 2.18. Она пропускает 50 процентов света и отражает с той же вероятностью. Соответственно волна от лазера делится на две, одна из которых идёт вдоль первого плеча детектора, а вторая — вдоль второго. В-третьих, внутри каждого плеча имеется ещё по одному «полупрозрачному» зеркалу, как опять же изображено на рис. 2.18. В одну сторону эти «полупрозрачные» зеркала пропускают весь свет, а в другую отражают 99 процентов света. Это озна-


114

Лекция 2. Общая теория относительности

чает, что эффективно внутри каждого плеча (точнее, внутри «тоннеля накопления света») свет 99 раз отражается туда и обратно, пока не вернётся окончательно к «светоделительной пластине». В результате каждое плечо эффективно становится в 100 раз длиннее. Вместо четырёх километров мы имеем четыреста, что позволяет регистрировать гравитационные волны длиной уже в несколько сотен километров. В-четвёртых, после возвращения двух разделённых лучей света к «светоделительной пластине» они подаются на фотодетектор, где наблюдается интерференция между двумя лучами, как показано на рис. 2.18. Явление интерференции мы подробно обсудим на лекции 3, посвященной квантовой механике. Сейчас же важно заметить, что учёным было необходимо добиться того, чтобы в фотодетекторе почти не было никакого сигнала, т. е. две волны гасили бы друг друга почти полностью. (Почему «почти», мы обсудим чуть ниже.) Этого можно достичь, если волна из одного плеча приходит в противофазе с волной из другого, т. е. горб одной из них внутри фотодетектора совпадает со впадиной другой. В-пятых, внутри каждого плеча всего детектора укладывается целое число длин полуволн. Подобрав размеры плеч так, чтобы на том конце, где находится фотодетектор, у волны от одного плеча был горб, а у волны от другого — впадина, можно как раз добиться того, что сигнал будет отсутствовать. Видео с пояснениями на эту тему можно найти на сайте https://www.ligo.caltech.edu/video/ligo20160211v6. В-шестых, в фотодетекторе сигналы от двух волн компенсируются не полностью, а почти полностью, что необходимо для увеличения чувствительности прибора. Дело в том, что при полной компенсации сигнала величина его отклонения от нуля в фотодетекторе зависит от изменения длин плеч не по линейному, а квадратичному закону. Чтобы это увидеть, надо понимать, что такое экстремум функции — понятие из области высшей математики. Мы же сейчас примем это за определение. Так вот, если компенсация сигнала в детекторе не полная, то его отклик на изменение длин плеч является линейным — большим по величине. Именно колебание сигнала в фотодетекторе и является той величиной, которую можно измерить с очень высокой точностью, в отличие от длин плеч.


§ 6. Гравитационные волны

115

Но зеркала могут смещаться из своих положений и по другим причинам. Например, если в окрестности детектора проедет машина, то амплитуда колебания зеркал в принципе может оказаться даже выше 10−21 , не говоря уже о том, что в земной коре постоянно происходят какие-то движения, приводящие к её колебаниям со значительно бо́льшими амплитудами. Как же в такой ситуации отличить столь маленький сигнал от столь большого фона? Безусловно, в детекторе используется механизмы, позволяющие подавить колебания зеркал, но этого недостаточно. Чтобы понять идею того, как работает механизм, отличающий сигнал от фона, обсудим немного другую проблему. Допустим, нам необходимо научиться регистрировать подводные лодки противника, которые курсируют у наших берегов. Как это сделать? Для этого в воду надо поместить сеть из микрофонов, которые будут регистрировать звуки в воде и подавать их на обработку в компьютер. Понятно, что такие микрофоны должны быть очень чувствительными, чтобы увидеть подводную лодку на как можно большем расстоянии. Но в силу этой чувствительности они будут также регистрировать и множество посторонних звуков: от других судов, от природных явлений и морских животных, которые могут быть намного сильнее звука подводной лодки. Военные знают те характерные звуки, которые издают двигатели подводных лодок, если они, конечно, не совсем новые. Акустики знают, как выглядит соответствующий характерный кусок кривой, который поступит на компьютер от микрофона. И если кривые на компьютере от микрофонов в сети совпадают между собой и совпадают с ожидаемой кривой, то можно сказать, что в данном районе прошла подводная лодка. Можно даже сказать, на каком расстоянии, глубине, где конкретно и в каком направлении она прошла, если это произошло не слишком далеко, а сеть из микрофонов была достаточно большая. Нечто похожее происходит и в случае с регистрацией гравитационных волн. Два детектора — это как два микрофона. Чем больше детекторов, тем лучше. Поэтому ещё несколько таких устройств строятся по всему миру. А откуда мы знаем,


116

Лекция 2. Общая теория относительности

как должна выглядеть кривая изменения светимости на фотодетекторе, если эти колебания возникли за счёт гравитационной волны? Для этого учёные произвели множество компьютерных симуляций различных слияний таких объектов, как чёрные дыры и нейтронные звёзды с различными массами и в разных комбинациях. Так были сгенерированы характерные примеры кривых, которые должны увидеть детекторы. В результате в процессе регистрации первой гравитационной волны учёные увидели следующее явление. Сначала один из детекторов, а через 7 миллисекунд другой зарегистрировали один и тот же характерный сигнал. Это означает, что за эти 7 миллисекунд волна шла со скоростью света от одного детектора до другого. Однако волна приходит к поверхности Земли под некоторым углом. В принципе она может прийти и перпендикулярно поверхности Земли, т. е. одновременно к обоим детекторам. Также она может распространяться и вдоль линии, соединяющей оба детектора. Поэтому сигналы на них не могут быть разделены на промежуток времени, больший, чем три тысячи километров, делённые на скорость света. Посмотрим на полученные результаты (рис. 2.19) и их интерпретацию (рис. 2.20). В верхней части рис. 2.20 изображено движение небесных тел, которые сформировали сигнал. Итак, сначала была система из двух чёрных дыр и они быстро вращались друг вокруг друга. При этом происходило излучение гравитационных волн, сигнал от которых был очень слабым, чтобы быть идентифицированным на детекторах. Однако в результате такого излучения чёрные дыры сближались друг с другом. В процессе сближения скорость вращения дыр росла, росло и ускорение. В результате увеличивалась и интенсивность излучения волн. Начиная с какого-то момента, очень близкого к окончательному слиянию, интенсивность излучения достигла той величины, которая может быть зарегистрирована нашими детекторами. Как видно из рис. 2.20, в результате сближения длина волны становится короче, а амплитуда больше. На пике роста амплитуды происходит слияние дыр, и с этого момента она убывает. Это затухание имеет характерный вид, который отвечает


§ 6. Гравитационные волны

117

Рис. 2.19. На верхней слева диаграмме показан сигнал, зарегистрированный одним детектором, а на верхней справа совмещены сигналы от двух детекторов. На нижних рисунках изображены сигналы, которые сгенерировали на компьютере, и их сравнения с экспериментальными кривыми

Рис. 2.20

формированию единого горизонта событий у получившейся дыры. Что такое горизонт событий мы расскажем в конце этой лекции, а сейчас нам достаточно знать, что это поверхность, которая в данной ситуации ведёт себя как мыльная плёнка: вибрирует почти по тем же законам и стремится в конечном


118

Лекция 2. Общая теория относительности

итоге приобрести сферическую форму, завершив тем самым свои колебания. Именно это и видно из экспериментального графика. Например, при слиянии нейтронных звёзд, которое привело бы опять к формированию нейтронной звезды, остаточный хвост от кривой имел бы другой характерный вид. Из всего вышесказанного учёные и делают вывод, что зарегистрировали именно гравитационные волны, но, безусловно, мы здесь сильно упростили описание устройства детекторов. § 7. О некоторых свойствах чёрных дыр Этот параграф может показаться неподготовленному читателю технически сложным и достаточно формальным. Поэтому тем, кто не готов тратить время на математические формулы, можно его пропустить. В конце этого параграфа обсуждаются некоторые свойства чёрных дыр, которые можно увидеть на примере физических явлений в неинерциальных системах отсчёта в плоском пространстве-времени. Менее формальное изложение материала о чёрных дырах можно найти в брошюре одного из авторов этих лекций, которая называется «О рождении и смерти чёрных дыр». 7.1. Переход в полярные координаты в двумерном плоском пространстве Чтобы описать переход в неинерциальную систему отсчёта в плоском пространстве-времени, научимся сначала производить преобразование в простейшие криволинейные координаты на двумерной евклидовой плоскости. А именно, перейдём от декартовых координат к полярным, которые мы упоминали на прошлой лекции. Длина очень короткого отрезка, соединяющего точки (x, y) и (x + dx, y + dy), определяется по формуле dl 2 = dx 2 + dy 2 . Перейдём теперь к полярным координатам: x = r cos ϕ,

y = r sin ϕ

и рассмотрим, как при этом поменяется метрика. Для очень короткого отрезка выполнены соотношения dx = (x + dx) − x ≈ (r + dr) cos(ϕ + dϕ) − r cos ϕ =


§ 7. О некоторых свойствах чёрных дыр

119

= r[cos ϕ cos dϕ − sin ϕ sin dϕ] + + dr[cos ϕ cos dϕ − sin ϕ sin dϕ] − r cos ϕ ≈ ≈ dr cos ϕ − r dϕ sin ϕ. Здесь мы воспользовались стандартной формулой из тригонометрии для косинуса суммы углов и тем, что для очень маленького угла dϕ верны приближённые равенства cos dϕ ≈ 1 и sin dϕ ≈ dϕ. Также мы пренебрегли произведением dr на dϕ, которое намного меньше, чем dr и r dϕ по отдельности, поскольку произведение двух малых величин даёт нечто ещё меньшее. В частности, именно это свойство лежит в основе известного правила Лейбница дифференцирования произведения функций. Аналогично можно получить, что dy = dr sin ϕ − r dϕ cos ϕ. В результате верна следующая цепочка равенств: dl 2 = dx 2 + dy 2 = = [dr cos ϕ − r dϕ sin ϕ]2 + [dr sin ϕ + r dϕ cos ϕ]2 = = dr 2 (cos2 ϕ + sin2 ϕ) + r 2 dϕ 2 (sin2 ϕ + cos2 ϕ) = = dr 2 + r 2 dϕ 2 , где мы воспользовались тем, что cos2 ϕ + sin2 ϕ = 1, т. е. в новых координатах длина будет вычисляться по формуле dl 2 = dr 2 + r 2 dϕ 2 . Это так называемая метрика в полярных координатах. Соответствующая координатная сетка была изображена на прошлой лекции. Заметим, что одна из компонент этой метрики не постоянна, а зависят от r. Полученное выражение можно понять из чисто геометрических соображений (рис. 2.21). В случае, когда размеры изображённых справа на рис. 2.21 отрезков очень малы, получающийся треугольник является почти прямоугольным и теорема Пифагора приводит нас к полученному выше выражению для dl 2 — длины гипотенузы. Формула для длины даже прямого отрезка большого размера в полярных координатах будет выглядеть достаточно


120

Лекция 2. Общая теория относительности

y x + dx

r + dr ϕ + d ϕ

y + dy

y x rϕ

dr x

r dϕ

Рис. 2.21. Здесь изображены очень маленькие отрезки и треугольники, но для наглядности мы показываем их так, будто они имеют конечный размер. Слева изображён треугольник в декартовых координатах, а справа — в полярных

непривычно для человека, знакомого только с ортогональной декартовой системой. Однако новые координаты удобны в ряде случаев за пределами обычной школьной программы. Для нас здесь важно, что простейший переход в криволинейные координаты в пространстве-времени, как мы сейчас увидим, выглядит аналогичным образом. 7.2. Переход в криволинейные координаты в двумерном плоском пространстве-времени Теперь рассмотрим в плоском двумерном пространстве-времени метрику, определяющую длину очень короткого интервала: ds2 = c2 dt 2 − dx 2 . Сделаем следующую замену координат: cτ cτ и x = ρ ch , ct = ρ sh l

l

(2.8)

где ρ > 0 — это новая координата, имеющая размерность длины, а l — некоторая константа, которая тоже имеет размерность длины. Константа l необходима для того, чтобы в аргументах гиперболических синусов и косинусов стояла безразмерная величина. Можно сказать, что l задаёт единицу измерения длины. При этом τ — это новая координата, имеющая размерность времени.


§ 7. О некоторых свойствах чёрных дыр

121

Аналогично проделанным выше вычислениям с косинусами и синусами нетрудно показать, что c dτ cτ cτ + ρ ch c dt = dρ sh l

и dx = dρ ch

l

l

cτ c dτ cτ + ρ sh . l l l

Эти формулы можно получить, зная выражения для гиперболических синусов и косинусов через экспоненты, которые приводились на прошлой лекции. Также здесь надо использовать, что для очень маленького dτ выполнено приближённое равенство dτ . e𝑐(τ+𝑑τ)/𝑙 = e𝑐τ/𝑙 e𝑐 𝑑τ/𝑙 ≈ e𝑐τ/𝑙 1 + c l

В результате получается следующая цепочка равенств: ds2 = c2 dt 2 − dx 2 = cτ cτ c dτ 2 = dρ sh + ρ ch − l l l 2 cτ cτ c dτ − dρ ch + ρ sh = l l l cτ cτ − ch2 + = dρ 2 sh2 l l 2 c dτ cτ cτ c dτ 2 + ρ2 ch2 − sh2 = ρ2 − dρ 2 , l

l

l

l

где мы воспользовались тем, что cτ cτ ch2 − sh2 = 1, l

l

т. е. в новых координатах расстояние вычисляется по формуле ρ 2 ds2 = (c dτ)2 − dρ 2 , (2.9) l

которая в точности получается из выражения для метрики в полярных координатах, если в последней заменить ρ на r, cτ/l на ϕ, а знак минус на плюс. Координатой времени здесь является τ, так как ds2 > 0, когда ρ постоянно (т. е. при dρ = 0), а пространственной координатой является ρ, так как ds2 < 0, когда τ постоянно (т. е. при dτ = 0). Одна из компонент новой метрики не является постоянной, а меняется с изменением пространственной


122

Лекция 2. Общая теория относительности

координаты ρ. В литературе выражение (2.9) носит название метрики Риндлера. Как нетрудно видеть из уравнения (2.8), sh(cτ/l) cτ ct = th , (2.10) = x

l

ch(cτ/l)

т. е. в координатах ct и x линии постоянного τ — это прямые, проходящие через начало координат, как изображено на рис. 2.22. При этом опять же из уравнения (2.8) и соотношения cτ cτ − sh2 =1 ch2 l

l

следует, что x 2 − (ct)2 = ρ 2 .

(2.11)

Таким образом, в координатах ct и x линии постоянного ρ — это гиперболы. Они тоже показаны на рис. 2.22. τ

ct

a

ρ, X

Рис. 2.22

Полученное преобразование координатной сетки изображено на рис. 2.23. Однако в силу того, что

cτ cτ ch > sh

, l

l

равенство (2.8) применимо только в правом квадранте x > |ct| координатной сетки (ct, x). Аналогично замена координат (2.8), а также и сами координаты ρ и τ были бы применимы только в левом квадранте, в случае ρ < 0. Обсуждаемая метрика не покрывает ни верхний, ни нижний квадранты ни при каких значениях ρ и τ. Бывает так, что


§ 7. О некоторых свойствах чёрных дыр

ct

123

ct

x

x

Рис. 2.23

координаты покрывают не всё пространство-время, а только его часть. Простейшим примером может послужить координатная сетка, отвечающая долготе и широте на поверхности Земли, которую нельзя продолжить внутрь какой-нибудь пещеры на поверхности её стен. Подчеркнём здесь, что различные гиперболы, отвечающие всевозможным значениям ρ, имеют одни и те же асимптоты: наклонённые под углом 45 градусов к осям и проходящие через начало координат прямые, т. е. при любом значении ρ гипербола x 2 − (ct)2 = ρ 2 приближается к прямым ct = x и ct = −x, когда t стремится к плюс или минус бесконечности соответственно. Более того, из уравнения (2.10) следует, что асимптоты гипербол отвечают следующим значениям времени τ: τ → −Ì и τ → +Ì. Действительно, когда аргумент гиперболического синуса или косинуса очень большой по модулю, обе эти функции можно приблизить экспонентами: cτ e𝑐τ/𝑙 cτ e𝑐τ/𝑙 ch ≈ и sh ≈ , l

l

2

2

если τ очень большое и положительное, либо cτ e−𝑐τ/𝑙 cτ −e−𝑐τ/𝑙 ch ≈ и sh ≈ , l

2

l

2

если τ очень большое по модулю, но при этом отрицательное. Поэтому th(cτ/l) ≈ 1, если τ → +Ì, и th(cτ/l) ≈ −1, если τ → −Ì.


124

Лекция 2. Общая теория относительности

Соответственно, из уравнения (2.10) следует, что ct = x отвечает τ → +Ì, а ct = −x отвечает τ → −Ì. Одновременно эти прямые отвечают ρ = 0, как следует из (2.11). 7.3. Пример мировой линии для неинерциального движения Почему обсуждаемое в предыдущем пункте преобразование координат описывает переход в неинерциальную систему отсчёта? Чтобы ответить на этот вопрос, необходимо рассмотреть движение релятивистской частицы под действием постоянной силы. Теперь мы должны показать, что кривые на плоскости ct и x, на которых координата ρ остаётся постоянной, — это мировые линии тел, которые двигаются неинерциальным образом, т. е. под действием силы, или, что то же самое, покоятся в неинерциальной системе отсчёта, точно так же, как в координатах Минковского прямые, на которых x постоянно, — это мировые линии покоящихся в этих координатах частиц или наблюдателей. Рассмотрим релятивистское движение под действием постоянной силы. Уравнение движения в таком случае выглядит следующим образом: d p~ = F~, (2.12) dt

где p~ — это импульс релятивистской частицы, d p~/dt — скорость его изменения, а F~ — сила, которая по условию не зависит от времени. Заметим, что в нерелятивистском приближении выполнялись бы равенства d p~ d(m~ v) d~ v = =m = m~ a, dt dt dt

где v~ — это скорость, а a~ — ускорение частицы. В релятивистском же случае всё несколько сложнее. А именно, энергия и импульс имеют следующий вид: p~ = p

m~ v 1 − (~ v /c)2

и

E=p

mc2 . 1 − (~ v /c)2

(2.13)

Вывод этих выражений выходит за рамки нашего курса и школьной программы. Однако не будет преувеличением


§ 7. О некоторых свойствах чёрных дыр

125

сказать, что они следуют из совокупности опытных данных. При этом выражения (2.13) удовлетворяют соотношению 2 E = (mc)2 + ( p~)2 , c

которое мы привели в конце прошлой лекции. В нерелятивистском пределе, когда величина |~ v /c| намного меньше единицы, эти формулы переходят в следующие: p~ ≈ m~ v

и

E ≈ mc2 +

m~ v2 . 2

Чтобы увидеть происхождение последнего выражения для энергии из правой формулы (2.13), надо уметь разлагать функции в так называемый ряд Тейлора, что является темой из высшей математики. В частности, надо уметь показывать, что верно следующее приближённое равенство: 1 α p ≈1+ 2 1−α

при очень маленьком значении переменной α. А отброшенная в правой части этого равенства функция от α очень мала при небольших значениях α. Читатель может попробовать самостоятельно разобраться в этой конкретной задаче. Мы привели выражения для p~ и E в нерелятивистском приближении, чтобы показать, что рассматриваемые величины, определённые в уравнении (2.13), являются релятивистскими обобщениями формул из школьного курса физики. Действительно, мы только что увидели, что в пределе при малой скорости из формулы (2.13) получается импульс нерелятивистской частицы и энергия, которая является суммой энергии покоя E0 = mc2 и нерелятивистской кинетической энергии частицы m~ v 2 /2. Итак, возвращаясь к нашей задаче, из уравнения (2.12) находим, что p~(t) = F~t + p~0 , если сила F~ не зависит от времени. В этой формуле p~0 — это значение импульса в момент времени t = 0. Без потери общности обсуждаемого здесь решения можно положить p~0 = 0. В результате из уравнения (2.13) следует, что p~ = p

m~ v = F~t, 1 − (~ v /c)2

если p~0 = 0,


126

Лекция 2. Общая теория относительности

откуда после возведения в квадрат обеих частей этого равенства и решения квадратного уравнения получается, что v~ = Æ

F~tc (mc)2 + ( F~t)2

.

(2.14)

Отсюда видно, что величина вектора v~ (t) (его модуль |~ v (t)|) никогда не превышает скорости света c и она приближается к c, только когда t стремится к бесконечности, т. е. когда ( F~t)2 становится намного больше (mc)2 . Иными словами, частица, двигаясь под действием постоянной силы, никогда не может превысить c, но может сколь угодно приблизиться к этой скорости в результате достаточно долгого ускорения. Чем дольше действие постоянной силы, тем ближе скорость частицы к скорости света. Далее, так как сила F~, а значит, и скорость v~ не меняют своего направления, поворотом координат в пространстве можно выбрать направление обоих векторов в левой и правой частях уравнения (2.14) вдоль оси x. Делать это совсем не обязательно, однако в такой форме ответ выглядит проще. Далее, вспоминая, что скорость является производной координаты по времени, v(t) = dx/dt, из формулы (2.14) можно найти зависимость x от t, если уметь вычислять интеграл (его также можно посмотреть в справочнике или вычислить на компьютере с использованием соответствующей программы). Результат интегрирования следующий: s 2 Ft mc2 x(t) = 1+ + x0 . (2.15) F

mc

Здесь x0 определяет значение координаты x в момент времени t = 0. Например, если выбрать x0 =

−mc2 , F

то в момент времени t = 0 частица находится в точке x = 0. Тогда если отношение Ft/(mc) много меньше единицы, т. е. набранная в результате ускорения скорость Ft/m намного меньше скорости света, то из полученной формулы следует приближённое равенство x(t) ≈

1 Ft 2 . 2m

(2.16)


§ 7. О некоторых свойствах чёрных дыр

127

Заметим, что в этом же приближении из уравнения (2.14) также следует равенство v~ (t) ≈

F~t , m

которое совпадает с формулой скорости при равноускоренном движении в нерелятивистской механике, а само выражение (2.16) совпадает с формулой для расстояния, пройденного за время t нерелятивистской частицей, двигающейся с ускорением F/m. Более общие релятивистские выражения (2.14) и (2.15) показывают, что скорость и длина пройденного пути модифицируются, когда набранная скорость движения частицы оказывается сопоставимой с c. Итак, мы вывели формулу (2.15), определяющую мировую линию для релятивистского движения с ускорением. Из неё простыми алгебраическими операциями можно получить, что 2 2 mc (x − x0 )2 − c2 t 2 = . F

Сравните это выражение с формулой (2.11). Видно, что график мировой линии частицы, двигающейся под действием постоянной силы, является гиперболой на плоскости (ct, x). Если изменить x0 , то вся гипербола целиком сместится вдоль оси x. Можно выбрать x0 = 0. При этом координата ρ определяет величину ускорения на гиперболе (2.11). Чтобы связать координату τ в метрике Риндлера (2.9) с собственным временем равноускоренного наблюдателя, надо в ней взять постоянное ρ, т. е. собственное время связано со временем τ по следующей формуле dT =

ρ dτ. l

Заметим, что линии постоянного собственного времени не будут прямыми. При движении по гиперболической мировой линии в пространстве-времени сила всегда направлена вдоль положительного направления оси x. Частица вечно движется под действием этой силы. Поэтому при движении от бесконечного прошлого до момента времени t = 0 она замедляется от скорости света до нулевой, а затем ускоряется обратно, стремясь к скорости света. Действительно, скорость частицы определяется


128

Лекция 2. Общая теория относительности

ct

x

Рис. 2.24. Гипербола, отвечающая ускоренному движению, находится целиком внутри светового конуса, построенного из любой её точки. Этот факт геометрически описывает утверждение, которое мы обсуждали после формулы (2.14). А именно, двигаясь под действием постоянной силы, частица никогда не сможет превысить скорость света

углом между осью t и касательной к гиперболе, а он всегда меньше 45 градусов (рис. 2.24). Безусловно, вечное ускорение под действием постоянной силы в реальности невозможно, хотя бы потому, что это потребовало бы бесконечных затрат энергии для вечного поддержания постоянной силы. Поэтому рассмотрим более правдоподобную ситуацию. Пусть до момента времени t = 0 частица покоится, затем в течение некоторого промежутка времени ускоряется, а потом продолжает движение с набранной постоянной скоростью. В таком случае мировая линия материальной точки имеет следующий вид: вертикальная полупрямая до t = 0, после чего участок мировой линии совпадает с участком гиперболы, а потом опять с наклонённой полупрямой, которая является касательной к гиперболе в тот момент, когда было выключено ускорение. Действительно, частица после выключения ускорения продолжает двигаться с постоянной набранной скоростью, т. е. по касательной (рис. 2.25). Переход в систему отсчёта материальных точек, которые двигаются более реалистично, выглядит намного сложнее, а со-


§ 7. О некоторых свойствах чёрных дыр

129

ct

a

x

Рис. 2.25. Мировая линия тела, которое ускоряется в течение конечного времени, совпадает с гиперболой только на небольшом интервале и обязательно пересекает асимптоту гиперболы

ответствующая метрика выглядит более громоздко. Поэтому мы рассмотрели идеализированный вариант. В конце заметим, что аналогичным образом можно перейти в вечно вращающуюся систему отсчёта (оставляем эту весьма непростую для первого знакомства с предметом задачу в качестве упражнения для читателя). Также все рассуждения в этом параграфе легко обобщаются на пространство-время, размерность которого больше чем два. Например, четырёхмерная метрика Риндлера получается из четырёхмерной метрики Минковского, если в последней сделать такую же замену, как и выше, для t и x, а y и z оставить неизменными: ρ 2 ds2 = (c dτ)2 − dρ 2 − dy 2 − dz2 . (2.17) l

7.4. Движение света в равноускоренной системе координат Вернёмся вновь к движению света. Как мы уже знаем, вдоль мировой линии фотона даже в искривлённом пространстве-времени выполняется равенство ds2 = 0. Это тем более верно для плоского пространства-времени в криволинейных координатах, поскольку длина интервала инвариантна (не меняется) при любой замене координат. Однако


130

Лекция 2. Общая теория относительности

в неинерциальной системе отсчёта изменится вид координатной сетки. Посмотрим, к чему это приведёт. В метрике Риндлера (2.9) из равенства ρ 2 (c dτ)2 − dρ 2 = 0 ds2 = l

следует, что ρ dρ = c. dτ l

Таким образом, скорость распространения света зависит от величины пространственной координаты ρ. Более того, при ρ = 0 скорость света даже равна нулю. Это лишний раз показывает, насколько важно обсуждение инерциальных систем для утверждения о независимости скорости света от выбора системы отсчёта. Подчеркнём ещё раз, что ничто не может превысить скорость распространения света ни в какой системе отсчёта даже тогда, когда она оказывается равной нулю, ведь вдоль мировых линий частиц, имеющих ненулевую массу, выполняется условие ds2 > 0, а вдоль световой линии ds2 = 0. Заметим, что в исходных координатах свет как двигался по прямой, так и продолжает это делать, а все чудеса возникают из-за перехода в криволинейную координатную сетку. При этом обсуждаемая здесь ситуация связана со следующим явлением, которое можно показать на рис. 2.22. А именно, если из некоторой точки a отправить свет вслед вечно ускоряющемуся наблюдателю, то он никогда не догонит этого наблюдателя. Действительно, мировая линия фотона имеет наклон 45 градусов по отношению к осям и не пересекает гиперболу — ведь асимптота мировой линии вечно ускоряющейся частицы тоже наклонена под углом 45 градусов. Последнее утверждение верно, если в момент времени t = 0 источник света находится достаточно далеко от ускоряющегося объекта. Например, если величина ускорения при таком вечном движении равна g = 10 м/с2 , то можно увидеть, что источник света должен находиться от наблюдателя на расстоянии больше чем c2 /g =9×1015 метров, чтобы свет никогда не догнал этого наблюдателя, двигающегося вечно с таким ускорением. Полученная величина даже больше размера Сол-


§ 7. О некоторых свойствах чёрных дыр

131

нечной системы. Мы оставляем соответствующие вычисления в качестве упражнения для читателя. Безусловно, свет не сможет догнать частицу только при её вечном ускорении. При более правдоподобном движении частицы, о котором мы говорили в конце предыдущего пункта, набранная ею скорость будет меньше световой. Действительно, ведь наклон касательной к гиперболе по отношению к оси t всегда меньше 45 градусов (рис. 2.25). Поэтому мировая линия фотона её обязательно пересечёт, т. е. он догонит частицу, как бы далеко позади ни находился его источник, если только частица не ускоряется вечно. 7.5. Аналогия с чёрными дырами Оказывается, те явления, которые мы рассмотрели выше, очень похожи на происходящие в окрестности чёрной дыры. Чёрной дырой называется небесное тело, которое настолько сильно сжато, что даже свет не может выйти наружу из его окрестности. Например, если Солнце сжать до размеров шара радиуса в 2,7 км, то оно превратится в чёрную дыру. Мы здесь не будем рассказывать о механизмах формирования чёрных дыр, а обсудим некоторые из их широко известных свойств. Границей окрестности чёрной дыры, из которой свет не может выйти наружу, является так называемый горизонт событий, или горизонт чёрной дыры. В фиксированный момент времени он выглядит как сфера. С точки зрения того, кто находится очень близко к такой сфере, она выглядит практически как плоская поверхность, если имеет достаточно большой радиус. В этой ситуации формула (2.17) хорошо описывает метрику в самой окрестности горизонта. Тогда ρ задаёт расстояние до горизонта, а величина c2 /l — ускорение свободного падения, вызванное гравитацией чёрной дыры. Точнее, можно показать, что эта величина задаёт ускорение свободного падения в нерелятивистском приближении, но для нас здесь это уже просто техническая подробность. В таком случае горизонт событий в плоскости (ct, x) совпадает с верхней из асимптот гипербол. Иными словами, он является поверхностью, которая задаётся уравнением x = ct и заполняет при этом всю плоскость y и z. Как мы обсудили


132

Лекция 2. Общая теория относительности

в конце п. 7.2, этот горизонт задаётся следующими уравнениями в координатах ρ и τ: ρ=0 и

τ → +Ì.

(2.18)

Действительно, свет из области за этой поверхностью не может проникнуть в область перед ней. Это явление как раз хорошо описывает ту ситуацию, которая и возникает при наличии горизонта событий, а именно тот факт, что горизонт можно пересечь только в одну сторону, а в другую — нельзя, т. е. в чёрную дыру можно упасть, но вырваться из неё уже невозможно. Всё сказанное выше в § 7 не является случайным, ведь — напомним, что создание общей теории относительности фактически началось с формулировки так называемого принципа эквивалентности, который утверждает, что однородное гравитационное поле эквивалентно равноускоренному движению. Не следует путать однородную метрику с однородным гравитационным полем. В то время как однородная метрика может описывать искривлённое пространство-время (как мы видели выше на примере расширяющейся Вселенной), однородное гравитационное поле отвечает плоскому пространствувремени. Гравитационное поле называется однородным, если его силовые линии параллельны друг другу. Иными словами, однородное гравитационное поле можно выключить, перейдя в свободно падающую систему отсчёта, или, наоборот, включить, перейдя в равноускоренную систему отсчёта в плоском пространстве-времени. Действительно, если поле абсолютно однородно, то при свободном падении его невозможно заметить никаким способом, потому что такая ситуация не отличается от свободного движения с постоянной скоростью в пустом плоском пространстве. При этом, просто двигаясь в ракете с постоянным ускорением в плоском пространстве-времени, мы будем чувствовать, что давим на пол, точно так же, как в однородном гравитационном поле. Подчеркнём, что в неоднородном поле на разных высотах мы давим на пол по-разному. Далее, тяжёлый шарообразный объект (планета или звезда) создаёт неоднородное гравитационное поле, но в очень маленькой области оно похоже на од-


§ 7. О некоторых свойствах чёрных дыр

133

нородное. Размер этой области должен быть много меньше радиуса кривизны шара. Неоднородность гравитационного поля ощущается через приливные силы. Например, из-за такой неоднородности макушка свободно падающего человека притягивается к центру слабее пяток. Измеряя такую разность сил, в принципе можно проверить наличие реальной гравитации. Всё описанное выше происходит из-за равенства между инерциальной и гравитационной массой и является частным случаем общей ковариантности. Ведь, как мы объяснили выше, переход в равноускоренную систему отсчёта и обратно связан с координатным преобразованием в пустом плоском пространстве-времени, в котором реальное (не однородное) гравитационное поле отсутствует. Неоднородное гравитационное поле, соответственно, нельзя выключить, просто перейдя в свободно падающую в нём систему отсчёта. Другими словами, кривое пространство-время невозможно сделать плоским заменой координат. Все эти наблюдения связаны с определением кривизны через параллельный перенос, которое мы приводили ранее. Можно показать, что кривизна напрямую связана с наличием приливных сил. Более того, всё это согласуется с тем, что метрика Риндлера (2.17) задаёт однородное гравитационное поле, которое только приближённо описывает ситуацию в окрестности чёрной дыры, где её поле можно считать приближённо однородным. Чёрная дыра, конечно же, искривляет пространство-время и создаёт неоднородное гравитационное поле. В заключение этой лекции мы расскажем о другом интересном явлении, которое может увидеть наблюдатель, висящий над чёрной дырой или вечно ускоряющийся в плоском пространстве. Оно формулируется следующим образом. Мировая линия тела, которое свободно падает в чёрную дыру или просто покоится в пространстве-времени Минковского, является вертикальной прямой линией, как изображено на рис. 2.26. Мировая линия наблюдателя, висящего над чёрной дырой или вечно ускоряющегося, задаётся гиперболой ρ = const. Понятно, что свободно падающее тело пересечёт горизонт событий чёрной дыры за конечное время по собственным


134

Лекция 2. Общая теория относительности

ρ = const τ=Ì τ = const

τ = −Ì

Рис. 2.26. Вертикальная прямая — это мировая линия покоящегося тела. Помимо неё здесь изображена координатная сетка в метрике Риндлера

часам. Чтобы в этом убедиться, нужно посчитать длину мировой линии на рис. 2.26 из любой конечной её точки в правом квадранте до горизонта и поделить её на скорость света c. С другой стороны, как следует из обсуждения вокруг уравнения (2.18), чтобы тело пересекло горизонт событий, потребуется бесконечно много времени τ в координатах Риндлера. А это значит, что висящий над чёрной дырой наблюдатель никогда не увидит, как свободно падающее тело пересекает горизонт событий. То же самое верно и в системе отсчёта вечно ускоряющегося наблюдателя — он никогда не увидит, как свободно летящее тело в пространстве Минковского пересекает поверхность, задающуюся уравнениями (2.18). Заметим также, что фотон, испущенный или рассеянный телом в момент пересечения горизонта событий на рис. 2.26, не будет получен наблюдателем, двигающимся вдоль гиперболы, ни за какое конечное время. Ведь такой фотон будет двигаться вдоль горизонта событий — по асимптоте гиперболы.


§ 7. О некоторых свойствах чёрных дыр

135

В результате наблюдатель, висящий над чёрной дырой, следя за телом, которое находится в самой окрестности чёрной дыры, будет видеть бесконечно замедляющийся и вечный процесс приближения падающего тела к горизонту событий. На этом мы завершаем наш рассказ об общей теории относительности.


ЛЕКЦ И Я 3 КВАНТОВАЯ МЕХАНИКА • • • • • • • • • • • •

О различных типах волн Интерференция Корпускулярно-волновой дуализм Комплексные числа Математика интерференции Вероятностная интерпретация квантовой механики Принцип Гюйгенса — Френеля и интеграл Фейнмана по путям Переход от квантовой к классической механике (или что такое измерение) Соотношение неопределённостей Гейзенберга Квантование уровней энергии и туннелирование Парадокс Эйнштейна — Подольского — Розена Парадокс кота Шрёдингера

При первом знакомстве с квантовой механикой, как правило, наибольшее недоумение вызывает так называемый корпускулярно-волновой дуализм. Действительно, может ли один и тот же объект, элементарная частица или квант, вести себя то как волна, то как материальная точка? Разве это не взаимоисключающие возможности? Однако при более глубоком изучении предмета основную сложность начинает представлять интерпретация квантовой механики, особенно её вероятностная часть. Цель этой лекции — сначала понять, откуда берётся корпускулярно-волновой дуализм и что это такое, а затем перейти к более сложным вопросам. В самом конце мы обсудим некоторые парадоксы в квантовой механике. Обычно человек представляет себе элементарные частицы как материальные точки, ассоциируя их с чем-то подобным крупицам пыли или песчинкам. Откуда возникает такое пред-


§ 1. О различных типах волн

137

ставление? Скорее всего, из ассоциаций, связанных с повседневным жизненным опытом. Ассоциация эта ничем не плоха и может быть взята за рабочую гипотезу. Но её нельзя принять за окончательный ответ и отвергнуть все противоречащие ей эксперименты, опираясь только на такие наблюдения, в которых элементарные частицы ведут себя как материальные точки. Никакое изначальное предположение нельзя сразу брать за окончательный ответ. Как раз наоборот — любое априорное представление об устройстве мира необходимо по возможности подвергать независимой проверке всеми доступными способами. Хорошей независимой проверкой, как известно, является эксперимент (конечно, если есть возможность его проделать). В данном случае, к счастью, можно поставить много разных опытов, что и было уже давно сделано. Пользуясь их результатами, мы опишем то, что открывает нам природа. В рассказе о корпускулярно-волновом дуализме мы рассмотрим свет, а не электроны. У света проще увидеть волновые свойства, а у электрона — свойства материальной точки. Дело в том, что электроны, которые присутствуют в используемых нами приборах, имеют очень короткую длину волны, фактически такую, как у рентгеновского излучения, тогда как электромагнитные волны вокруг нас часто бывают практически любой длины в достаточно широком диапазоне. (Связь между длиной волны и поведением квантов как материальных точек станет ясна из дальнейшего обсуждения.) § 1. О различных типах волн В рамках классической электродинамики свет — это электромагнитная волна. Ниже в этой лекции мы обсудим, когда верно такое описание света. Также некоторые из экспериментальных подтверждений данного факта мы рассмотрим в следующем параграфе, а сейчас разберёмся подробнее, что такое плоская, сферическая и цилиндрическая волна и какие у них свойства. Эксперименты, подтверждающие электромагнитную природу света, мы здесь затрагивать не будем — на эту тему написано много хороших научно-популярных книг и учебников.


138

Лекция 3. Квантовая механика

Как было рассказано на предыдущей лекции, плоская волна, двигающаяся со скоростью света c в положительном направлении вдоль оси x, может иметь, например, следующий профиль: E(t, x) = A cos[k(ct − x) + ϕ0 ]. (3.1) Уравнение (3.1) описывает профиль изменения электрического поля E(t, x). В электромагнитной волне в пространстве и во времени колеблются именно электрические и магнитные поля (профиль магнитного поля B(t, x) имеет аналогичную форму). В волне эти поля везде и всегда равны по величине и направлены перпендикулярно друг другу и оси распространения, как изображено на рис. 3.1. y E~

c

~ B

O

E~

~ B z E~

x

~ B

Рис. 3.1

Таким образом, в уравнении (3.1) функция E(t, x) — это компонента вектора электрического поля вдоль какого-то направления, перпендикулярного оси x. Подробное объяснение поведения электромагнитных полей в волне требует решения уравнений Максвелла и выходит за рамки наших лекций. Мы же примем обсуждаемое поведение полей как факт, следующий из совокупности экспериментальных данных. Напомним некоторые положения прошлой лекции, связанные со свойствами волн. Аргумент косинуса в формуле (3.1), т. е. величина ϕ = k(ct − x) + ϕ0 , называется фазой волны, ϕ0 — начальная фаза, т. е. её значение при t = 0 и x = 0. Волновой вектор k связан с частотой ν соотношением kc = 2πν.


§ 1. О различных типах волн

139

Частота ν — это количество колебаний в волне в единицу времени. Тогда период колебаний определяется как T = 1/ν. Длина волны — это расстояние между её соседними гребнями — положениями, где электрическое и магнитное поля принимают наибольшие значения. (Гребни волны отвечают следующим значениям фазы: ϕ = . . ., −2π, 0, 2π, 4π, . . . ) В таком случае длина волны (3.1) равна λ = cT = c/ν. Из указанных здесь формул нетрудно увидеть, что волновой вектор и длина волны связаны соотношением k = 2π/λ. Таким образом, чем меньше частота, тем больше длина волны, и наоборот — чем больше частота, тем меньше длина волны. В формуле (3.1) число k — это модуль, или, что то же самое, длина волнового вектора. В общей ситуации фаза будет определяться как ~ x~) + ϕ0 , ϕ = kct − (k, где k~ = (k𝑥 , k𝑦 , k𝑧 ) как раз и есть волновой вектор, который задаёт направление распространения волны и её частоту, а по величине равен q ~ = k𝑥2 + k𝑦2 + k𝑧2 . k = |k| Помимо этого, ~ x~) = k𝑥 x + k𝑦 y + k𝑧 z (k, — так называемое скалярное произведение вектора k~ на вектор x~ = (x, y, z). При этом поворотом системы координат в пространстве ~ а тогда последось x всегда можно направить вдоль вектора k, нее выражение для фазы сведётся к формуле (3.1). Именно поэтому для упрощения изложения мы начали обсуждение с более простого выражения. Волна, определённая в уравнении (3.1), называется монохроматической, так как у неё одна заданная частота и направление распространения, которые определяются волновым вектором. Однако в повседневной жизни мы видим свет, который является наложением (суммой) большого количества таких волн, как (3.1), с немного отличающимися векторами k~ и амплитудами (к обсуждению этого явления мы вернёмся позже). В отличие от плоской, сферическая волна имеет практически точечный источник и распространяется от него во все сто-


140

Лекция 3. Квантовая механика

роны в пространстве. В этом процессе у неё уменьшается амплитуда, так как энергия равномерно распределена по сфере, радиус которой растёт по мере распространения волны. Пример такой волны был рассмотрен на прошлой лекции. Сейчас мы обсудим свойства сферической волны немного подробнее и приведём определяющие её формулы. Волновые фронты сферической волны, положения её гребней представляют собой концентрические сферы, расширяющиеся из центра, формирующего излучение. Для сравнения мы здесь изобразили, как выглядят фронты плоской (рис. 10 а на вклейке) и сферической (рис. 10 б на вклейке) монохроматических волн. Можно показать, что энергия электромагнитного поля, приходящаяся на единицу объёма, пропорциональна сумме квадратов электрического и магнитного полей в ней. А поток энергии (интенсивность излучения или яркость) пропорционален произведению электрического и магнитного полей. Из общих соображений понятно, что эта энергия (или поток в единицу площади) в сферической волне уменьшается обратно пропорционально квадрату расстояния до источника, т. е. как 1/r 2 . Ведь она равномерно распределена по всей площади сферы, радиус которой как раз и растёт с расстоянием до источника. Поэтому амплитуда волны должна уменьшаться обратно пропорционально расстоянию до источника, т. е. в сферической волне электрическое поле может вести себя, например, следующим образом: E(t, r) =

D cos[k(ct − r) + ϕ0 ]. r

(3.2)

Здесь r > 0 — это расстояние от источника волны до её фронта. Видно, что в этом случае амплитуда убывает как раз по закону A = D/r, где D — это некоторая константа, а энергия в волне уменьшается соответственно как A2 = (D/r)2 . Сферическая волна действительно решает волновое уравнение в четырёхмерном пространстве-времени, но электромагнитные волны не бывают идеально сферическими. Причина заключается в том, что источник электромагнитных волн не может иметь идеальную сферическую симметрию, т. е. световое излучение может лишь приближённо описываться


§ 1. О различных типах волн

141

формулой (3.2). Дело в том, что уравнения Максвелла не совсем то же самое, что волновые уравнения. Такое усложнение уже выходит за рамки наших научно-популярных лекций однако мы поясним данное явление исходя из общефизических соображений. Представьте себе равномерно заряженную сферу, радиус которой колеблется в некоторых пределах, т. е. эта сфера как бы «дышит», сохраняя свою идеальную симметричную форму. Несмотря на то, что в этой ситуации заряд вроде бы совершает движение с ускорением, излучения не возникает. Действительно, за пределами своей поверхности равномерно заряженная сфера создаёт такое же электрическое поле, как точечный заряд, находящийся в её центре независимо от её радиуса. И при этом сфера не создаёт магнитного поля, т. е. в данной ситуации никакие колеблющиеся электрические и магнитные поля вообще не возникают, а поэтому не возникает и излучение. Для возникновения электромагнитного излучения необходимо наличие более тонкой характеристики, чем заряд: по крайней мере необходим так называемый дипольный момент, который меняется во времени. Специалистам по радиолокации хорошо известно, что по этой же причине излучение практически не возникает, если излучатели радиолокатора (они в некотором роде и являются теми самыми дипольными моментами) расположены на сфере и их фазы синхронизованы, т. е. нельзя создать идеальную сферическую радиолокационную антенну, которая будет работать одинаково хорошо во всех направлениях. А вот звуковую волну в принципе можно сделать идеально сферически симметричной, т. е. такой, как в уравнении (3.2). Вернёмся к обсуждению волн различного типа. Аналогично сферической цилиндрическая волна может иметь следующий профиль: D r

E(tr) = p cos[k(ct − r) + ϕ0 ].

(3.3)

Поверхности постоянной фазы у такой волны имеют форму цилиндра радиуса r, который определяет расстояние от фронта волны до оси формирования излучения (рис. 3.2). Энергия цилиндрической волны равномерно распределяется по площади цилиндра, а последняя растёт пропорцио-


142

Лекция 3. Квантовая механика

Рис. 3.2

нально первой степени радиуса — ведь вдоль оси цилиндра его размер не меняется. Поэтому в формуле (3.3) амплитуда и убывает как квадратный корень из радиуса r. В заключение заметим, что электромагнитные волны бывают разной частоты. Самые низкие частоты отвечают радиоволнам. Их длина в принципе может принимать сколь угодно большие значения. Далее при увеличении частоты получаются инфракрасные волны, а потом — видимый свет. Длина волны видимого света составляет несколько сотен нанометров — порядка 10−7 метра. Из видимого света самая низкая частота у красного цвета, а самая высокая — у фиолетового. Затем по мере увеличения частоты мы получим ультрафиолет, рентгеновское излучение и в конце концов — гамма-излучение. § 2. Интерференция Откуда мы делаем вывод, что свет ведёт себя как волна? Возможно, читатель знаком с опытом Юнга, в котором проявляются волновые свойства света — возникает интерференция. Мы начнём с описания этого опыта и условий, при которых он реализуется. Эти подробности нам понадобятся в дальнейшем. На самом деле интерференция возникает, когда мы имеем дело с волнами любой природы, даже с волнами на воде. Так что такая упорядоченная картина, как на рис. 11 (см. вклейку), вполне может возникнуть и на поверхности воды — при желании читатель может попробовать создать её у себя дома в ванной.


§ 2. Интерференция

143

Для опыта Юнга нам понадобятся экран с двумя плоскими щелями в форме вытянутых прямоугольников, монохроматический источник света и ещё один экран или стена, на которой наблюдается само явление интерференции, как изображено на рис. 12 (см. вклейку). Для щелей в форме круга интерференционная картина будет несколько сложнее изображённой на рис. 12. Это, возможно, станет ясно после общефизического обсуждения ниже в этом параграфе и после разбора математической модели интерференции ниже в этой лекции. На рис. 11 (см. вклейку) набегающая сзади волна создаёт колебания в отверстиях, которые становятся источниками интерферирующих волн. Представим себе теперь, что на воде возникает такая же картина, как на рис. 11, но добились мы её не за счёт монохроматической плоской волны сзади экрана, а бросив два камня в каждое из отверстий. Если размеры и массы камней совпадают, равны силы, с которыми их бросили, и одновременны моменты бросков, то картина будет такой же упорядоченной, как на рис. 11. Если же какие-то из перечисленных условий не будут выполнены, то симметричная интерференционная картина не появится. При совпадении указанных параметров для брошенных камней говорят о когерентности волн от двух щелей. В случае света аналогами этих параметров являются частота, амплитуда и значения фаз в отверстиях. Интерференционную картину для света лучше всего наблюдать в вакууме, т. е. экраны следует поместить в пустоту. В принципе интерференцию можно увидеть и не в вакууме, но тогда такая симметричная картина, как изображена на рис. 12 (см. вклейку), сохранится только при относительно малом расстоянии между экранами. Дело в том, что свет от двух щелей может рассеиваться на взвесях и неоднородностях окружающего газа. Всё это приводит к потере когерентности между интерферирующими волнами и к размытию картины по мере увеличения расстояния между экранами. Действительно, представьте себе, как в случае волн на воде изменится картина на рис. 11 (см. вклейку), если вокруг экрана с двумя щелями в разных местах будут находиться хаотически разбросанные свободно плавающие буи разных масс и размеров. Безусловно, в таком случае некоторая симметричность картины будет соблюдаться только на достаточно


144

Лекция 3. Квантовая механика

λ

λ

Рис. 3.3. На левом рисунке изображено условие возникновения тёмного, а на правом — светлого пятна

небольших расстояниях от экрана со щелями при условии, что плотность разброса буёв невелика. Понятно, что буи являются здесь аналогами взвесей в воздухе (пыли и неоднородностей плотности), на которых может рассеиваться световая волна. Причины возникновения интерференции показаны на рис. 3.3. Если в точке экрана сходится пик волны от одного из отверстий со впадиной от другого, как изображено на рисунке слева, то мы увидим тёмное пятно. Если же сходятся пики или впадины от обеих щелей, как изображено справа, то получится светлое пятно. В отличие от волн на воде, впадина в случае света не означает затемнение. Напротив, впадина — это тот же пик, но с противоположной фазой. Действительно, как мы уже обсудили, в электромагнитной волне колеблются электрические и магнитные поля. Волнистая линия на рис. 3.3 может изображать, например, профиль колебаний электрического поля. Тогда на гребне это поле направлено в одну сторону, а во впадине — в противоположную. Когда пик (гребень) волны от одного источника совпадает со впадиной от другого, электрические поля от двух волн гасят друг друга. То же самое происходит и с магнитными полями. А там, где нет полей, интенсивность света равна нулю, т. е. получается тёмное пятно. При совпадении же пиков или впадин поле удваивается и получается светлое пятно. Дело в том, что интенсивность света (или иначе яркость) пропорциональна энергии,


§ 2. Интерференция

145

которую несёт волна, т. е., как следует из сказанного выше, пропорциональна квадрату величины электрического или магнитного поля: в электромагнитной волне эти поля равны по величине, поэтому их произведение пропорционально квадрату любого из них. Таким образом, направление складывающихся полей (как в пике или как во впадине) на яркость света не влияет. Когерентности источников можно добиться также, если вместо щелей поставить две узкие прямоугольные монохроматические лампы с полностью синхронизированными частотами, амплитудами и фазами. Однако технически этого добиться довольно трудно; когерентность достигается проще, если возбуждения в щелях созданы одной волной, которая падает на экран со щелями сзади. Такую волну можно создать, расположив на пути исходного некогерентного излучения дополнительный экран (самый левый на рис. 13, см. вклейку) с одной плоской щелью и светофильтром. В таком случае свет, прошедший через щель в самом левом экране, будет с хорошей точностью описываться цилиндрической волной, которая задаётся уравнением (3.3). Точность будет тем выше, чем уже и длиннее щель. Форма такой волны будет существенно отличаться от цилиндрической только у коротких границ отверстия, являющегося вытянутым прямоугольником (как мы условились выше). Для того чтобы фазы колебаний волн в двух отверстиях в промежуточном экране на рис. 13 (см. вклейку) совпадали, цилиндрическая волна в окрестности каждого из них должна быть по свойствам близка к плоской, т. е. необходимо, чтобы расстояние между щелями было намного меньше радиуса цилиндрической волны, или, что то же самое, намного меньше расстояния между левым и промежуточным экранами на рис. 13. Зачем надо соблюдать все описанные выше условия? Как уже говорилось выше, обычный белый солнечный свет, который мы наблюдаем ежедневно, состоит из многих волн различной длины и интенсивности. Ещё точнее — он состоит из так называемых волновых пакетов (цугов), каждый из которых, в свою очередь, состоит из отдельных монохроматических волн. Можно сказать, что дневной свет аналогичен картине, которая получается, если хаотично и с разной


146

Лекция 3. Квантовая механика

силой кинуть в воду большое количество камней разного веса и размеров. Именно поэтому для наблюдения интерференции от солнечного света перед щелью в самом левом экране на рис. 13 (см. вклейку) следует поставить цветное стекло или светофильтр, чтобы через отверстие проходил набор волн в малом диапазоне частот. Помимо этого, щели и в первом, и во втором экране должны быть достаточно узкими. Насколько велика или мала ширина щели, определяется её отношением к длине волны. По этой причине светофильтр лучше ставить красного цвета, так как в таком случае длина волны наибольшая в видимом диапазоне и, соответственно, ширину щели можно сделать больше. Для чего нужно, чтобы щели были достаточно узкими? Раз важно только отношение длины волны к ширине отверстия, то можно менять и частоту света, а ширину щелей оставить неизменной. Сейчас мы поясним, почему дело обстоит именно так. Для определённости зафиксируем длину волны, а менять будем ширину щели. Рассмотрим, что будет происходить с одной волной на поверхности воды при прохождении через одно отверстие (рис. 3.4). Видно, что отклонения волны от плоской формы возникают только в окрестности границ щели. После прохождения отверстия волна существенно отличается от плоской только на рис. 3.4 в, когда ширина отверстия оказывается порядка или меньше длины волны.

а)

б)

в)

Рис. 3.4. Волны на рис. (а), которые возникают в области геометрической тени (за границами отверстия), имеют маленькую амплитуду. По мере уменьшения ширины щели амплитуда волн в области геометрической тени значительно усиливается, как показано на рис. (б) и особенно (в)


§ 2. Интерференция

147

Аналогичная ситуация возникает и в случае света. Эмпирически можно вывести следующий факт. Если верно соотношение d 1, (3.4) λ

которое означает, что ширина отверстия d намного больше длины волны λ, то прошедшая волна практически не отличается от плоской. Если же, наоборот, d 1, λ

(3.5)

то прошедшая волна близка к цилиндрической форме. Данные факты можно получить и математически из свойств волн, имеющих вид, приведённый в уравнениях (3.1)–(3.3), но это выходит далеко за рамки наших лекций. В результате если источником создаются волны очень короткой длины, а щели соответственно достаточно широкие, то интерференционная картина вообще может не возникнуть, так как не будет области на экране, в которой пересекаются волны от двух щелей. Мы просто увидим отдельные пятна (рис. 3.5). Описанное явление означает, что в пределе при очень коротких длинах волн мы из волновой получаем геометрическую оптику, в которой поведение света описывается лучами Э

S

A B

Рис. 3.5. Если бы щели A и B промежуточного экрана были достаточно широкие по сравнению с длиной волны, то на экране Э не возникало бы области, где волны, создаваемые этими щелями, пересекаются. Соответственно вместо интерференционной картины видны бы были просто два пятна. Можно показать, что ширина пятен на экране Э зависит от величины отношения d/λ. При этом интерференционная картина возникает на экране Э только в той области, где пересекаются волны от щелей A и B


148

Лекция 3. Квантовая механика

Рис. 3.6. Волновой пакет может быть локализован, т. е. иметь конечные размеры в пространстве и конечную продолжительность во времени. Можно показать, что фигура, изображённая здесь, является результатом наложения большого количества монохроматических волн с немного различными волновыми векторами в определённом диапазоне

(можно сказать, траекториями цугов, или, что то же самое, волновых пакетов), а не волнами. Иными словами, в некотором смысле мы переходим от описания излучения в виде волн к его представлению в терминах локализованных в пространстве цугов, траекториями которых и являются лучи. Чтобы пояснить обсуждаемое в предыдущем абзаце явление, заметим, что отдельная плоская монохроматическая волна занимает всё пространство-время, как видно из формулы (3.1). Если же запустить узкий цуг, т. е. такой волновой пакет, как изображённый на рис. 3.6, через широкую щель, как показано на рис. 14 (см. вклейку), то он пройдёт через неё практически без отклонений. При этом следует учитывать, что любой сигнал, который мы наблюдаем, длится конечное время и занимает ограниченную область пространства. Оказывается, такой сигнал состоит из отдельных цугов, каждый из которых, в свою очередь, состоит из большого числа монохроматических волн. Выше мы уже несколько раз упоминали это свойство реальных электромагнитных сигналов. Теперь мы готовы перейти к обсуждению того, какие наблюдения привели учёных к заключению о том, что в природе существует так называемый корпускулярно-волновой дуализм.


§ 3. Корпускулярно-волновой дуализм

149

§ 3. Корпускулярно-волновой дуализм Подчеркнём, что эксперименты, подтверждающие корпускулярно-волновой дуализм, исторически были устроены несколько иначе, однако сегодня постановка опыта, аналогичного описанному ниже, не составит особого труда. Более того, возможно, что кто-то именно такой эксперимент уже ставил, но нам неизвестна точная ссылка на соответствующую статью в научном журнале. Описанный ниже опыт больше подходит для публикации в педагогическом журнале, так как ничего нового научному сообществу, кроме, возможно, несколько иной методики изложения предмета для студентов и школьников, не несёт. А именно, мы здесь собрали вместе в одном мысленном эксперименте результаты нескольких реально поставленных опытов, которые были проделаны разными людьми на протяжении всего XX века. Итак, пусть интерференционная картина создаётся не за счёт солнечного света, а с использованием какого-то искусственного монохроматического источника, в котором мы можем менять интенсивность и частоту излучения (или ширину щелей) в широком диапазоне. Допустим, что мы начинаем наращивать яркость излучения источника с нуля. Какая картина получится на экране (стенке) при очень низкой интенсивности? Оказывается, на нём будут периодически высвечиваться точки, как изображено на рис. 3.7.

Рис. 3.7


150

Лекция 3. Квантовая механика

Конечно, такое явление невозможно увидеть невооружённым взглядом. Для этого поверхность экрана должна быть устроена так, чтобы усиливать сигнал от каждого источника. Если же постепенно увеличивать интенсивность, то получится именно то, что изображено на рис. 12 (см. вклейку). Казалось бы, из этих наблюдений можно сделать вывод, что свет состоит из точечных частиц (они называются квантами или фотонами). Действительно, если интенсивность велика, то фотонов очень много. Поэтому теперь мы можем видеть коллективный эффект и просто не различаем отдельные акты рассеяния или взаимодействия фотонов с поверхностью экрана. Но нельзя спешить с выводами, не проверив всё основательно! Нужно полностью использовать возможности прибора, который у нас имеется, и аккуратно провести измерения во всех ситуациях, которые могут быть реализованы. Например, что, если мы не будем наращивать интенсивность, а просто начнём запоминать те места, где на экране происходят всплески от фотонов? Пусть интервалы времени между двумя последовательными засвечиваниями точек больше, чем расстояние от источника излучения до стенки, делённое на скорость света. В принципе можно сделать периоды между отдельными всплесками на экране сколь угодно длительными, существенно уменьшая интенсивность. При таких условиях фотоны засвечивают именно те места, где в интерференционной картине имеются светлые пятна, и не попадают туда, где имеются затемнения, как показано на рис. 3.8. Читатель может спросить, а куда же они ещё могут попадать, если составляют именно тот световой поток, который создаёт интерференционную картину. Что нового мы можем извлечь из этого наблюдения? Однако следует признать, что такое поведение частиц, как на рис. 3.8, является крайне удивительным и совсем не похожим на картину, которую могут создать обычные маленькие шарики. Дело в том, что материальные точки, попадая в отверстия в промежуточном экране и рассеиваясь на их границах, создали бы самое большее две полосы, как показано на рис. 3.9. Действительно, при более интенсивном рассеянии частиц на


§ 3. Корпускулярно-волновой дуализм

Рис. 3.8

151

Рис. 3.9

границах щелей эти пятна могли бы оказаться сильно размазанными или даже перекрывали бы друг друга, но больше, чем две полосы при двух отверстиях, точечные частицы не засветили бы ни при каких обстоятельствах. Что может запретить шарикам попадать в те места, где имеются затемнения в интерференционной картине? Как мы подчеркнули выше, можно добиться того, чтобы пока один фотон не попадёт на экран, следующий ещё не возникал из источника, т. е. обсуждаемая интерференционная картина из засвеченных точек не могла бы возникнуть из-за взаимодействия отдельных фотонов между собой. Начнём теперь менять ширину щелей d или же частоту света c/λ. Когда отношение d/λ окажется много больше единицы, что отвечает пределу геометрической оптики, интерференционная картина пропадёт и мы увидим как раз то, что изображено на рис. 3.9, — два пятна вместо интерференционной картины, т. е. обсуждаемые здесь кванты (фотоны) начнут вести себя буквально как частицы. Но и это ещё не вся история! Поставим теперь детектор в одну из двух щелей, и пусть если квант (фотон) проходит через эту щель, то детектор издаёт щелчок, если же проходит через вторую щель, то не издаёт. Оказывается, в этом случае интерференционная картина пропадёт при любом размере щелей и мы просто увидим всплески именно в тех местах, где должны находиться пятна согласно законам геометрической оптики.


152

Лекция 3. Квантовая механика

Итак, свет высокой интенсивности проявляет себя как электромагнитная волна, а очень низкой — в виде так называемых квантов, иногда ведущих себя как волны (которым интерференция запрещает попадать в затемнённые места), а иногда как частицы (которые оставляют всего лишь точки на экране). Но если отдельный квант — это волна, то волна чего? Всё, что мы обсуждали выше, было фактом объективной реальности, которая имеется в нашем распоряжении как данность. Любой человек, располагая соответствующими приборами и аккуратно выполнив все условия, описанные выше, может воспроизвести подобный эксперимент. Теперь же мы перейдём к интерпретации и, что весьма важно, математическому описанию наблюдаемых здесь явлений. При этом важно, чтобы наша интерпретация не противоречила другим экспериментальным наблюдениям из всей имеющейся совокупности. Какие ответы на возникшие в эксперименте вопросы даёт современная фундаментальная физика? Вся совокупность опытных данных говорит о том, что до момента столкновения с экраном и после него отдельный квант ведёт себя как некоторая волна. А именно, такая волна, амплитуда которой в данной точке (например, экране) определяет вероятность того, что квант окажется там и будет взаимодействовать с экраном или с детектором. На экране фотон может, например, воздействовать на какую-то молекулу в его составе, приводя к химической реакции. В любом случае столкновение должно приводить к возникновению точечного пятнышка на экране. При этом чем выше вероятность попадания фотона в определённую область экрана, тем больше там происходит актов взаимодействия и, соответственно, точек, а чем ниже — тем меньше. В результате мы и получаем чередование светлых и тёмных областей — интерференцию на двух щелях от волны вероятности самой с собой. Всё это аналогично ситуации с электромагнитным излучением или волнами любой другой природы. Подчеркнём, что между моментами рождения из источника и взаимодействия с экраном или с детектором, а затем и после взаимодействия квант представляет собой замкнутую микроскопическую систему. В момент же взаимодействия происходит размыкание этой системы, так как она входит в контакт с чем-то внешним и большим, макроскопическим.


§ 4. Комплексные числа

153

Здесь стоит ещё раз повторить сказанное во введении: мы можем потратить годы жизни на обсуждение того, из чего состоит волна вероятности, или же того, что такое электромагнитное поле и соответствующая волна. Но для физика важно, что и то и другое явление описываются некоторыми уравнениями, в которых одни и те же элементы имеют различную интерпретацию, в зависимости от того, идёт ли речь об электромагнитной волне или волне вероятности. Далее мы приведём подтверждение этому факту с использованием математических формул. Мы надеемся, что читателю теперь понятно, что если поместить детектор в одно из отверстий, то когерентность между волнами вероятности из двух щелей теряется (в каком смысле, мы обсудим ниже, а сейчас подчеркнём ещё раз, что в момент взаимодействия с детектором квант перестаёт быть изолированной системой). Также если длина обсуждаемой волны вероятности слишком коротка по сравнению с шириной отверстий, т. е. выполнено условие (3.4), то интерференционная картина пропадает по той же причине, по которой она исчезает в случае волн на воде или электромагнитного излучения. В последнем случае поведение кванта вообще ничем не отличается от поведения частицы. В заключение этого параграфа заметим, что всё сказанное выше про свет и электромагнитные волны верно также и для электронов. Но для них технически сложно получить высокую интенсивность и большую длину волны, т. е. интерференционную картину для электронов создать сложнее, чем для фотонов, именно из-за того, что в «повседневной жизни» (в приборах и аппаратах широкого пользования) мы сталкиваемся с электронами, которые имеют очень короткую длину волны и относительно невысокую плотность потока. § 4. Комплексные числа В предыдущих главах, чтобы разобраться в некотором сложном предмете из фундаментальной физики, мы изучали основы какой-то новой для школьников области математики: для разбора специальной теории относительности применялись элементы геометрии Минковского, для общей


154

Лекция 3. Квантовая механика

теории относительности — геометрия на сфере и гиперболоидах различного типа. Приходилось иметь дело и с дифференциальным исчислением. Теперь для математической формулировки законов квантовой механики нам понадобятся элементы комплексного и векторного анализа. Для начала обсудим понятие числа на более привычных примерах. Как известно, для счёта используют натуральные числа 1, 2, 3, . . . Но для решения алгебраических уравнений учёные сначала ввели нуль, 0, а затем отрицательные числа −1, −2, −3, . . . После этого им пришлось вводить рациональные числа ±1/2, p ±1/3,p±2/3,p±5/6, . . . и наконец иррациональные числа ± 2, ± 3, ± 2/3, . . . Всё это происходило по мере усложнения решаемых задач. Все перечисленные выше величины относятся к множеству так называемых действительных чисел. (Правда среди них есть и те, которые никаких алгебраических уравнений с рациональными коэффициентами не решают, например, e и π. Они называются трансцендентными. Но это для нас здесь совсем не важно — мы подчеркнули данный факт лишь для полноты картины.) Оказывается, действительные числа не покрывают всё множество возможных решений алгебраических уравнений. Рассмотрим, например, ситуацию, когда дискриминант квадратного уравнения ax 2 + bx + c = 0 отрицательный: b2 −4ac < 0. В этом случае p приходится вводить так называемую мнимую единицу: i = −1, и, соответственно, i2 = −1. Можно доказать теорему, что с использованием этого нового числа покрываются уже все возможные решения алгебраических уравнений. Основой комплексного анализа как раз и является эта мнимая единица. Наше введение в понятие числа было очень кратким и наивным с точки зрения строгой науки, но мы предпочитаем обсуждать различные понятия из физики и математики, рассматривая конкретные примеры, которые нам пригодятся в дальнейшем, а не вводя строгие аксиомы. Нам здесь важна наглядность. На наш взгляд, определения стоит давать, когда разобрано большое количество конкретных примеров. Обра-


§ 4. Комплексные числа

155

тим лишь внимание на то, что все психологические сложности, которые возникали у учёных и были связаны с введением новых типов чисел, отражены в их названиях. В частности, практически в каждом случае потребовалось несколько десятков, а то и сотен лет, прежде чем математики свыклись с новым типом чисел и стали с лёгкостью с ними обращаться. Достаточно вспомнить, например, историю с открытием иррациональных чисел школой Пифагора. Итак, комплексным является такое число, которое имеет вид z = x + i y, где x и y являются действительными. Произвольное решение любого алгебраического уравнения всегда можно представить именно таким образом. Далее, у каждого комплексного числа z есть комплексно-сопряжённое число z, которое имеет вид z = x − i y. Сопряжённым же к z является само число z, т. е., дважды применив операцию сопряжения, мы возвращаемся обратно к исходному числу. Комплексные числа можно представлять графически, как показано на рис. 3.10. Тогда единичный вектор по оси x задаётся просто как (1, 0), а по оси y — как (0, i). Горизонтальная ось в таком случае называется действительной и обозначается y 3i 3 + 2i

2i i

−3 −2 −1

0 −i

1

−2i −3i Рис. 3.10

2

3

x


156

Лекция 3. Квантовая механика

Re z, а вертикальная — мнимой и обозначается Im z, т. е. z = = Re z + i Im z, или x = Re z, а y = Im z. Таким образом, в данном случае мы y имеем определённое соответствие между z2 двумерными векторами (x, y) и комплексными числами z = x + i y. Это удобно для графического представления алгебраичеz1 ских операций. Например, результат сумx мы двух чисел Рис. 3.11

z1 = x1 + i y1

и

z2 = x2 + i y2

изображён на рис. 3.11 и определяется следующим образом: z1 + z2 = (x 1 + x2 ) + i( y1 + y2 ). Это соответствует сумме двух векторов: (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ). Аналогичным образом нетрудно связать разность двух комплексных чисел с разностью двух векторов. Мы оставляем это в качестве упражнения для читателя. Далее, произведение комплексного числа z и действительного числа a определяется как az = ax + iay и отвечает растяжению вектора (x, y). А вот умножение на комплексное число уже не имеет очевидного аналога в терминах двумерных векторов и определяется следующим образом: z1 z2 = (x1 + i y1 )(x2 + i y2 ) = = x1 x2 + i(x1 y2 + y1 x2 ) + i2 y1 y2 = = (x1 x2 − y1 y2 ) + i(x1 y2 + y1 x2 ), где мы просто раскрыли скобки, проделали элементарные алгебраические операции и воспользовались тем, что i 2 = −1. Ниже мы поясним геометрический смысл этой операции, когда введём иное представление комплексных чисел. Зная, что такое сопряжение и как задаётся произведение, можно определить модуль комплексного числа: p Æ |z| = zz = x 2 + y 2 .


§ 4. Комплексные числа

157

Проверку последнего равенства мы оставляем в качестве упражнения для читателя. Заметим, что модуль комплексного числа совпадает с длиной соответствующего вектора. Существует ещё одно представление комплексных чисел, ради которого мы и затеяли рассказ о них и которое, в частности, позволяет наглядно представить процедуру умножения. А именно, оказывается, любое комплексное число можно записать следующим образом: z = ρe𝑖ϕ = ρ(cos ϕ + i sin ϕ). Здесь ρ=

Æ

x 2 + y 2 = |z|

— это модуль числа z, tg ϕ =

x , y

x = ρ cos ϕ

и

y = ρ sin ϕ,

где ϕ — это так называемая фаза комплексного числа z. В обсуждаемом представлении используется формула Эйлера e𝑖ϕ = cos ϕ + i sin ϕ. Её доказательство требует знания высшей математики. Однако, чтобы понять происхождение этой формулы, можно рассмотреть комплексное число, модуль которого равен единице |z0 | = 1. Его всегда получится представить как z0 = cos ϕ + i sin ϕ, ведь cos2 ϕ + sin2 ϕ = 1. При этом, как изображено на рис. 3.12, все возможные комплексные числа, модуль которых равен единице, лежат на единичной окружности с центром в начале координат. Из обсуждаемого представления видно, что умножение произвольного z = ρe𝑖ϕ на комплексное число z0 = e𝑖α , модуль которого равен единице, сводится просто к вращению фазы по окружности, как раз изображённой на рис. 3.12: ze𝑖α = ρe𝑖(ϕ+α) . Здесь мы проделали элементарные алгебраические операции и воспользовались основным свойством экспоненты: e𝑎 e𝑏 =e𝑎+𝑏 .


158

Лекция 3. Квантовая механика

Im i

eiϕ = cos ϕ + i sin ϕ

sin ϕ

ϕ 0 cos ϕ

1

Re

Рис. 3.12. Графическое представление формулы Эйлера

В такой форме умножение двух произвольных комплексных чисел выглядит особенно просто: z1 z2 = ρ1 e𝑖ϕ1 ρ2 e𝑖ϕ2 = ρ1 ρ2 e𝑖(ϕ1 +ϕ2 ) . Соответственно умножение вектора (x, y) на комплексное число ρe𝑖ϕ геометрически можно интерпретировать как его растяжение на ρ и поворот на угол ϕ. Зачем нам нужны комплексные числа? Как было сказано в начале этого параграфа, они возникли при решении алгебраических уравнений, но помогут нам в удобном представлении решений волновых уравнений. Дело в том, что, как мы объясняли на прошлой лекции, функции cos[k(ct − x) + ϕ0 ] и

sin[k(ct − x) + ϕ0 ]

по отдельности решают волновое уравнение. Нетрудно увидеть, что решением также является и любая их линейная комбинация a cos[k(ct − x) + ϕ0 ] + b sin[k(ct − x) + ϕ0 ] (с произвольными комплексными коэффициентами a и b, которые не зависят от времени и пространственных координат).


§ 5. Математика интерференции

159

Следовательно, и выражение e−𝑖[𝑘(𝑐𝑡−𝑥)+ϕ0 ] тоже решает волновое уравнение (как частный случай для a = 1 и b = i). В таком представлении движение волны сводится просто к вращению фазы. Действительно, если зафиксировать t, но менять x или же, наоборот, оставить неизменным x, а двигаться вдоль координаты t, то фаза волны совершает вращение по окружности, изображённой на рис 3.12. Как мы увидим ниже, такое представление движения волны сильно упрощает вычисления и интерпретацию многих формул. § 5. Математика интерференции Следующие два параграфа содержат достаточно сложные вычисления для человека, знакомого только со школьным курсом физики и математики. Однако для того, чтобы понять оставшуюся часть нашего рассказа о квантовой механике, их надо проработать. Мы воспользуемся здесь приобретёнными знаниями, чтобы математически описать интерференционную картину. Вернёмся к рис. 12 на вклейке и рис. 3.3 и рассмотрим монохроматические цилиндрические волны, зарождающиеся в двух щелях. Пусть расстояние между отверстиями и экраном, на котором наблюдается интерференция, равно L, а расстояние между самими отверстиями мы возьмём равным 2l для удобства записи формул. Напомним, что 2l намного меньше L. Также пусть оси x и y задают координатную сетку на экране и её начало находится посередине между щелями. При этом пусть ось y параллельна длинной стороне отверстий, а ось x — короткой, т. е. y направлена вдоль линий симметрии цилиндрических волн, которые проходят через щели, как показано на рис. 3.13. Далее, в силу цилиндрической симметрии вдоль координаты y картина интерференции практически не меняется, если мы не выходим в область геометрической тени над и под щелями, как это и видно из рис. 12 на вклейке, т. е. в дальнейшем мы вовсе можем забыть о зависимости от y. В частности, в цилиндрической волне r — это модуль (длина) двумерного радиус-вектора в плоскости, перпендикулярной оси симметрии цилиндра y.


160

Лекция 3. Квантовая механика

y x

L

2l Рис. 3.13

Рассмотрим теперь две волны от отверстий, которые сходятся в точке x при произвольном значении y. Расстояние от одной из щелей до этой точки равно q r1 = L2 + (x − l)2 , а от другой — r2 =

q

L2 + (x + l)2 .

Здесь r1 — модуль радиус-вектора из первой щели в точку x, а r2 — из второго отверстия в ту же точку. Интенсивность в момент времени t, как мы уже знаем, пропорциональна квадрату величины суммарного поля от обоих щелей в точке x:

𝑖{𝑘(𝑐𝑡−𝑟1 )+ϕ0 }

e e𝑖{𝑘(𝑐𝑡−𝑟2 )+ϕ0 } 2 p p I(x) = |E(t, r1 ) + E(t, r2 )|2 =

+

= =

e

𝑖{𝑘(𝑐𝑡−𝑟1 )+ϕ0 }

p

r1

×

+

e

r1 𝑖{𝑘(𝑐𝑡−𝑟2 )+ϕ0 } p

r2

r2

×

e𝑖{𝑘(𝑐𝑡−𝑟1 )+ϕ0 } e𝑖{𝑘(𝑐𝑡−𝑟2 )+ϕ0 } p p + . r1 r2

(3.6)

Здесь мы воспользовались формулой (3.3) для цилиндрической волны и равенством |z|2 = zz.


§ 5. Математика интерференции

161

При сопряжении комплексной экспоненты e𝑖ϕ нужно лишь поменять знак перед мнимой единицей, т. е. e 𝑖ϕ = e−𝑖ϕ . Поэтому I(x) =

e𝑖{𝑘(𝑐𝑡−𝑟2 )+ϕ0 } e𝑖{𝑘(𝑐𝑡−𝑟1 )+ϕ0 } p p + r1 r2

×

×

e−𝑖{𝑘(𝑐𝑡−𝑟2 )+ϕ0 } e−𝑖{𝑘(𝑐𝑡−𝑟1 )+ϕ0 } p p + r2 r1

=

=

1 e𝑖𝑘{𝑟1 −𝑟2 } 1 e𝑖𝑘{𝑟2 −𝑟1 } + p + . + p r1 r2 r2 r 1 r1 r 2

Здесь на последнем шаге мы раскрыли скобки и воспользовались тем, что e𝑖ϕ e−𝑖ϕ = 1. Далее, чтобы упростить формулы, можно воспользоваться тем, что l намного меньше L, и показать, что Æ Æ r1 − r2 = L2 + (x − l)2 − L2 + (x + l)2 = L2 + (x − l)2 − (L2 + (x + l)2 ) p = L2 + (x − l)2 + L2 + (x + l)2 4xl 2l p =p ≈ − x. 2 2 2 2 L L + (x − l) + L + (x + l)

=p

Здесь мы умножили и разделили выражение в самой верхней строке данной цепочки равенств на Æ Æ L2 + (x − l)2 + L2 + (x + l)2 . Затем в числителе использовалось равенство (a + b)(a − b) = = a2 − b2 и были раскрыты скобки. А на последнем шаге мы пренебрегли l и x по сравнению с L в знаменателе. При этом предполагалось, что x меняется в пределах, которые много меньше L. Размер реальной интерференционной картины действительно намного меньше чем L. Для дальнейшего упрощения обсуждаемых выражений можно опять воспользоваться тем, что l намного меньше L, и пренебречь им в знаменателях E(t, r1 ) и E(t, r2 ): q q p 4 4 2 4 L + (x − l)2 ≈ L2 + x 2 ≈ L2 + (x + l)2 , так как наличие l там слабо сказывается на зависимости интенсивности I от x.


162

Лекция 3. Квантовая механика

Наши приближения могут быть не вполне ясны человеку, знакомому лишь со школьной математикой. В таком случае важно понимать, что, зная высшую математику, учёный всегда может вычислить отброшенные вклады и проверить, насколько они малы по сравнению с теми, что были оставлены. Таким образом, получаем 1 e𝑖𝑘{𝑟2 −𝑟1 } e𝑖𝑘{𝑟1 −𝑟2 } 1 I(x) = + p ≈ + p + r1

≈p

r2 r 1

1 L2 + x 2

2+e

r2 2𝑙 −𝑖𝑘 𝑥 𝐿

r1 r 2

2𝑙 𝑖𝑘 𝑥 𝐿

+e

.

Вспомним о формуле Эйлера и используем её в последнем выражении: 2𝑙 2𝑙 1 −𝑖𝑘 𝑥 𝑖𝑘 𝑥 I(x) = p 2+e 𝐿 +e 𝐿 = =p

L2 + x 2 1 L2 + x 2

2l 2l 2 + cos k x + i sin k x + L

L

2l 2 1 + cos k x L p = . L2 + x 2

2l 2l + cos k x − i sin k x L L

Таким образом, собирая все полученные в этом параграфе формулы вместе, мы получаем, что интенсивность меняется вдоль горизонтальной оси x по следующему закону: 2l 2 1 + cos kx L p I(x) ≈ . L2 + x 2

(3.7)

Это выражение хорошо описывает картинку, изображённую на рис. 12 p (см. вклейку). Действительно, I(x) колеблется от нуля до 2/ L2 + x 2 и убывает с увеличением x — по мере удаления от оси симметрии y между двумя щелями. § 6. Вероятностная интерпретация квантовой механики В вычислении, проделанном в предыдущем параграфе, нигде не использовалась природа волн, из которых получается интерференция. Мы проводили вычисления так,


§ 6. Вероятностная интерпретация квантовой механики

163

p будто I(x) — это яркость света в точке x, а функция e𝑖𝑘(𝑐𝑡−𝑟) / r описывает изменение компонент электромагнитных полей в пространстве-времени. Однако если речь идёт об отдельных фотонах, то, как мы подчеркнули выше, I(x) — это вероятность найти квант в точке x, т. е. формула такая же, но интерпретация её элементов несколько иная. Попробуем рассказать об этой интерпретации так, чтобы она стала понятна человеку, знакомому только со школьной математикой и физикой, но используя новые математические понятия, введённые на этой лекции. Для этого нам придётся обсудить ещё одну тему из математики. А именно, рассмотрим простейшее векторное пространство, с которым мы сталкиваемся на уроках математики в школе, — двумерную плоскость. Любая точка на ней может быть задана в виде вектора (направленного в неё из начала координат), который записывают в виде строки (x1 , x2 ). Другая возможность — записать вектор в виде столбца x1 . x2

При этом говорят, что строка — это вектор, сопряжённый столбцу. И наоборот — столбец сопряжён строке. Можно ввести правило умножения вектора-строки на вектор-столбец: y (x1 , x2 ) 1 = x1 y1 + x2 y2 , y2

результатом которого является скалярное произведение двух векторов. Всё сказанное в предыдущих двух абзацах можно обобщить на случай пространств большей размерности и тех ситуаций, когда компоненты векторов x и y являются комплексными числами. Тогда, например, сопряжённый трёхмерному комплексному столбцу z1 z2 z3

вектор будет записываться как (z1 , z2 , z3 ). Какое отношение это имеет к квантовой механике? Дело в том, что в этой теории рассматривают так называемое про-


164

Лекция 3. Квантовая механика

странство состояний, а оно, оказывается, тоже является векторным. Следуя Дираку, сопряжённые векторы в пространстве состояний называют бра и кет. Термины бра и кет происходят от английского слова bracket — скобка. Сейчас мы на конкретном примере разберёмся, как работать с такими векторами и соответствующими пространствами. Итак, в квантовой механике уравнение (3.6) интерпретируют следующим образом. До того как попасть на экран, квант находится одновременно в двух состояниях — он прошёл через первое или второе отверстие, т. е. фотон находится в так называемой суперпозиции двух обсуждаемых состояний. В обозначениях квантовой теории данная ситуация записывается формулой, которая схематически выглядит так: |квант до столкновения со стенкой〉 = = |квант прошёл через щель номер 1〉 + + |квант прошёл через щель номер 2〉. Величина |квант до столкновения со стенкой〉 является как раз кет-вектором в пространстве состояний. В этом пространстве также есть и кет-вектор |x, t〉, описывающий ситуацию, в которой квант находится в точке x на экране в момент времени t. Кет-векторы можно считать полными аналогами столбцов, которые мы описали чуть выше в этом параграфе. Есть также и бра-векторы 〈квант до столкновения со стенкой| = = 〈квант прошёл через щель номер 1| + + 〈квант прошёл через щель номер 2| и 〈x, t|, которые сопряжены соответствующим кет-векторам. Ещё раз подчеркнём, что бра- и кет-векторы можно прямо так себе и представлять — как столбцы и строки. Только размерность пространства состояний может быть значительно больше, чем два или три. Оно вполне может быть бесконечным или даже континуальным: таким, в котором «индекс», нумерующий компоненты векторов, пробегает непрерывные, а не дискретные значения. Если немного абстрагироваться, то это не так уж и сложно себе представить. Далее мы рассмот-


§ 6. Вероятностная интерпретация квантовой механики

165

рим подобную ситуацию, когда будем обсуждать так называемый интеграл по путям. Скалярное произведение сопряжённого вектора бра 〈x, t| на кет |квант до столкновения со стенкой〉 называется амплитудой перехода кванта из состояния до столкновения с экраном в положение в точке x в момент времени t: Ψ(x, t) = 〈x, t|квант до столкновения со стенкой〉 = = 〈x, t|квант прошёл через щель номер 1〉 + + 〈x, t|квант прошёл через щель номер 2〉. Также, в зависимости от контекста, Ψ(x, t) могут называть волновой функцией кванта. Величина Ψ(x, t) решает волновое уравнение. В случае фотона такое уравнение следует из теории Максвелла, а когда речь идёт о нерелятивистском электроне, то Ψ(x, t) решает, соответственно, так называемое уравнение Шрёдингера. Если же электрон движется с релятивистской скоростью, его волновая функция определяется так называемым уравнением Дирака, которое переходит в уравнение Шрёдингера только в нерелятивистском пределе. Обычно, однако, в случае фотонов вместо Ψ(x, t) используют обозначение E(x, t), подчёркивая тем самым электромагнитное происхождение соответствующей волновой функции. Мы же в этом параграфе используем Ψ(x, t) лишь потому, что это стандартное обозначение в квантовой механике. В принципе неважно, как обозначать ту или иную величину, а важно понимать, что стоит за тем или иным вычислением и обозначением. Уравнение Шрёдингера для свободного нерелятивистского кванта, который двигается в трёхмерном пространстве и имеет массу m, записывается следующим образом: ∂Ψ(t, x, y, z) = ∂t i 2 h ∂2 Ψ(t, x, y, z) ∂2 Ψ(t, x, y, z) ∂2 Ψ(t, x, y, z) }h =− + + , 2 2 2 2m ∂x ∂y ∂z

i}h

(3.8)

где }h — это постоянная Планка. Это и есть простейшее нерелятивистское волновое уравнение в трёхмерном пространстве. Простейшее же релятивистское волновое уравнение имеет


166

Лекция 3. Квантовая механика

вид 2 2 1 ∂ Ψ(t, x, y, z) ∂ Ψ(t, x, y, z) − − 2 2 c ∂t ∂x 2 ∂2 Ψ(t, x, y, z) ∂2 Ψ(t, x, y, z) − − = 0, ∂ y2 ∂z2

(3.9)

и мы обсуждали его аналог на предыдущей лекции, где вместо скорости света c стояла произвольная скорость v. Как обсуждалось в начале лекции, приближённые решения уравнения (3.9) (когда L намного больше длины волны, которая определяется величиной k) в данном случае имеют вид p 2 2 e𝑖𝑘(𝑐𝑡− 𝐿 +(𝑥−𝑙) ) 〈x, t|квант прошёл через щель номер 1〉 = Æ 4 L2 + (x − l)2

и

p 2 2 e𝑖𝑘(𝑐𝑡− 𝐿 +(𝑥+𝑙) ) . 〈x, t|квант прошёл через щель номер 2〉 = Æ 4 L2 + (x + l)2

Также и сумма этих выражений приближённо решает уравнение (3.9). Наконец, в квантовой механике вероятность обнаружить квант в точке x определяется как квадрат модуля волновой функции: I(x) = |Ψ(x, t)|2 . Таким образом, одни и те же формулы (3.6) и (3.7) описывают одновременно две физически разные ситуации — интенсивный свет и отдельные кванты. § 7. Принцип Гюйгенса — Френеля и интеграл Фейнмана по путям Вернёмся к интерференционной картине. Нам сейчас неважно, создаётся ли она отдельными фотонами (волнами вероятности) или же интенсивным электромагнитным излучением. Пусть для определённости это будут отдельные кванты. Рассмотрим рис. 3.14, который схематично описывает ситуацию, изображённую на рис. 13 (см. вклейку). От источника (слева) до точки наблюдения (справа) волна вероятности


§ 7. Принцип Гюйгенса — Френеля и интеграл Фейнмана

167

2 1

4

3

Рис. 3.14. Вдоль звеньев под номерами 1, 2, 3 и 4 у волны набегают фазы ϕ1 , ϕ2 , ϕ3 и ϕ4 соответственно

прошла два пути — через первую и вторую щели. Как мы подчеркнули выше, когда излучение дошло до отверстий, их уже можно считать источниками волн, которые интерферируют. Чтобы получить ответ на вопрос об интенсивности в точке наблюдения, необходимо взять сумму волновых функций, отвечающих двум путям, как мы объясняли в предыдущем параграфе. Амплитуда вероятности для конкретного пути (для любой из двух ломаных на рис. 3.14, состоящих из пары звеньев 1 и 2 либо 3 и 4) получается умножением экспоненты от фазы, отвечающей одному из её звеньев, на экспоненту от фазы для другого звена: I = |e𝑖ϕ1 e𝑖ϕ2 + e𝑖ϕ3 e𝑖ϕ4 |2 = |e𝑖(ϕ1 +ϕ2 ) + e𝑖(ϕ3 +ϕ4 ) |2 . Представим себе теперь, что имеется больше экранов и в них больше отверстий, как изображено на рис. 3.15. Интерфе-

1

2

3

Рис. 3.15. Фаза, набегающая, например, вдоль ломаной γ, состоящей из звеньев 1, 2 и 3, равна ϕγ = ϕ1 + ϕ2 + ϕ3 . Для того чтобы получить амплитуду вероятности, необходимо просуммировать e𝑖ϕγ по всем ломаным γ


168

Лекция 3. Квантовая механика

ренционная картина, безусловно, изменится, но, чтобы найти величину волновой функции в точке наблюдения (справа), нам придётся просуммировать экспоненты от набегающих фаз вдоль всех возможных ломаных от источника до точки наблюдения. А фаза для данной ломаной есть сумма фаз для каждого из её звеньев. Далее, предположим, что мы будем увеличивать количество экранов и щелей в каждом из них. В конце концов экраны полностью заполнят всё пространство между точками излучения и наблюдения, а щели в них покроют целиком сами экраны. Что мы получим в результате? Очевидно, то, что изображено на рис. 3.16. А именно, чтобы найти величину волновой функции в точке наблюдения, нам необходимо просуммировать экспоненты фаз для всех возможных путей от источника до неё. Обсуждаемая сумма, соответственно, выглядит так: X K(t1 , x~1 | t2 , x~2 ) = e𝑖ϕγ12 , (3.10) γ12

P𝑁 где знак 𝑛=1 f𝑛 — это стандартное математическое обозначение суммы каких-то величин f𝑛 , зависящих, как правило, от дискретной переменной n, которая может, например, пробегать значения от 1 до N. В нашем же случае суммирование ведётся по всевозможным траекториям γ12 от источника x~1 в точку наблюдения x~2 , а каждому пути приписывается соответствующая фаза e𝑖ϕγ12 , которая набегает, если пройти e𝑖ϕγ

γ

Рис. 3.16


§ 7. Принцип Гюйгенса — Френеля и интеграл Фейнмана

169

вдоль γ12 . Эта экспонента от фазы e𝑖ϕγ12 называется весом траектории γ12 в сумме, стоящей в правой части уравнения (3.10). Слово «сумма» здесь используется условно, потому что все возможные траектории пробегают не дискретные, а непрерывные значения. Корректнее здесь использовать слово «интеграл». (Вспомним, что интеграл — это бесконечная сумма бесконечно малых величин.) Именно поэтому обсуждаемое выражение (3.10) называется интегралом, а не суммой Фейнмана. Математически строгое определение такого интеграла является сложной задачей даже для человека, знакомого с высшей математикой, но здесь нам такого определения и не потребуется. Величина K(t1 , x~1 | t2 , x~2 ) определяет амплитуду вероятности обнаружить квант в точке x~2 в момент времени t2 , если он был излучён из точки x~1 в момент времени t1 . А квадрат модуля |K(t1 , x~1 | t2 , x~2 )|2 определяет соответствующую вероятность перехода. Подчеркнём, что существует связь между K(t1 , x~1 | t2 , x~2 ) и Ψ(x, t), но объяснение её конкретного вида выходит далеко за рамки наших лекций. Нам же здесь достаточно понимать, что K(t1 , x~1 | t2 , x~2 ) и Ψ(x, t) можно рассматривать как объекты схожей природы. Действительно, K(t1 , ~x1 | t2 , ~x2 ) решает то же волновое уравнение (3.9) или (3.8), что и Ψ(x, t), в зависимости от того, идёт ли речь о фотонах или же о нерелятивистских электронах соответственно. Отличие между K(t1 , x~1 | t2 , x~2 ) и Ψ(x, t) заключается лишь в постановке двух разных задач, решениями которых они и являются: можно показать, что у одного и того же волнового уравнения имеется много различных решений в зависимости от так называемых начальных или граничных условий. Итак, формула (3.10), с одной стороны, содержит распространяющуюся волну от источника в точку наблюдения, а с другой — суперпозицию (сумму) всевозможных траекторий между заданными двумя положениями. На самом деле физическая картина, которую мы описали, не так уж и безумна, как может показаться на первый взгляд. Более того, в случае обычного света или волн на воде она известна учёным ещё со времён Гюйгенса, который был старшим современником Ньютона. Однако математический ап-


170

Лекция 3. Квантовая механика

парат для обсуждаемого явления был разработан Френелем лишь в XIX веке. Элементы этого аппарата мы и применили в параграфе про математическое описание интерференции. Итак, принцип Гюйгенса — Френеля утверждает следующее. Как изображено на рис. 3.17, если окружить источник волны некоторой поверхностью, до которой излучение уже дошло, то все точки этой поверхности можно считать излучателями вторичных волн. При этом величину поля в какой-то ещё точке можно вычислить наложением (интерференцией) всех волн от вторичных источников, как показано на рис. 3.17. Более того, можно рассмотреть распространение волны поэтапно, как изображено на рис. 3.18. Как показано на самой

Рис. 3.17

Рис. 3.18


§ 8. Переход от квантовой к классической механике

171

левой картинке, сначала волна дошла до какой-то щели. Тогда каждая точка этого отверстия начинает играть роль источника, который порождает вторичные волны. Новый фронт является результатом интерференции этих волн, как показано на втором рисунке слева. Теперь уже точки нового фронта играют роль источников «третичных» волн и т. д. Представим себе теперь, что все источники первичных, вторичных, третичных и т. д. волн один за другим соединены прямыми отрезками, как это схематично показано на рис. 3.17. Мы получим всевозможные ломаные, соединяющие исходный источник с конечной точкой наблюдения, а в пределе при измельчении шагов — всевозможные пути (3.10). § 8. Переход от квантовой к классической механике (или что такое измерение) Фаза в формуле (3.10) имеет очень важный физический смысл. Она выражается через так называемое действие Sγ12 следующим образом: ϕγ12 =

Sγ12 , }h

где }h — это постоянная Планка. Оказывается, в классической механике частица движется по такой траектории γ12 , для которой действие Sγ12 принимает своё минимальное значение. Это утверждение называется принципом наименьшего действия, который, как мы обсудили в начале лекции 2, обобщает принцип Ферма. Исторически действие именно так и возникло в классической механике материальных точек, а уже потом была найдена его связь с фазой волны. В оптике же Sγ12 называется эйконалом и его минимальное значение определяет линию, вдоль которой направлен световой луч, — можно сказать, траекторию цуга или фотона, в зависимости от того, идёт ли речь об интенсивном излучении или об отдельных квантах. Заметим при этом, что, как видно из формулы (3.10), квантовая частица движется не по одной, а по всем возможным траекториям и каждая траектория γ12 в сумме (3.10), как говорят, берётся с весом e𝑖𝑆γ12 /}ℎ . В простейшем случае для свободного фотона, траектория которого является прямой


172

Лекция 3. Квантовая механика

линией, действие (или эйконал) имеет вид S = Et − ( p~, x~), где E = }hω — это энергия кванта, ω = 2πν = kc — его циклическая частота, а p~ = }hk~ — импульс, который связан с волно~ При этом, как нетрудно видеть вым вектором k. Et − ( p~, x~) ~ x~). = kct − (k, }h

(3.11)

Полученные знания позволят нам обсудить принцип наименьшего действия, а заодно и понять, в каком пределе квантовая механика переходит в классическую. Рассмотрим интеграл Фейнмана для кванта: X K(t1 , x~1 | t2 , x~2 ) = e𝑖𝑆γ12 /}ℎ . γ12

Сумма в нём берётся по всем возможным путям γ12 . Рассмотрим ситуацию, когда она сильно упрощается. А именно, пусть для какой-то траектории γ12 в сравнении со всеми остальными путями γ12 выполнены следующие условия: 1

Sγ Sγ12 12 , }h }h

(3.12)

даже если эти пути слабо отличаются от γ12 . Например, эти условия выполняются в случае, описанном формулой (3.4), — в ситуации, когда длина волны фотона относительно мала. Здесь стоит вспомнить уравнение (3.11) и сопоставить его с уравнением (3.12) и с законами геометрической оптики, а также осознать, что в обсуждаемой ситуации при характер~ x~) имеет тот же порядок, что ных значениях | x~| величина (k, и отношение d/λ. В результате можно показать, что в пределе, когда верны соотношения (3.12), сумма по путям сильно упрощается и мы получаем, что K(t1 , x~1 | t2 , x~2 ) ≈ e𝑖𝑆γ12 /}ℎ , где γ12 — не что иное, как кратчайший путь из x~1 в x~2 , а Sγ12 — соответствующее минимальное действие. Грубо говоря, в таком случае основной вклад в сумму по путям даёт γ12 , так как результат суммы всех остальных γ12 пренебрежимо мал. Это связано с тем, что при отклонении от γ12 в силу усло-


§ 8. Переход от квантовой к классической механике

173

вий (3.12) вес e𝑖𝑆γ12 /}ℎ быстро осциллирует и, соответственно, быстро меняет знак. Интуитивно этот факт можно понять, заметив, что интеграл от периодической функции по любому количеству периодов равен нулю. Строгое доказательство этого факта выходит за рамки нашего курса, но мы надеемся, что читателю будет достаточно общефизических соображений и мотивации, которую мы привели при обсуждении предела геометрической оптики. Действительно, всё, что было сказано в предыдущих двух абзацах, в случае с интерференцией фактически означает, что можно забыть о сумме и считать, что квант летит только по прямому (кратчайшему) пути от источника до экрана и засветит точку там, где будет одно из двух пятен в пределе геометрической оптики. В результате мы получаем классическую механику из квантовой. Этот переход в квантовой механике называется квазиклассическим приближением (или пределом). В случае интенсивного света это же явление называют приближением геометрической оптики. Далее, можно показать, что если вы начнёте прикреплять (посредством какого-то взаимодействия) к одной квантовой частице вторую, третью и т. д., как это происходит, например, с ионами в кристалле, то действие, описывающее коллективное движение частиц, будет увеличиваться. (Например, можно рассмотреть такую цепочку из шариков (квантов), взаимодействующих друг с другом по закону Гука, как мы описали на лекции 2, посвящённой общей теории относительности.) В конце концов для достаточно большого объекта, состоящего из огромного числа элементарных составляющих, получится ситуация, которая описывается соотношениями (3.12). В результате движение крупного объекта, т. е. коллективное движение всех его микроскопических составляющих вместе, будет описываться классическими законами, а не квантовыми. Именно поэтому камень, снаряд, ракета или спутники летят по траекториям, определяемым из законов классической механики, а не по всевозможным путям. При этом в принципе движение крупных тел можно описывать и при помощи суммы по траекториям, но вероятность отклонения большого объекта от классического пути никогда не сможет измерить ни один прибор. Мы хотим сказать, что


174

Лекция 3. Квантовая механика

описание движения, например, камня с использованием законов квантовой механики — это превышение точности. А ведь искусство физика как раз и заключается в том, чтобы найти оправданное приближение для решения задачи. Наконец, измерение в квантовой механике — это взаимодействие маленькой квантовой системы с большой классической, а не с чьим-то сознанием. Большой классической системой может быть экран или детектор. Для маленькой квантовой системы верно, что Sγ12 ®1 }h

практически для всех траекторий γ12 , тогда как для большой классической системы хорошо выполняются соотношения (3.12). Из рассказа о корпускулярно-волновом дуализме мы помним, что фотон до и после взаимодействия с экраном, прибором или детектором является замкнутой системой. В момент взаимодействия кванта с детектором или экраном происходит её размыкание. При этом если квантовая система остаётся замкнутой, то волновая функция является решением волнового уравнения, но к процессу измерения последнее уравнение уже неприменимо, потому что волновое уравнение Шрёдингера описывает только замкнутую систему. § 9. Соотношение неопределённостей Гейзенберга Взгляд на кванты как на волны позволяет достаточно легко понять многие из мистических свойств квантовой механики. Например, вернёмся к обсуждению формул (3.4) и (3.5) для обычной электромагнитной волны. Эти соотношения иногда формулируются в иной эквивалентной форме. Действительно, пусть ось x направлена вдоль короткой стороны щели, а ширина отверстия равна ∆x. Можно показать, что тогда у монохроматической волны после прохождения щели появится разброс в значениях волнового вектора порядка ∆k𝑥 вдоль направления x, который удовлетворяет соотношению ∆k𝑥 ∆x ¦ 1. То же верно и вдоль длинной стороны щели. Видно, что чем шире отверстие, т. е. чем больше ∆x, тем меньше разброс ∆k𝑥 , т. е. тем меньше отличается волна от плос-


§ 10. Квантование уровней энергии и туннелирование

175

кой. И наоборот — чем уже щель, тем больше разброс, т. е. ситуация эквивалентна той, что описана в уравнениях (3.4) и (3.5). Более того, если продолжительность цуга равна ∆t, то разброс частот ∆ω у мод, из которых состоит волновой пакет, удовлетворяет соотношению ∆ω∆t ¦ 1. В частности, эти неравенства показывают, что монохроматическая волна, для которой ∆ω = 0 и ∆k~ = 0 (так как у неё есть единственный волновой вектор и единственная связанная с ним частота), имеет бесконечную продолжительность и заполняет всё пространство. Действительно, достаточно взглянуть на уравнение (3.1), чтобы понять, что плоская монохроматическая волна присутствует при всех значениях x и t. Реальный же свет состоит из волновых пакетов, которые имеют конечную продолжительность ∆t и конечный пространственный размер |∆~x |. Поэтому они состоят из целого спектра монохроматических волн с неко~ торым разбросом по частотам ∆ω и волновым векторам ∆k. В квантовой механике обсуждаемые соотношения приобретают новый смысл, если обе их части умножить на постоянную Планка и применить к волне вероятности. Действительно, как уже было сказано, например, в конце лекции 1, импульс ~ кванта связан с волновым вектором соотношением p~ = }hk, а энергия связана с частотой соотношением E = }hω. Тогда из полученных выше неравенств следуют так называемые соотношения неопределённостей Гейзенберга: ∆p𝑥 ∆x ¦ }h

и

∆E∆t ¦ }h.

Эти неравенства означают, что координату кванта вдоль направления x и его импульс вдоль этого же направления p𝑥 нельзя измерить одновременно с точностью выше, чем ∆x и ∆p𝑥 , которые удовлетворяют одному из указанных здесь соотношений. То же самое верно для времени и энергии, а также для импульсов и координат вдоль других осей. § 10. Квантование уровней энергии и туннелирование Этот параграф очень технический, и его можно пропустить. Здесь мы рассмотрим такие явления квантовой механики, как квантование уровней энергии и туннелирование.


176

Лекция 3. Квантовая механика

До сих пор мы рассматривали уравнения, описывающие движения только свободных волн, но обсуждали иногда и распространение квантов в присутствии экранов и стенок с отверстиями, которые, в свою очередь, состоят из молекул, атомов, атомных ядер, нуклонов, электронов и т. д., т. е. тоже из квантовых частиц. Что же тогда, например, мешает фотонам или электронам лететь сквозь экраны? Очевидно, частицы стенок и экранов создают некоторые поля, например кулоновские, которые затрудняют проникновение интерферирующих фотонов или электронов сквозь стенки. Иными словами, кванты в присутствии других предметов и частиц двигаются не свободно, а под действием полей. В простейшей ситуации это внешнее воздействие можно описать с помощью потенциальных сил. Например, если для простоты рассмотреть электрон, который двигается в одном пространственном измерении в потенциале V (x), то уравнение Шрёдингера в этом случае выглядит следующим образом: i}h

∂Ψ(t, x) }h2 ∂2 Ψ(t, x) =− + V (x)Ψ(t, x). ∂t 2m ∂x 2

(3.13)

Исходно Шрёдингер рассмотрел его трёхмерный аналог с потенциалом Кулона вместо V (x) для объяснения спектральных линий атома водорода. В данном случае нам неважно, какую природу имеют уравнение (3.13) и потенциал V (x). Потенциал может создаваться отдельным тяжёлым ядром или быть результатом воздействия на квант какой-то стенки, т. е. эффективно описывать влияние целого кристалла (большого количества частиц) на отдельный квант. Рассматривая уравнение (3.13), мы обсуждаем лишь модель какой-то реальной ситуации, которая позволит нам увидеть некоторые общие свойства движения квантовых частиц под действием различных сил или полей. Простейшая ситуация возникает, когда свободный квант находится между двух так называемых бесконечных стенок (см. левую часть рис. 3.19). Они называются бесконечными, потому что внутри них V (x) = Ì. Ничего страшного в этой бесконечности нет, так как она лишь моделирует тот факт, что электрон практически ни на йоту не может проникнуть внутрь рассматриваемых стенок. При этом между экранами


§ 10. Квантование уровней энергии и туннелирование

Ψ

E

n=3

177

|Ψ|2

n=3

n=3

n=2

n=2

n=1

n=1

n=2 n=1 0

L

0

L

Рис. 3.19. Самый левый из представленных здесь рисунков изображает так называемую бесконечную потенциальную яму, в которой располагается квант, и уровни энергии, на которых он может находиться. На среднем рисунке изображены стоячие волны, отвечающие этим уровням, а на крайнем справа — соответствующие квадраты модулей волновых функций

частица свободная, т. е. там V (x) = 0. В литературе такая ситуация называется задачей о квантовой частице в бесконечно глубокой потенциальной яме. Рассмотрим решение уравнения (3.13) с заданной энергией E. Как следует из нашего обсуждения свободных волн, его можно представить в следующем виде: Ψ(t, x) = e−𝑖𝐸𝑡/}ℎ ψ(x). При подстановке этой функции в уравнение (3.13) надо воспользоваться тем, что ∂ ∂ iE Ψ(t, x) = e−𝑖𝐸𝑡/}ℎ ψ(x) = − e−𝑖𝐸𝑡/}ℎ ψ(x), ∂t ∂t }h

ведь частная производная по времени действует на функцию от пространственной координаты x как на константу, а при


178

Лекция 3. Квантовая механика

этом ∂ −𝑖𝐸𝑡/}ℎ iE e = − e−𝑖𝐸𝑡/}ℎ . ∂t }h

Далее надо воспользоваться тем, что −

}h2 ∂2 −𝑖𝐸𝑡/}ℎ e ψ(x) + V (x)e−𝑖𝐸𝑡/}ℎ ψ(x) = 2m ∂x 2 2 }h2 d ψ(x) = e−𝑖𝐸𝑡/}ℎ − + V (x)ψ(x) , 2 2m dx

ведь опять же вторая частная производная по пространственной координате действует на функцию от времени как на константу. Тогда после подстановки полученных выражений в формулу (3.13) и сокращения в левой и правой частях множителя e−𝑖𝐸𝑡/}ℎ получаем, что функция ψ(x) удовлетворяет соотношению Eψ(x) = −

2 }h2 d ψ(x) + V (x)ψ(x), 2m dx 2

(3.14)

которое называется одномерным стационарным уравнением Шрёдингера. Теперь для того, чтобы увидеть то явление, которое мы собираемся описать, даже не надо решать уравнение Шрёдингера (3.14). Так как квант, т. е. решение этого уравнения, является волной, в рассматриваемом случае должны получаться стоячие волны. Действительно, ψ(x) должно обращаться в нуль на стенках, так как вероятность проникновения частицы внутрь них равна нулю. А между стенками ψ(x) ведёт себя как свободная стоячая волна, ведь там потенциал равен нулю, что и показано на рис. 3.19 в центре. Так как в стоячей волне должно укладываться целое число полуволн (рис. 3.19), электрон в бесконечной потенциальной яме может находиться только в дискретных состояниях, которые пронумерованы числами n = 1, 2, 3, . . . на рис. 3.19. Из общих соображений можно догадаться, что чем большее количество полуволн умещается между стенками, тем больше энергия кванта в этом состоянии. Поэтому и уровни энергии электрона тоже будут квантоваться. Это означает, что уравнение (3.14) имеет решение ψ(x) не при всех значениях E, а только при каких-то E1 , E2 , E3 и т. д., при которых имеются соответствующие стоячие волны ψ1 (x), ψ2 (x), ψ3 (x) и т. д.


§ 10. Квантование уровней энергии и туннелирование

179

Оказывается, мы сейчас описали общую ситуацию. В реальности потенциальная яма вовсе не должна быть бесконечно глубокой и обязательно одномерной. Оказывается, если квант двигается только в ограниченной области, которая обусловлена наличием потенциальной силы, то его энергия обязательно квантуется, т. е. принимает дискретные, а не всевозможные значения. А волновые функции, соответственно, является многомерными аналогами стоячих волн. Проявлением этого факта является, например, то, что газ, состоящий из атомов водорода, излучает не на всех частотах, а только на тех, которые отвечают перескокам электронов между квантовыми орбитами с сопутствующим излучением фотонов соответствующей энергии. Более того, по той же причине белый свет, проходя через охлаждённый водород, поглощается именно на тех же самых частотах, что отвечает обратным перескокам электронов между дискретными уровнями с поглощением фотонов. Это и изображено на рис. 15 (см. вклейку). Перейдём теперь к явлению туннелирования. Представим себе, что потенциал V (x) имеет такой вид, как показано на рис. 16 (см. вклейку). Это барьер, в котором потенциал равен нулю везде, кроме узкой полосы, где x принимает значения от 0 до a. А в этой полосе потенциал равен константе V. Предположим, что энергия кванта E меньше, чем V. Тогда стационарное уравнение Шрёдингера (3.14) примет вид d 2 ψ(x) 2mE = − 2 ψ(x), dx 2 }h

если x не принадлежит промежутку от 0 до a, и d 2 ψ(x) 2m(V − E) = ψ(x), dx 2 }h2

если x лежит внутри этого промежутка. Заметим, что, как мы предположили в конце предыдущего абзаца, V − E > 0. В силу формулы Эйлера, о которой мы рассказали, обсуждая комплексные числа решением первого из полученных уравнений является комплексная экспонента, т. е. линейная комбинация косинуса и синуса. Такая экспонента описывает колебания в волне или вращение фазы. Решением же второго уравнения является обычная, не комплексная, экспонента.


180

Лекция 3. Квантовая механика

Иными словами, в областях x < 0 и x > a волновая функция ψ(x) описывает колебания: ψ(x) = Ae ψ(x) = Be

p 𝑖 2𝑚𝐸 𝑥 } ℎ p 𝑖 2𝑚𝐸 𝑥 } ℎ

при x < 0; при x > a,

а внутри барьера (0 < x < a) волновая функция экспоненциально убывает как p

ψ(x) = Ae

2𝑚(𝑉−𝐸) 𝑥 } ℎ

.

При этом p

B = Ae

2𝑚(𝑉−𝐸) 𝑎 } ℎ

,

потому что волновая функция не должна иметь разрывов, так как это не имеет смысла в рамках вероятностной интерпретации. На рис. 16 (см. вклейку) красными волнистыми линиями изображено осциллирующее поведение волновой функции в областях x < 0 и x > a, а синей линией — её экспоненциальный спад в области 0 < x < a. Таким образом, получается, что квант может проникать внутрь барьера — в ту область, где V > E, чего в принципе не может сделать классическая частица. Однако внутри барьера квант не является бегущей волной, а описывается функцией p

Ψ(t, x) = Ae

2𝑚(𝑉−𝐸)𝑥 } ℎ

e−𝑖𝐸𝑡/}ℎ .

В результате квантовая частица может в принципе пройти сквозь стену, если последняя достаточно тонкая. Действительно, вероятность такого проникновения (туннелирования) равна p

2 2𝑚(𝑉−𝐸)

B

−2 𝑎 } ℎ W = =e ,

A

т. е. равна квадрату модуля той величины, которая определяет, насколько уменьшилась амплитуда волновой функции внутри барьера. Эта вероятность стремится к нулю, если величина p

2m(V − E) a, }h


§ 11. Парадокс Эйнштейна — Подольского — Розена

181

стоящая в показателе экспоненты, неограниченно растёт, т. е. если V и/или a увеличиваются при сохранении остальных компонент в последнем выражении неизменными. В результате чем выше барьер или чем он шире, тем меньше вероятность того, что квантовая частица его преодолеет. Эффект туннелирования играет важную роль при объяснении, например, радиационного распада (когда альфа-частицы туннелируют наружу изнутри ядер) и в вычислении его вероятности. § 11. Парадокс Эйнштейна — Подольского — Розена Вероятностная интерпретация волновой функции Ψ(t, x) является одним из наиболее мистических понятий квантовой механики. С ней спорили многие выдающиеся учёные. В частности, Эйнштейн вместе с Подольским и Розеном описали эксперимент, который выявляет, с их точки зрения, логическое противоречие в этой интерпретации. Существует много разных описаний так называемого парадокса Эйнштейна — Подольского — Розена, но суть их всех одна и та же. Мы расскажем об одной из стандартных формулировок, которая, однако, принадлежит другим учёным. Как нам уже известно, в световой волне колебания совершают электрические и магнитные поля. При этом векторы соответствующих полей направлены перпендикулярно друг другу и оси распространения волны. Это связано с тем, что световая волна имеет так называемую поляризацию. Не все волны имеют поляризацию. Например, звуковая волна поляризации не имеет, так как является результатом продольных колебаний плотности среды вдоль оси распространения. В случае света если волна распространяется вдоль оси x, то электрическое поле может быть направлено параллельно оси y, а магнитное — вдоль оси z. Или наоборот: вектор электрического поля направлен вдоль оси z, а магнитного — вдоль оси y. Описанные здесь две ситуации отвечают двум разным поляризациям. Далее, векторы электромагнитных полей могут совершать вращения в плоскости ( y, z) по часовой стрелке, в соответствии с направлением распространения волны. Это ещё один


182

Лекция 3. Квантовая механика

тип поляризации. Вращение же против часовой стрелки отвечает другому типу поляризации. Все описанные в этом абзаце ситуации относятся к волнам с высокой интенсивностью электромагнитного излучения. А что происходит в случае отдельных фотонов? Оказывается, отдельный квант тоже может иметь поляризацию, которая в квантовой механике называется спином. Фотон имеет спин единицу, а электрон — одну вторую. В отличие от ситуации с электроном, понять что такое спин фотона, не очень трудно. А именно, интенсивная монохроматическая электромагнитная волна может иметь только определённую поляризацию, например одну из четырёх перечисленных в двух предыдущих абзацах. Квантовые же свойства проявляются в том, что спин фотона может находиться одновременно в суперпозиции нескольких вариантов поляризации. Здесь ситуация абсолютно аналогична той, что возникала с суперпозицией нескольких путей в картине интерференции. Теперь мы готовы к формулировке парадокса Эйнштейна — Подольского — Розена. Представим систему из двух фотонов, которые разлетаются в противоположные стороны, а их общая поляризация равна нулю. В случае разлёта двух интенсивных монохроматических волн общая нулевая поляризация отвечала бы просто тому, что в них электрические поля направлены противоположно друг другу. То же верно и для магнитных полей. В ситуации же с квантами общая нулевая поляризация означает, что по отдельности каждый фотон не имеет определённой поляризации. Точнее, поляризация каждого из фотонов описывается суперпозицией двух состояний. (Ещё точнее поляризацию в такой ситуации описывают в виде так называемой матрицы плотности, а не волновой функции, но для нас это уже слишком сложная техническая подробность.) А именно, для формулировки парадокса нам достаточно представлять, например, что состояние поляризации первого фотона описывается вектором |состояние спина первого фотона〉 = = |спин направлен вверх〉 + + |спин направлен вниз〉,

(3.15)


§ 11. Парадокс Эйнштейна — Подольского — Розена

183

тогда поляризация второго фотона задаётся таким состоянием, которое компенсирует данное, так что полный спин системы двух фотонов равен нулю. Для формулировки парадокса не очень важно, как именно выглядит состояние второго фотона. Итак, пусть теперь кванты отдалились друг от друга: к примеру, один из них улетел в Лондон, а второй — во Владивосток. Представим, что в Лондоне кто-то произвёл измерение поляризации первого фотона, например, пропустил его сквозь поляризационное стекло. Тогда в соответствии с законами квантовой механики его состояние изменилось — произошла так называемая редукция волновой функции. Из суперпозиции (3.15) он с какой-то вероятностью перешёл в новое чистое состояние, например, в |спин фотона вверх〉. Подчеркнём, что процесс редукции волновой функции (т. е. измерение) не описывается волновым уравнением, так как в момент измерения квант перестаёт быть замкнутой системой. Парадокс заключается в том, что в тот же самый момент, когда первый фотон в Лондоне перешёл в чистое состояние благодаря непосредственному воздействию на него прибора, второй квант во Владивостоке также изменил своё состояние — перешёл из суперпозиции в чистое состояние ровно с противоположной проекцией спина (противоположной поляризацией) безо всякого непосредственного воздействия на него. Действительно, именно так и устроена природа. Это проверено многочисленными экспериментами, которые связаны с проверкой так называемых неравенств Белла. С точки зрения Эйнштейна, Подольского и Розена, это противоречит здравому смыслу, так как означает, что можно на расстоянии воздействовать на состояние второго фотона, тем самым нарушая принцип причинности. Здесь стоит подчеркнуть, что данное явление получится увидеть, только если система двух фотонов будет оставаться всё время замкнутой на протяжении всего её разлёта на большое расстояние. Иными словами, состояния двух фотонов не должны потерять когерентности между собой. Весьма важно, что этот эксперимент отличается от ситуации с чёрным и белым шарами, с которой его часто сравнивают


184

Лекция 3. Квантовая механика

из-за недопонимания. В случае с шарами происходило бы следующее: два шара чёрного и белого цвета закрыты в коробке, и если разделить её пополам так, что в каждой части окажется по одному шару, а затем отвезти одну из половинок во Владивосток, а другую в Лондон, то, открыв первую из них, мы сразу понимаем, какой шар во второй. В данном случае нет никакого парадокса, так как второй шар с самого момента разделения коробки пополам уже имел определённый цвет, а не находился в суперпозиции состояний с двумя возможностями одновременно. Ситуация с фотонами совершенно иная именно из-за наличия суперпозиции состояний. Важно также подчеркнуть, что никакого нарушения причинности в обсуждаемом эксперименте с фотонами не происходит именно из-за вероятностной природы квантовой механики. Дело в том, что, измеряя состояние первого фотона, мы не способны заставить его иметь ту поляризацию, которую нам захочется. В результате нашего измерения в Лондоне фотон может оказаться поляризованным тем или иным образом с какой-то вероятностью, а того, как именно он окажется поляризованным, мы не можем знать заранее. Соответственно, второй фотон окажется противоположно поляризованным с той же вероятностью. Поэтому для человека, наблюдающего за вторым фотоном во Владивостоке, его переход в чистое состояние с определённой поляризацией не будет являться передачей какого-то сообщения из Лондона. Таким образом, в обсуждаемой ситуации не происходит мгновенной передачи сигнала или энергии. Это связано с тем, что невозможно поставить эксперимент, который определит саму волновую функцию или состояние кванта. Опыт позволяет определить только вероятность перехода кванта из одного состояния в другое. § 12. Парадокс кота Шрёдингера Шрёдингер также ставил под сомнение вероятностную интерпретацию квантовой механики и в спорах с Бором и Гейзенбергом на этот счёт придумал следующий мысленный эксперимент: есть коробка, в которую помещены кот и специальный прибор, содержащий небольшое количество


§ 12. Парадокс кота Шрёдингера

185

радиоактивного элемента, так что, например, в течение часа с какой-то вероятностью может произойти радиоактивный распад одного из ядер этого вещества. Если распад происходит, то срабатывает триггер, который запускает ток, разбивающий колбу с ядом, и яд убивает кота. Если распада не происходит, то кот остаётся жив. Парадокс заключается в следующем: квантовая механика утверждает, что до того, как произошло измерение, ядро находится в суперпозиции состояний |распался〉 и |не распался〉. Соответственно, вроде бы и атом, и кот пребывают в смешанном состоянии, как пара фотонов в парадоксе Эйнштейна — Подольского — Розена. Точнее, если законы квантовой механики распространить на кота и прибор, то они вместе с атомом составляют замкнутую систему, которая находится в определённом состоянии. При этом каждая из подсистем этой замкнутой системы находится в суперпозиции состояний, как фотоны или пути в описанных выше на этой лекции ситуациях. Но что такое суперпозиция состояний для кота: |состояние кота〉 = |кот жив〉 + |кот мёртв〉? Фактически парадокс Шрёдингера в случае существования смешанного состояния кота показывал бы отсутствие параметра, по которому происходит переход от квантовой механики к классической. Тем не менее такой параметр есть, как мы объяснили выше. Напомним, что любая система — и классическая, и квантовая — характеризуется действием. И у маленькой квантовой системы действие и скорости его изменения (градиенты на размерах системы) сравнимы с постоянной Планка. Для большой же классической системы и действие, и его градиенты на размерах системы намного больше этой постоянной. Ситуация абсолютно аналогична той, что мы описали в случае движения больших классических тел по баллистическим траекториям. Итак, на наш взгляд, обсуждаемый парадокс можно решить, если вспомнить, что такое измерение в квантовой механике. Измерение — это воздействие большой классической системы (прибора, который запускает яд) на маленькую квантовую (радиоактивное ядро). В данном случае кот и прибор, вместе взятые (да и по отдельности), являются большой клас-


186

Лекция 3. Квантовая механика

сической системой и измерение состояния радиоактивного атома происходит не в тот момент, когда учёный раскрывает коробку с котом, а в момент взаимодействия частицы с прибором. Следовательно, кот умрёт или выживет с какой-то вероятностью ещё до того, как откроется коробка, и даже вне зависимости от того, откроется ли коробка вообще, и его состояние никогда не будет неопределённым. Таким образом, на наш взгляд, парадокса с котом, находящимся в смешанном состоянии, нет, однако есть вполне конкретная научная задача, которая состоит из следующих двух частей. Во-первых, если мы описываем микроскопическую квантовую систему в терминах волновой функции, а макроскопическую классическую систему с использованием методов классической механики Ньютона, то в каких терминах мы должны описывать замкнутую систему, которая состоит одновременно из микроскопической и макроскопической частей? А во-вторых, как в деталях происходит редукция состояния микроскопической системы при вхождении в контакт с макроскопическим прибором? Формулировкой этих важных вопросов мы и завершаем наше обсуждение картин фундаментальной физики.


СПИСОК ИСТОЧНИКОВ РИСУНКОВ

Основной текст Рис. 2.2. https://www4.uwsp.edu/physastr/kmenning/Phys300/ Lect10.html Рис. 2.3. https://www.headstuff.org/topical/science/gravitationallensing-einstein-eddington-1919-eclipse/ Рис. 2.4. https://researchonline.jcu.edu.au/10407/4/ 04Chapters5-8.pdf, с. 290 Рис. 2.5. https://www.skyandtelescope.com/sky-and-telescopemagazine/beyond-the-printed-page/my-do-it-yourselfrelativity-test/ Рис. 2.7. https://www.eeweb.com/quizzes/tags/electronics/p5 Рис. 2.19–2.20. https://journals.aps.org/prl/abstract/10.1103/ PhysRevLett.116.061102 Рис. 3.4. http://labman.phys.utk.edu/phys222core/modules/m9/ Diffractionpictures/single.htm Рис. 3.7–3.9. Кокс Б., Форшоу Д. Квантовая Вселенная. М.: Манн, Иванов и Фебер, 2016 Рис. 3.17. Беньковский З., Липинский Э. Любительские антенны коротких и ультракоротких волн. М.: Радио и связь, 1983 Цветная вклейка Рис. 3. https://www.nasa.gov/mission_pages/hubble/science/xdf.html Рис. 4. Слева: https://stemsoup.wordpress.com/tag/hyperbola/ Справа: https://www.researchgate.net/figure/Construction-of-thecoordinate-system-representing-the-de-Sitter-geometry-as-closedFRW_fig1_226165652 Рис. 5. https://www.shutterstock.com Рис. 6–7. https://www.researchgate.net/figure/Construction-of-thecoordinate-system-representing-the-de-Sitter-geometry-as-closedFRW_fig1_226165652 Рис. 8. https://www.repo.uni-hannover.de/bitstream/handle/ 123456789/1660/ncomms1122.pdf?isAllowed=y&sequence=1


188

Список источников рисунков

Рис. 9. https://www.ligo.caltech.edu/image/ligo20170927b Рис. 10. https://commons.wikimedia.org/wiki/File:Plane_Wave_ Oblique_View.jpg; https://www.gatinel.com/en/recherche-formation/ aberrometrie/theorie-du-front-donde/front-onde-spherique/ Рис. 11. https://phys.org/news/2014-05-nondestructive-methodquantum.html Рис. 12. https://www.youtube.com/watch?v=jTE_xw_Pg-U Рис. 13. https://myslide.ru/documents_3/ 74a5a8f6dc54b1cbdce476c6a4291bb7/img35.jpg Рис. 14. https://upload.wikimedia.org/wikipedia/commons/thumb/3/ 32/Concave_lens.jpg/300px-Concave_lens.jpg Рис. 15. https://infourok.ru/prezentaciya-po-teme-spektri1038386.html Рис. 16. http://induced.info/?s=Quantum+tunnelling++definition+of+ Quantum+tunnelling+and


Научно-популярное издание Ахмедов Эмиль Тофик оглы Громов Александр Викторович Картины фундаментальной физики Подписано в печать 30.11.2020 г. Формат 84×108 1/32 . Бумага офсетная. Печать офсетная. Печ. л. 6,25. Тираж 1500 экз. Заказ № Издательство Московского центра непрерывного математического образования 119002, Москва, Большой Власьевский пер., 11. Тел. (499) 241–08–04. Отпечатано в ООО «Типография „Миттель-Пресс“». г. Москва, ул. Руставели, д. 14, стр. 6. Тел./факс +7 (495) 619–08–30, 647–01–89. E-mail: mittelpress@mail.ru В соответствии с Федеральным законом № 436-ФЗ от 29 декабря 2010 года издание маркируется знаком

6+

Книги издательства МЦНМО можно приобрести в магазине «Математическая книга», Москва, Большой Власьевский пер., 11. Тел. (495) 745–80–31. E-mail: biblio@mccme.ru, http://biblio.mccme.ru


СВЕДЕНИЯ ОБ АВТОРАХ Ахмедов Эмиль Тофик оглы, д. ф.-м. н., ведущий научный сотрудник и профессор МФТИ. Автор книг: Ахмедов Э. Т. О рождении и смерти черных дыр. М.: МЦНМО, 2016. Ахмедов Э. Т. Лекции по теории относительности, классической электродинамике и гравитации. М.: МЦНМО, 2018. Громов Александр Викторович, научный блогер, учился в МЭИ по специальности инженер атомных станций и установок.




Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.