next up previous contents
Next: De extra traagheid van Up: De speciale relativiteitstheorie Previous: Relativistisch Dopplereffect   Contents


Relativistische mechanica

De lagrangiaanse methode beschreven in sectie 2.8 leent zich uitstekend voor de uitbreiding van de mechanica van Newton naar een versie die overeenkomt met het relativiteitsprincipe. Allereerst zullen we een vrij deeltje beschouwen, oftewel een deeltje met massa $ m$ dat beweegt zonder beïnvloed te worden door een kracht. De lagrangiaan voor een dergelijk deeltje bestaat dan alleen uit een kinetische term,

$\displaystyle L = K.$ (195)

In de klassieke mechanica wordt de kinetische energie gegeven door $ K = \frac{1}{2}m\vec{v}^2$. Deze uitdrukking kunnen we echter niet overnemen in de relativiteitstheorie. Immers, het relativiteitsprincipe eist dat de natuurwetten zodanig geformuleerd dienen te worden, dat zij niet van vorm veranderen wanneer naar een ander inertiaalstelsel wordt getransformeerd. Dit betekent dat de gezochte lagrangiaan invariant moet zijn onder transformaties tussen inertiaalstelsels, en daar voldoet bovenstaande uitdrukking zeker niet aan. Echter, met enige aanpassing is een vorm te vinden die erg lijkt op de oude uitdrukking, maar die wel degelijk invariant is. Hiervoor schrijven we eerst de oude uitdrukking uit als

$\displaystyle L = K = \frac{1}{2}m \frac{dx^i}{dt} \frac{dx_i}{dt},$ (196)

waar Einstein's sommatieconventie gebruikt is: $ dx^i dx_i = dx^2+dy^2+dz^2$. Wat de invariantie van deze uitdrukking in de weg staat zijn twee dingen: allereerst zijn de $ dx$-en inertiaalstelsel-afhankelijk; ten tweede zijn de $ dt$'s dat eveneens. We hadden immers al gezien dat waarnemers in verschillende inertiaalsystemen, verschillende afstanden en tijdsduren meten. Deze uitdrukking kan daarom nooit voldoen aan het relativiteitsprincipe. Echter, wanneer we $ dx^i dx_i$ vervangen door $ \eta_{\mu \nu} dx^\mu dx^\nu$ staat in de teller nu precies het lijnelement $ ds^2$, waarvan bekend is dat dit invariant is. Op dezelfde manier ligt een uitbreiding van de twee $ dt$'s ook voor de hand: vervang $ dt dt$ door $ d\tau^2$, zodat ook dit nu invariant is geworden. Een natuurlijke suggestie voor een relativistische lagrangiaan van een vrij deeltje is dan

$\displaystyle L = \frac{1}{2}m \eta_{\mu \nu} \frac{dx^\mu}{d\tau} \frac{dx^\nu}{d\tau}.$ (197)

Deze overwegingen zijn natuurlijk geen bewijs voor de geldigheid van deze uitdrukking: het is een gok. Er zijn ook andere Lagrangianen denkbaar die voldoen aan het relativiteitsprincipe. Echter, deze uitdrukking is de meest eenvoudige, en bovendien zal blijken dat de bewegingswettem die hieruit volgen, reduceren tot de oude vertrouwde bewegingswetten van Newton wanneer ze toegepast worden in situaties waarbij snelheden veel lager zijn dan de lichtsnelheid. Uiteindelijk zal het echter aan het experiment zijn om aan te tonen of de gevonden wetmatigheden correct zijn. Tot nu toe wijzen alle experimenten uit dat dit inderdaad het geval is.


De actie $ S$ behorend bij deze lagrangiaan wordt verkregen door de lagrangiaan te integreren over de tijd. Ook hier moet het relativiteitsprincipe in acht worden genomen: de uitdrukking moet worden geïntegreerd over de eigentijd $ d\tau$ (in tegenstelling tot over de waarnemer-afhankelijke tijd $ t$) om zo de invariantie van de actie te waarborgen. De actie wordt dan dus

$\displaystyle S = \int_{\tau_1}^{\tau_2} \left\{ \frac{1}{2}m \eta_{\mu \nu} \frac{dx^\mu}{d\tau}
 \frac{dx^\nu}{d\tau} \right\} d\tau.$ (198)

Om de bewegingswet voor het deeltje af te leiden, dient het principe van extreme actie weer te worden toegepast: er moet gezocht worden naar het pad $ x^\mu (\tau)$ dat de waarde van deze integraal minimaal of maximaal maakt. De Euler-Lagrange vergelijkingen voor deze situatie hebben de vorm55

$\displaystyle \frac{\partial L}{\partial x^\alpha} = \frac{d}{d\tau} \left( \frac{\partial L}
 { \partial \left( \frac{dx^\alpha}{d\tau} \right) } \right).$ (199)

Merk op dat dit vier vergelijkingen zijn: voor elk van de vier coordinaten van het pad $ x^\mu(t)$ is er een vergelijking die moet worden opgelost. Wanneer de relativistische lagrangiaan wordt ingevuld en beide zijden van de Euler-Lagrange vergelijkingen worden uitgerekend, wordt gevonden dat een vrij relativistisch deeltje een pad $ x^\mu (\tau)$ volgt waarvan de componenten voldoen aan de vergelijkingen

$\displaystyle m\frac{d^2x^\mu}{d\tau^2} = 0.$ (200)

Dit lijkt sprekend op de tweede wet van Newton voor een vrij deeltje, met twee subtiele verschillen.


Ten eerste doet de wet van Newton uitspraken over de drie plaatscoördinaten van het deeltje, waar deze nieuwe uitdrukking ook uitspraak doet over de tijd. Deze laatste stelt dat

$\displaystyle m \frac{dt^2}{d\tau^2}=0,$ (201)

waaruit volgt dat $ \frac{dt}{d\tau}$ gelijk is aan een constante. Dat is niet verrassend: we hadden immers al gezien dat de tijd $ \tau $ zoals gemeten door een waarnemer die het deeltje stil ziet staan, een andere is dan de tijd $ t$ gemeten door een waarnemer die het deeltje ziet bewegen. Dit was precies het tijddilatatie effect zoals besproken in sectie 5.3, en de waarde van deze constante laat zich dan ook aflezen van vergelijking (172): het is precies de lorentzfactor $ \gamma $.
Figuur 44: Ruimtetijddiagram in een specifiek lorentzframe dat de 3D ruimte toont op $ t=0$ de viersnelheid $ \vec U$ van een deeltje dat deze 3D ruimte passeert (op $ t=0$), en twee 3D vectoren die in deze 3D ruimte liggen: het ruimtelijke deel van de viersnelheid $ \vec U$ en de gewone snelheid $ \vec v$ van het deeltje.
\includegraphics[width=8cm]{Figures/u.eps}


Het tweede verschil met de wet van Newton is het feit dat er hier afgeleiden worden genomen naar de eigentijd $ \tau $, waar in Newton's theorie afgeleiden werden genomen naar de tijd $ t$. Dit maakt van deze nieuwe afgeleide een soort `gemengd-object': de gemeten afstanden $ x$ worden genomen zoals gemeten door een willekeurige waarnemer ten opzichte van wie het deeltje beweegt, waar de tijd gemeten wordt door de waarnemer die stilstaat ten opzichte van het bewegende deeltje. Dit object wordt de viersnelheid $ U^\mu(t)$ genoemd. Er geldt $ \vec U = d\vec x /d\tau$ en voor de componenten geldt $ U^\alpha = {dx^\alpha / d\tau}$. Dit betekent voor de gewone snelheid dat $ v^j \equiv {dx^j \over dt} = {dx^j / d\tau \over dt / d\tau} = {U^j \over U^0}$. Deze relatie in combinatie met de normering van $ \vec U$, $ \vec U^2 = g_{\alpha \beta}U^\alpha U^\beta = -(U^0)^2 +\delta_{ij}U^iU^j = -1$, betekent dat de componenten van de viersnelheid van de vorm $ U^0 = \gamma , U^i = \gamma v^i,~~{\rm met}~~
\gamma = 1 / (1-\delta_{ij}v^iv^j)^{1\over2}$ zijn. We vatten een en ander nog een samen in Fig. 44. Het is nuttig om $ v^j$ te zien als de componenten van een 3D vector $ \vec v$, de gewone snelheid, die leeft in de 3D euclidische ruimte $ t={\rm constant}$ van het gekozen lorentzstelsel. Deze 3D uimte is niet goed gedefinieerd totdat er een lorentzstelsel gekozen is, en daarom hangt het bestaan van $ \vec v$ af van de specifieke keuze. Op het moment dat een lorentzframe gekozen is, kunnen we $ \vec v$ zien als een coördinaten-onafhankelijk object.


Teneinde weer contact te maken met de klassieke mechanica, schrijven we de viersnelheid om naar een meer natuurlijk object (te weten: afstand en tijd gemeten door een en dezelfde waarnemer). Dit kunnen we doen door te beseffen dat de verlopen tijd gemeten door het deeltje, en die door een andere waarnemer, met elkaar gerelateerd zijn via de formule van tijddilatatie: $ d\tau = \gamma^{-1} dt$. Op deze manier is de gevonden wet uit te drukken als

$\displaystyle m \gamma^2 \frac{d\vec{x}^2}{dt^2} = 0.$ (202)

De wet van Newton kan nu gezien worden als een speciaal geval van deze nieuwe wet. Als we aannemen dat het deeltje veel langzamer beweegt dan het licht ten opzichte van de waarnemer in wiens tijdsduur en afstand we nu alles hebben uitgedrukt (oftewel we nemen aan dat $ v \ll c$), dan kan vergelijking (208) benaderd worden door

$\displaystyle m \gamma^2 \frac{d\vec{x}^2}{dt^2} \equiv \frac{m}{1-\left(\frac{...
...\right)^2\right)\frac{d\vec{x}^2}{dt^2}
 \approx m \frac{d\vec{x}^2}{dt^2} = 0,$ (203)

waar gebruik is gemaakt van de wiskundige regel $ (1+x)^m \approx 1+mx$, welke geldt als $ x \ll 1$. Dit is precies de wet van Newton! Zo is nu aangetoond dat de wet van Newton slechts een speciaal geval is van een meer algemene bewegingswet, vergelijking (206)! Dit geeft ons vertrouwen dat onze keuze voor de lagrangiaan waarschijnlijk de juiste was: hij voldoet aan het relativiteitsprincipe, en geeft ons bovendien onze oude vertrouwde bewegingswetten terug.


Met in het achterhoofd kunnen we nu verder gaan met het afleiden van wetten betreffende de energie en impuls. Zoals besproken in sectie 2.8, volgt een impuls uit een gegeven lagrangiaan via vergelijking (36). Toegepast op de relativistische lagrangiaan levert dit voor de impuls van het vrije deeltje

$\displaystyle p_{\alpha} = \frac{\partial L}{\partial \frac{dx^\alpha}{d\tau}}
 = m \frac{dx^\nu}{d\tau} \eta_{\alpha \nu},$ (204)

en na beide kanten te contraheren met de inverse $ \eta^{\mu \alpha}$ van de minkowksimetriek wordt dit

$\displaystyle p^\mu = m \frac{d x^\mu}{d\tau} = m U^\mu .$ (205)

Wederom lijkt dit erg op de impuls zoals bekend uit de mechanica van Newton: een massa vermenigvuldigd met een snelheid. Echter, de snelheid is hier nu weer de viersnelheid, en deze nieuwe impuls wordt dan ook de vierimpuls genoemd. Vergeleken met de uitdrukking voor de newtoniaanse variant, vergelijking (37), gaan weer twee verschillen op: ten eerste is er een nul-component aanwezig, en ten tweede is het weer een `gemengd-object': afgelegde afstand gemeten door een willekeurige waarnemer, en tijdsduur gemeten door een waarnemer die stilstaat ten opzichte van het deeltje. Het tweede verschil kunnen we weer een plaats geven door de relatie tussen eigentijd en tijd te gebruiken. Dit levert

$\displaystyle p^\alpha = m \gamma \frac{dx^\alpha}{dt},$ (206)

en via dezelfde benaderingsmethode als gebruikt in vergelijking (209) volgt direct dat de $ i$-component ($ i=1,2,3$) hiervan reduceert tot de impuls zoals bekend uit de mechanica van Newton, wanneer het deeltje veel langzamer beweegt dan het licht. De $ i=1,2,3$ componenten van dit object worden daarom opgevat als de relativistische uitdrukkingen van de impuls. Wat de nul-component betreft, deze moet nog een interpretatie krijgen. Deze component is

$\displaystyle p^0 = m c \gamma.$ (207)

Via een dimensie-analyse is meteen te zien dat het de dimensie van een energie heeft, en dit wekt de suggestie dat het gaat om de energie van het vrije deeltje. De vraag dringt zich dan al snel op: op welke manier is deze uitdrukking gerelateerd aan de newtoniaanse uitdrukking voor de energie van een vrij deeltje, $ K = \frac{1}{2}mv^2$? Ook hier biedt de benadering van lage snelheden uitkomst. Er geldt

$\displaystyle cp^0 = mc^2 \frac{1}{\sqrt{1- \left( \frac{v}{c} \right)^2}}
 \approx mc^2 \left( 1+\frac{1}{2}\left(\frac{v}{c} \right)^2 \right)
 = mc^2+K,$ (208)

waar de uitdrukking voor de newtoniaanse energie $ K$ van een vrij deeltje is ingevuld. Hier is nu gevolgd dat, in de benadering van lage snelheden, de nul-component van de relativistische impuls reduceert tot de newtoniaanse energie plus een extra term. Afgezien van deze constante term, is de nul-component bij lage snelheden inderdaad gelijk aan de energie van het deeltje zoals voorspeld door de newtoniaanse mechanica. Het ligt dan ook voor de hand om aan te nemen dat we $ p^0$ ook bij hoge snelheden mogen opvatten als de energie van het deeltje. Wat de constante term betreft kan de vraag worden gesteld hoe fysisch interessant deze is. Immers, in de natuurkunde kennen alleen energieverschillen een meetbare betekenis56, en dus zal elke extra constante term toegevoegd aan de energie van een systeem uit de berekening vallen wanneer een energieverschil opgeschreven wordt. Toch heeft de constante term $ m$ hier wel degelijk een fysische betekenis: het is namelijk niet zomaar een willekeurige constante, het is een constante die een eigenschap van het deeltje bevat (de massa)! Deze energie is ook aanwezig wanneer het deeltje geen bewegingsenergie heeft voor een gegeven waarnemer, $ K=0$; we spreken dan ook over rust-energie, en deze is gelijk aan

$\displaystyle E = mc^2.$ (209)

Dit is wellicht de bekendste formule uit de natuurkunde. Hij zegt dat elke massa een energie met zich meedraagt gelijk aan deze massa maal $ c^2$, en dat dit energie is die zich niet laat wegtransformeren door naar een ander inertiaalstelsel te gaan. Het is daarom een fundamentele hoeveelheid energie voor een gegeven massa $ m$: voor alle waarnemers geldt dat een massa op zijn minst deze hoeveelheid energie met zich meedraagt.


Resumerend is nu gevolgd dat onze keuze voor de lagrangiaan ons een uitdrukking geeft voor de impuls, waarvan de $ i$-componenten netjes reduceren tot de impuls zoals die in de newtoniaanse mechanica bekend was; de nul-component van de vierimpuls blijkt overeen te komen met de energie van het deeltje. We schrijven dan ook

$\displaystyle p^\mu = \left( 
 \begin{array}{c}
 \frac{E}{c} \\ 
 p_x \\ 
 p_y \\ 
 p_z \\ 
 \end{array}
 \right),$ (210)

waarin geldt

$\displaystyle E = \gamma m c^2, \quad \quad p^i = \gamma m v^i.$ (211)

De naam is niet de enige overeenkomst tussen de vierimpuls en viersnelheid: beide transformeren op dezelfde manier tussen inertiaalsystemen. Met name de lorentztransformaties werken op deze objecten op dezelfde manier; dit betekent dat twee waarnemers die zich in de $ x$-richting met snelheid $ v$ bewegen ten opzichte van elkaar, verschillende energie ($ E$ en $ E'$) en impuls ($ p_x$ en $ p'_x$) meten van een en hetzelfde deeltje, en dat deze zich tot elkaar verhouden als

$\displaystyle \left.
 \begin{array}{rcl}
 \frac{E'}{c} &=& \gamma\left(\frac{E}...
...array}
 \right) \rightarrow
 p^{\mu^\prime} = \Lambda_{~\nu}^{\mu^\prime} p^\nu$ (212)

Bovendien kunnen we de contractie $ p_\mu p^\mu$ van de vierimpuls met zichzelf nemen, omdat we al gezien hadden dat de contractie van een viervector met zichzelf altijd een invariant oplevert. Het is dan eenvoudig om aan te tonen dat deze invariant gelijk is, op een factor $ -c^2$ na, aan de massa van het deeltje in het kwadraat. Er geldt
$\displaystyle \eta_{\mu \nu} p^\mu p^\nu$ $\displaystyle =$ $\displaystyle -\left(\frac{E}{c}\right)^2+p^2$  
  $\displaystyle =$ $\displaystyle -m^2 c^2 \gamma^2+m^2 v^2 \gamma^2$  
  $\displaystyle =$ $\displaystyle -m^2 c^2 \gamma^2\left( 1-\left(\frac{v}{c}\right)^2 \right) = -m^2 c^2.$ (213)

Dit leidt dan tot de volgende uitdrukking voor de relatie tussen de energie en de impuls,

$\displaystyle E^2 = p^2c^2 + m^2c^4.$ (214)

Deze is bijna geheel57 equivalent aan de eerder gevonden uitdrukking voor de relativistische energie, vergelijking (214), maar is in de praktijk soms te prefereren omdat deze ons in staat stelt de energie van een deeltje uit te rekenen zonder de snelheid $ v$ van het deeltje te hoeven kennen. Met name in de deeltjesfysica, waar men vaak de impulsen van de deeltjes beter kan meten dan louter hun snelheid, wordt deze formule veel gebruikt.


Het belang van energieën en impulsen in de relativiteitstheorie is dezelfde als die in de Newtoniaanse mechanica. Daar is het een experimenteel gegeven dat energie en impuls behouden grootheden zijn; dit levert enorme voordelen op tijdens het berekenen van mechanische processen. Het blijkt experimenteel dat dit nog steeds geldt voor onze nieuwe uitdrukkingen voor de energie en impuls: elk experiment toont aan dat deze twee grootheden niet veranderen tijdens fysische processen. Dit maakt het uitermate handig om met energie en impuls te werken wanneer een relativistisch probleem wordt beschouwd. Het is hier nu van belang om het verschil tussen `behouden' en `invariant' te onderstrepen: een grootheid is behouden wanneer geldt dat zijn waarde voor en na een proces dezelfde is; een grootheid is invariant als geldt dat zijn waarde voor alle waarnemers in verschillende inertiaalstelsels dezelfde is. Enkele voorbeelden: de lichtsnelheid $ c$ is een invariant en is behouden; de massa van een deeltje is invariant maar in het algemeen niet behouden; de energie van een deeltje is behouden maar niet invariant; snelheden zijn in het algemeen zowel niet behouden als invariant.


Nog enkele woorden over snelheden. Zoals al besproken, volgt uit de minkowskimetriek de snelheidsregel van Einstein, waaruit we hebben laten volgen dat het onmogelijk is een deeltje sneller te zien gaan dan het licht als het voor een enkele waarnemer niet sneller gaat dan het licht. De vraag of er een waarnemer bestaat voor wie het deeltje sneller gaat dan het licht is nog niet aan de orde gekomen. Met de uitdrukking voor de relativistische energie kan die vraag nu definitief worden beantwoord, en wel als volgt. De uitdrukking gegeven in vergelijking (214) voor de relativistische energie vertelt ons dat er in een deeltje dat zich ten opzichte van ons met snelheid $ v$ beweegt, een energie $ E$ verscholen is. Omgekeerd kan de relatie ook gelezen worden als de hoeveelheid energie benodigd om een deeltje vanuit stilstand tot deze snelheid te versnellen. Als wij nu een deeltje naar de lichtsnelheid willen versnellen, dan geldt $ v = c$ en wordt de noemer van vergelijking (214) gelijk aan nul: de benodigde energie $ E$ wordt oneindig groot. Dit is een andere manier van zeggen dat het onmogelijk is een deeltje de lichtsnelheid te geven! Hiermee is dan ook aangetoond dat deeltjes voor deze waarnemer niet sneller kunnen gaan dan de lichtsnelheid; via Einstein's snelheidsregel volgt dan direct dat geen enkele andere waarnemer het deeltje sneller dan het licht kan zien bewegen.


Er is een uitzondering op deze regel. Om tot de energie $ E$ van $ \infty$ te komen, hebben we opgemerkt dat een deeltje met snelheid $ v = c$ de noemer in vergelijking (214) gelijkmaakt aan nul, en delen door nul geeft oneindig. Dit is inderdaad waar, mits de teller niet gelijk is aan nul. Als de teller van een breuk ook gelijk is aan nul, levert delen door nul niet altijd meer oneindig op. De waarde van de uitkomst is dan onbepaald: afhankelijk van de context kan er iets eindigs uitkomen. Hier staat in de teller van de breuk de massa van het deeltje, dus al met al ziet het ernaar uit dat er wel degelijk deeltjes zouden kunnen bestaan die met precies de lichtsnelheid bewegen mits de massa van zulke deeltjes maar gelijk is aan nul58. Zulke deeltjes kennen we: fotonen59 gaan met de lichtsnelheid, en deze hebben inderdaad een massa gelijk aan nul. Dit volgt uit alle metingen, maar het is interessant om te zien dat dit resultaat ook volgt uit puur theoretische overwegingen. De impuls van een foton heeft de waarde $ E = \vert \vec p \vert c$. Zoals elke keer weer blijkt dit een direct gevolg te zijn van de minkowskimetriek en het relativiteitsprincipe!


De vraag dient zich dan aan wat de waarde is van de energie van een foton: wat is hier de uitkomst van nul gedeeld door nul? De uitdrukking voor de relativistische energie doet geen uitspraak. Dit betekent niet dat er geen antwoord bestaat voor de energie van een massaloos deeltje, maar alleen dat deze waarde niet door vergelijking (214) of door de relativiteitstheorie bepaald kan worden, en dat een andere formule nodig is. In het geval van een foton is de formule bekend uit de quantummechanica,

$\displaystyle E = h f$ (215)

waar $ f$ de frequentie (kleur) van het licht is, en $ h$ de constante van Planck. De ontdekking van deze formule door Max Planck in 1900, was de start van de studie van de quantummechanica. Samen met de ontdekking van de speciale relativiteitstheorie leidde de ontwikkeling van de quantummechanica tot een gehele herschrijving van de grondslagen van de natuurkunde.


next up previous contents
Next: De extra traagheid van Up: De speciale relativiteitstheorie Previous: Relativistisch Dopplereffect   Contents
Jo van den Brand 2009-01-31