Relativiteitstheorie
Een introductie in de relativiteitstheorie van Einstein.
In dit stukje tekst zal geprobeerd worden om de speciale relativiteitstheorie wat duidelijk te maken, en er wordt een nadruk gelegd op de afleiding van de Lorentz-transformaties.
Inhoud
Inleiding[bewerken]
De success story van Einstein begon in de 2e helft van de 19e eeuw, met de wetten van Maxwell. Deze beschrijven het gedrag van elektrische en magnetische velden en voorspellen onder andere dat licht een elektromagnetische golf is. Uit de resulterende golfvergelijkingen blijkt, dat de snelheid van het licht alleen afhangt van de eigenschappen van het medium waarin de golf zich voortplant. In vacu�m wordt de uitdrukking van de lichtsnelheid zo Sqrt{1/(u0*e0 ) } , waarbij u0 en e0 respectievelijk de magnetische permeabiliteit en de elektrische susceptibiliteit van het vacu�m zijn (en alleraardigste Scrabble-woorden). De lichtsnelheid hangt dus volgens deze golfvergelijkingen niet af van de waarnemer en dat was erg vreemd! Want volgens het Galileaanse principe hangen alle snelheden wel degelijk af van de waarnemer: hierin kun je snelheden gewoon lineair bij elkaar optellen en aftrekken. Dus mocht je met 20 km/u op een auto afstevenen die 30 km/u gaat, dan is de onderlinge snelheid 30+20=50 km/u. Maar uit de wetten van Maxwell bleek al dat er met licht iets bijzonders aan de hand is.
Licht wordt dus voorgesteld als een golf, maar kan zich wel door het vacu�m bewegen. En dat is onvolledig, want ten opzichte waarvan meet je dan de lichtsnelheid? Er werd daarom een onzichtbaar medium voor het licht “ingevoerd”, genaamd de ether, die overal aanwezig zou moeten zijn. Michelson en Morley gingen daarop in 1881 de lichtsnelheid meten. Hun redenering was, dat als de Aarde zich door de ether bewoog, je dan ook verschillen in de lichtsnelheid zou moeten meten,door de beweging van de Aarde rond de zon. Eigenlijk verwachtten ze dus dat de vergelijkingen van Maxwell niet helemaal volledig waren. Ze vonden echter dat de verschillen in de lichtsnelheid onmeetbaar klein waren! Lorentz, Fitzgerald en Poincar� probeerden dit meetresultaat in 1895 te verklaren met 2 hypothesen. Ze stelden dat, als een waarnemer door de ether beweegt, deze de klokken langzamer ziet lopen en lengten ingekort ziet t.o.v. waarnemers die stilstaan t.o.v. hem. Ze gaven hier verder geen diepere verklaring voor. Einstein wel.
Einstein bracht in 1905 een artikel naar voren, dat verheldering moest brengen. Hij gebruikte daarin 2 postulaten, en kon daarmee de meetresultaten van Michelson & Morley verklaren, en de eerder gevonden formules van Lorentz & co. Hij gooide daarmee echter de klassieke opvattingen over ruimte en tijd volledig overboord, en ook de ether moest het ontgelden. Deze postulaten zijn :
- De wetten van de natuurkunde zijn dezelfde in alle inertiaalstelsels.
- De lichtsnelheid is een universele constante, onafhankelijk van de waarnemer.
Met een inertiaalstelsel wordt een stelsel bedoeld, waar geen kracht op werkt; zo’n stelsel beweegt zich dus rechtlijnig voort met constante snelheid, of staat stil. Dit natuurlijk t.o.v. een ander intertiaalstelsel. Intuitief klopt dat ook: in een onversnelde trein kun je prima tafeltennissen, totdat de trein gaat versnellen, dan gaat er een kracht op het balletje werken, en is de situatie anders dan bij stilstand of bij constante snelheid.
Het mooie is, dat je alleen met deze 2 postulaten alle formules van de speciale relativiteitstheorie kunt afleiden ! Voor deze formules heb je alleen een beetje middelbare schoolwiskunde nodig, hoewel je je voor de diepere details moet wenden tot tensoren, vectorruimten e.d.
Wat Einstein zich dus realiseerde, was dat de Newtoniaanse mechanica bij benadering wel goed was, maar bijgesteld moest worden voor hoge snelheden. Voor lage snelheden gaan de vergelijkingen van Einstein dan ook gewoon over in de Newtoniaanse vergelijkingen. Ook kreeg Einstein kopzorgen over de zogenaamde instantane interacties: volgens Newton werkte een massa direct op een andere massa in, wat een oneindige snelheid van de zwaartekracht betekent. Dat ging tegen Einsteins theorie in, want die voorspelt dat niets sneller dan het licht kan. Dit geldt voor massa’s, maar ook voor informatieoverdracht. Hoe dat met die zwaartekracht zit, valt onder algemene relativiteit. Deze theorie beschrijft wat er gebeurt als je ook nog eens zwaartekrachtsvelden invoert. Hier wordt daar verder niet op in gegaan.
Een beetje wiskunde:concepten van ruimte en tijd[bewerken]
De relativiteitstheorie smijt ruimte en tijd in 1 wiskundige ruimte, de zogenaamde ruimte-tijd. Een punt in deze ruimte-tijd noemt men een event, een gebeurtenis die wordt beschreven door 4 coordinaten: een x, y, z, en een t coordinaat. Deze 4 is het minimum aantal coordinaten wat je altijd nodig hebt om een event te beschrijven, wat wordt uitgedrukt in het feit dat de ruimte-tijd 4-dimensionaal is. Nou werd er al eerder genoemd dat de lichtsnelheid hetzelfde is voor alle waarnemers. Dus de afgelegde weg van een lichtstraal is voor alle waarnemers hetzelfde ( subtiel punt, denk er es over na ) Neem nu een frame K, en zendt een lichtstraal uit op tijdstip t1 en op plaats (x1 ,y1 ,z1) . Het ontvangen van de straal nemen we als tijdstip t2 op plaats (x2,y2,z2). De afgelegde weg van de lichtstraal is dan
c*(t2 - t1) (1) Maar de afgelegde weg is natuurlijk ook gelijk aan
(x2-x1)2 + (y2 - y1 ) 2 + (z2 - z1) 2 , (2)
de manier waarop je een afstand definieert in een gewone, cartesische ruimte. Echter, in frame K’ is de afgelegde weg exact hetzelfde, want c is constant. Dus in frame K’ heb je dezelfde uitdrukking als hierboven, maar dan met t’,x’,y’,z’ in plaats van t,x,y,z, en kun je deze 2 uitdrukkingen aan elkaar gelijk stellen. Op deze manier kun je een afstand definieren, maar dan in je ruimte-tijd. Want een afstand in een willekeurige wiskundige ruimte mag niet veranderen als je overgaat in een ander coordinatenstelsel ( als je dus van K naar K’ hupt). Als je bijvoorbeeld een willekeurige vector beschrijft met cartesische coordinaten in een cartesische ruimte, dan mag de lengte en richting van deze vector niet veranderen als je overgaat naar poolcoordinaten; het enige wat verandert zijn de componenten van de vector. Ook als je je vector roteert, mag de lengte niet veranderen. Het overgaan van het ene naar het andere frame kun je dus zien als een soort rotatie.
Met deze info gaan we een afstand definieren, die het ruimte-tijd interval wordt genoemd. Voor het verschil in coordinaten wordt voor het gemak een d genomen: dt= t2 - t1, en evenzo voor x, y en z. Zo wordt de afstand in de ruimte-tijd:
ds2 = c2 * dt2 - dx2 - dy2 - dz2 (3) Deze ruimte-tijd wordt ook wel Minkowski-ruimte genoemd. Voor licht is deze afstand dus altijd 0, maar voor lagere snelheden is dit niet het geval. Wat je dus hebt is een 4-dimensionale ruimte met coordinaten {ct,x,y,z}, en een afstand ds2 = c2 * t2 - dx2 - dy2 - dz2. Deze ruimte-tijd wordt ook wel Minkowski-ruimte genoemd. Ruimte en tijd zijn dus sterk aan elkaar verbonden ! Vergelijk deze 4 dimensionale ruimt-tijd es met een 3 dimensionale cartesische ruimte, waarin een afstand wordt genomen als dl2 = dx2+dy2+dz2. Hierin is er maar 1 punt waar de lengte 0 is, en dat is in de oorsprong. In de Minkowski ruimte is de afstand voor licht 0, maar licht legt natuurlijk wel een afstand in de cartesische ruimte af. Als je een lichtstraal zou hebben in de x-richting, en je zou een ruimte-tijd diagram tekenen met een x en een t-as, dan zou deze straal worden voorgesteld als een lijn met x/t=c, of als je c=1 stelt: x/t=1, dus een lijn die een hoek van 45 graden maakt met beide assen. Hoewel het concept van ruimte-tijd diagrammen erg sterk is, ga ik hier verder niet op in. Nu wordt er gekeken naar de consequenties van al dit moois :)
De alom beroemde Lorentz-transformaties[bewerken]
We nemen weer een frame K en een frame K’, met onderlinge snelheid v. Nu laten we een klok bewegen, en plakken het frame K’ aan deze klok vast. K’ beweegt dus met de klok mee,en de klok bevindt zich in de oorsprong van K’. In K meet je dat de klok in een tijdsinterval dt een afstand Sqrt[ dx2+dy2+dz2 ] beweegt. In frame K’ geldt echter dx’=dy’=dz’=0, omdat de klok zich in de oorsprong van K’ bevindt. Nou was het ruimtetijdsinterval ds voor verschillende waarnemers altijd gelijk. Dus kun je stellen
ds2=c2*dt2-dx2-dy2-dz2=c2*dt’2 (4)
Als de klok zich niet in de oorsprong van K’ zou bevinden, zou hierachter nog -dx’2-dy’2-dz’2 moeten staan ,maar in dit geval is dit wel het geval en dus is deze laatste term 0.
Schrijf vergelijking (4) eens om naar dt’=…… en merk op dat [dx2 + dy2+ dz2 ]/ dt2 = v2. Na een simpele omschrijving krijg je dan dt’=ds/c=dt*Sqrt[1-v2/c2 ] Deze dt’ noemt men ook wel de “eigentijd”: het is de tijd die een bewegende waarnemer meet met zijn eigen klok. Er geldt dus dt’<dt en deze zijn gelijk als ze beide in rust zijn t.o.v. elkaar. dt noemt men ook wel de coördinaten-tijd. Als je alles vanuit het andere stelsel wil bekijken, dan draai je gewoon de komma’s om, en v wordt dan –v. Dit idee resulteerde al gauw in de zogenaamde “tweeling-paradox”. In deze “paradox” wordt het idee van een relatieve snelheid misbruikt, en zo het idee van de inertiaalstelsels vergeten, zie de postulaten. Voor meer informatie over deze paradox kun je Googlen. Zo bestaan er nog vele andere paradoxen, die allemaal kunnen worden opgelost als je de postulaten maar juist toepast.
Nu de andere transformaties. Als we van een gebeurtenis {x,y,z,t} de coördinaten kennen, willen we graag ook weten hoe we dit moeten uitdrukken in een ander frame met coördinaten {x’,y’,z’,t’}. Dit gaan we doen met de eerder genoemde rotaties. De rotaties tussen de ruimtelijke assen zijn niet zo interessant, die kun je ook klassiek afleiden. Wat wel interessant is, zijn de relaties tussen de ruimtelijke assen en de tijdsas, dus tussen de ruimtelijke en de tijdscoördinaat. Deze rotaties had je in de Newtoniaanse mechanica natuurlijk niet ! We nemen weer 2 frames, K en K’, die weer bewegen met relatieve snelheid v t.o.v. elkaar, langs de x-assen. De andere assen staan weer parallel. Wat eisen we van een dergelijke transformatie? De lengte van de vector moet behouden blijven, en deze wordt gegeven door
c2t2-l2, waarbij l2=x2+y2+z2. (5)
Dus er moet gelden dat c2t2-x2=c’2t’2-l’2. Dit kwamen we al eerder tegen. Voor het gemak kijken we naar een transformatie tussen de x- en de t-as (de onderlinge snelheid is alleen in de x en x’ richting). Nu moet er een setje transformaties komen, die x in x’& t’ uitdrukt, en t in x’& t’ uitdrukt ( andersom kan natuurlijk ook, maar dit is gebruikelijker), en waarbij die afstand dus weer moet worden behouden:
c2t2-x2=c2t’2-x’2. (6)
De enige transformaties die dit doen, blijken hyperbolische functies te zijn: de sinus hyperbolicus en de cosinus hyperbolicus. Deze worden gedefinieerd via e-machten. Voor de volledigheid:
sinh(x)= (ex-e-x ) /2, cosh(x)=(ex+e-x[ ) /2 tanh(x)= sinh(x)/cosh(x)
Uit deze definities volgt dat
cosh2a-sinh2a=1, vergelijk dit es met sin2a+cos2a=1.
De transformaties die de relaties geven tussen de verschillende frames zijn:
x=x’cosh(a)+ct’sinh(a) ct=x’sinh(a)+ct’cosh(a) (7)
Dit kun je makkelijk checken, door de gegeven x en ct in vergelijking (6) in te vullen; je zult zien dat het ruimtetijdsinterval behouden blijft. Die a is dan een algemene hoek, die je je moeilijk kunt voorstellen, dus doe dat ook maar niet. Het is alleen een wiskundig gedefinieerde hoek en hij heeft verder geen fysische interpretatie.
Nu gaan we hetzelfde doen als zonet: we bekijken vanuit frame K de beweging van de oorsprong van K’. Dus geldt er weer dat x’=0. Vul dit in bij vergelijking (7). Dat resulteert in:
x=ct’sinh(a) c*t=ct’cosh(a), oftewel: x/(c*t)=v/c=tanh(a), waarbij sinh/cosh=tanh en x/t=v. (8)
Nu moeten er wat eigenschappen van de hyperbolische functies worden gebruikt, die met behulp van de e-machtdefinities makkelijk kunnen worden nagegaan:
sinh=tanh/[Sqrt(1-tanh2)] en cosh=1/[Sqrt(1-tanh2)]
Via directe invulling in (8) krijg je dan:
sinh(a)=y*v/c cosh(a)=gamma waarbij gamma=1/Sqrt(1-v2/c2)
Het enige wat je nu nog hoeft te doen is deze hyperbolische functies in vergelijking (7) invullen. Het eindresultaat:
x=gamma*[x’+v*t’] y=y’ z=z’ t=gamma*[t’+v*x’/c2 ]
Merk op dat alleen x wordt veranderd; dit omdat de onderlinge snelheid alleen in de x en x’-richting is.
De consequenties van deze formules zijn o.a. dat lengten in de bewegingsrichting worden verkort, en dat je hoge snelheden ( d.w.z. v --> c ) niet meer lineair bij elkaar mag optellen. Ook kun je hieruit afleiden dat voor bewegende waarnemers licht wordt afgebogen.
Ik hoop dat de wiskunde een klein beetje duidelijk is, ben van mening dat het niet veel kennis vereist om de meeste dingen zelf te kunnen nagaan. Misschien een beetje verbeeldingsvermogen :)
Misschien zijn sommigen verbaasd dat de term E=mc2 nog niet is voorbij gekomen. Deze formule volgt eigenlijk gewoon uit de definitie van arbeid, met dan de relativistische term voor de kracht ingevuld. Hier is de nadruk vooral gelegd op hoe ruimte en tijd met elkaar in verband staan, en wat de wiskundige consequenties daarvan zijn. Natuurlijk is dit allemaal prima na te meten, en de metingen bevestigen de theorie. Google bijvoorbeeld eens “muonenexperiment” en je krijgt een fraai stukje bevestiging te zien. Een ander deel van de speciale relativiteitstheorie gaat over relativistische kinematica, wat staat voor datgene wat dingen als impuls, energie, massa e.d. beschrijft in dit raamwerk. Het blijkt onder andere dat massa, impuls en energie op een niet-lineaire manier toenemen bij een verhoogde snelheid. De niet-lineaire term blijkt in dit geval de eerder genoemde gamma te zijn. Hiermee kun je afleiden dat geldt: E=gamma*mc2 . Ook wil ik graag zeggen dat de hier beschreven resultaten op verschillende manieren kunnen worden verkregen, ikzelf vind dit de meest elegante. Het kan ook via ruimte-tijd diagrammen . en wat geometrie. In andere boeken wordt de zogenaamde “ k-calculus “ manier aangehouden. Ook hier weer geldt dat de achterliggende wiskunde niet zo lastig is.
En dus....[bewerken]
Einstein publiceerde zijn speciale relativiteitstheorie in 1905, maar het duurde even voordat de fysische wereld klaar was om het klassieke denken opzij te zetten. Er wordt nog wel eens gezegd dat Einstein meer dacht dan las en niet echt op de hoogte was van de artikelen van Lorentz en zijn aanhang. Het bijzondere is, dat Einstein niet de vindingen van Michelson&Morley&Maxwell in het klassieke raamwerk wou gieten, maar doorhad dat het klassieke denken grondig moest worden veranderd. Na 1905 ging Einstein verder: hij wou graag zijn theorie uitbreiden naar niet-inertiaalstelsels en zwaartekracht invoeren in zijn model. Voor die versnellingen had hij genoeg aan de speciale relativiteitstheorie. Maar voor die zwaartekracht had hij een wiskunde nodig die nog niet zo bekend was bij natuurkundigen, en zo’n 60 jaar eerder pas was ontwikkeld door Bernhard Riemann. Zwaartekracht wordt hierdoor beschreven als een kromming van de ruimte-tijd, en hiervoor heb je zogenaamde differentiaalgeometrie en tensorcalculus voor nodig. Het zou tot 1916 duren voordat hij met de algemene relativiteitstheorie op de proppen kwam, en nog langer voordat de consequenties ervan doordrongen in de wetenschappelijke wereld.