Toán học của thuyết tương đối rộng

Toán học của thuyết tương đối rộng là mô hình chứa đựng cấu trúc và kỹ thuật toán học được sử dụng để nghiên cứu và thiết lập lên thuyết tương đối rộng của Einstein. Công cụ chính sử dụng trong lý thuyết hình học về lực hấp dẫn này là trường tenxơ xác định trên đa tạp Lorentz biểu diễn không thời gian. Bài viết này miêu tả tổng quan về toán học của thuyết tương đối tổng quát.

Ký hiệu

Trong toàn bộ bài viết, chúng ta sử dụng dấu metric kiểu không gian $\scriptstyle (-,+,+,+)$ và hệ đơn vị hình học trong đó $G=c=1$ mặc dù khi cần thiết chúng ta sẽ viết rõ tốc độ ánh sáng, c. Chúng ta sẽ viết đậm các tenxơ, ví dụ ${\boldsymbol {V}}$ , và các mũi tên bên ám chỉ các vectơ ba chiều hoặc các toán tử, ví dụ ${\overrightarrow {v}}$ hoặc ${\overrightarrow {\nabla }}$ . Đạo hàm hiệp biến và đạo hàm riêng bốn chiều sẽ được ký hiệu dạng tổng quát lần lượt là $\nabla _{\mu }$ và $\partial _{\mu }$ nhưng những ký hiệu khác có thể được sử dụng cho các khái niệm ít gặp hơn hoặc khi muốn so sánh với các công thức của cơ học Newton. Với quy ước chuẩn về cách tính tổng khi gặp các chỉ số lặp lại, các chỉ số Hy Lạp sẽ có giá trị từ 0 đến 3, trong khi các chỉ số Latin chạy từ 1 đến 3.

Khái niệm không thời gian sửa

Bước quan trọng đầu tiên để hiểu đúng đắn thuyết tương đối rộng, và từ đó là cấu trúc toán học của nó, chính là sự từ bỏ ý tưởng của Galilei về một không gian tuyệt đối và thời gian tuyệt đối. Hơn thế, điều này đưa đến đề xuất cách mạng về sự từ bỏ ý nghĩ không gian và thời gian như là những thành phần của một phông nền cố định, một đối tượng mà mọi quá trình xảy ra trên nó. Từ đây, các nhà vật lý cần thiết phải coi không gian và thời gian là những yếu tố động lực trong các định luật của tự nhiên, và cũng vì thế mà những định luật này bị ảnh hưỏng sâu sắc bởi chúng. Ý tưởng cách mạng này nằm ở trung tâm của thuyết tương đối và là một trong những thành tựu khoa học có ảnh hưởng lớn nhất của mọi thời đại.

Việc từ bỏ ý tưởng về một không gian tuyệt đối và một thời gian tuyệt đối dẫn tới sự giới thiệu không tránh khỏi của một khái niệm mới, đó là không thời gian, một đối tượng bốn chiều đơn nhất ${\mathcal {S}}$ , mà tuy nhiên, không nên chỉ coi nó như là một sân khấu cho tiến trình của một hệ vật lý xác định, mà nó còn là một trường động lực tham gia vào sự tiến triển của chính hệ vật lý đó. Những phần tử của không thời gian trừu tượng này được gọi là sự kiện, một khái niệm dường như cũng trừu tượng nhưng không hẳn là vậy. Chúng ta chắc chắn đã quen với khái niệm "cái gì đó ở nơi nào đấy" vì nó trở thành một phần nhận thức của chúng ta về thế giới khi còn là một đứa trẻ. Tương tự, khái niệm sự kiện có thể đi kèm với ý tưởng về "cái gì đó xảy ra ở nơi nào đấy", chẳng hạn như photon từ Mặt Trời tới võng mạc của chúng ta lúc bình minh. Do đó, các nhà vật lý thích nghĩ về các sự kiện như là các "điểm" $P$ trong không thời gian ${\mathcal {S}}$ , và sự tồn tại của chúng như là các phần tử của không thời gian độc lập với cách chọn hệ tọa độ để định vị chúng tại một vị trí không gian cụ thể trong một thời gian cho trước. Các sự kiện do đó tự chúng là những phần tử của không thời gian, mà tính động lực được điều chỉnh bởi các định luật vật lý.

Với tư duy như thế, các nhà vật lý nghĩ tới vấn đề các sự kiện liên hệ với nhau bằng cách nào. Nếu coi một sự kiện là "một cái gì đó xảy ra ở nơi nào đó", thì hai hay nhiều sự kiện có thể được liên hệ (vd, thông qua các định luật vật lý) và đưa vào thành "một dãy các sự kiện", mà, trong trường hợp dãy được xếp thứ tự với thời gian như là một tham số, chúng thuộc về một tập hợp, cụ thể hơn là một đường cong trong không thời gian, gọi là "đường thế giới" (worldline). Cũng trong trường hợp này, khái niệm trừu tượng về đường thế giới quả thực hiển nhiên giống với một cách giải thích quen thuộc khi chúng ta nghĩ tới tuyến đường trên một bản đồ (đoạn đường từ nhà tới nơi làm việc) như đường thế giới trong không thời gian miêu tả về chuyển động của chúng ta. Sự tài tình ở đây là, trong khi tuyến đường trên bản đồ kết nối các điểm (không gian) khác nhau mà chúng ta đứng tại những thời điểm khác nhau, thì đường thế giới kết nối các sự kiện khác nhau của không thời gian, tức là, những sự kiện mà chúng ta tham gia vào khi đi từ nhà đến nơi làm việc. Một hệ quả rõ ràng từ định nghĩa của đường thế giới là khi không có một không gian tuyệt đối và một thời gian tuyệt đối, bất kỳ sự lựa chọn theo thứ tự các sự kiện chỉ có thể là "tùy ý" (hoặc tương đối) khi có thể thay thế bằng những sự kiện tương đương và khả dĩ trên cùng một tập hợp các sự kiện. Tuy nhiên, kết quả này không nên chỉ coi đó là một giới hạn, nhưng mà là một đặc điểm quan trọng trong bức tranh mới về không gian và thời gian, một điều căn bản trong thuyết tương đối rộng. Nói chung, khái niệm như tính đồng thời vẫn được giữ lại nhưng phải được thể hiện một cách đúng đắn, và điều này được nhắc tới ở phần sau.

Đa tạp không thời gian sửa

M

U_{\alpha }

U_{\beta }

\varphi _{\alpha }

\varphi _{\beta }

\tau _{\alpha ,\beta }

\tau _{\beta ,\alpha }

\mathbb {R} ^{n}

\mathbb {R} ^{n}

Hai bản đồ

\scriptstyle \{(U_{\alpha },\varphi _{\alpha })\}\to \mathbb {R} ^{n}

trên đa tạp M.

\scriptstyle U_{\alpha },U_{\beta }

là 2 tập con mở,

\scriptstyle \varphi _{\alpha },\varphi _{\beta }

là hai ánh xạ địa phương khả vi từ các tập con mở vào không gian Euclid. Atlas của M là tập hợp các bản đồ

\scriptstyle \{(U_{\alpha },\varphi _{\alpha })\}

sao cho

\scriptstyle \bigcup U_{\alpha }=M

. Giả sử

\scriptstyle U_{\alpha }\cap U_{\beta }

không rỗng, khi đó ánh xạ chuyển tiếp

\scriptstyle \tau _{\alpha ,\beta }:\varphi _{\alpha }(U_{\alpha }\cap U_{\beta })\to \varphi _{\beta }(U_{\alpha }\cap U_{\beta })

xác định bởi

\scriptstyle \tau _{\alpha ,\beta }=\varphi _{\beta }\circ \varphi _{\alpha }^{-1}.

.

Thuyết tương đối rộng đề xuất ý tưởng miêu tả các hiện tượng vật lý bằng một tập hợp các sự kiện, tạo thành một thể liên tục (continuum) bốn chiều, gọi là không thời gian. Khái niệm toán học phù hợp nhất để đặc trưng cho không thời gian đó là một đa tạp khả vi ${\mathcal {M}}$ , một khái niệm kết hợp giữa những khái niệm của không gian tôpô và tính khả vi. Tức là, khi nói đến không thời gian bằng tập hợp các sự kiện, là một không gian tôpô, ta đang cung cấp thông tin về việc bằng cách nào mà những vùng khác nhau của continuum này được liên hệ với nhau. Hơn nữa, như đã rõ ràng khi ta nói về nguyên lý tương đương, thuyết tương đối rộng đòi hỏi rằng các sự kiện khác nhau của không thời gian cho phép các lân cận địa phương không giao nhau (rời nhau). Từ đây, không gian tôpô nhất thiết phải là không gian tôpô Hausdorff. Ngoài cấu trúc tôpô, ta cần trang bị cho không thời gian một cấu trúc vi phân thông qua phép tham số hóa khả vi bằng các tọa độ được gắn cho mỗi sự kiện. Những cách đặt tham số hóa này được thực hiện thông qua các hàm số của lớp $C^{k}$ với $k\geq 2$ , mà ánh xạ lân cận địa phương của mỗi sự kiện vào $\mathbb {R} ^{n}$ . Do vậy một đa tạp khả vi là một không gian tôpô Hausdorff vi phôi địa phương với $\mathbb {R} ^{n}$ . Ví dụ đơn giản về đa tạp đó là bề mặt của một hình cầu ba chiều ("mặt cầu 2 chiều") hoặc bất kỳ một siêu mặt m chiều nào trong không gian n chiều với $m\leq n$ .^[1]

Có rất nhiều sách và bài viết thảo luận về định nghĩa và tính chất của không gian tôpô và của đa tạp, chẳng hạn Franken 2011, Ch 2 và De Felice & Clarke 1992. Cho những mục đích ứng dụng chúng ta có thể coi ${\mathcal {M}}$ là "tập hợp chứa các sự kiện được tham số hóa", những thứ tạo nên không thời gian bốn chiều, và các tham số của chúng là những hàm khả vi tới một số bậc nhất định.

Số các tham số độc lập cần thiết để định ra một sự kiện trong ${\mathcal {M}}$ chính là số chiều của đa tạp và cách chọn những tham số này sẽ biểu diễn cách chọn hệ tọa độ cần thiết để phủ đa tạp, và có vô số cách chọn như thế. Ví dụ, hệ tọa độ sử dụng kinh độ và vĩ độ để xác định vị trí của điểm trên bề mặt Trái Đất. Khi áp dụng, chúng ta cần thiết định nghĩa một quy tắc gán tương ứng một điểm của đa tạp ${\mathcal {M}}$ , tức là sự kiện, vào không gian thực n chiều $\mathbb {R} ^{n}$ . Quy tắc này gọi là phép ánh xạ và cách chọn hệ tọa độ tương ứng sẽ phủ một phần hoặc toàn bộ đa tạp không thời gian. Các điểm lưu ý:

Ánh xạ thảo luận ở trên có thể coi là sự gán một - một các điểm trên đa tạp với các điểm của không gian Euclid với số chiều thích hợp. Sự tương ứng này là có ích nhưng phải cẩn thận khi áp dụng. Cụ thể hơn, nó nhấn mạnh rằng ít nhất trên cục bộ (hay địa phương) đa tạp nhìn giống như không gian Euclid.^[2] Tuy nhiên nó cũng ẩn chứa thực tế rằng tô pô toàn cục của đa tạp có thể rất khác so với tô pô Euclid. Chẳng hạn đa tạp là bề mặt của hình vòng xuyến: cả bề mặt lẫn tô pô toàn cục của nó khác hẳn so với không gian Euclid, nhưng có thể ánh xạ cục bộ một diện tích nhỏ trên bề mặt vào không gian Euclid, như mặt phẳng tiếp xúc với một điểm trong diện tích này.
Trong khi có vô hạn cách chọn hệ tọa độ để phủ một đa tạp, không phải cách nào cũng cho phương án tốt. Một số hệ tọa độ trong chúng có thể suy biến và khi phân tích toán học nghiệm của phương trình trường Einstein chứa đựng hệ tọa độ cho phép làm nổi bật nhất ý nghĩa vật lý của nghiệm. Lấy ví dụ lần nữa về hệ tọa độ cầu $(\theta ,\phi )$ trên mặt cầu 2 chiều. Rõ ràng hệ tọa độ này suy biến tại hai cực của mặt cầu vì có thể ánh xạ những tập vô hạn các giá trị, ví dụ khi $\theta =0,\pi$ và $\phi \in [0,2\pi ]$ .
Mỗi hệ tọa độ bao phủ một vùng nhất định của không thời gian gọi là mảnh hay bản đồ, và hai bản đồ có thể có miền giao nhau hoặc không. Atlas của đa tạp là bất kỳ những phép hợp các bản đồ sao cho phép hợp này bao phủ toàn bộ đa tạp.
Như đã nêu ở trên, mộ tính chất cơ bản của đa tạp trong thuyết tương đối rộng đó là chúng có tính khả vi, nghĩa là ánh xạ địa phương từ đa tạp vào $\mathbb {R} ^{n}$ phải khả vi. Mặt cầu hai chiều là đa tạp khả vi trong khi hình nón thì không, do nó không khả vi tại đỉnh nón vì không tồn tại ánh xạ khả vi từ điểm này vào $\mathbb {R} ^{n}$ .

Hệ tọa độ sửa

Ý tưởng về không thời gian (tập hợp chứa mọi sự kiện), như là một đa tạp (không gian phủ bởi các hệ tọa độ), là rất hấp dẫn từ quan điểm hình học, nhưng cũng phải là nguồn để đề cập đến từ quan điểm vật lý học, vì sự lựa chọn tùy ý hệ tọa độ có thể đưa đến việc làm mất các thông tin vật lý. Tuy vậy, đây là một lập luận không đúng và các phép đo phải là độc lập với hệ tọa độ, tức là, các phép đo sẽ cho cùng một kết quả trong mọi hệ tọa độ được lựa chọn. Tương tự, vẫn có thể dẫn ra được các phương trình độc lập với hệ tọa độ khi không thời gian được coi là một đa tạp.

Bước đầu tiên để học quá trình này đó là làm quen với các đối tượng cơ bản của một đa tạp, như đường cong, đại lượng vô hướng và vectơ, và cách chúng biến đổi như thế nào khi chuyển từ hệ tọa độ này sang hệ tọa độ khác. Kể từ đây chúng ta giả sử rằng ${\mathcal {M}}$ là đa tạp khả vi gồm bốn chiều (ba chiều không gian và một chiều thời gian), nhưng việc tổng quát hóa các tính chất của đa tạp lên đa tạp n chiều là trực tiếp.

Xét không thời gian được phủ bởi hai hệ tọa độ,^[3] $\{x^{\mu }\}$ và $\{x^{\mu '}\}$ ^[4] , hoặc tương đương, xét hai ánh xạ khác nhau $\Phi$ và $\Phi '$ đi từ ${\mathcal {M}}$ vào $\mathbb {R} ^{4}$ . Mỗi điểm P của ${\mathcal {M}}$ do đó được biểu diễn bằng hai tọa độ khác nhau, mỗi tọa độ chứa bốn phần tử, $\{x_{P}^{\mu }\}$ và $\{x_{P}^{\mu '}\}$ . Phép biến đổi tọa độ $\{x^{\mu }\}\rightarrow \{x^{\mu '}\}$ tại điểm P được biểu diễn bằng bốn hàm số đơn trị, liên tục và khả vi $f^{\mu }$ sao cho

\{x_{P}^{\mu '}\}=\left.f^{\mu '}(x^{1},x^{2},x^{3},x^{4})\right|_{P}=\left.f^{\mu '}(\mathbf {x} )\right|_{P}

(1)

ở đây ký hiệu x có bốn tọa độ $x^{\mu }$ ám chỉ những đối tượng bôi đậm thuộc về ${\mathcal {M}}$ . Bởi vì đa tạp là khả vi, do vậy phép biến đổi tọa độ không chỉ đúng tại điểm P, tức là

\{x^{\mu '}\}=f^{\mu '}(\mathbf {x} )

(2)

Hàm f cũng phải khả nghịch, do đó hàm f⁻¹ là phép biến đổi tọa độ nghịch đảo $\{x^{\mu '}\}\rightarrow \{x^{\mu }\}$ và

\{x^{\mu }\}=(f^{-1})^{\mu }(\mathbf {x'} )

(3)

với phép toán kết hợp $f\circ f^{-1}$ trở thành đồng nhất, nghĩa là $x^{\mu }=x^{\mu }(x^{\mu '})=x^{\mu }(x^{\mu '}(x^{\mu }))$ .

Ví dụ coi mặt phẳng là một đa tạp hai chiều với hai hệ tọa độ $\{x^{\mu }\}=(x,y)$ và $\{x^{\mu '}\}=(r,\theta )$ do vậy

f:{\begin{cases}x=rcos\theta \\y=rsin\theta ,\end{cases}}\quad f^{-1}:{\begin{cases}r=(x^{2}+y^{2})^{\frac {1}{2}}\\\theta =tan^{-1}\left({\frac {y}{x}}\right),\end{cases}}

(4)

và nếu áp dụng hàm hợp $f\circ f^{-1}$ đối với tập tọa độ thứ nhất ta thu được đồng nhất thức $x=(x^{2}+y^{2})^{\frac {1}{2}}cos[tan^{-1}(y/x)]=x.$

Khai thác tính khả vi của đa tạp, chúng ta có thể lấy vi phân của tọa độ x' theo x và thu được ma trận biến đổi

\mathbf {\Lambda } ^{\mu '}{}_{\mu }:={\frac {\partial x^{\mu '}}{\partial x^{\mu }}}=\left({\begin{array}{rrrr}{\dfrac {\partial x^{0'}}{\partial x^{0}}}&{\dfrac {\partial x^{0'}}{\partial x^{1}}}&{\dfrac {\partial x^{0'}}{\partial x^{2}}}&{\dfrac {\partial x^{0'}}{\partial x^{3}}}\\{\dfrac {\partial x^{1'}}{\partial x^{0}}}&{\dfrac {\partial x^{1'}}{\partial x^{1}}}&{\dfrac {\partial x^{1'}}{\partial x^{2}}}&{\dfrac {\partial x^{1'}}{\partial x^{3}}}\\{\dfrac {\partial x^{2'}}{\partial x^{0}}}&{\dfrac {\partial x^{2'}}{\partial x^{1}}}&{\dfrac {\partial x^{2'}}{\partial x^{2}}}&{\dfrac {\partial x^{2'}}{\partial x^{3}}}\\{\dfrac {\partial x^{3'}}{\partial x^{0}}}&{\dfrac {\partial x^{3'}}{\partial x^{1}}}&{\dfrac {\partial x^{3'}}{\partial x^{2}}}&{\dfrac {\partial x^{3'}}{\partial x^{3}}}\end{array}}\right).

(5)

với định thức

J':=\left|{\frac {\partial x^{\mu '}}{\partial x^{\mu }}}\right|

(6)

là định thức Jacobi (hay Jacobian) của biến đổi tọa độ $f$ trong (2). Nếu J' khác 0 tại mọi điểm, khi đó phương trình (2) sẽ có nghiệm và chúng ta nhận được phép biến đổi ngược (3). Ngược lại, nếu J' = 0 tại một điểm, ta nói phép biến đổi là kỳ dị tại điểm đó. Tương tự ta có thể lấy vi phân tọa độ x theo x' và thu được ma trận biến đổi ngược

\mathbf {\Lambda } ^{\mu }{}_{\mu '}:=\left({\frac {\partial x^{\mu }}{\partial x^{\mu '}}}\right)

(7)

Đến đây, sử dụng quy tắc dây chuyền đối với đạo hàm riêng, sẽ không khó để chứng minh được rằng hai ma trận (5) và (7) là nghịch đảo của nhau, tức là

\mathbf {\Lambda '\Lambda } =\mathbb {I}

(8)

với $\mathbf {\Lambda ',\Lambda } ,\mathbb {I}$ lần lượt là các ma trận tương ứng của $\Lambda ^{\mu '}{}_{\mu },\Lambda ^{\mu }{}_{\mu '}$ và ma trận đơn vị. Hệ quả trực tiếp của (8) đó là định thức Jacobi của hai ma trận là nghịch đảo của nhau, tức là J' = 1/J.

Ví dụ ma trận biến đổi giữa hai hệ tọa độ trong (4) là

\mathbf {\Lambda } '=\Lambda ^{\mu '}{}_{\mu }=\left({\begin{array}{rr}{\dfrac {\partial r}{\partial x}}&{\dfrac {\partial r}{\partial y}}\\{\dfrac {\partial \theta }{\partial x}}&{\dfrac {\partial \theta }{\partial y}}\end{array}}\right)

(9)

và

\mathbf {\Lambda } =\Lambda ^{\mu }{}_{\mu '}=\left({\begin{array}{rr}{\dfrac {\partial x}{\partial r}}&{\dfrac {\partial x}{\partial \theta }}\\{\dfrac {\partial y}{\partial r}}&{\dfrac {\partial y}{\partial \theta }}\end{array}}\right)

(10)

với $J'=1/(x^{2}+y^{2})^{1/2}=1/J.$

Đường cong (curve) và quỹ đạo (path) sửa

Sau khi đã giới thiệu khái niệm hệ tọa độ và biến đổi tọa độ, bây giờ chúng ta xét tới đối tượng đơn giản nhất trong đa tạp ${\mathcal {M}}$ mà sẽ dẫn tới định nghĩa tenxơ.

Xét trong không thời gian ${\mathcal {S}}$ một chuỗi các sự kiện $P_{1},...,P_{n}$ mà được liên hệ với nhau theo những cách nào đó. Như đã nói ở mục Khái niệm không thời gian, ta có thể liên hệ hoặc xếp thứ tự các sự kiện và sẽ thu được đường thế giới (worldline) khi tham số xếp thứ tự là tọa độ thời gian t. Bây giờ chúng ta mở rộng ý tưởng và xét các sự kiện mà không nhất thiết phải liên hệ thông qua thời gian, mà thông qua một tham số tổng quát hơn là $\lambda$ . Đối tượng thu được gọi là đường cong (curve) ${\mathcal {C}}$ và là ánh xạ từ một đoạn $I=[a,b]$ vào một tập hợp các điểm có tọa độ $\{x^{\mu }\}$ tức là

đường cong

{\mathcal {C}}\!:\{x^{\mu }(\lambda ),\lambda \in I\}

(11)

Rõ ràng rằng, cùng một tập hợp các điểm trong ${\mathcal {S}}$ có thể được tham số hóa vô hạn lần khi thay đổi cách lựa chọn tham số $\lambda$ . Cách xem xét này giúp chúng ta phân biệt với khái niệm quỹ đạo (path) - như là tập hợp các sự kiện trong ${\mathcal {S}}$ , so với đường cong đi qua các sự kiện này. Trong khi quỹ đạo là một đối tượng nội tại trong không thời gian ${\mathcal {S}}$ thì đường cong lại phụ thuộc vào cả cách tham số hóa nó cũng như việc chọn hệ tọa độ để lập bản đồ (chart) cho đa tạp ${\mathcal {M}}$ . Khi thay đổi tham số $\lambda$ sẽ dẫn tới đường cong mới đi qua cùng quỹ đạo trong ${\mathcal {S}}$ và cùng hệ tọa độ biểu diễn trong ${\mathcal {M}}$ (trong trường hợp này nó được gọi là ảnh). Tuy nhiên, khi thay đổi hệ tọa độ sẽ đem lại một đường cong mới đi qua cùng một quỹ đạo trong ${\mathcal {S}}$ , nhưng rõ ràng nó sẽ không chứa cùng những tọa độ biểu diễn trong ${\mathcal {M}}$ . Nói cách khác, khái niệm quỹ đạo mang ý nghĩa cơ bản hơn so với khái niệm đường cong và ảnh, chúng ta có thể xây dựng hai đường cong:

đường cong

{\mathcal {C}}'\!:\{x^{\mu }(\lambda '),\lambda '\in I'\}

(12)

và

đường cong

{\mathcal {L}}'\!:\{x^{\mu '}(\lambda '),\lambda '\in I'\}

(13)

sao cho chúng chứa cùng một quỹ đạo trong ${\mathcal {S}}$ , với ${\mathcal {C}}\!$ và ${\mathcal {C}}'$ có cùng ảnh, nhưng ${\mathcal {C}}$ và ${\mathcal {L}}'$ có ảnh khác nhau.

Cuối cùng, chúng ta có thể mở rộng khái niệm đường cong cho một mặt với hai tham số,

mặt

{\mathcal {H}}\!:\{x^{\mu }(\lambda ^{1},\lambda ^{2});\lambda ^{1},\lambda ^{2}\in I\}

(14)

Mặt được gọi là siêu mặt của đa tạp nếu số tham số cần thiết để miêu tả nó bằng số chiều của đa tạp trừ đi một, ví dụ siêu mặt 3 chiều đối với không thời gian bốn chiều.

Vectơ tiếp xúc sửa

xem thêm: Véctơ-4

Không gian tiếp tuyến

\scriptstyle T_{x}M

và vectơ tiếp tuyến

\scriptstyle v\in T_{x}M

dọc một đường cong đi qua điểm

\scriptstyle x\in M

Tất cả những khái niệm đã giới thiệu về các đường cong và mặt có thể được coi như là những công cụ cơ bản để định nghĩa khái niệm rất quan trọng và hữu ích, đó là vectơ tiếp xúc (tangent vector) với đường cong ${\mathcal {C}}$ . Nếu coi đường cong là tập hợp các điểm với mỗi điểm được đánh dấu bởi một bộ các tọa độ sắp thứ tự bằng một tham số λ, thì vectơ tiếp xúc là khái niệm dùng để diễn giải sự thay đổi tọa độ như thế nào dọc theo đường cong này. Nói cách khác, khi cho trước một hệ tọa độ $\{x^{\mu }\}$ trong đa tạp ${\mathcal {M}}$ và một đường cong ${\mathcal {C}}\!:\{x^{\mu }(\lambda ),\lambda \in I\}$ , vectơ tiếp xúc ${\boldsymbol {V}}_{P}$ tại điểm P dọc cung ${\mathcal {C}}$ được định nghĩa là tập hợp gồm bốn tọa độ

V_{P}^{\mu }:=\left.{\frac {dx^{\mu }}{d\lambda }}\right|_{P}

(15)

Chú ý rằng tại mỗi điểm P chỉ có duy nhất một vectơ tiếp xúc với đường cong và thậm chí hai đường cong có thể có chung một vectơ tiếp tuyến tại điểm chung P, và hai đường này sẽ có thể có một số điểm chung ở một số nơi (hai đường khác nhau) hoặc hoàn toàn đồng nhất giống nhau. Vì điểm P là bất kỳ, có thể viết biểu thức tổng quát cho định nghĩa của vectơ tiếp xúc ${\boldsymbol {V}}$ cho đường cong ${\mathcal {C}}$ là

$V^{\mu }:={\frac {dx^{\mu }}{d\lambda }}$

(16)

Chúng ta nên phân biệt giữa vectơ là đối tượng hình học, viết là ${\boldsymbol {V}}$ , và cách biểu diễn nó trong một hệ tọa độ cụ thể, mà trong trường hợp này chúng ta nói đến các thành phần tọa độ của nó $V^{\mu }$ . Sự quan trọng của biểu thức (16) là nó cho phép chúng ta có khả năng định nghĩa một đại lượng hình học theo các tính chất của phép biến đổi đối với nó dưới ảnh hưởng của sự thay đổi hệ tọa độ. Quả vậy, chúng ta xét một hệ tọa độ mới $\{x^{\mu '}\}$ và sử dụng biểu thức (2) để tính toán các thành phần tọa độ của cùng một vectơ tiếp xúc ${\boldsymbol {V}}$ đối với hệ tọa độ mới này

V^{\mu '}:={\frac {dx^{\mu '}}{d\lambda }}=\sum _{\mu =0}^{3}{\dfrac {\partial {x^{\mu '}}}{\partial {x^{\mu }}}}{\frac {dx^{\mu }}{d\lambda }}=\sum _{\mu =0}^{3}{\dfrac {\partial {x^{\mu '}}}{\partial {x^{\mu }}}}V^{\mu }

(17)

với phương trình thứ hai đã áp dụng định nghĩa của vi phân

dx^{\mu '}=\sum _{\mu =0}^{3}{\dfrac {\partial {x^{\mu '}}}{\partial {x^{\mu }}}}dx^{\mu }

(18)

và phương trình cuối cùng (17) có được từ định nghĩa của (16).

Bởi vì cách đặt ký hiệu tốt rất quan trọng và điều này càng có ý nghĩa đặc biệt trong thuyết tương đối rộng, đầu tiên chúng ta có thể viết gọn lại (17) bằng cách áp dụng ký hiệu quy ước tổng do Einstein đặt ra, mà khi ta gặp một chỉ số xuất hiện hai lần điều này sẽ hàm ý việc tính tổng giữa các chỉ số từ 0 đến 3, và thứ hai chúng ta có thể áp dụng cách viết rút ngắn hơn nhờ phương trình (5) cho phép biến đổi ma trận, tức là

V^{\mu '}=\Lambda ^{\mu '}{}_{\mu }V^{\mu }

(19)

Biểu thức (19) cần được giải thích rõ hơn, đầu tiên đó là chỉ số $\mu$ là chỉ số được tính tổng (hay chỉ số rút gọn-contraction) tức là nó xuất hiện một lần với vai trò là chỉ số trên (phản biến-contravariance) trong $V^{\mu }$ và một lần với vai trò là chỉ số dưới (hiệp biến-covariance) trong $\Lambda ^{\mu '}{}_{\mu }$ . Chỉ số này còn được gọi là chỉ số câm (dummy) để phân biệt với chỉ số tự do $\mu '$ xuất hiện như là một chỉ số không thể thu gọn được ở cả hai vế của phương trình tenxơ (19). Bằng cách kiểm tra số lượng các chỉ số tự do có ở hai vế của phương trình là cách đơn giản nhất, ít nhất về mặt toán học, đó là phương trình tenxơ đã đúng hay chưa (và có thể có nhiều lý do để phương trình chưa đúng).

Phương trình (19) là rất tổng quát và biểu diễn quy tắc biến đổi cho các vectơ phản biến^[5]. Về cơ bản, bốn phương trình trong (19) cho chúng ta cách tính các thành phần tọa độ của vectơ $\mathbf {V}$ trong hệ tọa độ $\{x^{\mu '}\}$ một khi chúng ta biết các thành phần của nó trong hệ tọa độ $\{x^{\mu }\}$ .

Chúng ta có thể mở rộng biểu thức (19) cho trường hợp biến đổi tọa độ tổ hợp, tức là khi xét hai hệ tọa độ: biến đổi hệ tọa độ thứ nhất từ hệ $\{x^{\mu }\}$ thành $\{x^{\mu '}\}$ và sau đó chuyển sang $\{x^{\mu ''}\}$ hay

\{x^{\mu }\}\rightarrow \{x^{\mu '}\}\rightarrow \{x^{\mu ''}\}

(20)

và coi đó như là một lần biến đổi

\{x^{\mu }\}\rightarrow \{x^{\mu ''}\}

(21)

do vậy vectơ (phản biến) sẽ biến đổi theo quy tắc

V^{\mu ''}=\Lambda ^{\mu ''}{}_{\mu '}V^{\mu '}=\Lambda ^{\mu ''}{}_{\mu '}\Lambda ^{\mu '}{}_{\mu }V^{\mu }=\Lambda ^{\mu ''}{}_{\mu }V^{\mu }

(22)

Như đã nói ở phần trước, chúng ta có thể viết ra phép biển đổi ngược của (1.19) là

V^{\mu }=\Lambda ^{\mu }{}_{\mu '}V^{\mu '}

(23)

Bốn phương trình (23) cho chúng ta cách tính thành phần tọa độ của vec tơ $\mathbf {V}$ trong hệ $\{x^{\mu }\}$ một khi đã biết các thành phần của nó trong hệ $\{x^{\mu '}\}$ . Rõ ràng là hai ma trận biến đổi của hai phép biến đổi ngược là ma trận nghịch đảo của nhau, hay

\Lambda ^{\mu '}{}_{\mu }\Lambda ^{\mu }{}_{\nu '}=\delta _{\nu '}^{\mu '}={\begin{cases}1,&{\mbox{khi }}\mu '=\nu '\\0,&{\mbox{khi }}\mu '\neq \nu '\end{cases}}

(24)

Điều này cũng đúng cho phép biến đổi ngược lại

\Lambda ^{\mu }{}_{\mu '}\Lambda ^{\mu '}{}_{\nu }=\delta _{\nu }^{\mu }={\begin{cases}1,&{\mbox{khi }}\mu =\nu \\0,&{\mbox{khi }}\mu \neq \nu \end{cases}}

(25)

Chú ý rằng cả hai phương trình (24) và (25) là tương đương với Jacobian của biến đổi khác 0,

det\left(\Lambda ^{\mu '}{}_{\mu }\right)\neq 0;det\left(\Lambda ^{\mu }{}_{\mu '}\right)\neq 0

(26)

Đại lượng $\delta _{\nu }^{\mu }$ được gọi là ký hiệu Kronecker.

Ở phần này, chúng ta đã giới thiệu một tập hợp tổng quát chứa các điểm được liên hệ với nhau thông qua một tham số, hay đường cong trong đa tạp, sau đó nêu ra định nghĩa khái niệm vectơ tiếp xúc tại một điểm P và học được cách biểu diễn đại lượng hình học này biến đổi như thế nào dưới những hệ tọa độ khác nhau. Điều này dẫn chúng ta tới một khái niệm tổng quát hơn đó là không gian tiếp xúc của đa tạp ${\mathcal {M}}$ tại điểm P: đó là không gian chứa mọi vectơ phản biến tại P.

Gradien của hàm số sửa

Một vec tơ bất kỳ có thể được xây dựng dựa trên khái niệm đường cong. Chúng ta có thể thấy điều này bằng cách áp dụng định nghĩa (11) của đường cong ${\mathcal {C}}$ trong đa tạp và giới thiệu ra hàm vô hướng $\phi$ , một hàm giá trị thực ánh xạ điểm P bất kỳ có tọa độ $x^{\mu }(\lambda )$ trong ${\mathcal {M}}$ vào một số thực $\phi (x^{m}u(\lambda )){\Big |}_{P}$ . Bây giờ chúng ta có thể tính được hàm thực này biến đổi như thế nào dọc đường cong ${\mathcal {C}}$ bằng^[6]

{\frac {d\phi }{d\lambda }}={\dfrac {\partial \phi }{\partial x^{\mu }}}{\frac {dx^{\mu }}{d\lambda }}={\dfrac {\partial \phi }{\partial x^{\mu }}}V^{\mu }=U_{\mu }V^{\mu }

(27)

Phương trình thứ hai trong phương trình (27) chỉ đơn giản là định nghĩa của vectơ tiếp xúc đã gặp ở (16), trong khi ở phương trình thứ ba là định nghĩa của gradien của hàm số $\phi$

$U_{\mu }:={\dfrac {\partial \phi }{\partial x^{\mu }}}=({\tilde {d}}\phi )_{\mu }$

(28)

với chỉ số tự do phải là chỉ số nằm ở dưới (tức là hiệp biến) và đây là đặc điểm phân biệt với vectơ $U^{\mu }$ .

Để hiểu tốt hơn tại sao chỉ số trong $U_{\mu }$ phải ở dưới, chúng ta có thể nghiên cứu cách đối tượng hình học này hành xử dưới một phép biến đổi tọa độ và làm rõ ý nghĩa của nó hơn. Một lần nữa, nếu $U_{\mu }$ là thành phần của đối tượng này trong hệ tọa độ $\{x^{\mu }\}$ thì thành phần của nó trong $\{x^{\mu '}\}$ là

U_{\mu '}:={\dfrac {\partial \phi }{\partial x^{\mu '}}}={\dfrac {\partial \phi }{\partial x^{\mu }}}{\dfrac {\partial x^{\mu }}{\partial x^{\mu '}}}=U_{\mu }{\dfrac {\partial x^{\mu }}{\partial x^{\mu '}}}

(29)

Hay nói cách khác, quy tắc biến đổi cho gradien của hàm số $\phi$ là

({\tilde {d}}\phi )_{\mu '}={\dfrac {\partial x^{\mu }}{\partial x^{\mu '}}}({\tilde {d}}\phi )_{\mu }

(30)

và có thể được sử dụng làm định nghĩa cho khái niệm vectơ hiệp biến (covariant vector).

Chú ý rằng biến đổi (30) là biến đổi ngược của quy tắc đã gặp cho các thành phần của vectơ [xem phương trình (19)]. Lý do cho điều này đến từ thực tế rằng vectơ phản biến và vectơ hiệp biến là đại lượng đối ngẫu của nhau, do đó không gian chứa mọi vectơ hiệp biến là không gian đối ngẫu của không gian tiếp tuyến mà chúng ta đã gặp ở phần trước.^[7] Bởi vì đây là một kết quả quan trọng và mối liên hệ sâu sắc giữa vectơ hiệp biến và vectơ phản biến sẽ được trình bày rõ ở phần sau. Như đối với vectơ phản biến, chúng ta có thể đưa ra biến đổi ngược cho vectơ hiệp biến và dễ dàng thu được

({\tilde {d}}\phi )_{\mu }={\dfrac {\partial x^{\mu '}}{\partial x^{\mu }}}({\tilde {d}}\phi )_{\mu '}

(31)

Người đọc thận trọng có thể tự hỏi tại sao chúng ta không viết (30) như sau

({\tilde {d}}\phi )_{\mu '}=\Lambda ^{\mu }{}_{\mu '}({\tilde {d}}\phi )_{\mu }

(32)

và tại sao không viết (31) như sau

({\tilde {d}}\phi )_{\mu }=\Lambda ^{\mu '}{}_{\mu }({\tilde {d}}\phi )_{\mu '}

(33)

Lý do đằng sau sự lựa chọn này là ở cách ký hiệu ma trận theo cách viết trong (32) và (33) có thể sẽ gây ra sự nhầm lẫn một khi chúng ta coi $\Lambda _{\mu '}^{\mu }$ giống như ở trong phương trình (23). Điều này sẽ trở lên rõ ràng nếu chúng ta quay trở lại ví dụ về biến đổi tọa độ miêu tả ở trong phần Hệ tọa độ. Quả thực, khi chúng ta biến đổi gradien của một vô hướng từ tọa độ $(x,y)$ sang $(r,\theta )$ , ma trận đúng viết trong (32) mà nhân với vectơ cột ${\tilde {d}}\phi )_{\mu }$ phải là

\Lambda ^{i'}{}_{j}=\left({\begin{array}{rr}{\dfrac {\partial x}{\partial r}}&{\dfrac {\partial y}{\partial r}}\\{\dfrac {\partial x}{\partial \theta }}&{\dfrac {\partial y}{\partial \theta }}\end{array}}\right)

(34)

mà chính là ma trận chuyển vị của ma trận được định nghĩa trong (10).

Ở những phần sau, chúng ta sẽ sử dụng ký hiệu $\Lambda ^{\mu '}{}_{\mu }$ đại diện cho $\partial x^{\mu '}/\partial x^{\mu }$ và $\Lambda ^{\mu }{}_{\mu '}$ đại diện cho $\partial x^{\mu }/\partial x^{\mu '}$ .

Ý nghĩa hình học của vectơ phản biến và vectơ hiệp biến sửa

Một vectơ v (đỏ) biểu diễn bằng

hệ vectơ cơ sở tiếp tuyến (vàng,: e₁, e₂, e₃) với tọa độ cong (đen),
hệ vectơ cơ sở đối ngẫu, (xanh,: e¹, e², e³), các vectơ pháp tuyến vuông góc với bề mặt tọa độ (xám),

trong hệ tọa độ cong 3 chiều (q¹, q², q³), một bộ các số xác định lên vị trí của điểm. Chú ý rằng hệ cơ sở và hệ cơ sở đối ngẫu không trùng nhau trừ khi hệ là cơ sở trực giao.^[8]

Chúng ta có thể kết hợp các định nghĩa trên đây để đi đến một miêu tả thống nhất về vectơ phản biến và vectơ hiệp biến. Đặc biệt, chúng ta có thể sử dụng định nghĩa gradien dọc một đường cong (27) và viết lại thành

{\frac {d\phi }{d\lambda }}={\frac {dx^{\mu }}{d\lambda }}{\dfrac {\partial \phi }{\partial x^{\mu }}}=V^{\mu }({\tilde {d}}\phi )_{\mu }

(35)

do đó vectơ phản biến $\mathbf {V}$ có thể được coi như là một đối tượng hình học tiếp tuyến với đường cong có tham số $\lambda$ và đo tỉ số ${d\phi }/{d\lambda }$ cho một hàm vô hướng bất kỳ $\phi$ dọc đường cong. Theo cách này, có thể coi vectơ là đại lượng độc lập với hệ tọa độ, và xác định lên, ít nhất trong một miền lân cận nhất định, đường cong mà nó tiếp xúc. Thành phần phản biến $V^{\mu }$ của nó cho phép đo sự thay đổi của hệ tọa độ dọc theo đường cong đó và những thứ này có mối liên hệ chặt với cách lựa chọn hệ tọa độ; một hệ tọa độ khác sẽ dẫn tới những thành phần tọa độ khác, cũng như hàm gradien $({\tilde {d}}\phi )_{\mu }$ khác.

Tất nhiên, chúng ta có thể thực hiện mà không cần hàm vô hướng $\phi$ trong (1.35) và coi vectơ như là một đối tượng xác định bằng

$\mathbf {V} :={\dfrac {d}{d\lambda }}=V^{\mu }{\dfrac {\boldsymbol {\partial }}{{\boldsymbol {\partial x}}^{\mu }}}=V^{\mu }\mathbf {e} _{\mu }$

(36)

mà chúng ta đưa ra ký hiệu

\mathbf {e} _{\mu }:={\dfrac {\boldsymbol {\partial }}{{\boldsymbol {\partial x}}^{\mu }}}={\boldsymbol {\partial }}_{\mu }

(37)

để chỉ bốn vectơ cơ sở $\{e_{\mu }\}$ dọc theo hướng xác định bởi tọa độ $\{x_{\mu }\}$ ^[9] Những cơ sở vectơ này, mà có liên hệ chặt với hệ tọa độ đang áp dụng, được gọi là tọa độ cơ sở. Theo cách này, biểu thức (36) nói một cách đơn giản rằng $\mathbf {V}$ là tổ hợp của các thành phần phản biến $V^{\mu }$ dọc theo hướng tọa độ.

Định nghĩa vectơ theo phương trình (36) mang bản chất hình học của vectơ và có vẻ rất khác thường. Nhưng thực ra nếu xem xét kỹ, khi coi đa tạp ba chiều đi kèm với đạo hàm theo hướng (directional derivative) $\{{\boldsymbol {\partial }}/{{\boldsymbol {\partial x}}^{i}}\}$ với cơ sở vectơ $\{e_{i}\}$ của giải tích vectơ cổ điển, khi đó rõ ràng rằng vectơ trong (36) lại được biểu diễn trùng với hệ ba vectơ ba chiều, tức là

{\begin{aligned}{\overrightarrow {\mathbf {V} }}=V^{i}{\overrightarrow {\mathbf {e} }}_{i}&=V^{x}{\overrightarrow {\mathbf {e} }}_{x}+V^{y}{\overrightarrow {\mathbf {e} }}_{y}+V^{z}{\overrightarrow {\mathbf {e} }}_{z}\\&=V^{r}{\overrightarrow {\mathbf {e} }}_{r}+V^{\theta }{\overrightarrow {\mathbf {e} }}_{\theta }+V^{\phi }{\overrightarrow {\mathbf {e} }}_{\phi }=...\\\end{aligned}}

(38)

khi ${\overrightarrow {\mathbf {V} }}$ được biểu diễn trong hệ tọa độ DeCartes (phương trình thứ hai) và trong hệ tọa độ cầu (phương trình thứ ba) hoặc trong bất kỳ cơ sở tọa độ nào. Cách nhìn mới về vec tơ này cũng hữu ích khi mở ra cách nhìn mới về đối vectơ hay một dạng một (covector, one form). Quả vậy, chúng ta có thể quay trở lại định nghĩa trong (35) và xét tới vectơ hiệp biến ${\boldsymbol {\tilde {d}}}$ như là một toán tử ${\boldsymbol {{\tilde {d}}(.)}}$ tác dụng lên vectơ sao cho khi áp dụng đối với vectơ $\mathbf {V}$ nó trả lại một số thực,^[10] nghĩa là

${\boldsymbol {{\tilde {d}}(V)}}=V^{\mu }d_{\mu }$

(39)

Khi coi là một toán tử tác dụng lên vectơ, đối vec tơ là một toán tử tuyến tính tức là

{\boldsymbol {\tilde {d}}}=a{\boldsymbol {\tilde {p}}}+b{\boldsymbol {\tilde {q}}}\Rightarrow {\boldsymbol {\tilde {d}}}({\boldsymbol {V}})=a{\boldsymbol {\tilde {p}}}({\boldsymbol {V}})+b{\boldsymbol {\tilde {q}}}({\boldsymbol {V}})

(40)

với a, b là các hệ số hằng số. Ngoài ra, nó còn tuân theo luật phân phối

{\boldsymbol {\tilde {d}}}(a{\boldsymbol {V}}+b{\boldsymbol {U}})=a{\boldsymbol {\tilde {d}}}({\boldsymbol {V}})+b{\boldsymbol {\tilde {d}}}({\boldsymbol {U}})

(41)

Cách giải thích hình học này đã thực sự thống nhất các khái niệm vectơ và đối vectơ (1-dạng, 1-form). Theo cách này, một vec tơ $\mathbf {V}$ xác định lên đường cong mà nó tiếp tuyến với, trong dạng một ${\tilde {d}}$ xác định gradien của một hàm vô hướng dọc cùng cung đó. Hơn nữa, dạng một tác dụng lên vectơ tạo ra một số độc lập với tọa độ và do vậy là bất biến tương đối tính. Tính chất quan trọng này được chứng minh bắt đầu bằng định nghĩa (39) khi viết trong hệ tọa độ mới $\{x^{\mu '}\}$

{\begin{aligned}{\boldsymbol {{\tilde {d}}(V)}}=V^{\mu '}d_{\mu '}&=(\Lambda ^{\mu '}{}_{\nu }V^{\nu })(\Lambda ^{\mu }{}_{\mu '}d_{\mu })\\&=\Lambda ^{\mu '}{}_{\nu }\Lambda ^{\mu }{}_{\mu '}V^{\nu }d_{\mu }\\&=\delta ^{\mu }{}_{\nu }V^{\nu }d_{\mu }=V^{\mu }d_{\mu }\\\end{aligned}}

(42)

Tính chất bất biến này cũng áp dụng cho định nghĩa (36) của vectơ và cho phép chúng ta suy ra quy tắc biến đổi của cơ sở vectơ

{\begin{aligned}{\boldsymbol {V}}=V^{\mu '}{\boldsymbol {e}}_{\mu '}&=V^{\mu }{\boldsymbol {e}}_{\mu }\\&=\Lambda ^{\mu }{}_{\nu '}V^{\nu '}{\boldsymbol {e}}_{\mu }=\Lambda ^{\mu }{}_{\mu '}V^{\mu '}{\boldsymbol {e}}_{\mu }\\\end{aligned}}

(43)

do đó, gộp các thành phần của vectơ $\mathbf {V}$ ta được

V^{\mu '}({\boldsymbol {e}}_{\mu '}-\Lambda ^{\mu }{}_{\mu '}{\boldsymbol {e}}_{\mu })=0,

(44)

Vì thế, đối với mọi vectơ không tầm thường ta có

{\boldsymbol {e}}_{\mu '}=\Lambda ^{\mu }{}_{\mu '}{\boldsymbol {e}}_{\mu }

(45)

Mặc dù biểu thức (45) không phải là phương trình biến đổi cho thành phần tọa độ, nhưng chúng ta nhận ra ngay lập tức sự tương tự giữa (45) và quy tắc biến đổi cho thành phần của đối vectơ trong (32). Vì vậy có thể nói rằng cơ sở vectơ biến đổi theo quy tắc giống như các thành phần của đối vectơ biến đổi và theo "cách ngược lại" với thành phần của vectơ. Chú ý rằng chữ "ngược" trong dấu hai phẩy vì nếu ta đọc biến đổi vectơ cơ sở trong (45) như là biểu diễn ma trận của sự thay đổi cơ sở, thì biểu diễn ma trận tương ứng trong (19) chấp nhận nghịch đảo của ma trận chuyển vị sử dụng trong (45) chứ không phải nghịch đảo của ma trận này (xem ở phần Gradien của hàm số).

Cuối cùng, khi đã giới thiệu định nghĩa cơ sở vectơ, sẽ tự nhiên khi đặt ra câu hỏi về định nghĩa cơ sở của đối vectơ do vectơ và đối vectơ (hay dạng một) là những đại lượng đối ngẫu, nghĩa là

{\boldsymbol {\tilde {\omega }}}^{\mu }({\boldsymbol {e}}_{\nu })=\delta _{\nu }^{\mu }

(46)

do đó một cơ sở vectơ $\{{\boldsymbol {e}}_{\nu }\}$ sinh ra một cơ sở đối vectơ $\{{\boldsymbol {{\tilde {\omega }}^{\mu }}}\}$ , và bất kỳ một đối vectơ ${\boldsymbol {\tilde {p}}}$ có thể biểu diễn theo các thành phần của nó

{\boldsymbol {\tilde {p}}}=p_{\mu }{\boldsymbol {\tilde {\omega }}}^{\mu }

(47)

Để chứng minh (46) là đúng, chúng ta có thể sử dụng (36) và (47) để nhận được

{\begin{aligned}p_{\mu }V^{\mu }={\boldsymbol {{\tilde {p}}(V)}}&=p_{\mu }{\boldsymbol {\tilde {\omega }}}^{\mu }({\boldsymbol {V}})\\&=p_{\mu }{\boldsymbol {\tilde {\omega }}}^{\mu }(V^{\nu }{\boldsymbol {e}}_{\nu })\\&=p_{\mu }V^{\nu }{\boldsymbol {\tilde {\omega }}}^{\mu }({\boldsymbol {e}}_{\nu })=p_{\mu }V^{\nu }\delta _{\nu }^{\mu }.\\\end{aligned}}

(48)

Tenxơ sửa

Định nghĩa của vectơ và đối vectơ đã giới thiệu ở phần trước là cơ sở cho nội dung của phần này. Chúng đã được giới thiệu để xác định các đối tượng hình học độc lập với bất kỳ hệ tọa độ nào và chúng ta đã học được rằng khi đưa ra một hệ tọa độ và chuyển đổi sang hệ tọa độ khác, các vectơ phản biến và vectơ hiệp biến biến đổi theo những quy tắc đơn giản trong (19) và (30).

Có ít nhất hai khía cạnh của vec tơ (hoặc đối với vectơ phản biến hoặc hiệp biến) mà khá rõ ràng. Thứ nhất đó là chúng ta không nhất thiết phải giới hạn định nghĩa vectơ tại một điểm. Mặt khác chúng ta có thể nghĩ tới toàn bộ miền của đa tạp ${\mathcal {M}}$ và thông qua một hàm trơn khả vi chúng ta gắn mỗi vectơ tại mỗi điểm của miền này, qua đó định nghĩa lên trường vectơ

f:\{P\in {\mathcal {M}}\longrightarrow V^{\mu }(P)\},\quad \quad g:\{P\in {\mathcal {M}}\longrightarrow U_{\mu }(P)\},

(49)

với $V^{\mu }(P),U_{\mu }(P)$ là giá trị của trường tại điểm P. Hơn nữa, trường vectơ được nói là khả vi nếu các thành phần của nó là những hàm tọa độ khả vi trong mọi hệ tọa độ. Khía cạnh thứ hai đó là vectơ chỉ là thành phần đơn giản nhất của một lớp đối tượng hình học tổng quát hơn gọi là tenxơ. Cũng như đối vectơ hiệp biến và vectơ phản biến, ten xơ có thể coi như là những đối tượng hình học mà được xác định hoàn toàn theo những tính chất dưới một phép biến đổi tọa độ.

Nhất quán với cách tiếp cận này, chúng ta định nghĩa một tenxơ phản biến hạng hai là một đối tượng hình học $\mathbb {T}$ , mà các thành phần biến đổi tuân theo quy tắc sau khi chuyển từ hệ tọa độ $\{x^{\mu }\}$ sang hệ mới $\{x^{\mu '}\}$ ^[11]

T^{\mu '\nu '}={\dfrac {\partial x^{\mu '}}{\partial x^{\mu }}}{\dfrac {\partial x^{\nu '}}{\partial x^{\nu }}}T^{\mu \nu }=\Lambda ^{\mu '}{}_{\mu }\Lambda ^{\nu '}{}_{\nu }T^{\mu \nu }

(50)

Tương tự chúng ta có thể định nghĩa tenxơ hiệp biến hạng hai là một đối tượng hình học $\mathbb {T}$ , mà các thành phần biến đổi tuân theo quy tắc sau khi chuyển từ hệ tọa độ $\{x^{\mu }\}$ sang hệ $\{x^{\mu '}\}$ ^[12]

T_{\mu '\nu '}={\dfrac {\partial x^{\mu }}{\partial x^{\mu '}}}{\dfrac {\partial x^{\nu }}{\partial x^{\nu '}}}T_{\mu \nu }=\Lambda ^{\mu }{}_{\mu '}\Lambda ^{\nu }{}_{\nu '}T_{\mu \nu }

(51)

Nếu hệ tọa độ là thông thường, cả hai biểu thức (50) và (51) sẽ thừa nhận phép biến đổi ngược và có thể suy ra trực tiếp dựa trên các biểu thức (23) và (31). Một cách tự nhiên, chúng ta có thể định nghĩa tenxơ hỗn hợp là một đối tượng hình học có cả thành phần hiệp biến và phản biến. Do vậy, ví dụ, chúng ta có thể định nghĩa tenxơ hỗn hợp loại (4,2) (tức là nó có bốn thành phần phản biến và hai thành phần hiệp biến) $R^{\alpha \beta \gamma \delta }{}_{\mu \nu }$ mà quy tắc biến đổi khi chuyển từ hệ tọa độ $\{x^{\mu }\}$ sang hệ $\{x^{\mu '}\}$ là^[13]

R^{\alpha '\beta '\gamma '\delta '}{}_{\mu '\nu '}=\Lambda ^{\alpha '}{}_{\alpha }\Lambda ^{\beta '}{}_{\beta }\Lambda ^{\gamma '}{}_{\gamma }\Lambda ^{\delta '}{}_{\delta }\Lambda ^{\mu }{}_{\mu '}\Lambda ^{\nu }{}_{\nu '}R^{\alpha \beta \gamma \delta }{}_{\mu \nu }

(52)

và biến đổi ngược sẽ là

R^{\alpha \beta \gamma \delta }{}_{\mu \nu }=\Lambda ^{\alpha }{}_{\alpha '}\Lambda ^{\beta }{}_{\beta '}\Lambda ^{\gamma }{}_{\gamma '}\Lambda ^{\delta }{}_{\delta '}\Lambda ^{\mu '}{}_{\mu }\Lambda ^{\nu '}{}_{\nu }R^{\alpha '\beta '\gamma '\delta '}{}_{\mu '\nu '}

(53)

Từ hai ví dụ trên sẽ không khó để hình dung ra cách xây dựng một tenxơ với số thành phần phản biến và hiệp biến là bất kỳ. Chúng ta có thể xây dựng lên không gian vectơ $\mathbf {V} ^{m}{}_{n}$ là tập hợp mọi tenxơ kiểu (m, n), ví dụ $R^{\alpha \beta \gamma \delta }{}_{\mu \nu }\in \mathbf {V} ^{4}{}_{2}$ .

Giờ đây chúng ta có thể coi vectơ và đối vectơ như là những tenxơ kiểu đặc biệt (lần lượt là kiểu (1, 0) và (0, 1)). Viết tenxơ theo các cơ sở vectơ (36) và cơ sở đối vectơ (47) để biểu diễn một tenxơ hỗn hợp như là đối tượng hình học độc lập với hệ tọa độ. Ví dụ đối với tenxơ hỗn hợp loại (1, 1) là

$\mathbf {R} =R^{\mu }{}_{\nu }\mathbf {e} _{\mu }\otimes {\mathbf {\tilde {\omega }} }^{\nu }$

(54)

với ký hiệu $\otimes$ là tích tenxơ. Chú ý rằng tích này không có tính giao hoán, tức là $\mathbf {e} _{\mu }\otimes {\mathbf {\tilde {\omega }} }^{\nu }\neq {\mathbf {\tilde {\omega }} }^{\nu }\otimes \mathbf {e} _{\mu }$ . Do vậy, hai tenxơ $\mathbf {R} =R^{\mu }{}_{\nu }\mathbf {e} _{\mu }\otimes {\mathbf {\tilde {\omega }} }^{\nu }$ và $\mathbf {\tilde {R}} ={\tilde {R}}_{\nu }{}^{\mu }{\mathbf {\tilde {\omega }} }^{\nu }\otimes \mathbf {e} _{\mu }$ là hai tenxơ khác nhau.

Tương tự như đối với vectơ, chúng ta có thể định nghĩa trường tenxơ bằng cách gán cho mỗi tenxơ kiểu (m, n) vào từng điểm P

f:\{P\in {\mathcal {M}}\longrightarrow V^{\alpha \beta ...}{}_{\mu \nu ...}(P)\},

(55)

với $V^{\alpha \beta ...}{}_{\mu \nu ...}(P)$ là giá trị của trường tenxơ tại P. Cũng vậy, trường tenxơ được nói là khả vi nếu các thành phần của nó là những hàm tọa độ khả vi trong mọi hệ tọa độ. Kể từ đây, chúng ta luôn luôn ám chỉ đến trường tenxơ mặc dù đôi khi chỉ viết ngắn gọn là tenxơ.

Nói chung, nếu một tenxơ có N chỉ số xác định trên đa tạp có D chiều, thì nó sẽ có $D^{N}$ thành phần. Do vậy, trong đa tạp bốn chiều mà chúng ta quan tâm, chúng ta có thể coi tenxơ là những ma trận có 4, 16, 64, 256 thành phần tương ứng với các ten xơ có 1, 2, 3, và 4 chỉ số. Có thể xảy ra trường hợp những thành phần này không độc lập hoàn toàn với nhau, như sẽ nêu ở phần dưới.

Tóm lược lại phần này:

-

V^{\mu }

: là vectơ phản biến hay vectơ, hoặc là tenxơ phản biến hạng 1, hoặc tenxơ kiểu (1, 0) hoặc

1 \choose 0

.

-

V_{\mu }

: là vectơ hiệp biến hay đối vectơ, hoặc dạng một, hoặc là tenxơ hiệp biến hạng 1, hoặc tenxơ kiểu (0, 1) hoặc

0 \choose 1

.

-

V_{\mu \nu }

: là là tenxơ hiệp biến hạng 2, hoặc tenxơ kiểu (0, 2) hoặc

0 \choose 2

.^[14]

-

V^{\mu \nu }{}_{\alpha \beta \gamma \delta }

: là là tenxơ hỗn hợp hiệp biến hạng 4 phản biến hạng 2, hoặc tenxơ kiểu (2, 4) hoặc

2 \choose 4

.

Đại số tenxơ sửa

Khi sử dụng thuyết tương đối rộng không thể tránh gặp phải những tính toán với sự có mặt của tenxơ và do vậy việc làm quen với các tính toán cơ bản của đại số tenxơ là điều cần thiết, và cuối cùng chúng ta đi tới giải tích tenxơ trong phần Không thời gian cong trong thuyết tương đối rộng. Bên cạnh những tính chất tuyến tính đã gặp ở đối vectơ hay dạng một (covector, one form) trong (39) mà đã được mở rộng thông thường khi coi vectơ ${\boldsymbol {V}}$ và dạng một ${\boldsymbol {\tilde {d}}}\phi$ là những tenxơ. Chúng ta liệt kê dưới đây một số tính chất quan trọng nhất của tenxơ cũng như các phép toán liên quan:

Tenxơ không: Nếu một ten xơ mà mọi thành phần của nó bằng 0 trong một hệ tọa độ, thì nó là tenxơ không và các thành phần của nó sẽ bằng 0 trong mọi hệ tọa độ.
Tenxơ đồng nhất bằng nhau: Nếu hai ten xơ cùng loại mà mọi thành phần của chúng tương ứng bằng nhau trong một hệ tọa độ, thì chúng được nói là đồng nhất bằng nhau, và các thành phần sẽ tương ứng bằng nhau trong mọi hệ tọa độ.
Hàm vô hướng: Tích của một trường vô hướng φ với một tenxơ có kiểu cho trước sẽ thu được một tenxơ có cùng kiểu, tức là nếu ${\boldsymbol {X}}\in {\boldsymbol {V}}_{n}^{m}$ và ${\boldsymbol {Y}}:={\boldsymbol {X}}\phi$ thì ${\boldsymbol {Y}}\in {\boldsymbol {V}}_{n}^{m}$ .
Phép cộng: Khi cộng hai tenxơ cùng kiểu sẽ thu được một tenxơ cùng kiểu, nếu ${\boldsymbol {X,Y}}\in {\boldsymbol {V}}_{n}^{m}$ thì ${\boldsymbol {Z:=X+Y}}\in {\boldsymbol {V}}_{n}^{m}$ .
Phép nhân: Khi nhân hai tenxơ có kiểu bất kỳ sẽ thu được một tenxơ có kiểu bằng tổng các kiểu tương ứng (tức là tổng các chỉ số phản biến và hiệp biến), hay còn gọi là tích ngoài của tenxơ, nếu ${\boldsymbol {X}}\in {\boldsymbol {V}}_{n}^{m}$ và ${\boldsymbol {Y}}\in {\boldsymbol {V}}_{q}^{p}$ thì ${\boldsymbol {Z}}:={\boldsymbol {X}}\otimes {\boldsymbol {Y}}$ khi đó ${\boldsymbol {Z}}\in {\boldsymbol {V}}_{n+q}^{m+p}$ . Sử dụng ký hiệu thành phần, với m=q=2 và n=p=1 thì $Z^{\alpha \beta \gamma }{}_{\lambda \mu \nu }=X^{\alpha \beta }{}_{\lambda }Y^{\gamma }{}_{\mu \nu }$ .
Rút gọn tenxơ: Thực hiện thu gọn một cặp chỉ số của tenxơ kiểu (m, n) thu được tenxơ kiểu mới (m-1, n-1) tức là $Z^{\alpha \beta \gamma }{}_{\gamma \mu \nu }=Z^{\alpha \beta }{}_{\mu \nu }$ .
Tenxơ đối xứng và phản xứng: Một tenxơ kiểu (m, n) được nói là đối xứng trên một cặp chỉ số bất kỳ p và q (hoặc là hiệp biến hoặc là phản biến) nếu các thành phần của nó không thay đổi khi thay đổi hai chỉ số này cho nhau. Ngược lại, ten xơ là phản xứng nếu nó đổi dấu khi thay đổi hai cặp chỉ số này cho nhau. Ví dụ đối với m = 0 và n = 2,

Z_{\mu \nu }

đối xứng

\iff Z_{\mu \nu }=Z_{\nu \mu }

(56)

Z_{\mu \nu }

phản xứng

\iff Z_{\mu \nu }=-Z_{\nu \mu }

(57)

Theo kết quả của (56) và (57) có thể xây dựng một tenxơ đối xứng hoặc phản xứng bằng một tenxơ bất kỳ

Z_{({\mu \nu })}={\frac {1}{2}}(Z_{\mu \nu }+Z_{\nu \mu }),\quad Z_{[{\mu \nu }]}=-{\frac {1}{2}}(Z_{\mu \nu }+Z_{\nu \mu })

(58)

với các dấu ngoặc tròn và ngoặc vuông ký hiệu cho tương ứng tenxơ đối xứng và tenxơ phản xứng. Và hệ quả rõ ràng từ (58) đó là một tenxơ bất kỳ luôn luôn có thể phân tích ra thành tổng của tenxơ đối xứng và tenxơ phản xứng

Z_{\mu \nu }=Z_{({\mu \nu })}+Z_{[{\mu \nu }]}

(59)

Biểu thức (58) có thể mở rộng ra cho ten xơ có kiểu bất kỳ, ví dụ ten xơ đối xứng và ten xơ phản xứng hiệp biến kiểu (0,3) có thể viết dưới dạng tổng của các ten xơ có chỉ số hoán vị của nó:

Z_{(\mu \nu \gamma )}={\frac {1}{3!}}(Z_{\mu \nu \gamma }+Z_{\nu \mu \gamma }+Z_{\gamma \mu \nu }+Z_{\mu \gamma \nu }+Z_{\gamma \nu \mu }+Z_{\nu \mu \gamma })

(60)

Z_{[\mu \nu \gamma ]}={\frac {1}{3!}}(Z_{\mu \nu \gamma }-Z_{\nu \mu \gamma }+Z_{\gamma \mu \nu }-Z_{\mu \gamma \nu }+Z_{\gamma \nu \mu }-Z_{\nu \mu \gamma })

(61)

Những tính chất cuối này cho phép chúng ta đưa ra khái niệm tenxơ Levi-Civita, nó là mở rộng bốn chiều của ký hiệu Levi-Civita $\epsilon _{i}jk$ . Cụ thể, đối với một tenxơ g^[15] loại (0, 2) và với định thức g, $g:=det(g_{\mu \nu })$ , chúng ta định nghĩa tenxơ Levi-Civita là^[16]

$\epsilon _{\alpha \beta \gamma \delta }:=-{\sqrt {-g}}\eta _{\alpha \beta \gamma \delta }$

(62)

$\epsilon ^{\alpha \beta \gamma \delta }:={\frac {1}{\sqrt {-g}}}\eta ^{\alpha \beta \gamma \delta }$

(63)

với $\eta _{\alpha \beta \gamma \delta }$ là ký hiệu phản xứng toàn phần định nghĩa bởi^[17]

$\eta _{\alpha \beta \gamma \delta }={\begin{cases}+1,{\text{neu }}[\alpha \beta \gamma \delta ]{\text{ la hoan vi chan cua 0123}}\\-1,{\text{neu }}[\alpha \beta \gamma \delta ]{\text{ la hoan vi le cua 0123}}\\0,{\text{neu }}[\alpha \beta \gamma \delta ]{\text{ trong truong hop con lai}}\end{cases}}$

(64)

Thêm vào đó, khi thực hiện thu gọn tenxơ Levi-Civita chúng ta có tenxơ hoán vị

\epsilon ^{\alpha \beta \gamma \delta }\epsilon _{\lambda \mu \nu \delta }=-1!\ \delta _{\lambda \mu \nu }^{\alpha \beta \gamma }

(65)

\epsilon ^{\alpha \beta \gamma \delta }\epsilon _{\lambda \mu \gamma \delta }=-2!\ \delta _{\lambda \mu }^{\alpha \beta }

(66)

\epsilon ^{\alpha \beta \gamma \delta }\epsilon _{\lambda \beta \gamma \delta }=-3!\ \delta _{\lambda }^{\alpha }

(67)

\epsilon ^{\alpha \beta \gamma \delta }\epsilon _{\alpha \beta \gamma \delta }=-4!

(68)

mà ten xơ hoán vị chính là mở rộng của ký hiệu Kronecker $\delta _{\beta }^{\alpha }$ tức là,

\delta _{\lambda \mu }^{\alpha \beta }={\begin{vmatrix}\delta _{\lambda }^{\alpha }&\delta _{\mu }^{\alpha }\\\delta _{\lambda }^{\beta }&\delta _{\mu }^{\beta }\end{vmatrix}}=\delta _{\lambda }^{\alpha }\delta _{\mu }^{\beta }-\delta _{\mu }^{\alpha }\delta _{\lambda }^{\beta }

(69a)

\delta _{\lambda \mu \nu }^{\alpha \beta \gamma }={\begin{vmatrix}\delta _{\lambda }^{\alpha }&\delta _{\mu }^{\alpha }&\delta _{\nu }^{\alpha }\\\delta _{\lambda }^{\beta }&\delta _{\mu }^{\beta }&\delta _{\nu }^{\beta }\\\delta _{\lambda }^{\gamma }&\delta _{\mu }^{\gamma }&\delta _{\nu }^{\gamma }\end{vmatrix}}=\delta _{\lambda }^{\alpha }(\delta _{\mu }^{\beta }\delta _{\nu }^{\gamma }-\delta _{\nu }^{\beta }\delta _{\mu }^{\gamma })-\delta _{\mu }^{\alpha }(\delta _{\lambda }^{\beta }\delta _{\nu }^{\gamma }-\delta _{\nu }^{\beta }\delta _{\lambda }^{\gamma })+\delta _{\nu }^{\alpha }(\delta _{\lambda }^{\beta }\delta _{\mu }^{\gamma }-\delta _{\mu }^{\beta }\delta _{\lambda }^{\gamma })

(69b)

Tại sao chúng ta phải sử dụng tenxơ và đại số tenxơ đối với thuyết tương đối rộng? Bởi vì trong vật lý học nói chung và thuyết tương đối nói riêng, các nhà vật lý quan tâm tới định nghĩa và xác định các đại lượng độc lập với lựa chọn hệ tọa độ cụ thể sử dụng để phủ đa tạp. Chúng ta đã thấy các thành phần của tenxơ rất phụ thuộc vào hệ tọa độ, nhưng tenxơ và quan trọng nhất là phương trình tenxơ lại không phụ thuộc vào hệ tọa độ. Ví dụ, chúng ta xét phương trình tenxơ sau đây trong hệ tọa độ $\{x^{\mu }\}$

G_{\nu }^{\mu }=kT_{\nu }^{\mu }

(70)

với k là hằng số và ta có thể coi $G_{\nu }^{\mu }$ như là một toán tử vi phân biểu diễn dưới dạng thành phần tenxơ. Để thu được phương trình (70) trong hệ tọa độ $\{x^{\mu '}\}$ ta sử dụng trực tiếp về biến đổi tọa độ cho mỗi vế của phương trình (1.70)

\Lambda ^{\mu }{}_{\mu '}\Lambda ^{\nu '}{}_{\nu }G_{\nu '}^{\mu '}=k\Lambda ^{\mu }{}_{\mu '}\Lambda ^{\nu '}{}_{\nu }T_{\nu '}^{\mu '}

(71)

khi nhóm thừa số chung lại ta có

\Lambda ^{\mu }{}_{\mu '}\Lambda ^{\nu '}{}_{\nu }(G_{\nu '}^{\mu '}-kT_{\nu '}^{\mu '})=0

(72)

Vì phương trình (72) phải đúng trong mọi hệ tọa độ, do vậy phải có

G_{\nu '}^{\mu '}=kT_{\nu '}^{\mu '}

(73)

mà nó có dạng giống hệt với phương trình (70). Hay phương trình tenxơ được nói là hiệp biến theo nghĩa chúng có cùng dạng trong mọi hệ tọa độ. Kết quả là nếu chúng đúng (hay thỏa mãn) trong một hệ tọa độ, thì chúng cũng đúng trong mọi hệ tọa độ. Tính hiệp biến của phương trình tenxơ thể hiện một tính chất rất quan trọng của tenxơ và có nguồn gốc rất sâu sắc từ thuyết tương đối rộng.

Tenxơ quan trọng nhất: Tenxơ metric sửa

Chúng ta vẫn chưa nói tới vấn đề làm thế nào để tính tích vô hướng giữa hai vectơ và đo được độ lớn của một vectơ. Cả hai phép toán tích vô hướng và tìm mô đun độ lớn đòi hỏi đa tạp không thời gian được trang bị một toán tử g, đó là ten xơ đối xứng hạng 2 hay kiểu (0, 2), mà khi nó tác dụng lên hai vectơ, $\mathbf {U,V}$ thì chúng ta thu được một số

${\boldsymbol {g(U,V)=U.V}}=g_{\mu \nu }U^{\mu }V^{\nu }$

(74)

Biểu thức trên chính là định nghĩa của tích vô hướng hai vectơ, và khi tích này bằng 0 ta nói hai vectơ trực giao với nhau. Theo cách tương tự đã chứng minh hàm $\mathbf {{\tilde {d}}(V)}$ là không phụ thuộc hệ tọa độ (phương trình (42)), chúng ta có thể chứng minh tích vô hướng cũng là một đại lượng bất biến, tức là $g_{\mu '\nu '}U^{\mu '}V^{\nu '}=g_{\mu \nu }U^{\mu }V^{\nu }$ . Định nghĩa mô đun độ lớn (hay độ dài) của một vectơ bất kỳ chính là trường hợp đặc biệt của (74) và tương ứng với tích vô hướng của chính nó,

{\boldsymbol {g(V,V)=V.V:=V^{2}}}=g_{\mu \nu }V^{\mu }V^{\nu }

(75)

Bây giờ chúng ta có thể quay trở lại phần Đa tạp không thời gian và coi không thời gian như là đa tạp ${\mathcal {M}}$ mà trên đó phủ một số hệ tọa độ. Khi có hai sự kiện P tại $\{x^{\mu }\}_{P}$ và Q tại $\{x^{\mu }\}_{Q}$ trên ${\mathcal {M}}$ , chúng ta mong muốn đo được bình phương khoảng không thời gian vô cùng bé (hay yếu tố đoạn-line element), ds², theo vectơ dời chỗ vô cùng bé dx mà các thành phần của nó chính là $dx^{\mu }:=\{x^{\mu }\}_{P}-\{x^{\mu }\}_{Q}$ . Khoảng cách này chính là tích vô hướng của hai vectơ và là đại lượng độc lập với hệ tọa độ

$ds^{2}:={\boldsymbol {dx.dx}}=g_{\mu \nu }dx^{\mu }dx^{\nu }$

(76)

Bởi vì có vai trò trong đo khoảng cách như ở phương trình (76) tenxơ đối xứng g thường được gọi là tenxơ metric (hay chỉ đơn giản là metric) và nó là tenxơ quan trọng nhất trong thuyết tương đối tổng quát. Dấu của tenxơ metric được định nghĩa bằng số giá trị riêng dương, âm hay bằng 0 của metric.

Khi đã lựa chọn hệ tọa độ để định vị và xếp thứ tự các sự kiện trong không thời gian, tenxơ metric cho phép chúng ta đo được khoảng cách giữa các sự kiện và do đó thực hiện được những phép đo vật lý. Trong khi biểu thức (76) chỉ giới hạn ở khoảng cách vô cùng bé, chúng ta có thể mở rộng nó ra cho khoảng cách hữu hạn và khoảng cách riêng giữa hai sự kiện nối với nhau bằng cung ${\mathcal {C}}$ bằng

\ell =\int _{C}{\sqrt {ds^{2}}}=\int _{C}{\sqrt {g_{\mu \nu }dx^{\mu }dx^{\nu }}}

(77)

Chúng ta có thể dễ dàng nhận ra biểu thức (76) rất giống với định lý Pythagoras áp dụng cho không thời gian khác với không gian Euclid. Để rõ hơn, lấy ví dụ về khoảng cách giữa hai điểm P và Q trong không gian ba chiều theo các hệ tọa độ khác nhau

{\begin{aligned}ds^{2}&=dx^{2}+dy^{2}+dz^{2}\\&=d\rho ^{2}+\rho ^{2}d\phi ^{2}+dz^{2}\\&=dr^{2}+r^{2}d\theta ^{2}+r^{2}sin^{2}\theta d\phi ^{2}=dr^{2}+r^{2}d\Omega ^{2}\\\end{aligned}}

(78)

Ba biểu thức trên biểu diễn cùng một khoảng cách (tức là chúng thu được cùng một số) và xuất hiện trông khác nhau bởi vì chúng được viết ra trong ba hệ tọa độ khác nhau, lần lượt là hệ tọa độ Descartes $(x,y,z)$ ; hệ tọa độ trụ $(\rho ,\phi ,z)$ và hệ tọa độ cầu $(r,\theta ,\phi )$ . Rõ ràng đối với mỗi hệ tọa độ, tenxơ metric sẽ có dạng lần lượt $g_{ij}=diag(1,1,1)\quad ;\quad g_{ij}=diag(1,\rho ^{2},1)\quad ;\quad g_{ij}=diag(1,r^{2},r^{2}sin^{2}\theta )$ . Chúng ta cũng thấy rằng hệ tọa độ Descartes có metric dạng đơn giản nhất và viết tương đương thành $g_{\mu \nu }=\delta _{\mu \nu }$ .

Định thức của tenxơ metric ký hiệu bằng $g:=det(g_{\mu \nu })$ và chúng ta sử dụng nó để tính yếu tố thể tích riêng (proper volume element) khi tích phân trên miền không gian bốn chiều giới hạn bởi siêu mặt ∑

V_{P}=\int _{\Sigma }{\sqrt {-g}}d^{4}x

(81)

Hơn nữa metric là không kỳ dị khi và chỉ khi $g\neq 0$ khắp nơi đối với ánh xạ. Trong trường hợp này $g_{\mu \nu }$ có nghịch đảo $g^{\mu \nu }$ sao cho

g^{\mu \nu }g_{\mu \gamma }=\delta _{\gamma }^{\nu }

(82)

Tính chất (82) cho phép chúng ta thực hiện nâng và hạ chỉ số của tenxơ bằng cách thu gọn tenxơ với tenxơ metric hoặc nghịch đảo của nó. Trong phép toán này, chỉ số được thu gọn (hay chỉ số câm) bị triệt tiêu và các chỉ số còn lại của tenxơ metric hoặc là hạ thấp (khi metric được sử dụng trong phép thu gọn) hoặc được nâng lên (trong trường hợp metric nghịch đảo được sử dụng). Ví dụ, đối với tenxơ T loại (2, 2) phép thu gọn nó với metric và metric nghịch đảo là

g_{\alpha \beta }T^{\alpha \delta }{}_{\mu \nu }=T_{\beta }{}^{\delta }{}_{\mu \nu }\qquad g^{\mu \delta }T^{\alpha \beta }{}_{\mu \nu }=T^{\alpha \beta \delta }{}_{\nu }

(83)

hoặc tổng quát hơn đối với ten xơ bất kỳ

g_{\alpha \beta }T^{...\alpha ...}{}_{...}=T^{...}{}_{\beta }{}^{...}{}_{...}\qquad g^{\alpha \beta }T^{...}{}_{...\alpha ...}=T^{...}{}_{...}{}^{\beta }{}_{...}

(84)

Hai trường hợp đặc biệt đối với thu gọn ten xơ bằng ten xơ metric đó là đối với ten xơ hạng hai, khi kết quả thu gọn hoặc là dẫn tới vết nếu ten xơ đối xứng, hoặc bằng 0 nếu ten xơ phản xứng^[18]

g^{\mu \nu }Z_{\mu \nu }=g^{\mu \nu }Z_{(\mu \nu )}=Z^{\mu }{}_{\mu }:=tr(Z^{\mu \nu });\quad g^{\mu \nu }Z_{\mu \nu }=g^{\mu \nu }Z_{[\mu \nu ]}=0

(85)

Tính chất nâng và hạ chỉ số không chỉ là cách thuận tiện khi làm việc với đại số ten xơ mà còn là một cách để chứng tỏ ten xơ metric có thể được sử dụng để ánh xạ vectơ vào dạng một. Để thấy điều này, ta hãy xem lại phương trình (74) và coi metric như là một toán tử tác động lên hai vectơ. Hơn nữa, nếu cố định một vec tơ, U chẳng hạn, và coi nó như là một toán tử khi tác động lên một vectơ sẽ thu được một số (hay vô hướng)

{\boldsymbol {g}}({\boldsymbol {U}},.)={\boldsymbol {g}}(.,{\boldsymbol {U}})={\tilde {\boldsymbol {U}}}(.)

(86)

mà ở cặp phương trình đầu tiên nhấn mạnh vào tính đối xứng của toán tử khi chúng ta có kết quả như nhau nếu "điền vào" dấu chấm một vectơ. Và khi cặp phương trình thứ nhất và cặp phương trình thứ hai tác động lên một vec tơ V sẽ cho cùng một kết quả

{\boldsymbol {g}}({\boldsymbol {U}},{\boldsymbol {V}})=U_{\mu }V^{\mu }\quad {\tilde {\boldsymbol {U}}}({\boldsymbol {V}})=U_{\mu }V^{\mu }

(87)

Về cơ bản phương trình (86) nói rằng ten xơ metric có thể dùng để ánh xạ một vec tơ U vào một đối vec tơ (hay dạng một) Ũ mà các thành phần sẽ là U_μ. Tương tự, nghịch đảo của metric g⁻¹ sẽ cho ánh xạ từ đối vectơ vào vectơ, do đó hoàn thiện bức tranh đầy đủ về tính đối ngẫu giữa vectơ và dạng một. Ngoài ý nghĩa của tenxơ metric như đã nêu, chúng ta có thể viết lại tích vô hướng dưới đây

{\boldsymbol {U.V}}=g_{\mu \nu }U^{\mu }V^{\nu }=(U^{\mu }{\boldsymbol {e}}_{\mu }).(V^{\nu }{\boldsymbol {e}}_{\nu })=U^{\mu }V^{\nu }({\boldsymbol {e}}_{\mu }.{\boldsymbol {e}}_{\nu }),

(88)

và viết lại thành

$g_{\mu \nu }={\boldsymbol {g}}({\boldsymbol {e}}_{\mu },{\boldsymbol {e}}_{\nu })={\boldsymbol {e}}_{\mu }.{\boldsymbol {e}}_{\nu }$

(89)

Hay nói cách khác, các thành phần của metric trong một hệ tọa độ biểu diễn tích vô hướng của các vectơ cơ sở của hệ đó. Đặc biệt, nếu hệ vectơ cơ sở thỏa mãn $|{\boldsymbol {e}}_{\mu }.{\boldsymbol {e}}_{\nu }|=\delta _{\mu \nu }$ thì hệ cơ sở này được gọi là hệ cơ sở trực chuẩn.

Tách một tenxơ thông qua vectơ sửa

Một tính chất hữu ích của đại số tenxơ mà có thể áp dụng cho các phương trình vật lý đó là chúng ta có thể tách một tenxơ hạng 2 theo hướng song song và vuông góc với một vectơ. Xét một trường vec tơ U mà có trực chuẩn U.U = -1 và định nghĩa toán tử chiếu (hay tenxơ chiếu) h trực giao với U như là một tenxơ với các thành phần

h_{\mu \nu }:=g_{\mu \nu }+U_{\mu }U_{\nu }

(90)

mà nó thỏa mãn những đẳng thức sau đây

h_{\mu \nu }U^{\mu }=0,\qquad h_{\mu }{}^{\lambda }h_{\lambda \nu }=h_{\mu \nu },\qquad h_{\mu }{}^{\mu }=3

(91)

Với toán tử này chúng ta có thể tách một trường vectơ V thành các phần song song với U và trực giao với U, nghĩa là

V^{\mu }=AU^{\mu }+B^{\mu },

(92)

với số hạng $A=-U_{\mu }V^{\mu }$ là thành phần của V dọc theo U, trong khi số hạng $B^{\mu }=h^{\mu }{}_{\nu }V^{\nu }$ là thành phần của V trong không gian trực giao với U. Tương tự, có thể tách một tenxơ hiệp biến hạng 2 W bằng cách sử dụng tenxơ chiếu trên từng thành phần c]ủa nó, nhận được

W_{\mu \nu }=AU_{\mu }U_{\nu }+B_{\mu }U_{\nu }+U_{\mu }C_{\nu }+Z_{\mu \nu }

(93)

với

A=W_{\mu \nu }U^{\mu }U^{\nu },\qquad B_{\mu }=-h^{\alpha }{}_{\mu }W_{\alpha \beta }U^{\beta }

(94)

C_{\nu }=-h^{\alpha }{}_{\nu }W_{\beta \alpha }U^{\beta },\qquad Z_{\mu \nu }=h^{\alpha }{}_{\mu }h^{\beta }{}_{\nu }W_{\alpha \beta }

(95)

Có thể phân tích $Z_{\mu \nu }$ thành các phần đối xứng và phản đối xứng như trong biểu thức (59) và có

Z_{(\mu \nu )}=h^{\alpha }{}_{(\mu }h^{\beta }{}_{\nu )}W_{\alpha \beta }=h^{\alpha }{}_{\mu }h^{\beta }{}_{\nu }W_{(\alpha \beta )}=W_{\langle \alpha \beta \rangle }+{\frac {1}{3}}W_{\alpha \beta }h^{\alpha \beta }h_{\mu \nu }

(96)

Z_{[\mu \nu ]}=h^{\alpha }{}_{[\mu }h^{\beta }{}_{\nu ]}W_{\alpha \beta }=h^{\alpha }{}_{\mu }h^{\beta }{}_{\nu }W_{[\alpha \beta ]}

(97)

với $W_{\langle \alpha \beta \rangle }$ trong phương trình (96) là thành phần không gian, đối xứng và vết tự do của tenxơ W, tức là:

W_{\langle \alpha \beta \rangle }=h_{\mu }{}^{\alpha }h_{\nu }{}^{\kappa }W_{(\alpha \kappa )}-{\frac {1}{3}}W_{\alpha \kappa }h^{\alpha \kappa }h_{\mu \nu }

(98)

Kết quả của phân tích (93) có thể viết thành dạng không khả quy là

$W_{\mu \nu }=AU_{\mu }U_{\nu }+B_{\mu }U_{\nu }+U_{\mu }C_{\nu }+W_{\langle \alpha \beta \rangle }+{\frac {1}{3}}W_{\alpha \beta }h^{\alpha \beta }h_{\mu \nu }+h^{\alpha }{}_{\mu }h^{\beta }{}_{\nu }W_{[\alpha \beta ]}$

(99)

Mặc dù chúng ta vẫn chưa giới thiệu ra công cụ toán học cần thiết để tính đạo hàm theo cách không bị phụ thuộc vào hệ tọa độ (theo nghĩa hiệp biến), chúng ta vẫn có đủ công cụ toán học để miêu tả không thời gian bốn chiều đơn giản nhất, không thời gian phẳng.

Không thời gian phẳng: Thuyết tương đối hẹp sửa

Xét hai hệ quy chiếu quán tính ${\mathcal {O}}$ và ${\mathcal {O}}'$ chuyển động tương đối so với nhau với tốc độ hằng.^[19] Bởi vì tốc độ này là thuần túy thuộc về không gian và do vậy là vectơ-3, chúng ta sẽ ký hiệu nó là vận tốc-3 ${\overrightarrow {\boldsymbol {V}}}$ với các thành phần được tính bằng^[20]

V^{i}:={\frac {dx^{i}}{dt}},

(100)

ở đây chỉ số Latin i chạy từ 1 đến 3 và t là tọa độ thời gian. Trong phần này, chúng ta sẽ coi ${\overrightarrow {\boldsymbol {V}}}$ hướng dọc theo trục x trong cả hai hệ quy chiếu ${\mathcal {O}}$ và ${\mathcal {O}}'$ . Do vậy, $V^{i}=(V^{x},0,0)=(V,0,0)$ . Trong vật lý Newton, phép biến đổi đúng giữa hai hệ quy chiếu được miêu tả bằng phép biến đổi Galilei:

x'=x-Vt,

(101)

t'=t,

(102)

chúng là cơ sở cho tính bất biến của các định luật động lực học Newton^[21] Ý tưởng về một cái gì đó bị sai đến với Einstein sau khi ông nhận ra rằng phương trình Maxwell không bất biến dưới phép biến đổi Galilei (101) và (102)^[22] Thuyết tương đối hẹp đã được phát triển để giải quyết sự không tương thích này và nó là lý thuyết vật lý đầu tiên về không thời gian như là một thực thể. Mặc dù đã có nhiều thí nghiệm kiểm chứng tính đúng đắn của lý thuyết, thuyết tương đối đặc biệt có cấu trúc toán học tiên đề rất rõ ràng, khi nó dựa trên những giả sử sau đây:

Không có hệ quy chiếu quán tính ưu tiên nào và các định luật vật lý là bất biến khi chuyển đổi giữa các hệ quy chiếu quán tính.
Tốc độ ánh sáng c là tốc độ lớn nhất mà thực thể vật lý và các sóng lan truyền có thể đạt tới.

Chú ý rằng, và nó cũng là hệ quả của tiên đề thứ hai, và bởi vì tốc độ ánh sáng xuất hiện trong phương trình Maxwell, c phải có giá trị như nhau trong mọi hệ quy chiếu quán tính. Cấu trúc tôpô và vi phân của thuyết tương đối hẹp là giống với cấu trúc toán học của lý thuyết Newton nhưng với định nghĩa khác về khoảng cách hay khác về mêtric. Trong hệ tọa độ Descarte, tenxơ metric $g_{\mu \nu }$ của không thời gian trong thuyết tương đối hẹp, hay không thời gian Minkowski là

$g_{\mu \nu }=\eta _{\mu \nu }={\begin{pmatrix}-1&0&0&0\\0&1&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}}=\eta ^{\mu \nu }$

(103)

Mêtric này còn gọi là mêtric không thời gian phẳng do độ cong hình học tương ứng của không gian bằng 0 ở khắp nơi (xem Tenxơ Riemann). Nguyên tố đoạn (76) viết theo metric (103) được viết thành

ds^{2}=g_{\mu \nu }dx^{\mu }dx^{\nu }=-dt^{2}+dx^{2}+dy^{2}+dz^{2}

(104)

Rõ ràng là, trong cùng một không thời gian phẳng, một hệ tọa độ khác - ví dụ hệ tọa độ cầu, sẽ cho tenxơ mêtric khác với dạng của (103). Tuy nhiên có một định lý quan trọng đối với không thời gian phẳng đó là: độc lập với hệ tọa độ dùng để bao phủ đa tạp không thời gian phẳng, luôn luôn có một biến đổi tọa độ toàn cục để đưa tenxơ mêtric của hệ tọa độ đó về dạng (103).

Chúng ta vẫn phải tìm ra phép biến đổi chính xác thay thế cho biến đổi Galilei ở trong (101) và (102) và cũng là cốt lõi của thuyết tương đối hẹp. Bên cạnh thể hiện được sự chuyển đổi từ hệ quy chiếu quán tính ${\mathcal {O}}$ sang ${\mathcal {O}}'$ và đáp ứng được đòi hỏi về tính bất biến của nguyên tố đoạn $ds^{2}=ds'^{2}$ (xem phần Tenxơ quan trọng nhất: Tenxơ mêtric), phép biến đổi cũng phải đáp ứng được những điều kiện khác. Không những $ds^{2}$ không thay đổi giá trị mà nó phải giữ nguyên dạng phương trình khi chuyển sang hệ quy chiếu quán tính khác, hay $ds'^{2}=dx'^{2}+dy'^{2}+dz'^{2}$ . Điều kiện thứ hai này là cần thiết vì nếu không sẽ có cách phân biệt các hệ quy chiếu quán tính. Phép biến đổi Lorentz đáp ứng được những điều kiện này:^[23]

x'=\gamma (x-Vt),

(105)

t'=\gamma (t-Vx),

(106)

y'=y

z'=z

trong đó

\gamma :={\frac {1}{\sqrt {1-V^{i}V_{i}}}}={\frac {1}{\sqrt {1-V^{2}}}},

(107)

là hệ số Lorentz có giá trị bằng 1 (khi V = 0) và tiến tới $\infty$ khi V $\rightarrow$ 1. Sử dụng (5), dạng ma trận cho biến đổi vectơ giữa các hệ tọa độ trong thuyết tương đối hẹp - hay ma trận biến đổi Lorentz (xem phần Vectơ tiếp tuyến)

\Lambda ^{\mu '}{}_{\mu }={\begin{pmatrix}\gamma &-\gamma V&0&0\\-\gamma V&\gamma &0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}}

(108)

mà cần nhấn mạnh một lần nữa đó là biến đổi tọa độ này tương đương với sự chuyển đổi giữa các hệ quy chiếu quán tính. Chú ý rằng ma trận biến đổi (108) có dạng đối xứng, và vì vậy nó bằng ma trận chuyển vị của nó, ma trận có định thức bằng 1 vì ma trận nghịch đảo có thể nhận được bằng cách thay V bằng -V. Ma trận nghịch đảo này có thể dùng cho phương trình (45) để tìm hệ cơ sở vectơ đơn vị của quan sát viên ${\mathcal {O}}'$ theo hệ cơ sở vectơ đơn vị của quan sát viên ${\mathcal {O}}$ .

Tập tin:Nonanhsang.jpg

Hình 1.1 Nón ánh sáng quá khứ và tương lai của sự kiện P. Đường màu nâu là tuyến thế giới (world line) của một quan sát viên với vận tốc-bốn u. Các màu khác biểu diễn các vectơ giữa sự kiện P và Q trong các trường hợp: vectơ kiểu thời gian (timelike) U.U < 0, vectơ rỗng (null) U.U = 0, vectơ kiểu không gian (spacelike) U.U > 0.

Tất cả những hệ quả kỳ lạ của thuyết tương đối hẹp mà không có ở vật lý Newton, như khái niệm về tính tương đối của sự đồng thời, sự co độ dài Lorentz, sự giãn thời gian, nghịch lý sinh đôi đều có thể rút ra từ các phương trình (105) (106). Hai sự kiện P và Q được nói là tách nhau kiểu thời gian nếu nguyên tố đoạn giữa chúng ds² < 0, theo nghĩa trong mỗi hệ quy chiếu khoảng cách không gian giữa hai sự kiện $dl={\sqrt {dx^{2}+dy^{2}+dz^{2}}}$ luôn có thể đạt tới bằng một vật chuyển động với vận tốc v < c trong khoảng thời gian $dt=|dt_{P}-dt_{Q}|$ . Khi ds² = 0 hai sự kiện được nói là tách nhau rỗng và chúng chỉ có thể liên hệ nhân quả được với nhau thông qua tia sáng. Lấy một sự kiện P(xⁱ, t) bất kỳ trong không thời gian, tập hợp các tia sáng từ nó sẽ định ra nón ánh sáng của P về quá khứ và trong tương lai phụ thuộc vào hướng đến hay hướng ra của tia sáng. Cuối cùng hai sự kiện P và Q được nói là tách nhau kiểu không gian nếu ds² > 0, hàm ý rằng trong mọi hệ quy chiếu khoảng cách không gian dl giữa hai sự kiện luôn luôn lớn hơn khoảng cách mà ánh sáng có thể lan truyền trong khoảng thời gian $dt=|dt_{P}-dt_{Q}|$ . Nội dung này được thể hiện trong hình 1.1 với nón ánh sáng quá khứ và tương lai của sự kiện P. Hai sự kiện được nói là có liên hệ nhân quả nếu và chỉ nếu chúng nằm trong nón ánh sáng của nhau.

Chúng ta có thể mở rộng khái niệm này đối với vectơ: một vectơ-bốn bất kỳ U gọi là vectơ kiểu thời gian, kiểu không gian và vectơ rỗng nếu có tương ứng U.U < 0, U.U > 0, U.U = 0, các ví dụ về những vec tơ này được thể hiện trong hình 1.1.

Nếu hai sự kiện tách nhau kiểu thời gian, thì khoảng thời gian tối thiểu dτ giữa chúng đo bởi một quan sát viên khi anh ta thực hiện gán cho mỗi sự kiện có cùng tọa độ không gian, hay dx = dy = dz = 0, do vậy ds² = -dt² = -d $\tau$ ². Bời vì tính bất biến của nguyên tố đoạn, điều kiện này phải thỏa mãn trong mọi hệ quy chiếu khác, nơi chúng có dạng

-d\tau ^{2}=ds^{2}=-dt^{2}+dx^{2}+dy^{2}+dz^{2}

(109)

từ đó ta có

d\tau ={\frac {dt}{\gamma }}<dt

(110)

Bởi vì $\tau$ là thời gian đo bởi quan sát viên từ đồng hồ gắn liền với anh ta, nên thời gian này thường được gọi là thời gian riêng.

Từ đây, chúng ta định nghĩa ra vectơ-bốn vận tốc u:

$u^{\mu }={\frac {dx^{\mu }}{d\tau }},$

(111)

mà chúng ta coi nó như là một vec tơ tiếp tuyến tiếp xúc với đường cong được xác định bởi tham số $\tau$ (xem phương trình (15)), ví dụ tuyến thế giới của hạt nếu u là vận tốc-bốn của hạt. Hơn nữa, theo định nghĩa của thời gian riêng $\tau$ trong (109) có thể dễ dàng kết luận rằng vectơ-bốn vận tốc u phải thỏa mãn điều kiện chuẩn hóa

$u^{\mu }u_{\mu }=-1,$

(112)

Các biểu thức (111) và (112) được viết cho trường hợp tổng quát, do vậy chúng cũng đúng cho trường hợp được viết trong không thời gian cong mà sẽ giới thiệu ở phần tiếp theo. Dễ dàng thiết lập lên mối liên hệ giữa vectơ-bốn vận tốc u và vận tốc-ba không gian ${\overrightarrow {v}}$ và nó được biểu diễn thông qua thành phần của vectơ-bốn vận tốc^[24]

$u^{\mu }=(\gamma ,\gamma v^{i}),\qquad u_{\mu }=(-\gamma ,\gamma v^{i})$

(113)

từ đây vận tốc-ba được biểu diễn bằng

v^{i}={\frac {u^{i}}{u^{0}}}=v_{i}

(114)

Lưu ý rằng trong hệ tọa độ mà hạt đứng yên, $u^{i}=v^{i}=0$ vectơ-bốn vận tốc có thành phần $u^{\mu }=(u^{0},0,0,0)=(1,0,0,0)$ . Kết quả là, trong hệ quy chiếu mà hạt đứng yên, vectơ-bốn vận tốc có hướng chỉ theo vectơ cơ sở thời gian ${\boldsymbol {u}}={\boldsymbol {e}}_{t}$ . Bây giờ giả sử hệ quy chiếu ${\mathcal {O}}'$ chuyển động với vận tốc V dọc theo trục x so với hệ quy chiếu ${\mathcal {O}}$ , và vận tốc-ba của hạt trong ${\mathcal {O}}$ là ${\overrightarrow {\boldsymbol {v}}}=d{\overrightarrow {\boldsymbol {x}}}/dt$ cũng như trong ${\mathcal {O}}'$ là ${\overrightarrow {{\boldsymbol {v}}'}}=d{\overrightarrow {{\boldsymbol {x}}'}}/dt$ , chúng ta có định luật cộng vận tốc đối với vận tốc-ba

v^{x}={\frac {v^{x'}+V}{1+v^{x'}V}},\quad v^{y}={\frac {v^{y'}}{\gamma (1+v^{x'}V)}},\quad v^{z}={\frac {v^{z'}}{\gamma (1+v^{x'}V)}}

(115)

Có thể dễ dàng nhận ra rằng định luật (1.115) thu về định luật cộng vận tốc Galilei $v^{x}=v^{x'}+V,\quad v^{y}=v^{y'},\quad v^{z}=v^{z'}$ khi $V\ll 1$ .

Nếu m là khối lượng nghỉ của hạt^[25] thì động lượng tương đối tính của nó được định nghĩa bằng:

{\boldsymbol {p}}:=m{\boldsymbol {u}}

(116)

và các thành phần của nó là:

p^{\mu }=m\gamma (1,v^{i})\quad p_{\mu }=m\gamma (-1,v^{i}),

(117)

Năng lượng tương đối tính được định nghĩa bằng:

E=m\gamma ,

(118)

mà nó trùng với thành phần thứ 0 của động lượng-bốn

p^{0}=E=-p_{0},

(119)

và thỏa mãn

E^{2}=m^{2}+p^{2},

(120)

Với $p^{2}=p^{i}p_{i}$ , sử dụng khai triển Taylor theo đối số $v=(v^{i}v_{i})^{1/2}$ giúp nhận rõ ra được năng lượng tương đối tính khác so với năng lượng trong cơ học Newton như thế nào:

E=m(1+{\frac {1}{2}}v^{2}+{\frac {3}{8}}v^{4}+...)=m+{\frac {1}{2}}mv^{2}+{\mathcal {O}}(v^{4})

(121)

Trong khi số hạng thứ hai chính là động năng của hạt trong cơ học Newton thì số hạng thứ nhất lại mới lạ và vắng mặt trong cơ học cổ điển. Nó biểu diễn cho năng lượng nghỉ của hạt

E_{0}=m

(122)

mà giá trị này khác 0 ngay cả khi hạt đứng yên. Hiệu số E - E₀ được coi là động năng tương đối tính

E-E_{0}=m(\gamma -1)

(123)

Chú ý rằng, khi v = 1 cả động năng và năng lượng phân kỳ cho thấy bản chất không có một vật thể với khối lượng hữu hạn nào có thể chuyển động với vận tốc ánh sáng được. Tuy nhiên, photon, hạt lượng tử ánh sáng, có khối lượng bằng 0 nhưng nó vẫn có động lượng^[26]

p=E

(124)

Một lưu lý khác, đó là vận tốc-bốn (111) không xác định cho photon (và những hạt không có khối lượng khác) vì chúng di chuyển trên đường thế giới kiểu ánh sáng (null worldline), do vậy thời gian riêng của chúng bằng 0 và khoảng bất biến $d\tau ^{2}=-ds^{2}=-{\boldsymbol {dx.dx}}=0$ . Điều này tương đương với phát biểu không có hệ quy chiếu chuyển động cùng với photon và do đó chúng đứng yên trong hệ đó.

Không thời gian cong: Thuyết tương đối rộng sửa

Như đã thảo luận ở phần trước, thuyết tương đối hẹp dựa trên sự tồn tại của hệ quy chiếu quán tính, những hệ chuyển động với vận tốc không đổi và luôn luôn có thể gắn lên chúng những hệ tọa độ mà khoảng cách riêng và thời gian riêng không phụ thuộc vào vị trí. Trong khi thuyết tương đối đặc biệt và những hệ quả của nó đã được kiểm tra vô số lần trong các máy gia tốc vật lý hạt năng lượng cao, nơi bỏ qua được tác động của lực hấp dẫn, rõ ràng rằng các tiên đề cơ sở của thuyết tương đối hẹp không phù hợp với sự có mặt của một trường hấp dẫn. Xem thêm các bài thí nghiệm Eötvös và GPS về những cơ sở thực nghiệm cho thấy điều này. Cũng nhận thấy rằng các phương trình của cơ học Newton không bất biến dưới phép biến đổi Lorentz (tính bất biến của phương trình Maxwell là một đòi hỏi cơ bản trong sự phát triển của thuyết tương đối hẹp). Kết quả là, tương tác hấp dẫn phải cần thiết xuất hiện thông qua sự mở rộng các định luật vật lý bao hàm các tiên đề của thuyết tương đối hẹp. Như chỉ ra ở bên dưới, điều này cho phép việc mở rộng các khái niệm và định nghĩa trong không thời gian như là một đa tạp phẳng sang thành một đa tạp cong.

Về mặt lịch sử, xuất phát điểm của sự phát triển thuyết tương đối tổng quát đó là trình bày cách phát biểu của nguyên lý tương đương.^[27] Trong cách phát biểu mạnh: nguyên lý tương đương khẳng định rằng các định luật vật lý trong một hệ quy chiếu rơi tự do là giống với khi chúng ở trong hệ quy chiếu quán tính. Nội dung này đến từ thực tế rằng, ít nhất trên phạm vi cục bộ, không thể phân biệt được thông qua các thí nghiệm và đo đạc vật lý một hệ quy chiếu quán tính với một hệ quy chiếu đang rơi tự do trong trường hấp dẫn.^[28] Trong cả hai hệ, chuyển động của vật không phụ thuộc vào khối lượng cũng như thành phần vật liệu cấu tạo nên nó. Bản chất của nguyên lý đó là hấp dẫn ngăn cản sự tồn tại của một hệ quy chiếu quán tính và cách để tạo ra một hệ quy chiếu quán tính đó là loại bỏ hấp dẫn bằng quá trình rơi tự do. Cũng có dạng phát biểu "yếu"của nguyên lý tương đương, tạo thành phát biểu bổ sung cho nguyên lý tương đương mạnh: các định luật vật lý trong một hệ quy chiếu không quán tính (có gia tốc) là như nhau so với khi chúng trong hệ quy chiếu nhúng vào một trường hấp dẫn. Bản chất của cách phát biểu thứ hai này đó là trường hấp dẫn thể hiện giống với hệ quy chiếu phi quán tính (có gia tốc).

Theo sau sự logic này, lý thuyết bao gồm các hiệu ứng hấp dẫn bắt đầu từ sự phân tích các hệ quy chiếu phi quán tính, cụ thể hơn, từ tính chất quan trọng của chúng khi được miêu tả bằng một metric mà không thể đưa về dạng (103). Lúc đó nguyên lý tương đương được sử dụng để tìm ra sự biểu hiện của một trường hấp dẫn mà gắn liền với một tenxơ mêtric mà sẽ khác hẳn với dạng (103). Ví dụ, giả sử trong không thời gian phẳng phủ bởi hệ tọa độ Descarte chúng ta thực hiện sự thay đổi hệ tọa độ thông qua biến đổi tọa độ, từ một hệ quy chiếu quán tính sang hệ quy chiếu khác quay với vận tốc góc $\Omega$ quanh trục z:

x=x'cos(\Omega t)-y'sin(\Omega t),\quad y=x'sin(\Omega t)+y'cos(\Omega t)

(125)

z'=z,\quad t'=t

(126)

Hệ quy chiếu mới rõ ràng là phi quán tính (do xuất hiện lực hướng tâm và lực Coriolis) và mêtric trong hệ quy chiếu mới này thay đổi từ dạng chéo hóa như ở (103) thành dạng không chéo hóa biểu diễn bằng nguyên tố đoạn:

ds'^{2}=-[1-\Omega ^{2}(x'^{2}+y'^{2})]dt'^{2}+dx'^{2}+dy'^{2}+dz'^{2}-2\Omega y'dx'dt'+2\Omega x'dy'dt'

(127)

Ở đây, một hệ quy chiếu phi quán tính, mà chúng ta đã thấy là có liên quan đến trường hấp dẫn, có thể được miêu tả bằng một mêtric không có dạng đường chéo. Từ ví dụ này có thể phỏng đoán rằng mêtric miêu tả trường hấp dẫn có thể khác với dạng mêtric trong (103). Theo nghĩa này, hấp dẫn không còn được coi là một dạng "lực nữa" mà là biểu hiện của sự cong không thời gian.

Chú ý rằng, trong ví dụ ở trên, không thời gian luôn luôn là phẳng độc lập với cách chọn hệ quy chiếu, do vậy luôn có thể từ mêtric (127) viết trở lại dạng biểu diễn ma trận có tính đối xứng với các hệ số không đổi. Điều này là không thể trong không thời gian cong chân chính và đây quả thực là một trong những tính chất khác biệt của không thời gian cong, mà chúng ta có thể coi nó là phẳng trên phạm vi cục bộ, trong khi không thời gian phẳng lại phẳng trên phạm vi toàn cục.^[29]

Bây giờ chúng ta có thể tóm lược những miêu tả ở trên, đặc biệt về tenxơ mêtric miêu tả trường hấp dẫn, để đi đến định nghĩa toán học chính xác về không thời gian không phẳng. Cụ thể hơn, chúng ta xác định một không thời gian cong là một đa tạp mà một điểm ${\mathcal {P}}$ trên nó có thể xác định được một tập hợp hệ tọa độ $x^{\mu }$ sao cho mêtric giả sử có dạng^[30]

$g_{\mu \nu }(x^{\mu })=\eta _{\mu \nu }+{\mathcal {O}}((x^{\mu })^{2})$

(128)

Nói cách khác, trong khi một không thời gian cong có thể xuất hiện dưới dạng phẳng cục bộ trong lân cận của một điểm của bất kỳ, với $g_{\mu \nu }({\mathcal {P}})=\eta _{\mu \nu }({\mathcal {P}})$ , nó không thể phẳng khi xét trên mọi điểm. Kết luận này và với độ yếu của trường hấp dẫn trên Trái Đất cũng giải thích sự thành công của thuyết tương đối hẹp khi nó miêu tả với độ chính xác cao các hiện tượng và kết quả vật lý trên phạm vi nhỏ của mọi thí nghiệm trong các phòng thí nghiệm.

Đạo hàm Lie sửa

Một khái niệm hữu ích khi lần đầu tiên thảo luận về đạo hàm trong không thời gian cong đó là đạo hàm Lie của một trường vectơ tương ứng với một trường vectơ khác. Để đưa ra toán tử vi phân mới này, đầu tiên chúng ta cần gắn cho một trường vectơ bất kỳ ${\boldsymbol {V}}(x^{\mu })$ một họ các đường cong ${\mathcal {C}}_{V}$ , gọi là đoàn đường cong của ${\boldsymbol {V}}$ , với ${\boldsymbol {V}}$ là vectơ tiếp tuyến, tức là

V(x^{\mu })={\frac {dx^{\mu }}{d\lambda }},

(129)

với $\lambda$ là tham số thay đổi dọc cung. Thứ hai, chúng ta thấy rằng sự hội tụ cung cấp một ánh xạ $\phi _{\lambda }$ từ đa tạp vào chính nó. Thực tế, tại một điểm P bất kỳ trên đa tạp, tồn tại một và chỉ một đường cong thuộc đoàn đường cong đi qua nó. Do vậy điểm P có thể được ánh xạ vào điểm Q bằng cách kéo P dọc theo cung thuộc đoàn đường cong mà nó thuộc về, tức là

Q=\phi _{\lambda }(P),

(130)

với $P={\mathcal {C}}(\lambda _{0}),\quad Q={\mathcal {C}}(\lambda _{0}+\lambda )$ với ${\mathcal {C}}$ là đường cong thuộc đoàn đường cong đi qua hai điểm P và Q. Rõ ràng là ánh xạ (130) có thể kéo không chỉ các điểm mà còn là toàn bộ một đường cong hay tập hợp của các điểm. Bây giờ giả sử có một trường vectơ thứ hai ${\boldsymbol {U}}$ gắn với đoàn ${\mathcal {C}}_{U}$ . Ý tưởng cơ bản về đạo hàm Lie của trường vectơ ${\boldsymbol {U}}$ tương ứng với trường vectơ ${\boldsymbol {V}}$ đó là so sánh vectơ ${\boldsymbol {U}}(Q)$ với vectơ nhận được sau khi kéo ${\boldsymbol {U}}(P)$ dọc theo đoàn đường cong của ${\boldsymbol {V}}$ . Theo đó, đạo hàm Lie của ${\boldsymbol {U}}$ dọc theo ${\boldsymbol {V}}$ là

{\mathcal {L}}_{\boldsymbol {V}}{\boldsymbol {U}}=\lim _{\lambda \to 0}{\frac {{\boldsymbol {U}}(Q)-\phi _{\lambda }^{*}({\boldsymbol {U}}(P))}{\lambda }}=\lim _{\lambda \to 0}{\frac {{\boldsymbol {U}}(\phi _{\lambda }(P))-\phi _{\lambda }^{*}({\boldsymbol {U}}(P))}{\lambda }}

(131)

với $\phi _{\lambda }^{*}({\boldsymbol {U}}(P))$ là vectơ thu được bằng cách lấy vectơ tiếp tuyến tại điểm P thuộc đường cong của đoàn đường cong ${\mathcal {C}}_{U}$ và kéo (hay dịch chuyển) nó từ P tới Q. Hình 1.2 minh họa hai họ đoàn đường cong và các vectơ tiếp tuyến tương ứng trên chúng.

Theo thành phần tọa độ, phương trình (130) có thể biểu diễn theo phép biến đổi tọa độ như sau:

P(x)\longrightarrow Q(x')

(132)

x^{\mu }\longrightarrow x^{{\mu }'}=x^{\mu }+\lambda V^{\mu }

(133)

trong đó $\lambda V^{\mu }$ là sự thay đổi tọa độ dọc theo đường cong. Vì đạo hàm của $x^{{\mu }'}$ là^[31]

\partial _{\nu }x^{{\mu }'}=\delta _{\nu }^{\mu }+\lambda \partial _{\nu }V^{\mu }

(134)

từ đây vec tơ $U^{\mu }$ biến đổi như sau

U^{{\mu }'}(x')=\Lambda _{\nu }^{{\mu }'}U^{\nu }=U^{\mu }(x)+\lambda U^{\nu }(x)\partial _{\nu }V^{\mu }

(135)

Tập tin:DaohamLie.jpg

Hình 1.2. Minh họa hai họ đoàn đường cong

{\mathcal {C}}_{U}

và

{\mathcal {C}}_{V}

với các trường vectơ tiếp tuyến tương ứng U và V. Chú ý sự khác nhau giữa trường vectơ

{\boldsymbol {U}}(Q)

tại sự kiện Q (màu đỏ) và trường vectơ kéo tương đương

\phi _{\lambda }^{*}({\boldsymbol {U}}(P))

của

{\boldsymbol {U}}(\phi _{\lambda }(P))

tại sự kiện P (màu cam).

Mặt khác, $U^{{\mu }'}(x')$ trên vế trái của (135) có thể tính thông qua khai triển Taylor

U^{{\mu }'}(x')=U^{{\mu }'}(x)+\lambda V^{\nu }\partial _{\nu }U^{\mu }+{\mathcal {O}}(\lambda ^{2}),

(136)

và kết hợp hai phương trình cuối ta thu được

U^{\mu }=U^{{\mu }'}+\lambda (V^{\nu }\partial _{\nu }U^{\mu }-U^{\nu }\partial _{\nu }V^{\mu }).

(137)

Nếu quay trở lại định nghĩa (131), chúng ta có thể suy luận ra công thức đạo hàm Lie của trường vectơ trong thành phần tọa độ hiệp biến và phản biến như sau

${\begin{aligned}({\mathcal {L}}_{\boldsymbol {V}}{\boldsymbol {U}})^{\mu }&=V^{\nu }\partial _{\nu }U^{\mu }-U^{\nu }\partial _{\nu }V^{\mu }\\({\mathcal {L}}_{\boldsymbol {V}}{\boldsymbol {U}})_{\mu }&=V^{\nu }\partial _{\nu }U_{\mu }-U_{\nu }\partial _{\nu }V^{\mu }\\\end{aligned}}$

(138; 139)

Điều mà chúng ta đã tìm thấy đó là có thể đặc biệt hóa một trường vec tơ thành một trường vô hướng hay tổng quát hóa thành một trường tenxơ bất kỳ. Ví dụ trong trường hợp hàm vô hướng $\phi$ và một trường tenxơ tổng quát T, chúng ta có thể lặp lại lập luận ở trên và có

{\mathcal {L}}_{\phi {\boldsymbol {V}}}{\boldsymbol {T}}=\phi {\mathcal {L}}_{\boldsymbol {V}}{\boldsymbol {T}}-{\boldsymbol {V}}{\mathcal {L}}_{\boldsymbol {T}}\phi ,

(140)

{\mathcal {L}}_{\boldsymbol {V}}\phi =V^{\nu }\partial _{\nu }\phi _{\nu }={\frac {d\phi }{d\lambda }}.

(141)

với công thức thứ hai chỉ đơn giản là đạo hàm của trường vô hướng dọc đoàn đường cong V, do đó nó nhấn mạnh rằng đạo hàm Lie có thể coi là sự tổng quát hóa của đạo hàm đối lưu (convective derivative hay material derivative) cho một đa tạp bất kỳ đối với một trường vô hướng dọc một đường cong (cũng xem phương trình (176)).

Rõ ràng từ định nghĩa (131) ta thấy đạo hàm Lie là một toán tử tuyến tính, nghĩa là đối với hai tenxơ tổng quát ${\boldsymbol {Y,Z}}$ đạo hàm Lie của tổ hợp tuyến tính hai tenxơ này bằng

{\mathcal {L}}_{\boldsymbol {V}}(aY^{\alpha \beta }+bZ^{\mu \nu })=a{\mathcal {L}}_{\boldsymbol {V}}Y^{\alpha \beta }+b{\mathcal {L}}_{\boldsymbol {V}}Z^{\mu \nu },

(142)

với a và b là hai hằng số thực. Tương tự, quy tắc Leibnitz cũng áp dụng cho đạo hàm Lie

{\mathcal {L}}_{\boldsymbol {V}}(Z^{\mu \nu }Y_{\alpha \beta })={\mathcal {L}}_{\boldsymbol {V}}(Z^{\mu \nu })Y_{\alpha \beta }+Z^{\mu \nu }{\mathcal {L}}_{\boldsymbol {V}}(Y_{\alpha \beta }),

(143)

Hơn nữa, đạo hàm Lie ánh xạ một tenxơ kiểu (m,n) vào một tenxơ khác có cùng kiểu. Do vậy, đạo hàm Lie của ten xơ kiểu (1,1) là

{\mathcal {L}}_{\boldsymbol {V}}T^{\alpha }{}_{\beta }=V^{\mu }\partial _{\mu }T^{\alpha }{}_{\beta }-T^{\mu }{}_{\beta }\partial _{\mu }V^{\alpha }+T^{\alpha }{}_{\mu }\partial _{\beta }V^{\mu }

(144)

Cuối cùng, chúng ta chú ý rằng công thức (138) có thể viết thành dạng thu gọn là

{\mathcal {L}}_{\boldsymbol {V}}{\boldsymbol {U}}=[{\boldsymbol {V,U}}]

(145)

mà chúng ta đã bỏ đi dạng thành phần, $[{\boldsymbol {V,U}}]$ còn được gọi là dấu ngoặc Lie và là thành phần cơ bản trong đại số Lie^[32]. Dấu ngoặc Lie cũng được sử dụng để nhấn mạnh một tính chất quan trọng của cơ sở tọa độ ${\boldsymbol {e}}_{\mu }={\boldsymbol {\partial }}_{\mu }$ . Nói chung, dấu ngoặc Lie của hai cơ sở tọa độ bất kỳ có biểu diễn theo cùng một cơ sở như

[{\boldsymbol {e}}_{\mu },{\boldsymbol {e}}_{\nu }]=C_{\mu \nu }^{\lambda }{\boldsymbol {e}}_{\lambda }

(146)

với các thành phần $C_{\mu \nu }^{\lambda }$ , mà không phải là thành phần của một tenxơ, được đặt tên là các hệ số cấu trúc. Có thể chứng minh được rằng^[33] một hệ cơ sở vectơ là cơ sở tọa độ khi và chỉ khi mọi hệ số cấu trúc của chúng bằng 0.

Từ định nghĩa ${\boldsymbol {e}}_{\mu }={\boldsymbol {\partial }}_{\mu }$ (ví dụ xem phương trình (37)), thì cơ sở tọa độ có thể được xây dựng từ một hệ tọa độ bất kỳ, ví dụ $\{{\boldsymbol {e}}_{t},{\boldsymbol {e}}_{x},{\boldsymbol {e}}_{y},{\boldsymbol {e}}_{z}\}=\{{\boldsymbol {\partial }}_{t},{\boldsymbol {\partial }}_{x},{\boldsymbol {\partial }}_{y},{\boldsymbol {\partial }}_{z}\}$ là cơ sở tọa độ trong trường hợp hệ tọa độ Descartes và $\{{\boldsymbol {e}}_{t},{\boldsymbol {e}}_{r},{\boldsymbol {e}}_{\theta },{\boldsymbol {e}}_{\phi }\}=\{{\boldsymbol {\partial }}_{t},{\boldsymbol {\partial }}_{r},{\boldsymbol {\partial }}_{\theta },{\boldsymbol {\partial }}_{\phi }\}$ là cơ sở tọa độ cho hệ tọa độ cầu. Rõ ràng các thành phần của hệ cơ sở tọa độ chỉ là $e_{\mu }^{\nu }=\delta _{\mu }^{\nu }$ khi tính trong cùng một hệ cơ sở đó, nhưng không phải mọi hệ cơ sở tọa độ là trực chuẩn hay ${\boldsymbol {e}}_{\mu }.{\boldsymbol {e}}_{\nu }\neq \eta _{\mu \nu }$ . Quả vậy, khi sử dụng hệ tọa độ cong, ngay cả trong không thời gian phẳng, cơ sở tọa độ nói chung không là hệ trực chuẩn, nhưng có thể dễ dàng xây dựng lên một hệ trực chuẩn từ hệ này. Ví dụ, xét cơ sở tọa độ $\{{\boldsymbol {e}}_{t},{\boldsymbol {e}}_{r},{\boldsymbol {e}}_{\theta },{\boldsymbol {e}}_{\phi }\}$ ta có thể xây dựng một hệ cơ sở trực chuẩn $\{{\boldsymbol {e}}_{\hat {t}},{\boldsymbol {e}}_{\hat {r}},{\boldsymbol {e}}_{\hat {\theta }},{\boldsymbol {e}}_{\hat {\phi }}\}$ như

{\boldsymbol {e}}_{\hat {t}}={\boldsymbol {e}}_{t}\qquad {\boldsymbol {e}}_{\hat {r}}={\boldsymbol {e}}_{r}

(147)

{\boldsymbol {e}}_{\hat {\theta }}={\frac {1}{r}}{\boldsymbol {e}}_{\theta }\qquad {\boldsymbol {e}}_{\hat {\phi }}={\frac {1}{rsin\theta }}{\boldsymbol {e}}_{\phi }

(148)

mà lúc này sẽ trở thành một hệ cơ sở trực chuẩn, chẳng hạn ${\boldsymbol {e}}_{\hat {\mu }}.{\boldsymbol {e}}_{\hat {\nu }}=\eta _{{\hat {\mu }}{\hat {\nu }}}$ . Hơn nữa, nếu thành phần đầu tiên của một hệ cơ sở trực chuẩn là một vectơ 4-vận tốc của một quan sát viên, thì hệ cơ sở này được gọi là nhóm bốn (tetrad), và nó đóng vai trò quan trọng trong lý thuyết đo lường trong thuyết tương đối rộng vì những đo đạc trong hệ cơ sở nhóm bốn là tương đương với đo đạc trong một hệ quy chiếu quán tính.^[34] Tính chất quan trọng của hệ cơ sở trực chuẩn mới (147) và (148) đó là nó không phải là hệ cơ sở tọa độ, vì không thể thực hiện phép biến đổi tọa độ đơn giản từ hệ tọa độ Descartes thành hệ này, hay một cách tương đương, các hệ số cấu trúc của hệ cơ sở trực chuẩn khác 0, ví dụ

C_{{\hat {r}}{\hat {\theta }}}^{\theta }=[{\boldsymbol {e}}_{\hat {r}},{\boldsymbol {e}}_{\hat {\theta }}]^{\theta }=({\mathcal {L}}_{{\boldsymbol {e}}_{\hat {r}}}{\boldsymbol {e}}_{\hat {\theta }})^{\theta }={\boldsymbol {e}}_{\hat {r}}^{\nu }\partial _{\nu }{\boldsymbol {e}}_{\hat {\theta }}^{\theta }-{\boldsymbol {e}}_{\hat {\theta }}^{\nu }\partial _{\nu }{\boldsymbol {e}}_{\hat {r}}^{\theta }=\delta _{r}^{\nu }\partial _{\nu }\left({\frac {1}{r}}\right)=-{\frac {1}{r^{2}}}\neq 0

(149)

Vì lý do này mà cơ sở trực chuẩn như (147) và (148) còn được coi là cơ sở phi tọa độ. Kể từ đây chúng ta sẽ ám chỉ cơ sở trực chuẩn với ký hiệu mũ bên trên chỉ số hiệp biến.

Định nghĩa đạo hàm Lie là rất cơ bản mà có thể xác định khi không cần một liên thông hay mêtric nào.^[35]

Đạo hàm hiệp biến và ký hiệu Christoffel sửa

Khi xây dựng một toán tử vi phân mới nhằm mở rộng khái niệm đạo hàm từng phần sang cho không thời gian cong, chúng ta đã biết nó phải có tính chất chính xác gì. Đó là, khi tác dụng lên một tenxơ, toán tử vi phân mới này sẽ phải cho kết quả là một tenxơ mới. Đạo hàm từng phần chỉ thỏa mãn tính chất này đối với các phép biến đổi tọa độ tuyến tính. Tuy nhiên, dưới những điều kiện tổng quát hơn, chẳng hạn cho các biến đổi phi tuyến, kết quả của đạo hàm riêng không có tính chất giống như tenxơ. Ví dụ, xét biến đổi

V^{{\mu }'}=\Lambda _{\mu }^{{\mu }'}V^{\mu }

(19)

rồi thực hiện đạo hàm riêng đối với hệ tọa độ mới $\{x^{{\mu }'}\}$ ta có

\partial _{\beta '}V^{{\mu }'}=\partial _{\mu }x^{{\mu }'}\partial _{\beta '}V^{\mu }+\left(\partial _{\mu }\partial _{\beta '}x^{{\mu }'}\right)V^{\mu }

(150)

Nếu biến đổi tọa độ $\{x^{\mu }\}\rightarrow \{x^{{\mu }'}\}$ là phi tuyến, thì số hạng thứ hai trong vế phải của phương trình (1.150) sẽ không triệt tiêu và đạo hàm riêng của các thành phần vectơ sẽ không biến đổi như một tenxơ. Thật may là việc xây dựng một toán tử vi phân với những tính chất đòi hỏi là không quá khó và chúng ta có thể bắt đầu bằng cách xét một trường vectơ ${\boldsymbol {U}}$ và một tập vectơ cơ sở $\{{\boldsymbol {e}}_{\mu }\}$ mà biểu diễn các thành phần của trường vectơ trên đó, ${\boldsymbol {U}}=U^{\mu }{\boldsymbol {e}}_{\mu }$ (xem phương trình (36)). Sau đó thực hiện tính đạo hàm

\partial _{\nu }{\boldsymbol {U}}=\partial _{\nu }U^{\mu }{\boldsymbol {e}}_{\mu }+U^{\mu }\partial _{\nu }{\boldsymbol {e}}_{\mu }

(151)

mà chúng ta có thể coi số hạng $\partial _{\nu }{\boldsymbol {e}}_{\mu }$ như là một vectơ được viết trong cùng một hệ cơ sở vectơ $\{{\boldsymbol {e}}_{\mu }\}$ hay

\partial _{\nu }{\boldsymbol {e}}_{\mu }=\Gamma _{\mu \nu }^{\lambda }{\boldsymbol {e}}_{\lambda }

(152)

mà ở đây dễ dàng nhận ra rằng hệ số $\Gamma _{\mu \nu }^{\lambda }$ bị triệt tiêu trong không thời gian phẳng phủ bởi hệ tọa độ Descartes do trong trường hợp này vectơ cơ sở là không thay đổi. Chú ý rằng, nếu trong cùng một không thời gian phẳng mà được bao phủ bằng một hệ tọa độ khác, ví dụ như hệ tọa độ cầu, thì các hệ số này lại không bị triệt tiêu hoàn toàn. Và từ sự triệt tiêu của các hệ số $\Gamma _{\mu \nu }^{\lambda }$ chưa chắc đã kết luận được đó là không thời gian phẳng hay không. Kết hợp phương trình (151) với (152) ta có

\partial _{\nu }{\boldsymbol {U}}=\left(\partial _{\nu }U^{\mu }+\Gamma _{\nu \lambda }^{\mu }U^{\lambda }\right){\boldsymbol {e}}_{\mu }=\left(\nabla _{\nu }U^{\mu }\right){\boldsymbol {e}}_{\mu }

(153)

do vậy các thành phần của trường vectơ $\partial _{\nu }{\boldsymbol {U}}$ , biểu thức nằm trong dấu ngoặc của phương trình thứ hai trong (153), xác định lên đạo hàm hiệp biến của $U^{\mu }$ ^[36]

$\nabla _{\nu }U^{\mu }:=\partial _{\nu }U^{\mu }+\Gamma _{\nu \lambda }^{\mu }U^{\lambda }$

(154)

Hệ số $\Gamma _{\nu \lambda }^{\mu }$ được gọi là hệ số liên thông aphin hay ký hiệu Christoffel (mang tên của Elwin Bruno Christoffel), chúng không phải là tenxơ do chúng biến mất trong những hệ tọa độ cụ thể (ví dụ như hệ tọa độ Descartes trong không thời gian phẳng) trong khi chúng khác 0 trong hệ tọa độ khác. Thật vậy, có thể dễ dàng chứng minh được rằng dưới phép biến đổi tọa tổng quát ký hiệu Christoffel biến đổi theo

\Gamma _{{\beta }'{\gamma }'}^{{\alpha }'}=\Lambda ^{{\alpha }'}{}_{\alpha }\Lambda ^{\beta }{}_{{\beta }'}\Lambda ^{\gamma }{}_{{\gamma }'}\Gamma _{\beta \gamma }^{\alpha }+\Lambda ^{{\alpha }'}{}_{\alpha }\partial _{{\beta }'}\partial _{{\gamma }'}x^{\alpha }

(155)

mà nó chỉ hoạt động như một tenxơ khi biến đổi là tuyến tính, như phép biến đổi Lorentz. Mặt khác, đạo hàm hiệp biến định nghĩa từ phương trình (154) cho phép xác định các thành phần của một tenxơ vì chúng đã được xây dựng để biểu diễn các thành phần của một trường vectơ trong (153). Cũng chú ý rằng vì hàm vô hướng không thể phân tích theo các thành phần của hệ vectơ cơ sở cho nên đạo hàm hiệp biến của hàm vô hướng $\phi$ trùng với đạo hàm riêng

\nabla _{\mu }\phi =\partial _{\mu }\phi

(156)

Bây giờ có thể sử dụng tính chất (156) và định nghĩa (154) của đạo hàm hiệp biến của vectơ phản biến $U^{\mu }$ để thu được đạo hàm hiệp biến của vectơ hiệp biến $U_{\mu }$

\nabla _{\nu }U_{\mu }=\partial _{\nu }U_{\mu }-\Gamma _{\mu \nu }^{\lambda }U_{\lambda }

(157)

Các thao tác tương tự cho phép tính được đạo hàm hiệp biến của một tenxơ hỗn hợp loại bất kỳ. Ví dụ, đối với ten xơ kiểu (1,1) và (0,2)

\nabla _{\mu }T_{\beta }^{\alpha }=\partial _{\mu }T_{\beta }^{\alpha }+\Gamma _{\nu \mu }^{\alpha }T_{\beta }^{\nu }-\Gamma _{\beta \mu }^{\nu }T_{\nu }^{\alpha }

(158)

\nabla _{\mu }T_{\alpha \beta }=\partial _{\mu }T_{\alpha \beta }-\Gamma _{\alpha \mu }^{\nu }T_{\nu \beta }-\Gamma _{\beta \mu }^{\nu }T_{\alpha \nu }

(159)

Có một điểm thú vị đó là nếu quay trở lại định luật biến đổi (155) sẽ thấy thành phần phản xứng của ký hiệu Christoffel $\Gamma _{[\mu \nu ]}^{\gamma }$ là một tenxơ. Hơn nữa, khi xét tới cơ sở tọa độ, thành phần phản xứng của ký hiệu Christoffel được sử dụng để định nghĩa một tenxơ gọi là tenxơ xoắn (torsion tensor):

{\mathcal {T}}^{\alpha }{}_{\mu \nu }:=2\Gamma _{[\mu \nu ]}^{\alpha }

(160)

Trong phát biểu ban đầu, Einstein đã giả sử không thời gian có các liên thông xoắn tự do (torsion-free) hay tenxơ xoắn bằng 0. Trong lý thuyết Einstein–Cartan, Cartan đã thử giới thiệu tenxơ xoắn thông qua spin mật độ của các hạt cơ bản. Tuy nhiên, trong những phần sau chỉ xét tới không thời gian có tenxơ xoắn bằng 0, hay ký hiệu Christoffel là đối xứng theo các chỉ số hiệp biến của nó. Điều này hàm ý, ví dụ, trong đạo hàm Lie (138) có thể thay thế đạo hàm thường bằng đạo hàm hiệp biến

$\left({\mathcal {L}}_{\boldsymbol {V}}{\boldsymbol {U}}\right)^{\mu }=V^{\nu }\nabla _{\nu }U^{\mu }-U^{\nu }\nabla _{\nu }V^{\mu }$

(161)

và thu được mối liên hệ quan trọng giữa đạo hàm Lie và đạo hàm hiệp biến. Do có thể viết đạo hàm hiệp biến của một vectơ ${\boldsymbol {A}}$ tổng quát thành hai dạng tương đương

\nabla _{\lambda }A_{\mu }=\nabla _{\lambda }\left(g_{\mu \nu }A^{\nu }\right)=A^{\nu }\nabla _{\lambda }g_{\mu \nu }+g_{\mu \nu }\nabla _{\lambda }A^{\nu }

(162)

Cũng vì đạo hàm hiệp biến của một vectơ là một tenxơ, có thể thực hiện việc nâng và hạ chỉ số thông qua tenxơ mêtric và đạo hàm hiệp biến trong (162) viết thành

\nabla _{\lambda }A_{\mu }=g_{\mu \nu }\nabla _{\lambda }A^{\nu }

(163)

Từ hai phương trình (162) và (163) dẫn tới một tính chất quan trọng của tenxơ mêtric

$\nabla _{\lambda }g_{\mu \nu }=0$

(164)

Tính bất biến của mêtric với đạo hàm hiệp biến được ứng dụng để tính các ký hiệu Christoffel hoàn toàn theo các thành phần của tenxơ mêtric. Thật vậy, từ các bước tính toán trực tiếp từ (164) thông qua phương trình (159) chúng ta tìm được

$\Gamma _{\beta \gamma }^{\alpha }={\frac {1}{2}}g^{\alpha \delta }\left(\partial _{\gamma }g_{\delta \beta }+\partial _{\beta }g_{\delta \gamma }-\partial _{\delta }g_{\beta \gamma }\right)$

(165)

Dạng đạo hàm hiệp biến của 4-vectơ trong (157) và biểu thức hiển cho ký hiệu Christoffel trong (165) cho phép suy luận ra một đẳng thức quan trọng của bốn-phân kỳ của một vectơ

\nabla _{\mu }U^{\mu }={\frac {\partial _{\mu }\left({\sqrt {-g}}U^{\mu }\right)}{\sqrt {-g}}}

(166)

mà ở đây $g:=det(g_{\mu \nu }$ và chúng ta đã áp dụng tính chất của ký hiệu Christoffel với hai chỉ số được thu gọn

\Gamma _{\mu \nu }^{\nu }={\frac {1}{2}}g^{\nu \delta }\partial _{\mu }g_{\nu \delta }={\frac {\partial _{\mu }\left({\sqrt {-g}}\right)}{\sqrt {-g}}}

(167)

Biểu thức (166) còn được gọi là công thức phân kỳ và việc tính toán đơn giản đi đáng kể vì nó chỉ chứa đạo hàm riêng.

Trong trường hợp nói chung, bởi vì đối với mỗi giá trị của một chỉ số bên trên sẽ có 10 cặp giá trị khác nhau của hai chỉ số bên dưới do vậy sẽ có 40 giá trị khác nhau của $\Gamma _{\mu \nu }^{\gamma }$ , tuy thế không phải tất cả các giá trị này đều độc lập với nhau. Sự triệt tiêu của các ký hiệu Christoffel cũng là một tính chất quan trọng cần lưu ý. Giả sử rằng các ký hiệu Christoffel trong hệ tọa độ $x^{\mu }$ tại điểm x₀ khác không, $\Gamma _{\lambda \kappa }^{\mu }(x_{0})\neq 0$ . Có thể chỉ ra rằng nếu thực hiện phép biến đổi như sau

x^{{\mu }'}=x^{\mu }-x_{0}^{\mu }+{\frac {1}{2}}\Gamma _{\alpha \beta }^{\mu }(x_{0})(x^{\alpha }-x_{0}^{\alpha })(x^{\beta }-x_{0}^{\beta })

(168)

thì các ký hiệu Christoffel trong hệ tọa độ mới triệt tiêu tại điểm x'₀ hay $\Gamma _{{\lambda }'{\kappa }'}^{{\mu }'}(x'_{0})=0$ . Kết quả này không quá gây ngạc nhiên bởi vì như đã nêu ở phần trước không thời gian cong có thể coi là phẳng trên phạm vi cục bộ và các hệ số Christoffel có thể triệt tiêu tại bất kỳ các điểm lân cận nào. Sự triệt tiêu của các ký hiệu Christoffel hàm ý rằng dạng công thức của mêtric cho không thời gian phẳng cục bộ đã được tìm thấy tại điểm đó. Tuy nhiên, điều quan trọng là trong không thời gian cong tính chất này không thể mở rộng ra cho mọi điểm, do vậy một phép biến đổi tọa độ kiểu (168) sẽ cho các hệ số Christoffel khác 0 tại những điểm khác x'₀. Một lần nữa, tính chất cơ bản này chính là sự thể hiện của nguyên lý tương đương và khả năng chọn được một hệ quy chiếu cục bộ mà nó trở thành hệ quy chiếu quán tính và hệ tương đương với hệ quy chiếu rơi tự do. Hệ quy chiếu cục bộ này không thể mở rộng ra toàn bộ đa tạp được.

Đối xứng và trường vectơ Killing sửa

Đối xứng đóng vai trò quan trọng trong vật lý học và thuyết tương đối tổng quát không phải là một ngoại lệ. Để đánh giá sự quan trọng của các đối xứng, hãy xét một không thời gian có một số đối xứng chịu trách nhiệm cho tính bất biến của các phương trình dưới tác dụng của nhóm một tham số ${\mathcal {G}}$ . Trong trường hợp này, có thể gắn với ${\mathcal {G}}$ một trường vectơ ${\boldsymbol {\xi }}$ sao cho các đường trong trường vectơ ${\boldsymbol {\xi }}$ tương ứng với đường đi (hay quỹ đạo) của ${\mathcal {G}}$ . Ví dụ, nếu không thời gian là dừng, thì ${\mathcal {G}}=(\mathbb {R} ,+)$ và các phương trình là bất biến dưới phép tịnh tiến dọc các đường kiểu thời gian, hay chúng độc lập với thời gian. Tương tự, nếu không thời gian là đối xứng trục, thì ${\mathcal {G}}=SO(2)$ và các phương trình là bất biến dưới phép quay xung quanh một vài trục, hay chúng độc lập với góc miêu tả sự quay quanh những trục này. Các trường vectơ Killing nhấn mạnh vào các đối xứng của không thời gian và, như sẽ thảo luận sâu hơn ở những phần sau, chúng cung cấp một công cụ mạnh khi gặp những đại lượng bảo toàn đi kèm với các đối xứng này.

Về định nghĩa, một trường vectơ ${\boldsymbol {\xi }}$ là trường Killing (theo tên của Wilhelm Killing) nếu đạo hàm Lie của trường tenxơ mêtric ${\boldsymbol {g}}$ dọc theo họ ${\boldsymbol {\xi }}$ bằng 0, hay ${\mathcal {L}}_{\boldsymbol {\xi }}{\boldsymbol {g}}=0$ . Nghĩa là trường vectơ Killing bảo tồn mêtric trên đa tạp Riemann. Trong dạng thành phần, điều kiện này tương đương với

{\mathcal {L}}_{\boldsymbol {\xi }}g_{\mu \nu }=\xi ^{\alpha }\partial _{\alpha }g_{\mu \nu }+g_{\mu \alpha }\partial _{\nu }\xi ^{\alpha }+g_{\alpha \nu }\partial _{\mu }\xi ^{\alpha }=0

(169)

Trường vectơ ${\boldsymbol {\xi }}$ cũng được coi là toán tử sinh (generator) của nhóm đối xứng ${\mathcal {G}}$ . Phương trình (169) cung cấp đặc trưng hiệp biến cho những đối xứng tồn tại. Quả vậy, nếu chúng ta thay đạo hàm riêng $\partial _{\nu }\xi ^{\alpha }$ theo (154) và sử dụng tính chất (164) $\nabla _{\mu }g_{\alpha \beta }=0$ sẽ thu được phương trình Killing

$\nabla _{(\mu }\xi _{\nu )}=0$

(170)

với dấu ngoặc ám chỉ thành phần đối xứng của tenxơ này. Phương trình (170) là phương trình vi phân tuyến tính bậc nhất cho các vectơ Killing và chúng xác định các phép đẳng cự (isometry) của không thời gian. Ví dụ, giả sử chọn hệ tọa độ sao cho $\xi ^{\mu }=(1,0,0,0)$ là một vectơ Killing. Thì từ (169) rút ra được mêtric độc lập với thời gian

\partial _{t}g_{\mu \nu }=0

(171)

Nói chung, khi vectơ Killing là vectơ cơ sở tọa độ, thì mêtric không phụ thuộc vào trục tọa độ tương ứng, hay còn gọi là tọa độ xilic (cyclic coordinate). Ví dụ, một số mêtric của không thời gian vật lý mà nêu ra ở phần Không thời gian trong vật lý thiên văn, các tọa độ $t,\phi$ là xiclic. Từ đây chúng thừa nhận ít nhất hai vectơ Killing ${\boldsymbol {\eta }}$ và ${\boldsymbol {\xi }}$ sao cho $\eta ^{\mu }=\delta ^{m}u_{t}$ và $\xi ^{\mu }=\delta ^{m}u_{\phi }$ và các tích vô hướng cho kết quả trực tiếp các thành phần của tenxơ mêtric

\eta ^{\mu }\eta _{\mu }=g_{tt},\qquad \xi ^{\mu }\xi _{\mu }=g_{\phi \phi },\qquad \eta ^{\mu }\xi _{\mu }=g_{t\phi }

(172)

Rõ ràng sự có mặt của một vectơ Killing thể hiện tính chất độc lập với một tọa độ của không thời gian, trong khi thực tế rằng một tọa độ là xilic là do cách lựa chọn đặc biệt đối với các tọa độ. Tuy nhiên, khi cho trước một vectơ Killing, luôn có thể tìm được một hệ tọa độ phù hợp sao cho vectơ Killing trùng với một trong các vectơ cơ sở tọa độ. Có thể chứng minh được là một không thời gian N chiều thừa nhận nhiều nhất N(N+1)/2 vectơ Killing độc lập. Trường hợp tất cả chúng có mặt khi chỉ khi độ cong của không thời gian là không đổi.^[37]. Ví dụ cho không thời gian có độ cong không đổi đó là không thời gian phẳng và không thời gian Friedmann–Lemaître–Robertson–Walker (FLRW) miêu tả trong phần liên quan ở dưới.

Hai mối liên hệ cơ sở thỏa mãn trong không thời gian có hai vectơ Killing ${\boldsymbol {\eta }}$ và ${\boldsymbol {\xi }}$ đó là

\eta ^{\mu }\nabla _{\mu }\eta _{\nu }=-{\frac {1}{2}}\nabla _{\nu }\left(\eta ^{\mu }\eta _{\mu }\right),\qquad \xi ^{\mu }\nabla _{\mu }\xi _{\nu }=-{\frac {1}{2}}\nabla _{\nu }\left(\xi ^{\mu }\xi _{\mu }\right)

(173)

Ngoài ra, nếu hai vectơ Killing ${\boldsymbol {\eta }}$ và ${\boldsymbol {\xi }}$ giao hoán, nghĩa là (xem (145))

{\mathcal {L}}_{\boldsymbol {\eta }}{\boldsymbol {\xi }}=-{\mathcal {L}}_{\boldsymbol {\xi }}{\boldsymbol {\eta }}=0

(174)

thì liên hệ sau cũng thỏa mãn

\eta ^{\mu }\nabla _{\mu }\xi _{\nu }=\xi ^{\mu }\nabla _{\mu }\eta _{\nu }=-{\frac {1}{2}}\nabla _{\nu }\left(\xi ^{\mu }\eta _{\mu }\right)

(175)

Phương trình đường trắc địa sửa

Xét một trường vectơ ${\boldsymbol {U}}$ trên đa tạp ${\mathcal {M}}$ và một đường cong ${\mathcal {C}}$ với vec tơ tiếp tuyến ${\boldsymbol {V}}$ . Đạo hàm đối lưu (convective derivative hoặc Lagrangian derivative) của ${\boldsymbol {U}}$ dọc theo ${\boldsymbol {V}}$ là

${\begin{aligned}\left({\frac {D{\boldsymbol {U}}}{D\lambda }}\right)^{\mu }&:=\left({\boldsymbol {\nabla _{V}U}}\right)^{\mu }\\&=V^{\mu }\nabla _{\nu }U^{\mu }=V^{\nu }\partial _{\nu }U^{\mu }+\Gamma _{\alpha \nu }^{\mu }U^{\alpha }V^{\nu }\\\end{aligned}}$

(176)

với $\lambda$ là tham số dọc cung ${\mathcal {C}}$ và chúng ta sử dụng ký hiệu $D/D\lambda$ để nhấn mạnh nó nên được coi là sự mở rộng của đạo hàm hiệp biến dọc theo hướng được chọn của trường vectơ ${\boldsymbol {V}}$ . Chú ý rằng nếu ${\boldsymbol {U}}$ là một hàm vô hướng $\phi$ , thì đạo hàm đối lưu (176) trùng với đạo hàm Lie của $\phi$ dọc theo ${\boldsymbol {V}}$

{\frac {D\phi }{D\lambda }}=V^{\nu }\partial _{\nu }\phi ={\frac {d\phi }{d\lambda }}={\mathcal {L}}_{\boldsymbol {V}}\phi

(177)

Đạo hàm đối lưu cho phép định nghĩa một khái niệm rất quan trọng đó là dịch chuyển song song (parallel transport) và ta nói rằng ${\boldsymbol {U}}$ được dịch chuyển song song dọc đường cong ${\mathcal {C}}$ với vectơ tiếp tuyến ${\boldsymbol {V}}$ nếu

${\boldsymbol {\nabla _{V}U}}=0$

(178)

Dịch chuyển song song một vectơ trên cung kín thuộc mặt cầu từ A → N → B → A và vectơ cuối cùng có hướng khác so với vec tơ ban đầu, góc lệch

\alpha

tỉ lệ với diện tích tam giác cầu (cung kín).

Phát biểu theo cách khác, một trường vec tơ được dịch chuyển song song nếu nó di chuyển từ điểm P₁ đến P₂ dọc theo ${\mathcal {C}}$ và tại đó nó trùng với trường vectơ nằm tại điểm P₁. Khái niệm dịch chuyển song song dẫn tới một cách tự nhiên định nghĩa một loại đường cong đặc biệt, với vectơ tiếp tuyến của đường cong này được dịch chuyển song song trên nó

${\boldsymbol {\nabla _{V}V}}=0\iff V^{\nu }\nabla _{\nu }V^{\mu }=0$

(179)

Để thấy được ý nghĩa của phương trình (179), hãy xét không thời gian phẳng nơi các đường mà dịch chuyển song song các vectơ tiếp tuyến của chúng chỉ đơn giản là một đường thẳng. Trong trường hợp này, thực tế vectơ tiếp tuyến vẫn còn song song với nhau khi nó trượt trên đường thằng. Do vậy, phương trình (179) biểu diễn sự mở rộng sang không thời gian cong tổng quát hơn của khái niệm đường thẳng mà gọi là các đường cong trắc địa hay đường trắc địa.

Vì ${\boldsymbol {V}}$ là vectơ tiếp tuyến nên có thể viết nó dưới dạng $V^{\mu }=dx^{\mu }/d\lambda$ (xem phương trình (16)) và từ phương trình (179) thu được

V^{\alpha }\nabla _{\alpha }V^{\mu }=V^{\alpha }\left(\partial _{\alpha }V^{\mu }+\Gamma _{\alpha \beta }^{\mu }V^{\beta }\right)={\frac {dV^{\mu }}{d\lambda }}+\Gamma _{\alpha \beta }^{\mu }V^{\alpha }V^{\beta }=0

(180)

hay chính là phương trình trắc địa hoặc phương trình đường cong trắc địa như sau

{\frac {d^{2}x^{\mu }}{d{\lambda }^{2}}}+\Gamma _{\alpha \beta }^{\mu }{\frac {dx^{\alpha }}{d\lambda }}{\frac {dx^{\beta }}{d\lambda }}=0

(181)

Tham số $\lambda$ , mà dùng để biểu thị thời gian riêng trên một đường cong kiểu thời gian (timelike curve), được gọi là tham số aphin của đường trắc địa với tên gọi đến từ lý do rằng phương trình (181) bất biến dưới phép biến đổi aphin trong đó $\lambda \rightarrow {\lambda }'=a\lambda +b$ với a, b là hai hằng số.

Cũng có thể rút ra phương trình trắc địa (181) theo cách tiếp cận khác. Giống như đường thẳng trong không thời gian phẳng biểu thị cho đường cong có độ dài cực trị (extremal length), ta có thể đòi hỏi rằng đường cong trắc địa biểu thị cho đường cong có độ dài cực trị giữa hai điểm P₁ và P₂ trong không thời gian tổng quát, tức là^[38] $\delta {\mathcal {S}}=0$ với

{\mathcal {S}}:=\int _{P_{1}}^{P_{2}}2Ld\lambda =\int _{P_{1}}^{P_{2}}ds=\int _{P_{1}}^{P_{2}}{\sqrt {|g_{\mu \nu }dx^{\mu }dx^{\nu }|}}=\int _{P_{1}}^{P_{2}}{\sqrt {|g_{\mu \nu }{\dot {x}}^{\mu }{\dot {x}}^{\nu }|}}d\lambda

(182)

với ${\dot {x}}^{\mu }:=dx^{\mu }/d\lambda$ và với $L=L(x^{\mu },{\dot {x}}^{\mu },\lambda )$ là hàm Lagrangian. Một hệ quả quan trọng của cách tiếp cận bằng phép tính biến phân đó là nó chứng tỏ chỉ có duy nhất một đường trắc địa nối giữa hai điểm khác nhau.

Bây giờ giả sử đường cong ${\mathcal {C}}$ là tuyến thế giới của một hạt khối lượng m, và được tham số hóa bằng thời gian riêng, do đó vectơ tiếp tuyến chính là 4-vận tốc của hạt. Trong trường hợp này, đường trắc địa là đường cong mà trên nó 4-gia tốc của hạt bị triệt tiêu, hay có nghĩa là đường mà hạt rơi tự do. Suy luận ra điều này là khá đơn giản nếu xét không thời gian phẳng với hệ tọa độ Descartes nơi phương trình đường trắc địa suy biến thành

{\frac {d^{2}x^{\mu }}{d{\lambda }^{2}}}={\frac {F^{\mu }}{m}}=0

(183)

trong đó $F^{\mu }$ là các thành phần của 4-lực. Từ đây chúng ta thu được hai kết luận quan trọng. Thứ nhất, đường trắc địa quả thực là quỹ đạo của hạt rơi tự do, tức là hạt không chịu tác động của một hợp lực ngoài. Thứ hai, đó là gia tốc-4 của hạt, mà định nghĩa bằng đạo hàm đối lưu của vận tốc-4, bằng không dọc theo đường trắc địa của hạt

a^{\mu }=u^{\nu }\nabla _{\nu }u^{\mu }=0

(184)

Có thể thiết lập mối liên hệ giữa đường cong trắc địa với các đối xứng Killing nêu ra ở phần trước. Trước hết chú ý nếu ${\boldsymbol {\xi }}$ là vectơ Killing và ${\boldsymbol {u}}$ là vectơ tiếp tuyến với đường trắc địa, thì dựa theo phương trình (184) ta có

{\mathcal {L}}_{\boldsymbol {u}}\left(u^{\mu }\xi ^{\mu }\right)=\nabla _{\boldsymbol {u}}\left(u^{\mu }\xi ^{\mu }\right)=0

(185)

tức là tích vô hướng ${\boldsymbol {u.\xi }}$ được bảo toàn dọc theo đường trắc địa. Như vậy là phương trình đường trắc địa được sử dụng để tìm các vectơ Killing có liên hệ với các định luật bảo toàn vật lý. Tính chất này đã biểu diễn ở phương trình (185) nhưng nó sẽ rõ ràng hơn nếu chúng ta xét phương trình đường trắc địa (179) và thực hiện thu gọn chỉ số với một trường vectơ Killing $\xi _{\nu }$ để tìm

\xi _{\nu }V^{\mu }\nabla _{\mu }V^{\nu }=V^{\mu }\nabla _{\mu }(\xi _{\nu }V^{\nu })-V^{\mu }V^{\nu }\nabla _{\mu }\xi _{\nu }=0

(186)

Từ phương trình (170) ta có $V^{\mu }V^{\nu }\nabla _{\mu }\xi _{\nu }=V^{\mu }V^{\nu }\nabla _{(\mu }\xi _{\nu )}$ triệt tiêu, và ngay lập tức suy ra được đại lượng $\xi _{\mu }V^{\mu }$ được bảo toàn dọc theo đường trắc địa. Kết quả này có một ý nghĩa đẹp được giải thích theo kết quả vật lý. Khi mêtric không phụ thuộc vào một tọa độ, như đối với tọa độ thời gian và/hoặc tọa độ góc phương vị như tương ứng trong không thời gian dừng và/hoặc không thời gian đối xứng trục, thì một hạt thử chuyển động với vận tốc $V^{\mu }$ dọc theo đường trắc địa sẽ có hai thành phần $V_{t}$ và/hoặc $V_{\phi }$ được bảo toàn. Do hạt trên một đường trắc địa khi và chỉ khi nó không chịu một lực bất kỳ nào khác ngoài lực hấp dẫn, một cách tự nhiên ta có thể gán hai đại lượng $V_{t}$ và $V_{\phi }$ là hằng số của chuyển động, tương ứng cho năng lượng và động lượng của hạt.

Tenxơ Riemann sửa

Mặc dù tenxơ mêtric chắc chắn là tenxơ quan trọng nhất trong thuyết tương đối rộng, nhưng nếu chỉ sử dụng một mình nó thì không thể suy luận ra không thời gian là phẳng hay cong. Chúng ta đã đề cập đến thực tế rằng một không thời gian phẳng được miêu tả bằng hệ tọa độ Descartes sẽ có tenxơ mêtric rất đơn giản với các thành phần là hằng số (xem (103)), cùng một không thời gian này sẽ có tenxơ mêtric phức tạp hơn khi đa tạp được phủ bằng những hệ tọa độ khác, chẳng hạn như hệ tọa độ cầu. Về mặt trực giác, khi thực hiện đo độ cong thì kết quả sẽ phụ thuộc vào tenxơ mêtric thay đổi như thế nào trên toàn bộ không thời gian (hay nó sẽ phải tỷ lệ với đạo hàm của ten xơ mêtric) và những sự thay đổi này sẽ có dạng toàn phương, với sự tương tự như ở độ cong nội tại Gauss đối với mặt. Từ đó, với cách lập luận đơn giản như thế đưa chúng ta nhận ra rằng tenxơ độ cong sẽ phải có thứ nguyên của nghịch đảo bình phương độ dài và là một đối tượng có kiểu

(tenxơ độ cong)

\propto f[(\partial {\boldsymbol {g}})^{2},\partial ^{2}{\boldsymbol {g}}]

(187)

Có thể thực hiện định nghĩa chính xác hơn khi áp dụng các công cụ toán học đã được nêu ở các phần trước, đặc biệt là khái niệm đạo hàm hiệp biến dọc theo một đường cong. Xét một trường vectơ bất kỳ ${\boldsymbol {A}}$ và hai đoàn đường cong ${\mathcal {C}}_{\boldsymbol {U}}$ và ${\mathcal {C}}_{\boldsymbol {V}}$ , với ${\boldsymbol {U}}$ và ${\boldsymbol {V}}$ tương ứng là các vectơ tiếp tuyến. Cho giá trị của trường vectơ tại một điểm P hay ${\boldsymbol {A}}(P)$ , chúng ta có thể tính giá trị tại một điểm Q sau khi đã kéo dọc giá trị từ P theo đoàn ${\mathcal {C}}_{\boldsymbol {U}}$ rồi sau đó kéo theo đoàn ${\mathcal {C}}_{\boldsymbol {V}}$ . Kết quả của hai sự dịch chuyển này là hai vectơ được so sánh tại điểm Q. Trong không gian thời gian phẳng, hai vectơ này sẽ đồng nhất giống nhau. Nhưng chúng sẽ khác nhau nếu không thời gian là cong và sự sai khác này có thể được sử dụng để đo độ cong của không thời gian. Việc so sánh này được nêu ra trong hình 1.3 với hai đoàn đường cong được vẽ ra và với các vec tơ tiếp tuyến. Chú ý rằng vec tơ ${\boldsymbol {A}}(P)$ sẽ có hai ảnh khác nhau tại điểm Q mới và hiệu giữa chúng sẽ đo độ cong của đa tạp.

Bằng cách tính toán trực tiếp nhưng khá dài bao gồm các định nghĩa của đạo hàm hiệp biến (154) và đạo hàm đối lưu (176) chúng ta thu được hai biểu thức sau cho các đạo hàm hiệp biến lần 2 cho tính giao hoán của bốn vec-tơ ${\boldsymbol {A}}$ như sau (hay còn gọi là đồng nhất thức Ricci)

\nabla _{[\mu }\nabla _{\nu ]}A_{\alpha }={\frac {1}{2}}R_{\alpha \nu \mu }^{\beta }A_{\beta },

(188)

\nabla _{[\mu }\nabla _{\nu ]}A^{\alpha }={\frac {1}{2}}R_{\beta \nu \mu }^{\alpha }A^{\beta },

(189)

với^[39]

$R^{\mu }{}_{\nu \alpha \beta }:=\partial _{\alpha }\Gamma _{\nu \beta }^{\mu }-\partial _{\beta }\Gamma _{\nu \alpha }^{\mu }+\Gamma _{\lambda \alpha }^{\mu }\Gamma _{\nu \beta }^{\lambda }-\Gamma _{\lambda \beta }^{\mu }\Gamma _{\nu \alpha }^{\lambda }$

(191)

là tenxơ độ cong Riemann mà ${\mathcal {O}}((\partial {\boldsymbol {g}})^{2},\partial ^{2}{\boldsymbol {g}})$ như được mong đợi theo (187).

Tập tin:Riemann curvature tensor.svg

Minh họa sự thay đổi của vectơ A khi nó được dịch chuyển song song từ điểm P đến điểm Q theo hai cách: thứ nhất là dọc theo đoàn đường cong

{\mathcal {C}}_{U}

rồi sau đó theo

{\mathcal {C}}_{V}

, thứ hai là theo cách ngược lại. Do đa tạp là cong nên hai kết quả sẽ cho hai vectơ khác nhau tại điểm Q, và hiệu của haivec tơ này đo độ cong của đa tạp, như được biểu diễn qua tenxơ Riemann.

Cách lập luận ở trên không phải là cách duy nhất để tìm ra tenxơ độ cong Riemann. Có một cách suy luận gần gũi với trực giác vật lý hơn đó là chứng tỏ mối liên hệ giữa độ cong và sự có mặt của lực thủy triều do trường hấp dẫn. Để thấy điều này, trước tiên chúng ta cần tính đạo hàm đối lưu bậc hai của một trường vectơ tổng quát ${\boldsymbol {A}}$ dọc theo một đường trắc địa có vectơ tiếp tuyến ${\boldsymbol {u}}$ . Điều này có thể dễ dàng thực hiện bằng cách tính hai lần đạo hàm đối lưu bậc nhất (176) ta có

{\frac {D^{2}A^{\mu }}{D\lambda ^{2}}}={\frac {D}{D\lambda }}\left({\frac {DA^{\mu }}{D\lambda }}\right)=u^{\nu }\nabla _{\nu }\left({\frac {DA^{\mu }}{D\lambda }}\right)=u^{\nu }\nabla _{\nu }(u^{\kappa }\nabla _{\kappa }A^{\mu })

(192)

Bây giờ sử dụng định nghĩa của phương trình trắc địa (179), có thể mở rộng phương trình (192) thông qua quy tắc tính đạo hàm tiêu chuẩn và có

{\frac {D^{2}A^{\mu }}{D\lambda ^{2}}}={\frac {d^{2}A^{\mu }}{d\lambda ^{2}}}+A^{\nu }u^{\alpha }u^{\beta }\partial _{\beta }\Gamma _{\nu \alpha }^{\mu }+2\Gamma _{\nu \alpha }^{\mu }u^{\nu }{\frac {dA^{\alpha }}{d\lambda }}+\Gamma _{\nu \beta }^{\mu }\Gamma _{\alpha \rho }^{\beta }A^{\alpha }u^{\rho }u^{\nu }-\Gamma _{\nu \alpha }^{\mu }\Gamma _{\gamma \rho }^{\nu }A^{\alpha }u^{\gamma }u^{\rho }

(193)

mà ở đây ký hiệu:

{\frac {dA^{\mu }}{d\lambda }}:=u^{\nu }\partial _{\nu }A^{\mu }

(194)

Tiếp theo, xét hai hạt điểm nằm gần nhau trong trạng thái rơi tự do và có nghĩa là hai hạt nằm trên hai đường trắc địa được tham số hóa bằng cùng một tham số $\lambda$ (hay có cùng thời gian riêng). Trong không thời gian phẳng, chúng sẽ chuyển động theo đường thẳng và do đó khoảng cách giữa chúng, mà được đo thông qua vectơ chuyển dịch vị trí $\xi ^{\mu }$ giữa hai đường trắc địa, là không đổi (các đường thẳng song song không cắt nhau trong không gian phẳng). Tuy nhiên, điều này sẽ không còn đúng nếu không thời gian là cong, và chúng ta có thể đo sự biến đổi trong vectơ chuyển dịch vị trí bằng cách theo dõi hai đường trắc địa mà sẽ có phương trình

{\frac {d^{2}x^{\mu }}{d\lambda ^{2}}}+\Gamma _{\alpha \beta }^{\mu }{\frac {dx^{\alpha }}{d\lambda }}{\frac {dx^{\beta }}{d\lambda }}=0

(195)

{\frac {d^{2}(x^{\mu }+\xi ^{\mu })}{d\lambda ^{2}}}+\Gamma _{\alpha \beta }^{\mu }(x+\xi ){\frac {d(x^{\alpha }+\xi ^{\alpha })}{d\lambda }}{\frac {d(x^{\beta }+\xi ^{\beta })}{d\lambda }}=0

(196)

Trừ hai vế của hai phương trình (195) và (196), rồi khai triển nó tới bậc nhất của độ dịch chuyển tức là $\Gamma _{\alpha \beta }^{\mu }(x+\xi )=\Gamma _{\alpha \beta }^{\mu }(x)+\xi ^{\nu }\partial _{\nu }\Gamma _{\alpha \beta }^{\mu }+{\mathcal {O}}({\boldsymbol {\xi }}^{2})$ thu được

{\frac {d^{2}\xi ^{\mu }}{d\lambda ^{2}}}=-2\Gamma _{\nu \beta }^{\mu }u^{\nu }{\frac {d\xi ^{\beta }}{d\lambda }}-u^{\nu }u^{\alpha }\xi ^{\beta }\partial _{\beta }\Gamma _{\nu \alpha }^{\mu }+{\mathcal {O}}({\boldsymbol {\xi }}^{2})

(197)

Sử dụng biểu thức (197) có thể tính tiếp đạo hàm đối lưu bậc hai của vectơ chuyển dịch vị trí $\xi ^{\mu }$ dựa theo công thức (193) cho vectơ tổng quát ${\boldsymbol {A}}$ cuối cùng nhận được

{\frac {D^{2}\xi ^{\mu }}{D\lambda ^{2}}}=R_{\nu \alpha \beta }^{\mu }u^{\nu }u^{\alpha }\xi ^{\beta }

(198)

với tenxơ kiểu (1, 3) $R_{\nu \alpha \beta }^{\mu }$ trong (198) có cùng dạng với tenxơ Riemann được định nghĩa trong (191).

Phương trình (198) được gọi là phương trình độ lệch trắc địa cung cấp một kết quả rất quan trọng khi nó phát biểu các đường trắc địa lân cận nhau thay đổi khoảng cách giữa chúng theo cách gia tốc nếu tenxơ Riemann khác 0.^[40] Kết quả là, một sự biểu thị điển hình của trường hấp dẫn, sự xuất hiện của lực thủy triều, bây giờ được coi đơn giản như là một hiệu ứng hình học do độ cong khác không của không thời gian. Do vậy, tenxơ Riemann không những dùng để thăm dò độ cong của không thời gian, mà còn được coi là sự có mặt của trường hấp dẫn và hai thứ này không thể phân biệt được với nhau. Điều này được minh họa trên hình 1.4 thể hiện vectơ ${\boldsymbol {\xi }}$ tách biệt giữa hai đường trắc địa của hai hạt rơi tự do với vectơ tiếp tuyến ${\boldsymbol {u}}$ . Bên trái là không thời gian phẳng, với $R_{\nu \alpha \beta }^{\mu }=0$ trong trường hợp này khoảng cách giữa hai đường là không đổi và hai đường trắc địa là những đường thẳng song song với nhau. Bên phải là trường hợp không thời gian cong, $R_{\nu \alpha \beta }^{\mu }\neq 0$ như được tạo ra bởi vật thể khối lượng lớn chẳng hạn, trong trường hợp này vec tơ khoảng cách có độ lớn biến thiên gia tốc thu nhỏ dần khi hai hạt thử di chuyển trong trường hấp dẫn. (198)

Chúng ta đã biết rằng nếu không thời gian là phẳng thì có một hệ tọa độ mà trong đó các hệ số Christoffel bị triệt tiêu trên toàn bộ không thời gian. Do đó từ phương trình (191) tenxơ Riemann cũng triệt tiêu, và do là tenxơ nó cũng triệt tiêu trong mọi hệ tọa độ khác. Điều ngược lại cũng đúng, nghĩa là nếu tenxơ Riemann bằng 0 trên toàn bộ không thời gian, thì từ phương trình (198) sẽ có khoảng cách giữa hai đường trắc địa bất kỳ sẽ không đổi và do vậy không thời gian là phẳng. Tuy nhiên chú ý rằng, nếu các hệ số Christoffel chỉ bằng 0 trong phạm vi cục bộ điều này không thể suy ra được tenxơ Riemann sẽ bằng 0 tại điểm đó bởi vì ten xơ này còn phụ thuộc vào đạo hàm của hệ số Christoffel. Do vậy bằng cách lập luận này, luôn có thể phân biệt được hiệu ứng gây ra bởi một trường hấp dẫn thực sự hay do một hệ quy chiếu phi quán tính (các dẫn đến không thời gian phẳng trên cục bộ) với một cách đơn giản đó là kiểm tra xem tenxơ Riemann có bằng 0 hay không.

Khi viết một tenxơ có kiểu (0, 4), tenxơ Riemann thể hiện một số tính chất đối xứng đại số quan trọng như sau:

Tập tin:Geodesicdeviation.svg

Minh họa khoảng cách giữa hai đường trắc địa khi được đo bằng vectơ khoảng cách

{\boldsymbol {\xi }}

giữa hai đường trắc địa của hai hạt rơi tự do với vectơ tiếp tuyến

{\boldsymbol {u}}

. Bên trái là không thời gian phẳng,

R_{\nu \alpha \beta }^{\mu }=0

, khoảng cách giữa hai đường trắc địa không thay đổi và chúng là hai đường thẳng song song. Bên phải là không thời gian cong bao quanh một vật thể khối lượng lớn, và trong trường hợp này khoảng cách giữa hai đường thay đổi và không còn song song với nhau nữa.

Nó đối xứng khi hoán vị giữa hai cặp chỉ số thứ nhất và thứ hai

R_{\alpha \beta \gamma \delta }=R_{\gamma \delta \alpha \beta }

(199)

Nó phản xứng khi đổi vị trí hai cặp chỉ số đầu tiên

R_{\alpha \beta \gamma \delta }=-R_{\beta \alpha \gamma \delta }

(200)

Tương tự, nó phản xứng khi đổi vị trí hai cặp chỉ số thứ ba và thứ tư

R_{\alpha \beta \gamma \delta }=-R_{\alpha \beta \delta \gamma }

(201)

Nó phản xứng ở ba chỉ số cuối (đồng nhất thức Bianchi)

3!R_{\alpha [\beta \gamma \delta ]}=2(R_{\alpha \beta \gamma \delta }+R_{\alpha \delta \beta \gamma }+R_{\alpha \gamma \delta \beta })

(202)

Do tất cả những tính chất đối xứng và phản xứng này, số các thành phần độc lập của tenxơ Riemann trong đa tạp N chiều không phải là N⁴ mà là N²(N²-1)/12, vì thế trong không thời gian bốn chiều, có 20 thành phần độc lập trong số 256 thành phần của tenxơ Riemann. Ta có thể thực hiện thao tác thu gọn chỉ số của tenxơ Riemann nhưng chỉ có một trường hợp là không tầm thường, và thu được một tenxơ đối xứng hạng hai gọi là tenxơ Ricci

$R_{\mu \nu }:=g^{\alpha \beta }R_{\alpha \mu \beta \nu }=R_{\mu \beta \nu }^{\beta }=\partial _{\lambda }\Gamma _{\mu \nu }^{\lambda }-\partial _{\nu }\Gamma _{\mu \lambda }^{\lambda }+\Gamma _{\mu \nu }^{\lambda }\Gamma _{\lambda \beta }^{\beta }-\Gamma _{\mu \beta }^{\lambda }\Gamma _{\nu \lambda }^{\beta }$

(203)

với phương trình cuối áp dụng theo phương trình (191) biểu diễn tenxơ Ricci theo hệ số Christoffel. Ta có thể thực hiện tiếp việc thu gọn chỉ số của tenxơ Ricci để thu được vết của nó hay gọi là độ cong vô hướng hoặc độ cong vô hướng Ricci cho bởi

$R:=g^{\mu \nu }R_{\mu \nu }=R^{\mu }{}_{\nu }$

(204)

Ý nghĩa hình học của độ cong vô hướng đó là nó thể hiện lượng thay đổi của thể tích một hình cầu trong đa tạp cong Riemann so với hình cầu cùng bán kính trong không gian Euclid.

Vì được xây dựng trực tiếp từ tenxơ Riemann nên cả tenxơ Ricci và vô hướng Ricci có thứ nguyên của nghịch đảo bình phương độ dài. Vô hướng Ricci cũng phân biệt với một loại vô hướng khác nhận được bằng cách thu gọn các chỉ số của hai tenxơ Riemann:

K:=R^{\alpha \beta \mu \nu }R_{\alpha \beta \mu \nu }

(205)

Độ cong vô hướng này còn được gọi là độ cong vô hướng Kretschmann, có thứ nguyên bằng nghịch đảo lũy thừa bậc bốn của độ dài. Các độ cong vô hướng này là những độ cong bất biến tại mỗi điểm và xác định lên hình học nội tại ở lân cận điểm đó. Độ cong bất biến rất có ích khi thực hiện đo độ cong của không thời gian cũng như nghiên cứu các kỳ dị vật lý. Để nhìn nhận một cách trực giác hơn về tính chất của tenxơ Riemann, hãy xét các thành phần của nó trong một không gian cong hai chiều đơn giản nhất, hay mặt cầu hai chiều trong không gian Euclid ba chiều ${\mathcal {S}}$ . Nếu $R_{S}$ là bán kính của mặt cầu hai chiều được phủ bằng hệ tọa độ $\{\theta ,\phi \}$ thì nguyên tố đoạn sẽ bằng

ds^{2}=R_{S}^{2}(d\theta ^{2}+sin^{2}\theta d\phi ^{2})

(206)

và do đó tenxơ mêtric sẽ có các thành phần

g_{ij}={\begin{pmatrix}R_{S}^{2}&0\\0&R_{S}^{2}sin^{2}\theta \end{pmatrix}},\quad g^{ij}={\begin{pmatrix}R_{S}^{-2}&0\\0&(R_{S}^{2}sin^{2}\theta )^{-1}\end{pmatrix}}

Các ký hiệu Christoffel khác 0 là

\Gamma _{\phi \phi }^{\theta }=-sin\theta cos\theta ,\quad \Gamma _{\theta \phi }^{\phi }=cot\theta

(207)

Từ đây có thể tính trực tiếp các thành phần khác 0 của tenxơ Riemann

R_{\phi \phi \theta }^{\theta }=-{\frac {1}{R_{S}^{2}}}g_{\theta \theta }=-sin^{2}\theta ,\quad R_{\theta \phi \theta }^{\phi }={\frac {1}{R_{S}^{2}}}g_{\theta \theta }=1

(208)

và tenxơ Ricci bằng $R_{ij}=g_{ij}/R_{S}^{2}$ trong khi độ cong vô hướng Ricci bằng $R=2/R_{S}^{2}$ . Sự quan trọng của biểu thức (208) là nó cho thấy tenxơ độ cong tỷ lệ nghịch với bình phương bán kính cong cục bộ tại điểm đó, do vậy nó độc lập với không gian Euclid ba chiều, và có thể gắn cho tenxơ độ cong tại mỗi điểm bằng nghịch đảo bình phương của bán kính mặt cầu mật tiếp tại điểm đó. Với mặt cầu hai chiều bất kỳ có bán kính R_S không đổi biểu thức (208) có thể mở rộng thành

R_{\mu \beta \nu }^{\alpha }={\frac {1}{R_{S}^{2}}}\left(\delta _{\beta }^{\alpha }g_{\mu \nu }-\delta _{\nu }^{\alpha }g_{\mu \beta }\right)

(209)

Ngoài những tính chất đối xứng nêu trên, tenxơ Riemann cũng tuân theo các liên hệ vi phân sau (còn gọi là các đồng nhất thức Bianchi thứ hai)

\nabla _{[\mu }R_{\nu \alpha ]\beta \gamma }=0

(210)

\nabla _{[\mu }R_{\nu \alpha \beta ]\gamma }=0

(211)

Thu gọn chỉ số của phương trình Bianchi (210) hai lần sẽ thu được kết quả quan trọng được sử dụng ở phần sau

$\nabla _{\mu }\left(R^{\mu \nu }-{\frac {1}{2}}g^{\mu \nu }R\right)=\nabla _{\mu }G^{\mu \nu }$

(212)

trong đó ở đây giới thiệu một tenxơ hạng hai, phân kỳ tự do còn gọi là tenxơ Einstein

$G^{\mu \nu }:=R^{\mu \nu }-{\frac {1}{2}}g^{\mu \nu }R$

(213)

Tenxơ Ricci có N(N+1)/2 thành phần độc lập và do vậy tenxơ Riemann có số thành phần độc lập nhiều hơn tenxơ Ricci trong đa tạp có số chiều N > 3. Hơn nữa, ten xơ Riemann cũng nhận sự phân tích thành một tenxơ khác, tenxơ Weyl (mang tên Hermann Weyl) định nghĩa bằng

$C^{\mu }{}_{\nu \alpha \beta }:=R^{\mu }{}_{\nu \alpha \beta }-{\frac {2}{N-2}}\left(\delta _{[\alpha }^{\mu }R_{\beta ]\nu }+g_{\nu [\beta }R_{\alpha ]}^{\mu }\right)+{\frac {2R}{(N-1)(N-2)}}\delta _{[\alpha }^{\mu }g_{\beta ]\nu }$

(214)

Tenxơ Weyl triệt tiêu trong bất kỳ đa tạp nào có số chiều N < 4, nó có vết tự do và có cùng các tính chất đối xứng như tenxơ Riemann. Tương tự như tenxơ Riemann, tenxơ Weyl thể hiện lực thủy triều chịu bởi một vật chuyển động trong trường hấp dẫn (hay trong không thời gian cong). Tuy nhiên, khác với tenxơ độ cong, tenxơ Weyl cung cấp thông tin về hình dáng vật thể bị biến dạng như thế nào chứ không phải về thể tích của nó thay đổi bao nhiêu. Tenxơ Weyl đặc biệt hữu ích trong tính toán bức xạ hấp dẫn hình thành trong các mô phỏng số tương đối tính thông qua hình thức luận Newman-Penrose.

Phương trình trường Einstein sửa

Trong lý thuyết hấp dẫn của Newton, phương trình liên hệ thế hấp dẫn $\phi$ với mật độ khối lượng $\rho$ biểu diễn nguồn của trường, là phương trình Poisson

\nabla ^{2}\phi =4\pi G\rho

(215)

Đây là phương trình đạo hàm riêng bậc hai đối với thế hấp dẫn chưa biết $\phi$ và $\nabla ^{2}$ là toán tử Laplace. Vì ý tưởng chính của thuyết tương đối tổng quát đó là trường hấp dẫn là một thực thể hình học, do vậy các hệ số mêtric $g_{\mu \nu }$ nên được coi như là những biến động lực mới của trường hấp dẫn. Để thu về giới hạn Newton, chúng ta mong muốn rằng phương trình trường hấp dẫn mới, phương trình trường Einstein, sẽ chứa các đạo hàm của ten xơ metric mà không quá đạo hàm bậc hai.

Hơn nữa, dạng của phương trình mới phải được giữ nguyên không phụ thuộc vào hệ tọa độ được chọn. Do vậy nó phải là phương trình tenxơ và ten xơ tự nhiên nhất tổng quát hóa mật độ khối lượng nằm ở bên phải phương trình (215) là tenxơ ứng suất–năng lượng $T^{\mu \nu }$ . Theo đó, phương trình trường Einstein phải có dạng

G_{\mu \nu }=\kappa T_{\mu \nu }

(216)

với $\kappa$ là một hằng số tỷ lệ, và tenxơ $G_{\mu \nu }$ phải có dạng phụ thuộc vào mêtric g và đạo hàm của nó như sau

G_{\mu \nu }=G_{\mu \nu }({\boldsymbol {g}},\partial {\boldsymbol {g}},\partial ^{2}{\boldsymbol {g}})

(217)

để nó có dạng giống tương ứng với phương trình Poisson trong lý thuyết Newton. Thêm vào đó, nguồn của trường hấp dẫn sẽ phải thỏa mãn các định luật bảo toàn viết dưới dạng $\nabla _{\mu }T^{\mu \nu }=0$ cho nên chúng ta mong muốn rằng từ phương trình (216) sẽ có $\nabla _{\mu }G^{\mu \nu }=0$ . Chỉ bằng ngôn ngữ hình học thuần túy, chúng ta đã xây dựng một tenxơ thỏa mãn các tính chất này, đó là tenxơ Einstein được định nghĩa trong phương trình (213).

Tenxơ ứng suất-năng lượng có một ý nghĩa tối quan trọng trong thuyết tương đối rộng. Trong lý thuyết Newton có mật độ $\rho$ là nguồn của trường hấp dẫn. Nó được hiểu là mật độ khối lượng và bằng thành phần $T^{00}$ của tenxơ trong thuyết tương đối hay chính là khối lượng nghỉ $\rho _{0}$ . Nhưng một lý thuyết chỉ sử dụng khối lượng nghỉ là nguồn của trường sẽ trở lên kỳ lạ từ cách nhìn tương đối tính, do khối lượng nghỉ và năng lượng có thể biến đổi được cho nhau. Chúng ta có thể chứng minh được rằng một lý thuyết như vậy sẽ vi phạm trong những thí nghiệm chính xác cao. Do đó nguồn của trường phải là mọi dạng năng lượng bao gồm cả mật độ khối lượng tổng cộng $T^{00}$ . Nhưng nếu nguồn của trường chỉ là một thành phần của một tenxơ sẽ đưa tới một lý thuyết hấp dẫn không thỏa mãn tính bất biến: chúng ta sẽ cần phải chọn một hệ tọa độ ưu tiên để có thể tính toán $T^{00}$ . Do vậy, Einstein đoán rằng nguồn của trường phải là tenxơ ứng suất-năng lượng: mọi năng lượng, động lượng, áp suất và ứng suất cũng phải là nguồn của trường hấp dẫn. Kết hợp với trực giác về không gian cong đã đưa ông tới hoàn thiện thuyết tương đối tổng quát.

Áp suất đóng một vai trò cơ bản hơn trong thuyết tương đối tổng quát so với lý thuyết hấp dẫn cổ điển. Bởi vì nó là một nguồn của trường hấp dẫn, hãy xét một ngôi sao đặc mà trường hấp dẫn mạnh của nó đòi hỏi gradien áp suất phải lớn để duy trì trạng thái cân bằng của nó khỏi sự nén hấp dẫn về bên trong. Mặt khác gradien áp suất này lại đóng góp vào nguồn của trường, do đó gradien áp suất càng phải lớn hơn để giữ cho ngôi sao ổn định. Đối với những sao có áp suất $p\ll \rho$ thì điều này không gây ra ảnh hưởng đáng kể nào. Nhưng khi p trở lên đáng kể so với $\rho$ chúng ta thấy rằng sự tăng áp suất lại là một con đường tự hủy diệt: không một áp suất nào có thể giữ ngôi sao ổn định và sự suy sụp hấp dẫn phải xảy ra. Tuy đây chỉ là những lập luận sơ bộ, chi tiết hơn cần có những tính toán chặt chẽ, nhưng nó cho thấy bằng cách phân tích các khía cạnh của thuyết tương đối hẹp cũng cho ta những kết quả cơ bản trong thuyết tương đối rộng.

Tenxơ ứng suất-năng lượng chỉ chứa những thành phần năng lượng, động lượng phi hấp dẫn mà không chứa năng lượng, động lượng của hấp dẫn.^[41]

Vì đạo hàm hiệp biến của mêtric bằng 0, (164), việc cộng thêm vào tenxơ Einstein một số hạng tỷ lệ với tenxơ mêtric không làm thay đổi phân kỳ tự do của nó hay $\nabla _{\mu }(G^{\mu \nu }+\Lambda g^{\mu \nu })=0$ , với $\Lambda$ là hằng số. Về mặt lịch sử, hằng số này được Eintein đưa ra đầu tiên nhằm thu được nghiệm miêu tả vũ trụ tĩnh và nó được đặt tên là hằng số vũ trụ. Gần đây, hằng số vũ trụ đã xuất hiện trở lại với khả năng giải thích cho vũ trụ giãn nở gia tốc mà các nhà thiên văn học đã quan sát thấy.^[42]^[43] Vì giá trị nhỏ của hằng số vũ trụ nếu chỉ xét tới các vật thể thiên văn nên có thể coi $\Lambda =0$ .

Phương trình trường Einstein viết dưới dạng thành phần bao gồm tất cả các số hạng là

$G_{\mu \nu }+\Lambda g_{\mu \nu }=R_{\mu \nu }-{\frac {1}{2}}g_{\mu \nu }R+\Lambda g_{\mu \nu }={\frac {8\pi G}{c^{4}}}T_{\mu \nu }$

(218)

ở đây các hệ số $G,c,8\pi$ xuất hiện để có thể thu về giới hạn trường hấp dẫn Newton yếu.^[44]

Có một cách khác để tìm ra phương trình trường Einstein đó là sử dụng nguyên lý biến phân cho tác dụng phù hợp của trường hấp dẫn (tác dụng Einstein–Hilbert).^[45] và phương pháp này có ích khi các nhà vật lý giới thiệu ra những lý thuyết thay thế khác về trường hấp dẫn.

Thực hiện tìm vết của phương trình (218) ta có

R=-8\pi \left(T-{\frac {\Lambda }{2\pi }}\right),

(219)

do vậy phương trình trường Einstein có thể viết lại thành

R_{\mu \nu }=-8\pi \left(T_{\mu \nu }-{\frac {1}{2}}Tg_{\mu \nu }+{\frac {1}{8\pi }}\Lambda g_{\mu \nu }\right),

(220)

Phương trình này giúp nhìn thấy rõ mối liên hệ chặt (sự tương đương chặt chẽ) giữa hình học của không thời gian bên vế trái với thành phần khối lượng-năng lượng bên vế phải.^[46] Đây là một trong những đặc điểm cơ bản của thuyết tương đối rộng.

Từ phát biểu toán học, phương trình trường Einstein là một hệ chứa 10 phương trình vi phân riêng phần phi tuyến biểu diễn theo tenxơ mêtric $g_{\mu \nu }$ . Tuy nhiên chỉ có 6 phương trình độc lập do điều kiện $\nabla _{\mu }G^{\mu \nu }=0$ . Kết quả này phản ánh thực tế rằng có bốn bậc tự do (bằng số tọa độ của không thời gian) trong 10 thành phần của tenxơ mêtric. Điều này không liên quan tới trường hấp dẫn mà chỉ là do chúng ta được lựa chọn hệ tọa độ một cách bất kỳ để miêu tả các thành phần của tenxơ mêtric, hay tự do chuẩn (gauge freedom). Vì phương trình trường Einstein là phi tuyến nên việc tìm và phân tích các nghiệm của nó khá phức tạp, đồng thời cũng hàm ý rằng không có nguyên lý chồng chập cho trường hấp dẫn (mạnh). Nói cách khác, tổng của hai nghiệm của phương trình không phải là một nghiệm khác. Ngay cả trong không thời gian chân không, $T_{\mu \nu }=0$ , phương trình trường Einstein trở thành dạng đơn giản $R_{\mu \nu }=0$ nhưng nó vẫn ẩn chứa 10 phương trình đạo hàm riêng phi tuyến. Nghiệm tầm thường duy nhất của phương trình Einstein là của không thời gian phẳng, khi không có vật chất $T_{\mu \nu }=0$ và mọi thành phần của tenxơ Riemann và tenxơ Einstein đều đồng nhất bằng 0.

Sự khác biệt cơ bản giữa phương trình trường Einstein và những phương trình trong các lý thuyết trường khác, ví dụ điện từ học, đó là nó cũng chứa thông tin về phương trình chuyển động cho nguồn của độ cong.^[47] Cụ thể là khi lấy phân kỳ div đối với phương trình Einstein (218) mà hệ quả quan trọng của nó là chuyển động của vật chất không thể được xác định một cách bất kỳ mà phải tuân theo định luật bảo toàn $\nabla _{\mu }T^{\mu \nu }=0$ . Mặt khác, trong điện từ học, phương trình Maxwell không quy định lên chuyển động của các điện tích điểm, mà động lực của chúng chỉ có thể giải tách biệt thông qua lực Lorentz.

Không thời gian trong vật lý thiên văn sửa

Không chỉ là một trong những phương trình đẹp của vật lý toán, phương trình trường Einstein phi tuyến có hệ quả quan trọng đó là chỉ một số ít các nghiệm chính xác được biết mà có liên quan tới vật lý thiên văn. Những nghiệm này thu được trong một số các điều kiện giới hạn và với những đối xứng đặc biệt, hoặc theo thời gian hoặc theo không gian hoặc là cả không gian và thời gian. Trong phần này đề cập tới một số nghiệm chính xác của phương trình trường Einstein, hai nghiệm liên quan tới lỗ đen và một nghiệm liên quan tới mô hình Vũ trụ. Hai nghiệm đầu tiên sẽ bỏ qua ảnh hưởng của hằng số vũ trụ trong khi nghiệm thứ ba sẽ đề cập tới nó.

Lỗ đen không quay: Nghiệm Schwarzschild sửa

Nghiệm dễ nhất trong số các nghiệm chính xác của phương trình trường Einstein do Karl Schwarzschild tìm ra (1916) chỉ vài tháng sau khi Einstein tìm ra phương trình đúng của thuyết tương đối rộng (tháng 11 năm 1915).^[48] Đây là nghiệm cho không thời gian có đối xứng cầu, tĩnh^[49] và trong chân không. Nó được biết đến rộng rãi là mêtric Schwarzschild và một định lý quan trọng liên quan tới nó, định lý Birkhoff, được chứng minh vào năm 1923 rằng nghiệm Schwarzschild là nghiệm duy nhất của phương trình trường Einstein cho không thời gian đối xứng cầu trong chân không. Nghiệm Schwarzschild là nghiệm miêu tả không thời gian bên ngoài một ngôi sao tương đối tính đối xứng cầu, độc lập với sự co giãn cầu xuyên tâm của sao.

Trong hệ tọa độ cầu $\{t,r,\theta ,\phi \}$ , nguyên tố đoạn của mêtric Schwarzschild là

$ds^{2}=-\left(1-{\frac {2M}{r}}\right)dt^{2}+\left(1-{\frac {2M}{r}}\right)^{-1}dr^{2}+r^{2}(d\theta ^{2}+sin^{2}\theta d\phi ^{2})$

(221)

trong đó M là tổng khối lượng-năng lượng của hệ. Chú ý rằng bởi vì không thời gian miêu tả bằng mêtric (221) là cong, hệ tọa độ cầu tương ứng không giống với hệ tọa độ cầu trong không thời gian phẳng. Ví dụ, độ dài riêng của chu vi đường tròn nằm tại r = 0 và trên mặt phẳng $\theta =\pi /2$ (đường xích đạo) là ${\mathcal {C}}_{circ}(r)=\oint {\sqrt {g_{\phi \phi }}}d\phi$ trong khi khoảng cách xuyên tâm riêng (proper radial distance) giữa hai điểm nằm trên hai vỏ xuyên tâm tại các bán kính $r_{1},r_{2}$ là

\int _{r_{1}}^{r_{2}}{\sqrt {g_{rr}}}dr=\int _{r_{1}}^{r_{2}}\left(1-{\frac {2M}{r}}\right)^{-1/2}dr>r_{2}-r_{1}

(222)

từ đó chứng tỏ sự tăng trong khoảng cách xuyên tâm riêng lớn hơn sự tăng trong khoảng cách tọa độ. Hơn nữa, nếu hai sự kiện có cùng tọa độ không gian, tức là $dr=d\phi =d\theta =0$ khoảng tọa độ thời gian dt giữa hai sự kiện là khác với khoảng thời gian riêng $d\tau$ và tỉ số của chúng bằng

{\frac {dt}{d\tau }}={\frac {1}{(1-2M/r)^{1/2}}}\neq 1

(223)

Nói cách khác, tại những khoảng cách hữu hạn từ gốc, tọa độ thời gian chạy chậm hơn so với thời gian riêng. Giả sử có hai đồng hồ nằm tại các khoảng cách r₂ > r₁, từ mỗi đồng hồ phát ra tín hiệu gửi tới một quan sát viên ở xa vô tận trong cùng một khoảng thời gian dt, nghĩa là

d\tau _{1}=(1-2M/r_{1})^{1/2}dt,\quad d\tau _{2}=(1-2M/r_{2})^{1/2}dt

(224)

Tỉ số giữa hai thời gian riêng

{\frac {d\tau _{2}}{d\tau _{1}}}={\frac {(1-2M/r_{2})^{1/2}}{(1-2M/r_{1})^{1/2}}}

(225)

mà khi chuyển sang tần số mà quan sát viên đo được ta có

{\frac {\nu _{1}}{\nu _{2}}}={\frac {(1-2M/r_{2})^{1/2}}{(1-2M/r_{1})^{1/2}}}\approx 1-{\frac {M}{r_{2}}}+{\frac {M}{r_{1}}}>1

(226)

Đây chính là hiệu ứng dịch chuyển đỏ do hấp dẫn, photon giảm tần số khi nó di chuyển ra xa khỏi giếng thế hấp dẫn. Vì photon có nguyên tố đoạn đặc trưng ds² = 0, đối với các photon chuyển động xuyên tâm ta có $dr/dt=\pm (1-2M/r)$ , với dấu + cho photon chuyển động ra bên ngoài và dấu - cho photon chuyển động vào trong. Từ đó, khác với không thời gian phẳng, mà có $dr/dt=\pm 1$ , tuyến thế giới của các photon trong mặt phẳng (t, r) không còn là những đường thẳng.Thêm vào đó, từ phương trình thứ nhất trong (226) dễ dàng nhận ra rằng khi $r_{1}\rightarrow 2M$ thì $\nu _{1}/\nu _{2}\rightarrow \infty$ hoặc tương đương $\nu _{2}\rightarrow 0$ . Kết quả này phản ánh tính chất là mặt tại bán kính Schwarzschild, r = 2M, là một mặt đặc biệt nhưng chính quy của nghiệm Schwarzschild, mà photon không thể thoát ra ngoài. Bề mặt này, theo định nghĩa toán học mà tại đó hàm mêtric $g_{tt}=0$ , tách không thời gian ra thành hai vùng không có liên hệ nhân quả với nhau và được gọi là chân trời sự kiện. Hơn nữa, ánh sáng chỉ có thể đi vào mặt này mà không thể thoát ra được, do vậy nghiệm Schwarzschild còn được gọi là nghiệm miêu tả lỗ đen Schwarzschild.

Chú ý rằng mặc dù trong mêtric (226) nó kỳ dị tại r = 2M, nhưng kỳ dị này chỉ là do sự lựa chọn hệ tọa độ bao phủ không thời gian và nó không phải là kỳ dị vật lý. Nhận ra điều này làm các nhà vật lý thay đổi hiểu biết về mêtric Schwarzschild. Thật vậy, khi tính toán bất biến độ cong (205) cho không thời gian Schwarzschild, $K=48M^{2}/r^{6}$ , tại r = 2M thu được giá trị hữu hạn và nó chỉ không xác định tại r = 0, và đây chính là kỳ dị vật lý. Các nhà vật lý đã giới thiệu các hệ tọa độ phù hợp để nghiên cứu không thời gian gần chân trời sự kiện, như hệ tọa độ Kruskal, hệ tọa độ Eddington-Filkenstein... đã loại trừ được kỳ dị toán học tại r = 2M.^[50]

Chuyển động của hạt thử có khối lượng nghỉ m trong không thời gian Schwarzschild có thể dẫn ra sau khi giải phương trình trắc địa (181). Chi tiết về việc giải phương trình như thế có thể xem trong d'Inverno (1992). Về thực hành, một trong những con đường đơn giản nhất là sử dụng phương pháp biến phân với các số hạng Lagrangian trong (182) và coi thời gian riêng $\tau$ như là một tham số aphin

2L={\mathcal {L}}^{2}=g_{\mu \nu }{\dot {x}}^{\mu }{\dot {x}}^{\nu }=-\left(1-{\frac {2M}{r}}\right)d{\dot {t}}^{2}+\left(1-{\frac {2M}{r}}\right)^{-1}d{\dot {r}}^{2}+r^{2}(d{\dot {\theta }}^{2}+sin^{2}\theta d{\dot {\phi }}^{2})

(227)

từ đây chúng ta dẫn ra các phương trình Euler–Lagrange sau

{\frac {d}{d\tau }}\left[\left(1-{\frac {2M}{r}}\right){\frac {dt}{d\tau }}\right]=0,

(228)

{\frac {d}{d\tau }}\left[\left(1-{\frac {2M}{r}}\right)^{-1}{\frac {dr}{d\tau }}\right]=r\left[\left({\frac {d\theta }{d\tau }}\right)^{2}+sin^{2}\theta \left({\frac {d\phi }{d\tau }}\right)^{2}\right]-{\frac {M}{r^{2}}}\left[\left({\frac {dt}{d\tau }}\right)^{2}+\left(1-{\frac {2M}{r}}\right)^{-2}\left({\frac {dr}{d\tau }}\right)^{2}\right],

(229)

{\frac {d}{d\tau }}\left(r^{2}{\frac {d\theta }{d\tau }}\right)=r^{2}sin\theta cos\theta \left({\frac {d\phi }{d\tau }}\right)^{2},

(230)

{\frac {d}{d\tau }}\left(r^{2}sin^{2}\theta {\frac {d\phi }{d\tau }}\right)=0,

(231)

Các phương trình (228) và (231) về cơ bản phát biểu rằng có thể bỏ qua được các tọa độ $t,\phi$ và cho phép xác định hai hằng số của chuyển động lần lượt là ${\tilde {E}}:=E/m$ , năng lượng riêng của hạt và, ${\tilde {\ell }}:=p_{\phi }$ là mômen động lượng phương vị riêng. Thêm vào đó, do đối xứng cầu, chúng ta có thể coi một mặt phẳng quỹ đạo ban đầu bất kỳ nào làm mặt phẳng đường xích đạo hay ban đầu đặt $\theta =\pi /2,\quad \theta /d\tau =0$ . Từ phương trình (230) có $d^{2}\theta /d\tau ^{2}=0$ và $\theta$ sẽ vẫn không đổi như mong đợi với chuyển động trong mặt phẳng.^[51] Kết quả là, phương trình đường trắc địa cho hạt có khối lượng trong không thời gian Schwarzschild thu gọn thành^[52]

{\frac {dt}{d\tau }}=\left(1-{\frac {2M}{r}}\right)^{-1}{\tilde {E}},

(232)

{\frac {dr}{d\tau }}=\left[{\tilde {E}}^{2}-\left(1-{\frac {2M}{r}}\right)\left(1+{\frac {\tilde {\ell ^{2}}}{r^{2}}}\right)\right]^{1/2},

(233)

{\frac {d\theta }{d\tau }}=0,

(234)

{\frac {d\phi }{d\tau }}={\frac {\tilde {\ell }}{r^{2}}}.

(235)

Phân tích phương trình (233) giúp làm sáng rõ sự khác biệt giữa lý thuyết của Newton với thuyết tương đối rộng, và có thể viết gọn phương trình (233) thành

\left({\frac {dr}{d\tau }}\right)^{2}={\tilde {E}}^{2}-V^{2}(r),

(236)

mà chúng ta đã định nghĩa thế hiệu dụng V bằng

V(r)=\left(1-{\frac {2M}{r}}\right)^{1/2}\left(1+{\frac {\tilde {\ell ^{2}}}{r^{2}}}\right)^{1/2},

(237)

mà nó trở thành thế hiệu dụng Newton ở khoảng cách lớn^[53] tức là

V(r)\approx \left(1-{\frac {M}{r}}\right)\left(1+{\frac {\tilde {\ell ^{2}}}{2r^{2}}}\right)=1-{\frac {M}{r}}+{\frac {\tilde {\ell ^{2}}}{2r^{2}}}+{\mathcal {O}}\left({\frac {1}{r^{3}}}\right):=V_{N},

(238)

Phương trình xuyên tâm (233) cũng dùng để phân loại các loại quỹ đạo khả dĩ khác nhau và điều này phụ thuộc cơ bản vào số lượng nhiều nhất và nhỏ nhất mà thế năng hữu hiệu (effective potential) sẽ nhận được tương ứng khi cho trước một giá trị của mômen động lượng (nếu ${\tilde {l}}=0$ quỹ đạo đơn giản là xuyên tâm và sẽ nối bất kỳ điểm nào với gốc tọa độ). Giả sử rằng, đỗi với mỗi mômen động lượng riêng ta thu được thế hữu hiệu có giá trị địa phương lớn nhất với V>1, và giá trị địa phương nhỏ nhất giống như minh họa trong hình bên trái của hình 1.5, mà tương đương với ${\tilde {l}}/M=4,1$ . Trong trường hợp này, sử dụng năng lượng riêng như là một tham số cho giảm dần, các trường hợp quỹ đạo có thể là:

Quỹ đạo bắt (capture orbit): Thế hữu hiệu và mức năng lượng hằng số không cắt nhau. Cho dù mômen động lượng lớn đến mức nào, luôn có một giá trị năng lượng làm cho hạt chuyển động tới gốc. Điều này tương phản với lý thuyết Newton, khi thế hữu hiệu trở lên phân kỳ khi $r\rightarrow 0$ và cho dù mômen động lượng có nhỏ đến cỡ nào (nhưng khác 0) thì hạt trong quỹ đạo Newton sẽ không bao giờ đạt tới gốc.^[54]
Quỹ đạo tròn nhưng không ổn định: Nó nằm tại giá trị địa phương lớn nhất của thế hữu hiệu, r_{circ, u} với $dr/d\tau =0$ , chỉ cần một nhiễu loại nhỏ sẽ làm cho hạt di chuyển sang quỹ đạo lớn hơn hoặc nhỏ hơn.
Quỹ đạo hypebol: Quỹ đạo này tương ứng với hạt có mức năng lượng ở xa vô tận lớn hơn 1 di chuyển về gốc cho tới khi đạt tới vị trí xuyên tâm cực tiểu, $dr/d\tau =0$ , tức là điểm quặt (turning point) rồi sau đó hạt chuyển động ra xa vô tận.
Quỹ đạo parabol: Quỹ đạo này tương ứng với hạt có mức năng lượng ở xa vô tận bằng 1 di chuyển về gốc cho tới khi đạt tới điểm quặt r_b. Đối với trường hợp ${\tilde {l}}/M=4$ điểm quặt trùng với quỹ đạo tròn không ổn định r_{circ, u} và nằm tại 4M (xem hình)
Quỹ đạo ellip: tương ứng với quỹ đạo của hạt có mức năng lượng nhỏ hơn 1 mà có hai điểm quặt r₁ và r₂.^[55]
Quỹ đạo tròn ổn định: tương ứng với vị trí cực tiểu của thế hữu hiệu r_{circ, s} với $dr/d\tau =0$ và bất kỳ một nhiễu loạn nhỏ nào tác động tới hạt thì hạt sẽ vẫn trở lại quỹ đạo tròn ổn định.

AAA

Tập tin:Schwarzschild geodesics.svg

Hình bên trái: Thế hữu hiệu V(r) đối với giá trị của mômen động lượng riêng

{\tilde {l}}/M=4,1

. Lần lượt là các loại quỹ đạo khác nhau:

Các giá trị của mômen động lượng riêng mà tại đó thế hữu hiệu có cả giá trị địa phương nhỏ nhất và lớn nhất, tức là $\partial _{r}V(r)=0$ và vì thế mà cũng tồn tại quỹ đạo tròn, được cho bởi

{\tilde {l}}^{2}={\frac {Mr^{2}}{r-3M}}

(239)

Để đảm bảo vế phải lớn hơn 0, nên chỉ tồn tại các điểm cực trị với ${\tilde {l}}/M\geq 2{\sqrt {3}}$ . Thêm vào đó, với ${\tilde {l}}/M=2{\sqrt {3}}\simeq 3,46$ các quỹ đạo tròn ổn định và không ổn định trùng nhau, dẫn tới điểm uốn (inflection point) tại bán kính r_ms = 6M hay còn gọi là bán kính ổn định biên (marginally stable radius). Quỹ đạo tương ứng gọi là quỹ đạo tròn ổn định trong cùng (innermost stable circular orbit) nó biểu thị bán kính nhỏ nhất mà có thể tồn tại một quỹ đạo tròn ổn định, thường đánh dấu cạnh trong cùng của đĩa bồi tụ xung quanh lỗ đen. Cũng có thể xác định quỹ đạo ổn định biên đối với hạt phi khối lượng (chẳng hạn photon) và bằng r_ph = 3M.

Sự biến đổi của thế hữu hiệu đối với mỗi giá trị mômen động lượng riêng được minh họa trong hình 1.5 bên phải với hình chèn vào thể hiện giá trị của thế hữu hiệu là cực đại (mà trùng với mức năng lượng của quỹ đạo tròn không ổn định) và cho bởi

V_{extr}^{2}(r)={\frac {4M^{2}(r/2M-1)^{2}}{r(r-3M)}}

(240)

Đặt V_extr(r) = 1, khi ấy r_mb = 4M là bán kính quỹ đạo nhỏ nhất tương ứng với quỹ đạo tròn không ổn định. Một hạt ở xa vô tận ( ${\tilde {E}}=1$ ) bắt đầu chuyển động trên quỹ đạo parabol để tới r = r_mb nơi nó có thể trên một quỹ đạo tròn nhưng trong trạng thái cân bằng không ổn định.

Tóm lược, các quỹ đạo tròn không ổn định đối với

3M=r_{ph}\leq r<r_{ms}=6M,\iff 2{\sqrt {3}}\leq {\tilde {\ell }}/M<\infty

(241)

trong khi quỹ đạo tròn ổn định đối với

6M=r_{ms}\leq r<\infty ,\iff 2{\sqrt {3}}\leq {\tilde {\ell }}/M<\infty

(242)

Sử dụng phương trình (240) sẽ không khó để ước lượng được mức năng lượng tương ứng của quỹ đạo tròn bên trong ổn định nhất bằng ${\tilde {E}}_{ms}={\sqrt {8/9}}\simeq 0,943$ và kết quả đơn giản này gợi ra một kết luận quan trọng: Xét một hạt chuyển từ quỹ đạo tròn sang một quỹ đạo tròn lân cận và bị mất phần năng lượng trong quá trình chuyển tiếp này (ví dụ vật chất trong đĩa bồi tụ quanh lỗ đen). Tổng năng lượng bị mất khi hạt chuyển động xoáy ốc từ khoảng cách xa vô tận tới quỹ đạo bên trong ổn định nhất bằng $\Delta E=(1-{\tilde {E}}_{ms})\approx 0,057$ , điều này hàm ý rằng hiệu suất biến đổi năng lượng của năng lượng liên kết xấp xỉ bằng 6%. Khi so sánh hiệu suất này với hiệu suất của phản ứng phân hạch hạt nhân (~ 0,1%) hoặc phản ứng tổng hợp hạt nhân (~ 0,4%) rõ ràng là sự bồi tụ vật chất quanh lỗ đen là một trong những quá trình biến đổi năng lượng hiệu quả nhất. Hiệu suất này còn cao hơn đối với lỗ đen quay như nêu ở phần dưới.

Lỗ đen quay: Nghiệm Kerr sửa

Năm 1963, gần 50 năm sau khi Schwarzschild tìm ra nghiệm của ông, nhà toán học Roy Kerr đã tìm ra một nghiệm chính xác dừng đối với phương trình chân không Einstein, miêu tả không thời gian của lỗ đen có tổng khối lượng M và mômen động lượng J.^[56] Nghiệm này còn gọi là lỗ đen Kerr và sau đó được chứng minh là duy nhất,^[57] nó thu về mêtric Schwarzschild khi mômen động lượng bằng 0. Vì bao gồm sự quay, lỗ đen Kerr không có dạng đối xứng cầu mà là đối xứng quanh trục theo hướng của vectơ mômen động lượng của lỗ đen, hơn nữa nó không còn là nghiệm tĩnh mà là nghiệm dừng.^[58] Vì phần lớn ở hệ các thiên thể trong Vũ trụ đều có tính chất quay, nghiệm Kerr được coi là nghiệm gần với thực tại nhất khi nghiên cứu về vùng không thời gian quanh lỗ đen. Không có một định lý tương tự nào như định lý Birkhoff cho lỗ đen quay, mặc dù nó là nghiệm duy nhất, nhưng đối với không thời gian có vật chất bên ngoài thì nó phụ thuộc vào tính chất của nguồn vật chất như sự phân bố khối lượng và mômen động lượng trong trường hợp đối với một ngôi sao tương đối tính.

Chi tiết về cách giải phương trình trường Einstein đối với không thời gian quay để tìm ra nghiệm Kerr có thể xem tại các tài liệu Carmeli (2001); de Felice và Clarke (1990). Ở đây trình bày cách ngắn gọn về cách rút ra mêtric Kerr. Bắt đầu bằng việc khai thác các đối xứng của không thời gian và chọn hệ tọa độ $(t,x^{1},x^{2},\phi )$ với x¹ và x² là các tọa độ tổng quát và nguyên tố đoạn được viết thành

ds^{2}=Pdt^{2}+2Qdtd\phi +\varrho d\phi ^{2}+e^{2\mu }[d(x^{1})^{2}+d(x^{2})^{2}]

(243)

trong đó P, Q $\varrho ,\mu$ là các hàm của hai biến x¹ và x². Phương trình Einstein thu về thành một phương trình gọi là phương trình Ernst^[59] cho bởi

(\xi {\bar {\xi }}-1)\nabla ^{\alpha }(\nabla _{\alpha }\xi )=2{\bar {\xi }}(\nabla _{\alpha }\xi )(\nabla ^{\alpha }\xi )

(244)

với $\xi$ là hàm số phức của x¹ và x² và ${\bar {\xi }}$ là liên hợp phức. Hệ tọa độ phỏng cầu $(t,\chi ,\zeta ,\phi )$ trở lên thuận tiện đối với nghiệm của phương trình Ernst và nó có liên hệ với hệ tọa độ trụ $(t,R,z,\phi )$ như sau

R={\sqrt {(M^{2}-a^{2})(\chi ^{2}-1)(1-\zeta ^{2})}}

(245)

z={\sqrt {M^{2}-a^{2}}}\chi \zeta

(246)

với a là hệ số hằng số. Sử dụng cách hệ tọa độ này và các tính toán đại số, có thể biểu diễn mêtric Kerr thành

ds^{2}=-P^{-1}\left[(M^{2}-a^{2})e^{2\gamma '}\left({\frac {d\chi ^{2}}{\chi ^{2}-1}}+{\frac {d\zeta ^{2}}{1-d\zeta ^{2}}}\right)+R^{2}d\phi ^{2}\right]+P(dt-hd\phi )^{2}

(247)

với

r:={\sqrt {M^{2}-a^{2}}}\chi +M,\quad \theta :=cos^{-1}\zeta

(248)

P:=-\left(1-{\frac {2Mr}{\Sigma ^{2}}}\right),\quad \Sigma ^{2}:=r^{2}+a^{2}cos^{2}\theta

(249)

h:=-{\frac {2Marsin^{2}\theta }{\Sigma ^{2}-2Mr}},\quad \gamma ':=ln\left[(M^{2}-a^{2})^{-1/2}(\Sigma ^{2}-2Mr)^{1/2}\right]

(250)

Ký hiệu J là mômen động lượng liên kết với không thời gian miêu tả bởi phương trình (247), từ đây có thể giải thích trực tiếp tham số a như là mômen động lượng trên một đơn vị khối lượng a:=J/M. Do tham số a trong hệ đơn vị hình học hóa (geometrised unit) có thứ nguyên là độ dài, nó sẽ có ích khi đặt tham số spin không thứ nguyên $a_{*}:=J/M^{2}=a/M$ mà giới hạn bởi $-1\leq a\geq 1$ .

Dạng hệ tọa độ thường gặp để miêu tả mêtric Kerr (mặc dù không phải là thuận tiện nhất) gọi là hệ tọa độ Boyer–Lindquist $(t,r,\theta ,\phi )$ mà các tọa độ cầu r và $\theta$ có liên hệ với các tọa độ phỏng cầu $\chi ,\zeta$ thông qua phương trình (248). Trong hệ tọa độ này, mêtric Kerr có dạng

$ds^{2}=-\left(1-{\frac {2Mr}{\Sigma ^{2}}}\right)dt^{2}-{\frac {4Mar}{\Sigma ^{2}}}sin^{2}\theta dtd\phi +{\frac {\Sigma ^{2}}{\Delta }}dr^{2}+\Sigma ^{2}d\theta ^{2}+{\frac {A}{\Sigma ^{2}}}sin^{2}\theta d\phi ^{2}$

(251)

trong đó

\Delta :=r^{2}-2Mr+a^{2},\quad A:=(r^{2}+a^{2})^{2}-a^{2}\Delta sin^{2}\theta

(252)

và mêtric (251) thu về mêtric Schwarzschild (221) khi a = 0.

Không giống như nghiệm Schwarzschild, ở đó bề mặt có hiệu ứng dịch chuyển đỏ do hấp dẫn lớn vô hạn trùng với bề mặt chân trời sự kiện, nghiệm Kerr có hai bề mặt dịch chuyển đỏ vô hạn nhận được khi g_tt = 0 và giải ra ta có

r_{s,\pm }=M\pm {\sqrt {M^{2}-a^{2}cos^{2}\theta }}

(253)

Mặt khác chân trời sự kiện có thể xác định khi thành phần g_rr phân kỳ hay khi đặt $\Delta =0$ và thu được

r_{eh,\pm }=M\pm {\sqrt {M^{2}-a^{2}}}

(254)

với dấu $\pm$ ký hiệu chân trời sự kiện bên ngoài (+) và bên trong (-). Chú ý rằng trong giới hạn Schwarzschild $r_{eh,-}=0$ và $r_{eh,+}=2M$ như đã thấy trước đó.

Vùng ở giữa $r_{s,+}$ được gọi là mặt cầu sản công (ergosphere), và vùng ở giữa $r_{eh,+}$ gọi là vùng sản công (ergoregion), do không có một quan sát viên tĩnh nào (tức là nhìn thấy một quan sát viên đang đứng yên ở xa vô tận) và toàn bộ không thời gian bị kéo theo sự cùng quay đồng bộ (synchronous corotation) bởi lỗ đen. Đây là hiệu ứng thuần túy tương đối tính, mà được còn gọi là hiệu ứng kéo hệ quy chiếu, không những áp dụng cho vùng sản công (nơi ngay cả photon cũng không tránh khỏi cùng quay) mà còn cho toàn bộ không thời gian, mặc dù hiệu ứng dần yếu đi khi khoảng cách xa dần khỏi lỗ đen. Hệ quả là, một quan sát viên có mômen động lượng bằng không ở xa vô tận (Zero Angular Momentum Observer-ZAMO)^[60] sẽ không chuyển động thẳng xuyên tâm về phía lỗ đen nhưng sẽ bắt đầu quay theo hướng quay của lỗ đen và di chuyển về phía nó. Bốn-vận tốc tương ứng trong tọa độ Boyer–Lindquist sẽ là

u^{\mu }=\left({\frac {A}{\Delta \Sigma ^{2}}}\right)^{1/2}(1,0,0,\omega )

(255)

với

\omega :={\frac {2Mar}{A}}\propto {\frac {a}{r^{3}}}

(256)

là vận tốc góc ZAMO, mà giảm theo khoảng cách tỷ lệ với 1/r³ bên ngoài lỗ đen và bằng 0 đối với lỗ đen không quay Schwarzschild. Sự quan trọng của mặt cầu sản công nằm ở chỗ nó có thể thực hiện quá trình vật lý nhằm thu năng lượng quay lấy từ lỗ đen như chỉ ra lần đầu tiên bởi Penrose^[61]^[62] đối với các hạt thử và sau đó các nhà vật lý đặt ra tình huống tương tự đối với từ trường tạo ra bởi đĩa bồi tụ bao quanh lỗ đen quay.^[63]

Giống như nghiệm Schwarzschild, cả mặt dịch chuyển đỏ vô hạn và mặt chân trời sự kiện biểu diễn kỳ dị vật lý của không thời gian Kerr và việc tính toán độ cong vô hướng tại những mặt này có thể dễ dàng chứng minh điều đó. Cũng đối với nghiệm Kerr, kỳ dị tọa độ tại chân trời sự kiện có thể loại bỏ bằng cách biến đổi hệ tọa độ theo một-dạng (one-form)

dt'=dt+{\frac {2Mr}{\Delta }}dr,\quad d\phi '=d\phi +{\frac {a}{\Delta }}dr

(257)

hoặc cụ thể hơn qua biến đổi tọa độ

t'=t+2M\int {\frac {rdr}{r^{2}-2Mr+a^{2}}},\quad \phi '=\phi +a\int {\frac {dr}{r^{2}-2Mr+a^{2}}}

(258)

Trong hệ tọa độ mới $(t',r,\theta ,\phi ')$ , hay tọa độ Kerr-Schild, nguyên tố đoạn viết thành

ds^{2}=-(1-B^{2})dt'^{2}-2Basin^{2}\theta dt'd\phi '+2Bdt'dr-2a(1+B)sin^{2}\theta drd\phi '+(1+B)dr^{2}+\Sigma ^{2}d\theta ^{2}+{\frac {Asin^{2}\theta }{\Sigma ^{2}}}d\phi '^{2}

(259)

với $B:=2Mr/\Sigma ^{2}$ và thành phần không gian của mêtric không còn chéo hóa nữa. Kỳ dị vật lý của không thời gian Kerr, độc lập với khi mêtric được viết theo dạng (251) hoặc (259) là tại $\Sigma ^{2}=r^{2}+a^{2}cos^{2}\theta =0$ tức là tại r = 0 và $\theta =\pi /2$ . Kết luận không đúng này có thể tránh được nếu sử dụng một hệ tọa độ tốt hơn gần gốc và đặc biệt sau khi thực hiện biến đổi tọa độ về hệ tọa độ Decartes Kerr-Schild định nghĩa bằng

x:={\sqrt {r^{2}+a^{2}}}sin\theta cos\left[\phi '-arctan\left({\frac {a}{r}}\right)\right],

(260)

y:={\sqrt {r^{2}+a^{2}}}sin\theta sin\left[\phi '-arctan\left({\frac {a}{r}}\right)\right],

(261)

z:=rcos\theta ,

(262)

t:=t'

(263)

lúc đó điều kiện $\Sigma ^{2}=0$ trở thành

{\frac {x^{2}+y^{2}}{r^{2}+a^{2}}}+{\frac {z^{2}}{r^{2}}}=1

(264)

Phương trình (264) cho thấy mọi điểm trong mặt phẳng z = 0 (mặt phẳng xích đạo) với $x^{2}+y^{2}\leq a^{2}$ có r = 0, hàm ý rằng kỳ dị vật lý thực sự là một vành trong biểu diễn hệ tọa độ này. Kỳ dị vành này thu về giới hạn kỳ dị Schwarzschild r = 0 trong giới hạn lỗ đen không quay. Dạng hoàn thiện của nguyên tố đoạn trong hệ tọa độ Decartes Kerr-Schild là

$ds^{2}=-dt^{2}+dx^{2}+dy^{2}+dz^{2}+{\frac {2Mr^{3}}{r^{4}+a^{2}z^{2}}}\left[dt+{\frac {r(xdx+ydy)}{a^{2}+r^{2}}}+{\frac {a(ydx-xdy)}{a^{2}+r^{2}}}+{\frac {z}{r}}dz\right]^{2}$

(265)

Giống như đối với không thời gian Schwarzschild, việc nghiên cứu chuyển động trắc địa của hạt thử trong mêtric Kerr đem lại những hiểu biết về đặc tính của không thời gian này. Chuyển động hạt trong trường hợp này trở lên phức tạp hơn, và ngoài hằng số năng lượng và động lượng, một hằng số chuyển động mới xuất hiện đó là hằng số Carter.^[64] Thêm vào đó chỉ có chuyển động trong quỹ đạo thuộc mặt phẳng xích đạo là chuyển động trên mặt phẳng mà các tính chất của chuyển động này tương tự như đối với của không thời gian Schwarzschild.

AAA

Mêtric Friedmann–Lemaître–Robertson–Walker sửa

Vì phương trình trường Einstein miêu tả bất kỳ tương tác hấp dẫn nào, nó không những áp dụng cho các vật thể đặc như sao neutron và lỗ đen như đã nêu ở phần trước, mà còn áp dụng cho toàn thể Vũ trụ. Điểm bắt đầu để dẫn ra phương trình miêu tả động lực của Vũ trụ rõ ràng phải dựa trên các dữ kiện quan sát Vũ trụ. Chúng cung cấp các chứng cứ rằng, ít nhất trên phạm vi đủ lớn, Vũ trụ là đồng nhất và đẳng hướng, hay tuân theo nguyên lý vũ trụ học.^[65] Thêm vào đó, các quan sát chứng tỏ vũ trụ đang giãn nở^[66] và đang thực sự giãn nở gia tốc.^[42]^[43]

Mêtric tổng quát nhất chứa đựng các kết quả quan trắc này, được nghiên cứu bởi Friedman (1922),^[67] Lemaître (1931),^[68] Robertson (1935)^[69] và Walker (1935)^[70] và được gọi là mêtric Friedmann–Lemaître–Robertson–Walker (mêtric FLRW)

d^{2}=-dt^{2}+a^{2}(t)\left[{\frac {dr^{2}}{1-\kappa r^{2}}}+r^{2}(d\theta ^{2}+sin^{2}\theta d\phi ^{2})\right]

(270)

Mêtric này đánh dấu thời điểm bắt đầu của ngành Vũ trụ học hiện đại. Đầu tiên, chúng ta thấy rằng thành phần hiệp biến thời gian-thời gian của mêtric g^tt = -1, do vậy hàm ý rằng tọa độ thời gian t cũng là thời gian riêng đo bởi đồng hồ gắn với thiên hà trong sự giãn nở của không thời gian. Tất cả các thành phần hỗn hợp thời gian-không gian g_ti bằng 0 là điều kiện cần (và đủ) để cho tất cả các đồng hồ đồng chuyển động (comoving clock) có thể đồng bộ hóa được (synchronizable), như yêu cầu bởi tọa độ thời gian toàn cục t. Sự đồng bộ hóa có thể hiện thực bằng cách giả sử mọi quan sát viên đặt thời gian riêng của họ bằng một số khi mật độ nền đồng nhất đạt tới cùng một giá trị cho trước đo được bởi mọi quan sát viên.

Thành phần không gian trong mêtric (270) được biểu diễn thông qua hệ số bảo giác (conformal factor) a(t) mà được dùng để thay đổi tỉ lệ khoảng cách không gian. Kết quả là hệ số này miêu tả sự giãn nở hay co lại của Vũ trụ và còn được gọi là hệ số tỉ lệ (không nên nhầm lẫn với tham số spin của lỗ đen quay miêu tả ở phần trước), và tính động lực của nó được xác định từ phương trình trường Einstein như sẽ được chỉ ra ở dưới. Mặt khác, hằng số $\kappa$ được chuẩn hóa và nhận các giá trị -1, 0, 1 và đo độ cong hằng số của mêtric không gian thuần túy. Thực tế, tại một kỷ nguyên bất kỳ, độ cong phải có cùng một giá trị tại mọi vị trí không gian, tức là không đổi nếu giả thiết tính đẳng hướng được bảo toàn. Giá trị $\kappa =0$ tương ứng với nguyên tố đoạn phẳng và kết quả là một vũ trụ phẳng và mở. Giá trị $\kappa =1$ tương ứng với độ cong không gian dương và miêu tả vũ trụ đóng kín trong một thể tích hữu hạn nhưng không có biên, tương tự như mặt cầu hai chiều. Cuối cùng, giá trị $\kappa =-1$ biểu diễn vũ trụ có độ cong không gian âm và mở.

Chú ý rằng mêtric 270 chỉ cung cấp miêu tả động học của không thời gian tuân theo các giả sử vũ trụ học miêu tả ở trên. Tuy nhiên, khi kết hợp với phương trình trường Einstein và định luật bảo toàn năng lượng $\nabla _{\mu \nu }T^{\mu \nu }=0$ thì hệ số tỷ lệ chưa được biết a(t) và hằng số độ cong $\kappa$ được liên hệ với thành phần năng lượng của vũ trụ và phương trình thu được gọi là các phương trình Friedmann:

${\begin{aligned}H^{2}:=\left({\frac {\dot {a}}{a}}\right)^{2}&={\frac {8}{3}}\pi (e+e_{\Lambda })-{\frac {\kappa }{a^{2}}},\\{\frac {\ddot {a}}{a}}&=-{\frac {4}{3}}\pi (e+3p-2e_{\Lambda }),\\{\dot {e}}+3H(e+p)&=0\\\end{aligned}}$

(271 272 273)

với các dấu chấm chỉ đạo hàm theo thời gian vũ trụ t, và H=H(t) là tham số Hubble có thứ nguyên bằng nghịch đảo của thời gian. Chú ý rằng khi đưa ra các phương trình (271) và (272) chúng ta đã giả sử rằng tenxơ năng lượng-động lượng trong phương trình trường Einstein là của chất lỏng lý tưởng với mật độ tổng năng lượng e và áp suất p. Thêm vào đó, chúng ta đã gán hằng số vũ trụ học $\Lambda$ với mật độ năng lượng hiệu dụng $e_{\Lambda }:=\Lambda /(8\pi )$ .

Sử dụng phương trình (271) ta biểu diễn độ cong của không thời gian là

{\frac {\kappa }{a^{2}}}=H^{2}\left({\frac {e+e_{\Lambda }}{e_{c}}}-1\right)=H^{2}(\Omega _{m}+\Omega _{\Lambda }-1)

(274)

với

e_{c}:={\frac {3H^{2}}{8\pi }},\qquad \Omega _{m}:={\frac {e}{e_{c}}},\qquad \Omega _{\Lambda }:={\frac {e_{\Lambda }}{e_{c}}}

(275)

Ở đây e_c là mật độ năng lượng giới hạn trong khi $\Omega _{m},\Omega _{\Lambda }$ là mật độ năng lượng được chuẩn hóa của 'vật chất' (bao gồm cả đóng góp từ bức xạ) và của hằng số vũ trụ học. Trong thực hành, e_c được dùng để xác định tô pô của không gian là đóng ( $\kappa =1$ ), phẳng ( $\kappa =0$ ), và mở ( $\kappa =-1$ ), nếu như tham số mật độ $\Omega :=\Omega _{m}+\Omega _{\Lambda }$ có giá trị lớn hơn 1, bằng 1, hoặc nhỏ hơn 1. Cũng có thể gán mật độ năng lượng hiệu dụng với độ cong không gian khi định nghĩa $e_{\kappa }:=-3\kappa /(8\pi a^{2})$ và giá trị chuẩn hóa của nó là $\Omega _{\kappa }:=e_{\kappa }/e_{c}=-\kappa /(aH)^{2}$ do vậy phương trình (274) có thể viết thành

1=\Omega _{\Lambda }+\Omega _{m}+\Omega _{\kappa }\simeq 0,68+0,315+0,00

(276)

Phương trình thứ hai trong (276) biểu diễn giá trị ước lượng hiện tại của các mật độ thông qua nhiều phương pháp quan trắc khác nhau, chẳng hạn thông qua bức xạ nền vi sóng vũ trụ^[71]. Theo đó, có khoảng 70% thành phần năng lượng trong Vũ trụ trong dạng mà không thể gán cho bất kỳ vật chất nào và vì lý do này mà nó thường được gọi là năng lượng tối. Cũng chú ý rằng, sự đóng góp của vật chất vào mật độ tới hạn có thể chia thành các đóng góp của vật chất baryon thông thường, $\Omega _{b}$ và đóng góp của vật chất tối $\Omega _{dm}$ loại vật chất mà nguồn gốc của nó hiện tại chưa được biết và sự có mặt của nó không thể suy ra từ việc quan sát trong phổ điện từ mà là từ ảnh hưởng hấp dẫn của nó. Cũng vậy, nhiều quan sát thiên văn cho kết quả tương thích $\Omega _{m}:=\Omega _{b}+\Omega _{dm}\simeq 0,05+0,26\simeq 0,31$ . Phương trình (272) cũng nêu bật rằng nhiều mô hình vũ trụ học khác nhau hoặc các tính chất động lực đơn giản khác nhau trong cùng một mô hình có thể nhận được từ nhiều giá trị khác nhau của hằng số vũ trụ học và nhiều phương trình trạng thái khác nhau đối với chất lỏng choán đầy trong vũ trụ, tức là các mối liên hệ khác nhau giữa năng lượng và áp suất. Các mô hình với hằng số vũ trụ học bằng 0 được gọi là các mô hình Friedmann trong khi các mô hình với hằng số vũ trụ học gọi là các mô hình Lemaitre và mô hình nổi bật trong số đó là mô hình vũ trụ de Sitter và mô hình anti-de Sitter. Đó là các vũ trụ trống rỗng, e = p = 0 nhưng có hằng số vũ trụ tương ứng $\Lambda >0,\Lambda <0$ .

Sóng hấp dẫn sửa

Khi coi hệ phương trình trường Einstein (281) là một tập các phương trình đạo hàm riêng phi tuyến bậc hai sẽ không dễ để nhận ra phương trình có chứa các nghiệm hoạt động như dạng sóng. Quả thực, khái niệm sóng hấp dẫn viết dưới dạng nghiệm của phương trình trường Einstein là phương trình sóng đồng nhất và tuyến tính chỉ đúng dưới một số giả sử nhất định, như không thời gian chân không và tiệm cận phẳng, với chế độ tuyến tính hóa và chuẩn phù hợp (suitable gauge). Nếu loại bỏ những giả sử này, định nghĩa về sóng hấp dẫn trở lên khó hơn nhưng vẫn là có thể được. Tuy nhiên cũng nên chú ý rằng trong trường hợp này sóng hấp dẫn vẫn không phải là trường hợp kỳ lạ. Thực tế, bất kỳ hiện tượng kiểu sóng nào có thể miêu tả dưới dạng phương trình sóng thuần nhất chỉ trong một số giả sử đơn giản hóa, như đòi hỏi một nền đồng đều cho trường lan truyền như một sóng.

Những suy sét này gợi cho việc tìm kiếm nghiệm kiểu sóng đối với phương trình trường Einstein là nên thử trong một không thời gian có độ cong rất nhỏ và nguyên tố đoạn là của không thời gian phẳng nhưng có độ lệch độ cong không thời gian

$g_{\mu \nu }=\eta _{\mu \nu }+h_{\mu \nu }+{\mathcal {O}}((h_{\mu \nu })^{2})$

(277)

nơi chế độ tuyến tính hóa được đảm bảo bằng điều kiện $|h_{\mu \nu }|<\!\!<1$ . Trước khi viết phiên bản tuyến tính hóa của phương trình (218) ta cần phải đưa ra dạng tuyến tính hóa của ký hiệu Christoffel. Trong cơ sở tọa độ Decartes, chúng ta nhớ lại biểu thức tổng quát cho liên thông affine cho bởi phương trình (165) với đạo hàm từng phần được tính trực tiếp bằng

\partial _{\beta }g_{\nu \alpha }=\partial _{\beta }\eta _{\nu \alpha }+\partial _{\beta }h_{\nu \alpha }=\partial _{\beta }h_{\nu \alpha }

(278)

Do vậy ký hiệu Christoffel dưới dạng tuyến tính hóa viết thành

\Gamma ^{\mu }{}_{\alpha \beta }={\frac {1}{2}}\eta ^{\mu \nu }(\partial _{\beta }h_{\nu \alpha }+\partial _{\alpha }h_{\nu \beta }-\partial _{\nu }h_{\alpha \beta }={\frac {1}{2}}(\partial _{\beta }h^{\mu }{}_{\alpha }+\partial _{\alpha }h^{\mu }{}_{\beta }-\partial ^{\mu }h_{\alpha \beta })

(279)

Chú ý rằng thao tác nâng và hạ chỉ số trong biểu thức (279) không thực hiện qua các mêtric $g_{\mu \nu },g^{\mu \nu }$ mà qua các mêtric không thời gian $\eta _{\mu \nu },\eta ^{\mu \nu }$ . Đây chỉ là hệ quả của xấp xỉ tuyến tính và mặc dù thế, không thời gian thực sự là cong.

Một khi ký hiệu Christoffel dạng tuyến tính hóa đã được tính toán, biểu thức cho tenxơ Ricci dạng tuyến tính cũng sẽ tìm được

R_{\mu \nu }=\partial _{\alpha }\Gamma ^{\alpha }{}_{\mu \nu }-\partial _{\nu }\Gamma ^{\alpha }{}_{\mu \alpha }={\frac {1}{2}}(\partial _{\alpha }\partial _{\nu }h_{\mu }{}^{\alpha }+\partial _{\alpha }\partial _{\mu }h_{\nu }{}^{\alpha }-\partial _{\alpha }\partial ^{\alpha }h_{\mu \nu }-\partial _{\mu }\partial _{\nu }h)

(280)

trong đó

h:=h^{\alpha }{}_{\alpha }=\eta ^{\mu \alpha }h_{\mu \alpha }

(281)

là vết của phần nhiễu loạn mêtric. Độ cong vô hướng Ricci khi đó bằng

R=g^{\mu \nu }R_{\mu \nu }\simeq \eta ^{\mu \nu }R_{\mu \nu }

(282)

Sử dụng các kết quả của (281) và (282), phương trình trường Einstein (218) viết lại dưới dạng tuyến tính hóa là

\partial ^{\alpha }\partial _{\nu }h_{\mu \alpha }+\partial ^{\alpha }\partial _{\mu }h_{\nu \alpha }-\partial _{\alpha }\partial ^{\alpha }h_{\mu \nu }-\partial _{\mu }\partial _{\nu }h-\eta _{\mu \nu }(\partial ^{\alpha }\partial ^{\beta }h_{\alpha \beta }-\partial ^{\alpha }\partial _{\alpha }h)=16\pi T_{\mu \nu }

(283)

Mặc dù đã là dạng tuyến tính hóa, phương trình Einstein (283) dường như chưa cho thấy dạng của phương trình sóng. Để làm điều này, chúng ta cần thực hiện thêm một biến đổi nữa, đưa phương trình về dạng gọn hơn, bằng cách sử dụng "tenxơ vết tự do" định nghĩa bằng

{\bar {h}}_{\mu \nu }=h_{\mu \nu }-{\frac {1}{2}}\eta _{\mu \nu }h

(284)

với toán tử gạch ngang mũ trong (284) có thể áp dụng cho bất kỳ tenxơ đối xứng nào, ví dụ ${\bar {R}}_{\mu \nu }=G_{\mu \nu }$ và lặp lại ${\bar {{\bar {h}}_{\mu \nu }}}=h_{\mu \nu }$ .^[72] Sử dụng biến đổi này, phương trình Einstein (283) viết thành dạng gọn hơn

-\partial ^{\alpha }\partial _{\alpha }{\bar {h}}_{\mu \nu }-\eta _{\mu \nu }\partial ^{\alpha }\partial ^{\beta }{\bar {h}}_{\alpha \beta }+\partial ^{\alpha }\partial _{\mu }{\bar {h}}_{\nu \alpha }=16\pi T_{\mu \nu }

(285)

với số hạng thứ nhất trong vế trái của phương trình (285) có thể dễ dạng nhận ra đó là toán tử d'Alembert $\partial ^{\alpha }\partial _{\alpha }{\bar {h}}_{\mu \nu }=\Box {\bar {h}}_{\mu \nu }$ . Đến bước này, có thể khai thác tính tự do chuẩn (gauge freedom) của thuyết tương đối rộng để viết lại phương trình (285) thành dạng thuận tiện hơn. Cụ thể, nhờ chuẩn tự do cho phép chọn phần nhiễu loạn mêtric $h_{\mu \nu }$ bị loại bỏ trong phương trình (285) và thu được phương trình dạng sóng. Nổi bật nhất là, phần nhiễu loạn của mêtric có thể được chọn sao cho

\partial _{\alpha }{\bar {h}}^{\mu \alpha }=0

(286)

Nhờ biến đổi chuẩn (286), còn gọi là chuẩn Lorenz (hay chuẩn Hilbert),^[73] phương trình trường tuyến tính hóa thu được

$\Box {\bar {h}}_{\mu \nu }=-16\pi T_{\mu \nu }$

(287)

và áp dụng đối với chân không

$\Box {\bar {h}}_{\mu \nu }=0$

(288)

Phương trình (288) chỉ ra rằng, trong chuẩn Lorenz, phần mêtric nhiễu loạn lan truyền như dạng sóng làm biến dạng không thời gian phẳng.

Nghiệm đơn giản nhất của phương trình Einstein tuyến tính hóa (288) đó là nghiệm sóng phẳng có phương trình

{\bar {h}}_{\mu \nu }=A_{\mu \nu }exp(i\kappa _{\alpha }x^{\alpha })

(289)

và tất nhiên chúng ta chỉ quan tâm tới phần thực của (289) với A là tenxơ biên độ sóng, $\kappa$ là bốn-vectơ trống tức là nó thỏa $\kappa ^{\alpha }\kappa _{\alpha }=0$ . Trong những nghiệm như thế, sóng phẳng (289) lan truyền trong hướng không gian ${\overrightarrow {k}}=(\kappa _{x},\kappa _{y},\kappa _{z})/\kappa _{0}$ với tần số $\omega =\kappa ^{0}=(\kappa _{j}\kappa ^{j})^{1/2}$ . Chú ý rằng tenxơ biên độ A về nguyên lý có 16 - 6 = 10 thành phần độc lập, nhưng dễ dàng nhận thấy chỉ có hai thành phần độc lập tương ứng với bậc tự do động lực của thuyết tương đối tổng quát. Sự giảm số lượng thành phần độc lập có thể giải thích một cách đơn giản. Đầu tiên, A và ${\boldsymbol {\kappa }}$ không thể tùy ý nếu chúng được dùng để miêu tả một sóng phẳng, kết quả là điều kiện trực giao giữa hai đại lượng sẽ giới hạn 4 trong 10 thành phần của A (xem điều kiện (a) ở bên dưới). Thứ hai, đó là chuẩn Lorenz toàn cục đã được chọn (phương trình (286)) điều này không hoàn toàn cố định hệ tọa độ của lý thuyết tuyến tính. Phần chưa rõ còn lại, thực chất được bảo tồn thông qua sự thay đổi chuẩn tùy ý (arbitrary gauge change), thông qua phép biến đổi tọa độ vô cùng bé mà không bị giới hạn hoàn toàn ngay cả khi một chuẩn toàn cục đã được chọn. Để đánh giá đúng hơn điều này, xét một biến đổi tọa độ vô cùng bé bởi một bốn-vectơ dịch chuyển vô cùng bé ${\boldsymbol {\xi }}$

x^{\alpha '}=x^{\alpha }+\xi ^{\alpha }

(290)

Áp dụng biến đổi này đối với mêtric (277) tạo ra một tenxơ mêtric mới, mà đối với bậc thấp nhất có dạng

g_{\mu '\nu '}^{new}=\eta _{\mu \nu }+h_{\mu \nu }^{old}-\partial _{\mu }\xi _{\nu }-\partial _{\nu }\xi _{\mu }

(291)

do vậy nhiễu loạn "mới" và "cũ" được liên hệ bởi biểu thức sau

h_{\mu '\nu '}^{new}=h_{\mu \nu }^{old}-\partial _{\mu }\xi _{\nu }-\partial _{\nu }\xi _{\mu }

(292)

hay cách khác

{\bar {h}}_{\mu '\nu '}^{new}=h_{\mu \nu }^{old}-\partial _{\mu }\xi _{\nu }-\partial _{\nu }\xi _{\mu }+\eta _{\mu \nu }\partial _{\alpha }\xi ^{\alpha }

(293)

Để hệ tọa độ mới thỏa mãn điều kiện chuẩn Lorenz (277) $\partial ^{\alpha }{\bar {h}}_{\mu \alpha }^{new}=0$ , đòi hỏi bốn vectơ dịch chuyển là nghiệm của phương trình sóng thuần nhất

\partial ^{\beta }\partial _{\beta }\xi ^{\alpha }=0

(294)

Kết quả là vectơ sóng phẳng với thành phần

\xi ^{\alpha }=-iC^{\alpha }exp(i\kappa _{\beta }x^{\beta })

(295)

thông qua bốn-hằng số bất kỳ $C^{\alpha }$ , sinh ra biến đổi chuẩn làm thay đổi bốn thành phần tùy ý của A cùng với điều kiện ${\boldsymbol {A.\kappa }}=0$ . Do vậy, $A_{\mu \nu }$ chỉ còn 10 - 4 - 4 = 2 thành phần độc lập tuyến tính, tương ứng với số bậc tự do trong thuyết tương đối rộng.^[44] Chú ý rằng những xem xét này không phải là duy nhất đối với thuyết tương đối rộng và những lập luận tương tự cũng có thể thực hiện đối với điện động lực học cổ điển, nơi phương trình Maxwell là bất biến dưới phép biến đổi thế vectơ (vector potential) kiểu $A_{\mu }\rightarrow A_{\mu '}=A_{\mu }+\partial _{\mu }\Psi$ với $\Psi$ là một hàm vô hướng bất kỳ, do vậy tenxơ điện từ tương ứng sẽ là $F_{\mu '\nu '}^{new}=\partial _{\nu '}A_{\mu '}-\partial _{\mu '}A_{\nu '}=F_{\mu '\nu '}^{old}$ . Tương tự, trong lý thuyết tuyến tính hóa thuyết tương đối rộng, biến đổi chuẩn trong (292) sẽ bảo tồn các thành phần của tenxơ Riemann $R_{\alpha \beta \mu \nu }^{new}=R_{\alpha \beta \mu \nu }^{old}+{\mathcal {O}}(R^{2})$ .

Tổng kết lại, cách thuận tiện để giới hạn các thành phần của tenxơ biên độ thông qua các điều kiện sau:

(a): Điều kiện trực giao: Bốn thành phần của tenxơ biên độ được xác định cụ thể nếu A và

\kappa

được chọn để trực giao,

A_{\mu \nu }\kappa ^{\nu }=0

(b): Hệ tọa độ Lonrentz toàn cục: Giống như trong thuyết tương đối hẹp, có thể xác định một hệ tọa độ Lorentz toàn cục tương đối đối với một quan sát viên có bốn-vận tốc u. Trong trường hợp này, ba thành phần^[74] của tenxơ biên độ có thể xác định sau khi chọn một bốn-vận tốc u trực giao với A,

A_{\mu \nu }u^{\nu }=0

.

(c): Biến đổi chuẩn vô cùng bé: Thành phần cuối cùng của tenxơ biên độ có thể triệt tiêu sau khi chọn vectơ dịch chuyển vô cùng bé

\xi ^{\mu }=-iC^{\mu }exp(i\kappa _{\beta }x^{\beta })

sao cho

A^{\mu }{}_{\mu }=0

.

Chú thích sửa

^ Franken 2011, Ch 2
^ Chúng ta sẽ trở lại điểm này khi thảo luận ở phần Không thời gian cong: Thuyết tương đối rộng.
^ Chú ý, chúng ta ký hiệu hệ tọa độ $\{x^{\mu }\}$ giữa những dấu ngoặc nhọn để nhấn mạnh rằng thực sự chúng ta đang xét tới bốn số khác nhau tại mỗi điểm của đa tạp
^ Về mặt nguyên lý, hệ tọa độ mới có thể viết là $\{(x')^{\mu }\}$ nhưng cách viết này hơi rườm rà. Tương tự cách viết $\{x^{'\mu }\}$ và $\{x^{\mu '}\}$ có thể gây ra hiểu nhầm về ý nghĩa của dấu phẩy mà thường được sử dụng để ký hiệu một hệ tọa độ khác với chỉ số $\mu$ . Ở đây chúng ta chấp nhận cách ký hiệu thuận tiện $\{x^{\mu '}\}$
^ Nhiều tác giả chỉ đơn giản gọi nó là vectơ.
^ Về mặt nguyên lý, chúng ta nên coi (27) được xác định tại P trên đường cong (như chỉ ra trong (15) rồi sau đó mở rộng ra cho một điểm chung (generic point). Trong thực hành, chúng ta đã bỏ qua bước trung gian và viết theo biểu thức tổng quát.
^ Trong phần Ý nghĩa hình học của vectơ phản biến và vectơ hiệp biến, chúng ta sẽ thấy rằng các thành phần của vectơ hiệp biến biến đổi giống như vectơ cơ sở tọa độ, trong khi các thành phần của vectơ phản biến biến đổi theo cách ngược lại.
^ J.A. Wheeler, C. Misner, K.S. Thorne (1973). Gravitation. W.H. Freeman & Co. ISBN 0-7167-0344-0.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
^ Chúng ta viết $\{e_{\mu }\}$ cho cơ sở vectơ giữa các dấu ngoặc nhọn để nhấn mạnh rằng chúng ta đang thực sự coi đây là bốn vectơ. Từ đây, chỉ số dưới trong (37) không ám chỉ các thành phần khác của một vectơ cơ sở, nhưng nó phân biệt bốn vec tơ khác nhau tạo nên cơ sở.
^ Chúng ta ký hiệu chữ viết đậm với dấu ngã ở trên ${\boldsymbol {\tilde {p}}}$ để biểu diễn đối vectơ (covector) hay dạng một (one form) như là một toán tử, và viết chữ thường với chỉ số bên dưới, ví dụ $p_{\mu }$ để chỉ thành phần của nó.
^ Một số nhà toán học sử dụng ký hiệu tenxơ này là ${2 \choose 0}$
^ Một số nhà toán học sử dụng ký hiệu tenxơ này là ${0 \choose 2}$ Hơn nữa nếu tenxơ là phản xứng (ví dụ xem phương trình (56) về định nghĩa) thì nó là dạng hai (two form)
^ Một số người ký hiệu ten xơ này là ${4 \choose 2}$
^ Tenxơ cũng là dạng hai nếu nó phản xứng, hay nó tuân theo phương trình (56)
^ Trong phần tiếp theo, chúng ta sẽ nhận thấy ten xơ này thực sự là tenxơ metric và cần thiết $\epsilon$ biến đổi như là tenxơ
^ Một số tác giả sử dụng định nghĩa khác, ví dụ trong Misner1973, định nghĩa $\epsilon ^{\alpha \beta \gamma \delta }:=-\eta ^{\alpha \beta \gamma \delta }/{\sqrt {-g}}$
^ Chú ý rằng bởi vì $\eta _{\alpha \beta \gamma \delta }$ không phải là ten xơ, chỉ số dưới của nó không có nghĩa là chỉ số hiệp biến mà chỉ là một dãy các số, vì lý do này $\eta _{\alpha \beta \gamma \delta }=\eta ^{\alpha \beta \gamma \delta }=[\alpha \beta \gamma \delta ].$
^ Có thể chứng minh được rằng, khi thu gọn hai ten xơ hạng bất kỳ mà có hai chỉ số là đối xứng ở một ten xơ và phản xứng ở ten xơ kia thì kết quả thu được bằng 0, nghĩa là $T^{\alpha \beta [\gamma \delta ]...\epsilon }R_{\mu \nu (\gamma \delta )...\rho }=0$
^ Nói một cách tương đương, hệ quy chiếu quán tính được định nghĩa là hệ quy chiếu mà nguyên lý quán tính Galilei được thỏa mãn, tức là một vật nằm trong nó không chịu tác động của lực nào hoặc các lực tác dụng vào nó là cân bằng thì vật đó sẽ giữ nguyên chuyển động đều hoặc đứng im.
^ Quy ước khi đặt c = 1 không thực sự thuận tiện trong phần này bởi vì nó giấu đi bản chất rằng tọa độ thời gian t thực sự phải được viết bằng ct và vận tốc V bất kỳ phải được hiểu là V / c. Người đọc nên lưu ý điều này.
^ Một định luật vật lý bất biến qua phép biến đổi có nghĩa là nó có cùng dạng phương trình toán học và nếu các hằng số vật lý xuất hiện trong phương trình không thay đổi giá trị theo thời gian.
^ Xem Preti 2009 về bối cảnh lịch sử.
^ Landau & Lifshitz 1975, tr. 9 và Schutz 2009, ph. 1.9
^ Trường hợp tường minh có sự xuất hiện của c, là $u^{\mu }=(\gamma ,\gamma v^{i}/c)\quad u_{\mu }=(-\gamma ,\gamma v^{i}/c)$ . Cũng chú ý rằng mọi vận tốc ở đây là vận tốc 'tương đối', so với một quan viên đứng yên có vận tốc - bốn $U^{\mu }=\delta _{0}^{\mu }$
^ Khối lượng nghỉ được định nghĩa là khối lượng của hạt trong hệ quy chiếu chuyển động cùng với nó. Định nghĩa này giúp phân biệt với khối lượng tổng thể, mà còn bao gồm đóng góp từ trường hấp dẫn.
^ Khi tốc độ ánh sáng không được đặt bằng 1, các biểu thức (118) - (124) viết thành $p^{\mu }p_{\mu }=-m^{2}c^{2},E=m\gamma c^{2},E^{2}=m^{2}c^{4}+p^{2}c^{2},E=mc^{2}+mv^{2}+{\mathcal {O}}(v^{4}/c^{4}),E_{0}=mc^{2},p=E/c$
^ Có tồn tại một số dạng phát biểu của nguyên lý tương đương và vấn đề xác thực nguyên lý này bằng thực nghiệm thông qua những thí nghiệm phức tạp vẫn đang là một chủ đề nghiên cứu tích cực.
^ Chú ý rằng, như đã nêu, nguyên lý tương đương đúng khi và chỉ chỉ khi hệ quy chiếu rơi tự do với gia tốc không đổi, tức là nó rơi trong một trường hấp dẫn đều. Rõ ràng là những trường hấp dẫn như thế chỉ là sự lý tưởng hóa và thực tế không tồn tại các trường hấp dẫn đều. Đối với trường hấp dẫn không đều, nói một cách sơ lược, nguyên lý tương đương không áp dụng được trong tình huống này, do sự có mặt của hiệu ứng thủy triều cho phép nhà vật lý có thể phân biệt được hiệu ứng hấp dẫn bằng quá trình rơi tự do của hai vật.
^ Chúng ta nhớ lại rằng, khi chúng ta đưa ra khái niệm đa tạp trong phần 2 [Đa tạp không thời gian], chúng ta nhấn mạnh rằng tính cục bộ, tức là trong một lân cận đủ nhỏ của một điểm, đa tạp được coi giống như không gian Euclide và có thể được xấp xỉ bằng một không gian phẳng tiếp tuyến tại điểm đó.
^ Định lý phổ (spectral theorem) nổi tiếng trong lý thuyết ma trận nói rằng luôn tồn tại một phép biến đổi ma trận biến một ma trận đối xứng bất kỳ thành một ma trận đường chéo với các phần tử trên đường chéo là một trong các số -1, 0, +1, hay tenxơ mêtric không thời gian cong có thể đưa về dạng mêtric (103) không thời gian phẳng tại một điểm. Xem Schutz 2009, tr 145 chương 6
^ Kể từ đây, chúng ta sẽ viết đạo hàm riêng theo cách rút gọn là $\partial _{\mu }:=\partial /\partial x^{\mu }$ .
^ Xem De Felice & Clarke 1990, tr 65
^ Xem De Felice & Clarke 1990, tr 66
^ Xem De Felice & Clarke 1990, Chương 4, Spacetime and Tetrad formalism, tr 129
^ Schutz 2009, tr 170
^ Một số sách sử dụng kiểu ký hiệu khác cho đạo hàm hiệp biến, trong đó ký hiệu nabla được thành bằng dấu chấm phẩy, trong khi đạo hàm riêng thường được ký hiệu bằng dấu phẩy, ví dụ $U^{\mu }{}_{;\nu }=U^{\mu }{}_{,\nu }+\Gamma _{\nu \lambda }^{\mu }U^{\lambda }$ . Xem Misner, Thorne & Wheeler 1973
^ Xem De Felice & Clarke 1990, Chương 3, The Cuvarture, tr 126
^ Xem Landau & Lifshitz 1975, Chương 10, tr 263

^ Phương trình (188) và (189) có thể mở rộng cho không thời gian có tenxơ xoắn khác 0,

{\mathcal {T}}

và chúng có dạng

\nabla _{[\mu }\nabla _{\nu ]}A_{\alpha }={\frac {1}{2}}R_{\alpha \nu \mu }^{\beta }A_{\beta }+{\frac {1}{2}}{\mathcal {T}}_{\mu \nu }^{\beta }\nabla _{\beta }A_{\alpha },\quad \nabla _{[\mu }\nabla _{\nu ]}A^{\alpha }={\frac {1}{2}}R_{\beta \nu \mu }^{\alpha }A^{\beta }+{\frac {1}{2}}{\mathcal {T}}_{\mu \nu }^{\beta }\nabla _{\beta }A^{\alpha }

(190)

^ Nếu ten xơ Riemann là một thành phần động lực, tức là nó phụ thuộc vào thời gian, thì phương trình độ lệch trắc địa (198) có thể được sử dụng để xác định các hiệu ứng của bức xạ hấp dẫn tác dụng lên nhóm các hạt thử trong trạng thái rơi tự do. Xem Misner, Thorne & Wheeler 1973, Part III Gravitation Waves
^ Xem Landau & Lifshitz 1975, Chương 11, phương trình 96
^ ^a ^b Riess, Adam G.year=1998. “Observational evidence from supernovae for an accelerating universe and a cosmological constant”. Astronomical J. 116 (3): 1009–38. arXiv:astro-ph/9805201. Bibcode:1998AJ....116.1009R. doi:10.1086/300499.
^ ^a ^b Perlmutter, S.journal=Astrophysical Journal (1999). “Measurements of Omega and Lambda from 42 high redshift supernovae”. 517 (2): 565–86. arXiv:astro-ph/9812133. Bibcode:1999ApJ...517..565P. doi:10.1086/307221. Chú thích journal cần |journal= (trợ giúp)
^ ^a ^b Misner, Thorne & Wheeler 1973
^ Xem De Felice & Clarke 1990
^ Mặc dù hầu hết các nhà vật lý đều thống nhất rằng lý thuyết lượng tử về hấp dẫn có thể cung cấp sự miêu tả về nguồn gốc của hằng số vũ trụ, bây giờ nó có thể được coi là đóng góp thêm vào tenxơ ứng suất-năng lượng theo dạng $T_{\mu \nu }(\Lambda )=-(\Lambda /8\pi )g_{\mu \nu }$
^ *Einstein, A.; Infeld, L.; Hoffmann, B. (1938). “The Gravitational Equations and the Problem of Motion”. Annals of Mathematics. Second series. 39 (1): 65–100. Bibcode:1938AnMat..39...65E. doi:10.2307/1968714. JSTOR 1968714.
^ Schwarzschild, K. (1916). “Über das Gravitationsfeld eines Massenpunktes nach der Einsteinschen Theorie”. Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften. 7: 189–196. arXiv:physics/9905030. Bibcode:1916AbhKP1916..189S.
^ Chúng ta gọi nghiệm tĩnh của phương trình trường Einstein đó là nghiệm mà các thành phần của mêtric không phụ thuộc vào thời gian hay bị ảnh hưởng bởi sự đảo ngược thời gian, tức là thông qua biến đổi $t\rightarrow -t$ .
^ Xem De Felice & Clarke 1990, Schutz 2009, Misner, Thorne & Wheeler 1973, d'Inverno 1992
^ Quả vậy, nếu quỹ đạo không nằm trên mặt phẳng nó sẽ tiến động theo một hướng, và không tuân theo giả sử về đối xứng cầu.
^ Phương trình (233) có thể dễ dàng suy ra nếu để ý 2L = -m² rồi sử dụng các phương trình (232) và (235)
^ Chú ý rằng hằng số một trong thế không làm nhiễu loạn nghiệm, không ảnh hưởng đến phương trình chuyển động.
^ Xem thêm Những định luật của Kepler về chuyển động thiên thể.
^ Chú ý rằng những quỹ đạo này không kín bởi vì sự tiến động của cận điểm quỹ đạo trong trường hấp dẫn (Misner, Thorne & Wheeler 1973) do đó chúng là những quỹ đạo ellip nhưng không kín.
^ Kerr, R. P. (1963). “Gravitational field of a spinning mass as an example of algebraically special metrics”. Phys. Rev. Lett. 11 (5): 237. Bibcode:1963PhRvL..11..237K. doi:10.1103/PhysRevLett.11.237.
^ Robinson D. C. (1975). “Uniqueness of the Kerr Black Hole”. Phys. Rev. Lett. 34 (14): 905. doi:10.1103/PhysRevLett.34.905.
^ Các thành phần của mêtric vẫn độc lập với thời gian nhưng nghiệm bị ảnh hưởng bởi sự đảo ngược thời gian, tức là qua phép biến đổi $t\rightarrow -t$ .
^ Frederick J. Ernst (1968). “New Formulation of the Axially Symmetric Gravitational Field Problem. II”. Phys. Rev. Lett. 168 (5): 1415. doi:10.1103/PhysRev.168.1415.
^ Bardeen, J.M.; Press, W.H.; Teukolsky, S.A. (1972). “Rotating Black Holes: Locally Nonrotating Frames, Energy Extraction, and Scalar Synchrotron Radiation”. Astrophysical Journal. 178: 347–370. Bibcode:1972ApJ...178..347B. doi:10.1086/151796.
^ R. Penrose, Gravitational Collapse: The Role of General Relativity, Rivista del Nuovo Cimento, Numero Speziale I, 252 (1969)
^ R. Penrose and R. M. Floyd, "Extraction of Rotational Energy from a Black Hole," Nature Physical Science 229, 177 (1971).
^ R. D. Blandford and R. L. Znajek (1977). “Electromagnetic extraction of energy from Kerr black holes”. MNRAS. 179 (3): 433–456. doi:10.1093/mnras/179.3.433.Quản lý CS1: sử dụng tham số tác giả (liên kết)
^ B. Carter (1968). “Global structure of the Kerr family of gravitational fields”. Physical Review. 174 (5): 1559–1571. doi:10.1103/PhysRev.174.1559.
^ Nguyên lý vũ trụ học (căn cứ trên các dữ liệu quan trắc nhưng vẫn là những giả sử cơ bản), nói rằng khi quan sát trên phạm vi đủ lớn, tính chất của Vũ trụ là như nhau đối với mọi quan sát viên. Nhìn theo cách khác, nguyên lý vũ trụ học là sự mở rộng của Nguyên lý Copernicus về con người không ở một vị trí đặc biệt nào trong Vũ trụ.
^ Hubble, Edwin (1929). “A relation between distance and radial velocity among extra-galactic nebulae” (PDF). Proceedings of the National Academy of Sciences. 15 (3): 168–173. Bibcode:1929PNAS...15..168H. doi:10.1073/pnas.15.3.168. PMC 522427. PMID 16577160.
^ Friedmann, Alexander (1922), “Über die Krümmung des Raumes”, Zeitschrift für Physik A, 10 (1): 377–386, Bibcode:1922ZPhy...10..377F, doi:10.1007/BF01332580
^ Lemaître, Georges (1931), “Expansion of the universe, A homogeneous universe of constant mass and increasing radius accounting for the radial velocity of extra-galactic nebulæ”, Monthly Notices of the Royal Astronomical Society, 91: 483–490, Bibcode:1931MNRAS..91..483L, doi:10.1093/mnras/91.5.483
^ Robertson, H. P. (1935), “Kinematics and world structure”, Astrophysical Journal, 82: 284–301, Bibcode:1935ApJ....82..284R, doi:10.1086/143681
^ Walker, A. G. (1935), “On the formal comparison of Milne's kinematical system with the systems of general relativity”, Monthly Notices of the Royal Astronomical Society, 95: 263–269, Bibcode:1935MNRAS..95..263W
^ Planck collaboration. “Planck 2013 results. XVI. Cosmological parameters”. Astronomy & Astrophysics. 571. arXiv:1303.5076. doi:10.1051/0004-6361/201321591.Quản lý CS1: sử dụng tham số tác giả (liên kết)
^ Toán tử gạch ngang mũ cũng có thể áp dụng cho vết và ${\bar {h}}=-h$ .
^ Chuẩn Lorenz do Ludvig V. Lorenz nêu ra, không nên nhầm lẫn với chuẩn Lorentz theo tên của Hendrik Lorentz.
^ Chú ý rằng điều kiện trực giao cố định ba chứ không phải bốn thành phần do cần phải có thêm điều kiện $\kappa ^{\mu }A_{\mu \nu }u^{\nu }=0$ .

Sách tham khảo sửa

Einstein, A. (1961). Relativity: The Special and General Theory (PDF). New York: Crown. ISBN 0-517-02961-8.
d'Inverno, Ray (1992). Introducing Einstein's Relativity. Oxford: Nhà xuất bản Đại học Oxford. ISBN 0-19-859686-3.
Schutz, Bernard F. (2009). A First Course in General Relativity (2nd Ed) (PDF). Cambridge: Nhà xuất bản Đại học Cambridge. ISBN 0-521-88705-4. Bản gốc (PDF) lưu trữ ngày 25 tháng 8 năm 2016. Truy cập ngày 10 tháng 10 năm 2016.
Hartle, James B. (2003). Gravity: an Introduction to Einstein's General Relativity (PDF). San Francisco: Addison–Wesley. ISBN 0-8053-8662-9. Bản gốc (PDF) lưu trữ ngày 11 tháng 10 năm 2016. Truy cập ngày 10 tháng 10 năm 2016.
De Felice, F.; Clarke, C. J. (1992). Relativity on Curved Manifolds. Cambridge: Nhà xuất bản Đại học Cambridge. ISBN 0-521-42908-0.
Franken, Theodore (2011). The Geometry of Physics: An Introduction (3rd Ed) (PDF). Cambridge: Nhà xuất bản Đại học Cambridge. ISBN 1107602602. Bản gốc (PDF) lưu trữ ngày 11 tháng 10 năm 2016. Truy cập ngày 10 tháng 10 năm 2016.
Misner, Charles; Thorne, Kip S. & Wheeler, John Archibald (1973). Gravitation. San Francisco: W. H. Freeman. ISBN 0-7167-0344-0.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
Landau, L. D. and Lifshitz, E. M. (1975). Classical Theory of Fields (Fourth Revised English Edition). Oxford: Pergamon. ISBN 0-08-018176-7.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
Weinberg, Steven (1972). Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity. New York: John Wiley & Sons. ISBN 0-471-92567-5.
Wald, Robert M. (1984). General Relativity. Chicago: Nhà xuất bản Đại học Chicago. ISBN 0-226-87033-2.

[1] Franken 2011, Ch 2

[2] Chúng ta sẽ trở lại điểm này khi thảo luận ở phần Không thời gian cong: Thuyết tương đối rộng.

[3] Chú ý, chúng ta ký hiệu hệ tọa độ $\{x^{\mu }\}$ giữa những dấu ngoặc nhọn để nhấn mạnh rằng thực sự chúng ta đang xét tới bốn số khác nhau tại mỗi điểm của đa tạp

[4] Về mặt nguyên lý, hệ tọa độ mới có thể viết là $\{(x')^{\mu }\}$ nhưng cách viết này hơi rườm rà. Tương tự cách viết $\{x^{'\mu }\}$ và $\{x^{\mu '}\}$ có thể gây ra hiểu nhầm về ý nghĩa của dấu phẩy mà thường được sử dụng để ký hiệu một hệ tọa độ khác với chỉ số $\mu$ . Ở đây chúng ta chấp nhận cách ký hiệu thuận tiện $\{x^{\mu '}\}$

[5] Nhiều tác giả chỉ đơn giản gọi nó là vectơ.

[6] Về mặt nguyên lý, chúng ta nên coi (27) được xác định tại P trên đường cong (như chỉ ra trong (15) rồi sau đó mở rộng ra cho một điểm chung (generic point). Trong thực hành, chúng ta đã bỏ qua bước trung gian và viết theo biểu thức tổng quát.

[7] Trong phần Ý nghĩa hình học của vectơ phản biến và vectơ hiệp biến, chúng ta sẽ thấy rằng các thành phần của vectơ hiệp biến biến đổi giống như vectơ cơ sở tọa độ, trong khi các thành phần của vectơ phản biến biến đổi theo cách ngược lại.

[8] J.A. Wheeler, C. Misner, K.S. Thorne (1973). Gravitation. W.H. Freeman & Co. ISBN 0-7167-0344-0.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)

[9] Chúng ta viết $\{e_{\mu }\}$ cho cơ sở vectơ giữa các dấu ngoặc nhọn để nhấn mạnh rằng chúng ta đang thực sự coi đây là bốn vectơ. Từ đây, chỉ số dưới trong (37) không ám chỉ các thành phần khác của một vectơ cơ sở, nhưng nó phân biệt bốn vec tơ khác nhau tạo nên cơ sở.

[10] Chúng ta ký hiệu chữ viết đậm với dấu ngã ở trên ${\boldsymbol {\tilde {p}}}$ để biểu diễn đối vectơ (covector) hay dạng một (one form) như là một toán tử, và viết chữ thường với chỉ số bên dưới, ví dụ $p_{\mu }$ để chỉ thành phần của nó.

[11] Một số nhà toán học sử dụng ký hiệu tenxơ này là ${2 \choose 0}$

[12] Một số nhà toán học sử dụng ký hiệu tenxơ này là ${0 \choose 2}$ Hơn nữa nếu tenxơ là phản xứng (ví dụ xem phương trình (56) về định nghĩa) thì nó là dạng hai (two form)

[13] Một số người ký hiệu ten xơ này là ${4 \choose 2}$

[14] Tenxơ cũng là dạng hai nếu nó phản xứng, hay nó tuân theo phương trình (56)

[15] Trong phần tiếp theo, chúng ta sẽ nhận thấy ten xơ này thực sự là tenxơ metric và cần thiết $\epsilon$ biến đổi như là tenxơ

[16] Một số tác giả sử dụng định nghĩa khác, ví dụ trong Misner1973, định nghĩa $\epsilon ^{\alpha \beta \gamma \delta }:=-\eta ^{\alpha \beta \gamma \delta }/{\sqrt {-g}}$

[17] Chú ý rằng bởi vì $\eta _{\alpha \beta \gamma \delta }$ không phải là ten xơ, chỉ số dưới của nó không có nghĩa là chỉ số hiệp biến mà chỉ là một dãy các số, vì lý do này $\eta _{\alpha \beta \gamma \delta }=\eta ^{\alpha \beta \gamma \delta }=[\alpha \beta \gamma \delta ].$

[18] Có thể chứng minh được rằng, khi thu gọn hai ten xơ hạng bất kỳ mà có hai chỉ số là đối xứng ở một ten xơ và phản xứng ở ten xơ kia thì kết quả thu được bằng 0, nghĩa là $T^{\alpha \beta [\gamma \delta ]...\epsilon }R_{\mu \nu (\gamma \delta )...\rho }=0$

[19] Nói một cách tương đương, hệ quy chiếu quán tính được định nghĩa là hệ quy chiếu mà nguyên lý quán tính Galilei được thỏa mãn, tức là một vật nằm trong nó không chịu tác động của lực nào hoặc các lực tác dụng vào nó là cân bằng thì vật đó sẽ giữ nguyên chuyển động đều hoặc đứng im.

[20] Quy ước khi đặt c = 1 không thực sự thuận tiện trong phần này bởi vì nó giấu đi bản chất rằng tọa độ thời gian t thực sự phải được viết bằng ct và vận tốc V bất kỳ phải được hiểu là V / c. Người đọc nên lưu ý điều này.

[21] Một định luật vật lý bất biến qua phép biến đổi có nghĩa là nó có cùng dạng phương trình toán học và nếu các hằng số vật lý xuất hiện trong phương trình không thay đổi giá trị theo thời gian.

[22] Xem Preti 2009 về bối cảnh lịch sử.

[23] Landau & Lifshitz 1975, tr. 9 và Schutz 2009, ph. 1.9

[24] Trường hợp tường minh có sự xuất hiện của c, là $u^{\mu }=(\gamma ,\gamma v^{i}/c)\quad u_{\mu }=(-\gamma ,\gamma v^{i}/c)$ . Cũng chú ý rằng mọi vận tốc ở đây là vận tốc 'tương đối', so với một quan viên đứng yên có vận tốc - bốn $U^{\mu }=\delta _{0}^{\mu }$

[25] Khối lượng nghỉ được định nghĩa là khối lượng của hạt trong hệ quy chiếu chuyển động cùng với nó. Định nghĩa này giúp phân biệt với khối lượng tổng thể, mà còn bao gồm đóng góp từ trường hấp dẫn.

[26] Khi tốc độ ánh sáng không được đặt bằng 1, các biểu thức (118) - (124) viết thành $p^{\mu }p_{\mu }=-m^{2}c^{2},E=m\gamma c^{2},E^{2}=m^{2}c^{4}+p^{2}c^{2},E=mc^{2}+mv^{2}+{\mathcal {O}}(v^{4}/c^{4}),E_{0}=mc^{2},p=E/c$

[27] Có tồn tại một số dạng phát biểu của nguyên lý tương đương và vấn đề xác thực nguyên lý này bằng thực nghiệm thông qua những thí nghiệm phức tạp vẫn đang là một chủ đề nghiên cứu tích cực.

[28] Chú ý rằng, như đã nêu, nguyên lý tương đương đúng khi và chỉ chỉ khi hệ quy chiếu rơi tự do với gia tốc không đổi, tức là nó rơi trong một trường hấp dẫn đều. Rõ ràng là những trường hấp dẫn như thế chỉ là sự lý tưởng hóa và thực tế không tồn tại các trường hấp dẫn đều. Đối với trường hấp dẫn không đều, nói một cách sơ lược, nguyên lý tương đương không áp dụng được trong tình huống này, do sự có mặt của hiệu ứng thủy triều cho phép nhà vật lý có thể phân biệt được hiệu ứng hấp dẫn bằng quá trình rơi tự do của hai vật.

[29] Chúng ta nhớ lại rằng, khi chúng ta đưa ra khái niệm đa tạp trong phần 2 [Đa tạp không thời gian], chúng ta nhấn mạnh rằng tính cục bộ, tức là trong một lân cận đủ nhỏ của một điểm, đa tạp được coi giống như không gian Euclide và có thể được xấp xỉ bằng một không gian phẳng tiếp tuyến tại điểm đó.

[30] Định lý phổ (spectral theorem) nổi tiếng trong lý thuyết ma trận nói rằng luôn tồn tại một phép biến đổi ma trận biến một ma trận đối xứng bất kỳ thành một ma trận đường chéo với các phần tử trên đường chéo là một trong các số -1, 0, +1, hay tenxơ mêtric không thời gian cong có thể đưa về dạng mêtric (103) không thời gian phẳng tại một điểm. Xem Schutz 2009, tr 145 chương 6

[31] Kể từ đây, chúng ta sẽ viết đạo hàm riêng theo cách rút gọn là $\partial _{\mu }:=\partial /\partial x^{\mu }$ .

[32] Xem De Felice & Clarke 1990, tr 65

[33] Xem De Felice & Clarke 1990, tr 66

[34] Xem De Felice & Clarke 1990, Chương 4, Spacetime and Tetrad formalism, tr 129

[35] Schutz 2009, tr 170

[36] Một số sách sử dụng kiểu ký hiệu khác cho đạo hàm hiệp biến, trong đó ký hiệu nabla được thành bằng dấu chấm phẩy, trong khi đạo hàm riêng thường được ký hiệu bằng dấu phẩy, ví dụ $U^{\mu }{}_{;\nu }=U^{\mu }{}_{,\nu }+\Gamma _{\nu \lambda }^{\mu }U^{\lambda }$ . Xem Misner, Thorne & Wheeler 1973

[37] Xem De Felice & Clarke 1990, Chương 3, The Cuvarture, tr 126

[38] Xem Landau & Lifshitz 1975, Chương 10, tr 263

[39] Phương trình (188) và (189) có thể mở rộng cho không thời gian có tenxơ xoắn khác 0, ${\mathcal {T}}$ và chúng có dạng

$\nabla _{[\mu }\nabla _{\nu ]}A_{\alpha }={\frac {1}{2}}R_{\alpha \nu \mu }^{\beta }A_{\beta }+{\frac {1}{2}}{\mathcal {T}}_{\mu \nu }^{\beta }\nabla _{\beta }A_{\alpha },\quad \nabla _{[\mu }\nabla _{\nu ]}A^{\alpha }={\frac {1}{2}}R_{\beta \nu \mu }^{\alpha }A^{\beta }+{\frac {1}{2}}{\mathcal {T}}_{\mu \nu }^{\beta }\nabla _{\beta }A^{\alpha }$

(190)

[40] Nếu ten xơ Riemann là một thành phần động lực, tức là nó phụ thuộc vào thời gian, thì phương trình độ lệch trắc địa (198) có thể được sử dụng để xác định các hiệu ứng của bức xạ hấp dẫn tác dụng lên nhóm các hạt thử trong trạng thái rơi tự do. Xem Misner, Thorne & Wheeler 1973, Part III Gravitation Waves

[41] Xem Landau & Lifshitz 1975, Chương 11, phương trình 96

[Riess-42] Riess, Adam G.year=1998. “Observational evidence from supernovae for an accelerating universe and a cosmological constant”. Astronomical J. 116 (3): 1009–38. arXiv:astro-ph/9805201. Bibcode:1998AJ....116.1009R. doi:10.1086/300499.

[perlmutter-43] Perlmutter, S.journal=Astrophysical Journal (1999). “Measurements of Omega and Lambda from 42 high redshift supernovae”. 517 (2): 565–86. arXiv:astro-ph/9812133. Bibcode:1999ApJ...517..565P. doi:10.1086/307221. Chú thích journal cần |journal= (trợ giúp)

[Misner_1973_loc-44] Misner, Thorne & Wheeler 1973

[45] Xem De Felice & Clarke 1990

[46] Mặc dù hầu hết các nhà vật lý đều thống nhất rằng lý thuyết lượng tử về hấp dẫn có thể cung cấp sự miêu tả về nguồn gốc của hằng số vũ trụ, bây giờ nó có thể được coi là đóng góp thêm vào tenxơ ứng suất-năng lượng theo dạng $T_{\mu \nu }(\Lambda )=-(\Lambda /8\pi )g_{\mu \nu }$

[47] *Einstein, A.; Infeld, L.; Hoffmann, B. (1938). “The Gravitational Equations and the Problem of Motion”. Annals of Mathematics. Second series. 39 (1): 65–100. Bibcode:1938AnMat..39...65E. doi:10.2307/1968714. JSTOR 1968714.

[48] Schwarzschild, K. (1916). “Über das Gravitationsfeld eines Massenpunktes nach der Einsteinschen Theorie”. Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften. 7: 189–196. arXiv:physics/9905030. Bibcode:1916AbhKP1916..189S.

[49] Chúng ta gọi nghiệm tĩnh của phương trình trường Einstein đó là nghiệm mà các thành phần của mêtric không phụ thuộc vào thời gian hay bị ảnh hưởng bởi sự đảo ngược thời gian, tức là thông qua biến đổi $t\rightarrow -t$ .

[50] Xem De Felice & Clarke 1990, Schutz 2009, Misner, Thorne & Wheeler 1973, d'Inverno 1992

[51] Quả vậy, nếu quỹ đạo không nằm trên mặt phẳng nó sẽ tiến động theo một hướng, và không tuân theo giả sử về đối xứng cầu.

[52] Phương trình (233) có thể dễ dàng suy ra nếu để ý 2L = -m² rồi sử dụng các phương trình (232) và (235)

[53] Chú ý rằng hằng số một trong thế không làm nhiễu loạn nghiệm, không ảnh hưởng đến phương trình chuyển động.

[54] Xem thêm Những định luật của Kepler về chuyển động thiên thể.

[55] Chú ý rằng những quỹ đạo này không kín bởi vì sự tiến động của cận điểm quỹ đạo trong trường hấp dẫn (Misner, Thorne & Wheeler 1973) do đó chúng là những quỹ đạo ellip nhưng không kín.

[56] Kerr, R. P. (1963). “Gravitational field of a spinning mass as an example of algebraically special metrics”. Phys. Rev. Lett. 11 (5): 237. Bibcode:1963PhRvL..11..237K. doi:10.1103/PhysRevLett.11.237.

[57] Robinson D. C. (1975). “Uniqueness of the Kerr Black Hole”. Phys. Rev. Lett. 34 (14): 905. doi:10.1103/PhysRevLett.34.905.

[58] Các thành phần của mêtric vẫn độc lập với thời gian nhưng nghiệm bị ảnh hưởng bởi sự đảo ngược thời gian, tức là qua phép biến đổi $t\rightarrow -t$ .

[59] Frederick J. Ernst (1968). “New Formulation of the Axially Symmetric Gravitational Field Problem. II”. Phys. Rev. Lett. 168 (5): 1415. doi:10.1103/PhysRev.168.1415.

[60] Bardeen, J.M.; Press, W.H.; Teukolsky, S.A. (1972). “Rotating Black Holes: Locally Nonrotating Frames, Energy Extraction, and Scalar Synchrotron Radiation”. Astrophysical Journal. 178: 347–370. Bibcode:1972ApJ...178..347B. doi:10.1086/151796.

[61] R. Penrose, Gravitational Collapse: The Role of General Relativity, Rivista del Nuovo Cimento, Numero Speziale I, 252 (1969)

[62] R. Penrose and R. M. Floyd, "Extraction of Rotational Energy from a Black Hole," Nature Physical Science 229, 177 (1971).

[63] R. D. Blandford and R. L. Znajek (1977). “Electromagnetic extraction of energy from Kerr black holes”. MNRAS. 179 (3): 433–456. doi:10.1093/mnras/179.3.433.Quản lý CS1: sử dụng tham số tác giả (liên kết)

[64] B. Carter (1968). “Global structure of the Kerr family of gravitational fields”. Physical Review. 174 (5): 1559–1571. doi:10.1103/PhysRev.174.1559.

[65] Nguyên lý vũ trụ học (căn cứ trên các dữ liệu quan trắc nhưng vẫn là những giả sử cơ bản), nói rằng khi quan sát trên phạm vi đủ lớn, tính chất của Vũ trụ là như nhau đối với mọi quan sát viên. Nhìn theo cách khác, nguyên lý vũ trụ học là sự mở rộng của Nguyên lý Copernicus về con người không ở một vị trí đặc biệt nào trong Vũ trụ.

[66] Hubble, Edwin (1929). “A relation between distance and radial velocity among extra-galactic nebulae” (PDF). Proceedings of the National Academy of Sciences. 15 (3): 168–173. Bibcode:1929PNAS...15..168H. doi:10.1073/pnas.15.3.168. PMC 522427. PMID 16577160.

[67] Friedmann, Alexander (1922), “Über die Krümmung des Raumes”, Zeitschrift für Physik A, 10 (1): 377–386, Bibcode:1922ZPhy...10..377F, doi:10.1007/BF01332580

[68] Lemaître, Georges (1931), “Expansion of the universe, A homogeneous universe of constant mass and increasing radius accounting for the radial velocity of extra-galactic nebulæ”, Monthly Notices of the Royal Astronomical Society, 91: 483–490, Bibcode:1931MNRAS..91..483L, doi:10.1093/mnras/91.5.483

[69] Robertson, H. P. (1935), “Kinematics and world structure”, Astrophysical Journal, 82: 284–301, Bibcode:1935ApJ....82..284R, doi:10.1086/143681

[70] Walker, A. G. (1935), “On the formal comparison of Milne's kinematical system with the systems of general relativity”, Monthly Notices of the Royal Astronomical Society, 95: 263–269, Bibcode:1935MNRAS..95..263W

[71] Planck collaboration. “Planck 2013 results. XVI. Cosmological parameters”. Astronomy & Astrophysics. 571. arXiv:1303.5076. doi:10.1051/0004-6361/201321591.Quản lý CS1: sử dụng tham số tác giả (liên kết)

[72] Toán tử gạch ngang mũ cũng có thể áp dụng cho vết và ${\bar {h}}=-h$ .

[73] Chuẩn Lorenz do Ludvig V. Lorenz nêu ra, không nên nhầm lẫn với chuẩn Lorentz theo tên của Hendrik Lorentz.

[74] Chú ý rằng điều kiện trực giao cố định ba chứ không phải bốn thành phần do cần phải có thêm điều kiện $\kappa ^{\mu }A_{\mu \nu }u^{\nu }=0$ .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]