Toán học của thuyết tương đối rộng
Toán học của thuyết tương đối rộng là mô hình chứa đựng cấu trúc và kỹ thuật toán học được sử dụng để nghiên cứu và thiết lập lên thuyết tương đối rộng của Einstein. Công cụ chính sử dụng trong lý thuyết hình học về lực hấp dẫn này là trường tenxơ xác định trên đa tạp Lorentz biểu diễn không thời gian. Bài viết này miêu tả tổng quan về toán học của thuyết tương đối tổng quát.
Ký hiệu
Trong toàn bộ bài viết, chúng ta sử dụng dấu metric kiểu không gian và hệ đơn vị hình học trong đó mặc dù khi cần thiết chúng ta sẽ viết rõ tốc độ ánh sáng, c. Chúng ta sẽ viết đậm các tenxơ, ví dụ , và các mũi tên bên ám chỉ các vectơ ba chiều hoặc các toán tử, ví dụ hoặc . Đạo hàm hiệp biến và đạo hàm riêng bốn chiều sẽ được ký hiệu dạng tổng quát lần lượt là và nhưng những ký hiệu khác có thể được sử dụng cho các khái niệm ít gặp hơn hoặc khi muốn so sánh với các công thức của cơ học Newton. Với quy ước chuẩn về cách tính tổng khi gặp các chỉ số lặp lại, các chỉ số Hy Lạp sẽ có giá trị từ 0 đến 3, trong khi các chỉ số Latin chạy từ 1 đến 3.
Khái niệm không thời gian
sửaBước quan trọng đầu tiên để hiểu đúng đắn thuyết tương đối rộng, và từ đó là cấu trúc toán học của nó, chính là sự từ bỏ ý tưởng của Galilei về một không gian tuyệt đối và thời gian tuyệt đối. Hơn thế, điều này đưa đến đề xuất cách mạng về sự từ bỏ ý nghĩ không gian và thời gian như là những thành phần của một phông nền cố định, một đối tượng mà mọi quá trình xảy ra trên nó. Từ đây, các nhà vật lý cần thiết phải coi không gian và thời gian là những yếu tố động lực trong các định luật của tự nhiên, và cũng vì thế mà những định luật này bị ảnh hưỏng sâu sắc bởi chúng. Ý tưởng cách mạng này nằm ở trung tâm của thuyết tương đối và là một trong những thành tựu khoa học có ảnh hưởng lớn nhất của mọi thời đại.
Việc từ bỏ ý tưởng về một không gian tuyệt đối và một thời gian tuyệt đối dẫn tới sự giới thiệu không tránh khỏi của một khái niệm mới, đó là không thời gian, một đối tượng bốn chiều đơn nhất , mà tuy nhiên, không nên chỉ coi nó như là một sân khấu cho tiến trình của một hệ vật lý xác định, mà nó còn là một trường động lực tham gia vào sự tiến triển của chính hệ vật lý đó. Những phần tử của không thời gian trừu tượng này được gọi là sự kiện, một khái niệm dường như cũng trừu tượng nhưng không hẳn là vậy. Chúng ta chắc chắn đã quen với khái niệm "cái gì đó ở nơi nào đấy" vì nó trở thành một phần nhận thức của chúng ta về thế giới khi còn là một đứa trẻ. Tương tự, khái niệm sự kiện có thể đi kèm với ý tưởng về "cái gì đó xảy ra ở nơi nào đấy", chẳng hạn như photon từ Mặt Trời tới võng mạc của chúng ta lúc bình minh. Do đó, các nhà vật lý thích nghĩ về các sự kiện như là các "điểm" trong không thời gian , và sự tồn tại của chúng như là các phần tử của không thời gian độc lập với cách chọn hệ tọa độ để định vị chúng tại một vị trí không gian cụ thể trong một thời gian cho trước. Các sự kiện do đó tự chúng là những phần tử của không thời gian, mà tính động lực được điều chỉnh bởi các định luật vật lý.
Với tư duy như thế, các nhà vật lý nghĩ tới vấn đề các sự kiện liên hệ với nhau bằng cách nào. Nếu coi một sự kiện là "một cái gì đó xảy ra ở nơi nào đó", thì hai hay nhiều sự kiện có thể được liên hệ (vd, thông qua các định luật vật lý) và đưa vào thành "một dãy các sự kiện", mà, trong trường hợp dãy được xếp thứ tự với thời gian như là một tham số, chúng thuộc về một tập hợp, cụ thể hơn là một đường cong trong không thời gian, gọi là "đường thế giới" (worldline). Cũng trong trường hợp này, khái niệm trừu tượng về đường thế giới quả thực hiển nhiên giống với một cách giải thích quen thuộc khi chúng ta nghĩ tới tuyến đường trên một bản đồ (đoạn đường từ nhà tới nơi làm việc) như đường thế giới trong không thời gian miêu tả về chuyển động của chúng ta. Sự tài tình ở đây là, trong khi tuyến đường trên bản đồ kết nối các điểm (không gian) khác nhau mà chúng ta đứng tại những thời điểm khác nhau, thì đường thế giới kết nối các sự kiện khác nhau của không thời gian, tức là, những sự kiện mà chúng ta tham gia vào khi đi từ nhà đến nơi làm việc. Một hệ quả rõ ràng từ định nghĩa của đường thế giới là khi không có một không gian tuyệt đối và một thời gian tuyệt đối, bất kỳ sự lựa chọn theo thứ tự các sự kiện chỉ có thể là "tùy ý" (hoặc tương đối) khi có thể thay thế bằng những sự kiện tương đương và khả dĩ trên cùng một tập hợp các sự kiện. Tuy nhiên, kết quả này không nên chỉ coi đó là một giới hạn, nhưng mà là một đặc điểm quan trọng trong bức tranh mới về không gian và thời gian, một điều căn bản trong thuyết tương đối rộng. Nói chung, khái niệm như tính đồng thời vẫn được giữ lại nhưng phải được thể hiện một cách đúng đắn, và điều này được nhắc tới ở phần sau.
Đa tạp không thời gian
sửaThuyết tương đối rộng đề xuất ý tưởng miêu tả các hiện tượng vật lý bằng một tập hợp các sự kiện, tạo thành một thể liên tục (continuum) bốn chiều, gọi là không thời gian. Khái niệm toán học phù hợp nhất để đặc trưng cho không thời gian đó là một đa tạp khả vi , một khái niệm kết hợp giữa những khái niệm của không gian tôpô và tính khả vi. Tức là, khi nói đến không thời gian bằng tập hợp các sự kiện, là một không gian tôpô, ta đang cung cấp thông tin về việc bằng cách nào mà những vùng khác nhau của continuum này được liên hệ với nhau. Hơn nữa, như đã rõ ràng khi ta nói về nguyên lý tương đương, thuyết tương đối rộng đòi hỏi rằng các sự kiện khác nhau của không thời gian cho phép các lân cận địa phương không giao nhau (rời nhau). Từ đây, không gian tôpô nhất thiết phải là không gian tôpô Hausdorff. Ngoài cấu trúc tôpô, ta cần trang bị cho không thời gian một cấu trúc vi phân thông qua phép tham số hóa khả vi bằng các tọa độ được gắn cho mỗi sự kiện. Những cách đặt tham số hóa này được thực hiện thông qua các hàm số của lớp với , mà ánh xạ lân cận địa phương của mỗi sự kiện vào . Do vậy một đa tạp khả vi là một không gian tôpô Hausdorff vi phôi địa phương với . Ví dụ đơn giản về đa tạp đó là bề mặt của một hình cầu ba chiều ("mặt cầu 2 chiều") hoặc bất kỳ một siêu mặt m chiều nào trong không gian n chiều với .[1]
Có rất nhiều sách và bài viết thảo luận về định nghĩa và tính chất của không gian tôpô và của đa tạp, chẳng hạn Franken 2011, Ch 2 và De Felice & Clarke 1992. Cho những mục đích ứng dụng chúng ta có thể coi là "tập hợp chứa các sự kiện được tham số hóa", những thứ tạo nên không thời gian bốn chiều, và các tham số của chúng là những hàm khả vi tới một số bậc nhất định.
Số các tham số độc lập cần thiết để định ra một sự kiện trong chính là số chiều của đa tạp và cách chọn những tham số này sẽ biểu diễn cách chọn hệ tọa độ cần thiết để phủ đa tạp, và có vô số cách chọn như thế. Ví dụ, hệ tọa độ sử dụng kinh độ và vĩ độ để xác định vị trí của điểm trên bề mặt Trái Đất. Khi áp dụng, chúng ta cần thiết định nghĩa một quy tắc gán tương ứng một điểm của đa tạp , tức là sự kiện, vào không gian thực n chiều . Quy tắc này gọi là phép ánh xạ và cách chọn hệ tọa độ tương ứng sẽ phủ một phần hoặc toàn bộ đa tạp không thời gian. Các điểm lưu ý:
- Ánh xạ thảo luận ở trên có thể coi là sự gán một - một các điểm trên đa tạp với các điểm của không gian Euclid với số chiều thích hợp. Sự tương ứng này là có ích nhưng phải cẩn thận khi áp dụng. Cụ thể hơn, nó nhấn mạnh rằng ít nhất trên cục bộ (hay địa phương) đa tạp nhìn giống như không gian Euclid.[2] Tuy nhiên nó cũng ẩn chứa thực tế rằng tô pô toàn cục của đa tạp có thể rất khác so với tô pô Euclid. Chẳng hạn đa tạp là bề mặt của hình vòng xuyến: cả bề mặt lẫn tô pô toàn cục của nó khác hẳn so với không gian Euclid, nhưng có thể ánh xạ cục bộ một diện tích nhỏ trên bề mặt vào không gian Euclid, như mặt phẳng tiếp xúc với một điểm trong diện tích này.
- Trong khi có vô hạn cách chọn hệ tọa độ để phủ một đa tạp, không phải cách nào cũng cho phương án tốt. Một số hệ tọa độ trong chúng có thể suy biến và khi phân tích toán học nghiệm của phương trình trường Einstein chứa đựng hệ tọa độ cho phép làm nổi bật nhất ý nghĩa vật lý của nghiệm. Lấy ví dụ lần nữa về hệ tọa độ cầu trên mặt cầu 2 chiều. Rõ ràng hệ tọa độ này suy biến tại hai cực của mặt cầu vì có thể ánh xạ những tập vô hạn các giá trị, ví dụ khi và .
- Mỗi hệ tọa độ bao phủ một vùng nhất định của không thời gian gọi là mảnh hay bản đồ, và hai bản đồ có thể có miền giao nhau hoặc không. Atlas của đa tạp là bất kỳ những phép hợp các bản đồ sao cho phép hợp này bao phủ toàn bộ đa tạp.
- Như đã nêu ở trên, mộ tính chất cơ bản của đa tạp trong thuyết tương đối rộng đó là chúng có tính khả vi, nghĩa là ánh xạ địa phương từ đa tạp vào phải khả vi. Mặt cầu hai chiều là đa tạp khả vi trong khi hình nón thì không, do nó không khả vi tại đỉnh nón vì không tồn tại ánh xạ khả vi từ điểm này vào .
Hệ tọa độ
sửaÝ tưởng về không thời gian (tập hợp chứa mọi sự kiện), như là một đa tạp (không gian phủ bởi các hệ tọa độ), là rất hấp dẫn từ quan điểm hình học, nhưng cũng phải là nguồn để đề cập đến từ quan điểm vật lý học, vì sự lựa chọn tùy ý hệ tọa độ có thể đưa đến việc làm mất các thông tin vật lý. Tuy vậy, đây là một lập luận không đúng và các phép đo phải là độc lập với hệ tọa độ, tức là, các phép đo sẽ cho cùng một kết quả trong mọi hệ tọa độ được lựa chọn. Tương tự, vẫn có thể dẫn ra được các phương trình độc lập với hệ tọa độ khi không thời gian được coi là một đa tạp.
Bước đầu tiên để học quá trình này đó là làm quen với các đối tượng cơ bản của một đa tạp, như đường cong, đại lượng vô hướng và vectơ, và cách chúng biến đổi như thế nào khi chuyển từ hệ tọa độ này sang hệ tọa độ khác. Kể từ đây chúng ta giả sử rằng là đa tạp khả vi gồm bốn chiều (ba chiều không gian và một chiều thời gian), nhưng việc tổng quát hóa các tính chất của đa tạp lên đa tạp n chiều là trực tiếp.
Xét không thời gian được phủ bởi hai hệ tọa độ,[3] và [4] , hoặc tương đương, xét hai ánh xạ khác nhau và đi từ vào . Mỗi điểm P của do đó được biểu diễn bằng hai tọa độ khác nhau, mỗi tọa độ chứa bốn phần tử, và . Phép biến đổi tọa độ tại điểm P được biểu diễn bằng bốn hàm số đơn trị, liên tục và khả vi sao cho
(1)
ở đây ký hiệu x có bốn tọa độ ám chỉ những đối tượng bôi đậm thuộc về . Bởi vì đa tạp là khả vi, do vậy phép biến đổi tọa độ không chỉ đúng tại điểm P, tức là
(2)
Hàm f cũng phải khả nghịch, do đó hàm f−1 là phép biến đổi tọa độ nghịch đảo và
(3)
với phép toán kết hợp trở thành đồng nhất, nghĩa là .
Ví dụ coi mặt phẳng là một đa tạp hai chiều với hai hệ tọa độ và do vậy
(4)
và nếu áp dụng hàm hợp đối với tập tọa độ thứ nhất ta thu được đồng nhất thức
Khai thác tính khả vi của đa tạp, chúng ta có thể lấy vi phân của tọa độ x' theo x và thu được ma trận biến đổi
(5)
với định thức
(6)
là định thức Jacobi (hay Jacobian) của biến đổi tọa độ trong (2). Nếu J' khác 0 tại mọi điểm, khi đó phương trình (2) sẽ có nghiệm và chúng ta nhận được phép biến đổi ngược (3). Ngược lại, nếu J' = 0 tại một điểm, ta nói phép biến đổi là kỳ dị tại điểm đó. Tương tự ta có thể lấy vi phân tọa độ x theo x' và thu được ma trận biến đổi ngược
(7)
Đến đây, sử dụng quy tắc dây chuyền đối với đạo hàm riêng, sẽ không khó để chứng minh được rằng hai ma trận (5) và (7) là nghịch đảo của nhau, tức là
(8)
với lần lượt là các ma trận tương ứng của và ma trận đơn vị. Hệ quả trực tiếp của (8) đó là định thức Jacobi của hai ma trận là nghịch đảo của nhau, tức là J' = 1/J.
Ví dụ ma trận biến đổi giữa hai hệ tọa độ trong (4) là
(9)
và
(10)
với
Đường cong (curve) và quỹ đạo (path)
sửaSau khi đã giới thiệu khái niệm hệ tọa độ và biến đổi tọa độ, bây giờ chúng ta xét tới đối tượng đơn giản nhất trong đa tạp mà sẽ dẫn tới định nghĩa tenxơ.
Xét trong không thời gian một chuỗi các sự kiện mà được liên hệ với nhau theo những cách nào đó. Như đã nói ở mục Khái niệm không thời gian, ta có thể liên hệ hoặc xếp thứ tự các sự kiện và sẽ thu được đường thế giới (worldline) khi tham số xếp thứ tự là tọa độ thời gian t. Bây giờ chúng ta mở rộng ý tưởng và xét các sự kiện mà không nhất thiết phải liên hệ thông qua thời gian, mà thông qua một tham số tổng quát hơn là . Đối tượng thu được gọi là đường cong (curve) và là ánh xạ từ một đoạn vào một tập hợp các điểm có tọa độ tức là
- đường cong
(11)
Rõ ràng rằng, cùng một tập hợp các điểm trong có thể được tham số hóa vô hạn lần khi thay đổi cách lựa chọn tham số . Cách xem xét này giúp chúng ta phân biệt với khái niệm quỹ đạo (path) - như là tập hợp các sự kiện trong , so với đường cong đi qua các sự kiện này. Trong khi quỹ đạo là một đối tượng nội tại trong không thời gian thì đường cong lại phụ thuộc vào cả cách tham số hóa nó cũng như việc chọn hệ tọa độ để lập bản đồ (chart) cho đa tạp . Khi thay đổi tham số sẽ dẫn tới đường cong mới đi qua cùng quỹ đạo trong và cùng hệ tọa độ biểu diễn trong (trong trường hợp này nó được gọi là ảnh). Tuy nhiên, khi thay đổi hệ tọa độ sẽ đem lại một đường cong mới đi qua cùng một quỹ đạo trong , nhưng rõ ràng nó sẽ không chứa cùng những tọa độ biểu diễn trong . Nói cách khác, khái niệm quỹ đạo mang ý nghĩa cơ bản hơn so với khái niệm đường cong và ảnh, chúng ta có thể xây dựng hai đường cong:
- đường cong
(12)
và
- đường cong
(13)
sao cho chúng chứa cùng một quỹ đạo trong , với và có cùng ảnh, nhưng và có ảnh khác nhau.
Cuối cùng, chúng ta có thể mở rộng khái niệm đường cong cho một mặt với hai tham số,
- mặt
(14)
Mặt được gọi là siêu mặt của đa tạp nếu số tham số cần thiết để miêu tả nó bằng số chiều của đa tạp trừ đi một, ví dụ siêu mặt 3 chiều đối với không thời gian bốn chiều.
Vectơ tiếp xúc
sửa- xem thêm: Véctơ-4
Tất cả những khái niệm đã giới thiệu về các đường cong và mặt có thể được coi như là những công cụ cơ bản để định nghĩa khái niệm rất quan trọng và hữu ích, đó là vectơ tiếp xúc (tangent vector) với đường cong . Nếu coi đường cong là tập hợp các điểm với mỗi điểm được đánh dấu bởi một bộ các tọa độ sắp thứ tự bằng một tham số λ, thì vectơ tiếp xúc là khái niệm dùng để diễn giải sự thay đổi tọa độ như thế nào dọc theo đường cong này. Nói cách khác, khi cho trước một hệ tọa độ trong đa tạp và một đường cong , vectơ tiếp xúc tại điểm P dọc cung được định nghĩa là tập hợp gồm bốn tọa độ
(15)
Chú ý rằng tại mỗi điểm P chỉ có duy nhất một vectơ tiếp xúc với đường cong và thậm chí hai đường cong có thể có chung một vectơ tiếp tuyến tại điểm chung P, và hai đường này sẽ có thể có một số điểm chung ở một số nơi (hai đường khác nhau) hoặc hoàn toàn đồng nhất giống nhau. Vì điểm P là bất kỳ, có thể viết biểu thức tổng quát cho định nghĩa của vectơ tiếp xúc cho đường cong là
(16)
Chúng ta nên phân biệt giữa vectơ là đối tượng hình học, viết là , và cách biểu diễn nó trong một hệ tọa độ cụ thể, mà trong trường hợp này chúng ta nói đến các thành phần tọa độ của nó . Sự quan trọng của biểu thức (16) là nó cho phép chúng ta có khả năng định nghĩa một đại lượng hình học theo các tính chất của phép biến đổi đối với nó dưới ảnh hưởng của sự thay đổi hệ tọa độ. Quả vậy, chúng ta xét một hệ tọa độ mới và sử dụng biểu thức (2) để tính toán các thành phần tọa độ của cùng một vectơ tiếp xúc đối với hệ tọa độ mới này
(17)
với phương trình thứ hai đã áp dụng định nghĩa của vi phân
(18)
và phương trình cuối cùng (17) có được từ định nghĩa của (16).
Bởi vì cách đặt ký hiệu tốt rất quan trọng và điều này càng có ý nghĩa đặc biệt trong thuyết tương đối rộng, đầu tiên chúng ta có thể viết gọn lại (17) bằng cách áp dụng ký hiệu quy ước tổng do Einstein đặt ra, mà khi ta gặp một chỉ số xuất hiện hai lần điều này sẽ hàm ý việc tính tổng giữa các chỉ số từ 0 đến 3, và thứ hai chúng ta có thể áp dụng cách viết rút ngắn hơn nhờ phương trình (5) cho phép biến đổi ma trận, tức là
(19)
Biểu thức (19) cần được giải thích rõ hơn, đầu tiên đó là chỉ số là chỉ số được tính tổng (hay chỉ số rút gọn-contraction) tức là nó xuất hiện một lần với vai trò là chỉ số trên (phản biến-contravariance) trong và một lần với vai trò là chỉ số dưới (hiệp biến-covariance) trong . Chỉ số này còn được gọi là chỉ số câm (dummy) để phân biệt với chỉ số tự do xuất hiện như là một chỉ số không thể thu gọn được ở cả hai vế của phương trình tenxơ (19). Bằng cách kiểm tra số lượng các chỉ số tự do có ở hai vế của phương trình là cách đơn giản nhất, ít nhất về mặt toán học, đó là phương trình tenxơ đã đúng hay chưa (và có thể có nhiều lý do để phương trình chưa đúng).
Phương trình (19) là rất tổng quát và biểu diễn quy tắc biến đổi cho các vectơ phản biến[5]. Về cơ bản, bốn phương trình trong (19) cho chúng ta cách tính các thành phần tọa độ của vectơ trong hệ tọa độ một khi chúng ta biết các thành phần của nó trong hệ tọa độ .
Chúng ta có thể mở rộng biểu thức (19) cho trường hợp biến đổi tọa độ tổ hợp, tức là khi xét hai hệ tọa độ: biến đổi hệ tọa độ thứ nhất từ hệ thành và sau đó chuyển sang hay
(20)
và coi đó như là một lần biến đổi
(21)
do vậy vectơ (phản biến) sẽ biến đổi theo quy tắc
(22)
Như đã nói ở phần trước, chúng ta có thể viết ra phép biển đổi ngược của (1.19) là
(23)
Bốn phương trình (23) cho chúng ta cách tính thành phần tọa độ của vec tơ trong hệ một khi đã biết các thành phần của nó trong hệ . Rõ ràng là hai ma trận biến đổi của hai phép biến đổi ngược là ma trận nghịch đảo của nhau, hay
(24)
Điều này cũng đúng cho phép biến đổi ngược lại
(25)
Chú ý rằng cả hai phương trình (24) và (25) là tương đương với Jacobian của biến đổi khác 0,
(26)
Đại lượng được gọi là ký hiệu Kronecker.
Ở phần này, chúng ta đã giới thiệu một tập hợp tổng quát chứa các điểm được liên hệ với nhau thông qua một tham số, hay đường cong trong đa tạp, sau đó nêu ra định nghĩa khái niệm vectơ tiếp xúc tại một điểm P và học được cách biểu diễn đại lượng hình học này biến đổi như thế nào dưới những hệ tọa độ khác nhau. Điều này dẫn chúng ta tới một khái niệm tổng quát hơn đó là không gian tiếp xúc của đa tạp tại điểm P: đó là không gian chứa mọi vectơ phản biến tại P.
Gradien của hàm số
sửaMột vec tơ bất kỳ có thể được xây dựng dựa trên khái niệm đường cong. Chúng ta có thể thấy điều này bằng cách áp dụng định nghĩa (11) của đường cong trong đa tạp và giới thiệu ra hàm vô hướng , một hàm giá trị thực ánh xạ điểm P bất kỳ có tọa độ trong vào một số thực . Bây giờ chúng ta có thể tính được hàm thực này biến đổi như thế nào dọc đường cong bằng[6]
(27)
Phương trình thứ hai trong phương trình (27) chỉ đơn giản là định nghĩa của vectơ tiếp xúc đã gặp ở (16), trong khi ở phương trình thứ ba là định nghĩa của gradien của hàm số
(28)
với chỉ số tự do phải là chỉ số nằm ở dưới (tức là hiệp biến) và đây là đặc điểm phân biệt với vectơ .
Để hiểu tốt hơn tại sao chỉ số trong phải ở dưới, chúng ta có thể nghiên cứu cách đối tượng hình học này hành xử dưới một phép biến đổi tọa độ và làm rõ ý nghĩa của nó hơn. Một lần nữa, nếu là thành phần của đối tượng này trong hệ tọa độ thì thành phần của nó trong là
(29)
Hay nói cách khác, quy tắc biến đổi cho gradien của hàm số là
(30)
và có thể được sử dụng làm định nghĩa cho khái niệm vectơ hiệp biến (covariant vector).
Chú ý rằng biến đổi (30) là biến đổi ngược của quy tắc đã gặp cho các thành phần của vectơ [xem phương trình (19)]. Lý do cho điều này đến từ thực tế rằng vectơ phản biến và vectơ hiệp biến là đại lượng đối ngẫu của nhau, do đó không gian chứa mọi vectơ hiệp biến là không gian đối ngẫu của không gian tiếp tuyến mà chúng ta đã gặp ở phần trước.[7] Bởi vì đây là một kết quả quan trọng và mối liên hệ sâu sắc giữa vectơ hiệp biến và vectơ phản biến sẽ được trình bày rõ ở phần sau. Như đối với vectơ phản biến, chúng ta có thể đưa ra biến đổi ngược cho vectơ hiệp biến và dễ dàng thu được
(31)
Người đọc thận trọng có thể tự hỏi tại sao chúng ta không viết (30) như sau
(32)
và tại sao không viết (31) như sau
(33)
Lý do đằng sau sự lựa chọn này là ở cách ký hiệu ma trận theo cách viết trong (32) và (33) có thể sẽ gây ra sự nhầm lẫn một khi chúng ta coi giống như ở trong phương trình (23). Điều này sẽ trở lên rõ ràng nếu chúng ta quay trở lại ví dụ về biến đổi tọa độ miêu tả ở trong phần Hệ tọa độ. Quả thực, khi chúng ta biến đổi gradien của một vô hướng từ tọa độ sang , ma trận đúng viết trong (32) mà nhân với vectơ cột phải là
(34)
mà chính là ma trận chuyển vị của ma trận được định nghĩa trong (10).
Ở những phần sau, chúng ta sẽ sử dụng ký hiệu đại diện cho và đại diện cho .
Ý nghĩa hình học của vectơ phản biến và vectơ hiệp biến
sửaChúng ta có thể kết hợp các định nghĩa trên đây để đi đến một miêu tả thống nhất về vectơ phản biến và vectơ hiệp biến. Đặc biệt, chúng ta có thể sử dụng định nghĩa gradien dọc một đường cong (27) và viết lại thành
(35)
do đó vectơ phản biến có thể được coi như là một đối tượng hình học tiếp tuyến với đường cong có tham số và đo tỉ số cho một hàm vô hướng bất kỳ dọc đường cong. Theo cách này, có thể coi vectơ là đại lượng độc lập với hệ tọa độ, và xác định lên, ít nhất trong một miền lân cận nhất định, đường cong mà nó tiếp xúc. Thành phần phản biến của nó cho phép đo sự thay đổi của hệ tọa độ dọc theo đường cong đó và những thứ này có mối liên hệ chặt với cách lựa chọn hệ tọa độ; một hệ tọa độ khác sẽ dẫn tới những thành phần tọa độ khác, cũng như hàm gradien khác.
Tất nhiên, chúng ta có thể thực hiện mà không cần hàm vô hướng trong (1.35) và coi vectơ như là một đối tượng xác định bằng
(36)
mà chúng ta đưa ra ký hiệu
(37)
để chỉ bốn vectơ cơ sở dọc theo hướng xác định bởi tọa độ [9] Những cơ sở vectơ này, mà có liên hệ chặt với hệ tọa độ đang áp dụng, được gọi là tọa độ cơ sở. Theo cách này, biểu thức (36) nói một cách đơn giản rằng là tổ hợp của các thành phần phản biến dọc theo hướng tọa độ.
Định nghĩa vectơ theo phương trình (36) mang bản chất hình học của vectơ và có vẻ rất khác thường. Nhưng thực ra nếu xem xét kỹ, khi coi đa tạp ba chiều đi kèm với đạo hàm theo hướng (directional derivative) với cơ sở vectơ của giải tích vectơ cổ điển, khi đó rõ ràng rằng vectơ trong (36) lại được biểu diễn trùng với hệ ba vectơ ba chiều, tức là
(38)
khi được biểu diễn trong hệ tọa độ DeCartes (phương trình thứ hai) và trong hệ tọa độ cầu (phương trình thứ ba) hoặc trong bất kỳ cơ sở tọa độ nào. Cách nhìn mới về vec tơ này cũng hữu ích khi mở ra cách nhìn mới về đối vectơ hay một dạng một (covector, one form). Quả vậy, chúng ta có thể quay trở lại định nghĩa trong (35) và xét tới vectơ hiệp biến như là một toán tử tác dụng lên vectơ sao cho khi áp dụng đối với vectơ nó trả lại một số thực,[10] nghĩa là
(39)
Khi coi là một toán tử tác dụng lên vectơ, đối vec tơ là một toán tử tuyến tính tức là
(40)
với a, b là các hệ số hằng số. Ngoài ra, nó còn tuân theo luật phân phối
(41)
Cách giải thích hình học này đã thực sự thống nhất các khái niệm vectơ và đối vectơ (1-dạng, 1-form). Theo cách này, một vec tơ xác định lên đường cong mà nó tiếp tuyến với, trong dạng một xác định gradien của một hàm vô hướng dọc cùng cung đó. Hơn nữa, dạng một tác dụng lên vectơ tạo ra một số độc lập với tọa độ và do vậy là bất biến tương đối tính. Tính chất quan trọng này được chứng minh bắt đầu bằng định nghĩa (39) khi viết trong hệ tọa độ mới
(42)
Tính chất bất biến này cũng áp dụng cho định nghĩa (36) của vectơ và cho phép chúng ta suy ra quy tắc biến đổi của cơ sở vectơ
(43)
do đó, gộp các thành phần của vectơ ta được
(44)
Vì thế, đối với mọi vectơ không tầm thường ta có
(45)
Mặc dù biểu thức (45) không phải là phương trình biến đổi cho thành phần tọa độ, nhưng chúng ta nhận ra ngay lập tức sự tương tự giữa (45) và quy tắc biến đổi cho thành phần của đối vectơ trong (32). Vì vậy có thể nói rằng cơ sở vectơ biến đổi theo quy tắc giống như các thành phần của đối vectơ biến đổi và theo "cách ngược lại" với thành phần của vectơ. Chú ý rằng chữ "ngược" trong dấu hai phẩy vì nếu ta đọc biến đổi vectơ cơ sở trong (45) như là biểu diễn ma trận của sự thay đổi cơ sở, thì biểu diễn ma trận tương ứng trong (19) chấp nhận nghịch đảo của ma trận chuyển vị sử dụng trong (45) chứ không phải nghịch đảo của ma trận này (xem ở phần Gradien của hàm số).
Cuối cùng, khi đã giới thiệu định nghĩa cơ sở vectơ, sẽ tự nhiên khi đặt ra câu hỏi về định nghĩa cơ sở của đối vectơ do vectơ và đối vectơ (hay dạng một) là những đại lượng đối ngẫu, nghĩa là
(46)
do đó một cơ sở vectơ sinh ra một cơ sở đối vectơ , và bất kỳ một đối vectơ có thể biểu diễn theo các thành phần của nó
(47)
Để chứng minh (46) là đúng, chúng ta có thể sử dụng (36) và (47) để nhận được
(48)
Tenxơ
sửaĐịnh nghĩa của vectơ và đối vectơ đã giới thiệu ở phần trước là cơ sở cho nội dung của phần này. Chúng đã được giới thiệu để xác định các đối tượng hình học độc lập với bất kỳ hệ tọa độ nào và chúng ta đã học được rằng khi đưa ra một hệ tọa độ và chuyển đổi sang hệ tọa độ khác, các vectơ phản biến và vectơ hiệp biến biến đổi theo những quy tắc đơn giản trong (19) và (30).
Có ít nhất hai khía cạnh của vec tơ (hoặc đối với vectơ phản biến hoặc hiệp biến) mà khá rõ ràng. Thứ nhất đó là chúng ta không nhất thiết phải giới hạn định nghĩa vectơ tại một điểm. Mặt khác chúng ta có thể nghĩ tới toàn bộ miền của đa tạp và thông qua một hàm trơn khả vi chúng ta gắn mỗi vectơ tại mỗi điểm của miền này, qua đó định nghĩa lên trường vectơ
(49)
với là giá trị của trường tại điểm P. Hơn nữa, trường vectơ được nói là khả vi nếu các thành phần của nó là những hàm tọa độ khả vi trong mọi hệ tọa độ. Khía cạnh thứ hai đó là vectơ chỉ là thành phần đơn giản nhất của một lớp đối tượng hình học tổng quát hơn gọi là tenxơ. Cũng như đối vectơ hiệp biến và vectơ phản biến, ten xơ có thể coi như là những đối tượng hình học mà được xác định hoàn toàn theo những tính chất dưới một phép biến đổi tọa độ.
Nhất quán với cách tiếp cận này, chúng ta định nghĩa một tenxơ phản biến hạng hai là một đối tượng hình học , mà các thành phần biến đổi tuân theo quy tắc sau khi chuyển từ hệ tọa độ sang hệ mới [11]
(50)
Tương tự chúng ta có thể định nghĩa tenxơ hiệp biến hạng hai là một đối tượng hình học , mà các thành phần biến đổi tuân theo quy tắc sau khi chuyển từ hệ tọa độ sang hệ [12]
(51)
Nếu hệ tọa độ là thông thường, cả hai biểu thức (50) và (51) sẽ thừa nhận phép biến đổi ngược và có thể suy ra trực tiếp dựa trên các biểu thức (23) và (31). Một cách tự nhiên, chúng ta có thể định nghĩa tenxơ hỗn hợp là một đối tượng hình học có cả thành phần hiệp biến và phản biến. Do vậy, ví dụ, chúng ta có thể định nghĩa tenxơ hỗn hợp loại (4,2) (tức là nó có bốn thành phần phản biến và hai thành phần hiệp biến) mà quy tắc biến đổi khi chuyển từ hệ tọa độ sang hệ là[13]
(52)
và biến đổi ngược sẽ là
(53)
Từ hai ví dụ trên sẽ không khó để hình dung ra cách xây dựng một tenxơ với số thành phần phản biến và hiệp biến là bất kỳ. Chúng ta có thể xây dựng lên không gian vectơ là tập hợp mọi tenxơ kiểu (m, n), ví dụ .
Giờ đây chúng ta có thể coi vectơ và đối vectơ như là những tenxơ kiểu đặc biệt (lần lượt là kiểu (1, 0) và (0, 1)). Viết tenxơ theo các cơ sở vectơ (36) và cơ sở đối vectơ (47) để biểu diễn một tenxơ hỗn hợp như là đối tượng hình học độc lập với hệ tọa độ. Ví dụ đối với tenxơ hỗn hợp loại (1, 1) là
(54)
với ký hiệu là tích tenxơ. Chú ý rằng tích này không có tính giao hoán, tức là . Do vậy, hai tenxơ và là hai tenxơ khác nhau.
Tương tự như đối với vectơ, chúng ta có thể định nghĩa trường tenxơ bằng cách gán cho mỗi tenxơ kiểu (m, n) vào từng điểm P
(55)
với là giá trị của trường tenxơ tại P. Cũng vậy, trường tenxơ được nói là khả vi nếu các thành phần của nó là những hàm tọa độ khả vi trong mọi hệ tọa độ. Kể từ đây, chúng ta luôn luôn ám chỉ đến trường tenxơ mặc dù đôi khi chỉ viết ngắn gọn là tenxơ.
Nói chung, nếu một tenxơ có N chỉ số xác định trên đa tạp có D chiều, thì nó sẽ có thành phần. Do vậy, trong đa tạp bốn chiều mà chúng ta quan tâm, chúng ta có thể coi tenxơ là những ma trận có 4, 16, 64, 256 thành phần tương ứng với các ten xơ có 1, 2, 3, và 4 chỉ số. Có thể xảy ra trường hợp những thành phần này không độc lập hoàn toàn với nhau, như sẽ nêu ở phần dưới.
Tóm lược lại phần này:
- - : là vectơ phản biến hay vectơ, hoặc là tenxơ phản biến hạng 1, hoặc tenxơ kiểu (1, 0) hoặc .
- - : là vectơ hiệp biến hay đối vectơ, hoặc dạng một, hoặc là tenxơ hiệp biến hạng 1, hoặc tenxơ kiểu (0, 1) hoặc .
- - : là là tenxơ hiệp biến hạng 2, hoặc tenxơ kiểu (0, 2) hoặc .[14]
- - : là là tenxơ hỗn hợp hiệp biến hạng 4 phản biến hạng 2, hoặc tenxơ kiểu (2, 4) hoặc .
Đại số tenxơ
sửaKhi sử dụng thuyết tương đối rộng không thể tránh gặp phải những tính toán với sự có mặt của tenxơ và do vậy việc làm quen với các tính toán cơ bản của đại số tenxơ là điều cần thiết, và cuối cùng chúng ta đi tới giải tích tenxơ trong phần Không thời gian cong trong thuyết tương đối rộng. Bên cạnh những tính chất tuyến tính đã gặp ở đối vectơ hay dạng một (covector, one form) trong (39) mà đã được mở rộng thông thường khi coi vectơ và dạng một là những tenxơ. Chúng ta liệt kê dưới đây một số tính chất quan trọng nhất của tenxơ cũng như các phép toán liên quan:
- Tenxơ không: Nếu một ten xơ mà mọi thành phần của nó bằng 0 trong một hệ tọa độ, thì nó là tenxơ không và các thành phần của nó sẽ bằng 0 trong mọi hệ tọa độ.
- Tenxơ đồng nhất bằng nhau: Nếu hai ten xơ cùng loại mà mọi thành phần của chúng tương ứng bằng nhau trong một hệ tọa độ, thì chúng được nói là đồng nhất bằng nhau, và các thành phần sẽ tương ứng bằng nhau trong mọi hệ tọa độ.
- Hàm vô hướng: Tích của một trường vô hướng φ với một tenxơ có kiểu cho trước sẽ thu được một tenxơ có cùng kiểu, tức là nếu và thì .
- Phép cộng: Khi cộng hai tenxơ cùng kiểu sẽ thu được một tenxơ cùng kiểu, nếu thì .
- Phép nhân: Khi nhân hai tenxơ có kiểu bất kỳ sẽ thu được một tenxơ có kiểu bằng tổng các kiểu tương ứng (tức là tổng các chỉ số phản biến và hiệp biến), hay còn gọi là tích ngoài của tenxơ, nếu và thì khi đó . Sử dụng ký hiệu thành phần, với m=q=2 và n=p=1 thì .
- Rút gọn tenxơ: Thực hiện thu gọn một cặp chỉ số của tenxơ kiểu (m, n) thu được tenxơ kiểu mới (m-1, n-1) tức là .
- Tenxơ đối xứng và phản xứng: Một tenxơ kiểu (m, n) được nói là đối xứng trên một cặp chỉ số bất kỳ p và q (hoặc là hiệp biến hoặc là phản biến) nếu các thành phần của nó không thay đổi khi thay đổi hai chỉ số này cho nhau. Ngược lại, ten xơ là phản xứng nếu nó đổi dấu khi thay đổi hai cặp chỉ số này cho nhau. Ví dụ đối với m = 0 và n = 2,
đối xứng(56)
- phản xứng
(57)
Theo kết quả của (56) và (57) có thể xây dựng một tenxơ đối xứng hoặc phản xứng bằng một tenxơ bất kỳ
(58)
với các dấu ngoặc tròn và ngoặc vuông ký hiệu cho tương ứng tenxơ đối xứng và tenxơ phản xứng. Và hệ quả rõ ràng từ (58) đó là một tenxơ bất kỳ luôn luôn có thể phân tích ra thành tổng của tenxơ đối xứng và tenxơ phản xứng
(59)
Biểu thức (58) có thể mở rộng ra cho ten xơ có kiểu bất kỳ, ví dụ ten xơ đối xứng và ten xơ phản xứng hiệp biến kiểu (0,3) có thể viết dưới dạng tổng của các ten xơ có chỉ số hoán vị của nó:
(60)
(61)
Những tính chất cuối này cho phép chúng ta đưa ra khái niệm tenxơ Levi-Civita, nó là mở rộng bốn chiều của ký hiệu Levi-Civita . Cụ thể, đối với một tenxơ g[15] loại (0, 2) và với định thức g, , chúng ta định nghĩa tenxơ Levi-Civita là[16]
(62)
(63)
với là ký hiệu phản xứng toàn phần định nghĩa bởi[17]
(64)
Thêm vào đó, khi thực hiện thu gọn tenxơ Levi-Civita chúng ta có tenxơ hoán vị
(65)
(66)
(67)
(68)
mà ten xơ hoán vị chính là mở rộng của ký hiệu Kronecker tức là,
(69a)
(69b)
Tại sao chúng ta phải sử dụng tenxơ và đại số tenxơ đối với thuyết tương đối rộng? Bởi vì trong vật lý học nói chung và thuyết tương đối nói riêng, các nhà vật lý quan tâm tới định nghĩa và xác định các đại lượng độc lập với lựa chọn hệ tọa độ cụ thể sử dụng để phủ đa tạp. Chúng ta đã thấy các thành phần của tenxơ rất phụ thuộc vào hệ tọa độ, nhưng tenxơ và quan trọng nhất là phương trình tenxơ lại không phụ thuộc vào hệ tọa độ. Ví dụ, chúng ta xét phương trình tenxơ sau đây trong hệ tọa độ
(70)
với k là hằng số và ta có thể coi như là một toán tử vi phân biểu diễn dưới dạng thành phần tenxơ. Để thu được phương trình (70) trong hệ tọa độ ta sử dụng trực tiếp về biến đổi tọa độ cho mỗi vế của phương trình (1.70)
(71)
khi nhóm thừa số chung lại ta có
(72)
Vì phương trình (72) phải đúng trong mọi hệ tọa độ, do vậy phải có
(73)
mà nó có dạng giống hệt với phương trình (70). Hay phương trình tenxơ được nói là hiệp biến theo nghĩa chúng có cùng dạng trong mọi hệ tọa độ. Kết quả là nếu chúng đúng (hay thỏa mãn) trong một hệ tọa độ, thì chúng cũng đúng trong mọi hệ tọa độ. Tính hiệp biến của phương trình tenxơ thể hiện một tính chất rất quan trọng của tenxơ và có nguồn gốc rất sâu sắc từ thuyết tương đối rộng.
Tenxơ quan trọng nhất: Tenxơ metric
sửaChúng ta vẫn chưa nói tới vấn đề làm thế nào để tính tích vô hướng giữa hai vectơ và đo được độ lớn của một vectơ. Cả hai phép toán tích vô hướng và tìm mô đun độ lớn đòi hỏi đa tạp không thời gian được trang bị một toán tử g, đó là ten xơ đối xứng hạng 2 hay kiểu (0, 2), mà khi nó tác dụng lên hai vectơ, thì chúng ta thu được một số
(74)
Biểu thức trên chính là định nghĩa của tích vô hướng hai vectơ, và khi tích này bằng 0 ta nói hai vectơ trực giao với nhau. Theo cách tương tự đã chứng minh hàm là không phụ thuộc hệ tọa độ (phương trình (42)), chúng ta có thể chứng minh tích vô hướng cũng là một đại lượng bất biến, tức là . Định nghĩa mô đun độ lớn (hay độ dài) của một vectơ bất kỳ chính là trường hợp đặc biệt của (74) và tương ứng với tích vô hướng của chính nó,
(75)
Bây giờ chúng ta có thể quay trở lại phần Đa tạp không thời gian và coi không thời gian như là đa tạp mà trên đó phủ một số hệ tọa độ. Khi có hai sự kiện P tại và Q tại trên , chúng ta mong muốn đo được bình phương khoảng không thời gian vô cùng bé (hay yếu tố đoạn-line element), ds2, theo vectơ dời chỗ vô cùng bé dx mà các thành phần của nó chính là . Khoảng cách này chính là tích vô hướng của hai vectơ và là đại lượng độc lập với hệ tọa độ
(76)
Bởi vì có vai trò trong đo khoảng cách như ở phương trình (76) tenxơ đối xứng g thường được gọi là tenxơ metric (hay chỉ đơn giản là metric) và nó là tenxơ quan trọng nhất trong thuyết tương đối tổng quát. Dấu của tenxơ metric được định nghĩa bằng số giá trị riêng dương, âm hay bằng 0 của metric.
Khi đã lựa chọn hệ tọa độ để định vị và xếp thứ tự các sự kiện trong không thời gian, tenxơ metric cho phép chúng ta đo được khoảng cách giữa các sự kiện và do đó thực hiện được những phép đo vật lý. Trong khi biểu thức (76) chỉ giới hạn ở khoảng cách vô cùng bé, chúng ta có thể mở rộng nó ra cho khoảng cách hữu hạn và khoảng cách riêng giữa hai sự kiện nối với nhau bằng cung bằng
(77)
Chúng ta có thể dễ dàng nhận ra biểu thức (76) rất giống với định lý Pythagoras áp dụng cho không thời gian khác với không gian Euclid. Để rõ hơn, lấy ví dụ về khoảng cách giữa hai điểm P và Q trong không gian ba chiều theo các hệ tọa độ khác nhau
(78)
Ba biểu thức trên biểu diễn cùng một khoảng cách (tức là chúng thu được cùng một số) và xuất hiện trông khác nhau bởi vì chúng được viết ra trong ba hệ tọa độ khác nhau, lần lượt là hệ tọa độ Descartes ; hệ tọa độ trụ và hệ tọa độ cầu . Rõ ràng đối với mỗi hệ tọa độ, tenxơ metric sẽ có dạng lần lượt . Chúng ta cũng thấy rằng hệ tọa độ Descartes có metric dạng đơn giản nhất và viết tương đương thành .
Định thức của tenxơ metric ký hiệu bằng và chúng ta sử dụng nó để tính yếu tố thể tích riêng (proper volume element) khi tích phân trên miền không gian bốn chiều giới hạn bởi siêu mặt ∑
(81)
Hơn nữa metric là không kỳ dị khi và chỉ khi khắp nơi đối với ánh xạ. Trong trường hợp này có nghịch đảo sao cho
(82)
Tính chất (82) cho phép chúng ta thực hiện nâng và hạ chỉ số của tenxơ bằng cách thu gọn tenxơ với tenxơ metric hoặc nghịch đảo của nó. Trong phép toán này, chỉ số được thu gọn (hay chỉ số câm) bị triệt tiêu và các chỉ số còn lại của tenxơ metric hoặc là hạ thấp (khi metric được sử dụng trong phép thu gọn) hoặc được nâng lên (trong trường hợp metric nghịch đảo được sử dụng). Ví dụ, đối với tenxơ T loại (2, 2) phép thu gọn nó với metric và metric nghịch đảo là
(83)
hoặc tổng quát hơn đối với ten xơ bất kỳ
(84)
Hai trường hợp đặc biệt đối với thu gọn ten xơ bằng ten xơ metric đó là đối với ten xơ hạng hai, khi kết quả thu gọn hoặc là dẫn tới vết nếu ten xơ đối xứng, hoặc bằng 0 nếu ten xơ phản xứng[18]
(85)
Tính chất nâng và hạ chỉ số không chỉ là cách thuận tiện khi làm việc với đại số ten xơ mà còn là một cách để chứng tỏ ten xơ metric có thể được sử dụng để ánh xạ vectơ vào dạng một. Để thấy điều này, ta hãy xem lại phương trình (74) và coi metric như là một toán tử tác động lên hai vectơ. Hơn nữa, nếu cố định một vec tơ, U chẳng hạn, và coi nó như là một toán tử khi tác động lên một vectơ sẽ thu được một số (hay vô hướng)
(86)
mà ở cặp phương trình đầu tiên nhấn mạnh vào tính đối xứng của toán tử khi chúng ta có kết quả như nhau nếu "điền vào" dấu chấm một vectơ. Và khi cặp phương trình thứ nhất và cặp phương trình thứ hai tác động lên một vec tơ V sẽ cho cùng một kết quả
(87)
Về cơ bản phương trình (86) nói rằng ten xơ metric có thể dùng để ánh xạ một vec tơ U vào một đối vec tơ (hay dạng một) Ũ mà các thành phần sẽ là Uμ. Tương tự, nghịch đảo của metric g−1 sẽ cho ánh xạ từ đối vectơ vào vectơ, do đó hoàn thiện bức tranh đầy đủ về tính đối ngẫu giữa vectơ và dạng một. Ngoài ý nghĩa của tenxơ metric như đã nêu, chúng ta có thể viết lại tích vô hướng dưới đây
(88)
và viết lại thành
(89)
Hay nói cách khác, các thành phần của metric trong một hệ tọa độ biểu diễn tích vô hướng của các vectơ cơ sở của hệ đó. Đặc biệt, nếu hệ vectơ cơ sở thỏa mãn thì hệ cơ sở này được gọi là hệ cơ sở trực chuẩn.
Tách một tenxơ thông qua vectơ
sửaMột tính chất hữu ích của đại số tenxơ mà có thể áp dụng cho các phương trình vật lý đó là chúng ta có thể tách một tenxơ hạng 2 theo hướng song song và vuông góc với một vectơ. Xét một trường vec tơ U mà có trực chuẩn U.U = -1 và định nghĩa toán tử chiếu (hay tenxơ chiếu) h trực giao với U như là một tenxơ với các thành phần
(90)
mà nó thỏa mãn những đẳng thức sau đây
(91)
Với toán tử này chúng ta có thể tách một trường vectơ V thành các phần song song với U và trực giao với U, nghĩa là
(92)
với số hạng là thành phần của V dọc theo U, trong khi số hạng là thành phần của V trong không gian trực giao với U. Tương tự, có thể tách một tenxơ hiệp biến hạng 2 W bằng cách sử dụng tenxơ chiếu trên từng thành phần c]ủa nó, nhận được
(93)
với
(94)
(95)
Có thể phân tích thành các phần đối xứng và phản đối xứng như trong biểu thức (59) và có
(96)
(97)
với trong phương trình (96) là thành phần không gian, đối xứng và vết tự do của tenxơ W, tức là:
(98)
Kết quả của phân tích (93) có thể viết thành dạng không khả quy là
(99)
Mặc dù chúng ta vẫn chưa giới thiệu ra công cụ toán học cần thiết để tính đạo hàm theo cách không bị phụ thuộc vào hệ tọa độ (theo nghĩa hiệp biến), chúng ta vẫn có đủ công cụ toán học để miêu tả không thời gian bốn chiều đơn giản nhất, không thời gian phẳng.
Không thời gian phẳng: Thuyết tương đối hẹp
sửaXét hai hệ quy chiếu quán tính và chuyển động tương đối so với nhau với tốc độ hằng.[19] Bởi vì tốc độ này là thuần túy thuộc về không gian và do vậy là vectơ-3, chúng ta sẽ ký hiệu nó là vận tốc-3 với các thành phần được tính bằng[20]
(100)
ở đây chỉ số Latin i chạy từ 1 đến 3 và t là tọa độ thời gian. Trong phần này, chúng ta sẽ coi hướng dọc theo trục x trong cả hai hệ quy chiếu và . Do vậy, . Trong vật lý Newton, phép biến đổi đúng giữa hai hệ quy chiếu được miêu tả bằng phép biến đổi Galilei:
(101)
(102)
chúng là cơ sở cho tính bất biến của các định luật động lực học Newton[21] Ý tưởng về một cái gì đó bị sai đến với Einstein sau khi ông nhận ra rằng phương trình Maxwell không bất biến dưới phép biến đổi Galilei (101) và (102)[22] Thuyết tương đối hẹp đã được phát triển để giải quyết sự không tương thích này và nó là lý thuyết vật lý đầu tiên về không thời gian như là một thực thể. Mặc dù đã có nhiều thí nghiệm kiểm chứng tính đúng đắn của lý thuyết, thuyết tương đối đặc biệt có cấu trúc toán học tiên đề rất rõ ràng, khi nó dựa trên những giả sử sau đây:
- Không có hệ quy chiếu quán tính ưu tiên nào và các định luật vật lý là bất biến khi chuyển đổi giữa các hệ quy chiếu quán tính.
- Tốc độ ánh sáng c là tốc độ lớn nhất mà thực thể vật lý và các sóng lan truyền có thể đạt tới.
Chú ý rằng, và nó cũng là hệ quả của tiên đề thứ hai, và bởi vì tốc độ ánh sáng xuất hiện trong phương trình Maxwell, c phải có giá trị như nhau trong mọi hệ quy chiếu quán tính. Cấu trúc tôpô và vi phân của thuyết tương đối hẹp là giống với cấu trúc toán học của lý thuyết Newton nhưng với định nghĩa khác về khoảng cách hay khác về mêtric. Trong hệ tọa độ Descarte, tenxơ metric của không thời gian trong thuyết tương đối hẹp, hay không thời gian Minkowski là
(103)
Mêtric này còn gọi là mêtric không thời gian phẳng do độ cong hình học tương ứng của không gian bằng 0 ở khắp nơi (xem Tenxơ Riemann). Nguyên tố đoạn (76) viết theo metric (103) được viết thành
(104)
Rõ ràng là, trong cùng một không thời gian phẳng, một hệ tọa độ khác - ví dụ hệ tọa độ cầu, sẽ cho tenxơ mêtric khác với dạng của (103). Tuy nhiên có một định lý quan trọng đối với không thời gian phẳng đó là: độc lập với hệ tọa độ dùng để bao phủ đa tạp không thời gian phẳng, luôn luôn có một biến đổi tọa độ toàn cục để đưa tenxơ mêtric của hệ tọa độ đó về dạng (103).
Chúng ta vẫn phải tìm ra phép biến đổi chính xác thay thế cho biến đổi Galilei ở trong (101) và (102) và cũng là cốt lõi của thuyết tương đối hẹp. Bên cạnh thể hiện được sự chuyển đổi từ hệ quy chiếu quán tính sang và đáp ứng được đòi hỏi về tính bất biến của nguyên tố đoạn (xem phần Tenxơ quan trọng nhất: Tenxơ mêtric), phép biến đổi cũng phải đáp ứng được những điều kiện khác. Không những không thay đổi giá trị mà nó phải giữ nguyên dạng phương trình khi chuyển sang hệ quy chiếu quán tính khác, hay . Điều kiện thứ hai này là cần thiết vì nếu không sẽ có cách phân biệt các hệ quy chiếu quán tính. Phép biến đổi Lorentz đáp ứng được những điều kiện này:[23]
(105)
(106)
trong đó
(107)
là hệ số Lorentz có giá trị bằng 1 (khi V = 0) và tiến tới khi V 1. Sử dụng (5), dạng ma trận cho biến đổi vectơ giữa các hệ tọa độ trong thuyết tương đối hẹp - hay ma trận biến đổi Lorentz (xem phần Vectơ tiếp tuyến)
(108)
mà cần nhấn mạnh một lần nữa đó là biến đổi tọa độ này tương đương với sự chuyển đổi giữa các hệ quy chiếu quán tính. Chú ý rằng ma trận biến đổi (108) có dạng đối xứng, và vì vậy nó bằng ma trận chuyển vị của nó, ma trận có định thức bằng 1 vì ma trận nghịch đảo có thể nhận được bằng cách thay V bằng -V. Ma trận nghịch đảo này có thể dùng cho phương trình (45) để tìm hệ cơ sở vectơ đơn vị của quan sát viên theo hệ cơ sở vectơ đơn vị của quan sát viên .
Tất cả những hệ quả kỳ lạ của thuyết tương đối hẹp mà không có ở vật lý Newton, như khái niệm về tính tương đối của sự đồng thời, sự co độ dài Lorentz, sự giãn thời gian, nghịch lý sinh đôi đều có thể rút ra từ các phương trình (105) (106). Hai sự kiện P và Q được nói là tách nhau kiểu thời gian nếu nguyên tố đoạn giữa chúng ds2 < 0, theo nghĩa trong mỗi hệ quy chiếu khoảng cách không gian giữa hai sự kiện luôn có thể đạt tới bằng một vật chuyển động với vận tốc v < c trong khoảng thời gian . Khi ds2 = 0 hai sự kiện được nói là tách nhau rỗng và chúng chỉ có thể liên hệ nhân quả được với nhau thông qua tia sáng. Lấy một sự kiện P(xi, t) bất kỳ trong không thời gian, tập hợp các tia sáng từ nó sẽ định ra nón ánh sáng của P về quá khứ và trong tương lai phụ thuộc vào hướng đến hay hướng ra của tia sáng. Cuối cùng hai sự kiện P và Q được nói là tách nhau kiểu không gian nếu ds2 > 0, hàm ý rằng trong mọi hệ quy chiếu khoảng cách không gian dl giữa hai sự kiện luôn luôn lớn hơn khoảng cách mà ánh sáng có thể lan truyền trong khoảng thời gian . Nội dung này được thể hiện trong hình 1.1 với nón ánh sáng quá khứ và tương lai của sự kiện P. Hai sự kiện được nói là có liên hệ nhân quả nếu và chỉ nếu chúng nằm trong nón ánh sáng của nhau.
Chúng ta có thể mở rộng khái niệm này đối với vectơ: một vectơ-bốn bất kỳ U gọi là vectơ kiểu thời gian, kiểu không gian và vectơ rỗng nếu có tương ứng U.U < 0, U.U > 0, U.U = 0, các ví dụ về những vec tơ này được thể hiện trong hình 1.1.
Nếu hai sự kiện tách nhau kiểu thời gian, thì khoảng thời gian tối thiểu dτ giữa chúng đo bởi một quan sát viên khi anh ta thực hiện gán cho mỗi sự kiện có cùng tọa độ không gian, hay dx = dy = dz = 0, do vậy ds2 = -dt2 = -d 2. Bời vì tính bất biến của nguyên tố đoạn, điều kiện này phải thỏa mãn trong mọi hệ quy chiếu khác, nơi chúng có dạng
(109)
từ đó ta có
(110)
Bởi vì là thời gian đo bởi quan sát viên từ đồng hồ gắn liền với anh ta, nên thời gian này thường được gọi là thời gian riêng.
Từ đây, chúng ta định nghĩa ra vectơ-bốn vận tốc u:
(111)
mà chúng ta coi nó như là một vec tơ tiếp tuyến tiếp xúc với đường cong được xác định bởi tham số (xem phương trình (15)), ví dụ tuyến thế giới của hạt nếu u là vận tốc-bốn của hạt. Hơn nữa, theo định nghĩa của thời gian riêng trong (109) có thể dễ dàng kết luận rằng vectơ-bốn vận tốc u phải thỏa mãn điều kiện chuẩn hóa
(112)
Các biểu thức (111) và (112) được viết cho trường hợp tổng quát, do vậy chúng cũng đúng cho trường hợp được viết trong không thời gian cong mà sẽ giới thiệu ở phần tiếp theo. Dễ dàng thiết lập lên mối liên hệ giữa vectơ-bốn vận tốc u và vận tốc-ba không gian và nó được biểu diễn thông qua thành phần của vectơ-bốn vận tốc[24]
(113)
từ đây vận tốc-ba được biểu diễn bằng
(114)
Lưu ý rằng trong hệ tọa độ mà hạt đứng yên, vectơ-bốn vận tốc có thành phần