Khác biệt giữa bản sửa đổi của “Gen”

Nội dung được xóa Nội dung được thêm vào
Không có tóm lược sửa đổi
Dòng 1:
{{Annotated image 4
| caption = Gen thường là một chuỗi [[ADN]] mã hóa sản phẩm di truyền. Mỗi [[nhiễm sắc thể]] là một phân tử ADN chứa rất nhiều gen. Bộ gen của mỗi người có ngót 30.000 gen.
| alt = A chromosome unravelling into a long string of DNA, a section of which is highlighted as the gene
| image = Chromosome DNA Gene unannotated.svg
| image-width = 350
Hàng 24 ⟶ 23:
Thuật ngữ "gen" đóng vai trò cơ bản thiết yếu và quan trọng hàng đầu trong di truyền học. Nội hàm của thuật ngữ "gen" đã thay đổi nhiều kể từ khi di truyền học (genetics - tức khoa học về gen) ra đời (từ năm 1900) cho đến thế kỷ XIX hiệ nay. Trong [[sinh học phân tử]] hiện đại cũng như di truyền học phân tử hiện đại, tính từ đầu năm 2000 đến nay, đã có ít nhất 6 định nghĩa mới về gen.<ref>{{Chú thích web|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5378099/|title=The Evolving Definition of the Term “Gene”|last=Petter Portin & Adam Wilkins|first=|date=|website=|archive-url=|archive-date=|dead-url=|access-date=}}</ref> Bài viết này mới chỉ đề cập đến nội hàm của thuật ngữ gen ở thời kỳ mà nhiều nhà nghiên cứu lịch sử di truyền học gọi là "'''thời kỳ tân cổ điển'''" của di truyền học (khoảng từ những năm 1940 đến những năm 1970) và ít nhiều đề cập tới nội hàm tương đối mới đến những năm 1980.
 
Trong quá trình [[biểu hiện genegen]], trước tiên DNA được [[phiên mã|sao chép sang RNA]]. Phân tử RNA hoặc là [[RNA không mã hóa|có chức năng biệt hóa trực tiếp]] hoặc làm [[sinh tổng hợp protein|khuôn mẫu]] trung gian để tổng hợp lên [[protein]] thực hiện một chức năng nào đó. Sự chuyển giao genegen đến các sinh vật thế hệ con cháu là cơ sở của tính thừa kế các [[tính trạng]] kiểu hình. Các genegen tạo thành từ các trình tự DNA khác nhau gọi là [[kiểu genegen]]. Kiểu genegen cùng với các yếu tố môi trường và phát triển xác định lên tính trạng [[kiểu hình]]. Đa số các tính trạng sinh học chịu ảnh hưởng bởi nhiều genegen (polygene, tức một tính trạng do nhiều genegen khác nhau quyết định) cũng như [[tương tác gene–môigen–môi trường]]. Một số tính trạng di truyền có thể trông thấy ngay lập tức, ví như [[màu mắt]] hoặc số [[chi (giải phẫu học)|chi]], và một số khác thì không, như [[nhóm máu]], nguy cơ mắc các bệnh, hoặc hàng nghìn quá trình [[sinh hóa]] cơ bản cấu thành [[sự sống]].
 
Gene có thể thu nạp các [[đột biến sinh học]] nằm trong trình tự của chúng, dẫn đến những biến thể, gọi là các [[allele]], trong [[Quần thể (sinh học)|quần thể]]. Các allele này mã hóa một số phiên bản hơi khác nhau của cùng một protein, làm biểu hiện tính trạng kiểu hình khác nhau. Việc sử dụng thuật ngữ "có một genegen" (v.d., "các genegen tốt," "genegen màu tóc") thông thường nhắc tới việc bao gồm một allele khác nữa của cùng chung một genegen.
 
Khái niệm genegen liên tục được tinh chỉnh để cho phù hợp với những hiện tượng mới khám phá gần đây.<ref name=Gericke/> Ví dụ, các [[trình tự điều hòa|vùng điều hòa]] của một genegen có thể nằm rất xa các [[vùng mã hóa]] của nó, và các vùng mã hóa này có thể xen kẽ bởi các đoạn [[exon]]. Một số [[virus RNA|virus]] lưu trữ [[bộ genegen]] của chúng trong [[RNA]] thay vì ở DNA và một số sản phẩm genegen là những [[RNA không mã hóa]] có chức năng chuyên biệt. Do đó, theo nghĩa rộng, định nghĩa khoa học hiện đại về genegen là bất cứ đoạn [[Locus (di truyền)|locus]] di truyền được, đoạn trình tự trong bộ genegen ảnh hưởng tới các tính trạng của sinh vật được [[biểu hiện genegen|biểu hiện]] thành sản phẩm chức năng hoặc tham gia [[điều hòa biểu hiện genegen]].<ref name="Pearson_2006">{{cite journal | vauthors = Pearson H | title = Genetics: what is a gene? | journal = Nature | volume = 441 | issue = 7092 | pages = 398–401 | date = May 2006 | pmid = 16724031 | doi = 10.1038/441398a | bibcode = 2006Natur.441..398P }}</ref><ref name="Rethink">{{cite journal | vauthors = Pennisi E | title = Genomics. DNA study forces rethink of what it means to be a gene | journal = Science | volume = 316 | issue = 5831 | pages = 1556–1557 | date = June 2007 | pmid = 17569836 | doi = 10.1126/science.316.5831.1556 }}</ref>
 
Thuật ngữ ''genegen'' do [[thực vật học|nhà thực vật học]], [[sinh lý học thực vật]] và [[di truyền học]] người [[Đan Mạch]] [[Wilhelm Johannsen]] giới thiệu năm 1905.<ref name=Johannsen>Johannsen, W. (1905). ''Arvelighedslærens elementer'' ("The Elements of Heredity". Copenhagen). Rewritten, enlarged and translated into German as ''Elemente der exakten Erblichkeitslehre'' (Jena: Gustav Fischer, 1905; [http://caliban.mpiz-koeln.mpg.de/~stueber/johannsen/elemente/index.html Scanned full text.]</ref> Ông lấy gốc từ [[tiếng Hy Lạp cổ đại]]: γόνος, ''gonos'', có nghĩa là thế hệ con cháu và sinh sản.
 
==Lịch sử==
Hàng 38 ⟶ 37:
=== Khám phá các đơn vị di truyền độc lập ===
 
Sự tồn tại của các đơn vị độc lập có khả năng di truyền được đề xuất lần đầu tiên bởi nhà thực vật học [[Gregor Mendel]] (1822–1884).<ref>{{cite journal | vauthors = Noble D | title = Genes and causation | journal = Philosophical Transactions of the Royal Society of London. Series A, Mathematical and Physical Sciences | volume = 366 | issue = 1878 | pages = 3001–3015 | date = September 2008 | pmid = 18559318 | doi = 10.1098/rsta.2008.0086 | url = http://rsta.royalsocietypublishing.org/cgi/pmidlookup?view=long&pmid=18559318 | format = Free full text | bibcode = 2008RSPTA.366.3001N }}</ref> Từ năm 1854 đến 1863, trong một tu viện ở [[Brno]], ông đã tiến hành trồng (gần 28.000 cây) và nghiên cứu các mẫu thế hệ con cháu của 12.835 cây thực vật [[đậu Hà Lan]], theo dõi các đặc điểm khác biệt truyền từ thế hệ này sang thế hệ khác.<ref>{{cite book|last1=Magner|first1=Lois N.|title=History of the Life Sciences|year=2002|publisher=Marcel Dekker, Inc.|location=New York|isbn=978-0-2039-1100-6|page=380|edition=3, revised|url=https://books.google.com/books?id=YKJ6gVYbrGwC&pg=PA380&dq}}</ref><ref>{{cite book|last1=Gros|first1=Franc̜ois|title=The Gene Civilization|year=1992|publisher=McGraw Hill|location=New York|isbn=978-0-07-024963-9|page=28|edition=English Language|url=https://books.google.com/books?id=WmfwAAAAMAAJ&q}}</ref><ref>{{cite journal|last1=Moore|first1=Randy|title=The "Rediscovery" of Mendel’s Work|journal=Bioscene|year=2001|volume=27|issue=2|pages=13–24|url=http://courses.pbsci.ucsc.edu/mcdb/bio105/Spring15/Lecture2/Rediscovery%20of%20Mendel.pdf|deadurl=yes|archiveurl=https://web.archive.org/web/20160216153032/http://courses.pbsci.ucsc.edu/mcdb/bio105/Spring15/Lecture2/Rediscovery%20of%20Mendel.pdf|archivedate=11 February 2016}}</ref> Ông miêu tả các đặc điểm này như là [[tổ hợp (toán học)|tổ hợp toán học]] 2<sup>n</sup>&nbsp;với n là số các đặc điểm khác nhau trong các cây đậu gốc. Mặc dù ông không sử dụng thuật ngữ ''genegen'', ông đã giải thích các kết quả theo thuật ngữ các ''đơn vị rời rạc có khả năng di truyền'' làm xuất hiện các ''đặc điểm thực tế quan sát được''. Nội dung miêu tả này đã có trước phát hiện phân biệt của Wilhelm Johannsen về giữa kiểu genegen (vật liệu di truyền của một sinh vật) và kiểu hình (các đặc điểm trông thấy của sinh vật đó). Mendel cũng lần đầu tiên chứng tỏ [[di truyền Mendel|quy luật phân ly độc lập]], sự khác biệt giữa các [[Tính trội (di truyền học)|tính trạng trội]] và [[Tính trội (di truyền học)|tính trạng lặn]], sự khác biệt giữa [[dị hợp tử]] (heterozygote) và [[đồng hợp tử]] (homozygote), và hiện tượng di truyền không liên tục.
Trước khi có nghiên cứu của Mendel, ngành [[sinh học]] đã có một số tiến bộ như: nhờ phát minh [[kính hiển vi]] sơ khai của [[Antonie van Leeuwenhoek]] (thế kỷ XVII) đã mở đường cho việc quan sát thế giới [[vi sinh vật]], sự ra đời [[học thuyết tế bào|thuyết tế bào]] của [[Matthias Schleiden]] và [[Theodor Schwann]] (1838, 1839). Nhìn chung quan niệm phổ biến về di truyền thời đó vẫn là ''di truyền các tính trạng tập nhiễm'' và ''di truyền hòa hợp'' (blending inheritance), cho rằng các cá thể thừa kế từ bố mẹ một hỗn hợp pha trộn các tính trạng, ví dụ như lai cây hoa đỏ với hoa trắng sẽ cho ra hoa hồng. [[Charles Darwin]] đã phát triển một lý thuyết về di truyền mà ông gọi là [[pangenesis]] (thuyết mầm, thuyết pangen), từ tiếng Hy Lạp cổ pan ("mọi, toàn thể") và genesis ("sự sinh") / genos ("nguồn gốc").<ref>{{OED|genesis}}</ref><ref>{{cite book |last = Magner |first = Lois N. |title = A History of the Life Sciences |edition = Third |publisher = Marcel Dekker, CRC Press |year = 2002 |isbn = 978-0-203-91100-6 |url = https://books.google.com/?id=YKJ6gVYbrGwC&printsec=frontcover#v=onepage&q|page=371}}</ref> Darwin sử dụng thuật ngữ ''gemmule'' (''mầm sinh'') để miêu tả các hạt giả thuyết mà chúng được trộn với nhau trong quá trình sinh sản.
Hàng 44 ⟶ 43:
Tuy nhiên giới khoa học đương thời đã không hiểu và đánh giá được tầm vóc của khám phá Mendel sau khi ông công bố nghiên cứu vào năm 1866. Mãi đến năm 1900 ba nhà sinh học [[Hugo de Vries]], [[Carl Correns]], và [[Erich von Tschermak]] độc lập nhau đã thực hiện các thí nghiệm và đi đến các kết luận tương tự trước khi họ biết tới các nghiên cứu của Mendel.<ref>{{cite book|ref=harv |last=Henig|first= Robin Marantz |title=The Monk in the Garden: The Lost and Found Genius of Gregor Mendel, the Father of Genetics |publisher=Houghton Mifflin |location=Boston |year=2000 |isbn=978-0395-97765-1|pages=1–9}}</ref> Đặc biệt, năm 1889, Hugo de Vries xuất bản cuốn sách của ông ''Intracellular Pangenesis'',<ref>Vries, H. de, ''Intracellulare Pangenese'', Verlag von Gustav Fischer, [[Jena]], 1889. Translated in 1908 from German to English by C. Stuart Gager as [http://www.esp.org/books/devries/pangenesis/facsimile/ ''Intracellular Pangenesis''], Open Court Publishing Co., Chicago, 1910</ref> trong đó ông dự đoán rằng các tính trạng riêng biệt có từng đơn vị di truyền độc lập và sự kế thừa các tính trạng này trong sinh vật đến từ các hạt mầm. De Vries gọi những đơn vị này là "pangenes" (''Pangens'' trong [[tiếng Đức]]), dựa theo lý thuyết pangenesis năm 1868 của Darwin.
 
Trong các năm 1902-1903, dựa trên các quan sát của nhiều nhà khoa học, trong đó có [[Walther Flemming]] về nhiễm sắc thể trong quá trình [[phân bào]], hai nhà khoa học [[Walter Sutton]] và [[Theodor Boveri]] đã độc lập với nhau cùng khởi xướng [[Học thuyết di truyền nhiễm sắc thể]]. Trong bài báo của ông, Sutton nhấn mạnh vào sự quan trọng khi ông quan sát thấy nhóm NST lưỡng bội chứa hai tập hợp có hình thái (morphology) giống nhau, và trong [[giảm phân]], mỗi [[giao tử]] chỉ nhận được một NST từ mỗi cặp NST tương đồng. Sau đó ông sử dụng quan sát này để giải thích các kết quả của Mendel bằng cách giả thiết rằng các genegen nằm trên nhiễm sắc thể.<ref>{{chú thích tạp chí|title=The Chromosomes in Heredity|journal=Biological Bulletin|volume=4|page=231-251|url=http://old.esp.org/foundations/genetics/classical/holdings/s/wss-03.pdf|year=1903}}</ref>
 
Năm 1905, Wilhelm Johannsen đã giới thiệu các thuật ngữ 'gene', 'genotype' và 'phenotype'<ref name="Johannsen"/> và [[William Bateson]] đưa ra thuật ngữ '[[di truyền học]]' ('genetic')<ref name="Gerstein"/>.
 
Trong thập niên 1910, [[Thomas Hunt Morgan]] cùng với cộng sự đã xây dựng thành công thuyết di truyền nhiễm sắc thể (chromosome theory of inheritance) dựa trên đối tượng nghiên cứu là ruồi giấm [[Drosophila melanogaster]]. Học thuyết này xác nhận rằng genegen là đơn vị cơ sở của tính di truyền nằm trên nhiễm sắc thể (ở
trong nhân); trên đó các genegen sắp xếp theo đường thẳng tạo thành nhóm liên kết.<ref name="Fisher">{{Cite journal | last1 = Fisher | first1 = R. A. | authorlink1 = Ronald Fisher| last2 = De Beer | first2 = G. R. | doi = 10.1098/rsbm.1947.0011 | title = Thomas Hunt Morgan. 1866-1945 | journal = Obituary Notices of Fellows of the Royal Society | volume = 5 | issue = 15 | pages = 451–466 | year = 1947 | pmid = | jstor = 769094}}</ref>
 
=== Sự khám phá DNA ===
 
Quá trình nghiên cứu genegen và di truyền tiếp tục đạt được những tiến bộ trong thế kỷ XX. Trước đó [[Friedrich Miescher]] (1869) đã khám phá ra một hỗn hợp trong nhân tế bào gọi là 'nuclein' mà sau đó [[Albrecht Kossel]] (1878) đã cô lập được thành phần không phải protein trong nuclein gọi là axit deoxyribonucleic. DNA được chứng tỏ là những phân tử chứa thông tin di truyền qua các thí nghiệm thực hiện trong thập niên 1940 đến thập niên 1950<ref name=Avery_et_al>{{cite journal |doi=10.1084/jem.79.2.137 |last1=Avery |first1=OT |last2=MacLeod |first2=CM |last3=McCarty |first3=M |title=Studies on the Chemical Nature of the Substance Inducing Transformation of Pneumococcal Types: Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type III |journal=The Journal of Experimental Medicine |volume=79 |issue=2 |pages=137–58 |year=1944 |pmid=19871359 |pmc=2135445}} Reprint: {{cite journal |pmid=33226 |year=1979 |last1=Avery |first1=OT |last2=MacLeod |last3=McCarty |title=Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Inductions of transformation by a desoxyribonucleic acid fraction isolated from pneumococcus type III |volume=149 |issue=2 |pages=297–326 |journal=The Journal of Experimental Medicine |doi=10.1084/jem.149.2.297 |first2=CM |first3=M |pmc=2184805}}</ref><ref>{{cite journal |doi= 10.1085/jgp.36.1.39 |pmid=12981234 |pmc=2147348 |year= 1952 |last1= Hershey |first1= AD |last2= Chase |title= Independent functions of viral protein and nucleic acid in growth of bacteriophage |volume= 36 |issue= 1 |pages= 39–56 |journal= The Journal of General Physiology |first2= M}}</ref> (xem [[thí nghiệm Avery–MacLeod–McCarty]], [[thí nghiệm Hershey–Chase]]). Nhờ kết quả nghiên cứu cấu trúc DNA bởi [[Rosalind Franklin]] và [[Maurice Wilkins]] bằng phương pháp [[tinh thể học tia X]], đã giúp [[James D. Watson]] và [[Francis Crick]] đề xuất ra mô hình đúng về phân tử sợi xoắn kép DNA mà nguyên tắc ghép cặp [[nucleobase]] hàm ý giả thiết cho cơ chế sao chép vật liệu di truyền.<ref>{{cite book |title=The Eighth Day of Creation: Makers of the Revolution in Biology |last=Judson |first=Horace |year=1979 |publisher=Cold Spring Harbor Laboratory Press |isbn=0-87969-477-7 |pages=51–169}}</ref><ref name=watsoncrick_1953a>{{cite journal |url=http://www.nature.com/nature/dna50/watsoncrick.pdf |doi=10.1038/171737a0 |title=Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid |year=1953 |last1=Watson |first1=J. D. |last2=Crick |journal=Nature |volume=171 |pages=737–8 |pmid=13054692 |first2=FH |issue=4356 |bibcode=1953Natur.171..737W}}</ref>
 
Những năm đầu thập niên 1950, đa số các nhà sinh học có quan điểm cho rằng các genegen trong một nhiễm sắc thể hoạt động giống như những đoạn rời rạc, không thể phân chia được bằng cách tái tổ hợp và sắp xếp như những hạt trên một chuỗi. Thí nghiệm của [[Seymour Benzer]] sử dụng các khuyết tật [[đột biến]] ở vùng rII của [[thể thực khuẩn]] T4 (1955-1959) đã chứng tỏ từng genegen có một cấu trúc thẳng đơn giản và dường như là tương đương với một đoạn của sợi DNA.<ref name="pmid16589677">{{cite journal |vauthors=Benzer S |title=Fine Structure of A Genetic Region in Bacteriophage |journal=Proc. Natl. Acad. Sci. U.S.A. |volume=41 |issue=6 |pages=344–54 |year=1955 |pmid=16589677 |pmc=528093 |doi= 10.1073/pnas.41.6.344 }}</ref><ref name="pmid16590553">{{cite journal |vauthors=Benzer S |title=On the Topology of the Genetic Fine Structure |journal=Proc. Natl. Acad. Sci. U.S.A. |volume=45 |issue=11 |pages=1607–20 |year=1959 |pmid=16590553 |pmc=222769 |doi= 10.1073/pnas.45.11.1607|url=}}</ref>
 
Bằng các thí nghiệm gây [[đột biến]] các genegen liên quan đến các con đường sinh hóa trên nấm mốc bánh mỳ Neurospora crassa, năm 1941 [[George Wells Beadle|George Beadle]] và [[Edward Lawrie Tatum|Edward Tatum]] xác nhận mỗi genegen kiểm soát phản ứng sinh hóa tổng hợp một enzyme đặc thù.<ref name="PNAS 1941">{{Chú thích tạp chí |authors=Beadle G.W, Tatum E.L |date = 15 November 1941 |title = Genetic Control of Biochemical Reactions in Neurospora |journal = PNAS
|volume = 27 | issue = 11 | pages = 499–506 |doi=10.1073/pnas.27.11.499 |pmc=1078370 |pmid=16588492 |bibcode = 1941PNAS...27..499B }}</ref> Kết quả này đưa hai ông đến [[giả thiết một genegen-một enzymeenzym]] mà về sau được chính xác hóa là một genegen xác định chỉ một chuỗi polypeptide, cấu trúc bậc 1 của protein, trong đó có các enzyme.<ref>Berg P, Singer M. [https://books.google.com/books?id=XsyJXxHaDPQC&pg=PA307&lpg=PA307&dq=history+%22one+gene+one+polypeptide%22&source=bl&ots=gJVxP_VyO7&sig=3WLBBdCrXQUT7Bmmb7LbeT9nX2Y&hl=en&ei=N3LrSp6yLIXcNt6-wYMM&sa=X&oi=book_result&ct=result&resnum=9&ved=0CCEQ6AEwCA#v=onepage&q=history%20%22one%20gene%20one%20polypeptide%22&f=false George Beadle, an uncommon farmer: the emergence of genetics in the 20th century], CSHL Press, 2003. {{ISBN|0-87969-688-5}}, {{ISBN|978-0-87969-688-7}}</ref>
 
Từ những kết quả nghiên cứu thu nạp dần đã hình thành lên [[luận thuyết trung tâm]] của sinh học phân tử, phát biểu rằng các protein được dịch mã từ RNA, mà đến lượt RNA được phiên mã từ DNA. Tuy vậy, sau này luận thuyết được chỉ ra có những ngoại lệ, ví dụ như [[phiên mã ngược]] ở [[retrovirus]]. Ngành di truyền hiện đại nghiên cứu ở cấp độ DNA được biết đến là [[di truyền phân tử]].
 
Năm 1972, [[Walter Fiers]] và cộng sự ở [[Đại học Ghent]] đã lần đầu tiên xác định được trình tự của một genegen: đó là genegen mã hóa cho protein vỏ bọc của [[thể thực khuẩn MS2]].<ref name=Min_1972>{{cite journal | authors = M, Fiers W et al | title = Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein | journal = Nature | volume = 237 | issue = 5350 | pages = 82–8 | date = May 1972 | pmid = 4555447 | doi = 10.1038/237082a0 | bibcode = 1972Natur.237...82J }}</ref> Những phát triển sau đó của [[xác định trình tự DNA]] bằng kỹ thuật [[Phương pháp Dideoxy|gián đoạn chuỗi]] bởi [[Frederick Sanger]] năm 1977 đã nâng cao hiệu quả giải trình tự và giúp nó trở thành công cụ thường xuyên trong các phòng thí nghiệm.<ref name=sanger_et_al>{{cite journal |doi=10.1073/pnas.74.12.5463 |pmid=271968 |pmc=431765 |year=1977 |last1=Sanger |first1=F et al |title=DNA sequencing with chain-terminating inhibitors |volume=74 |issue=12 |pages=5463–7 |journal=Proceedings of the National Academy of Sciences of the United States of America |bibcode=1977PNAS...74.5463S}}</ref> Một kỹ thuật tự động của phương pháp Sanger đã được áp dụng ở giai đoạn đầu của [[Dự án bản đồ gen người|dự án giải mã bộ genegen ở người]].<ref name=scitable_adams>{{cite journal|last1=Adams|first1=Jill U.|title=DNA Sequencing Technologies|url=http://www.nature.com/scitable/topicpage/dna-sequencing-technologies-690|journal=Nature Education Knowledge|date=2008|volume=1|issue=1|page=193|series=SciTable|publisher=Nature Publishing Group}}</ref>
 
=== Thuyết tổng hợp hiện đại ===
Hàng 68 ⟶ 67:
Một số lý thuyết đã được phát triển đầu thế kỷ XX nhằm kết hợp giữa [[di truyền Mendel]] với [[thuyết tiến hóa|thuyết tiến hóa Darwin]] được gọi là [[thuyết tổng hợp hiện đại (thế kỷ XX)|thuyết tổng hợp hiện đại]], một thuật ngữ do [[Julian Huxley]] giới thiệu.<ref>{{cite book |last1=Huxley |first1=Julian |title=Evolution: the Modern Synthesis |date=1942 |publisher=MIT Press |location=Cambridge, Mass. |isbn=978-0262513661}}</ref>
 
Các nhà sinh tiến hóa sau đó đã chỉnh sửa bổ sung khái niệm này, như quan điểm genegen là đối tượng trung tâm của tiến hóa nêu ra bởi [[George C. Williams (nhà sinh học)|George C. Williams]]. Ông đề xuất một khái niệm genegen tiến hóa như là một đơn vị của [[chọn lọc tự nhiên]] với định nghĩa: "nó là cái tách biệt và tái kết hợp với tần số phù hợp."<ref>{{cite book |last1=Williams |first1=George C. |title=Adaptation and Natural Selection a Critique of Some Current Evolutionary Thought |date=2001 |publisher=Princeton University Press |location=Princeton |isbn=9781400820108 |edition=Online}}</ref>{{rp|24}} Theo quan điểm này, phân tử genegen ''phiên mã'' như là một đơn vị, và genegen tiến hóa ''kế thừa'' như là một đơn vị. Các ý tưởng liên quan nhấn mạnh vào vai trò trung tâm của genegen trong tiến hóa được [[Richard Dawkins]] thảo luận trong các cuốn sách phổ biến khoa học.<ref>{{cite book |last1=Dawkins |first1=Richard |title=The selfish gene |date=1977 |publisher=Oxford University Press |location=London |isbn=0-19-857519-X |edition=Repr. (with corr.)}}</ref><ref>{{cite book|last1=Dawkins |first1=Richard |title=The extended phenotype |date=1989 |publisher=Oxford University Press |location=Oxford |isbn=0-19-286088-7|edition=Paperback}}</ref>
 
==Cơ sở phân tử==
Hàng 76 ⟶ 75:
 
=== DNA ===
Hầu hết các sinh vật sống mã hóa genegen của chúng trong những chuỗi dài DNA (axit deoxyribonucleic). DNA bao gồm một [[polyme|chuỗi]] cấu thành từ bốn loại tiểu đơn vị [[nucleotide]], mỗi tiểu đơn vị cấu tạo bởi: một đường năm cacbon ([[deoxyribose|2'-deoxyribose]]), một nhóm [[phosphat]], và một trong bốn [[nucleobase|base]] [[adenine]], [[cytosine]], [[guanine]], và [[thymine]].<ref name="MBOC">{{cite book | first1 = Bruce | last1 = Alberts | first2 = Alexander | last2 = Johnson | first3 = Julian | last3 = Lewis | first4 = Martin | last4 = Raff | first5 = Keith | last5 = Roberts | first6 = Peter | last6 = Walter | name-list-format = vanc | title = Molecular Biology of the Cell | edition = Fourth | publisher = Garland Science | location = New York | year = 2002 | isbn = 978-0-8153-3218-3 | url = https://www.ncbi.nlm.nih.gov/books/NBK21054/}}</ref>{{rp|2.1}}
 
Hai sợi DNA xoắn quanh nhau tạo thành chuỗi xoắn kép DNA với bộ khung xoắn đường-phosphat bao ngoài, và các base hướng vào trong mà adenine bắt cặp với thymine và guanine bắt cặp với cytosine. Sự bắt cặp base đặc biệt này xảy ra bởi vì ở mỗi adenine và thymine hình thành 2 liên kết hiđrô với nhau, trong khi ở mỗi cytosine và guanine hình thành 3 liên kết hiđrô với nhau. Do vậy hai sợi trong chuỗi xoắn kép liên kết với nhau tuân theo [[nguyên tắc bổ sung]], với trình tự của các base bắt cặp sao cho các adenine của một sợi được bắt cặp với các thymine sợi kia, và cứ tương tự như thế.<ref name=MBOC/>{{rp|4.1}}
Hàng 82 ⟶ 81:
Do tính chất hóa học của phần dư [[pentose]] của các base, các sợi DNA có tính xác định hướng. Một đầu cuối của polyme DNA chứa nhóm [[hydroxyl]] lộ ra khỏi [[deoxyribose]]; vị trí này được gọi là đầu 3' của phân tử. Đầu cuối còn lại chứa nhóm [[phosphat]] lộ ra; hay còn gọi là đầu 5'. Hai sợi của chuỗi xoắn kép chạy theo hướng ngược nhau. Các quá trình tổng hợp axit nucleic, bao gồm [[Quá trình nhân đôi DNA|tái bản DNA]] và [[phiên mã]] diễn ra theo chiều đầu 5'→3', bởi vì các nucleotide mới được ghép vào thông qua phản ứng [[khử nước]] khi sử dụng đầu 3'&nbsp;hydroxyl như là chất phản ứng [[nucleophile]] (chất cho một cặp electron để tạo thành liên kết hóa học).<ref name = "Stryer_2002">{{cite book |vauthors=Stryer L, Berg JM, Tymoczko JL | title = Biochemistry | publisher = W.H. Freeman | location = San Francisco | year = 2002 | edition = 5th | isbn = 0-7167-4955-6 | url = https://www.ncbi.nlm.nih.gov/books/NBK21154/ }}</ref>{{rp|27.2}}
 
Sự [[biểu hiện genegen]] được mã hóa trong DNA bắt đầu bằng quá trình [[dịch mã]] genegen thành RNA, một loại axit nucleic thứ hai rất giống với DNA, nhưng các monome chứa đường [[ribose]] thay cho đường [[deoxyribose]]. RNA cũng chứa base [[uracil]] thay cho [[thymine]]. Các phân tử RNA ít bền hơn DNA và thường là sợi đơn trong dạng điển hình. Các genegen mã hóa cho các protein chứa một dãy các trình tự ba [[nucleotide]] được gọi là các [[codon]], phục vụ như các "từ" trong "ngôn ngữ" di truyền. [[Mã di truyền]] xác định lên protein trong quá trình dịch mã giữa codon và [[axit amin]]. Mã di truyền gần như là như nhau ở mọi sinh vật sống đã biết.<ref name=MBOC/>{{rp|4.1}}
 
=== Nhiễm sắc thể ===
[[Tập tin:PLoSBiol3.5.Fig7ChromosomesAluFish.jpg|nhỏ|upright=1.6|alt=A microscopy image of 46 chromosomes striped with red and green bands|Ảnh chụp qua kính hiển vi huỳnh quang cho thấy 23 cặp [[nhiễm sắc thể]] ở nữ. DNA được [[hiển vi huỳnh quang|thể hiện màu]] đỏ, với những vùng giàu các genegen nội dịch (housekeeping gene) được thể hiện thêm bằng màu lục. Nhiễm sắc thể lớn nhất có số lượng base lớn gấp 50 lần của NST nhỏ nhất.<ref>{{cite journal|last1=Bolzer|first1=Andreas et al|title=Three-Dimensional Maps of All Chromosomes in Human Male Fibroblast Nuclei and Prometaphase Rosettes|journal=PLoS Biology|date=2005|volume=3|issue=5|pages=e157|doi=10.1371/journal.pbio.0030157|pmid=15839726|pmc=1084335}} {{open access}}</ref>]]
Toàn bộ đầy đủ các genegen trong một sinh vật hoặc tế bào được biết đến như là [[bộ gene]], mà chúng lưu trữ trong một hoặc nhiều [[nhiễm sắc thể]]. Một NST chứa một chuỗi xoắn kép DNA rất dài (cùng với các protein hỗ trợ khác) mà trên đó có hàng nghìn genegen được mã hóa.<ref name=MBOC/>{{rp|4.2}} Vùng NST tại đó chứa một genegen đặc biệt được gọi là [[locus (di truyền học)|locus]]. Mỗi locus chứa một [[allele]] của gene; tuy nhiên, các thành viên trong một quần thể có thể có các allele khác nhau tại locus, mà mỗi allele chỉ hơi khác nhau về trình tự genegen.
 
Phần lớn các genegen của [[sinh vật nhân thực]] được lưu trong một tập lớn, các sợi NST. Các NST được vo lại trong [[nhân tế bào]] như búi với sự hỗ trợ của các protein [[histone]] để tạo thành một đơn vị gọi là [[nucleosome]]. DNA đóng gói và cô đặc theo cách này được gọi là [[chromatin]] (chất nhiễm sắc).<ref name=MBOC/>{{rp|4.2}} Cách thức DNA quấn bao quanh các histone, cũng như các sửa đổi hóa học của chính histone, giúp điều hòa một vùng DNA cụ thể nơi quá trình [[biểu hiện genegen]] có thể thực hiện được. Ngoài các đoạn gene, trong nhiễm sắc thể của sinh vật nhân thực còn chứa các trình tự giúp đảm bảo quá trình tái bản DNA diễn ra bình thường mà không làm suy giảm các vùng đầu cuối DNA và giúp sắp xếp chúng vào các tế bào con trong quá trình phân bào: vùng khởi điểm tái bản (replication origin), [[telomere]] và [[tâm động]] (centromere).<ref name=MBOC/>{{rp|4.2}} Vùng khởi điểm tái bản là những vùng trình tự nơi quá trình tái bản DNA được bắt đầu diễn ra (có thể tại một hoặc nhiều vị trí trên NST). Telomere (đầu mút) là những đoạn trình tự dài và lặp lại nằm ở những đoạn đầu hoặc cuối cùng của NST có chức năng ngăn cản sự thoái hóa của các vùng trình tự điều hòa và mã hóa trong quá trình tái bản DNA. Độ dài của các telomere giảm đi mỗi lần bộ genegen được sao chép và được phát hiện có liên quan đến quá trình [[lão hóa]] tế bào.<ref name="Braig">{{cite journal | vauthors = Braig M, Schmitt CA | title = Oncogene-induced senescence: putting the brakes on tumor development | journal = Cancer Research | volume = 66 | issue = 6 | pages = 2881–4 | date = March 2006 | pmid = 16540631 | doi = 10.1158/0008-5472.CAN-05-4006 }}</ref> Vị trí tâm động là nơi các sợi thoi (spindle fibre, hoặc microtubule) bám vào để tách hai chromatid chị em dính nhau ở tâm động trong quá trình [[phân bào]].<ref name=MBOC/>{{rp|18.2}}
 
[[Sinh vật nhân sơ]] ([[vi khuẩn]] và [[vi khuẩn cổ]]) thông thường lưu giữ bộ genegen của chúng trên một sợi nhiễm sắc thể dạng vòng có kích thước lớn (circular chromosome, xem [[DNA siêu xoắn]]). Tương tự, ở một số [[bào quan]] ở sinh vật nhân thực có chứa một NST mạch vòng còn sót loại mà trên đó có một số ít các genegen.<ref name="MBOC" />{{rp|14.4}} Thỉnh thoảng sinh vật nhân sơ bổ sung vào NST của chúng thêm những vòng nhỏ DNA gọi là [[plasmid]], mà thường chỉ mã hóa một số genegen và có thể trao đổi được giữa các cá thể. Ví dụ, các genegen có khả năng giúp vi sinh vật [[Kháng thuốc kháng sinh|kháng kháng sinh]] và mang lại cho plasmid khả năng tự sao chép độc lập giữa các tế bào, thậm chí của các chủng loài khác nhau, thông qua cơ chế chuyển genegen ngang (horizontal gene transfer).<ref name=bennett>{{cite journal|last1=Bennett|first1=PM|title=Plasmid encoded antibiotic resistance: acquisition and transfer of antibiotic resistance genes in bacteria.|journal=British Journal of Pharmacology|date=March 2008|volume=153 Suppl 1|pages=S347–57|pmid=18193080|doi=10.1038/sj.bjp.0707607|pmc=2268074}}</ref>
 
Trong khi ở nhiễm sắc thể của sinh vật nhân sơ có mật độ tập trung genegen tương đối cao, thì ở sinh vật nhân thực thường chứa các vùng DNA mà chức năng của nó không rõ ràng. Sinh vật nhân thực đơn bào đơn giản có tương đối ít lượng DNA như thế, trong khi bộ genegen phức tạp của những [[sinh vật đa bào]], bao gồm [[con người]], chứa rất nhiều đoạn DNA mã vẫn chưa giải mã được chức năng của chúng.<ref name="IHSGC2004">{{cite journal | author = International Human Genome Sequencing Consortium | title = Finishing the euchromatic sequence of the human genome | journal = Nature | volume = 431 | issue = 7011 | pages = 931–45 | date = October 2004 | pmid = 15496913 | doi = 10.1038/nature03001 | url = http://www.nature.com/nature/journal/v431/n7011/full/nature03001.html | bibcode = 2004Natur.431..931H }}</ref> Các nhà sinh học phân tử thường coi những vùng này là những ''đoạn DNA rác'' ("junk DNA"). Tuy nhiên, những phân tích gần đây gợi ý rằng mặc dù các vùng DNA mã hóa protein chỉ chiếm 2% trong [[bộ genegen người]], khoảng 80% số lượng base trong bộ genegen có thể được biểu hiện, do đó "đoạn rác DNA" có thể bị sử dụng nhầm tên gọi.<ref name="Rethink" />
 
== Cấu trúc ==
{{Annotated image 4
| caption = Cấu trúc của một genegen mã hóa protein ở '''sinh vật nhân thực'''. Trình tự điều hòa kiểm soát ở đâu và vào lúc nào sự biểu hiện xảy ra đối với vùng mã hóa protein (đỏ). [[vùng gen khởi động|Vùng khởi động]] (promoter) và [[vùng genegen tăng cường|tăng cường]] (enhancer) (vàng) điều hòa [[phiên mã]] genegen thành phân tử pre-mRNA mà được [[sửa đổi sau phiên mã|sửa đổi]] để loại bỏ các [[intron]] (xám nhạt) và thêm vào đầu 5' và đuôi poly-A (xám đậm). Các vùng không được dịch mã của mRNA là đầu [[5' UTR|5']] và đầu [[3' UTR|3']] (lam) điều hòa [[dịch mã (sinh học)|dịch mã]] thành chuỗi [[polypeptide]] trước khi thành sản phẩm protein cuối cùng.<ref name="ShafeeLowe2017">{{cite journal|last1=Shafee|first1=Thomas|last2=Lowe|first2=Rohan|title=Eukaryotic and prokaryotic gene structure|journal=WikiJournal of Medicine|volume=4|issue=1|year=2017|issn=20024436|doi=10.15347/wjm/2017.002}}</ref>
 
| alt = Sơ đồ cấu trúc genegen của sinh vật nhân thực
| image = Gene_structure_eukaryote_2_unannotated.svg
| image-width = 600
Hàng 150 ⟶ 149:
}}
{{Annotated image 4
| caption = Cấu trúc của một [[operon]] ở '''sinh vật nhân sơ''' về gene mã hóa protein. Các trình tự điều hòa kiểm soát khi nào quá trình biểu hiện genegen diễn ra đối với nhiều vùng mã hóa protein (đỏ). Các vùng [[vùng gen khởi động|promoter]], [[w:operator (biology)|operator]] và [[w:enhancer (genetics)|enhancer]] (vàng) điều hòa phiên mã gene thành một mRNA. Các vùng không dịch mã (lam) của mRNA điều hòa sự dịch mã thành các sản phẩm protein cuối cùng.<ref name="ShafeeLowe2017">{{cite journal|last1=Shafee|first1=Thomas|last2=Lowe|first2=Rohan|title=Eukaryotic and prokaryotic gene structure|journal=WikiJournal of Medicine|volume=4|issue=1|year=2017|issn=20024436|doi=10.15347/wjm/2017.002}}</ref>
 
| alt = Sơ đồ cấu trúc gene của sinh vật nhân sơ
Hàng 200 ⟶ 199:
 
}}
[[cấu trúc gene|Cấu trúc]] của một genegen chứa nhiều yếu tố mà những [[vùng mã hóa|trình tự mã hóa protein]] thực sự chỉ là một phần nhỏ trong đó. Chúng bao gồm các vùng DNA không được phiên mã cũng như các vùng RNA không được dịch mã.
 
Tại hai bên [[khung đọc mở]], mỗi gene chứa một [[trình tự điều hòa]] cần thiết cho sự biểu hiện của nó. Đầu tiên, gene cần một trình tự [[vùng gen khởi động|khởi động (promoter)]]. Các [[yếu tố phiên mã]] (transcription factors) nhận ra và liên kết với vùng trình tự khởi động, sau đó [[RNA polymerase]] thực hiện khởi phát quá trình phiên mã.<ref name="MBOC" />{{rp|7.1}} Việc nhận ra này thường nằm ở [[hộp TATA]] trong vùng khởi động. Một gene có thể có nhiều hơn một vùng khởi động, làm cho các RNA thông tin (mRNA) khác nhau ở độ dài của đầu 5'.<ref>{{cite journal | authors = Mortazavi A et al | title = Mapping and quantifying mammalian transcriptomes by RNA-Seq | journal = Nature Methods | volume = 5 | issue = 7 | pages = 621–8 | date = July 2008 | pmid = 18516045 | doi = 10.1038/nmeth.1226 }}</ref> Những gene thường xuyên được phiên mã có những trình tự khởi động "mạnh" tức là tạo thành liên kết mạnh với các yếu tố phiên mã, do vậy khởi phát phiên mã ở tốc độ cao. Những gene khác có những vùng trình tự khởi động "yếu" mà liên kết yếu với các yếu tố phiên mã và do vậy sự phiên mã đối với các genegen này xảy ra ít hơn.<ref name="MBOC" />{{rp|7.2}} Các vùng trình tự khởi động ở sinh vật nhân thực có cấu trúc phức tạp hơn và khó nhận diện hơn so với ở sinh vật nhân sơ.<ref name="MBOC" />{{rp|7.3}}
 
Thêm vào đó, các genegen có thể chứa những vùng điều hòa có độ dài hàng kilobase nằm ở bên trái hoặc bên phải khung đọc mở dẫn đến làm thay đổi mức độ biểu hiện. Những vùng này hoạt động bằng cách [[vị trí liên kết DNA|liên kết]] với các yếu tố phiên mã khiến cho DNA tạo thành mạch vòng do đó trình tự điều hòa (và yếu tố phiên mã bám vào) trở lên rất gần với RNA polymerase tại vị trí liên kết.<ref name="5questions">{{Cite journal | doi = 10.1038/nrg3458| pmid = 23503198| title = Enhancers: Five essential questions| journal = Nature Reviews Genetics| volume = 14| issue = 4| pages = 288–95| year = 2013| last1 = Pennacchio | first1 = L. A. et al | pmc=4445073}}</ref> Ví dụ, các vùng tăng cường (enhancer) làm tăng tốc độ phiên mã bằng cách liên kết với một protein kích hoạt (activator protein) giúp kéo phân tử RNA polymerase đến vùng khởi động; ngược lại vùng bất hoạt (silencer) bám với protein ức chế (repressor protein) làm cho DNA trở lên ít hoạt động với RNA polymerase.<ref>{{Cite journal | doi = 10.1146/annurev.genom.7.080505.115623| pmid = 16719718| title = Transcriptional Regulatory Elements in the Human Genome| journal = Annual Review of Genomics and Human Genetics| volume = 7| pages = 29–59| year = 2006| last1 = Maston | first1 = G. A. et al }}</ref>
 
Phân tử tiền mRNA ([[pre-mRNA]]) chứa những [[vùng không dịch mã]] ở cả hai đầu mà trong mỗi đầu chứa [[vị trí liên kết ribosome]], vùng kết thúc (terminator) và các [[codon khởi đầu]] và [[codon kết thúc]].<ref>{{Cite journal|title = Untranslated regions of mRNAs|url = http://genomebiology.com/2002/3/3/reviews/0004/abstract|journal = Genome Biology|date = 2002-02-28|issn = 1465-6906|pmid = 11897027|pages = reviews0004|volume = 3|issue = 3|doi = 10.1186/gb-2002-3-3-reviews0004|first = Flavio|last = Mignone et al|pmc=139023}}</ref> Thêm vào đó, ở hầu hết khung đọc mở của sinh vật nhân thực chứa các đoạn [[intron]] không dịch mã mà sẽ được loại bỏ trước khi các đoạn [[exon]] được dịch mã. Các trình tự ở cuối mỗi intron, quyết định các vị trí cắt (splice site, RNA splicing) để tạo ra [[mRNA]] thành thục cuối cùng, dùng để mã hóa cho protein hoặc sản phẩm RNA khác.<ref>{{cite journal |pmid = 23108796|doi = 10.1002/bies.201200073 |volume = 34 |issue = 12|title = Introns in UTRs: why we should stop ignoring them |date = December 2012 |pages = 1025–34 |authors=Bicknell AA et al |journal = BioEssays}}</ref>
 
Nhiều gene ở sinh vật nhân sơ được tổ chức thành các đơn vị [[operon]], với nhiều trình tự mã hóa protein được phiên mã nằm trong nó.<ref>{{Cite journal | last1 = Salgado | first1 = H. et al | title = Operons in Escherichia coli: Genomic analyses and predictions | doi = 10.1073/pnas.110147297 | journal = Proceedings of the National Academy of Sciences | volume = 97 | issue = 12 | pages = 6652–6657 | year = 2000 | pmid = 10823905 | pmc =18690 |bibcode = 2000PNAS...97.6652S }}</ref><ref>{{Cite journal |title = Operons in eukaryotes|url = http://bfg.oxfordjournals.org/content/3/3/199|journal = Briefings in Functional Genomics & Proteomics|date = November 2004|issn = 2041-2649|pmid = 15642184|pages = 199–211|volume = 3|issue = 3|doi = 10.1093/bfgp/3.3.199|first = Thomas|last = Blumenthal}}</ref> Các gene trong một operon được phiên mã như là một mRNA liên tục, mà coi nó như là polycistronic mRNA. Thuật ngữ [[cistron]] trong bối cảnh này tương đương với khái niệm genegen. Sự phiên mã của một operon của mRNA thường bị kiểm soát bởi phân tử ức chế (repressor), mà trạng thái hoạt động hay bị cấm của sự phiên mã phụ thuộc vào sự có mặt những [[chất chuyển hóa]] nhất định.<ref name="Jacob F"/> Khi phân tử ức chế hoạt động, nó bám vào một trình tự DNA nằm ở vị trí khởi đầu của operon, được gọi là vùng operator, làm cản trở sự phiên mã của operon; khi phân tử ức chế bất hoạt, sự phiên mã ở operon có thể xảy ra (xem ví dụ [[Lac operon]]). Các sản phẩm của gene operon thường có những chức năng liên quan và tham gia vào cùng [[mạng lưới điều hòa gene]].<ref name="MBOC" />{{rp|7.3}}
 
=== Định nghĩa theo chức năng ===
Các nhà sinh học phân tử gặp phải khó khăn khi muốn định nghĩa chính xác phần nào của một trình tự DNA chứa một genegen.<ref name="Gericke">{{cite journal|last1=Gericke|first1=Niklas Markus|last2=Hagberg|first2=Mariana|title=Definition of historical models of gene function and their relation to students' understanding of genetics|journal=Science & Education|date=5 December 2006|volume=16|issue=7–8|pages=849–881|doi=10.1007/s11191-006-9064-4|bibcode = 2007Sc&Ed..16..849G }}</ref> Các vùng điều hòa của một genegen như vùng tăng cường không cần thiết phải nằm gần với trình tự mã hóa trên mạch dài phân tử bởi vì các đoạn DNA trung gian có thể tạo vòng lồi ra (loop out) giúp mang gene và vùng trình tự điều hòa của nó đến gần nhau. Tương tự, các đoạn intron của một genegen có thể dài hơn rất nhiều so với các đoạn exon của nó. Các vùng điều hòa thậm chí có thể nằm hoàn toàn trên nhiễm sắc thể khác và hoạt động từ xa (''in trans'') khi cho phép vùng điều hòa trên một nhiễm sắc thể đến gần với các genegen đích nằm trên nhiễm sắc thể khác.<ref>{{cite journal | authors = Spilianakis CG et al | title = Interchromosomal associations between alternatively expressed loci | journal = Nature | volume = 435 | issue = 7042 | pages = 637–45 | date = June 2005 | pmid = 15880101 | doi = 10.1038/nature03574 | bibcode = 2005Natur.435..637S }}</ref><ref>{{cite journal|last1=Williams|first1=A et al|title=Interchromosomal association and gene regulation in trans.|journal=Trends in Genetics|date=April 2010|volume=26|issue=4|pages=188–97|pmid=20236724|doi=10.1016/j.tig.2010.01.007|pmc=2865229}}</ref>
 
Những nghiên cứu ban đầu trong di truyền phân tử gợi ra khả năng một genegen tạo một protein. Khái niệm này (ban đầu gọi là giả thuyết một genegen-một enzyme) bắt nguồn từ bài báo có tầm ảnh hưởng năm 1941 bởi George Beadle và Edward Tatum công bố kết quả nghiên cứu các thí nghiệm gây đột biến trên nấm mốc bánh mỳ Neurospora crassa.<ref name="PNAS 1941"/> [[Norman Horowitz]], một trong các cộng sự ban đầu tham gia vào nghiên cứu ''Neurospora'', nhớ lại vào năm 2004 rằng “những thí nghiệm này là cơ sở của khoa học mà Beadle và Tatum từng gọi là ''di truyền sinh hóa''. Thực sự các kết quả của họ đã khai sinh ra ngành [[di truyền phân tử]] và tất cả những phát triển sau đó.”<ref name="pmid15020400">{{cite journal |authors=Horowitz NH et al |title=A centennial: George W. Beadle, 1903-1989 |journal=Genetics |volume=166 |issue=1 |pages=1–10 |year=2004 |pmid=15020400 |pmc=1470705 |doi= 10.1534/genetics.166.1.1|url=}}</ref> Khái niệm một genegen-một protein đã được tinh chỉnh dần từ lúc khám phá ra các genegen có thể mã hóa nhiều protein bằng quá trình điều hòa cắt-nối có chọn lọc (alternative splicing) và các trình tự mã hóa tách thành những đoạn ngắn trên bộ gene mà các mRNA được ghép nối bằng quá trình xử lý cắt-nối chéo (trans-splicing).<ref name="Rethink" /><ref>{{cite journal | vauthors = Marande W, Burger G | title = Mitochondrial DNA as a genomic jigsaw puzzle | journal = Science | volume = 318 | issue = 5849 | pages = 415 | date = October 2007 | pmid = 17947575 | doi = 10.1126/science.1148033 | publisher = AAAS | bibcode = 2007Sci...318..415M }}</ref><ref>{{cite journal | authors = Parra G, et al | title = Tandem chimerism as a means to increase protein complexity in the human genome | journal = Genome Research | volume = 16 | issue = 1 | pages = 37–44 | date = January 2006 | pmid = 16344564 | pmc = 1356127 | doi = 10.1101/gr.4145906 }}</ref>
 
Một định nghĩa có tầm hoạt động rộng thỉnh thoảng được sử dụng để bao quát được tính phức tạp của nhiều hiện tượng phong phú, nơi một genegen được định nghĩa như là hợp của các trình tự mã hóa cho một tập nhất quán các sản phẩm chuyên biệt có khả năng xen phủ lẫn nhau.<ref name="Gerstein">{{cite journal | authors = Gerstein MB et al | title = What is a gene, post-ENCODE? History and updated definition | journal = Genome Research | volume = 17 | issue = 6 | pages = 669–681 | date = June 2007 | pmid = 17567988 | doi = 10.1101/gr.6339607 }}</ref> Định nghĩa này phân loại gene theo các sản phẩm có chức năng riêng (như protein hay RNA) hơn là theo những vị trí locus cụ thể trên đoạn DNA, với các yếu tố điều hòa được phân loại như là các vùng ''kết hợp với gene''.<ref name="Gerstein" />
 
== Biểu hiện gene ==
{{chính|Biểu hiện gene}}
 
Trong mọi sinh vật, có hai bước cần thiết để đọc thông tin mã hóa trong DNA của gene và tổng hợp lên sản phẩm protein mà gene mã hóa cho. Đầu tiên, các đoạn DNA của gene được ''phiên mã'' thành RNA thông tin ([[mRNA]]).<ref name="MBOC" />{{rp|6.1}} Thứ hai, mRNA được ''dịch mã'' thành protein.<ref name="MBOC" />{{rp|6.2}} Các gene mã hóa trong RNA vẫn phải trải qua bước đầu tiên, nhưng không nhất thiết dịch mã thành protein.<ref name="Edd01" /> Quá trình tổng hợp ra một phân tử chức năng sinh học hoặc là RNA hay protein được gọi là [[biểu hiện genegen]], và phân tử tạo thành được gọi là [[sản phẩm gene]].
 
=== Mã di truyền ===
[[Tập tin:RNA-codons-aminoacids.svg|nhỏ|upright=1.6|Phác thảo một đoạn của phân tử RNA sợi đơn minh họa cho chuỗi bộ ba base [[codon]]. Cứ mỗi bộ ba [[nucleotide]] codon tương ứng với một [[axit amin]] khi được dịch mã thành protein|alt=Một phân tử RNA chứa các nucleotide. Nhóm ba nucleotide được gọi là bộ ba mã hóa hay codon, mã mỗi nhóm tương ứng với một axit amin cụ thể.]]
 
Trình tự nucleotide của DNA trong một genegen xác định lên trình tự axit amin tương ứng của protein thông qua [[mã di truyền]]. Tập hợp các bộ ba nucleotide, gọi là bộ ba mã hóa hay [[codon]], mà mỗi codon mã hóa cho một axit amin.<ref name="MBOC" />{{Rp|6}} Nguyên lý phát biểu rằng cứ ba base trong trình tự DNA mã hóa cho mỗi axit amin được minh chứng bằng thí nghiệm năm 1961 khi tạo đột biến dịch chuyển khung trong gene rIIB của thể thực khuẩn T4<ref name="pmid13882203">{{cite journal |authors=Crick F et al |title=General nature of the genetic code for proteins |journal=Nature |volume=192 |issue= |pages=1227–32 |year=1961 |pmid=13882203 |doi= 10.1038/1921227a0|url=}}</ref> (xem [[thí nghiệm Crick, Brenner và cộng sự]]).
 
Ngoài ra, một "codon khởi động", và ba "codon kết thúc" đánh dấu sự bắt đầu và kết thúc của vùng mã hóa protein. Có tất cả 64&nbsp;codon khả dĩ (vì có bốn nucleotide ở mỗi một trong ba vị trí, do vậy tổ hợp có tất cả 4<sup>3</sup>&nbsp;codon) và trong tự nhiên chỉ có 20&nbsp;axit amin cơ bản; do vậy số bộ ba là thừa và có nhiều codon cùng mã hóa cho một axit amin. Sự tương ứng giữa các codon và axit amino gần như là phổ biến rộng rãi ở mọi sinh vật sống đã biết trên [[Trái Đất]].<ref>{{Cite book|title = The genetic code|last = Crick|first = Francis|publisher = WH Freeman and Company|year = 1962|isbn = |location = |pages = |url = http://profiles.nlm.nih.gov/ps/access/SCBBFY.ocr|pmid = 13882204}}</ref>
 
=== Phiên mã ===
[[Phiên mã]] tạo ra phân tử [[RNA]] sợi đơn được biết đến là mRNA, mà các trình tự nucleotide trong nó tuân theo nguyên tắc bổ sung với của DNA làm gốc để phiên mã nó.<ref name="MBOC" />{{rp|6.1}} mRNA có vai trò làm khuôn mẫu trung gian giữa DNA của gene và sản phẩm protein cuối cùng. DNA của gene được sử dụng làm khuôn để tổng hợp lên mRNA theo nguyên tắc ghép cặp bổ sung. mRNA khớp với trình tự của dải mã hóa (coding strand) trong DNA của gene bởi vì nó được tổng hợp như là sợi bổ sung của dải khuôn mẫu (template strand). Phiên mã được thực hiện bằng [[enzyme]] gọi là [[RNA polymerase]], khi nó đọc và thực hiện trượt theo dải khuôn mẫu theo hướng đầu 3' đến đầu 5'; và tổng hợp lên RNA theo hướng ngược lại từ đầu 5' đến đầu 3'. Để khởi phát phiên mã, phân tử polymerase đầu tiên nhận ra và bám vào vùng khởi động của genegen. Do vậy, cơ chế chính của [[điều hòa biểu hiện genegen]] là ngăn chặn hoặc cô lập vùng khởi động, hoặc thông qua các phân tử ức chế (repressor) có chức năng ngăn chặn polymerase, hoặc bằng cách tổ chức DNA sao cho không thể tiếp cận được vùng khởi động.<ref name="MBOC" />{{rp|7}}
 
Ở sinh vật nhân sơ, quá trình phiên mã xảy ra trong [[tế bào chất]]; đối với phân tử phiên mã rất dài, sự dịch mã có thể bắt đầu tại đầu 5' của RNA trong khi ở đầu 3' của nó vẫn đang trong quá trình phiên mã. Ở sinh vật nhân thực, phiên mã xảy ra trong [[nhân tế bào]], nơi lưu giữ DNA và nhiễm sắc thể. Phân tử RNA được tổng hợp bằng polymerase được gọi là bản sao sơ cấp (primary transcript) và trải qua một quá trình [[sửa đổi hậu phiên mã]] (post-transcriptional modification) trước khi trở thành mRNA thành thục và được chuyển ra khỏi nhân vào tế bào chất để chuẩn bị cho dịch mã. Một trong những sửa đổi được thực hiện đó là [[cắt-nối RNA|cắt-nối]] các đoạn [[intron]] là những trình tự trong vùng phiên mã nhưng không mã hóa cho protein. Cơ chế [[cắt-nối có chọn lọc]] (alternative splicing) có thể cho các bản sao thành thục từ cùng một genegen nhưng mRNA có trình tự khác vào do vậy nó mã hóa cho những protein khác. Đây là cơ chế điều hòa chính ở tế bào nhân thực và cũng xuất hiện ở một vài tế bào nhân sơ.<ref name="MBOC" />{{rp|7.5}}<ref>{{cite journal | vauthors = Woodson SA | title = Ironing out the kinks: splicing and translation in bacteria | journal = Genes & Development | volume = 12 | issue = 9 | pages = 1243–7 | date = May 1998 | pmid = 9573040 | doi = 10.1101/gad.12.9.1243 | url = http://genesdev.cshlp.org/content/12/9/1243.full }}</ref>
 
=== Dịch mã ===
Hàng 239 ⟶ 238:
 
=== Điều hòa ===
Các gene được điều hòa sao cho chúng chỉ biểu hiện khi các sản phẩm gene ở mức cần thiết, vì quá trình biểu hiện tiêu tốn những nguồn dự trữ hạn chế.<ref name="MBOC" />{{rp|7}} Một tế bào [[điều hòa biểu hiện genegen|điều hòa]] biểu hiện các genegen của nó phụ thuộc vào [[môi sinh]] (ví dụ [[chất dinh dưỡng]] nhiều hay ít, [[protein sốc nhiệt|nhiệt độ]] và [[đáp ứng sức ép tế bào|các sức ép]]-stress), môi trường bên trong tế bào (ví dụ [[chu kỳ phân bào]], [[trao đổi chất]], [[nhiễm trùng|trạng thái lây nhiễm]]), và [[biệt hóa tế bào|vai trò cụ thể]] của nó trong một [[sinh vật đa bào]]. Biểu hiện gene có thể được điều hòa ở bất kỳ một bước nào: từ lúc [[điều hòa phiên mã|khởi phát phiên mã]], đến [[xử lý RNA]], đến [[sửa đổi sau dịch mã]] đối với protein. Sự điều hòa các genegen kiểm soát trao đổi chất của đường [[lactose]] ở ''[[E. coli]]'' ([[lac operon|''lac'' operon]]) là một trong những cơ chế điều hòa đầu tiên được [[François Jacob]] và [[Jacques Monod]] miêu tả vào năm 1961.<ref name="Jacob F">{{cite journal |title = Genetic regulatory mechanisms in the synthesis of proteins|journal = Journal of Molecular Biology |author = Jacob F|authorlink = François Jacob|author2 = Monod J|authorlink2 = Jacques Monod|date = June 1961|volume = 3|pages = 318–56|pmid = 13718526|doi = 10.1016/S0022-2836(61)80072-7|issue = 3}}
</ref>
 
Hàng 248 ⟶ 247:
 
== Di truyền ==
[[Tập tin:Autosomal recessive - mini.svg|nhỏ|Sự kế thừa từ một genegen có hai [[allele]] khác nhau (lam và trắng). Gene này nằm trên [[nhiễm sắc thể thường]] (không phải là NST giới tính). Allele trắng là [[tính trạng|tính trạng lặn]] so với tính trạng trội do allele lam quy định. Xác suất cho biểu hiện các tính trạng ở thế hệ con bằng một phần tư, hay 25 phần trăm.|alt=Illustration of autosomal recessive inheritance. Each parent has one blue allele and one white allele. Each of their 4 children inherit one allele from each parent such that one child ends up with two blue alleles, one child has two white alleles and two children have one of each allele. Only the child with both blue alleles shows the trait because the trait is recessive.]]
{{chính|Di truyền Mendel|Di truyền}}
Bộ gene các sinh vật kế thừa từ gene trong thế hệ bố mẹ của chúng. Các sinh vật [[sinh sản vô tính]] chỉ đơn giản là kế thừa bản sao đầy đủ của bộ gene bố mẹ chúng. Các sinh vật [[sinh sản hữu tính]] có hai bản sao ở mỗi nhiễm sắt thể bởi vì chúng thừa hưởng một bộ đầy đủ từ mỗi con cái và con đực.<ref name="MBOC" />{{rp|1}}
 
=== Di truyền Mendel ===
Theo [[di truyền Mendel]], các biến dị trong [[kiểu hình]] của một sinh vật (các đặc điểm vật lý và cư xử quan sát được) là một phần do những biến đổi trong [[kiểu gene]] (đặc biệt là các genegen tương ứng). Mỗi gene xác định một tính trạng riêng với các trình tự khác nhau trên cùng một genegen (các [[allele]]) làm xuất hiện nhiều kiểu hình khác nhau. Hầu hết các sinh vật nhân thực (như ở cây đậu Hà Lan mà Mendel dùng để nghiên cứu) có hai allele cho mỗi tính trạng, mỗi allele được kế thừa từ bố hoặc mẹ.<ref name="MBOC" />{{rp|20}}
 
Tại locus các allele có thể là [[gene trội|trội]] hoặc [[gene lặn|lặn]]; các allele trội thể hiện những kiểu hình tương ứng khi nó ghép cặp với bất kỳ một allele khác của tính trạng, trong khi các allele lặn chỉ thể hiện kiểu hình tương ứng khi nó ghép cặp với cùng một bản sao allele khác. Nếu biết kiểu hình của sinh vật, có thể xác định được allele trội và allele lặn. Ví dụ, nếu allele xác định thân cây cao ở đậu Hà Lan là tính trạng trội so với allele xác định thân cây thấp, thì ở thực vật đậu thừa hưởng một allele allele cao từ bố mẹ và một allele thấp từ bố mẹ thì nó sẽ là thân cây cao. Nghiên cứu của Mendel chứng tỏ rằng các allele phân ly độc lập trong hình thành [[giao tử]], hoặc các [[tế bào gốc]], đảm bảo biến đổi ở thế hệ tiếp theo. Mặc dù di truyền Mendel vẫn là một mô hình tốt cho nhiều tính trạng xác định bởi các genegen riêng rẽ (bao gồm một số [[bệnh di truyền]] hay gặp) nó không kể đến những quá trình sinh hóa trong tái bản DNA và phân bào.<ref name=scitable_miko>{{cite journal|last1=Miko|first1=Ilona|title=Gregor Mendel and the Principles of Inheritance|url=http://www.nature.com/scitable/topicpage/gregor-mendel-and-the-principles-of-inheritance-593|journal=Nature Education Knowledge|date=2008|volume=1|issue=1|page=134|
series=SciTable|publisher=Nature Publishing Group}}</ref><ref name=scitable_chial>{{cite journal|last1=Chial|first1=Heidi|title=Mendelian Genetics: Patterns of Inheritance and Single-Gene Disorders|url=http://www.nature.com/scitable/topicpage/mendelian-genetics-patterns-of-inheritance-and-single-966|journal=Nature Education Knowledge|date=2008|volume=1|issue=1|page=63|
series=SciTable|publisher=Nature Publishing Group}}</ref>
Hàng 267 ⟶ 266:
 
=== Di truyền phân tử ===
[[Tập tin:Drosophila Gene Linkage Map.svg|nhỏ|500px|Bản đồ di truyền liên kết ở ''[[Drosophila melanogaster]]'' của [[Thomas Hunt Morgan]]. Đây là nghiên cứu thành công đầu tiên trong việc lập bản đồ gene (xác định vị trí các genegen trên NST) và cung cấp bằng chứng quan trọng cho lý thuyết di truyền trên nhiễm sắc thể. Bản đồ chỉ ra vị trí tương đối của các [[allele]] trên NST số 2 của Drosophila. Khoảng cách giữa các genegen (đơn vị đo [[centimorgan]]) tỷ lệ thuận với ''tần số tái tổ hợp'' của sự kiện trao đổi giữa các allele.<ref name="Mader">{{cite book|last1=Mader|first1=Sylvia|date=2007|title=Biology Ninth Edition|location=New York|publisher=McGraw-Hill|page=209|isbn=978-0-07-325839-3}}</ref>]]
 
Sự tái bản và truyền vật liệu di truyền từ một thế hệ tế bào sang thế hệ tiếp theo là cơ sở của di truyền phân tử, và là mối liên hệ giữa bức tranh phân tử với bức tranh cổ điển của genegen. Sinh vật thừa hưởng những đặc tính từ bố mẹ bởi vì các tế bào con chứa các bản sao của gene từ trong tế bào của bố mẹ chúng. Ở các sinh vật [[sinh sản vô tính]], ở thế hệ con sẽ chứa bản sao di truyền hay [[dòng hóa]] từ các sinh vật bố mẹ. Ở sinh vật [[sinh sản hữu tính]], một giai đoạn đặc biệt của quá trình phân bào gọi là [[giảm phân]] tạo thành các tế bào [[giao tử]] hoặc [[tế bào mầm phôi]] [[đơn bội]], và chỉ chứa gene trong nhiễm sắc thể đơn bội.<ref name="MBOC" />{{rp|20.2}} Giao tử phát sinh từ con cái gọi là [[trứng (sinh học)|trứng]] hay ova, và giao tử phát sinh từ con đực gọi là [[tinh trùng]]. Hai giao tử kết hợp với nhau tạo thành hợp tử lưỡng bội trứng đã được thụ tinh, một tế bào trong nó chứa hai tập hợp gene, với một bản sao của mỗi gene đến từ con cái và một bản sao còn lại từ con đực.<ref name="MBOC" />{{rp|20}}
 
Trong quá trình phân bào giảm phân, thỉnh thoảng xuất hiện sự kiện [[tái tổ hợp di truyền]] hay ''trao đổi chéo'' ở một số đoạn giữa hai nhiễm sắc thể tương đồng, kéo theo sự trao đổi các gen giữa chúng. Ở sự kiện này, một đoạn DNA trên một [[chromatid]] được hoán vị bằng một đoạn DNA có độ dài bằng nhau nằm trên chromatid tương đồng khác chị em. Hiện tượng này có thể dẫn đến sự tổ chức lại các allele đã có liên kết với nhau.<ref name="MBOC" />{{rp|5.5}} Quy luật phân ly độc lập của Mendel khẳng định mỗi gene từ bố hoặc mẹ cho mỗi tính trạng sẽ xắp sếp một cách độc lập trong giao tử; hay các allele của các genegen khác nhau thì phân ly một cách độc lập với nhau trong quá trình hình thành giao tử. Điều này chỉ đúng cho những gene mà không nằm trên cùng một nhiễm sắc thể, hoặc nằm trên cùng một nhiễm sắc thể nhưng cách rất xa nhau. Hai gene nằm càng gần nhau trên cùng một nhiễm sắc thể, chúng sẽ càng có mặt cùng nhau trong giao tử và các tính trạng chúng biểu hiện sẽ xuất hiện cùng nhau thường xuyên; những gene nằm rất gần nhau hoặc cạnh nhau về cơ bản không bao giờ bị tách biệt bởi vì rất hiếm khi điểm trao đổi chéo sẽ xuất hiện giữa hai gene này. Đây là cơ sở của hiện tượng [[di truyền liên kết]] gene hoàn toàn (genetic linkage).<ref name=scitable_lobo>{{cite journal|last1=Lobo|first1=Ingrid|last2=Shaw|first2=Kelly|title=Discovery and Types of Genetic Linkage|url=http://www.nature.com/scitable/topicpage/discovery-and-types-of-genetic-linkage-500|journal=Nature Education Knowledge|date=2008|volume=1|issue=1|page=139|
series=SciTable|publisher=Nature Publishing Group}}</ref>
 
Ruồi giấm ''Drosophila melanogaster'' đã được nhà di truyền học người Mỹ, Thomas Hunt Morgan (1866-1945), sử dụng trong nghiên cứu di truyền học từ những năm đầu của thế kỷ XX, trong khi đang làm việc tại Học viện Công nghệ California. Nhờ sử dụng ruồi giấm này, Morgan và các cộng sự của mình đã xây dựng thành công học thuyết di truyền nhiễm sắc thể. Lý thuyết này đã khẳng định gene - đơn vị di truyền then chốt đóng ba vai trò: (i) Gene là ''đơn vị chức năng'', nghĩa là gene được xem như một thể thống nhất toàn vẹn kiểm soát một tính trạng cụ thể. (ii) Gene là ''đơn vị tái tổ hợp'', nghĩa là gene không bị chia nhỏ bởi sự trao đổi chéo (vì theo quan điểm này, trao đổi chéo không xảy ra bên trong phạm vi một genegen mà chỉ xảy ra giữa các gene); như thế gene được coi là ''đơn vị cấu trúc cơ sở của vật chất di truyền'', nhiễm sắc thể. (iii) Gene là ''đơn vị đột biến'', nghĩa là nếu đột biến xảy ra trong gene dù ở bất kỳ vị trí nào hoặc với phạm vi ra sao, chỉ gây ra một trạng thái cấu trúc mới tương ứng với một kiểu hình mới, kiểu hình đột biến, khác với kiểu hình bình thường. Tuy nhiên, quan niệm này vẫn còn chưa rõ ràng và không thực sự chính xác theo quan điểm của di truyền học hiện đại<ref name="Mader"/>
 
==Các biến đổi ở mức phân tử==
 
=== Đột biến ===
Giai đoạn tái bản DNA diễn ra phần lớn có độ chính xác cao, tuy vậy cũng có lỗi ([[đột biến]]) xảy ra.<ref name="MBOC" />{{rp|7.6}} Tần suất lỗi ở tế bào sinh vật nhân thực có thể thấp ở mức 10<sup>−8</sup> trên nucleotide trong mỗi lần tái bản,<ref name="Nachman">{{cite journal |vauthors=Nachman MW, Crowell SL |title = Estimate of the mutation rate per nucleotide in humans|journal = Genetics|volume = 156|issue = 1|pages = 297–304|date = September 2000|pmid = 10978293|pmc = 1461236|url = http://www.genetics.org/cgi/content/full/156/1/297}}</ref><ref name="Science2">{{cite journal |authors=Roach JC et al |title = Analysis of genetic inheritance in a family quartet by whole-genome sequencing|journal = Science|volume = 328|issue = 5978|pages = 636–9|date = April 2010|pmid = 20220176|pmc = 3037280|doi = 10.1126/science.1186802|url = http://www.sciencemag.org/cgi/content/abstract/science.1186802|bibcode = 2010Sci...328..636R }}</ref> trong khi ở một số virus RNA có thể cao tới mức 10<sup>−3</sup>.<ref name="Genetics2">{{cite journal |authors=Drake JW et al |title = Rates of spontaneous mutation|journal = Genetics|volume = 148|issue = 4|pages = 1667–86|date = April 1998|pmid = 9560386|pmc = 1460098|url = http://www.genetics.org/cgi/content/full/148/4/1667}}</ref> Điều này có nghĩa là ở mỗi thế hệ, trong bộ gene ở người thu thêm 1–2 đột biến mới.<ref name="Genetics2"/> Những đột biến nhỏ xuất hiện từ quá trình tái bản DNA và hậu quả từ [[sửa chữa DNA|phá hủy DNA]] và bao gồm [[đột biến điểm]] trong đó một base bị thay đổi và [[đột biến dịch chuyển khung]] trong đó một base được thêm vào hay bị xóa. Hoặc là những đột biến này làm thay đổi gene theo cách làm sai nghĩa (missense mutation, thay đổi một codon làm nó mã hóa cho axit amin khác) hoặc làm cho gene trở nên vô nghĩa (nonsense mutation, làm quá trình tái bản DNA sớm kết thúc khi đọc đến codon kết thúc và sản phẩm gene là protein không hoạt động được).<ref>{{cite web|title=What kinds of gene mutations are possible?|url=http://ghr.nlm.nih.gov/handbook/mutationsanddisorders/possiblemutations|website=Genetics Home Reference|publisher=United States National Library of Medicine|accessdate=19 May 2015|date=11 May 2015}}</ref> Những đột biến lớn hơn có thể gây ra lỗi trong tái tổ hợp dẫn đến những bất thường ở nhiễm sắc thể (chromosomal abnormality) bao gồm nhân đôi một genegen (gene duplication), xóa, sắp xếp lại hoặc đảo ngược những đoạn dài trong một NST. Thêm vào đó, cơ chế sửa chữa DNA có thể dẫn ra vài đột biến mới khi thực hiện sửa chữa những sai hỏng vật lý ở phân tử. Sự sửa chữa, ngay cả khi đi kèm với đột biến, là quan trọng hơn đối với sự tồn tại hơn là khôi phục lại bản sao chính xác, ví dụ khi thực hiện sửa chữa chuỗi xoắn kép bị gãy.<ref name="MBOC" />{{rp|5.4}}
 
Khi nhiều allele khác nhau của cùng một genegen có mặt trong quần thể một loài thì hiện tượng này được gọi là ''đa hình'' (polymorphism). Phần lớn các allele khác nhau hoạt động tương tự nhau, tuy nhiên ở một số allele có thể làm xuất hiện các tính trạng kiểu hình khác nhau. Allele phổ biến nhất của một genegen được gọi là [[kiểu dại]] (wild type), và những allele hiếm được gọi là allele đột biến. [[Biến dị di truyền]] trong tần số tương đối của các allele khác nhau trong một quần thể có nguyên nhân từ cả [[chọn lọc tự nhiên]] và [[biến động di truyền]] (genetic drift, những sự biến đổi ngẫu nhiên vô hướng về tần số allele trong tất cả các quần thể, nhưng đặc biệt là ở các quần thể nhỏ).<ref>{{cite journal|last1=Andrews|first1=Christine A.|title=Natural Selection, Genetic Drift, and Gene Flow Do Not Act in Isolation in Natural Populations|journal=Nature Education Knowledge|date=2010|volume=3|issue=10|page=5|url=http://www.nature.com/scitable/knowledge/library/natural-selection-genetic-drift-and-gene-flow-15186648|series=SciTable|publisher=Nature Publishing Group}}</ref>
 
Phần lớn các đột biến bên trong các genegen là đột biến trung tính (neutral mutation), không có ảnh hưởng đến kiểu hình của sinh vật (đột biến lặng, silent mutation). Một số đột biến không làm thay đổi trình tự axit amin bởi vì một số codon mã hóa cho cùng một axit amin (đột biến đồng nghĩa, synonymous mutation). Các đột biến khác trở thành trung tính nếu tuy nó làm thay đổi trình tự axit amin, nhưng protein vẫn gập nếp và hoạt động bình thường với axit amin mới (đột biến bảo toàn, conservative mutation). Tuy nhiên, nhiều đột biến là có hại (deleterious mutation) hay thậm chí gây chết (lethal allele), và bị loại bỏ khỏi quần thể bằng quá trình chọn lọc. Rối loạn di truyền (genetic disorders) là kết quả của các đột biến có hại và có thể do đột biến tự phát trong cá thể bị ảnh hưởng, hoặc có thể di truyền sang thế hệ sau. Cuối cùng, có một tỷ lệ nhỏ các đột biến là có lợi (beneficial mutation), tăng cường độ phù hợp (fitness) ở sinh vật, và trở thành một trong những luận điểm quan trọng của thuyết tiến hóa tổng hợp hiện đại, vì trong chọn lọc có hướng dẫn đến tiến hóa thích nghi.<ref name="MBOC" />{{rp|7.6}}
 
=== Trình tự tương đồng ===
[[Tập tin:Histone Alignment.png|nhỏ|phải|upright=1.8|Kết quả sắp trình tự tạo ra bằng [[ClustalO]], cho các protein [[histone]] ở động vật có vú.]]
Gene có [[Tổ tiên chung gần nhất|nguồn gốc tổ tiên chung gần nhất]], và do vậy chia sẻ cùng một lịch sử khám phá, được biến đến có tính [[trình tự tương đồng|tương đồng]].<ref>{{cite journal|last1=Patterson|first1=C|title=Homology in classical and molecular biology.|journal=Molecular Biology and Evolution|date=November 1988|volume=5|issue=6|pages=603–25|pmid=3065587}}</ref> Những gene này xuất hiện hoặc từ sự lặp đoạn gene bên trong bộ gene của sinh vật, nơi chúng được gọi là các genegen môi sinh, hoặc là kết quả của sự phân tán gene sau một sự kiện [[sự hình thành loài|hình thành loài]],<ref name="MBOC" />{{rp|7.6}} và thường thực hiện các chức năng giống nhau hoặc tương tự như ở sinh vật liên quan. Người ta thường giả sử rằng những gene này có sự giống nhau nhiều hơn so với gene môi sinh, mặc dù sự khác nhau là nhỏ.<ref>{{cite journal|last1=Studer|first1=RA|last2=Robinson-Rechavi|first2=M|title=How confident can we be that orthologs are similar, but paralogs differ?|journal=Trends in Genetics|date=May 2009|volume=25|issue=5|pages=210–6|pmid=19368988|doi=10.1016/j.tig.2009.03.004}}</ref><ref>{{cite journal|last1=Altenhoff|first1=AM et al|title=Resolving the ortholog conjecture: orthologs tend to be weakly, but significantly, more similar in function than paralogs.|journal=PLOS Computational Biology|date=2012|volume=8|issue=5|pages=e1002514|pmid=22615551|doi=10.1371/journal.pcbi.1002514|pmc=3355068}} {{open access}}</ref>
 
Mối liên hệ giữa các genegen có thể đo được bằng cách so sánh [[bắt cặp trình tự|sắp trình tự]] trong DNA của chúng.<ref name="MBOC" />{{rp|7.6}} Độ giống nhau giữa các genegen tương đồng được gọi là trình tự bảo toàn (conserved sequence). Theo thuyết tiến hóa phân tử trung tính, phần lớn những thay đổi trong trình tự của một genegen không ảnh hưởng đến chức năng của nó và do vậy gene tích lũy các đột biến theo thời gian. Thêm vào đó, bất kỳ chọn lọc nào trên một genegen sẽ làm cho trình tự của nó phân tán với tốc độ khác. Các gene chịu ảnh hưởng chọn lọc ổn định có tính ổn định cao và sự thay đổi đối với chúng diễn ra chậm trong khi các genegen chịu ảnh hưởng chọn lọc định hướng thay đổi trình tự một cách nhanh chóng.<ref>{{cite journal|last1=Nosil|first1=Patrik et al|title=Divergent selection and heterogeneous genomic divergence|journal=Molecular Ecology|date=February 2009|volume=18|issue=3|pages=375–402|doi=10.1111/j.1365-294X.2008.03946.x|pmid=19143936}}</ref> Sự khác nhau trong trình tự giữa các genegen có thể được ứng dụng để phân tích [[phát sinh chủng loại học|phát sinh chủng loài]] để nghiên cứu các genegen đã tiến hóa bằng cách nào và bằng cách nào mà các sinh vật trở lên có liên quan đến nhau.<ref>{{cite web|last1=Emery|first1=Laura|title=Introduction to Phylogenetics|url=http://www.ebi.ac.uk/training/online/course/introduction-phylogenetics|publisher=EMBL-EBI|accessdate=19 May 2015}}</ref><ref name=scitable_mitchell>{{cite journal|last1=Mitchell|first1=Matthew W.|last2=Gonder|first2=Mary Katherine|title=Primate Speciation: A Case Study of African Apes|url=http://www.nature.com/scitable/knowledge/library/primate-speciation-a-case-study-of-african-96682434|journal=Nature Education Knowledge|date=2013|volume=4|issue=2|page=1|
series=SciTable|publisher=Nature Publishing Group}}</ref>
 
=== Nguồn gốc các genegen mới ===
[[Tập tin:Evolution fate duplicate genes - vector.svg|nhỏ|upright=1.8|Số phận tiến hóa của các genegen lặp đoạn.]]
Nguồn gốc chung phổ biến ở các genegen mới trong nòi giống sinh vật nhân thực là [[lặp đoạn gene]], trong đó tạo ra một bản sao gene mới từ gene đã có trong bộ gene.<ref name="guerzoni">{{cite journal|last1=Guerzoni|first1=D|last2=McLysaght|first2=A|title=De novo origins of human genes.|journal=PLOS Genetics|date=November 2011|volume=7|issue=11|pages=e1002381|pmid=22102832|doi=10.1371/journal.pgen.1002381|pmc=3213182}} {{open access}}</ref><ref>{{cite journal|last1=Reams|first1=AB|last2=Roth|first2=JR|title=Mechanisms of gene duplication and amplification.|journal=Cold Spring Harbor perspectives in biology|date=2 February 2015|volume=7|issue=2|pages=a016592|pmid=25646380|doi=10.1101/cshperspect.a016592|pmc=4315931}}</ref> Những gene tạo ra này sau đó có thể phân tán trong trình tự và chức năng. Tập hợp các genegen hình thành theo cách này tạo thành gia đình gene (gene family). Các nhà tiến hóa cho rằng lặp đoạn gene và mất gene trong một gia đình là phổ biến và là nguyên nhân chủ yếu dẫn đến sự [[đa dạng sinh học]].<ref>{{cite journal|last1=Demuth|first1=JP et al|title=The evolution of mammalian gene families|journal=PLoS ONE|date=20 December 2006|volume=1|pages=e85|pmid=17183716|bibcode = 2006PLoSO...1...85D |doi = 10.1371/journal.pone.0000085|pmc=1762380}} {{open access}}</ref> Thình thoảng, lặp đoạn gene có thể tạo ra một bản sao không hoạt động bình thường, hoặc bản sao chức năng chịu ảnh hưởng của đột biến làm mất chức năng; những gene không hoạt động này được gọi là gene giả (pseudogene).<ref name="MBOC" />{{rp|7.6}}
 
Các gene "mồ côi", mà trình tự không giống với một genegen đã có nào, ít gặp hơn so với lặp đoạn genegen. Ước tính số lượng gene mà không có trình tự tương đồng nằm bên ngoài con người từ 18<ref>{{cite journal|last1=Knowles|first1=DG|last2=McLysaght|first2=A|title=Recent de novo origin of human protein-coding genes.|journal=Genome Research|date=October 2009|volume=19|issue=10|pages=1752–9|pmid=19726446|doi=10.1101/gr.095026.109|pmc=2765279}}</ref> đến 60.<ref>{{cite journal|last1=Wu|first1=DD et al|title=De novo origin of human protein-coding genes.|journal=PLOS Genetics|date=November 2011|volume=7|issue=11|pages=e1002379|pmid=22102831|doi=10.1371/journal.pgen.1002379|pmc=3213175}} {{open access}}</ref> Hai nguồn chủ yếu của các genegen mồ côi mã hóa protein đó là quá trình lặp đoạn gene theo sau bởi sự thay đổi trình tự cực lớn, như mối liên hệ gốc là không xác định được từ việc so sánh trình tự, và sự chuyển đổi mới từ một trình tự không mã hóa trước đó thành một genegen mã hóa protein.<ref>{{cite journal|last1=McLysaght|first1=Aoife|last2=Guerzoni|first2=Daniele|title=New genes from non-coding sequence: the role of de novo protein-coding genes in eukaryotic evolutionary innovation|journal=Philosophical Transactions of the Royal Society B: Biological Sciences|date=31 August 2015|volume=370|issue=1678|pages=20140332|doi=10.1098/rstb.2014.0332|pmid=26323763|pmc=4571571}}</ref> Các gene mới thường ngắn hơn và đơn giản hơn về cấu trúc so với các genegen ở sinh vật nhân thực, mà chỉ có vài intron (nếu có).<ref name="guerzoni" /> Các nhà sinh tiến hóa cho rằng trong thời gian tiến hóa dài, gene mới sinh có thể chịu trách nhiệm cho một tỷ lệ đáng kể các gia đình gene bị giới hạn về mặt chủng loại.<ref>{{cite journal|last1=Neme|first1=Rafik|last2=Tautz|first2=Diethard|title=Phylogenetic patterns of emergence of new genes support a model of frequent de novo evolution|journal=BMC Genomics|date=2013|volume=14|issue=1|pages=117|doi=10.1186/1471-2164-14-117|pmid=23433480|pmc=3616865}}</ref>
 
Quá trình chuyển gene ngang nhắc tới sự truyền vật liệu di truyền thông qua một cơ chế hơn là sự [[sinh sản]]. Cơ chế này là nguồn thường gặp tạo gene mới ở sinh vật nhân sơ, mà đôi lúc được cho là đóng góp nhiều hơn vào biến dị di truyền so với lặp đoạn gene.<ref>{{cite journal|last1=Treangen|first1=TJ|last2=Rocha|first2=EP|title=Horizontal transfer, not duplication, drives the expansion of protein families in prokaryotes.|journal=PLOS Genetics|date=27 January 2011|volume=7|issue=1|pages=e1001284|pmid=21298028|doi=10.1371/journal.pgen.1001284|pmc=3029252}} {{open access}}</ref> Nó là một cách phổ biến để phát tán [[kháng thuốc kháng sinh]], [[độc lực]], và các chức năng [[trao đổi chất]] thích ứng.<ref name="bennett" /><ref>{{cite journal|last1=Ochman|first1=H et al|title=Lateral gene transfer and the nature of bacterial innovation.|journal=Nature|date=18 May 2000|volume=405|issue=6784|pages=299–304|pmid=10830951|bibcode = 2000Natur.405..299O|doi=10.1038/35012500}}</ref> Mặc dù chuyển gene ngang hiếm xảy ra ở sinh vật nhân thự, một số trường hợp tương tự đã được phát hiện ở bộ gene của [[sinh vật nguyên sinh]] và [[tảo]] chứa các genegen có nguồn gốc từ vi khuẩn.<ref>{{cite journal|last1=Keeling|first1=PJ|last2=Palmer|first2=JD|title=Horizontal gene transfer in eukaryotic evolution.|journal=Nature Reviews Genetics|date=August 2008|volume=9|issue=8|pages=605–18|pmid=18591983|doi=10.1038/nrg2386}}</ref><ref>{{cite journal|last1=Schönknecht|first1=G et al|title=Gene transfer from bacteria and archaea facilitated evolution of an extremophilic eukaryote.|journal=Science|date=8 March 2013|volume=339|issue=6124|pages=1207–10|pmid=23471408|bibcode = 2013Sci...339.1207S |doi = 10.1126/science.1231707 }}</ref>
 
== Bộ gene==
[[Bộ gene]] là tổng thể toàn bộ vật liệu di truyền của một sinh vật và bao gồm cả các genegen và những trình tự không mã hóa.<ref>Ridley, M. (2006). ''Genome''. New York, NY: Harper Perennial. {{ISBN|0-06-019497-9}}</ref>
 
=== Số lượng gene ===
[[Tập tin:Gene numbers.svg|nhỏ|upright=2.75|Biểu diễn kích thước bộ gene ở [[thực vật]] (lục), [[động vật có xương sống]] (lam), [[động vật không xương sống]] (đỏ), [[nấm]] (vàng), [[vi khuẩn]] (tím), và [[virus]] (xám). Hình nhỏ bên phải minh họa kích thước các bộ gene được phóng lớn 100 lần.<ref name="Watson">Watson, JD et al (2004). "Ch9-10", Molecular Biology of the Gene, 5th ed., Peason Benjamin Cummings; CSHL Press.</ref><ref>{{cite web|title=Understanding the Basics|url=https://web.ornl.gov/sci/techresources/Human_Genome/project/timeline.shtml|website=The Human Genome Project|accessdate=26 April 2015}}</ref><ref>{{cite web |date=10 August 2011 |title=WS227 Release Letter |url=http://www.wormbase.org/wiki/index.php/WS227 |publisher=WormBase|accessdate=19 November 2013}}</ref><ref>{{cite journal|last1=Yu|first1=J.|title=A Draft Sequence of the Rice Genome (Oryza sativa L. ssp. indica)|journal=Science|date=5 April 2002|volume=296|issue=5565|pages=79–92|doi=10.1126/science.1068037|bibcode = 2002Sci...296...79Y|pmid=11935017}}</ref><ref name=mitochondrial_genome>{{cite journal|last1=Anderson|first1=S. et al|title=Sequence and organization of the human mitochondrial genome|journal=Nature|date=9 April 1981|volume=290|issue=5806|pages=457–465|doi=10.1038/290457a0|bibcode = 1981Natur.290..457A|pmid=7219534}}</ref><ref>{{cite journal|last1=Adams|first1=M. D.|title=The Genome Sequence of Drosophila melanogaster|journal=Science|date=24 March 2000|volume=287|issue=5461|pages=2185–2195|doi=10.1126/science.287.5461.2185|bibcode = 2000Sci...287.2185.|pmid=10731132}}</ref><ref name="ReferenceB">{{cite journal|last1=Pertea|first1=Mihaela|last2=Salzberg|first2=Steven L|title=Between a chicken and a grape: estimating the number of human genes|journal=Genome Biology|date=2010|volume=11|issue=5|pages=206|doi=10.1186/gb-2010-11-5-206|pmid=20441615|pmc=2898077}}</ref>]]
 
[[Kích thước bộ gene]], và số lượng gene mã hóa ở mỗi loài sinh vật là khác nhau. [[Virus]],<ref>{{cite journal|last1=Belyi|first1=V. A. et al|title=Sequences from Ancestral Single-Stranded DNA Viruses in Vertebrate Genomes: the Parvoviridae and Circoviridae Are More than 40 to 50 Million Years Old|journal=Journal of Virology|date=22 September 2010|volume=84|issue=23|pages=12458–12462|doi=10.1128/JVI.01789-10|pmid=20861255|pmc=2976387}}</ref> và [[viroid]] (mà hoạt động như là một genegen RNA không mã hóa) có bộ gene nhỏ nhất.<ref>{{cite journal|last1=Flores|first1=Ricardo et al|title=Viroids: The Noncoding Genomes|journal=Seminars in Virology|date=February 1997|volume=8|issue=1|pages=65–73|doi=10.1006/smvy.1997.0107}}</ref> Ngược lại, ở thực vật có những bộ gene cực kỳ lớn,<ref>{{cite journal|last1=Zonneveld|first1=B. J. M.|title=New Record Holders for Maximum Genome Size in Eudicots and Monocots|journal=Journal of Botany|date=2010|volume=2010|pages=1–4|doi=10.1155/2010/527357}}</ref> chẳng hạn ở [[lúa|cây lúa gạo]] chứa hơn 46.000 gene mã hóa protein.<ref name="pmid11935017">{{cite journal | authors = Yu J et al | title = A draft sequence of the rice genome (Oryza sativa L. ssp. indica) | journal = Science | volume = 296 | issue = 5565 | pages = 79–92 | date = April 2002 | pmid = 11935017 | doi = 10.1126/science.1068037 | bibcode = 2002Sci...296...79Y }}</ref> Tổng số lượng gene mã hóa protein ([[bộ protein]], proteome, trên Trái Đất) ước tính bằng 5 triệu trình tự.<ref>{{cite journal | authors = Perez-Iratxeta C et al | title = Towards completion of the Earth's proteome | journal = EMBO Reports | volume = 8 | issue = 12 | pages = 1135–1141 | date = December 2007 | pmid = 18059312 | pmc = 2267224 | doi = 10.1038/sj.embor.7401117 | url = http://www.nature.com/embor/journal/v8/n12/full/7401117.html }}</ref>
 
Mặc dù số lượng cặp base của DNA ở bộ gene người đã được biết đến từ thập niên 1960, ước tính số lượng gene có sự thay đổi theo thời gian khi định nghĩa về gene, và phương pháp xác định chúng liên tục được cập nhật và tinh chỉnh. Các dự đoán lý thuyết ban đầu về số lượng gene ở người cao tới mức 2.000.000 gene.<ref>{{cite journal |author = Kauffman SA|title = Metabolic stability and epigenesis in randomly constructed genetic nets|journal = Journal of Theoretical Biology|volume = 22|issue = 3|pages = 437–467|year = 1969|pmid = 5803332|doi = 10.1016/0022-5193(69)90015-0|url = http://www.sciencedirect.com/science/article/pii/0022519369900150|publisher = Elsevier}}</ref> Trong khi các kết quả đo thực nghiệm sơ bộ ban đầu cho thấy số lượng này trong khoảng 50.000–100.000 gene ''được phiên mã'' (bằng phương pháp đánh dấu trình tự biểu hiện).<ref>{{cite journal | authors = Schuler GD et al | title = A gene map of the human genome | journal = Science | volume = 274 | issue = 5287 | pages = 540–6 | date = October 1996 | pmid = 8849440 | doi = 10.1126/science.274.5287.540 | url = http://www.sciencemag.org/cgi/content/full/274/5287/540 | bibcode = 1996Sci...274..540S }}</ref> Sau đó, kết quả giải trình tự ở [[Dự án bản đồ gen người|Dự án Bản đồ gene ở Người]] cho thấy nhiều trình tự được phiên mã là những biến thể khác của cùng một genegen, và tổng số lượng gene mã hóa protein giảm xuống còn ~20.000<ref name="ReferenceB"/> trong đó có 13 gene mã hóa nằm trong bộ gene [[ty thể]].<ref name=mitochondrial_genome/> Nghiên cứu sâu hơn từ dự án [[GENCODE]], tiếp tục cho ước lượng số gene giảm xuống còn ~19.900.<ref>{{chú thích web|url=https://www.gencodegenes.org/stats/archive.html#a28|title=Statistics about all Human GENCODE releases (Version 28 - November 2017)|publisher=ENCODE|accessdate=18 tháng 4 năm 2018}}</ref><ref>{{Cite journal|last=Chi|first=Kelly Rae|date=2016-08-17|title=The dark side of the human genome|url=http://www.nature.com/articles/538275a|journal=Nature|language=En|volume=538|issue=7624|pages=275–277|doi=10.1038/538275a}}</ref> Trong bộ gene ở người, chỉ 1–2% trong 3 tỷ cặp base DNA là đoạn mã hóa protein,<ref>{{chú thích web|title=The 99 percent... of the Human Genome|url=http://sitn.hms.harvard.edu/flash/2012/issue127a/|work=Jonathan Henninger|publisher=Harvard University|date=1 October 2012|accessdate=12 October 2015}}</ref><ref name=Claverie2005>{{cite journal | vauthors = Claverie JM | title = Fewer genes, more noncoding RNA | journal = Science | volume = 309 | issue = 5740 | pages = 1529–30 | date = September 2005 | pmid = 16141064 | doi = 10.1126/science.1116800 | bibcode = 2005Sci...309.1529C }}</ref> những đoạn còn lại là các DNA 'không mã hóa' bao gồm [[intron]], [[retrotransposon]], các trình tự điều hòa DNA và các đoạn DNA phiên mã thành RNA không mã hóa.<ref name=Claverie2005/><ref name="Carninci2007">{{cite journal |vauthors = Carninci P, Hayashizaki Y|title = Noncoding RNA transcription beyond annotated genes|journal = Current Opinion in Genetics & Development|volume = 17|issue = 2|pages = 139–44|date = April 2007|pmid = 17317145|doi = 10.1016/j.gde.2007.02.008}}</ref> Trong mỗi tế bào ở sinh vật đa bào chứa toàn bộ gene nhưng không phải tất cả gene hoạt động trong từng tế bào.
 
=== Gene cơ bản===
Hàng 315 ⟶ 314:
[[Tập tin:Syn3 genome.svg|nhỏ|upright=1.25|Các gene chức năng trong bộ gene tối thiểu của [[sinh học tổng hợp|sinh vật tổng hợp]], ''[[Syn 3]]''.<ref name = "Hutchison"/>]]
 
Các gene cơ bản là tập hợp những gene được cho là trọng yếu đối với sự sinh tồn của một sinh vật.<ref>{{cite journal|last1=Glass|first1=J. I. et al|title=Essential genes of a minimal bacterium|journal=Proceedings of the National Academy of Sciences|date=3 January 2006|volume=103|issue=2|pages=425–430|doi=10.1073/pnas.0510013103|bibcode = 2006PNAS..103..425G|pmid=16407165|pmc=1324956}}</ref> Định nghĩa này dựa trên giả sử sinh vật được cung cấp nguồn [[chất dinh dưỡng]] đầy đủ và không chịu các áp lực từ môi trường nó sống. Chỉ một phần nhỏ gene của một sinh vật là gene cơ bản. Ở vi khuẩn, ước tính có khoảng 250–400 gene cơ bản đối với ''[[Escherichia coli]]'' và ''[[Bacillus subtilis]]'', mà số lượng này nhỏ hơn 10% tổng số gene của chúng.<ref>{{cite journal|last1=Gerdes|first1=SY et al|title=Experimental determination and system level analysis of essential genes in Escherichia coli MG1655.|journal=Journal of Bacteriology|date=October 2003|volume=185|issue=19|pages=5673–84|pmid=13129938|doi=10.1128/jb.185.19.5673-5684.2003|pmc=193955}}</ref><ref>{{cite journal|last1=Baba|first1=T et al|title=Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection.|journal=Molecular Systems Biology|date=2006|volume=2|pages=2006.0008|pmid=16738554|doi=10.1038/msb4100050|pmc=1681482}}</ref><ref name="Juhas">{{cite journal|last1=Juhas|first1=M et al|title=Bacillus subtilis and Escherichia coli essential genes and minimal cell factories after one decade of genome engineering.|journal=Microbiology|date=November 2014|volume=160|issue=Pt 11|pages=2341–51|pmid=25092907|doi=10.1099/mic.0.079376-0}}</ref> Một nửa các genegen này là ortholog trong cả hai vi khuẩn và phần lớn tham gia vào [[sinh tổng hợp protein]].<ref name="Juhas"/> Ở nấm men ''[[Saccharomyces cerevisiae]]'' số lượng gene cơ bản cao hơn một chút, ở mức 1000 gene (~20% bộ gene của nó).<ref name="ReferenceA">{{cite journal|last1=Tu|first1=Z et al|title=Further understanding human disease genes by comparing with housekeeping genes and other genes|journal=BMC Genomics|date=21 February 2006|volume=7|pages=31|pmid=16504025|pmc=1397819|doi=10.1186/1471-2164-7-31}} {{open access}}</ref> Mặc dù số lượng này càng khó xác định hơn ở sinh vật nhân thực bậc cao, ước tính ở chuột và người có khoảng 2000 gene cơ bản (~10% bộ gene).<ref name="georgi">{{cite journal|last1=Georgi|first1=B et al|title=From mouse to human: evolutionary genomics analysis of human orthologs of essential genes.|journal=PLOS Genetics|date=May 2013|volume=9|issue=5|pages=e1003484|pmid=23675308|doi=10.1371/journal.pgen.1003484|pmc=3649967}} {{open access}}</ref> Sinh vật tổng hợp, ''[[Syn 3]]'', chứa 473 gene cơ bản và một số gene gần cơ bản (cần thiết cho sự sinh trưởng nhanh), mặc dù có 149 gene là chưa rõ chức năng.<ref name="Hutchison">{{Cite journal|last=Hutchison|first=Clyde A. et al |date=2016-03-25|title=Design and synthesis of a minimal bacterial genome|url=http://science.sciencemag.org/content/351/6280/aad6253|journal=Science|language=en|volume=351|issue=6280|pages=aad6253|doi=10.1126/science.aad6253|issn=0036-8075|pmid=27013737|bibcode=2016Sci...351.....H}}</ref>
 
Các gene cơ bản bao gồm gene giữ nhà (housekeeping gene, chúng đặc biệt quan trọng cho các chức năng cơ bản của tế bào)<ref>{{cite journal|last1=Eisenberg|first1=E|last2=Levanon|first2=EY|title=Human housekeeping genes, revisited.|journal=Trends in Genetics|date=October 2013|volume=29|issue=10|pages=569–74|pmid=23810203|doi=10.1016/j.tig.2013.05.010}}</ref> cũng như các genegen được biểu hiện ở những thời điểm khác nhau trong các giai đoạn [[sinh học phát triển|phát triển]] hoặc vòng đời sinh học.<ref>{{cite journal|last1=Amsterdam|first1=A|last2=Hopkins|first2=N|title=Mutagenesis strategies in zebrafish for identifying genes involved in development and disease.|journal=Trends in Genetics|date=September 2006|volume=22|issue=9|pages=473–8|pmid=16844256|doi=10.1016/j.tig.2006.06.011}}</ref> Các gene giữ nhà được sử dụng trong [[kiểm soát khoa học]] khi thực hiện phân tích biểu hiện genegen, vì chúng được biểu hiện cấu thành ở mức độ tương đối không đổi.
 
=== Định danh gene và bộ gene ===
[[Định danh gene]] được quản lý bởi [[Ủy ban HUGO về danh mục gen|Ủy ban định danh gene]] ([[Tổ chức Bộ gen loài người|HUGO]]) cho mỗi gene đã biết ở người tuân theo dạng thức đã được phê chuẩn về tên của một genegen và ký hiệu tương ứng của nó, cho phép dữ liệu về nó có thể truy cập được thông qua cơ sở dữ liệu quản lý bởi Ủy ban này. Các ký hiệu được chọn duy nhất cho từng gene (mặc dù đôi lúc phê duyệt lại ký hiệu thay đổi). Các ký hiệu được ưu tiên đặt sao cho giữ sự nhất quán với các thành viên khác trong một gia đình gene và với các genegen tương đồng ở những loài khác, đặc biệt là ở [[chuột nhắt|chuột]] do nó được sử dụng là một trong những [[sinh vật mô hình]].<ref>{{cite web|title=About the HGNC|url=https://www.genenames.org/about/overview|website=HGNC Database of Human Gene Names|publisher=HUGO Gene Nomenclature Committee|accessdate=14 May 2015}}</ref>
 
== Kỹ thuật di truyền ==
Hàng 327 ⟶ 326:
{{chính|Kỹ thuật di truyền}}
 
Kỹ thuật di truyền là các phương pháp chỉnh sửa bộ gene của một sinh vật nhờ các [[công nghệ sinh học]]. Từ thập niên 1970, nhiều kỹ thuật đã được phát triển để thực hiện thêm, loại bỏ hoặc sửa đổi các genegen trong sinh vật.<ref>{{cite journal|author1=Stanley N. Cohen |author2=Annie C. Y. Chang |url = http://www.pnas.org/content/70/5/1293.short|title = Recircularization and Autonomous Replication of a Sheared R-Factor DNA Segment in Escherichia coli Transformants |journal= PNAS|date = 1 May 1973|accessdate = 17 July 2010|doi= 10.1073/pnas.70.5.1293 |volume=70 |pages=1293–1297|pmc=433482}}</ref> Các kỹ thuật [[chỉnh sửa bộ gene]] được phát triển gần đây sử dụng các enzyme [[nuclease]] để tạo ra các đích [[sửa chữa DNA]] trong nhiễm sắc thể hoặc là phá vỡ hay chỉnh sửa một genegen khi vị trí đứt gãy được sửa đổi.<ref>{{Cite journal | last1 = Esvelt | first1 = KM. | last2 = Wang | first2 = HH. | title = Genome-scale engineering for systems and synthetic biology | journal = Mol Syst Biol| volume = 9 | issue = 1| pages = 641 | month = | year = 2013 | doi = 10.1038/msb.2012.66 | pmid = 23340847 | pmc=3564264}}</ref><ref>{{Cite journal | last1 = Tan | first1 = WS. et al | title = Precision editing of large animal genomes | journal = Adv Genet | volume = 80 | issue = | pages = 37–97 | month = | year = 2012 | doi = 10.1016/B978-0-12-404742-6.00002-8 | pmid = 23084873 | pmc=3683964| series = Advances in Genetics | isbn = 9780124047426 }}</ref><ref>{{Cite journal | last1 = Puchta | first1 = H. | last2 = Fauser | first2 = F. | title = Gene targeting in plants: 25 years later | journal = Int. J. Dev. Biol | volume = 57 | issue = 6–7–8| pages = 629–637 | month = | year = 2013 | doi = 10.1387/ijdb.130194hp | pmid = }}</ref><ref name="ran">{{cite journal |authors=Ran FA et al |title=Genome engineering using the CRISPR-Cas9 system |journal=Nat Protoc |volume=8 |issue=11 |pages=2281–308 |year=2013 |pmid=24157548 |pmc=3969860 |doi=10.1038/nprot.2013.143 |url=}}</ref> Ngành sinh học tổng hợp (synthetic biology) đôi khi sử dụng các kỹ thuật liên quan để mở rộng nghiên cứu di truyền trên một sinh vật.<ref>{{Cite journal|url = http://www.sciencedirect.com/science/article/pii/S1367593112000786|title = Successes and failures in modular genetic engineering|last = Kittleson|first = Joshua|date = 2012|journal = Current Opinion in Chemical Biology|doi = 10.1016/j.cbpa.2012.06.009|pmid = 22818777|access-date =|volume=16|issue = 3–4|pages=329–336}}</ref>
 
Kỹ thuật di truyền hiện nay là công cụ nghiên cứu thường xuyên áp dụng cho các sinh vật mô hình. Ví dụ, có thể dễ dàng thêm vào các genegen ở vi khuẩn<ref>{{cite journal |doi = 10.1534/genetics.109.112144|title = Personal Reflections on the Origins and Emergence of Recombinant DNA Technology|year = 2010|last1 = Berg|first1 = P.|last2 = Mertz|first2 = J. E.|journal = Genetics|volume = 184|pages = 9–17|pmid = 20061565|issue = 1|pmc = 2815933}}</ref> và nòi giống ở [[chuột knockout]] với một chức năng gene đặc biệt bị bất hoạt nhằm nghiên cứu chức năng của các genegen.<ref>{{Cite journal|title = The Knockout Mouse Project|url = http://www.nature.com/ng/journal/v36/n9/full/ng0904-921.html|journal = Nature Genetics|date = September 2004|issn = 1061-4036|pmc = 2716027|pmid = 15340423|pages = 921–924|volume = 36|issue = 9|doi = 10.1038/ng0904-921|first = Christopher P.|last = Austin et al}}</ref><ref>{{Cite journal|title = A review of current large-scale mouse knockout efforts |url = http://doi.wiley.com/10.1002/dvg.20594|journal = Genesis|pages = NA| doi=10.1002/dvg.20594|year = 2010|last1 = Guan|first1 = Chunmei et al}}</ref> Nhiều sinh vật đã được sửa đổi về mặt di truyền để ứng dụng trong [[nông nghiệp]] (thực phẩm biến đổi gene), công nghiệp công nghệ sinh học, và [[y học]].
 
Đối với sinh vật đa bào, đặc biệt là các [[phôi]] được tác động theo ý muốn trước khi trưởng thành hay các [[GMO|sinh vật chỉnh sửa genegen]] (GMO).<ref name=Deng_2007>{{cite journal | vauthors = Deng C | title = In celebration of Dr. Mario R. Capecchi's Nobel Prize | journal = International Journal of Biological Sciences | volume = 3 | issue = 7 | pages = 417–419 | year = 2007 | pmid = 17998949 | pmc = 2043165 | doi = 10.7150/ijbs.3.417 | url = http://www.biolsci.org/v03p0417.htm }}</ref> Tuy nhiên, bộ gene của các tế bào trong sinh vật trưởng thành có thể chỉnh sửa bằng cách sử dụng các kỹ thuật [[liệu pháp gene]] để điều trị các bệnh liên quan tới di truyền.
 
== Xem thêm ==
Hàng 338 ⟶ 337:
* [[Vốn gen]]
* [[Giải thuật di truyền]]
* [[Danh sách genegen ở người]]
}}