DNA

Bách khoa toàn thư mở Wikipedia

Trang này nói về phân tử mang thông tin di truyền mã hóa. Về DNA khác, xin xem trang DNA (định hướng)
Quá trình tự nhân đôi của DNA, dấu hiệu của sự sống
Quá trình tự nhân đôi của DNA, dấu hiệu của sự sống

Deoxyribonucleic acid (DNA) là một phân tử nucleic acid mang thông tin di truyền mã hóa cho hoạt động sinh trưởng và phát triển của các dạng sống bao gồm cả virus. DNA thường được coi là vật liệu di truyền ở cấp độ phân tử tham gia quyết định các tính trạng. Trong quá trình sinh sản, phân tử DNA được nhân đôi và truyền cho thế hệ sau.

Trong những tế bào eukaryote (thực vật, động vật .v.v), DNA nằm trong nhân tế bào trong khi ở các tế bào vi khuẩn hay các prokaryote khác (archae), DNA không được màng nhân bao bọc, vẫn nằm trong tế bào chất. Ở những bào quan sản sinh năng lượng như lục lạpty thể, cũng như ở nhiều loại virus cũng mang những phân tử DNA đặc thù.

Một cách đơn giản, DNA chính là những phân tử cấu thành nên sự sống, nó chứa đầy đủ thông tin để đảm bảo cho sự họat động bình thường của sinh vật. Ví dụ ở loài người, DNA quy định từ màu tóc, đến chiều cao, hay khả năng mắc bệnh di truyền.

DNA chứa các gene trong cơ thể của bạn là được thừa kế từ DNA của bố và mẹ. Những DNA đó trước tiên gặp nhau trong hợp tử (tế bào trứng được thụ tinh), sau đó tế bào này được phân chia nhiều lần, DNA cũng được sao chép lại sau mỗi lần như vậy cho đến khi hình thành cơ thể con người hòan chỉnh. Như vậy, mỗi tế bào trong cơ thể của bạn đều mang các bản sao của DNA bố mẹ (ngoại trừ tế bào hồng cầu, vì tế bào này không có DNA và không thể phân chia).

Mục lục

[sửa] Sơ lược về DNA

DNA khi quan sát dưới kính hiển vi điện tử
DNA khi quan sát dưới kính hiển vi điện tử
  • DNA có thể được hiểu một cách đơn giản là nơi chứa mọi thông tin chỉ dẫn cần thiết để tạo nên các đặc tính sự sống của mỗi sinh vật;
  • Mỗi phân tử DNA bao gồm các vùng chứa các gene cấu trúc, những vùng điều hòa biểu hiện gene, và những vùng không mang chức năng, hoặc có thể khoa học hiện nay chưa biết rõ gọi là junk DNA;
  • Cấu trúc phân tử DNA được cấu thành gồm 2 chuỗi có thành phần bổ sung cho nhau từ đầu đến cuối. Hai chuỗi này được giữ vững cấu trúc bằng những liên kết hoá học. Các liên kết này khi bị cắt sẽ làm phân tử DNA tách tời 2 chuỗi tương tự như khi ta kéo chiếc phéc mơ tuya;
  • Về mặt hoá học, các DNA được cấu thành từ những viên gạch, gọi là nucleotide,viết tắt là Nu.Do các Nu chi khác nhau ở base (1Nu = 1 Desoxyribose + 1 phosphate + 1 base),nên tên gọi của Nu cũng là tên của base mà nó mang.Chỉ có 4 loại gạch cơ bản là A, T, C, và G;
  • Mỗi base trên 1 chuỗi chỉ có thể bắt cặp với 1 loại base nhất định trên chuỗi kia theo một quy luật chung cho mọi sinh vật. VD theo quy luật, một "A" ở chuỗi của phân tử DNA sợi kép sẽ chỉ liên kết đúng với một "T" ở chuỗi kia.(Nguyên tắc bổ sung)
  • Trật tự các base dọc theo chiều dài của chuỗi DNA gọi là trình tự, trình tự này rất quan trọng vì nó chính là mật mã nói lên đặc điểm hình thái của sinh vật. Tuy nhiên, vì mỗi loại base chỉ có khả năng kết hợp với 1 loại base trên sợi kia, cho nên chỉ cần trình tự base của 1 chuỗi là đã đại diện cho cả phân tử DNA.
  • Khi DNA tự nhân đôi, 2 chuỗi của DNA mạch kép trước tiên được tách đôi nhờ sự hỗ trợ của một số protein chuyên trách. Mỗi chuỗi DNA sau khi tách ra sẽ thực hiện việc tái tạo một chuỗi đơn mới phù hợp bằng cách mỗi base trên chuỗi gốc sẽ chọn loại base tương ứng (đang nằm tự do trong môi trường xung quanh) theo quy luật như trên. Do đó, sau khi nhân đôi, 2 phân tử DNA mới (mỗi phân tử chứa một chuỗi cũ và một chuỗi mới) đều giống hệt trình tự nhau nếu như không có đột biến xảy ra.
  • Đột biến hiểu đơn giản là hậu quả của những sai sót hoá học trong quá trình nhân đôi. Bằng cách nào đó, một base đã bị bỏ qua, chèn thêm, bị sao chép nhầm hay có thể chuỗi DNA bị đứt gẫy hoặc gắn với chuỗi DNA khác. Về mặt cơ bản, sự xuất hiện những đột biến này là ngẫu nhiên và xác suất rất thấp.

[sửa] Ứng dụng khoa học DNA trong thực tiễn

[sửa] DNA trong vấn đề tội phạm

Khoa học hình sự có thể sử dụng DNA thu nhận từ máu, tinh dịch hay lông, tóc của hung thủ để lại trên hiện trường mà điều tra, giám định vụ án. Lĩnh vực này gọi là kỹ thuật vân tay DNA (genetic fingerprinting) hay DNA profiling (kỹ thuật nhận diện DNA). Trong kỹ thuật nhận diện DNA, những đọan ngắn DNA thuộc vùng lặp lại (như STR hoặc ministatellite) được so sánh với nhau để xác định hung thủ trong đối tượng nghi vấn, hoặc xác định huyết thống. Kỹ thuật này được nhà di truyền học Alec Jeffreys phát minh từ năm 1984 và được sử dụng đầu tiên trong vụ án giết người năm 1986 ở toà án vùng Leicestershire, Anh. Ở nhiều nước, toà án yêu cầu lấy mẫu DNA của tất cả nghi phạm các vụ án để thành lập ngân hàng dữ liệu DNA. Ngân hàng này sẽ hỗ trợ cho quá trình điều tra kể cả các vụ án đã cũ khi không xác định được nghi phạm nhưng chỉ có DNA từ hiện trường (đặc biệt trong các vụ án hiếp dâm mà nghi phạm là kẻ lạ mặt). Phương pháp này là một trong những kỹ thuật bảo đảm nhất dùng để xác định tội phạm mặc dù không phải hoàn hảo trong mọi trường hợp (ví dụ, khi không thể thu nhận DNA từ hiện trường hoặc hiện trường có lẫn DNA của một vài nghi phạm).

[sửa] DNA trong khoa học máy tính

Dù có nguồn gốc từ sinh học, DNA lại đóng một vai trò quan trọng trong khoa học máy tính, vừa là một vấn đề đang được tập trung nghiên cứu vừa là một phương pháp tính toán, gọi là tính toán DNA.

Ví dụ đơn giản như, nghiên cứu về các giải thuật tìm kiếm chuỗi, để tìm sự xuất hiện của một trình tự các kí tự (letters) bên trong một trình tự rất lớn các kí tự, là động lực cho việc nghiên cứa DNA, nơi mà ta cần tìm một trình tự cụ thể nào đó các nucleotide bên trong một trình tự rất lớn. Trong các ứng dụng khác như trình biên tập văn bản, ngay cả các giải thuật đơn giản cho vấn đề này thường cũng đủ đáp ứng nhu cầu, nhưng trình tự DNA làm cho những giải thuật này trở thành phải xử lí ở trường hợp gần như xấu nhất vì số lượng kí tự khác biệt là khá nhỏ.

Các cơ sở dữ liệu cũng bị tác động mạnh từ nghiên cứu DNA, nó đòi hỏi các công cụ đặc biệt để lưu trữ và thao tác với các trình tự DNA. Các cơ sở dữ liệu chuyên dụng cho mục đích này được gọi là cơ sở dữ liệu genomic, và có một số thử thách về mặt kĩ thuật liên quan đến tác vụ so trùng gần đúng, so sánh trình tự, tìm kiếm các mẫu lặp lại, và tìm kiếm tính tương đồng.

Vào năm 1994, Leonard Adleman thuộc Đại học Nam California đưa ra những phát biểu đầu tiên khi ông khám phá một cách giải quyết cho bài toàn đường đi Hamilton (Hamiltonian path problem), là một bài toán NP-đầy đủ, dùng các công cụ từ sinh học phân tử, đặc biệt là DNA. Hướng tiếp cận mới, gọi là tính toán DNA, có những thuận lợi thực tiễn so với các máy tính truyền thống về sức mạnh sử dụng, không gian sử dụng, và tính hiệu quả, vì khả năng song song hóa tính toán cao (xem tinh toán song song). Một số các bài toán khác, bao gồm mô phỏng nhiều máy trừu tượng khác nhau, bài toán thỏa mãn nhị nguyên (boolean satisfiability problem), và phiên bản giới hạn của Post correspondence problem, cũng đang được giải quyết dùng tính toán DNA.

Do tính vững chắc của nó, DNA cũng có một vai trò quan trọng trong mã hóa, đặc biệt nó cho phép one-time pad không thể bị phá vỡ có thể được tạo dựng và sử dụng một cách hiệu quả .[1]

[sửa] Tổng quan về cấu trúc phân tử

Mô hình cấu trúc xoắn kép của phân tử DNA
Mô hình cấu trúc xoắn kép của phân tử DNA

Phân tử DNA được coi là "cơ sở vật chất của tính di truyền ở cấp độ phân tử" (molecule of heredity). Tuy nhiên, thực chất về mặt cấu tạo, các DNA không phải một phân tử đơn thuần mà nó được tạo thành từ hai chuỗi polynucleotide, chúng liên kết với nhau và uốn quanh 1 trục tương tự 1 chiết thang dây xoắn. Cấu trúc này được gọi là cấu trúc xoắn kép (double helix) (xem hình minh hoạ).

Mỗi chuỗi polynucleotide chính là do các phân tử nucleotide liên kết với nhau thông qua liên kết phosphodieste giữa gốc đường của nucleotide này với gốc phosphate của nucleotide tiếp theo. Tóm lại, DNA là các đại phân tử (polymer) mà các đơn phân (monomer) là các nucleotide.

Mỗi nucleotide được tạo thành từ một phân tử đường ribose, một gốc phosphate và một bazơ nitơ (nucleobase). Trong DNA chỉ có 4 loại nucleotide và những loại này khác nhau ở thành phần nucleobase. Do đó tên gọi của các loại nucleotide xuất phát từ gốc nucleobase mà nó mang: adenine (A), thymine (T), cytosine (C), và guanine (G). Trong đó, AG là các purine (có kích thước lớn) còn TC,có kích thước nhỏ hơn (pyrimidine).

Trong môi trường dịch thể, 2 chuỗi polynucleotide của 1 phân tử DNA liên kết với nhau bằng liên kết hydro. Liên kết này được tạo ra giữa 2 gốc nucleobase của 2 nucleotide đối diện nhau trên 2 chuỗi, tương tự như những bậc thang trên 1 chiếc thang dây.

Do cấu tạo hoá học của các nucleobase mà liên kết hydro chỉ hình thành giữa 2 loại nucleobase nhất định là A với T (qua 2 liên kết hydro) và C với G (bằng 3 liên kết hydro). Đó thực chất là liên kết giữa một purine và 1 pyrimidine nên khỏang cách tương đối giữa 2 chuỗi polynucleotide được giữ vững. Nguyên tắc hình thành liên kết trên được gọi là nguyên tắc bổ sung và nó phổ biến trên mọi loài sinh vật.

Trong tế bào, dưới tác dụng của một số protein đặc hiệu, 2 chuỗi của phân tử DNA có thể tách nhau ra (còn gọi là biến tính DNA) do các liên kết hydro bị cắt đứt. Khi đó, các nucleotide trên mỗi chuỗi có thể tạo thành liên kết với các nucleotide tự do trong môi trường nội bào. Kết quả của quá trình này là tạo thành 2 phân tử DNA giống hệt nhau từ 1 phân tử DNA ban đầu. Đây cũng chính là nguồn gốc của đặc tính di truyền của sinh vật. Các nhà khoa học có thể thực hiện quá trình tự nhân đôi này trong ống nghiệm gọi là kỹ thuật PCR. Nếu sự bắt cặp giữa nucleotide chuỗi gốc với nucleotide không tuân theo nguyên tắc bổ sung thì sẽ tạo thành đột biến là nguồn gốc của hiện tượng biến dị.

[sửa] Trình tự DNA

Xem thêm: Phương pháp xác định trình tự DNA

Tại các gene trên 1 chuỗi (mạch) phân tử DNA, trật tự sắp xếp các nucleotide tạo thành trình tự của gene. Dựa trên thông tin từ trình tự này, các RNA thông tin được tạo ra thông qua quá trình phiên mã. Và rồi từ các RNA thông tin tế bào sẽ tổng hợp các protein qua quá trình dịch mã tại các thời điểm nhất định của cuộc đời. Mỗi quan hệ giữa trình tự gene với trình tự của các amino acid trên protein được gọi là mã di truyền (một dạng mật mã chung cho mọi sinh vật). Thực chất, ba nucleotide liên tiếp (gọi là một bộ ba hay một codon) trên gene sẽ thông qua những bộ ba tương ứng ở RNA thông tin và RNA vận chuyển mà quy định cho một loại amino acid nhất định (có khỏang 20 loại amino acid khác nhau). Một loại amino acid có thể được quy định bởi một số codon, tuy nhiên mỗi codon chỉ mã hoá cho một loại amino acid. Có 3 codon không mã hoá cho amino acid mà là tín hiệu kết thúc vùng mã hoá (gọi là mã kết thúc.

Ở nhiều loài sinh vật, chỉ có một phần nhỏ trình tự của bộ gene (genome) là dùng để mã hoá protein (gen cấu trúc). Chức năng của phần còn lại là vẫn còn đang được giả định. Thực chất, một số vùng DNA có khả năng bám với protein liên kết DNA, vùng này (gọi là vùng điều hoà) điều khiển quá trình nhân đôi và phiên mã có vai trò cực kỳ quan trọng. Cho tới nay, các nhà khoa học mới chỉ có thể xác định một phần nhỏ vùng điều hoà trên genome. Phần genome còn lại mà chúng ta chưa biết được chức năng gọi là vùng DNA bí ẩn (junk DNA).

Trình tự của DNA cũng xác định khả năng và vị trí mà DNA có thể bị phân huỷ bởi các enzyme giới hạn, một công cụ quan trọng của ngành kỹ thuật di truyền. Bản đồ các khả năng và vị trí cắt trên DNA genome có thể sử dụng như là dấu vân tay của mỗi cá thể nhất định và được ứng dụng trong kỹ thuật vân tay DNA (DNA fingerprinting).

[sửa] Quá trình tự nhân đôi DNA

Bài chính: Quá trình tự nhân đôi DNA

Quá trình tự nhân đôi DNA hay tổng hợp DNA là một cơ chế sao chép các phân tử DNA mạch kép trước mỗi lần phân bào. Kết quả của quá trình này là tạo ra hai phân tử DNA gần như giống nhau hòan tòan, chỉ sai khác với tần số rất thấp (thông thường dưới 1 phần vạn, xem thêm đột biến). Có được như vậy là do cơ chế nhân đôi thực hiện dựa trên nguyên tắc bổ sung, và tế bào có hệ thống tìm kiếm và sửa chữa các sai hỏng DNA họat động hiệu quả.

Trong các phân tử DNA xoắn kép mới tổng hợp thì có 1 chuỗi là từ DNA ban đầu còn chuỗi kia được tổng hợp từ các thành phần của môi trường nội bào, đó là nội dung của nguyên tắc bán bảo toàn.

[sửa] Các đặc tính hoá lý

Bài chính: Các đặc tính hoá lý của phân tử DNA.

Space-filling model of a section of DNA molecule
Space-filling model of a section of DNA molecule

[sửa] Sự kết hợp và tách rời 2 chuỗi đơn

Các liên kết hydro giữ hai chuỗi xoắn kép là những liên kết yếu khiến chúng dễ dàng được tách ra nhờ enzyme (trong điều kiện in vivo) hoặc nhiệt độ trên 90°C (điều kiện in vitro, PCR). Những enzyme như helicase có chức năng tháo xoắn các chuỗi cho phép cho các DNA polymerase, RNA polymerase thực hiện hoạt động. Trong quá trình tháo xoắn, các helicase phải cắt liên kết phosphodieste của một trong hai chuỗi để tránh các chuỗi bị xoắn vòng quanh.

[sửa] DNA vòng

Trong tự nhiên, cũng như ở điều kiện in vitro, phân tử DNA có thể tồn tại dưới dạng sợi vòng, mạch kép. Ở dạng cấu trúc này, cấu trúc xoắn không gian không dễ dàng bị tháo xoắn do nhiệt hay các quá trình hoá học nếu không làm đứt gãy 1 mạch. Trong tự nhiên, các topoisomerase thực hiện nhiệm vụ tháo xoắn bằng cách cắt tạm thời một mạch và gắn lại sau khi đã tháo xoắn, quá trình này là bước khởi đầu cho hoạt động phiên mã. Trong phòng thí nghiệm, người ta có thể gắn nối 2 đầu của sợi DNA mạch thẳng thành 1 DNA vòng trong quá trình tạo ra các plasmid tái tổ hợp.

[sửa] Great length versus tiny breadth

The narrow breadth of the double helix makes it impossible to detect by conventional electron microscopy, except by heavy staining. At the same time, the DNA found in many cells can be macroscopic in length -- approximately 5 centimetres long for strands in a human chromosome. Consequently, cells must compact or "package" DNA to carry it within them. This is one of the functions of the chromosomes, which contain spool-like proteins known as histones, around which DNA winds.

[sửa] Entropic stretching behavior

When DNA is in solution, it undergoes conformational fluctuations due to the energy available in the thermal bath. For entropic reasons, more floppy states are thermally accessible than stretched out states; for this reason, a single molecule of DNA stretches similarly to a rubber band. Using optical tweezers, the entropic stretching behavior of DNA has been studied and analyzed from a polymer physics perspective, and it has been found that DNA behaves like the Kratky-Porod worm-like chain model with a persistence length of about 53 nm.

Furthermore, DNA undergoes a stretching phase transition at a force of 65 pN; above this force, DNA is thought to take the form that Linus Pauling originally hypothesized, with the phosphates in the middle and bases splayed outward. This proposed structure for overstretched DNA has been called "P-form DNA," in honor of Pauling.

[sửa] Different helix geometries

The DNA helix can assume one of three slightly different geometries, of which the "B" form described by James D. Watson and Francis Crick is believed to predominate in cells. It is 2 nanometres wide and extends 3.4 nanometres per 10 bp of sequence. This is also the approximate length of sequence in which the double helix makes one complete turn about its axis. This frequency of twist (known as the helical pitch) depends largely on stacking forces that each base exerts on its neighbors in the chain.

[sửa] Supercoiled DNA

The B form of the DNA helix twists 360° per 10.6 bp in the absence of strain. But many molecular biological processes can induce strain. A DNA segment with excess or insufficient helical twisting is referred to, respectively, as positively or negatively "supercoiled". DNA in vivo is typically negatively supercoiled, which facilitates the unwinding of the double-helix required for RNA transcription.

[sửa] Conditions for formation of A and Z helices

The two other known double-helical forms of DNA, called A and Z, differ modestly in their geometry and dimensions. The A form appears likely to occur only in dehydrated samples of DNA, such as those used in crystallographic experiments, and possibly in hybrid pairings of DNA and RNA strands. Segments of DNA that cells have methylated for regulatory purposes may adopt the Z geometry, in which the strands turn about the helical axis like a mirror image of the B form.

[sửa] Table of comparison of the properties of different helical forms

Geometry attribute A-form B-form Z-form
Helix sense right-handed right-handed left-handed
Repeating unit 1 bp 1 bp 2 bp
Rotation/bp 33.6° 35.9° 60°/2
Mean bp/turn 10.7 10.0 12
Inclination of bp to axis +19° -1.2° -9°
Rise/bp along axis 0.23 nm 0.332 nm 0.38 nm
Pitch/turn of helix 2.46 nm 3.32 nm 4.56 nm
Mean propeller twist +18° +16°
Glycosyl angle anti anti C: anti,
G: syn
Sugar pucker C3'-endo C2'-endo C: C2'-endo,
G: C2'-exo
Diameter 2.6 nm 2.0 nm 1.8 nm

[sửa] Non-helical forms

Other, including non-helical, forms of DNA have been described, for example a side-by-side (SBS) configuration. Indeed, it is far from certain that the B-form double helix is the dominant form in living cells.

[sửa] Chiều của trình tự DNA

The asymmetric shape and linkage of nucleotides means that a DNA strand always has a discernible orientation or directionality. Because of this directionality, close inspection of a double helix reveals that nucleotides are heading one way along one strand (the "ascending strand"), and the other way along the other strand (the "descending strand"). This arrangement of the strands is called antiparallel.

[sửa] Chemical nomenclature (5' and 3')

For reasons of chemical nomenclature, people who work with DNA refer to the asymmetric ends of \"five prime" and "three prime"). DNA workers and enzymes alike always read nucleotide sequences in the "5' to 3' direction". In a vertically oriented double helix, the 3' strand is said to be ascending while the 5' strand is said to be descending.

[sửa] Sense and antisense

As a result of their antiparallel arrangement and the sequence-reading preferences of enzymes, even if both strands carried identical instead of complementary sequences, cells could properly translate only one of them. The other strand a cell can only read backwards. Molecular biologists call a sequence "sense" if it is translated or translatable, and they call its complement "antisense". It follows then, somewhat paradoxically, that the template for transcription is the antisense strand. The resulting transcript is an RNA replica of the sense strand and is itself sense.

[sửa] An exception: viruses

Some viruses blur the distinction between sense and antisense, because certain sequences of their genomes do double duty, encoding one protein when read 5' to 3' along one strand, and a second protein when read in the opposite direction along the other strand. As a result, the genomes of these viruses are unusually compact for the number of genes they contain, which biologists view as an adaptation.

[sửa] As viewed by topologists

Topologists like to note that the juxtaposition of the 3′ end of one DNA strand beside the 5′ end of the other at both ends of a double-helical segment makes the arrangement a "crab canon".

[sửa] DNA sợi đơn (ssDNA) và cơ chế sửa lỗi đột biến

Trong một số loài virus, DNA nhiễm sắc thể của chúng có dạng sợi đơn, không cuộn xoắn. Vì rằng hầu hết các cơ chế sửa chữa sai hỏng DNA của tế bào chỉ thực hiện trên các base đã bắt cặp, do đó các virus mang DNA genome sợi đơn thường có tần số đột biến cao hơn các loài khác. Nhờ đó, những loài virus này thường có khả năng thích nghi nhanh hơn để trách bị loại bỏ, hay tuyệt chủng. Tuy nhiên, đặc điểm này không tỏ ra có ích đối với những sinh vật cấu tạo phức tạp hơn và có tần số sinh sản chậm hơn so với virus. Điều này giải thích tại sao chỉ có những loài virus mới dùng DNA sợi đơn làm vật liệu di truyền. Ngoài ra, những virus DNA sợi đơn cũng tiết kiệm năng lượng tốt hơn với cơ chế nhân đôi DNA so với những loài virus DNA sợi kép.

[sửa] Lịch sử phát hiện DNA và chuỗi xoắn kép

James Watson in the Cavendish Laboratory at the University of Cambridge
James Watson in the Cavendish Laboratory at the University of Cambridge

The discovery that DNA was the carrier of genetic information was a process that required many earlier discoveries. The existence of DNA was discovered in the mid 19th century. However, it was only in the early 20th century that researchers began suggesting that it might store genetic information. This was only accepted after the structure of DNA was elucidated by Watson and Crick in their 1953 Nature publication. Watson and Crick proposed the central dogma of molecular biology in 1957, describing the process whereby proteins are produced from nucleic DNA.

[sửa] First isolation of DNA

Working in the 19th century, biochemists initially isolated DNA and RNA (mixed together) from cell nuclei. They were relatively quick to appreciate the polymeric nature of their "nucleic acid" isolates, but realized only later that nucleotides were of two types--one containing ribose and the other deoxyribose. It was this subsequent discovery that led to the identification and naming of DNA as a substance distinct from RNA.

Friedrich Miescher (1844-1895) discovered a substance he called "nuclein" in 1869. Somewhat later, he isolated a pure sample of the material now known as DNA from the sperm of salmon, and in 1889 his pupil, Richard Altmann, named it "nucleic acid". This substance was found to exist only in the chromosomes.

[sửa] Establishing a link between heritable traits and chromosomes

Max Delbrück, Nikolai V. Timofeeff-Ressovsky, and Karl G. Zimmer published results in 1935 suggesting that chromosomes are very large molecules the structure of which can be changed by treatment with X-rays, and that by so changing their structure it was possible to change the heritable characteristics governed by those chromosomes. (Delbrück and Salvador Luria were awarded the Nobel Prize in 1969 for their work on the genetic structure of viruses.) In 1943, Oswald Theodore Avery discovered that traits proper to the "smooth" form of the Pneumococcus could be transferred to the "rough" form of the same bacteria merely by making the killed "smooth" (S) form available to the live "rough" (R) form. Quite unexpectedly, the living R Pneumococcus bacteria were transformed into a new strain of the S form, and the transferred S characteristics turned out to be heritable. Avery called the medium of transfer of traits the transforming principle; he identified DNA as the transforming principle, and not protein as previously thought. In 1953, Alfred Hershey and Martha Chase did an experiment (Hershey-Chase experiment) that showed, in T2 phage, that DNA is the genetic material (Hershey shared the Nobel prize with Luria).

Francis Crick's first sketch of the deoxyribonucleic acid double-helix pattern
Francis Crick's first sketch of the deoxyribonucleic acid double-helix pattern

In 1944, the renowned physicist, Erwin Schrödinger, published a brief book entitled What is Life?, where he maintained that chromosomes contained what he called the "hereditary code-script" of life. He added: "But the term code-script is, of course, too narrow. The chromosome structures are at the same time instrumental in bringing about the development they foreshadow. They are law-code and executive power -- or, to use another simile, they are architect's plan and builder's craft -- in one." He conceived of these dual functional elements as being woven into the molecular structure of chromosomes. By understanding the exact molecular structure of the chromosomes one could hope to understand both the "architect's plan" and also how that plan was carried out through the "builder's craft." Francis Crick, James D. Watson, Maurice Wilkins, Rosalind Franklin, Seymour Benzer, et al., took up the physicist's challenge to work out the structure of the chromosomes and the question of how the segments of the chromosomes that were conceived to relate to specific traits could possibly do their jobs.

Just how the presence of specific features in the molecular structure of chromosomes could produce traits and behaviors in living organisms was unimaginable at the time. Because chemical dissection of DNA samples always yielded the same four nucleotides, the chemical composition of DNA appeared simple, perhaps even uniform. Organisms, on the other hand, are fantastically complex individually and widely diverse collectively. Geneticists did not speak of genes as conveyors of "information" in such words, but if they had, they would not have hesitated to quantify the amount of information that genes need to convey as vast. The idea that information might reside in a chemical in the same way that it exists in text--as a finite alphabet of letters arranged in a sequence of unlimited length--had not yet been conceived. It would emerge upon the discovery of DNA's structure, but few researchers imagined that DNA's structure had much to say about genetics.

[sửa] Discovery of the structure of DNA

In the 1950s, only a few groups made it their goal to determine the structure of DNA. These included an American group led by Linus Pauling, and two groups in Britain. At the University of Cambridge, Crick and Watson were building physical models using metal rods and balls, in which they incorporated the known chemical structures of the nucleotides, as well as the known position of the linkages joining one nucleotide to the next along the polymer. At King's College, London, Maurice Wilkins and Rosalind Franklin were examining X-ray diffraction patterns of DNA fibers. Of the three groups, only the London group was able to produce good quality diffraction patterns and thus produce sufficient quantitative data about the structure

The chemical structure of DNA
The chemical structure of DNA

[sửa] Discovery that DNA is helical

A key inspiration in the work of all of these teams was the discovery in 1948 by Pauling that many proteins included helical (see alpha helix) shapes. Pauling had deduced this structure from X-ray patterns. Even in the initial diffraction data from DNA by Maurice Wilkins, it was evident that the structure involved helices. But this insight was only a beginning. There remained the questions of how many strands came together, whether this number was the same for every helix, whether the bases pointed toward the helical axis or away, and ultimately what were the explicit angles and coordinates of all the bonds and atoms. Such questions motivated the modeling efforts of Watson and Crick.

[sửa] Discovery that complementary nucleotides occur in equal proportions

In their modeling, Watson and Crick restricted themselves to what they saw as chemically and biologically reasonable. Still, the breadth of possibilities was very wide. A breakthrough occurred in 1952, when Erwin Chargaff visited Cambridge and inspired Crick with a description of experiments Chargaff had published in 1947. Chargaff had observed that the proportions of the four nucleotides vary between one DNA sample and the next, but that for particular pairs of nucleotides -- adenine and thymine, guanine and cytosine -- the two nucleotides are always present in equal proportions.

[sửa] Watson and Crick's model

Crick and Watson DNA model built in 1953, currently on display at the National Science Museum in London.
Crick and Watson DNA model built in 1953, currently on display at the National Science Museum in London.

Watson and Crick had begun to contemplate double helical arrangements, but they lacked information about the amount of twist (pitch) and the distance between the two strands. Rosalind Franklin had to disclose some of her findings for the Medical Research Council and Crick saw this material through Max Perutz's links to the MRC. Franklin's work confirmed a double helix that was on the outside of the molecule and also gave an insight into its symmetry, in particular that the two helical strands ran in opposite directions.

Watson and Crick were again greatly assisted by more of Franklin's data. This is controversial because Franklin's critical X-ray pattern was shown to Watson and Crick without Franklin's knowledge or permission. Wilkins showed the famous Photo 51 to Watson at his lab immediately after Watson had been unsuccessful in asking Franklin to collaborate to beat Pauling in finding the structure.

From the data in photograph 51 Watson and Crick were able to discern that not only was the distance between the two strands was constant, but also to measure its exact value of 2 nanometres. The same photograph also gave them the 3.4 nanometre-per-10 bp "pitch" of the helix.

The final insight came when Crick and Watson saw that a complementary pairing of the bases could provide an explanation for Chargaff's puzzling finding. However the structure of the bases had been incorrectly guessed in the textbooks as the enol tautomer when they were more likely to be in the keto form. When Jerry Donohue pointed this fallacy out to Watson, Watson quickly realised that the pairs of adenine and thymine, and guanine and cytosine were almost identical in shape and so would provide equally sized 'rungs' between the two strands. With the base-pairing, the Watson and Crick quickly converged upon a model, which they announced before Franklin herself had published any of her work.

Franklin was two steps away from the solution. She had not guessed the base-pairing and had not appreciated the implications of the symmetry that she had described. However she had been working almost alone and did not have regular contact with a partner like Crick and Watson, and with other experts such as Jerry Donohoe. Her notebooks show that she was aware both of Jerry Donohue's work concerning tautomeric forms of bases (she used the keto forms for three of the bases) and of Chargaff's work.

The disclosure of Franklin's data to Watson has angered some people who believe Franklin did not receive the credit due to her at the time and that she might have discovered the structure on her own before Crick and Watson. In Crick and Watson's famous paper in Nature in 1953, they said that their work had been stimulated by the work of Wilkins and Franklin, whereas it had been the basis of their work. However they had agreed with Wilkins and Franklin that they all should publish papers in the same issue of Nature in support of the proposed structure.

[sửa] Publishing of the "Central Dogma"

Watson and Crick's model attracted great interest immediately upon its presentation. Arriving at their conclusion on February 21 1953, Watson and Crick made their first announcement on February 28. Their paper 'A Structure for Deoxyribose Nucleic Acid' was published on April 25. In an influential presentation in 1957, Crick laid out the "Central Dogma", which foretold the relationship between DNA, RNA, and proteins, and articulated the "sequence hypothesis." A critical confirmation of the replication mechanism that was implied by the double-helical structure followed in 1958 in the form of the Meselson-Stahl experiment. Work by Crick and coworkers showed that the genetic code was based on non-overlapping triplets of codons, and Har Gobind Khorana and others deciphered the genetic code not long afterward. These findings represent the birth of molecular biology.

Watson, Crick, and Wilkins were awarded the 1962 Nobel Prize for Physiology or Medicine for discovering the molecular structure of DNA, by which time Franklin had died. Nobel prizes are not awarded posthumously; had she lived, the difficult decision over whom to jointly award the prize would have been complicated as the prize can only be shared between two or three. The process of the actual nomination is covered in Graeme Hunter's biography of Sir Lawrence Bragg, "Light is a Messenger" (pub. 2004)

[sửa] Tài liệu tham khảo

  • DNA: The Secret of Life, by James D. Watson. ISBN 0-375-41546-7
  • The Double Helix: A Personal Account of the Discovery of the Structure of DNA (Norton Critical Editions), by James D. Watson. ISBN 0393950751

[sửa] Liên kết ngoài