Issuu on Google+

Máster en Biología Molecular y Biotecnología

GENÉTICA MOLECULAR

TEMA 1: TÉCNICAS MODERNAS DE SECUENCIACIÓN ( “High Throughput, Next Generation Sequencing o NGS”)


Rendimiento (kbp)

1016 1014 1012 1010 108 106 104 102

NGS


PRINCIPIOS DE LA POLIMERIZACIÓN DE DNA IN VITRO

Cebador

Cadena molde

OH 3´

Polimerasa de DNA + 4 dNTPs

Síntesis de DNA


PRINCIPIOS DE LA POLIMERIZACIÓN DE DNA IN VITRO Extremo 5´-P

+ desoxinucleótido normal

pirofosfato (PPi)

+

+

La cadena puede elongarse

H+


FUNDAMENTOS DE LA SECUENCIACIÓN POR EL MÉTODO DE LOS DIDESOXINUCLEÓTIDOS (Fred Sanger, 1977) Extremo 5´-P

+ didesoxinucleótido

pirofosfato (PPi)

+

La cadena se termina

+

H+


FUNDAMENTOS DE LA SECUENCIACIÓN POR EL MÉTODO DE LOS DIDESOXINUCLEÓTIDOS (Fred Sanger, 1977) Cadena de DNA a secuenciar Cebador Polimerasa + 4 dNTPs + ↓ ddATP

Desnaturalización y separación en gel de poliacrilamida


EVOLUCIÓN DEL MÉTODO DE LOS ddNTPs: dye terminators (Leroy Hood,1986) y secuenciadores automáticos (Applied Biosystems, 1987)

3´ A A T

C G T

•  Lectura “a mano” •  ∼300 b/muestra

•  Lectura “automatizada” •  ∼600-800 b/muestra


SECUENCIACIÓN POR EL MÉTODO DE LOS DIDESOXINUCLEÓTIDOS: “dye terminators” y secuenciadores automáticos Cadena molde

TTGCATACGA

Capilar

Láser

Detector

Cromatograma


SECUENCIACIÓN AUTOMATIZADA POR EL MÉTODO DE LOS DIDESOXINUCLEÓTIDOS (SECUENCIADORES DE "PRIMERA GENERACIÓN") Secuenciadores automáticos (nº capilares): 1, 4, 16, 48, 96 (1998, utilizado por Celera y algunos laboratorios del consorcio público para el PGH)

Applied Biosystems 3730x1 96 capilares è ∼ 0.5 Mb/ 24h


Borrador del “Genoma humano (3 Gb)” en 2001 (obtenido usando varios cientos de secuenciadores automáticos)

Consorcio público: ~300 millones $, ~10 años

Celera Genomics: ~100 millones $, ~3 años


SECUENCIACIÓN AUTOMATIZADA DE ALTO RENDIMIENTO POR EL MÉTODO DE LOS DIDESOXINUCLEÓTIDOS: 384 capilares (2002)

GE Healthcare MegaBACE 4500

384 capilares è ∼ 2.8 Mb/ 24h (4600 muestras) Un genoma humano en ∼ 2 meses: 100 secuenciadores de 384 capilares


SECUENCIACIÓN POR LOS MÉTODOS DE NUEVA GENERACIÓN Los secuenciadores de nueva generación más modernos, operados por una sola persona, pueden generar tantos datos en 24h como varios cientos de secuenciadores automáticos de capilares.

OBJETIVOS: •  ↑ RAPIDEZ •  ↓ CANTIDAD DE MUESTRA (50 ng-1 µg DNA) •  ↓ COSTE (≤ $1000/genoma humano) •  ↑ PRECISIÓN (≤1/106 bases)


Rendimiento por "corrida" (kbp)

1016 1014 1012 1010 108 106

Secuenciadores capilares de alto rendimiento

104 102

NGS ABI 3730 (capilares)

Illumina 454 SOLiD

1ª Generación (capilares)

2ª Generación (moléculas de DNA amplificadas)

Illumina Hi-Seq2000

GridION

PacBio RS Heliscope

3ª Generación (moléculas de DNA individuales)


Secuenciación por capilares: Consorcio público: ~300 millones $, ~10 años “Genoma humano” (2001) Celera Genomics: Genoma diploide de Craig Venter (2007):

~100 millones $, ~3 años ~10 millones $, ~3 años

Secuenciación por los métodos de 2ª Generación: Genoma diploide de Watson (2008) por 454: ~1 millón $, 2 meses

Genoma diploide de africano/chino (2008) por Illumina: ~250.000 $, 2 meses (desde entonces , los precios han bajado)


MÉTODOS DE “SEGUNDA GENERACIÓN”

Reacciones en volúmenes muy pequeños (picolitros, en algunos casos)

Secuenciación paralela de miles de “Polonies” (Polymerase colonies) o "Clústers": amplificación clonal para obtener miles de fragmentos de DNA idénticos inmovilizados

↓ tiempo reacción ↓ coste ↑ rendimiento


454 GS-FLX de Roche Life Sciences (2005)

Amplificación clonal Secuenciación Lecturas Nº bases por experimento Coste por Mb

PCR en emulsión

Illumina de Illumina/Solexa (2006)

Amplificación por "puente"

SOLiD de Applied Biosystems (2007)

PCR en emulsión

Pirosecuenciación

Terminadores reversibles

Ligación de oligonucleótidos

≈500-700 b

30-150 b

≈ 50 b

≈ 0.7 Gb (23 horas)

≈ 600 Gb (11 días)

≈ 30 Gb (7 días)

≈ 55 $

≈ 5.97 $

≈ 5.81 $


MĂŠtodo llumina: pasos a seguir


Paso 1. Preparación de la colección de fragmentos 1.1 Rotura aleatoria del DNA genómico (fragmentos de ∼200-400 pb) 1.2 Adición de adaptadores a los extremos (tras reparación y adición de A)

Fragmentos de DNA Adapta -dores

Obtención de extremos romos (polimerasa y exonucleasa)

Adición de A

Ligación de adaptadores

PCR

Colección de fragmentos de DNA listos para el paso 2


Paso 2. Amplificación clonal de los fragmentos La amplificación se lleva a cabo en una célula de flujo (flow cell) con 8 canales (uno por cada colección de fragmentos de DNA a secuenciar). La célula está recubierta de oligonucleótidos complementarios a los cebadores que se unieron a los extremos de los fragmentos. Entrada de flujo

Extremo 3´OH libre

Extremo 5´ anclado

Salida de flujo


Paso 2. Amplificaci贸n clonal de los fragmentos 2.1. Anclaje de los fragmentos de DNA a la superficie de un canal en la c茅lula de flujo. Adici贸n de los fragmentos de DNA flanqueados por cebadores

+dNTPs +polimerasa

Fragmento hibridado

Fragmento copiado

Desnaturalizaci贸n

Fragmento anclado covalentemente


Paso 2. Amplificaci贸n clonal de los fragmentos 2.2. Amplificaci贸n en "puente" (bridge amplification)

+ Hibridaci贸n

+ dNTPs + Polimerasa

+ Desnaturalizaci贸n


Paso 2. Amplificación clonal de los fragmentos 2.2. Amplificación en "puente" (bridge amplification)

Tras múltiples ciclos de hibridación, síntesis y desnaturalización

Clon de moléculas

(∼1µ de ∅)


Paso 3. Secuenciación de los clones de DNA Eliminación de la cadena "reversa"

Bloqueo de 3´OH (evitar que "ceben")

Adición del cebador cebador

1)  En cada ciclo de secuenciación se añaden los cuatro FI-dNTPs, cada uno etiquetado con un fluoróforo distinto eliminable por tratamiento químico. 2)  Los FI-dNTPs están modificados para que la terminación sea reversible. 3)  En cada ciclo de secuenciación se lee una sola base de cada clon de fragmentos. 4)  Se realizan 30-150 ciclos de secuenciación → lecturas de 30-150 b 5)  ∼3 x 108 o más clones leídos a la vez → ∼ 60-600 Gb por experimento


Paso 3. Secuenciación de los clones de DNA 3.1. PRIMER CICLO DE SECUENCIACIÓN (cadena "directa"): G

C

T

A

+ 4 FI-dNTPs + Polimerasa

A

FluorescenT cia verde

Excitación con láser


Paso 3. Secuenciación de los clones de DNA 3.1. PRIMER CICLO DE SECUENCIACIÓN

1ª BASE de la cadena "directa" de cada fragmento

Visualización de la fluorescencia emitida por cada clon en una zona del canal


Paso 3. Secuenciación de los clones de DNA 3.1. PRIMER CICLO DE SECUENCIACIÓN

Antes del siguiente ciclo de secuenciación hay que “borrar” las señales del ciclo anterior y revertir el terminador: → tratamiento químico elimina el fluoróforo y regenera el extremo 3´OH y lavado para eliminar restos


Terminadores reversibles (G): Fluor贸foro

base (G)

Corte para eliminar el fluor贸foro

Bloqueo de 3麓OH Corte para eliminar el bloqueo


Paso 3. Secuenciación de los clones de DNA 3.2. SEGUNDO CICLO DE SECUENCIACIÓN: G + 4 FI-dNTPs + Polimerasa

C

T

A 2ª BASE de la cadena "directa" de cada fragmento

Visualización de la fluorescencia emitida por cada clon


Paso 3. Secuenciación de los clones de DNA Tras n CICLOS DE SECUENCIACIÓN Ciclo

Ciclo

1

2

3

5

Molécula 1

G C T G A ………

Molécula 2

C T T A G ………

Molécula 3

T A A G T ………

Molécula 4

A G C C G ………

………………

4

1 2 3 4 5 ……. n

Molécula n

………………………

Una vez finalizada la lectura (sólo se lee parte de la cadena "directa") se puede regenerar la cadena "reversa" para secuenciar el otro extremo de cada fragmento: "paired end sequencing"


Paso 4. Análisis bioinformático 1) Alineamiento con secuencia de referencia (software BWA,..) (también puede usarse para ensamblaje de novo de genomas)

Secuencia de referencia

2) Análisis de la variación genética (SAMTOOLS, …): •  SNPs (polimorfismos de un solo nucleótido) •  Indels (pequeñas inserciones o deleciones) •  Variaciones estructurales de mayor tamaño

SNP nuevo

SNP conocido


MĂŠtodo llumina: vĂ­deos


MÉTODOS DE “TERCERA GENERACIÓN”


HeliScope de Helicos Biosciences 3陋 Generaci贸n

PacBio RS de Pacific Biosciences Ion PGM de Ion Torrent GridION de Oxford Nanopore

Sin amplificaci贸n (Single Molecule Sequencing)


Single Molecule Real Time Sequencing (SMRT) de Pacific Biosciences

•  dNTPs marcados no convencionales (fluoróforo unido al grupo trifosfato) •  Cada dNTP marcado con un fluoróforo distinto


Single Molecule Real Time Sequencing (SMRT) de Pacific Biosciences Vol= 20 zeptolitros (10-21 l)

Ď•29 DNA polymerase + DNA + 4 dNTPs*


Single Molecule Real Time Sequencing (SMRT) de Pacific Biosciences

•  Lecturas como media >3000 b (hasta10.000) è facilita el ensamblaje y se requieren menos lecturas (cobertura) que en los métodos de 2ª generación. è mejor para resolver regiones repetidas y variaciones estructurales. •  Más rápido y barato que los métodos de 2ª generación (>100 Gb/hora), pero requiere unas 10 veces más de DNA


Secuenciación por Ion Torrent: Vídeos

Pocillo: una sola molécula de DNA

Detector de H+ •  Detección de H+ liberado (cambio de pH) cuando se incorpora un nucleótido: se añade A èlavadoèCèlavadoèG……….


Secuenciación a través de un nanoporo (Oxford Nanopore Technologies): GridION

•  Detección de cambios en la corriente iónica a través de un nanoporo, a medida que lo atraviesa la molécula de DNA o los nucleótidos liberados por exonucleasa. •  Lecturas ultralargas (decenas de kb) de moléculas individuales. •  La secuenciación no tiene una duración fija (hasta que….). Por día: decenas de Gb.


Secuenciación a través de un nanoporo (Oxford Nanopore Technologies): GridION Plataforma escalable según las necesidades: uno o varios nodos

Nodo

Cartucho de secuenciación desechable (reactivos necesarios y 2000-8000 nanoporos)

Vídeos

Secuenciación y análisis de datos a tiempo real


Secuenciación a través de un nanoporo (Oxford Nanopore Technologies): MinION Un secuenciador portátil desechable del tamaño de un USB (cientos de nanoporos)

Se espera que se comercialice a finales de 2013 por un precio inferior a $900


1ª parte presentación