Las notas del presentador contienen información extra que puede serte de utilidad si vas a presentar estas diapositivas.
Presiona P
de nuevo para ir a las notas del presentador.
Presiona C
para crear una ventana nueva donde se visualizará la misma presentación.
Esta ventana está vinculada a la ventana principal. Si cambias las diapositivas en una, las otras cambiarán también.
Útil para dar una presentación.
Las notas del presentador contienen información extra que puede serte de utilidad si vas a presentar estas diapositivas.
Presiona P
de nuevo para ir a las notas del presentador.
Presiona C
para crear una ventana nueva donde se visualizará la misma presentación.
Esta ventana está vinculada a la ventana principal. Si cambias las diapositivas en una, las otras cambiarán también.
Útil para dar una presentación.
Entender las dificultades en la secuenciación y en la amplificación del scRNA-seq y cómo superarlas.
Conocer los tipos de variación en un análisis y cómo controlarlos.
Comprender qué es la reducción de dimensiones y cómo se puede realizar.
Familiarizarse con las principales técnicas de clusterización de datos y cuándo usarlas.
Por ejemplo, ¿Cómo se capturan y secuencian las células?
¿Cómo preparamos las muestras para la secuenciación?
Bulk RNA-seq
Por ejemplo, ¿Cómo se capturan y secuencian las células?
En el análisis bulk RNA-seq, el proceso incluye tomar una muestra, remover las moléculas no deseadas y secuenciar todo lo demás.
¿Cómo preparamos las muestras para la secuenciación?
Bulk RNA-seq
Single-cell RNA-seq
Por ejemplo, ¿Cómo se capturan y secuencian las células?
En el análisis bulk RNA-seq, el proceso incluye tomar una muestra, remover las moléculas no deseadas y secuenciar todo lo demás.
¿Cómo preparamos las muestras para la secuenciación?
Bulk RNA-seq
Single-cell RNA-seq
Replicados Biológicos
Bulk RNA-seq | Cada corte del tejido es una muestra, puede tomar otro corte |
Single-cell RNA-seq | Cada célula es una muestra, no puede tener un replicado porque es única |
Por ejemplo, ¿Cómo se capturan y secuencian las células?
En el análisis bulk RNA-seq, el proceso incluye tomar una muestra, remover las moléculas no deseadas y secuenciar todo lo demás.
La separación de las células puede llevarse a cabo de diferentes maneras.
La separación de las células puede llevarse a cabo de diferentes maneras.
Un método es el pipeteo manual, donde el laboratorista succiona cada célula usando un tubo largo y fino.
La separación de las células puede llevarse a cabo de diferentes maneras.
Un método es el pipeteo manual, donde el laboratorista succiona cada célula usando un tubo largo y fino.
Pueden hacer esto cientos de veces para aislar cientos de células, pero es propenso a errores yy a menudo se aíslan varias células juntas.
¿Cómo se aíslan las células?
La separación de las células puede llevarse a cabo de diferentes maneras.
Un método es el pipeteo manual, donde el laboratorista succiona cada célula usando un tubo largo y fino.
Pueden hacer esto cientos de veces para aislar cientos de células, pero es propenso a errores yy a menudo se aíslan varias células juntas.
Otro método es la citometría de flujo, en el que se reduce el error humano como componente de esta etapa.
Dispersión Óptica
Si el Tamaño de la célula < a la longitud de la onda (~400nm)
Medido en términos:
Dispersion Lateral (SSC)
La dispersión lateral es perpendicular al láser principal y mide la granularidad de la célula, ideal para distinguir las que tienen estructuras internas menos definidas, por ejemplo como los granulocitos que se observan en el eje Y de la imagen.
Image from BD Biosciences
Fluorescence-Activated Cell Sorting (FACS)
Coloque las células en la placa de secuenciación
De un conjunto de muchos muchos tejidos / células de muestras diferentes:
Una vez que las moléculas de ARN han sido etiquetadas con los códigos de barras de las células, pueden ser amplificadas, ya sea por separado o agrupadas, donde los productos amplificados comparten los mismos códigos de barras de células que sus contrapartes originales.
¿Cuántas transcritos rojos hay en la célula?
¿Después de la amplificación por PCR?
¿Qué hacen las pequeñas etiquetas de colores al comienzo de cada transcripción?
Identificadores moleculares únicos (UMI)
Agregado para ayudar a mitigar el sesgo de la amplificación.
Cuantificación de fragmentos
Reads | |
---|---|
Rojo | 6 |
Azul | 3 |
Agrupación de fragmentos de acuerdo con los genes y UMI
UMIs | Reads | |
---|---|---|
Rojo | Rosa | 2 |
Cyan | 4 | |
Azul | Rosa | 1 |
Verde | 2 |
Cuantificación los fragmentos desduplicados (únicos)
UMIs (Grouped) | # UMIs | |
---|---|---|
Rojo | {Rosa, Cyan} | 2 |
Azul | {Rosa, Verde} | 2 |
Sin embargo, si agrupamos los fragmentos por sus UMIs, y luego contamos solo el número de los UMIs únicos por transcripción, eliminando la duplicación de los fragmentos que comparten la misma transcripción y UMIs, llegamos a 2 fragmentos rojas y 2 lecturas azules que representan mejor el verdadero número de transcritos.
UMIs | #Fragmentos | |
---|---|---|
Rojo | {Rosa, Cyan} | 2 |
Azul | {Rosa, Verde} | 2 |
¿Puede cada transcripción en una célula tener su propio UMI?
¿Número de transcripciones de ARNm en una célula?
Requiere un mínimo de códigos de barras de longitud N, donde 4ᴺ = 10⁵
Esto se debe a que a menudo hay más transcripciones que UMI disponibles, que dependen de la cantidad de transcripciones en una célula y de la longitud del código de barras.
Códigos de barras de longitud N Con Distancia de Edición B:
N = 5 y B = 1
AAAAA AAAAC AAAAG AAAAT AAACA ····CCCCC CCCCA CCCCG CCCCT CCCAC ···· · · ·
4⁵ = 1024 códigos de barras
N = 5 y B = 2
AAAAA AAACC AAAGG AAATT AACCA ····CCCCC CCCAA CCCGG CCCTT CCCAA ···· · · ·
4⁵⁻¹ = 512 códigos de barras
Las Distancias de Edición protegen contra errores de secuenciación.
UMIs | # Fragmentos | |
---|---|---|
Rojo | {Rosa, Cyan} | 2 |
Azul | {Rosa, Verde} | 2 |
¿En qué contexto son los UMIs únicos?
UMIs son "sal aleatoria"
Deseamos contar solo las transcripciones
En el contexto de la amplificación, las UMI no necesitan ser únicas, solo necesitan ser lo suficientemente aleatorias para deduplicar las transcripciones a fin de dar una estimación más precisa del número de transcripciones dentro de una celda.
Así que recapitulemos lo que hemos aprendido: primero, cada célula tiene un código de barras celular que a su vez es agregado a cada molécula de ARN en cada célula.
Bulk RNA-seq: Alta Cobertura
T1 | T2 | T3 | |
---|---|---|---|
GenA | 100 | 80 | 40 |
GenB | 45 | 30 | 40 |
scRNA-seq: Muy baja profundidad de secuenciación
C1 | C2 | C3 | C4 | C5 | |
---|---|---|---|---|---|
GenA | 0 | 0 | 2 | 0 | 1 |
GenB | 2 | 0 | 15 | 0 | 0 |
¿Por qué esto es un problema?
$$R(s,g) = \frac{X\{sg}}{(\prod\{s} X\_{s})^{\frac{1}{n}}}$$
$$DESeq(s,g) = \frac{X\{sg}}{Med(R\{s})}$$
Bulk RNA-seq: Alta Cobertura
T1 | T2 | T3 | |
---|---|---|---|
GenA | 100 | 80 | 40 |
GenB | 45 | 30 | 40 |
scRNA-seq: Muy baja profundidad de secuenciación
C1 | C2 | C3 | C4 | C5 | |
---|---|---|---|---|---|
GenA | 0 | 0 | 2 | 0 | 1 |
GenB | 2 | 0 | 15 | 0 | 0 |
¿Por qué esto es un problema?
$$R(s,g) = \frac{X\{sg}}{(\prod\{s} X\_{s})^{\frac{1}{n}}}$$
$$DESeq(s,g) = \frac{X\{sg}}{Med(R\{s})}$$
¡No se puede dividir entre cero!
Calcula el tamaño de la biblioteca de todas las células.
Calcula el tamaño de la biblioteca de una célula de pseudo referencia (promedio)
Separa los tamaños impares (rojo) y los tamaños pares (azul) en dos grupos
Ordena cada grupo por tamaño de biblioteca y lo coloca en lados opuestos de un "anillo"
Define grupos superpuestos de células adyacentes de tamaño k
Para cada grupo
Para cada célula
Considera:
Objetivo:
Nota:
Objetivo:
Restricción:
]
También podemos derivar aún más las relaciones entre estos grupos calculando árboles de linaje en función de la cantidad de ruido en cada grupo, con la expectativa de que las células madre tengan perfiles de expresión ruidosos que produzcan grupos más amplios, y las células maduras tengan perfiles de expresión muy claros que produzcan grupos más apretados.
] | ![]() |
Duro | Suave |
Espacios grandes entre grupos | Los grupos sobrelapan |
Los tipos de células están bien definidos y el agrupamiento lo refleja | Los tipos de células parecen entremezclarse |
Es de esperar un agrupamiento suave, ya que aunque el agrupamiento es un método estadístico para dividir datos de manera discreta, la biología celular subyacente de los datos es un proceso continuo, donde las células pasan de un estado bien definido a otro a través de etapas intermedias que se representan en entre dos centros de grupos.
![Perfiles de expresión discretos: Se muestran tres montañas con nubes de las que sólo vemos tres picos. En rojo, verde y azul se representan tipos de células en los picos. Paisaje de expresión continua: las nubes se eliminan y vemos que las montañas están realmente conectadas y hay células intermedias en varios colores de transición.]
Conjuntos de datos dinámicos con grupos continuamente dinámicos
Variedad de métodos de agrupación
K-means (K-medias)
K-medians (K-medianas)
Si, en cambio, la nueva configuración ha aumentado el número de enlaces externos, la configuración se rechaza y se selecciona y prueba otra célula. Al realizar esto varias veces, se construye una estructura comunitaria de células con el grado de especificidad que desee el usuario.
Los conjuntos de datos de una sola célula son vastos y están escasamente poblados
Se requiere filtrado y normalización de calidad
La selección de funciones y la reducción de dimensiones reducen la complejidad
La agrupación denota tipos de células y relaciones de células
scRNA-seq es un campo impulsado estadísticamente
Hay muchas formas de analizar los datos.
Los datos scRNA-seq requieren ser pre-procesados antes que un análisis sea llevado a cabo.
Los grupos de células con perfiles similares son comparados contra otros grupos.
Los problemas de detectabilidad requieren una atención especial en todas las etapas.
La clusterización es una etapa completa del análisis.
Continúa tu aprendizaje completando uno de nuestros entrenamientos recomendados:
Este material es resultado de trabajo colaborativo. ¡Agradecimientos a Galaxy Training Network y a todos los contribuidores!
Autores/as |
|
Revisores/as |
|
GTN Framework tiene licencia del MIT Creative Commons Attribution 4.0 International License.
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |