El genoma de Saccharomyces cerevisiae
El genoma de Saccharomyces cerevisiae contiene aproximadamente 120.000 pares de bases y se divide en 16 conjuntos de cromosomas. * * * Hay 6275 genes, de los cuales alrededor de 5800 pueden tener funciones reales. Se estima que alrededor del 23% de sus genes son homólogos a los humanos. La base de datos del genoma de la levadura contiene anotaciones detalladas del genoma de la levadura y es una herramienta importante para estudiar la genética y la fisiología de las células eucariotas. Otra importante base de datos de Saccharomyces cerevisiae [1] la mantiene el Centro de Información sobre Secuencias de Proteínas de Munich.
Antes de que comenzara el proyecto de secuenciación de S. cerevisiae, se identificaron aproximadamente 2.600 genes que codifican ARN o proteínas en levaduras mediante métodos genéticos tradicionales. Al secuenciar el genoma completo de Saccharomyces cerevisiae, se descubrió que hay 5885 marcos de lectura abiertos que codifican proteínas específicas en la secuencia del genoma completo de 12068 kb. Esto significa que hay una media de un gen codificador de proteínas cada 2 kb en el genoma de la levadura, es decir, el 72% de la secuencia de nucleótidos de todo el genoma consta de marcos de lectura abiertos. Esto sugiere que los genes de la levadura están más estrechamente organizados que en otros eucariotas superiores. Por ejemplo, en el genoma de los nematodos, hay un promedio de un gen codificador de proteínas cada 6 kb; en el genoma humano, en promedio, se puede encontrar un gen codificador de proteínas cada 30 kb o más. La compacidad del genoma de la levadura se debe a los cortos intervalos entre genes y a la escasez de intrones dentro de los genes. La longitud promedio del marco de lectura abierto en el genoma de la levadura es de 1450 pb, o 483 codones. El más largo es un marco de lectura abierto de función desconocida (4910 codones) ubicado en el cromosoma número 1, y algunos marcos de lectura abiertos superan los 1500 codones. . En el genoma de la levadura también hay genes que codifican proteínas cortas. Por ejemplo, el gen PMP1 codifica una proteína lipídica de la membrana plasmática compuesta por 40 aminoácidos. Además, el genoma de la levadura también contiene: alrededor de 140 genes que codifican ARN, dispuestos en el extremo largo del número de cromosomas; 40 genes que codifican SnRNA, dispersos en 16 cromosomas; 275 genes de ARNt pertenecientes a 43 familias también están ampliamente distribuidos en el genoma; . La Tabla 1 proporciona una descripción general de la distribución de genes de levadura en cada cromosoma. Tabla 1 Mapa de cromosomas de levadura
Número de cromosomas longitud (pb) número de genes y número de genes de ARNt
I 23×103894
II 807 188 410 13< /p >
Ⅲ315×10318210
Ⅳ 153 197479627
V 569 202 27113
Ⅵ 270×10312910
Ⅶ 109 093 657233
Ⅷ561×10326911
Ⅸ 439 8862 2110
X 745 44237924
Ⅺ66 64 483 3116
Ⅻ 1078 1715 3422
ⅻi 924 430 45921
ⅺv 7843 284 1915
XV 109 2283 56020
X ⅵ 94 806 148717 La secuenciación reveló cambios extensos en la composición de bases en el genoma de la levadura. La mayoría de los cromosomas de levadura están compuestos de secuencias de ADN ricas en GC y secuencias de ADN empobrecidas en GC en diversos grados y en un amplio rango. Este cambio en el contenido de GC está relacionado con la estructura cromosómica, la densidad de genes y la frecuencia de recombinación. Las regiones con alto contenido de GC generalmente están ubicadas en el medio de los brazos cromosómicos, y la densidad genética en estas regiones es alta; las regiones con bajo contenido de GC generalmente están cerca de los telómeros y centrómeros, y el número de genes en estas regiones es relativamente pequeño. Simchen et al. demostraron que la incidencia relativa de recombinación genética, o roturas de doble cadena, en la levadura está acoplada a las regiones ricas en GC del cromosoma, con frecuencias de recombinación que varían entre los diferentes cromosomas. La frecuencia de recombinación de los cromosomas más pequeños ⅰ, ⅲ, ⅳ y ⅸ es mayor que la frecuencia de recombinación promedio de todo el genoma.
Otra característica obvia del genoma de la levadura es que contiene muchas secuencias de ADN repetidas, algunas de las cuales son exactamente las mismas secuencias de ADN, como los genes rDNA y CUP1, los factores Ty y sus secuencias LTR únicas derivadas. La presencia de un gran número de repeticiones de trinucleótidos en marcos de lectura abiertos o regiones intergénicas ha atraído gran atención. Porque algunas enfermedades genéticas humanas son causadas por cambios en el número de repeticiones de trinucleótidos.
Hay muchas secuencias de ADN que son altamente homólogas entre sí, lo que se denomina redundancia genética. Los extremos de muchos cromosomas de la levadura tienen regiones altamente homólogas que superan las decenas de kb de longitud. Estas regiones son las principales regiones de abundancia genética y también experimentan frecuentes procesos de recombinación de ADN. Otra forma de abundancia genética es la duplicación de un solo gen, de las cuales las formas dispersas son las más típicas. Otra forma rara son las familias de genes agrupados. Las regiones de homología agrupadas (CHR) son grandes segmentos homólogos ubicados en múltiples cromosomas revelados por la secuenciación del genoma de la levadura. Cada segmento contiene varios genes homólogos correspondientes. Su orden de disposición y dirección de transcripción están muy conservados y puede haber pequeñas inserciones o eliminaciones. Estas características indican que la región de homología de grupos es un producto intermedio entre la duplicación de grandes segmentos cromosómicos y la diferenciación completa y, por tanto, es un buen material para estudiar la evolución del genoma y se denomina fósil de duplicación de genes. Las repeticiones terminales cromosómicas, las repeticiones de un solo gen y las regiones homólogas agrupadas constituyen la estructura general de la abundancia genética en los genomas de levadura. Los estudios han demostrado que un grupo de genes en abundancia genética a menudo tienen funciones fisiológicas iguales o similares, por lo que las mutaciones en uno o varios genes no pueden mostrar fenotipos identificables, lo que es muy perjudicial para la investigación funcional de genes de levadura. Por lo tanto, muchos genetistas de levaduras consideran que comprender la verdadera naturaleza y el significado funcional de la abundancia genética y desarrollar métodos experimentales asociados con ella son dificultades importantes y cuestiones centrales.