El contenido y el progreso de la investigación del proyecto genoma
La unidad de almacenamiento de información vital es en realidad lo que llamamos genes, y el portador es el ADN del ácido desoxirribonucleico. En los organismos multicelulares, la información fluye entre diferentes células, entre tejidos compuestos por diferentes células y entre órganos formados por diferentes tejidos. Esto es lo que llamamos: el dogma central de la genética. El genoma es la suma de la información genética de un organismo vivo. El descubrimiento de la doble hélice del ADN puede ser el mayor avance en las ciencias biológicas del siglo XX. Las cuatro bases diferentes de ATCG forman un lenguaje genético complejo.
De hecho, la mayoría de las enfermedades humanas están controladas por múltiples genes. El Proyecto Genoma Humano se lanzó oficialmente en 1990, lo que significa que se necesitarán 15 años para completar la determinación de toda la secuencia de ADN del genoma humano para 2005. Hasta el momento, no disponemos de una tecnología que pueda secuenciar directamente un cromosoma. Así que todo el proyecto del genoma humano es en realidad un proceso que va de lo complejo a lo simple y luego de lo simple a lo complejo. Al comienzo de la secuenciación del genoma humano, el método de análisis de la secuencia de ADN utilizado en ese momento era principalmente la electroforesis en gel, que era básicamente una operación manual. Pero después de la década de 1990, surgió una nueva tecnología de secuenciación, la electroforesis capilar. Esto acelera enormemente la secuenciación. En un día se puede detectar una secuencia de 6,5438+0 millones de pares de bases. China también se ha sumado a este proyecto de secuenciación y nosotros hemos asumido el 1% de la tarea. En abril de 2000 se completó el borrador de la secuencia del cromosoma 21.
Ahora podemos hacer clic en el genoma humano en un biochip del tamaño de una uña y se hace clic en todos los genes. Si quieres ver a un médico en el futuro, no sólo necesitarás traer tu tarjeta de identificación de paciente, sino también tu propio chip. Antes de que su médico haga un diagnóstico, use un chip para ver qué enfermedades podría tener. Al comparar la genómica de organismos en diferentes etapas evolutivas, podemos descubrir las reglas de regulación funcional de la estructura del genoma. De hecho, los genes relacionados con enfermedades humanas también aportan información importante sobre la integridad estructural y funcional del genoma humano. De hecho, en los últimos años, el estudio de las enfermedades ha sido el estudio del genoma humano.
Parte de un plan importante. En 1997 se propusieron dos proyectos: uno fue el proyecto de disección del genoma tumoral y el otro fue el proyecto del genoma ambiental. De hecho, todo está relacionado con la salud. La contribución del Proyecto Genoma Humano a la medicina ha sido el diagnóstico y la terapia génica. Para los países en desarrollo como el nuestro, deberíamos prestar más atención a la prevención.
El proyecto genoma de nuestro país se inició en 1994, partiendo de la perspectiva de la genómica funcional. Preste igual atención a la estructura y función, establezca tecnologías clave interdisciplinarias y estudie la diversidad del genoma y los genes de enfermedades. Esta fue la estrategia al principio. Podemos decir con orgullo que, excepto el cromosoma Y, todos los cromosomas están cubiertos de genes descubiertos y nombrados por científicos chinos. Recientemente, realizamos un estudio SNP a gran escala del genoma chino. Este trabajo ha pasado de la genética de poblaciones al estudio de la información genética que subyace a la aparición y el desarrollo de enfermedades, que es característica de la población china. Por lo tanto, si ahora podemos crear un catálogo sistemático y una base de datos de la variación de los elementos de la vida en China, podemos obtener los derechos de propiedad intelectual para la innovación tecnológica en la industria biomédica de China, beneficiar a las generaciones futuras y contribuir a toda la humanidad.
Texto completo
Por supuesto, Tsinghua es una de las universidades más importantes de nuestro país. Entonces, venir aquí hoy da un poco de miedo. Bueno, estoy aquí principalmente para pedir consejo. Ahora quiero presentarles la investigación sobre el genoma humano, que se puede decir que es la primera vez. En las ciencias de la vida se ha materializado un cierto concepto de gran ciencia. Es decir, se analiza la información genética en su conjunto y se estudia la función del genoma. Por eso digo que las características de la biología han alcanzado ahora una nueva plataforma a partir de las décadas de 1970 y 1980, centrándose principalmente en el análisis, el refinamiento de las materias y la división del trabajo. Esta plataforma es una gran síntesis. De hecho, nuestra ciencia china ha hecho hincapié en la síntesis desde el principio. Verás, nuestro arte es el mismo, nuestra pincelada a mano alzada es una gran síntesis. Esta fusión de Oriente y Occidente es muy importante. Si combinamos el análisis riguroso de Occidente con el pensamiento integral de China hace miles de años, creo que esto puede traer nuevas oportunidades de avance. Entonces sentí que esta imagen no es sólo para las personas que se dedican a las ciencias de la vida, sino también para nosotros, los estudiantes de ciencias no biológicas. También estamos muy familiarizados con las leyes centrales de la genética.
Como todos sabemos, la esencia de las actividades de la vida es el flujo de información. Algunas personas siempre han dicho que todos nos dedicamos a las ciencias de la vida.
Pero de repente surgió una frase: "¿Qué es la vida?" Hace pensar a la gente. Personalmente soy consciente de que la información de la vida, como unidad de almacenamiento, es una de las características importantes de la vida y tiene una función de memoria. Entonces su unidad de almacenamiento es en realidad lo que llamamos genes. En la mayoría de los organismos sabemos que su portador es el ADN del ácido desoxirribonucleico. Pero su unidad de ejecución es principalmente la proteína. Utiliza diferentes lenguajes de información, uno es el lenguaje de los ácidos nucleicos y el otro es el lenguaje de los aminoácidos. Por tanto, en este flujo de información espacial, se necesitan algunos mecanismos reguladores. Es bien sabido que el primer paso de esta regulación es la transcripción. En este momento, el lenguaje de la información de la vida no ha cambiado, es el lenguaje de los ácidos nucleicos. Sólo del ADN al ARNm, este proceso se llama transcripción. Entonces el idioma cambia, cambia y necesita traducción. Por tanto, del lenguaje de la vida en el ARNm al lenguaje de la vida en las proteínas. Por supuesto que conocemos esta proteína y muchas proteínas tienen actividad metabólica. Una diferencia importante entre los seres vivos y los no vivos es que existe metabolismo y metabolismo, y luego las proteínas pueden formar configuraciones espaciales de nivel superior. Aquí interactúan diferentes partes de la célula, el núcleo y el citoplasma. Entonces, en un organismo multicelular, la información fluye entre diferentes células, entre tejidos compuestos de diferentes células y entre órganos formados por diferentes tejidos. Supongo que esto es lo que llamamos la "ley central de la genética". Bueno, todo el mundo tiene muy claro el concepto de genes, o los conceptos básicos son muy claros, pero la definición exacta puede no ser muy clara hoy en día.
Entonces, ¿qué significa genoma? El genoma es la suma de la información genética de un organismo vivo. Entonces lo que tenemos aquí no es un solo gen, sino todos los genes. Codifica la relación entre todos los aminoácidos, por lo que el significado es completamente diferente. El descubrimiento de la estructura de doble hélice del ADN puede ser el mayor avance en las ciencias biológicas del siglo XX. Entonces, las cuatro bases diferentes A, T, C y G constituyen un lenguaje genético complejo y son también los símbolos más básicos de la información de la vida. Este símbolo básico realmente nos parece simple. La naturaleza ha utilizado estas cuatro simples palabras para crear innumerables fenómenos de diversidad de vida en el vasto mundo que nos asombran. Entonces su información genética, en la mayoría de los organismos, lo que acabo de decir es la molécula de ADN. Entonces su disposición y combinación allí determina, o en una medida considerable, determina las actividades de la vida en el cuerpo humano, que es lo que llamamos: nacimiento, vejez, enfermedad, muerte, etc. Entonces, cuando hablamos de la estructura de doble hélice, todos sabemos que tanto los pares de bases como el ADN son macromoléculas biológicas. Generalmente no utilizamos la unidad de masa para expresar su volumen, sino su longitud. Entonces, un pb se llama par de bases en chino. Pero en términos de genes, un gen a menudo requiere miles de pares de bases. Entonces introdujimos la escala del "par de kilobases". Entonces, cuando estábamos trabajando en el genoma, todos sabíamos que el genoma era de una escala muy grande, por lo que inventamos algunas unidades de escala nuevas, como Mb, que se refiere a un millón de pares de bases.
Esto es lo que sabíamos sobre el genoma humano antes del proyecto genoma. Conocemos la longitud del genoma humano. El genoma haploide tiene aproximadamente 3 mil millones de pares de bases de longitud. En términos generales, los libros de texto dicen que la secuencia codificante en la secuencia, lo que significa que lo que acabamos de mencionar se transcribe y expresa, se puede llamar secuencia genética. Probablemente en realidad se refiere a ARNm maduro, menos del 5% de la secuencia en el ARNm procesado. En otras palabras, las secuencias no codificantes constituyen la gran mayoría. En el núcleo de la célula humana, la información genética está organizada en forma de cromosomas, distribuidos en 22 autosomas y 2 cromosomas sexuales. Todos sabemos que las características pasadas de la ciencia biológica eran básicamente operaciones de estilo taller donde los maestros dirigían a los aprendices. A mediados de la década de 1980, sentí que uno era la gran expansión del pensamiento científico en las ciencias biológicas y el segundo era el avance de la tecnología. Por ejemplo, la ingeniería genética ya estaba muy madura en ese momento, la secuenciación del ADN también estaba relativamente madura en ese momento, y luego la tecnología de PCR comenzó a aparecer allí. Como resultado, allí surgió la ambición de los científicos y científicos de la vida, que estaban decididos a romper con el modelo de operación original de estilo taller que no era valorado por la física ni siquiera por la química, y crear algo que pueda llamarse gran ciencia.
Por supuesto, creo que las condiciones para la investigación y el pensamiento científico están por un lado. Pero, de hecho, si miramos hacia atrás en la historia de la ciencia, muchos acontecimientos importantes todavía estuvieron impulsados por necesidades allí. Algunos de nuestros científicos critican este enfoque, lo que significa que debemos tener cuidado de alinear la investigación básica con necesidades sociales importantes. Creo que esto en realidad es un poco sesgado, es decir, hay varios tipos de investigación: algunos son de exploración libre, por lo que pueden ser muy detallados y todos pueden tener la idea del Premio Nobel en mente.
Pero también hay algunos estudios que realmente esperan beneficiar a la humanidad. Sin embargo, los desafíos que plantean tales investigaciones pueden en realidad generar la idea de otorgar premios Nobel a personas desconocidas. El Proyecto Genoma Humano es un ejemplo típico.
Veamos la primera, que puede considerarse una oferta formal. En términos generales, cuando hacemos este proyecto, primero debemos tener un documento de licitación. La primera licitación para el Proyecto Genoma Humano puede considerarse un breve artículo publicado por el premio Nobel Dulbecco en 1986 en la revista Science. ¿Cuál es el título de este artículo? Un punto de inflexión en la investigación del cáncer: la investigación del genoma humano. De hecho, sabemos que un joven y ambicioso presidente, John F. Kennedy, llegó al poder en Estados Unidos. En ese momento, tenía dos grandes planes científicos: uno era enviar humanos a la luna y el otro, vencer el cáncer. Luego, con la exitosa implementación del programa Apolo, los humanos llegaron a la luna en 1969. Pero el plan para vencer el tumor fracasó. ¿Por qué? Resulta que los científicos pensaron que el problema era demasiado simple, pensando que los tumores eran sólo un problema de uno o dos genes. Pero, de hecho, la gran mayoría de los tumores son causados por problemas poligénicos. El problema que afecta a todo el genoma es el desorden de toda la información genética. Como acabo de decir, no creas que un gen de fusión es suficiente para causar leucemia en ratones. Porque en ese caso, la leucemia ocurrirá tan pronto como se inyecte. De hecho, tenemos la leucemia de Lola. Cuando este gen de fusión se inyecta en un óvulo fertilizado, la leucemia tarda un año en desarrollarse y no ocurre cada hora. Esto demuestra que hay otros factores decisivos involucrados. Ahora sabemos que, a veces, cuando se infectan varios genes juntos, la tasa de leucemia se acelera considerablemente.
Artículo Dulbecco afirmó que si queremos entender más sobre los tumores, debemos empezar a prestar atención al genoma de las células de ahora en adelante. ¿Con qué especies deberíamos empezar? Si queremos comprender los tumores humanos, debemos comenzar con los humanos. Una comprensión detallada del ADN hará avanzar enormemente la investigación de tumores humanos. De hecho, la mayoría de las enfermedades humanas son poligénicas. El Proyecto Genoma Humano se lanzó oficialmente, ahora comúnmente conocido como 1990. Luego, en 1990, el Congreso de Estados Unidos lanzó oficialmente dicho plan. El ambicioso plan es completar la secuenciación del ADN en 2005, 15 años después. ¿A cuánto asciende esta inversión? Tres mil millones de dólares. Los cálculos de la época se basaban en el hecho de que medir un par de bases costaba alrededor de un dólar. Todo el plan aquí es en realidad un plan limitado, y este plan es en realidad un plan de clasificación. De hecho, cuando hablamos de secuenciación, leer el Libro Celestial es sólo el primer paso para comprender a los seres humanos. Lo más importante es leer el Libro Celestial. Pero incluso si miras un plan celestial como este, pasarás por muchas dificultades. Es decir, a día de hoy no disponemos de ninguna tecnología que pueda secuenciar directamente un cromosoma, no de un extremo al otro. Por lo tanto, se puede decir simplemente que todo el proyecto del genoma humano va de complejo a simple, luego de simple a complejo y finalmente a simple. Es decir, un cromosoma que no puede secuenciarse directamente se descompone en unidades más pequeñas y manipulables. Entonces, ¿cómo descomponerlo? Eso es pintar. Puedes usar el método genético para dibujar, o puedes usar el método físico para dibujar. Sabemos que el mapeo genético utiliza marcadores genéticos para determinar las distancias relativas entre los marcadores de ADN. Otro concepto es formar una serie de los llamados clones contiguos de ADN para que estos fragmentos, superpuestos entre sí, puedan cubrir todo el cromosoma de un extremo al otro. De esta manera, una unidad que no se puede utilizar directamente para la secuenciación se analiza en una unidad operable relativamente pequeña. Con el tiempo, se recombina en una disposición que es fiel a la información vital del cromosoma original, y aquí es donde se identifican todos los genes humanos. Entonces, el genoma humano es un mapeo, o el proyecto del genoma humano en un sentido estricto, que es el proyecto de mapeo, el mapa genético, el mapa físico, el mapa de secuencia y luego el mapa genético.
Hay dos estrategias de secuenciación a gran escala en el Proyecto Genoma Humano. Una es la idea que acabo de mencionar, que en realidad se llama clonación uno por uno. Como acabo de decir, se construye un sistema de clonación continua de clones de ADN, que cubre todo el cromosoma, y luego se clona uno por uno. El más utilizado se llama BAC, cromosoma artificial bacteriano, que tiene aproximadamente 100 KB de longitud. Luego, selecciona los clones uno por uno y subclónalos más tarde. Este subclon es así, por lo que puede secuenciarse y luego ensamblarse y restaurarse después de la secuenciación. Esta estrategia es la que se emplea en la secuenciación de proyectos en la esfera pública internacional. De hecho, es una evolución histórica, es decir, evolucionó a partir del mapeo, la genética y el mapeo físico. Todos conocemos a la empresa estadounidense Siral y Quikmart.
Luego desarrolló un método llamado método de escopeta de genoma completo. Basado en cierta información cartográfica, descompuso directamente el genoma en pequeños fragmentos para una secuenciación aleatoria, evitando la construcción de un sistema de clonación continua de fragmentos grandes, y luego usó supercomputadoras para ensamblarlo. . Puede permitir que el genoma humano entre rápidamente en la secuenciación, especialmente en la secuenciación a gran escala, una vez completado el mapeo preliminar. Avanzar hacia las expectativas de las personas. Hay dos factores principales que han contribuido a esto. Tenemos que admitir que la contribución de la industria es muy grande. Por ejemplo, cuando se produjo por primera vez el genoma humano, el método de análisis de secuencia de ADN utilizado en ese momento se basaba principalmente en la electroforesis en gel, que era básicamente una operación manual. Pero en la primera mitad de la década de 1990 surgió una nueva tecnología de secuenciación: la electroforesis capilar. Además, se introducen operaciones y sistemas automatizados que incluyen la gestión industrial. Por tanto, la velocidad de secuenciación se acelera enormemente. Usted es uno de esos probadores y su nombre es Megabace. ¿Qué quieres decir? Es electroforesis capilar. Se necesitan casi dos horas para leer una secuencia y puede leer cientos de bases, por lo que puede hacer diez clases por día, por lo que tiene 96 canales, por lo que puede hacer 960 canales por día. Cada línea puede alcanzar un KB según su promoción, pero en realidad es muy difícil de lograr. Este es el estado más ideal. Entonces puedes generar 654,38+0 millones de pares de bases en un día. Sin embargo, otro problema que alguna vez preocupó a la comunidad académica es que si ahora estamos en una era de explosión de conocimiento, se puede decir que la explosión de información biológica es la más impresionante.
Vemos que antes de que comenzara el proyecto del genoma, el crecimiento de las secuencias de ADN en las bases de datos públicas era muy lento. Luego, después de 1990, hubo un período de crecimiento exponencial. Y he contado esto en el dominio público en dos mundos el año pasado y el año 2000. El proyecto de secuenciación y Siral respectivamente anunciaron la finalización de los llamados bocetos de trabajo. Este fue el caso en ese momento, y probablemente lo sea ahora. En aquel momento, 1999 enfrentaba un fuerte desafío por parte del Siral. Fundado en 1998 y afirmando haber capturado el genoma humano en tres años, el Proyecto Internacional Genoma Humano decidió aceptar el desafío. Hay exactamente 16 grupos en el mundo que comparten la tarea de secuenciar el genoma humano, y China también se ha sumado a ese proyecto de secuenciación. Por supuesto, somos responsables del 1% de las tareas, y el 1% sigue siendo muy importante. Porque no es fácil para un país en desarrollo meterse en este club de los países desarrollados. Hay algunas cosas que tal vez no podamos incluir incluso si quisiéramos, como los planes para la estación espacial, pero la gente todavía desconfía de usted.
Aquí me gustaría presentarles qué es un diagrama de marco de trabajo. Como todo el mundo habla del diagrama del marco de trabajo, entonces, ¿qué es el diagrama del marco de trabajo? En realidad, un boceto funcional. Entonces, ¿qué significa esto? En otras palabras, al secuenciar una cobertura de 4 a 5 veces de clones continuos de BAC (cromosoma artificial bacteriano) con posiciones cromosómicas claras, se puede obtener más del 90% de las secuencias de genes en el genoma y la tasa de error debe ser inferior a 65438 ± 0%. En otras palabras, su cobertura debería alcanzar más del 90% del genoma. En segundo lugar, la tasa de error debería ser inferior al 1%. 100 pares de bases te dan menos de un error de par de bases. Aunque esto es sólo un esbozo, ya es muy útil, es decir, comprensión básica de la estructura del genoma, identificación y análisis de genes, localización y clonación de genes de enfermedades, descubrimiento de polimorfismos de un solo nucleótido, etc.
Por eso, cuando se trata de bocetos, debe haber una imagen final. Por lo tanto, la definición de este diagrama requiere que los clones utilizados para la secuenciación puedan representar fielmente la estructura del genoma de la eucromatina, con una tasa de cobertura superior al 99,9%, y la tasa de error de secuencia debe ser inferior a 1 en 10.000. La relación con el diagrama del marco de trabajo es en realidad aumentar la cobertura de la secuenciación sobre la base del diagrama del marco de trabajo, llenar los vacíos y aumentar la precisión de la secuenciación, de modo que se pueda lograr dicho estándar. En otras palabras, el siguiente paso en el boceto. ¿Cuál era el estado de la secuenciación el 25 de junio de 2000? Vimos que los proyectos de dominio público en ese momento, es decir, los proyectos apoyados por los gobiernos de Estados Unidos, Reino Unido, Alemania, Japón, Francia y China, cubrían alrededor del 86,8% del genoma humano. . Se ha completado una parte, que es el diagrama de secuencia final que acabamos de mencionar. La secuencia estándar es probablemente un poco más del 20%, y luego alrededor del 66% de la secuencia se encuentra en la llamada etapa de boceto de trabajo. Entonces se puede decir que no está completo. Porque dijimos que queremos llegar a más del 90%, pero al mismo tiempo Siral afirma que su tasa de cobertura ya es superior al 95%. Por supuesto, su cobertura en realidad incluye esta contribución de todas las áreas, más su contribución, por lo que las dos suman. Creo que deberíamos creer que más del 90% de la secuencia está cubierta por la calidad de dicha secuencia además de un boceto de trabajo.
Echemos un vistazo a la situación de los proyectos de secuenciación de dominio público en aquel momento y su distribución en los 24 cromosomas. Sabemos que, de hecho, desde junio 5438+0999 hasta febrero de 2019, como uno de los cromosomas humanos más pequeños, se determina la secuencia completa del cromosoma 22, o su cromosoma autosómico se refiere a parte de la secuencia completa. Hemos notado que su brazo corto, que es una región cromosómica fácil, es en realidad muy impredecible. Porque hay muchas secuencias vacías y pocos genes. En abril de 2000 se completó la secuencia completa del cromosoma 21, que es la misma definición, es decir, esta parte del autosoma. Vemos este lugar pintado de un color rojo oscuro, casi terminado. Y este amarillo representa el boceto de trabajo que acabamos de mencionar, que es parte del boceto de trabajo de la mayoría de las regiones cromosómicas. De hecho, de lo que estamos hablando ahora es de completar la determinación de toda la secuencia del genoma humano, es decir, la parte autosómica. Por eso, algunas personas dicen que tal vez la secuencia del genoma humano nunca se complete.
15 de febrero de 2001 Sabemos que en el ámbito de la naturaleza existe un sentimiento de soldados contra soldados y de generales contra generales. El 16 de febrero se estrenó la secuencia de Siral. Evidentemente, tras una nueva ronda de competición, la calidad de las secuencias terminadas es mucho mayor que en junio de 2000. Entonces, en este caso, deberíamos pensar que la información que estas dos empresas reunieron debería ir más allá de la definición general que acabo de decir. Por lo tanto, existe un estado intermedio entre el boceto de trabajo y el dibujo final terminado, llamado boceto de alta calidad. Pero con bocetos de tan alta calidad, básicamente ya sabemos cuánta información hay sobre la vida de mi familia. Al final, descubrimos que nuestras posesiones parecían ser relativamente pequeñas, más de lo que esperábamos porque sólo tenemos alrededor del doble de genes que un nematodo, un organismo vivo con poco más de 900 células, y tenemos el doble de genes que un nematodo. bicho. . La complejidad del genoma de los organismos inferiores a los superiores está determinada no tanto por el número de genes sino por la longitud de los genes. Recientemente completamos la secuenciación de una bacteria llamada Leptospira que puede causar enfermedades infecciosas. Promedia un gen por KB, algo tan pequeño, 5 millones de pares de bases del genoma, 5.000 genes. Tenemos 3 mil millones de pares de bases, pero sólo tenemos 30.000, tal vez más cerca de 40.000 como máximo. Pero cuando nos fijamos en la levadura, cuando se trata de células eucariotas, el promedio es de 5 a 10 KB de un gen. Luego está Drosophila, aunque parece tener menos genes que C. elegans. Pero alcanzó una longitud genética de más de 100 KB, y luego también alcanzó una longitud genética en los mamíferos, probablemente como en los humanos, donde ahora supera los 100 KB. Por lo tanto, las posibilidades de sustitución y empalme aumentan considerablemente. Además, la complejidad de estas secuencias aumenta significativamente con respecto a la regulación temporal y espacial, es decir, la etapa de desarrollo y la expresión específica de tejido. Aunque los genes pueden alcanzar el quinto nivel de diez en organismos superiores, existen entre decenas y cientos de miles de organismos tan avanzados. Pero, de hecho, su dominio proteico, si se compara el genoma con un edificio, el número de piezas prefabricadas que componen este edificio es en realidad limitado. Además, algunos organismos superiores tienen combinaciones de dominios más ricas y los genes para la función neuronal, el desarrollo de tejidos específicos, la regulación, la hemostasia y el sistema inmunológico están muy expandidos en los vertebrados. Cientos de genes humanos se originaron a partir de la transferencia lateral de genes bacterianos en algún momento de la evolución de los vertebrados. Los genomas varían mucho entre diferentes individuos: polimorfismos de un solo nucleótido, las diferencias de genes haploides son 1/1250, menos del 1% pueden causar variación de proteínas.
Este libro genético ya está frente a nosotros, y el siguiente paso es entenderlo. Para entenderlo debemos plantearnos cómo interpretarlo desde el concepto de gran sistema. Un mensaje de este genoma interactúa allí con el entorno externo. Además, esta información del genoma no cae del cielo, sino que se ha desarrollado a través de un largo proceso evolutivo de miles de millones de años, por lo que debe interpretarse de manera comparativa. Además, es necesario considerar que existe variación entre individuos y grupos, y esta variación también está regulada por el entorno externo. Por lo tanto, aunque actualmente no existe una definición estricta del contenido de la investigación en genómica funcional, personalmente creo que incluye al menos los siguientes aspectos: El contenido central del estudio de la variación de la secuencia de ADN en el genoma humano es el SNP, porque es el más tipo común de variación, por supuesto, hay muchas otras variaciones. Luego viene el estudio de la regulación de la expresión del genoma, que es la variación de tejidos y órganos durante las etapas de desarrollo, y luego el estudio de organismos modelo, incluida la importancia evolutiva, y el uso de organismos modelo para estudios funcionales. Por supuesto, hacemos todos estos estudios tal como hacemos estudios de secuenciación.
La bioinformática no es sólo una herramienta básica, sino también una nueva disciplina. Porque al final, para integrar esta información en lo que llamamos biología de sistemas, hay que recurrir a medios teóricos y a medios de procesamiento de información a gran escala.