El genoma es la secuencia total de ADN que posee un organismo en particular. El genoma en eucariontes comprende el ADN contenido en el núcleo celular, organizado en cromosomas, y el genoma de orgánulos celulares, como las mitocondrias y los plastos. En los seres procariotas comprende el ADN de su nucleoide.[1]
En cuanto al genoma eucariota, se analiza en caso de que la célula vaya a someterse a un proceso de cariocinesis; si se trata de la interfase del ciclo celular, el grado de compactación de la cromatina es menor, lo que permite la replicación del material genético. Los organismos diploides tienen dos copias del genoma en sus células, debido a la presencia de pares de cromosomas homólogos. Los organismos o células haploides solo contienen una copia. También existen organismos poliploides, con grupos de cromosomas homólogos.
La secuenciación del genoma de una especie no analiza la diversidad genética o el polimorfismo de los genes. Para estudiar las variaciones de un gen se requiere la comparación entre individuos mediante el genotipado.
El término "genoma" fue creado en 1920 por Hans Winkler, profesor de botánica en la Universidad de Hamburgo, Alemania. Oxford Dictionary sugiere que el nombre es un acrónimo de las palabras 'gen' y 'cromosoma'. Ya existían algunas palabras relacionadas con el -oma, como bioma y rizoma, que formaban un vocabulario en el que genoma encajaba sistemáticamente.
Una secuencia genómica es la lista completa de los nucleótidos (A, C, G y T para los genomas de ADN) que componen todos los cromosomas de un individuo o una especie. Dentro de una especie, la gran mayoría de los nucleótidos son idénticos entre individuos, pero es necesario secuenciar varios individuos para comprender la diversidad genética.
En 1976, Walter Fiers, de la Universidad de Gante (Bélgica), fue el primero en establecer la secuencia de nucleótidos completa de un genoma de ARN viral (bacteriófago MS2). Al año siguiente, Fred Sanger completó la primera secuencia de ADN-genoma: el fago Φ-X174, de 5386 pares de bases. Las primeras secuencias genómicas completas entre los tres dominios de la vida se publicaron en un período corto a mediados de la década de 1990: el primer genoma bacteriano que se secuenció fue el de Haemophilus influenzae, completado por un equipo del Instituto de Investigación Genómica en 1995. Unos meses más tarde se completó el primer genoma eucariota, con las secuencias de los 16 cromosomas de la levadura en ciernes Saccharomyces cerevisiae publicadas como resultado de un esfuerzo liderado por Europa que comenzó a mediados de la década de 1980. La primera secuencia del genoma de una arquea, Methanococcus jannaschii, se completó en 1996, nuevamente por el Instituto de Investigación Genómica.
El desarrollo de nuevas tecnologías ha hecho que la secuenciación del genoma sea mucho más barata y sencilla, y el número de secuencias genómicas completas crece rápidamente. Los Institutos Nacionales de Salud de Estados Unidos mantienen una de varias bases de datos integrales de información genómica. Entre los miles de proyectos completos de secuenciación del genoma se incluyen los del arroz, un ratón, la planta Arabidopsis thaliana, el pez globo y la bacteria Escherichia coli. En diciembre de 2013 los científicos secuenciaron por primera vez el genoma completo de un neandertal, una especie extinta de humano. El genoma fue extraído del hueso del dedo del pie de un neandertal de 130.000 años encontrado en una cueva siberiana.
Las nuevas tecnologías de secuenciación, como la secuenciación masiva en paralelo, también han abierto la perspectiva de la secuenciación del genoma personal como herramienta de diagnóstico, tal como lo ha iniciado Manteia Predictive Medicine. Un paso importante hacia ese objetivo fue la finalización en 2007 del genoma completo de James Watson, uno de los codescubridores de la estructura del ADN.
Mientras que una secuencia del genoma enumera el orden de cada base de ADN en un genoma, un mapa del genoma identifica los puntos de referencia. Un mapa del genoma es menos detallado que una secuencia del genoma y ayuda a navegar por el genoma. El Proyecto Genoma Humano fue organizado para mapear y secuenciar el genoma humano. Un paso fundamental en el proyecto fue la publicación de un mapa genómico detallado por parte de Jean Weissenbach y su equipo en el Genoscope de París.
Las secuencias y mapas del genoma de referencia continúan actualizándose, eliminando errores y aclarando regiones de alta complejidad alélica. El costo decreciente del mapeo genómico ha permitido que los sitios genealógicos lo ofrezcan como un servicio, en la medida en que uno puede enviar su genoma a esfuerzos científicos de colaboración colectiva como ADN LAND en el New York Genome Center, un ejemplo tanto de las economías de escala como de la ciencia ciudadana.
En filogenia y taxonomía el genoma también juega un papel importante en las clasificaciones biológicas, sobre todo para medir la distancia genética entre los diferentes taxones de seres vivos y construir los árboles filogenéticos de los diversos grupos.
Los genomas virales pueden estar compuestos de ARN o ADN. Los genomas de los virus pueden ser monocatenario o bicatenario, y pueden contener una o más moléculas de ARN o ADN separadas (segmentos: genoma monopartito o multipartito). La mayoría de los genomas de virus ADN se componen de una sola molécula lineal de ADN, pero algunos se componen de una molécula de ADN circular.
La envoltura viral es una capa externa de membrana que los genomas virales utilizan para ingresar a la célula huésped. Algunas de las clases de ADN y ARN viral consisten en una envoltura viral, mientras que otras no.
Tanto los procariotas como los eucariotas tienen genomas de ADN bicatenario. Las arqueas y la mayoría de las bacterias tienen un solo cromosoma circular, sin embargo, algunas especies bacterianas tienen cromosomas lineales o múltiples. Si el ADN se replica más rápido de lo que se dividen las células bacterianas, pueden estar presentes múltiples copias del cromosoma en una sola célula, y si las células se dividen más rápido de lo que se puede replicar el ADN, la replicación múltiple del cromosoma es iniciado antes de que ocurra la división, lo que permite que las células hijas hereden genomas completos y cromosomas ya parcialmente replicados. La mayoría de los procariotas tienen muy poco ADN repetitivo en sus genomas. Sin embargo, algunas bacterias simbióticas (por ejemplo, Serratia symbiotica) tienen genomas reducidos y una alta fracción de "pseudogenes": solo ~40% de su ADN codifica proteínas. Los procariotas también tienen material genético auxiliar, que se transporta en plásmidos.
Los genomas eucariotas están compuestos por uno o más cromosomas de ADN bicatenario lineal. El número de cromosomas varía ampliamente desde las hormigas y un nematodoasexual que cada uno tiene un solo par, hasta una especie de helecho que tiene 720 pares. Es sorprendente la cantidad de ADN que contienen los genomas eucariotas en comparación con otros genomas. La cantidad es incluso mayor de lo que es necesario para los genes codificantes y no codificantes de proteínas de ARN debido al hecho de que los genomas eucariotas muestran una variación de hasta 64.000 veces en sus tamaños. Sin embargo, esta característica especial es causada por la presencia de ADN repetitivo y transposones.
Una célula humana típica tiene dos copias de cada uno de los 22 autosomas, uno heredado de cada padre, más dos cromosomas sexuales, lo que la convierte en diploide. Los gametos, como los óvulos, los espermatozoides, las esporas y el polen, son haploides, lo que significa que solo tienen una copia de cada cromosoma. Además de los cromosomas en el núcleo celular, los orgánulos como los cloroplastos y las mitocondrias tienen su propio ADN. A veces se dice que las mitocondrias tienen su propio genoma, a menudo denominado "genoma mitocondrial". El ADN que se encuentra dentro del cloroplasto puede denominarse "plastoma". Al igual que las bacterias de las que se originaron, las mitocondrias y los cloroplastos tienen un cromosoma circular.
A diferencia de los procariotas, los eucariotas tienen una organización exón-intrón de genes que codifican proteínas y cantidades variables de ADN repetitivo. En mamíferos y plantas, la mayor parte del genoma se compone de ADN repetitivo. Los genes en los genomas eucariotas se pueden anotar mediante FINDER.
Las secuencias de ADN que llevan las instrucciones para producir proteínas se denominan secuencias codificantes. La proporción del genoma ocupado por secuencias de codificación varía ampliamente. Un genoma más grande no contiene necesariamente más genes, y la proporción de ADN no repetitivo disminuye junto con el aumento del tamaño del genoma en eucariotas complejos.
Las secuencias no codificantes incluyen intrones, secuencias de ARN no codificantes, regiones reguladoras y ADN repetitivo. Las secuencias no codificantes constituyen el 98% del genoma humano. Hay dos categorías de ADN repetitivo en el genoma: repeticiones en tándem y repeticiones intercaladas.
Las secuencias cortas que no codifican y que se repiten de la cabeza a la cola se denominan repeticiones en tándem. Los microsatélites consisten en repeticiones de 2 a 5 pares de bases, mientras que las repeticiones de minisatélites son de 30 a 35 pb. Las repeticiones en tándem constituyen aproximadamente el 4% del genoma humano y el 9% del genoma de la mosca de la fruta. Las repeticiones en tándem pueden ser funcionales. Por ejemplo, los telómeros se componen de la repetición en tándem TTAGGG en los mamíferos y desempeñan un papel importante en la protección de los extremos del cromosoma.
En otros casos, las expansiones en el número de repeticiones en tándem en exones o intrones pueden causar enfermedades. Por ejemplo, el gen humano huntingtina (Htt) normalmente contiene de 6 a 29 repeticiones en tándem de los nucleótidos CAG (que codifican un tracto de poliglutamina). Una expansión a más de 36 repeticiones da como resultado la enfermedad de Huntington, una enfermedad neurodegenerativa. Se sabe que veinte trastornos humanos resultan de expansiones repetidas en tándem similares en varios genes. El mecanismo por el cual las proteínas con tractos de poliglutamina expandidos causan la muerte de las neuronas no se comprende completamente. Una posibilidad es que las proteínas no se plieguen correctamente y eviten la degradación, sino que se acumulen en agregados que también secuestran factores de transcripción importantes, alterando así la expresión génica.
Las repeticiones en tándem generalmente son causadas por deslizamiento durante la replicación, entrecruzamiento desigual y conversión de genes.
Estas repeticiones en tándem pueden adquirir gran importancia en el material genómico en diferentes aspectos, pudiendo formar gran parte del genoma de algunos organismos, como es el caso del kril antártico, en el que la mayoría de su material genético está constituido por estas repeticiones que pueden insertarse en intrones y genes disminuyendo el tamaño de estos, pero aumentando el tamaño del material genético en sí provocando que sea el genoma más grande ensamblado hasta la fecha. Además, estas repeticiones en tándem pueden ser sujeto de estudio tanto a nivel poblacional como evolutivo, permitiendo así determinar adaptaciones ambientales y relaciones entre los diversos grupos geográficos de un mismo organismo. [2]
Los transposones son secuencias de ADN con una estructura definida que pueden cambiar su ubicación en el genoma. Los transposones se clasifican como un mecanismo que se replica copiando y pegando o como un mecanismo que se puede extirpar del genoma e insertarlo en una nueva ubicación. En el genoma humano, hay tres clases importantes de transposones que constituyen más del 45 % del ADN humano; estas clases son los elementos nucleares intercalados largos (LINE), los elementos nucleares intercalados (SINE) y los retrovirus endógenos. Estos elementos tienen un gran potencial para modificar el control genético en un organismo huésped.
El movimiento de los transposones es una fuerza impulsora de la evolución del genoma en los eucariotas porque su inserción puede alterar las funciones de los genes, la recombinación homóloga entre los transposones puede producir duplicaciones y los transposones pueden barajar exones y secuencias reguladoras a nuevas ubicaciones.
La presencia de los elementos transponibles en un genoma no suele tener grandes efectos en la regulación genómica. Sin embargo, modificaciones epigenéticas en estas secuencias pueden conllevar a grandes alteraciones en el genoma. En el caso del kril antártico, se cree que la baja proporción de GC en los transposones puede ser el causante de una expansión genómica por elementos transponibles,[2] ya que, una posible metilación en el dinucleótido CpG en el promotor de un gen, inhibe la transcripción del mismo y por tanto, con el paso del tiempo, la eliminación de este y una reducción del tamaño genético, es decir, si existe una baja proporción de este dinucleótido, habría una menor metilación y por ende, menor deleción genética. [3]
Los transposones de ADN son transposones que codifican una enzima transposasa entre repeticiones terminales invertidas. Cuando se expresa, la transposasa reconoce las repeticiones invertidas terminales que flanquean al transposón y cataliza su escisión y reinserción en un nuevo sitio. Este mecanismo de cortar y pegar típicamente reinserta transposones cerca de su ubicación original (dentro de 100kb). Los transposones de ADN se encuentran en todos los seres vivos y constituyen el 3% del genoma humano y el 12% del genoma del gusano redondo Caenorhabditis elegans.
Los retrotransposones se encuentran en eucariotas y forman una gran parte de los genomas de muchos eucariotas. El retrotransposón es un transposón que se transpone a través de un intermediario de ARN. Los retrotransposones están compuestos de ADN, pero se transcriben en ARN para su transposición, luego la transcripción de ARN se vuelve a copiar para formar ADN con la ayuda de una enzima específica llamada transcriptasa inversa. Los retrotransposones que llevan transcriptasa inversa en su gen pueden desencadenar su propia transposición, pero los genes que carecen de la transcriptasa inversa deben utilizar la transcriptasa inversa sintetizada por otro retrotransposón. Los retrotransposones se pueden transcribir en ARN, que luego se duplica en otro sitio en el genoma. Los retrotransposones se pueden dividir en repeticiones terminales largas (LTR) y repeticiones terminales no largas (Non-LTR).
El genoma de los seres vivos contiene una cantidad enorme de información. En el caso del ratón doméstico, una de las primeras especies en ser descifradas completamente, la información contenida equivale a 2,8 GB.[4] Se ha calculado que esta secuencia requeriría el equivalente a
11 veces los 32 tomos de la 15.ª edición de la Encyclopædia Britannica para escribirla completamente. Se ha estimado que la cantidad de información contenida en una molécula de ADN está en el orden de los 20 000 millones de bits, de lo cual se deduce que la cantidad de información contenida en un cromosoma es equivalente a unos 4000 volúmenes (libros) escritos en lenguaje cotidiano.[5]
El tamaño del genoma es el número total de pares de bases de ADN en una copia de un genoma haploide. El tamaño del genoma varía ampliamente entre las especies. Los invertebrados tienen genomas pequeños, esto también se correlaciona con una pequeña cantidad de transposones, a excepción del kril antártico que es un invertebrado con el genoma determinado más grande hasta la fecha, con unas 48.01 Gb donde la mayor parte de su secuencia genética está formada por unidades repetidas en tándem.[2] Los peces y los anfibios tienen genomas de tamaño intermedio y las aves tienen genomas relativamente pequeños, pero se ha sugerido que las aves perdieron una parte sustancial de sus genomas durante la fase de transición al vuelo. Ante esta pérdida, la metilación del ADN permite la adecuada expansión del genoma.
En los seres humanos, el genoma nuclear comprende aproximadamente 3200 millones de nucleótidos de ADN, divididos en 24 moléculas lineales, la más corta de 50 000 000 ( 5 × 107) de nucleótidos de longitud y la más larga de 260 000 000 ( 2,6 × 108) de nucleótidos, cada una contenida en un cromosoma diferente. No existe una correlación clara y consistente entre la complejidad morfológica y el tamaño del genoma en procariotas o eucariotas inferiores. El tamaño del genoma es en gran medida una función de la expansión y contracción de elementos de ADN repetitivos.
Dado que los genomas son muy complejos, una estrategia de investigación es reducir al mínimo el número de genes en un genoma y aun así lograr que el organismo en cuestión sobreviva. Se está realizando un trabajo experimental sobre genomas mínimos para organismos unicelulares, así como genomas mínimos para organismos pluricelulares. El trabajo es tanto in vivo como in silico.
Hay muchas diferencias enormes en el tamaño de los genomas, especialmente mencionadas antes en los genomas de eucariotas pluricelulares. La razón principal por la que existe una variedad tan grande de tamaños se debe a la presencia de transposones. Se sabe que los transposones contribuyen a un cambio significativo en la masa de ADN de una célula. Este proceso se correlaciona con su alojamiento a largo plazo en el genoma del huésped y, por lo tanto, con la expansión del tamaño del genoma.
Aquí hay una tabla de algunos genomas significativos o representativos.
Nota: El ADN de una simple célula tiene una longitud aproximada de 1,8A.
Las investigaciones llevadas a cabo, sugieren que la complejidad del genoma humano no radica en el número total de genes, sino en cómo parte de estos genes son liberados de la represión mediante la epigenética y en cómo se copian luego en ARN (transcripción génica), para finalmente construir diferentes productos en el empalme alternativo (alternative splicing).[49]
En medicina, se utilizan las pruebas genéticas para el diagnóstico de enfermedades, la confirmación diagnostica, la información del pronóstico así como del curso de la enfermedad, para confirmar la presencia de enfermedad en pacientes asintomáticos y, con variados grados de certeza, para predecir el riesgo de enfermedades futuras en personas sanas y en su descendencia. La información sobre el genoma también se puede usar para el estudio de susceptibilidad a las enfermedades.[50]
Existe la posibilidad de desarrollo de técnicas o para tratar enfermedades hereditarias. El procedimiento implica reemplazar, manipular o suplementar los genes no funcionales con genes funcionales. En esencia, la terapia génica es la introducción de genes en el ADN de una persona para tratar enfermedades. La posible creación de fármacos a medida del enfermo terapia génica y farmacogenómica.
Genómica microbiana, con aplicaciones en el desarrollo de fármacos, entre otras.
Bioarqueología, antropología, evolución y estudio de migraciones humanas, paleogenética principalmente a partir del ADN fósil
Identificación por ADN.
Agricultura y bioprocesamiento
Los análisis genómicos también han permitido estudiar las bases poligénicas de los cambios fenotípicos que se llevan a cabo en las especies, sobre todo en aquellas especies que han sido objeto de domesticación como es el caso del conejo.[51]
2000 En marzo publicación del genoma completo de Drosophila melanogaster gracias al consorcio público y la compañía Celera Genomics. Alberga alrededor de 13.600 genes.
2003, el 24 de abril se completa la secuencia del genoma humano.
2004, en abril se crea un catálogo de aproximadamente el 75% de los genes que se cree posee el genoma humano. Este catálogo, Human Full-length Complementary-DNA Annotation Invitational Database, ha sido elaborado por un equipo internacional liderado por Takashi Gojobori.[53][54]
2004, el 22 de abril crearon en Japón un ratón solo con el ADN de dos hembras (partenogénesis). Para fecundar un ratón necesitaron solo dos óvulos.[55]
2005, el 22 de agosto científicos de la Universidad Harvard (Estados Unidos) unen una célula de la piel con una célula troncal embrionaria, avance que podría derivar en la creación de células troncales útiles sin tener que crear o destruir embriones humanos.
2008, el 26 de mayo científicos del Centro Médico Universitario de Leyde (Países Bajos) anuncian haber descifrado la primera secuencia completa del genoma de una mujer.
2010, el 20 de mayo de 2010 la revista Science publica una noticia histórica: Craig Venter y su equipo lograron crear una célula bacteriana con el genoma sintético.
↑Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A, Volckaert G, Ysebaert M (April 1976). «Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene». Nature260 (5551): 500-7. Bibcode:1976Natur.260..500F. PMID1264203. doi:10.1038/260500a0.
↑Fiers W, Contreras R, Haegemann G, Rogiers R, Van de Voorde A, Van Heuverswyn H, Van Herreweghe J, Volckaert G, Ysebaert M (May 1978). «Complete nucleotide sequence of SV40 DNA». Nature273 (5658): 113-20. Bibcode:1978Natur.273..113F. PMID205802. doi:10.1038/273113a0.
↑Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (February 1977). «Nucleotide sequence of bacteriophage phi X174 DNA». Nature265 (5596): 687-95. Bibcode:1977Natur.265..687S. PMID870828. doi:10.1038/265687a0.
↑Thomason L, Court DL, Bubunenko M, Costantino N, Wilson H, Datta S, Oppenheim A (abril de 2007). «Recombineering: genetic engineering in bacteria using homologous recombination». Current Protocols in Molecular Biology. Chapter 1: Unit 1.16. ISBN978-0-471-14272-0. PMID18265390. doi:10.1002/0471142727.mb0116s78.
↑Philippe N, Legendre M, Doutre G, Couté Y, Poirot O, Lescot M, Arslan D, Seltzer V, Bertaux L, Bruley C, Garin J, Claverie JM, Abergel C (July 2013). «Pandoraviruses: amoeba viruses with genomes up to 2.5 Mb reaching that of parasitic eukaryotes». Science341 (6143): 281-6. Bibcode:2013Sci...341..281P. PMID23869018. doi:10.1126/science.1239181.
↑Shigenobu S, Watanabe H, Hattori M, Sakaki Y, Ishikawa H (September 2000). «Genome sequence of the endocellular bacterial symbiont of aphids Buchnera sp. APS». Nature407 (6800): 81-6. PMID10993077. doi:10.1038/35024074.
↑Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM (July 1995). «Whole-genome random sequencing and assembly of Haemophilus influenzae Rd». Science269 (5223): 496-512. Bibcode:1995Sci...269..496F. PMID7542800. doi:10.1126/science.7542800.
↑Blattner FR, Plunkett G, Bloch CA, Perna NT, Burland V, Riley M, Collado-Vides J, Glasner JD, Rode CK, Mayhew GF, Gregor J, Davis NW, Kirkpatrick HA, Goeden MA, Rose DJ, Mau B, Shao Y (September 1997). «The complete genome sequence of Escherichia coli K-12». Science277 (5331): 1453-62. PMID9278503. doi:10.1126/science.277.5331.1453.
↑ScienceShot: Biggest Genome EverArchivado el 11 de octubre de 2010 en Wayback Machine., comments: "The measurement for Amoeba dubia and other protozoa which have been reported to have very large genomes were made in the 1960s using a rough biochemical approach which is now considered to be an unreliable method for accurate genome size determinations."
↑Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG (April 1981). «Sequence and organization of the human mitochondrial genome». Nature290 (5806): 457-65. Bibcode:1981Natur.290..457A. PMID7219534. doi:10.1038/290457a0.
↑Greilhuber J, Borsch T, Müller K, Worberg A, Porembski S, Barthlott W (November 2006). «Smallest angiosperm genomes found in lentibulariaceae, with chromosomes of bacterial size». Plant Biology8 (6): 770-7. PMID17203433. doi:10.1055/s-2006-924101.
↑Tuskan GA, Difazio S, Jansson S, Bohlmann J, Grigoriev I, Hellsten U, Putnam N, Ralph S, Rombauts S, Salamov A, Schein J, Sterck L, Aerts A, Bhalerao RR, Bhalerao RP, Blaudez D, Boerjan W, Brun A, Brunner A, Busov V, Campbell M, Carlson J, Chalot M, Chapman J, Chen GL, Cooper D, Coutinho PM, Couturier J, Covert S, Cronk Q, Cunningham R, Davis J, Degroeve S, Déjardin A, Depamphilis C, Detter J, Dirks B, Dubchak I, Duplessis S, Ehlting J, Ellis B, Gendler K, Goodstein D, Gribskov M, Grimwood J, Groover A, Gunter L, Hamberger B, Heinze B, Helariutta Y, Henrissat B, Holligan D, Holt R, Huang W, Islam-Faridi N, Jones S, Jones-Rhoades M, Jorgensen R, Joshi C, Kangasjärvi J, Karlsson J, Kelleher C, Kirkpatrick R, Kirst M, Kohler A, Kalluri U, Larimer F, Leebens-Mack J, Leplé JC, Locascio P, Lou Y, Lucas S, Martin F, Montanini B, Napoli C, Nelson DR, Nelson C, Nieminen K, Nilsson O, Pereda V, Peter G, Philippe R, Pilate G, Poliakov A, Razumovskaya J, Richardson P, Rinaldi C, Ritland K, Rouzé P, Ryaboy D, Schmutz J, Schrader J, Segerman B, Shin H, Siddiqui A, Sterky F, Terry A, Tsai CJ, Uberbacher E, Unneberg P, Vahala J, Wall K, Wessler S, Yang G, Yin T, Douglas C, Marra M, Sandberg G, Van de Peer Y, Rokhsar D (September 2006). «The genome of black cottonwood, Populus trichocarpa (Torr. & Gray)». Science313 (5793): 1596-604. Bibcode:2006Sci...313.1596T. PMID16973872. doi:10.1126/science.1128691.
↑Pellicer, Jaume; Fay, Michael F.; Leitch, Ilia J. (15 de septiembre de 2010). «The largest eukaryotic genome of them all?». Botanical Journal of the Linnean Society164 (1): 10-15. doi:10.1111/j.1095-8339.2010.01072.x.Parámetro desconocido |name-list-format= ignorado (ayuda)
↑Lang D, Zimmer AD, Rensing SA, Reski R (October 2008). «Exploring plant biodiversity: the Physcomitrella genome and beyond». Trends in Plant Science13 (10): 542-9. PMID18762443. doi:10.1016/j.tplants.2008.07.002.
↑«The genome of a lepidopteran model insect, the silkworm Bombyx mori». Insect Biochemistry and Molecular Biology38 (12): 1036-45. December 2008. PMID19121390. doi:10.1016/j.ibmb.2008.11.004.
↑Wurm Y, Wang J, Riba-Grognuz O, Corona M, Nygaard S, Hunt BG, Ingram KK, Falquet L, Nipitwattanaphon M, Gotzek D, Dijkstra MB, Oettler J, Comtesse F, Shih CJ, Wu WJ, Yang CC, Thomas J, Beaudoing E, Pradervand S, Flegel V, Cook ED, Fabbretti R, Stockinger H, Long L, Farmerie WG, Oakey J, Boomsma JJ, Pamilo P, Yi SV, Heinze J, Goodisman MA, Farinelli L, Harshman K, Hulo N, Cerutti L, Xenarios I, Shoemaker D, Keller L (April 2011). «The genome of the fire ant Solenopsis invicta». Proceedings of the National Academy of Sciences of the United States of America108 (14): 5679-84. Bibcode:2011PNAS..108.5679W. PMC3078418. PMID21282665. doi:10.1073/pnas.1009690108.
↑Church DM, Goodstadt L, Hillier LW, Zody MC, Goldstein S, She X, Bult CJ, Agarwala R, Cherry JL, DiCuccio M, Hlavina W, Kapustin Y, Meric P, Maglott D, Birtle Z, Marques AC, Graves T, Zhou S, Teague B, Potamousis K, Churas C, Place M, Herschleb J, Runnheim R, Forrest D, Amos-Landgraf J, Schwartz DC, Cheng Z, Lindblad-Toh K, Eichler EE, Ponting CP (May 2009). «Lineage-specific biology revealed by a finished genome assembly of the mouse». En Roberts, Richard J, ed. PLoS Biology7 (5): e1000112. PMC2680341. PMID19468303. doi:10.1371/journal.pbio.1000112.
↑Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA, Gocayne JD, Amanatides P, Ballew RM, Huson DH, Wortman JR, Zhang Q, Kodira CD, Zheng XH, Chen L, Skupski M, Subramanian G, Thomas PD, Zhang J, Gabor Miklos GL, Nelson C, Broder S, Clark AG, Nadeau J, McKusick VA, Zinder N, Levine AJ, Roberts RJ, Simon M, Slayman C, Hunkapiller M, Bolanos R, Delcher A, Dew I, Fasulo D, Flanigan M, Florea L, Halpern A, Hannenhalli S, Kravitz S, Levy S, Mobarry C, Reinert K, Remington K, Abu-Threideh J, Beasley E, Biddick K, Bonazzi V, Brandon R, Cargill M, Chandramouliswaran I, Charlab R, Chaturvedi K, Deng Z, Di Francesco V, Dunn P, Eilbeck K, Evangelista C, Gabrielian AE, Gan W, Ge W, Gong F, Gu Z, Guan P, Heiman TJ, Higgins ME, Ji RR, Ke Z, Ketchum KA, Lai Z, Lei Y, Li Z, Li J, Liang Y, Lin X, Lu F, Merkulov GV, Milshina N, Moore HM, Naik AK, Narayan VA, Neelam B, Nusskern D, Rusch DB, Salzberg S, Shao W, Shue B, Sun J, Wang Z, Wang A, Wang X, Wang J, Wei M, Wides R, Xiao C, Yan C, Yao A, Ye J, Zhan M, Zhang W, Zhang H, Zhao Q, Zheng L, Zhong F, Zhong W, Zhu S, Zhao S, Gilbert D, Baumhueter S, Spier G, Carter C, Cravchik A, Woodage T, Ali F, An H, Awe A, Baldwin D, Baden H, Barnstead M, Barrow I, Beeson K, Busam D, Carver A, Center A, Cheng ML, Curry L, Danaher S, Davenport L, Desilets R, Dietz S, Dodson K, Doup L, Ferriera S, Garg N, Gluecksmann A, Hart B, Haynes J, Haynes C, Heiner C, Hladun S, Hostin D, Houck J, Howland T, Ibegwam C, Johnson J, Kalush F, Kline L, Koduru S, Love A, Mann F, May D, McCawley S, McIntosh T, McMullen I, Moy M, Moy L, Murphy B, Nelson K, Pfannkoch C, Pratts E, Puri V, Qureshi H, Reardon M, Rodriguez R, Rogers YH, Romblad D, Ruhfel B, Scott R, Sitter C, Smallwood M, Stewart E, Strong R, Suh E, Thomas R, Tint NN, Tse S, Vech C, Wang G, Wetter J, Williams S, Williams M, Windsor S, Winn-Deen E, Wolfe K, Zaveri J, Zaveri K, Abril JF, Guigó R, Campbell MJ, Sjolander KV, Karlak B, Kejariwal A, Mi H, Lazareva B, Hatton T, Narechania A, Diemer K, Muruganujan A, Guo N, Sato S, Bafna V, Istrail S, Lippert R, Schwartz R, Walenz B, Yooseph S, Allen D, Basu A, Baxendale J, Blick L, Caminha M, Carnes-Stine J, Caulk P, Chiang YH, Coyne M, Dahlke C, Mays A, Dombroski M, Donnelly M, Ely D, Esparham S, Fosler C, Gire H, Glanowski S, Glasser K, Glodek A, Gorokhov M, Graham K, Gropman B, Harris M, Heil J, Henderson S, Hoover J, Jennings D, Jordan C, Jordan J, Kasha J, Kagan L, Kraft C, Levitsky A, Lewis M, Liu X, Lopez J, Ma D, Majoros W, McDaniel J, Murphy S, Newman M, Nguyen T, Nguyen N, Nodell M, Pan S, Peck J, Peterson M, Rowe W, Sanders R, Scott J, Simpson M, Smith T, Sprague A, Stockwell T, Turner R, Venter E, Wang M, Wen M, Wu D, Wu M, Xia A, Zandieh A, Zhu X (February 2001). «The sequence of the human genome». Science291 (5507): 1304-51. Bibcode:2001Sci...291.1304V. PMID11181995. doi:10.1126/science.1058040.