Información

Métricas para analizar la longitud de las ramas en árboles filogenéticos

Métricas para analizar la longitud de las ramas en árboles filogenéticos


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Me interesa conocer algunas métricas básicas que podrían usarse para discriminar árboles en función de la longitud de sus ramas. Conozco métodos topológicos / basados ​​en formas de árboles que desconocen la longitud de las ramas, como los índices de Colless y Sackin, y tengo curiosidad por saber si existen métricas similares que utilizan la longitud de las ramas para discriminar. Por ejemplo, los dos árboles siguientes tienen una topología idéntica pero son muy diferentes.


Hay una variedad de medidas de similitud de árboles implementadas en el paquete TreeDist R. (Sus filogenias parecen ser del paquete R ape, por lo que es de esperar que esté algo familiarizado con R.)

Otras herramientas incluyen treedist de Joe Felsenstein, que calcula Robinson-Foulds y la distancia de puntaje de rama (que suena muy relacionado con sus intereses, descritos en este documento). Puede ver esa página de software para obtener mucha más información.

Para obtener una descripción práctica de las diferentes métricas de comparación de árboles, puede consultar este artículo.

Sugeriría echar un vistazo al manual y las múltiples viñetas asociadas con el paquete TreeDist para obtener más información sobre cómo funcionan exactamente esas métricas. Parece haber una amplia variedad de métricas de las que nunca he oído hablar, como la entropía agrupada o la entropía dividida o la similitud de Nye.

Este paquete también incluye herramientas para realizar visualizaciones de diferencias, como la que se muestra a continuación:


No sé si esto se usa realmente en filogenia, pero si restringe el problema a los casos en que las topologías son las mismas, cada árbol puede describirse como un punto en un espacio de n dimensiones donde n es el número de ramas, y cada eje representa la longitud (posiblemente normalizada) de una de las ramas.

Luego puede calcular distancias entre puntos (es decir, árboles) en ese espacio.


Mejora del método filogenético para analizar la heterogeneidad composicional

El análisis filogenético es una forma clave de comprender la investigación actual en los procesos biológicos y detectar la teoría de la evolución de la selección natural. La relación evolutiva entre especies se refleja generalmente en forma de árboles filogenéticos. Muchos métodos para construir árboles filogenéticos se basan en criterios de optimización. Extraemos los datos biológicos a través de características de modelado y luego comparamos estas características para estudiar la evolución biológica entre especies.

Resultados

Aquí, utilizamos el método de máxima verosimilitud y de inferencia bayesiana para establecer árboles filogenéticos, cadena de Markov múltiple. El método de muestreo de Monte Carlo se puede utilizar para seleccionar el árbol filogenético óptimo, resolviendo el problema local óptimo. El modelo de correlación del análisis filogenético supone que los árboles filogenéticos se basan en datos homogéneos, sin embargo, existe una gran desviación en presencia de datos heterogéneos. Usamos la detección consciente para resolver la heterogeneidad composicional. Nuestro método se evalúa en dos conjuntos de datos experimentales, un grupo de datos de genes bacterianos de ARN ribosómico 16S y un grupo de datos genéticos con cinco especies homólogas.

Conclusiones

Nuestro método puede obtener árboles filogenéticos precisos en los datos homólogos y también detectar la heterogeneidad composicional de los datos experimentales. Proporcionamos un método eficiente para mejorar la precisión del árbol filogenético generado.


Distancias de RF generalizadas

La distancia de Robinson-Foulds simplemente suma el número de divisiones no triviales (a veces denominadas de manera inexacta clados, nodos o bordes) que ocurren en ambos árboles; cualquier división que no sea perfectamente idéntica contribuye un punto a la puntuación de distancia de cero, por similar o similar que sea. diferentes son. Al pasar por alto las similitudes potenciales entre divisiones casi idénticas, este enfoque conservador tiene propiedades indeseables.

Las métricas de RF "generalizadas" generan emparejamientos ese par se divide en un árbol con divisiones similares en el otro. A cada par de divisiones se le asigna una puntuación de similitud, la suma de estas puntuaciones en la coincidencia óptima y luego cuantifica la similitud entre dos árboles.

Las diferentes formas de calcular la similitud entre un par de divisiones conducen a diferentes métricas de distancia del árbol, implementadas en las siguientes funciones:

Smith (2020) puntúa las coincidencias en función de la cantidad de información que una partición contiene sobre la otra. La información filogenética mutua asigna cero similitudes a los pares divididos que no pueden existir en un solo árbol. La métrica de información de agrupación mutua es más indulgente y muestra un comportamiento más deseable; es la métrica recomendada para la comparación de árboles. (Su complemento, ClusteringInfoDistance (), devuelve una distancia de árbol).

Nye et al. (2006) calificaron emparejamientos según el tamaño de la división más grande que sea consistente con ambos, normalizado frente al índice de Jaccard. Este enfoque es ampliado por Böcker et al. (2013) con la métrica Jaccard-Robinson-Foulds (función JaccardRobinsonFoulds ()).

Bogdanowicz y Giaro (2012) y Lin et al. (2012) propusieron de forma independiente contar el número de hojas "no coincidentes" en un par de divisiones. MatchingSplitInfoDistance () proporciona un equivalente basado en información (Smith 2020).

El paquete también implementa la variación de la distancia de ruta propuesta por Kendal y Colijn (2016) (función KendallColijn ()), aproximaciones de la distancia de Intercambio más cercano-vecino (NNI) (función NNIDist () siguiendo a Li et al. (1996)), y calcula el tamaño (función MASTSize ()) y el contenido de información (función MASTInfo ()) del Subárbol de Acuerdo Máximo.

Para una implementación de la distancia de Bisección y Reconexión de Árbol (TBR), consulte el paquete "TBRDist".


Resultados

Descripción general del algoritmo OrthoFinder y resumen de archivos de resultados

El algoritmo OrthoFinder se describe en detalle en la sección "Métodos". En resumen, aborda los desafíos identificados anteriormente en cinco pasos principales: (a) inferencia de ortogrupo, (b) inferencia de árboles genéticos para cada ortogrupo, (cyd) análisis de estos árboles genéticos para inferir el árbol de especies enraizadas, (e ) enraizamiento de los árboles genéticos utilizando el árbol de especies enraizadas, y (f – h) análisis de duplicación-pérdida-coalescencia (DLC) de los árboles genéticos enraizados para identificar ortólogos y eventos de duplicación de genes (mapeados en sus ubicaciones tanto en la especie como en el gen árboles) (Fig.2). Por lo tanto, partiendo solo de secuencias de genes, OrthoFinder infiere ortogrupos, ortólogos, el conjunto completo de árboles de genes para todos los ortogrupos, el árbol de especies enraizadas y todos los eventos de duplicación de genes y calcula estadísticas genómicas comparativas. Para ilustrar los resultados estándar proporcionados por un análisis OrthoFinder, en la figura 3a-h se muestra un ejemplo gráfico del conjunto completo de resultados producido por OrthoFinder para diez especies de metazoos.

El flujo de trabajo de OrthoFinder. El método utilizado para cada paso se muestra con la flecha. Los algoritmos publicados se muestran en cursiva y van seguidos de un asterisco. Una línea azul punteada que se conecta con una flecha sólida indica datos adicionales que se utilizan para llevar a cabo la transformación indicada por la flecha sólida. MSA, DLC de inferencia de árbol basado en alineación de múltiples secuencias, duplicación-pérdida-coalescencia. (a) Inferencia de ortogrupo utilizando el algoritmo OrthoFinder original (un ortogrupo es el conjunto de genes que descienden de un solo gen en el último ancestro común de todas las especies consideradas). (B) Inferencia del árbol genético. (C) Inferencia de árboles de especies. (D) Especies enraizamiento de árboles (mi) Enraizamiento del árbol genético (F) Análisis híbrido de superposición + DLC de árboles de genes enraizados para inferir ortólogos y eventos de duplicación de genes. (gramo) Ilustración de la tabla de resultados de ortólogos para los genes de cada especie de entrada (cuatro recuadros principales). Las divisiones horizontales dentro de estos muestran los ortólogos para cada par de especies individuales. (h) Ilustración de la tabla de eventos de duplicación de genes que muestra la ubicación de los eventos de duplicación de genes mapeados en el árbol de especies, la ubicación en el árbol de genes, el porcentaje de retención de los genes duplicados en la especie muestreada y los genes descendientes del evento de duplicación de genes. . (I) Estadísticas genómicas comparativas

Resumen del análisis de OrthoFinder de un conjunto de especies de Chordata: Ciona intestinalis, Danio rerio, Oryzias latipes, Xenopus tropicalis, Gallus gallus, Monodelphis domestica, Mus musculus, Rattus norvegicus, Pan trogloditas, y Homo sapiens. Los gráficos de barras y el mapa de calor contienen datos para cada especie, alineados con las especies correspondientes en el árbol en a. a El árbol de especies inferido por STAG y enraizado por STRIDE. B Porcentaje de genes de cada especie asignados a ortogrupos. C El número de ortogrupos específicos de especies. D El número de genes con ortólogos en cualquiera / todas las especies. mi Mapa de calor del número de ortogrupos que contienen cada par de especies (arriba a la derecha) y ortólogos entre cada especie (abajo a la izquierda). F Multiplicidades de ortólogos para dos especies, C. intestinalis y H. sapiens, con respecto a todas las demás especies. gramo El número de eventos de duplicación de genes en cada rama terminal del árbol de especies. h El número de duplicaciones en cada rama del árbol de la especie y retenido en todas las especies descendientes. OG, ortogrupo sp., Especie spp., Especie (plural) dups., Eventos de duplicación de genes

La versión predeterminada y más rápida de OrthoFinder usa DIAMOND [24] para búsquedas de similitud de secuencia. Estas puntuaciones de similitud de secuencia proporcionan tanto los datos brutos para la inferencia de ortogrupos [10] como para la inferencia del árbol genético de estos ortogrupos utilizando DendroBLAST [24]. La implementación predeterminada de OrthoFinder se ha diseñado para permitir un análisis completo con la máxima velocidad y escalabilidad utilizando solo secuencias de genes como entrada. Sin embargo, OrthoFinder también ha sido diseñado para permitir el uso de métodos alternativos para la inferencia de árboles y la búsqueda de secuencias para adaptarse a las preferencias del usuario. Por ejemplo, BLAST [4] se puede utilizar para búsquedas de similitud de secuencia en lugar de DIAMOND. De manera similar, los árboles genéticos no necesitan inferirse usando DendroBLAST. En su lugar, OrthoFinder puede inferir automáticamente múltiples alineaciones de secuencia y árboles filogenéticos utilizando la mayoría de los métodos de inferencia de árbol y alineación de múltiples secuencias preferidos por el usuario. Además, si el árbol de especies se conoce antes del análisis, OrthoFinder también puede proporcionarlo como entrada, en lugar de inferirlo. Por lo tanto, aunque OrthoFinder está diseñado para requerir un mínimo de insumos y cálculos, se puede adaptar para adaptarse a los recursos informáticos y de datos disponibles para el usuario.

OrthoFinder tiene la mayor precisión de inferencia de ortólogos

La precisión de los algoritmos de componentes clave de OrthoFinder se ha evaluado de forma independiente en este trabajo y en publicaciones especializadas [5, 10, 22, 24, 33]. Para demostrar la precisión del método general, los ortólogos identificados por OrthoFinder utilizando sus opciones predeterminadas, junto con múltiples configuraciones diferentes, se enviaron a la comunidad. Búsqueda de ortólogos servidor de evaluación comparativa para el conjunto de datos 2011_04 [1] (consulte la sección "Métodos" para obtener detalles de las pruebas). Este conjunto de datos tuvo resultados de referencia para la mayor cantidad de otros métodos y, por lo tanto, permitió la comparación más completa con los métodos de la competencia. Los resultados de todos estos análisis se muestran en la Fig. 4a-ly el apoyo de análisis adicionales en el archivo adicional 1: Figura S1-S3 y archivo adicional 1: Tabla S1.

al Quest for Orthologs 2011_04 puntos de referencia (ver [1]) en 66 especies en Eukarya, Bacteria y Archaea para métodos de inferencia de ortólogos. La línea punteada muestra la frontera de Pareto. Los datos de los gráficos se encuentran en el archivo adicional 1: Tabla S1. a, B F-puntuación en las pruebas SwissTree y TreeFam-A. C "Seudo-F-puntaje ”en las dos pruebas de discordancia de árboles de especies (STDT). D "Seudo-F-score ”en las cuatro Pruebas de Discordancia de Árboles de Especies Generalizadas (GSTDT). miF Acuerdo de ortólogos SwissTree / FreeFam-A trees gramo-h Puntos de referencia en STDT y amp GSTDT. Eje X: Fracción total de genes seleccionados al azar con ortólogos pronosticados en un conjunto predefinido de especies para los dos STDT y cuatro GSTDT respectivamente. Eje Y: Promedio (1 - distancia de Robinson-Foulds normalizada) entre el árbol genético de los ortólogos putativos y el árbol de especies conocidas en los dos STDT y los cuatro GSTD respectivamente. Los cuatro GSTDT individuales y dos STDT individuales se muestran en Archivo adicional: 1 Illinois Acercar parcelas mi-h. Consulte la sección de métodos “Evaluación comparativa de Ortholog” para obtener detalles sobre las pruebas comparativas de Quest for Orthologs. metro Tiempo de ejecución para cada método con 4-256 proteomas de hongos de entrada. norte Resultados devueltos por métodos, un ortogrupo de múltiples especies es el conjunto de genes que descienden de un solo gen en el último ancestro común de tres o más especies.

Las pruebas SwissTree y TreeFam-A dentro Búsqueda de ortólogos evaluar la precisión de la inferencia de ortólogos frente a los ortólogos de árboles de referencia. Para estas pruebas, precisión, recuperación y F-se puede calcular la puntuación. En estas pruebas, la versión predeterminada y más rápida de OrthoFinder fue 3–24% (SwissTree, Fig. 4a) y 2–30% (TreeFam-A, Fig. 4b) más precisa que cualquier otro método. Las otras versiones de OrthoFinder eran un 1 a 3% más precisas que OrthoFinder predeterminado. Ningún método fue el segundo mejor después de OrthoFinder.

Para el Búsqueda de ortólogos Pruebas de discordancia de árboles de especies estándar y generalizadas (STDT y GSTDT), no se conocen ortólogos de verdad fundamental y los métodos se evalúan según el porcentaje de pruebas en las que se identifica un conjunto de ortólogos en un conjunto de especies y la distancia de Robinson-Foulds entre árbol de especies y el árbol genético de los supuestos ortólogos. Como tal, precisión estándar, recuperación y F-Las medidas de puntuación no se pueden calcular. Para estas pruebas, un "pseudo-F-score ”se calculó utilizando el porcentaje de los conjuntos de ortólogos recuperados en lugar del recuerdo y 1 - distancia de Robinson-Foulds normalizada en lugar de precisión (de manera equivalente, la proporción de biparticiones en un acuerdo entre el árbol de especies y el árbol de ortólogos putativos). Tanto en STDT como en GSTDT, todas las versiones de OrthoFinder tenían un pseudo-F-puntuación que todas las versiones de todos los demás métodos. La versión predeterminada y más rápida de OrthoFinder fue de 0 a 45% (STDT, Fig. 4c) y 10 a 59% (GSTDT, Fig. 4d) de puntuación más alta que los métodos de la competencia. Las otras versiones de OrthoFinder obtuvieron una puntuación entre un 1 y un 6% más alta que la versión predeterminada.

Todas las versiones de OrthoFinder, independientemente de las opciones algorítmicas, infirieron más ortólogos (conjuntos de ortólogos más recuperados / recuperados) que cualquier otro método probado con un nivel de precisión similar (Fig. 4e-l). En las cuatro pruebas, la versión predeterminada y más rápida de OrthoFinder (DIAMOND) logró entre 0 (Fig. 4g) y 65% ​​(Fig. 4h) conjuntos de ortólogos recuperados / recuperados más altos que los métodos de la competencia. Logró una concordancia entre especies de árboles de precisión / ortólogo entre un 5% más baja (Fig. 4h) y un 15% más alta (Fig. 4g) que los métodos de la competencia. De manera similar, en los últimos puntos de referencia de 2018, las tres versiones de OrthoFinder fueron más precisas que todos los demás métodos en los cuatro puntos de referencia: STDT, GSTDT, SwissTree y TreeFam-A (archivo adicional 1: Figura S2).

Además de probar OrthoFinder con métodos de la competencia que se pueden ejecutar en datos de secuencia sin procesar, OrthoFinder también se comparó con métodos de bases de datos estáticas que involucran varios niveles de curación humana. Todas las versiones de OrthoFinder, independientemente de las opciones algorítmicas, tenían un mayor F-puntaje / pseudo-F-puntuar en cada una de las cuatro pruebas que cualquiera de las bases de datos con la única excepción de PANTHER en la Prueba de Discordancia del Árbol de Especies (Archivo adicional 1: Figura S3). En general, la versión predeterminada F-puntaje / pseudo-F-La puntuación fue entre un 2 y un 14% más alta que los métodos de la base de datos. OrthoFinder (BLAST + MSA) puntuó entre un 5 y un 17% más que los métodos de la base de datos (archivo adicional 1: Figura S3). Por lo tanto, aunque OrthoFinder está completamente automatizado y no requiere curación manual, también logró una mayor precisión que los métodos de base de datos en línea curados.

OrthoFinder es rápido y se adapta bien a cientos de especies.

Para demostrar la escalabilidad del método OrthoFinder, se ejecutó en conjuntos de entre 4 y 256 especies de hongos con 16 procesos paralelos (Fig. 4m). Todas las demás herramientas de software disponibles públicamente que se han evaluado en el Búsqueda de ortólogos conjunto de datos se probaron de manera similar. La versión predeterminada de OrthoFinder se ejecutó en 192 s en las 4 especies y en 1,8 días en los conjuntos de datos de 256 especies. En este tiempo, infirió ortogrupos, todos los árboles genéticos, el árbol de especies enraizadas, ortólogos y eventos de duplicación de genes (Fig. 4n). En general, OrthoFinder fue el segundo método más rápido, y el método más rápido SonicParanoid tomó 1.2 días en el mismo conjunto de 256 especies. Tanto OrthoFinder como SonicParanoid escalaron bien a los conjuntos de datos más grandes, y ambos tomaron menos de la mitad del tiempo del siguiente mejor método (4.1 días, Fig. 4m).

Hubo una gran variedad de tiempos de ejecución en todo el conjunto de métodos. Muchos métodos no eran adecuados para conjuntos de especies más grandes, siendo 64 especies el conjunto más grande en el que todos los métodos se podían ejecutar dentro del límite de 120 h (5 días). En este punto de comparación, el método más lento tardó 200 veces más en ejecutarse que OrthoFinder. También debe tenerse en cuenta que ningún método competidor también proporciona árboles de genes o identifica eventos de duplicación de genes (Fig. 4n). Por lo tanto, OrthoFinder no solo es el método más preciso y el segundo método más rápido, sino que también proporciona la mayor cantidad de información filogenómica.

OrthoFinder resuelve de manera eficiente y precisa el desafío de inferir un árbol de especies enraizadas a partir de datos de secuencias de proteínas no alineadas

Los árboles de genes enraizados son necesarios para permitir el uso de información filogenética para la inferencia de ortólogos, ya que la ubicación correcta de la raíz es necesaria para la disección correcta de las relaciones filogenéticas entre genes en el árbol [22]. Sin embargo, la gran mayoría de los métodos de inferencia de árboles infieren árboles sin raíz. Los árboles genéticos se pueden enraizar correctamente dado el conocimiento del árbol de especies enraizado subyacente y, por lo tanto, OrthoFinder primero infiere y luego enraiza el árbol de especies para el conjunto de especies que se analizan. OrthoFinder resuelve estos dos desafíos (inferencia de árboles de especies y enraizamiento) utilizando dos algoritmos desarrollados específicamente para este propósito.

El árbol de especies se infiere del conjunto de árboles de genes de ortogrupos no enraizados usando STAG [33], y este árbol de especies se enraiza usando STRIDE [22]. STAG se desarrolló para aprovechar la gran cantidad de información filogenética ya disponible en el conjunto completo de árboles de genes de ortogrupos inferidos por OrthoFinder. También se desarrolló para ser resistente a altos niveles de duplicación y pérdida de genes que pueden obstaculizar los métodos que se basan en conjuntos de ortólogos de copia única [33]. Superó los métodos populares de inferencia de árboles de especies en los datos de referencia y se adaptó bien a grandes conjuntos de datos [33].

Métodos para ab initio El enraizamiento de especies de árboles (es decir, sin conocimiento previo de un grupo externo adecuado) ha recibido poca atención [22]. STRIDE se desarrolló de manera similar para aprovechar los eventos de duplicación de genes en el conjunto completo de árboles de genes de ortogrupos para determinar de manera eficiente la raíz del árbol de especies y logró una alta precisión en los datos de referencia [22]. La capacidad de OrthoFinder para aprovechar automáticamente los datos de la secuencia de aminoácidos sin procesar para inferir el árbol de especies enraizadas permite, por lo tanto, el enraizamiento externo del conjunto completo de árboles de genes de ortogrupos para cualquier conjunto de especies de entrada y para todos los árboles de genes. Este es un paso crítico para permitir la inferencia de ortología filogenética a partir de secuencias de genes.

OrthoFinder implementa un algoritmo novedoso de duplicación-pérdida-coalescente para identificar ortólogos y eventos de duplicación de genes

Dado un conjunto de árboles de genes de ortogrupos enraizados, el último gran desafío para diseccionar con precisión las relaciones filogenéticas entre genes es tener en cuenta la clasificación incompleta del linaje y el error del árbol de genes. Los métodos existentes para determinar si los genes dentro de un árbol genético son ortólogos o parálogos tenían poca precisión o no podían escalar al número y tamaño de los árboles genéticos de ortogrupos que deben analizarse. Por lo tanto, para abordar este desafío, se desarrolló un algoritmo novedoso y escalable basado en el modelo de duplicación-pérdida-coalescente (consulte la sección “Métodos”).

Para demostrar las características de rendimiento relativo de este método, se aplicó a dos conjuntos de datos simulados independientes [32, 34] y se comparó con tres métodos populares comparables: GSDI Forester [29], DLCpar (completo y de búsqueda) [32] y método de superposición [31] (Fig. 5). También se comparó con Notung [30], pero dado que los valores de soporte de rama no estaban disponibles, que Notung usa para mejorar su precisión, logró resultados idénticos a Forester y, por lo tanto, no se muestra aquí como un método adicional. En términos de precisión, el nuevo método OrthoFinder superó a todos los métodos distintos de DLCpar (completo) (Fig. 5a, Archivo adicional 1: Tabla S2). Sin embargo, DLCpar (completo) no pudo analizar conjuntos de datos de especies de tamaño realista. Por ejemplo, mientras que el método OrthoFinder pudo analizar el conjunto completo de 18,651 árboles de genes de ortogrupos (948,449 genes) de 128 especies de hongos en 141 s, DLCpar (completo) no pudo procesar un conjunto de datos de 4 especies considerablemente más pequeño (2259 árboles , 12.958 genes) en 120 h (Fig. 5b). Por lo tanto, OrthoFinder es el método más preciso que es escalable a conjuntos de datos realistas. Este algoritmo permite la interrogación precisa de árboles genéticos de ortogrupos de una manera que puede analizar miles de árboles genéticos en cientos de especies en minutos en hardware informático estándar (Fig. 5b).

a Puntuación F de duplicación, en árboles genéticos simulados. B Tiempo de ejecución para analizar todos los árboles de los conjuntos de datos de hongos de 4 a 128 especies (ver Métodos), se permitió un tiempo máximo de 120 horas (4,3x10 segundos). DLCpar (completo) no completó el conjunto de datos más pequeño en este límite de tiempo y, por lo tanto, solo se muestra el límite inferior para el primer punto de tiempo. CD Precisión y recuerdo


ÁRBOLES CONTINUOS

Aunque muchas métricas se definen en términos de reordenamientos de árboles, otra clase de métricas se centra en las propiedades de los árboles que se pueden representar como vectores. Las métricas se basan en comparaciones de estos vectores. La representación vectorial más común tiene las longitudes de las ramas del árbol como coordenadas. Los cálculos son independientes del orden de las coordenadas, por lo que se puede utilizar cualquier orden fijo en las coordenadas. Los espacios resultantes a menudo se denominan "espacios de árboles continuos". A pesar de que hay N = 2 norte−1 −1 posibles divisiones para norte-árboles de hojas, como máximo 2norte−3 divisiones pueden ocurrir en un árbol. De manera similar, para un vector de árbol, establecemos todas las coordenadas que no corresponden a una división del árbol en 0. Por lo tanto, el vector de cualquier árbol puede tener como máximo 2norte−3 coordenadas distintas de cero. Si un vector de árbol tiene menos de 2norte−3 coordenadas distintas de cero, el árbol correspondiente no está completamente resuelto (es decir, no es binario). Un "árbol estrella" se refiere a un árbol con solo norte ramas (p. ej. T0 en la figura 4).

El modelo de árbol se vuelve más complejo cuando permitimos las longitudes de las ramas en los bordes del árbol, pero sorprendentemente, las métricas se vuelven computacionalmente más fáciles. Primero revisamos las distancias que dependen únicamente de la comparación de los vectores y luego las restringimos a los espacios donde todos los vectores corresponden a un árbol. Para este último, la distancia entre dos árboles es el camino más corto entre los dos árboles que no sale del espacio (Fig. 5). (Billera et al. 2001) mostró que la geodésico o el camino más corto existe y es único. Nos centraremos en su espacio ya que para él se han desarrollado la mayoría de herramientas estadísticas y computacionales.

Se han propuesto otros espacios de árboles basados ​​en vectores. Algunos, en particular los que utilizan triples o cuartetos como coordenadas, pueden calcularse con bastante rapidez (Brodal et al. 2013 Sand et al. 2013) y se están utilizando, especialmente para comparar árboles de genes y especies (DeGiorgio y Degnan 2010). Otra clase de espacios intrigantes está parametrizada por los caminos entre las hojas. Se necesita mucho trabajo para estos espacios, tanto teóricamente (como definir medianas y promedios cuando hay múltiples caminos más cortos entre puntos) como herramientas algorítmicas (como algoritmos y software que pueden calcular distancias para árboles de más de 3 hojas). Dada la enorme complejidad en el cálculo de incluso pequeños ejemplos y la topología del espacio subyacente (Moulton y Steel 2004 Gill et al. 2008 Engström et al. 2013), esta es una tarea abrumadora. Explicamos brevemente estos espacios, así como sus vínculos con el espacio filogenético naranja (definido a continuación) que incluye modelos probabilísticos de evolución (Kim 2000).

Métricas y vecinos

Representar árboles como vectores abre muchas formas de comparar los árboles. Ya existen muchas matemáticas hermosas en los espacios vectoriales, y aquí destacamos los conceptos utilizados para comparar árboles filogenéticos (para una descripción más detallada, ver Rudin 1987). La longitud (o norma) de un vector. v a menudo se escribe ‖v‖. Algunas de las métricas utilizadas en filogenética ocurren en este marco de normas, a menudo llamado el pag-norm o L p -norm (nombrado en honor al matemático Henri Lebesgue). Las métricas de tripletes y cuarteto enraizados también se pueden representar en términos de vectores, pero utilizando vectores subyacentes que representan en lugar de las divisiones, los triples y los cuartetos, respectivamente. El espacio Billera – Holmes – Vogtmann (BHV) de Billera et al. (2001) también se define como el conjunto de todos los árboles con la longitud de las ramas, pero utiliza como métrica la ruta geodésica o más corta entre dos puntos que se encuentra completamente dentro del espacio. Aunque se puede aproximar mediante métricas que comparan vectores, su requisito adicional de que la ruta más corta se encuentre completamente en el espacio complica el cálculo. Este requisito también produce puntos medios entre árboles que son árboles, lo que permite técnicas de resumen que no son posibles en otros espacios. A diferencia de las métricas de reordenamiento de árboles, muchas métricas basadas en vectores que se utilizan para comparar árboles se pueden calcular en tiempo polinomial.


Métricas de diversidad filogenética para comunidades ecológicas: integración de riqueza, abundancia e historia evolutiva de especies

La información filogenética se utiliza cada vez más para comprender el ensamblaje de comunidades biológicas y procesos ecológicos. Sin embargo, las métricas de diversidad filogenética (DP) de uso común no incorporan información sobre la abundancia relativa de individuos dentro de una comunidad. En este estudio, desarrollamos tres índices de PD que consideran explícitamente la abundancia de especies. Primero, presentamos una métrica de uniformidad de abundancia filogenética que evalúa la relación entre la abundancia y la distribución de las longitudes de las ramas terminales. En segundo lugar, calculamos un índice de desequilibrio jerárquico de abundancias a nivel de clado que encapsula la distribución de los individuos en los nodos de la filogenia. En tercer lugar, desarrollamos un índice de distinción evolutiva ponderada por abundancia y generamos un índice entrópico de diversidad filogenética que captura tanto información sobre distancias evolutivas como topología de árboles filogenéticos, y también sirve como base para evaluar el valor de conservación de las especies. Estas métricas ofrecen medidas de diversidad filogenética que incorporan diferentes atributos de la comunidad. Comparamos estas nuevas métricas con las existentes y las usamos para explorar patrones de diversidad en una comunidad de plantas de pastizales anuales típica de California en la reserva biológica de Jasper Ridge.


Referencias

Huelsenbeck JP, Ronquist F: MrBayes: inferencia bayesiana de árboles filogenéticos. Bioinformática. 2001, 17: 754-755. 10.1093 / bioinformatics / 17.8.754.

Beaumont M: Detección de la expansión y disminución de la población mediante microsatélites. Genética. 1999, 153: 2013-2029.

Drummond AJ, Nicholls G, Rodrigo A, Solomon W: Estimación de parámetros de mutación, historia de la población y genealogía simultáneamente a partir de datos de secuencia espaciados temporalmente. Genética. 2002, 161: 1307-1320.

Wilson I, Weale M, Balding D: Inferencias de datos de ADN: historias de población, procesos evolutivos y probabilidades de coincidencia forense. J Royal Stat Soc A-Statistics in Society. 2003, 166: 155-188. 10.1111 / 1467-985X.00264.

Rannala B, Yang Z: Estimación de Bayes de los tiempos de divergencia de especies y tamaños de poblaciones ancestrales utilizando secuencias de ADN de múltiples loci. Genética. 2003, 164: 1645-1656.

Pybus O, Drummond AJ, Nakano T, Robertson B, Rambaut A: La epidemiología y la transmisión iatrogénica del virus de la hepatitis C en Egipto: un enfoque coalescente bayesiano. Mol Biol Evol. 2003, 20: 381-387. 10.1093 / molbev / msg043.

Kuhner M: LAMARC 2.0: Máxima verosimilitud y estimación bayesiana de parámetros poblacionales. Bioinformática. 2006, 22: 768-770. 10.1093 / bioinformatics / btk051.

Lunter G, Miklos I, Drummond A, Jensen J, Hein J: coestimación bayesiana de filogenia y alineación de secuencias. BMC Bioinformática. 2005, 6: 83-10.1186 / 1471-2105-6-83.

Redelings B, Suchard M: Estimación conjunta bayesiana de alineación y filogenia. Biología sistemática. 2005, 54: 401-418. 10.1080 / 10635150590947041.

Metropolis N, Rosenbluth A, Rosenbluth M, Teller A, Teller E: Ecuaciones de cálculos de estado por máquinas de computación rápida. Revista de Química y Física. 1953, 21: 1087-1092. 10.1063 / 1.1699114.

Hastings W: métodos de muestreo de Monte Carlo utilizando cadenas de Markov y sus aplicaciones. Biometrika. 1970, 57: 97-109. 10.1093 / biomet / 57.1.97.

Zuckerkandl E, Pauling L: divergencia evolutiva y convergencia en proteínas. 1965, Nueva York: Academic Press, 97-166.

Sanderson M: Enfoque no paramétrico para estimar tiempos de divergencia en ausencia de constancia de velocidad. Biología Molecular y Evolución. 1997, 14: 1218-1231.

Thorne J, Kishino H, Painter I: Estimación de la tasa de evolución de la tasa de evolución molecular. Biología Molecular y Evolución. 1998, 15: 1647-1657.

Rambaut A, Bromham L: Estimación de fechas de divergencia a partir de secuencias moleculares. Biología Molecular y Evolución. 1998, 15: 442-448.

Yoder A, Yang Z: Estimación de las fechas de especiación de primates usando relojes moleculares locales. Biología Molecular y Evolución. 2000, 17: 1081-1090.

Kishino H, Thorne J, Bruno W: Rendimiento de un método de estimación del tiempo de divergencia bajo un modelo probabilístico de evolución de la tasa. Biología Molecular y Evolución. 2001, 18: 352-361.

Sanderson M: Estimación de tasas absolutas de evolución molecular y tiempos de divergencia: un enfoque de verosimilitud penalizada. Biología Molecular y Evolución. 2002, 19: 101-109.

Thorne J, Kishino H: tiempo de divergencia y estimación de la tasa de evolución con datos multilocus. Syst Biol. 2002, 51: 689-702. 10.1080 / 10635150290102456.

Aris-Brosou S, Yang Z: Los modelos bayesianos de evolución episódica apoyan una diversificación explosiva del Precámbrico tardío de los metazoos. Mol Biol Evol. 2003, 20: 1947-1954. 10.1093 / molbev / msg226.

Drummond AJ, Ho S, Phillips M, Rambaut A: Filogenia relajada y citas con confianza. PLoS Biology. 2006, 4: e88-10.1371 / journal.pbio.0040088.

Lanave C, Preparata G, Saccone C, Serio G: Un nuevo método para calcular las tasas de sustitución evolutiva. Revista de evolución molecular. 1984, 20: 86-93. 10.1007 / BF02101990.

Tavare S: Algunos problemas probabilísticos y estadísticos sobre el análisis de secuencias de ADN. Lect Math Life Sci. 1986, 17: 57-86.

Hasegawa M, Kishino H, Yano T: Datación de la división entre humanos y simios mediante un reloj molecular de ADN mitocondrial. Revista de evolución molecular. 1985, 22: 160-174. 10.1007 / BF02101694.

Goldman N, Yang Z: un modelo basado en codones de sustitución de nucleótidos para secuencias de ADN que codifican proteínas. Biología Molecular y Evolución. 1994, 11: 725-736.

Uzzell T, Corbin K: Ajuste de distribuciones de probabilidad discretas a eventos evolutivos. Ciencias. 1971, 172: 1089-1096. 10.1126/science.172.3988.1089.

Yang Z: Maximum likelihood phylogenetic estimation from DNA sequences with variable rates over sites: approximate methods. Journal of Molecular Evolution. 1994, 39: 306-314. 10.1007/BF00160154.

Gu X, Fu Y, Li W: Maximum likelihood estimation of the heterogeneity of substitution rate among nucleotide sites. Molecular Biology and Evolution. 1995, 12: 546-557.

Waddell P, Steel M: General time reversible distances with unequal rates across sites: Mixing Gamma and inverse Gaussian distributions with invariant sites. Molecular Phylogenetics and Evolution. 1997, 8: 398-414. 10.1006/mpev.1997.0452.

Rambaut A: Estimating the rate of molecular evolution: incorporating non-contemporaneous sequences into maximum likelihood phylogenies. Bioinformatics. 2000, 16: 395-399. 10.1093/bioinformatics/16.4.395.

Drummond AJ, Pybus O, Rambaut A, Forsberg R, Rodrigo A: Measurably evolving populations. Trends in Ecology & Evolution. 2003, 18: 481-488. 10.1016/S0169-5347(03)00216-7.

Kingman J: The coalescent. Stochastic Processes and Their Applications. 1982, 13: 235-248. 10.1016/0304-4149(82)90011-4.

Griffths R, Tavare S: Sampling theory for neutral alleles in a varying environment. Philos Trans R Soc Lond B Biol Sci. 1994, 344: 403-410. 10.1098/rstb.1994.0079.

Drummond AJ, Rambaut A, Shapiro B, Pybus O: Bayesian coalescent inference of past population dynamics from molecular sequences. Molecular Biology and Evolution. 2005, 22: 1185-1192. 10.1093/molbev/msi103.

Wilson A, Sarich V: A molecular time scale for human evolution. Proc Natl Acad Sci USA. 1969, 63: 1088-1093. 10.1073/pnas.63.4.1088.

Thorne J, Kishino H, Felsenstein J: An evolutionary model for maximum likelihood alignment of DNA sequences. Journal of Molecular Evolution. 1991, 33: 114-124. 10.1007/BF02193625.

Lemey P, Pybus O, Rambaut A, Drummond AJ, Robertson D, Roques P, Worobey M, Vandamme A: The molecular population genetics of HIV-1 group O. Genetics. 2004, 167: 1059-1068. 10.1534/genetics.104.026666.

Newton M, Raftery A: Approximate Bayesian inference with the weighted likelihood bootstrap. Journal of the Royal Statistical Society, Series B. 1994, 56: 3-48.

Shapiro B, Rambaut A, Drummond AJ: Choosing Appropriate Substitution Models for the Phylogenetic Analysis of Protein-Coding Sequences. Mol Biol Evol. 2006, 23: 7-9. 10.1093/molbev/msj021.

Huelsenbeck J, Rannala B: Frequentist Properties of Bayesian Posterior Probabilities of Phylogenetic Trees Under Simple and Complex Substitution Models. Systematic Biology. 2004, 53: 904-913. 10.1080/10635150490522629.

Shapiro B, Drummond AJ, Rambaut A, Wilson MC, Matheus PE, Sher AV, Pybus OG, Gilbert MTP, Barnes I, Binladen J, Willerslev E, Hansen AJ, Baryshnikov GF, Burns JA, Davydov S, Driver JC, Froese DG, Harington CR, Keddie G, Kosintsev P, Kunz ML, Martin LD, Stephenson RO, Storer J, Tedford R, Zimov S, Cooper A: Rise and fall of the Beringian steppe bison. Science. 2004, 306: 1561-1565. 10.1126/science.1101074.

Suchard M, Redelings B: BAli-Phy: simultaneous Bayesian inference of alignment and phylogeny. Bioinformatics. 2006, 22: 2047-2048. 10.1093/bioinformatics/btl175.

Rambaut A, Drummond AJ: Tracer [computer program]. 2003, [http://beast.bio.ed.ac.uk/tracer]


Referencias

Blomberg SP, Garland Jr T, Ives AR, Crespi B. Testing for phylogenetic signal in comparative data: behavioral traits are more labile. Evolution. 200357:717–45.

Diniz-Filho JAF, Bini LM. Macroecology, global change and the shadow of forgotten ancestors. Global Ecol Biogeogr. 200817:11–7

Verbruggen H, Tyberghein L, Pauly K, Vlaeminck C, Nieuwenhuyze KV, Kooistra WHCF, et al. Macroecology meets macroevolution: evolutionary niche dynamics in the seaweed Halimeda. Global Ecol Biogeogr. 200918:393–405.

Fitzpatrick BM, Turelli M. The geography of mammalian speciation: mixed signals from phylogenies and range maps. Evolution. 200660:601–15.

Davies TJ, Wolkovich EM, Kraft NJB, Salamin N, Allen JM, Ault TR, et al. Phylogenetic conservatism in plant phenology. J Ecol. 2013101:1520–30.

Kamilar JM, Cooper N. Phylogenetic signal in primate behaviour, ecology and life history. Philos T Roy Soc B. 2013368:20120341.

Fritz SA, Purvis A. Selectivity in mammalian extinction risk and threat types: a new measure of phylogenetic signal strength in binary traits. Conserv Biol. 201024:1042–51.

Webb CO, Ackerly DD, McPeek MA, Donoghue MJ. Phylogenies and community ecology. Ann Rev Ecol Syst. 200233:475–505.

Mouquet N, Devictor V, Meynard CN, Munoz F, Bersier L-F, Chave J, et al. Ecophylogenetics: advances and perspectives. Biol Rev. 201287:769–85.

Cavender-Bares J, Kozak KH, Fine PVA, Kembel SW. The merging of community ecology and phylogenetic biology. Ecol Lett. 200912:693–715.

Vamosi SM, Heard SB, Vamosi JC, Webb CO. Emerging patterns in the comparative analysis of phylogenetic community structure. Mol Ecol. 200918:572–92.

Jetz W, Thomas GH, Joy JB, Hartmann K, Mooers AO. The global diversity of birds in space and time. Nature. 2012491:444–8.

Zanne AE, Tank DC, Cornwell WK, Eastman JM, Smith SA, FitzJohn RG, et al. Three keys to the radiation of angiosperms into freezing environments. Nature. 2014506:89–92.

Hinchliff CE, Smith SA. Some limitations of public sequence data for phylogenetic inference (in plants). PLoS One. 20149, e98986.

The Angiosperm Phylogeny Group. An update of the Angiosperm Phylogeny Group classification for the orders and families of flowering plants: APG IV. Bot J Linn Soc. 2016181:1–20.

Jarvis ED, Mirarab S, Aberer AJ, Li B, Houde P, Li C, et al. Whole-genome analyses resolve early branches in the tree of life of modern birds. Science. 2014346:1320–31.

Prum RO, Berv JS, Dornburg A, Field DJ, Townsend JP, Lemmon EM, et al. A comprehensive phylogeny of birds (Aves) using targeted next-generation DNA sequencing. Nature. 2015526:569–73.

Bininda-Emonds ORP. The evolution of supertrees. Trends Ecol Evol. 200419:315–22.

Baker WJ, Savolainen V, Asmussen-Lange CB, Chase MW, Dransfield J, Forest F, et al. Complete generic-level phylogenetic analyses of palms (Arecaceae) with comparisons of supertree and supermatrix approaches. Syst Biol. 200958:240–56.

Davies TJ, Kraft NJB, Salamin N, Wolkovich EM. Incompletely resolved phylogenetic trees inflate estimates of phylogenetic conservatism. Ecology. 201193:242–7.

Roquet C, Thuiller W, Lavergne S. Building megaphylogenies for macroecology: taking up the challenge. Ecography. 201336:13–26.

Webb CO, Ackerly DD, Kembel SW. Phylocom: software for the analysis of phylogenetic community structure and trait evolution. Bioinformatics. 200824:2098–100.

Paradis E. Molecular dating of phylogenies by likelihood methods: a comparison of models and a new information criterion. Mol Phylogenet Evol. 201367:436–44.

Münkemüller T, Lavergne S, Bzeznik B, Dray S, Jombart T, Schiffers K, et al. How to measure and test phylogenetic signal. Met Ecol Evol. 20123:743–56.

Pagel M. Inferring the historical patterns of biological evolution. Nature. 1999401:877–84.

Bininda-Emonds ORP, Cardillo M, Jones KE, MacPhee RDE, Beck RMD, Grenyer R, et al. The delayed rise of present-day mammals. Nature. 2007446:507–12.

Pavoine S, Ricotta C. Testing for phylogenetic signal in biological traits: the ubiquity of cross-product statistics. Evolution. 201367:828–40.

Revell LJ. phytools: an R package for phylogenetic comparative biology (and other things). Met Ecol Evol. 20123:217–23.

Letten AD, Cornwell WK. Trees, branches and (square) roots: why evolutionary relatedness is not linearly related to functional distance. Methods Ecol Evol. 20156:439–44.

Pybus OG, Harvey PH. Testing macro–evolutionary models using incomplete molecular phylogenies. P Roy Soc Lond B Bio. 2000267:2267–72.

Mooers AO, Heard SB. Inferring Evolutionary Process from Phylogenetic Tree Shape. Q Rev Biol. 199772:31–54.

R Development Core Team. R: a language and environment for statistical computing. Vienna: R Foundation for Statistical Computing 2015.

Swenson NG. Phylogenetic resolution and quantifying the phylogenetic diversity and dispersion of communities. PLoS One. 20094, e4390.

Kress WJ, Erickson DL, Jones FA, Swenson NG, Perez R, Sanjur O, et al. Plant DNA barcodes and a community phylogeny of a tropical forest dynamics plot in Panama. Proc Natl Acad Sci U S A. 2009106:18621–6.

Pei N, Lian J-Y, Erickson DL, Swenson NG, Kress WJ, Ye W-H, et al. Exploring tree-habitat associations in a Chinese subtropical forest plot using a molecular phylogeny generated from DNA barcode loci. PLoS One. 20116, e21273.

Rangel TF, Colwell RK, Graves GR, Fučíková K, Rahbek C, Diniz-Filho JAF. Phylogenetic uncertainty revisited: Implications for ecological analyses. Evolution. 201569:1301–12.

Kuhn TS, Mooers AØ, Thomas GH. A simple polytomy resolver for dated phylogenies. Met Ecol Evol. 20112:427–36.

Purvis A, Gittleman JL, Luh H-K. Truth or consequences: effects of phylogenetic accuracy on two comparative methods. J Theor Biol. 1994167:293–300.

Molina-Venegas R, Roquet C. Directional biases in phylogenetic structure quantification: a Mediterranean case study. Ecography. 201437:572–80.

Freckleton RP, Harvey PH, Pagel M, Losos AEJB. Phylogenetic analysis and comparative data: a test and review of evidence. Am Nat. 2002160:712–26.

Molina-Venegas R, Aparicio A, Slingsby JA, Lavergne S, Arroyo J. Investigating the evolutionary assembly of a Mediterranean biodiversity hotspot: deep phylogenetic signal in the distribution of eudicots across elevational belts. J Biogeogr. 201542:507–18.

Brunbjerg AK, Borchsenius F, Eiserhardt WL, Ejrnæs R, Svenning J-C. Disturbance drives phylogenetic community structure in coastal dune vegetation. J Veg Sci. 201223:1082–94.

Butterfield BJ, Cavieres LA, Callaway RM, Cook BJ, Kikvidze Z, Lortie CJ, et al. Alpine cushion plants inhibit the loss of phylogenetic diversity in severe environments. Ecol Lett. 201316:478–86.

Lososová Z, Čeplová N, Chytrý M, Tichý L, Danihelka J, Fajmon K, et al. Is phylogenetic diversity a good proxy for functional diversity of plant communities? A case study from urban habitats. J Veg Sci. 201627:1036–46.

Stournaras KE, Lo E, Böhning-Gaese K, Cazetta E, Matthias Dehling D, Schleuning M, et al. How colorful are fruits? Limited color diversity in fleshy fruits on local and global scales. New Phytol. 2013198:617–29.

Wikström N, Savolainen V, Chase MW. Evolution of the angiosperms: calibrating the family tree. P R Soc B. 2001268:2211–20.

Qian H, Zhang J. Using an updated time-calibrated family-level phylogeny of seed plants to test for non-random patterns of life forms across the phylogeny. J Syst Evol. 201452:423–30.

Grafen A. The phylogenetic regression. Philos Trans R Soc Lond B Biol Sci. 1989326:119–57.

Diniz Filho JAF, Rangel TF, Santos T, Bini LM. Exploring patterns of interspecific variation in quantitative traits using sequential phylogenetic eigenvector regressions. Evolution. 201266:1079–90.


Metrics to analyze branch lengths in phylogenetic trees - Biology

Reading trees: A quick review

A phylogeny, or evolutionary tree, represents the evolutionary relationships among a set of organisms or groups of organisms, called taxa (singular: taxon). The tips of the tree represent groups of descendent taxa (often species) and the nodes on the tree represent the common ancestors of those descendants. Two descendents that split from the same node are called sister groups. In the tree below, species A & B are sister groups — they are each other's closest relatives.

Many phylogenies also include an outgroup — a taxon outside the group of interest. All the members of the group of interest are more closely related to each other than they are to the outgroup. Hence, the outgroup stems from the base of the tree. An outgroup can give you a sense of where on the bigger tree of life the main group of organisms falls. It is also useful when constructing evolutionary trees.

For general purposes, not much. This site, along with many biologists, use these terms interchangeably — all of them essentially mean a tree structure that represents the evolutionary relationships within a group of organisms. The context in which the term is used will tell you more details about the representation (e.g., whether the tree's branch lengths represent nothing at all, genetic differences, or time whether the phylogeny represents a reconstructed hypothesis about the history or the organisms or an actual record of that history etc.) However, some biologists do use these words in more specific ways. To some biologists, use of the term "cladogram" emphasizes that the diagram represents a hypothesis about the actual evolutionary history of a group, while "phylogenies" represent true evolutionary history. To other biologists, "cladogram" suggests that the lengths of the branches in the diagram are arbitrary, while in a "phylogeny," the branch lengths indicate the amount of character change. The words "phylogram" and "dendrogram" are also sometimes used to mean the same sort of thing with slight variations. These vocabulary differences are subtle and are not consistently used within the biological community. For our purposes here, the important things to remember are that organisms are related and that we can represent those relationships (and our hypotheses about them) with tree structures.

Evolutionary trees depict clades. A clade is a group of organisms that includes an ancestor and todos descendants of that ancestor. You can think of a clade as a branch on the tree of life. Some examples of clades are shown on the tree below.


Conclusiones

By providing these profiles, PhyDesign facilitates locus prioritization, increasing the efficiency of sequencing for phylogenetic purposes compared to traditional studies with more laborious and low capacity screening methods, as well as increasing the accuracy of phylogenetic studies. Future website implementations will include the latest theoretical advances developed in our research group, expanding the current phylogenetic informativeness methodology to quantify the effects of parallelism and convergence, as well as quantifying the utility of taxon addition [16].


Ver el vídeo: creacion de arboles filogeneticos metodo de maxima parsimonia (Julio 2022).


Comentarios:

  1. Averell

    Esta cualquier urbanizacion



Escribe un mensaje