Ejercicio 1: Alineamientos de palabras
La evolución molecular y la evolución lingüística comparten muchas características en común; tanto los genes como las palabras evolucionan siguiendo procesos similares: herencia, variación y selección. Estos procesos dan como resultado una gran diversidad de palabras, genes y proteínas, por ejemplo, las diferentes formas de decir hecho en Europa, o las distintas formas de hemoglobina en los humanos. Los genes y las palabras son capaces además de representar la distribución geográfica de las poblaciones humanas: su filogeografía. A lo largo de la historia, los pueblos se han dispersado por el mundo hacia nuevos territorios, como es el caso del Imperio Romano, que se expandió desde la actual Italia hasta ocupar gran parte de Europa. Con las migraciones y establecimiento de poblaciones en distintas regiones, surgieron nuevas variaciones en sus acervos genéticos y en las palabras que utilizaban. La proporción de algunos genes y el uso de algunas nuevas palabras prevalecieron sobre la proporción y el uso de otras, por lo que fueron seleccionados, dando lugar a nuevas lenguas y nuevos acervos genéticos.
Otra característica común entre los genes, las proteínas y las palabras, es que se representan con letras. Nuestro alfabeto contiene 27 letras, el ADN se representa con 4 y la estructura primaria de las proteínas con 20. En las lenguas, se distinguen palabras que por sus similitudes fonéticas y por tener el mismo significado en distintos idiomas, se intuye que tienen un origen común. Estas palabras se denominan cognados y son análogas a los genes o proteínas homólogas. La palabra en castellano hecho conserva el mismo significado que su origen latino factu y es mantenido por el resto de los cognados a través de distintos idiomas europeos. Similarmente, a medida que los seres vivos evolucionan y se diversifican, ciertos genes y proteínas cambian a estructuras distintas que pueden conservar una identidad apreciable y la misma función. Por ejemplo, la secuencia de la insulina en los mamíferos es muy similar entre especies y tienen la misma función.
Los cambios que se producen en las secuencias de nucleótidos de los genes a través de la evolución son los mismos que se producen durante la evolución de las palabras, y pueden ser de tres tipos: Inserciones (incorporaciones de nucleótidos/aminoácidos/letras a la secuencia original), deleciones (pérdida de nucleótidos/aminoácidos/letras) y sustituciones (cambio de nucleótidos/aminoácidos/letras por otras). Observemos con detenimiento la siguiente tabla con 10 cognados de la palabra hecho. La evolución de factum (latín culto) a factu (latín vulgar) es un ejemplo de deleción, mientras que el cambio de factu a facto (romance) muestra una sustitución.
Conociendo la distancia proporcional podemos construir el árbol filogenético a través del método neighbor joining o unión de vecinos. Primero buscamos los vecinos más próximos, es decir, el par de palabras que posean la distancia proporcional más pequeña y se las conecta con dos ramas que se unen en un nudo, el cual representa al ancestro común de ambas. Tomamos la siguiente palabra más cercana a nuestra pareja de palabras, contamos las diferencias, calculamos el promedio de diferencias y luego la distancia proporcional. Seguimos este procedimiento con todas las palabras que vayan a conformar el árbol filogenético.
Referencia:
Marcos-Merino, José; Gallego, Rocío; Ochoa de Alda, Jesús. (2017). Introducción de la evolución molecular a través de una analogía lingüística. Libro de resúmenes: "II Workshop Estudiar Ciencias. Creando vocaciones científicas" ISSN: 2530-4925
Vamos a construir un árbol filogenético con los siguientes
5 cognados: Hecho, fecho, feito, fact y factum. Llena la tabla adjunta y completa el árbol presentado en la
Figura 6.1.
Figura 1. Completa el árbol filogenético de los 5 cognados de hecho.
Figura 2. Filogeografía de los cognados. Sitúa las palabras de los 5 cognados de hecho en el mapa
Marcos-Merino, José; Gallego, Rocío; Ochoa de Alda, Jesús. (2017). Introducción de la evolución molecular a través de una analogía lingüística. Libro de resúmenes: "II Workshop Estudiar Ciencias. Creando vocaciones científicas" ISSN: 2530-4925
Ejercicio 2: La filogeografía es un criterio para definir un orígen común, funciona tanto para palabras como genes. Las palabas y los genes tienen un origen común y un espacio común que comparten. La palabra dos del castellano tiene su origen en una palabra indoeuropea. Esta palabra es común para todas la lenguas que proceden del indoeuropeo. Con este ejercicio se pretende subrayar el que las palabras comunes también tienen una distribución geográfica común. Con los genes ocurre exactamente lo mismo.
¿Podrías situar la palabra dos en sus versiones germánica, eslava, celta, y latina en el mapa de abajo?
Ejercicio tres. Métodos de distancias. Si tomamos como punto de partida Guayaquil podemos conectarnos con todas las ciudades del Ecuador. Habrá ciudades que estén más cerca que otras. Las que están más cerca tienen, obviamente, menos Km que las que están más lejos. Con las secuencias genéticas pasa lo mismo. Aquellas que tienen menos cambios con la secuencia que queremos comparar serán las que están más próximas en el árbol genealógico.
El orden se crea en relación a un punto de partida, que en este caso es Guayaquil. El total del viaje hasta la frontera con Colombia en Ipiales es de 674 km. Por lo tanto, si estás en Babahoyo habrás recorrido 83/674 km = 0.12, es decir, habrás hecho el 12% del trayecto. Si estás en Ibarra habrás recorrido 535/674 = 0.79, es decir el 79%.
Ejercicio 3. Árbol filogenético de tres monos emparentados.
Ahora vamos a ver un ejemplo genético. En filogenética, la distancia evolutiva no es una distancia métrica matemáticamente hablando, la distancia evolutiva es una magnitud que mide la separación entre secuencias. Por ejemplo, tenemos tres tipos de monos ecuatorianos: A Mono capuchino de la Costa (Cebus aequatorialis); B Mono araña de la Costa (Ateles fusciceps) y C Capuchino de cabeza blanca (Cebus capucinus).
Cebus aequatorialis A: AGGCATCAGTAGCTCTGAAACACGCCCGCGATTCGTCGAACTGTC
Ateles fusciceps B: ACGCATCACTAGCTCTGCTACACGCGCGCGAATCGTCGTACTGAC
Cebus capucinus C: ATGCATCAGTAGCTCTGGAACACGCCCGCGATTCGTCGAACTGAC
Lo más normal es que los dos monos capuchinos estén emparentados y el árbol más probable sea ii. Sin embargo, a pesar de lo aparente debemos de dar un argumento genético.
Secuencia A: AGGCATCAGTAGCTCTGAAACACGCCCGCGATTCGTCGAACTGTC
Secuencia B: ACGCATCACTAGCTCTGCTACACGCGCGCGAATCGTCGTACTGAC
Secuencia B: ACGCATCACTAGCTCTGCTACACGCGCGCGAATCGTCGTACTGAC
Secuencia C: ATGCATCAGTAGCTCTGGAACACGCCCGCGATTCGTCGAACTGAC
Secuencia A: AGGCATCAGTAGCTCTGAAACACGCCCGCGATTCGTCGAACTGTC
Secuencia C: ATGCATCAGTAGCTCTGGAACACGCCCGCGATTCGTCGAACTGAC
Podemos establecer que la distancia entre...
Distancia A-B: 8
Distancia B-C: 7
Distancia A-C: 3
Ahora bien, debemos de referir esa distancia a la secuencia de que partimos, la secuencia de 45 nt. ¿Por qué? pongo un ejemplo. Estamos viendo diferencias entre palabras. Imaginemos dos escenarios, A y B:
A Elarzobispodeconstantinopla
Elarzobispodemonstantinopla
Entre las dos palabras hay una diferencia
B Hecho
Fecho
Entre las dos palabras solo hay una diferencia también.
¿Es el mismo caso? No porque en el caso A es 1/27 = 0.03 y en el caso B 1/6 = 0.17
Por lo tanto, en nuestro ejercicio tenemos que poner las distancias relativas a los 45 nt que tiene la secuencia.
Distancia relativa A-B: 8/45 = 0.17
Distancia relativa B-C: 7/45 = 0.15
Distancia relativa A-C: 3/45 = 0.06
Basándonos en estas distancias deducimos que los monos capuchinos son las especies más cercanas y formarían un grupo ("Cerezas" se le llama en la jerga genética porque parecen dos cerezas unidas por sus rabitos), mientras que el mono araña es el más alejado.
La distancia entre A y C es de 0.06, la distancia al nodo común, al ancestro común de los capuchinos es de 0.03. Vamos a calcular la rama hasta que encontremos el nodo correspondiente al ancestro común de los tres monos:
(Distancia A-B + distancia B-C)/2 = (8+7)/2=7.5. 7.5 Cambios en 45
7.5/45= 0.17. Por lo tanto, la distancia del mono araña hasta el común ancestro es de 0.08
Para saber más:
Una vez que se ha establecido un modelo de evolución, la distancia filogenética entre dos secuencias se define como la cantidad que estima el máximo de verosimilitud de la cantidad de cambios acumulados entre las dos secuencias durante la evolución. Por ejemplo, para el modelo evolutivo más sencillo, el denominado modelo de Jukes-Cantor, el número de cambios esperados entre dos secuencias de ADN es
-3/4 * ln(1-4p/3) si p es la fracción de nucleótidos distintos entre las dos secuencias. Esa cantidad se llama distancia de Jukes-Cantor.
Distancia Jukes-Cantor A-B: -3/4 * ln((1-4*8)/3, pero esto queda para un curso más avanzado.
Publicar un comentario