jueves, 29 de septiembre de 2022

Alineamientos de palabras con un origen común

 Ejercicio 1: Alineamientos de palabras

La evolución molecular y la evolución lingüística comparten muchas características en común; tanto los genes como las palabras evolucionan siguiendo procesos similares: herencia, variación y selección. Estos procesos dan como resultado una gran diversidad de palabras, genes y proteínas, por ejemplo, las diferentes formas de decir hecho en Europa, o las distintas formas de hemoglobina en los humanos. Los genes y las palabras son capaces además de representar la distribución geográfica de las poblaciones humanas: su filogeografía. A lo largo de la historia, los pueblos se han dispersado por el mundo hacia nuevos territorios, como es el caso del Imperio Romano, que se expandió desde la actual Italia hasta ocupar gran parte de Europa. Con las migraciones y establecimiento de poblaciones en distintas regiones, surgieron nuevas variaciones en sus acervos genéticos y en las palabras que utilizaban. La proporción de algunos genes y el uso de algunas nuevas palabras prevalecieron sobre la proporción y el uso de otras, por lo que fueron seleccionados, dando lugar a nuevas lenguas y nuevos acervos genéticos.

Otra característica común entre los genes, las proteínas y las palabras, es que se representan con letras. Nuestro alfabeto contiene 27 letras, el ADN se representa con 4 y la estructura primaria de las proteínas con 20. En las lenguas, se distinguen palabras que por sus similitudes fonéticas y por tener el mismo significado en distintos idiomas, se intuye que tienen un origen común. Estas palabras se denominan cognados y son análogas a los genes o proteínas homólogas. La palabra en castellano hecho conserva el mismo significado que su origen latino factu y es mantenido por el resto de los cognados a través de distintos idiomas europeos. Similarmente, a medida que los seres vivos evolucionan y se diversifican, ciertos genes y proteínas cambian a estructuras distintas que pueden conservar una identidad apreciable y la misma función. Por ejemplo, la secuencia de la insulina en los mamíferos es muy similar entre especies y tienen la misma función.

Los cambios que se producen en las secuencias de nucleótidos de los genes a través de la evolución son los mismos que se producen durante la evolución de las palabras, y pueden ser de tres tipos: Inserciones (incorporaciones de nucleótidos/aminoácidos/letras a la secuencia original), deleciones (pérdida de nucleótidos/aminoácidos/letras) y sustituciones (cambio de nucleótidos/aminoácidos/letras por otras). Observemos con detenimiento la siguiente tabla con 10 cognados de la palabra hecho. La evolución de factum (latín culto) a factu (latín vulgar) es un ejemplo de deleción, mientras que el cambio de factu a facto (romance) muestra una sustitución.

El alineamiento de secuencias nos permite comparar dos o más secuencias de nucleótidos o aminoácidos para determinar las similitudes entre ellas. Para este ejercicio, realiza un alineamiento de los cognados de hecho, cuenta las diferencias puntuales (letras distintas) en cada par de palabras y llena la tabla adjunta.

Ahora calcula la distancia proporcional entre cada par de palabras y anótalo en la Tabla 6.3. La distancia proporcional entre dos secuencias (o palabras en este caso) se refiere al número de diferencias puntuales entre dos secuencias dividido para el número total de caracteres de la secuencia (número de nucleótidos/letras de la secuencia o palabra más larga).

Conociendo la distancia proporcional podemos construir el árbol filogenético a través del método neighbor joining o unión de vecinos. Primero buscamos los vecinos más próximos, es decir, el par de palabras que posean la distancia proporcional más pequeña y se las conecta con dos ramas que se unen en un nudo, el cual representa al ancestro común de ambas. Tomamos la siguiente palabra más cercana a nuestra pareja de palabras, contamos las diferencias, calculamos el promedio de diferencias y luego la distancia proporcional. Seguimos este procedimiento con todas las palabras que vayan a conformar el árbol filogenético.

Vamos a construir un árbol filogenético con los siguientes 5 cognados: Hecho, fecho, feito, fact y factum. Llena la tabla adjunta y completa el árbol presentado en la Figura 6.1.

 

Figura 1. Completa el árbol filogenético de los 5 cognados de hecho.

Figura 2. Filogeografía de los cognados. Sitúa las palabras de los 5 cognados de hecho en el mapa


Referencia:
Marcos-Merino, José; Gallego, Rocío; Ochoa de Alda, Jesús. (2017). Introducción de la evolución molecular a través de una analogía lingüística. Libro de resúmenes: "II Workshop Estudiar Ciencias. Creando vocaciones científicas" ISSN: 2530-4925

Ejercicio 2: La filogeografía es un criterio para definir un orígen común,  funciona tanto para palabras como genes. Las palabas y los genes tienen un origen común y un espacio común que comparten.  La palabra dos del castellano tiene su origen en una palabra indoeuropea. Esta palabra es común para todas la lenguas que proceden del indoeuropeo. Con este ejercicio se pretende subrayar el que las palabras comunes también tienen una distribución geográfica común. Con los genes ocurre exactamente lo mismo.




Existe una hipótesis, la teoría del del lenguaje de Sapir-Whorf, que dice que las lenguas configuran la manera como vemos el mundo. 


¿Podrías situar la palabra dos en sus versiones germánica, eslava, celta, y latina en el mapa de abajo?


Ejercicio tres. Métodos de distancias. Si tomamos como punto de partida Guayaquil podemos conectarnos con todas las ciudades del Ecuador. Habrá ciudades que estén más cerca que otras. Las que están más cerca tienen, obviamente, menos Km que las que están más lejos. Con las secuencias genéticas pasa lo mismo. Aquellas que tienen menos cambios con la secuencia que queremos comparar serán las que están más próximas en el árbol genealógico.

Por ejemplo, si quiero que se ordene las ciudades que se conectan a Guayaquil en la vía a Colombia quedaría así:

El orden se crea en relación a un punto de partida, que en este caso es Guayaquil. El total del viaje hasta la frontera con Colombia en Ipiales es de 674 km. Por lo tanto, si estás en Babahoyo habrás recorrido 83/674 km = 0.12, es decir, habrás hecho el 12% del trayecto. Si estás en Ibarra habrás recorrido 535/674 = 0.79, es decir el 79%.

¿Cuál sería el orden de las ciudades de Guayaquil a Perú?

Ejercicio 3. Árbol filogenético de tres monos emparentados. 

Ahora vamos a ver un ejemplo genético. En filogenética, la distancia evolutiva no es una distancia métrica matemáticamente hablando, la distancia evolutiva es una magnitud que mide la separación entre secuencias. Por ejemplo, tenemos tres tipos de monos ecuatorianos: A Mono capuchino de la Costa (Cebus aequatorialis); B Mono araña de la Costa (Ateles fusciceps) y C Capuchino de cabeza blanca (Cebus capucinus). 

Cebus aequatorialis A: AGGCATCAGTAGCTCTGAAACACGCCCGCGATTCGTCGAACTGTC
Ateles fusciceps B:    ACGCATCACTAGCTCTGCTACACGCGCGCGAATCGTCGTACTGAC
Cebus capucinus C:     ATGCATCAGTAGCTCTGGAACACGCCCGCGATTCGTCGAACTGAC

Como podemos ver, existen tres posibilidades de que estos tres monos estén relacionados:

Lo más normal es que los dos monos capuchinos estén emparentados y el árbol más probable sea ii. Sin embargo, a pesar de lo aparente debemos de dar un argumento genético. 

SOLUCIÓN: Si consideramos las tres secuencias podemos establecer que la distancia entre ellas

Secuencia A: AGGCATCAGTAGCTCTGAAACACGCCCGCGATTCGTCGAACTGTC
Secuencia B: ACGCATCACTAGCTCTGCTACACGCGCGCGAATCGTCGTACTGAC

Secuencia B: ACGCATCACTAGCTCTGCTACACGCGCGCGAATCGTCGTACTGAC
Secuencia C: ATGCATCAGTAGCTCTGGAACACGCCCGCGATTCGTCGAACTGAC

Secuencia A: AGGCATCAGTAGCTCTGAAACACGCCCGCGATTCGTCGAACTGTC
Secuencia C: ATGCATCAGTAGCTCTGGAACACGCCCGCGATTCGTCGAACTGAC

Podemos establecer que la distancia entre... 

 Distancia A-B: 8
 Distancia B-C: 7
 Distancia A-C: 3

Ahora bien, debemos de referir esa distancia a la secuencia de que partimos, la secuencia de 45 nt. ¿Por qué? pongo un ejemplo. Estamos viendo diferencias entre palabras. Imaginemos dos escenarios, A y B: 

A Elarzobispodeconstantinopla
  Elarzobispodemonstantinopla

Entre las dos palabras hay una diferencia

B Hecho
  Fecho

Entre las dos palabras solo hay una diferencia también. 

¿Es el mismo caso? No porque en el caso A es 1/27 = 0.03 y en el caso B 1/6 = 0.17

Por lo tanto, en nuestro ejercicio tenemos que poner las distancias relativas a los 45 nt que tiene la secuencia.

 Distancia relativa A-B: 8/45 = 0.17
 Distancia relativa B-C: 7/45 = 0.15
 Distancia relativa A-C: 3/45 = 0.06

Basándonos en estas distancias deducimos que los monos capuchinos son las especies más cercanas y formarían un grupo ("Cerezas" se le llama en la jerga genética porque parecen dos cerezas unidas por sus rabitos), mientras que el mono araña es el más alejado.

La distancia entre A y C es de 0.06, la distancia al nodo común, al ancestro común de los capuchinos es de 0.03. Vamos a calcular la rama hasta que encontremos el nodo correspondiente al ancestro común de los tres monos:

(Distancia A-B + distancia B-C)/2 = (8+7)/2=7.5. 7.5 Cambios en 45 
7.5/45= 0.17. Por lo tanto, la distancia del mono araña hasta el común ancestro es de 0.08


Para saber más:

Una vez que se ha establecido un modelo de evolución, la distancia filogenética entre dos secuencias se define como la cantidad que estima el máximo de verosimilitud de la cantidad de cambios acumulados entre las dos secuencias durante la evolución. Por ejemplo, para el modelo evolutivo más sencillo, el denominado modelo de Jukes-Cantor, el número de cambios esperados entre dos secuencias de ADN es 

-3/4 * ln(1-4p/3) si p es la fracción de nucleótidos distintos entre las dos secuencias. Esa cantidad se llama distancia de Jukes-Cantor.

Distancia Jukes-Cantor A-B: -3/4 * ln((1-4*8)/3, pero esto queda para un curso más avanzado.

No hay comentarios:

Publicar un comentario