viernes, 2 de diciembre de 2011

Genética y Datos

Como aficionado a la lectura, uno de los géneros que más me gusta es la divulgación científica. Y dentro de ésta, siempre me ha gustado especialmente lo relacionado con las ciencias físicas, sobre todo el estudio de la evolución del Universo. Pero hace como unos ocho años empecé a leer divulgación científica acerca de la  genética y la verdad es que me enganchó.

Mi trabajo se desarrolla dentro del ambito de las telecomunicaciones, y estoy muy familiarizado con muchos  de los protocolos que se utilizan para la transmisión de datos. Por eso una de las cosas que más me llamó la atención fue la relación entre mi especialidad y la genética.

Para entenderlo voy a exponer un pequeño resumen acerca de en que consiste la genética. No hay que ser un lince para adivinar que de lo que se ocupa es del estudio de los genes, pero para los no iniciados,   vamos para casi todo el mundo, la pregunta clave es ¿para que demonios sirven los genes y cómo funcionan? Para ello lo primero que te hay que tener claro es que las mayoría de las funciones a nivel básico de los seres vivos son llevadas a cabo por las proteínas, funciones como transportar el oxigeno a las células,  funciones defensivas, regulación de reacciones químicas en el organismo y otras, que son indispensables para mantener a un organismo vivo y en continuo desarrollo.

Por tanto nuestro cuerpo tiene que producir las proteínas que necesita. ¿Y como sabe como construir éstas? Pues para eso dispone de una especie de libro de instrucciones, que es lo que son los genes, ya que cada uno de ellos especifica la secuencia exacta, en el orden exacto de aminoácidos que debe tener una proteína dada. Resumiendo, que las proteínas son un conjunto de aminoácidos, que serían como los ladrillos que hay que poner uno sobre otro hasta completarla, y cada proteína tiene un gen que describe que aminoácidos hay que ensamblar y en que orden para formarla.

¿Y cómo es capaz un gen de describir que aminoácido le toca seleccionar en cada momento? Pues para eso hay que entender de que están compuestos los genes. Estos son una cadena de bases nitrogenadas (hasta aquí voy a llegar, no voy a explicar que narices es una base de éstas porque ni yo lo entiendo bien del todo).

Se utilizan cuatro de estas bases denominadas Adenina (A), Timina (T), Guanina (G) y Citosina (C). El número de bases que conforman un gen es múltiplo de 3, de forma que cada 3 bases identifica a un aminoácido o algún mensaje especial. A cada una de estas secuencias de 3 bases se les llama triplete o codón. Con estas 4 bases tomadas de 3 en 3 y pudiendo repetirse una misma base dentro de la secuencia, como "Calculín" que soy o mejor dicho que algunos me llaman, sería variaciones con repetición de 4 elementos (bases) tomados de 3 en 3. Es decir 4 elevado a 3 que da 64 combinaciones posibles. Lo que esto quiere decir es que con estas 4 bases agrupándolas de esta forma se podrían identificar hasta 64 aminoácidos distintos. Pero no hace falta tantos, ya que por ejemplo el ser humano únicamente requiere de 20 aminoácidos ser viable. Las combinaciones sobrantes o no se usan, o se usan para codificar alguna señal especial, o hay casos en los que un mismo aminoácido se puede codificar con varios codones distintos.

Después de todo este rollo lo que tiene que quedar claro es que un gen es un conjunto de bases, que cada 3 bases indica un aminoácido a seleccionar, y que con la suma de los aminoácidos que codifica el gen consigue que se ensamble una proteína. Aunque esto de por si no es suficiente en todos los casos para que la proteína sea funcional, ya que muchas veces requieren de la asistencia de otras proteínas que mientras es producida en la célula la ayuden a plegarse a la configuración correcta.

Hasta aquí la primera similitud entre genética y datos estaría entre el termino codón y el byte, ya que éste último codificaría una sería de unidades mínimas de información que una vez ensambladas conformaría un mensaje que sería el equivalente a la proteína. El propio byte esta formado por unidades mínimas de información llamadas bits, que serían equivalentes a las bases nitrogenadas. La diferencia sería que mientras que un codón tiene 3 bases, el byte está formado por 8 bits, y que cada base puede tomar 4 valores distintos (A, T, G, C), mientras que el bit sólo puede tomar 2 valores distintos (0, 1).

¿Y donde residen los genes? Pues en los cromosomas que son unas cadenas enormes (millones) de dichas bases nitrogenadas. Y sólo un porcentaje realmente pequeño de estas bases son genes. El resto se supone que es ADN basura, aunque investigaciones recientes apuntan a que algunas partes de esta "basura" puede que no lo sea tanto y tenga algún tipo de función, como por ejemplo en el control de la actividad de algunos genes. ¿Y cómo se determina que parte del cromosoma es un gen y que parte no? Pues aquí es donde encuentro otra similitud con el mundo de los datos, en concreto con la transmisión de datos. En una línea de datos todo el tiempo se está transmitiendo una señal, pero no toda la señal son datos útiles. Cuando se tiene que transmitir una información útil, esta se empaqueta en fragmentos más pequeños, y la forma de saber dentro de toda la señal donde empieza uno de estos "paquetes", sería por una cadena especial de bits que indica cuando comienza éste, y otra que indica cuando acaba. Con los genes ocurre algo similar, los codones que los conforman no sólo codifican aminoácidos, sino que al haber combinaciones de sobra para los 20 aminoácidos que se necesita codificar, se reservan algunas de las combinaciones libres tanto para identificar el comienzo de un gen, como su finalización.


Podría seguir describiendo alguna otra similitud que he encontrado entre estas dos materias, como por ejemplo el Checksum que se utiliza en los datos, para comprobar que un paquete no se haya modificado por error durante el proceso de copia, que es equivalente a algunas de las estrategias que utiliza la genética para evitar errores en la duplicación de los cromosomas.

Pero si has llegado hasta aquí, esto sólo es posible si te has sentido ligeramente interesado por lo que he contado, así que lo mejor sería que trataras de descubrirlo por ti mismo empezando a leer algo acerca de la genética. Uno de los libros que recomiendo para cualquiera que quiera iniciarse en este mundo se llama Genoma de Matt Ridley. En el viene bastante bien explicado en 23 capítulos (uno por cada uno de los 23 pares de cromosomas que conforman el genoma humano) usando el autor como hilo conductor, las funciones de un gen dado por cada uno de los cromosomas/capítulos.

Pero el autor habilmente no se limita a estos genes, sino que aborda otros muchos temas según puedan interesar en un momento determinado del desarrollo del libro, como puede ser la clonación, la relación entre el cáncer y las mutaciones genéticas, genética forense, etc.

Si después de leer éste libro gustara tanto que quisierais profundizar más en esta materia, a mi me fue bastante útil un libro de texto que se utiliza en algunas universidades, para introducir a los estudiantes en la genética, llamado Conceptos de Genética de Willian S. Klug y Michael R. Cummings.

Aunque mucho más complejo (y completo) que el anterior, la verdad es que se me hizo bastante llevadera su lectura para el pedazo tocho del que se trata, y al ser un libro de introducción para estudiantes bastante bien escrito, la curva de aprendizaje está muy bien lograda, empezando por los conceptos más simples para seguir aumentando poco a poco en complejidad según se van afianzando conceptos. Aún así muchas partes hay que releearlas una y otra vez para sino entenderlas, al menos hacerse una idea de lo que están contando. Eso si como buen libro de texto universitario que se precie, el precio es desorbitado. En su momento me salió por 70 euros, y fue hace unos cuantos años cuando iban por la 5ª edición, y ahora van por la 8ª, por lo que es de esperar que actualmente sea aún más caro.

La verdad es que es fascinante (como diría el Punset), como la naturaleza por un lado, y los científicos e ingenieros por otro, al enfrentarse a desafíos similares  en dos ámbitos totalmente distintos, han acabado desarrollando por separado mecanismos muy parecidos para resolver dichos desafíos.









6 comentarios:

Carmelo Santos dijo...

Carlos me ha encantado lo bien explicado que está y lo fácil que has echo que se entienda. Me ha sabido a poco.

Calvarez dijo...

Muchas gracias Carmelo. Estoy elaborando alguno más sobre genética, así que en cuanto lo tenga listo te aviso.

DavidB dijo...

Muy interesante, y además en un texto breve (y ameno y... hala, ya no te echo más flores ;-) ) estás dando pie de refilón a cuestiones más trascendentales, que a mí personalmente me suelen "tirar" bastante, porque... ¿de donde viene tal parecido en ambas mecánicas (genética/telecomunicaciones)? ¿Estamos los seres humanos copiando constantemente a la naturaleza en nuestra ciencia? Y, si no es así, ¿será más bien que los procesos mentales que han construido uno y otro han sido similares? ¿Hay sólo "una forma de hacer las cosas"? etc, etc...

Calvarez dijo...

Pues si, eso fue lo que me llamo la atención, sobre todo teniendo en cuenta que estoy seguro de que los que desarrollaron los primeros protocolos para transferencias de datos no tendrían conocimiento alguno de las investigaciones en el campo de la genética.

Paula dijo...

Has logrado presentar en forma de un buen glosario cada concepto a medida que fue necesario, lo veo muy enriquecedor.
Por curiosidad, ¿en tu especialización de telecomunicaciones trabajas con los llamados "algoritmos genéticos"?
Saludos desde Argentina, Paula

Calvarez dijo...

Gracias Paula, me alegro de que te haya gustado la entrada. En mi trabajo no he tenido ocasión de trabajar con los algoritmos genéticos. Si trabajara diseñando redes a lo mejor si que me podrían ser de utilidad, pero me dedico a Troubleshooting de redes ya en producción, y en ese campo no se me ocurre que estos algoritmos puedan ser aplicados.