Seminario de doctorado

Resumen

En los últimos años diferentes áreas del conocimiento (Química, Biología, Economía, etc.) han incrementado notablemente la necesidad de contar con plataformas de altas prestaciones que les permitan dar solución a problemas que involucran el procesamiento de grandes cantidades de datos y/o un alto número de operaciones. Esta situación ha propiciado el desarrollo del Cómputo Paralelo, cuyo objetivo consiste en la división de un problema cualquiera en un número arbitrario de subproblemas, los cuales pueden resolverse simultáneamente por diferentes procesadores.

Aún cuando los problemas del mundo real que se modelan computacionalmente son inherentemente paralelos, las soluciones que se presentan se obtienen mediante programación secuencial. El interés de los científicos por la adaptación de código mediante el uso de técnicas de paralelización deriva del deseo de mejorar el desempeño de algoritmos secuenciales, tomando ventaja del poder computacional que los sistemas paralelos proveen, es por esto que, tienden a incorporar procesamiento paralelo después de probar y revisar sus aplicaciones en un ambiente secuencial.

La rápida evolución del hardware de altas prestaciones y la demanda permanente por un mayor rendimiento computacional en áreas como la Minería de Datos, cuyo objetivo es apoyar en la toma de decisiones a partir de la extracción de conocimiento proveniente de una base de datos y cuyas principales tareas poseen la ventaja de su fácil aplicación a cualquier área del conocimiento tal como la Bioinformática, ha contribuido al uso de técnicas de paralelización que faciliten el manejo de la información proveniente de distintas fuentes, así como la realización de cálculos complejos. El uso de Programación Paralela representa una labor sumamente compleja.

En teoría, el uso de adaptación de código se basa en aplicar múltiples procesadores para dar solución a un problema. En la práctica, la Programación Paralela tiene un alto costo, no solo por el valor de la plataforma de hardware que involucra, sino que además requiere un mayor esfuerzo por parte del científico, el cual debe ser un programador experto, quien debe entender el problema y además contar con amplios conocimientos de arquitectura de computadoras para así, lograr una buena relación entre el software implementado y la arquitectura destino (hardware).

Las capacidades de cómputo de los sistemas cambian frecuentemente debido al abaratamiento y su rápida evolución, esta variabilidad influye notablemente en las prestaciones del software de Cómputo Paralelo con el que se cuenta. Lo anterior genera una necesidad por el desarrollo de metodologías y técnicas con capacidad de auto-adaptación de código, es decir, software adaptativo que sea capaz de conseguir que el código previamente paralelizado, pueda ser usado en un entorno ajeno al de su diseño original sin reducir las prestaciones iniciales.

El objetivo primordial de este trabajo se situará en el marco de la adaptación de código con el propósito de optimizar el tiempo de ejecución por medio del estudio y aplicación de técnicas paralelas auto-adaptables a las características del sistema paralelo donde se ejecutan, en particular de algoritmos de Minería de Datos enfocados a la solución de problemas bioinformáticos. La optimización del tiempo se hará de una manera cercana a la óptima. Tal implementación proporcionará a los usuarios rutinas capaces de ejecutarse eficientemente en el sistema donde se esté trabajando, independientemente de las características del sistema y de los conocimientos que sobre Cómputo Paralelo se tengan.

Mi dibujo

Mi dibujo representa dos situaciones, en la primera existe un científico agotado que ha analizado una gran cantidad de información biológica; en la segunda se representa un científico que tiene una maquina mágica que le permite analizar una gran cantidad de información de manera casí automática aprovechando todos los recursos. En este sentido, mi dibujo trata de representar el análisis de grandes cantidades de datos mediante una caja negra (nuestra propuesta) que representa la automatización de algoritmos de Minería de Datos para la optimización de recursos en el análisis de información biológica.

Tema musical

Tema musical: Harder better faster stronger
Artista: Daft Punk
Fecha de lanzamiento: 2001

Elegí esta canción debido a que desde el título se representan las cualidades básicas que tiene nuestra contribución y el proceso de investigación que estamos desarrollando. En este sentido, se busca que los algoritmos de Minería de Datos sean eficaces (better) y eficientes (faster) con respecto a la arquitectura destino. Además, en la letra de la canción solamente se encuentran las palabras: Work It, Make It, Do It, Make Us, Harder, Better, Faster, Stronger, More Than, Hour, Our, Never, Ever, After y Work is over, palabras que relacione con el trabajo que se hace día a día para cumplir con nuestro objetivo.

Como dato curioso, esta canción fué utilizada en la película "Interstella 5555" la cual trata sobre una banda de extraterrestres secuestrados que son convertidos en humanos mediante una máquina que modifica su aspecto físico para poder ser llevados al planeta tierra. De forma homóloga, nuestra propuesta de solución se basa en la modificación de los algoritmos básicos de Minería de Datos (extraterrestres) a algoritmos auto-adaptados (humanos) mediante una caja negra (nuestra propuesta) que sustituye secciones de código secuencial altamente paralelizable (aspecto físico) en código previamente paralelizado para una arquitectura destino (planeta tierra). Finalmente, el nombre completo de la película es "Interstella 55555: The 5yory of the 5ecret 5tar 5ystem", lo cual puede hacer referencia a la principal aplicación de nuestros algorítmos en Bioinformática cuyo objetivo es tratar de delucidar el dogma central de la Biología Molecular (The story of the secret star system).

Finalmente, esta canción es de uno de mis artístas favoritos.

Memes

Premio nobel

Premio nobel: Martin Karpluz
Tema: Modelos multiescala de complejos sistemas químicos.

Elegí la entrevista al Dr. Karpluz debido a que su trabajo permitió que se empezaran a utilizar programas informáticos en el entendimiento de los procesos químicos y biológicos. En particular, el objetivo principal de los sistemas computacionales que propusieron Karpluz et al. es la simulación del comportamiento de las reacciones químicas, las cuales se producen en fracciones de microsegundos, eliminando así, la necesidad de hacer experimentos clásicos de laboratorios que además de ser laboriosos son muy costosos. Además, el uso de este tipo de software permite la posibilidad de plantear un proceso químico-biológico y comprobar rápidamente los diferentes resultado para resolver hipótesis y hacer predicciones de manera rápida.

La motivación para la elección de este premio Nobel es su interés por el desarrollo de software eficiente que permita modelar computacionalmente sistemas biológico-químicos con el objetivo de reducir recursos económicos y humanos. Tema estrechamente ligado con mi investigación.

Lo que me gustó. La manera en que explica el tema de investigación. Es sorprendente como se realiza el transporte intracelular, y hasta antes de que Karpluz et al. estabecieran los sistemas informáticos como una herramienta escencial para el análisis y estudio de procesos químico-biológicos solo se podían tener imágenes planas las cinecinas realizaban este proceso.

Lo que me sorprendió. La forma en que se convirtió en un científico y la manera en que define la creatividad. "Para ser creativo debes indagar en algo que no entiendes, de manera contraria se convierte en un tema aburrido y no interesante".

Lo que me motivó. "Antes los químicos creaban modelos de moléculas recurriendo a bolas de plástico y bastones. Hoy, el modelado de reacciones y sistemas biológicos se realiza por computadora". Realmente me motivó que su investigación no solo fué un trabajo teórico, destinado a permanecer en una biblioteca, sino que permitió el análisis de sistemas biológico-químicos.

Entrevista

Entrevistado: Luís Martín Sánchez-Adame
Tema: Human-Computer interaction, user interface design, user experience and, social media.
Página Web: computacion.cs.cinvestav.mx/~lmsanchez

About my research

La divulgación científica, ¡Una pasión, un reto, un arte, ..., una actividad incomprendida!

La presentación del video que describe nuestra linea de investigación quiero comenzarla con un breve relato.
Hace unos años, cuando aún no decidía estudiar un doctorado y estaba en un día de campo con mi familia, me llamo la atención la manera en que mi sobrino de seis años desarrollo el método científico: el observaba como en el río flotaban algunas ramas y hojas de los árboles. Enseguida él le explico a su mamá que algunos objetos flotaban en el agua por que pesaban muy poco y otros se hundían por que pesaban mucho y comenzo a realizar experimentos: lanzó una rama de un árbol y vio que flotaba, después lo hizo con hojas y piedras. El experimento paso por muchas variantes, hasta que se acerco a su mamá nuevamente y le dijo: "Si la hoja pesa muy poco casi nada, entonces flota. Si pongo una hoja y encima una piedra que pesa mucho, entonces esta se hundirá". Finalmente, mi sobrino comenzó a enseñarle a su mamá que siempre sucedía eso. Ella le explico que efectivamente los objetos flotaban o se hundían con base a su peso.

En particular, todos comenzamos a desarrollar el método científico desde que somos pequeños. Así aprendimos desde andar en bicicleta hasta manejar un automovil, y en general todas estas actividades hacian que nos sintieramos emocionados. En efecto, "El cerebro necesita emocionarse para aprender", sin embargo, ¿cómo explicas un tema a alguien con el objetivo de que se interese, e incluso poder crear una inspiración para seguir investigando? En este sentido, ¿cómo le explicas a un niño de seis años que es la fuerza de empuje y la densidad de los objetos?

La transmisión de estos conocimientos no es una tarea sencilla, tiene retos y dificultades. El éxito de interesar a alguién a que haga ciencia, en este caso a un niño de seis años, dependerá en gran medida de la calidad de la respuesta que obtenga. El seminario de doctorado me ayudo a entender que es importante saber explicar de manera divulgativa la ciencia que desarrollamos para poder acercar a las personas. Me ha quedado claro que divulgar ciencia es un arte que todos los que están en esta área deberían cultivar, no sólo por gusto sino por obligación, por que es una forma de retribuir a la sociedad lo que ha invertido en nuestra educación e investigación, a traves de las becas y los financiamientos que recibimos.

Termino con la idea de que si algún día puedo inspirar a un niño a hacer ciencia, mi misión estaría cumplida, debido a que habría contribuido a mantener su creatividad y curiosidad activa por siempre.

Let’s Do Some Work Together!