Tarea 7: Lectura de un artículo de investigación

Tarea 7: Lectura de un artículo de investigación

Información de la Tarea

Estudiante: Andrés Cruz Chipol

Curso: Aprendizaje Automático

Fecha de entrega: 19 de Marzo, 2026

Descripción de la Tarea

Lectura y análisis del artículo de investigación: “A Performance Evaluation of Machine Learning Techniques for Breast Ultrasound Classification” por Francisco A. González-Luna, Juanita Hernández-López y Wilfrido Gomez-Flores. DOI: 10.1109/ICEEE.2019.8884547.


1. ¿Qué características se usaron? ¿Cuántas?

Se extrajeron un total de 137 características morfológicas y de textura de la región de interés de los tumores. Estas características se seleccionaron para describir los parámetros del BI-RADS específico para masas. Se dividieron en cinco categorías:

2. ¿Cómo se realizaron las pruebas?

Los autores implementaron la siguiente metodología:

3. ¿Cómo se realizó la Figura 3?

Se elaboró graficando las curvas ROC resultantes de cada uno de los enfoques de aprendizaje automático. Para construirla, se trazó la Sensibilidad en el eje vertical (eje Y) contra la métrica matemática de 1 - Especificidad en el eje horizontal (eje X). Cada línea en la gráfica ilustra el comportamiento de un clasificador diferente (Ada, KNN, LDA, MLR, RBFN, RF y SVM) al evaluar todas las compensaciones posibles entre la sensibilidad y la especificidad .

4. ¿Para qué sirve la prueba Kruskal-Wallis?

En este estudio, la prueba de Kruskal-Wallis (utilizando un nivel de significancia de $\alpha=0.05$) se utilizó para realizar una comparación estadística del rendimiento de clasificación entre los distintos enfoques de aprendizaje automático. El propósito de aplicar esta prueba fue determinar matemáticamente si las diferencias observadas en el rendimiento de los modelos eran estadísticamente significativas, o si los modelos tuvieron un desempeño similar. Los autores pudieron concluir que el modelo LDA y el SVM tuvieron un rendimiento estadísticamente similar.

5. ¿Qué software se utilizó para realizar los clasificadores?

Para el desarrollo, entrenamiento y evaluación de los modelos, los autores utilizaron un ecosistema basado en MATLAB. La arquitectura del software se centró en el uso de BUSAT (Breast Ultrasound Analysis Toolbox), una herramienta propia diseñada específicamente para el análisis de imágenes de ultrasonido de mama y el desarrollo de sistemas de diagnóstico asistido por computadora (CAD).

Dentro de los 62 algoritmos que conforman BUSAT, se empleó el módulo de clasificación, que cuenta con 16 funciones dedicadas a catalogar tumores utilizando enfoques lineales y no lineales. Específicamente:

6. ¿Tienen ustedes el software para poder replicar los resultados si tuvieses acceso a los datos de los autores?

Sí, utilizando la biblioteca scikit-learn, sería posible replicar la fase de clasificación y evaluación estadística de los resultados. Los equivalentes directos de los clasificadores son:

Solo la RBFN carece de implementación nativa en scikit-learn; puede emularse con RBFSampler o aproximarse mediante SVM (kernel RBF).