¿Y si el algoritmo no aprende de buenos datos?
Clasifica en verdadero o falso
-
El poder del aprendizaje automático permite que los sistemas puedan hacer predicciones correctas sobre la realidad aprendiendo a partir de cualquier conjunto de datos relacionados
¡Bien hecho! los datos utilizados en el entrenamiento deben ser suficientemente representativos del mundo real para que el modelo de IA pueda generalizar y realizar predicciones precisas en situaciones nuevas y desconocidas
-
El sesgo asociado a los sistemas de Inteligencia Artificial incrementa los estereotipos en la sociedad
¡Así es! Los sistemas de Inteligencia Artificial se utilizan para tomar decisiones que perpetuarán la discriminación y el sesgo que aparecían en los datos de entrenamiento.
-
Quiero diseñar un programa de fisioterapia preventivo para evitar lesiones en los jugadores de futbol profesionales. Para ello analizo los datos que me proporciona la liga masculina. Es una muestra amplia por lo que mi sistema será bueno para toda la población
¡Exacto! Los datos solo pueden ser válidos para la muestra de entrenamiento que se limita a un género y no tiene en cuenta los datos específicos de la anatomía femenina. El aplicar un programa diseñado con los datos del género masculino no será capaz de predecir las lesiones en las mujeres e incluso puede ser perjudicial porque no se adapte a las características de su cuerpo.
-
El sesgo en los sistemas de Inteligencia Artificial tiene su origen únicamente en la parcialidad de los datos usados en el aprendizaje
¡Tienes razón! Malas decisiones en todo el proceso de creación del sistema pueden dar lugar a sesgo: los datos de entrenamiento, la selección de características, la elección del algoritmo de aprendizaje automático, o la arquitectura del modelo. Se deben tomar medidas de control en todo el ciclo de vida del algoritmo para evitar la aparición de sesgo. El valor asociado a los diferentes errores en el entrenamiento o la influencia de ciertas variables en el modelo pueden producir el mismo efecto que unos malos datos.