Blog

El refuerzo positivo del aprendizaje

Nos lo han dicho a todos en alguna ocasión, el aprendizaje resulta más efectivo si se sirve de refuerzos positivos. Este también llamado refuerzo por recompensa se aplica incluso al adiestramiento de algunos animales y se ha trasladado al mundo de la programación y a un conjunto de reglas para lograr un objetivo.

 

Incluso este principio es aplicado ahora por los científicos de datos para programar algoritmos, que reciben una recompensa cuando realizan una acción beneficiosa para el objetivo final y un castigo en caso de que les aleje de este objetivo.

Este aprendizaje por refuerzo se usa a menudo en áreas como la robótica, los videojuegos, la gestión de recursos o el aprendizaje automático, para replicar tareas del mundo físico o enseñar a las máquinas rutinas propias de las personas o  ayudar a las empresas a planificar la asignación de recursos.

Hoy en día, el aprendizaje automático se utiliza en una amplia gama de aplicaciones. Quizás uno de los ejemplos más conocidos de aprendizaje automático, en acción es el motor de recomendaciones que impulsa el News Feed de Facebook.

Facebook utiliza el aprendizaje automático para personalizar cómo se entrega el feed de cada miembro. Si un miembro se detiene con frecuencia para leer las publicaciones de un grupo en particular, el motor de recomendaciones comenzará a mostrar más de la actividad de ese grupo anteriormente en el feed.

Por detrás, el motor intenta potenciar los patrones de comportamiento on line de sus miembros. Si el miembro cambia su patrón y no lee las publicaciones de ese grupo en varias semanas, la sección de noticias se ajusta en consecuencia.

Además de los motores de noticias, otros usos del aprendizaje automático incluyen la gestión de relaciones con los clientes, el software CRM para analizar el correo electrónico y pedir a los miembros del equipo de ventas que respondan primero a los mensajes más importantes. También los proveedores de BI y análisis utilizan el aprendizaje automático en su software para identificar coincidencias y patrones de datos o anomalías potenciales.

La gestión de recursos humanos también se aprovecha de ello para utilizar modelos de aprendizaje automático que filtran las aplicaciones e identifican a los mejores candidatos para un puesto vacante.

Los algoritmos de aprendizaje automático permiten incluso que un automóvil semiautónomo reconozca un objeto parcialmente visible y alerte al conductor o interpretar el lenguaje natural y su contexto.

El aprendizaje automático ya ha protagonizado potentes casos de éxito que llegan incluso a predecir el comportamiento del cliente, ayudan a adaptar los productos y servicios a las preferencias del usuario o incluso han generado algunos modelos de negocio nuevos, como el de Uber o Google.

Pero esto no significa que no tenga sus inconvenientes. En primer lugar, puede resultar caro. Los proyectos de aprendizaje automático suelen estar impulsados ​​por científicos de datos, que cobran altos salarios y también requieren una infraestructura de software que puede resultar muy cara.

Además, también existe el problema del sesgo del aprendizaje automático. Los algoritmos que se entrenaron en conjuntos de datos que excluyen a ciertas poblaciones, o contienen errores, pueden conducir a modelos inexactos del mundo que, en el mejor de los casos, fallan y, en el peor, son discriminatorios. Cuando una empresa basa los procesos comerciales centrales en modelos sesgados, puede sufrir daños regulatorios y de reputación.