El data science o ciencia de datos es un campo interdisciplinario que aprovecha las matemáticas, la programación, los negocios y el conocimiento del dominio para abordar problemas de datos complejos. Su aparición como campo de estudio y aplicación práctica durante los últimos años ha permitido el desarrollo de diferentes tecnologías, especialmente del aprendizaje automático (ML) como forma de trabajar hacia lo que denominamos inteligencia artificial (IA), un campo tecnológico que está transformando rápidamente nuestra forma de trabajar y vivir.
La gran cantidad de datos que recogen y almacenan estas tecnologías pueden aportar beneficios transformadores a las organizaciones y sociedades de todo el mundo, pero sólo si sabemos interpretarlos. En este artículo vamos a revisarlas tendencias en data science para el año que entra, el cual promete seguir con la aceleración digital vivida en los últimos dos años a causa de la COVID-19.
Cuatro tendencias en data science para 2022
La importancia que está cobrando el data science también en el mundo de la empresa y el comercio hace que la ciencia que hay detrás de este campo sea cada vez más accesible. Esto ha dado lugar a la extendida democratización de la ciencia de los datos y que, sin duda, vamos a ver entre las tendencias de aprendizaje en los próximos años. Pero dentro del campo en cuestión, nos encontramos con cuatro tendencias clave:
1. El Small Data o TinyML
Mientras que la actividad de desarrollo del machine learning (o aprendizaje automático) se centra en soluciones de alta potencia en la nube o de potencia media en el borde, existe otro conjunto de actividades destinadas a implementar el aprendizaje automático en sistemas con recursos muy limitados: el TinyxML. Una idea que ha adquirido un importante impulso en los últimos años y cuyo motor es la noción de que algunos problemas no necesitan un servidor de centro de datos o una plataforma de borde para resolverlos. En definitiva, se trata de una metodología que busca mejorar las soluciones y ampliar los límites para los que realmente se necesita una computación de mayor potencia.
Durante 2022, lo veremos aparecer en cada vez más sistemas integrados: desde los wearables (tecnología vestible)hasta electrodomésticos, coches o equipos industriales, haciéndolos todos más inteligentes y útiles.
2. AutoML o auto Machine Learning
A menudo, una gran parte del tiempo de un científico de datos se dedica a la limpieza y preparación de los datos,tareas que requieren de gran conocimiento y que suelen ser repetitivas. El Auto MI (auto machine learning)supone la automatización de esas labores y su objetivo a corto plazo es que cualquiera que tenga un problema que resolver o una idea que probar, pueda aplicar el auto funcionamiento del machine learning para ganar tiempo y dedicarlo al planteamiento de soluciones.Esta tendencia está impulsando la democratización de la ciencia de datos que mencionamos al inicio del artículo que veremos en los próximos años.