Los datos preparados para la IA son fundamentales para aprovechar el potencial de las iniciativas de IA. Asegúrate de entender bien qué son y sigue estos cinco pasos para prepararlos.
Los datos preparados para la IA son fundamentales para aprovechar el potencial de las iniciativas de IA. Asegúrate de entender bien qué son y sigue estos cinco pasos para prepararlos.
Por Rita Sallam | 21 de octubre de 2024
Los responsables de análisis de datos deben demostrar que los datos de su organización están listos para ser utilizados en un número cada vez mayor de iniciativas de IA, pero hay que tener en cuenta que existen grandes diferencias entre los requisitos de los datos preparados para IA y la gestión de datos tradicional. Para cerrar esa brecha, Gartner recomienda los siguientes pasos:
Evalúa tus necesidades de datos en función de los casos de uso de la IA.
Presenta los requisitos a la junta directiva y consigue su aceptación.
Desarrolla prácticas de gestión de datos.
Amplía el ecosistema de gestión de datos.
Garantiza la escalabilidad y la gobernanza de los datos.
Con esta hoja de ruta te asegurarás de que tus datos estén preparados para las iniciativas de IA que planeas implantar y mantendrá a las partes interesadas alineadas sobre lo que realmente significa que los datos estén preparados para la IA.
Más información: consulta el recurso Prepárate para la IA: lo que todo responsable de TI debe saber y hacer para obtener más información sobre cómo identificar oportunidades y casos de uso de IA.
Puedes demostrar que tus datos están preparados para cumplir los requisitos de la IA alineándolos con los casos de uso, evaluándolos adecuadamente y garantizando una gobernanza apropiada. Hacerte estas tres preguntas puede ayudarte.
Cada caso de uso de IA debe especificar qué datos se necesitan, lo cual también dependerá de la técnica de IA que se utilice. Puede que no estén del todo definidos de entrada, pero se irán ajustando a medida que se utilicen los datos y se cumplan los requisitos de la IA. Al examinar los requisitos, ten en cuenta lo siguiente:
Técnicas de IA: las distintas técnicas de IA, como la IA generativa o los modelos de simulación, tienen requisitos de datos específicos.
Cuantificación: hay que garantizar un volumen suficiente de datos, teniendo en cuenta factores como la estacionalidad.
Semántica y etiquetado: la anotación y el etiquetado adecuados de los datos, especialmente en imágenes y vídeos, son fundamentales.
Calidad: los datos deben cumplir las normas de calidad específicas del caso de uso de la IA, aunque incluyan errores o valores atípicos.
Confianza: las fuentes de datos y los flujos de procesamiento deben ser fiables.
Diversidad: es importante incluir diversas fuentes de datos para evitar sesgos.
Linaje: debe mantenerse la transparencia sobre el origen y transformación de los datos.
La evaluación del uso asegura que los datos cumplan los requisitos en todo momento, ya sea para el entrenamiento, desarrollo o ejecución de un modelo en operaciones. Utiliza los siguientes parámetros para asegurarte de que los datos cumplen los requisitos de confianza esperados para los casos de uso de la IA:
Validación y verificación: comprueba de manera regular que los datos cumplan con los requisitos tanto durante el desarrollo como en las operaciones.
Rendimiento y coste: los datos deben cumplir los acuerdos de nivel de servicio operativo, incluidos el tiempo de respuesta y la rentabilidad.
Control de versiones: rastrea y gestiona las distintas versiones de los datos para manejar la deriva del modelo y los problemas en los flujos de procesamiento.
Pruebas de regresión continuas: desarrolla casos de prueba para detectar fallos y desviaciones de datos.
Indicadores de observabilidad: supervisa el estado de los datos, asegurando que se entreguen a tiempo y con exactitud.
Define los requisitos continuados de gobernanza de datos que deben cumplirse para respaldar un caso de uso de la IA, utilizando parámetros como:
Administración de datos: aplica las políticas a lo largo del ciclo de vida de los datos, incluidos el acceso y el desarrollo de modelos.
Normas y reglamentos: cumple la normativa sobre IA en evolución, como la Ley de IA de la UE y el Reglamento General de Protección de Datos (RGPD).
Ética de la IA: aborda las consideraciones éticas, como el uso de datos reales de clientes para entrenar los modelos.
Inferencia y derivación controladas: controla la interacción entre modelos y garantiza la gobernanza.
Sesgo e imparcialidad de los datos: gestiona de manera proactiva el sesgo de los datos y prueba los modelos con conjuntos de datos adversarios.
Intercambio de datos: facilita el intercambio de datos y metadatos para apoyar diversos casos de uso de la IA.
Basándose en experiencias de clientes que han implementado con éxito iniciativas para preparar los datos para la IA, Gartner propone cinco pasos para guiar a los responsables de análisis de datos (D&A) en la preparación de los datos para la IA.
Evaluar la preparación para la gestión de datos: analiza las prácticas actuales de gestión de datos para detectar carencias y oportunidades de mejora.
Consigue la aceptación de la junta directiva: logra el apoyo de los ejecutivos de la empresa para garantizar los recursos necesarios y el compromiso con las iniciativas de IA.
Desarrollar las prácticas de gestión de datos: adapta y optimiza las estrategias de gestión de datos para responder a los requisitos específicos de los datos preparados para la IA.
Ampliar el ecosistema de datos: amplía la infraestructura y las capacidades de datos para respaldar casos de uso de IA diversos y redimensionables.
Garantizar la escalabilidad y gobernanza: implementa marcos sólidos de gobernanza de datos para asegurar la calidad de los datos, el cumplimiento normativo y el uso ético en las iniciativas de IA en expansión.
Los datos preparados para la IA son datos que representan adecuadamente el caso de uso específico, incluidos los patrones, errores, valores atípicos y sucesos inesperados necesarios para entrenar o ejecutar un modelo de IA. La preparación de los datos para la IA es un proceso continuo que depende de la disponibilidad de metadatos para alinear, evaluar y gobernar los datos.
No es posible preparar todos los datos para la IA de forma general o anticipada; la preparación depende de cómo se vayan a utilizar. Por ejemplo, los datos necesarios para crear un algoritmo de mantenimiento predictivo son muy diferentes de los necesarios para aplicar la IA generativa a los datos de la empresa.
Los datos de “alta calidad”, según se definen en las normas tradicionales de calidad de datos, no están necesariamente preparados para la IA. Por ejemplo, al considerar los datos en el contexto de la analítica, se espera eliminar los valores atípicos o limpiar los datos para cumplir con las expectativas de las personas. Sin embargo, al entrenar un algoritmo, es fundamental contar con datos representativos. Esto también puede incluir datos de mala calidad.