Home Tecnología Obtener valor de sus datos no debería ser tan difícil

Obtener valor de sus datos no debería ser tan difícil

by notiulti

El impacto potencial de la explosión de datos en todo el mundo continúa excitando la imaginación. Un informe de 2018 estimó que cada segundo de cada día, cada persona produce 1,7 MB de datos en promedio, y la creación anual de datos más del doble desde entonces y se proyecta que se duplique nuevamente para 2025. Un informe del McKinsey Global Institute estima que los usos hábiles de big data podrían generar una $ 3 billones en la actividad económica, permitiendo aplicaciones tan diversas como automóviles autónomos, atención médica personalizada y cadenas de suministro de alimentos rastreables.

Pero agregar todos estos datos al sistema también está creando confusión sobre cómo encontrarlos, usarlos, administrarlos y compartirlos de manera legal, segura y eficiente. ¿De dónde vino un determinado conjunto de datos? ¿Quién es dueño de qué? ¿A quién se le permite ver ciertas cosas? ¿Dónde reside? ¿Se puede compartir? ¿Se puede vender? ¿Puede la gente ver cómo se usó?

A medida que las aplicaciones de datos crecen y se vuelven más ubicuas, los productores, consumidores y propietarios y administradores de datos descubren que no tienen un manual a seguir. Los consumidores quieren conectarse a datos en los que confían para poder tomar las mejores decisiones posibles. Los productores necesitan herramientas para compartir sus datos de forma segura con quienes los necesitan. Pero las plataformas tecnológicas se quedan cortas y no existen verdaderas fuentes comunes de la verdad para conectar a ambos lados.

¿Cómo encontramos los datos? ¿Cuándo debemos moverlo?

En un mundo perfecto, los datos fluirían libremente como una utilidad accesible para todos. Podría empaquetarse y venderse como materia prima. Puede ser visto fácilmente, sin complicaciones, por cualquier persona autorizada para verlo. Sus orígenes y movimientos podrían rastrearse, eliminando cualquier preocupación sobre usos nefastos en algún lugar a lo largo de la línea.

El mundo de hoy, por supuesto, no funciona de esta manera. La explosión masiva de datos ha creado una larga lista de problemas y oportunidades que dificultan compartir fragmentos de información.

Dado que los datos se crean en casi todas partes dentro y fuera de una organización, el primer desafío es identificar lo que se recopila y cómo organizarlo para que se pueda encontrar.

La falta de transparencia y soberanía sobre los datos y la infraestructura almacenados y procesados ​​abre problemas de confianza. Hoy en día, mover datos a ubicaciones centralizadas desde múltiples pilas de tecnología es costoso e ineficiente. La ausencia de estándares abiertos de metadatos e interfaces de programación de aplicaciones de fácil acceso puede dificultar el acceso y el consumo de datos. La presencia de ontologías de datos específicas del sector puede dificultar que personas ajenas al sector se beneficien de nuevas fuentes de datos. Las múltiples partes interesadas y la dificultad para acceder a los servicios de datos existentes pueden dificultar el intercambio sin un modelo de gobernanza.

Europa está tomando la delantera

A pesar de los problemas, se están emprendiendo proyectos de intercambio de datos a gran escala. Uno que está respaldado por la Unión Europea y un grupo sin fines de lucro está creando un intercambio de datos interoperable llamado Gaia-X, donde las empresas pueden compartir datos bajo la protección de estrictas leyes europeas de privacidad de datos. El intercambio se concibe como un recipiente para compartir datos entre industrias y un repositorio de información sobre los servicios de datos en torno a la inteligencia artificial (IA), la analítica e Internet de las cosas.

Hewlett Packard Enterprise anunció recientemente un marco de la solución para apoyar la participación de empresas, proveedores de servicios y organismos públicos en Gaia-X. La plataforma de espacios de datos, que se encuentra actualmente en desarrollo y se basa en estándares abiertos y nativos de la nube, democratiza el acceso a los datos, el análisis de datos y la IA al hacerlos más accesibles para los expertos en el dominio y los usuarios comunes. Proporciona un lugar donde los expertos de áreas de dominio pueden identificar más fácilmente conjuntos de datos confiables y realizar análisis de datos operativos de manera segura, sin requerir siempre el costoso movimiento de datos a ubicaciones centralizadas.

Al utilizar este marco para integrar fuentes de datos complejas en los entornos de TI, las empresas podrán brindar transparencia de datos a escala, de modo que todos, ya sean científicos de datos o no, sepan qué datos tienen, cómo acceder a ellos y cómo usarlos. en tiempo real.

Las iniciativas de intercambio de datos también están en la cima de las agendas de las empresas. Una prioridad importante a la que se enfrentan las empresas es la verificación de los datos que se utilizan para entrenar modelos internos de inteligencia artificial y aprendizaje automático. La inteligencia artificial y el aprendizaje automático ya se están utilizando ampliamente en las empresas y la industria para impulsar mejoras continuas en todo, desde el desarrollo de productos hasta la contratación y la fabricación. Y recién estamos comenzando. IDC proyecta que el mercado global de la IA crecerá de $ 328 mil millones en 2021 a $ 554 mil millones en 2025.

Para desbloquear el verdadero potencial de la IA, los gobiernos y las empresas deben comprender mejor el legado colectivo de todos los datos que impulsan estos modelos. ¿Cómo toman sus decisiones los modelos de IA? ¿Tienen prejuicios? ¿Son dignos de confianza? ¿Las personas que no son de confianza han podido acceder o cambiar los datos contra los que una empresa ha entrenado su modelo? Conectar a los productores de datos con los consumidores de datos de manera más transparente y con mayor eficiencia puede ayudar a responder algunas de estas preguntas.

Construyendo madurez de datos

Las empresas no van a resolver cómo desbloquear todos sus datos de la noche a la mañana. Pero pueden prepararse para aprovechar las tecnologías y los conceptos de gestión que ayudan a crear una mentalidad de intercambio de datos. Pueden asegurarse de que están desarrollando la madurez para consumir o compartir datos de manera estratégica y efectiva en lugar de hacerlo de forma ad hoc.

Los productores de datos pueden prepararse para una distribución más amplia de datos siguiendo una serie de pasos. Deben comprender dónde están sus datos y comprender cómo los recopilan. Luego, deben asegurarse de que las personas que consumen los datos tengan la capacidad de acceder a los conjuntos de datos correctos en el momento adecuado. Ese es el punto de partida.

Luego viene la parte más difícil. Si un productor de datos tiene consumidores, que pueden estar dentro o fuera de la organización, deben conectarse a los datos. Eso es un desafío tanto organizativo como tecnológico. Muchas organizaciones quieren gobernar el intercambio de datos con otras organizaciones. La democratización de los datos, al menos poder encontrarlos en todas las organizaciones, es un problema de madurez organizacional. ¿Cómo manejan eso?

Las empresas que contribuyen a la industria automotriz comparten datos activamente con proveedores, socios y subcontratistas. Se necesitan muchas piezas, y mucha coordinación, para ensamblar un automóvil. Los socios comparten fácilmente información sobre todo, desde motores hasta neumáticos y canales de reparación habilitados para la web. Los espacios de datos automotrices pueden servir a más de 10,000 proveedores. Pero en otras industrias, podría ser más insular. Es posible que algunas grandes empresas no quieran compartir información confidencial incluso dentro de su propia red de unidades comerciales.

Creando una mentalidad de datos

Las empresas a ambos lados del continuo consumidor-productor pueden avanzar en su mentalidad de intercambio de datos haciéndose estas preguntas estratégicas:

  • Si las empresas están creando soluciones de inteligencia artificial y aprendizaje automático, ¿de dónde obtienen los equipos sus datos? ¿Cómo se conectan a esos datos? ¿Y cómo rastrean ese historial para garantizar la confiabilidad y la procedencia de los datos?
  • Si los datos tienen valor para otros, ¿cuál es el camino de monetización que el equipo está tomando hoy para expandir ese valor y cómo se gobernará?
  • Si una empresa ya está intercambiando o monetizando datos, ¿puede autorizar un conjunto más amplio de servicios en múltiples plataformas, en las instalaciones y en la nube?
  • Para las organizaciones que necesitan compartir datos con proveedores, ¿cómo se realiza hoy la coordinación de esos proveedores con los mismos conjuntos de datos y actualizaciones?
  • ¿Quieren los productores replicar sus datos o obligar a las personas a que les traigan modelos? Los conjuntos de datos pueden ser tan grandes que no se pueden replicar. ¿Debería una empresa alojar a los desarrolladores de software en su plataforma donde están sus datos y mover los modelos hacia adentro y hacia afuera?
  • ¿Cómo pueden los trabajadores de un departamento que consume datos influir en las prácticas de los productores de datos ascendentes dentro de su organización?

Tomando acción

La revolución de los datos está creando oportunidades comerciales, junto con mucha confusión sobre cómo buscar, recopilar, administrar y obtener información a partir de esos datos de una manera estratégica. Los productores de datos y los consumidores de datos están cada vez más desconectados entre sí. HPE está construyendo una plataforma que admite tanto la nube pública como la local, utilizando el código abierto como base y soluciones como la plataforma de software HPE Ezmeral para proporcionar el terreno común que ambas partes necesitan para hacer que la revolución de los datos funcione para ellos.

Lea el artículo original en Enterprise.nxt.

Este contenido fue producido por Hewlett Packard Enterprise. No fue escrito por el personal editorial de MIT Technology Review.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.