michelangelus - Fotolia
Cómo diseñar y construir una infraestructura de inteligencia artificial
La construcción de una infraestructura de inteligencia artificial requiere una mirada seria a las necesidades de almacenamiento, redes y datos de la IA, combinados con una planificación deliberada y estratégica.
Las organizaciones deben considerar muchos factores al construir o mejorar una infraestructura de inteligencia artificial para soportar las aplicaciones y cargas de trabajo de IA.
Estos no son problemas triviales. El éxito final de una compañía con IA probablemente dependerá de qué tan adecuado sea su entorno para aplicaciones tan potentes. Si bien la nube se está convirtiendo en un recurso importante para las cargas de trabajo intensivas en datos de la inteligencia artificial, las empresas aún confían en sus entornos de TI locales para estos proyectos.
Almacenamiento de datos para IA
Una de las consideraciones más importantes es el almacenamiento de datos de IA, específicamente la capacidad de escalar el almacenamiento a medida que crece el volumen de datos. A medida que las organizaciones preparan las estrategias de IA de la empresa y construyen la infraestructura necesaria, el almacenamiento debe ser una prioridad. Eso incluye garantizar la capacidad de almacenamiento adecuada, IOPS y la confiabilidad para manejar los enormes volúmenes de datos requeridos para una IA efectiva.
Averiguar qué tipo de almacenamiento necesita una organización depende de muchos factores, incluido el nivel de IA que una organización planea usar y si necesitan tomar decisiones en tiempo real.
Por ejemplo, para ecosistemas de redes neuronales avanzados y de alto valor, las arquitecturas de almacenamiento tradicionales conectadas a la red pueden presentar problemas de escalamiento con E/S y latencia. Del mismo modo, una compañía de servicios financieros que utiliza sistemas de inteligencia artificial empresarial para decisiones comerciales en tiempo real puede necesitar una tecnología de almacenamiento rápida completamente flash.
Muchas empresas ya están construyendo entornos de big data y análisis que aprovechan Hadoop y otros marcos diseñados para soportar enormes volúmenes de datos, y estos probablemente sean adecuados para muchos tipos de aplicaciones de IA.
Otro factor es la naturaleza de los datos de origen. Las aplicaciones de IA dependen de los datos de origen, por lo que una organización necesita saber dónde residen los datos fuente y cómo las aplicaciones de IA los usarán. Por ejemplo, ¿las aplicaciones analizarán los datos de sensores en tiempo real o utilizarán el posprocesamiento?
También debe tener en cuenta la cantidad de datos de inteligencia artificial que generarán las aplicaciones. Las aplicaciones de IA toman mejores decisiones ya que están expuestas a más datos. A medida que las bases de datos crecen con el tiempo, las empresas necesitan monitorear la capacidad y planificar la expansión según sea necesario.
Infraestructura de redes de IA
Las redes son otro componente clave de una infraestructura de inteligencia artificial. Para proporcionar la alta eficiencia a escala requerida para soportar la IA, las organizaciones probablemente necesitarán actualizar sus redes.
Los algoritmos de aprendizaje profundo dependen en gran medida de las comunicaciones, y las redes empresariales necesitarán mantener el ritmo de la demanda a medida que se expanden los esfuerzos de IA. Es por eso que la escalabilidad debe ser una alta prioridad, y eso requerirá arquitecturas creativas de alto ancho de banda y baja latencia.
Las empresas deben automatizar siempre que sea posible. Por ejemplo, deberían implementar herramientas automatizadas de administración de infraestructura en sus centros de datos.
Los proveedores de infraestructura de red, mientras tanto, buscan hacer lo mismo. Las redes definidas por software se combinan con el aprendizaje automático para crear redes basadas en la intención que pueden anticipar las demandas de la red o las amenazas a la seguridad y reaccionar en tiempo real.
Procesamiento de datos de IA
También es fundamental para una infraestructura de inteligencia artificial tener suficientes recursos informáticos, incluidas las CPU y las GPU.
Un entorno basado en CPU puede manejar cargas de trabajo de IA básicas, pero el aprendizaje profundo implica múltiples conjuntos de datos grandes y la implementación de algoritmos de redes neuronales escalables. Para eso, la computación basada en CPU podría no ser suficiente.
Para proporcionar las capacidades de cómputo necesarias, las empresas deben recurrir a las GPU. La implementación de GPU permite que las organizaciones optimicen la infraestructura de su centro de datos y ganen eficiencia energética.
Actualmente, muchas empresas dependen principalmente de GPU reutilizadas para sus esfuerzos de IA, pero también aprovechan los recursos de la infraestructura en la nube, así como también el costo general cada vez menor de los procesadores. Nvidia e Intel están impulsando GPU enfocadas en la inteligencia artificial.
Mientras tanto, la startup Graphcore lanzó una nueva arquitectura de procesamiento específica de IA llamada unidad de procesamiento inteligente para reducir el costo de acelerar las aplicaciones de inteligencia artificial en la nube y en los centros de datos empresariales.
Preparar datos de IA
Las organizaciones tienen mucho que considerar. No solo tienen que elegir dónde almacenarán los datos, cómo los moverán a través de las redes y cómo los procesarán, sino que también tendrán que elegir cómo prepararán los datos para su uso en las aplicaciones de inteligencia artificial.
Uno de los pasos críticos para una IA empresarial exitosa es la limpieza de datos. También se denomina depuración de datos, es el proceso de actualizar o eliminar datos de una base de datos que son inexactos, incompletos, mal formateados o duplicados.
Cualquier empresa, pero especialmente aquellas en sectores impulsados por datos, deberían considerar la implementación de herramientas automatizadas de limpieza de datos para evaluar los datos en busca de errores utilizando reglas o algoritmos. La calidad de los datos es especialmente crítica con la IA. Si los sistemas de alimentación de datos para IA son inexactos o están desactualizados, el resultado y las decisiones de negocios relacionadas también serán inexactos.
Gestión de datos y gobernanza de IA
Otro factor importante es el acceso a los datos. ¿La organización cuenta con los mecanismos adecuados para entregar datos de manera segura y eficiente a los usuarios que los necesitan?
Como tal, parte de la estrategia de gestión de datos debe garantizar que los usuarios (máquinas y personas) tengan un acceso fácil y rápido a los datos. Deben ser accesibles desde una variedad de puntos finales, incluidos los dispositivos móviles a través de redes inalámbricas.
El acceso también plantea una serie de problemas de privacidad y seguridad, por lo que los controles de acceso a los datos son importantes. Las empresas deben considerar tecnologías como la gestión de identidades y accesos y las herramientas de encriptación de datos como parte de sus estrategias de administración y gobierno de datos.
IA e IoT
Ninguna discusión sobre la infraestructura de inteligencia artificial estaría completa sin mencionar el creciente impacto de la internet de las cosas (IoT). IoT implica recopilar y analizar datos de innumerables dispositivos, productos, sensores, activos, ubicaciones, vehículos, etc., que están conectados a través de internet. IA e IoT están estrechamente vinculados porque las organizaciones necesitan aplicar inteligencia para obtener conocimiento de toda la información proveniente de cosas conectadas.
Gartner estima que 8,4 mil millones de cosas conectadas estaban en uso en todo el mundo en 2017, un 31% más que en 2016, y ese número llegará a 20,4 mil millones para 2020. Imagínese la cantidad asombrosa de datos generados por los objetos conectados, y corresponderá a las compañías integrar, administrar y asegurar toda esta información.
Desde el punto de vista de la infraestructura de inteligencia artificial, las empresas deben analizar sus redes, almacenamiento de datos, análisis de datos y plataformas de seguridad para asegurarse de que puedan manejar de manera efectiva el crecimiento de sus ecosistemas de IoT. Eso incluye los datos generados por sus propios dispositivos, así como los de sus socios de la cadena de suministro.
Entrenamiento en IA
Por último, pero ciertamente no menos importante: la capacitación y el desarrollo de habilidades son vitales para cualquier esfuerzo de TI, y especialmente para las iniciativas de IA empresariales. Las compañías necesitarán analistas de datos, científicos de datos, desarrolladores, expertos en ciberseguridad, ingenieros de redes y profesionales de TI con una variedad de habilidades para construir y mantener su infraestructura para soportar la IA y utilizar tecnologías de inteligencia artificial, como aprendizaje automático, procesamiento del lenguaje natural y aprendizaje profundo, de forma continua.
También necesitarán personas que sean capaces de administrar los diversos aspectos del desarrollo de la infraestructura, y que estén bien versados en los objetivos de negocios de la organización. Armar un equipo fuerte es una parte esencial de cualquier esfuerzo de desarrollo de infraestructura de inteligencia artificial.