¿Qué es la IA generativa? Todo lo que necesita saber
La IA generativa es un tipo de tecnología de inteligencia artificial que puede producir varios tipos de contenido, incluidos texto, imágenes, audio y datos sintéticos. El reciente revuelo en torno a la IA generativa ha sido impulsado por la simplicidad de las nuevas interfaces de usuario para crear texto, gráficos y videos de alta calidad en cuestión de segundos.
Cabe señalar que la tecnología no es nueva. La IA generativa se introdujo en la década de 1960 en los chatbots. Pero no fue hasta 2014, con la introducción de las redes antagónicas generativas o GAN –un tipo de algoritmo de aprendizaje automático– que la IA generativa pudo crear imágenes, videos y audio convincentemente auténticos de personas reales.
Por un lado, esta capacidad recién descubierta ha abierto oportunidades que incluyen un mejor doblaje de películas y un rico contenido educativo. También reveló preocupaciones sobre deepfakes –imágenes o videos falsificados digitalmente– y ataques dañinos de seguridad cibernética en las empresas, incluidas solicitudes nefastas que imitan de manera realista al jefe de un empleado.
Dos avances recientes adicionales que se discutirán con más detalle a continuación han jugado un papel fundamental en la generalización de la IA generativa: los transformadores y los revolucionarios modelos de lenguaje que permitieron. Los transformadores son un tipo de aprendizaje automático que hizo posible que los investigadores entrenaran modelos cada vez más grandes sin tener que etiquetar todos los datos por adelantado. Por lo tanto, se podrían entrenar nuevos modelos en miles de millones de páginas de texto, lo que daría como resultado respuestas con mayor profundidad. Además, los transformadores desbloquearon una nueva noción llamada atención, que permitió a los modelos rastrear las conexiones entre palabras a través de páginas, capítulos y libros, en vez de solo en oraciones individuales. Y no solo palabras: los transformadores también podrían usar su capacidad para rastrear conexiones para analizar código, proteínas, químicos y ADN.
Los rápidos avances en los llamados modelos grandes de lenguaje (LLM) –es decir, modelos con miles de millones o incluso billones de parámetros– han abierto una nueva era en la que los modelos generativos de IA pueden escribir texto atractivo, pintar imágenes fotorrealistas e incluso crear comedias de situación algo entretenidas sobre la marcha. Además, las innovaciones en IA multimodal permiten a los equipos generar contenido en múltiples tipos de medios, incluidos texto, gráficos y video. Esta es la base para herramientas como Dall-E que crean automáticamente imágenes a partir de una descripción de texto o generan leyendas de texto a partir de imágenes.
A pesar de estos avances, todavía estamos en los primeros días del uso de IA generativa para crear texto legible y gráficos estilizados fotorrealistas. Las primeras implementaciones han tenido problemas con la precisión y el sesgo, además de ser propensas a las alucinaciones y a escupir respuestas extrañas. Aun así, el progreso hasta el momento indica que las capacidades inherentes de este tipo de IA podrían cambiar fundamentalmente los negocios. En el futuro, esta tecnología podría ayudar a escribir códigos, diseñar nuevos medicamentos, desarrollar productos, rediseñar procesos comerciales y transformar las cadenas de suministro.
¿Cómo funciona la IA generativa?
La IA generativa comienza con una consulta que puede ser un texto, una imagen, un video, un diseño, notas musicales o cualquier entrada que el sistema de IA pueda procesar. Luego, varios algoritmos de IA devuelven contenido nuevo en respuesta a la consulta. El contenido puede incluir ensayos, soluciones a problemas o falsificaciones realistas creadas a partir de imágenes o audio de una persona.
Las primeras versiones de IA generativa requerían el envío de datos a través de una API o un proceso complicado. Los desarrolladores tenían que familiarizarse con herramientas especiales y escribir aplicaciones utilizando lenguajes como Python.
Ahora, los pioneros en IA generativa están desarrollando mejores experiencias de usuario que les permiten describir una solicitud en un lenguaje sencillo. Después de una respuesta inicial, también pueden personalizar los resultados con comentarios sobre el estilo, el tono y otros elementos que desean que refleje el contenido generado.
Modelos generativos de IA
Los modelos generativos de IA combinan varios algoritmos de IA para representar y procesar contenido. Por ejemplo, para generar texto, varias técnicas de procesamiento de lenguaje natural transforman caracteres sin procesar (por ejemplo, letras, puntuación y palabras) en oraciones, partes del discurso, entidades y acciones, que se representan como vectores utilizando múltiples técnicas de codificación. Del mismo modo, las imágenes se transforman en diversos elementos visuales, también expresados como vectores. Una advertencia es que estas técnicas también pueden codificar los sesgos, el racismo, el engaño y la fanfarronería contenidos en los datos de entrenamiento.
Una vez que los desarrolladores se deciden por una forma de representar el mundo, aplican una red neuronal particular para generar contenido nuevo en respuesta a una consulta o aviso. Técnicas como GAN y codificadores automáticos variacionales (VAE) –redes neuronales con un decodificador y un codificador– son adecuadas para generar rostros humanos realistas, datos sintéticos para el entrenamiento de IA o incluso facsímiles de humanos particulares.
Los avances recientes en transformadores, como las Representaciones de codificador bidireccional de transformadores (BERT) de Google, GPT de OpenAI y Google AlphaFold, también han dado como resultado redes neuronales que no solo pueden codificar lenguaje, imágenes y proteínas, sino también generar contenido nuevo.
Cómo las redes neuronales están transformando la IA generativa
Los investigadores han estado creando IA y otras herramientas para generar contenido programáticamente desde los primeros días de la IA. Los primeros enfoques, conocidos como sistemas basados en reglas, y más tarde como "sistemas expertos", usaban reglas elaboradas explícitamente para generar respuestas o conjuntos de datos.
Las redes neuronales, que forman la base de gran parte de las aplicaciones actuales de inteligencia artificial y aprendizaje automático, dieron la vuelta al problema. Diseñadas para imitar cómo funciona el cerebro humano, las redes neuronales "aprenden" las reglas al encontrar patrones en conjuntos de datos existentes. Desarrolladas en las décadas de 1950 y 1960, las primeras redes neuronales estaban limitadas por la falta de poder computacional y los pequeños conjuntos de datos. No fue hasta la llegada de los grandes datos a mediados de la década de 2000 y las mejoras en el hardware de las computadoras que las redes neuronales se volvieron prácticas para generar contenido.
El campo se aceleró cuando los investigadores encontraron una manera de hacer que las redes neuronales se ejecutaran en paralelo a través de las unidades de procesamiento de gráficos (GPU) que se usaban en la industria de los juegos de computadora para renderizar videojuegos. Las nuevas técnicas de aprendizaje automático desarrolladas en la última década, incluidas las redes generativas antagónicas y los transformadores antes mencionados , han preparado el escenario para los notables avances recientes en el contenido generado por IA.
¿Qué son Dall-E, ChatGPT y Bard?
ChatGPT, Dall-E y Bard son interfaces de IA generativas populares.
Dall-E. Entrenado en un gran conjunto de datos de imágenes y sus descripciones de texto asociadas, Dall-E es un ejemplo de una aplicación de IA multimodal que identifica conexiones a través de múltiples medios, como visión, texto y audio. En este caso, conecta el significado de las palabras con elementos visuales. Se creó utilizando la implementación GPT de OpenAI en 2021. Dall-E 2, una segunda versión más capaz, se lanzó en 2022. Permite a los usuarios generar imágenes en múltiples estilos impulsados por indicaciones del usuario.
ChatGPT. El chatbot con tecnología de IA que cautivó al mundo en noviembre de 2022 se basó en la implementación GPT-3.5 de OpenAI. OpenAI ha proporcionado una forma de interactuar y ajustar las respuestas de texto a través de una interfaz de chat con comentarios interactivos. Solo se podía acceder a las versiones anteriores de GPT a través de una API. GPT-4 se lanzó el 14 de marzo de 2023. ChatGPT incorpora el historial de su conversación con un usuario en sus resultados, simulando una conversación real. Después de la increíble popularidad de la nueva interfaz GPT, Microsoft anunció una nueva inversión significativa en OpenAI e integró una versión de GPT en su motor de búsqueda Bing.
Bard. Google fue otro de los primeros líderes en técnicas pioneras de transformadores de inteligencia artificial para procesar lenguaje, proteínas y otros tipos de contenido. Abrió el código de algunos de estos modelos para los investigadores. Sin embargo, nunca lanzó una interfaz pública para estos modelos. La decisión de Microsoft de implementar GPT en Bing llevó a Google a apresurarse a comercializar un chatbot de cara al público, Google Bard, construido sobre una versión liviana de su familia LaMDA de modelos grandes de lenguaje. Google sufrió una pérdida significativa en el precio de las acciones luego del debut apresurado de Bard, después de que el modelo de lenguaje dijera incorrectamente que el telescopio Webb fue el primero en descubrir un planeta en un sistema solar extranjero. Mientras tanto, las implementaciones de Microsoft y ChatGPT también perdieron prestigio en sus primeras salidas debido a resultados inexactos y comportamiento errático. Desde entonces, Google ha presentado una nueva versión de Bard basada en su LLM más avanzado, PaLM 2, que permite que Bard sea más eficiente y visual en su respuesta a las consultas de los usuarios.
¿Cuáles son los casos de uso de la IA generativa?
La IA generativa se puede aplicar en varios casos de uso para generar prácticamente cualquier tipo de contenido. La tecnología se está volviendo más accesible para usuarios de todo tipo gracias a avances de vanguardia como GPT que se pueden ajustar para diferentes aplicaciones. Algunos de los casos de uso de la IA generativa incluyen los siguientes:
- Implementación de chatbots para atención al cliente y soporte técnico.
- Implementar deepfakes para imitar a personas o incluso a individuos específicos.
- Mejora del doblaje de películas y contenidos educativos en diferentes idiomas.
- Redacción de respuestas por correo electrónico, perfiles de citas, currículos y trabajos finales.
- Creación arte fotorrealista en un estilo particular.
- Mejora de los videos de demostración de productos.
- Sugerir nuevos compuestos farmacológicos para probar.
- Diseño de productos físicos y edificios.
- Optimización de nuevos diseños de chips.
- Escribir música en un estilo o tono específico.
¿Cuáles son los beneficios de la IA generativa?
La IA generativa se puede aplicar ampliamente en muchas áreas del negocio. Puede facilitar la interpretación y comprensión del contenido existente y crear automáticamente contenido nuevo. Los desarrolladores están explorando formas en que la IA generativa puede mejorar los flujos de trabajo existentes, con miras a adaptar los flujos de trabajo por completo para aprovechar la tecnología. Algunos de los beneficios potenciales de implementar IA generativa incluyen los siguientes:
- Automatizar el proceso manual de redacción de contenidos.
- Reducir el esfuerzo de responder a los correos electrónicos.
- Mejorar la respuesta a consultas técnicas específicas.
- Crear representaciones realistas de personas.
- Resumir información compleja en una narrativa coherente.
- Simplificar el proceso de creación de contenido en un estilo particular.
¿Cuáles son las limitaciones de la IA generativa?
Las primeras implementaciones de IA generativa ilustran vívidamente sus muchas limitaciones. Algunos de los desafíos que presenta la IA generativa son el resultado de los enfoques específicos utilizados para implementar casos de uso particulares. Por ejemplo, un resumen de un tema complejo es más fácil de leer que una explicación que incluye varias fuentes que respaldan los puntos clave. Sin embargo, la legibilidad del resumen se produce a expensas de que el usuario pueda verificar de dónde proviene la información.
Estas son algunas de las limitaciones para tener en cuenta al implementar o utilizar una aplicación de IA generativa:
- No siempre identifica la fuente del contenido.
- Puede ser un desafío evaluar el sesgo de las fuentes originales.
- El contenido que suena realista hace que sea más difícil identificar información inexacta.
- Puede ser difícil entender cómo adaptarse a las nuevas circunstancias.
- Los resultados pueden pasar por alto los sesgos, los prejuicios y el odio.
Atención es todo lo que necesita: los transformadores traen nuevas capacidades
En 2017, Google informó sobre un nuevo tipo de arquitectura de red neuronal que trajo mejoras significativas en la eficiencia y precisión de tareas como el procesamiento del lenguaje natural. El enfoque innovador, llamado transformadores, se basó en el concepto de atención.
En un nivel alto, la atención se refiere a la descripción matemática de cómo las cosas (por ejemplo, las palabras) se relacionan, complementan y modifican entre sí. Los investigadores describieron la arquitectura en su artículo seminal, "Atención es todo lo que necesita", mostrando cómo una red neuronal transformadora pudo traducir entre inglés y francés con más precisión y en solo una cuarta parte del tiempo de entrenamiento que otras redes neuronales. La técnica de avance también podría descubrir relaciones, u órdenes ocultas, entre otras cosas enterradas en los datos que los humanos podrían haber ignorado porque eran demasiado complicadas de expresar o discernir.
La arquitectura de transformadores ha evolucionado rápidamente desde que se introdujo, dando lugar a LLM como GPT-3 y mejores técnicas de capacitación previa, como BERT de Google.
¿Cuáles son las preocupaciones en torno a la IA generativa?
El auge de la IA generativa también está alimentando varias preocupaciones. Estas se relacionan con la calidad de los resultados, el potencial de mal uso y abuso, y el potencial de alterar los modelos comerciales existentes. Estos son algunos de los tipos específicos de cuestiones problemáticas que plantea el estado actual de la IA generativa:
- Puede proporcionar información inexacta y engañosa.
- Es más difícil confiar sin conocer la fuente y procedencia de la información.
- Puede promover nuevos tipos de plagio que ignoren los derechos de los creadores de contenido y artistas del contenido original.
- Podría interrumpir los modelos comerciales existentes basados en la optimización de motores de búsqueda y la publicidad.
- Facilita la generación de noticias falsas.
- Hace que sea más fácil afirmar que la evidencia fotográfica real de un delito fue solo una falsificación generada por IA.
- Podría hacerse pasar por personas para ataques cibernéticos de ingeniería social más efectivos.
¿Cuáles son algunos ejemplos de herramientas de IA generativa?
Existen herramientas de IA generativa para diversas modalidades, como texto, imágenes, música, código y voces. Algunos generadores de contenido de IA populares para explorar incluyen los siguientes:
- Las herramientas de generación de texto incluyen GPT, Jasper, AI-Writer y Lex.
- Las herramientas de generación de imágenes incluyen Dall-E 2, Midjourney y Stable Diffusion.
- Las herramientas de generación de música incluyen Amper, Dadabots y MuseNet.
- Las herramientas de generación de código incluyen CodeStarter, Codex, GitHub Copilot y Tabnine.
- Las herramientas de síntesis de voz incluyen Descript, Listnr y Podcast.ai.
- Las empresas de herramientas de diseño de chips de IA incluyen Synopsys, Cadence, Google y Nvidia.
Casos de uso de IA generativa, por industria
Las nuevas tecnologías de IA generativa a veces se han descrito como tecnologías de propósito general similares a la energía de vapor, la electricidad y la informática porque pueden afectar profundamente a muchas industrias y casos de uso. Es esencial tener en cuenta que, al igual que las tecnologías de propósito general anteriores, a menudo las personas tardaron décadas en encontrar la mejor manera de organizar los flujos de trabajo para aprovechar el nuevo enfoque en lugar de acelerar pequeñas porciones de los flujos de trabajo existentes. Aquí hay algunas formas en que las aplicaciones de IA generativa podrían impactar en diferentes industrias:
- Finanzas puede observar transacciones en el contexto del historial de un individuo para construir mejores sistemas de detección de fraude.
- Las firmas legales pueden usar IA generativa para diseñar e interpretar contratos, analizar evidencia y sugerir argumentos.
- Los fabricantes pueden usar IA generativa para combinar datos de cámaras, rayos X y otras métricas para identificar las piezas defectuosas y las causas raíz de manera más precisa y económica.
- Las empresas de cine y medios pueden utilizar la IA generativa para producir contenido de manera más económica y traducirlo a otros idiomas con las propias voces de los actores.
- La industria médica puede utilizar la IA generativa para identificar candidatos a fármacos prometedores de manera más eficiente.
- Las empresas de arquitectura pueden utilizar la IA generativa para diseñar y adaptar prototipos con mayor rapidez.
- Las empresas de juegos pueden utilizar la IA generativa para diseñar el contenido y los niveles del juego.
GPT se une al panteón de tecnologías de propósito general
OpenAI, una empresa de investigación e implementación de IA, tomó las ideas centrales detrás de los transformadores para entrenar su versión, denominada Transformador preentrenado generativo o GPT, por sus siglas en inglés. Los observadores han notado que GPT es el mismo acrónimo que se usa para describir tecnologías de propósito general como la máquina de vapor, la electricidad y la computación. La mayoría estaría de acuerdo en que GPT y otras implementaciones de transformadores ya están haciendo honor a su nombre a medida que los investigadores descubren formas de aplicarlas a la industria, la ciencia, el comercio, la construcción y la medicina.
Ética y sesgo en la IA generativa
A pesar de su promesa, las nuevas herramientas generativas de IA abren una caja de pandora con respecto a la precisión, la confiabilidad, el sesgo, las alucinaciones y el plagio, cuestiones éticas que probablemente llevará años resolver. Ninguno de los problemas es particularmente nuevo para la IA. La primera incursión de Microsoft en los chatbots en 2016, llamada Tay, por ejemplo, tuvo que apagarse después de que comenzó a arrojar una retórica incendiaria en Twitter.
Lo que sí es nuevo es que la última cosecha de aplicaciones generativas de IA suena más coherente en la superficie. Pero esta combinación de lenguaje humano y coherencia no es sinónimo de inteligencia humana, y actualmente existe un gran debate sobre si los modelos generativos de IA pueden entrenarse para tener capacidad de razonamiento. Un ingeniero de Google incluso fue despedido después de declarar públicamente que la aplicación de inteligencia artificial generativa de la compañía, Language Models for Dialog Applications (LaMDA), era inteligente.
El realismo convincente del contenido generativo de IA introduce un nuevo conjunto de riesgos de IA. Hace que sea más difícil detectar el contenido generado por IA y, lo que es más importante, hace que sea más difícil detectar cuándo algo anda mal. Esto puede ser un gran problema cuando confiamos en los resultados de la IA generativa para escribir código o brindar asesoramiento médico. Muchos resultados de la IA generativa no son transparentes, por lo que es difícil determinar si, por ejemplo, infringen los derechos de autor o si hay un problema con las fuentes originales de las que obtienen los resultados. Si no sabe cómo la IA llegó a una conclusión, no puede razonar por qué podría estar equivocada.
IA generativa contra IA
La IA generativa produce contenido nuevo, respuestas de chat, diseños, datos sintéticos o falsificaciones profundas. La IA tradicional, por otro lado, se ha centrado en detectar patrones, tomar decisiones, perfeccionar análisis, clasificar datos y detectar fraudes.
La IA generativa, como se señaló anteriormente, a menudo utiliza técnicas de redes neuronales como transformadores, GAN y VAE. Otros tipos de IA, a diferencia, utilizan técnicas que incluyen redes neuronales convolucionales, redes neuronales recurrentes y aprendizaje por refuerzo.
La IA generativa a menudo comienza con una consulta que permite a un usuario o una fuente de datos enviar una pregunta inicial o un conjunto de datos para guiar la generación de contenido. Este puede ser un proceso iterativo para explorar variaciones de contenido. Los algoritmos de IA tradicionales procesan nuevos datos para devolver un resultado simple.
Historia de la IA generativa
El chatbot Eliza creado por Joseph Weizenbaum en la década de 1960 fue uno de los primeros ejemplos de IA generativa. Estas implementaciones tempranas utilizaron un enfoque basado en reglas que se rompió fácilmente debido a un vocabulario limitado, falta de contexto y una dependencia excesiva de los patrones, entre otras deficiencias. Los primeros chatbots también eran difíciles de personalizar y ampliar.
El campo experimentó un resurgimiento a raíz de los avances en las redes neuronales y el aprendizaje profundo en 2010, que permitieron que la tecnología aprendiera automáticamente a analizar texto existente, clasificar elementos de imagen y transcribir audio.
Ian Goodfellow introdujo las GAN en 2014. Esta técnica de aprendizaje profundo proporcionó un enfoque novedoso para organizar redes neuronales competidoras para generar y luego calificar variaciones de contenido. Estos podrían generar personas, voces, música y texto realistas. Esto inspiró interés –y temor– sobre cómo se podría usar la IA generativa para crear falsificaciones profundas realistas que suplantan voces y personas en videos.
Desde entonces, el progreso en otras técnicas y arquitecturas de redes neuronales ha ayudado a expandir las capacidades de IA generativa. Las técnicas incluyen VAE, memoria a corto plazo, transformadores, modelos de difusión y campos de radiación neural.
Mejores prácticas para usar IA generativa
Las mejores prácticas para usar IA generativa variarán según las modalidades, el flujo de trabajo y los objetivos deseados. Dicho esto, es importante considerar factores esenciales como la precisión, la transparencia y la facilidad de uso al trabajar con IA generativa. Las siguientes prácticas ayudan a lograr estos factores:
- Etiquete claramente todo el contenido generativo de IA para usuarios y consumidores.
- Verifique la precisión del contenido generado utilizando fuentes primarias cuando corresponda.
- Considere cómo el sesgo podría entretejerse en los resultados de IA generados.
- Vuelva a verificar la calidad del código y el contenido generados por IA utilizando otras herramientas.
- Conozca las fortalezas y limitaciones de cada herramienta de IA generativa.
- Familiarícese con los modos de falla comunes en los resultados y solucione estos.
El futuro de la IA generativa
La increíble profundidad y facilidad de ChatGPT se han mostrado tremendamente prometedoras para la adopción generalizada de la IA generativa. Sin duda, también ha demostrado algunas de las dificultades para implementar esta tecnología de manera segura y responsable. Pero estos problemas de implementación temprana han inspirado la investigación de mejores herramientas para detectar texto, imágenes y video generados por IA. La industria y la sociedad también construirán mejores herramientas para rastrear la procedencia de la información para crear una IA más confiable.
Además, las mejoras en las plataformas de desarrollo de IA ayudarán a acelerar la investigación y el desarrollo de mejores capacidades generativas de IA en el futuro para texto, imágenes, video, contenido 3D, medicamentos, cadenas de suministro, logística y procesos comerciales. A pesar de lo buenas que son estas nuevas herramientas únicas, el impacto más significativo de la IA generativa provendrá de la incorporación de estas capacidades directamente en las versiones de las herramientas que ya usamos.
Los correctores gramaticales van a mejorar. Las herramientas de diseño integrarán a la perfección recomendaciones más útiles directamente en los flujos de trabajo. Las herramientas de capacitación podrán identificar automáticamente las mejores prácticas en una parte de la organización para ayudar a capacitar a otros de manera más eficiente. Y estas son solo una fracción de las formas en que la IA generativa cambiará la forma en la que se trabaja.
Preguntas frecuentes sobre IA generativa
A continuación se presentan algunas preguntas frecuentes que la gente tiene sobre la IA generativa.
¿Quién creó la IA generativa?
Joseph Weizenbaum creó la primera IA generativa en la década de 1960 como parte del chatbot Eliza.
Ian Goodfellow demostró redes antagónicas generativas para generar personas de aspecto y sonido realistas en 2014.
La investigación posterior sobre LLM de Open AI y Google encendió el entusiasmo reciente que se ha convertido en herramientas como ChatGPT, Google Bard y Dall-E.
¿Cómo podría la IA generativa reemplazar los trabajos?
La IA generativa tiene el potencial de reemplazar una variedad de trabajos, incluidos los siguientes:
- Redacción de descripciones de productos.
- Creación de textos de márketing.
- Generación de contenidos web básicos.
- Iniciación del alcance interactivo de las ventas.
- Contestación de preguntas de los clientes.
- Realización de gráficos para páginas web.
Algunas empresas buscarán oportunidades para reemplazar a los humanos cuando sea posible, mientras que otras utilizarán la IA generativa para aumentar y mejorar su fuerza laboral existente.
¿Cómo se construye un modelo generativo de IA?
Un modelo de IA generativo comienza codificando de manera eficiente una representación de lo que desea generar. Por ejemplo, un modelo generativo de IA para texto podría comenzar por encontrar una manera de representar las palabras como vectores que caractericen la similitud entre las palabras que se usan a menudo en la misma oración o que significan cosas similares.
El progreso reciente en la investigación LLM ha ayudado a la industria a implementar el mismo proceso para representar patrones que se encuentran en imágenes, sonidos, proteínas, ADN, medicamentos y diseños 3D. Este modelo generativo de IA proporciona una manera eficiente de representar el tipo de contenido deseado y de iterar de manera eficiente sobre variaciones útiles.
¿Cómo se entrena un modelo de IA generativa?
El modelo de IA generativa necesita ser entrenado para un caso de uso particular. El progreso reciente en LLM proporciona un punto de partida ideal para personalizar aplicaciones para diferentes casos de uso. Por ejemplo, el popular modelo GPT desarrollado por OpenAI se ha utilizado para escribir texto, generar código y crear imágenes basadas en descripciones escritas.
El entrenamiento implica ajustar los parámetros del modelo para diferentes casos de uso y luego ajustar los resultados en un conjunto dado de datos de entrenamiento. Por ejemplo, un centro de llamadas podría entrenar a un chatbot con los tipos de preguntas que los agentes de servicio reciben de varios tipos de clientes y las respuestas que los agentes de servicio dan a cambio. Una aplicación de generación de imágenes, a diferencia del texto, podría comenzar con etiquetas que describen el contenido y el estilo de las imágenes para entrenar al modelo para generar nuevas imágenes.
¿Cómo está cambiando la IA generativa el trabajo creativo?
La IA generativa promete ayudar a los trabajadores creativos a explorar variaciones de ideas. Los artistas pueden comenzar con un concepto de diseño básico y luego explorar variaciones. Los diseñadores industriales podrían explorar variaciones de productos. Los arquitectos podrían explorar diferentes diseños de edificios y visualizarlos como un punto de partida para un mayor refinamiento.
También podría ayudar a democratizar algunos aspectos del trabajo creativo. Por ejemplo, los usuarios comerciales podrían explorar imágenes de márketing de productos utilizando descripciones de texto y podrían refinar aún más estos resultados usando comandos o sugerencias simples.
¿Qué sigue para la IA generativa?
La capacidad de ChatGPT para generar texto similar al humano ha despertado una gran curiosidad sobre el potencial de la IA generativa. También arrojó luz sobre los muchos problemas y desafíos que se avecinan.
A corto plazo, el trabajo se centrará en mejorar la experiencia del usuario y los flujos de trabajo utilizando herramientas de IA generativa. También será fundamental generar confianza en los resultados de la IA generativa.
Muchas empresas también personalizarán la IA generativa en sus propios datos para ayudar a mejorar la marca y la comunicación. Los equipos de programación utilizarán IA generativa para hacer cumplir las mejores prácticas específicas de la empresa para escribir y formatear código más legible y coherente.
Los proveedores integrarán capacidades de IA generativa en sus herramientas adicionales para optimizar los flujos de trabajo de generación de contenido. Esto impulsará la innovación sobre cómo estas nuevas capacidades pueden aumentar la productividad.
La IA generativa también podría desempeñar un papel en varios aspectos del procesamiento, la transformación, el etiquetado y la verificación de datos como parte de los flujos de trabajo de análisis aumentados. Las aplicaciones de la web semántica podrían usar IA generativa para mapear automáticamente taxonomías internas que describen habilidades laborales a diferentes taxonomías en sitios de capacitación y contratación de habilidades. De manera similar, los equipos de negocios usarán estos modelos para transformar y etiquetar datos de terceros para evaluaciones de riesgo más sofisticadas y capacidades de análisis de oportunidades.
En el futuro, los modelos generativos de IA se ampliarán para admitir el modelado 3D, el diseño de productos, el desarrollo de fármacos, los gemelos digitales, las cadenas de suministro y los procesos comerciales. Esto facilitará la generación de nuevas ideas de productos, la experimentación con diferentes modelos organizativos y la exploración de diversas ideas de negocio.
Definición de la más reciente tecnología de IA
Arte de IA (arte de inteligencia artificial)
El arte de IA es cualquier forma de arte digital creada o mejorada con herramientas de IA. Leer más.
Auto-GPT
Auto-GPT es un agente experimental de IA autónomo de código abierto basado en el modelo de lenguaje GPT-4 que encadena tareas de forma autónoma para lograr un objetivo general establecido por el usuario. Leer más.
Experiencia generativa de búsqueda de Google
La experiencia generativa de búsqueda de Google (SGE) es un conjunto de capacidades de búsqueda e interfaz que integra resultados generativos impulsados por IA en las respuestas de consulta del motor de búsqueda de Google. Leer más.
Q-learning
Q-learning es un enfoque de aprendizaje automático que permite que un modelo aprenda y mejore iterativamente con el tiempo al tomar la acción correcta. Leer más.
Google Search Labs (GSE)
GSE es una iniciativa de la división de Google de Alphabet para proporcionar nuevas capacidades y experimentos para la Búsqueda de Google en un formato de vista previa antes de que estén disponibles públicamente. Leer más.
Puntuación de origen
La puntuación de origen (IS, por inception score) es un algoritmo matemático que se utiliza para medir o determinar la calidad de las imágenes creadas por la IA generativa a través de una red antagónica generativa (GAN). La palabra "origen" se refiere a la chispa de la creatividad o comienzo inicial de un pensamiento o acción tradicionalmente experimentada por los humanos. Leer más.
Aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF)
RLHF es un enfoque de aprendizaje automático que combina técnicas de aprendizaje por refuerzo, como recompensas y comparaciones, con orientación humana para capacitar a un agente de IA. Leer más.
Autocodificador variacional (VAE)
Un autocodificador variacional es un algoritmo de IA generativa que utiliza el aprendizaje profundo para generar nuevos contenidos, detectar anomalías y eliminar el ruido. Leer más.
¿Cuáles son algunos modelos generativos para el procesamiento del lenguaje natural?
Algunos modelos generativos para el procesamiento del lenguaje natural incluyen los siguientes:
- XLNet de la Universidad Carnegie Mellon
- GPT de OpenAI (Transformador preentrenado generativo)
- ALBERT de Google ("A Lite" BERT)
- BERT de Google
- Google LaMDA
¿Algún día la IA ganará conciencia?
Algunos defensores de la IA creen que la IA generativa es un paso esencial hacia la IA de propósito general e incluso hacia la consciencia. Uno de los primeros probadores del chatbot LaMDA de Google incluso creó un gran revuelo cuando declaró públicamente que era inteligente. Luego lo despidieron de la empresa.
En 1993, el escritor de ciencia ficción y científico informático estadounidense Vernor Vinge postuló que en 30 años tendríamos la capacidad tecnológica para crear una "inteligencia sobrehumana", una IA que fuera más inteligente que los humanos, después de lo cual la era humana terminaría. El pionero de la IA, Ray Kurzweil, predijo tal "singularidad" para 2045.
Muchos otros expertos en inteligencia artificial creen que podría estar mucho más lejos. El pionero de los robots, Rodney Brooks, predijo que la IA no obtendrá la inteligencia de un niño de 6 años durante su vida, pero podría parecer tan inteligente y atenta como un perro para 2048.
Nota del editor: este artículo se actualizó en septiembre de 2023. El texto final ha sido revisado, verificado, editado y aprobado por Editores de TechTarget.