Meta utiliza diferentes sentidos humanos para generar contenido

Meta anunció el lanzamiento de un modelo de Inteligencia Artificial (IA) que Crea contenidos basados en estudios de los sentidos humanos. EL El proyecto ImageBind es un sistema que analiza datos multisensoriales, como la visión y la percepción de profundidad, de forma similar al cerebro humano, transformándolos en información para generar una acción.

LEA TAMBIÉN: “Los expertos piden detener el avance de la IA”

LEA TAMBIÉN: “4 plataformas de IA para la ejecución de tareas

 Enlace de imagen, el primer modelo de IA capaz de vincular información de seis modalidadesEl modelo aprende un único espacio de representación o incrustación compartido no solo para texto, imagen/video y audio, sino también para sensores que registran profundidad (3D), radiación térmica (radiación infrarroja) y unidades de medición inercial (IMU), que calculan el movimiento y la posición. ImageBind proporciona a las máquinas una comprensión holística que conecta los objetos de una fotografía con cómo sonarán, su forma 3D, qué tan calientes o fríos están y cómo se mueven.

Todos estos datos se recopilan automáticamente y se utilizan para calcular la siguiente acción, sin necesidad de supervisión humana. Los metacientíficos creen que un modelo de este tipo podría superar las pruebas previas realizadas con máquinas especializadas entrenadas por humanos; después de todo, el aprendizaje automático puede prescindir de la interferencia externa.

ImageBind es parte de los esfuerzos de Meta para crear sistemas de IA multimodales que aprenden de todos los tipos de datos posibles que los rodean. A medida que aumenta el número de modalidades, ImageBind abre las compuertas para que los investigadores intenten desarrollar nuevos sistemas holísticos, como la combinación de sensores 3D e IMU para diseñar o experimentar mundos virtuales inmersivos. ImageBind también puede proporcionar una forma enriquecedora de explorar recuerdos: buscando fotos, vídeos, archivos de audio o mensajes de texto utilizando una combinación de texto, audio e imágenes.

ImageBind en la práctica

Para comprender mejor cómo funciona ImageBind, imaginemos un robot que carga un tren de mercancías y manipula líquidos inflamables. Una máquina convencional seguiría realizando su función indefinidamente, pero un robot equipado con la IA de Meta podría alertar a los técnicos humanos al detectar una variación de temperatura. El asistente robótico asociaría este hallazgo con el sonido de una explosión y la detección visual de fuego dentro del vagón para tomar una decisión. Dependiendo del entrenamiento del algoritmo del robot, este podría decidir por sí mismo qué hacer. ¿Debería simplemente alejarse? ¿Tomar un extintor? ¿Apagar el circuito eléctrico? ¿Ordenar a los humanos que evacuen? Todas las decisiones se basarían en cálculos matemáticos que involucran probabilidades y estadísticas asociadas con datos holísticos.

Meta entiende que hay mucho por descubrir sobre el aprendizaje multimodal. La comunidad investigadora de IA aún necesita cuantificar eficazmente los comportamientos de escalamiento que solo aparecen en modelos más grandes y comprender sus aplicaciones. ImageBind supone un paso hacia su evaluación rigurosa y la demostración de nuevas aplicaciones en la generación y recuperación de imágenes.

VER TAMBIÉN: “Servicio humanizado o automático: ¿cuál es la mejor opción?”

VER TAMBIÉN: LinkedIn despedirá a 700.000 empleados y cerrará su aplicación en China.

Publicaciones relacionadas

Shopify: contratações só após teste com IA

Shopify: Contratación solo después de pruebas de IA.

Google une IA generativa e busca tradicional: o novo passo na disputa contra o ChatGPT

Google combina inteligencia artificial generativa y búsqueda tradicional: el siguiente paso en la batalla contra ChatGPT.

‘IA agêntica’: o modelo que amplia a integração entre robôs e humanos

‘Agente AI’: el modelo que amplía la integración entre robots y humanos.

Matrix Go lança Morpheus e aposta na IA Agêntica

Matrix Go lanza Morpheus y apuesta por la IA de agencia.

“Misión Génesis”: un nuevo hito de mil millones de dólares para liderar la carrera global de la IA.

Amazon e IA: expansão bilionária impulsiona infraestrutura global

Amazon y la IA: una expansión de mil millones de dólares impulsa la infraestructura global.