IAaaS: El emergente mercado de la Inteligencia Artificial como servicio
mayo 20, 2023
Sneaker X de Cooler Master: un zapato que es una verdadera CPU
mayo 23, 2023

Meta desarrolla ImageBind

Meta desarrolla ImageBind

Meta desarrolló ImageBind, el primer modelo de Inteligencia Artificial que vincula información de 6 modalidades distintas: texto, imagen, audio, profundidad, temperatura e inercia.

NOTICIAS: MARTORELL OFFICE

Meta ha presentado ImageBind, una nueva propuesta basada en Inteligencia Artificial (IA) que representa un avance significativo hacia la capacidad multisensorial de aprendizaje de los seres humanos por parte de las máquinas. ImageBind permite a las máquinas adquirir información de manera simultánea, holística y directa a partir de múltiples fuentes de información, eliminando la necesidad de una supervisión explícita. Con este enfoque innovador, Meta busca acercar aún más a las máquinas a la forma en que los seres humanos procesamos y asimilamos diferentes tipos de información de manera natural y eficiente.

La compañía aseguró que ImageBind es el primer modelo de IA capaz de vincular información de seis modalidades: texto, imagen/video, audio, medición de profundidad (3D), de temperatura (radiación infrarroja) y mediciones inerciales (IMU), las cuales calculan el movimiento y la posición.

ImageBind equipa a las máquinas con una comprensión holística que conecta los objetos en una foto con cómo sonarán, su forma 3D, qué tan cálidos o fríos están y cómo se mueven.

De acuerdo con Meta, ImageBind supera a los modelos especializados anteriores, los cuales estaban entrenados individualmente para una modalidad en particular, y lo más importante es que ayuda a avanzar en la Inteligencia Artificial al permitir que las máquinas analicen mejor muchas formas diferentes de información juntas.

Así, desarrollará exponencialmente la Inteligencia Artificial Generativa, ya que, según la empresa, al usar ImageBind, Make-A-Scene será capaz de crear imágenes a partir de un audio, como una imagen basada en los sonidos de una selva tropical o un mercado bullicioso.

Mientras que otras posibilidades futuras incluyen formas más precisas de reconocer, conectar y moderar contenido, impulsar el diseño creativo, así como generar medios más ricos de manera más fluida y funciones de búsqueda multimodal más amplias.

ImageBind es parte de los esfuerzos de Meta por crear sistemas de IA multimodales que aprenden de todos los tipos de datos posibles a su alrededor y representa un paso importante hacia la construcción de máquinas que puedan analizar diferentes tipos de datos de manera integral, como lo hacen los humanos.

A medida que aumenta el número de modalidades, ImageBind abre las compuertas para que los investigadores intenten desarrollar nuevos sistemas holísticos, como la combinación de sensores 3D e IMU para diseñar o experimentar mundos virtuales inmersivos.

ImageBind también podría proporcionar una forma rica de explorar recuerdos: buscar imágenes, videos, archivos de audio o mensajes de texto a través de una combinación de texto, audio e imágenes.





Fuente de la noticia: america-retail

Comments are closed.