Inicio Innovación El poder de las redes convolucionales gráficas de fusión y división

El poder de las redes convolucionales gráficas de fusión y división

Por

3 de junio de 2024

Investigadores de la Universidad de Tecnología de Chongqing, en colaboración con expertos internacionales, han desarrollado un método innovador para mejorar el reconocimiento de interacciones. El estudio, publicado en Cyborg and Bionic Systems, introduce la Red de Convolución Gráfica de Fusión y División (MS-GCN), un enfoque novedoso diseñado para abordar las complejidades del reconocimiento de interacciones basadas en esqueletos.

El reconocimiento de interacciones humanas es crucial en diversas aplicaciones, desde la mejora de interfaces hombre-máquina hasta la optimización de sistemas de vigilancia. Los métodos tradicionales, que suelen depender de datos RGB, enfrentan problemas como cambios de iluminación y oclusiones, dificultando un reconocimiento preciso.

Estructura de fusión y división: Esta estructura fusiona la información de las articulaciones de los individuos que interactúan en un espacio de características unificado, permitiendo un análisis holístico de las interacciones. Mapea los nodos de conjuntos jerárquicos correspondientes de dos individuos en el mismo espacio semántico, facilitando un reconocimiento más preciso de movimientos específicos de la interacción.
Atención guiada jerárquica: Este componente enfatiza la importancia de diferentes conjuntos jerárquicos según su relevancia para la interacción. Por ejemplo, en acciones como el saludo con la mano, se centra más en los conjuntos jerárquicos que involucran las manos, asegurando que no se pierdan características críticas del movimiento.
Módulo de dependencia a corto plazo: Reconociendo que las variaciones a corto plazo en el movimiento pueden ser cruciales para distinguir entre acciones similares, como un apretón de manos y un «choca esos cinco», este módulo mejora la sensibilidad del modelo a estas diferencias sutiles.

La efectividad de la MS-GCN se destaca por su rendimiento en dos conjuntos de datos reconocidos, NTU60 y NTU120, donde logró resultados de vanguardia. El enfoque ha sido validado rigurosamente a través de extensos experimentos, demostrando su superioridad sobre los métodos existentes en escenarios de interacción dual e individual.

A medida que los robots y sistemas de IA se integran cada vez más en la vida diaria, su capacidad para entender e interactuar con los humanos de manera matizada y significativa es fundamental. La MS-GCN no solo avanza en el campo del reconocimiento de acciones, sino que también abre nuevas vías para el desarrollo de sistemas de IA más intuitivos y receptivos.

Fuente

El poder de las redes convolucionales gráficas de fusión y división

DEJA UNA RESPUESTA Cancelar respuesta

Incluso más noticias

Los gobiernos están difundiendo desinformación para alimentar la negación climática y...

Diagnóstico superhumano, Tinder escanea rostros, fuga de usuarios en Windows, ley...

Primera terapia regenerativa para pérdida auditiva neurosensorial recibe autorización para ensayos...

CATEGORÍA POPULAR

Científicos logran transferir datos instantáneamente entre máquinas utilizando teletransportación cuántica

Códigos QR comestibles impresos en 3D para comidas personalizadas

Microsoft confía en que Windows en ARM podría finalmente superar a...

Paneles solares reciclados sin productos químicos tóxicos con un 99% de...