DolphinGemma, un modelo de lenguaje desarrollado por Google, está ayudando a los científicos a estudiar cómo se comunican los delfines, con la esperanza de entender el significado de sus vocalizaciones.

Desde hace décadas, la comunidad científica ha intentado desentrañar los clicks, silbidos y pulsos acústicos de los delfines. Hoy, coincidiendo con el Día Nacional del Delfín, Google, en colaboración con investigadores del Instituto Tecnológico de Georgia y el Proyecto de Delfines Silvestres, ha anunciado progresos en DolphinGemma, un modelo de IA que se entrena para aprender la estructura de las vocalizaciones de los delfines y generar nuevas secuencias de sonido similares.

Investigación sobre la sociedad de los delfines

Para entender a cualquier especie, es necesario tener un contexto profundo. Desde 1985, el Proyecto de Delfines Silvestres ha llevado a cabo el estudio de investigación submarina más prolongado del mundo, observando a una comunidad específica de delfines manchados atlánticos en las Bahamas. Esta investigación no invasiva ha generado un rico conjunto de datos que incluye décadas de video y audio, además de identidades, historias de vida y comportamientos observados de los delfines.

El enfoque principal del proyecto es observar y analizar la comunicación y las interacciones sociales naturales de los delfines. Esto permite correlacionar tipos de sonido con contextos de comportamiento, incluyendo:

  • Silbidos de firma: utilizados por madres y crías para reunirse.
  • «Chirridos» de pulsos: frecuentemente escuchados durante peleas.
  • «Zumbidos» de clicks: que se usan a menudo durante el cortejo o la caza de tiburones.

Conocer a los delfines individuales involucrados es crucial para interpretar con precisión estas vocalizaciones. El objetivo final de este trabajo es entender la estructura y posible significado de las secuencias de sonido naturales, buscando patrones que podrían indicar un lenguaje.

Introduciendo DolphinGemma

Analizar la compleja comunicación natural de los delfines es una tarea monumental, y el amplio conjunto de datos anotados del Proyecto de Delfines Silvestres ofrece una oportunidad única para la IA moderna.

El modelo DolphinGemma utiliza tecnologías de audio de Google, como el tokenizador SoundStream, que permite representar de manera eficiente los sonidos de los delfines. Este modelo, de aproximadamente 400 millones de parámetros, está diseñado para ejecutarse directamente en los teléfonos Pixel que el proyecto utiliza en el campo.

DolphinGemma es un modelo de audio-in y audio-out que procesa secuencias de sonidos naturales de delfines para identificar patrones y estructuras, y, en última instancia, predecir los sonidos que probablemente seguirán en una secuencia. Esta funcionalidad se asemeja a cómo los modelos de lenguaje para el idioma humano predicen la siguiente palabra en una oración.

Usando teléfonos Pixel para escuchar y analizar sonidos de delfines

Además de analizar la comunicación natural, el proyecto también está explorando la posibilidad de interacción bidireccional utilizando tecnología en el océano. Este esfuerzo llevó al desarrollo del sistema CHAT (Cetacean Hearing Augmentation Telemetry), diseñado para establecer un vocabulario compartido con los delfines, utilizando silbidos sintéticos asociados con objetos que a los delfines les gusta.

El modelo CHAT necesita primero:

  1. Escuchar el mimetismo de los silbidos con precisión en medio del ruido del océano.
  2. Identificar qué silbido fue imitado en tiempo real.
  3. Informar al investigador sobre el objeto «solicitado» por el delfín a través de auriculares que funcionan bajo el agua.
  4. Permitir que el investigador responda rápidamente ofreciendo el objeto correcto.

Un Google Pixel 6 está realizando el análisis de alta fidelidad de los sonidos de los delfines en tiempo real, y una próxima generación, centrada en un Google Pixel 9, buscará mejorar esta interacción.

Compartiendo DolphinGemma con la comunidad de investigación

Google planea compartir DolphinGemma como un modelo abierto este verano, con la expectativa de que sea útil para investigadores que estudian otras especies de cetáceos. Proporcionar herramientas como DolphinGemma tiene como objetivo acelerar la búsqueda de patrones en los conjuntos de datos acústicos y profundizar en la comprensión de estos inteligentes mamíferos marinos.

El camino para entender la comunicación de los delfines es largo, pero la combinación de investigaciones de campo dedicadas, la experiencia técnica del Instituto Tecnológico de Georgia y la potencia de la tecnología de Google están abriendo nuevas posibilidades emocionantes. Ya no solo estamos escuchando, sino comenzando a entender los patrones dentro de los sonidos, allanando el camino para un futuro donde la comunicación entre humanos y delfines podría acercarse un poco más.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí