A día de hoy, es bastante complicado tener una conversación mediante llamadas de voz o vídeo si nuestro interlocutor habla un idioma desconocido para nosotros. Sin un intérprete, la comunicación se hace casi imposible, haciéndonos depender de terceros para entendernos. Pues bien, esto está a punto de cambiar, y es que la inteligencia artificial NVIDIA, Maxine, ya puede traducir tu voz en tiempo real, entre otras muchas mejoras.
Pero además de esta impresionante tecnología capaz de traducir en tiempo real, NVIDIA Maxine cuenta con otras bondades. Una de ellas es la capacidad de apuntar la mirada del hablante en dirección a la cámara. Todo esto, por su puesto, a través de la inteligencia artificial. De esta forma, siempre parecerá que estás viendo a los oyentes, incluso si estás mirando hacia otro lado.
NVIDIA asegura que Maxine estará disponible próximamente para todos los usuarios del mundo. De esta forma, no serán solo unos pocos los que puedan disfrutar de ella. Desde su presentación oficial, la inteligencia artificial captó la mirada de los entusiastas por la tecnología, y con razón. NVIDIA Maxine puede ofrecer una mejora sin precedentes a la forma en la que nos comunicamos con otros seres humanos alrededor del mundo.
Las funciones principales de realidad aumentada disponibles en NVIDIA Maxine se dividen entre las siguientes:
- Seguimiento facial
- Seguimiento de puntos de referencia
- Malla facial
- Estimación de la pose corporal
- Contacto visual
- Estimación de la expresión facial
NVIDIA Maxine llega para cambiar el juego, pero todavía le queda mucho por mejorar
Hasta ahora, quienes han podido probar esta inteligencia artificial, han llegado a una conclusión bastante parecida, y es que se trata de una herramienta más que interesante, pero que todavía le queda mucho por pulir. Sin embargo, considerando que apenas está en desarrollo y ni siquiera cuenta con un lanzamiento oficial, NVIDIA Maxine es una propuesta bastante sorprendente.
La función denominada como Eye Contact es uno de sus aspectos más llamativos. Al tenerla activada, tu mirada pasará a observar de forma directa —pero natural— a la cámara. Asimismo, emula pestañeos, posición y forma de los ojos; mientras que permite enfocar los ojos según varíe la posición de la cara. Mientras todo esto sucede, puedes tener tu mirada apuntando a cualquier lado, ya que NVIDIA Maxine se encarga de corregirla para el resto de participantes.
El procesamiento de NVIDIA Maxine, eso sí, no estará al alcance de todos. Según Alex Qi, una de las responsables del equipo de software detrás de esta inteligencia artificial, la herramienta cuenta con algunos requisitos básicos para funcionar. Uno de ellos es una cámara web, como es lógico, pero también una tarjeta gráfica de la serie RTX de NVIDIA. Sin embargo, existen formas de ejecutar la herramienta en cualquier ordenador, gracias a la delegación de la señal de vídeo en otros centros de dato que se encargarán de su procesamiento.
"NVIDIA Maxine es el conjunto de un SDK de IA acelerado en la GPU y microservicios nativos en la nube para implementar funciones de IA que mejoran los efectos de audio, vídeo y realidad aumentada en tiempo real. Los modelos de última generación de Maxine crean efectos de alta calidad que pueden lograrse con equipos con micrófono y cámara estándar."
NVIDIA
Una IA con mucho futuro
Si bien la función de Eye Contact es la más popular de NVIDIA Maxine, no es la única. Además, la inteligencia artificial te permite mejorar el audio al eliminar el ruido de fondo y el eco. Además, también podrás aplicar mejoras a la resolución, establecer un fondo virtual para tu imagen, y traducir de forma instantánea entre idiomas como el inglés, francés, español, alemán y otros más.
Tal vez algún día veamos esta misma tecnología integrada en programas como Zoom, Discord, Skype o Teams. Después de todo, NVIDIA Maxine permitiría llevar más allá la comunicación entre personas, incluso si no hablan el mismo idioma.