
Sergio Borromei, director de tecnología de Lagash, explicó
las características de este proceso y sus consecuencias en las personas y las
organizaciones
Internet está en plena transición de un formato donde
predominaba el texto hacia otro donde crece la influencia del audio y el video.
Durante años, esta versión multimedia de la Red ganó terreno contra la Internet
basado en texto. Sin embargo, entre 2017 y 2018 ese proceso se aceleró y ahora
el audio y el video son imparables.
Sergio Borromei, director de tecnología de Lagash, empresa
especializada en desarrollo de tecnologías de realidad aumentada, inteligencia
artificial y robótica, sobre este proceso y sus consecuencias en las personas y
las organizaciones.
- Durante años, la Internet multimedia ganó terreno sobre la
Red basado en texto. Sin embargo, entre 2017 y 2018 este proceso se aceleró en
forma dramática y ahora el audio y el video son imparables. ¿Cuáles son las
causas de este proceso?
- Este proceso se da por dos causas principales: por una
lado, la infraestructura y el desarrollo tecnológico, que amplificaron
exponencialmente las capacidades de streaming de audio/video sobre redes 3G/4G
e hicieron un algoritmo muy sofisticado de compresión para sea más simple, ágil
y rápido generar y compartir audios o videos por celular que tipear un texto en
un teclado minúsculo y ocupando las manos.
Por otro lado, hay una causa vinculada al contenido, porque
a través de un audio o un video podemos transmitir muchas otras cosas de forma
inmediata que en formato texto, como por ejemplo, emociones, contexto de
lugares o cosas, entre otras muchas mas.
Y entonces, al hacer mas práctico y sencillo el uso desde lo
técnico, muchas personas optan por transmitir en audio y video. Con la llegada
próxima del 5G, seguramente veremos este proceso acelerarse mas aún.
- ¿Puedes compartir un ejemplo de este proceso con alguno de
los clientes de tu empresa o dentro de tu organización? Me refiero a interfaces
basadas en multimedia en lugar de texto, tanto en aplicaciones como páginas web
u otras herramientas tecnológicas.
- Hace unos años desarrollamos para Worknet la app que
buscaba reemplazar el curriculum vitae con un video, brindando la posibilidad
al postulante de contar su historia profesional.
Por otro lado, en la realidad aumentada y la realidad mixta
también hemos experimentado con esta forma de yuxtaposición del texto sobre el
contenido, en este caso, de la misma realidad observada. No obstante el
"input" del usuario necesariamente ocurre a través de comandos de voz
o gestos.
Actualmente la industria se encuentra en un ciclo acelerado
de aprendizaje constante donde creamos tecnología, aprendemos del resultado de
su aplicación, y luego volcamos ese aprendizaje en el inicio de un nuevo ciclo
creativo.
- Asistentes de voz, celulares que detectan el rostro del
usuario, la inteligencia artificial para buscar fotografías o traducir la
lengua hablada, y la realidad aumentada son avances que se basan en las
cámaras, los micrófonos, la voz, los oídos y los ojos. ¿Estos desarrollos
provocarán la muerte del texto como interfaz del usuario?
- Es cierto que en el último tiempo hemos visto una
evolución de interfaces que permiten evitar tener que escribir texto. Sin
embargo, si de-construimos el mero acto de escribir, el teclado funciona como
una extensión del pensamiento.
Tipeo, vuelvo atrás, corrijo la gramática, escribo
nuevamente, re-leo y vuelvo a escribir. Esa dinámica es constitutiva del
pensamiento y aún resulta difícil de reemplazar o mejorar mediante un
algoritmo.
No obstante, no resulta muy arriesgado imaginarnos un futuro
cercano donde asistentes virtuales de voz puedan lograr esa misma dinámica con
el pensamiento, entablando un diálogo fluido con el usuario e incluso
aumentando su capacidad reflexiva. Hoy la inteligencia artificial es muy
eficiente para predecir o entender las intenciones de un usuario...
¿Llegaremos a un estado de arte en que la AI sea tan buena
para generar preguntas que nos hagan reflexionar? Probablemente para ese
momento la interfaz de texto escrito no sea tan necesaria.
- ¿Cuáles son las posibilidades más cinéticas de esta
cultura en línea donde el texto se queda en el fondo, y los sonidos y las
imágenes se convierten en el lenguaje universal?
- El texto nos constituye como seres humanos y nos otorga
sentido. Nuestro pensamiento es texto... la configuración lingüística es
nuestra forma de relacionarnos con la realidad y darle sentido a las cosas, e
incluso nos limita. Wittgenstein nos decía "los límites de mi lenguaje
significan los límites de mi mundo".
En ese sentido, sería impensable "lo humano" tal
como lo conocemos por fuera del lenguaje o el texto, o en palabras de Jaques
Derrida, "nada hay fuera del texto". Por lo tanto, podríamos decir
que el texto siempre existirá, probablemente oculto en nuevas formas, pero
texto al fin.
Entonces la pregunta que surge es si esta nueva forma de
texto nos permitirá pensar mas rápido y mediante esa velocidad adquirida lograr
expandir los límites de nuestro mundo. Del pensamiento surge la predicción,
analizar las diversas posibilidades de futuro y otorgarles una probabilidad.
¿Podremos predecir con mayor certeza?
- ¿Ahora es más fácil comunicarse con las máquinas a través
de imágenes y sonidos que mediante texto? ¿Quiénes usan más estas interfaces
multimedia? Por ejemplo, ¿los millennials?
- Es curioso ver las cifras de adopción de asistentes
virtuales como Siri. Según estudios se ha revelado que sólo un 15% de los
usuarios de IPhone usan a Siri muy frecuentemente, pero muy rara vez lo hacen
público. Por otro lado el 70% que lo utiliza lo hace cuando está conduciendo.
Esto sugiere un indicador de que su utilidad aún no logra
superar el pudor que supone hablar con una máquina. Seguramente esto cambie en
la medida que vayamos naturalizando esta experiencia al recibir a cambio un
servicio de mayor utilidad. Me imagino que para personas de edad avanzada o con
problemas motrices hay un potencial enorme para brindar soluciones innovadoras.
- La confusión de la desinformación que pesa sobre la vida
en línea, ¿empeorará con este mundo multimedia?
- Boris Groys dice que la vida humana puede describirse como
un diálogo prolongado con el mundo. El hombre interroga al mundo y es
interrogado por él. Este diálogo es regulado por la forma en que definimos las
preguntas válidas que dirigimos al mundo y por los modos en que podemos
identificar las respuestas relevantes a esas preguntas. Si creemos que los
OVNIS existen, hacemos preguntas diferentes y esperamos respuestas diferentes
de las que aquellos que no lo creen.
Esto exacerba en la actualidad ya que mantenemos un diálogo
con el mundo fundamentalmente a través de Internet. Si queremos dialogar con el
mundo, usamos Google, Facebook o cualquier otra red social.
Sin embargo la construcción de sentido a través de Google o
Facebook no depende solamente de supuestos metafísicos e ideológicos, sino
además de la ocurrencia de una sentencia en un determinado contexto, tus
hábitos de búsqueda y la afinidad de tu perfil con otros perfiles de
características similares.
Una misma imagen e incluso un texto pueden ser interpretados
de manera diferentes en contextos de usuarios diferentes. El gran desafío de
las nuevas generaciones será superar el aislamiento confortable de su contexto
para realizar su propia construcción de sentido.
Fuente: https://www.iprofesional.com/tecnologia/285800-5g-app-celular-Cuando-la-imagen-y-el-sonido-reemplazaran-al-texto-en-Internet