Ciencia 15

Comentarios intrascendentes a noticias científicas y técnicas de los últimos quince días (más o menos)
Archivos
<Noviembre 2025
Lu Ma Mi Ju Vi Sa Do
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
             

Documentos

Blogalia

Blogalia

Inicio > Historias > Adobe VoCo. El editor de voz que desafía la realidad
Adobe VoCo. El editor de voz que desafía la realidad 2025-08-24

En 2017 comencé mis intervenciones de verano en el programa de Eduardo Yáñez «Déjame que te cuente», en Onda Cero, en julio. En estas entradas reproduciré las notas que usé para hablar, no es exactamente lo que dije.

Adobe VoCo. El editor de voz que desafía la realidad

Hola, buenas noches.

Todos estamos acostumbrados a lo que llamamos «voz robótica»: esa voz metálica, monótona, con escasos matices y ritmo algo lento, aunque con una vocalización impecable. Durante décadas, los sintetizadores de voz que convertían texto en audio eran bastante rudimentarios. Y ojo, no lo digo como crítica: eran auténticas hazañas tecnológicas. Lograban reproducir el habla humana con una precisión sorprendente para su época. Pero claro, si los comparamos con una conversación real entre personas, quedaban muy lejos.

Recuerdo que en la Universidad Politécnica de Valencia se realizaron experimentos muy interesantes. En lugar de generar sílabas completas, se trabajaba con «semisílabas», lo que permitía una entonación mucho más natural. Un enfoque ingenioso que acercaba la voz sintética a la humana.

Y hablando de avances, en 2016 Adobe —sí, la misma empresa detrás de Photoshop— presentó en su evento Adobe MAX un editor de voz revolucionario: VoCo, abreviatura de Voice Conversion. Lo llamaron el «Photoshop de la voz», y no era exageración.

VoCo permitía editar grabaciones de voz con una precisión asombrosa. Podías insertar, eliminar o cambiar palabras en una frase grabada. Pero lo realmente sorprendente era que podía generar palabras que la persona nunca había dicho. Bastaban unos veinte minutos de audio para que el sistema aprendiera el timbre, el ritmo y la entonación de esa voz. A partir de ahí, podía imitarla con una fidelidad inquietante.

Con herramientas como esta, la clásica voz robótica queda en el pasado. Los robots —o mejor dicho, los sistemas de síntesis vocal— pueden hablar como cualquier persona. Tan realista es el resultado, que VoCo generó preocupación por sus implicaciones:

Ética: ¿Qué pasaría si se usara para falsificar declaraciones o manipular audios?

Seguridad biométrica: ¿Qué ocurre si alguien puede imitar tu voz y acceder a sistemas que la usan como método de autenticación?

Por estas razones, Adobe decidió no comercializar VoCo. Al menos, por ahora.

¿Y el futuro? Bueno, ya veremos qué nos depara. Pero una cosa está clara: la voz sintética ha dejado de sonar a robot.

Hasta mañana.

Enviado por flexarorion a las 17:01 | 0 Comentarios | Enlace


Referencias (TrackBacks)

URL de trackback de esta historia http://ciencia15.blogalia.com//trackbacks/79190

Comentarios

© 2002 flexarorion