#techdagógica

recursos compartidos para aulas numerosas

Transcripción de entrevistas por reconocimiento de voz.

nFNw7IJ

Sueños.

Recuerdo todavía cuando apareció el comentario de Atlas.Ti en Facultad. Había gente que lo describía como un programa al que “vos le cargas las entrevistas y el te las analiza solo…” (sic).

Pues bien, en ese país de la fantasías todos hemos soñado con un software al que le carguemos un mp3, apretemos un botón de procesar y al cabo de un tiempo nos devuelva una hermosa transcripción para levantar en el procesador de textos. #Ufff! que genial sería.

Pues bien, lamento decir que así de fácil no he encontrado nada, pero de todos modos tengo de esas buenas noticias que son buenas porque se arriman bastante al bochin.

Tengo que agradecer de mis descubrimientos a las conversaciones de ayer en la fiesta de lanzamiento que desarrolló Ubuntu-Uruguay en Facultad de Psicología presentando la versión 13.10 del sistema operativo.

El software libre genera comunidad y la comunidad que libera logra transformar.

Perfectibilidad optimista.

Revisé un par de alternativas antes de la aplicación que voy a presentar, todas ellas basadas en el reconocimiento de voz y particularmente usando el desarrollo abierto que realizó Google en torno al tema. Cada una de las aplicaciones tienen sus particularidades; su estética podríamos decir y cualquiera de las mismas pueden ser enriquecidas, por lo cual hacer sugerencias a los desarrolladores en este momento puede ser vital.

Volviendo a dar ánimos, cuento que por mas perfectible que todo esto sea todavía, con Dictanote se economiza un volumen interesante de tiempo en la transcripción de la entrevista, y principalmente de esfuerzo y cansancio.

Dictanote.

Dictanote es una aplicación de Google Chrome (por lo que debemos tener instalado este navegador gratuíto y multiplataforma) disponible en la tienda de aplicaciones de Chrome (para acceder directamente haga click aquí) que ofrece ofrece un avanzado editor de texto enriquecido con reconocedor de voz multi-lenguaje incorporado. La función principal del programa es transcribir a texto lo que se dicta en voz. Y esto es importante de señalar, ya que se trata de un software de transcripción de dictados.

Al usarlo veremos la diferencia de ‘genero conversacional’ que existe entre una conversación cotidiana, una entrevista y un dictado; y no solo porque en este último se ponga mayor empeño en la pronunciación, sino que también la conversación cotidiana, incluso la registrada en una entrevista, tiene múltiples muletillas, indeterminaciones, y expresiones sonoras no verbales que en la comunicación oral suman sentido pero que se transforman en ‘ruido’ a la hora de su pasaje a la transcripción escrita.

Es así que si bien el software se puede usar para transcribir conversaciones u otros registros orales, dicha transcripción supone la medicación activa del dictado por una persona que oficiará de puente vivo entre el archivo de audio y la transcripción por reconocimiento de voz que Dictanote realiza.

A nivel de la presentación, básicamente veremos en pantalla un procesador de texto. Sobre el ángulo superior izquierdo se encuentran -tal como se muestra en la figura de abajo- dos botones web diferentes a los que usualmente veríamos en un software de procesamiento de textos; ellos son el botón de configuración (setting) y el de grabación, fundamental en todo esto.

Dictanote - Chromium_002

Configuración y funcionamiento.

Lo primero que tenemos que hacer entonces es configurar el idioma y la región en la que se hablará. Para mi caso Español y Uruguay. Puede parecer tonto, pero en algunos ejemplos observé lo importante de esta fase por ejemplo para advertir a al software que se va a habar en ingles pero que quien lo hará es por ejemplo una persona de la India. Para quienes estudiamos algún idioma sabemos lo dificultoso e imperfecto que resulta emitir algunos fonemas fundamentales de una legua que nuestra lengua materna no los cuenta en su repertorio. De este modo, el software podrá transcribir palabras en un idioma con repertorios fonéticos derivados de otros.

Luego de configurado, podemos comenzar a dictar. Para ello borre todo lo que hay en la hoja de escritura y  haga click en el botón de  micrófono que se encuentra en el ángulo superior derecho de la misma.

ATENCIÓN!!! La primera vez que usa el software en una computadora seguramente aparezca un aviso debajo de la barra de dirección preguntándole si quiere permitir la activación del micrófono o no. Constate que el micrófono está abierto y conectado.

Una vez resuelto lo anterior verá que aparece un mensaje de grabando donde se puede observar también el movimiento de nuestra voz. A los segundos de no producir mas sonido, es decir, de no dictar mas, el cuadro de grabación desaparecerá y se transcribirá a la hoja lo que usted dictó.

Le recomiendo que dicte frases claras y cortas. Para el caso de una entrevista que vaya dictando de a pequeñas frases.

Aprendizajes de la experiencia.

Techdagógica es un blog que privilegia la comunicación de herramientas y descubrimiento a partir del relato de la experiencia propia. En este sentido y para esta herramienta lo primero que me surge compartir es que el armarse de una dinámica de trabajo con Dictanote supone un proceso mínimo de entrenamiento personal. Básicamente de encontrar una forma personal y cómoda de trabajar con él.

Personalmente me parece que el uso de auriculares con micrófono incorporado es de gran ayuda. El regulado del volumen de lo que uno escucha también es importante, porque va a hacer como una especie de traducción en tiempo real pero en el mismo idioma y poder escuchar tanto lo que vamos a traducir como lo que estamos traduciendo es impoertantes.

Particularmente he agregado al kit el uso y personalización del reproductor VLC, agregando al panel del control botones de  opciones de configuración que el software tiene tales como ‘enlentecer fluencia’, ‘aumentar fluencia’, ‘dar un salto atrás’ y ‘dar un salto adelante’, además de dejarlo bien finito y ‘siempre arriba’, a fin de tener acceso para controlar tanto el Dictanote como el VLC.

Un detalle fundamental, es que para trabajar con él Dictanote necesita conexión a internet.

Finalmente describir que hay una versión free, en la que solo podemos trabajar en un solo documento a la vez, por lo que conviene copiando lo transcripto a un documento real de write, aunque no haya límite de extensión ni uso en el trabajo sobre ese documento; y una versión pro con la cual podemos tener varios documentos en proceso en la nube y otros beneficios a un muy módico costo de 10 dólares al año.

Por dudas y experiencias propias como siempre esperamos vuestros comentarios. Buen fin de semana!

Anuncios

Un comentario el “Transcripción de entrevistas por reconocimiento de voz.

  1. Juan Abasolo
    noviembre 18, 2013

    Te contesto usando el dictando *the pro demo iny* [Dictate PRO Demo] marco lo que no haya escrito como debería.
    La nota recién [la] estoy leyendo ahora por evitar lo de procastinar, que antes le decíamos *weber* [webear/huevear].
    Me parece realmente bueno y práctico; tiene una contra evidente, que es la de tener que hablar como si uno fuera una máquina *homo* o como un escritor leyendo algún cuento suyo.
    Después también tiene otro problema que para mi es grande pero supongo que para la mayoría de los lectores del blog no. Yo no suelo trabajar en castellano, la mayoría lo hago en euskera (idioma vasco) y el reconocimiento del euskera, que formalmente aparece como que lo reconoce, es realmente triste o cómico, pero seguramente no es operativo. Ahora, el castellano rioplatense, que es el que hablo yo, lo interpreta a la (casi) perfección. Estaba pensando que se podría hacer una prueba de ver cómo pasa algún audio libro que tengo de Galeano o de Cortazar que creo que hablan parecido a como éste hablando yo ahora a la computador[a].
    Realmente todo un descubrimiento supongo que regularmente *ie* [iré] probando a ver como reconoce *el que quiera* [el euskera], el idioma vasco, porque me di cuenta que es una herramienta realmente útil. Me sorprende que vaya escribiendo lo que digo y que mi único trabajo con el teclado *se ha* [sea] poner puntos, comas y paréntesis.
    Gracias por compartir.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Información

Esta entrada fue publicada en noviembre 10, 2013 por en Producción original, Recursos y etiquetada con , , , , , , .

Responsabilidad.

Las opiniones vertidas por un autor en este espacio colectivo son de su absoluta responsabilidad, eximiendo de la misma al resto de los administradores, autores y colaboradores del sitio.

Tweets @techdagogica

SOMOS CULTURA LIBRE!

Entradas seriadas…

A %d blogueros les gusta esto: