Printer Friendly

Interfaces graficas para la sintesis de audio digital.

Graphic interfaces for digital audio synthesis.

Evolucion e interaccion de los sintetizadores

El timbre, junto con la duracion y la altura, es una de las tres dimensiones fundamentales usadas para caracterizar un sonido (Copland, 2002). El timbre es a su vez multi-dimensional: por un lado, para describir un timbre cualquiera, usualmente se usa una gran cantidad de palabras derivadas de la percepcion de quien califica el sonido (brillante, opaco, sucio, denso, fuerte, etc.), decimos entonces que podemos clasificar un sonido, en lenguaje perceptivo, usando multiples variables; por otro lado, los instrumentos tecnologicos usados para controlar el timbre, son tambien maquinas que definen el timbre basadas en una gran cantidad de variables cientificamente universales (Russ, 2004) (como frecuencia de corte, tipo de filtro, tipo de onda, amplitud de la onda, amplitud de modulacion, ataque, etc.). En ambos casos, tanto en la descripcion como en el control del timbre, ya sea con lenguaje perceptivo o con lenguaje cientifico, el timbre es complejo y multidimensional, lo que lo hace engorroso muchas veces para alguien que se acerque a el ya sea para describirlo o para transformarlo.

Las maquinas usadas para el control del timbre son llamadas sintetizadores, y por razones practicas y de estandarizacion son controladas usando el lenguaje cientifico. La distancia que hay entre un sintesista y el uso correcto de su maquina, es proporcional a la distancia entre su lenguaje perceptivo y el lenguaje cientifico (Seago, 2004). Esta distancia es un tema importante de estudio para la psicoacustica (Risset & Wessel, 1999), la interaccion hombre-maquina y es un capitulo obligado para los disenadores de nuevos instrumentos. Historicamente para cubrir esta distancia ha sido el sintesista quien ha debido traducir su lenguaje perceptivo al lenguaje de la maquina, y no al reves. Durante el siglo XX muchos investigadores (Wessel, Grey, Arfib, Jorda, Freed, Smith, Moog, entre otros) han tratado de conciliar esta distancia entre la percepcion y la ciencia del timbre usando diversos metodos; pero a pesar de sus esfuerzos, las maquinas de sintesis comerciales aun se producen usando lenguaje altamente cientifico. Una de las razones para que esto suceda es la imposibilidad de generar un modelo psicoacustico unificado, donde las unidades de medicion del timbre sean unidades estandarizadas como dB o Hz, para amplitud y frecuencia respectivamente.

Instrumentos acusticos y sintetizadores

Los procesos de transformacion del timbre son procesos inherentes a los sintetizadores, pero aparecen tambien en los instrumentos acusticos (Russ, 2004): cada instrumento acustico es en si un sintetizador de sonido, con reglas -propias muy definidas para el control de la altura, y con un cierto margen de trabajo, mucho mas reducido, para el timbre. Las interfaces de los instrumentos tradicionales acusticos no estan codificadas en lenguaje cientifico sino en un lenguaje fisico: para acceder a su control debemos hacer esfuerzos de motriridad fina con un gran despliegue y coordinacion fisica. Tanto los sintetizadores como los instrumentos acusticos requieren de una traduccion del lenguaje perceptivo a otro lenguaje: fisico/mecanico para los instrumentos acusticos y cientifico para los sintetizadores. En ambos la percepcion del timbre debe ser traducida a un segundo lenguaje y el proceso de aprendizaje de ambos es la construccion de ese mecanismo de traduccion entre una idea perceptiva y una certeza mecanica o cientifica (ver esquema en la Figura 1).

Diferencias formales

En los instrumentos tradicionales se accede corporalmente al proceso de generacion del sonido, es por esto que la relacion gestual con dichos instrumentos se vive de manera muy organica, ya que permiten una interaccion en la que se puede sentir (ataque, presion, angulo, vibracion) (haptica) y algunas veces visualizar (golpe, velocidad, movimiento) (retroalimentacion visual) el resultado sonoro. Los procesos cognitivos de aprendizaje consisten en la toma de conciencia de dichas relaciones (que gesto me lleva a que resultado) y de que modificaciones o influencias en el sonido tienen las variaciones del gesto fisico al tocar el instrumento (Goudeseune & Garnett, 1999).

[FIGURA 1 OMITIR]

En los sintetizadores fisicos los procesos de generacion del sonido no estan basados en vibraciones mecanicas, sino en procesos electronicos que solo se convierten en sonido al conectarse a un amplificador. Estos procesos se manipulan a traves de una interfaz fisica que esta dotada de potenciometros y botones y codificada en un lenguaje cientifico. Por defecto en un sintetizador, el generador del sonido o motor de audio se encuentra separado de la interfaz fisica (Arfib, Couturier & Kessous, 2004). Los dispositivos que componen dicha interfaz se encargan de interpretar los gestos de un musico (giro, deslizamiento, presion, entre otros) y enviarlos al proceso electronico. Los procesos cognitivos de aprendizaje de un sintetizador consisten entonces en hacer relaciones entre el timbre del sonido percibido y el estado de las variables del sintetizador, principalmente en ausencia de guias hapticas o de retroalimentacion visual, con muy baja exigencia motriz y sin referentes gestuales especificos.

Para aprender un instrumento acustico, el musico debe conocer a fondo la forma del instrumento y conectar las necesidades sonoras con gestos fisicos. Sin embargo, la historia de la evolucion de los sintetizadores dice que la forma de los instrumentos se baso en menor medida en la ergonomia y principalmente obedeciendo a necesidades mecanicas de la acustica de cada instrumento (Fletcher & Rossing, 1998). Por el lado de los sintetizadores, aunque existen formas estandarizadas y casi fetiches como la caja con potenciometros y un teclado (Pinch & Trocco 2005), pueden tomar cualquier forma, ya que esta no tiene ninguna incidencia en el tipo de sonido que se genera y la exigencia fisica de sus controles es tan baja que podrian acoplarse a cualquier mecanismo.

Posibles roles de la infografia

Una consecuencia para el diseno de los sintetizadores generada por la separacion entre forma y motor de audio es su mutacion a sistemas digitales, en donde la aproximacion del musico a estos es bastante diferente. Los sintetizadores digitales virtuales, representados por una imagen digital de los sintetizadores fisicos, imponen una separacion mayor entre el musico y la herramienta, pues plantean la interaccion con dicha imagen, y solo pueden acceder a un control a la vez a traves del raton (Seago 2004). Aunque todas las posibilidades y la flexibilidad derivadas del avance en la computacion grafica estan ahora en los computadores, estas aun no son lo suficientemente explotadas en los sintetizadores comerciales (Freed, 1995).

Tanto en los sintetizadores fisicos como en los virtuales, la distribucion de botones y potenciometros en su superficie esta relacionada con el flujo de voltaje interno entre los diferentes componentes del motor de audio. Las interfaces son entonces una especie de mapas con actuadores electronicos que nos orientan a traves del aparato. Estando el aparato conformado por esta gran cantidad de variables, y estando algunas conexiones no representadas en la interfaz, el mapa puede volverse confuso y superar el limite perceptivo del usuario, ya que estas interfaces pueden tener varias decenas de variables disponibles. Es muy probable que el uso de la infografia, que busca la optimizacion de la informacion en espacios bidimensionales (Tufte, 1990), pueda servir al diseno de las interfaces graficas de los sintetizadores.

Otra metodologia importante para la optimizacion de las interfaces de un sintetizador es la de crear un espacio timbrico, usando tecnicas de escalamiento multidimensional, que este mas cercano de un espacio perceptivo que de un espacio tecnologico o espacio-sintetizador (Grey, 1977). Esta estrategia, por un lado, busca definir variables perceptivas generales basados en experimentos de similaridad pero, por otro, ofrece una vision estructural y topografica del timbre ubicado en un espacio perceptivo. Es importante ver que esta estructura multidimensional del timbre no es exclusiva de las variables perceptivas o del espacio timbrico, sino que puede extrapolarse a espacios conformados por otras dimensiones.

Recopilacion de la problematica

Para obtener guias para el diseno de sintetizadores virtuales que sobrepasen la frontera de la representacion de los sintetizadores fisicos, se han recopilado algunos decalogos y listas de deseo de investigadores en el area de la sintesis de sonido, donde se podran encontrar diversos aspectos de esta problematica.

A finales de la decada del 70 David Wessel manifesto, en relacion a la sintesis aditiva, que era necesario buscar maneras de simplificar la manipulacion de la cantidad de datos y variables trabajados, sin sacrificar la riqueza en el resultado timbrico (Wessel, 1979). Goudeseune se refieren veinte anos mas tarde a este aspecto como el "problema de sobrecarga cognitiva" (Goudeseune & Garnett, 1999), sugiriendo como posible solucion evitar mapeos muy simples, en los que el control de cada parametro se haga uno a muchos (o muchos a uno), posibilitando que un gesto manipule varias variables. Jorda muestra como esto se encuentra en los instrumentos acusticos, donde el control de la altura siempre manipula timbre y amplitud a su vez (Jorda, 2005), y complementa exponiendo que los sintetizadores no deben mostrar todas sus posibilidades de sintesis al principio, sino que estas se deben ir percibiendo proporcionalmente al crecimiento del nivel de aprehension que el interprete tenga de los instrumentos; siempre en la busqueda de mayor eficiencia con menor esfuerzo fisico y conocimiento de ejecucion, en contraste con los instrumentos tradicionales.

A mitad de la decada del 90 Adrian Freed aparece con cinco sugerencias para el diseno de interfaces (Freed, 1995), las cuales, excepto la del procesamiento y sintesis de audio en tiempo real (area pertinente mas a la tecnologia que al diseno), siguen todavia muy poco exploradas. Las primeras dos apoyan la infografia digital y muestran como el uso del color y el modelado en 3D podrian ayudar mucho en el control, y retroalimentacion visual de los procesos timbricos, sin embargo a pesar de que Seago advierte que no hay ninguna representacion del sonido psicologicamente significativa mas que el sonido mismo (Seago, 2004), muestra como de los tres tipos de taxonomia de sintetizadores: arquitectura fija, especificacion segun la arquitectura y especificacion directa; los ultimos, que hacen representaciones de la onda, son los que permiten una manipulacion mas intuitiva y directa del procesamiento timbrico. Por ultimo, Seago realza la importancia de la escalabilidad multidimensional como un acercamiento a la especificacion timbrica.

El decalogo de Sergi Jorda de su tesis Digital Lutherie (Jorda, 2005) es quiza el mas completo encontrado hasta ahora, sus recomendaciones se podrian dividir en cuatro clases: escalabilidad cognitiva, ejecucion interactiva, amplitud y detalle en el control y comprension del mecanismo interno. Las que tienen que ver con escalabilidad cognitiva fueron enunciadas en los parrafos anteriores en relacion al problema de sobrecarga cognitiva expuesto por Goudeseune. Las que tienen que ver con ejecucion interactiva sugieren delegar parte del proceso creativo al computador, de esta forma se aprovecharia su "inteligencia" y capacidad de intervencion, lo que ayudaria a superar los limites de los instrumentos tradicionales en donde de una accion se deriva un resultado sonoro. Las que tienen que ver con amplitud y detalle en el control sugieren que los instrumentos deben permitir acceso a toda su complejidad, mas no dejar a un lado los cambios sutiles y precisos en su mecanismo; algo que le daria amplitud y riqueza a un instrumento seria la posibilidad de tener una plataforma multiusuario, en donde se podrian manipular mas parametros de forma mas detallada sin causar sobrecarga en un solo usuario. Por ultimo, las recomendaciones que tienen que ver con comprension del mecanismo interno, sugieren aprovechar la capacidad de la pantalla para representar y monitorear procesos complejos, donde este soporte visual de cuenta del estado y comportamiento de la plataforma operativa; en este punto habla tambien que es necesario evitar el raton como controlador ya que, al igual que lo expresaba Freed en su decalogo de deseos (Freed, 1995), sus limitaciones no permiten manipular los instrumentos en toda su dimension y amplitud.

Disenos

Con la informacion revisada anteriormente y el estudio de las problematicas encontradas en diversas decadas, se ha iniciado un proceso de diseno que busca solucionar algunas de las necesidades existentes y escalarlas a un mundo virtual.

Interfaz Escalable

La dimension de un sintetizador, en los inicios de su definicion como instrumento (Moog, 1964) fue modular y escalable (era posible remover o aumentar algunos modulos, dependiendo de las necesidades de cada sonido). Aunque el montar y desmontar modulos fisicos es poco practico debido al tiempo y esfuerzo que debe ser invertido en ello, en los sintetizadores de software es posible retomar la idea de variar la dimension de la interfaz dependiendo del uso en la conformacion del sonido. La mayoria de sintetizadores software usa sin embargo una version de interfaz digital mas cercana al Minimoog fisico en donde las conexiones entre los modulos son ocultas y la interfaz es rigida. Como estrategia para superar estas problematicas, se ha propuesto el diseno y construccion de una interfaz escalable a la medida del usuario, en donde las variables se vayan mostrando o escondiendo a medida que el sonido pre programado se vuelve mas complejo o que el usuario asi lo desee.

Interfaz con variables perceptivas

Las interfaces fisicas son en su gran mayoria interfaces disenadas con lenguaje tecnico. El lenguaje tecnico es objetivo, pero no facilmente interiorizable y para un musico no entrenado en sintesis de audio tan vago como sus propias descripciones de el sonido en terminos perceptuales. Independiente de que exista un acuerdo o no entre el instrumento y el musico, la interfaz ya viene con unas dimensiones y unas conexiones propias del diseno del motor de audio. Las dimensiones de la interfaz podrian acercarse al usuario si este simplemente las nombra con palabras de su propio lenguaje. Es decir, tener una interfaz funcional pero sin definiciones previas de las variables, para que sea el mismo usuario quien les asigne nombres de acuerdo a su funcionamiento. Obviamente seria un proceso de nombrar y corregir hasta que preceptivamente la interfaz tenga un lenguaje adecuado para cada usuario particular. Profundizando en esta direccion, el diseno de interfaces adaptables al usuario en niveles superiores como la definicion de un espacio timbrico perceptivo de acuerdo a evaluaciones sencillas de calibracion, en donde la herramienta le haga preguntas al usuario de tal manera que pueda calibrar automaticamente las dimensiones y los rangos de su interfaz. Esta familia de interfaces adaptables es otro de los prototipos a desarrollar.

Sintetizador Estadistico

La estadistica se ha usado de diversas maneras en el control de nuevos instrumentos musicales. Herramientas estadisticas que sirven para auto completar discontinuidades en el control de un sintetizador o variables inter relacionadas por metodos estadisticos (Loviscach, 2008), el uso de distribuciones estadisticas para asignar valores a variables que comparten un mismo plano (Momeni et al., 1995). Es posible tambien usar bases de datos de sonidos pre configurados en sintetizadores (presets) para navegar a traves del espacio conformado por las variables de un sintetizador o espacio-sintetizador. Esta perspectiva genera la posibilidad de que el musico decida que tan "amplia" es su interfaz. La amplitud de la interfaz puede ir desde cerrada, limitada por los puntos mas comunes de toda la base de datos; maxima, ofreciendo todas las posibilidades independientes de su frecuencia de uso; hasta tener amplitud negativa, favoreciendo zonas del espacio-sintetizador que son estadisticamente desechadas.

Conclusiones

La multidimensionalidad del timbre y la falta de unidad de un modelo psicoacustico para su analisis, crean la necesidad de involucrar diferentes ramas del conocimiento para facilitar la tarea de traduccion entre dimensiones del lenguaje cientifico y perceptivo. Estas ramas deben aportar guias perceptivas adicionales al lenguaje cientifico para tratar de cerrar la brecha usuario-maquina estimulando la cognicion del musico, usando anchos de banda disponibles en otros sentidos adicionales a la escucha. Los instrumentos acusticos hacen esto en mayor o menor grado.

Las limitaciones fisicas de los instrumentos musicales tradicionales hacen que la motricidad fina de los musicos y la creatividad de los compositores, sean el recurso para expandir su sonoridad. Las diversas sonoridades y timbres derivados de variaciones de tecnicas interpretativas, hacen parte de la paleta de colores que un instrumento acustico ofrece. Esta paleta es limitada. Un sintetizador ofrece muchas dimensiones de control y sus combinaciones prometen timbres y colores infinitos, pero la densidad en la cantidad de controles hace que un musico promedio se aleje de los instrumentos debido a la sobrecarga cognitiva. Es posible pensar que un instrumento musical a medio camino entre pocos parametros y la sobrecarga cognitiva favorezca el acercamiento de nuevos usuarios. No necesariamente el instrumento con la mayor cantidad de variables y conexiones es el instrumento mas adecuado para sintesistas promedio.

Algunas de las necesidades planteadas por investigadores en decadas pasadas, en relacion con el uso de los graficos para representar los instrumentos musicales, aun estan vigentes. Este es un campo de investigacion que aun esta en desarrollo. Tanto en la parte tecnica como en la cognicion y la respuesta al trabajo con diferentes tipos de interfaces graficas. El desarrollo de herramientas graficas con bajo nivel de procesamiento pero que estimule enlaces cognitivos entre la imagen y el lenguaje tecnico del sintetizador (y entre la imagen y el sonido), es obligatorio para el diseno de mejores herramientas musicales.

Las mejoras en los nuevos instrumentos musicales pueden verse como optimizaciones del proceso cognitivo que acerquen el musico a su herramienta.

La mayoria de los esfuerzos se dan en mejorar la herramienta para que el musico la pueda entender mejor y en menor tiempo, pero hay un camino grande por recorrer en la optimizacion de la maquina para que entienda al usuario. Este camino va desde interfaces cuyos nombres sean personalizables por el usuario, hasta interfaces que generen espacios timbricos multidimensionales basados en la percepcion misma del usuario y que basados en entender su percepcion ajusten sus controles de sintesis.

Muchos de los deseos y conclusiones de los investigadores para el diseno de nuevos instrumentos aun estan por resolverse despues de anos de haber sido formulados. El trabajo presentado en este articulo no pretende dar soluciones definitivas a la problematica sino que plantea una metodologia reflexiva para allanar el terreno, verificando literatura y proyectos de otros autores, analizando instrumentos acusticos y tratando de resolver problemas discretos o grupos de problemas en vez de enfrentarse a toda la problematica en un solo diseno.

Bibliografia

ARFIB, D., J. M. COUTURIER & L. KESSOUS. (2004). Design and Use of Some New Digital Musical Instruments. En Gesture-Based Communication in HCI. Berlin, Alemania: Springer.

COPLAND, A. (2002). What to Listen for in Music. First edition. USA: Signet Classics. p. 63.

FLETCHER, N. & T. ROSSING. (1998). The Physics of Musical Instruments. NY, USA: Springer.

FREED, A. (1995). Improving Graphical User Interfaces For Computer Music Applications. Proceedings of the CHI. Computer Music Journal, 19: 4-5.

GOUDESEUNE, C. & G. E. GARNETT. (1999). Performance Factors in Control of High-Dimensional Spaces. Proceedings ICMC International Computer Music Conference, Beijing, China.

GREY, J. M. (1977). Multidimensional perceptual scaling of musical timbres. Journal Acoustical Society of America, 61: 1270-1277.

JORDA, S. (2005). Digital Lutherie. Tesis Doctoral, Departamento de Tecnologia, Universitat Pompeu Fabra, Barcelona, Espana.

LOVISCACH, J. (2008). Programming a Music Synthesizer through Data Mining. Proceedings. New Interfaces for Musical Expression 2008, Genova, Italia (207-210).

MOMENI, Ali & David WESSEL. (2003). Characterizing and controlling musical material intuitively with geometric models. Proceedings Conference on New Interfaces for Musical Expression NIME, Montreal, Quebec, Canada.

MOOG, Robert A. (1964). Voltage-Controlled Electronic Music Modules. AES Convention 16 (October 1964). p. 346.

PINCH, T. and F. TROCCO. (2005). Analog Days: The Invention and Impact of the Moog Synthesizer. Cambridge, MA, USA: Harvard University Press. p. 53-69.

RUSS, M. (2004). Sound Synthesis and Sampling. 2a Edicion. Cap. 2. Burlington, USA: Focal Press.

TUFTE, E. (1990). Envisioning Information. New York, USA: Graphics Press.

WESSEL, D. L. (1979). Timbre space as a musical control structure. Computer Music Journal, 3 (2): 45-52.

Daniel Gomez

Instituto Tecnologico Metropolitano

danielgomez@itm.edu.co

David Sanchez

Instituto Tecnologico Metropolitano

davidsanchez@itm.edu.co

Recibido: Agosto 5 de 2010

Aprobado: Noviembre 16 de 2010
COPYRIGHT 2010 Universidad de Caldas
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2010 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Gomez, Daniel; Sanchez, David
Publication:Kepes
Article Type:Report
Date:Jan 1, 2010
Words:3582
Previous Article:Interfaces vivenciales: espacios de inmersion y formacion.
Next Article:Presentacion.
Topics:

Terms of use | Privacy policy | Copyright © 2019 Farlex, Inc. | Feedback | For webmasters