Printer Friendly

Reconocimiento automatizado de senales bioacusticas: una revision de metodos y aplicaciones.

Automated Recognition of Bioacoustic Signals: a Review of Methods and Applications

1 Introduccion

La destruccion y degradacion de la naturaleza conduce al empobrecimiento y, en muchos casos, a la perdida de los beneficios que esta nos suministra. Entender las consecuencias de los agentes tensionantes sobre la biodiversidad y los servicios ecosistemicos--de los cuales dependemos--requiere de una evaluacion constante de las tendencias de cambio de los patrones y procesos ecologicos. Sin embargo, uno de los mayores desafios en ecologia y biologia de la conservacion, es la evaluacion de la biodiversidad mediante tecnicas de monitoreo eficaces, que permitan abarcar amplias escalas, tanto espaciales como temporales [1]. Este conocimiento debe ser la base para construir criterios mas robustos que conlleven a un mejor manejo del territorio, mediante un sistema de monitoreo centralizado que permita que los investigadores, tomadores de decision, o personas interesadas, tengan una buena perspectiva general sobre los resultados arrojados por los programas de monitoreo a escala nacional [2].

Actualmente, el conocimiento de la gran mayoria de los sistemas ecologicos se basa en escalas espaciales y temporales muy limitadas [3]. Adicionalmente, en el ambito nacional, las tareas de monitoreo estan altamente descentralizadas--en el sentido de que no se cuenta con sistemas eficaces mediante los cuales se pueda compartir la informacion obtenida en programas de monitoreo aislados--lo que dificulta que los investigadores o planificadores de conservacion puedan realizar analisis y tomar decisiones basandose en una perspectiva global [2]. Los programas de monitoreo--que generalmente incluyen deteccion, localizacion, clasificacion y conteo de los animales en un sitio [4]--son fundamentales para conocer el estado y las tendencias de la biodiversidad, identificar especies vulnerables y en riesgo de extincion, evaluar el impacto de la actividad humana sobre ecosistemas naturales, hacer seguimiento de especies invasoras y parasitos, entre otros [2]. Los metodos tradicionales de levantamiento de informacion en inventarios, caracterizaciones y monitoreo de fauna dependen del grupo de estudio; a grandes rasgos se basan en observaciones, capturas-recapturas, trampas, huellas y registros auditivos [5],[6].

1.1 Importancia de las senales acusticas en los animales de vida silvestre

Las senales acusticas emitidas por grupos taxonomicos como insectos, anuros, aves, peces y mamiferos refuerzan las diferencias entre las especies, ya que presentan caracteristicas que permiten el reconocimiento entre individuos [7]. Las funciones mas conocidas de estas senales son de caracter sexual, pues implican varios procesos comportamentales como la atraccion y seleccion de pareja, y el mantenimiento y defensa de un territorio [8]; ambos aspectos son cruciales para el flujo genetico, el mantenimiento especifico de procesos implicados directamente en la evolucion y patrones de distribucion de las especies [9]. Estudios en biologia de la conservacion han utilizado las vocalizaciones de la fauna, ya que son muy eficientes para con firmar la presencia de una especie y mucho mas en ambientes en donde la visibilidad es poca, como por ejemplo en los bosques tropicales, en los sistemas acuaticos y en el estudio de especies nocturnas [10],[11],[12],[13],[14]; en otros casos han sido empleadas para identificar el sexo, la edad e individuos [15],[16].

En las ultimas decadas, el avance en tecnologias que buscan automatizar el monitoreo de la fauna--mediante el uso de unidades de grabacion remota y paquetes analiticos de reconocimiento acustico automatizado de especies--esta transformando la forma como se estudian las interacciones de los animales y sus habitats [17],[18],[19],[13]. Comparada con las metodologias de muestreo acustico tradicionales, la toma de muestras automatizada permite recolectar los ambientes sonoros en diferentes puntos de la zona de estudio de manera simultanea y sistematizada en escalas temporales amplias, incrementando asi el tamano de la muestra y por consiguiente aumentando la representatividad del universo muestral [20].

1.2 Bioacustica y tecnologia

Los avances tecnologicos y computacionales abren paso a nuevos enfoques para el censo y recoleccion de informacion bioacustica a escala mundial [10]. A traves de hardware especializado (unidades de grabacion remota) es posible grabar y almacenar enormes cantidades de informacion [21]. Los datos adquiridos se pueden transmitir, procesar y analizar usando herramientas computacionales. Esta prometedora herramienta bioacustica brinda la capacidad de ampliar la escala espacio-temporal de los muestreos biologicos y de realizar analisis que permiten el manejo de vastas cantidades de informacion para el reconocimiento de especies, lo que se traduce en una metodologia ideal de monitoreo de la fauna colombiana. Sin embargo, a pesar de que la tecnologia se presenta como una solucion, existen desafios que se deben enfrentar; entre ellos estan la gran capacidad de almacenamiento y la velocidad de procesamiento que se requiere, teniendo en cuenta la magnitud de la informacion que se puede recolectar y, el desarrollo de algoritmos precisos para la clasificacion y reconocimiento automatizado de las vocalizaciones especificas [17],[22].

Tradicionalmente, la tarea de la identificacion de especies a traves de sus vocalizaciones requiere de una persona con amplia experiencia. Usual mente, el uso de espectrogramas facilita la identificacion, ya que se emplea no solo la memoria auditiva, sino tambien la visual y de esta manera se refuerza el proceso de aprendizaje. Sin embargo, esta tarea es titanica si se requiere analizar el volumen de informacion bioacustica obtenida por las unidades de grabacion remota. El procesamiento automatizado facilita la organizacion y busqueda de datos acusticos [23], mediante tecnicas DSP/PR es posible incorporar metodos de deteccion y localizacion de vocalizaciones de fauna vocalmente activa [4]. Estos metodos se pueden usar para contestar una amplia gama de preguntas de investigacion que abordan diferentes escalas biologicas, desde individuos, poblaciones, comunidades y ecosistemas hasta paisajes [10],[1]. A pesar de que la clasificacion automatizada no es un concepto nuevo, si lo es para muchas aplicaciones; la mayoria de la investigacion en clasificacion de objetos se ha enfocado en computacion y robotica [18]. Este es un reto multidisciplinario, que requiere de la aplicacion de areas relacionadas con bioacustica, taxonomia, sistematica, ecologia del paisaje sonoro, computacion y electronica.

2 Adquisicion de informacion

El monitoreo acustico es un metodo no invasivo, lo que implica que no se requiere capturar individuos para contar con informacion biologica de interes. Ademas, se puede apoyar este tipo de monitoreo mediante el uso de herramientas tecnologicas disponibles actualmente [19], obteniendo una amplia cobertura espacial y temporal, e incluso es posible reducir los costos que implican otras tecnicas. Los componentes basicos de hardware que se usan para la adquisicion de datos son microfonos, grabadoras, fuentes de energia, mecanismos de inicio y final de grabaciones y cubiertas para los equipos [24]. Los avances en tecnologia bioacustica incluyen el desarrollo de sistemas de grabacion cableados e inalambricos, que permiten la recoleccion de datos en multiples lugares a lo largo del tiempo [17]. Los microfonos utilizados dependen del organismo que se requiera estudiar; hay microfonos especializados para la captura de infrasonidos (elefantes, cetaceos) y de ultrasonidos (murcielagos, algunos insectos). Para la captura de vocalizaciones de aves, ranas y algunos insectos usualmente se utilizan microfonos omnidireccionales, los cuales muestrean el sonido con la misma eficiencia en todas las direcciones [17]. En [17],[18],[19] se encuentran consideraciones tecnicas sobre tipos de microfonos, recomendaciones para la ubicacion de estos en los sitios de monitoreo, y especificaciones sobre equipos y protocolos de comunicacion.

Los sistemas de monitoreo bioacustico automatizado requieren de sistemas de grabacion digitales que se puedan programar, del desarrollo de un sistema computarizado de reconocimiento y clasificacion de sonidos y de una alta capacidad de almacenamiento de las grabaciones [3],[20]; estos equipos de grabacion se conocen como unidades de grabacion automatica (ARUs por sus siglas en ingles). Las ARUs pueden programarse para hacer grabaciones de audio en diferentes horas del dia de manera automatica o activarse desde un telefono movil [25].

Actualmente existe una variada oferta de tipos de equipos de grabacion automatizada en el mercado, sin embargo, no todos los equipos ofrecen la misma calidad de grabacion. Las diferencias entre los equipos de grabacion estan vinculadas con varias caracteristicas como por ejemplo en la relacion senal a ruido, en la calidad y diseno de los circuitos electronicos, la configuracion, la proteccion del equipo a las condiciones de intemperie, frecuencia de muestreo, filtros de reduccion de ruido de fondo y cronogramas de programacion [26]. Las ARUs mas utilizadas para este fin son los songmeters, sistemas de grabacion E3A, telefonos moviles y accesorios.

* Songmeter SM2-GPS (Wildlife Acoustics Inc., Concord, MA, USA, http:// www.wildlifeacoustics.com): consta de dos microfonos omnidireccionales (respuesta de muestreo: 20-2000 Hz). Estas unidades de grabacion pueden tener un cronograma de grabacion de acuerdo a los requerimientos de cada investigacion, ademas estan disenadas de tal forma que se pueden conectar hidrofonos, microfonos sensibles al ultrasonido e infrasonido [17],[27]. Para estudios en donde se desee triangular el sonido con fines de localizacion de individuos, los SM2 tienen la opcion de ser conectados a un GPS.

* Sistemas de grabacion E3A: las series Earthsong E3A DSS Bio-Acoustic Monitor Kit estan disenadas para grabar ambientes sonoros con una alta resolucion, en estereo. Este sistema utiliza dos microfonos de condensador electret CZM (Compression Zone Microphone), y esta patentado por River Foks Research Corporation (Patente # US 6,681,023 B1/20 Jan 2004), el cual incorpora una novedosa tecnologia que combina las propiedades acusticas de un microfono de zona de presion y un transformador acustico, en donde se incrementa la sensibilidad porque el sonido se refleja desde una superficie dura, creando una zona de mayor presion sonora [28],[29]. El equipo es protegido de la intemperie por una maleta a prueba de agua [29].

* Telefonos moviles y accesorios: existen sensores incorporados en telefonos moviles que se programan para la captura de audio, tales como microfonos externos omnidireccionales. Los datos se transmiten a traves de Internet o conexiones moviles a una central de almacenamiento de datos. La energia es suministrada por paneles solares o baterias, algunas de estas unidades tambien utilizan preamplificadores reguladores de voltaje y controladores de poder (1).

Debido a las diferencias tecnologicas de los equipos disponibles en el mercado, es recomendable usar un solo tipo de equipo para efectos comparativos en programas de monitoreo y de esta manera reducir sesgos en la detectabilidad. En [26] se recomienda que en estudios de corto a mediano plazo se utilicen los mismos equipos por un maximo de cinco anos, por diferentes razones primero, debido a que la tecnologia cambia rapidamente, es mejor reemplazar con nuevas versiones de equipos y asi poder gozar de las mejoras que los fabricantes hayan realizado; segundo, las versiones antiguas de los equipos salen del mercado y esto hace que sea casi imposible mantenerlas.

3 Herramientas para el reconocimiento automatizado de senales bioacusticas

Los procesos de analisis de senales acusticas se pueden llevar a cabo mediante algoritmos computacionales de reconocimiento. El objetivo de ello es tener la capacidad de analizar grandes cantidades de datos en lapsos cortos de tiempo y, ademas, permitir que esto se haga de una forma sistematizada. La tecnologia para el analisis automatizado de sonidos se ha enfocado casi completamente en reconocimiento del habla humana; sin embargo, hay una gran necesidad para la deteccion automatizada y clasificacion de sonidos naturales no humanos [30]. En procesamiento de habla se han producido muchos avances en el analisis de series de tiempo, por esta razon, muchas de las tecnicas que se usan en monitoreo bioacustico se apoyan en estas metodologias [4]. Los modelos de reconocimiento de voz generalmente se basan en la caracterizacion del vocabulario y la gramatica. De manera similar, en las vocalizaciones de animales acusticamente activos, por ejemplo en aves, se pueden distinguir unidades basicas similares a los fonemas y, estructuras mas complejas como cantos o frases [31], que son la base para crear los modelos de identificacion automatizada [32]. En la Figura 1 se presenta un esquema de un sistema de monitoreo automatizado, se resalta que aunque este documento esta orientado particularmente a los sistemas basados en senales acusticas, se puede adaptar facilmente a un esquema que incluya datos de imagenes o datos del entorno tales como ubicacion, condiciones atmosfericas, etcetera. En un sistema automatizado se distinguen dos partes: 1) entrenamiento y 2) reconocimiento; en el entrenamiento se disena el mecanismo de inferencia a partir de informacion a priori; el reconocimiento consiste en el uso del sistema para la clasificacion automatizada de la senal de entrada.

[FIGURA 1 OMITIR]

Los sistemas de reconocimiento basados en bioacustica generalmente se disenan para segmentar grabaciones, identificar la presencia de una especie objetivo o clasificar un segmento de canto de acuerdo a una baraja de opciones. Estos sistemas de reconocimiento se han aplicado en diferentes casos, por ejemplo en el enriquecimiento de la informacion de las colecciones de sonidos de tal manera que se facilita la navegacion en bases de datos de audio, adicionando informacion de la localizacion en tiempo y frecuencia de las especies; esta necesidad surge porque aunque las grabaciones en archivos de sonidos de animales usualmente utilizan sistemas de catalogacion mediante una serie de metadatos, es poco frecuente que las grabaciones tengan todas las especies de fondo catalogadas, bien sea por desconocimiento de las vocalizaciones de estas o porque el colector no lo menciona [33].

La elaboracion de algoritmos de clasificacion de especies efectivos es un paso preliminar dirigido a la extraccion de informacion util de las grabaciones recolectadas en el campo [34]. Algunos de los desafios relacionados con el desarrollo de software de reconocimiento son: los sonidos de animales se graban en ambientes altamente ruidosos [35], se pueden presentar distintas vocalizaciones al mismo tiempo (traslapadas), los individuos emisores de sonido pueden estar en movimiento (esto causa variaciones en intensidad); en el caso del reconocimiento automatizado en aves la dificultad depende, tambien, de la forma como las especies obtienen sus cantos. Las aves se dividen en dos grandes grupos, los sub-oscines que adquieren su repertorio de canto netamente a traves de mecanismos geneticos, es decir son 100 % innatos, mientras que otro grupo los oscines o aves cantoras adquieren su repertorio mediante mecanismos geneticos y procesos de aprendizaje similares a la adquisicion del habla en humanos [36]. Como consecuencia, la variabilidad en los cantos en individuos y poblaciones de una misma especie es alta, y es comun que en estas especies se presenten dialectos y variaciones del canto debido a aislamientos geograficos [37]. Sin embargo, estas especies presentan llamados de corta duracion que no varian sustancialmente entre poblaciones o notas dentro del canto que tampoco varian y que pueden utilizarse como las senales clave de reconocimiento especie-especifico.

3.1 Estimacion del desempeno en sistemas de reconocimiento automatizado

La estimacion del desempeno de un sistema de reconocimiento automatizado es fundamental, siendo necesario conocer la confiabilidad de los datos etiquetados por el sistema. Una forma basica de estimacion del desempeno de clasificacion o deteccion es la proporcion de los objetos etiquetados correctamente, sin embargo, esto puede no ser muy ilustrativo en el caso de problemas desbalanceados, es decir, cuando el numero de objetos de cada clase difiere considerablemente, de manera que un sistema que indistintamente asigne la etiqueta de la clase mayoritaria a todas las muestras, podria reflejar un falso buen desempeno. En [38] se describen medidas de estimacion de la fiabilidad de clasificadores biclase (2), como la sensibilidad y la especificidad; estas se pueden aplicar en tareas de reconocimiento multiclase replanteando los problemas como en el caso de la tecnica uno contra todos, es decir transformando el problema en varios problemas biclase, tomando en cada uno de ellos una clase como clase objetivo y las demas como no objetivo; o uno contra uno, en donde se evaluan los desempenos de cada par de clases [21],[39],[32]. En los problemas de clasificacion de datos bioacusticos, frecuentemente se tiene una alta deteccion de falsos positivos [40]. En el caso de problemas multietiqueta--en donde un objeto puede pertenecer a varias clases--por ejemplo, en problemas de etiquetado de grabaciones, donde cada una de ellas puede contener vocalizaciones de diferentes especies, existen medidas especiales de estimacion del desempeno, como Hamming loss, Rank loss, One-error, cobertura y Micro-AUC [41].

3.2 Preprocesamiento

El preprocesamiento es el conjunto de tecnicas que se usan para mejorar la calidad de la senal o adaptarla a las condiciones requeridas para procesos posteriores como los de representacion o clasificacion. Algunos de los tratamientos que se suelen realizar son: filtrado (atenuacion del ruido), normalizacion (estandarizacion de la intensidad de la senal de las grabaciones) y submuestreo (reduccion de la cantidad de datos disminuyendo la frecuencia de muestreo). En los siguientes trabajos se describen algunos ejemplos de preprocesamiento: en [35] se submuestrean las senales a 8kHz y se normalizan en amplitud; en [30] se usa un algoritmo de extraccion de senales de ruido de fondo que consiste en la aplicacion de filtros en donde el umbral se ajusta dependiendo de la banda de frecuencia, considerando que el nivel de ruido de fondo no es el mismo en cada una de ellas; en [41] se normalizan los valores en el espectrograma y se aplica un filtro para aumentar el contraste de las vocalizaciones y reducir el ruido.

3.3 Segmentacion

Las grabaciones contienen informacion acustica que no es relevante para los procesos de automatizacion del reconocimiento de especies, ya que las especies pueden presentar picos de actividad vocal o sus vocalizaciones estan dispersas en el tiempo. En estos casos se requiere localizar los intervalos de tiempo que contienen vocalizaciones de animales en la grabacion; este procedimiento se conoce como segmentacion. Las vocalizaciones de algunos animales se han jerarquizado, por ejemplo en las aves, estas se dividen en cuatro niveles: notas, silabas, frases y cantos [42]; en la literatura se encuentran varios trabajos orientados a la clasificacion de silabas [4], [32],[35],[37], [42],[43]. Los metodos de segmentacion mas basicos estan disenados para detectar las regiones con mayor energia [44], sin embargo, en otros metodos mas elaborados se busca detectar trayectorias caracteristicas en las representaciones tiempo-frecuencia [37],[41],[45].

3.4 Metodos de representacion

La representacion de senales acusticas consiste en la seleccion de un conjunto de variables (llamadas tambien atributos, descriptores o caracteristicas) que describan la informacion contenida en el sonido de una forma compacta, de tal forma que sea procesable computacionalmente. Existe un gran numero de caracteristicas que se pueden extraer de senales de audio y se usan para multiples propositos: reconocimiento automatizado de voz, evaluacion de informacion musical, segmentacion de audio y evaluacion del sonido ambiental. En [17],[23],[24],[46],[47] se revisan diversos metodos para representar y procesar datos acusticos. A continuacion se mencionan algunos descriptores tradicionales:

* Representaciones tiempo-frecuencia: Las senales de audio son series de tiempo. Para el analisis de patrones acusticos generalmente se usa la transformacion de Fourier, el espacio transformado se conoce como dominio de la frecuencia cuya unidad de medida mas comun es el hercio (Hz). Se conoce como espectrograma la representacion que se obtiene al realizar la transformada de Fourier a intervalos traslapados de la senal de audio.

El analisis tiempo-frecuencia de las senales bioacusticas en su gran mayoria se hace usando el espectrograma, ademas, este tiene una gran acogida por los biologos como herramienta de inspeccion visual. Sin embargo, en muchas aplicaciones de DSP se ha usado satisfactoriamente la transformada Wavelet, la cual es una modificacion de la transformada de Fourier. Esta herramienta matematica ofrece informacion sobre la localizacion en tiempo y frecuencia de la senal y, al ser una representacion bidimensional, se puede ilustrar de manera similar al espectrograma. Algunos trabajos en bioacustica resaltan sus propiedades en la representacion de senales no estacionarias, con energia dispersa en un amplio rango de frecuencias, discontinuas y con picos de energia [10],[48],[49].

* Los coeficientes cepstrales en las frecuencias de Mel: Estos coeficientes, comunmente conocidos por la sigla MFCCs (Mel frequency cepstral coefficients), son una de las representaciones mas usadas para la clasificacion de audio. A diferencia de la representacion en el dominio de la frecuencia de Fourier, en los MFCCs la unidad de medida son los mels, en donde la escala de frecuencia se ubica de forma logaritmica, con lo cual se busca que la representacion se acerque mejor a la percepcion auditiva humana [34].

* Codificacion predictiva lineal: La codificacion predictiva lineal (Linear predictive coding, LPC) se basa en un analisis auto-regresivo, en donde se usa un predictor lineal para estimar el valor de cada muestra de una senal por una combinacion lineal de valores anteriores. El objetivo de la LPC es estimar parametros basicos, como las frecuencias formantes [47], que corresponden a las bandas de frecuencia donde se concentra la mayor parte de la energia de la senal acustica.

3.5 Metodos de clasificacion

Gracias al desarrollo de tecnicas de aprendizaje supervisado se pueden clasificar datos bioacusticos de forma rapida y precisa. La clasificacion de vocalizaciones de animales tradicionalmente se ha relegado a enfoques cualitativos, estos requieren de un gran consumo de tiempo y frecuentemente estan sesgados por la subjetividad [21]. En esta revision se usa el termino deteccion en los problemas cuyo objetivo es localizar la ubicacion temporal de la emision de la vocalizacion de una especie objetivo [4],[22],[23],[34],[35],[50]. El termino clasificacion se usa para etiquetar un canto [17],[21],[24],[30], para ello se usa un algoritmo conocido como clasificador, cuya entrada corresponde a un conjunto de valores relacionados con atributos o caracteristicas del objeto; el clasificador requiere entrenarse previamente con un conjunto de datos estadisticamente representativos. Generalmente, en la etapa de preprocesamiento de los problemas de clasificacion se requiere la aplicacion de algoritmos de segmentacion; en [4], por ejemplo, en donde se denomina como unidad de reconocimiento a cada silaba segmentada. Un desafio que no se ha estudiado a profundidad, teniendo en cuenta las variaciones temporales y geograficas de las vocalizaciones de animales, es el desarrollo de sistemas autonomos adaptativos que se acomoden a nuevas circunstancias con ninguna o poca intervencion humana; un trabajo que tiene en cuenta esto es [23], en donde para la clasificacion y deteccion se usa una metodologia llamada sistema de soporte en linea de memoria perceptual (MESO: Perceptual Memory to Support Online Learning in Adaptive Software).

3.5.1 Algoritmos de clasificacion. Los algoritmos de clasificacion se usan para asignar etiquetas de clase a objetos ubicados en un espacio de representacion o descritos por caracteristicas [51],[52]. Dentro del area de reconocimiento de patrones, existen muchos algoritmos de clasificacion establecidos, algunos de ellos se plantean como funciones matematicas que mapean los valores de entrada a un conjunto con valores categoricos. Los siguientes clasificadores se han usado frecuentemente en reconocimiento de senales bioacusticas: k vecinos mas cercanos (k nearest neighbors, kNN) [35], maquinas de vectores de soporte (Support Vector Machine, SVM) [3],[21],[22], bosque aleatorio [21],[22], Boosting adaptativo [22], funciones discriminantes [3],[21], redes neuronales [42], entre otros.

Frecuentemente, los problemas de clasificacion se plantean en terminos probabilisticos. Particularmente en reconocimiento de audio se usa la tecnica conocida por la sigla en ingles HMMs (hidden Markov models). Estos modelos son un metodo probabilistico que ha sido usado amplia y exitosamente en diferentes escenarios de reconocimiento automatizado tales como la identificacion de habla y hablante, la clasificacion de senales sismicas y la clasificacion de secuencias de genes. Los HMMs resultan muy apropiados para el analisis de senales bioacusticas debido a su capacidad de tratar datos secuenciales con alta variabilidad (e, incluso, de diferentes longitudes) [34],[8],[32]. Estos cuentan con una clara y elegante interpretacion bayesiana, ademas, se han desarrollado algoritmos rapidos y eficientes para realizar el entrenamiento y la prueba de los modelos [53].

4 Ejemplos de aplicacion de monitoreo bioacustico automatizado

Actualmente, se estan desarrollando redes de sensores inalambricos que permiten adquirir paquetes de datos bioacusticos y datos ambientales (luz, velocidad del viento, humedad relativa, temperatura, precipitacion, etcetera) simultaneamente, en diferentes escalas espaciales, en conjunto producen una recoleccion de datos ecologicos muy relevantes [54]. Una vez recolectados, los datos pueden ser agrupados y transmitidos a traves de una red de computadores hacia un laboratorio de analisis bioacustico en donde se cuenta con la infraestructura necesaria para el almacenamiento, y capacidad tecnica interdisciplinaria necesaria para el analisis de los procesos y patrones de la diversidad de la fauna vocalmente activa. El ciclo se cierra en la constante divulgacion de la informacion ambiental y ecologica, lo cual es la base para comunicar a aquellos responsables de tomar decisiones sobre la conservacion y el manejo del medio ambiente y para una divulgacion transparente para el publico en general. La clasificacion automatizada de las vocalizaciones de diferentes especies (ya sea especies clave o un ensamble de especies) tiene el potencial de incrementar el conocimiento sobre los cambios de los ecosistemas debido a vectores de transformacion (cambios de uso del suelo) y sus efectos sobre los patrones y procesos de la biodiversidad [23],[25],[55].

4.1 Reconocimiento bioacustico de poblaciones

Los estudios de poblaciones requieren de datos de alta calidad, y una forma de obtenerlos es mediante el reconocimiento de individuos [56]. Existen muchas tecnicas que se han implementado para este fin, pero la mayoria utilizan capturas y marcaje, y a pesar de que a traves de ellas se obtiene informacion valiosa, pueden causar cambios en el comportamiento de los individuos y hacerlos mas visibles ante los predadores [57]. La individualidad en las vocalizaciones ha sido demostrada en diferentes especies de aves [58], asi como en cetaceos [59] y elefantes. Las senales acusticas tienen el potencial de ser usadas como una alternativa al marcaje tradicional [57]. El uso de analisis canonicos discriminantes (DCA) fue efectivo para la correcta identificacion de 12 individuos del ave Formicario mexicano (Formicarius monilingu r), en bosques humedos tropicales de Mexico y esta tecnica de monitoreo permitio mapear los territorios y monitorear la dinamica espacial y temporal de individuos previamente marcados y posteriormente reconocidos por sus vocalizaciones, gracias a lo cual se conocen aspectos comportamentales sexuales, sus movimientos en el tiempo, interacciones con el ambiente y dinamicas poblacionales [16].

4.2 Reconocimiento bioacustico de comunidades

El monitoreo acustico puede proveer datos confiables en riqueza y composicion de especies. Esta tecnica de monitoreo es un metodo eficiente y efectivo para evaluar la biodiversidad y sus cambios en escalas temporales y espaciales amplias. Las grabaciones con un unico microfono se han utilizado ampliamente para medir la riqueza y composicion de especies, en aves, murcielagos, ranas e insectos [17]. La necesidad de implementar un sistema de monitoreo bioacustico automatizado nacio en la decada de los noventa, con estudios que buscaron evaluar la composicion de especies de aves terrestres migratorias que hacen sus viajes durante la noche [60],[61], desde los sitios en donde se reproducen en el hemisferio norte hacia el hemisferio sur donde se resguardan de la epoca de invierno. Muchas de estas especies emiten cortos llamados mientras vuelan [62]. Estos llamados son especieespecificos y se cree que son utilizados por la dificultad de la comunicacion visual; asi, la bandada mantiene la ubicacion espacial con el fin de evitar colisiones, mantiene tambien la cohesion durante el vuelo y puede estimar la direccion del viento. Con el fin de automatizar la clasificacion de estos llamados por especies, Mills [60] creo un software para detectar esas vocalizaciones, en un rango de frecuencias entre 5 y 9 kHz, de duracion entre los 50 y 100 ms. La deteccion utilizo los picos temporales de los llamados en las bandas de energia, para la clasificacion se utilizaron redes neuronales. Otra aproximacion al mismo problema utilizo los arboles de decision. Este sistema de reconocimiento automatizado fue probado para 138 especies migratorias nocturnas australianas, 85 % de los llamados fueron clasificadas correctamente, 4 % incorrectamente y 8 % incierto.

5 Proyectos de monitoreo bioacustico automatizado

Los siguientes son proyectos de monitoreo bioacustico automatizado que se estan desarrollando en la actualidad. En general ellos disponen de herramientas tecnologicas, hardware, software, equipos de comunicaciones y personal especializado:

* En Estados Unidos (EEUU), el programa de investigacion en bioacustica BRP (Bioacoustic Research Program) (3) del Laboratorio de Ornitologia de la Universidad Cornell, en Ithaca Nueva York, desarrolla equipos de grabacion y software que usan cientificos alrededor del mundo para estudiar la comunicacion entre animales y monitorear la salud de las poblaciones de vida silvestre. Este laboratorio tiene dos ramas de investigacion una de ellas en comunicacion animal, en donde se llevan a cabo varios proyectos sobre monitoreo bioacustico y movimientos de varias especies, investigaciones que estan en la vanguardia en la comprension de patrones de migracion y comunicacion. La segunda rama de investigacion es sobre algoritmos para desarrollo de software y metodos para el procesamiento de senales, con el fin de detectar, reconocer, localizar y hacer estudios comparativos de los sonidos de los animales.

* En Puerto Rico, el proyecto ARBIMON (Automated Remote BIodiversity MONitoring Network) (4)cuenta con estaciones temporales y permanentes de grabacion y transmision de archivos de audio, software para el manejo de base de datos y la clasificacion automatica de especies. Ademas, se desarrolla investigacion orientada a la recoleccion de informacion ambiental mediante imagenes satelitales.

* En Europa, el proyecto AMIBIO (Automatic acoustic Monitoring and Inventorying of Biodiversity) (5) desarrolla estaciones autonomas con multiples sensores en la region de Himeto (Grecia). Las estaciones de monitoreo se alimentan mediante paneles solares y se usan para grabar y transmitir senales de audio y datos climaticos. Los objetivos del proyecto son: evaluar la biodiversidad, estimar la densidad de animales, detectar la presencia o ausencia de especies raras o en peligro en areas de dificil acceso, estimar la salud de ciertas especies, advertir la presencia de sonidos atipicos tales como la presencia de cazadores y detectar posibles desastres naturales inducidos por la actividad humana.

* El Laboratorio de Evaluacion Ambiental Remota REAL (Remote Environmental Assessment Laboratory) (6) de la Universidad del Estado de Michigan establecio un observatorio ecologico a traves de sensores para monitorear el ambiente de manera automatizada mediante una red de sensores que recolectan los datos de forma programada. Los paisajes sonoros son analizados en tiempo real con el fin de identificar las especies basandose en las vocalizaciones que emiten. Esta informacion es la base para las investigaciones bioacusticas e indices ecologicos. Toda esta informacion se almacena en una base de datos que se puede consultar por Internet.

6 Software comercial o libre

Los siguientes son programas computacionales que poseen herramientas de tratamiento de senales de audio y que se han usado para el analisis y reconocimiento bioacustico:

* Avisoft (http://www.avisoft.com/): herramienta para el analisis, edicion y clasificacion de sonidos. Software comercial, posee una version "lite" para descargar.

* PAMGUARD (http://www.pamguard.org/): software especializado en la deteccion, localizacion y clasificacion de mamiferos marinos. Codigo abierto.

* Raven (http://www.birds.cornell.edu/brp/raven/RavenOverview.html): software de analisis de sonidos del BRP de la Universidad Cornell. Software disponible en versiones comercial y libre.

* Song Scope (http://www.wildlifeacoustics.com/products/song-scope-overview): herramienta de analisis y reconocimiento de sonidos. Software comercial, tiene una version de prueba de 15 dias.

* SoundID (http://www.soundid.net/): herramienta de deteccion y reconocimiento de sonidos. Software comercial, tiene una version de prueba de 30 dias.

* XBAT (http://www.birds.cornell.edu/brp/software): herramienta de analisis de sonidos desarrollada con el software de analisis matematico MATLAB. Codigo abierto (MATLAB tiene licencia comercial).

* SonoBat (http://www.sonobat.com/): herramienta de analisis y reconocimiento de vocalizaciones de murcielagos. Software comercial y version de prueba.

7 Retos y oportunidades para Colombia

Colombia es un pais rico en biodiversidad y fauna vocalmente activa, cuenta con mas de 1.860 especies de aves [5], 763 especies de anfibios, 479 especies de mamiferos, 2.000 especies de peces marinos y 1.435 especies de peces dulceacuicolas (7). Las aves son un grupo que ha sido utilizado como indicador de cambios en la naturaleza, estan distribuidas ampliamente, son faciles de detectar por sus sonidos y, en comparacion con otros grupos de animales, se cuenta con gran conocimiento de la biologia de la mayoria de las especies. En Colombia existen cerca de 20 asociaciones de ornitologia dispersas por el territorio nacional, las cuales pueden presentar interes en este tipo de monitoreo. A escala global, la contribucion de asociaciones ornitologicas y de observadores de aves ha incrementado el conocimiento de las tendencias poblacionales de las aves, especialmente en Europa y Norte America. En Colombia, desde 1987, se han realizado censos anuales de aves, los cuales han contribuido con el incremento del conocimiento y la cohesion de las asociaciones ornitologicas; el metodo de muestreo empleado en estos censos anuales es puntos de conteo. Si las asociaciones ornitologicas implementaran un sistema de monitoreo acustico automatizado, bajo un diseno experimental sistematizado podrian operar no solo por una vez al ano, sino tener datos a escalas temporales y espaciales mas amplias y de esta manera, contar con informacion a diferentes niveles, de comunidades y poblaciones.

Es cada vez mas creciente el interes de diferentes entidades ante este tipo de aproximacion a la biodiversidad, como por ejemplo fundaciones y organizaciones no gubernamentales (ONGs), instancias academicas en diferentes zonas de Colombia, quienes en conjunto podrian realizar nodos de monitoreo, bajo un sistema estandarizado de toma de datos en campo e identificacion de especies en laboratorio. El Instituto Humboldt cuenta con dos soportes ideales para el desarrollo de un sistema de monitoreo bioacustico: la Coleccion de Sonidos Ambientales y el Laboratorio de Biogeografia Aplicada y Bioacustica. La Coleccion de Sonidos tiene la capacidad para ser el centro de almacenamiento de los especimenes bioacusticos; de esta manera, se garantiza su proteccion a largo plazo, y en conjunto con entidades academicas con experiencia en ingenieria electronica, ciencias de la computacion e informatica y/o bioacustica nacionales e internacionales, podrian ofrecer las herramientas para la automatizacion del reconocimiento de las especies de fauna vocalmente activa, publicar esta informacion de manera gratuita y tener un sistema de informacion en linea sobre este tipo de monitoreo.

El monitoreo bioacustico automatizado es una herramienta llamativa en diferentes contextos, por ejemplo para el turismo ornitologico en Colombia, ya que es posible el desarrollo de aplicaciones para telefonos moviles, y de esta manera se facilita el reconocimiento de las especies en campo. El uso de sonidos de la fauna en sistemas educativos mediante textos escolares multimedia concientizaria a un publico infantil sobre la alta biodiversidad del pais. Adicionalmente, incrementar el conocimiento de este tipo de monitoreo en Colombia permitira que empresas privadas tengan sistemas de monitoreo confiables y eficaces, con un soporte fisico de la evidencia de la presencia de las especies en sus zonas de accion, ideal para estudios de impacto y planes de manejo ambiental que la Autoridad Nacional de Licencias Ambientales (ANLA) exige.

En cuanto al diseno e implementacion de un sistema de reconocimiento automatizado, hay tres cuellos de botella: a) recoleccion de un numero estadisticamente suficiente de ejemplos de vocalizaciones de las especies objetivo y no objetivo; b) segmentacion de las grabaciones para extraer las vocalizaciones y descartar porciones de audio que no sean de interes; c) transformacion de un sistema prototipo a uno definitivo, esto se refiere al desarrollo de interfaces de usuario, manuales, legalizacion de licencias y en general todo lo que se debe adicionar al sistema para ponerlo en funcionamiento. Las tareas a) y b) requieren mas que experiencia tecnica en informatica y electronica, la colaboracion de expertos en ecologia, esto se puede llevar a cabo a traves de convenios de cooperacion entre grupos o instituciones con personal capacitado en ciencia y tecnologia. Una vez se cuenta con un conjunto de ejemplos para la generacion de un prototipo de reconocimiento automatizado, la transformacion a uno definitivo y la instalacion son actividades que implican inversion en personal y, en la compra de equipos y software.

8 Conclusiones

Las herramientas tecnologicas disponibles actualmente, de adquisicion, almacenamiento y procesamiento de informacion, se pueden usar como apoyo a actividades de recoleccion ambiental facilitando tareas como: conteo de especies, evaluacion rapida de la biodiversidad con amplia cobertura espacial y temporal, enriquecimiento de la informacion en los estudios de ecologia y conservacion, desarrollo de actividades de monitoreo automatizado, monitoreo de especies raras o en peligro, deteccion de especies invasoras, estimacion del impacto del cambio climatico, analisis de los efectos de la actividad antropogenica, entre otras [19].

Las senales acusticas ambientales no se pueden adquirir en condiciones controladas, de manera que los sistemas automatizados de reconocimiento deben contar con metodos robustos al ruido, a las variaciones en intensidad y deben ser rapidos (teniendo en cuenta la gran cantidad de datos que se requiere inspeccionar). Ademas, considerando la naturaleza aleatoria y no estacionaria de las senales bioacusticas (variaciones temporales y espaciales de sus parametros), estos sistemas deberian permitir la inclusion periodica de correcciones sugeridas por expertos.

El monitoreo bioacustico tiene el potencial de suplir informacion en tiempo real de varios grupos taxonomicos simultaneamente, de manera sistematizada, abarcando amplias escalas tanto espaciales como temporales. Mediante este tipo de monitoreo se puede contar con informacion precisa sobre el comportamiento de las dinamicas de la naturaleza ante factores de cambio, tensores que estan asociados al desarrollo de la sociedad, por ejemplo la mineria, la agricultura, la infraestructura, asi como factores derivados del desarrollo humano, como el cambio climatico. El uso de esta novedosa tecnica de monitoreo permite crear sistemas de alerta temprana con alta eficacia, de tal manera que da un soporte con base en datos contemporaneos, a los tomadores de decisiones ambientales.

En el mundo se han desarrollado exitosamente investigaciones y proyectos sobre monitoreo de la biodiversidad usando este tipo de herramientas tecnologicas. La cooperacion entre instituciones facilitara la implementacion y el uso de esta tecnologia en el pais; un esquema de monitoreo bioacustico automatizado estandar permite unificar esfuerzos aislados de investigaciones relacionadas con el tema. Siendo Colombia un pais megadiverso, con alto numero de especies, endemicas, amenazadas y ecosistemas estrategicos se justifican los esfuerzos por implementar este tipo de sistemas de monitoreo de nuestra biodiversidad.

Agradecimientos

Esta revision se realizo en el marco del convenio de cooperacion no. 12020 celebrado entre el Instituto de Investigacion de Recursos Biologicos

"Alexander von Humboldt" y la Universidad Nacional de Colombia - Sede Manizales.

Referencias

[1] M. Depraetere, S. Pavoine, F. Jiguet, A. Gasc, S. Duvail, and J. Sueur, "Monitoring animal diversity using acoustic indices: Implementation in a temperate woodland," Ecological Indicators, vol. 13, no. 1, pp. 46-54, 2012. 172, 175

[2] D. M. Marsh and P. C. Trenham, "Current trends in plant and animal population monitoring," Conservation Biology, vol. 22, no. 3, pp. 647-655, 2008. 173

[3] M. A. Acevedo, C. J. Corrada-Bravo, H. Corrada-Bravo, L. J. Villanueva-Rivera, and T. M. Aide, "Automated classification of bird and amphibian calls using machine learning: A comparison of methods," Ecological Informatics, vol. 4, no. 4, pp. 206-214, 2009. 173, 176, 183

[4] C.-H. Lee, C.-C. Han, and C.-C. Chuang, "Automatic classification of bird species from their sounds using two-dimensional cepstral coefficients," IEEE Transactions on Audio, Speech, and Language Processing, vol. 16, no. 8, pp. 1541-1550, Nov. 2008. 173, 175, 177, 181, 182

[5] J. E. Botero, D. Arbelaez, and G. M. Lentijo, "Metodos para estudiar las aves," Biocarta, no. 8, pp. 1-4, Jul. 2005. [Online]. Available: http://www.rnoa.org/sco/ pdf/Biocarta008.pdf 173, 187

[6] W. J. Sutherland, Ecological census techniques: a handbook, 2nd ed. Cambridge University Press, 2006. 173

[7] C. Ten Cate, "Birdsong and Evolution," in Nature's music: the science of birdsong, 2004, ch. 10, pp. 296-317. 173

[8] W. Chu and D. T. Blumstein, "Noise robust bird song detection using syllable pattern-based hidden Markov models," in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, may 2011, pp. 345-348. 173, 183

[9] B. R. Grant and P. R. Grant, "Hybridization and speciation in darwin's finches: the role of sexual imprinting on a culturally transmitted trait," Endless Forms: Species and Speciation, pp. 404-422, 1998. 173

[10] R. Bardeli, D. Wolff, F. Kurth, M. Koch, K. H. Tauchert, and K.-H. Frommolt, "Detecting bird sounds in a complex acoustic environment and application to bioacoustic monitoring," Pattern Recognition Letters, vol. 31, no. 12, pp. 1524-1534, Sep. 2010. 174, 175, 182

[11] D. C. Cugler, C. B. Medeiros, and L. F. Toledo, "Managing animal sounds-some challenges and research directions," in Proceedings V eScience Workshop-XXXI Brazilian Computer Society Conference, 2011. 174

[12] A. Farnsworth and R. W. Russell, "Monitoring flight calls of migrating birds from an oil platform in the northern gulf of mexico," Journal of Field Ornithology, vol. 78, no. 3, pp. 279-289, 2007. 174

[13] D. Mennill and S. Vehrencamp, "Context-dependent functions of avian duets revealed through microphone array recordings and multi-speaker playback," Current Biology, vol. 18, pp. 1314-1319, 2008. 174

[14] K. J. Odom and D. J. Mennill, "A quantitative description of the vocalizations and vocal activity of the barred owl," The Condor, vol. 112, no. 3, pp. 549-560, 2010. 174

[15] S. Gaunt and A. McCallum, "Birdsong and Conservation," in Nature's music: the science of birdsong, 2004, ch. 12, pp. 343-362. 174

[16] A. Kirschel, M. Cody, Z. Harlow, V. Promponas, E. Vallejo, and C. Taylor, "Territorial dynamics of mexican ant-thrushes formicarius moniliger revealed by individual recognition of their songs," Ibis, vol. 153, no. 2, pp. 255-268, 2011. 174, 185

[17] D. T. Blumstein, D. J. Mennill, P. Clemins, L. Girod, K. Yao, G. Patricelli, J. L. Deppe, A. H. Krakauer, C. Clark, K. A. Cortopassi, S. F. Hanser, B. McCowan, A. M. Ali, and A. N. G. Kirschel, "Acoustic monitoring in terrestrial environments using microphone arrays: applications, technological considerations and prospectus," Journal of Applied Ecology, vol. 48, no. 3, pp. 758-767, 2011. 174, 175, 176, 181, 182, 185

[18] D. Chesmore, "The automated identification of taxa: Concepts and applications," in Automated Taxon Identification in Systematics: Theory, Approaches and Applications, ser. Systematics Association special volumes, N. MacLeod, Ed. Boca Raton, FL: CRC Press, 2008, vol. 74, ch. 6, pp. 83-100. 174, 175

[19] D. Chesmore, K.-H. Frommolt, D. Wolff, R. Bardeli, and S. Huebner, "Computational bioacoustics: New tools for assessing biological diversity," May 2008, side Event at the ninth meeting of the Conference of the Parties (COP 9). Bonn, Germany. 174, 175, 190

[20] M. A. Acevedo and L. J. Villanueva-Rivera, "Using automated digital recording systems as effective tools for the monitoring of birds and amphibians," Wildlife Society Bulletin, vol. 34, pp. 211-214, 2006. 174, 176

[21] D. W. Armitage and H. K. Ober, "A comparison of supervised learning techniques in the classification of bat echolocation calls," Ecological Informatics, vol. 5, no. 6, pp. 465-473, 2010. 174, 180, 182, 183

[22] F. Briggs, X. Fern, and R. Raich, "Acoustic classification of bird species from syllables: an empirical study," Oregon State University, Tech. Rep., 2009. 174, 182, 183

[23] E. P. Kasten, P. K. McKinley, and S. H. Gage, "Ensemble extraction for classification and detection of bird species," Ecological Informatics, vol. 5, no. 3, pp. 153 166, 2010. 175, 181, 182, 183, 184

[24] T. S. Brandes, "Automated sound recording and analysis techniques for bird surveys and conservation," Bird Conservation International, vol. 18, no. S1, pp. S163-S173, 2008. 175, 181, 182

[25] R. Mason, P. Roe, M. Towsey, J. Zhang, J. Gibson, and S. Gage, "Towards an acoustic environmental observatory," in eScience, 2008. eScience '08. IEEE Fourth International Conference on, 2008, pp. 135-142. 176, 184

[26] R. S. Rempel, C. M. Francis, J. N. Robinson, and M. Campbell, "Comparison of audio recording system performance for detecting and monitoring songbirds," Journal of Field Ornithology, vol. 84, no. 1, pp. 86-97, 2013. 176, 177

[27] D. Mennill, M. Battiston, D. R. Wilson, J. R. Foote, and S. M. Doucet, "Field test of an affordable, portable, wireless microphone array for spatial monitoring of animal ecology and behaviour," Methods in Ecology and Evolution, vol. 3, pp. 704-712, 2012. 176

[28] K. A. Hobson, R. S. Rempel, H. Greenwood, B. Turnbull, and S. L. Van Wilgenburg, "Acoustic surveys of birds using electronic recordings: new potential from an omnidirectional microphone system," Wildlife Society Bulletin, pp. 709-720, 2002. 176

[29] L. A. Venier, S. B. Holmes, G. W. Holborn, K. A. Mcilwrick, and G. Brown, "Evaluation of an automated recording device for monitoring forest birds," Wildlife Society Bulletin, vol. 36, no. 1, pp. 30-39, 2012. 176

[30] T. S. Brandes, "Feature vector selection and use with hidden Markov models to identify frequency-modulated bioacoustic signals amidst noise," IEEE Transactions on Audio, Speech, and Language Processing, vol. 16, no. 6, pp. 1173 -1180, aug 2008. 177, 180, 182

[31] P. Caycedo-Rosales, "Estudio comparativo del canto entre poblaciones del soterrey de apolinar (cistothorus apolinari, troglodytidae) presentes en la cordillera oriental de los andes colombianos," Universidad Nacional de Colombia, 2000, tesis de pregrado. 177

[32] B. Lakshminarayanan, R. Raich, and X. Fern, "A syllable-level probabilistic framework for bird species identification," in Proceedings of the Fourth International Conference on Machine Learning and Applications. Los Alamitos, CA, USA: IEEE Computer Society, Dec. 2009, pp. 53-59. 178, 180, 181, 183

[33] R. Bardeli, "Similarity search in animal sound databases," IEEE Transactions on Multimedia, vol. 11, no. 1, pp. 68-76, jan 2009. 179

[34] F. Briggs, R. Raich, and X. Z. Fern, "Audio classification of bird species: A statistical manifold approach," in Proceedings of the Ninth IEEE International Conference on Data Mining. Los Alamitos, CA, USA: IEEE Computer Society, Dec. 2009, pp. 51-60. 179, 182, 183

[35] C.-J. Huang, Y.-J. Yang, D.-X. Yang, and Y.-J. Chen, "Frog classification using machine learning techniques," Expert Systems with Applications, vol. 36, no. 2, pp. 3737-3743, 2009. 179, 180, 181, 182, 183

[36] D. Todt, "From birdsong to speech: a plea for comparative approaches," Anais da Academia Brasileira de Ciencias, vol. 76, no. 2, pp. 201-208, 2004. 179

[37] L. Ranjard and H. A. Ross, "Unsupervised bird song syllable classification using evolving neural networks," Journal of the Acoustical Society of America, vol. 123, no. 6, pp. 4358-4368, 2008. 179, 181

[38] M. Bramer, Principles of Data Mining. Springer, 2007. 180

[39] S. Fagerlund, "Bird species recognition using support vector machines," EURASIP Journal on Advances in Signal Processing, vol. 2007, no. 1, pp. 64-64, 2007. 180

[40] I. Urazghildiiev, C. Clark, T. Krein, and S. Parks, "Detection and Recognition of North Atlantic Right Whale Contact Calls in the Presence of Ambient Noise," IEEE Journal of Oceanic Engineering, vol. 34, no. 3, pp. 358-368, Jul. 2009. 180

[41] F. Briggs, B. Lakshminarayanan, L. Neal, X. Z. Fern, R. Raich, S. J. K. Hadley, A. S. Hadley, and M. G. Betts, "Acoustic classification of multiple simultaneous bird species: A multi-instance multi-label approach," Journal of the Acoustical Society of America, vol. 131, no. 6, pp. 4640-4650, Oct. 2012. 180, 181

[42] C.-H. Chou, P.-H. Liu, and B. Cai, "On the studies of syllable segmentation and improving MFCCs for automatic birdsong recognition," in Proceedings of the 2008 IEEE Asia-Pacific Services Computing Conference. Washington, DC, USA: IEEE Computer Society, 2008, pp. 745-750. 181, 183

[43] A. Harma, "Automatic identification of bird species based on sinusoidal modeling of syllables," in Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP '03, vol. 5, Apr. 2003, pp. 545-548. 181

[44] D. Stowell and M. D. Plumbley, "Birdsong and C4DM: A survey of UK birdsong and machine recognition for music researchers," Centre for Digital Music, Queen Mary, University of London, London, UK, Tech. Rep. C4DM-TR-09-12, Jul. 2011.181

[45] L. Neal, F. Briggs, R. Raich, and X. Z. Fern, "Time-frequency segmentation of bird song in noisy acoustic environments," in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, pp. 2012 2015.181

[46] C.-H. Lee, S.-B. Hsu, J.-L. Shih, and C.-H. Chou, "Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features," IEEE Transactions on Multimedia, vol. 15, pp. 454-464, 2013. 181

[47] D. Mitrovic, M. Zeppelzauer, and C. Breiteneder, "Features for content-based audio retrieval," in Advances in Computers: Improving the Web, ser. Advances in Computers, M. V. Zelkowitz, Ed. Elsevier, 2010, vol. 78, pp. 71-150. 181, 182

[48] S. Ntalampiras, I. Potamitis, and N. Fakotakis, "Probabilistic Novelty Detection for Acoustic Surveillance Under Real-World Conditions," IEEE Transactions on Multimedia, vol. 13, no. 4, pp. 713-719, Aug. 2011. 182

[49] A. Selin, J. Turunen, and J. T. Tanttu, "Wavelets in recognition of bird sounds," EURASIP J. Appl. Signal Process., vol. 2007, no. 1, pp. 141-141, Jan. 2007. 182

[50] J. L. Goyette, R. W. Howe, A. T. Wolf, and W. D. Robinson, "Detecting tropical nocturnal birds using automated audio recordings," Journal of Field Ornithology, vol. 82, no. 3, pp. 279-287, 2011. 182

[51] C. M. Bishop, Pattern Recognition and Machine Learning (Information Science and Statistics), 1st ed. Springer, 2007. 183

[52] R. Duda, P. Hart, and D. Stork, Pattern Classification. Wiley, 2001. 183

[53] L. R. Rabiner, "A tutorial on hidden Markov models and selected applications in speech recognition," Proceedings of the IEEE, vol. 77, no. 2, pp. 257-286, May 1989.183

[54] D. Chesmore, "Automated bioacoustic identification of species," Anais da Academia Brasileira de Ciencias, vol. 76, no. 2, pp. 436-440, 2004. 184

[55] J. Wimmer, M. Towsey, B. Planitz, P. Roe, and I. Williamson, "Scaling acoustic data analysis through collaboration and automation," in e-Science (e-Science), 2010 IEEE Sixth International Conference on. IEEE, 2010, pp. 308-315. 184

[56] W. J. Sutherland, From individual behaviour to population ecology. Oxford University Press Inc., 1996. 184

[57] P. K. McGregor, T. M. Peake, and G. Gilbert, "Communication behaviour and conservation," in Behaviour and Conservation. Cambridge University Press, 2000. 184

[58] H. Slabbekoorn, "Singing in the wild: the ecology of birdsong," in Nature's music: the science of birdsong, 2004, ch. 1, pp. 178-2005. 184

[59] V. Deecke, J. Ford, and P. Spong, "Quantifying complex patterns of bioacoustic variation: use of a neural network to compare killer whale (orcinus orca) dialects," The Journal of the Acoustical Society of America, vol. 105, p. 2499, 1999. 184

[60] H. Mills, "Automatic detection and classification of nocturnal migrant bird calls," The Journal of the Acoustical Society of America, vol. 97, p. 3370, 1995. 185

[61] A. Taylor, "Bird flight call discrimination using machine learning," The Journal of the Acoustical Society of America, vol. 97, p. 3370, 1995. 185

[62] W. M. Tyler, "The call-notes of some nocturnal migrating birds," The Auk, pp. 132-141, 1916. 185

(1) http://arbimon.com/arbimon/index.php/products-acoustics

(2) Problema de clasificacion con dos clases en donde los objetos pueden pertenecer a una clase denominada como clase positiva u objetivo o a otra denominada como negativa o no objetivo.

(3) http://www.birds.Cornell.edu/brp/

(4) http://arbimon.com/

(5) http://www.amibio-project.eu/

(6) http://www.real.msu.edu/

(7) https://www.siac.gov.co/contenido/contenido.aspx?conID=1252&catID=52

Paula Catalina Caycedo-Rosales (1), Jose Francisco Ruiz-Munoz (2) y Mauricio Orozco-Alzate (3)

Recepcion: 14-05-2013, Aceptacion: 30-07-2013 Disponible en linea: 05-11-2013

PACS: 43.60.-c, 43.60.Lq, 43.80.-n

(1) Magister en Ecologia, pcaicedo@humboldt.org.co, Instituto de Investigacion de Recursos Biologicos Alexander von Humboldt, Bogota-Colombia.

(2) Magister en Ingenieria, jfruizmu@unal.edu.co, Universidad Nacional de Colombia, Manizales-Colombia.

(3) Doctor en Ingenieria Automatica, morozcoa@unal.edu.co, Universidad Nacional de Colombia, Manizales-Colombia.
COPYRIGHT 2013 Universidad EAFIT
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2013 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Caycedo-Rosales, Paula Catalina; Ruiz-Munoz, Jose Francisco; Orozco-Alzate, Mauricio
Publication:Ingenieria y Ciencia
Date:Jul 1, 2013
Words:9177
Previous Article:Modelo analitico para el transporte electronico en peliculas delgadas semiconductoras.
Next Article:Tecia solanivora, povolny (lepidoptera: gelechiidae): una revision sobre su origen, dispersion y estrategias de control biologico.
Topics:

Terms of use | Privacy policy | Copyright © 2019 Farlex, Inc. | Feedback | For webmasters