Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales

Jorge Castro; Roberto Vargas-Masís; Danny Alfaro-Rojas

doi:10.18845/tm.v33i5.5075

Tecnología en Marcha (Mar 2020)

Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales

Jorge Castro,
Roberto Vargas-Masís,
Danny Alfaro-Rojas

Affiliations

Jorge Castro: ORCiD; Centro Nacional de Alta Tecnología
Roberto Vargas-Masís: ORCiD; Universidad Estatal a Distancia
Danny Alfaro-Rojas: ORCiD; Universidad Estatal a Distancia

DOI: https://doi.org/10.18845/tm.v33i5.5075

Abstract

Read online

Se han propuesto muchos algoritmos de detección de audio para monitorear aves usando sus vocalizaciones. Entre estos algoritmos, las técnicas basadas en el aprendizaje profundo han tomado la delantera en términos de rendimiento a gran escala. Sin embargo, usualmente se requiere de mucho trabajo manual para etiquetar correctamente las vocalizaciones de aves en grandes conjuntos de datos. Una forma de abordar esta limitación es usar el marco de trabajo de aprendizaje de instancias múltiples (MIL), que modela cada grabación como una bolsa de instancias, es decir, una colección de segmentos de audio que se asocia con una etiqueta positiva si un pájaro está presente en la grabación. En este trabajo, modificamos una red profunda MIL propuesta previamente, para predecir la presencia o ausencia de aves en grabaciones de campo de un minuto. Exploramos el comportamiento y el rendimiento de la red cuando utilizamos un número diferente de coeficientes cepstrales de frecuencia de mel (MFCC) para representar las grabaciones. La mejor configuración encontrada logró un valor F de 0.77 sobre el conjunto de datos de validación.

Published in Tecnología en Marcha

ISSN: 0379-3982 (Print); 2215-3241 (Online)
Publisher: Instituto Tecnológico de Costa Rica
Country of publisher: Costa Rica
LCC subjects: Technology
Website: https://revistas.tec.ac.cr/index.php/tec_marcha

About the journal

Abstract

Keywords