Uso de un algoritmo de realce de características como apoyo para un clasificador de redes neuronales convolucionales en imágenes de libélulas del género rhionaeschna
Abstract
En el estudio de diversas áreas de la ciencia los especialistas utilizan técnicas de clasificación que les permiten estandarizar conocimientos a nivel mundial. En la entomología, que es el estudio de los insectos, la gran cantidad de especies animales en el planeta tierra plantea una clara dificultad en el momento de compartir información; para solucionar este inconveniente, los biólogos utilizan la sistemática o taxonomia, con el fin de clasificar organismos vivos según sus características fenotípicas en reinos, filos, clases, órdenes, familias, géneros y especies. El diagnóstico visual de estas características fenotípicas es la base de esta investigación, los entomólogos utilizan una serie de claves físicas que permite distinguir a las especies según su apariencia, formas, colores y tamaños. Para realizar este proceso de manera más rápida y automatizada existen muchas herramientas de clasificación, actualmente se están desarrollando algoritmos de clasificación de imágenes o chasquido de saltamontes (Guevara, 2008), así como reconocimiento de artrópodos (Siti N. A. Hassan, 2014). Para el desarrollo de una herramienta de diagnóstico visual de fenotipos de especies, primero necesitamos crear un dataset de imágenes tomadas por diversas cámaras y ángulos de las muestras a estudiar (dos especies de libélulas del género Rhionaeschna), posteriormente tenemos que preprocesar estas imágenes para obtener un buen resultado en la clasificación, teniendo en cuenta que el algoritmo debe ser aplicado en computadoras económicas o dispositivos móviles de bajo costo, por lo tanto se debe minimizar el uso de recursos. Luego, se hace uso de un clasificador que en este caso estará basado en la teoría de Redes Neuronales Convolucionales, éste, trabajará con una arquitectura de procesamiento preentrenada para reducir el costo computacional. Uniendo ambas etapas, deseamos lograr un aumento en la precisión de nuestro clasificador de RNC con el fin de obtener una herramienta que no solo brinda un bajo costo computacional, sino una precisión aceptable para una posterior implementación de un aplicativo que pueda ser usado por especialistas en cualquier parte del mundo para la detección de especies de libélulas. Se planteó la arquitectura de RNC Inception-v3 para el desarrollo de esta investigación, la cual nos brinda un clasificador pre-entrenado, que reduce el costo computacional del proyecto, también es la arquitectura con mejor desempeño y mayor taza de acierto en el mercado según la competencia de reconocimiento visual a gran escala de ImageNet del año 2014. Siendo la mejor alternativa para resolver el problema de esta investigación. El uso del método haar cascade permitió reducir las imágenes a una escala más cómoda para el clasificador al momento de realizar la categorización de especies. El clasificador haar cascade y un algoritmo de realce de características como método de pre-procesamiento de imágenes ayudó a reducir el tiempo de entrenamiento de la red neuronal.
Collections
- Tesis [92]