Christopher D Gómez | Universidad Latina de Panama (original) (raw)
Estudiante de Ingeniería Mecatrónica
Comprendo tres idiomas: Español, Ingles y Japonés (N4)
Phone: +507 67010297
Address: Panamá
less
Related Authors
Vietnam National University - Ho Chi Minh City
Uploads
Book Reviews by Christopher D Gómez
Papers by Christopher D Gómez
Projecto IA , 2019
El objetivo de este proyecto es clasificar la imagen de entrada como una imagen de perro o de gat... more El objetivo de este proyecto es clasificar la imagen de entrada como una imagen de perro o de gato. Se analizará la entrada de imagen que es provista al sistema y el resultado predicho se brindará como salida. El algoritmo de aprendizaje automático, red neuronal convolucional, se utiliza para clasificar la imagen. El modelo así implementado puede extenderse a un dispositivo móvil o a cualquier sitio web según las necesidades del desarrollador. I. INTRODUCCIÓN l conjunto de datos Perros vs. Gatos es un conjunto de datos estándar de visión por computador que implica la clasificación de las fotos ya sea que contengan un perro o un gato. Aunque el problema parece sencillo, sólo se ha abordado de forma efectiva en los últimos años mediante el uso de redes neuronales convolucionales de aprendizaje profundo. Aunque el conjunto de datos se ha resuelto de forma efectiva, puede utilizarse como base para el aprendizaje y la práctica de cómo desarrollar, evaluar y utilizar las redes neuronales convolucionales de aprendizaje profundo para la clasificación de imágenes desde cero. Esto incluye cómo desarrollar un robusto arnés de prueba para estimar el rendimiento del modelo, cómo explorar las mejoras del modelo y cómo guardar el modelo y posteriormente cargarlo para hacer predicciones sobre nuevos datos. II. REDES NEURONALES CONVOLUCIONALES (CNNS) Las CNNs son modelos de aprendizaje profundo adecuados para analizar imágenes visuales. Están fuertemente influenciados por la forma en que nosotros, los humanos, vemos el mundo que nos rodea. Antes de proceder a las CNNs para analizar cómo ven las computadoras, enfoquémonos en cómo los humanos son capaces de hacerlo. A. ¿Cómo ven los humanos? Estructura visual del cerebro humano Cuando vemos un objeto, los receptores de luz en sus ojos envían señales a través del nervio óptico a la corteza visual primaria, donde se procesa la entrada. La corteza visual primaria tiene sentido de lo que el ojo ve. La estructura jerárquica profundamente compleja de las neuronas y las conexiones en el cerebro juegan un papel importante en este proceso de recordar y etiquetar los objetos. Sin entrar en más detalles, el cerebro humano analiza las imágenes en las capas de creciente complejidad. La primera capa distingue atributos básicos como líneas y curvas. En niveles más altos, el cerebro reconoce que una combinación de bordes y colores es, por ejemplo, un tren o un perro. Las neuronas corticales individuales responden a los estímulos sólo en una región restringida del campo visual conocida como campo receptivo. Los campos receptivos de las diferentes neuronas se superponen parcialmente de tal manera que cubren todo el campo visual. B. ¿Cómo ven las computadoras? Para una computadora, una imagen es sólo un conjunto de valores. Típicamente es una matriz tridimensional (RGB) de valores de píxeles. Por ejemplo, una representación de imagen abstracta 6x6 RGB se vería así.
Projecto IA , 2019
El objetivo de este proyecto es clasificar la imagen de entrada como una imagen de perro o de gat... more El objetivo de este proyecto es clasificar la imagen de entrada como una imagen de perro o de gato. Se analizará la entrada de imagen que es provista al sistema y el resultado predicho se brindará como salida. El algoritmo de aprendizaje automático, red neuronal convolucional, se utiliza para clasificar la imagen. El modelo así implementado puede extenderse a un dispositivo móvil o a cualquier sitio web según las necesidades del desarrollador. I. INTRODUCCIÓN l conjunto de datos Perros vs. Gatos es un conjunto de datos estándar de visión por computador que implica la clasificación de las fotos ya sea que contengan un perro o un gato. Aunque el problema parece sencillo, sólo se ha abordado de forma efectiva en los últimos años mediante el uso de redes neuronales convolucionales de aprendizaje profundo. Aunque el conjunto de datos se ha resuelto de forma efectiva, puede utilizarse como base para el aprendizaje y la práctica de cómo desarrollar, evaluar y utilizar las redes neuronales convolucionales de aprendizaje profundo para la clasificación de imágenes desde cero. Esto incluye cómo desarrollar un robusto arnés de prueba para estimar el rendimiento del modelo, cómo explorar las mejoras del modelo y cómo guardar el modelo y posteriormente cargarlo para hacer predicciones sobre nuevos datos. II. REDES NEURONALES CONVOLUCIONALES (CNNS) Las CNNs son modelos de aprendizaje profundo adecuados para analizar imágenes visuales. Están fuertemente influenciados por la forma en que nosotros, los humanos, vemos el mundo que nos rodea. Antes de proceder a las CNNs para analizar cómo ven las computadoras, enfoquémonos en cómo los humanos son capaces de hacerlo. A. ¿Cómo ven los humanos? Estructura visual del cerebro humano Cuando vemos un objeto, los receptores de luz en sus ojos envían señales a través del nervio óptico a la corteza visual primaria, donde se procesa la entrada. La corteza visual primaria tiene sentido de lo que el ojo ve. La estructura jerárquica profundamente compleja de las neuronas y las conexiones en el cerebro juegan un papel importante en este proceso de recordar y etiquetar los objetos. Sin entrar en más detalles, el cerebro humano analiza las imágenes en las capas de creciente complejidad. La primera capa distingue atributos básicos como líneas y curvas. En niveles más altos, el cerebro reconoce que una combinación de bordes y colores es, por ejemplo, un tren o un perro. Las neuronas corticales individuales responden a los estímulos sólo en una región restringida del campo visual conocida como campo receptivo. Los campos receptivos de las diferentes neuronas se superponen parcialmente de tal manera que cubren todo el campo visual. B. ¿Cómo ven las computadoras? Para una computadora, una imagen es sólo un conjunto de valores. Típicamente es una matriz tridimensional (RGB) de valores de píxeles. Por ejemplo, una representación de imagen abstracta 6x6 RGB se vería así.