Hurtado et al., Computación inteligente para la Clasificación de Semillas de Trigo  
LA COMPUTACIÓN INTELIGENTE PARA LA CLASIFICACIÓN  
DE SEMILLAS DE TRIGO  
1
2
3
Andrés Hurtado Pasquel , Wendy Estupiñan Estupiñan , Franyelit Suárez Carreño  
angel.andrew.hurtad@gmail.com, wendy.paola.estupinan@gmail.com, franyelit.suarez@pucese.edu.ec  
Pontificia Universidad Católica del Ecuador, Sede Esmeraldas-Ecuador  
Recibido (06/06/17), aceptado (08/02/18)  
Resumen: Los mapas auto-organizados (SOM) de Kohonen, son un tipo de redes neuronales  
artificiales de aprendizaje no supervisado, que permite la identificación de patrones entre  
datos midiendo las distancias entre ellos para formar clústers mediante el encuentro de un  
representante por cada grupo. En este artículo se presenta el algoritmo SOM para representar  
mapas de datos, se utilizará un programa en Matlab con la herramienta SOM toolbox para llevar a  
cabo la clasificación de tres tipos de semillas de trigo, a partir de los atributos de las mismas.  
Palabras Clave: SOM, entrenamiento, red neuronal artificial, base de datos, clasificación.  
INTELLIGENT COMPUTING FOR THE  
CLASSIFICATION OF WHEAT SEEDS  
Abstract: Kohonen's self-organized maps (SOM) are a type of artificial neural networks of unsupervised  
learning that allows the identification of patterns between data by measuring the distances between  
them to form clusters by meeting one representative for each group. In this article we present the  
SOM algorithm to represent data maps, we will use a program in Matlab with the tool SOM toolbox  
to carry out the classification of three types of wheat seeds, based on the attributes of the same.  
Key words: Keywords - SOM, training, artificial neural network, database, classification.  
27  
ISSN 2542-3401  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 22, Nº 86 Marzo 2018 (pp. 27-33)  
Hurtado et al., Computación inteligente para la Clasificación de Semillas de Trigo  
I.INTRODUCCIÓN  
B. Redes Neuronales Artificiales  
La inteligencia en la actualidad ha evolucionado, ésta  
Las redes neuronales artificiales (RNA), consisten en  
ya no es solo para las personas, sino también las máquinas; un gran número de neuronas interconectadas que trabajan  
el hombre ha creado máquinas electrónicas capaz de en paralelo hacia una solución específica, estas permiten  
resolver problemas al igual que un ser humano, para el procesamiento de grandes volúmenes de datos a gran  
comprobarlo se han realizado estudios y pruebas, entre velocidad.  
ellos el Test de Turing, el cual describe lo siguiente: si una  
persona establece una conversación con una máquina que C. Aprendizaje No Supervisado  
se encuentra en un cuarto oscuro, y al finalizar piensa que  
estuvo conversando con una persona, se considera que esa de problemas en los cuales se pretende buscar e identificar  
máquina es inteligente. estructuras, tipo de organización o jerarquías de datos,  
Este tipo de aprendizaje es muy útil para la solución  
Otro gran paso en el avance tecnológico ha sido la sin contar con alguna forma de conocimiento previo para  
Inteligencia Artificial (IA) la misma que pretende simular ejercer un entrenamiento.  
el funcionamiento del cerebro humano para aprender y  
resolver problemas.  
D. Herramienta SOM Toolbox  
El presente trabajo consiste en utilizar el algoritmo de  
SOM Toolbox es una biblioteca de funciones libres  
clustering SOM, analizando su desempeño para distintos para MATLAB 5 que implementa el algoritmo SOM,  
parámetros de entrenamiento. Para esto se utilizará una visualización y análisis [4][5]. Esta herramienta permite  
base de datos conformada por tres especies de semillas el entrenamiento de redes SOM en diferentes tipologías  
con siete atributos cada una [1][2]. Esta base de datos y parámetros de aprendizaje, permite calcular diferentes  
contiene siete atributos de mediciones de las propiedades errores, calidad y medidas para SOM. La visualización  
geométricas de los núcleos pertenecientes a tres diferentes de esta se presenta a través de matrices, planos de  
variedades de trigo para 210 muestras, las cuales son:  
componentes, codificación de colores por clústers, enlaces  
de colores entre SOM y más.  
1
2
3
4
5
6
7
. Zona (A)  
. Perímetro (P)  
. Compacidad (C = 4 * pi * A / P ^ 2)  
. Longitud de kernel  
. Anchura del kernel,  
E. Redes SOM  
SOM por sus siglas en inglés corresponden a  
Self-Organizing Maps que significa Mapas auto-  
organizados o también llamados Mapas de Kohonen,  
es un tipo de red neuronal artificial con entrenamiento  
no supervisado, el mismo que permite agrupar los  
datos a través de un representante por cada grupo, para  
. Coeficiente de asimetría  
. Longitud de la ranura del núcleo.  
La base de datos contiene información de tres diferentes así visualizar un mapa con la descripción intuitiva de  
clases de trigos: Kama(1), Rosa(2) y canadiense(3), con 70 la similitud entre los datos.  
elementos cada uno, seleccionados al azar.  
Mediante la herramienta Matlab se  
correspondenciaentrelostiposdetrigosylascaracterísticas  
de cada uno mediante una red SOM.  
encontrará la Arquitectura del SOM  
Kohonen [6] propuso el modelo neuronal de la  
red SOM con el objetivo de demostrar que a partir  
de estímulos externos o datos de entrada de espacios  
multidimensionales, la estructura propia de la red  
artificial puede describir y proyectar la información  
abstraída en los estímulos, organizando datos de  
II. FUNDAMENTACIÓN TEÓRICA  
A. Semillas de Trigo  
El término trigo se emplea para identificar a otro tipo salida en un mapa bidimensional. Un modelo SOM  
de cereal denominado Triticum, del cual existen diversas está compuesto por dos capas de neuronas [7]. La  
especies que han evolucionado a través del tiempo capa de entrada, formada por N neuronas, una por  
dependiendo el clima, la estación, región, temperatura, y cada variable de entrada, se encarga de recibir y  
más. Las semillas de trigo se caracterizan por ser de tipo transmitir a la capa de salida la información procedente  
endosperma (contenida en un solo saco embrionario); del exterior. La capa de salida, formada por M neuronas,  
además de poder clasificarse por anchura, longitud, es encargada de procesar la información y formar el mapa  
asimetría o zonas/regiones. [3]  
de rasgos [8].  
28  
ISSN 2542-3401  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 22, Nº 86 Marzo 2018 (pp. 27-33)  
Hurtado et al., Computación inteligente para la Clasificación de Semillas de Trigo  
En la Figura 1 se observa la estructura que presenta la red F. Entrenamiento  
SOM, compuesta por la capa de entrada y salida.  
Cada vez que se entrena la red neuronal SOM, a esta  
se le introduce un vector de datos de entrada y otro vector  
aleatorio correspondiente a los pesos de inicialización de  
cada neurona, se cuantifica la disimilitud entre ellos, y  
la neurona vencedora será aquella que se encuentre más  
cerca a esa medida, formando clústeres con las demás  
neuronas que se aproximen a la neurona vencedora [8].  
III. METODOLOGÍA  
AlAnalizar el desempeño del algoritmo de clustering  
Red Neuronal SOM a través de distintos parámetros  
de entrenamiento, se evidencia la importancia de  
Figura 1. Estructura de la Red SOM.  
Las Redes SOM se caracterizan por su aprendizaje la utilización de dichas redes/algoritmos en la vida  
secuencial que consiste en presentar ejemplos, buscar cotidiana. Día tras día se crean nuevas aplicaciones para  
el resultado más cercano y posteriormente actualizar su encontrar patrones similares y agruparlos entre ellos, de  
posición en el espacio destinado para este [9].  
tal manera que se entienda la relación que existe.  
El presente trabajo explica detalladamente  
La Arquitectura de las redes SOM cuentan con:  
Matriz de neuronas: estas son un conjuntos de neuronas el procedimiento que se siguió para la creación,  
de la red que se distribuyen por todo un campo de dos o entrenamientoyevaluacióndelaredneuronalSOM,para  
tres dimensiones, pudiendo ser hexagonal, rectangular, lograr la clasificación efectiva de un grupo constituido  
entre otras, de tal manera que se identifican los grupos o por núcleos examinados (semillas) pertenecientes a tres  
clústeres [4][10].  
diferentes tipos de trigo: Kama, Rosa y Canadiense.  
Se cuenta con una base de datos titulada “seed” en  
En la Figura 2, se evidencia las matrices de neuronas con formato *.data tomada de UC Irvine Machine Learning  
dimensión hexagonal y rectangular.  
Repository, esta base de datos contiene 7 atributos y 70  
elementos por cada tipo de semilla, siendo en total 210  
instancias seleccionadas al azar para el experimento.  
Estos datos formarán la matriz de entrada.  
Para obtener los datos agrupados de las diferentes  
semillas de trigo se instaló la herramienta SOM  
toolbox en la aplicación Matlab, procediendo así al  
ingreso de los datos de entrada y salida en un solo  
archivo con formato *.data, la creación e inicialización  
del mapa, la normalización y entrenamiento de los  
datos. Adicionalmente se procedió a la creación del  
Figura 2. Configuraciones hexagonal y rectangular en código en un archivo con formato *.m con el cual una  
la retícula del SOM.  
vez listo se puedo llegar a visualizar los mapas que se  
requieran para el entendimiento y posterior análisis de  
Espacio de entrada: conjunto de datos de los mismos.  
entrada (inputs) que se identifican como un vector de  
Finalmente se realizó la clasificación de patrones  
componentes por cada atributo y así se determina la teniendo en cuenta los diferentes pesos aleatorios  
dimensión del vector de pesos iniciales.  
generados, que permiten visualizar de manera intuitiva  
Espacio de salida: corresponde al conjunto de datos en un plano 2D la organización de los distintos clústeres  
de salida (outputs/targets) de la red neuronal SOM de de los datos suministrados, los cuales presentan un  
menor dimensión que el conjunto de entrada.  
espectro de colores según la clase de semilla a la que  
Relación topológica entre neuronas: entre las pertenecen.  
neuronas existe una relación de vecindad, la cual es  
Finalmente se realizó la clasificación de patrones  
subyacente al conjunto de datos debido a su estructura teniendo en cuenta los diferentes pesos aleatorios  
topológica natural. Lo más importante es definir la regla generados, que permiten visualizar de manera intuitiva  
de asociación al inicio de la Red Neuronal SOM [8].  
en un plano 2D la organización de los distintos  
29  
ISSN 2542-3401  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 22, Nº 86 Marzo 2018 (pp. 27-33)  
Hurtado et al., Computación inteligente para la Clasificación de Semillas de Trigo  
clústeres de los datos suministrados, los cuales  
presentan un espectro de colores según la clase de  
semilla a la que pertenecen.  
IV. RESULTADOS  
Es necesario que la herramienta SOM sea  
capaz de agrupar en el mapa los tres tipos de trigos,  
proporcionándole únicamente los datos sobre las  
siete características citadas. Para ello se crearán las  
categorías de forma no supervisada por la propia red.  
Se inicializó la red con los datos de las semillas, tomando  
en cuenta las características propias de cada tipo Figura3.GráficaenHexagonaldecadaatributoAgrupado  
Rseed= som_read _data('C:\IA2\seed.data'); % Lee  
datos en código ascii  
Rseed = som_normalize(Rseed,'var'); % Normaliza el Figura 4, en la cual se presenta la clasificación de los  
conjunto de datos  
tres tipos de semillas, obsérvese que existen dos mapas  
Eseed = som_make(Rseed); % crea, inicializa y hexagonales cada uno con las etiquetas propias de cada  
enttena a la red SOM  
semillaagrupadasentresclústeresdiferentes,yungráfico  
Eseed = som_autolabel(Eseed,Rseed,'vote'); % ordena de proyecciones. En los tres casos se puede diferenciar  
Las proyecciones pueden también observarse en la  
las etiquetas automaticamente  
como se encuentran separados los grupos de semilla.  
som_  
Una vez declarado podemos empezar a trabajar  
con la herramienta, obteniendo por cada atributo  
un código de colores que lo representa y que hace  
énfasis en las características propias de cada semilla .  
subplot(1,3,1)  
som_cplane(Eseed,Code,DisMatriz);  
hold on  
som_grid(Eseed,'Label',cellstr(int2str(hits)),...  
'Line','none','Marker','none','Labelcolor','k');  
hold off  
title('Codigo de Colores')  
Una vez terminada la parte de codificación, es posible  
caracterizar los 7 clústeres asociados a los tipos de trigo.  
La Figura 3 muestra la matriz de todos los atributos de  
los tres tipos de semillas, matriz de pesos agrupados Figura 4. Gráfica de las Proyecciones  
por atributos y la clasificación, En las matrices, los  
tonos de colores más oscuros representan una gran  
La Figura 5 se muestran los datos agrupados por  
distancia entre las neuronas y los colores más claros atributos de dos en dos y la relación existente entre cada  
significa que los vectores de los atributos de las semillas uno de ellos. Para lo cual, un atributo se coloca en el eje  
están próximos entre sí en el espacio de entrada. de las x y el siguiente en el eje de las y determinando lo  
dispersos o cercanos que se encuentran los datos.  
30  
ISSN 2542-3401  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 22, Nº 86 Marzo 2018 (pp. 27-33)  
Hurtado et al., Computación inteligente para la Clasificación de Semillas de Trigo  
Figura 5. Gráfica de relaciones entre Atributos  
Otra manera de analizar los datos a través de gráficas no tiene nada que ver uno con el otro, ya que existe  
se encuentra en la Figura 6. En la imagen encontramos un espacio significante entre las neuronas (entre más  
3
gráficas diferentes, la del lado izquierdo muestra un diferente sea el color de una neurona y otra, más espacio  
plano que identifica el peso de las neuronas por atributos existirá).  
eje x atributos, eje y pesos neuronas) y los siguientes  
(
gráficos muestran el agrupamiento de las matrices de  
pesos.  
Figura 6. Agrupamiento de Valores por Atributos  
Para finalizar, la Figura 7 muestra la matriz completa  
con los datos una vez ya agrupados correctamente  
luego del entrenamiento de la red. Se puede observar Figura 7. Matriz Hexagonal con las Neuronas de  
claramente que existen neuronas de color amarillo junto Entrenamientos (Datos Agrupados por clase de  
con otras de color azul, esto quiere decir que estos datos Semilla de Trigos)  
31  
ISSN 2542-3401  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 22, Nº 86 Marzo 2018 (pp. 27-33)  
Hurtado et al., Computación inteligente para la Clasificación de Semillas de Trigo  
Para llevar a cabo el agrupamiento, fue de suma Conference on Imaging Systems and Techniques  
importancia la utilización de los siguientes comandos de Proceedings, 2012.  
la herramienta SOM Toolbox: som_read_data permite [2] F. González, N. Obregón, «Self-organizing maps  
la lectura del archivo con los datos de las semillas of Kohonen as a river clustering tool within the  
de trigo en formato .data, som_normalize permite methodology for determining regional ecological flows  
normalizar los datos con sus respectivos atributos para ELOHA»,Ingeniería y Universidad [en línea] 2013, 17  
poder ser inicializado y creado el mapa con som_make (Julio-Diciembre) : [Fecha de consulta: 28 de mayo de  
y por último som_show o som_show_add que permiten 2017] Disponible en:<http://oai.redalyc.org/articulo.  
la visualización de los mapas auto-organizativos, oa?id=47728826003> ISSN 0123-2126.  
mostrando los tres tipos de semillas agrupados.  
[3]A.Yasar,E.KayayI.Saritas,«ClassificationofWheat  
Types by Artificial Neural Network,» International  
Journal of Intelligent Systems and Applications in  
V. CONCLUSIONES  
Los estudios se llevaron a cabo utilizando la Engineering, vol. 4, nº 1, pp. 12-15, 2016.  
combinación de grano de trigo cosechado procedente de [4] M. Chang,Y. Horng and H. Jia-Sheng, «Evolutionary  
yacimientos experimentales, explorado en el Instituto self-organizing map», 1998 IEEE International Joint  
de Agrofísica de la Academia de Ciencias de Polonia en Conference on Neural Networks Proceedings. IEEE  
Lublin. El grupo constituido por núcleos examinados World Congress on Computational Intelligence (Cat.  
pertenecientes a tres diferentes variedades de trigo: No.98CH36227).  
Kama, Rosa y canadiense, 70 elementos cada uno, [5] A. Akhterov, O. Lezina and A. Shastina,  
seleccionados al azar para el experimento [11]. Los «DIAGNOSTICS  
OF  
DEVELOPMENT  
OF  
cuales ofrecen una importante información para llevar ORGANIZATIONAL  
AND MANAGERIAL  
la selección y clasificación de las variables.  
COMPETENCIES OF THE ENGINEERS USING  
Las redes SOM permiten visualizar de manera THE SELF-ORGANIZING KOHONEN MAPS»,  
intuitiva en un plano 2D la organización de los distintos Automation and Control in Technical Systems, no. 42,  
clústeres de los datos, los cuales pueden ser coloreados 2013.  
según la clase a la que pertenecen, haciendo más fácil [6] E. Atenogenes, «Laboratorio de Dinámica no  
la visualización de los vectores prototipo asociados a Lineal,» [En línea]. Available: www.dynamics.unam.  
cada clúster.  
edu. [Último acceso: 20 05 2017].  
La Red Neuronal SOM se utiliza para clasificar [7] I. Callejas, J. Pineros, J. Rocha, F. Hernández and  
patrones teniendo diferentes pesos aleatorios, consume F. Delgado, «Implementación de una red neuronal  
bastantes recursos cuando hay un número alto de artificial tipo SOM en una FPGA para la resolución  
neuronas, así como las iteraciones que realiza y el de trayectorias tipo laberinto», 2013 II International  
número de vecindad que posee. En la actualidad las Congress of Engineering Mechatronics and Automation  
redes neuronales SOMs se utiliza para clasificar y (CIIMA), 2013.  
determinar grupos en los cuales hay muchos patrones. [8] A. Gómez, «Redes neuronales artificiales: The Self-  
[1]  
Organizing Maps (SOM) para el reconocimiento de  
Finalmente, se concluye que fue posible caracterizar patrones.,» Institución Universitaria Los Libertadores ,  
los 7 clústeres asociados a los tipos de trigo, en cuanto vol. 1, nº 1, 17 diciembre 2013.  
se logró una clasificación utilizando el mapa SOM con [9] S. Gálvez, «SELF-ORGANIZING MAPS,»  
un alto porcentaje de datos clasificados correctamente. Universidad de Chile Facultad de Ciencias Físicas y  
Matemáticas Departamento de Ingeniería Eléctrica,  
Santiago, 2014.  
VIII.- REFERENCIAS  
[
[10] J. Vesanto, J. Himberg, E. Alhoniemi y  
1] T. York, A. Ukpong, S. Mylvaganam and Y. Ru, J. Parhankangas, «Laboratory of Computer  
«
Parameter estimation from tomographic data using and Information Science Adaptive Informatics  
self-organising maps», 2012 IEEE International Research  
32  
ISSN 2542-3401  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 22, Nº 86 Marzo 2018 (pp. 27-33)