Lobo etal .,I d e n ticac iónd eobje to sm úl tip l e ssolapad o s: Estad íst ic ades cr ip tiv a
IDENTIFICACIÓN DE OBJETOS  
MÚLTIPLEMENTE SOLAPADOS: ESTADÍSTICA DESCRIPTIVA  
Lobo, Eladio y Maldonado, Luciano.  
cruzchiquita123@gmail.com, maldonaj@ula.ve  
UNEXPO-Puerto Ordaz, Venezuela  
ORCID: 0000-0002-8763-5513  
Recibido (15/07/19), Aceptado (12/08/19)  
Resumen: El reconocimiento de objetos en una imagen instantánea es un área de investigación que ha  
sido explorada a lo largo de varias décadas, en la cual hay logros y avances extraordinarios. Sin embargo,  
persisten problemas que no han sido superados claramente por la comunidad científica mundial, como  
es la separación de objetos digitales solapados. En este artículo se describe, brevemente las medidas  
descriptivasdecentralizacióndedatosaplicadasenlaidentificacióndeobjetosdigitalesdeformairregular  
generados por objetos solapados; como un conocimiento previo para continuar futuras investigaciones  
Palabras Claves: Imagen solapada, separar objetos, estadística descriptiva.  
IDENTIFICATION OF MULTIPLE OVERLAPPING OBJECTS:  
DESCRIPTIVE STATISTICS  
Abstract: The recognition of objects in an instantaneous image is an area of research that has been  
explored over several decades, in which there are extraordinary achievements and advances. However,  
problems persist that have not been clearly overcome by the world scientific community, such as the  
separation of overlapping digital objects. This article briefly describes the descriptive measures of  
centralization of data applied in the identification of irregularly shaped digital objects generated by  
overlapping objects; as a prior knowledge to continue future investigations.  
Keywords: Overlapping image, separate objects, descriptive statistics.  
I.INTRODUCCIÓN  
En la figura 1 se muestra dos objetos digitales del  
Los objetos en general no tienen una forma predefi- mismo tipo y formas diferentes que deberán ser sepa-  
nida dificultando generalizar el procedimiento de iden- rados e identificados, en este caso de investigación nos  
tificación y clasificación de objetos digitales, en este interesa caracterizar los objetos para luego compararlos  
caso de estudio de identificación de objetos digitales so- con un patrón, utilizando las medidas descriptivas de  
lapados, se consiguieron objetos de forma irregular que centralización de datos.  
se generan por la intersección de objetos, estos últimos  
tendrán forma irregular que deberán ser identificados y  
descartados de la clasificación final.  
Se busca una técnica de identificación, clasificación  
de objetos digitales, que identifique el objeto en la po-  
sición que se encuentre, sin la necesidad de rotarlo o  
reubicarlo en un molde predefinido y sin intervención  
humana.  
El número de las características extraídas usualmen-  
te de objetos grandes o pequeños repetidos. Trae uno  
de los problemas más comunes en el reconocimiento  
de patrones, aumenta la complejidad computacional, en  
la organización donde se requeriría un clasificador ade- Figura 1: objetos del mismo tipo solapados.  
cuado para la identificación de objetos [5].  
29  
 I S SN 2542-3 401/ 1316-4821  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 23, Nº 94 Octubre 2019 (pp. 29-35)  
Lobo et al., Identificaci ón deob jetosmúltipl es so lap ados:Estadís ti c ad escr iptiv ae.  
En este proceso de investigación exploratorio se ge- Existen varias técnicas automáticas para resolver el pro-  
neran algunas preguntas como: ¿Será posible identifi- blema de la segmentación de objetos solapados. Pero  
car objetos digitales aplicando estadísticas descriptiva?, en la práctica, en el análisis de imágenes de citologías,  
¿
Qué diferencia hay entre los resultados pueden darse la segmentación de núcleos solapados suele realizarse  
aplicando estadística e inteligencia artificial?, ¿Cómo manualmente [3].  
aplicar estadísticas en la identificación de objetos de  
El análisis de pixeles en una imagen determina si  
forma irregular?, ¿A que características del objeto se un píxel es permanente o transitorio en cuanto a inten-  
le puede aplicar estadísticas?, ¿Cuáles serán los reque- sidad. El análisis de la detección regiones corresponde  
rimientos de máquina en la aplicación de estadística?, a los objetos fijos. Esas regiones son registradas como  
¿
En qué casos se puede aplicar estadística en la identifi- capas de imágenes de fondo permanente, en las cuales  
cación de objetos digitales?. puede detectarse el movimiento de los objetos que pa-  
Este artículo está estructurado en cuatro secciones; san a través de esas capas [6].  
la primera presenta algunas definiciones de medidas  
En la figura 1 se puede observar dos objetos solapa-  
descriptivas de centralización. Luego en la sección dos dos, para la visión humana estos objetos son de formas  
se aprecian fundamentaciones teóricas que sustentan y color equivalente, se puede apreciar el inicio y final  
este trabajo, que comprende los aspectos relevantes de del otro, no podemos concluir sobre la igualdad entre  
tratamiento de imágenes, así como los métodos posi- estos dos objetos. Si caracterizamos los objetos podre-  
bles para su identificación. En la sección tres se aprecia mos identificar y compáralos según los datos extraídos.  
la metodología para obtener los indicadores estadísti-  
Seguidamente se van a mostrar algunos conceptos  
cos de un objeto de forma regular. Los resultados se de estadística que van a ser aplicados en esta investi-  
encuentran en la sección cuatro, y en ella se exponen los gación:  
hallazgos referentes a la comparación estadística entre  
Medidas descriptivas de centralización: proporcio-  
dos objetos. Finalmente se presentan las conclusiones. nan un centro de la distribución de frecuencias. Es un  
valor que se puede tomar como representativo de todos  
II.DESARROLLO  
los datos [4]. Hay diferentes formar o técnicas para de-  
La segmentación es una de las tareas centrales en la finir el "centro" de las observaciones en un conjunto de  
compresión de la imagen. Una variante particularmen- datos. Las medidas de centralización son:  
te desafiante de esta tarea, la segmentación de objetos  
Media (µ: media aritmética o simplemente media):  
translúcidos superpuestos, a menudo ocurre en imá- es el promedio aritmético de las observaciones, es decir,  
genes biológicas, pero también se puede encontrar en el cociente entre la suma de todos los datos y el número  
otros dominios. Muchas aplicaciones prácticas requie- n de ellos.  
ren no solo la segmentación simple de la instancia, sino  
Mediana: es el valor que separa por la mitad las ob-  
también la identificación de sub-partes dentro de las servaciones ordenadas de menor a mayor, de tal forma  
instancias de objetos. Los métodos existentes no pue- que el 50% de éstas son menores que la mediana y el  
den resolver esta tarea para objetos superpuestos. En otro 50% son mayores. Si el número de datos es impar  
los últimos años, varias obras abordaron la segmenta- la mediana será el valor central y si la mediana es par es  
ción semántica de instancias tanto en imágenes natura- la media aritmética de los dos valores centrales.  
les como biológicas que muestra un rendimiento nota-  
Moda: es el valor de la variable que más veces se  
blemente fuerte en imágenes naturales, pero no puede repite. Pueden existir varias modas en una misma po-  
tratar con objetos superpuestos debido a la supresión blación de datos.  
local no máxima. Además, los requisitos de memoria  
son muy altos cuando se trabaja con imágenes que con- de tendencia central tienen como objetivo el sintetizar  
tienen muchas instancias de objetos [1]. los datos en un valor representativo, las medidas de dis-  
Medidas descriptivas de dispersión: las medidas  
Una segmentación precisa es fundamental para los persión expresan hasta qué punto estas medidas de ten-  
métodos de detección automatizados. Sin embargo, la dencia central son representativas como síntesis de la  
segmentación se complica por el hecho de que a menu- información. Las medidas de dispersión cuantifican la  
do forman grupos superpuestos [2].  
separación, la variabilidad de los valores de la distribu-  
Las técnicas clásicas de segmentación funcionan ción respecto al valor central. Se distinguen entre me-  
bien cuando la imagen a segmentar contiene estructu- didas de dispersión absolutas, que no son comparables  
ras bien definidas, con bordes bien resaltados y formas entre diferentes muestras y las relativas que permiten  
regulares. Pero no son tan eficientes con imágenes que comparar varias muestras. Las medidas descriptivas de  
presentan objetos irregulares, incompletos y solapados. dispersión son la varianza, la desviación estándar ( ) y  
30  
ISSN 2542-3401/ 1316-4821  
UN IVE R S IDA D ,CI E NC I A y T EC N O L O G ÍAVo l.2 3 , Nº9 4Oc t ub r e2 0 1 9(pp .2 9 - 3 5)  
Lobo et al., Identifica c i ónd e o b j e t o smú lt ip l e s s o lapado s:Es tadís t ic ades c ri ptiva  
el rango.  
Min.: valor mínimo de la muestra  
Variabilidad: las medidas de tendencia central o W: es el ancho de una barra en un histograma, W =  
posición nos indican donde se sitúa un dato dentro de (Max.-Min.)/Nro. Barras.  
una distribución de datos. Las medidas de dispersión, N: el número de muestras.  
variabilidad o variación nos indica si esos datos están σ: es la desviación estándar.  
próximos entre sí o sí están dispersos.  
µ: es la media.  
x: un valor dentro de la población.  
III.METODOLOGÍA  
Este estudio comprende el tratamiento de imágenes,  
como paso previo a la identificación de los objetos, es-  
Medidas descriptivas de forma: comparan la for- tando almacenados en una matriz los datos de posición  
ma que tiene la representación gráfica, bien sea el his- (filas, columnas) de los pixeles del objeto para luego  
tograma o el diagrama de barras de la distribución, con ser usados en su caracterización.  
la distribución normal. A continuación se describen las  
medidas descriptivas de forma:  
La identificación de objetos semejantes dentro de  
una imagen es aplicable en diversas áreas como la me-  
Asimetría: una distribución es asimétrica a la dere- dicina, la biología, la criminología, la metalurgia y la  
cha si las frecuencias (absolutas o relativas) descienden industria en general, entre otros.  
más lentamente por la derecha, que por la izquierda. Si  
En la figura 4 se muestra la representación en el pla-  
las frecuencias descienden más lentamente por la iz- no XY un círculo perfecto, se busca visualizar el com-  
quierda que por la derecha la distribución es asimétrica portamiento de los datos del cálculo de distancia del  
a la izquierda.  
centro al borde del objeto, en una curva normal, para  
Curtosis: es el grado de concentración que presen- el cálculo de la distancia se usa la métrica Euclidiana,  
tan los valores alrededor de la zona central de la distri- es decir la distancia desde el pixel (x,y) al pixel central  
bución. Se definen 3 tipos de distribuciones según su (xc,yc):  
grado de curtosis: mesocúrtica, leptocúrtica y platicúr-  
tica. En cuanto a los coeficientes de curtosis, se tiene  
que, un coeficiente igual a cero, indica una distribución  
mesocúrtica, un coeficiente mayor a cero, es caracterís-  
tico de una distribución leptocúrtica, mientras que valo-  
(3)  
En la figura 2 se muestra un ejemplo de vecindad,  
res de este coeficiente inferiores a cero corresponden a desde el pixel central (fila=11, columna=247), aplican-  
una distribución platicúrtica.  
do la ecuación 3 se calcula la distancia.  
Normalidad: la prueba más simple para evaluar la  
normalidad es a través de los histogramas que comparen  
los valores de los datos observados con una distribución  
aproximadamente normal. Para evaluar este supuesto,  
también, se pueden examinar coeficientes de asimetría  
y curtosis. Adicionalmente, existen las pruebas estadís-  
ticas de Shapiro Wills y Kolmogorov-Smirnov, que im-  
plementan muchos programas computacionales.  
La función de densidad (2) del modelo normal tiene  
forma de campana, la que habitualmente se denomina  
campana de Gauss. De hecho, a este modelo, también  
se le conoce con el nombre de distribución gaussiana.  
9
245 9 246 9 247 9 248 9 249  
0 245 10 246 10 247 10 248 10 249  
11 245 11 246 11 247 11 248 11 249  
1
1
1
2 245 12 246 12 247 12 248 12 249  
3 245 13 246 13 247 13 248 13 249  
ra 2: filas y columnas de posición de ejemplo ve-  
cino centra.  
Dónde:  
Max.: valor máximo de la muestra  
En la figura 3 se muestra el resultado del cálculo de  
31  
ISS NI S 2S 5N 4 22 -5 34 42 0- 13 401/ 1316-4821  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 23, Nº 94 Octubre 2019 (pp. 29-35)  
Lobo et al., Identifica cC i rnvadj ea loebt aj el .t , oL asmticú elt nipl lae es ds ou lc aa p caiódnosu : nEisvt eards íist ati rcia d escrip t iv a
la distancia del vecindario al pixel central (fila=11, co-  
lumna=247) de la figura 2.  
2
2
,8284 2,2361  
,2361 1,4142  
2
1
0
1
2
2,2361 2,8284  
1,4142 2,2361  
2
1
1
2
2
2
,2361 1,4142  
,8284 2,2361  
1,4142 2,2361  
2,2361 2,8284  
Figura 4: círculo perfecto en el plano XY.  
Seguidamente se tiene las tablas desde I.a y 1.b,  
muestra los indicadores de posición del objeto círculo  
perfecto de la figura 4.  
Figura 3: resultados del cálculo de distancia.  
Tabla I.a: posición de los pixeles del círculo  
Promedio Centro) Min. Max.  
Min.  
Max. Perímetro Vértices Cuadro  
Fila  
9,04  
Columna Fila Fila  
52,97 89  
Columna Columna Pixeles  
89 232  
Pixeles  
6400  
4
9
9
95  
El cuadro ocupado por el objeto se calcula conside- el diseñador), en el caso del círculo la figura 4 se conta-  
rando la máxima, mínima fila y columna. bilizaron 95 posibles vértices.  
(4)  
(5)  
Los vértices se cuentan al considerar el cambio de  
ángulo de cinco datos consecutivos (valor asumido por  
Tabla I.b: distancia del centro al borde  
Media Moda Mediana DesvEst %Var Asimetría Curtosis  
0,16 40,14 40,17 0,44 1,10 -0,01 0,65  
4
En la tabla I.b se observa la igualdad que hay en- del objeto círculo, esta función es representada usando  
tre la media, moda y mediana por repetirse la distancia la ecuación 2.  
desde el centro hasta el borde del objeto (en este caso es  
el radio del circulo), este comportamiento de los datos  
(distancia) es estadísticamente normal.  
En la figura 5 se muestra la función de distribución  
de los datos de la distancia desde el centro al perímetro  
32  
ISSN 2542-3401/ 1316-4821  
ISSN 2542-3401  
U NI V E RS IDAD, CI ENCI Ay T E CNOL OGÍ AV o l. 23 ,Nº 9 4O ct u bre2019(pp.29-35 )  
Lobo et al., Identific aC ca i  vna jda el e ot ba jl e. , Lt oa st imcúe lnt i lpa l e sd su oc laa cp i óadnou sn:iEvs e t ra sdi as tr i ca ades c ri ptiva  
Fi
En la figura 7 se muestra la representación en el pla-  
Figura 5: función de densidad de la distancia.  
no XY de las coordenadas de los pixeles de posición  
(fila, columna) del perímetro de las briquetas de hierro  
Se aprecia en la figura 5 y en la tabla I.b una asime- después de haber sido separadas, considerando el pa-  
tría que tiende a cero, existe aproximadamente la mis- trón el objeto ubicado a la derecha (2) y el evaluado el  
ma cantidad de datos a los dos lados de la media (por ser objeto ubicado a la izquierda (1).  
el radio de un circulo) y se aprecia curtosis positiva es  
Leptocúrtica, la curva normal forma un pico alrededor  
de la media, esto significa que el objeto tiende a repetir  
la distancia desde el centro al borde. La variabilidad de  
la distancia es de 1,10% muy bajo porcentaje por ser un  
círculo.  
IV.RESULTADOS  
Seguidamente se muestra un ensayo de un objeto  
real (briqueta de hierro) para validar la estrategia de  
identificar objetos dentro de una imagen de 520x640  
pixeles ver la figura 6.  
Figura 7: posición en el plano XY.  
Seguidamente se va mostrar las tablas desde II.a  
hasta II.c, se muestra los indicadores de posición de  
los objetos que cierran el perímetro en la figura 6.  
Tabla II.a: estadísticas objetos de la figura 6  
Promedio(centr  
o)  
Min.  
Perím  
etro  
Vértic Cuadro  
es  
Max.  
Min.  
Max.  
Colum  
na  
239,34 138,07  
240,89 303,83  
Colum Colum Pixeles  
na na  
49 224  
221 387  
Pixeles  
N
Fila  
Fila  
180  
186  
Fila  
297  
296  
1
2
536  
524  
128  
77  
20475  
18260  
33  
 I S SN 2542-3 401/ 1316-4821  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. Vol. 23, Nº 94 Octubre 2019 (pp. 29-35)  
Lobo et al., Identifica c iónde obj e t osmú lt iples s olapado s:Estadís t icadescrip t i v a
En la tabla II.a, se mostró el promedio de filas y co- estadísticos medidas descriptivas de centralización, dis-  
lumnas, máximo y mínimos de cada objeto de períme- persión y forma.  
tro cerrado, en la tabla II.b se va mostrar los resultados  
Tabla II.b: estadísticas de la distancia del centro al borde (pixeles)  
N
1
2
Media  
79,77  
76,10  
Moda Mediana DesvEst %Var Asimetría Curtosis  
83,95  
82,27  
13,62 17,08  
13,37 17,57  
-0,44  
-0,44  
-1,26  
-1,26  
Nota: no hay moda en la mayoría de los datos de este  
caso en estudio.  
Se aprecia una asimetría negativa en ambos casos  
por lo que los valores se tienden a reunir más en la parte  
derecha de la media y se aprecia curtosis negativa es  
En la figura 8 se muestra la función de distribución platicúrtica, las curvas están achatadas, esto significa  
de los datos de la distancia desde el centro al borde del que el objeto patrón y el evaluado repiten con baja fre-  
objeto patrón (2) y evaluado (1), esta función se es re- cuencia los datos, existen igualdad indicadores asime-  
presentada usando la ecuación 2.  
tría y curtosis.  
En la tabla II.a se mostró los resultados obtenidos se-  
gún filas y columnas de cada objeto de perímetro cerra-  
do y en la tabla II.b se mostró los resultados estadísticos  
de la distancia desde el centro del objeto al borde, en  
la tabla II.c se va mostrar la relación del objeto patrón  
identificado como el número 2, con respecto al objeto  
número 1, en comparación a la distancia del borde al  
centro aplicando la ecuación 3.  
Figura 8: función de densidad de la distancia del punto  
central del objeto patrón (2) y el objeto evaluado (1).  
Tabla II.c: clasificación de los objetos  
Posición  
Prome  
dio  
Distanciadel centro al borde (pixeles)  
N Media Mediana DesvEst %Var Asimetría Curtosis Perímetro Cuadro Área  
%
1
2
95,18  
97,95  
98,14  
97,18  
97,71  
99,76  
97,71  
87,87 92,86 96,04  
100,0 100,0  
100,00 100,00 100,00 100,00 100,00 100,00  
100,00 100,00  
0
0
El objeto número 2 es el patrón, el objeto número V.CONCLUSIONES  
se aproxima al objeto 2 en la comparación se obtie- La estrategia de aplicar de estadística para identifi-  
ne una clasificación general predefinida de Muy Bueno car un objeto utilizando como datos la distancia desde  
MB) con 96,04% y con un promedio por comparación del centro al borde del objeto cumple con el objetivo  
de la distancia de 97,65% y 92,81% por comparación planteado.  
del perímetro, cuadro y área Extraer datos de un objeto, en este caso de estudio se  
1
(
utilizó como datos la distancia del centro al perímetro, a  
estos se les puede hacer análisis estadístico y comparar  
34  
ISS NI S S2 N5 4 22 5- 43 24 -0 31 401/ 1316-4821  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 23, Nº 94 Octubre 2019 (pp. 29-35)  
Lobo et al., Identificación deo b je t o s mú lt i p l e ss o l apados : Est adí s ti c ades c ri ptiva  
con un objeto patrón.  
cal cells”. Department of Computer Science, City Uni-  
Los objetos de forma irregular y en posición aleato- versity of Hong Kong, China. 2013  
ria generan variabilidad de datos que deben ser acon- [3]S. Alayón, S. Sánchez y J. Méndez. “Segmentación  
dicionados para realizar finalmente una la clasificación automática de núcleos solapados en imágenes de citolo-  
de objetos, es para la clasificación del objeto en que se gías”. Universidad de La Laguna, España. 2013  
debe decidir aplicar estadística o inteligencia artificial, [4]A. Borrero, J. Maldonado y E. Lobo. “Selección de  
la inteligencia artificial requería de implementar estruc- una técnica robusta de extracción de características para  
turas de decisión complejas aplicadas a casos particula- identificar condiciones físicas de las briquetas de hierro  
res mientras la estadística se pude aplicar a casos gene- producidas en la empresa Orinoco Iron, S.C.S”, Uni-  
rales con estructuras de decisión más simples.  
versidad de los Andes, Facultad de Ingeniería, Mérida,  
Las características de los objetos a los que nos es Venezuela. 2012  
posible a aplicar análisis estadístico son el perímetro, [5]S. Zulma. “Caracterización y clasificación de café  
número de vértices, cuadro que ocupa el objeto, el área cereza usando visión artificial” Magister en Automati-  
por ser un único dato del objeto, caso contrario de la zación Industrial, Universidad Nacional de Colombia,  
distancia del centro al perímetro que genera datos de los Sede Manizales. 2005  
cuales se puede extraer información.  
[6]H. Fujiyoshi y T. Kanade. Layered detection for  
Una vez que se tienen los datos de la distancia desde multiple overlapping objects. IEICE TRANS. INF. &  
el centro al perímetro el requerimiento de máquina para SYST., VOL. E87-D, NO.12 December. 2004  
aplicar estadística, es bajo.  
[7]T. Xie, N. Tillmann and P. Lakshman, “Advances  
in Unit Testing: Theory and Practice,” in IEEE/ACM  
38th International Conference on Software Engineering  
V.IREFERENCIAS  
[1]A. Bohm. M. Tatarchenko y T. Falk, T. “Semantic Companion (ICSE-C), Austin, TX, pp. 904-905, 2016.  
instance segmentation of touching and overlapping ob- [8]A. Subramanian, "Integration of Natural User In-  
jects”. Department of Computer Science, BIOSS Cen- terface in a Real-World Environment," in 2015 IEEE  
tre for Biological Signalling Studies, University of Frei- International Conference on Computational Intelligen-  
burg, Germany. 2018  
2]Z. Luz, G. Carneiro y A. Bradley. “Automated nu- 718, 2015.  
cleus and cytoplasm segmentation of overlapping cervi-  
ce & Communication Technology, Ghaziabad, pp. 714-  
[
35  
ISS NI S 2S 5N 4 22 -5 34 42 0- 13 401/ 1316-4821  
UNIVERSIDAD, CIENCIA y TECNOLOGÍA Vol. 23, Nº 94 Octubre 2019 (pp. 29-35)