Acelerando la Comparaci on de Huellas Dactilares basadas

Acelerando la Comparacion de HuellasDactilares basadas en Agrupaciones

Deformables de MinuciasAndres Jesus Sanchez1, Luis Felipe Romero2 y Siham Tabik3

Resumen— El reconocimiento de huellas dactilareses considerado como uno de los metodos de acred-itacion biometrica mas utilizado en la actualidad. Laidentificacion de una huella requiere realizar la com-paracion de sus minucias con todas las minucias queconforman cada huella perteneciente a una base dedatos. Los algoritmos de comparacion de huellas masavanzados son muy costosos desde el punto de vistacomputacional, e ineficientes cuando trabajan sobrebases de datos de grandes dimensiones. En este tra-bajo, se han incluido diversos metodos para acelerar elalgoritmo DMC (el metodo de comparacion de huel-las dactilares mas preciso basado unicamente en min-ucias). En particular, se han reescrito en C++ las fun-ciones del algoritmo con mayor carga computacional;se ha creado una librerıa estatica en C++ donde se eje-cuta el algoritmo de comparacion DMC modificado yque se conecta con el codigo original en C# utilizandopara ello un proyecto de librerıa de clases de CLR. Lasolucion reimplementa funciones crıticas tales como lacuenta del numero de bits con valor uno mediante lainclusion de una librerıa de PopCount en C++ y el usodel cuadrado de la distancia Euclıdea para el calculode la vecindad de las minucias. Los resultados ex-perimentales muestran una reduccion significativa deltiempo de ejecucion de las funciones optimizadas den-tro del algoritmo DMC. Por ultimo, se presenta comotrabajo futuro una nueva estrategia de procesamientoparalelo de los datos de las huellas, en la que se tieneen cuenta la jerarquıa de memoria.

Palabras clave— Procesamiento de Huellas Dacti-lares, Optimizacion de Cache, Interoperatividad delos Lenguajes de Programacion.

I. Introduccion

LA tarea del reconocimiento de huellas dactilaresha sido ampliamente estudiada en estos ultimos

anos. La razon principal por la que se utilizaesta parte del cuerpo humano para identificar alas personas, reside en el hecho de que las huellasdactilares son unicas y no cambian con el paso deltiempo. Por consiguiente, no existen dos personascon las mismas huellas, convirtiendolas en rasgosperfectos de identificacion. Los elementos princi-pales que definen a las huellas dactilares, basados enlos surcos y crestas que las forman, son conocidoscomo minucias. Estas minucias se encuentran nor-malmente localizadas en los finales o bifurcacionesde las crestas. Por todo ello, en la mayorıa delos algoritmos de procesamiento de huellas dacti-lares, la comparacion entre las mismas se realizaobteniendo la similaridad existente entre la total-

1Dpto. de Arquitectura de Computadores, Univ. Malaga,e-mail: [email protected].

2Dpto. de Arquitectura de Computadores, Univ. Malaga,e-mail: [email protected].

3Dpto. de Ciencias de la Computacion e Inteligencia Artifi-cial, Univ. Granada, e-mail: [email protected].

idad de minucias que forman las huellas a contrastar.

La implementacion de los algoritmos de com-paracion de huellas dactilares se suele realizarutilizando para ello lenguajes de programacion dealto nivel como pueden ser C#, Java o Python [1].Esta eleccion se realiza en base a la gran cantidadde herramientas de programacion disponibles enestos lenguajes y sus entornos de trabajo, quefacilitan la implementacion de los algoritmos a losinvestigadores. Sin embargo, la mayor desventajade estos lenguajes y otros similares reside en la bajavelocidad de ejecucion de los codigos, en contrastecon los lenguajes de programacion de bajo nivel.Por ejemplo, en C#, cuando un codigo escrito coneste lenguaje es compilado, las lıneas de codigo soninicialmente traducidas a un lenguaje intermediodenominado Common Intermediate Language (CIL)y despues a codigo maquina, en tiempo de ejecucion,gracias a la herramienta del entorno de trabajo de.NET Common Language Runtime (CLR). Esta esla razon principal por la que este tipo de lenguajees tambien conocido como lenguaje manejado,provocando mayor carga de trabajo durante laejecucion.

Este artıculo se centra en el estudio de uno de losalgoritmos mas precisos de comparacion de huellasdigitales basado en el procesamiento de las minucias,propuesto por Medina-Perez et al. [2] y que seradenotado como “DMC” a lo largo de este trabajo.Este metodo fue inicialmente implementado en C# yemplea los siguientes tres algoritmos:

1. El metodo Minutia Cylinder-Code [3] basado enestructuras tridimensionales de datos, denomi-nadas Binary Cylinder Codes, formados a par-tir de las posiciones y angulos que caracterizana las minucias utilizando estructuras locales [4].DMC emplea esta representacion de las minu-cias en el algoritmo de comparacion de huellas.

2. El metodo Minutiae Discrimination [5] calculaun valor de calidad para cada minucia basado enla consistencia en las direcciones de las minuciasvecinas a cada una de ellas.

3. El metodo Deformable Minutiae Clustering [2],[6] empleado para evitar la perdida de datosprovocada por la deformacion de la huella du-rante su captura. Los resultados de similaridadson obtenidos sumando los pesos de cada par deminucias coincidentes encontrados al mezclar las

agrupaciones de minucias similares. A su vez,el peso de cada par de minucias (q, p) se cal-cula evaluando las minucias incluidas en la agru-pacion coincidente en la que (q, p) esta local-izada en el centro. Los resultados estadısticos dela comparacion de las huellas dactilares siguenlas doctrinas de evaluacion propuestas por Cap-pelli et al. [7].

Nosotros proponemos distintas tecnicas de acel-eracion para el algoritmo de comparacion de huellasdactilares DMC. En primer lugar, se presenta elanalisis de rendimiento del algoritmo de comparacionpara determinar las funciones con el mayor costecomputacional. Posteriormente, el algoritmo decomparacion DMC se traduce a codigo no manejadoimplementando una serie de optimizaciones dentrode una librerıa de C++, que es conectada con elcodigo C# mediante un proyecto de librerıa de clasesdel CLR. Con respecto a dichas mejoras, se haoptimizado la operacion de cuenta de bits con valoruno que era realizada dentro del algoritmo MinutiaCylinder-Code gracias a la inclusion de una librerıade C++. Por otro lado, el calculo de la consistenciade la direccion de las minucias dentro del metodoMinutiae Discrimination se ha mejorado realizandomodificaciones sobre las operaciones con el mayorcoste computacional.

Este artıculo esta organizado de la siguiente forma.La seccion II introduce la estructura del algo-ritmo de comparacion DMC junto con los resulta-dos obtenidos al realizar el analisis de rendimiento.La seccion III describe las tecnicas de optimizacionimplementadas sobre el algoritmo de comparacionDMC. La seccion IV presenta los resultados ex-perimentales. La seccion V propone un nuevoplanteamiento para mejorar el rendimiento de lamemoria cache, junto con el procesamiento en par-alelo del algoritmo de comparacion. Finalmente, enla seccion VI se analizan los resultados obtenidos yel enfoque de trabajo futuro.

II. Estructura y perfil de rendimiento delalgoritmo DMC

El algoritmo de comparacion de huellas dactilaresconocido como DMC fue disenado a partir de la im-plementacion de tres metodos de comparacion inde-pendientes cuyos procedimientos pueden ser resumi-dos en los siguientes apartados:

1. Se definen Q y T como las listas de minuciaspertenecientes a las huellas dactilares consulta yplantilla, respectivamente, de una determinadabase de datos. Cada minucia q ∈ Q es con-trastada con todas las minucias t ∈ T en basea la similaridad existente entre sus respectivosdescriptores. En nuestro caso de analisis, el de-scriptor utilizado para las minucias es un vectorde 1280 bits que almacena la informacion refe-rente a las posiciones y angulos de todas las min-ucias vecinas que se encuentren dentro de una

000011100…. 1280 bit ….000101101

011010111…. ….000110001

Minucia t en huelladactilar plantilla T

Minucia q en huelladactilar a consultar Q Representación binaria de

cada minucia y sus vecinas

100010100…. .…111100011

XNOR

Cuenta de bits a uno (utilizada para obtener valor de similaridad)

base de datos∈( Q,T )

Fig. 1. Ejemplo de la operacion de cuenta de bits con valor 1empleada en el primer paso del algoritmo de comparacion.Los bits a 1 resultantes de la aplicacion de la operacionXNOR sobre dos descriptores de minucias, son contados yutilizados para calcular el valor de similaridad entre min-ucias.

circunferencia de radio r, centrada en la minuciade estudio. Por consiguiente, dos minucias simi-lares deben tener una gran cantidad de bits conla misma posicion y valor dentro de sus respec-tivos vectores, de la forma que, si se realiza laoperacion XNOR entre estos descriptores comose muestra en la figura 3, el resultado obtenidosera un nuevo vector con unos en las posicionescoincidentes. Por ello, la funcion denominadacomo PopCount es necesaria para realizar estaoperacion de cuenta de bits con valor uno, re-sultado que es utilizado para obtener el valor desimilaridad entre minucias. Cada par de minu-cias coincidentes (q, t) es posteriormente inclu-ido dentro de un nuevo vector de pares de min-ucias similares (A), y ordenado en orden decre-ciente en funcion del valor de similitud obtenido.

2. Para cada minucia q ∈ Q se calcula un valorde calidad en funcion de la consistencia exis-tente entre las direcciones de las minucias quese encuentran dentro de su vecindario, y paraalcanzar este objetivo, es necesario previamenterealizar el calculo de las tres minucias mas cer-canas a la minucia de estudio, procedimiento eje-cutado por la funcion UpdateNearest dentro delalgoritmo DMC. Asimismo, la misma operacionse realiza para cada minucia t ∈ T . Por ultimo,se forman dos nuevos vectores que contienen to-das las minucias de cada huella junto con suscorrespondientes valores de calidad.

3. A partir de la lista ordenada A, se determi-nan agrupaciones de pares de minucias similarespara cada par de minucias (q, t), junto con unvalor de peso obtenido teniendo en cuenta lospares de minucias similares dentro de la agru-pacion similar en la que (q, t) esta situada en elcentro. Despues, todas las agrupaciones dentrode ambas huellas son comparadas para encon-trar pares de minucias globales. Posteriormente,se realiza una nueva busqueda centrada en cadaminucia q ∈ Q y t ∈ T , utilizando el metodoThin Plate Spline para encontrar nuevos pares

de minucias similares [8], que habrıan podido serdescartados de los anteriores procesamientos de-bido a posibles deformaciones en la captura delas huellas.

4. El valor total de similaridad se obtiene comoresultado de sumar los pesos de todos los paresde minucias coincidentes.

TABLA I

Analisis de rendimiento con estructura de arbol de

llamadas del algoritmo DMC de comparacion de

huellas dactilares. Las funciones se encuentran

listadas en orden descendente en base al numero de

muestras exclusivas de CPU obtenidas. BCC define a

Binary Cylinder-Code y DMC-BCC.Match a la funcion

principal donde se ejecuta el algoritmo de

comparacion.

Funcion Inclusivas Exclusivas

clr.dll 2096 2094

mscorlib.ni.dll 1685 1187

Map 1242 358

UpdateNearest 315 231

DMC-BCC.Match 6193 209

Compare 381 205

BCC.Match 309 189

MatchMinutiae 281 107

BCC.PopCount 95 95

Una vez que el algoritmo de comparacion ha sidoanalizado, el siguiente objetivo se basa en determi-nar las funciones de mayor coste computacional den-tro de los metodos mencionados. Por consiguiente,se ha llevado a cabo un analisis de rendimiento so-bre el algoritmo DMC y para ello se ha empleado laherramienta Performance Profiler de Visual Studio2017 que ofrece dos tipos de resultados: muestras in-clusivas y exclusivas de CPU. Para nuestro estudio,se han tenido en cuenta unicamente las muestras ex-clusivas para identificar las funciones con la mayorcarga computacional y el menor numero de lineasde codigo. Esto es posible ya que este tipo de mues-tras se determinan teniendo en cuenta unicamente lasobtenidas dentro de la funcion de estudio, sin con-tar las funciones que son llamadas desde esta, por loson usadas para determinar los cuellos de botella enlos algoritmo de estudio. La tabla I recoge las fun-ciones con el mayor coste computacional ordenadasen orden decreciente en base a las muestras exclusi-vas de CPU obtenidas para cada una. Las funcionesresaltadas son aquellas que se encuentran implemen-tadas dentro del algoritmo de comparacion, mientrasque el resto son herramientas utilizadas por el en-torno de trabajo .NET. A partir de estos resultados,el estudio se centra en las funciones UpdateNearesty PopCount, debido a la gran cantidad de mues-tras exclusivas obtenidas en contraste con el pequenonumero de lıneas de codigo que contienen. En laseccion siguiente, se presentaran las optimizacionesrealizadas sobre las dos funciones mencionadas.

III. Nuevas optimizaciones

El algoritmo de comparacion DMC fue implemen-tado utilizando C# junto al entorno de trabajo de.NET y por lo tanto, el primer paso para la op-timizacion reside en su traduccion, incluyendo alas funciones previamente determinadas a partir delanalisis de rendimiento, a un lenguaje de progra-macion no manejado y de bajo nivel pero preser-vando la estructura original de la solucion. Porello, se selecciono C++ para reemplazar a C# comoel lenguaje de programacion empleado, debido a sumejor rendimiento y al hecho de que es tambien unlenguaje de programacion orientado a objetos (OOP,por sus siglas en ingles) lo que resulta en menosproblemas de compatibilidad durante la traduccion.Mas tarde, se tenıa que lograr la conexion entre elproyecto original en C# y una nueva librerıa imple-mentada en C++, para poder compartir los datos yresultados entre ellos y para lograrlo, dos herramien-tas del entorno de trabajo de .NET fueron estudi-adas: Platform Invoke utilizando metodos externosen “C” [9] y C++/CLI Wrapper [10]. Ambas estrate-gias aceleran las zonas de codigo que son traducidasa C++, sin embargo, el segundo metodo permite lacreacion de objetos, la utilizacion de name-spaces yel paso de valores, y ademas habilita el ensambladode este tipo de proyectos no manejados junto conotros de tipo manejado.

(1) DoComparisons() (3) FingerprintGetLocalMatchingMtiae() (5) ComputeMtiaQuality()

(2) Matcher.Match() (4) return reducedMatchingPairs (6) UNC.ComputeMtiaQualityC()

.NET Framework Class Library

.NET Framework Class Library

Proyecto DMC C#Proyecto DMC C#

CLR Class Library

CLR Class Library

C++/CLI WrapperC++/CLI Wrapper

C++ LibraryC++ Library

C++ no manejadoC++ no manejado

(1)(2)

(3)

(4)

(5)

(6)(7)

Fig. 2. Estructura del algoritmo de comparacion de huellasdactilares DMC modificado que incluye una librerıa declases de CLR junto a otra librerıa no manejada de C++donde se ejecuta el algoritmo original.

La figura 2 muestra el algoritmo de comparacionDMC modificado tras utilizar la estrategia C++/CLIWrapper, donde han sido incluidos dos nuevosproyectos: una librerıa de clases de CLR y unalibrerıa no manejada de C++. La primera esta es-crita utilizando codigo C++/CLI que ofrece muchasherramientas del entorno de trabajo de .NET paratrabajar con memoria manejada y no manejadadentro del mismo archivo. Gracias a ello, todoslos datos pertenecientes a las huellas dactilarescargados dentro del proyecto de C# pueden sertransferidos y almacenados dentro de la librerıa de

clases de CLR con pequenas transformaciones (1).Mas tarde, estos datos pueden ser exportados deuna forma sencilla a la librerıa de C++ llamando alas funciones definidas en este ultimo archivo (2).Posteriormente, la librerıa de C++ se encarga deejecutar el algoritmo de comparacion DMC con lasnuevas optimizaciones, que incluye los siguientesmetodos: Minutia Cylinder-Code Creation (3),Minutia Quality Computation (4) y ClusteringComputation and Merging (5). Por ultimo, todoslos resultados obtenidos son devueltos a la librerıade clases de CLR (6) y despues, al proyecto de C#para realizar la evaluacion de los mismos (7).

Dentro del primer paso del algoritmo de com-paracion, se tiene que emplear la operacion de contarbits a uno para obtener el valor de similaridad entreminucias de las huellas dactilares. Esta operacioncalcula el numero de unos contenidos dentro deun determinado valor y se encuentra implemen-tada dentro de la funcion denominada PopCount,utilizando el metodo SWAR. Esta tecnica realizala cuenta de 2 valores dentro de la palabra, paradespues agregar la cuenta de duos a un cuartetode estos y mas tarde, bytes dentro de un registrode 64 bits para finalmente sumar todos los bytesjuntos. A pesar de que este metodo logra un buenrendimiento, se buscaba implementar la mejorestrategia existente para la cuenta de unos, enfuncion de las caracterısticas del ordenador sobre elque se esta ejecutando el algoritmo de comparacionDMC. Por ello, se ha implementado la librerıa deC++ desarrollada por Wojciech Mula et al. [11]que escoge, en funcion de las caracterısticas delprocesador y del tamano del vector de estudio, elalgoritmo optimo para calcular el numero de bits auno que contiene.

Por otro lado, centrando el estudio en el segundopaso del algoritmo de comparacion, es necesario cal-cular las minucias vecinas para cada una de las min-ucias del total que forman la huella dactilar, uti-lizando para ello el valor de la distancia Euclıdea.Los resultados de la raız cuadrada realizada en estaoperacion pueden ser obtenidos de dos formas: me-diante el acceso a una tabla preestablecida de valoresque contiene los resultados de la raız cuadrada paralos primeros 1024 numeros naturales o, si el valor nose encuentra en dicha tabla, mediante la realizacionde la operacion raız cuadrada gracias a la librerıa declases matematicas de C#. Con la finalidad de re-ducir el tiempo de ejecucion necesario para ambosmetodos, se ha empleado en cambio el cuadrado dela distancia Euclıdea para el calculo de la vecindadde cada minucia.

IV. Resultados experimentales

Los experimentos fueron ejecutados empleando elprocesador Intel i5-8600K con una frecuencia de eje-cucion de 3,60 GHz. Dicho procesador posee seismemorias cache L1 y L2 de 32 y 256 kB, respectiva-

mente, junto a una unica unidad de memoria cacheL3 de 9 MB. Ademas, se emplea una memoria RAMde 8GB (DDR4 con doble canal). Los resultados detiempo han sido obtenidos empleando la clase Stop-watch del entorno de trabajo .NET en C# y la librerıaC++11 Chrono en la librerıa de C++.

1

204,8

0,0

50,0

100,0

150,0

200,0

250,0

C# C++

Aceleración

Fig. 3. Resultados de tiempo y aceleracion por iteracion dela operacion de cuenta de bits a uno dentro de la funcionPopCount, donde se comparan los desempenos de los al-goritmos de SWAR en C# y la librerıa rapida de C++.

Con respecto a la optimizacion llevada a cabosobre la operacion de cuenta de bits a uno, se haempleado una librerıa rapida de C++ dentro dela funcion PopCount en detrimento del algoritmoSWAR original de C#. Los resultados obtenidostras la ejecucion de ambos metodos se muestran enla figura 3. El tiempo de ejecucion del metodo decomparacion DMC por iteracion de la operacionde cuenta de bits a uno, fue reducido de 90,176microsegundos en C# hasta 0,440 microsegundos enC++ sobre un vector cuyo tamano aproximado es de160 bytes (20 valores de 8 bytes). Por lo tanto, lostiempos de ejecucion de la funcion se han llegado amejorar hasta en 204,8 veces tomando como baseel tiempo obtenido en C#. Por otro lado, debidoa que el tamano del vector es menor de 512 bytes,la nueva librerıa emplea un algoritmo denominadocomo unrolled pop count para realizar la operacionde cuenta de bits. Si el tamano del vector fuerasuperior a 512 bytes se emplearıa un algoritmobasado en instrucciones AVX2, no obstante, estasituacion no se cumple en este caso, siendo estudiadacomo trabajo futuro con la finalidad de mejorar eldesempeno del algoritmo sin incrementar el tiempode ejecucion del mismo..

En relacion con la funcion UpdateNearest, se hareemplazado el uso de la distancia Euclıdea por elcuadrado de la misma (SED, por sus siglas en ingles),eliminando con ello la necesidad de realizar la op-eracion raız cuadrada y mejorando los resultados detiempo, que son mostrados en la figura 4. Se halogrado una aceleracion para esta funcion de hasta2,83 al emplear el cuadrado de la distancia Euclıdea,en contraste con la aceleracion de 2,33 conseguidautilizando la distancia Euclıdea estandar, todo ellotomando como referencia el tiempo de ejecucion pre-viamente calculado en C#.

1

2,33

2,83

1,00

1,50

2,00

2,50

3,00

3,50

C# C++ C++ (SED)

Ace

lera

ción

Fig. 4. Resultados de tiempo y aceleracion por iteracion dela funcion UpdateNearest para tres situaciones diferentes:el metodo original en C#, el metodo original traducidoa C++ donde se emplea la distancia Euclıdea estandar yel metodo optimizado que implementa el cuadrado de ladistancia Euclıdea (SED) en C++.

V. Analisis de rendimiento y propuestas demejora

Los algoritmos de reconocimiento de huellas dacti-lares normalmente realizan la comparacion entre unahuella latente y todas las huellas almacenadas dentrode una determinada base de datos de huellas, obte-niendo con ello un grupo de huellas similares que,posteriormente, seran analizadas con mayor deten-imiento por un experto en este campo. Esta tecnicapermite reducir el numero total de huellas a analizar,obteniendo un pequeno grupo de estas cuya canti-dad es determinada previamente por el experto. Sinembargo, el tiempo necesario para desempenar estatarea de comparacion depende en gran medida deltamano de la base de datos.

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

0 1 2 3 4 5 6 7 8 9

Tam

año e

n m

emori

a (k

B)

Muestra de huellas dactilares

Lista de minucias

Tamaño medio

Tamaño medio par

Capacidad caché L1

Fig. 5. Tamanos de las listas de minucias, en memoria mane-jada, para una muestra de 10 huellas dactilares de la basede datos FVC2004 DB1A. Se muestra el tamano mediode una lista y de un par de listas de minucias calculadaspara la muestra seleccionada, junto con la capacidad dela memoria cache de datos L1.

Por otro lado, cada muestra tomada de una huelladactilar, ya sea de tipo rodada, latente o impresa,no tiene por que contener un numero fijo de minu-cias, debido a la considerable complejidad que tienela toma de muestras de huellas dactilares, que im-plica varios aspectos como las variaciones de presion,el area (muestra parcial o total), grandes distorsionesno lineales, entre otras variables [12]. Por lo tanto,si la huella a consultar y la de plantilla de la base de

datos contienen una gran cantidad de minucias cadauna, la cantidad total de datos con los que se trabajadurante la comparacion de ambas huellas necesitaramas espacio de memoria del disponible dentro de lamemoria cache de datos L1, incrementando con ellolos fallos de cache y aumentando por consiguienteel tiempo de ejecucion [13]. Esta situacion se pre-senta en la figura 5, donde se muestra que el tamanomedio de un par de huellas dactilares se encuentramuy cercano al maximo espacio disponible dentrode la memoria cache L1, estos resultados han sidoobtenidos a partir de la ejecucion y analisis del algo-ritmo de comparacion DMC sobre la base de datosde huellas FVC2004 DB1A.

0

50

100

150

200

250

300

350

400

0 2000 4000 6000 8000

Tie

mpo p

or o

per

ació

n (

ns)

Operaciones de comparación

1,00

2,00

3,00

4,00

5,00

6,00

7,00

1 2 3 4 5 6

Ace

lera

ción

Cores

Fig. 6. Tiempo por operacion de comparacion entre minu-cias, en nanosegundos, con respecto al numero total deoperaciones a realizar. Las comparaciones entre huellasdactilares que posean una cantidad reducida de minuciasnecesitan un tiempo de procesamiento mayor que aquellasque tienen un gran numero de minucias a comparar.

Por ello, se ha analizado el desempeno de losdos primeros pasos del algoritmo de comparacionDMC al calcular el valor de similitud existente entrediversas huellas dactilares que contienen diferentenumero de minucias a comparar. Los resultadosobtenidos, en terminos de aceleracion, se puedenobservar en la figura 6. En ella se muestra el tiempomedio necesario para realizar una operacion de com-paracion entre dos minucias en funcion del numerototal de comparaciones a realizar. El tiempo mediopor operacion de comparacion decrece conformeaumenta el numero de minucias a analizar y porende, la cantidad de operaciones de comparacion.Posiblemente este hecho se deba a las optimizacionesllevadas a cabo por el compilador en lo referente alos bucles de procesamiento del algoritmo.

Se propone la implementacion de una estructuraparalela para la ejecucion del algoritmo de com-paracion DMC. La figura 7 muestra esta estruc-tura, donde cada core de la CPU tendra a su dis-posicion una copia de la huella a consultar y realizarala comparacion entre esta y un bloque de huellaspertenecientes a la base de datos. Este bloque podraestar formado por huellas completas o parciales,dependiendo del espacio total que ocupe la com-paracion en memoria, por ejemplo, F5-S1 y F5-S2 de

la figura anterior representan la division de la quintahuella dactilar de la base de datos en dos grupos deminucias para ser procesadas en dos cores diferentes.El tamano de este bloque de procesamiento sera cal-culado de forma que todos los datos referentes a lasminucias puedan estar almacenados perfectamente, ysin desbordamientos, dentro de cada memoria cacheL1 al realizar los dos primeros pasos del algoritmode comparacion DMC. Si se produce una coinciden-cia entre minucias, el valor de similaridad sera alma-cenado para calcular posteriormente la coincidenciatotal entre huellas. Por ello, esta propuesta intentasolventar dos problemas muy comunes entre los algo-ritmos de comparacion de huellas dactilares: la malaescalabilidad de estos programas para bases de datosde grandes dimensiones y el bajo rendimiento de lamemoria cache durante los calculos.

2-0

1-1

1-0

0-2

0-1 0-1 0-1

F4 F5

F3 F4 F5

F2 F3 F4 F5

F1 F2 F3 F4 F5

25 18 45 68 12

F1

F2

0 24

0 17

0-0 0-0

F0 F1 F2 F3

0 0 0 03 1 2

Core 0

...

Core 1 Core 2 Core N

L1 D-caché L1 D-caché L1 D-caché L1 D-caché

F1

F2

F1 F1 F1

F6F3 F4 Fi

F5-S1 F5-S2

Fig. 7. Estructura del algoritmo paralelo de comparacionDMC propuesto donde cada hilo de ejecucion posee unacopia de la huella a consultar (F1) para ser comparada conun bloque de huellas dactilares seleccionadas de la base dedatos de forma que la totalidad de los datos puedan seralmacenados dentro de cada memoria cache L1.

Por ultimo, se han realizado una serie de prue-bas sobre las dos primeras etapas del algoritmo paraobtener un resultado aproximado de la escalabilidaddel codigo, y que se muestra en la figura 8. Parael procesamiento paralelo de las huellas se han em-pleado las directivas que ofrece OpenMP para C++tomando como huella a consultar la primera de labase de datos FVC2004 DB1A frente a la totalidadde huellas que la componen (800 muestras). Comose puede observar en el grafico, la primera partedel codigo escala correctamente empleando 2, 4 y 6procesadores.

0

50

100

150

200

250

300

350

400

0 2000 4000 6000 8000

Tie

mpo p

or o

per

ació

n (

ns)

Operaciones de comparación

1,00

1,50

2,00

2,50

3,00

3,50

4,00

1 2 3 4 5 6

Ace

lera

ción

Cores

Fig. 8. Resultados de aceleracion al paralelizar la com-paracion de huellas para las dos primeras etapas del algo-ritmo DMC, empleando la base de datos FVC2004 DB1A.

VI. Conclusiones

Se han presentado dos estrategias para mejorar eltiempo de ejecucion del algoritmo de comparacionDMC propuesto por Medina-Perez et al. [2]. Paraello, se ha probado que el primer paso para la re-duccion del tiempo de procesamiento del algoritmoDMC reside en la traduccion desde C# a C++ de lasfunciones con mayor coste computacional, debido ala mayor carga de trabajo que induce el codigo C#por ser un lenguaje manejado. Para alcanzar esteobjetivo, se ha implementado una librerıa de clasesde CLR dentro del codigo original del DMC paratrabajar como conector entre el proyecto original deC# y el nuevo archivo de C++ no manejado, permi-tiendo con ello la transferencia de los datos de lashuellas dactilares en ambas direcciones. El codigoC++ no manejado se incluye dentro de una librerıaestatica de C++ (.lib) que contiene el algoritmo op-timizado de comparacion de huellas DMC reescritoen dicho lenguaje de bajo nivel. Con respecto a lasoptimizaciones realizadas sobre el algoritmo, se haimplementado una librerıa rapida de C++ dentro dela funcion PopCount reduciendo significativamenteel tiempo a emplear para realizar la operacion decuenta de valores a uno hasta 204,8 veces, en con-traste con el metodo SWAR implementado en C#.En relacion con la funcion UpdateNearest, se hanprobado dos alternativas, dentro de la nueva librerıade C++, de optimizacion para el calculo de la vecin-dad de cada minucia: la traduccion del mismo algo-ritmo implantado en C# a C++ que emplea el uso dela distancia Euclıdea, y esta traduccion empleandoel cuadrado de la misma (SED). Estas estrategiashan mejorado 2,33 y 2,83 veces, respectivamente, eltiempo de ejecucion obtenido para el codigo de C#.Como ultimo aspecto, se ha propuesto un nuevo en-foque para mejorar el rendimiento del algoritmo decomparacion DMC basado en una estructura paralelade procesamiento donde cada hilo de ejecucion re-alizara la comparacion entre la copia de la huella aconsultar que tiene almacenada y los bloques de huel-las completas o parciales procedentes de la base dedatos, que podran ser almacenadas en su totalidaddentro del espacio disponible en la memoria cache L1durante la realizacion de los dos primeros pasos delalgoritmo. Ademas, se ha mostrado que, centrandoel estudio en el algoritmo DMC, el tamano de losdatos necesarios para realizar la comparacion entredos huellas dactilares es, en algunos casos, mayor queel espacio disponible dentro de la memoria cache L1.Esta situacion reduce previsiblemente el rendimientode los calculos debido a los fallos de cache y la malaescalabilidad del algoritmo para bases de datos quecontienen gran cantidad de huellas. No obstante, es-tos problemas podrıan ser atenuados utilizando lanueva propuesta que emplea la estructura paralelade procesamiento. Por ultimo, se han mostrado losresultados relativos a la aceleracion obtenida para lasdos primeras etapas del algoritmo DMC, empleandopara ello la estructura paralela propuesta.

Agradecimientos

El presente trabajo ha sido financiado por elProyecto TIN2016-80920-R perteneciente al PlanNacional de Investigacion destinado al estudio dearquitecturas de altas prestaciones para aplica-ciones intensivas en datos, y por la Universidad deMalaga (Campus de Excelencia Internacional An-dalucıa Tech).

Referencias

[1] M.A. Medina-Perez, et al., Introducing an experimen-tal framework in C# for fingerprint recognition, MCPR2014, pp. 132–141, Springer, Cham, 2014.

[2] M.A. Medina-Perez, et al., Latent fingerprint identifica-tion using deformable minutiae clustering, Neurocomput-ing, vol. 175, pp. 851–865, 2016.

[3] R. Cappelli, M. Ferrara, D. Maltoni, Minutia cylinder-code: A new representation and matching technique forfingerprint recognition, IEEE Transactions on PatternAnalysis and Machine Intelligence, vol. 32, no. 12, pp.2128–2141, 2010.

[4] X. Jiang, Y. Wei-Yun, Fingerprint minutiae matchingbased on the local and global structures, Pattern Recogni-tion, vol. 2000, no. 2, pp. 1038–1041, 2000.

[5] K. Cao, et al., Fingerprint matching by incorporatingminutiae discriminability, IJCB 2011, pp. 1–6, 2011.

[6] M.A. Medina-Perez, et al., Improving fingerprint verifica-tion using minutiae triplets, Sensors, vol. 12, no. 3, pp.3418–3437, 2012.

[7] R. Cappelli, et al., Performance evaluation of fingerprintverification systems, IEEE Transactions on Pattern Anal-ysis and Machine Intelligence, vol. 28, no. 1, pp. 3–18,2006.

[8] A.M. Bazen, H.G. Sabih, Fingerprint matching by thin-plate spline modelling of elastic deformations, PatternRecognition, vol. 36, no. 8, pp. 1859–1867, 2003.

[9] Using C++ Interop (Implicit PInvoke),https://msdn.microsoft.com/en-gb/library/2x8kf7zx.aspx,

Ultimo acceso: 16 Febrero 2018.[10] .NET Programming with C++/CLI (Visual C++),

https://msdn.microsoft.com/en-gb/library/68td296t,

Ultimo acceso: 22 Mayo 2018.[11] W. Mua, N. Kurz, D. Lemire, Faster population counts

using AVX2 instructions, The Computer Journal, vol. 61,no. 1, pp. 111–120, 2017.

[12] A.K. Jain, J. Feng, Latent fingerprint matching, IEEETransactions on Pattern Analysis and Machine Intelli-gence, vol. 33, no. 1, pp. 88–100, 2011.

[13] M. Kowarschik, C. Weiss, An overview of cache op-timization techniques and cache-aware numerical algo-rithms, Algorithms for Memory Hierarchies, pp. 213–232,Springer, Berlin, 2011.

Documents

Acelerando la Comparaci on de Huellas Dactilares basadas