Upload
alberto-alonso
View
19
Download
1
Embed Size (px)
Citation preview
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
2
Índice
Presentación ................................................................................................................................................. 3
¿Qué es el razonamiento aproximado?........................................................................................................ 4
Ámbitos de aplicación del razonamiento aproximado ................................................................................. 5
Razonamiento aproximado e incertidumbre. Dominios inciertos ............................................................... 6
Razonamiento aproximado e incertidumbre. Fuentes de error ................................................................... 7
Métodos de razonamiento aproximado ....................................................................................................... 8
El formalismo de los factores de certeza (CF) .............................................................................................. 9
Propagación de los factores de certeza y regla de encadenamiento I ....................................................... 11
Propagación de los factores de certeza y regla de encadenamiento II ...................................................... 12
Resumen ..................................................................................................................................................... 13
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
3
Presentación
El razonamiento aproximado se orienta a tratar el conocimiento que se utiliza en múltiples dominios
como la medicina o el derecho, o diferentes ámbitos de la ingeniería. En la unidad anterior nos hemos
centrado en los sistemas expertos y los sistemas basados en el conocimiento en los que los datos,
hechos, relaciones entre ellos, y conocimiento en general, se encontraban definidos de forma precisa y
clara. Esto no ocurre así en múltiples situaciones donde existe incertidumbre tanto en los datos con los
que el sistema trabaja, como en el propio conocimiento que utilizan los expertos, que puede ser más
vago e impreciso.
Las técnicas de razonamiento aproximado se orientan a gestionar este tipo de situaciones donde los
datos y el conocimiento son más imprecisos, vagos y pueden incluir diferentes fuentes de
incertidumbre. En esta unidad trataremos el razonamiento aproximado, y nos centraremos en dos
modelos que resultan especialmente representativos: el formalismo de los factores de certeza y la
lógica difusa.
Al terminar este tema serás capaz de:
Tener una visión general de qué es el razonamiento aproximado y en qué aspectos se centra.
Distinguir los ámbitos de aplicación del razonamiento aproximado.
Comprender la importancia de la incertidumbre en el razonamiento aproximado y las
diferentes fuentes de donde puede provenir.
Diferenciar la diversidad de técnicas de razonamiento aproximado.
Conocer el formalismo de los factores de certeza y la regla de encadenamiento.
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
4
¿Qué es el razonamiento aproximado?
De forma complementaria a los sistemas basados en el conocimiento que hemos visto en la anterior
unidad, existen muchas ocasiones en las que es necesario modelar conocimiento en el que las reglas o
relaciones entre los conceptos no son exactamente de tipo binario si/no o verdadero/falso.
En la vida diaria y en la toma de decisiones en dominios concretos es habitual hacer uso de
conocimiento que relaciona conceptos de forma más ambigua o con un cierto nivel de incertidumbre.
En este tema veremos un conjunto representativo de elementos en torno al razonamiento aproximado,
que permite abordar este tipo de situaciones.
Un conocimiento de este tipo del que hacemos uso todos los días puede ser por ejemplo: “Si está muy
nublado, es posible que llueva en unas horas”. No es un conocimiento que podamos representar
mediante una regla o un predicado lógico. No estamos expresando que “si está nublado lloverá”, de
forma precisa.
No es fácil encontrar una correspondencia de la frase anterior con un lenguaje de representación del
conocimiento que hemos visto en la unidad anterior. Incluye una cierta gradación e incertidumbre. Por
otra parte, es un conocimiento que puede resultarnos útil representar y ser capaces de integrar en un
sistema que opere con él.
Consideremos como ejemplo sencillo la siguiente regla:
Sistema experto de esta regla
La regla podría encontrarse en un sistema experto, dentro de un conjunto más amplio en el que se
estuviese representando el conocimiento de síntomas de enfermedades.
R: IF dolor.de.cabeza THEN gripe
Efectivamente, uno de los síntomas de la gripe es el dolor de cabeza. Por otra parte, la regla concluye
directamente que si existe dolor de cabeza, entonces la enfermedad es la gripe con toda seguridad. Una
regla parecida a la anterior, pero incorporando uno de los métodos que veremos en puntos siguientes,
el de factores de certeza, sería esta:
R: IF dolor.de.cabeza THEN gripe (CF = 0,3)
A diferencia de la anterior, en este formalismo estamos representando, de forma más gradual, e
incluyendo una dosis de incertidumbre o consideración de probabilidad, que efectivamente es posible
que el paciente tenga como enfermedad la gripe si tiene dolor de cabeza, pero con un factor de certeza
(CF) de 0,3 (que viene a representar su probabilidad, siendo el CF máximo 1,0).
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
5
Ámbitos de aplicación del razonamiento aproximado
Los ámbitos de aplicación en que se han utilizado sistemas de razonamiento aproximado son múltiples y
abarcan un amplio espectro, desde sistemas de control de transporte ferroviario, aire acondicionado,
control de aeronaves y procesos industriales, a sistemas de análisis y toma de decisiones en
biomedicina.
Técnicas de este tipo se han aplicado en sistemas diversos: de búsqueda de información en la web,
filtrado de spam y páginas web, marketing personalizado, comercio electrónico, control de cuencas
fluviales, clasificación de datos estelares, encaminamiento y clasificación de textos, y un largo
etcétera.
Por ver en más detalle, por ejemplo, en el dominio biomédico, este tipo de sistemas han sido utilizados
en aplicaciones concretas que han incluido:
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
6
Razonamiento aproximado e incertidumbre. Dominios inciertos
El razonamiento aproximado es la clave en sistemas orientados a campos de aplicación en los que la
incertidumbre de los datos que se analizan y la del conocimiento con que se trabaja en él juega un papel
especialmente protagonista.
El campo de la medicina es un ejemplo de dominio incierto. En él es frecuente un planteamiento en el
que se estudia un paciente, se presentan un conjunto de signos y síntomas, y un interrogante principal
es saber qué enfermedad tiene. Se puede tener tan incorporada esta pregunta que no siempre se es
capaz de percibir el grado de incertidumbre implícito. La relación entre los signos y los síntomas de las
enfermedades que los producen es variable (existen pacientes con iguales síntomas y diferentes
enfermedades).
De hecho, la secuencia de los eventos y los datos disponibles
puede no ser conocida con exactitud. No aceptar un cierto
grado de incertidumbre en la información puede abrir senderos
rápidos pero equivocados. El paciente puede administrar datos
equívocos, no estar seguro de tal o cuál afirmación o evocación,
puede haber ausencia de información, errores y subjetividad
por parte del paciente y por parte del médico.
El proceso mental que acerca al diagnóstico es complejo, el
concepto de probabilidad e incertidumbre están en mayor o
menor grado presentes. Para medir la incertidumbre, se puede
partir de un conjunto grande que incluya todas las posibilidades
de diagnóstico, luego construir un subconjunto acotado y
asignar un número real que mida el grado de incertidumbre
sobre tal o cual diagnóstico. Puede ser necesario acudir a medidas de probabilidad, y la intuición no
está excluida del proceso.
El campo de la medicina es efectivamente uno paradigmático de dominio incierto, pero todas estas
fuentes de incertidumbre pueden darse, y de hecho se dan en múltiples campos de las ciencias
naturales, el derecho, las humanidades y la ingeniería en sus distintos ámbitos de aplicación.
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
7
Razonamiento aproximado e incertidumbre. Fuentes de error
Existen situaciones donde los datos que debe procesar el sistema, o el conocimiento que proviene de un
experto y que queremos incluir, se encuentran rodeados de diferentes niveles de incertidumbre.
La incertidumbre puede tener origen en los datos, por ejemplo:
Los datos pueden no llegar o no estar disponibles en un determinado momento.
Los datos pueden estar disponibles, pero pueden ser ambiguos, o no ser de confianza, debido a
errores en medidas, medidas en conflicto, etc.
La representación de los datos puede ser imprecisa o inconsistente.
Los datos pueden ser simplemente la mejor estimación de un usuario.
Los datos pueden ser valores por defecto, y los valores por defecto pueden tener excepciones.
La incertidumbre puede provenir también del conocimiento representado e incluido en el sistema, ya
que puede:
Representar la mejor estimación de los expertos, basada en asociaciones plausibles o
estadísticas que han observado.
No ser apropiada en todas las situaciones, sino sólo en un subconjunto no determinado de
ellas.
Teniendo presentes estas numerosas fuentes de error, hay muchas situaciones en las que los sistemas
basados en el conocimiento requieren la incorporación de alguna forma de gestión de la incertidumbre.
Cuando se desarrolla un sistema hay tres aspectos principales a considerar, (algunos a veces son sutiles
pero pueden tener impacto significativo en el funcionamiento y conclusiones obtenidos por un sistema):
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
8
Métodos de razonamiento aproximado
En la actualidad existe un amplio abanico de diversos métodos y técnicas, y aplicaciones basadas en
ellos, orientados a la implementación de diferentes formas de razonamiento aproximado: hacemos una
revisión sintética de algunos de los más relevantes.
Las primeras aproximaciones se basaron de forma muy directa en el teorema de Bayes (al que ya
hemos hecho referencia en temas anteriores de esta asignatura) para relacionar probabilidades de
hipótesis y evidencias:
Respecto a los primeros sistemas basados en el método probabilístico clásico (a veces denominado
Bayes Ingenuo), el formalismo de los factores de certeza (CF), supuso un avance básico al permitir la
incorporación de criterios de incertidumbre y probabilidad en las reglas de los sistemas expertos.
Método probabilístico en sistemas expertos
El primer sistema experto en incorporarlo fue MYCIN, a principios de los años 70. En años siguientes, el
formalismo de los factores de certeza recibió mejoras en su fundamentación y fue incorporado de forma
creciente en diversos sistemas y entornos de desarrollo. Las redes bayesianas han sido en cierta medida
una continuación directa, y en la actualidad son utilizadas en diversos productos de fabricantes como
Microsoft, Digital, Hewlett‐Packard, IBM, Intel o Siemens, así como de fabricantes tecnológicos más
especializados.
También ha jugado un papel relevante en el ámbito del razonamiento aproximado la teoría de la
evidencia desarrollada inicialmente por Dempster en 1967 y posteriormente extendida por Shafer en
1976, y que es habitualmente denominada teoría de Dempster‐Shafer.
También, en el marco del razonamiento aproximado, la teoría de conjuntos difusos, y la lógica difusa
basada en ella, han sido la base de un número muy importante tanto de sistemas como de entornos de
desarrollo.
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
9
El formalismo de los factores de certeza (CF)
El conocimiento en un sistema experto que incorpore el formalismo de los factores de certeza, se
representa como un conjunto de reglas de la forma:
IF EVIDENCIA
THEN HIPOTESIS (CF)
Donde EVIDENCIA son uno o más hechos que dan soporte a que la HIPOTESIS sea cierta. El valor del CF
de la regla denota la confianza en que efectivamente la HIPOTESIS se dé, si EVIDENCIA ocurre. En este
formalismo, también a los hechos se les puede asignar un valor de CF, dependiendo del nivel de
seguridad o certidumbre con que se estén produciendo. Para verlo sobre un ejemplo, consideremos una
regla sencilla motivada en el dominio médico:
R: IF dolor.de.cabeza THEN gripe (0,3)
Valor de CF
El valor de CF oscila entre ‐1 y 1, de tal forma que un CF=1 es seguridad total, un CF= ‐1 es seguridad de
que no ocurre, y un CF = 0 es incertidumbre absoluta.
Los hechos que se incluyen como evidencia en las reglas, también pueden tener su CF para modelar una
situación. De esta forma, si estamos considerando una situación en la que alguien tiene dolor de cabeza
bastante intenso, podríamos asignarle un CF = 0,9 a dolor.de.cabeza. Si por el contrario, manifiesta que
no tiene absolutamente ningún tipo de dolor de cabeza, podríamos asignarle a dolor.de.cabeza un CF = ‐
0,9, o incluso un CF = ‐1,0. Dado un valor de CF para la EVIDENCIA, y aplicando la regla, el CF de la
HIPOTESIS se calcula mediante el producto de ambas, es decir:
CF(HIPOTESIS) = CF(EVIDENCIA) * CF(REGLA)
Por lo tanto, para un caso por ejemplo en que tuviésemos un CF = 0,9 para dolor.de.cabeza,
obtendríamos para gripe un CF = 0,9*0,3 = 0,27.
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
10
Explicación regla
Explicación de la regla
Con esta regla (que puede ser muy cuestionable en un caso real) estamos representando el
conocimiento de que si alguien tiene dolor de cabeza, es probable que tenga la gripe. Al asignarle un CF
= 0,3 a la regla R, estamos representando que estimamos un 30% aproximadamente de que
efectivamente ocurra, que si alguien tiene dolor de cabeza, tenga la gripe (esto se corresponde con que
es también bastante probable que alguien tenga dolor de cabeza, pero por otras razones, y que de
hecho no tenga la gripe).
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
11
Propagación de los factores de certeza y regla de encadenamiento I
Es habitual que tengamos una serie de reglas y que todas ellas influyan en una determinada hipótesis. Es
decir, para dos reglas, esta situación:
R1: IF EVIDENCIA1 THEN HIPOTESIS (CF1)
R2: IF EVIDENCIA2 THEN HIPOTESIS (CF2)
En este caso, surge la cuestión de cómo componer los valores obtenidos para el CF de HIPOTESIS a partir
de cada una de ellas.
Consideremos esto sobre el ejemplo sencillo:
R1: IF dolor.de.cabeza THEN gripe (0,5)
R2: IF fiebre THEN gripe (0,9)
Si por ejemplo obtenemos como resultado para gripe un CF(gripe) = 0,4 aplicando R1, y un CF(gripe) =
0,7 aplicando R2, ¿cómo componer ambos valores?
Podríamos por ejemplo intentar sumar ambos CF, pero este caso nos muestra que no puede ser así, ya
que obtendríamos un CF de 1,1 y, por definición el máximo CF es 1,0 (que sería certeza absoluta de
tener la gripe). Veremos a continuación la expresión que nos permite componer ambos CF respetando
sus propiedades.
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
12
Propagación de los factores de certeza y regla de encadenamiento II
El formalismo de CF incluye las siguientes expresiones para la composición de CF de dos reglas que
proporcionan evidencia para la misma hipótesis:
La expresión (E1) constituye la base de la denominada regla de encadenamiento, que permite
encadenar las conclusiones obtenidas por las reglas en el proceso de inferencia o razonamiento. La
expresión se puede fundamentar con teoría de probabilidades: ver en detalle esta cuestión queda fuera
de los objetivos de este tema, pero interesa tenerlo presente.
Las expresiones en (E1) permiten componer un número n de reglas, de forma iterativa. En el caso
anterior que comentábamos de los dos valores obtenidos para gripe de CF(gripe) = 0,4 y CF(gripe) = 0,7,
aplicaríamos la expresión (la opción correspondiente a los dos CF > 0), y obtendríamos un CF para la
gripe de:
R1+R2. CF(gripe) = 0,4 + 0,7*(1-0,4) = 0,82
En el tema siguiente veremos la utilización de todos estos elementos y su cálculo para dos ejemplos de
sistemas expertos simplificados: uno en un dominio jurídico simplificado, y otro en un sistema de
control de alarmas.
RAZONAMIENTO APROXIMADO
CONOCIMIENTO E INCERTIDUMBRE
13
Resumen
Las técnicas de razonamiento aproximado se orientan a tratar situaciones en donde los datos y el
conocimiento tienen una cierta imprecisión o puede incluir diferentes fuentes de incertidumbre. En este
tema hemos proporcionado una visión general de qué es el razonamiento aproximado y en qué
aspectos se centra.
Hemos visto la diversidad de ámbitos de aplicación del razonamiento aproximado, como la biomedicina,
el derecho o la ingeniería. La incertidumbre juega un papel relevante en el conocimiento con el que se
trabaja en muchas situaciones de estos ámbitos de aplicación, y puede provenir de diversas fuentes.
Existe un cierto número de técnicas de razonamiento aproximado que incluyen las aproximaciones
bayesianas clásicas, el formalismo de los factores de certeza, las redes bayesianas, la teoría de la
evidencia de Dempster‐Shafer y la lógica difusa.
El formalismo de los factores de certeza (CF) permite representar en las reglas de un sistema experto el
nivel de confianza o probabilidad asociado a ella. La regla de encadenamiento permite calcular el valor
del CF resultante de la aplicación de las reglas, y de las conclusiones finales del proceso de
razonamiento.