67
Естествен интелект – способността да се разсъждава, да се взема решение, да се обучава, да се възприема средата с цел ефективна адаптация на индивида. Рационално поведение – всичко свързано с интелигентното Редица човешки интелигентни функции, като решаване на задачи, доказване на теореми, разпознаване на образи успешно се заместват от програмни системи. В много случаи не се имитира биологичният прототип, а се използват нови принципи на възпроизвеждане в изкуствена среда. Интелигентно поведение – взаимодействие между система и среда, за което е характерна възможността да се знае, разсъждава и действа целенасочено. Основни аспекти на интелигентното поведение: - Перцепция – възприемане на информация от сензори, интерпретиране и представяне с цел натрупване на знания за средата. - Действане – представлява формиране на команди и активиране на изпълнителните устройства на интелигентната система с цел промяна на средата. Може да бъде и чисто информационен акт – напр. Разсъждение - Разсъждаване – обработки върху сензорно получени знания и други налични знания с цел решаване на задачите. Основни форми на ръзсъждаване са: Заключение (извеждане на нови хипотези в неявен вид в базата от знания), обучение (представлява обобщаване на предишен опит с цел промяна или извеждане на знания за усъвършенстване на поведението), избор на различни варианти на решения, планиране (формиране на последователност от описания на действия, чието изпълнение води до целта), разпределяне на общи ресурси с цел реализиране на процесите по перцепция, разсъждаване и действие. Изкуственият интелект е интердисциплинарна научна област използваща математика, информатика и др. СИМВОЛЕН И ЧИСЛОВ ПОДХОД НА ИИ

Вероятностни мрежи (Мрежи на Бейс) Web viewmycin – бактериална диагностика на кръвта.Система

  • Upload
    vumien

  • View
    258

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Естествен интелект – способността да се разсъждава, да се взема решение, да се обучава, да се възприема средата с цел ефективна адаптация на индивида.

Рационално поведение – всичко свързано с интелигентното

Редица човешки интелигентни функции, като решаване на задачи, доказване на теореми, разпознаване на образи успешно се заместват от програмни системи. В много случаи не се имитира биологичният прототип, а се използват нови принципи на възпроизвеждане в изкуствена среда.

Интелигентно поведение – взаимодействие между система и среда, за което е характерна възможността да се знае, разсъждава и действа целенасочено.

Основни аспекти на интелигентното поведение:

- Перцепция – възприемане на информация от сензори, интерпретиране и представяне с цел натрупване на знания за средата.

- Действане – представлява формиране на команди и активиране на изпълнителните устройства на интелигентната система с цел промяна на средата. Може да бъде и чисто информационен акт – напр. Разсъждение

- Разсъждаване – обработки върху сензорно получени знания и други налични знания с цел решаване на задачите. Основни форми на ръзсъждаване са: Заключение (извеждане на нови хипотези в неявен вид в базата от знания), обучение (представлява обобщаване на предишен опит с цел промяна или извеждане на знания за усъвършенстване на поведението), избор на различни варианти на решения, планиране (формиране на последователност от описания на действия, чието изпълнение води до целта), разпределяне на общи ресурси с цел реализиране на процесите по перцепция, разсъждаване и действие.

Изкуственият интелект е интердисциплинарна научна област използваща математика, информатика и др.

СИМВОЛЕН И ЧИСЛОВ ПОДХОД НА ИИ

От 1956 година на конфернцията в Дартмут развитието на ИИ се характеризира с два подхода. В основата на символния подход е хипотезата на Алан Нюел за физическата синволна система, че интелигентното поведение изисква символни разсъждения върху символно представени знания. Представянето на знания е на ниво смислова информация, а не на ниво данни. Интелигентните системи в това направление като следствие обработват смислово заредени структури, наречени модели за представяне на знания.

Числовият подход е основан на хипотезата за пораждащата се функционалност – според нея ИИ може да се породи от голям набор елементарни поведения без централизирано управление над тях. Тук се включват невронни мрежи, генетични алгоритми, симулационни програми и т.н. Този подход моделира подсъзнателното поведение.

Page 2: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Неструктурирани задачи според Нюел – нямат алгоритмично решение, освен това входните величини нямат числова форма, нееднозначни са, непълни и противоречиви и се променят динамично. Целите на задачата не могат да се изразят с целева функция. За решението им е необходим човешки опит под формата на знания. Самото решение се приема като най-добрият възможен вариант при наличната информация. Последоватлността от деиствия за решаването на тези задачи не е известна и трябва да се генерира в процеса на работа. Задачите се решават при различна степен на разбиране на информацията.

(към Архитектура на интелигентните системи) Наличието и обработката на знания е основният белег отличаващ интелигентити системи от останалите.

Важни характеристики на интелигентните системи:

- Решават неструктурирани задачи- Обработват знания- Обучават се – с учител, без учител или подпомагано- Използват специалните подходи на ИИ за намиране на решения (някой от тях са

търсене в пространство от състояния, логически разсъждения, съпоставка по образци и др.)

СИМВОЛНИ ИНТЕЛИГЕНТНИ СИСТЕМИ

Особенности

Знанията в тези системи са явно представени, организирани в бази от знания, които се обработват от специални програмни механизми. Пример в Prolog – правилата и фактите са базата от данни, а обработката е чрез вградения механизъм за логическо решаване.

Знанията са представени чрез един или няколко модела. Съдържанието на базата от знания се формиръ не само при създаването на средата, но и в резултата на нейната работа. Премахването на части от знания не блокира системата, а води до алтернативно решение.

Разсъжденията са класифицират на достоверни и недостоверни. Достоверни са дедуктивните (логически). При тях от истинни предпоставки следва исттинно заключение. Недостоверните са провдоподобни и приближени. Правдоподобни разсъждения са абдуктивните (те са правдоподобни, но не доказани). Те са средство за генериране на хипотези (Шерлок Холмс като използващт този метод). Приближените разсъждения са вероятностните и размитите разсъждения (размитата логика на Zade).

При обработката на базата от знания се генерира нова информация, която не е била зададена. Това не е възможно при традиционните системи.

В процеса на обучение е възможно добавяне на знания чрез символен вход или извеждане със символен изход, като и съмоубочение.

Page 3: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

РЕШАВАНЕ НА ПРОБЛЕМИ ЧРЕЗ ТЪРСЕНЕ

Търсенето е основен подход при решаване на неструкторирани задачи. Чрез него още на концептуално ниво може да се останови начин за намиране на решение или да се покаже, че задачата няма решение. То се различава от традиционните методи, при които се използва конкретен алгоритъм. При търсенето се задава модел, който не се променя при промяна на изходните условия в допустим диапазон и води само до намиране на нови решения.

Основни понятия:

- Състояние – структура от данни, която представя абстрактна снимка в определен стадий на решения

- Оператори – действията за реализиране от едно състояние в друго- Наследници – получените състояния- Пространство на търсенето – генерирани състояния в процеса на прилагане на

операторите. Генерира се дървовидна структура (възли – междинни състояния, листа – крайни състояние)

- Алгоритъм- Функция за проверка дали изходното състояние е добро

В алгоритъма има два други вида функции. Първата е генератор на разумните ходове, който избира и подрежда операторите. Втората функция е оценъчна и обикновенно е числова величина, представляваща мярка за близостта на целта на разглежданото състояние. Оценъчната функция може да връща число, което количествена оценка на необходимите ресурси за достигане на даден възел. Състоянията се реализират за разглеждане според стойността на оценачната функция. За повечето реални задачи, оценачната функиция се основава на евристика (практически правила, опростявания, различни практически подходи за бързо намиране на решения).

В зависимост от сложността на проблема може да има различни видове търсене в едно пространство, йерархия от пространства или алтернативни пространства и др.

Стратегиите при търсене в едно пространство са от изходните данни към целта (права верига) и от целта към изходните данни (обратна верига).

При търсенето напред процеса на изграждане започва от известните данни, като продължава към целта. Използва се когато голяма част от данни са зададени в условието на задачата и когато съществува голям брой потенциални цели или когато формирането на целта е трудно. При обратното търсене най-напред се разглежда целта, анализират се допустимите оператори водещи към нея и се определят предпоставките за прилагането им. Тези условия стават подцели на търсенето, което продължава до изходните данни. Приложимо е при явна или лесно формулируема цел; когато има много правила, които на основа на фактите позволяват да се получат голям брой заключения или цели; когато изходните данни не се дават в системата, но лесно могат да станат известни. И при права и обратна верига на търсене се използва едно и също пространство.

Page 4: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

СЛЯПО (НЕИНФОРМИРАНО) ТЪРСЕНЕ

Прилага се когато липсва (или е малко) информация за предметната област. Това търсене не е ефективно и понякога води до комбинаторен взрив, но често е единствено възможно. Зато има значение при изграждане на интелигентни агенти. Изпълнява се в ширина, дълбочина или двупосочно.

Търсенето в ширина се провежда чрез обхождане на всяко ниво. Ако решението съществува, то тази стратегия е най-бърза. Изходния възел винаги е с индекс 0, а всеки друг е най-близкият му +1.

Броят на наследниците за отделния възел се нарича фактор на разклоняване. Новите породени възли се добавят в края на списъка от породени, но неразгледани възли. Пример – породените на възел 1 – 4, 5 и 6 ще се разгледат след възел 3.

Пътя към целта може да се определи чрез запаметяване на откритите родителски възли. Например с всеки нов възел се асоциира показател към пораждащият го родителски. Тогава пътя се намира с проследяване на показателите към корена.

Търсенето в ширина изисква мно памет, тъй като при него се запомнят всички пътища към обходените възли.

АЛГОРИТЪМ ЗА ТЪРСЕНЕ ПО ШИРИНА

O – списък с разкрити но неразкрити възли (непородени насл)

C – разкрити възли

М – множество от необработени възли

V0 – начален възел

V – текущ възел

Vj – целеви възел.

Записва се началният възел в списъка О, инициализира се C; Ако О е празен – спира се решението с отговор не; Ако V = Vj то стоп да; Изтрива се V в О и се добавя С; поражда се Vi – наследници на V; Формира се списъка М като се записват Vi в края на списъка О и се поставят .. ; Преход към точка 2.

ТЪРСЕНЕ В ДЪЛБОЧИНА – стремежът е да се открие целта по пътя напред, без отклонения встрани. Изследват се възлите от корена към листата по най-левия клон. Когато се попадне в края на даден път без да се намери целта, се прави връщане назад по родителски възел и се търси в следващият клон.

Page 5: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

АЛГОРИТЪМ ЗА ТЪРСЕНЕ ПО ДЪЛБОЧИНА

Изисква умерени ресурси, тъй като се запомня само пътя от началния възел до текущо изследвания плюс пътя за останалите неизследвани възли за изследваният родителски.

До шеста точка е еднакво; наследниците Vi си записват в началот на М; преход към 2.

При големи пространства от състояния стратегията за търсене в дълбочина може да е много неефективна, тъй като е възможно дълго време да се езследват клони, намиращи се далеч от целта. Тогава се ограничава дълбочината на търсене, като се задава номер на ниво, след което търсенето се превключва към следващ клон. За задачи с неголеми пространства на състояния търсенето в дълбочина е по-ефективната стратегия.

При практически приложения на методите за търсене в ширина и дълбочина вместо дървото от състояния да се задава явно, то се задаво чрез множества от начални и целеви състояния и пораждащи оператори. Възлите се пораждат и изследват от конкретната програмна система, а фактите и правилата описват дървото от състояния.

ДВУПОСОЧНО ТЪРСЕНЕ

Търсене от корена към листата и от предполагаемо ниво на целта към началото. При среща търсенето се прекратява. Главнията въпрос е може ли да се определят родителите, а това става при обратими оператори. Ако не са – не е подходящ алгоритъм. Силно се намаля времето за решение, но не винаги е приложима стратегията.

ЕВРИСТИЧНО ТЪРСЕНЕ

Характерни са за интелигентните системи. Най-старите му приложения са доказателства на теореми и игри. Използва се когато има само едно решение или едно решение е приемливо и когато цената на решението е висока. Възможно е евристиката да греши, тъй като е само предложение за следваща стъпка. Основната идея прие евристичните методи се състои в сортирането на списъка О в съответствие с предварително формирана оценъчна функция. Обикновенно не се намират всички възможни решения, а едно приблизително.

ТЪРСЕНЕ В АЛТЕРНАТИВНИ ПРОСТРАНСТВА

Налага се от непълни пространства на данните. Спецификата при търсене в алтернативни пространства се изразява в това, че връщането не е към родителското състояние, а към състоянието предизвикало предположението. Търсенето се насочва към ново пространство. Във всяко от пространствата могат да се прилагат стратегиите за търсене в едно пространство.

Page 6: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ИНЖЕНЕРИНГ НА ЗНАНИЯ

ИЗВЛИЧАНЕ НА ЗНАНИЯ

Инженеринга на знания се прилага за символните системи, тъй като там знанията са явни и могат да бъдат изведени от различни източници. Процесът на извличане, подбор, структуриране на знанията и тяхното концептуално моделиране се нарича инженеринг на знанията (когнитивно). Инжинерът по знанията е когнитолог. Интелигентното ниво на работа рядко се свежда до алгоритъм, но се поддаво на компютъризация.

Извличане на знания – процес на предаване и преобразуване на опита по решаването на задачи от някакъв източник на знания в инелигентната програма.

Експерт–когнитолог

Експерт–софтуер за редактиране на знанията–знания – програмата трябва да разполага със знания за структората от данните, да има възможност за диалог

Примери-индуктивна програма-знания – въвеждане на положителни и отрицателни примери от системата

Схеми за структурите от данни – използване на мета знания, начин на използване на данните и др.

Извличането на знания се извършва предимно в началото на проекта, но не приключва с остановяване на тяхната основна част. Този процес съпътства изграждането, тестването и експлоатацията. Обема на знанията е относително пълен, ако дава възможноста да се решава всички задачи към системата.

КОНЦЕПТУАЛИЗАЦИЯ

Включва:

- Извличане на знания- Концептуализация на знания- Принцип: инт. Ниво

Същност на концептуалния модел на знания

С концептуализацията започва формализацията на всяка конкретна област. Формализацията представлява представянето на знания във формата на модели, които могат да се обработват на базата на определена теория. Концептуализацията трябва да се извърши с достатъчно общи средства на предметната област, които да са точни или компютърно приложими.

В резултат на извличането на знания се формират три множества

D – множество от предмети

Page 7: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

F – множество от операции над D

R – множество от релации

Една и съща предметна област може да се концептуализира по различен начин. Не може да се каже кои характеристики са по-добри от други.

K = < {A, B, C, E, T} , {TOP} , {block, TABLE, ON_T, CLEAR, ON, AB} >

Една и съща предметна област може да се концептуализира различно. Няма зависимост между концептуализациите.

TOP = < {A, B} , {E, B} , {B, c} >

Концептуализация ако се разглеждат цветове:

K1 = < {A, B, C, E, T, WHITE, BLUE, RED} , {COLOR} , {PROPERTY} >

Когнитулога може да изобрази изведените връзки чрез различни графични средства. Използва се метод за изобразяване на знанията, който е помощен и е начин на формализация на знанията в конкретната област. След това програмистът създава прототипна система, след което започват тестове и попълване на базата знания.

МОДЕЛИ ЗА ПРЕДСТАВЯНЕ И ОБРАБОТКА НА ЯВНИ ЗНАНИЯ

Съществуват три основни групи модели – декларативни, процедурни, процедурно-декларативни. Към тези модели се поставят изисквания за адекватност към описвания обект, смислова еднозначност, удобство при извлеченията, лесен достъп до знанията. Основната разлика при моделите е как се обработват знанията. При декларативния модел базата знания и обработката са отделно. Те са подходящи за описателни знания с много логически съждения. Дели се на модулно и мрежово, като при модулните модели се използват логически и продукционни правила. При мрежовите модели най-ярък представител са семантичните мрежи, където в явен вид се задават взаимоотношенията в явен вид. Процедурните модели изграждат заедно базата знания и оперативната част. Процедурно-декларативните съчетават предимствата на двата вида. Основни представители са фрейми и сценарии. В реалните задачи има предпочитание за използване и на трите групи модели. Така, че отношението между тях се решава за всеки конкретен случай.

C

B

A E

T

Page 8: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ЛОГИЧЕСКИ МОДЕЛИ

Основният вид логика, който представлява база за повечето модели е предикатната логика от първи ред. Нейна основа е съждителната логика. За извличане на заключения в логическите модели се прилага дедукция. Важно е, че логическият извод се основава на строга математическа теория, гарантираща верността на резултата. Логическия извод няма ограничения за сложността на изразите.

Предсатвяне на знания чрез съждителна логика

Представянето на знания става чрез прости и съставни съждения, а обработката – чрез логическо съждение.

Съждителната логика е ограничена защото:

- Атомите в нея се разглеждат като единно цяло и не се разграничават отделните компоненти носещи различен смисъл

- В съждителната логика няма средства за задаване кога едно твърдение е истина. Тя се определя в началото и не се променя

- Не могат да се изразяват твърдения от типа за всяко x съществува или има поне едно x, за което е в сила еди какво си.

Само малка част от изреченията в естествения език могат да се представят със съждителна логика.

Чрез предикатна логика от първи ред

Разширения:

- Въвеждат се предикати, правила и квантори и се използва по-богат набор от термини

- Въвеждат се променливи – чрез тях косвено се представя група обекти с еднакви характеристики или представянето на знания в предикатната логика е чрез терми за представяне на фактите за обектите и правила за изразяване на отношенията. Основно при това представяне е, че задачата се задава като съвкупност от логически формули и нейното решаване се свежда до решаване на логически извод. Той показва, че целта е логическо следствие на зададените формули. За логическия извод са необходими система от аксиоми и теореми, които заедно с метода на рез. Изграждат ... на предикатната логика.

Предикатната логика представя пълен модел на разсъждение, но има голям недостатък – тя е монотонна. Твърденията са верни и не могат да се отрекът от следващите резултати. Не може да се работи с несигурни знания, тъй като всички логически изрази имат точно установена истина или неистина. Предположение:

- Счита се, че изразите в нея адекватно съответстват на предметната област- Информационната база е непротиворечива- С използването на правила за извод базата знания се увеличава монотонно

Page 9: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ПРОДУКЦИОННИ ПРАВИЛА

Това е един от най-популярните модели за представяне на правила. При тях се използват записвания от вида - Ако (условие) То (следствие). Лявата страна на правилото се състои от предпоставки, които програмата за обработка проверява за истинност, а дясната страна задава промени в базата от данни, активиране на групи правила, изпълнение на команди и др. В зависимост от използвания интерпретатор може да се започне с проверка в лявата страна или с търсене в дясната страна, което определя прав и обратен интерпретатор.

При традиционната програма отделните модули се обръщат един към друг в точно зададена последователност. При продукционните системи няма указания за това кое правило или модул към кое трябва да се обръща. Модулите са взаимно независими. Връзката между тях се осъществява чрез базата данни. Реда на прилагане на съответните правила също се определя от състоянието на базата данни. Този факт води до отпадане на необходимостта да се обмислят предварително връзките между модулите. Кот реакция получаваме висока гъвкавост, възможност за разменяне на действията и тяхното управление и отделяне на данните.

При избор на правило по принцип не се разполага с достатъчно инфорамция за това кое е най-подходящото. Ето защо действието на една продукционна система може да се характеризира като търсене, при което се изпробват правилата. Това продължава докато се установи, че някаква последователност от правила поражда такава база данни, която удовлетворява целевото условие или друго ограничение за спиране на работа.

Основните стъпки от работата на продукционната система

- Съпоставяне – сравнява се базата данни с лявата или дясната част в зависимост от избрания интерпретатор. Определя се множество от правила които са релевантни, които формират множество, което може да е конфликтно.

- Избор на едно от алтернативните правила – в тази фаза се изразходва 85-90% от времето за работа.

- Прилагане на деиствието, определено от правилото- Проверка за край – достигната ли е целта или друго условие

Търсенето се извършва напред и назад.

При продукционните системи с търсене в права посока базата данни съдържа началното състояние на задачата. Търсенето се извършва с цел извеждане на хипотезата – следствие на правилата. При обратна посока, базата данни съдържа целта и търсенето се осъществява в посока от целта към началното състояние. Продукционните правила могат да се формализират със средствата на Prolog след като се дефинират операторите if, then, or и and. Това става като във файл standard.add се записва:

op(800,fx,if). // fx - префиксop(700,xfx,then). // xfx - инфиксенop(300,xfy,or). // 700 - приоритетop(200,xfy,and).

Page 10: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Предимствата на продукционните правила

- Естествен начин на представяне на правила- Позволяват модулност на базата знания – улесняма актуализация, четливост и

откриване на грешки- Отчитане на несигурността на информацията- Отделят се знанията от механизма за обработката им

Недостатък е при повишаване броя на правилата скоростта на работа се забавя.

СЕМАНТИЧНИ МРЕЖИ

Мрежовите модели позволяват в графична форма да се оказват релациите в моделите и явленията. Семантичните мрежи са разнообразни по форма и използване и позволяват добро графично изобразяване на връзките. Основавт се на предположението, че знанията се пазят в човешкия мозък на групи, свързани с множество връзки.

Обработката позволява няколко типа процедури:

- При въпрос към системата най-често се извършва търсене по образец. Въпроса се преобразува в подмрежа с възли по променливите, може да се запише като структура на пролог и да се свърже с конкретните факти

- Интерпретатора може да изпълнява логически извод върху семантичната мрежа, като тя се обхожда и се извличат свойства за обектите, неявно представени в нея

- Допълване на базата знания чрез обединяване на семантични мрежи. Отчита се съвпадението на възлите.

В семантичните мрежи съществува наследяването на свойства – ако се търси свойство най-напред се проверява за факт и ако липсва се проследява мрежата и се търси стойност за свойството в някой от класовете.

Предимства:

- Нагледност и модулност- Наследяване на свойства- Гъвкавост – лесно се дефинират нови връзки

Недостатъци:

- Не е достатъчно мощен модел (няма квантори)- Неопределена семантика- Те са твърде произволни структури- При много изключения могат да станат твърде сложни

Page 11: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ПРОЦЕДУРИ

Процедурите съдържат базата знания и обработката като едно цяло. Те представляват програми съдържащи знания за реагиране при наличие на определена ситуация, следователно включват механизъм за изследване на базата данни и нейното модифициране, понеже предпоставките за активирането им произтичат от промени или търсенето в базата данни. Управлението на процеса търсене на решение се предава от процедура на процедура в зависимост от текущите данни и не се прави търсене в класическия смисъл. Главното предимство е високото бързодействие. Главните недостатъци са затруднената корекция на базата знания и затруднено обяснение на резултатите. Прилагат се за алгоритмични знания имогат да се предвидят почти всички промени в базата от знания.

ПРЕДСТАВЯНЕ И ОБРАБОТКА НА ЗНАНИЯТА ЧРЕЗ ФРЕЙМИ И СЦЕНАРИИ

Фрейми – процедурно-декларативен модел

Фрейма е структура от данни, представляващ стереотипна ситуация. В основата им е представата, че човешкия мозък запомня порция информация, свързана с определена ситуация или понятие. От информационна гледна точка фрейма е йерархична структура от данни с няколко равнища – Име на фрейма на най-високо ниво, Полета с описание на обекта или група обекти (слотове), В слотовете могат да се въвеждат стойности (вкл по подразбиране), процедури или инструкции. Когато слото съдържа процедура, той съдържа инструкции за стартирането и. Декларативните знания са тези, които активират процедурните, а не обратното. При създаването на фрейма слотовете могат да бъдат празни, което значи че е важна структурата и от нея зависи до колко точно ще могат да се описват елементите по-късно. Конкретизирането на информацията довежда до създаване на екземпляр във фрейма.

Обработка на фрейми

- Съвпадение на структури- Изпълнение на включениет вав фрейма процедури- Наследяване на свойства и процедури

Предимства

- Съчетават процедурното и декларативното представяне на знанията- Използване на общи слотове от различни фрейми и слотове по подразбиране- Възможност за наследяване

Недостатъци

- Трудна разбираемост- Висъки ресурсни изисквания

Page 12: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Сценарии

Представляват модел за представяне на знания, описващ стереотипна последователност от събития. Използват се главно в системите за разбиране на естествен език. Включва следните компоненти:

- Начални условия, които трябва да са истини- Трябва да има резултати или факти когато сценария завърши- Предположения, които поддържат контекста на сценария- Роли – действията на отделните участници- Сцени

При сложни задачи се използва повече от един модел за представяне на знания, като предимствата са – моделиране на различни аспекти на проблема, преодоляват се ситуации без изход или с противоречиви изисквания и се подобрява вероятността за намиране на добро решение. За обмяна на информация се използва „черна дъска” която е глобална база от данни за облекчаване на взаимодействието между различни модели и за записване на междинни решения.

ПОДХОДИ ЗА ОТЧИТАНЕ НА НЕПЪЛНОТАТА НА ИНФОРМАЦИЯТА

Това е неопределеност, когато се отнася до съдържанието на информацията и неточност, когато се разглежда нейната истинност. Несигурността е форма на недостиг на знанията. Въпреки това човек може да прави заключения. Вземането на решение на непълни данни придава разумен характер на интелигентната система.

Класификация на подходите:

- Числови – използват количествена мярка за несигурностo Вероятностенo Коефициент за достоверностo Размити величини и размита логика

- Знакови – използват предимно качествена мярка

Еднакво информативни са както наличието на верни твърдения, така и липсата на знания.

Вероятностен подход

- Обективно и субективно схващане за вероятностСпоред обективното схващане вероятността представлява отношението между броя на случаите, когато това събитие е вярно и общия брой случаи.

Page 13: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Според субективното схващане вероятността се интерпретира като нечие вярване или събитие да е вярно.В интелигентните системи е по-подходящо субективното схващане, поради това, че са разсъждаващи обекти.

- Метод на Бейсo Безусловна вероятност (априорна) P(A)

Увереността, която се присвоява на дадено твърдение без да се изисква използване на някакво условие

o Условна вероятност (апостериорна)P(A|B) P(A|BC)Използва се за установяване на вероятност на твърдение А се отчита сбъдването на определенo събитие B.

Пр. на Бейс дава основание за разсъждение отностно несигурността в много интелигентни системи. То изразява, че вероятността на събитие B, което зависи от сбъдването на А може да се изчисли ако са извършени безусловните вероятности на А и B и условната вероятност на А в зависимост от B.

P (B|A )=P (A|B ) . P(B)

P(A )

Пример: Да се установи каква е вероятността един пациент да има менингинт ако е със схванат врат. Лекарят знае, че ако има менингит в 50% от случаите оплакванията са схванат врат. Безцел. вероятността някой да страда от менингит е 1:50000. Безцел. Вероятност човек да има схванат врат е 1:20. Нека S озн. твърдението, че пациента има схванат врат и M е твърдение той да има минингит.

P(S|M) = 0,5P(M) = 1/50000P(S)=1/20P(M|S)=[P(S|M).P(M)]/P(S) = 0,0002

Опр. Събитията А и В са независими (значението на едното не променя вероятността на другото), когато P(A^B)=P(A).P(B)

Опр. Събитията А и В са несъвместими (никога не могат да се случат заедно), когато вер. P(A^B)=0

Опр. Условна независимост на А и В при дадено С имаме когато P(A|B^C)=P(A|C) или P(B|A^C)=P(B|C)

Ако А и В са независими събития, вероятност от комбинации или се изчисляват като произволна на вероятност, т.к. предположение за независимост на събитията не може да бъде обосновано за коректност на заключенията при подхода на Бейтс , се изисква изчисляване на пълните вероятности включително обединението им. В много случаи такова обширно набавяне на данни не е възможно или е много скъпо.

Page 14: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ВЕРОЯТНОСТНИ МРЕЖИ (МРЕЖИ НА БЕЙС)

Определение: Съвм. вероятностно разпределение се нарича n-мерна таблица с mi

клетки и се изменя от 1 до n по всяка размерност (ако Xi има mi възможни стойности). Във всяка клетка се записва вероятността да съответното събитие (описващо конкретното състояние на предметната област). Т.к. отделни събития са взаимноизключващи се и таблицата съдържа всички отделни събития, то сумата от стойностите на всички клетки е 1.

Мрежите на Бейс се създават от инжинера на знание и представляват ориентирна графика за сбито (компактно) описание на зависимостите между променливите. Във възлите на мрежата се задават даваните величини, вързките, свързващи двойките възли задават ********-следствени връзки. Интуитивното значение на дъгата от възела Х към възела Y е, че Х оказва директно влияние върху Y. За всеки възел е дефинирана таблица за съвместно вероятно разпределение, което количествено определя ефекта от влиянието на „причинните” величини.

P(C)

P(A|C) P(B|C)P(A|┐C) P(B|┐C)

Обща процедура за изграждане на мрежите на Бейс в стъпки.

1. Избира се множество от подходящи применливи xi които описват предметната област2. Избира се наредба за променливите. Поради начина по който работи процедурата за

конструиране на межата на Бейс възлите оказващи директно влияние трябва да се включат в мрежата най-напред, т.к. те ще бъдат родители на всеки възел, върху който влияят. => коректният ред на добавяне на възли изисква най-напред да се поставят „причинителите” след това променливите върху които пряко влияят и така до „листата” възли които не оказват влияние върху други променливи.

3. Докато има ост. променливи се изп.- Избира се променлива xi и се добавя възел в мрежата за тази променлива- Установява се множеството родителски възли вече включено в мрежата, така че

изискването за целева зависимост да е изпълнено.- Дефинира се таблицата с условните вероятности за xi

Така всеки възел е свързан само с предходните възли от мрежата => конструираната мрежа на Бейс е ацикличен граф.

Видове извод в мрежата ан Бейс (МБ)

При дадени стойности на част от променливите да се определи вероятността на стойностите на друго подмножество променливи. Това може да става по следните начини:

от следствието към причината (диагностика)

C

A B

Page 15: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

от причината към следствието (предсказване) междупричинен извод (м/у причините за дадено следствие)

Компактност и наредба на възлите

МБ като правило са значително по-компактно предоставяне на знанията за областта отколкото пълните таблици за съвместно разпределение на променливите. Компактността на МБ е пример за едно от общите свойства на локално структурираните системи. В една такава система всеки компонент взаимодейства директно само с ограничително множество от останалите компоненти. Вместо с всички останали компоненти, локалната структурираност обикновено се свързва с линейна, вместо с експоненциална сложност. В случай на МБ е обуслано да се предположи, че в повечето области всяка променлива се влияе директно от неповече от k други. Ако за простота има предвид булеви променливи тогава за представяне на таблица за всеки възел ще са необходими 2k числа => цялата мрежа може да се зададе с помощта на n*2k числа където n е броя на възлите. Докато при предст. на пълното съвместимо разпределение се изисква изпълнение на 2n числа. Например нека имаме 20 възела (n=20) и всеки от тях има най-много 5 родителя (k=5)

20*25 = 640 (МБ)220 – пълно съвместимо разпределение

Основния недостатък на МБ е, че не може да се различи несигурността от незнанието.

Предимства на вероятностни мрежи са:

дават възможност да се отрази, че твърденията се влияят взаимно.

Изискванията за изчисление на пълните вроятности

Не може да каже какъв е резултата от кванторите и вероятностите Не е известно доколко вероятностите са подходящи за различни задачи Вероятността на събитята се определя субективно

МЕТОД НА ДЕМПСТЪР-ШАФЪР

При изменение на сигурността използва вероятности

Бейс: P(H) = 1 – P(┐H)

Демпстър-Шафър: P(H) + P(H доп.) ≤ 1

Разликата до 1 определяме степента на незнание

Коефициенти на достоверност. Правила за изчисляване

Един от най-разпространените подходи за отчитане на несигурността. При него към продукционните справки и фактите се доближават стойности в интервалите между [0;100], [0;1],[-100;+100] или [-1;+1]. Лявата страна на интервала задава абсолютна неистина, с дясната оказваме пълната сигурност. Коеф. на достоверност на конюнкция от твърдения е минималният от коефициантите. Коеф. на достоверност на дизюнкция е max коеф. Коеф. на достоверност(КД) на отрицание е равен на разликата между единица и коеф. на сигурност на

Page 16: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

твърдението. Сигурността на цялото правило се различава като израз на коеф. на предпоставка със сигурност на следствието.

Чрез КД се комбинират частични сведения на основата на мат. подходи. В много от ИТ продукционните правила се разглеждат само ако превишават определен праг на сигурност.

Разсъждение чрез теории на размитите множества

За обработка на размити понятия се използва лингвистичният подход, чиито апарат е теория за размитите множества на tadeh(Zadeh), 1965. Позволява да се предсавят в КС субективните лингвистични оценки на специалистите и така се отчита лингвистика от ест. език.

Лингвистична променлива се определя от:

Име Множество от нейните значения Област на значения Синтактична процедура за обработка на нови знания на променливата Семантична процедура за при*****ване на образувано ново значение на някаква

семантика

Размитото множество позволява формализиране на значенията на лигнвистичната променлива чрез крайно множество от числови стойности, които съответстват в определени степени на смисъла влаган в дадено понятие. Относно елементите на това множество може да се посочат случайни твърдения.

елемента принадлежи на дадено множество елемента не принадлежи елемента еринадлежи на дадено множество със степен на увереност P[0;1]. Изискват се

всички дроби между 0 и 1 за оказване на частична принадлежност

Понятието степен на принадлежност служи за обозначаване на степента на съответната на дадена стойност на лигвистична променлива на субективното значение влагано в нея.

S={10,11,…,40} съответства на размитото понятие „неголям запас от материали в склад” = A={10/0,1; 11/0,1; 12/0,1; …}

Функция на принадлежност – чрез нея се изразява графично степента на принадлежност на всяка от значение лигнвистична променлива на дадено понятие.

ИНЖИНЕРИНГ НА ЗНАНИЯ

(ЗА СИМВОЛНИТЕ ИНТЕЛИГЕНТНИ СИСТЕМИ)

Включва:

ЕКСПЕРТНИ СИСТЕМИ

Те са символни ИС. Едно от най-значителните постижения в областта на изкуствения интелект.Нова технология, чиято цел е да се повиши ефективността от изпълнение на компютърна техника чрез размисъл на обхвата на обработваните проблеми. Изпълнява се главно при

Page 17: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

подпомагане вземането на решение и консултации при сложни неструктурирани проблеми. Практическата реализация на ЕС се изпълнява от началото на 80-те години при конференция на КС, медицинска диагностика, геоложки изследвания, химически анализи.През 1969г. е създадена първата ЕС. Тя е в областта на химията. Създатели на тази система са Ледербенг, Фегербаум и Брус. Създават MYCIN – бактериална диагностика на кръвта.Система ПРОСПЕКТОР – археология -> открива запаси.

Опр: Интелигентна компютърна програма, която използва знания и процедури за извод, за да решава трудни и изискващи значителен опит проблеми.

Съдържат преди всичко индивидуалните емпирични знания на изявени специалисти в дадена предметна област, евристики, интуитивна и научна експерност.

Не съдържат:

знания от общ характер знания за разсъждение по аналогия и абстракция възможност за творчество, интуиция, въображение и др.

Главни достойнства на ЕС:

възможност за натрупване и гарантиране на знания дава висококачествени решения предлага напълно безпристрастно решение с отчитане на всички детайли изпълнява лог. извод за намиране на решение предлага обяснение на решението и др.

Критерии за обосноваността на разработване на ЕС

проблемът може да се реши с изпълнение на символични разсъждения отсъствие на човешки опит в ситуации, където той е необходим наличие на експерти, които са съгласни да сътрудничат и могат да изразят ясно своите

знания проблемът има променливи размери и граници не са необходими знания от тип „здрав разум”

Архитектура на ЕС

Към структурата може да вкл. :

БЗ

Механизъм за извод

Извл. назнания

Обяснение на решението

Интерфейс

Експерт, когнитолог

Потребител

Page 18: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

модул за самообучение редактор на БЗ за локализиране и корекция на грешки и за проверка

непротиворечивостта на знанията

БЗ – основна част от нея са знанията за предметната отбласт. Те са с най-голям обем и имат първокачествено значение за вземане на решение.

За представяне на знанията се използва 1 или няколко модела с цел да се обхванат всички аспекти на предметната област. Обикновено се включва средство за обработка на непълнотата на информацията. Най-разппространено средство са инструкциите за достоверност, а най-разпространено представяне е с продукционни правила.В БЗ се изпълняват знания от по-високо ниво – метазнания. Изпълняват се за избор на стратегии при търсене на решение или за „разсъждение” от по-общ характер. Важен метод за ускоряване е подреждането на знания. Например при правилата предпостваките се подреждат така, че най-вероятните отрицателни отговори или простите съответствия на истината да се проверяват най-напред. Редът на правилата, размерът на отсичаното множество, стойността на всяка проверка и др. се изпълнява за повишаване на ефективността. БД съдържа фактологията с която работи системата. Съдържа състоянието на предметната област.

Извод: Мощността на ЕС се обуслява на 1-во място от качеството на БЗ и възможност за нейното попълване и на 2-ро – от изпълнените методи ...

Предназначение е да избира и да предложи значение към текущо състояние на БД. Също така да осигури обосновка на решението, автоматичното натрупване на нови знания и служебна информация. В зависимост от изброения модул, механизма за извод е различен.

Механизъма за извод и механизъма за обрботка вървят заедно!

Когато се изпълнява, механизъмът за извод може да се обърне към потребителя и да запита за информация, което позволява прилагането на определено правило. Механизъмът за извод спира изпълнението, ако след изпълнение на поредното правило съдържа инструкции за спиране или ако се достигне до цикъл на обхождане на правилата, при които няма нови активирани правила. След спиране на работа на МИ се издава крайното заключение за решение на задачата.

Защо е необходимо обяснение на решението?

За убеждаване на потребителя в достоверността и т.к. в много случаи се изпълняват недостатъчно методи за откриване на решението

За обучение на потребителя За определяне на недостига от знания За локализиране на грешки в системата

Две възможни запитвания:

Защо е зададен определен въпрос; Проследява се дърво на извода нагоре.Процесът на логически извод в права посока обикновено се представя във вид на схем, която се нарича дърво на извода. В процеса на работата ЕС строи дърво на извода и го запазва в паметта си във вътрешна форма.

Page 19: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Как е достиганато заключението? Проследява се дърво на извода надолу.За отговор на въпроса „Как” се проследява дървото надолу, зада се види кои подцели са били удоволетворени за постигане на крайната цел. При тази организация за обяснение на системата, процесът на обяснение представлява обхват на дървото и се свежда до задачата за търсене.

ЕС от второ поколение

Изпълнява „дълбочинни” знания Осигурено е допълване на знанията за предметната област Решават задачи с динамични БД Немонотонни разсъждения

ЕС за работа в реално време. Изисквания към тях:

получаване на отговор за определено време разсъждаване за няколко асинхр. процеса да осигури пъпълване на БЗ да протоколизира своите действия да притежават интефейс за различни категории потребители защита на информацията и др.

Налагат два нови модела:

за моделиране на външната среда за възпроизвеждане на информация от външния свят

Налагат се промени във всички останали компоненти на ЕС.

Разработка на ЕС

ЕС имат цикъл на създаване, различен от традиционните системи.

Основни причини за това са:

Обект на обработка са знанията. Необходимо е да се запази специално значение на знанията, т.к. позволява да се разсъждава интелигентно. Интеративна оценка и адаптиране

Моделират процеса на експертиза. Моделира се процеса на експертиза, който се прилага за трудни задачи

Разработването на ЕС е обосновано на ранно прототипиране и постепенна модификация на кода. Не се цели създаване на крайния продукт. Целта на прототипа е да се апробират(?!?!) изброените механизми за представяне на знания. Да се осигури демонетрационен модел на бъдещата система и да се установи приемлива стратегия за извличане на знания от експерта.

Адекватността на прототипа е предварително обособена от извличането на знания, което когнитологът е изпълнил. Той създава концептуален модел на системата и избира модел за представяне на знания, който по-късно може да бъде променен. Концептуалния модел не е формална система и не може да се изпълни на компютъра. Той е междинно проектно решение. След това програмистът (в някои случаи когнитологът) създава прототипа на

Page 20: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

системата. Прототипът трябва да може да решава основни задачи от предметната област. Следва тестването и корекцията на грешки. При остраняване на дефектите БЗ нараства и се разширява. Ако прототипът работи коректно се превръща в завършена система. БЗ в нея продължава да се разширява при самообучението на системата и процеса на усъвършенстването й.

Основни групи за създаване на ЕС

1. Специализирани програмни езици – Lisp, Prolog2. Традиционни програмни езици – C, Pascal

За работа в императивен стил. Не са достатъчно изразителни. Не се гарантира точност. Или когато величините нямат количествени измерители. Съществуват разработки на ЕС на база традиционните програмни езици, но те са успешни поради процедурния модел на представяне на знания или поради програмиране на фреймите със стартиращи процедури в слотовете.

3. Специализирани програмни средиДобре развити средства за създаване на ЕС с възможен избор на модел за представяне на знания. Осигурява се обменът на информацията между моделите. Имат собствено обкръжение от програми за визуализиране и управление на изгледа. Оператори на знания, средства за откриване на грешки.Интефейси – CLIPS, KEE

4. Скелетни системи за създаване на ЕС

ПЛАНИРАНЕ НА ДЕЙСТВИЯТА

Основната идеяе да се определи последователност от действия за постигане на целта, започвайки от дадено начално състояние, с рационално използване на ресурси и избягване на опасните ситуации.

- Големият размер на пространството от възможни действия.

Разлицията между планирането и търсенето се дължат на:

- Особеностите в представянето на състоянията, целите и действията.- Спецификата във формирането и представянето на последователност от действия.

При търсенето всички действия се дефинират като оператор за преход. Оценъчната функция избира кой от наследниците е по-близо до целта, за да се приложат следващите оператори. Когато факторът на различ. расте и се прави сляпо търсене, изборът на подходящото състояние

БЗ

Генериране на обяснения

Машина за извод

Извл. на знания

Потребителски интефейс

Page 21: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

е сериозен проблем. Не може предварително да се отхвърлят част от състоянията и да се намалява времето за търсене.

Планиране:

- Действията по планирането се представят като предусловия и резултати.- Използва се формален език за представяне.- Чрез логическо разсъждение върху условията, може да се проследи вниманието на

едни действия в/у условията и да се направи избор.

Има специфика във формирането и представянето на последователни действия:

- При търсене – последователност от действия започват от началното състояние и завършват в целевото.

- При планиране – не е задължително съответствие между вил. на действие в плана и реда на тяхното изпълнение

Целите на ПС при планерането може да се задава в конюнктивна форма, т.е. задачата да се декомпозира на по-малки части и се строи подплан за постигането на всяка от тях.

Езикът STRIPS

Описват се:

- Състояния – представят се чрез конюнкция от матеряли- Цели – представят се също чрез конюнкция от матеряли. Допуска се използването на

променливи. Съществува важна разлика между целите, доказвани метода на рез. в Prolog и целите на планирането.При Prolog трябва да се отговори на въпроса дали целта е истина (логическо следствие) при зад. база знание. При планирането целта не е логическо значение. Трябва да се генерира последователност от действия които ако бъдат изпълнени ще променят БЗ така че целта да бъде истина.

-действие=идентификатор –зад,като предикат с или, самото действие и аргументи=списък от предусловия=списък от отпадащи литерали, след като се изп.действието=списък от добавени литерали след като е изп.действието.

http://www . cs . ubc. ca/labs/lci/Clspace/version4/planning Q STRIPS поддържа списък на целите

Основните методи на планиране се групират в два подхода:-планиране в пространството на състоянията;-планиране в пространството на плановете;

Етапи при обслужване на слушащата система:

Page 22: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

- Възприятие – представлява превръщането на съобщенията в низ от думи (разпознаване на символ, говорима реч) и др.

- Анализ – представлява четене на информационно съдържание на сиобщенията- Синтаксис

Обикновенно се извършва групиране на думите в йерархични структурио – фрази. Второ ниво в анализа е семантиката – уст. на значения на отделни думи и фрази. Трето ниво е прогматика – представлява поставяне на значения общуването (извличане на възможни полезни изводи от значението) в конт. на значенията на слушащата система.

- Усвояване – евентуално модифициране на БЗ или целите на общуващите системи в зависимост от отношенията им. Основният проблем е многозначността на информацията. Ти е х-но св-во на ест. езиковото общуване тайа че отстраняването и е един от основните проблеми на обр. на ест. език

Нива на многозначност:1.Фонетично – „петко_рита”2.Синтактично –„Ям макарони със сирене” и „Ям макарони с вилица”3.Прилагателно – „Знаете ли колко е часът?”4.Семантично – омоними

Ограничен ест. езикОграничени естествени езици се изв. най-често в следните 2 аспекта:

- Ограничаване на структурата на допустими фрази (опростяване на синтаксиса на езика)- Ограничаване на предметната област (създаване на езици за общуване в дадена тясна

предметна област) така се ограничава речникът на системата и се ограничава възм. Интерпретации на отделните фрази.

Различни 2 групи системи за обработка1.Системи, които не изп. Знание на семантиката на езика. В тази група попадат голям брой ранни системи от тип въпрос – отговор, както работят на базата на механизми в съпоставяне с образец.ELIZADOCTORSTUDENT

2.Системи за обрработка на огр. ест. език, които използват знания за семантика на езика. Най-често това са системи за решаване на задачи от определена предметна област, които са снабдени с ест. езиков интерфейс. При тях заявката се формулира като фраза или поредица от фрази – интерфейс (лингвист.) модул на с-ма анлизира заявката и на осн. на значениеята на системата трансф. в съответната команда на вътрешният език на интелигентната система.

Page 23: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

МАШИННО ОБУЧЕНИЕ (МО)

Определение – В Webster е записано, че обучението е процес на получаване на умения или знания.Мински - обучениетто е създадено на полезни промени в работата на нашият разсъдък (ум)Саймън – счита, че обучение е всяко изменение в системата водещо до подобряване на решението на задачата при нейното повторно поставяне или за решаването на друга задача на основата на същите данни. Машинното обучение се използва при взаимодействие с околната среда или при натрупване на опит в резултат на изменение на състоянието. При МО се решават 2 основни типа задачи:

- Създаване на определено В/И поведение – форм. това означава постигане на съответствие между множеството на входните параметри и множеството на изходящите параметри на системата

- Подобряване на качеството на решение на задачата – това означава повишаване на бързодействието или точността на резултата, понижаване на използваните ресурси и т.н.

За подобряване на поведението на системата съществуват роли играещи количество на нач. априорни значения, които системата притежава преди да започне обучението. Един от източниците на обучителните процедури е резултат от сензурната обработка. Съществената характеристика тук е че информацията трябва да е и в изобилие което позволява прилагане на комбинаторни алгоритми за обучение.

Според това дали в процеса на обучение се използва насочваща информация за коректността на резултата се разглеждат 3 групи алгоритми за обучение :

1. Обучение с учител (Super Visor) 2. Обучение без учител3. Подпомагано обучение

-1.- на обучаваната система се съобщава към кой клас се отнася даденият пример. Използва се при невронните мрежи

-2.- предполага се извличането на полезна информация при отсъствие на коректно класифицирани обучаващи данни. Системата започва да работи в следствие на външно назначена цел. Началният опит се обобщава в хипотези. След много тестове, ако хипотезата премине прага на доверие, след който се счита за сигурна, се създава ново правило. Правилата се формират като опитите се натрупват заедно в съответствие на тяхното подобие. За пол. на компонент на правило няколко подоб. на компонента от опитите трябва да се групират заедно в клас. Наборът от правила се разглежда като теория. На всяка стъпка разделената единица се сравнява с други близки единици , поддържани в коресп. бази от факти, правила и теории. Новата единица се разпределя в базата от данни кото се уст. отношения със свързаните понятия.

Page 24: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

-3.- този подход е близък до човешкия. При него ИС се разполага в определена среда и пол. обратна връзка от нея. Системата трябва сама да си изработи политика за обратна връзка.

При комп. се изпълнява изчислителен алгоритъм за max на ползваната при прехода на едно състояние в друго. Оценят се не само непосредствени резултати, но и последващите, както и случайно възникналите ползи.

Според начина на самообучение се различават системи с:

- Самообучение чрез наизустяване – най-примитивен тип машинно самообучение, аналог на ученето на изуст. Идеи: запазват се резултати от работата на системата (усл. на тежки трудоемки задачи и пол. решения) с цел изп. им наготово в случай , че постъпи подобна задача. В чистият си вид, методът не предполага никаква допълнителна обработка на тези резултати.

При редица задачи такова запазване чувствително подобрява работата на системата.

- Самообучението чрез макроопратори – идеята е както при предходното, но се предполага допълнителна обработка на съхраняваните резултати от работата на системата. Използват се най-често при планиране на действията. Пример: системата STRIPS има подсистема за натрупване на резултати от вече извършена от нея работа под формата на макрооператори. Всеки макрооператор представлява обобщен плаз за решаване на даден тип задачи и се състои от предусловие (обобщават същественна част от началното състояние при решаването на конретна задача за планиране), тяло (обобщение на конструирания от системата план) и следуслови (обобщение на целта) при решаване на конкретна задача за планиране.

- Самообучение чрез уточняване на параметрите – мн. ИС изп. оценяващи ф-ии, които са комбинация от ст-ти на подобрано множество от параметри, като всеки параметър участва със съст. коефициент оценяващата функция. При проектирането от прогр. на такива системи е трудно априори да се определят правилно теглата на всички фактори участващи в оценяващата функция. Един възв. подход е свързан с вкл. на на средства за модификация на тези тегла на основа на натрупан опит от работата на системата. Това е един от най-често използваните методи при разпределяне на образи и невронни мрежи.

- Самообучение чрез съвети – нека да предположим че съществува външен учител, който е заинтересован обуч. се система да научи нещо. Най-често учителят иска да каже на ученика не само че греши , но и защо. Същественият проблем тук е че учителят често не познава вътрешната структура на системата получаваща съветите. Подсистемата за разб. на естествен език трябва да може да съотнесе съветите към вътрешната стр. на обучаващата се система. Положителният съвет трябва да се операционализира чрез форм. на подходящи правила, промяна в изп. оценяваща ф-я и т.н.. Алтернативен вариянт е да се изисква от учителя да разбира точно момента в който съветът се търси и приблизително какъв да бъде неговият формат. Често обаче това е трудно изпълнимо.TEIRE-SIAS (MYCIN) играе голята на интерфейс към пол. на съвети от MYCIN.

- Самообучение чрез примери – тип МО, което се прилага при системи свързани със задачи за класификация. Класификацията е процес, при който от даден обект (описанието му) се пол. името на класа към който принадлежи този обект.

Page 25: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Класификацията е даден етап от решението на много задачи в областта на ИИ (изкуствен интелект). При създаване на системи за решение на такива задачи най-напред трябва да се дефинират класовете, с които ще се работи. Често е мн. трудно да се даде пълна и вярна дефиниция на отделните класовя в различна област, затова е полезно създ. на самообуч. се прогр. с-ми, които могат сами да изграждат деоф. на класовете. Задача за изграждане на деф. на класовете в известна като изучаване на понятия. Това е най-полулярният метод. Изпълняват се т.нар. обучаващи примери, които могат да бъдат положителни или отрицателни. Два примерни подхода при самообучение чрез примери са : подход на покриване и подход на отделяне

- Подход на покриване – целта на постр. на описание е те да покриват примерите (положителни примери за даден клас). По-точно за всеки клас се задава пълно множество от положителни обуч. примери (описание на обекти, принадлежащи на класа) и множество от отрицателни примери (описание на обекти които не принадлежат на класа, но приличат на обекти от положителни примери) изв. се обобщаване на положителни примери (така че полученото описание на класа да включва описанията на всички положителни примери) и ограничаване на отрицателни примери (така че описанието на класа да изключва описанието на отрицателните примери). Пример е ARCHES за класа на кубове.

- Подход на отделяне – целта е примерите за зададеният клас да се отделят от тези за други класове. Типичен представител на разделяща стратегия са класификацията на дървета.Всеки възел в едно класово дърво представлява даден атрибут, който се среща в примерите. Дъгите излизащи от даденият възел предст. различни стойности на този атрибут. ФОРМА

Кръг Триъгълник Правоъгълник Цвят

Червен Син

При конструиране на класификационн дървета, целта е да се построи компактно дърво с минимален брой разделящи възли (така се минимизира необходимият брой тестове/проверки). Така за предпочитане са плитките и силно разклонени дървета. Постигането на тази цел зависи от избора на добри атрибути. Критерий за качеството на един атрибут е способността му да разделя множеството от примери на групи от еднородни примери. Форм. това се прави със използване на т.нар. инф.критерий.

- Самообучение чрез обяснения – идеи: при самообучението чрез примери е съществено на голям брой обучаващи примери. Тук целта е обратната – да се минимизира множеството от обучавани примери като по възможност се използва един (+ и на основание на доп. знание на предметната област се костр. обяснение защо той е пример за различно понятие. Чрез обобщаване на обяснението се получава описание на различни понятия. Най-същественото при този подход е изп. на знания за пред.област което е характерна черта отличаваща го от всички останали.

Page 26: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ЧИСЛОВ ПОДХОД (ЧП)НА ИЗГРАЖДАНЕ НА ИНТЕЛИГЕНТНИ СИСТЕМИ

Обработват се неявно представени знания.Мозакът може да възприема 4 милярда бита информация за секунда.Биологиченият неврон се състои от:

- Дендрити- Аксони- Синопс

При моделирането на биологични системи не се постига забавяне и не се моделират определени процесина синхр. , не се отчита ...... на неврол. .....

В резултат на опростяването при изкуствен неврон се генерира само 1 изходен сигнал и се ...... реално подаваната информация.

Изкуствените невронни мрежи (НМ) силно приличат на естествените.

Определение : НМ са изч. модели изградени от множество процесорни елементи (неврони), всеки от който изпълнява прости числови операции и обменя резултати чрез претегляни връзки.

Невронът се състои от:

- Множество от връзки, всяка от които се характеризира с тегло. - Сумиращ блок за входните сигнали.- Активационна функция за ограничяване на амплитудата на сигнала на изхода от

неврона [ 0 , 1 ] , [ -1 , +1 ].- Отклонението bias – има за задача да се поддържа входното ниво за активационната

функция (в случай че останалите сигнали са слаби или липсват).

НМ наподобява мозъкът поради:

- Знанията се натрупват в мрежата чрез процес на обучение - Връзките между невроните известни като синоптични тегла се използва за запомняне

на знанията

НМ са много устойчиви, не се влияят от малки грешки.

НМ могат да моделират всеки процес,колкото и сложен да е той. Моделират не само линейно и нелинейни зависимости , както и имат възможност да научават тези връзки директно от данните,които моделират.Те могат да обработват непълна и неточна информация.

Основно изчисление:

net=∑ ( xi ,wi ) , за i от0доn

Out=f (net)

Page 27: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Aко теглото (w) е 0,5 това означава, че само половината от сигнала се получава в неврона.

Out = 0 , ако net < T

1 , ако net ≥ T

Най-често изпълнявана функция е сигмоидната – смесена и симетрична.

Смесена → Out=1

1+e−net

Симетрична → Out=1−e−net

1+e−net

Kласификации на Невронните мрежи :

Неврони със смесени прагови функции имат практически предимства като:

- повишена устойчивост към изв от страна на отделни елементи.- невронът може да изпълнява по-сложни логически функции от , , , което обезпечава

реализацията на зададената логическа функция с по-малък брой елементи (така се намаля обема на проектираните устройства)

Основният недостатък на праговия неврон е недостатъчна гъвкавост при настройка на мрежата.Ако net незначитително не достига за даден праг ,то изходния сигнал не се формира.Това означава,че се губи интензивността на входния сигнал на даден неврон и се обработва невисока стойност на изхода му.

Линейни функции – линейният участък в тях позволява да се работи с непрекъснати сигнали.

Сигмоидна функция-разпространена в практически използвани системи.

Архитектура на невронните мрежи(НМ)

НМ е система от обработващи елементи (неврони), организирани в слоеве. В зависимост от това откъде получават данни и накъде ги насочват,невроните съответстват слоевете, които те съставляват от се делят на входящи, скрити, междинни или вътрешни и изходящи. Входящите неврони получават сигнали от външната среда и ги трансформират към скритите или изходящи неврони. Невроните от скритите слоеве са „посредници” при обработката на данните, не правят контакт с външната среда, а само получават информация от други неврони, те се явяват ключа за изучаваните структури на данните и основните зависимости между изходящи и входящи неврони.

Наличието на поне един скрит слой е индикатор за нелинейност на изучаваната функция,а силата на НМ е в способността да разрешават проблеми ,които са твърде сложни за традиционните методи и такива,които нямат или е трудно да се намери алгоритмично решение НМ без скрити неврони(слоеве,са подход за моделиране на линейни функции).От

Page 28: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

теоретична гледна точка НМ с един междинен слой и подходящ брой скрити неврони в него са в съотношение да апроксим...

Двуслойните НМ притежават само входящ и изходящ слой. При многослойните входния и изходния слой са разделени най-често от два или повече вътрешни слоеве.Изходните неврони получават вече преработената от скритите или входящи неврони информация и генерират резултата на системата.Невроните в рамките на мрежата са свързани чрез бръзки наречени тегловни или синаптични тегла .

От подредбата на невроните в системата и връзките между тях до голяма степен зависят обработващите способности на НМ.В научната литература са познати две основни фактологии на свързване на невроните в мрежата:

1. НМ с право разпространение2. НМ с обратно разпространение на сигналите като вторите се наричат

рекурентни.

1. Характеризират се с еднопосочни връзки между невроните от отделните слоеве.Сигналите се движат от входящия през скрития към изходящия слой. Повечето НМ от този тип са пълно свързани,т.е. входящите им неврони с всички неврони от следващия скрит слой, а те на свой ред с всички неврони от следващия или изходящ слой.Пример за права мрежа е прецептрон.

2. При тях освен прав информационен поток се наблюдава и обратен.Възможно е и връзка между невроните в рамките на един слой , това са НМ с междуслойни двупосочни или вътрешно-слойни връзки.Благодарение на своята архитекрура рекурентните НМ имат потенциала да моделират най-пълно човешкия мозък.Пример за такива мрежи са мрежите на Хопфийлд

Според типа на връзките между вход и изход данни.Съгласно този критерий се разграничава авто-асоциативни и хетероасоциативни НМ. Автоасоцуативните се характеризират с един и същ входящ и изходящ вектор за разлика от хетероасоциативните,при които входящия и изходящия вектор са налични.

Обучение на НМ – сред основните характеристики на НМ.Според подхода на обучение мрежите могат да бъдат:

- обучени с учител-неговата същност се състои в запознаване на мрежата с и изследван проблем с указване на начина на неговото разрешаване .Това означава ,че правилните (желаните) стойности на изхода на мрежата са известни предварително,а процеса на обучение се реализира съобразно редуктора на грешката,изчислена като разликата между правилната и изведената от НМ стойност.Или НМ се обучава като изпълнява наредените двойки входящи-изходящи стойности.

- без учител- характеризира се със следното:НМ получава информация за изучавания проблем,но не и за резултатите => мрежите се обучават само на основа на входящите наблюдения.Търси се отговор на въпроси като:

Page 29: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Каква е степента на вътрешното сходство и разлика между данните и как са обвързани данните.Най-известните обучаващи се без учител НМ са мрежите на Кохонен.- състои се от 2 нива: входно и изходно. Често изходното ниво се представя като двумерна повърхност – карта. Всеки изходен неврон е свързан със всеки входен. По време на обучението всеки входен пример се сравнява с тегловната структура на всеки изходен неврон.Изходния неврон, чието тегловна структура прилича най-много на входния, пример се нарича победител, теглата на неговите връзки леко се настройват към стойностите на входните. Изходни неврони в съседство с победители също се настройват, но в по-ограничена степен. Така мрежата клъстеризира образците базирайки се на взаимната им прилика. Чрез представяне на класификатор на Картър разпределението на образците може по-добре да се визуализира за потребителите.

- Подпомагано обучение – НМ използващи подпомагано обучение разполагат с конкретни наблюдения характеризиращи проблема, но в началото нямат неговото разрешение. Обучението се извършва въз основа оценката на изходящи стойности от мрежата.

За да се получи достоверен резултат от НМ са необходими подбрани примери по проблема наречени обучаващо множество.При обучението с учител множеството представлява комбинации от конкретни статистики за наблюдаваните беличини и съответният им резултат.Обичайна практика е наличните данни да се разделят на 3 части.

- извадка за обучение(тренировъчно множество) – съставено е от наблюденията (примерите) на основа на които ще се извърши обучението

- валидираща извадка – служи за проверка на обобщаващите способности на обучените невронни мрежи. Служи и за избор на момент за приключване на обучението и за избягване на тъй наречените свръхобучения

- тестова извадка – обхваща най-актуални примери за наблюдавания проблем и служи за оценка и сравнение между различните архитектури НМ.Тясно свързани с проблема за разделянето на извадката на части е проблема за пропорцията

Повечето автори основават работата си на следните правила :

- 70% - тренировъчна част- 30% - тестова част

Други разделят това отношениа съответно на 80% на 20%. Обикновено тренировъчната част се разделя вътрешно на тестова и валидираща като са 80% - тренировъчна и само по 10% - за тестова и валидираща.

Обучението е процес, при който мрежата автоматично извлича функционална зависимост от входните данни.

Обучението включва следната последователност от действия:

- Първият пример от тренировъчното множество се подава на входа на мрежата и се получава изход, който обикновенно е далеч от зададеното условие в примера като

Page 30: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

верен резултат, защото е изчислен на база на текущото състояние на връзките (първоначално всички тегла в мрежата са произволно избрани).

- Сравняват се получения и желания изход – в зависимост от размера на грешката, теглата на всички връзки се настройват така, че отклонението да се намали.

- Процесът продължава със следващите примери и продължава докато се минимизира грешката или се постигне поставенатацел. Когато обучителният процес приключи, мрежата е готова за използуване. Постига се стабилно състояние-конвергенция, при което теглата вече не се променят, а мрежата е способна да отговаря на непознати примери вярно. В процеса на обучение трябва да се следи промяната на повърхността на грешката и всяка възможна конфигурация от тегла, определяща точка от тази повърхност.

АЛГОРИТМИ ЗА ОБУЧЕНИЕ НА МНОГОСЛОЙНИ ПЕРЦЕПТРОНИ

Делта правило – обобщен алгоритъм на обучение. Използва се за мрежи с непрекъснати активационни форми. Логиката е да се намери с каква делта (стойност ана промяна) трябва да се коригира теглото, за да се намали стойността на грешката.

∆ wi=η (di−Out ) . xi

w inew=w i

old+∆w i

Out → фактическият изходd i→ целевият изходx i → входните значения на i-тия неврон

Обучение на перцептрони чрез спускане по градиента

Този метод е един от най-използваните за обучение на невронни мрежи. Основава се на задаване на оценъчна функция, която измерва грешката в работата на мрежата и е деференцируема функция на теглата. Целта е да се намери такова множество от тегла, които минимизират грешката Е.

∑ 12.∑

i

n

(di−Out )n , където :

Out=f ¿

Името на метода произтича от градиента, който определя наклона на функцията във всяка нейна точка. Във всяка възможна конфигурация на тегла се определя се определя точка от повърхността на грешката. С помощта на алгоритъм за обучение може да се намери посока на промяна на теглата върху тази повърхност, в която да се постигне най-бързо намаление на функцията на грешката.

Нека оптималното тегло е W*. Тъй като не е известно къде се намира то, се започва от произволно избрано тегло W0. За да се открие в каква посока да се направи стъпка за промяна на теглата за намаляване на грешката “е” се използва производната на тази функция, изразена като допирателна в съответната точка. Тя дава информация за наклона на функцията в

Page 31: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

текущата точка. В точка Wo ъгълът е тъп и оттук tg<0 производната на функцията е отрицателна. За да се достигне оптимума е необходимо движение в положителна посока. В точка Wi производната е положителна, затова за да се достигне до оптимума трябва да се направи стъпка в отрицателна посока. Затова се прави избор за достигане на минимума на функция Е. Започва се от произволна стойност на аргумента, изчислява се производната на функцията в тази точка и се прави стъпка в обратна на знака на производната посока. Големината на стъпката трябва да бъде пропорционална на големината на производната като големината се изчислява по следния начин :

∆ wi=−η ∂E∂w i

winew=wi

old+∆wi

Скорост на обучение – определя големината на стъпките на промяна и скоростта на достигане на минимума на функцията.

Спускането по наклона е бавно, ако коефициента е с по-малка стойност и може да се колебае ако тази константа е с много голямо Е. Може да попадне в локалния минимум. За изваждането от този локален минимум е важно как ще се изберат началните тегла, например подходящи начални тегла са на стойност около 1/ √қ i , където кi са източниците на информация за неврон i. Обикновенно не е явно дали невронната мрежа е попаднала в локален минимум. Това се следи по изменението на грешката – ако тя не намалява с повече от 1% за 100 корекции на теглата, то считаме че сме в локален минимум. Един изход от тази ситуация е да се добави един скрит слой неврони към невронната мрежа. Процесът на обучение продължава докато се промени размерността на пространството на теглата и следователно на повърхнината на грешките.

Алгоритъм с обратно разпространение на грешката

Използва се за обучение на многослойни перцептрони. Прилага се делта правилото. По същността си дава описание за промяна на теглата на всяка права в невронната мрежа. Използва се на 2 етапа:

1. На входа на мрежата се подава сигнала на първия пример. При преминаването в права посока се получава изход.

2. След сравняване на изхода с целевите стойности се установява грешката и се коригират теглата на връзките в обратна посока.

Търсят се подходящи стойности, за които при даден вход ще се получават верни изходи. Активационната функция е :

ni=1

1+e−net 1, за i=1 ,…,B ,къдетоnet 1=∑ x jw1 ij

Изходът за невроните на външния слой:

Out j=1

1+e−net2, за i=1 ,…,C

Page 32: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Пресмятат се грешките на изходния слой, по формулата:

χ2 j=(d j−Out j )Out j (1−Out i ) , за j=1 ,…,C

Недостатъци:

- намалено бързодействие ,поради това че установяването на теглата в първия слой зависи от теглата във всички следващи слоеве.

Базови параметри за метода backpropogation:

1. скорост на обучени-learning rate2. инерционен параметър-momentum3. активационна функция4. толеранс на грешката-error tolerance

1. служи за контрол върху ∆W, тоест размера на промяна на теглата.Приема стойност между 0 и 1

2. Инерционният параметър също е между 0 и 1,предназначението му е да гарантира същата посока на изменение в теглата,както при последвала промяна.

3. Активационната функция е формула на основание на която се определя генерираният от всеки неврон изход. Чрез нея се определя степента на нелинейност.

Подготовката на НМ вид и избор на критерии за край на обучението.Най-често се изпълнява предварително зададено ниво на грешката или определен брой епохи (преминаване на всички примери за обучение на мрежата)

При регистриране на ръст на грешката във валидиращо множество.

МЕТОДИ ЗА ИНТЕРПРЕТИРАНЕ НА ОТГОВОРИТЕ

1. Победителят взема всичко – използва се при класификация. Броят на изходните неврони при него е равен на броя разпознавани класове и номерът на неврона с максимален изход се интерпретира като номер на разпознат клас.

2. Знаковата интерпретация - изисква логаритъм на основа 2м на неврона, като м е броя на класовете. Да допуснем, че у1, .. ум е съвк от изходни сигнали. Ако се заменят в тази последователност положителните числа с 1, а отрицателните - с 0, получената последователност от 0 и 1 се разглежда като номер на класа в двуична бройна система.

3. Размита интерпретация – основава се също на принципа победителя взема всичко. Изходните сигнали на невроните, които след мащабиране са в [0,1] могат да се разглеждат като функции на принадлежност към съответния клас. В този случай са възможни следните начини на интерпретация:- избира се клас, при който значението на изхода е максимално. Достоверността на

разпознаване се определя като разлика между максималния сигнал и следващия след него по стойност.

Page 33: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

- изхода на неврона се интерпретира като степен на увереност за принадлежност към един или друг клас, с указване на най-доброто съвпадение.

МЕТОДИ ЗА ПРЕДВАРИТЕЛНА ОБРАБОТКА НА ДАННИТЕ ОТ ТРЕНИРОВАЧНИТЕ МНОЖЕСТВА

В невронната мрежа се обработват само числови данни, но входните данни може да са текстови, графични, дати и затова е необходимо кодиране. В големите невро пакети се поддържат основни типове представяне на данни, например текстовите във формат ASCII, изображенията като .bmp и др. Всеки текстов елемент в EasyNN има числова стойност, която е сума от произведението на ASCII кода за всеки символ и позицията му във стринга. Намирането на най-близката асоциирана стойност за изходната колона при заявка се задава със серия вълнички. Една вълничка е най-близката и т.н.

По отношение на числовите данни – те се нормират така, че да бъдат в диапазона [0,1] или [-1,1].

[X min , Xmax ]→диапазоннапроменитена значениятанавходните променливи x

P=(X−Xmin )(b−a)(Xmax−Xmin)

+a

[a,b] – диапазон на приеманите входни сигнали

X – входен параметър, Р – преобразуван входен сигнал подаван на входа.

МЕТОДИ ЗА СЪЗДАВАНЕ НА НЕВРОННИ МРЕЖИ

При конструиране на НМ разработчикът има като правило следните изходни данни:

1. Размерност на вектора на входните сигнали.2. Размерност на вектора на изходните сигнали.3. Формулировка на решаваната задача.4. Изисквана точност на решаваната задача.

Разработчика трябва да определи още топологията на мрежата (брой нива, брой неврони в ниво), вида на операционната функция на невроните (често различна за слоевете), начин на задаване на теглата и метод за доказателство работоспособността на мрежата.

За решаване на задачата за избор на топология се използват следните методи:

1. Колкото повече неврони се зададат на междинно ниво, толкова по-надеждна е работата на мрежата, но и по-бавно е обучението. В процеса на обучение или при завършването му обикновенно се изключват неврони с малки тегла. Този подход е деструктивен и в повечето невропродукти има възможност за орязване на невроните с ниски тегла.

Page 34: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

2. Вторият подход е конструктивен. При него се построява мрежа с малко слоеве и малък брой неврони. В процеса на обучение броят на слоевете и невроните постепенно се овеличават с цел получаване на целевата грешка. Конструктивните методи са по-прости от деструктивните, осигоряват по-бързо построяване на топологията, но могат да се прилагат там, където не се изисква гарантиране на решението.

Деструктивните методи изискват пълнота на топологията на невроннат мрежа още в началото на изследването и се препоръчват като спомагателни, а не основни за търсене на решение.

КЛАСИФИКАЦИЯ НА ОСНОВНИТЕ ПОДХОДИ ЗА ОБУЧЕНИЕ ПО ПРИЗНАКА OFFLINE, ONLINE, КОМБИНИРАНО

Когато мрежата е Offline мрежата се обучава от множество данни в самата мрежа. При всяко преминаване мрежата се актуализира, за да подобри обучението си. Online обучението се разглежда като научаване на всеки пример поотделно докато системата работи и данните съществуват за кратък период от време. Тези методи са адаптивно обучаващи методи, които са типични за естествените системи. Използва се широко в роботиката, контрола на процеси и др. При комбинираното обучение системата първо работи в Online режим, след което превключва в Offline и т.н. – хваща се малък прозорец от данни, обучава се и след това се повтаря. Обикновенно процеса на обучение се изпълнява само веднъж, след което теглата се заключват и системата е готова за използване. Този тип обучение е най-разпространения, но съществува и друг подход, при който мрежата се учи непрекъснато в променяща се среда през целия период на съществуването си.

ПЕРЦЕПТРОНИ

Най-простата форма на невронна мрежа, използвана за класификация на образци. Първите са използвани 1957 г. от Франк Розенблат, като базовият модел е с еднослоен перцептрон. Идеята е развита към многослоен перцептрон. Обикновенния перцептрон е ограничен в разпознаване само на два класа. За да се получават конкретни резултати, класовете трябва да се линейно отделими. Линейно отделима задача е тази, за която може да се намери равнина в пространството, разделяща множествата от изходни резултати. Ако такава равнина не може да бъде построена, задачата не се решава чрез невронна мрежа от този тип. Архитектурата на перцептрона е много проста, за да може да риши линейни задачи. Доказателството, че отрицанието на еквивалентността не може да се реализира чрез перцептрон е дадено през 1959 г. Погрешно е прието, че това важи за цялата концепция. С включване на един междинен слой е възможно решаването на проблема. С многослойна невронна мрежа могат да се представят всички булеви функции. Всяка от тях може да се изрази като дизюнкция от конюнкции. Конюнкциите се реализират на скрито ниво, след което се обединяват с дизюнкции. Една важна функция на скритото ниво е да се добавят измерения в

Page 35: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

пространството на теглата. Добавянето на трето измерение позволява разделяне с двумерна равнина.

Предимства на невронните мрежи

1. Паралелизъм на работа за разлика от машината на Фон Нойман, поради това че повечето от клетките в паметта бездействат, а централния процесор комуникира с паметта и блокира временно входно-изходните устройства.

2. Адаптивност – приспособими са към всякакъв вид задачи, след преминаване на обучение

3. Способност за обобщение – обобщението е извличането на зависимости между входа и изхода

Недостатъци1. При големите невронни мрежи обучението е много бавно2. За сложните системи се изисква 3. Не може да се генерира обяснение за решението.

Проблеми, неподходящи за невронни мрежи

1. Програми, които лесно се описват с блоксхеми2. Дали е вероятно да се промени логиката на програмата – една от основните черти на

мрежата е способността и да се учи. Ако алгоритъм използван за решаване на проблема е непроменящо се правило, то няма причина за използване на невронна мрежа.

3. НМ не са подходящи, когато трябва да се обясни решението, поради неявните данни

Проблеми подходящи за невронна мрежа

Класификация, прогнозиране, разпознаване на образци и оптимизация са напълно подходящи. Проблемите решавани с моделиране на функции. При тях е необходимо да се определи изход при дадено множество от входове. Невронната мрежа изгражда модел, който открива тези връзки и в тази група попада широка област от проблеми – например определяне цената на недвижими имоти при дадено множество от величини или обучение за шофиране на кола, където входът е картината на пътя, а изхода – положението на кормилото и газта.

Практическа употреба на НМ

В биснеса се вписват в почти всяка негова област, но най-вече в сегментация на пазара. В одобряването на заеми оценяват риска за даване на заем. В оценката на недвижими имоти.

Page 36: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

НМ в софтуерните системи – в търсачките НМ могат лесно да се използват за семантичен анализ и извличане на характеристики от текст, поради което те са ценен инструмент при разработването на системи за търсене. По отношение на сигурността – системите за мрежова сигурност, където мрежовия трафик на компютъра се наблюдава и съобщава. С течение на времето мрежата изгражда модел за това, какво представлява нормална работа. Когато изникне нещо извън обичайното НМ го открива и системата го докладва. За разпознаване на образци НМ се справят по-добре от традиционните системи в области като компютърното зрение, разпознаване на реч и ръкопис, биометрични данни. В компютърните игри (например табла).

Друга група са в потребителските стоки – автомобили (контролни модули на двигателите, автопилоти), в пералните машини (използване на оптимизиране потока вода и перилни препарати), в мастилно струйните принтери (регулиращи мастилото), тостерите в Япония и др.

В медицината – най-вече при прогнозиране на лекарствени взаимодействия, спешната медицина, оценяване вероятностите за оцеляване и всякакви медицински диагнози.

ГЕНЕТИЧНИ АЛГОРИТМИ (РАЗВИТА В УЧЕБНИКА И ПРЕЗЕНТАЦИЯ)

Спадат към числовия подход – използват неявни знания. Базирани са на дарвиновата еволюционна теория.

Същност на генетичния алгоритъм – прост модел на еволюцията в природата, реализиран във вид на компютърна програма за решаване на дадена задача. Основните етапи са в следния ред:

1. В момент Т0 се избира популация за генериране на решение, като всички хромозоми се избират случайно

2. Изчислява се значението на критерия за годност (фитнес функция) на всеки член от популацията. Изчислява се и средната годност по същия критерий. Мярката за годност се изчислява като % между двете величини. Хромозомите с по-голяма стойност ще участват в процеса на възпроизводство с по-голяма вероятност

3. Избира се определен брой индивиди отговарящи на критеря за годност4. С помощта на генетичните оператори се създава следващо поколение, като новите

индивиди се получават като резултата от комбинация на свойства на родителите5. Заменят се индивиди от популацията с техни потомци, като се отчита критерия за

годност. Обикновенно се заменя фиксиран % от слабите индивиди, а в някой случаи се отстраняват някой от по-силните, като се очаква съхранените по-слаби да допренесат по-точно решение

6. Установява се период Т1 и се повтаря до постигане на критерий за годност.

Генетичното програмиране осигурява автоматично създаване на работеща компютърна програма чрез представяне на проблема на високо ниво. Генетичното програмиране постига целта на автоматичното програмиране чрез генетично размножаване на популация от компютърни програми с използване на дарвиновата теория. Главната разлика между

Page 37: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

генетичното програмиране и генетичните алгоритми е представянето на решението. Генетичното програмиране създава компютърна програма на LISP като решение. Избора му е продиктуван от това, че програмите и данните имат еднаква структура, което дава лесен начин за оценка и манипулация. В ГП индивидуалните членове на популацията не са стрингове, а програми, които след като се изпълнят са кандидати за решение. Програмите в генетичното програмиране са изразени като дървета, а не като линии код. Най-общият начин на записване на функция с два аргумента е инфиксната нотация. Друг начин е префиксната нотация, като този начин има предимства при изчисленията. При ГП функциите се записват като възли и аргументите им като листа. Поддървото е част от дърво, намиращо се под вътрешен възел на дървото. Ако това дърво се отреже от родителя си, вътрешният възел става коренов, а поддървото – валидно дърво. Налице е тясна връзка между тези дървета и S-изразите. Дърветата са само друг начин на записване на функциите. Процесът на избор на функции и терминални възли, необходими или полезни за намиране на решение е ключова стъпка при ГП. Обобщената процедура е следната:

1. Генериране на случайна популация от случайни композиции на функции и терминални състояния по проблема

2. Изчисляване на фитнес стойностите за всеки индивид в популацията.3. Използване на стратегия на селекция и подходящи репродукционни оператори за

получаване на потомство.4. Повторение на процедурата до намиране на желаното решение или постигане на

терминални условия.Създаването на потомство чрез крастоска в ГП е свързано с изтриване на фрагмент на

първия родител и вмъкване на фрагмент на втория. Произволно се избират поддърветата, които се обменят. Аналогично се работи за следващ член от потомството.

За мутация се използват най-често 2 варианта. Най-простият е заместване на функция или терминален възел от друга функция, а в други случаи цяло поддърво може да замести друго.

Генетичното програмиране изисква структури от данни, които е лесно да се поддържат и оценят и са гъвкави за структурна обработка. Ако наборът от функции не е достатъчно полезен, решението може да е много сложно или да не се намери. Както във всяка еволюционна изчислителна техника генерирането на първата популация е важно за успеха и. Други фактори са размера на популацията, процент индивиди, които участват в крастоска или мутация, максимална дълбочина на началните индивиди и максимална разришена дължина за потомството.

Недостатъци на генетични алгоритмиИзползването им е нежелателно в случаите когато е необходимо да се намери точният

глобален оптимум или когато времето за реализация на функцията е огромно или трябва да се намерят всички решения или конфигурацията е сложно

ПредимстваЗа бърза локализация на едно от оптималните решения

Еволюционните алгоритми са по-общо понятие от генетичните алгоритми. ЕА могат да включват освен генетичните алгоритми и генетично програмиране, еволюционно програмиране и .. Най-важната характеристика на ГА в сравнение с ЕА е техният фокус върху

Page 38: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

символни низове с фиксирана дължина. ГА могат да се отнасят за проблеми, за които няма хора експерти.

БИЗНЕС ИНТЕЛЕГЕНТНИ СИСТЕМИ

БИ(определение)

В управлението а информационните технологии все по-често се среща съчетанието БИ като съвкупност от подходи и инструменти за извличане на максимална полза от натрупаните данни.Счита се,че за първи път терминът:Business Intelligence(Dresner-Garther Group - `89)

Според много автори,това е технолгия,при която чрез траснформации и нареждане на данните в определен склад от данни се създават условия за анализ от страна на потребителите.Бизнес интелегентните инструменти анализират данните под Enterprice Resource Planning,Customer Relationship Management и Supply Chain Management,те са източник за бразуване на БИ.

Много автори констатират,че за БИ все още липсва строга дефиниция.

„Технология за интелигентно управление на бизнеса”Академик Попчев дефинира БИ по следния начин:съзнателна методологична транформация на всякакъв тип данни от всички налични източници в нова форма което предоставя информация ориентирана към бизнеса.

Инструменти за БИ:

1. Софтуер за мултимерен анализ:ОLАРВ по-широк смисъл ОLАР е синоним на Data warehousing, а в по-тесен се отнася до инструментите за мултимерен анализ. Както е изветно ОLАР анализът често се представят като многомерен куб и всяка страна от него представлява самостоятелна аналитична категория, като например региони, продукти, продуктови групи и т.н. Има видове ОLАР:

AOLAP(хибриден ОLАР)DOLAP(desktop ОLАР)MOLAP(multi OLAP)

2. Инструменти за извличане на закономерости от данни (Data Mining) представлява претърсване (прекопаване) на големи масиви от данни с цел да се намерят скрити модели ,връзки,интересни знания сред огромни количества с данни. Нуждата от Data mining, се появява, когато потребителските въпроси са твърде общи или неясни за разлика от работата с OLAP. Data Mining е етап от процеса на откриване на знания Knoledge Discovery.

При откриване на знания се прави опит за разбиране на приложната област, кои са основните величини в нея и кои са основните зависимости. Кои шаблони са вече известни. Определя се целта на процеса.

- Създаване на целево множество от данни-селектира се наборът от данни върху което се прави изследване

Page 39: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

- Почистване и предварителна обработка на данните.Решаване как да се подредят полетата с липсващи данни

- Редуциране и изхвърляне с цел броя на разглежданите променливи да се намали или да се намали друго представяне на данните

- Изпълнява се DM или тапет-Mining или Web –mining

- Резултатите от тези методи се представят в класификационни правила ,клътери,дървета и др.

- Сравнения и изор на модел измежду положителни резултати

- Интерпретация на шаблоните и възможното връщане назад към предходната стъпка за следваща итерация

- Действие върху изследваните знания-проверява се за конфликт между извлечените.

Множеството от техики ,които се основават на сравнителна оценка на положителни модели може да включва:

Bagging – класификация осредняване за коминирае на класификация от различни модели

Boosting – генерира различни модели или класификатори и дава тегла за да се комбинират тези модели в едно. Акогато типовете на моделите за много различни се прилага:

Stacking – вид обобщение

DM включва техники,като технология на БД,статистика,визуализация на данни,НМ,генетични алгоритми ,размити множества и т.н.

- OLTP средствата дават възможност за бърз ,последователен и интерактивен достъп до огромни обеми данни.Те са достъпни за рзличните заявки на потребителите

- Бизнес обекти –инструментите за изготвяне на справки и разчети с достъп до данните в складове от данни.Бизнес обектите представляват данните в 3 йерархични категории:universy класове ,обекти всички universy е набор от класове,предназначен за различни групи потребители.Класовете от своя страна представляват логическа колекция от обекти.Повечето класове кореспондират с таблиците в складовете .Обектите кореспондират със самите данни и азираните на тях изчисления. Бизнес обектите са много гъвкав инструмент

- Извличане ,трансформиране и зареждане. Извличащата функция чете данните и извлича желаното подмножество от тях. След това трансформиращата функция работи с предобитите данни, като използава правила или таблици за конвертирането им в желаното състояние. Зареждащата функция се използва, за да предаде крайните данни на целевата БД или осъществи миграцията на данните от една платформа към друга.

- Инструменти за заявки и отчети-отчетът се формира в различния достъп до данните,тяхното форматиране и доставяне.Отчетите са една от основние функции на БИ и когато се комбинират със Scorecards и Dashboards позволяват на потребителите да реализира специфичните данни с използването на ключовите метрики.Key Performance indicadors (KPI)

- Визуализация на данните –графично представяне напоказателите ,таблата и различни видове диаграми

Page 40: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

Balanced Scorecards – представлява управленска концепция, която позволява на мениджърите на всички нива да наблюдават резултатите в определена ключова област. Съществуват от 1992г. Целта на тези показатели е да фокусират бизнеса върху общ стратегически план като наблюдават неговото изпълнение. Основна използвана мярка са KPI.

Dashboard - едно ниво по-ниско то Scorecase, то е с по-слабо фоксирано върхустратегическа цел и по-силно свъзано със специфичните цели на предприятието. Ползите от таблата са, че бързо конвертират сложни корпоративни данни в смислени схеми, графики, мерки и други формати. Най-общо таблата са потребителки интерфейс, който представя и организира информацията по начи лесен за четене и възприемане. В многопрактически системи в основата на всяко табло са ключовите идикатори.

SAP,BI,Micro Strategy,Ms business ,Oracle BI и др.

ИНТЕЛЕГЕНТНИЯТ РОЯК

Искуствени адаптивни системи

Физически системи които имат способнстта да се адаптират на промените в основната среда. Статистическите системиза разлика от адаптивните нямат каквито и да е способности за самовъзстановяване и приспособяване в своята среда.Адаптивната система може да реагира на нови ситуации-нетествани, нито предсказвани техни детайли.

Основни естествени адаптивни механизми

1. Стигмерия – индиректна комуникация между компонентите на адаптивната система Отличава се с 2 особености :

- физическо естество на депозирае на информация чрез оставяне на следа от някакъв вид субстанция

- локално естество на депозираната информация,което означва ,че информацията еразделена по отделните състояния и е достъпна само за агентите ,които посещават състоянията

Съществуват два вида стигмерия:a. Количествена стигмерия – среща се при мравките и представлява следа от

феромон, който е химически непостоянна субстанция. Трайността е между 30 и 60 минути, а честотата на маркиране е 5 белега на 20 см. Важно е количеството на депозирания феромон, видът му за предупреждение или за намерена храна, освен това скоростта на изпълнението и концентрацията на феромона.

b. Качествена стигмерия – реализира се чрез стимулиращо условие за работа. При нея насекомите променят своето поведение в отговор на опростени стимули. Например поведението на „социалните оси”. Гнездата на осите са изградени от клетки. Всяка оса получава качествени стимули да не гради гради там, където има 1 клетъчна стена и да се премести място, където 2 или 3 стени са налични. Продължават да се строят само тези клетки, които образуват успоредни редици с радиална или двустранна форма около първоначалните клетки.

- Съгласувания на позиция и скорост при пасажи от риби и ята от птици

Page 41: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

- Производство – процес, при който организмът е способен да произвежда себе си и другите от този тип.

Интелигентния рояк притежава следните основни свойства:- Агентите са прости единици – нямат интелект- Използва се индиректна комуникация между тях- Поведенията са устойчиви- Работи се без централен контрол, без определен модел на средата, но е налице

способност средата да бъде променена- Положителна обратна връзка – повечето мравки по определен път увеличават

средата на феромона и привличат повече мравки. Така дадения път се маркира като предпочитан

- Отрицателна обратна връзка – премахват се лоши и стари решения чрез изпарение на феромона. Той има по-малко време за изпарение при по-близки решения

- Многочислени взаимодействия – отделния индивид не може да разрешава нито една задача. Решението се получава само при колективно вземане на решение.

В началото мравките се разпределят по равно във възлите на една абстрактна мрежа с N-брой точки. Разстоянието между точките - dij

Да се намери затворен път, който минава през всяка точка и завършва в началната точка и който има минимална дължина. Задачата може да се представи, чрез пълно свързан граф(V, E), където V е множеството от точки, а E – множеството от възможни дъги между тях. Движението на мравките се основава на следното вероятностно уравнение:

pijk−вероятност за преходотточкаi къмточка j , за k−тата мравка

pijk=¿

τ ijα . ηij

β

∑ τ ikα . ηik

β , ако k∈ A k

0, в противен случай

Ak=(V−tabu−k )Ak−множествотоот разрешените в даден моментточкиV – всички възли в мрежатаtabu-k – списък от забранени точки

Коефициентът е количеството феромон, - евристичен коефициент, като целта е да се управлява съотношението между интензивността на следата и видимостта.

nij=1d ij

Видимостта не се променя.

Вероятността за преход pij е компромис между видимост и интензивност на средата. Видимостта изисква по-близките точки да се избират с по-голяма вероятност, докато интензивността изисква да се извика дъгата ij, която е с по-голям трафик.

tabu-k →за да се ограничат мравките, да не посещават вече посетени точки, с всяка мравка се асоциира структура от данни tabu-k – наречена tabu списък. В рамките на един тур, мравките не могат да посещават 2 пъти, коя да е от точките.

Page 42: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

∆ τ ij−количеството субстанции отk−татамравка в зададенияинтервал отвремесеизчислявапо формулата:

∆ τ ij=QLk,токите на единтур ,мравките не могатдапосещават 2пъти ,коядае отточките .аструктураот данниокатоинтензивно

където Q е константа, а Lk е дължината на направената обиколка от k-тата мравка

τ ij ( t+n )=ρ . τ ij (t )+∆ τ ij ,0<ρ<1

Количество изпарена субстанция

След като пътят на мравките е завършен, дъгите са сумирани като дължина на пътя и е отчетено изпарението на феромона, алгоритъмът се пуска отново. Tabu списъкът се изчиства и дължината на пътя се нулира. Мравките отново се движат по мрежата в съответствие с вероятността за избор на дъга по формулата. Процесът продължава до моментът, в който при ... стартирания не се отчете ∆-тия в намерения път. Избира се най-краткия път, който е и решението.

ИЗКУСТВЕНИ ИНТЕЛИГЕНТНИ АГЕНТИ (В УЧЕБНИКА И ПРЕЗЕНТАЦИЯ)

1. Разпределен ИИ

Масачузетски институт 1989 е домакин на първия семинар по разпределен ИИ. Посветен е на въпросите, свързани с интелигентното решаване на задачи от системите. Интересно е как могат да се координират отделните единици, при решаване на проблеми, изискващи знания и опит. Една от основните тези е, че интелигентното решение не изисква централизирано запазване на знанията и тяхната обработка по обща схема на избор. Необходими са интелигентни системи, взаимодействащи си, където всеки елемент отговаряа за решаването на задачата. Тъй като елемента е ситуативен е възможно контекста на решение да се пренесе във взаимодействащата среда. Това дава възможност системата да обработва задачата индивидуално, без да знае общото решение.

Изследванията по проблемите на разпределения ИИ са свързани най-вече с ограниченията на класичиския ИИ. Основна теза в класическия ИИ е, че е възможно да се моделират процеси, като се приеме идеята за централизирана интелигентност и автономност на машина, ползваща всички ресурси. Това води до следните ограничения:

1 – системата се нуждае от огромен набор от знания за решаването на задачата, водещо до по-големи изисквания.

2 – системата трябва да се препрограмира за да може да взаимодейства с нови източници или с друг модел

3 – възможно е достигане до състояние без изход, поради липса на взаимодействие с други системи

Целта на разпределения ИИ е създаване на система, която свързва отделно създадени сътрудничещи си агенти, функциониращи като група на ниво по-високо от нивото на всеки от членовете. Предимствата са:

Page 43: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

1 – възможност за паралелно решаване на проблеми, които са прекаленно сложни за един агент поради липса на ресурси и поради риска.

2 – възможност за взаимовръзка със съществуващите програмни системи. Поддържането на съфтуера в синхрон с постоянно променяните бизнес нужди налага периодично обновяване на съществуващите системи. Пълното пренаписване на софтуера за реализиране на връзките е твърде скъпо, а понякога и невъзможно. Единственият начин наличните системи да останат използваеми е да се включат в общност, в която да могат да се експлоатират от друг софтуер. Обединяването в общност може да стане чрез използването на интелигентен агент.

3 – решаване на разделени по същността си проблеми. Те изискват информазция от разпръснати източници и решения, където знанията са разпределени.

4 – постигане на по-висока скорост на работа, поради използвания паралелизъм.

Ключова концепция на разпределения ИИ са софтуерните агенти

2. Модел базирана система и понятие за агент

Понятието агент има широк семантичен обхват. В общия смисъл това е обект, който възприема и модифицира средата, в която е поставен.

Дефиниция (в презентацията)

FIPA – фондация за интелигентни агентни системи

Агент базирана система (в презентацията) – системата е декомпозирана на хардуерна и софтурна среда, като специализираната среда .. абстракция между агентите или връзка с по-долните нива. Платформата осигурява по-общата инфраструктура, където средата и агентите могат да се създават. Тя се състои от ОС, компилатори и драйвери. Изчислителните процеси на агентите осигуряват вътрешно механизми за изпълнение на задачите на софтуера и хардуера. Много агентни реализации изискват големи библиотеки и модули код. Хостовете са изчислителните устройства, върху които се реализират агентите. Могат да се включват и различни сензори. Инфраструктурата на агентната система осигурява контекста на съфтуерната среда и основните и услуги. Тя обосредства агентите с външната среда. Физическият свят включва физически компоненти като мрежови връзки между хостовете, както и изчислителни елементи. Като входящи устройства могат да се използват сензори, микрофон, клавиатура и др. служещи за възприемане на средата и потребителските команди. Сензорите могат да се групират в различни системи. Ефекторите са задвижващи механизми – хидро-, електро- и др. и служат за реализация на избраното поведение. Изходния резултат освен на монитор и принтер може да се предаде на друг агент или да задвижи ефектор. Контролера представлява .. и може да включва различни методи за обработка на знания. Знанието на агента е ограничено главно до текущите му задачи. Обикновенно той съдържа текущите му знания за средата, предишен опит, цели за постигане и наблюдения за текущата среда и самия себе си. Пример – инфобот – агент със задача извличане на информация за средата от разпръснати информационни източници. Агента трябва да останови каква информация да представи по заявка от потребителя. Той трябва да определи откъде да намери информацията, да я извлече и представи в подходящ вид. Необходимите знания са предварителните знания за средатата,

Page 44: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

типовете ресурси и как да се направи отговора; трябва да има предишен опит от търсене и цели каква информация да се намери и при какви цени, скороста на различните сървари и др. Инфобота може да открива информация, за която потребителя не знае, въпреки че го интересува. Когато даден агент започва работа, той трябва да се инициализира – отговаря се на въпроси къде съм, какво да направя първо и др. Ако няма отговор на подобни базови въпроси се активизират сензорите, за да знае какво да направи може да се избере цел от библиотека с задачи, да се зададе от външен източник или агента да си постави сам задача. След това започва решаването на задачата чрез определени методи.

3. Основни характеристики на агентите.

Агента се създава за да има определена функционалност, записана в интерфейса. Винаги действията са в полза и от името на потребителя (персонализация на агента)

3.1. Автономност – основна характерна черта, считана за обособяващ признак. Това е реализация на периодични дествия, спонтанно действие и инициатива, в които агента трябва да е способен за интелигентни решения с максимална полезност. Автономния агент се оправлява от индивидуалните си цели за постигане. Автономността не се свързва единствено с поведението, но и с разпределяне на ресурсите. Във връзка с енергията, пространството на работа и др. агента е относително зависим от средата. Способността му да ги оправлява намалява зависимостта му от външния свят и повишава ефективността. Ако агента използва само началните знания, без да се обучава от опита, то той не е автономен – агента е автономен в степен, определена от опита.

3.2. Рационалност – един от основните принципи. Агента избира и изпълнява действия, подходящи за генериране на поставените цели. За тази цел може да се въведе мярка за оценяване. Обикновенно е числова функция, която агента се опитва да максимизира. Тук се изчислява вероятността за дадени събития и ползата, която ще донесът за агента. Обикновенно оценяването се прави от проектанта или от самооценка

3.3. Самоубочение – на база собствен опит, примери или други информационни източници. При обучение с явни знания основна роля има инжинера по знанията. Чрез самообучението се стига до адаптивността на агентите.

3.4. Възможности за комуникация

3.5. Мобилност – реализира се чрез придвижване в мрежа за софтуерните агенти, а за роботите – чрез движения в реални среди. За софтуерните агенти миграцията е движение между компютрите, където се изпълняват конкретни задачи, след което резултата се връща в изходната точка, а агента може да се предвижи напред или да се върне.

Агентната технология трябва да се разглежда като развитие на обектноориентираната, защото начина на мислене е подобен на обектно ориентирания подход. Известно е, че обектът се характеризира с поведенческа и фактологична база, но обекта няма индивидуални цели, които да се стреми да постигне. Той не може да извърши действията, за които е взел решения. Чрез интерфейса на обекта се получават съобщения стартиращи обработката, но тя е само извикване на процедури. Агента не е обект – той използва знания, извършва действия, притежава сензори и др. Той може да откаже изпълнението на дадена задача ако е зает или

Page 45: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

няма знания за нея. Неговите методи са достъпни само чрез специален език за комуникация (таблица в презентацията).

Експертните системи са класически представители на символните ИС. Те обаче не са автономни софтуерни единици и не могат да изпълняват взаимодействие върху средата – те са пасивни ИС.

Предимства на интелигентните агенти

1. предоставят индивидуална и качествено събрана информация

2. автоматично обновяват базата си от знания при промяна на средата

3. имат по-голяма надеждност на информацията, поради намалената субективизация

4. намесата на програмиста по време на работата е незначителна

5. поддръжката на работата в индивидуално състояние не изисква много разходи.

КЛАСИФИКАЦИЯ НА АГЕНТИТЕ

1. Според архитектурата:

1.1. Рефлексни – (схема в презентацията) – агенти автомати. Те реагират моментално на определени условия от типа ако – то. Изпълняваните от тях действия са: четене на входните сигнали; интерпретиране; намиране на релевантно правило съответстващо на входния сигнал; избор на правилото; модифициране на средата чрез действие.

1.2. Рефлексни с вътрешно състояние - (схема в презентацията) – За да се избегнат ситуации на зацикляне и за да се запомня миналото на агента се добавя модул за вътрешно състояние в което се поддържат знания за това как се променя света и как действията му променят този свят. Тези агенти поддържат информация за миналото. Всяко действие се избира чрез правилата ако – то и чрез формиране на актуализирано описание на текущото описание. Текущото състояние се получава според текущото възприятие и регистрираното предходно вътрешно състояние. Определя се новото вътрешно състояние с използване на знанията за резултата от действията, както и за това как света се развива. Изпълнявани действия: четене на входните сигнали; интерпретиране; съчетаване на външните сигнали с вътрешното състояние; намиране на релевантно правило съответстващо на входния сигнал; актуализинане на вътрешното състояние с резултата от собствените действия и с независимите промени; определяне на ново състояние на средата.

1.3. Агенти с явно зададени цели - (схема в презентацията) – Тези агенти избират действията си така, че да постигнат целите си. Използва се принципа за рационалност. Те могат да формират подцели на зададената цел. При избора на действие не се използват правила. В зависимост от подходите за решения агентите са: логически, търсещи и планиращи (използват техники за планиране на действията, в които се включват и процедури от логиката и търсенето

Page 46: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

на решение). Основен недостатък на тези агенти е, че нямат средства за работа при конфликтни ситуации.

1.4. Агенти, базирани на полезност (прагматични агенти) - (схема в презентацията) – При тях авно се задава функция на полезност (заменя целите). Чрез нея се въвежда измерител на успеха под формата на число. Функцията на полезност определя освен степента на оспех за постигане на целите, определя относителната важност на конкретни цели.

1.5. Самообичаващи се агенти - (схема в презентацията) – Имат важна способност да се самообучават. Те използват възприятията си не само за определяне на подходящи действия, но и за подобряване на възможностите за по добра работа в бъдеще. Обучаващията елемент служи за успешното приспособяване на агента към определена среда. Той получава обратна връзка от модула критична връзка за това колко успешен е агента и как трябва да се адаптира. Модула критична оценка трябва да е независим, за да не може агента да го модифицира с поведението си. Генератор на решения – предлага действия за обогатяване знанията на агента. Задачата на модула е да генерира знания за самообучение.

При тях не се включват табличните агенти. Тук не може да се говори за автономност понеже се прави търсене

2. Според изпълняваните функции.

Агентите могат да функционират като мрежови агенти, агенти свързани с интерфейса и др.

2.1. Интерфейсни агенти – те подпомагат потребителя при работата с различни интерфейси, като предлагат по добри методи след „наблюдение” на потребителя (ако съществува повтарящо се поведение). Агентите се обучават чрез: наблюдение и имитиране на работата на потребителя (проследяване на действията на потребителя и запомняне на ситуацията, свързана с тях); обратна връзка от потребителя; получаване на преки потребителски инструкции; „обсъждане” с други агенти. С еволюцията на уеб базираната среда от статична хипермедийна към предлагаща различни нива скъпата система за поддръжка се заменя с агент базирани архитектури.

2.2. Информационни агенти - (схема в презентацията) – способни са проактивно да извличат информация от хетерогенни информационни ресурси. Разделят се в няколко групи: за търсене с общо предназначение; за специализирано търсене; неспециализирани програмируеми агенти. С изключение на интерфейсните агенти всички останали могат да бъдат мобилни.

2.3. ИА за електронна търговия – използват се 6 етапа в процеса на купуване – идентификация на потребности, посредничество, преговаряне, заплащане, доставка, обслужване на продукта и оценка. Агентите се използвата на трите първи етапа. При идентификацията на потребности се използват наблюдатели – непрекъснато работещи програми, които следят потоците от данни и предприемат действие при определено условие. Общата им цел е стимулиране на потенциалния куповаз за неосъзната потребност чрез информирането му за определена стока. При посредничеството за потребителите при избор на стоки има няколко агентни системи, които намаляват времето за търсене при куповача

Page 47: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

(personal logic, jango, t@t, firefly). Резултата е определяне на желаната група стоки чрез информация за продукта. От страна на търговците проблема е, че повечето от тях желаят решението за покупка да се основава не само на цената, но и на гаранционни условия, време за доставка, наличности и др. Преговаряне – повечето транзакции от тип бизнес към бизнес включват преговаряне. Активните агенти предлагат промяна на потребителските искания, а пасивните осигуряват само методи на потребителя да си промени спецификациите. По отношение на заплащане и доставка нивото е сигнал за завършване на преговорите и агентите могат да повлияят на евентуалните финални договорки.

2.4. ИА за контрол на процесите

2.5. ИА за авотномни превозни средства

2.6. Хетерогенни атенти и др.

МУЛТИАГЕНТНИ СИСТЕМИ (СХЕМА В ПРЕЗЕНТАЦИЯТА)

В реалния свят познанието и интелигентността са разделени и за решаването на задачите се използват знанията на различни експерти. Мултиагентните системи са свързани заедно единици, които работят заедно на ниво над индивидуалните им възможности. Интелекта в МАС се разглежда като възникващо явление а не е сума от интелигентните системи. Една МАС е съвкупност от среда, множество от агенти, множество от връзки, свързващи агентите и обектите, множество от обекти, асоциирани с позиция в средата, които могат да се създават, разрушават, възприемат от агентите, множество от операции и оператори, с задача да представят прилагането на операциите и реакцията на света в резултат на прилагането им. Ще шчитаме, че една МАС е изчислителна програма, блоковете за изчисление на задачата на която са разположени в някаква среда и всеки от тях е способен на гъвкави социално ориентирани действия, водени от цели.

Особенности на МАС

1. Всеки агент има отделна гледна точка. Има частични знания

2. Няма глобален контрол на системата. Агентите са автономни и разпределени и се грижат за удовлетворяване на своите цели самостоятелно или чрез кооперация

3. данните са децентрализирани

4. изчисленията са асинхронни

Базови измерения на сложността на МАС (схема и таблица в презентацията)

В архитектурата на системата агентите се разглеждат като взаимодействащи си единици, доставящи и използващи услуги. Необходимостта от механизми за търсене, представяне, актуализиране на интелигентни услуги довежда до специална група агенти, наречени посредници. Те позволяват да се работи надеждно при мобилност на агенти. Агентите посредници се класифицират като: улесняващи (удовлетворяват заявки от името на подчинени

Page 48: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

агенти); медиатори (използват наличните знания за създаване на услуги в приложения от по високо ниво); брокери (получават заявки и изпълняват действия, като ползват услуги от други агенти); тип жълти страници; тип черна дъска (получават и съхраняват заявки за обработка от други агенти). МАС използват някой техники на традиционните разпределени системи – напр. Алгоритми за разпределение на задачите. МА подход предлага по-общи характерни подходи с по-малка концентрация на вградените механизми, а прилагането на традиционните системи изпълнява алгоритми и точност. Общата среда са мрежите, но МАС не се осъществяват с мрежите, защото в отделните възли не се постигат цели и функции за удовлетворяване. Предимствата на МАС:

1. Успешно се прилагат при решаване на разпределени по природа проблеми

2. Намаляват се разходите за обработка, тъй като използването на един мощен процесор се работи с голям брой по-евтини.

3. Организационната структура на агентите е динамична

4. Разреша са взаимна връзка и работа на наличните ИС, мрежови протоколи и традиционни системи.

ВЗАИМОДЕЙСТВИЕ МЕЖДУ АГЕНТИТЕ (СХЕМА В ПРЕЗЕНТАЦИЯТА)

Взаимодействията се разглеждат като сума от поведение на агенти в динамична връзка, които се стремят да постигат цели при ограничени ресурси. Агентите си взаимодействат повреме на протичащи събития, когато се налага да се преодоляват проблеми за несъвместимост на целите, недостиг на ресурси за изпълнение на задачите. Те предават социален елемент на системите.

Основните механизми за координация са:

1. Взаимно регулиране – агентите са равнопоставени и поделят информация и ресурси за постигане на общата цел – при малки групи агенти

2. Директно ръководство – един агент има някаква степен на контрол и оправлява ресурсите и поведението им.

3. Координация чрез стандартизация – установяват се стандартни процедури, които се следват от агентите. При взаимно регулиране тези процедури се прилагат чрез удобрение, а при директиня – чрез задължение

4. Координация чрез сътрудничество – посредника действа като ръководещ

5. Координация чрез рефлексно поведение

От разгледаните 5 механизма само 1 и 4 позволяват автономност на системите.

Page 49: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

ПРИЛОЖНИ ОБЛАСТИ НА МАС

Структурираната информация има ясно изразена семантика и модел. Значението и е недвусмислено. Позволява да се идентифицират фрагменти от нея и да се правят обръщения към тях. Например структурирани са данните в базите от данни, електронните таблици и др.

Полуструктурираната информация – част от съдържанието на данните няма модел (структура), може да отцъства или да бъде маркирано като неизвестно или релевантно.

Неструктурираната информация – при нея липсва ясна семантика или модел на данните, които се изискват от приложенията, за да се обработи. Информацията е фрагментарна и представлява мултимедийни презентации, съобщения в е-поща, гласов запис и др. Неструктурираната информация е резултат предимно от комуникацията между хората. За да бъде обработена е необходимо да се добави модел (структура) към неструктурираното съдържание. За това се прилагат специални информационни технологии, включително от областта на ИИ.

Приложни области на МАС (в учебника):

1. Решаване на сложни неструктурирани възможности

1.1. разпределено решаване на проблеми – областта в която се работи не е разпределена а само режимат на решаване на задачата, разпределен в агентната система е разпределен. МАС могат лесно да управляват откриването и отговора на важна, критична във времето информация, която може да се появи внезапно във всеки от огромния брой информационни ресурси.

1.2. решаване на разпределени проблеми – подходът се характеризира с разпределяне както на експертността, така и на областта на работа на системата (примерно проблемите в телекомуникациите). Основните направления на разработките са свързани с управление на услуги, мрежови контрол, поддръжка на процесите и др.

1.3. разпределяне на техниките за решаване на проблеми. Обикновенно проблема е добре формулиран и всички данни са напълно достъпни. Всяка част от проблема обаче се обработва с различна техника.

2. Мултиагентна симулация – за разлика от класическите подходи чрез нея се участва в търсенето на подходящ модел, а не се ограничава работата само в изпълнение на модела и анализ на резултатите. МАС правят възможно интегрирането на количествени величини и поведение базирано на знания. Могат да се добавят нови агенти със собствено поведение, които да взаимодействат с вече наличните. Пример – пазарните процеси.

3. Създаване на изкуствени светове

4. Създаване на общества от роботи – разпознаване на емоции и реч

5. Софтуерен дизайн – МАС може да се разглеждат като основен модел за архитектурата на нови софтуерни системи.

Page 50: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

СОФТУЕРНИ СРЕДСТВА ЗА СЪЗДАВАНЕ НА АГЕНТНИ СИСТЕМИ

1. Езици за програмиране на функционалната структура на агентната система

1.1. За логическо и функционално програмиране – използват се главно за описание поведението на обекта. Използват се части от тези езици за обектно ориентирано програмиране на тези системи. Езици – Prolog, Lisp, Strips и др.

1.2. Традиционни езици от обектно ориентиран тип – използването само на този вид езици е недостатъчно, защото не може да се представи кооперирането между агентите и тяхното автономно поведение. Скриптови езици – главна причина за използването им е, че позволяват на агентите да изпълняват задачи премествайки се между различни компютърни платформи.

1.3. Актор езици – позволяват паралелни изчисления и се използват при програмиране на конкуриращи се компоненти.

1.4. Интерфейси между езиците – Kprolog позволява JAVA с двупосочен интерфейс към пролог. InterProlog интерфейс от пролог към JAVA.

2. Протоколи и специализирани езици за комуникация – KQML (Knowledge Query and Manipulation Language), KIF (Knowledge Interchange Format) и др. KQML е както език от високо ниво, така и протокол за работа със съобщения. Той е със специална линейна структура базирана на LISP. Съдържа примитиви от специални директиви за комуникация между агентите. Примитивите обхващат основата върху която се развива преговарянето между агенти. Обхващат се следните групи действия – добавяне на информация, задаване на директиви на определен адрес, потвъждение за изпълнение или изразяване на ментално състояние и декларативни. Предимството на езика се състои в това, че информацията необходима за разчитане на съобщението се съдържа в него. Той е независим от трансферната среда в която се използва. Протоколът дефинира следната структура:

(KQML - performative

:sender <word>

:receiver <word>

:language <word>

:ontotlogy <word>

:content <…>

….)

Аргументите могат да се подредят по произволен начин. Като резултат KQML формулира решение разбираемо за агентите които го използват.

Page 51: Вероятностни мрежи (Мрежи на Бейс)  Web viewmycin – бактериална диагностика на кръвта.Система

KIF е декларативен език, базиран на изчисления на предикати. Като синтаксис може да се опише чрез три нива – базови символи, комбинация от символи като думи, комбинация от думи като изрази. Могат да се включват и функции за числа, стрингове списъци. Езика е версия на предикатната логика от първи ред с разширения за поддържане на немонотонни функции. Описанията на езика включват спецификации на синтаксиса и семантиката. Записванията са подобни на записите от базите данни.

3. Платформи и шелове за създаване на агент базирани приложения – тези средства са създадени с езици като JAVA и др. – IBM Able (разпределена среда базирана на JAVA. Поддържат се обектно ориентирани техники, преносимост на кода, няколко нишки на кода и др.), JADE, ZEUS (разработена от British telecom – интегрирана среда за разработка на агенти с библиотека на JAVA), Open Source (платформа за създаване на агенти с отворен код)

4. Средства за описание поведението на обекта – UML както и мрежите на Петри.