Ремонт Стены Уход

Современные информационные продукты как результат инженерии знаний. Понятие инженерии знаний, основные принципы и подходы

Это краткий ответ на экзаменационный вопрос по системам искусственного интеллекта (все вопросы).

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Инженерия знаний нацелена на создание умелых компьютерных систем, целью которых является, во-первых, извлечь знания, которыми располагают специалисты, а во-вторых, потом так организовать их, чтобы обеспечить эффективное использование.

Подходы

Два основных подхода: преобразование знаний, построение моделей.

  1. Преобразование знаний - процесс преобразования и трансформации экспертизы и переход от знаний эксперта к программной реализации знаний. Считался основой разработки Knowledge Based Systems. Знания представляются в виде правил. Недостатки: невозможность адекватного представления разных типов знаний и неявных знаний, сложность отображения большого количества правил.
  2. Построение моделей. Процесс создания СИИ рассматривается как деятельность по моделированию, т.е. создание СИИ означает построение комп. модели, которая решает задачи в предметной области как эксперт. Модель не имитирует деятельность эксперта на когнитивном уровне, а позволяет получать тот же результат. Процесс создания KBS: создание модели предм. области, разработка методов оперирования моделью, методов лог. вывода на модели, оценка результатов моделирования.

Система - посредник, заключение договора на поставку.

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Knowledge system - система основанная на знаниях.

СОЗ СБЗ СУБД ЭС ИС СИИ - система искусственного интеллекта.

Структура системы, основанной на знаниях.

БЗ механизм получения решения

ИНТЕРФЕЙС

БЗ - это модель, представляющая в ЭВМ знания, накопленные в определенной предметной области. Эти знания должны быть формализованы.
Знания формируются с помощью модели, а затем представляются с помощью определенного языка.

В БЗ обычно выделяются знания о конкретных объектах и правила. Эти правила исполняются как механизм получения решений, для того, чтобы из исходных фактов вывести новые.

Интерфейс обеспечивает ведение диалога на языке, близком пользователю.

Методы, основанные на использовании логических выводов, часто используется в инженерии знаний.

Понятие предметной области.

Объект – то что существует или воспринимается в качестве отдельной сущности.

Основные свойства: дискретность; различие.

При представлении знаний используется прагматический подход, т.е. выделяются те свойства объекта, которые важны для решения задач, которые будет решать создаваемая система. Поэтому система, основанная на знаниях, имеет дело с предметами, которые являются абстрактными объектами. Предмет выступает в роли носителя некоторых свойств объекта. Состояние предметной области может меняться со временем. В каждый момент времени состояние предметной области характеризуется множеством объектов и связями. Состояние предметной области характеризуется ситуацией.

Концептуальные средства описания предметной области.

Концептуальная модель отражает наиболее общие свойства. Для того, чтобы детализировать описание нужны языки. Характерными чертами концептуальных средств описания предметной области являются абстрактность и универсальность. Их можно использовать для описания любой предметной области.

Понятие класса объекта.

Понятие объекта – понятие множеств. Сходные между собой объекты объединяются в классы. В разные моменты времени одному и тому же классу могут соответствовать разные множества объектов.

К – класс объекта.

Кt – множество объектов класса К в момент времени t.

Группа (1999) = { ИА-1-99, ИА-1-98, … , ИА-1-94, ИБ-1-99,…}

Группа (1998) = { ИА-1-98, ИА-1-97, … , ИА-1-93, ИБ-1-98,…}

(t Кt = { … }

Преподавательская должность = { профессор, доцент, старший преподаватель, преподаватель, ассистент}

1 4 Геометрическая фигура, форма квадрат, цвет синий.

(К: А1 К1, А2К2, … , АnКn) имя атрибут название классов классов объектов атрибутная пара

Идентификация объектов может быть прямая и косвенная. В случае прямой используются имена объектов, порядковые номера объектов; косвенная основана на использовании свойств объектов.

Атрибут может быть компонентом. Под атрибутом понимается свойство, характеристика, название компонентов.

(Геометрическая фигура: форма Геометрическая форма цвет Цвет)

Пары имя атрибута и значение атрибута часто совпадают.

Пример ситуации:

(Лекция: лектор Фамилия_лектора, место №_аудитории, тема Название_темы, слушатель Код_группы, день День_недели, время Время_начала)

Ситуация – показана связь между «преподаватель» и «слушатель», остальные характеристики данной ситуации.

Роли участников ситуации:

Слушатель

Характеристики ситуации:

(К: А1К1,А2К2, … , АnКn) – представление знаний в виде некоторой структуры.

(дата, число, день_месяца)

(дата, месяц, название_месяца)

(дата, год, год)

(геометрическая_фигура, форма, геометрическая_форма)

(геометрическая_фигура, цвет, цвет)

Такому представлению знаний соответствует представление знаний в виде отдельных фактов.

(К: А1К1,А2К2, … , АnКn)

Представления знаний об объектах делятся на:

классы объекта (структура данных)

знания о конкретных объектах (о данных)

Классы объекта.

1. (К: А1К1,А2К2, … , АnКn)

Аi – имя атрибута

Кi – классы объекта, являются значением атрибута

К – имя класса

(преподаватели:

ФИО фамилия_с_инициалами,

Должность преподпвательская_должность)

(преподаватель, ФИО фамилия_с_инициалами, преподаватель, должность преподпвательская_должность)

3. К (К1,К2, … , Кn)

4. К (А1,А2, … , Аn)

(преподаватель (фамилия_с_инициалами, преподпвательская_должность), преподаватель (ФИО, должность))

Представление знаний для первой формы:

(К: А1К1,А2К2, … , АnКn) кi (Кi

Атрибутивное представление знаний:

(преподаватель: - представляет собой

ФИО Семенов - некоторую структуру

Должность доцент) - данных

Представление знаний для второй формы:

(К: АiКi) к (К, кi (Кi

Атрибутивное представление знаний в виде отдельных фактов:

(преподаватель1, ФИО, Семенов) - 1, 2 являются связками между

(преподаватель1, должность, доцент) - фактами

(преподаватель2, ФИО, Петров)

(преподаватель2, должность, ассистент)

Представление знаний для третьей формы:

К (К1,К2, … , Кn)

(преподаватель (Семенов, доцент) - позиционное представление знаний

Если имена атрибутов отсутствуют, а сами атрибуты записываются на определённых позициях, то – позиционноё представление знаний.

Представление знаний в виде «троек» - (объект, атрибут, значение).

Для представления неточных значений используются коэффициенты уверенности – (объект, атрибут, значение, коэффициент уверенности).

0 – соответствует неопределенности. отрицательное значение – степень уверенности в невозможности значения атрибута.

(пациент1, диагноз, гастрит, К740)

* (пациент, ФИО, Антонов, диагноз колит К760, гастрит К740)

Представление знаний о классе объекта называется минимальным, если при удалении одного из атрибутов приводит к тому, что оставшееся множество атрибутов перестает быть представлением данного класса объекта.

Аренда (объект_аренды, арендатор, арендодатель, срок_аренды, плата).

Если удалить «срок_аренды», получится купля-продажа, а если удалить
«срок_аренды» и «плата», то получиться подарок.

Представление знаний в реляционной базе данных.

Реляционная база данных – данные хранятся в позиционном формате.

Данные хранятся в виде таблицы, где название таблицы – имя класса.
Каждому классу соответствует таблица или файл БД. Имя класса - название соответствующей таблицы. Имена атрибутов – соответствующие поля таблицы
(столбец). Строки таблицы – записи БД. Записи соответствует запись в позиционном формате.
|А1 |А2 | . . .|Аn |
| | |. . | |
|К1 |К2 | . . .|Кn |
| | |. . | |

Преподаватели

|ФИО |должность|
|Семенов |Доцент |
|Петров |ассистент|

Понятие атрибута в позиционной БД сохраняется.

Запись К (А1,А2, … , Аn) называется отношение между атрибутами. Такая терминология используется в реляционной БД. Идея данных в реляционной БД основана на понятие «ключ».

Ключ – набор атрибутов отношения, значение которых однозначно определяет запись в файле.

Квартира

| город |улица |дом |корпус|квартира|площадь |количество комнат|
|Москва |Тверская |2 |1 |47 |60 |2 |
|Москва |Тверская |2 |1 |54 |50 |1 |

В данном случае ключ будет состоять из нескольких полей.

Кi sup Кj является подклассом класс sup подкласс; подкласс sup класс.

Кi является подклассом Кj, если (t Ki t (Kj t

(Если в любой момент времени t класс Кi является подклассом Кj)

Npr – классификация сети.

Классификация сети представляется в виде иерархической структуры.

Студент sup учащийся.

Ki part of Kj - является частью Ki part Kj

Ki является частью Kj, если конкретный объект класса Ki является частью однозначно определенного объекта Kj.

Отношение принадлежности. k isa K - является элементом

Ki ius K - является составляющей

Означает, что объект класса К состоит из объектов класса К1, К2, … ,
Кn, причем объект класса К может включать несколько объектов класса Кi.

Лекция №4.

Свойства отношений.

Отношения частичного порядка обладают свойством транзитивности.

Ki sup Kj Kj sup Km

Ki part Kj Kj part Km

Если элемент является составляющей блока, а блок составлен…

Нет циклов в графе принадлежности.

K1 ins K2, K2 ins K3,…,Kn-1 ins Kj

Неверно, что Kn ins K1

Москва isa город

Город sup Населенный пункт

Москва isa Населенный пункт

Операции над классами объектов.

С помощью операций над классами объектов можно определить новый класс объектов

Ki множество блоков, к примеру, телевизоров

Материальные объекты делятся на три класса

Условие (Помещение (Оборудование = Материальный объект

Человек (Помещение = Человек (Оборудование = Помещение (
Оборудование =?

Размещение классов объекта

Человек (Фамилия, Имя, Отчество, Год_Рождения, пол)

Пол={мужской, женский}

Мужчина, женщина = Человекпол

K (K1, K2, K3, K4, K5)

KK5 – Разбиение класса по классу К5.

Объединение всех этих классов есть человек.

Мужчина?Женщина=Человек

Мужчина?Женщина=?

(Знание_иностранного языка

Знающий человек,

Предмет иностранный_язык)

В результате разбиения мы получаем классы людей, знающих иностранный язык.

Концептуальной схемой предметной области называется множество классов объектов, заданных на нем отношений и операциями.

Шаблонные описания состояния предметной области:

Занятия K проводит занятия по дисциплине в группе в на в.

Иванов И.И. проводит занятия по дисциплине ТОЭ в группе ИТ-1-98 в понедельник на 4 паре в Г-301.

(занятия: преподаватель Преподаватель дисциплина Название_дисциплины группа Код_группы день День_недели время Номер_пары место Аудитория)

Концептуальные модели предметной области – концептуальная схема вместе с множеством высказываний построенных по конечному набору шаблонов.

Диаграмма сущности и связи (ER – диаграмма)

Entety Relation Diagramm

Сущность

Атрибуты сущности и связи

На 1 кафедре работает N преподавателей. «*» – знак преподавателя – можно найти кафедру.

Связь глагол или дополнение

Атрибуты – прилагательное, числители, размеры, место действия

Расписание нагрузки

Логические системы (модели), на основе единственного примера поставки товара в магазин.

Логические модели представления знаний.

Описание предметной области на одном из логических языков программирования, основано на исчислении предикат.

Язык многократного исчисления предикатов 1-го порядка. Многократная логика 1-го порядка.

Для составления этого языка:

Понятие сорта соответствует понятию классов объектов.

Множество сортов S

На множестве задаются функциями. f-имя функции;

сорта аргументов;
В – сорт значения функции.
Z – сигнатура – это верхний уровень представления знаний в логических моделях.

Предикат -
Т={0;1}

ложь истина
-константа сорта В

Рассмотрим в качестве примеров обработку деталей на производстве
2-токарных;
1-фрезерный;

S={Деталь, Станок, Операция, Тип_детали, Тип_станка, Время }
1) дет: Операция Деталь; f A1 B
2) ст: Операция (Станок;
3) нач: Операция (Время
4) кон: Операция (Время
5) тип_дет: Деталь (Тип_детали
6) тип_ст: Станок (Тип_станка
7) 0: (Время

T: (Время
8) ст_вал:(Тип_детали вал_мест: (Тип_детали
9) фрез: (Тип_станка ток: (Тип_станка
10) фрез_торц:операция Т ток_обр: операция Т
11) +: Время*Время Время
12): Время*Время Т

Знания о конкретных объектах
(нижн. Уровень представления знаний) на языке многократного исчисления предикатов наз-ся структурой интегрированной сигнатурой
1) сигнатура
2) Структура интегр. Сигнатуры.
3) Для каждого имя сорта создаётся мн-во объектов этого сорта.
Деталь = {дет.1, дет.2, дет.3, дет.4}
Станок = {ст.1, ст.2, ст3}
Операция ={опер1,опер2, опер3, опер4, опер5, опер6, опер7, опер8}
Тип_детали = {ст_вал, вал_мест}
Тип_станка = {ток, фрез}
Время = {1,2,…,t}

Объединение всех множеств - универсум.
Каждой функции и предикатов из структуры в системе соответствует множество факторов.
1) дет.(опер.1)=дет1 дет.(опер.2)=дет1 дет.(опер.3)=дет2

…………………..
2) ст.(опер.1)= ст.3 ст.(опер.2)= ст.1 ст.(опер.3)= ст.3

…………………
3) нач.(опер.1)=0 нач.(опер.2)=5 нач.(опер.3)=5
…………………..
4) конц(опер.1)=5 конц(опер.2)=12 конц(опер.3)=0
…………………
5) тип_дет(дет.1)=ст_вал тип_дет(дет.2)=вал_мест тип_дет(дет.3)=ст_вал тип_дет(дет.4)=вал_мест
………………….
6) тип_ст. (ст.1)=ток тип_ст. (ст.2)=ток тип_ст. (ст.3)=фрез
………………….
10) фрез_торц(опер1) ток_обр (опер2) фрез_торц(опер3)
|операция|деталь |станок |начало |конец |фрез_торц|ток_обр|
|Опер1 |Дет.1 |Ст.3 |0 |5 |1 |0 |
|Опер2 |Дет.1 |Ст.1 |5 |12 |0 |1 |
|Опер3 |Дет.2 |Ст.3 |5 |10 |1 |0 |
|Опер4 |Дет.2 |Ст.2 |10 |17 |0 |1 |
|Опер5 |Дет.3 |Ст.3 |10 |16 |1 |0 |
|Опер6 |Дет.3 |Ст.1 |16 |26 |0 |1 |
|Опер7 |Дет.4 |Ст.3 |16 |22 |1 |0 |
|Опер8 |Дет.4 |Ст.2 |22 |32 |0 |1 |

|Деталь|Тип_дет |
|Дет.1 |Ст_вал |
|Дет.2 |Ст_вал |
|Дет.3 |Вал_мест|
|Дет.4 |Вал_мест|

|Станок|Тип_ст |
|Ст.1 |Ток. |
|Ст.2 |Ток. |
|Ст.3 |Фрез. |

3) Составляющая: Логические формулы

Правила построения формул: а)константа сорта А, есть терм сорта А б)переменная принимающая значение из сорта А, есть терм сорта А в)если сигнатура содержит функцию- построенные термы сортов соответственно, то
-есть терм сорта В г)если сигнатура содержит предикат-
,термы построенных сортов
, то - есть атом. д)если - термы одинакового сорта, то выражение , то есть атом е)Атом есть формула правильно построенная (ППФ)Переменная, входящая в атом, является свободной в этом атоме. ж)если построенная формула в которую свободно входит переменные х сорта А, то выражения:

Также является ППФ, переменная “x” является связанной (в новых файлах) з)если уже построенные формулы, то , также является ППФ
Примеры:
1) Представление Знания b=> опер2 выполнены на токарном станке тип_ст(ст(опер2))=nток
2) Опер2 выполн на ост.1 на ст.1 нач 5 конец 12
3)

Лекция 8 12.11.99.

Метод резолюций


Метод резолюций доказывает невыполнимость.
Для использования этого метода необходимо исходную формулу привести к ДНФ.
ДНФ:
- дизъюнкция литер рii – атом или отрицание атома.
Потом ДНФ представляют в виде множества дизъюнктов
В методе резолюций – имеется одно правило вывода
В результате из 2-х дизъюнктов получаем новую, называется руовентой
- получаем пустой дизъюнкт, который всегда ложный.
Если множество содержит пустой дизъюнкт, то оно является не выполнимым.
Получается пустой дизъюнкт, который доказывает что данное множество является невыполнимым.
Метод резолюций применяется до тех пор пока не получится пустой– дизъюнкт
m,n – const
подстановка вместо переменной константы –унификация.
В данном случае выполняем подстановку {n/y}:
Из (1)и (2) => a(x)c(x,n) (5)
Из (3) и (5) , выполняя ь подстановку {m/n}=> c(m,n) (6)
Из (4) и (6) без подстановок => 0

Принцип резолюций в Прологе
В Прологе используются хордовские дизъюнкты, т.е. дизъюнкты, содержащие одну литеру без отрицания.
На пример
=>

конъюнкция без отрицания

Могут использоваться дизъюнкты, которые вообще не содержат литер. – это целевое утверждение на прологе: ? – a a: - b,c,d. b: - e,f. c. e. f.
?-a a(1) a(2) a(3)
|№ шага |Целевой |Исходный |резольвета|
| |дизъюнкт |дизъюнкт | |
|1 |?- a. |a:-b,c,d. |-b,c,d. |
|2 |?-b,c,d |b:-e,f |-e,f,c,d |
|3 |?-e,f,c,d |e |-f,c,d |
|4 |?-f,c,d |f |-c,d |
|5 |?-c,d |c |-d |
|6 |?-d |d |0 |

Представление программы в виде графа a: - b;c b: - d,e c: - g,f. e: - i,h g: - h,j d. f. h.
?-a
«,» - и
«;» - или
Построение графа начинается с целевого дизъюнкта.
На графе видно какие и сколько решений имеет рассматриваемая задача.

Два решения задачи

Продукционная модель представления знаний.
Основа для данной модели – это продукционные правила, которые имеют следующий вид
- продукционное правило >:=
Eсли то [КД=]

Примеры:
Правило 5
Если пол=женский

И сложение=мелкое

И вес=65 лет_или_больше
То относительный_вес=изменчивый
Коэффициент доверия определяется числом 0-100

Правило 27
ЕСЛИ перспектива=отличная

И риск=высокий
ТО фактор=0 КД=10
В общем случае посылка может быть логическим выражением.
Если посылка истинна, то истинно и заключение, т.е. в заключение может быть указано какое-либо действие, которое выполняется, если посылка истинна
::[ИИ…И]
::== объект, атрибут, значение, коэфициент доверия- представление знаний в виде четвёрки
::==
:==КД=
Один и тот же объект может иметь разные значения.
Многозначные объекты – объекты, которые могут иметь несколько достоверных значений.
Если объект не объявлен, как многозначный, то он может иметь несколько значений, то они не должны быть достоверными, т.е. КД= 100

Для объектов, значение которое запрашивается у пользователя.
Какое сложение?
1. Мелкое
2. Среднее разрешённые значения
3. Крупное

Каков возраст
1. меньше 25
2. от 25 до 55
3. больше 55
Коэффициент доверия посылки=min(Кдусл)

Факта, полученного в результате выполнения правила перспектива=отличная КД=50 риск=высокий КД=70 фактор=0

Базовая структура продукционной модели представления знаний

Исходные данные

Результат

Лекция 9 (Конец)
|№ |Конфликтное |Выполнение|Выведенный|
|шага|Множество | | |
| |правил |правила |факт |
|1 | | | |
|2 | | | |
|3 | | | |
|4 | | | |
|5 | | | |

Выводы заканчиваются, когда достигается целевая вершина, либо не осталось применимых правил, а цель не достигнута.

Обратные выводы – выполняются сверху вниз (выводами ориентирующих на цель)

П 1 П2 П3 П4
П5

С 4 С5 С6 С7 С8

|№ |Цель|Конфликтное |Выполнение|Подцели|Факт|
|шага| |множество | | | |
| | |правил |правил | | |
|1 |С1 |П6,П7 |П6 |С2,С3 | |
|2 |С2 |П1,П2 |П1 |С1,С5,С| |
|3 |С3 | | |3 |F1 |
|4 |С4 | | | |F2 |
|5 |С5 |П3 |П3 | | |
|6 |С6 | | |С6,С7,С|F3 |
|7 |С7 | | |8 |F4 |
|8 |С8 | | | |F5 |
| | | | | | |

Цель – «продолжительность» –цель задаётся именем объекта.
Она сопоставляется с заключением правил и выбирается правило с заключением
, в которых есть имя объекта. Выбираем правило, которое содержит целевой объект, мы формируем гипотезу

В процессе гипотеза либо подтверждается либо опровергается. Выводы продолжаются до тех пор, пока какая либо не будет подтверждена, либо не будут исчерпаны все возможные гипотезы.
Используется меньшее количество проверок, т.к. в правиле бывает несколько условий и одно заключение.

Двунаправленные выводы.

Сначала выполняются прямые выводы, на основе небольшого количества данных, в результате формируется гипотеза для подтверждения или опровержения выполняются другие выводы.
Для проверки условий правил используется аппарат активации правил, который выделяет на каждом шаге те правила, в которых проходит проверка условий.
Должны быть использованы также условия. В условиях правил выделяются индивидуальные, а затем общие.
Общие правила – правила условий применимости. Сфера применимости.

Обобщённая структура продукционного правила.
(i); Q; P; A; =B; N
(i)– имя правила:
Q –сфера применения правила;
P – условие применимости првила (логическое условие)
A=>B – ядро правило, где А- посылка, а В- заключение;
N – поставленное условие, определяетдействия, которые выполняются в случае выполнения ядра.
Р – при истинности активизируется ядро правила.

Фрейм – структура данных для представления стереотипной ситуации
(к: А1К1, A2K2, ….,AnKn)
(к: A1k1, A2k2,….,An kn)
(имя файла: имя слота1 (значение слота1) имя слота2 (значение слота2)

……………………………….. имя слота n (значение слота n))
Протофрейм – знания о классе объектов.
Фрейм- экземпляр- получается из протофрейма при заполнении слотов конкретными значчениями.
В структуру фреймов обычно включают системные слоты. К системе слота относятся:
Слоты определим фреймродитель, слот, указываемый на прямые дочерние фрейма.

В качестве системы слотов: слоты, содержащие сведения о создателе программы, о её модификации.
В структуру входят:
- указатель наследования;
- указатель типа данных;
- демоны и т.п.

ЯЗЫК ФМС (FMS).
Указатели наследования могут быть:
U – unique – уникальный
S – same- какой-то
R – range – указатель границ;
0 –override – игнорировать

U – во фреймах разных уровней с одинаковыми именами будут различными.
S – слоты наследования значений из слотов высшего уровня с такими же именами

Значение нижнего уравнения должно лежать внутри границ определённого в верхнем уравнении.

R
Человек

Если значение не задано то оно наследуется из слота верхнего уравнения, а если оно задано, то наследование игнорируется.

Лекция 11 3.12.99

Сочетание сетевой и фреймовой модели в системе представления знаний OPS-5
В этом языке есть продукционные правила и базы данных
::=({| }+)

{}+ - Может повторятся несколько раз
::=({ значение})
::= |
(Вещество класс кислота

Имя

Цвет бесцветная)
(Порядок – задач: Источник, утечки Ограждения)
Что собой представляют правила:
::=(Р )
::={}+
::= | -
::= | |
::=({значение>}+) |

# (Порядок задач)

([{ }+])
# (Вещество)
В образце не обязательно указываются все атрибуты данного класса, т.е. мы можем записать
(Вешество класс кислота

Имя) т.е. переменная кислота –вещ получит значение
::= ({ >}+)
Значение с соответствующего атрибута элемента работой памяти должно совпадать с одним из элементов указанных в данном листе, хотя бы с одним.
Эти значения задаются конкретными словами.
# (Вещество класс кислота

Цвет)
::= ({{{}+}}+)
Список значений может задаваться и в виде ограничений
# (Двигатель мощность { 100 200})

(Двигатель мощность 160)
:={}+
::=(make | remove | (modif
{} +)

# (Р координировать _а

(цель состояние активный

Имя координировать)
Если цель находится в состоянии координировать и порядок задач не определён, то создать

(Порядок задач) –>
(make цель состояние активный

Имя упорядочить задачи)
(modif1 состояние ожидания))

Стратегия решения задач основана на явном задании цели
Выполнение
1. сопоставление с элементами памяти в результате формируется конфликтное множество правил
2. Выбор правил из конфликтного множества
3. Выполнение действий, указанных в заключении правил
Выполняется до тех пор, пока не будет достигнута цель.

Приобретение знаний

Извлечение знаний из источника, преобразование их в нужную форму, а также перенос в базу знаний интеллектуальной системы.

Знания делятся на:
- объективизированные;
- субъективные
Объективизированные – знания, представленные во внешних источниках – книгах, журналах, НИР.
- форматизированные, т.е. представлены в виде законов, формул, моделей, алгоритмов.
Субъективные – знания, которые являются экспертными и эмперическими не представлены во внешней форме.
Знания экспертом является неформализованными, представляют собой множество эвристических приёмов и правил, позволяют находить подходы к решению задач и выдвигать гипотезы, которые могут быть подтверждены или опровержены.
Знания могут быть получены в процессе наблюдения за каким-либо объектогм.
Режимы работы инженера по знаниям, консультолога в процессе приобретения знаний.
1. протокольный анализ
- записываются рассуждения вслух в процессе решения задач.
О.с. составляются протоколы, которые анализируются
2. Интервью - ведется диалог с экспериментом, направленный на приобретение знаний.
3. Игровая имитация профессиональной деятельности.

Методы интервьюирования.
1. Рубление на ступени выделяются связи, позволяющие строить иерархические структуры
2. Репертуальная рещётка предлагаются 3 понятия и требуется назвать отличие 2-х понятие 3-его. Эксперту предлагается пара понятий и требуется назвать общие свойства => сформировать классы.

Методика работы конитолога по формированию поля знания
Включает 2 этапа
1. подготовительный
1.1. Чёткая подготовка задачи, которая должна решать система
2. Знакомство конит с литовой
3. Выбор экспертов
4. Знакомство экспертов с копией
5. Знакомство эксперта с популярной методикой по искусственному интеллекту
6. Формирование с копии поля знания
2. Основной этап
1. накачка поля знания в режиме
2. командная работа косметолога – анализ протокола, определение связей между понятиями, готовит вопросы к эксперту
3. Подкачка поля знания – задача вопросов эксперту
4. Формализация концептуальной задачи.
5. Проверка полноты модели
Если модель неполная, то используется 2-ое приближение.

Лекция 12 10.12. 99.

Нечёткие множества
– толщина изделий малая средняя большая

степень принадл

10 15 40 толщина изделий
- нечёткое множество х - универсальное множество
х - образуют совокупность пар А
- называется функцией принадлежности нечёткого множества.
Значения функции принадлежности для конкретного элемента Х называется

Степенью принадлежности

Носитель нечёткого множества
Нормальным нечётким множеством называется множество для которого

Нечёткое множество
Х - универсальное множество
Х - образуют совокупность пар А
: - называется функцией принадлежности нечёткого множества.
Значение функции принадлежности для конкретного элемента Х называется степенью принадлежности
- носитель нечёткого множества
&
Нормальным нечётким множеством называется множество для каждого

Если приводить к нормальной форме => нужно поделить все её значения на
.

Пусть функция принадлежности задаётся целым числом от 10 до 40
Определить понятие малая толщина изделия.

| | | | | | | | x x

10 11 12 13 14 15 16 17 18
18

Операции над нечёткими множествами

1. Объединение нечётких множеств


2. Пересечение нечётких множеств


3. Дополнение нечёткого множества

Начало 12 и 13 лекции.

(A1,(A2,….,(An x1,x2,…,xn x1(X1 x2(X2 … xn(Xn

(A1 x(A2 x … x(An = {}

(x (x1,x2,…,xn) = min{(A1 (x1), (A2 (x2)…(An (xn) }

(A x(B = {,
, }
5. Возведение нечеткого множества в степень.

(A2 = con((A) - концентрация

(A0.5 = dil((A) – растяжение

Методы определения функции принадлежности.

Немного больше 2. От 0 до 5.
|x |0 |1 |2 |3 |4 |5 |
|n1 |- |- |- |10|8 |4 |
|n2 |10|10|10|- |2 |6 |

(A = n1 / (n1 + n2)

Метод рангирования.

Нечеткая переменная.

(- имя нечеткой переменной х – область ее определения

(А – смысл, нечеткое множество определяет семантику нечеткой переменной

Лингвистическая переменная.

(- имя лингвистической переменной

Т – базовая терм множество – образует имена нечетких переменных
{редко, иногда, часто}, являющихся лингвистическими переменными

Х – носитель лингвистических значений – область определения

G – синтаксическая процедура

М – семантическая процедура

Синтаксическая процедура в виде грамматических терминов, символы которых составляют термы из терм множеств {и, или, не}, модификаторы типов
{очень, слегка, не и т.д.}

(- частота

Т = {редко, иногда, часто}

Очень часто

Такие термины вместе с исходными образуют производную терм множества.

Семантические процедуры позволяют переписать термо-нечеткую семантику.

М((1 или (2) = (А1 ((А2

((1 , х1 , (А1)

((2 , х2 , (А2)

М((1 и (2) = (А1 ((А2

М(очень () = con ((A)

М(слегка () = dil ((A)

Сценарий.

Является классом фреймовых моделей представления знаний, где в обобщенной и структурной форме представлены знания о последовательности действий, событий типичных для предметной области. Рассмотрим стереотип каузальный сценарий – определяет последовательность действий необходимых для достижения целей, это фреймовая модель.

(kcus имя: имя слота 1(значение слота 1); имя слота 2(значение слота 2);

… имя слота n(значение слота n))

(kcus деятель цель деятеля посылка ключ следствие системное имя)

Посылка определяет действия, которые должны быть выполнены раньше ключевого действия, необходимые для его действия. Последствие – заключительное действие. Системное имя – сценарий.

(kcus «тушение пожара»: деятель (S:) цель деятеля (С: «прекращение пожара»)

П11, П12 посылки (cus: «поиск средств тушения»R1, «транспортные средства тушения»)

К1 ключ (f: «использование средств тушения для полного прекращения огня») следствие (Р: «прекращение огня») системное имя (sys: cus*1))

R1 – быть раньше

(kcus «поиск средств тушения »: деятель (S:) цель деятеля (С: «нахождение средств тушения»)

П121, П22 посылки (cus: «определение координат местонахождения средств тушения»R1, «перемещение к месту нахождения средств тушения»)

К2 ключ (f: «схватывание средств тушения») следствие (Р: «нахождение у места расположения средств тушения») системное имя (sys: cus*2))

(kcus «транспортировка средств тушения к месту пожара»: деятель (S:) цель деятеля (С: «доставка средств тушения к месту пожара»)

П31, П32 посылки (cus: «наличие средств тушения»R1, «определение координат места пожара»)

К3 ключ (f: «движение к месту пожара») следствие (Р: «нахождение на месте пожара средств тушения») системное имя (sys: cus*3))

Пополнение знаний на основе сценария.

Последовательность действий:

Д = cus: П11 R1 cus: П12 R1 K1 =

П21R1П22R1K2 П31R1П32R1K3

П21R1П22R1K2 R1 П31R1П32R1K3 R1 K1

Посылки определяют действия, которые должны быть выполнены раньше ключевого действия, необходимы для его действия. Следствие заключительное действие. Системное имя сценарий.

Пополнение знаний на основе псевдофизических логик.

Р1 – посадка самолета

Р2 – подача трапа

Р3 – выход пассажиров из самолета

Р4 – подача автобуса

Р5 – прибытие на аэровокзал

Структура текста на лингвистическом уровне представляется следующей формулой:

TS = PR4dt&P1R3 10,(P2&P2R1P3&P4R3 2,(P5 t = 15 часов 20 минут

PR4dt , P1R3 10,(P2 (P2R4 dt + 10

P1R3 10,(P2 (P1R1P2

P4R3 2,(P5 (P4R1P5

TS* = P1R1P2& P1R1P3& P2R1P3& P4R1P5

Модели и методы обобщений знаний.

Под обобщением понимается процесс получения знаний, объясняющих имеющиеся факты, а так же способных классифицировать, объяснять и предсказывать новые факты. Исходные данные представляются обучающей выборкой. Объекты могут быть разбиты на классы. В зависимости от того, заданы или нет априорные разбиения объектов на классы, модели обобщения делятся на модели обобщения по выборкам и по классам.

(+ = {01+, 02+…0nj+} – положительная выборка.

Может задаваться отрицательная выборка (- = {01-, 02-…0ьj-}

Требуется найти такое правило, которое позволяет установит, относится или нет объект к классу Kj.

В моделях обобщения по данным выборка представляется множеством объектов класса. Методы обобщения делятся на методы обобщения по признакам и структурно-логические методы обобщения.

Z = {z1, z2, …, zr}

Zi = {zi1, zi2, …, zini}

Объект характеризуется множеством значений признаков Qi = {z1j1, z2j2, …, zrjr}.

Структурно-логические методы обобщения используются для представления знаний об объектах, имеющих внутреннюю структуру среди структурно- логических методов. Можно выдвинуть два направления: индуктивные методы нормального исчисления и методы обобщения на семантических сетях.

Алгоритм обобщения понятий по признакам.

Правила определения принадлежности объектов к некоторому классу представляются в ряде логических формул элементами которых являются hij и функции ((((((((

Z = {z1, z2} {пол, возраст}

Z1 = {z11, z12} {м, ж}

Z2 = {z21, z22, z23} {молодой, средний, старый}

(j+ = {01+, 02+} (j- = {01-, 02-, 03-}

01+ = (z11, z21) 02+ = (z11, z22)

01- = (z11, z23) 02- = (z12, z21) 03- = (z12, z22)

&i hij - обобщенное конъюнктивное понятие

0 = max(xij – 1/(i), где 0 – критерий, xij – частота появления некоторого значения признака, (i – количество признаков.

0 = 3/5 – 1/2 = 0.1

(j+ = {01+, 02+} (j- = {01-}

(-1+ = 0 (-1- = {02-, 03-}

-----------------------

Ситуация

Статическая

Динамическая

Постоянные свойства и соотношения

Состояния

Устойчивые

Временные

Процессы

(пациент1, диагноз, колит, К760)
(пациент1, диагноз, гастрит, К740)

учащийся

Неопределенный объект

Определенный объект

Материальный объект

Нематериальный объект

ситуация

пространство

помещение

оборудование

учащиеся

административный персонал

преподаватели

обслуживающий персонал

аспирант

заведующий кафедрой

методист

профессор

ассистент

лаборант

пространство

губерния

населенный пункт

работает

преподаватель

Назв.каф.

замещение

дисциплина

Код группы

Усилия исследователей в области инженерии знаний направлены на создание формальных методов извлечения знаний . К их числу можно отнести метод автоматической обработки текстов на основе статистической обработки семантических единиц. Метод и программные средства автоматизированного извлечения знаний из текстов базируются на формальных процедурах обнаружения в текстах семантических единиц различной выраженности.  


Для создания экспертной системы нужен собственно эксперт, источник знаний в какой-либо узкой предметной области , и универсальный инженер знаний. Инженер знаний опрашивает эксперта, формализует его знания и создаёт модель предметной области . Модель затем вводится в компьютер, и проигрываются всевозможные варианты.  

Как уже отмечалось, технологию построения экспертных систем часто называют инженерией знаний. Как правило, этот процесс требует специфической формы взаимодействия создателя экспертной системы предметной области . Инженер знаний извлекает из экспертов процедуры, стратегии, эмпирические правила, которые они используют при решении задач , и встраивает эти знания в экспертную систему. Одной из наиболее сложных проблем, возникающих при создании экспертных систем, является преобразование знаний эксперта и описания применяемых им способов поиска решений в форму, позволяющую представить их в базе знаний системы, а затем эффективно использовать для решения задач в данной предметной области.  

Обычно эксперт не прибегает к процедурным или количественным методам его основные средства - аналогия, интуиция и абстрагирование. Часто эксперт даже не может объяснить, как именно им было найдено решение. В лучшем случае вы получите от него лишь описание основных приемов или эвристик, которые помогли ему успешно справиться с задачей. На инженера знаний возлагается очень сложная работа по преобразованию этих описаний в строгую, полную и непротиворечивую систему, которая позволяла бы решать прикладные задачи не хуже, чем это сделал бы сам эксперт, поскольку процесс построения базы знаний плохо структурирован и по своей природе является скорее циклическим, чем линейным.  

Инженер знаний должен корректно сформулировать задачу. В то же время он должен уметь распознать, что задача не структурирована, и в этом случае воздержаться от попыток ее формализовать или применить систематические методы решения . Главная цель начального этапа построения базы знаний - определить, как будет выглядеть описание предметной области на различных уровнях абстракции. Экспертная система включает базу знаний , которая создается путем формализации некоторой предметной области , а та, в свою очередь, является результатом абстрагирования определенных сущностей реального мира.  

Инженер знаний прежде всего обязан провести опрос эксперта и только потом приступать к построению системы. Эксперт, безусловно, должен быть специалистом в той области, в которой будет работать система . Первым делом необходимо определить целевое назначение системы. Какие, собственно, задачи предстоит решать системе, основанной на знаниях Цели разработки системы следует сформулировать точно, полно и непротиворечиво.  

Процесс приобретения знаний - наиболее сложный этап разработки экспертной системы , поскольку инженер знаний (программист) плохо разбирается в предметной области , а эксперт не знает программирования. В связи с этим лексика, используемая экспертом, не понятна инженеру знаний, и чтобы уточнить все вопросы, требуется совместная работа эксперта и инженера знаний. Одна из наиболее сложных задач инженера знаний - помочь эксперту структурировать знания о проблеме. " "...  

В выполнении всех задач, возникающих в процессе приобретения знаний, могут принимать участие эксперт, инженер знаний и экспертная система . В зависимости от того, кто выполняет задачу, можно выделить различные модели приобретения знаний.  

Последующие разработки систем искусственного интеллекта основывались на отделении знаний от программ и оформлении знаний в виде простых информационных структур , называемых базами знаний . В этом случае эксперт взаимодействует с системой либо непосредственно, либо через инженера знаний.  

Эксперт, имеющий минимальные знания в области программирования, может взаимодействовать с экспертной системой через интеллектуальный редактор, без посредничества инженера знаний.  

Перед тем как приступить к разработке ЭС, инженер по знаниям должен рассмотреть вопрос, следует ли разрабатывать ЭС для данного приложения. В обобщенном виде ответ может быть таким использовать ЭС следует в том случае, когда разработка ЭС возможна, оправдана и методы инженерии знаний соответствуют решаемой задаче.  

Прототип должен продемонстрировать пригодность методов инженерии знаний для данного приложения. В случае успеха эксперт с помощью инженера по знаниям расширяет знания прототипа о проблемной области. При неудаче может потребоваться разработка нового прототипа или разработчики могут прийти к выводу о непригодности методов инженерии знаний для данного приложения.  

Уровень технологии любого производства оказывает решающее влияние на экономические показатели (прибыль, рентабельность продукции , издержки производства и др). Поэтому экономисту необходимы достаточные знания современных технологических процессов , а инженеру - знания в области экономики.  

Выполнение этих требований позволяет упростить механизм логического вывода и процессы приобретения знаний и управления ими, однако, как правило, создателям интеллектуальной системы приходится идти на некоторый компромисс в стремлении обеспечить одинаковое понимание знаний и экспертами, и инженерами знаний, и пользователями.  

Компонент приобретения знаний предназначен для обеспечения работы инженера знаний по созданию и поддержанию модели знаний , адекватной реальной предметной области (генерации БЗн, ее тестирования, пополнения новыми знаниями , исключения неверных (ставших таковыми) знаний и т. п.).  

В психологии, инженерии знаний разработаны приемы, большинство из которых, за исключением аппаратурных методик, вполне доступны. Познакомимся с конкретными приемами выявления стереотипов Клиентов.  

Одной из ключевых проблем создания систем ИИ является проблема представления и использования знаний о той предметной области , в которой система решает те или иные задачи. Общий круг задач, решаемых в этой связи, относится к разделу ИИ, называемому инженерией знаний. База знаний является важным элементом любой системы управления . Идея баз знаний сформировалась в ходе исследований по созданию принципов и методов работы с большими базами данных. Оказалось, что эффективность использования баз данных может быть существенно повышена, если связывать хранящуюся информацию не только за счет форм (таблиц, списков, деревьев), а за счет тех отношений, которые существуют между фактами. Причем, отношения эти должны быть не случайными, ситуативными, а отражать существенные связи объекта. Такие базы данных получили название интеллектуальных баз данных или баз знаний.  

К примеру, инженеры знаний (люди, которые осуществляют опрос экспертов и переводят их экспертизу в искусственный интеллект - компьютерную программу экспертной системы) сегодня составляют менее 1% сотрудников в сфере обработки данных, однако предполагается, что после 2000 г. они займут до 20% рабочих мест по обработке данных. Исследование компетенций может показать, что лучшие инженеры знаний обладают более высоким уровнем когнитивных компетенций, таких как опознавание модели , концептуализация и аналитическое мышление (способность распознавать и формулировать алгоритмы решения задачи эта способность используется экспертами в компьютерных программируемых правилах типа если- то) и навыки межличностного интервьюирования, нужные для установления взаимопонимания и выслушивания экспертов по теме.8 Эти данные предлагают критерии отбора и тренинга для персонала, занимающегося обработкой данных, который будут набирать и развивать в течение следующей декады.  

В будущем исследование компетенций будет все больше напоминать инженерию знаний процесс определения хода мысли людей-экспертов, чтобы на их основе разработать компьютерные экспертные системы.5  

Эти проблемы преодолеваются с помощью методов инженерии знаний (гл. 9). Благодаря им можно непосредственно представлять в моделях плохо формализуемые знания менеджеров о бизнес-процессах , в частности рабочих процедурах. Кроме того, решается проблема быстрой разработки приложений и создания интеллекту-  

Чтобы преодолеть эти проблемы, в настоящее время начинают использовать методы инженерии знаний. С их помощью можно непосредственно представлять в моделях плохо формализуемые знания менеджеров о бизнес-процессах , в частности рабочих процедурах. Кроме того, решается проблема создания интеллектуального интерфейса конечного пользователя со сложными средствами анализа моделей.  

Его основатели - Марвин Минский и Эдвард Фейгенбаум посчитали излишней апелляцию к архитектуре мозга его нейронным структурам и декларировали необходимость моделирования работы человека со знаниями. Тем самым, поставив в центр внимания операции с формальнологическими языковыми структурами, они заведомо выбрали ориентацию на имитацию обработки информации левым полушарием мозга человека . Системы обработки таких формализованных знаний были названы экспертными, поскольку они должны были воспроизводить ход логических рассуждений эксперта (высокопрофессионального специалиста) в конкретной предметной области . Эти рассуждения проводятся с использованием правил вывода, которые инженер знаний должен извлечь у эксперта.  

Технологию построения экспертных систем называют инженерией знаний. Этот процесс требует специфической формы взаимодействия создателя экспертной системы , которого называют инженером знаний, и одного или нескольких экспертов в некоторой предметной области . Инженер знаний извлекает из экспертов процедуры, стра-  

Система - посредник, заключение договора на поставку.

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Knowledge system - система основанная на знаниях.

СОЗ СБЗ СУБД ЭС ИС СИИ - система искусственного интеллекта.

Структура системы, основанной на знаниях.


ИНТЕРФЕЙС

БЗ - это модель, представляющая в ЭВМ знания, накопленные в определенной предметной области. Эти знания должны быть формализованы. Знания формируются с помощью модели, а затем представляются с помощью определенного языка.

В БЗ обычно выделяются знания о конкретных объектах и правила. Эти правила исполняются как механизм получения решений, для того, чтобы из исходных фактов вывести новые.

Интерфейс обеспечивает ведение диалога на языке, близком пользователю.

Методы, основанные на использовании логических выводов, часто используется в инженерии знаний.

Понятие предметной области.

Объект – то что существует или воспринимается в качестве отдельной сущности.

Основные свойства: дискретность; различие.

При представлении знаний используется прагматический подход, т.е. выделяются те свойства объекта, которые важны для решения задач, которые будет решать создаваемая система. Поэтому система, основанная на знаниях, имеет дело с предметами, которые являются абстрактными объектами. Предмет выступает в роли носителя некоторых свойств объекта. Состояние предметной области может меняться со временем. В каждый момент времени состояние предметной области характеризуется множеством объектов и связями. Состояние предметной области характеризуется ситуацией.


Концептуальные средства описания предметной области.

Концептуальная модель отражает наиболее общие свойства. Для того, чтобы детализировать описание нужны языки. Характерными чертами концептуальных средств описания предметной области являются абстрактность и универсальность. Их можно использовать для описания любой предметной области.

Понятие класса объекта.

Понятие объекта – понятие множеств. Сходные между собой объекты объединяются в классы. В разные моменты времени одному и тому же классу могут соответствовать разные множества объектов.

К – класс объекта.

К t – множество объектов класса К в момент времени t.

Группа (1999) = { ИА-1-99, ИА-1-98, … , ИА-1-94, ИБ-1-99,…}

Группа (1998) = { ИА-1-98, ИА-1-97, … , ИА-1-93, ИБ-1-98,…}

" t К t = { … }

Преподавательская должность = { профессор, доцент, старший преподаватель, преподаватель, ассистент}



1 4 Геометрическая фигура, форма квадрат, цвет синий.
объектов атрибутная пара

Идентификация объектов может быть прямая и косвенная. В случае прямой используются имена объектов, порядковые номера объектов; косвенная основана на использовании свойств объектов.

Атрибут может быть компонентом. Под атрибутом понимается свойство, характеристика, название компонентов.

(Геометрическая фигура:

форма Геометрическая форма

цвет Цвет)

Пары имя атрибута и значение атрибута часто совпадают.

Пример ситуации:

лектор Фамилия_лектора,

место №_аудитории,

тема Название_темы,

слушатель Код_группы,

день День_недели,

время Время_начала)

Ситуация – показана связь между «преподаватель» и «слушатель», остальные характеристики данной ситуации.

Роли участников ситуации:

Слушатель

Характеристики ситуации:

(К: А 1 К 1 ,А 2 К 2 , … , А n К n) – представление знаний в виде некоторой структуры.

(дата, число, день_месяца)

(дата, месяц, название_месяца)

(дата, год, год)

(геометрическая_фигура, форма, геометрическая_форма)

(геометрическая_фигура, цвет, цвет)

Такому представлению знаний соответствует представление знаний в виде отдельных фактов.

(К: А 1 К 1 ,А 2 К 2 , … , А n К n)

Представления знаний об объектах делятся на:

Классы объекта (структура данных)

Знания о конкретных объектах (о данных)

Классы объекта.

1. (К: А 1 К 1 ,А 2 К 2 , … , А n К n)

А i – имя атрибута

К i – классы объекта, являются значением атрибута

К – имя класса

(преподаватели:

ФИО фамилия_с_инициалами,

Должность преподпвательская_должность)

2. (К: А i К i)

(преподаватель, ФИО фамилия_с_инициалами,

преподаватель, должность преподпвательская_должность)

3. К (К 1 ,К 2 , … , К n)

4. К (А 1 ,А 2 , … , А n)

(преподаватель (фамилия_с_инициалами, преподпвательская_должность),

преподаватель (ФИО, должность))

Представление знаний для первой формы:

(К: А 1 К 1 ,А 2 К 2 , … , А n К n) к i Î К i

Атрибутивное представление знаний:

(преподаватель: - представляет собой

ФИО Семенов - некоторую структуру

Должность доцент) - данных

Представление знаний для второй формы:

(К: А i К i) к Î К, к i Î К i

Атрибутивное представление знаний в виде отдельных фактов:

(преподаватель1 , ФИО, Семенов) - 1 , 2 являются связками между

(преподаватель1 , должность, доцент) - фактами

(преподаватель2 , ФИО, Петров)

(преподаватель2 , должность, ассистент)

Представление знаний для третьей формы:

К (К 1 ,К 2 , … , К n)

(преподаватель (Семенов, доцент) - позиционное представление знаний

Если имена атрибутов отсутствуют, а сами атрибуты записываются на определённых позициях, то – позиционноё представление знаний.

Представление знаний в виде «троек» - (объект, атрибут, значение).

Для представления неточных значений используются коэффициенты уверенности – (объект, атрибут, значение, коэффициент уверенности).

(пациент1, диагноз, колит, К760)

0 – соответствует неопределенности.

отрицательное значение – степень уверенности в невозможности значения атрибута.


(пациент1, диагноз, гастрит, К740)

* (пациент, ФИО, Антонов, диагноз колит К760, гастрит К740)

Представление знаний о классе объекта называется минимальным, если при удалении одного из атрибутов приводит к тому, что оставшееся множество атрибутов перестает быть представлением данного класса объекта.

Аренда (объект_аренды, арендатор, арендодатель, срок_аренды, плата).

Если удалить «срок_аренды», получится купля-продажа, а если удалить «срок_аренды» и «плата», то получиться подарок.

Представление знаний в реляционной базе данных.

Реляционная база данных – данные хранятся в позиционном формате.

Данные хранятся в виде таблицы, где название таблицы – имя класса. Каждому классу соответствует таблица или файл БД. Имя класса - название соответствующей таблицы. Имена атрибутов – соответствующие поля таблицы (столбец). Строки таблицы – записи БД. Записи соответствует запись в позиционном формате.

В данном случае ключ будет состоять из нескольких полей.

4.1 Анализ предметной и проблемной областей.
4.2 Приобретение знаний .

4.2.1 .
4.2.2 Автоматизация процесса сбора знаний.

4.3 Представление знаний.

4.3.1 Модели представления знаний.
4.3.2 Выбор способа представления знаний.

4.4 Поиск и хранение знаний.

Основные определения

Инженерия знаний представляет собой совокупность моделей, методов и технических приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Фактически инженерия знаний - это теория, методология и технология, которые охватывают методы добычи, анализа, представления и обработки знаний экспертов.

Представление знаний, их обработка и использование, рассматриваемые применительно к конкретной прикладной области, являются предметом инженерии знаний.

На высоком уровне, процесс инженерии знаний состоит из двух:

  1. Извлечение знаний - преобразование «сырых знаний» в организованные.
  2. Внедрение знаний - преобразование организованных знаний в реализованные.

С областью инженерии знаний тесно связано понятие искусственного интеллекта (ИИ).

Сущностью искусственного интеллекта (ИИ) можно считать научный анализ и автоматизацию интеллектуальных функций человека. Однако для большинства проблем общая реальность - трудность их машинного воплощения. Исследования по ИИ позволили утвердиться во мнении, что подлинно необходимым для решения проблем являются знания экспертов, т.е. если создать систему, способную запоминать и использовать знания экспертов, то она найдет применение в практической деятельности.

История возникновения термина

Инженерия знаний тесно связана со всем процессом разработки интеллектуальных информационных систем в целом и экспертных систем (ЭС) в частности - от возникновения замысла до его реализации и совершенствования.

В конце 1960-х и начале 1970-х гг. под руководством Э.Фейгенбаума в Стенфордском университете США была создана система DENDRAL, а позднее - MYCIN. Поскольку эти системы накапливают в памяти компьютера знания экспертов и используют эти знания для решения проблем, извлекая их при необходимости из памяти, то они получили названия экспертных, а профессор Э.Фейгенбаум, являющийся одним из создателей экспертных систем (ЭС), выдвинул для данной области техники название «инженерия знаний». Слово «engineering» в английском языке означает искусную обработку предметов, изобретение или создание чего-либо. Следовательно, работу по оснащению программ специальными экспертными знаниями из проблемной области, выполняемую человеком либо компьютером (программой), также можно назвать «инженерией знаний».

Базы знаний

Знания — совокупность сведений, понятий, представлений о чем-либо, полученных, приобретенных, накопленных в результате учения, опыта, в процессе жизни и т.д. и обычно реализуемых в деятельности. Более формальные определения применяемые обычно в рамках менеджмента знаний:

  • информация, подвергшаяся преобразованию в части выд еле ния сущностных зависимостей. Знание само задает контекст описания и является целостным описанием ситуации;
  • результаты обобщения информации и установления определенных закономерностей в какой-либо предметной области, которые позволяют ставить и решать задачи в этой области;
  • ресурс, базирующийся на практическом опыте специалистов и на информации, существующей на предприятии.

Представление знаний, их обработка и использование, рассматриваемое применительно к конкретной прикладной области, является предметом инженерии знаний. Коллекция совместно организованных знаний, относящихся к задачам, решаемым в системе искусственного интеллекта (ИИ), называется базой знаний (БЗ).

Итак, База знаний — это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом систем Искусственного интеллекта и Экспертных систем. Большинство БЗ ограничены в некоторой специальной, обычно узкой предметной области, в которой они сосредоточены. При создании БЗ технология ИИ позволяет встраивать в компьютер механизм и способности вывода, основывающиеся на фактах и отношениях, содержащихся в БЗ.

Задачи инженерии знаний

Анализ предметной и проблемной областей

Предметная область - сфера человеческой деятельности, выделенная и описанная согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду.

Проблемная область - комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых в производственной системе, и стоящих перед ней целях.

При исследовании экономических систем и решаемых ими задач с целью формализации знаний в БЗ и работе необходимо учитывать специфику таких систем. Экономическим системам присуща динамичность функционирования, частая смена ситуаций, обновление больших массивов измерительных и других данных, характеризующих состояние объекта. Они часто функционируют в условиях полной определенности из-за действия случайных возмущающих факторов.

Приобретение знаний

Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации.

Классификация этапов обучения, соответствующих способностям компьютеров к формализации знаний:

А. Получение информации без логических выводов.

  1. Ввод программ.
  2. Ввод фактических данных.

Б. Получение извне информации, уже представленной в виде знаний.

  1. Получение готового набора знаний, представленных во внутреннем формате.
  2. Получение знаний, представленных во внутреннем формате, в режиме диалога.
  3. Получение знаний, представленных во внешнем формате, и их понимание.

В. Обучение по примерам.

  1. Параметрическое обучение.
  2. Обучение на основе выводов по аналогии.
  3. Обучение на основе выводов по индукции - эвристическое обучение.

Г. Приобретение знаний на метауровне.

В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную область, так и инженерию знаний. Таких посредников называют инженерами знаний (инженерами по знаниям).

Итак, инженер по знаниям - это специалист по искусственному интеллекту, проектирующий и создающий Экспертную систему или другую информационную систему.

И работа с ними - основная задача инженера знаний.

Инженер знаний выполняет важные функции при разработке БЗ. Он должен хорошо ориентироваться в проблемной области и быть неплохим психологом, чтобы общаться с экспертом в процессе приобретения знаний. Вместе с тем он должен хорошо знать и возможности программного обеспечения компьютеров, чтобы структурировать знания для хранения и работы с ними. Основным источником знаний о проблемной области является человек-эксперт. Эксперт - специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области.

Инженер знаний работает с ним в режиме диалога или интервью и формирует необходимый объем знаний и сведений для работы с объектом. Возможно также использование опросников, которые затем соответствующим образом обрабатываются.

Табл.1 Методы извлечения знаний из предметного эксперта.

Описание

Наблюдение на рабочем месте

Наблюдать за экспертом, решающим реальные задачи на своем рабочем месте.

Обсуждение задач

Выявить виды данных, знаний и процедур, необходимых для решения конкретных задач.

Описание задач

Попросить эксперта описать прототипную задачу для каждой категории возможных ответов.

Анализ задачи

Представить эксперту ряд реалистических задач для решения вслух с целью выявить логические основания конкретных шагов рассуждения.

Доводка системы

Попросить эксперта предоставить вам несколько задач для решения и с использованием правил, выявленных во время интервью.

Оценивание системы

Попросить эксперта проверить работу системы и подвергнуть критике правила и структуру управления прототипной системой.

Проверка системы

Предоставить примеры, решенные экспертом и прототипом системы, другим независимым экспертам для сравнения и оценки.

Для некоторых задач источниками дополнительной информации являются книги, технологические описания, инструкции, документы. Используются также методы так называемого «мозгового штурма».

Знания об объекте можно формировать путем использования статистической обработки информации и информации о результатах имитационных экспериментов.

Другим важным источником знаний является Интернет. Помимо традиционного поиска необходимой информации и знаний в Интернет, в настоящее время в процесс поиска знаний вовлекаются интеллектуальные агенты.

Автоматизация процесса сбора знаний

Автоматизация извлечения знаний и запись их в БЗ. Неавтоматизированный сбор знаний специалистов трудоемкий процесс. В развитых интеллектуальных системах предусматриваются вспомогательные средства для приобретения знаний.

Автоматическая структуризация неформальных знаний, доступных в Интернет через распределенную гипермедиа систему - Web. Технология гипермедиа через Web обеспечивает идеальный подход для развития систем, основанных на знаниях путем расширения возможностей каналов человеко-машинного взаимодействия. Этот новый подход к интеграции технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как они будут формализованы. Многие Web - механизмы поиска включают интеллектуальных агентов для идентификации и поставки требуемой информации по индивидуальным потребностям и запросам. Причина экспоненциального роста количества информации, обеспечиваемого через Web-механизмы, вызывает развитие методов структуризации информации в распределенных гипермедиа системах. Такая интеграция между технологией гипермедиа и методами извлечения знаний может обеспечить мощный инструмент для извлечения знаний.

Представление знаний

Важное место в системах управления знаниями занимает проблема представления знаний, являющаяся ключевой.

Существует также ряд общих для всех СПЗ проблем. К ним можно отнести,
в частности, проблемы:

  • приобретения новых знаний и их взаимодействие с уже существующими;
  • организации ассоциативных связей;
  • выбора диапазона в размере элементов представления, связан-ной с тем, насколько «детально могут быть описаны объекты и события, и какая часть внешнего мира может быть представлена в конкретной системе»;
  • неоднозначности и выбора семантических примитивов;
  • модульности и понимания;
  • явности знаний и доступности;
  • выбора соотношения декларативной и процедурной составляющих представления, что влияет на экономичность системы, полноту, легкость кодировки и понимания.

Модели представления знаний

Модели представления знаний можно условно разделить на декларативные и процедурные.

Декларативная модель представления знаний основывается на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом оказываются раздельными синтаксические и семантические аспекты знания, что является достоинством указанных форм представления из-за возможности достижения их определенной универсальности.

В декларативных моделях не содержатся в явном виде описания выполняемых процедур. Эти модели представляют собой множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния.

Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

В процедурном представлении знания содержатся в процедурах небольших программах, которые определяют, как выполнять специфичные действия (как поступать в специфичных ситуациях).

При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий. При процедурном представлении знаний семантика непосредственно заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений.

Выбор способа представления знаний

Важным вопросом при создании БЗ является выбор способа представления знаний. Цель представления знаний — организация необходимой информации в такую форму, чтобы программа ИИ имела легкий доступ к ней для принятия решений, планирования, узнавания объектов и ситуаций, анализа сцен, вывода заключений и других когнитивных функций.

Основные типы моделей представления знаний применительно к процессу разработки БЗ:

  • При использовании логики предикатов первого порядка (дедуктивной логики) БЗ может рассматриваться как совокупность логических формул, которые обеспечивают частичное описание проблемной среды.
  • Семантические сети позволяют описывать свойства и отношения объектов событий, понятий, ситуаций или действий с помощью направленного графа, состоящего из вершин и помеченных ребер.
  • Фреймы представляют собой декларативно-процедурные структуры. Во многих фреймовых структурах возможна реализация наследственных отношений, при которых объекты могут наследовать атрибуты более абстрактных объектов. Такая форма организации знаний позволяет экономить объем памяти.
  • Продукционные модели (основанные на правилах вида Если-То) являются наиболее популярным способом представления знаний. При организации знаний с использованием продукционных моделей в БЗ содержатся правила продукций, а в БД содержится информация, которая отображает текущее состояние решаемой задачи. Инициализацию необходимого правила осуществляет блок управления.
  • Большие трудности возникают при создании моделей нечетких знаний.

Формализация таких знаний осуществляется на основе теории нечетких множеств. Развиваются также модели на основе искусственных нейронных сетей (ИНС), многоагентных систем, генетических алгоритмов и другие моделипредставления и обработки знаний.

Поиск и хранение знаний

Поиcк и хранение необходимых знаний cвязаны c понятием корпоративной памяти, которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок, что является пока достаточно труднореализуемым на практике.
Корпоративная память хранит неоднородную информацию из различных иcточников и делает ее доступной пользователям для решения корпоративных задач.

Становится актуальной разработка модели представления знаний, которая обеспечивала бы автоматизированную обработку информации на cемантическом уровне в системах управления знаниями.

Большую популярность в последнее время приобретают онтологии.

Методы инженерии знаний

В области инженерии знаний было созданы различные средства и модели, позволяющие эффективно управлять знаниями и их представлением. Рассмотрим некоторые из них на нашей странице, посвященной методам инженерии знаний.

Ссылки по теме

  1. http://www.ozon.ru/context/detail/id/5402790/ Книга "Управление знаниями корпорации и реинжиниринг бизнеса". Абдикеев Н.М., Киселев А.Д. Основными ресурсами развития компаний во все большей мере становятся люди и знания, которыми они обладают, интеллектуальный капитал и растущая профессиональная компетенция кадров. Сегодня требуются новые методы развития организации, основанные на стыке гуманитарного и инженерного подходов, что позволит получить синергетический эффект от их взаимодействия. Этот подход базируется на современных достижениях информационных технологий, а именно когнитивных технологиях развития организации. Актуально развитие симбиоза концепции управления знаниями, реинжиниринга, бизнес-процессов и когнитивной человеческой составляющей.
  2. http://www.novsu.ru/file/106360 Сайт Новгородского Государственного Университета предоставляет статью на тему инженерии знаний. В статье представлен обзор некоторых теоретических аспектов получения знаний, рассматриваются практические методы получения знаний, а также информация о структурирование знаний.
  3. http://old.ulstu.ru/people/SOSNIN/umk/Knowledge_Engineering/gl_17_2.htm Сайт Ульяновского Государственного Технического Университета. На странице представлены материалы по вопросу извлечения знаний. Приводится классификация некоторых методов извлечения знаний, а также их практическое применение.
  4. http://innovatika.boom.ru/UZ.htm На сайте выложена первая глава книги В. П. Баранчеева «Управление знаниями ». В. П. Баранчеев - доктор экономических наук, профессор Государственного университета управления (Институт инноватики и логистики, кафедра инновационного менеджмента). В книге рассматриваются современные концепции управления знаниями, неформализованное и формализованное знание, а также базы знаний.
  5. http://www.knowbase.ru/ Сайт, посвященный базам данных. На странице вводятся понятия знаний, информации, управление знаниями, познание и т.д. Также описаны некоторые возможности баз знаний, а также рассказывается об их практическом применении и проблемах, связанных с их использованием. Каждому понятию отведена отдельная веб-страница.
  6. http://lingvoworks.org.ua/index.php?option=com_content&view=article&id=
    57:2009-12-09-11-34-05&catid=2:misc&Itemid=3 В статье рассматриваются вопросы построения, структурирования, описания, классификации и использования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению формальных и лингвистических онтологий. Также, предложена достаточно подробная методология построения ресурсов онтологического типа.
  7. http://aimatrix.nm.ru/aimatrix/SemanticNetworks.htm Статья, повященная семантическим сетям. Описывается история создания семантических сетей, а также принципы построения и классификация.
  8. http://bibl.tikva.ru/base/B1253/B1253Part12-59.php Статья о когнитивных картах. Приводится несколько примеров использования когнитивных карт.
  9. http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%
    D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_
    %D1%81%D0%B5%D1%82%D1%8C Материал из википедии. Статья о семантических сетях.
  10. http://lsdis.cs.uga.edu/projects/glycomics/report/Report2006.html Сайт научно-исследовательского центра. Можно найти пример визуализации биохимической и биологической онтологии.
  11. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.41.1007 В статье дается обзор исследований в области инженерии знаний, описываются принципы и методы, а также два подхода, сформированные в данной области. Ссылка на статью в формате pdf содержится на веб-странице.
  12. http://www.vk-engineering.com/ Веб-сайт, посвященный инженерии знаний. На сайте можно увидеть новости, результаты научных исследований в виде статей, презентаций, видео.
  13. http://www.commonkads.uva.nl/INFO/course-slides/01-intro.ppt#257,1,Introduction to Knowledge Engineering Презентация. Введение в инженерию знаний. История и терминология.
  14. http://web.cs.wpi.edu/~jburge/thesis/kematrix.html Краткий обзор методов извлечения знаний.
  15. http://cranedge.wordpress.com/2010/11/15/strategic-knowledge-engineering/ Стратегия инженерии знаний. Автор статьи Jesu Valiant.