Основы инженерии знаний. Инженерия знаний и получение знаний Поиск и хранение знаний

Классификация знаний

Знания бывают классифицированы на следующие категории:

¨ Поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области.

¨ Глубинные – абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания могут использоваться для прогнозирования поведения объекта.

К примеру, поверхностные знания бывают описаны следующим предложением:

ʼʼВ случае если болит голова, то следует выпить аспиринʼʼ.

При этом можно также рассмотреть глубинные знания:

ʼʼЗнания физиологов и врачей высокой квалификации о причинах, видах головных болей и методах их леченияʼʼ.

Знания, которыми обладает человек, делятся на формализованные (точные) и слабо формализованные (неточные). Формализованные знания можно зафиксировать в виде определœений, формул, алгоритмов, моделœей и т.п. Неформализованные знания - ϶ᴛᴏ знания, для которых отсутствует алгоритм (модель, метод) их получения. Эти знания трудно сформулировать, так как они, как правило, являются результатом обобщения многолетнего опыта человека. К примеру, мы не всœегда можем ответить: почему мы приняли то или иное решение, говорим, что оно пришло на интуитивном уровне.

Инженерия знаний – достаточно молодое направление искусственного интеллекта͵ появившаяся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности ʼʼдобычиʼʼ и формализации знаний. Инженерия знаний напрямую связана с проектированием баз знаний , ᴛ.ᴇ. получению и структурированию знаний специалистов для последующей разработки интеллектуальных информационных систем (ИИС).

Для БЗ характерны информационные массивы небольшого объёма (в отличие от баз данных) являющиеся исключительно дорогими. В базе знаний можно проводить выбор по запросу информации, явно не хранимой, а выводимой из имеющихся данных. Базы знаний используются для хранения знаний и построения на их базе ИИС. Для этого знания крайне важно представить в форме, понятной компьютеру.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, идеология создания базы знаний в основном связана с формализацией знаний (или памяти человека). Модели памяти разрабатываются когнитивной психологией. Когнитивная психология (психология познания) занимается, прежде всœего, изучением способов восприятия и понимания знаний человеком.

Процесс представления знаний представляет собой формализацию знаний об определœенной области. В конечном итоге, знания должны быть представлены в форме, которая будет пригодна для создания интеллектуальной системы. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, крайне важно создание определœенных схем, позволяющих описать знания на некотором формальном языке.

Выделяют декларативные и процедурные знания. Декларативные знания хранятся в виде фактов и утверждений об объектах и отношений между этими объектами. К моделям представления таких знаний относятся, предикаты, семантические сети, фреймы. Процедурные знания хранятся в процедурах и выводятся в виде алгоритмов. К моделям их представления относятся правила продукции.

Особенности, присущие некоторым слабоструктурированным задачам, такие, как разнородность информации, неполнота и неопределœенность исходных данных и т.д. делают привлекательным использование качественных знаний. Для их формализации используются методы нечеткой математики.

Извлечение знаний - ϶ᴛᴏ процедура взаимодействия специалиста с источником знаний, в результате которой становится явным процесс рассуждений специалиста при принятии решения и структура его представления о предметной области.

Условно данный процесс включает можно разбить на три этапа:

1. Формулировка проблемы – определœение целœей и задачей получения знаний;

2. Сбор информации из различных источников. Следует отметить, что в качестве эксперта может выступа не только человек, но и любой другой источник информации (справочники, статьи, видеозаписи и т.д.);

3. Разработка формализма (модели) знаний о предметной области.

Рис. 2.1 – Методы получения знаний

Инженерия знаний (ИЗ) была определена Фейгенбаумом и МакКордак в 1983 году как:

«ИЗ - раздел (дисциплина) инженерии, направленный на внедрение знаний в компьютерные системы для решения сложных задач, обычно требующих богатого человеческого опыта.»

В настоящее время это также предполагает создание и обслуживание подобных систем (Кендэл, 2007). Это также тесно соприкасается с разработкой программного обеспечения и используется во многих информационных исследованиях, например таких, как исследования искусственного интеллекта, включая базы данных, сбор данных, экспертные системы, систем поддержки принятия решений и географические информационные системы. ИЗ связана с математической логикой, также используемой в разных научных дисциплинах, например в социологии где «подопытными» являются люди, а цели исследований - понимание, как работает человеческая логика на примере взаимоотношений в обществе.

Примеры

Пример действия системы, базирующейся на ИЗ:

  • Рассмотрение задачи
  • Запрос к базам данных по задаче
  • Внесение и структурирование полученной информации (IPK модель)
  • Создание базы данных по структурированной информации
  • Тестирование полученной информации
  • Внесение корректировок и доработка системы.

ИЗ имеет практическое применение. В США до 90 % кредитных решений по клиентам розничного банковского бизнеса принимается с использованием экспертных систем на основе баз знаний FICO . Подразделом ИЗ является метаинженерия знаний, пригодная для разработки ИИ.

Принципы

С середины 1980-х в ИЗ появилось несколько принципов, методов и инструментов, которые облегчили процесс получения и работы со знаниями. Вот некоторые ключевые из них:

В инженерии знаний используются методы структурирования знаний для убыстрения процесса получения и работы со знаниями.

Определения

Инженерия знаний (ИЗ) была определена Фейгенбаумом и МакКордаком в 1983 году как:

«ИЗ - раздел (дисциплина) инженерии, направленный на внедрение знаний в компьютерные системы для решения сложных задач, обычно требующих богатого человеческого опыта.»

В настоящее время это также предполагает создание и обслуживание подобных систем (Кендэл, 2007). Это также тесно соприкасается с разработкой программного обеспечения и используется во многих информационных исследованиях, например таких, как исследования искусственного интеллекта, включая базы данных, сбор данных, экспертные системы, систем поддержки принятия решений и географические информационные системы. ИЗ связана с математической логикой, также используемой в разных научных дисциплинах, например в социологии где «подопытными» являются люди, а цели исследований - понимание, как работает человеческая логика на примере взаимоотношений в обществе.

Примеры

Пример действия системы, базирующейся на ИЗ:

  • Рассмотрение задачи
  • Запрос к базам данных по задаче
  • Внесение и структурирование полученной информации (IPK модель)
  • Создание базы данных по структурированной информации
  • Тестирование полученной информации
  • Внесение корректировок и эволюция системы.

Будучи скорее искусством, нежели чисто инженерной задачей, ИЗ не имеет большого практического применения. Подразделом ИЗ является метаинженерия знаний, пригодная для разработки ИИ.

Принципы

С середины 1980-х в ИЗ появилось несколько принципов, методов и инструментов, которые облегчили процесс получения и работы со знаниями. Вот некоторые ключевые из них:

  • Существуют разного рода типы знаний [какие? ] и для работы с ними должны использоваться конкретные методы и техника. [какие? ]
  • Существуют различные типы экспертов и опыта. [какие? ] Для работы с ними должны использоваться определенные методы и техника. [какие? ]
  • Существуют разные способы предоставления, использования, понимания знаний [какие? ] и работа с ними может помочь переосмыслить и использовать уже имеющиеся знания по-новому.

В инженерии знаний используются методы структурирования знаний для убыстрения процесса получения и работы со знаниями.

Теории

  • Трансляционная (традиционная): предполагает прямой перенос человеческих знаний в машину.
  • Модельная (альтернативный взгляд): предполагает моделирование задачи и её способов решения самой системой ИИ .
  • Гибридные.

Wikimedia Foundation . 2010 .

  • Днестровские плавни
  • Пршо, Дадо

Смотреть что такое "Инженерия знаний" в других словарях:

    Инженерия знаний - научное направление, занимающееся разработкой языков и форм представления знаний, методов их наполнения и использования при решении тех или иных проблем, исследованием процедур проверки корректности знаний. Инженерия знаний разрабатывает такие… … Основы духовной культуры (энциклопедический словарь педагога)

    Фрейм (инженерия знаний) - У этого термина существуют и другие значения, см. Фрейм. Фрейм (англ. frame «каркас» или «рамка») способ представления знаний в искусственном интеллекте, представляющий собой схему действий в реальной ситуации. Первоначально… … Википедия

    Инженерия - Инженерное дело (инженерия) область человеческой интеллектуальной деятельности, дисциплина, профессия, задачей которой является применение достижений науки, техники, использование законов физики и природных ресурсов для решения конкретных… … Википедия

    Инженерия производительности - (англ. Performance Engineering) часть системотехники, включающая в себя набор ролей, знаний, практик, инструментов и результатов и применяющаяся на каждом этапе Цикла разработки программного обеспечения с целью убедиться в том, что создаваемое,… … Википедия

    Инженерия программного обеспечения - Новый Airbus A 380 использует довольно много ПО, чтобы создать современную кабину в самолете. Метод инженерии программного обеспечения позволил создать программное обеспечение самолёта, описываемое миллионами строк … Википедия

    Представление знаний - Представление знаний вопрос, возникающий в когнитологии (науке о мышлении), в информатике и в исследованиях искусственного интеллекта. В когнитологии он связан с тем, как люди хранят и обрабатывают информацию. В информатике с подбором … Википедия

    База знаний - (БЗ; англ. knowledge base, KB) в информатике и исследованиях искусственного интеллекта это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую… … Википедия

    Продукционная модель представления знаний - В данной статье или разделе имеется список источников или внешних ссылок, но источники отдельных утверждений остаются неясными из за отсутствия сносок … Википедия

    Логическая модель представления знаний - Логическая модель представления знаний модель в представлении знаний. Основная идея подхода при построении логических моделей представления знаний вся информация, необходимая для решения прикладных задач, рассматривается как… … Википедия

Это краткий ответ на экзаменационный вопрос по системам искусственного интеллекта (все вопросы).

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Инженерия знаний нацелена на создание умелых компьютерных систем, целью которых является, во-первых, извлечь знания, которыми располагают специалисты, а во-вторых, потом так организовать их, чтобы обеспечить эффективное использование.

Подходы

Два основных подхода: преобразование знаний, построение моделей.

  1. Преобразование знаний - процесс преобразования и трансформации экспертизы и переход от знаний эксперта к программной реализации знаний. Считался основой разработки Knowledge Based Systems. Знания представляются в виде правил. Недостатки: невозможность адекватного представления разных типов знаний и неявных знаний, сложность отображения большого количества правил.
  2. Построение моделей. Процесс создания СИИ рассматривается как деятельность по моделированию, т.е. создание СИИ означает построение комп. модели, которая решает задачи в предметной области как эксперт. Модель не имитирует деятельность эксперта на когнитивном уровне, а позволяет получать тот же результат. Процесс создания KBS: создание модели предм. области, разработка методов оперирования моделью, методов лог. вывода на модели, оценка результатов моделирования.

представляет собой совокупность моделей, методов и технических приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Фактически инженерия знаний – это теория, методология и технология, которые охватывают методы добычи, анализа, представления и обработки знаний экспертов.

Представление знаний, их обработка и использование, рассматриваемые применительно к конкретной прикладной области, являются предметом инженерии знаний.

На высоком уровне, процесс инженерии знаний состоит из двух:

1. – преобразование «сырых знаний» в организованные.

2. – преобразование организованных знаний в реализованные.

С областью инженерии знаний тесно связано понятие .

Сущностью можно считать научный анализ и автоматизацию интеллектуальных функций человека. Однако для большинства проблем общая реальность – трудность их машинного воплощения. Исследования по ИИ позволили утвердиться во мнении, что подлинно необходимым для решения проблем являются знания экспертов, т.е. если создать систему, способную запоминать и использовать знания экспертов, то она найдет применение в практической деятельности.

История возникновения термина

Инженерия знаний тесно связана со всем процессом разработки интеллектуальных информационных систем в целом и (ЭС) в частности – от возникновения замысла до его реализации и совершенствования.

В конце 1960-х и начале 1970-х гг. под руководством Э.Фейгенбаума в Стенфордском университете США была создана система DENDRAL, а позднее – MYCIN. Поскольку эти системы накапливают в памяти компьютера знания экспертов и используют эти знания для решения проблем, извлекая их при необходимости из памяти, то они получили названия экспертных, а профессор Э.Фейгенбаум, являющийся одним из создателей экспертных систем (ЭС), выдвинул для данной области техники название «инженерия знаний». Слово «engineering» в английском языке означает искусную обработку предметов, изобретение или создание чего-либо. Следовательно, работу по оснащению программ специальными экспертными знаниями из проблемной области, выполняемую человеком либо компьютером (программой), также можно назвать «инженерией знаний».

Базы знаний.

Совокупность сведений, понятий, представлений о чем-либо, полученных, приобретенных, накопленных в результате учения, опыта, в процессе жизни и т.д. и обычно реализуемых в деятельности. Более формальные определения применяемые обычно в рамках менеджмента знаний:

Представление знаний, их обработка и использование, рассматриваемое применительно к конкретнойприкладной области, является предметом инженерии знаний. Коллекция совместно организованных знаний, относящихся к задачам, решаемым в системе искусственного интеллекта (ИИ), называется базой знаний (БЗ).

Итак, - это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом систем Искусственного интеллекта и Экспертных систем. Большинство БЗ ограничены в некоторой специальной, обычно узкой предметной области, в которой они сосредоточены.При создании БЗ технология ИИ позволяет встраивать в компьютер механизм и способности вывода, основывающиеся на фактах и отношениях, содержащихся в БЗ.

Задачи инженерии знаний.

Анализ предметной и проблемной областей.

Предметная область - сфера человеческой деятельности, выделенная и описанная согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду.

Проблемная область - комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых в производственной системе, и стоящих перед ней целях.

При исследовании экономических систем и решаемых ими задач с целью формализации знаний в БЗ и работе необходимо учитывать специфику таких систем. Экономическим системам присуща динамичность функционирования, частая смена ситуаций, обновление больших массивов измерительных и других данных, характеризующих состояние объекта. Они часто функционируют в условиях полной определенности из-за действия случайных возмущающих факторов.

Приобретение знаний.

Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации.

Классификация этапов обучения, соответствующих способностям компьютеров к формализации знаний:

А. Получение информации без логических выводов.

1. Ввод программ.

2. Ввод фактических данных.

Б. Получение извне информации, уже представленной в виде знаний.

1. Получение готового набора знаний, представленных во внутреннем формате.

2. Получение знаний, представленных во внутреннем формате, в режиме диалога.

3. Получение знаний, представленных во внешнем формате, и их понимание.

В. Обучение по примерам.

1. Параметрическое обучение.

2. Обучение на основе выводов по аналогии.

3. Обучение на основе выводов по индукции – эвристическое обучение.

Г. Приобретение знаний на метауровне.

В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную область, так и инженерию знаний. Таких посредников называют инженерами знаний (инженерами по знаниям).

Итак, – это специалист по искусственному интеллекту, проектирующий и создающий Экспертную систему или другую информационную систему.

Выявление источников знаний.

Выявление источников знаний и работа с ними - основная задача инженера знаний.

Инженер знаний выполняет важные функции при разработке БЗ. Он должен хорошо ориентироваться в проблемной области и быть неплохим психологом, чтобы общаться с экспертом в процессе приобретения знаний. Вместе с тем он должен хорошо знать и возможности программного обеспечения компьютеров, чтобы структурировать знания для хранения и работы с ними. Основным источником знаний о проблемной области является человек-эксперт. Эксперт - специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области.

Инженер знаний работает с ним в режиме диалога или интервью и формирует необходимый объем знаний и сведений для работы с объектом. Возможно также использование опросников, которые затем соответствующим образом обрабатываются.

Табл.1 Методы извлечения знаний из предметного эксперта.

Метод

Описание

Наблюдение на рабочем месте

Наблюдать за экспертом, решающим реальные задачи на своем рабочем месте.

Обсуждение задач

Выявить виды данных, знаний и процедур, необходимых для решения конкретных задач.

Описание задач

Попросить эксперта описать прототипную задачу для каждой категории возможных ответов.

Анализ задачи

Представить эксперту ряд реалистических задач для решения вслух с целью выявить логические основания конкретных шагов рассуждения.

Доводка системы

Попросить эксперта предоставить вам несколько задач для решения и с использованием правил, выявленных во время интервью.

Оценивание системы

Попросить эксперта проверить работу системы и подвергнуть критике правила и структуру управления прототипной системой.

Проверка системы

Предоставить примеры, решенные экспертом и прототипом системы, другим независимым экспертам для сравнения и оценки.

Для некоторых задач источниками дополнительной информации являются книги, технологические описания, инструкции, документы . Используются также методы так называемого « мозгового штурма».

Знания об объекте можно формировать путем использования статистической обработки информации и информации о результатах имитационных экспериментов.

Другим важным источником знаний является Интернет. Помимо традиционного поиска необходимой информации и знаний в Интернет, в настоящее время в процесс поиска знаний вовлекаются интеллектуальные агенты.

Автоматизация процесса сбора знаний.

Автоматизация извлечения знаний и запись их в БЗ . Неавтоматизированный сбор знаний специалистов трудоемкий процесс. В развитых интеллектуальных системах предусматриваются вспомогательные средства для приобретения знаний.

Автоматическая структуризация неформальных знаний , доступных в Интернет через распределенную гипермедиа систему – Web. Технология гипермедиа через Web обеспечивает идеальный подход для развития систем, основанных на знаниях путем расширения возможностей каналов человеко–машинного взаимодействия. Этот новый подход к интеграции технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как они будут формализованы. Многие Web – механизмы поиска включают интеллектуальных агентов для идентификации и поставки требуемой информации по индивидуальным потребностям и запросам. Причина экспоненциального роста количества информации, обеспечиваемого через Web-механизмы, вызывает развитие методов структуризации информации в распределенных гипермедиа системах. Такая интеграция между технологией гипермедиа и методами извлечения знаний может обеспечить мощный инструмент для извлечения знаний.

Представление знаний.

Важное место в системах управления знаниями занимает проблема представления знаний, являющаяся ключевой.

Существует также ряд общих для всех СПЗ проблем. К ним можно отнести,

в частности, проблемы:

приобретения новых знаний и их взаимодействие с уже существующими;

организации ассоциативных связей;

выбора диапазона в размере элементов представления, связан­ной с тем, насколько «детально могут быть описаны объекты и события, и какая часть внешнего мира может быть представлена в конкретной системе»;

неоднозначности и выбора семантических примитивов;

модульности и понимания;

явности знаний и доступности;

выбора соотношения декларативной и процедурной составляющих представления, что влияет на экономичность системы, полноту, легкость кодировки и понимания.

Модели представления знаний.

Модели представления знаний можно условно разделить на декларативные и процедурные .

Декларативная модель представления знаний основывается на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода , оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом оказываются раздельными синтаксические и семантические аспекты знания, что является достоинством указанныхформ представленияиз-завозможности достиженияих определенной

универсальности.

В декларативных моделях не содержатся в явном виде описания выполняемых процедур. Эти модели представляют собой множество утверждений. Предметная область представляется в виде

синтаксического описания ее состояния.

Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

В процедурномпредставлении знания содержатсявпроцедурах небольших программах, которые определяют, как выполнять специфичные действия (как поступать в специфичных ситуациях).

При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состоянияипроцедуры, генерирующиенеобходимые описания ситуаций и действий. При процедурном представлении знаний семантика непосредственно заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений.

Выбор способа представления знаний.

Важным вопросом при создании БЗ является выбор способа представления знаний. Цель представления знаний - организация необходимой информации в такую форму, чтобы программа ИИ имела легкий доступ к ней для принятия решений, планирования, узнавания объектов и ситуаций, анализа сцен, вывода заключений и других когнитивных функций.

Основные типы моделей представления знаний применительно к процессу разработки БЗ:

При использовании логики предикатов первого порядка (дедуктивной логики) БЗ может рассматриваться как совокупность логических формул, которые обеспечивают частичное описание проблемной среды.

позволяют описывать свойства и отношения объектов событий, понятий, ситуаций или действий с помощью направленного графа, состоящего из вершин и помеченных ребер.

Фреймы представляют собой декларативно-процедурные структуры. Во многих фреймовых структурах возможна реализация наследственных отношений, при которых объекты могут наследовать атрибуты более абстрактных объектов. Такая форма организации знаний позволяет экономить объем памяти.

Продукционные модели (основанные на правилах вида Если-То) являются наиболее популярным способом представления знаний. При организации знаний с использованием продукционных моделей в БЗ содержатся правила продукций, а в БД содержится информация, которая отображает текущее состояние решаемой задачи. Инициализацию необходимого правила осуществляет блок управления.

Большие трудности возникают при создании моделей нечетких знаний.

Формализация таких знаний осуществляется на основе теории нечетких множеств. Развиваются также модели на основе искусственных нейронных сетей (ИНС), многоагентных систем, генетических алгоритмов и другие моделипредставления и обработки знаний.

Поиск и хранение знаний.

Пои c к и хранение необходимых знаний c вязаны c понятием корпоративной памяти , которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок, что является пока достаточно труднореализуемым на практике.

Корпоративная память хранит неоднородную информацию из различных и c точников и делает ее доступной пользователям для решения корпоративных задач.

Становится актуальной разработка модели представления знаний, которая обеспечивала бы автоматизированную обработку информации на c емантическом уровне в системах управления знаниями.

Большую популярность в последнее время приобретают онтологии.

В области инженерии знаний было созданы различные средства и модели, позволяющие эффективно управлять знаниями и их представлением. Рассмотрим некоторые из них на нашей странице, посвященной методам инженерии знаний.