ID3 (алгоритм)

Материал из testwiki
Версия от 10:33, 19 октября 2024; imported>MBHbot (Литература: Project talk:Викификатор#Шаблон:Rq, replaced: {{rq|sources}} → {{подст:нет источников}})
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Шаблон:Значения Алгоритм ID3 — один из алгоритмов для построения дерева принятия решений. Разработан Джоном Р. Квинланом (Шаблон:Lang-en). Впоследствии Квинлан создал усовершенствованную версию — алгоритм C4.5.

Алгоритм

  1. Взять все неиспользованные признаки и посчитать их энтропию относительно тестовых образцов
  2. Выбрать признак, для которого энтропия минимальна (а информационная выгода соответственно максимальна)
  3. Сделать узел дерева, содержащий этот признак

Алгоритм следующий:

ID3(Таблица примеров, Целевой признак, Признаки)

  1. Если все примеры положительны, то возвратить узел с меткой «+».
  2. Если все примеры отрицательны, то возвратить узел с меткой «-».
  3. Если множество признаков пустое, то возвратить узел с меткой, которая больше других встречается в значениях целевого признака в примерах.
  4. Иначе:
    1. A — признак, который лучше всего классифицирует примеры (с максимальной информационной выгодой).
    2. Создать корень дерева решения; признаком в корне будет являться A.
    3. Для каждого возможного значения A (vi):
      1. Добавить новую ветвь дерева ниже корня с узлом со значением A=vi
      2. Выделить подмножество Examples(vi) примеров, у которых A=vi.
      3. Если подмножество примеров пусто, то ниже этой новой ветви добавить узел с меткой, которая больше других встречается в значениях целевого признака в примерах.
      4. Иначе, ниже этой новой ветви добавить поддерево, вызывая рекурсивно ID3(Examples(vi), Целевой признак, Признаки)
  5. Возвратить корень.

Литература

Шаблон:Computer-sci-stub Шаблон:Нет источников