Многопеременная логистическая функция

Материал из testwiki
Перейти к навигации Перейти к поиску

Многопеременная логистическая функция (в программировании также используется Шаблон:Lang-en) — это обобщение логистической функции для многомерного случая. Функция преобразует вектор z размерности K в вектор σ той же размерности, где каждая координата σi полученного вектора представлена вещественным числом в интервале [0,1] и сумма координат равна 1.

Координаты σi вычисляются следующим образом:

σ(z)i=ezik=1Kezk

Применение в машинном обучении

Многопеременная логистическая функция применяется в машинном обучении для задач классификации, когда количество возможных классов больше двух (для двух классов используется логистическая функция). Координаты σi полученного вектора при этом трактуются как вероятности того, что объект принадлежит к классу i. Вектор-столбец z при этом рассчитывается следующим образом:

z=wTxθ

где x — вектор-столбец признаков объекта размерности M×1; wTтранспонированная матрица весовых коэффициентов признаков, имеющая размерность K×M; θ — вектор-столбец с пороговыми значениями размерности K×1 (см. перцептрон), где K— количество классов объектов, а M — количество признаков объектов.

Часто Softmax используется для последнего слоя глубоких нейронных сетей для задач классификации. Для обучения нейронной сети при этом в качестве функции потерь используется перекрёстная энтропия.

Шаблон:Math-stub Шаблон:Нет ссылок

Шаблон:Машинное обучение