Многопеременная логистическая функция: различия между версиями
imported>РобоСтася м checkwiki fixes (1, 2, 9, 17, 22, 26, 38, 48, 50, 52, 54, 64, 65, 66, 76, 81, 86, 88, 89, 101) |
(нет различий)
|
Текущая версия от 21:19, 14 сентября 2024
Многопеременная логистическая функция (в программировании также используется Шаблон:Lang-en) — это обобщение логистической функции для многомерного случая. Функция преобразует вектор размерности в вектор той же размерности, где каждая координата полученного вектора представлена вещественным числом в интервале [0,1] и сумма координат равна 1.
Координаты вычисляются следующим образом:
Применение в машинном обучении
Многопеременная логистическая функция применяется в машинном обучении для задач классификации, когда количество возможных классов больше двух (для двух классов используется логистическая функция). Координаты полученного вектора при этом трактуются как вероятности того, что объект принадлежит к классу . Вектор-столбец при этом рассчитывается следующим образом:
где — вектор-столбец признаков объекта размерности ; — транспонированная матрица весовых коэффициентов признаков, имеющая размерность ; — вектор-столбец с пороговыми значениями размерности (см. перцептрон), где — количество классов объектов, а — количество признаков объектов.
Часто Softmax используется для последнего слоя глубоких нейронных сетей для задач классификации. Для обучения нейронной сети при этом в качестве функции потерь используется перекрёстная энтропия.