Сигмоида

Материал из testwiki
Версия от 15:49, 20 октября 2024; imported>MBHbot (Project talk:Викификатор#Шаблон:Rq, replaced: {{rq|sources}} → {{подст:нет источников}})
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску
Логистическая кривая (сигмоида)

Сигмо́ида (также сигмо́ид) — это гладкая монотонная возрастающая нелинейная функция, имеющая форму буквы «S», которая часто применяется для «сглаживания» значений некоторой величины.

Часто под сигмоидой понимают логистическую функцию

σ(x)=11+ex.

Сигмоида ограничена двумя горизонтальными асимптотами, к которым стремится при стремлении аргумента к ±. В зависимости от соглашения, этими асимптотами могут быть Шаблон:Nobr±) либо Шаблон:Nobr в и Шаблон:Nobr в +.

Производная сигмоиды представляет собой колоколообразную кривую с максимумом в нуле, асимптотически стремящуюся к нулю в +.

Семейство функций класса сигмоид

Сравнение некоторых сигмоидных функций, нормализованных таким образом, чтобы производная в начале координат была равна 1

В семейство функций класса сигмоид входят такие функции, как арктангенс, гиперболический тангенс и другие функции подобного вида.

f(x)=11+e2αx,α>0.
  • Рациональная сигмоида:
f(x)=x|x|+α,α>0.
f(x)=arctgx.
f(x)=thxα=exαexαexα+exα.
  • Гладкая ступенька N-го порядка:
f(x)={(01(1u2)N du)10x(1u2)N du|x|1sgn(x)|x|1N1.
  • Корневая сигмоида:
f(x)=x1+x2.
f(x)=(1+ex)1.
f(x)=(1+ex)α,α>0.
f(x)=erf(x)=2π0xet2dt.
f(x)=gdx=0x1coshtdt=arctg(shx).

Применение

Нейронные сети

Сигмоиды применяются в нейронных сетях в качестве функций активации. Они позволяют нейронам как усиливать слабые сигналы, так и не насыщаться от сильных сигналов[1].

В нейронных сетях часто используются сигмоиды, производные которых могут быть выражены через саму функцию. Это позволяет существенно сократить вычислительную сложность метода обратного распространения ошибки, сделав его применимым на практике:

σ(x)=(1+σ(x))(1σ(x)) — для гиперболического тангенса;
σ(x)=σ(x)(1σ(x)) — для логистической функции.

Логистическая регрессия

Логистическая функция f(x)=11+ex используется в решении задач классификации с использованием логистической регрессии. Пусть решается задача классификации с двумя классами (y=0 и y=1, где y — переменная, указывающая класс объекта). Делается предположение о том, что вероятность принадлежности объекта к одному из классов выражается через значения признаков этого объекта x1,x2,...,xn (действительные числа):

{y=1x1,,xn}=f(a1x1++anxn)=11+exp(a1x1anxn),

где a1,...,an — некоторые коэффициенты, требующие подбора, обычно, методом наибольшего правдоподобия.

Именно такая функция f(x) получается при использовании обобщённой линейной модели и предположения, что зависимая переменная y распределена по закону Бернулли.

См. также

Литература

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Нет источников Шаблон:Машинное обучение