Произведение Хатри — Рао

Материал из testwiki
Версия от 08:02, 3 сентября 2024; imported>РобоСтася (checkwiki fixes (1, 2, 9, 17, 22, 48, 50, 52, 54, 64, 65, 66, 76, 86, 88, 89, 101), replaced: – → – (2))
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Произведение Хатри — Рао — операция умножения матриц, определяемая выражением[1][2]:

𝐀𝐁=(𝐀ij𝐁ij)ij

в котором ij-й блок является произведением Кронекера mipinjqj соответствующих блоков 𝐀 и 𝐁 при условии, что количество строк и столбцов обеих матриц равно. Размерность произведения — imipi×jnjqj.

К примеру, если матрицы 𝐀 и 𝐁 имеют блочную размерность Шаблон:Nowrap:

𝐀=[𝐀11𝐀12𝐀21𝐀22]=[123456789] и 𝐁=[𝐁11𝐁12𝐁21𝐁22]=[147258369],

то:

𝐀𝐁=[𝐀11𝐁11𝐀12𝐁12𝐀21𝐁21𝐀22𝐁22]=[1212214524421416457221245481].

Столбцовое произведение Хатри — Рао

Столбцовое произведение Кронекера двух матриц также принято называть произведением Хатри — Рао. Это произведение предполагает, что блоки матриц являются их столбцами. В этом случае m1=m, p1=p, n=q и для каждого j: nj=pj=1. Результатом произведения является mp×n-матрица, каждый столбец которой получается как произведение Кронекера соответствующих столбцов матриц 𝐀 и 𝐁. Например, для:

𝐂=[𝐂1𝐂2𝐂3]=[123456789] и 𝐃=[𝐃1𝐃2𝐃3]=[147258369]

столбцовое произведение:

𝐂𝐃=[𝐂1𝐃1𝐂2𝐃2𝐂3𝐃3]=[18212102431227420428254812305473263144072214881].

Столбцовая версия произведения Хатри — Рао используется в линейной алгебре для аналитической обработки данных[3] и оптимизации решений проблемы обращения диагональных матриц[4][5]; в 1996 году его было предложено использовать в описании задачи совместного оценивания угла прихода и времени задержки сигналов в цифровой антенной решётке[6], а также для описания отклика 4-координатного радара[7].

Торцевое произведение

Торцевое произведение матриц

Существует альтернативная концепция произведения матриц, которая в отличие от столбцовой версии использует разбиение матриц на строки[8] — торцевое произведение (Шаблон:Lang-en)[7][9][10] или транспонированное произведение Хатри — Рао (Шаблон:Lang-en)[11]. Этот тип матричного умножения базируется на построчном произведении Кронекера двух и более матриц с одинаковым количеством строк. Например, для:

𝐂=[𝐂1𝐂2𝐂3]=[123456789] и 𝐃=[𝐃1𝐃2𝐃3]=[147258369]

можно записать[7]:

𝐂𝐃=[𝐂1𝐃1𝐂2𝐃2𝐂3𝐃3]=[14728143122182032102540123048214263244872275481].

Основные свойства

Транспонирование (1996[7][9][12]):

(𝐀𝐁)T=AT𝐁T,

Коммутативность и ассоциативная операция[7][9][12]:

𝐀(𝐁+𝐂)=𝐀𝐁+𝐀𝐂,(𝐁+𝐂)𝐀=𝐁𝐀+𝐂𝐀,(k𝐀)𝐁=𝐀(k𝐁)=k(𝐀𝐁),(𝐀𝐁)𝐂=𝐀(𝐁𝐂),

где 𝐀, 𝐀 и 𝐂 — матрицы, а k — скаляр,

a𝐁=𝐁a,[12] где a - вектор с количеством элементов, равным количеству строк матрицы 𝐁,

Свойство смешанного произведения (1997[12]):

(𝐀𝐁)(𝐀T𝐁T)=(𝐀𝐀T)(𝐁𝐁T),
(𝐀𝐁)(𝐂𝐃)=(𝐀𝐂)(𝐁𝐃)[10],
(𝐀𝐁𝐂𝐃)(𝐋𝐌𝐍𝐏)=(𝐀𝐋)(𝐁𝐌)(𝐂𝐍)(𝐃𝐏)[11][13],
(𝐀𝐁)T(𝐀𝐁)=(𝐀T𝐀)(𝐁T𝐁)[14],

где обозначает произведение Адамара.

Также выполняются следующие свойства:

  • (𝐀𝐁)(𝐂𝐃)=(𝐀𝐂)(𝐁𝐃)[12],
  •  a(𝐁𝐂)=(a𝐁)𝐂,[7] где a - вектор-строка,
  • (𝐀𝐁)(𝐂𝐃)=(𝐀𝐂)(𝐁𝐃)[14],
  • (𝐀𝐁)(𝐂𝐃)=(𝐀𝐂)(𝐁𝐃)[13],
  • (𝐀𝐋)(𝐁𝐌)(𝐂𝐒)=(𝐀𝐁𝐂)(𝐋𝐌...𝐒),
  • cTdT=cTdT[12],
  • cd=cd, где c и d являются векторами согласованной размерности,
  • (𝐀cT)d=(𝐀dT)c[15], dT(c𝐀T)=cT(d𝐀T),
  • (𝐀𝐁)(cd)=(𝐀c)(𝐁d)[16], где c и d являются векторами согласованной размерности (следует из свойств 3 и 8),
  • (𝐀𝐁)(𝐌𝐍c𝐐𝐏d)=(𝐀𝐌𝐍c)(𝐁𝐐𝐏d),
  • 𝒲(C(1)xC(2)y)=(𝒲C(1)𝒲C(2))(xy)=𝒲C(1)x𝒲C(2)y,

где 𝒲 является матрицей дискретного преобразования Фурье, - символ векторной свёртки (тождество следует из свойств отсчётного скетча[17]),

  • 𝐀𝐁=(𝐀𝟏𝐜T)(𝟏𝐤T𝐁)[18], где 𝐀 - r×c матрица, 𝐁 - r×k матрица, 𝟏𝐜, 𝟏𝐤 - векторы из c и k единиц соответственно,
  • 𝐌𝐌=(𝐌𝟏T)(𝟏T𝐌)[19], где 𝐌 является r×c матрицей, - произведение Адамара и 𝟏 - вектор из c единиц.
  • 𝐌𝐌=𝐌[](𝐌𝟏T), где [] - символ проникающего торцевого произведения матриц.
  • По аналогии, 𝐏𝐍=(𝐏𝟏𝐜)(𝟏𝐤𝐍), где 𝐏 - c×r матрица, 𝐍 - k×r матрица,
  • 𝐖𝐝𝐀=𝐰𝐀[12],
  • vec((𝐰T𝐀)𝐁)=(𝐁T𝐀)𝐰[10],
  • vec(𝐀(𝐰𝐁))=(𝐁T𝐀)𝐰[11],
  • vec(𝐀T𝐖𝐝𝐀)=(𝐀𝐀)T𝐰[19],
  • vec(𝐀𝐖𝐝𝐀T)=(𝐀T𝐀T)T𝐰=(𝐀𝐀)𝐰,

где 𝐰 - вектор, сформированный из диагональных элементов матрицы 𝐖𝐝, vec(𝐀) - операция формирования вектора из матрицы 𝐀 путём расположения одного под другим её столбцов.

Свойство поглощения произведения Кронекера:

(𝐀𝐋)(𝐁𝐌)...(𝐂𝐒)(𝐊𝐓)=(𝐀𝐁...𝐂𝐊)(𝐋𝐌...𝐒𝐓)[10][13]
(𝐀𝐋)(𝐁𝐌)...(𝐂𝐒)(cd)=(𝐀𝐁...𝐂c)(𝐋𝐌...𝐒d),
(𝐀𝐋)(𝐁𝐌)...(𝐂𝐒)(𝐏c𝐐d)=(𝐀𝐁...𝐂𝐏c)(𝐋𝐌...𝐒𝐐d),

где c и d являются векторами согласованной размерности.

Например[16]:

([100110][101001])([1111][1111])([σ100σ2][ρ100ρ2])([x1x2][y1y2])=([100110][101001])([1111][σ100σ2][x1x2][1111][ρ100ρ2][y1y2])=[100110][1111][σ100σ2][x1x2][101001][1111][ρ100ρ2][y1y2].

Теорема[16]

Если M=T(1)T(c), где T(1),,T(c) представляют собой независимые включения матрицы T, содержащей строки T1,,Tmd, такие, что E[(T1x)2]=x22 и E[(T1x)p]1/papx2,
то |Mx2x2|<εx2 с вероятностью 1δ для любого вектора x, если количество строк
m=(4a)2cε2log1/δ+(2ae)ε1(log1/δ)c.

В частности, если элементами матрицы T являются числа ±1, можно получить m=O(ε2log1/δ+ε1(1clog1/δ)c), что при малых значениях ε согласуется с предельным значением m=O(ε2log1/δ) леммы Джонсона-Линденштрауса о распределении.

Блочное торцевое произведение

Примение блочного транспонированного торцевого произведения для описания отклика многогранной цифровой антенной решётки[13]

Для блочных матриц с одинаковым количеством столбцов в соответствующих блоках:

𝐀=[𝐀11𝐀12𝐀21𝐀22] и 𝐁=[𝐁11𝐁12𝐁21𝐁22]

согласно определению[7], блочное торцевое произведение 𝐀[]𝐁 запишется в виде:

𝐀[]𝐁=[𝐀11𝐁11𝐀12𝐁12𝐀21𝐁21𝐀22𝐁22].

Аналогично, для блочного транспонированного торцевого произведения (или блочного столбцового произведения Хатри — Рао) двух матриц 𝐀[]𝐁 с одинаковым количеством столбцов в соответствующих блоках имеет место соотношение[7]:

𝐀[]𝐁=[𝐀11𝐁11𝐀12𝐁12𝐀21𝐁21𝐀22𝐁22].

Выполняется свойство транспонирования[13]:

(𝐀[]𝐁)T=AT[]𝐁T

Приложения

Семейство торцевых произведений матриц используется в тензорно-матричной теории цифровых антенных решёток для радиотехнических систем[11].

Торцевое произведение получило широкое распространение в системах машинного обучения, статистической обработке больших данных[16]. Оно позволяет сократить объёмы вычислений при реализации метода уменьшения размерности данных, получившего наименование тензорный скетч[16], а также быстрого преобразования Джонсона — Линденштрауса[16]. При этом осуществляется переход от исходной проецирующей матрицы к произведению Адамара, оперирующему матрицами меньшей размерности. Погрешность аппроксимации данных большой размерности на основе торцевого произведения матриц соответствует лемме о малом искажении[16][20]. В указанном контексте идея торцевого произведенияШаблон:Переход может быть использована для решения задачи дифференциальной приватности (Шаблон:Lang-en)[15]. Кроме того, аналогичные вычисления были применены для формирования тензоров совместной встречаемости в задачах обработки естественного языка и построения гиперграфов подобия изображений[21].

Торцевое произведение применяется для P-сплайн аппроксимации[18], построения обобщённых линейных моделей массивов данных (GLAM) при их статистической обработке[19] и может быть использовано для эффективной реализации ядерного метода машинного обучения, а также изучения взаимодействия генотипов с окружающей средой.[22]

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Библиоинформация

  1. Шаблон:Статья
  2. Шаблон:Citation
  3. See e.g. H.D. Macedo and J.N. Oliveira. A linear algebra approach to OLAP. Formal Aspects of Computing, 27(2):283-307, 2015.
  4. Шаблон:Статья
  5. Шаблон:Статья
  6. Vanderveen, M. C., Ng, B. C., Papadias, C. B., & Paulraj, A. (n.d.). Joint angle and delay estimation (JADE) for signals in multipath environments. Conference Record of The Thirtieth Asilomar Conference on Signals, Systems and Computers. — DOI:10.1109/acssc.1996.599145
  7. 7,0 7,1 7,2 7,3 7,4 7,5 7,6 7,7 Шаблон:Cite journal
  8. Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501 [1] Шаблон:Wayback
  9. 9,0 9,1 9,2 Шаблон:Статья
  10. 10,0 10,1 10,2 10,3 Шаблон:Cite journal
  11. 11,0 11,1 11,2 11,3 Шаблон:Cite web
  12. 12,0 12,1 12,2 12,3 12,4 12,5 12,6 Шаблон:Cite journal
  13. 13,0 13,1 13,2 13,3 13,4 Vadym Slyusar. New Matrix Operations for DSP (Lecture). April 1999. - DOI: 10.13140/RG.2.2.31620.76164/1
  14. 14,0 14,1 C. Radhakrishna Rao. Estimation of Heteroscedastic Variances in Linear Models.//Journal of the American Statistical Association, Vol. 65, No. 329 (Mar., 1970), pp. 161-172
  15. 15,0 15,1 Kasiviswanathan, Shiva Prasad, et al. «The price of privately releasing contingency tables and the spectra of random matrices with correlated rows.» Proceedings of the forty-second ACM symposium on Theory of computing. 2010.
  16. 16,0 16,1 16,2 16,3 16,4 16,5 16,6 Шаблон:Cite web
  17. Шаблон:Cite conference
  18. 18,0 18,1 Шаблон:Cite journal
  19. 19,0 19,1 19,2 Шаблон:Cite journal
  20. Шаблон:Cite conference
  21. Bryan Bischof. Higher order co-occurrence tensors for hypergraphs via face-splitting. Published 15 February, 2020, Mathematics, Computer Science, ArXiv Шаблон:Wayback
  22. Johannes W. R. Martini, Jose Crossa, Fernando H. Toledo, Jaime Cuevas. On Hadamard and Kronecker products in covariance structures for genotype x environment interaction.//Plant Genome. 2020;13:e20033. Page 5. [2]