Cálculo del permanente

En álgebra lineal, el cálculo del permanente de una matriz es un problema que se piensa que es más difícil que el cálculo del determinante de una matriz, a pesar de la aparente similitud de las definiciones.

El permanente se define de forma similar al determinante, como la suma de productos de conjuntos de elementos de la matriz ubicados en filas y columnas distintas. Sin embargo, si el determinante pondera cada uno de estos productos con un signo ±1 basado en la paridad de los elementos, el permanente los pondera a todos con un signo +1.

Si bien el determinante puede calcularse en tiempo polinómico mediante la eliminación de Gauss-Jordan, generalmente se cree que el permanente no puede calcularse en tiempo polinómico. En teoría de la complejidad computacional, un teorema de Valiant establece que calcular permanentes es #P-difícil, e incluso #P-completo para matrices donde todos los elementos son 0 o 1 Valiant (1979). Esto sitúa el cálculo del permanente en una clase de problemas que se considera aún más difícil de calcular que NP. Se sabe que calcular el permanente es imposible para circuitos ACC0 uniformes en el espacio logarítmico. (Allender y Gore, 1994)

El desarrollo de algoritmos exactos y aproximados para calcular el permanente de una matriz es un área de investigación activa.

Definición y algoritmo ingenuo

El permanente de una matriz de n por n, A = (ai,j), se define como:

La suma se extiende a todos los elementos σ del grupo simétrico Sn, es decir, a todas las permutaciones de los números 1, 2, ..., n. Esta fórmula difiere de la fórmula correspondiente para el determinante solo en que, en el determinante, cada producto se multiplica por el signo de la permutación σ, mientras que en esta fórmula cada producto no tiene signo. La fórmula puede traducirse directamente a un algoritmo que la expande de forma ingenua, sumando todas las permutaciones y, dentro de la suma, multiplicando cada entrada de la matriz. Esto requiere n!·n operaciones aritméticas.

Fórmula de Ryser

El algoritmo exacto general[1]​ más conocido se debe a Ryser (1963). El método de Ryser se basa en la fórmula de inclusión-exclusión, que se puede expresar como[2]​ de la siguiente manera: sea obtenido de A eliminando k columnas, sea el producto de las sumas de filas de y sea la suma de los valores de sobre todos los valores posibles de . Entonces:

Puede reescribirse en términos de las entradas de la matriz de la siguiente manera:[3]

La fórmula de Ryser se puede calcular mediante operaciones aritméticas, o procesando los conjuntos en orden según el código Gray.[4]

Fórmula de Balasubramanian-Bax-Franklin-Glynn

Otra fórmula que parece ser tan rápida como la de Ryser (o quizás incluso el doble) se encuentra en dos tesis doctorales. Véase (Balasubramanian, 1980), (Bax, 1998); y también (Bax y Franklin, 1996). Los métodos para hallar la fórmula son bastante diferentes, relacionados con la combinatoria del álgebra de Muir y con la teoría de diferencias finitas, respectivamente. Otra vía, relacionada con la teoría de invariantes, es mediante la identidad de polarización para un tensor simétrico (Glynn, 2010). La fórmula se generaliza a un número infinito de otras, como encontraron todos estos autores, aunque no está claro si son más rápidas que la básica. Véase (Glynn, 2013).

La fórmula más simple conocida de este tipo (cuando la característica del cuerpo no es dos) es

donde la suma externa es sobre todos los vectores .

Casos especiales

Planar y K 3,3-libre

El número de concordancias perfectas en un grafo bipartito se contabiliza por el permanente de la matriz de adyacencia del grafo, y el permanente de cualquier matriz 0-1 puede ser interpretado de esta manera como el número de emparejamientos perfectos en un grafo. Para un grafo plano (independientemente de su bipartitidad), el algoritmo FKT calcula el número de emparejamientos perfectos en tiempo polinómico modificando los signos de un subconjunto cuidadosamente seleccionado de las entradas en la matriz de Tutte del grafo, de modo que el Pfaffiano de la matriz antisimétrica resultante (la raíz cuadrada de su determinante) sea el número de emparejamientos perfectos. Esta técnica se puede generalizar a grafos que no contienen subgrafos homeomórficos hasta el grafo bipartito completo K3,3.[5]

George Pólya planteó la pregunta[6]​ de cuándo es posible cambiar el signo de algunas de las entradas de una matriz A de ceros y unos (01) de modo que el determinante de la nueva matriz sea el permanente de A. No todas las matrices 01 son convertibles de esta manera. De hecho, se sabe (Marcus y Minc (1961)) que no existe una función lineal tal que para todas las matrices . La caracterización de las matrices convertibles fue dada por Little (1975), quien demostró que dichas matrices son precisamente las que constituyen la matriz de biyacencia de grafos bipartitos que tienen una orientación pfaffiana: una orientación de las aristas tal que para cada ciclo par para el cual tiene una correspondencia perfecta, hay un número impar de aristas dirigidas en C (y, por lo tanto, un número impar con la orientación opuesta). También se demostró que estos grafos son exactamente aquellos que no contienen un subgrafo homeomorfo a , como se indicó anteriormente.

Cálculo según el módulo de un número

En módulo 2, el permanente es igual al determinante, ya que también se puede calcular el módulo en el tiempo para . Sin embargo, es UP-difícil el calcular el permanente en un módulo cuya base no sea una potencia de 2. Valiant (1979)

Existen varias fórmulas dadas por Glynn (2010) para el cálculo según el módulo de un primo p. Primero, hay una que utilizar cálculos simbólicos con derivadas parciales.

En segundo lugar, para p = 3, existe la siguiente fórmula para una matriz de orden n×n, que involucra los menores de la matriz principal (Kogan (1996)):

donde es la submatriz de inducida por las filas y columnas de indexadas por , y es el complemento de en , mientras que el determinante de la submatriz vacía se define como 1.

El desarrollo anterior se puede generalizar en una característica arbitraria p como el siguiente par de identidades duales:

donde en ambas fórmulas la suma se realiza sobre todas las (p - 1)-tuplas que son particiones del conjunto en p - 1 subconjuntos, algunos de ellos posiblemente vacíos.

La fórmula anterior posee un análogo para el hafniano de una matriz simétrica y un p impar:

con la suma tomada sobre el mismo conjunto de índices. Además, en la característica cero, una expresión de suma de convolución similar que involucra tanto el permanente como el determinante produce el ciclo hamiltoniano polinómico (definido como , donde es el conjunto de n-permutaciones con un solo ciclo):

En la característica 2, esta última igualdad se convierte en , lo que permite calcular en tiempo polinómico el ciclo hamiltoniano polinómico de cualquier matriz unitaria (es decir, tal que , donde es la matriz identidad n×n), ya que cada menor de dicha matriz coincide con su complemento algebraico: , donde es la matriz identidad n×n, con la entrada de los índices k, k reemplazada por 0. Además, puede, a su vez, generalizarse para una matriz unitaria n×n como , donde es un subconjunto de 1, ..., n. es la matriz identidad n×n con las entradas de índices k, k reemplazadas por 0 para todos los k pertenecientes a . Se define , donde es el conjunto de n-permutaciones cuyo ciclo contiene al menos un elemento de .

Esta fórmula también implica las siguientes identidades sobre cuerpos de característica 3:

  • Para cualquier unitary , es decir, una matriz cuadrada tal que , donde es la matriz identidad del tamaño correspondiente,
donde es la matriz cuyas entradas son los cubos de las entradas correspondientes de .

También se demostró (Kogan (1996)) que, si se define una matriz cuadrada como k-semi-unitaria cuando , el permanente de una matriz 1-semi-unitaria es computable en tiempo polinómico sobre cuerpos de característica 3, mientras que para k > 1 el problema se convierte en #3-P-completo. Una teoría paralela concierne al ciclo hamiltoniano polinómico en característica 2: si bien su cálculo en las matrices unitarias es factible en tiempo polinómico, el problema es #2-P-completo para las k-semi-unitarias para cualquier k > 0. Este último resultado se amplió esencialmente en 2017 (Knezevic y Cohen (2017)) y se demostró que en la característica 3 existe una fórmula simple que relaciona los permanentes de una matriz cuadrada y su inversa parcial (para y siendo cuadradas, siendo invertible):

Y permite reducir en tiempo polinómico el cálculo del permanente de una matriz n×n con un subconjunto de k o k - 1 filas expresables como combinaciones lineales de otro subconjuntos (disjuntos) de k filas al cálculo del permanente de una matriz (n - k)×(n - k) o (n - k + 1)×(n - k + 1) correspondientemente, habiendo introducido así un operador de compresión (análogo a la modificación gaussiana aplicada para calcular el determinante) que preserva el permanente en la característica 3. Análogamente, valdría la pena reseñar que el ciclo hamiltoniano polinómico en la característica 2 también posee sus compresiones matriciales invariantes, teniendo en cuenta el hecho de que ham(A) = 0 para cualquier matriz A de orden n×n que tenga tres filas iguales o, si n > 2, un par de índices i,j tales que sus i-ésimas y j-ésimas filas sean idénticas y sus i-ésimas y j-ésimas columnas también sean idénticas. El cierre de ese operador definido como el límite de su aplicación secuencial junto con la transformación transpuesta (utilizada cada vez que el operador deja la matriz intacta) también es una correspondencia de operadores cuando se aplica a clases de matrices de una clase a otra. Mientras que el operador de compresión asigna la clase de matrices 1-semiunitarias a sí mismo y a las clases de matrices unitarias y 2-semiunitarias, el cierre de compresión de la clase 1-semiunitaria (así como la clase de matrices recibidas de las unitarias al reemplazar una fila por un vector de fila arbitrario (el permanente de tal matriz es, a través de la expansión de Laplace, la suma de las permanentes de matrices 1-semiunitarias y, en consecuencia, computable en tiempo polinómico), es aún desconocida y está tensamente relacionada con el problema general de la complejidad computacional del permanente en la característica 3 y la pregunta principal de P frente a NP: como se demostró en (Knezevic y Cohen (2017)), si tal cierre de compresión es el conjunto de todas las matrices cuadradas sobre un cuerpo de característica 3 o, al menos, contiene una clase de matriz, el cálculo del permanente es #3-P-completo (como la clase de matriz 2-semiunitarias), y entonces el permanente es computable en tiempo polinómico en esta característica.

Además, se formuló el problema de encontrar y clasificar posibles analogías de las compresiones de conservación permanente existentes en la característica 3 para otras características primas (Knezevic y Cohen (2017)), dando la siguiente identidad para una matriz de n×n y dos vectores de n (cuyas entradas pertenecen al conjunto 0, ..., p - 1) y tales que , válido en una característica prima arbitraria p:

donde para una matriz de orden n×m-, un n-vector y un m-vector , ambos vectores tienen todas sus entradas del conjunto 0, ..., p - 1, denota la matriz recibida de a través de la repetición de veces su i-ésima fila para i = 1, ..., n y veces su j-ésima columna para j = 1, ..., m (si la multiplicidad de alguna fila o columna es igual a cero significaría que la fila o columna fue eliminada, y por lo tanto esta noción es una generalización de la noción de submatriz), y denota el n-vector cuyas entradas son todas iguales a la unidad. Esta identidad es un análogo exacto de la fórmula clásica que expresa el menor de una matriz a través del menor de su inversa y, por lo tanto, demuestra (una vez más) una especie de dualidad entre el determinante y el permanente como inmanentes relativos. De hecho, su propio análogo para el hafniano de una matriz simétrica y un primo impar p es ).

Y, como una generalización aún más amplia para el caso inverso parcial en un primo característico p, para , siendo cuadrada, invertible y de tamaño x, y , se cumple también la identidad.

donde los vectores de multiplicidad fila/columna comunes y para la matriz generan los vectores de multiplicidad fila/columna correspondientes y , s,t = 1,2, para sus bloques (lo mismo ocurre con el inverso parcial de en el lado derecho de la igualdad).

Cálculo aproximado

Cuando las entradas de A son no negativas, el permanente puede calcularse aproximadamente en tiempo polinómico probabilístico, hasta un error de εM, donde M es el valor del permanente y ε > 0 es arbitrario. En otras palabras, existe un esquema de aproximación de tiempo polinómico (FPRAS) (Jerrum, Sinclair y Vigoda (2001)).

El paso más difícil del cálculo es la construcción de un algoritmo para obtener una muestra casi uniforme a partir del conjunto de todos los emparejamientos perfectos en un grafo bipartito dado: en otras palabras, un muestreo casi uniforme completamente polinómico (FPAUS). Esto se puede lograr mediante un algoritmo de un método de Montecarlo basado en cadenas de Markov que utiliza una regla de Metropolis para definir y ejecutar una cadena de Márkov con una distribución casi uniforme y cuyo tiempo de mezclado sea polinómico.

Es posible contar aproximadamente el número de emparejamientos perfectos en un grafo mediante autorreducibilidad del permanente, utilizando el FPAUS en combinación con una conocida reducción de muestreo a conteo debido a Jerrum, Valiant y Vazirani (1986). Sea el número de emparejamientos perfectos en . Aproximadamente, para cualquier arista particular en , al muestrear muchos emparejamientos en y contar cuántos de ellos son emparejamientos en , se puede obtener una estimación de la razón . El número es entonces , donde puede aproximarse aplicando el mismo método recursivamente.

Otra clase de matrices para las cuales el permanente es de particular interés, son las matrices positivas semidefinidas.[7]​ Usando una técnica del conteo de Stockmeyer, se pueden calcular dentro de la clase , pero esta se considera una clase inviable en general. Es NP-difícil aproximar permanentes de matrices PSD dentro de un factor subexponencial, y se conjetura que es -difícil[8]​ Si se imponen restricciones adicionales en el espectro de una matriz, se conocen algoritmos más eficientes. Un algoritmo aleatorizado se basa en el modelo de muestreo de bosones y usa las herramientas propias de la óptica cuántica, para representar el permanente de matrices semidefinidas positivas como el valor esperado de una variable aleatoria específica. Esta última se aproxima entonces por su media muestral.[9]​ Este algoritmo, para un conjunto determinado de matrices semidefinidas positivas, aproxima su permanente en tiempo polinómico hasta un error aditivo, lo cual es más fiable que el algoritmo clásico estándar de tiempo polinómico de Gurvits.[10]

Referencias

  1. As of 2008, véase Rempała y Wesolowski (2008)
  2. van Lint y Wilson (2001) p. 99
  3. CRC Concise Encyclopedia of Mathematics ()
  4. Nijenhuis y Wilf (1978)
  5. Little (1974), Vazirani (1988)
  6. Pólya (1913), Reich (1971)
  7. Véase el problema abierto (4) en Shtetl Optimized: Introducing some British people to P vs. NP, 22 de julio de 2015 .
  8. Meiburg, Alexander (2023), «Inapproximability of Positive Semidefinite Permanents and Quantum State Tomography», Algorithmica 85 (12): 3828-3854, arXiv:2111.03142, doi:10.1007/s00453-023-01169-1 .
  9. Chakhmakhchyan, Levon; Cerf, Nicolas; Garcia-Patron, Raul (2017), «A quantum-inspired algorithm for estimating the permanent of positive semidefinite matrices», Phys. Rev. A 96 (2): 022329, Bibcode:2017PhRvA..96b2329C, S2CID 54194194, arXiv:1609.02416, doi:10.1103/PhysRevA.96.022329 .
  10. Gurvits, Leonid (2005), «On the complexity of mixed discriminants and related problems», Mathematical Foundations of Computer Science 2005, Lecture Notes in Computer Science 3618, pp. 447-458, ISBN 978-3-540-28702-5, doi:10.1007/11549345_39 .

Bibliografía

  • Allender, Eric; Gore, Vivec (1994), «A uniform circuit lower bound for the permanent», SIAM Journal on Computing 23 (5): 1026-1049, doi:10.1137/s0097539792233907, «citeseerx: 10.1.1.51.3546» .
  • Balasubramanian, K. (1980), Combinatorics and Diagonals of Matrices, Ph.D. Thesis, Department of Statistics, Loyola College, Madras, India, T073, Indian Statistical Institute, Calcutta .
  • Bax, Eric (1998), Finite-difference Algorithms for Counting Problems, Ph.D. Dissertation 223, California Institute of Technology .
  • Bax, Eric; Franklin, J. (1996), A finite-difference sieve to compute the permanent, Caltech-CS-TR-96-04, California Institute of Technology .
  • Glynn, David G. (2010), «The permanent of a square matrix», European Journal of Combinatorics 31 (7): 1887-1891, doi:10.1016/j.ejc.2010.01.010 .
  • Glynn, David G. (2013), «Permanent formulae from the Veronesean», Designs, Codes and Cryptography 68 (1–3): 39-47, S2CID 36911503, doi:10.1007/s10623-012-9618-1 .
  • Jerrum, M.; Sinclair, A.; Vigoda, E. (2001), «A polynomial-time approximation algorithm for the permanent of a matrix with non-negative entries», Proc. 33rd Symposium on Theory of Computing, pp. 712-721, ISBN 978-1581133493, S2CID 8368245, doi:10.1145/380752.380877 .
  • Jerrum, Mark; Valiant, Leslie; Vazirani, Vijay (1986), «Random generation of combinatorial structures from a uniform distribution», Theoretical Computer Science 43: 169-188, doi:10.1016/0304-3975(86)90174-X .
  • Kogan, Grigoriy (1996), «Computing permanents over fields of characteristic 3: Where and why it becomes difficult», Proceedings of 37th Conference on Foundations of Computer Science, pp. 108-114, ISBN 0-8186-7594-2, S2CID 39024286, doi:10.1109/SFCS.1996.548469 .
  • Knezevic, Anna; Cohen, Greg (2017), Some facts on Permanents in Finite Characteristics, Bibcode:2017arXiv171001783K, arXiv:1710.01783 .
  • van Lint, Jacobus Hendricus; Wilson, Richard Michale (2001), A Course in Combinatorics, Cambridge University Press, ISBN 978-0-521-00601-9 .
  • Little, C. H. C. (1974), «An extension of Kasteleyn's method of enumerating the 1-factors of planar graphs», en Holton, D., ed., Proc. 2nd Australian Conf. Combinatorial Mathematics, Lecture Notes in Mathematics 403, Springer-Verlag, pp. 63-72 .
  • Little, C. H. C. (1975), «A characterization of convertible (0, 1)-matrices», Journal of Combinatorial Theory, Series B 18 (3): 187-208, doi:10.1016/0095-8956(75)90048-9 .
  • Marcus, M.; Minc, H. (1961), «On the relation between the determinant and the permanent», Illinois Journal of Mathematics 5 (3): 376-381, doi:10.1215/ijm/1255630882 .
  • Nijenhuis, Albert; Wilf, Herbert S. (1978), Combinatorial Algorithms, Academic Press .
  • Pólya, G. (1913), «Aufgabe 424», Arch. Math. Phys. 20 (3): 27 .
  • Reich, Simeon (1971), «Another solution of an old problem of pólya», American Mathematical Monthly 78 (6): 649-650, JSTOR 2316574, doi:10.2307/2316574 .
  • Rempała, Grzegorz A.; Wesolowski, Jacek (2008), Symmetric Functionals on Random Matrices and Random Matchings Problems, Springer, p. 4, ISBN 978-0-387-75145-0 .
  • Ryser, Herbert John (1963), Combinatorial Mathematics, The Carus Mathematical Monographs, Vol. 14, Mathematical Association of America, ISBN 978-1-61444-014-7 .
  • Vazirani, Vijay V. (1988), «NC algorithms for computing the number of perfect matchings in K3,3-free graphs and related problems», Proc. 1st Scandinavian Workshop on Algorithm Theory (SWAT '88), Lecture Notes in Computer Science 318, Springer-Verlag, pp. 233-242, ISBN 978-3-540-19487-3, doi:10.1007/3-540-19487-8_27, hdl:1813/6700 .
  • Valiant, Leslie G. (1979), «The complexity of computing the permanent», Theoretical Computer Science (Elsevier) 8 (2): 189-201, S2CID 1637832, doi:10.1016/0304-3975(79)90044-6 .
  • «Permanent», CRC Concise Encyclopedia of Mathematics, Chapman & Hall/CRC, 2002 .

Lecturas adicionales