Ecuaciones definidas por formas

Ecuaciones definidas por formas
Cada forma F(x1, . . . , xr) con coeficientes enteros plantea dos problemas
básicos:
1. Determinar las soluciones de la ecuación diofántica F(x1, . . . , xr) = m,
para cada entero m.
2. Determinar qué enteros m están representados por F, es decir, admiten
una expresión del tipo F(x1, . . . , xr) = m para ciertos enteros x1, . . . , xr.

La teoría que vamos a desarrollar resolverá estos problemas para una familia
bastante amplia de formas. Para empezar, éstas habrán de admitir una representaci
ón del tipo N(x1α1 + · · · + xrαr), y entonces los problemas indicados
se pueden reformular, tal y como vimos en la sección anterior, en términos del
módulo generado por los números algebraicos α1, . . . , αr.
Una técnica básica en la resolución de ecuaciones es transformarlas en otras
equivalentes, es decir, con las mismas soluciones, pero cada vez más sencillas.
Aunque esto no basta para resolver ecuaciones diofánticas, al menos nos da
cierta libertad para simplificar el problema lo más posible. En primer lugar notemos
que al multiplicar una ecuación por una constante (racional) no nula, las
soluciones (enteras) no varían, por lo que en muchos casos podremos considerar
que una forma y uno cualquiera de sus múltiplos son ‘la misma forma’, en el
sentido de que podremos reemplazar una por otra. Esto supone que admitimos
trabajar con formas con coeficientes racionales, no necesariamente enteros.
Hay otro sentido en el que dos formas pueden ser mutuamente reemplazables:
Definición 1.4 Diremos que dos formas F(x1, . . . , xr), G(y1, . . . , ys) del mismo
grado son equivalentes (en sentido amplio) si cada una puede obtenerse de la otra
a partir de un cambio de variables lineal con coeficientes enteros. Diremos que
son equivalentes si r = s y la matriz del cambio de variables tiene determinante
±1 (con lo que tenemos dos cambios de variables mutuamente inversos).
Por ejemplo, las formas
x2 + 7y2 + z2 − 6xy + 6yz − 2xz y 2u2 − v2
son equivalentes (en sentido amplio), pues los cambios de variables
x= 3v u = −x + 2y + z
y = u + v v = x − y − z
z = −u + v
convierten una en otra.
Es claro que en esta situación una solución entera de una de las formas
da lugar a una solución entera de la otra mediante las fórmulas de cambio de
variables, luego sabemos resolver una si y sólo si sabemos resolver la otra.
Ejercicio: Probar que si los números algebraicos α1, . . . , αr y β1, . . . , βs generan un
mismo módulo de un cuerpo numérico K entonces las formas N(x1α1 + · · · + xrαr)
y N(x1β1 + · · · + xsβs)son equivalentes en sentido amplio, y si ambos son bases del
mismo módulo entonces son equivalentes.
Este ejercicio muestra que a cada módulo le podemos asociar una única
clase de equivalencia (en sentido amplio) de formas, así como que toda forma
es equivalente en sentido amplio a una forma N(x1α1 + · · · + xrαr), donde
α1, . . . , αr forman una base de un cierto módulo. (Notemos que todo módulo es
un Z-módulo finitamente generado y libre de torsión, luego es libre.)
El teorema siguiente muestra cómo la equivalencia de formas nos permite
pasar a formas con propiedades adicionales de interés:
Teorema 1.5 Toda forma de grado n es equivalente a otra en la que la potencia
n-sima de una de las variables tiene coeficiente no nulo.
Demostración: Sea F(x1, . . . , xr) una forma de grado n. Probamos primero
que existen enteros a2, . . . , ar tales que F(1, a2, . . . , ar) = 0. Lo haremos
por inducción sobre r.
Si r = 1 entonces es F(x1) = Axn1
con A = 0, luego F(1) = 0.
Si es cierto para formas con r − 1 variables, escribimos F como
F = G0xnr
+ G1xn−1
r + · · · + Gn,
donde cada Gi es 0 o una forma de grado i con r − 1 variables, pero no pueden
ser todas nulas, pues F tiene grado n. Por hipótesis de inducción existen enteros
a2, . . . , ar−1 tales que Gi(1, a2, . . . , ar−1) = 0 para algún i.
El polinomio F(1, a2, . . . , ar−1, xr) no es nulo, luego existe un entero ar tal
que F(1, a2, . . . , ar−1, ar) = 0.
Ahora hacemos el siguiente cambio de variables:
x1 = y1
x2 = a2y1 + y2
· · · · · · · · · · · ·
xr = ary1 + yr.
Con ello F se convierte en G(y1, . . . , yr) = F(y1, a2y1 + y2, . . . , ary1 + yr),
que es una forma equivalente (el cambio tiene determinante 1) y el coeficiente
de yn
1 es G(1, 0, . . . , 0) = F(1, a2, . . . , ar) = 0.
Ahora podemos dar una caracterización sencilla de las formas que admiten
una representación de tipo N(x1α1 + · · · + xrαr).
Definición 1.6 Una forma F(x1, . . . , xr) Q[x1, . . . , xr] es factorizable si existe
un cuerpo K (extensión de Q) tal que F se escinde en producto de factores
lineales de K[x1, . . . , xr].
Por definición, las formas N(x1α1 + · · · + xrαr) son factorizables. También
es evidente que si dos formas son equivalentes, una es factorizable si y sólo si lo
es la otra.
Ejercicio: Comprobar que la forma x2 + y2 + z2 no es factorizable (si lo fuera se
descompondría en dos factores lineales).
Los razonamientos con formas cuadráticas binarias vistos en la sección anterior
justifican que todas ellas son factorizables.
En general, una condición necesaria para poder abordar una ecuación diofántica
definida por una forma expresándola como norma en un módulo es que la
forma ha de ser factorizable. De hecho las formas N(x1α1+· · ·+xrαr) factorizan
en cuerpos numéricos, pero esto no es una restricción adicional:
Teorema 1.7 Toda forma factorizable factoriza en un cuerpo numérico.
Ecuaciones definidas por formas 17
Demostración: Sea F = (α11×1 + · · · + α1rxr) · · · (αn1×1 + · · · + αnrxr)
una forma factorizable, donde los coeficientes αij están en un cierto cuerpo K.
Es obvio que si una forma factoriza en un cuerpo K, también lo hacen sus
equivalentes, luego podemos exigir que el coeficiente A de xn1
sea no nulo. Entonces
todos los coeficientes ai1 son no nulos (su producto es A), luego podemos
extraerlos y escribir
F = A(x1 + β12×2 + · · · + β1rxr) · · · (x1 + βn2×2 + · · · + βnrxr).
Para 2 ≤ j ≤ r hacemos xj = 1 y las demás variables 0, con lo que queda
F(x1, 0, . . . , 1, . . . , 0) = A(x1 + β1j). . . (x1 + βnj),
y así tenemos un polinomio mónico con coeficientes racionales cuyas raíces son
los elementos −βij , luego son algebraicos.
El cuerpo Q {βij} es una extensión finita de Q, luego podemos identificarlo
con un subcuerpo de C, es decir, con un cuerpo numérico, y F factoriza en él.
Una forma de tipo N(x1α1 + · · · + xrαr) no tiene por qué ser irreducible
en el anillo Q[x1, . . . , xr]. Por ejemplo, en el cuerpo K = Q √2,√3  se tiene
que N x√2 + y√3  = (2×2 − 3y2)2. Desgraciadamente poco podemos decir en
general sobre formas reducibles, pues sus factores se comportan independientemente
y la teoría de cuerpos no es de gran ayuda. Por ejemplo, de nuestro
análisis de las formas cuadráticas binarias en la sección anterior se deduce que
una forma cuadrática es reducible en Q[x, y] si y sólo si su discriminante es
cuadrado perfecto, y ese caso tuvo que ser estudiado aparte.
Nuestra teoría se aplicará satisfactoriamente a formas factorizables irreducibles,
caracterizadas por estar definidas por generadores de K.
Teorema 1.8 Sea un cuerpo numérico K = Q(α2, . . . , αr). Entonces la forma
F(x1, . . . , xr) = N(x1 +x2α2 +· · ·+xrαr) es irreducible en Q[x1, . . . , xr] y toda
forma factorizable irreducible en Q[x1, . . . , xr] es equivalente a un múltiplo por
una constante de una forma de este tipo.
Demostración: Supongamos que F = GH, donde G,H Q[x1, . . . , xr].
Por definición
F = x1 + x2σ1(α2) + · · · + xrσ1(αr)· · · x1 + x2σn(α2) + · · · + xrσn(αr).
Cada forma Li = x1 +x2σi(α2)+· · ·+xrσi(αr) divide a G o a H. Digamos
que L1 divide a G, o sea, G = L1M. Aplicando el monomorfismo σi y teniendo
en cuenta que G tiene los coeficientes racionales llegamos a que G = Liσi(M),
o sea, todas las formas Li dividen al polinomio G.
Como α2, . . . , αr generan K, si dos monomorfismos coinciden sobre ellos es
que son iguales. De aquí se sigue que las formas Li son distintas dos a dos, y
como el coeficiente de x1 es 1 en todas ellas, no pueden diferenciarse en una
unidad, es decir, son primas entre sí. Consecuentemente su producto, o sea, F,
divide a G. Esto implica que H es una constante, luego F es irreducible.
Si F∗(x1, . . . , xr) es una forma irreducible factorizable de grado n, por el
teorema 1.5 podemos suponer que el coeficiente de xn1
es no nulo, y entonces F∗
factoriza como
F∗ = A(x1 + β12×2 + · · · + β1rxr) · · · (x1 + βn2×2 + · · · + βnrxr).
Consideremos el cuerpo K = Q(β12, . . . , β1r) y la forma irreducible F =
N(x1 + β12×2 + · · · + β1rxr).
Tenemos que la forma (x1+β12×2+· · ·+β1rxr) divide a F y a F∗. Aplicando
los monomorfismos de K obtenemos que todos los factores de F dividen a F∗
y en la prueba de la parte anterior hemos visto que son primos entre sí, luego
F divide a F∗. Como F∗ es irreducible ha de ser un múltiplo de F por una
constante.