20.2 Fórmulas

En R para especificar un modelo estadístico (realmente una familia) se suelen emplear fórmulas (también para generar gráficos). Son de la forma:

respuesta ~ modelo

modelo especifica los “términos” mediante operadores (tienen un significado especial en este contexto):

Operador Descripción
a+b incluye a y b (efectos principales)
-b excluye b del modelo
a:b interacción de a y b
\ b %in% a efectos de b anidados en a (a:b)
\ a/b = a + b %in% a = a + a:b
a*b = a+b+a:b efectos principales más interacciones
^n interacciones hasta nivel n ((a+b)^2 = a+b+a:b)
poly(a, n) polinomios de a hasta grado n
1 término constante
. todas las variables disponibles o modelo actual en actualizaciones

Para realizar operaciones aritméticas (que incluyan +, -, *, ^, 1, …) es necesario “aislar” la operación dentro una función (e.g. log(abs(x) + 1)). Por ejemplo, para realizar un ajuste cuadrático se debería utilizar y ~ x + I(x^2), ya que y ~ x + x^2 = y ~ x (la interacción x:x = x).

  • I() función identidad.