20.2 Fórmulas
En R para especificar un modelo estadístico (realmente una familia) se suelen emplear fórmulas (también para generar gráficos).
Son de la forma:
respuesta ~ modelomodelo especifica los “términos” mediante operadores (tienen un significado especial en este contexto):
| Operador | Descripción |
|---|---|
a+b |
incluye a y b (efectos principales) |
-b |
excluye b del modelo |
a:b |
interacción de a y b |
| \ | b %in% a efectos de b anidados en a (a:b) |
| \ | a/b = a + b %in% a = a + a:b |
a*b = a+b+a:b |
efectos principales más interacciones |
^n |
interacciones hasta nivel n ((a+b)^2 = a+b+a:b) |
poly(a, n) |
polinomios de a hasta grado n |
1 |
término constante |
. |
todas las variables disponibles o modelo actual en actualizaciones |
Para realizar operaciones aritméticas (que incluyan +, -, *, ^, 1, …)
es necesario “aislar” la operación
dentro una función (e.g. log(abs(x) + 1)).
Por ejemplo, para realizar un ajuste cuadrático se debería utilizar y ~ x + I(x^2), ya que y ~ x + x^2 = y ~ x (la interacción x:x = x).
I()función identidad.