Grado en Ingeniería Informática · Estadística

Tema 2 · Variables bidimensionales

Tablas conjuntas, condicionadas, independencia, covarianza, correlación y regresión.

1. Idea

Observas dos variables X e Y en los mismos individuos. El objetivo es estudiar distribución conjunta, marginales, condicionadas, independencia, covarianza, correlación y regresión.

2. Tabla bidimensional

Memorizar notación
n_ij = frecuencia conjunta de X=x_i e Y=y_j
n_i· = Σ_j n_ij = marginal de X
n_·j = Σ_i n_ij = marginal de Y
f_ij = n_ij / n

Letras: El punto significa “sumo la otra variable”.

3. Marginales y condicionadas

Marginal de X: sumas columnas y te quedas con filas. Marginal de Y: sumas filas y te quedas con columnas. Condicionada: filtras una parte de la tabla y recalculas frecuencias con el nuevo total.

Método imprescindible
Distribución de X | Y∈B:
usa solo las columnas de Y que cumplen B
nuevo total = suma de esas columnas
frecuencia relativa condicionada = frecuencia filtrada / nuevo total

Letras: En exámenes aparece como “para quienes tienen Y mayor que...” o “condicionado a...”.

4. Independencia

Memorizar criterio
X e Y independientes ⇔ n_ij = (n_i· n_·j)/n para todas las celdas
Equivalente: f_ij = f_i· f_·j

Letras: Basta una celda que no cumpla para negar independencia. Si el enunciado dice que son independientes, puedes completar tabla con la fórmula.

5. Covarianza, correlación y R²

Memorizar interpretación; fórmula puede venir
σ_XY = ΣΣ x_i y_j n_ij / n - x̄ȳ
r = σ_XY / (σ_X σ_Y)
R² = r²

Letras: Usa marcas de clase si hay intervalos. r no tiene unidades; R² mide proporción explicada por la recta.

ValorInterpretación
σ_XY>0 o r>0Relación lineal directa.
σ_XY<0 o r<0Relación lineal inversa.
r≈0No hay relación lineal clara, aunque puede haber relación no lineal.
|r| cercano a 1Recta fiable si además no extrapolas.

6. Regresión lineal

Memorizar cuál usar
Recta de Y sobre X: y = a x + b
a = σ_XY / σ_X²
b = ȳ - a x̄

Recta de X sobre Y: x = α y + β
α = σ_XY / σ_Y²
β = x̄ - αȳ

Letras: Si te dan X y piden Y usa Y sobre X. Si te dan Y y piden X usa X sobre Y.

La predicción es defendible si R² es alto y el valor usado está dentro o cerca del rango observado. Si no, di que es extrapolación.

7. Casio

STAT 2-variable/regresión evita casi todas las cuentas. Mete pares (x,y), activa frecuencia si hay repeticiones y lee x̄, ȳ, σx, σy, Sx, Sy, Σxy, r, a y b. Si necesitas X sobre Y, intercambia columnas o calcula la segunda recta.