Resumen de Estudio · Segundo Parcial — Introducción a la Ciencia de Datos

El parcial combina dos bloques. Identificá rápido a qué bloque pertenece cada consigna:

Si la pregunta habla de…BloqueHerramienta
"relación entre variables", "correlación"ACoeficiente de correlación r
"qué % de las variaciones se explica"ACoeficiente de determinación
"estime con X% de confianza un porcentaje"BIntervalo de confianza para 1 proporción
"¿puede asegurarse que el % es superior/inferior a…?"BPrueba de hipótesis para 1 proporción
"qué tipo de error se podría cometer"BError Tipo I / Tipo II
"diferencia entre dos % / dos grupos"BComparación de 2 proporciones

BLOQUE A — Correlación y regresión lineal

1. Coeficiente de correlación r

Mide la fuerza y el sentido de la relación lineal entre dos variables. Va de −1 a +1.

r = Sxy / √(Sxx · Syy) Sxy = Σxy − (Σx·Σy)/n Sxx = Σx² − (Σx)²/n Syy = Σy² − (Σy)²/n

Interpretación (punto 1):

⚠️ Siempre interpretar en contexto: "existe una relación lineal positiva y muy fuerte entre las vistas y las ventas: a mayor cantidad de vistas, mayores ventas".

2. Coeficiente de determinación

Es r al cuadrado. Mide qué porcentaje de la variación de Y se explica por X.

R² = r² → se expresa en %

Recta de regresión (por si la piden)

ŷ = b0 + b1·x b1 = Sxy / Sxx (pendiente) b0 = ȳ − b1·x̄ (ordenada al origen)

b1 = cuánto cambia Y por cada unidad que aumenta X.

BLOQUE B — Inferencia sobre proporciones

Una proporción p = casos favorables / total = X / n. En estos ejercicios: p = Ventas / Vistas (ventas = "éxitos", vistas = "ensayos").

3. Intervalo de confianza para una proporción

"Estime con un C% de confianza el porcentaje…"

IC = p ± ME ME = Z · √( p·(1−p) / n )

4. Prueba de hipótesis para una proporción

"¿Puede asegurarse, con α% de riesgo, que el % es superior/inferior a p0?"

Paso 1 — Hipótesis (el "superior/inferior" va en H1):

Paso 2 — Estadístico:

Z = (p − p0) / √( p0·(1−p0) / n )

Paso 3 — Decisión:

Paso 4 — Conclusión en contexto.

5. Errores Tipo I y Tipo II

Realidad: H0 verdaderaRealidad: H0 falsa
Rechazo H0Error Tipo I (prob. α)correcto
No rechazo H0correctoError Tipo II (prob. β)

6. Comparación de dos proporciones (prueba de hipótesis)

"Si el % del grupo B supera en más de D al del grupo A, entonces…"

H0: pB − pA ≤ D0 H1: pB − pA > D0 Z = ((pB − pA) − D0) / √( p̂·(1−p̂)·(1/na + 1/nb) ) p̂ = (Xa + Xb)/(na + nb) (proporción combinada / pooled)

7. Intervalo de confianza para la diferencia de proporciones

IC = (pB − pA) ± ME ME = Z · √( pA·(1−pA)/na + pB·(1−pB)/nb )

Tabla de valores Z

Confianza / colaZ
90 % una cola · Z(0,90)1,282
95 % una cola · 90 % dos colas · Z(0,95)1,645
95 % dos colas · Z(0,975)1,960
99 % una cola · Z(0,99)2,326
Regla: IC bilateral al 95 % → 1,96. Prueba de una cola al 5 % → 1,645.

Checklist para el día del parcial

  1. ¿Pide relación o % explicado? → r / R² (Bloque A).
  2. ¿Pide estimar con confianza? → Intervalo (± ME).
  3. ¿Pide asegurar/comprobar algo? → Prueba de hipótesis (H0/H1, Z, comparar, concluir).
  4. ¿Dos grupos? → fórmulas con na, nb (pooled si es prueba; separadas si es IC).
  5. Siempre cerrá con una frase interpretada en el contexto.
  6. Cuidado: prueba de una cola usa 1,645; intervalo al 95 % usa 1,96.