Orientacyjny sylabus (Statystyka — Python)
Dokładny układ materiału może nieznacznie zmienić się w toku semestru (np. w zależności od tempa pracy grupy).
Bloki tematyczne (kolejność)
1) Statystyka opisowa i praca z danymi (Python)
- podstawowe pojęcia: populacja, próba, losowość;
- typy danych i skale pomiarowe;
- miary tendencji centralnej i rozproszenia, rozkład empiryczny;
- wizualizacja rozkładów i zależności (wykresy, interpretacja);
- wczytywanie prostych danych z plików tekstowych (CSV/TSV) i praca z danymi tabelarycznymi (Pandas).
2) Rachunek prawdopodobieństwa i zmienne losowe
- intuicja częstotliwościowa prawdopodobieństwa, reguły działań na zdarzeniach;
- zmienne losowe dyskretne i ciągłe, funkcje: pmf/pdf/cdf/ppf;
- podstawowe własności rozkładów i praca z rozkładami w
scipy.stats.
3) Rozkłady, symulacje i Centralne Twierdzenie Graniczne
- rozkłady wykorzystywane w statystyce (m.in. dwumianowy, normalny, t-Studenta, chi-kwadrat);
- symulacje jako narzędzie rozumienia (Monte Carlo);
- Centralne Twierdzenie Graniczne i błąd standardowy (intuicja i konsekwencje).
4) Wnioskowanie statystyczne (estymacja i testowanie hipotez)
- estymacja punktowa i przedziałowa; interpretacja przedziałów ufności;
- logika NHST: $H_0/H_A$, poziom istotności, p-wartość, błędy I/II rodzaju, moc;
- testy dla średniej i proporcji (w tym testy t), test chi-kwadrat;
- zarys testów nieparametrycznych (kiedy i dlaczego);
- raportowanie: efekt + przedział ufności (gdy to ma sens) oraz p-wartość jako jedna informacja.
5) Modele liniowe: korelacja, regresja, ANOVA
- korelacja i regresja liniowa (model, założenia, interpretacja współczynników, dopasowanie);
- analiza wariancji jako szczególny przypadek modelu liniowego (ANOVA, post-hoc);
- wielokrotna regresja liniowa i interakcje (w tym zmienne nominalne).
Mapa materiałów (zgodna z folderami w repo)
- Statystyka opisowa i wizualizacja rozkładów
- Rachunek prawdopodobieństwa i zmienne losowe
- Rozkłady i symulacje
- Testowanie hipotez: p-wartość, błędy I/II rodzaju, moc
- Test chi-kwadrat: zgodność i niezależność
- Przedziały ufności: konstrukcja i interpretacja
- Testy t: jedna próba, próby zależne, próby niezależne
- Wielkość efektu i moc testów
- Testy nieparametryczne
- Korelacja i regresja liniowa
- Analiza wariancji
- Wielokrotna regresja liniowa (w tym interakcje)
Literatura (propozycja)
Podstawowa
- Downey, A. Think Stats: Exploratory Data Analysis in Python. O’Reilly.
- VanderPlas, J. Python Data Science Handbook (rozdziały dot. statystyki i wizualizacji). O’Reilly.
- James, G., Witten, D., Hastie, T., Tibshirani, R. An Introduction to Statistical Learning (wybrane rozdziały: regresja + podstawy wnioskowania). Springer.
Uzupełniająca
- Wasserman, L. All of Statistics. A Concise Course in Statistical Inference. Springer.
- Dowolny aktualny podręcznik statystyki opisowej i wnioskowania statystycznego (PL/EN) — ważne, by omawiał założenia metod i interpretację wyników.