A Pandas könyvtár

Mérési vagy szimulációs adatainkat gyakran célszerűbb a puszta számokat tartalmazó list vagy numpy.array adatszerkezet helyett a pandas könyvtár DataFrame osztályában tárolunk, ahol a számok mellett feliratozni is tudjuk a sorokat, illetve oszlopokat, illetve a különböző oszlopokban különböző adattípusok lehetnek.

A DataFrame-re gondolhatunk úgy, mint egy szokásos Excel-táblázatra, az osztályhoz tartozó függvények egy része ugyanis nagyon hasonlít a táblázatkezelőkből ismertekére.

A következőkben lépésenként áttekintjük a pandas-ban rejlő lehetőségeket:

  1. adatok elérése, a DataFrame adatszerkezet, fájlok be- és kiolvasása link
  2. egyszerű műveletek, maszkolás link
  3. adatbázis-műveletek 1. (groupby) link
  4. statisztikák és ábrázolásuk (seaborn) link
  5. adatbázis-műveletek 2. (concat, join, apply, pivot) link