pandas (original) (raw)
Toggle table of contents sidebar
pandas ist eine Python-Bibliothek zur Datenanalyse, die in den letzten Jahren sehr populär geworden ist. Auf der Website wird pandas so beschrieben:
»pandas ist ein schnelles, leistungsfähiges, flexibles und einfach zu bedienendes Open-Source-Tool zur Datenanalyse und -manipulation, das auf der Programmiersprache Python aufbaut.«
Genauer ist pandas ein In-Memory-Analysewerkzeug, das SQL-ähnliche Konstrukte, sowie statistische und analytische Werkzeuge bietet. Dabei baut pandas aufCython und NumPy auf, wodurch es weniger speicherintensiv und schneller ist als reiner Python-Code. Meist wird pandas genutzt, um
- Excel und Power BI zu ersetzen
- einen ETL-Prozess zu realisieren
- CSV- oderJSON-Daten zu verarbeiten
- maschinelles Lernen vorzubereiten