Gdy zaczynałem przygodę z przeteważaniem języka naturalnego i analizą danych naturalnym wyborem środowiska pracy był język skryptowy PHP, dzięki obsludze protokołów sieciowych oraz baz danych stanowił świetne narzędzie. Jego zaletami są elastyczność i niesamowita integracja z HTMLem.
Jednakże niedługo potem popularnosć zaczął zyskiwać język skryptowy Python. Jego zaletami są prostota programowania oraz niesamowita szybkość przetwarzania danych. Zestawy danych przetwarzane w PHP przez 48 godzin Python przetwarza w kilkanaście minut. Coraz większa rzesza entuzjastów tego języka przyczynia się do bardzo dynamicznego rozwoju rozwiązań dostępnych dla analityków danych. Oto niektóre z nich:
- ogólne porónanie Python i Matlab (bardzo popularne komercyjne środowisko obiczeniowe)
- Summarizing data in Python - porównanie środowiska R (środowiska dedykowanego obliczeniom statystycznym) i pandas - bibliotece analizy danych języka Python
- wizualizacje danych za pomocą biblioteki matplotlib