Spis treści
Podziękowania
Wprowadzenie
1. Eksploracyjna analiza danych
Twój pierwszy dzień na stanowisku prezesa
Znajdowanie wzorców w zbiorach danych
Używanie plików .csv do przeglądania i przechowywania danych
Wyświetlanie danych w Pythonie
Obliczanie statystyk zbiorczych
Analizowanie podzbiorów danych
Dane nocne
Dane sezonowe
Wizualizacja danych za pomocą Matplotlib
Rysowanie i wyświetlanie prostego wykresu
Tytuły i etykiety na wykresach
Kreślenie podzbiorów danych
Testowanie różnych typów wykresów
Eksplorowanie korelacji
Obliczanie korelacji
Silna i słaba korelacja
Znajdowanie korelacji między zmiennymi
Tworzenie map cieplnych
Dalsza eksploracja
Podsumowanie
2. Prognozowanie
Przewidywanie popytu
Oczyszczanie błędnych danych
Kreślenie danych w celu odkrywania trendów
Przeprowadzanie regresji liniowej
Algebraiczne podstawy linii regresji
Obliczanie miar błędu
Używanie regresji do prognozowania przyszłych trendów
Wypróbowywanie innych modeli regresji
Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej
Oddawanie zmienności z wykorzystaniem trygonometrii
Wybieranie najlepszej regresji na potrzeby prognozowania
Dalsza eksploracja
Podsumowanie
3. Porównywanie grup
Dane dotyczące populacji
Statystyki zbiorcze
Próby losowe
Różnice między próbami
Testowanie hipotez
Test t
Niuanse testowania hipotez
Porównywanie grup w kontekście praktycznym
Podsumowanie
4. Testy A/B
Potrzeba eksperymentowania
Przeprowadzanie eksperymentów w celu testowania nowych hipotez
Matematyka testów A/B
Przekładanie matematyki na praktykę
Optymalizacja z wykorzystaniem modelu mistrz – pretendent
Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A
Wielkości efektu
Obliczanie istotności danych
Zastosowania i kwestie zaawansowane
Etyka testów A/B
Podsumowanie
5. Klasyfikacja binarna
Minimalizowanie odpływu klientów
Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka
Wykres ryzyka odpływu
Potwierdzanie zależności za pomocą regresji liniowej
Przewidywanie przyszłości
Dokonywanie rekomendacji biznesowych
Mierzenie dokładności prognoz
Multiwariantne modele LPM
Tworzenie nowych miar
Wady modeli LPM
Przewidywanie binarnych wyników za pomocą regresji logistycznej
Rysowanie krzywych logistycznych
Dopasowywanie krzywej logistycznej do danych
Zastosowania klasyfikacji binarnej
Podsumowanie
6. Uczenie nadzorowane
Przewidywanie ruchu w witrynie internetowej
Wczytywanie i wykreślanie danych dotyczących artykułów
Używanie regresji liniowej jako metody przewidywania
Uczenie nadzorowane
Metoda k najbliższych sąsiadów
Implementowanie metody k-NN
Analiza k-NN z wykorzystaniem pakietu sklearn
Używanie innych algorytmów uczenia nadzorowanego
Drzewa decyzyjne
Lasy losowe
Sieci neuronowe
Mierzenie dokładności prognoz
Praca z modelami multiwariantnymi
Używanie klasyfikacji zamiast regresji
Podsumowanie
7. Uczenie nienadzorowane
Uczenie nadzorowane a uczenie nienadzorowane
Generowanie i eksplorowanie danych
Rzucanie kością
Używanie innego typu kości
Określanie źródła obserwacji przez klasteryzację
Klasteryzacja w zastosowaniach biznesowych
Analizowanie wielu wymiarów
Klasteryzacja E-M
Etap zgadywania
Etap oczekiwań
Etap maksymalizacji
Etap konwergencji
Inne metody klasteryzacji
Inne metody uczenia nienadzorowanego
Podsumowanie
8. Web scraping
Jak działają witryny internetowe?
Twój pierwszy scraper
Parsowanie kodu HTML
Scraping adresów e-mail
Bezpośrednie wyszukiwanie adresów
Wyrażenia regularne
Używanie metaznaków do elastycznych wyszukiwań
Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych
Łączenie metaznaków w wyszukiwaniach zaawansowanych
Używanie wyrażeń regularnych do wyszukiwania adresów e-mail
Przekształcanie wyników w użyteczne dane
Używanie biblioteki Beautiful Soup
Parsowanie elementów etykiety HTML
Scraping i parsowanie tabel HTML
Zaawansowany scraping
Podsumowanie
9. Systemy rekomendacyjne
Rekomendacje oparte na popularności
Filtrowanie kolaboratywne oparte na artykułach
Mierzenie podobieństwa wektorów
Obliczanie podobieństwa kosinusowego
Implementowanie filtrowania kolaboratywnego opartego na artykułach
Filtrowanie kolaboratywne oparte na użytkownikach
Studium przypadku: rekomendacje muzyczne
Generowanie rekomendacji za pomocą zaawansowanych systemów
Podsumowanie
10. Przetwarzanie języka naturalnego
Używanie NLP do wykrywania plagiatów
Model NLP word2vec
Ocenianie podobieństw między słowami
Tworzenie układu równań
Analizowanie wektorów liczbowych w word2vec
Manipulowanie wektorami poprzez obliczenia matematyczne
Wykrywanie plagiatów z wykorzystaniem word2vec
Model skip-thoughts
Modelowanie tematyczne
Inne zastosowania NLP
Podsumowanie
11. Data science w innych językach
Wygrywanie meczów piłkarskich z pomocą SQL-a
Wczytywanie i analizowanie danych
Podstawy SQL-a
Tworzenie bazy danych SQL
Wykonywanie kwerend SQL
Łączenie danych poprzez łączenie tabel
Wygrywanie meczów piłkarskich z pomocą języka R
Podstawy języka R
Stosowanie regresji liniowej w języku R
Kreślenie danych w R
Inne przydatne umiejętności
Podsumowanie
Skorowidz
Opinie
Na razie nie ma opinii o produkcie.