Promocja!

DATA SCIENCE WYZWANIA I ROZWIĄZANIA

Pierwotna cena wynosiła: 79.00zł.Aktualna cena wynosi: 71.11zł.

Na stanie

Spis treści

Przedmowa

Część I. Techniki analityki danych

Rozdział 1. I co z tego? Generowanie wartości dzięki danologii

Czym jest wartość?
„Co?”, czyli zrozumieć biznes
„Co z tego?”, czyli istota generowania wartości dzięki danologii
„Co teraz?”, czyli bądź przebojowy
Pomiar wartości
Najważniejsze wnioski
Dalsza lektura

Rozdział 2. Projektowanie wskaźników

Pożądane właściwości wskaźników
Mierzalność
Możliwość podejmowania działań
Trafność
Aktualność
Dekompozycja wskaźników
Lejek analityczny
Dekompozycje przepływów i zapasów
Dekompozycje typu P×Q
Przykład: inny sposób dekompozycji przychodów
Przykład: platformy sprzedażowe
Najważniejsze wnioski
Dalsza lektura

Rozdział 3. Dekompozycje wzrostu – zrozumienie przeszkód i sprzyjających czynników

Dlaczego dekompozycje wzrostu?
Dekompozycja addytywna
Przykład
Interpretacja i przypadki użycia
Dekompozycja multiplikatywna
Przykład
Interpretacja
Dekompozycja zmian wag i wartości
Przykład
Interpretacja
Wyprowadzanie równań matematycznych
Dekompozycja addytywna
Dekompozycja multiplikatywna
Dekompozycja mix-rate
Najważniejsze wnioski
Dalsza lektura

Rozdział 4. Projekty 2×2

Argumenty za upraszczaniem
Czym jest projekt 2×2?
Przykład: testowanie modelu i nowej cechy
Przykład: zrozumienie zachowań użytkownika
Przykład: udzielanie i akceptacja ofert kredytów
Przykład: ustalanie priorytetów w procesie pracy
Najważniejsze wnioski
Dalsza lektura

Rozdział 5. Tworzenie uzasadnienia biznesowego

Wybrane zasady tworzenia uzasadnień biznesowych
Przykład: proaktywna strategia zatrzymywania klientów
Zapobieganie oszustwom
Zakup zewnętrznych zbiorów danych
Praca nad projektem z obszaru danologii
Najważniejsze wnioski
Dalsza lektura

Rozdział 6. Czym jest wskaźnik przyrostu?

Definicja wskaźnika przyrostu
Przykład: model klasyfikatora
Błędy wynikające z samoselekcji i przeżywalności
Inne zastosowania wskaźników przyrostu
Najważniejsze wnioski
Dalsza lektura

Rozdział 7. Narracje

Co kryje się w narracji? Opowiadanie historii za pomocą danych
Jasna i rzeczowa
Wiarygodność
Zapadająca w pamięć
Możliwość podejmowania działań
Tworzenie narracji
Nauka jako opowiadanie historii
„Co?”, „co z tego?” i „co teraz?”
Ostatnia prosta
Streszczenia TL;DR
Wskazówki dotyczące pisania zapadających w pamięć streszczeń TL;DR
Przykład: pisanie streszczenia TL;DR tego rozdziału
Skuteczne krótkie prezentacje
Prezentowanie narracji
Najważniejsze wnioski
Dalsza lektura

Rozdział 8. Wizualizacje danych – wybór właściwego wykresu do przekazania komunikatu

Kilka przydatnych i rzadko używanych wizualizacji danych
Wykres słupkowy a wykres liniowy
Wykres nachylenia
Wykres kaskadowy
Funkcje wygładzania dla wykresów punktowych
Prezentowanie rozkładów na wykresie
Ogólne zalecenia
Dobierz odpowiednią wizualizację dla przekazu
Mądrze dobieraj kolory
Różne wymiary na wykresie
Staraj się uzyskać odpowiednio wysoki współczynnik dane/atrament
Personalizacja a półautomatyzacja
Na samym początku dobierz odpowiedni rozmiar czcionki
Interaktywne czy nie?
Zachowaj prostotę
Zacznij od wyjaśnienia wykresu
Najważniejsze wnioski
Dalsza lektura

Część II. Uczenie maszynowe

Rozdział 9. Symulacje i bootstrapping

Podstawy symulacji
Symulacja modelu liniowego i regresji liniowej
Czym są wykresy zależności częściowych?
Błąd systematyczny z powodu pominięcia zmiennej
Symulacja problemu klasyfikacji
Modele zmiennych ukrytych
Porównanie różnych algorytmów
Bootstrapping
Najważniejsze wnioski
Dalsza lektura

Rozdział 10. Regresja liniowa – powrót do podstaw

Co kryje się za współczynnikiem?
Twierdzenie Frischa-Waugha-Lovella
Dlaczego twierdzenie FWL jest ważne?
Czynniki zakłócające
Dodatkowe zmienne
Centralna rola wariancji w uczeniu maszynowym
Najważniejsze wnioski
Dalsza lektura

Rozdział 11. Wyciekanie danych

Czym jest wyciekanie danych?
Wynik również jest cechą
Funkcja wyniku sama też jest cechą
Złe zmienne kontrolne
Niewłaściwe oznaczenie znacznika czasu
Wiele zbiorów danych z nieprecyzyjnymi agregacjami czasowymi
Wyciekanie innych informacji
Wykrywanie wyciekania danych
Całkowita separacja
Metoda okien
Wybór długości okien
Etap treningu odzwierciedla etap oceny punktowej
Wdrażanie metody okien
Mam wyciek. Co teraz?
Najważniejsze wnioski
Dalsza lektura

Rozdział 12. Stosowanie modeli w środowisku produkcyjnym

Co oznacza „gotowość produkcyjna”?
Wsadowa ocena punktowa (w trybie offline)
Obiekty modeli czasu rzeczywistego
Dryf danych i modelu
Etapy niezbędne w każdym potoku produkcyjnym
Pobieranie i przekształcanie danych
Sprawdzanie poprawności danych
Etapy treningu i oceny punktowej
Sprawdzanie poprawności modelu i ocen punktowych
Zapisywanie modelu i ocen punktowych
Najważniejsze wnioski
Dalsza lektura

Rozdział 13. Opowiadanie historii w uczeniu maszynowym

Holistyczne spojrzenie na opowiadanie historii w uczeniu maszynowym
Opowiadanie historii przed opracowaniem modelu i w trakcie tego procesu
Tworzenie hipotez
Inżynieria cech
Opowiadanie historii po opracowaniu modelu: otwieranie czarnej skrzynki
Kompromis między interpretowalnością a skutecznością
Regresja liniowa: ustalenie punktu odniesienia
Znaczenie cech
Mapa cieplna
Wykresy zależności częściowych
Skumulowane efekty lokalne
Najważniejsze wnioski
Dalsza lektura

Rozdział 14. Od predykcji do decyzji

Analiza procesu podejmowania decyzji
Proste reguły decyzyjne oparte na inteligentnym wyznaczaniu wartości progowych
Precyzja i czułość
Przykład: pozyskiwanie list kontaktów
Optymalizacja macierzy błędów
Najważniejsze wnioski
Dalsza lektura

Rozdział 15. Zmiany dodatkowe – Święty Graal danologii?

Definiowanie zmian dodatkowych
Wnioskowanie przyczynowe w celu poprawy predykcji
Wnioskowanie przyczynowe jako wyróżnik
Usprawnione podejmowanie decyzji
Czynniki zakłócające i kolidery
Błąd doboru
Założenie o braku zmiennych zakłócających
Radzenie sobie z błędem doboru – randomizacja
Dopasowywanie
Uczenie maszynowe i wnioskowanie przyczynowe
Kod otwartoźródłowy
Podwójne uczenie maszynowe
Najważniejsze wnioski
Dalsza lektura

Rozdział 16. Testy A/B

Czym są testy A/B?
Kryterium decyzyjne
Minimalne wykrywalne efekty
Ustalanie mocy statystycznej, poziomu istotności i wartości P
Szacowanie wariancji wyniku
Symulacje
Przykład: współczynniki konwersji
Określanie wartości MWE
Lista hipotez do zbadania
Wskaźnik
Hipoteza
Uszeregowanie
Zarządzanie eksperymentami
Najważniejsze wnioski
Dalsza lektura

Rozdział 17. Modele LLM i praktyka danologii

Obecny stan sztucznej inteligencji
Czym zajmują się danologowie?
Ewolucja opisu stanowiska danologa
Studium przypadku: testy A/B
Studium przypadku: oczyszczanie danych
Studium przypadku: uczenie maszynowe
Modele LLM a ta książka
Najważniejsze wnioski
Dalsza lektura

Skorowidz

ISBN

978-83-289-1294-6

Liczba stron

Rok wydania

Wydawca

Opinie

Na razie nie ma opinii o produkcie.

Napisz pierwszą opinię o „DATA SCIENCE WYZWANIA I ROZWIĄZANIA”

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *