Modele bazowe (foundation models) zapoczątkowały prawdziwy rozkwit aplikacji opartych na sztucznej inteligencji. AI stała się potężnym narzędziem rozwojowym, którego dziś może używać niemal każdy. Decyzja o stworzeniu własnej aplikacji AI wymaga jednak zrozumienia procesu budowy i świadomego podejmowania decyzji projektowych.
Ta książka jest kompleksowym przewodnikiem po budowaniu generatywnych aplikacji AI w środowiskach produkcyjnych.
Luke Metz, współtwórca ChatGPT w OpenAI
Ten przystępnie napisany i praktyczny podręcznik pokazuje, czym jest inżynieria AI i w jaki sposób tworzy się aplikacje z wykorzystaniem łatwo dostępnych modeli bazowych. Dowiesz się, jak się poruszać w świecie sztucznej inteligencji, czym dokładnie są modele, zbiory danych, wskaźniki oceny i wzorce aplikacyjne. W książce przedstawiono również, krok po kroku, kompletny proces tworzenia aplikacji AI i ich efektywnego wdrażania. Poszczególne zagadnienia zostały zilustrowane dobrze udokumentowanymi studiami przypadków. Nie zabrakło również komentarzy odnoszących się do zaimplementowania systemu opinii użytkowników w celu zapewnienia przydatnych informacji zwrotnych.
Najważniejsze zagadnienia:
istota inżynierii AI
proces tworzenia aplikacji AI
różne techniki adaptacji modeli, w tym inżynieria promptów, generowanie wspomagane wyszukiwaniem (RAG), dostrajanie modeli, agenty i inżynieria zbiorów danych
wąskie gardła modeli podstawowych i ich pokonywanie
zasady wyboru modelu, wskaźników, danych oraz wzorców projektowych
Pozycja obowiązkowa dla każdego profesjonalisty, który chce wdrożyć AI w swojej firmie!
Spis treści
Wstęp
Rozdział 1. Wprowadzenie do tworzenia aplikacji AI przy użyciu modeli podstawowych
Rozwój inżynierii AI
Od modeli językowych do dużych modeli językowych
Od dużych modeli językowych do modeli podstawowych
Od modeli podstawowych do inżynierii AI
Przykłady zastosowań modeli podstawowych
Programowanie
Tworzenie obrazów i wideo
Generowanie tekstów
Edukacja
Boty konwersacyjne
Agregacja informacji
Organizowanie danych
Automatyzacja przepływu danych
Planowanie aplikacji AI
Ocena przypadków użycia
Ustalenie oczekiwań
Zaplanowanie kamieni milowych
Konserwacja i utrzymanie
Stos technologiczny inżynierii AI
Trzy warstwy stosu AI
Inżynieria AI a inżynieria ML
Inżynieria AI a inżynieria pełnowymiarowa
Podsumowanie
Rozdział 2. Zrozumienie modeli podstawowych
Dane treningowe
Modele wielojęzyczne
Modele specyficzne dla danej dziedziny
Modelowanie
Architektura modelu
Rozmiar modelu
Post-trening
Dostrajanie nadzorowane
Dostrajanie preferencji
Próbkowanie
Podstawy próbkowania
Strategie próbkowania
Efektywność obliczeniowa czasu testowania
Dane ustrukturyzowane
Probabilistyczna natura sztucznej inteligencji
Podsumowanie
Rozdział 3. Metodyka ewaluacji
Wyzwania związane z ewaluacją modeli podstawowych
Zrozumienie wskaźników dotyczących modelowania języka
Entropia
Entropia krzyżowa
Wskaźniki bits-per-character i bits-per-byte
Nieokreśloność
Interpretacja nieokreśloności i jej zastosowania
Ewaluacja dokładna
Poprawność funkcjonalna
Pomiar poziomu podobieństwa względem danych referencyjnych
Wprowadzenie do osadzania
AI jako sędzia
Dlaczego „AI jako sędzia”?
Jak używać metody „AI jako sędzia”?
Ograniczenia metody „AI jako sędzia”
Jakie modele mogą być sędziami?
Ranking modeli wynikający z ewaluacji porównawczej
Wyzwania ewaluacji porównawczej
Przyszłość ewaluacji porównawczej
Podsumowanie
Rozdział 4. Ewaluacja modeli AI
Kryteria ewaluacji
Zdolności specyficzne dla danej dziedziny
Zdolności generacyjne
Zdolność do podążania za instrukcjami
Koszty i opóźnienia
Wybór modelu
Proces wyboru modelu
Budowa czy zakup modelu?
Zestawy testów dostępne publicznie
Projektowanie procesu ewaluacji
Krok 1. Ewaluacja wszystkich komponentów systemu
Krok 2. Utworzenie wytycznych do ewaluacji
Krok 3. Określenie metod ewaluacji i danych
Podsumowanie
Rozdział 5. Inżynieria promptów
Wprowadzenie do tworzenia promptów
Uczenie w kontekście: zero-shot i few-shot
Prompt systemowy a prompt użytkownika
Długość i efektywność kontekstu
Najlepsze zasady inżynierii promptów
Twórz jasno i precyzyjnie sformułowane instrukcje
Dostarcz niezbędny kontekst
Podziel zadania złożone na prostsze podzadania
Daj modelowi czas na myślenie
Doskonal prompty w procesie iteracyjnym
Oceniaj narzędzia do inżynierii promptów
Porządkuj prompty i zarządzaj ich wersjami
Strategia zabezpieczania promptów
Prompty zastrzeżone i inżynieria odwrotna promptów
Omijanie zabezpieczeń i wstrzykiwanie promptów
Ekstrakcja informacji
Obrona przed atakami na prompty
Podsumowanie
Rozdział 6. Generowanie wspomagane wyszukiwaniem i agenty
Generowanie wspomagane wyszukiwaniem
Architektura generowania wspomaganego wyszukiwaniem
Algorytmy wyszukiwania
Optymalizacja wyszukiwania
Generowanie wspomagane wyszukiwaniem a inne modalności
Agenty
Przegląd agentów
Narzędzia
Planowanie
Tryby błędów agenta i sposoby ich oceny
Pamięć
Podsumowanie
Rozdział 7. Dostrajanie
Wprowadzenie do dostrajania
Kiedy należy dostrajać?
Powody, by dostrajać
Powody, by nie dostrajać
Dostrajanie a generowanie wspomagane wyszukiwaniem (RAG)
Ograniczenia pamięciowe
Propagacja wsteczna i parametry trenowane
Obliczenia dotyczące pamięci
Reprezentacje numeryczne
Kwantyzacja
Techniki dostrajania
Dostrajanie efektywne parametrowo
Scalanie modeli i dostrajanie wielozadaniowe
Taktyki dostrajania
Podsumowanie
Rozdział 8. Inżynieria zbiorów danych
Przygotowanie danych
Jakość danych
Pokrycie danych
Ilość danych
Pozyskiwanie i etykietowanie danych
Synteza i generowanie sztucznych danych
Po co stosować syntezę danych?
Tradycyjne metody syntezy danych
Synteza danych wspierana przez AI
Destylacja modelu
Przetwarzanie danych
Inspekcja danych
Deduplikacja danych
Czyszczenie i filtrowanie danych
Formatowanie danych
Podsumowanie
Rozdział 9. Optymalizacja wnioskowania
Zrozumienie optymalizacji wnioskowania
Podstawy wnioskowania
Wskaźniki związane z wydajnością wnioskowania
Akceleratory AI
Optymalizacja wnioskowania
Optymalizacja modelu
Optymalizacja usługi wnioskowania
Podsumowanie
Rozdział 10. Architektura systemów AI i informacje zwrotne od użytkowników
Architektura systemów AI
Krok 1. Rozszerzenie kontekstu
Krok 2. Wprowadzenie zabezpieczeń
Krok 3. Wprowadzenie routingu i bramki dostępowej
Krok 4. Zmniejszenie opóźnień za pomocą mechanizmów buforowania
Krok 5. Dodanie wzorców agentowych
Monitorowanie systemu i przejrzystość jego działania
Orkiestracja potoku AI
Informacja zwrotna od użytkowników
Pozyskiwanie informacji zwrotnej z rozmów
Projektowanie systemu gromadzenia informacji zwrotnych
Ograniczenia systemu gromadzenia informacji zwrotnych
Podsumowanie
Epilog
Skorowidz
Opinie
Na razie nie ma opinii o produkcie.