Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
- Wydawnictwo:
- Helion
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 456
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
Wprawny analityk potrafi się posługiwać zbiorami danych o wysokiej dynamice i różnorodności. Działanie to ułatwia biblioteka open source Pandas, która pozwala, przy użyciu języka Python, zrealizować niemal każde zadanie wymagające analizy danych. Pandas może pomóc w zapewnieniu wiarygodności danych, wizualizowaniu ich pod kątem efektywnego podejmowania decyzji i analizowaniu wielu zbiorów danych.
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywistego zbioru danych, aby wkrótce rozwiązywać złożone problemy danologii, takie jak obsługa brakujących danych, stosowanie regularyzacji czy też używanie metod nienadzorowanego uczenia maszynowego do odnajdywania podstawowej struktury w zbiorze danych. Pracę z poszczególnymi zagadnieniami ułatwia to, że zostały one zilustrowane prostymi, ale praktycznymi przykładami.
W książce:
- importowanie i eksportowanie danych, przygotowywanie ich zbiorów
- tworzenie wykresów za pomocą bibliotek matplotlib, seaborn i Pandas
- konwersja typów danych
- skalowanie operacji przetwarzania danych
- zaawansowane możliwości biblioteki Pandas powiązane z datami i czasem
- dopasowywanie modeli liniowych przy użyciu bibliotek statsmodels i scikit-learn
Analizuj zbiory danych i odkrywaj ukrytą w nich wiedzę!
Automatyzowanie analizy danych oraz zarządzanie nią za pomocą biblioteki Pandas języka Python
Obecnie analitycy muszą zarządzać danymi cechującymi się wyjątkową różnorodnością, dynamiką i wolumenem. Dzięki zastosowaniu biblioteki open source Pandas możesz za pomocą języka Python szybko zautomatyzować i zrealizować prawie każde zadanie dotyczące analizy danych niezależnie od jego wielkości lub stopnia złożoności. Biblioteka ta może pomóc w zapewnieniu wiarygodności danych, wizualizowaniu ich pod kątem efektywnego podejmowania decyzji oraz odtwarzania w pewny sposób analiz w przypadku wielu zbiorów danych.
W książce Biblioteka Pandas dla każdego. Wydanie drugie połączono wiedzę praktyczną i obserwacje w celu umożliwienia rozwiązywania realnych problemów przy użyciu biblioteki Pandas nawet wtedy, gdy dopiero zaczynasz analizować dane za pomocą języka Python. Daniel Y. Chen prezentuje kluczowe pojęcia z wykorzystaniem prostych, lecz praktycznych przykładów. Stopniowo bazuje na nich, aby rozwiązywać trudniejsze i rzeczywiste problemy ze świata danologii. Jest to na przykład zastosowanie regularyzacji w celu uniknięcia nadmiernego dopasowania lub użycie metod nienadzorowanego uczenia maszynowego do znalezienia podstawowej struktury w zbiorze danych.
Nowości w wydaniu drugim obejmują:
- Rozszerzono omówienie tworzenia wykresów oraz biblioteki do wizualizacji danych seaborn.
- Rozbudowano przykłady i zasoby informacji.
- Zaktualizowano kod do wersji 3.9 języka Python oraz omówienie pakietów z uwzględnieniem bibliotek statsmodels i scikit-learn.
Autor umożliwia rozpoczęcia korzystania z biblioteki Pandas z użyciem rzeczywistego zbioru danych. Ponadto omawia łączenie zbiorów danych, obsługę brakujących danych oraz tworzenie struktury zbiorów danych w celu ułatwienia analizy i wizualizacji. Autor demonstruje zaawansowane techniki oczyszczania danych, począwszy od podstawowego modyfikowania łańcuchów, a skończywszy na jednoczesnym stosowaniu funkcji w obrębie wielu ramek danych.
Po przygotowaniu danych autor prezentuje modele dopasowywania używane na potrzeby predykcji, klasteryzacji, wnioskowania i eksplorowania. Zapewnia wskazówki dotyczące wydajności i skalowalności, a także wprowadza do obszerniejszego ekosystemu analizy danych w języku Python.
- Praca z obiektami DataFrame i Series oraz importowanie lub eksportowanie danych.
- Tworzenie wykresów za pomocą bibliotek matplotlib, seaborn i Pandas.
- Łączenie zbiorów danych i obsługa brakujących danych.
- Przekształcanie, porządkowanie i oczyszczanie zbiorów danych w celu ułatwienia pracy z nimi.
- Konwersja typów danych i modyfikowanie łańcuchów tekstowych.
- Stosowanie funkcji do skalowania operacji przetwarzania danych.
- Agregowanie, transformowanie i filtrowanie dużych zbiorów danych za pomocą metody .groupby.
- Korzystanie z zaawansowanych możliwości biblioteki Pandas powiązanych z datami i czasem.
- Dopasowywanie modeli liniowych przy użyciu bibliotek statsmodels i scikit-learn.
Wybrane bestsellery
-
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Jak sądzisz, co stanowi bazę informatyki? Od czego powinien zacząć przyszły programista? Może od opanowania jednego z najpopularniejszych języków programowania? Oczywiście mógłby od tego rozpocząć, tyle że to trochę tak, jakby uczyć się korzystać z narzędzia bez świadomości, do czego ono właściwi...
Informacja i kodowanie. Krótkie wprowadzenie z przykładami zastosowań Informacja i kodowanie. Krótkie wprowadzenie z przykładami zastosowań
(41.30 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Książkę szczególnie docenią analitycy bezpieczeństwa, którzy chcą się zapoznać z zestawem poleceń ARM i zdobyć wiedzę umożliwiającą im efektywne korzystanie z technik inżynierii wstecznej. Poza zestawem potrzebnych poleceń znalazło się w niej mnóstwo przydatnych informacji. Znajdziesz tu przegląd...
Niebieski lis. Polecenia procesorów Arm i inżynieria wsteczna Niebieski lis. Polecenia procesorów Arm i inżynieria wsteczna
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Ewolucja formularzy internetowych zaczęła się od prostych znaczników języka HTML 2.0 opublikowanego w 1993 roku. Z czasem HTML oferował bardziej zaawansowane funkcje obsługi formularzy. Późniejsze wersje, HTML4, a następnie HTML5, wprowadziły nowe typy pól, takie jak pola daty, koloru czy też adr...
Angular i formularze reaktywne. Praktyczny przewodnik Angular i formularze reaktywne. Praktyczny przewodnik
(44.85 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)69.50 zł
139.00 zł(-50%) -
Tę książkę docenią praktycy: inżynierowie uczenia maszynowego i analitycy danych, poszukujący sposobu praktycznego zaadaptowania modeli transformacyjnych do swoich potrzeb. Autorzy skupili się na praktycznej stronie tworzenia aplikacji językowych, a w poszczególnych rozdziałach ujęto wszystkie na...
Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face
(64.35 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Dzisiejszą gospodarką rządzi informacja. Kto potrafi ją wyłuskać z zalewu danych, ten zyskuje konkurencyjną przewagę. Świadomi tego twórcy oprogramowania komputerowego stworzyli szereg narzędzi służących wyszukiwaniu informacji, ich przetwarzaniu, analizowaniu i prezentowaniu w sposób dostępny dl...
Elasticsearch. Kurs video. Pozyskiwanie i analiza danych Elasticsearch. Kurs video. Pozyskiwanie i analiza danych
(99.59 zł najniższa cena z 30 dni)112.05 zł
249.00 zł(-55%) -
Czym jest inżynieria wymagań? To systematyczne podejście do pozyskiwania i dokumentowania wymagań, a także zarządzania nimi. Polega na zrozumieniu potrzeb i oczekiwań interesariuszy, a następnie opisaniu, za pomocą wymagań, systemu, który je spełnia.
Certyfikowany inżynier wymagań. Na podstawie IREB CPRE. Poziom podstawowy Certyfikowany inżynier wymagań. Na podstawie IREB CPRE. Poziom podstawowy
(44.85 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%)
O autorze ebooka
Dr Daniel Y. Chen jest wykładowcą na uczelni University of British Columbia. Prowadzi też zajęcia edukacyjne z zakresu danologii w firmie RStudio PBC. Współpracował z organizacją The Carpentries jako instruktor, prowadzący szkolenia, opiekun materiałów lekcyjnych i kierownik odpowiedzialny za utrzymanie społeczności.
Ebooka "Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Pandas for Everyone: Python Data Analysis (Addison-Wesley Data & Analytics Series), 2nd Edition
- Tłumaczenie:
- Piotr Pilch
- ISBN Książki drukowanej:
- 978-83-289-0151-3, 9788328901513
- Data wydania książki drukowanej:
- 2024-01-16
- ISBN Ebooka:
- 978-83-289-0152-0, 9788328901520
- Data wydania ebooka:
- 2024-01-16 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 165x235
- Numer z katalogu:
- 208967
- Rozmiar pliku Pdf:
- 5.6MB
- Rozmiar pliku ePub:
- 8.3MB
- Rozmiar pliku Mobi:
- 16.4MB
- Pobierz przykładowy rozdział PDF
- Przykłady na ftp
Ebook zawiera materiały dodatkowe, które możesz pobrać z serwera FTP - link znajdziesz na stronie redakcyjnej.
Spis treści ebooka
- Rozdział 1. Typ danych DataFrame biblioteki Pandas - podstawy
- 1.1. Wprowadzenie
- Cele rozdziału
- 1.2. Ładowanie pierwszego zbioru danych
- 1.3. Sprawdzanie kolumn, wierszy i komórek
- 1.3.1. Wybieranie i określanie podzbioru kolumn na podstawie nazwy
- 1.3.2. Określanie podzbioru wierszy
- 1.3.3. Określanie podzbioru wierszy za pomocą numeru wiersza: atrybut .iloc[]
- 1.3.4. Użycie kombinacji
- 1.3.5. Określanie podzbioru wierszy i kolumn
- 1.4. Obliczenia grupowane i agregowane
- 1.4.1. Średnie grupowane
- 1.4.2. Liczebności grupowane
- 1.5. Podstawowy wykres
- Podsumowanie
- Rozdział 2. Struktury danych biblioteki Pandas - podstawy
- Cele rozdziału
- 2.1. Tworzenie własnych danych
- 2.1.1. Tworzenie obiektu Series
- 2.1.2. Tworzenie obiektu DataFrame
- 2.2. Obiekty Series
- 2.2.1. Obiekt Series przypomina typ ndarray
- 2.2.2. Określanie podzbioru wartości boolowskich: obiekt Series
- 2.2.3. Operacje są automatycznie wyrównywane i wektoryzowane (rozgłaszanie)
- 2.3. Obiekt DataFrame
- 2.3.1. Części obiektu DataFrame
- 2.3.2. Określanie podzbioru wartości boolowskich: obiekty DataFrame
- 2.3.3. Operacje są automatycznie wyrównywane i wektoryzowane (rozgłaszanie)
- 2.4. Wprowadzanie zmian w obiektach Series i DataFrame
- 2.4.1. Dodawanie dodatkowych kolumn
- 2.4.2. Bezpośrednie modyfikowanie kolumny
- 2.4.3. Modyfikowanie kolumn za pomocą metody .assign()
- 2.4.4. Usuwanie wartości
- 2.5. Eksportowanie i importowanie danych
- 2.5.1. "Peklowanie"
- 2.5.2. Format danych CSV
- 2.5.3. Excel
- 2.5.4. Format Feather
- 2.5.5. Projekt Arrow
- 2.5.6. Słownik
- 2.5.7. Format JSON
- 2.5.8. Inne typy danych wyjściowych
- Podsumowanie
- Rozdział 3. Tworzenie wykresów - podstawy
- Cele rozdziału
- 3.1. Dlaczego warto wizualizować dane?
- 3.2. Podstawy obsługi biblioteki matplotlib
- 3.2.1. Obiekty rysunków i podwykresy z osiami
- 3.2.2. Anatomia rysunku
- 3.3. Tworzenie graficznych wizualizacji danych statystycznych za pomocą biblioteki matplotlib
- 3.3.1. Jednozmienność (pojedyncza zmienna)
- 3.3.2. Dwuzmienność (dwie zmienne)
- 3.3.3. Dane wielozmienne
- 3.4. Biblioteka seaborn
- 3.4.1. Jednozmienność
- 3.4.2. Dane dwuzmienne
- 3.4.3. Dane wielozmienne
- 3.4.4. Aspekty
- 3.4.5. Style i kompozycje biblioteki seaborn
- 3.4.6. Jak korzystać z dokumentacji biblioteki seaborn?
- 3.4.7. Interfejs biblioteki seaborn następnej generacji
- 3.5. Metoda tworzenia wykresów za pomocą biblioteki Pandas
- 3.5.1. Histogram
- 3.5.2. Wykres gęstości
- 3.5.3. Wykres punktowy
- 3.5.4. Wykres przedziałów sześciokątnych (hexbin)
- 3.5.5. Wykres pudełkowy
- Podsumowanie
- Rozdział 4. Dane uporządkowane
- Cele rozdziału
- Uwaga dotycząca niniejszego rozdziału
- 4.1. Kolumny zawierają wartości, a nie zmienne
- 4.1.1. Utrwalenie jednej kolumny
- 4.1.2. Utrwalenie wielu kolumn
- 4.2. Kolumny zawierają wiele zmiennych
- 4.2.1. Osobne dzielenie i dodawanie kolumn
- 4.2.2. Dzielenie i łączenie kolumn w jednym kroku
- 4.3. Zmienne znajdują się w wierszach i kolumnach
- Podsumowanie
- Cele rozdziału
- Rozdział 5. Zastosowanie funkcji
- Cele rozdziału
- Uwaga dotycząca niniejszego rozdziału
- 5.1. Elementarz funkcji
- 5.2. Zastosowanie funkcji (podstawy)
- 5.2.1. Zastosowanie funkcji względem obiektu Series
- 5.2.2. Zastosowanie funkcji względem obiektu DataFrame
- 5.3. Funkcje wektoryzowane
- 5.3.1. Wektoryzacja za pomocą biblioteki NumPy
- 5.3.2. Wektoryzacja za pomocą biblioteki Numba
- 5.4. Funkcje lambda (funkcje anonimowe)
- Podsumowanie
- Cele rozdziału
- Rozdział 6. Łączenie danych
- Cele rozdziału
- 6.1. Łączenie zbiorów danych
- 6.2. Konkatenacja
- 6.2.1. Części przeglądowe obiektu DataFrame
- 6.2.2. Dodawanie wierszy
- 6.2.3. Dodawanie kolumn
- 6.2.4. Konkatenacja z różnymi indeksami
- 6.3. Jednostki obserwacyjne w obrębie wielu tabel
- 6.3.1. Ładowanie wielu plików za pomocą pętli
- 6.3.2. Ładowanie wielu plików przy użyciu listy składanej
- 6.4. Scalanie wielu zbiorów danych
- 6.4.1. Scalanie typu "jedna z jedną"
- 6.4.2. Scalanie typu "wiele z jedną"
- 6.4.3. Scalanie typu "wiele z wieloma"
- 6.4.4. Sprawdzanie wyników pracy za pomocą asercji
- Podsumowanie
- Rozdział 7. Normalizacja danych
- Cele rozdziału
- 7.1. Wiele jednostek obserwacyjnych w tabeli (normalizacja)
- Podsumowanie
- Rozdział 8. Operacje grupowania: dzielenie, stosowanie i łączenie
- Cele rozdziału
- 8.1. Agregacja
- 8.1.1. Podstawowa agregacja danych grupowanych z jedną zmienną
- 8.1.2. Wbudowane metody agregacji
- 8.1.3. Funkcje agregacji
- 8.1.4. Użycie wielu funkcji jednocześnie
- 8.1.5. Zastosowanie słownika w metodzie .agg() lub .aggregate()
- 8.2. Transformacja
- 8.2.1. Przykład wyniku standardowego z
- 8.2.2. Przykład z brakującymi wartościami
- 8.3. Filtrowanie
- 8.4. Obiekt pandas.core.groupby.DataFrameGroupBy
- 8.4.1. Grupy
- 8.4.2. Obliczenia w ramach grupowania obejmujące wiele zmiennych
- 8.4.3. Wybieranie grupy
- 8.4.4. Iteracja w obrębie grup
- 8.4.5. Wiele grup
- 8.4.6. "Spłaszczanie" wyników (.reset_index())
- 8.5. Zastosowanie obiektu MultiIndex
- Podsumowanie
- Rozdział 9. Brakujące dane
- Cele rozdziału
- 9.1. Czym jest wartość NaN?
- 9.2. Skąd biorą się brakujące wartości?
- 9.2.1. Ładowanie danych
- 9.2.2. Scalone dane
- 9.2.3. Wartości wprowadzane przez użytkownika
- 9.2.4. Ponowne indeksowanie
- 9.3. Zajmowanie się brakującymi danymi
- 9.3.1. Znajdowanie brakujących danych i określanie ich ilości
- 9.3.2. Oczyszczanie danych z brakującymi wartościami
- 9.3.3. Obliczenia uwzględniające brakujące dane
- 9.4. Brakująca wartość NA wbudowana w bibliotece Pandas
- Podsumowanie
- Rozdział 10. Typy danych
- Cele rozdziału
- 10.1. Typy danych
- 10.2. Przekształcanie typów
- 10.2.1. Konwersja do postaci obiektów łańcuchów
- 10.2.2. Przekształcanie w wartości liczbowe
- 10.3. Dane kategorialne
- 10.3.1. Przekształcanie w kategorię
- 10.3.2. Przetwarzanie danych kategorialnych
- Podsumowanie
- Rozdział 11. Łańcuchy i dane tekstowe
- Wprowadzenie
- Cele rozdziału
- 11.1. Łańcuchy
- 11.1.1. Określanie podzbioru i dzielenie łańcuchów
- 11.1.2. Uzyskanie ostatniego znaku łańcucha
- 11.2. Metody łańcuchowe
- 11.3. Dodatkowe metody łańcuchowe
- 11.3.1. Metoda join
- 11.3.2. Metoda splitlines
- 11.4. Formatowanie łańcuchów (f-łańcuchy)
- 11.4.1. Formatowanie liczb
- 11.5. Wyrażenia regularne
- 11.5.1. Dopasowanie wzorca
- 11.5.2. Pamiętaj, jakich używasz wzorców wyrażeń regularnych
- 11.5.3. Znajdowanie wzorca
- 11.5.4. Zastępowanie wzorca
- 11.5.5. Kompilowanie wzorca
- 11.6. Biblioteka regex
- Podsumowanie
- Rozdział 12. Daty i godziny
- Cele rozdziału
- 12.1. Obiekt datetime języka Python
- 12.2. Przekształcanie do postaci ramki danych
- 12.3. Ładowanie danych zawierających daty
- 12.4. Wyodrębnianie składników daty
- 12.5. Obliczenia obejmujące daty i obiekty timedelta
- 12.6. Metody obiektu datetime
- 12.7. Uzyskiwanie danych notowań giełdowych
- 12.8. Określanie podzbioru danych na podstawie dat
- 12.8.1. Obiekt DatetimeIndex
- 12.8.2. Obiekt TimedeltaIndex
- 12.9. Zakresy dat
- 12.9.1. Częstotliwości
- 12.9.2. Przesunięcia
- 12.10. Wartości przesuwające
- 12.11. Ponowne próbkowanie
- 12.12. Strefy czasowe
- 12.13. Biblioteka Arrow do lepszej obsługi dat i godzin
- Podsumowanie
- Rozdział 13. Regresja liniowa (wynikowa zmienna ciągła)
- 13.1. Prosta regresja liniowa
- 13.1.1. Użycie biblioteki statsmodels
- 13.1.2. Zastosowanie biblioteki scikit-learn (sklearn)
- 13.2. Regresja wielokrotna
- 13.2.1. Użycie biblioteki statsmodels
- 13.2.2. Zastosowanie biblioteki scikit-learn (sklearn)
- 13.3. Modele ze zmiennymi kategorialnymi
- 13.3.1. Zmienne kategorialne w bibliotece statsmodels
- 13.3.2. Zmienne kategorialne w bibliotece scikit-learn (sklearn)
- 13.4. Kodowanie One-Hot w bibliotece scikit-learn z wykorzystaniem potoków transformera
- Podsumowanie
- 13.1. Prosta regresja liniowa
- Rozdział 14. Uogólnione modele liniowe
- Coś o tym rozdziale
- 14.1. Regresja logistyczna (binarna zmienna wyjściowa)
- 14.1.1. Użycie biblioteki statsmodels
- 14.1.2. Zastosowanie biblioteki sklearn
- 14.1.3. Zachowaj ostrożność w przypadku domyślnych wartości biblioteki scikit-learn (sklearn)
- 14.2. Regresja Poissona (ilościowa zmienna wynikowa)
- 14.2.1. Użycie biblioteki statsmodels
- 14.2.2. Ujemna regresja dwumianowa w przypadku nadmiernej dyspersji
- 14.3. Bardziej uogólnione modele liniowe
- Podsumowanie
- Rozdział 15. Analiza przeżycia
- 15.1. Dane analizy przeżycia
- 15.2. Krzywe Kaplana-Meiera
- 15.3. Model proporcjonalnego hazardu Coxa
- 15.3.1. Testowanie założeń modelu Coxa
- Podsumowanie
- Rozdział 16. Diagnostyka modeli
- 16.1. Residua
- 16.1.1. Wykresy kwantylowe K-K
- 16.2. Porównanie wielu modeli
- 16.2.1. Korzystanie z modeli liniowych
- 16.2.2. Zastosowanie uogólnionych modeli liniowych
- 16.3. Walidacja krzyżowa k-krotna
- Podsumowanie
- 16.1. Residua
- Rozdział 17. Regularyzacja
- 17.1. Dlaczego regularyzacja?
- 17.2. Regresja LASSO
- 17.3. Regresja grzbietowa
- 17.4. Sieć elastyczna
- 17.5. Walidacja krzyżowa
- Podsumowanie
- Rozdział 18. Klasteryzacja
- 18.1. k-średnie
- 18.1.1. Ograniczanie liczby wymiarów za pomocą analizy PCA
- 18.2. Klastrowanie hierarchiczne
- 18.2.1. Klastrowanie kompletne
- 18.2.2. Klastrowanie pojedyncze
- 18.2.3. Klastrowanie ze średnią
- 18.2.4. Klastrowanie z centroidem
- 18.2.5. Klastrowanie metodą Warda
- 18.2.6. Ręczne ustawianie progu
- Podsumowanie
- 18.1. k-średnie
- Rozdział 19. Świat poza obrębem biblioteki Pandas
- 19.1. Stos do obliczeń (naukowych)
- 19.2. Wydajność
- 19.2.1. Pomiar czasu wykonywania kodu
- 19.2.2. Profilowanie kodu
- 19.2.3. Moduł concurrent.futures
- 19.3. Dask
- 19.4. Siuba
- 19.5. Ibis
- 19.6. Polars
- 19.7. PyJanitor
- 19.8. Pandera
- 19.9. Uczenie maszynowe
- 19.10. Publikowanie
- 19.11. Panele kontrolne
- Podsumowanie
- Rozdział 20. Działanie w pojedynkę jest niebezpieczne!
- 20.1. Lokalne spotkania
- 20.2. Konferencje
- 20.3. The Carpentries
- 20.4. Podcasty
- 20.5. Inne zasoby
- Podsumowanie
- Dodatek A. Mapy pojęć
- Dodatek B. Instalacja i konfiguracja
- B.1. Instalacja języka Python
- B.1.1. Anaconda
- B.1.2. Miniconda
- B.1.3. Odinstalowywanie dystrybucji Anaconda lub Miniconda
- B.1.4. pyenv
- B.2. Instalowanie pakietów języka Python
- B.3. Pobieranie zbiorów danych używanych w książce
- B.1. Instalacja języka Python
- Dodatek C. Wiersz poleceń
- C.1. Instalacja
- C.1.1. System Windows
- C.1.2. System Mac
- C.1.3. System Linux
- C.2. Podstawy
- C.1. Instalacja
- Dodatek D. Szablony projektowe
- Dodatek E. Zastosowanie języka Python
- E.1. Wiersz poleceń i edytor tekstu
- E.2. Python i IPython
- E.3. Jupyter
- E.4. Zintegrowane środowiska programistyczne IDE
- Dodatek F. Katalogi robocze
- Dodatek G. Środowiska
- G.1. Środowiska systemu conda
- G.2. Pyenv + Pipenv
- Dodatek H. Instalacja pakietów
- H.1. Aktualizowanie pakietów
- Dodatek I. Importowanie bibliotek
- Dodatek J. Styl kodu
- J.1. Znaki podziału wiersza w kodzie
- Dodatek K. Kontenery: listy, krotki i słowniki
- K.1. Listy
- K.2. Krotki
- K.3. Słowniki
- Dodatek L. Określanie wartości za pomocą składni wycinków
- Dodatek M. Pętle
- Dodatek N. Listy składane
- Dodatek O. Funkcje
- O.1. Parametry domyślne
- O.2. Parametry arbitralne
- O.2.1. Wyrażenie *args
- O.2.2. Wyrażenie **kwargs
- Dodatek P. Zakresy i generatory
- Dodatek Q. Przypisanie wielokrotne
- Dodatek R. Typ ndarray biblioteki NumPy
- Dodatek S. Klasy
- Dodatek T. Komunikat SettingWithCopyWarning
- T.1. Modyfikowanie podzbioru danych
- T.2. Zastępowanie wartości
- T.3. Dodatkowe zasoby informacji
- Dodatek U. Tworzenie łańcuchów metod
- Dodatek V. Czas wykonywania kodu
- Dodatek W. Formatowanie łańcuchów
- W.1. Formatowanie w stylu języka C
- W.2. Formatowanie łańcuchów: metoda .format()
- W.3. Formatowanie liczb
- Dodatek X. Instrukcje warunkowe (if-elif-else)
- Dodatek Y. Przykład regresji logistycznej ze zbiorem danych ACS dla Nowego Jorku
- Y.0.1. Użycie biblioteki sklearn
- Dodatek Z. Replikowanie wyników za pomocą języka R
- Z.1. Regresja liniowa
- Z.2. Regresja logistyczna
- Z.3. Regresja Poissona
- Z.3.1. Ujemna regresja dwumianowa w przypadku nadmiernej dyspersji
Słowo wstępne do wydania drugiego
Słowo wstępne do wydania pierwszego
Przedmowa
Podziękowania
O autorze
Zmiany w wydaniu drugim
Część I. Wprowadzenie
Część II. Przetwarzanie danych
Część III. Typy danych
Część IV. Modelowanie danych
Część V. Podsumowanie
Dodatki
Skorowidz
Helion - inne książki
-
Dzięki tej przystępnej książce zrozumiesz metody działania wielkich modeli językowych i techniki szkolenia modeli generatywnych. Następnie zapoznasz się z przypadkami użycia, w których ChatGPT sprawdzi się najlepiej, a w efekcie zwiększy produktywność i kreatywność. Dowiesz się też, jak wchodzić ...
Generatywna sztuczna inteligencja z ChatGPT i modelami OpenAI. Podnieś swoją produktywność i innowacyjność za pomocą GPT3 i GPT4 Generatywna sztuczna inteligencja z ChatGPT i modelami OpenAI. Podnieś swoją produktywność i innowacyjność za pomocą GPT3 i GPT4
(51.35 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
Ta książka jest przewodnikiem dla profesjonalistów do spraw cyberbezpieczeństwa. Przedstawia podstawowe zasady reagowania na incydenty bezpieczeństwa i szczegółowo, na przykładach, omawia proces tworzenia zdolności szybkiej i skutecznej reakcji na takie zdarzenia. Zaprezentowano tu techniki infor...
Informatyka śledcza. Narzędzia i techniki skutecznego reagowania na incydenty bezpieczeństwa. Wydanie III Informatyka śledcza. Narzędzia i techniki skutecznego reagowania na incydenty bezpieczeństwa. Wydanie III
(69.30 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Czy wiesz, co kryje się w centrum naszej Galaktyki? Czy zastanawiasz się czasem, jak powstają czarne dziury i co one oznaczają dla naszego zrozumienia wszechrzeczy? Czy chcesz poznać tajemnice tych niesamowitych obiektów, które wykraczają poza granice wyobraźni? Jeśli tak, to bestseller Czarne dz...(41.30 zł najniższa cena z 30 dni)
41.30 zł
59.00 zł(-30%) -
To piąte, gruntownie zaktualizowane wydanie podręcznika, który doceni każdy student informatyki i inżynier oprogramowania. Książka obejmuje szeroki zakres zagadnień, od podstawowych pojęć po zaawansowaną problematykę związaną z najnowszymi trendami w systemach operacyjnych. Wyczerpująco omawia pr...(125.30 zł najniższa cena z 30 dni)
125.30 zł
179.00 zł(-30%) -
Oto drugie, zaktualizowane wydanie znakomitego przewodnika dla analityków danych. Dzięki niemu dowiesz się, w jaki sposób używać języka R do importowania, przekształcania i wizualizowania danych, a także do przekazywania uzyskanych wyników analizy. Nauczysz się też rozwiązywać najczęściej występu...
Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II
(90.30 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Bez Photoshopa, Illustratora i InDesigna wielu profesjonalnych grafików nie wyobraża sobie pracy. Każda z tych aplikacji jest znakomita, ale często do uzyskania jakiegoś spektakularnego efektu trzeba użyć dwóch lub trzech. Musisz więc zrozumieć zależności między tymi aplikacjami i dokładnie wiedz...
Adobe Photoshop, Illustrator i InDesign. Współdziałanie i przepływ pracy. Oficjalny podręcznik Adobe Photoshop, Illustrator i InDesign. Współdziałanie i przepływ pracy. Oficjalny podręcznik
(70.85 zł najniższa cena z 30 dni)76.30 zł
109.00 zł(-30%) -
ChatGPT wywołał wstrząs w branży technologicznej. Programiści i wynalazcy otrzymali niesamowite możliwości dostępne na wyciągnięcie ręki. Interfejs API OpenAI i towarzyszące mu biblioteki stanowią gotowe rozwiązanie dla każdego twórcy aplikacji opartych na sztucznej inteligencji. Programista za p...
Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i fascynujące projekty Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i fascynujące projekty
(38.35 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
Ta książka pomoże Ci się przygotować do pracy na stanowisku testera oprogramowania, a także zapewni wsparcie podczas wykonywania nowych zadań. Znajdziesz tu dokładne omówienie podstaw testowania, jego różnych rodzajów i poziomów w odniesieniu do zastosowania na różnych etapach pracy nad projektem...
Tester samouk. Praktyczny przewodnik po testowaniu oprogramowania na bazie gotowego projektu Tester samouk. Praktyczny przewodnik po testowaniu oprogramowania na bazie gotowego projektu
(38.35 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
Książka stanowi zbiór praktycznych informacji dotyczących najpopularniejszych wzorców projektowych. Lekturę rozpoczniesz od zapoznania się z możliwościami korzystania z wzorców projektowych na platformie Javy. Dowiesz się także, jakich zasad trzeba przestrzegać, aby zapewnić czytelność i łatwość ...
Wzorce projektowe dla programistów Javy. Udoskonal swoje umiejętności projektowania oprogramowania Wzorce projektowe dla programistów Javy. Udoskonal swoje umiejętności projektowania oprogramowania
(43.55 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Dzięki tej książce nauczysz się gromadzić publicznie dostępne informacje, korzystać z wiedzy o cyklu życia wrażliwych danych i przekształcać je w informacje wywiadowcze przydatne dla zespołów zajmujących się bezpieczeństwem. Opanujesz proces gromadzenia i analizy danych, poznasz również strategie...
Prawdziwa głębia OSINT. Odkryj wartość danych Open Source Intelligence Prawdziwa głębia OSINT. Odkryj wartość danych Open Source Intelligence
(64.35 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Daniel Y. Chen (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.