Używamy cookies, aby ułatwić korzystanie z Portalu. Możesz określić warunki przechowywania, dostępu do plików cookies w Twojej przeglądarce. Dowiedz się więcej.
strona główna Strona główna | Nowości | Promocje | Zapowiedzi Twoje konto | Zarejestruj | Schowek | Kontakt | Pomoc
mapa działów
Szukaj: szukanie zaawansowane
Koszyk
Książki \ Programowanie \ Język R

Język R dla każdego: zaawansowane analizy i grafika statystyczna Język: 1

978-83-7541-336-6

Cena Brutto: 98.70

Cena netto: 94.00

Ilość:
Wersja: Drukowana
Autor Jared P. Lander
Liczba_stron 606
Wydawnictwo Pearson - Addison-Wesley
Oprawa miękka
Data_Wydania 2018-01-17

Język R

dla każdego: zaawansowane analizy i grafika statystyczna



Przy użyciu języka R możesz budować skuteczne modele statystyczne i znaleźć odpowiedzi na wiele spośród najtrudniejszych pytań. Tworzony w ramach open source język R tradycyjnie uważany jest za trudny do opanowania dla nie-statystyków, zaś większość dostępnych książek zakłada zbyt dużą już obecną wiedzę na ten temat, aby były prawdziwie pomocne. Rozwiązaniem tego problemu jest ten tytuł: R dla każdego.

Opierając się na swoich rozległych doświadczeniach w nauczaniu nowych użytkowników, Jared P. Lander przygotował doskonały tutorial dla każdego, kto dopiero wkracza w świat programowania i modelowania statystycznego. Przewodnik ten, zaplanowany tak, aby nauka była prosta i intuicyjna, skupia się na tych 20 procentach funkcjonalności R, których potrzebujemy, aby móc zrealizować 80 procent nowoczesnych zadań.

Wykład rozpoczyna się od absolutnych podstaw, oferując liczne ćwiczenia praktyczne i przykładowy kod. Trzeba pobrać i zainstalować R, poznać środowisko, opanować podstawowe sterowanie pro-gramu, importowanie danych, przetwarzanie ich i wizualizację, a także wykonywanie podstawowych testów. Na tym fundamencie można konstruować pełne modele, zarówno liniowe, jak i nieliniowe i używać technik drążenia danych. A na koniec sprawimy, aby nasz kod był reprodukowalny przy użyciu LaTeX, RMarkdown oraz Shiny.

Po ukończeniu lektury nie będziesz po prostu wiedział, jak pisać programy w R – będziesz gotów rozwiązywać problemy statystyczne, na których ci zależy.

W książce autor omawia następujące zagadnienia:
  • Podstawy R, RStudio i pakietów R
  • Używanie R dla obliczeń: typy zmiennych, wektory, wywoływanie funkcji i więcej
  • Korzystanie ze struktur danych, w tym ramek danych, macierzy i list
  • Wczytywanie danych z różnych typów źródeł
  • Tworzenie atrakcyjnych, intuicyjnych grafik statystycznych
  • Pisanie funkcji zdefiniowanych przez użytkownika
  • Sterowanie przepływem programu przy użyciu wyrażeń warunkowych i złożonych testów
  • Usprawnianie wydajności dzięki manipulacjom grupowym
  • Łączenie i przekształcanie wielu zbiorów danych
  • Manipulowanie ciągami znakowymi przy użyciu funkcji R i wyrażeń regularnych
  • Tworzenie rozkładów prawdopodobieństwa – w tym normalnego, dwumianowego i Poissona
  • Budowanie modeli liniowych, uogólnionych liniowych i nieliniowych
  • Programowanie podstawowych statystyk: średnich, odchyleń standardowych i testów t
  • Trenowanie modeli uczenia maszynowego
  • Ocenianie jakości modelu i wybieranie zmiennych
  • Ochrona przed nadmiernym dopasowaniem i wybieranie zmiennych przy użyciu metod Elastic Net i Bayesa
  • Analizowanie jedno- i wieloczynnikowych serii danych czasowych
  • Grupowanie danych poprzez k-średnie i gromady hierarchiczne
  • Przygotowywanie raportów, pokazów slajdów i stron Web przy użyciu knitr
  • Interaktywne wyświetlanie danych przy użyciu RMarkdown i htmlwidgets
  • Implementowanie tablic kontrolnych przy użyciu Shiny
  • Budowanie pakietów R za pomocą ­devtools i Rcpp

O autorze:
Jared P. Lander zajmuje stanowisko Chief Data Scientist w Lander Analytics, zlokalizowanej w Nowym Jorku firmie specjalizującej się w analizach statystycznych i usługach szkoleniowych, jednej z organizatorów New York Open Statistical Programming Meetup – największego na świecie spotkania użytkowników i twórców R – oraz New York R Conference. Jest wykładowcą statystyki na Uniwersytecie Columbia. Posiadając dyplom M.A. z Uniwersytetu Columbia w dziedzinie staty-styki oraz B.S. z matematyki uzyskany w ­Muhlenberg College, ma doświadczenie zarówno w badaniach naukowych, jak i komercyjnych zastosowaniach. Jared często występuje na różnorod-nych konferencjach i spotkaniach na całym świecie. Jego artykuły na temat statystyki można znaleźć na stronie jaredlander.com. Jego prace są cytowane w takich czasopismach, jak Forbes i Wall Street Journal.

Słowo wstępne. . . . . . . . . . xi

Wprowadzenie. . . . . . . . . xiii

1 Poznajemy R . . . . . . . . . . . .1

1.1 Pobieranie R . . . . . . . . . . 1

1.2 Wersja R. . . . . . . . . . . . . . 2

1.3 Wersja 32- czy 64-bitowa . . . . . . . . . . 2

1.4 Instalowanie . . . . . . . . . . 3

1.5 Microsoft R Open. . . . 14

1.6 Podsumowanie . . . . . . 15

2 Środowisko R. . . . . . . . . . .17

2.1 Interfejs wiersza polecenia . . . . . . . . 18

2.2 RStudio . . . . . . . . . . . . . 19

2.3 Microsoft Visual Studio. . . . . . . . . . . 35

2.4 Podsumowanie . . . . . . 36

3 Pakiety R. . . . . . . . . . . . . . .37

3.1 Instalowanie pakietów 38

3.2 Ładowanie pakietów . 40

3.3 Budowanie pakietu . . . 41

3.4 Podsumowanie . . . . . . 42

4 Podstawy R. . . . . . . . . . . . .43

4.1 Podstawowe działania arytmetyczne . . . . . . . . . . . 43

4.2 Zmienne . . . . . . . . . . . . 44

4.3 Typy danych. . . . . . . . . 46

4.4 Wektory . . . . . . . . . . . . . 52

4.5 Wywoływanie funkcji. 58

4.6 Dokumentacja funkcji 58

4.7 Brakujące dane. . . . . . . 59

4.8 Potoki . . . . . . . . . . . . . . . 61

4.9 Podsumowanie . . . . . . 62

5 Zaawansowane struktury danych. . . . .63

5.1 Ramki danych . . . . . . . 63

vi Spis treści

5.2 Listy . . . . . . . . . . . . . . . . 71

5.3 Macierze . . . . . . . . . . . . 77

5.4 Tablice . . . . . . . . . . . . . . 80

5.5 Podsumowanie . . . . . . 81

6 Wczytywanie danych do R . . . . . . . . . . .83

6.1 Czytanie plików CSV. 83

6.2 Dane Excela . . . . . . . . . 88

6.3 Wczytywanie z baz danych . . . . . . . . 91

6.4 Dane z innych narzędzi statystycznych. . . . . . . . . . . . 94

6.5 Pliki binarne języka R 95

6.6 Dane dołączone do R. 97

6.7 Wydobywanie danych z witryn sieci Web . . . .. . . . . . 98

6.8 Wczytywanie danych JSON. . . . . . 101

6.9 Podsumowanie . . . . . 103

7 Grafi ka statystyczna. . . 105

7.1 Podstawowe funkcje grafi czne. . . . 105

7.2 ggplot2 . . . . . . . . . . . . . 109

7.3 Podsumowanie . . . . . 123

8 Tworzenie funkcji w języku R . . . . . . 125

8.1 Hello, World! . . . . . . . 125

8.2 Argumenty funkcji . . 126

8.3 Zwracane wartości . . 129

8.4 Funkcja do.call . . . . . . 130

8.5 Podsumowanie . . . . . 131

9 Wyrażenia sterujące. . . 133

9.1 if oraz else . . . . . . . . . . 133

9.2 switch . . . . . . . . . . . . . . 136

9.3 ifelse . . . . . . . . . . . . . . . 138

9.4 Złożone testy . . . . . . . 139

9.5 Podsumowanie . . . . . 140

10 Pętle – nie-R metoda iteracji . . . . . . . 141

10.1 Pętle for . . . . . . . . . . . 141

10.2 Pętle while . . . . . . . . 143

10.3 Sterowanie pętlami. 144

10.4 Podsumowanie . . . . 144

11 Manipulacje grupowe . 145

Spis treści vii

11.1 Rodzina apply . . . . . 145

11.2 aggregate . . . . . . . . . . 149

11.3 plyr . . . . . . . . . . . . . . . 152

11.4 data.table. . . . . . . . . . 157

11.5 Podsumowanie . . . . 166

12 Szybsze manipulacje grupowe przy użyciu dplyr. . . . . 167

12.1 Potoki. . . . . . . . . . . . . 167

12.2 tbl . . . . . . . . . . . . . . . . 168

12.3 select. . . . . . . . . . . . . . 170

12.4 fi lter . . . . . . . . . . . . . . 176

12.5 slice. . . . . . . . . . . . . . . 180

12.6 mutate . . . . . . . . . . . . 181

12.7 summarize . . . . . . . . 184

12.8 group_by . . . . . . . . . 185

12.9 arrange . . . . . . . . . . . . 186

12.10 do . . . . . . . . . . . . . . . 187

12.11 Stosowanie dplyr dla baz danych . . .  . . . . . 189

12.12 Podsumowanie . . . 192

13 Iteracje przy użyciu purrr. . . . . . . . . . 193

13.1 map. . . . . . . . . . . . . . . 193

13.2 Funkcja map ze wskazanymi typami . . . .  . . . . . 195

13.3 Iteracje przez obiekt data.frame . 201

13.4 Funkcja map z wieloma wejściami. . . . . .  . . . . . . . 202

13.5 Podsumowanie . . . . 203

14 Kształtowanie danych . 205

14.1 Funkcje cbind oraz rbind . . . . . . . 205

14.2 Złączenia . . . . . . . . . . 206

14.3 reshape2 . . . . . . . . . . 212

14.4 Podsumowanie . . . . 216

15 Kształtowanie danych w Tidyverse . 217

15.1 Sklejanie wierszy i kolumn. . . . . . 217

15.2 Złączenia przy użyciu dplyr . . . . . 218

15.3 Konwertowanie formatów danych. . . . . .. . . . . 223

15.4 Podsumowanie . . . . 227

16 Manipulowanie ciągami znaków . . . 229

16.1 paste . . . . . . . . . . . . . . 229

viii Spis treści

16.2 sprintf. . . . . . . . . . . . . 230

16.3 Wyodrębnianie tekstu . . . . . . . . . . 231

16.4 Wyrażenia regularne . . . . . . . . . . . 235

16.5 Podsumowanie . . . . 242

17 Rozkłady prawdopodobieństwa. . . . 243

17.1 Rozkład normalny . 243

17.2 Rozkład dwumianowy. . . . . . . . . . 249

17.3 Rozkład Poissona . . 254

17.4 Inne rozkłady . . . . . . 257

17.5 Podsumowanie . . . . 260

18 Podstawowe statystyki 261

18.1 Statystyki podsumowujące . . . . . 261

18.2 Korelacja i kowariancja . . . . . . . . . 265

18.3 Test t-Studenta . . . . 274

18.4 ANOVA. . . . . . . . . . . 283

18.5 Podsumowanie . . . . 286

19 Modele liniowe . . . . . . . 287

19.1 Prosta regresja liniowa. . . . . . . . . . 287

19.2 Regresja wieloraka . 293

19.3 Podsumowanie . . . . 310

20 Uogólnione modele liniowe . . . . . . . 311

20.1 Regresja logistyczna. . . . . . . . . . . . 311

20.2 Regresja Poissona . . 315

20.3 Inne uogólnione modele liniowe 319

20.4 Analiza przeżycia . . 319

20.5 Podsumowanie . . . . 325

21 Diagnostyka modelu . . 327

21.1 Reszty. . . . . . . . . . . . . 327

21.2 Porównywanie modeli. . . . . . . . . . 333

21.3 Sprawdzian krzyżowy . . . . . . . . . . 337

21.4 Bootstrap . . . . . . . . . 342

21.5 Krokowe wybieranie zmiennych 346

21.6 Podsumowanie . . . . 350

22 Regularyzacja i ściąganie . . . . . . . . . . 351

22.1 Elastic Net. . . . . . . . . 351

22.2 Ściąganie bayesowskie. . . . . . . . . . 370

Spis treści ix

22.3 Podsumowanie . . . . 375

23 Modele nieliniowe . . . . 377

23.1 Modele nieliniowe najmniejszych kwadratów . . . . . . . . . . . . 377

23.2 Interpolacja funkcjami sklejanymi . . . . . . .. . . . 380

23.3 Uogólnione modele addytywne . 384

23.4 Drzewa decyzyjne . 391

23.5 Wzmocnione drzewa decyzyjne. 394

23.6 Lasy losowe . . . . . . . 397

23.7 Podsumowanie . . . . 399

24 Serie czasowe i autokorelacja . . . . . . 401

24.1 Autoregresywne średnie ruchome. . . . . . . . . . . 401

24.2 VAR . . . . . . . . . . . . . . 409

24.3 GARCH . . . . . . . . . . 415

24.4 Podsumowanie . . . . 422

25 Grupowanie . . . . . . . . . . 423

25.1 K-średnie. . . . . . . . . . 423

25.2 PAM. . . . . . . . . . . . . . 432

25.3 Grupowanie hierarchiczne. . . . . . 439

25.4 Podsumowanie . . . . 444

26 Dopasowywanie modelu przy użyciu Caret . . . . . . . . . . . 445

26.1 Podstawy Caret . . . . 445

26.2 Opcje Caret . . . . . . . 446

26.3 Dostrajanie wzmocnionego drzewa . . . . . . . . . . 448

26.4 Podsumowanie . . . . 452

27 Reprodukowalność i raporty przy użyciu knitr . . . . . . .  . . . . . . 453

27.1 Instalowanie programu LATEX . . 453

27.2 Elementarz LATEX . 454

27.3 Korzystanie z knitr w połączeniu z LATEX. . . . . .. . . . . . . 457

27.4 Podsumowanie . . . . 463

28 Tworzenie bogatych dokumentów przy użyciu RMarkdown. . . . . . . . . . . . . 465

28.1 Kompilowanie dokumentu . . . . . 465

28.2 Nagłówek dokumentu. . . . . . . . . . 466

28.3 Elementarz języka Markdown. . . 467

28.4 Wstawki kodu w Markdown . . . . 469

28.5 htmlwidgets . . . . . . . 471

x Spis treści

28.6 Pokazy slajdów RMarkdown . . . . 485

28.7 Podsumowanie . . . . 486

29 Tworzenie interaktywnych tablic kontrolnych przy użyciu Shiny . . . . . . . . 487

29.1 Shiny w RMarkdown. . . . . . . . . . . 488

29.2 Wyrażenia reaktywne w Shiny . . 493

29.3 Serwer i UI . . . . . . . . 496

29.4 Podsumowanie . . . . 505

30 Tworzenie pakietów R. 507

30.1 Struktura folderów . 507

30.2 Pliki pakietu . . . . . . . 508

30.3 Dokumentacja pakietu . . . . . . . . . 515

30.4 Testy. . . . . . . . . . . . . . 518

30.5 Sprawdzanie, kompilacja i instalowanie . .  . . . . 521

30.6 Wysyłanie pakietu do CRA N . . . 523

30.7 Kod C++. . . . . . . . . . 523

30.8 Podsumowanie . . . . 530

A Praktyczne zasoby . . . . 531

A.1 Meetupy . . . . . . . . . . . 531

A.2 Stack Overfl ow . . . . . 533

A.3 Twitt er. . . . . . . . . . . . . 533

A.4 Konferencje . . . . . . . . 533

A.5 Witryny Web . . . . . . . 534

A.6 Dokumenty . . . . . . . . 534

A.7 Książki. . . . . . . . . . . . . 535

A.8 Podsumowanie . . . . . 536

B Słownik . . . . . . . . . . . . . . 537

Spis ilustracji . . . . . . . . . 553

Spis tabel. . . . . . . . . . . . . 561

Indeks ogólny . . . . . . . . 563

Indeks funkcji . . . . . . . . 571

Indeks osób . . . . . . . . . . 581

Indeks pakietów . . . . . . 582

Indeks zbiorów danych 584

powrót
 
Produkty Podobne
Zestaw 2 książek do języka R (Język R dla każdego + Wydajne programowanie w R)
Wydajne programowanie w R. Praktyczny przewodnik po lepszym programowaniu
Język R dla każdego: zaawansowane analizy i grafika statystyczna
Język R. Kompletny zestaw narzędzi dla analityków danych
Więcej produktów