グラフ・分析

【超入門dplyr】Rのパッケージであるdplyrの最低限知っておくべき使い方

dplyr

パッケージを使うのすら初心者なんだけど

dplyrってどうやって使うんだっけ?

という方にdplyrの使い方をお伝えするよ。

Rにもともと入っているデータを使うので、データをダウンロードする必要もないですわ。

RStudioとこの記事を、交互に見るのが大変だよぉぉ

という方に向けて、次のコードを用意したよ。

  1. 関数ごとに分けたもの(実行しなくても理解できる)
  2. 具体的な説明とコードを書いたもの(実行するのがおすすめ)

もしエラーがおきたらteratailで質問してみてください。エンジニアさんやプログラマーさんが教えてくれますよ。

dplyr関数ごとに分けたもの

dplyrのインストールと読み込み

パッケージ読み込み

install.packages(“dplyr”)
library(dplyr)

他のインストール方法もあるわ。

データを見てみる

今回はRにもともと入っているデータを使うので、ダウンロードする必要はありません。

ToothGrowthデータを表示

head(ToothGrowth)

dplyr

len、supp、doseが列名です。

「ToothGrowth」というのは、ギニアピッグの歯の成長に対するビタミンCの効果を表しているよ。

意味わかんなくても大丈夫。あくまでdplyrの使い方。

もしデータの概要が気になるという方がいたら、このコードで見れるよ。

ヘルプ

?ToothGrowth

filterを使ってみる

列名の一部を指定して取り出す

ToothGrowthデータの中でsuppがVCであるもののデータを表示してみる。

suppがVCであるときのデータを表示してみるわ。イコールは二個だよ。

supp ==VC

ToothGrowth %>% filter(supp == “VC”) %>% head()

filterでデータの取得する部分を指定しているね。

dplyr

条件付きでfilterを使う

列名だけでなく、5以上とか20以上とか数値を指定することができます。

lenが30より上,suppがOJのものを取り出す。

len >30 supp==OJ

ToothGrowth %>% filter(len > 30, supp == “OJ”)

dplyr

lenが20より上,doseが1のものを取り出す。

len > 20, dose == 1

ToothGrowth %>% filter(len > 20, dose == 1)

dplyr

数値のときは””はいらない。文字列のときは””は必要。

selectを使う

selectで必要な列を取り出す

列名がlenのものを取り出すよ。

lenだけを取り出す

ToothGrowth %>% select(len) %>% head()

dplyr

selectで列名を変える

列名を変えることもできるわ。列名lenをlengthにしてみます。

lenをlength

ToothGrowth %>% select(length = len) %>% head()

dplyr

mutateを使う

mutateで列を追加する

doseに10をかけたdose2という列名を追加していくわ。10をかけた理由とかないけどね。

dose2をデータに追加

ToothGrowth %>% mutate(dose2 = dose * 10) %>% head()

dplyr

dplyrの具体的な説明とコードを書いたもの

こっちは、この記事とRStudioなどを交互に見る必要ないバージョンです。Rstudioなどのファイルにコピペして使ってください。

▼RStudioでファイルを作る

①File
②New file
③R Script

dplyrの使い方

dplyr入門
パイプ処理偏
#dplyrは、データフレームを効率的に処理できるもの
#パッケージのインストールと読み込み
install.packages(“dplyr”)
library(dplyr)

##Rにもともと入っているデータ(ToothGrowth)を使う
#head()でデータの上から5行を表す
head(ToothGrowth)

##ToothGrowthはギニアピッグの歯の成長に対するビタミンCの効果
#説明を深く知りたいときは「?データ名」で説明が見れる ?ToothGrowth

##データには歯の長さ(len)、ビタミンCの種類(supp)VCかOJか、ビタミンCの量(dose) #Formatってところにあるよ

###filter
##ToothGrowthデータの中でsuppがVCであるもののデータを表示
#suppがOJであるときのデータを表示してみる
ToothGrowth %>% filter(supp == “VC”) %>% head()

ToothGrowthデータの中でsuppがOJであるもののデータを表示
#suppがOJであるときのデータを表示してみる
ToothGrowth %>% filter(supp == “OJ”) %>% head()
#filterでデータの取得する部分を表しているような感じ

##条件付きfilterを利用する
#lenが30より上,suppがVC
ToothGrowth %>% filter(len > 30, supp == “OJ”)
#lenが20より上,doseが1
ToothGrowth %>% filter(len > 20, dose == 1)

###select
##selectで必要な列を取り出す
#lenだけを取りだす
ToothGrowth %>% select(len) %>% head()

##selectで列名を変えることもできる
#列名lenをlengthにする
ToothGrowth %>% select(length = len) %>% head()

##mutate
#列を追加することが出来る(*はかけると同じ)
ToothGrowth %>% mutate(dose2 = dose * 10) %>% head()

###番外編
##magrittrパッケージを使えば、列名を上書きできる
install.packages(magrittr) library(magrittr)

#列を上書きすることができる
#上書きすることのできる%<>%を使う
ToothGrowth %<>% mutate(dose = dose * 10) %>% head() ToothGrowth

 

まとめ:dplyrを簡単に使えましたか?

まとめ

  • データがないときはRに付属してあるデータを使う
  • 説明した関数は↓
  • filter
  • select
  • mutate

ゼロから始めるR言語に戻る

R言語
【随時更新】ゼロから始めるR言語【2018/3/30日更新】RとRStudioのインストールからグラフ・図・分析、テキストマイニング、スクレイピングなどをやっていきます。ネットでRを勉強したい人は是非ご覧ください。...

Rに関する本

 

データサイエンティストになりたいなら

  • データサイエンティストになりたいけど、漠然とRの勉強をしている

もしそうならば、戦略的に勉強しましょう。戦略的に勉強しなければデータサイエンティストになるのは夢のままになってしまう可能性があります。

データサイエンティストになるためのおすすめの勉強方法・講座を3つご紹介します。

①通勤講座でデータサイエンティストの講座を受ける

  • ビジネスにデータを活用したいが方法が分からない。
  • ビックデータをどう扱えばよいか分からない。
  • データサイエンティストになりたいが、どうすればいいのか分からない。

このような場合、データサイエンティスト基礎講座 を受けてるのはどうでしょうか。動画によって、上のような悩みを解決してくれます。

まずデータサイエンティスト の基礎を学んでみて、ビジネススキルが足りなかったらUdemy で勉強するのが良いです。

いまなら10%クーポンもありますし、無料の動画もあります。今行動しないと一生やりませんので、もう少し下を見てからで良いのでご覧ください。

▼まずデータサイエンティストの基礎を学ぶ▼

データサイエンティストの基礎を学ぶ>>

②Udemyのデータサイエンティスト講座を受ける  

「Udemy」も動画で学ぶタイプの講座です。データサイエンティストになるための講座がそこそこあります。

通勤講座とちがうのが安さです。どちらも内容の質が良いことは間違えないのですが、Udenyは安めです。

「自分この部分の知識がないな」と思ったときの補強でも使えますね。一度講座をとって気に入らなかったら、全額返金できます。

▼データサイエンティストの基礎を学んだり、知識の補強をする▼

 Udemyのデータサイエンティスト講座を受ける>>

③データサイエンティスト育成スクールにいく

本気でデータサイエンティストになりたいなら、このスクールに行くのがおすすめです。

データサイエンティストに必要な知識は膨大です。統計学、機械学習、人工知能、データベース、プログラミング、ビジネススキルなどなど。

その知識をデータサイエンティストとしての経験がある先生たちが、オフラインで教えてくれます。

動画です。ご覧ください。

どうですか、めっちゃ良いですよね。ここは他の講座と違うなと思った部分があるのですが、転職支援もしてくれます。

さらに

データサイエンティスト全コースを一括で申し込んでいただいた方のみ、
ブートキャンプ終了時にご満足いただけない場合は受講料を全額返金します。

返金保障もあります。

もしまだ心配な方は説明会もありますので、いって見てください。

  • 未経験からデータサイエンティスト目指せる(Rを触っているあなたならもっと安心)
  • 返金保障あり
  • データサイエンティストに必要な知識を学べる
  • オフライン
  • データサイエンティスト経験がある先生に質問ができる
  • 転職支援あり

もう一度言います。本気でデータサイエンティストを目指すならおすすめです。

▼データサイエンティストになる▼

未経験からデータサイエンティストになる>> 

どれにしますか

①と②の場合はまず基礎を学んで、足りないところを補充して転職という感じです。③は転職支援もあるので安心です。

思いたったときに行動しなければ意味がありません。将来的にデータサイエンティストになりたいなら今すぐ行動しましょう。

データサイエンティストの基礎を学ぶ
通勤講座のデータサイエンティストの講座を受ける  

データサイエンティストの基礎を学んだり、知識の補強をする
Udemyのデータサイエンティスト講座を受ける  

本気でデータサイエンティストを目指す
データサイエンティスト育成スクールにいく

 

ABOUT ME
さぎのみや
さぎのみや
ゲーム開発を手助けるメディア【ユニシャー】を運営しているさぎのみやの個人ブログです。自分の考えや役にたったことを書いております。自分の芯がある人が好きです。→Amazonほしいものリスト
ゲーム開発を手助けるメディア「Unishar-ユニシャー」
  • Unityを勉強したい
  • とりあえずUnityを使ってゲームを作りたい

このような悩みを解決してくれる、アクセス急上昇中のUnityメディア「Unishar-ユニシャー」

Unityでのゲーム開発に役立つことばかりです。

Unity専門メディア「Unishar-ユニシャー」→