テキストマイニング

【R】RMeCabで簡単に形態素解析(単語に分けたり、品詞をみたり)してみる【RMeCabCの使い方】

RMeCabC

RMeCabをインストールしたけど…

どうやって使えばいいの?

という方対象です。

RMeCabを使って、このようなことをしていきますわ。

  • それぞれの単語にわける
  • 名詞・動詞などの品詞名をつける

とりあえず【RMeCab】を使ってみたい人におすすめです。

もしエラーがおきたらteratailで質問してみてください。エンジニアさんやプログラマーさんが教えてくれますよ。

今回の目的

【RMeCab】で、単語ごとにわける・品詞名(形態素解析とよぶ)をつける。

実行環境

  • Windows10(MacでもLinuxでも可)
  • MeCab・RMeCabインストール済み
  • Rstudio

MeCab・RMeCabをインストールしていない人は、【MeCab】を【R】で使えるようにするための【RMeCab】を導入する方法・流れ【Windows編】

必要なパッケージ

  • RMeCab

先に読み読み込んでおきましょう。

パッケージ読み込み

library(RMeCab)

短い文を形態素解析する

「わたしはグミが好きだ」これを解析していきましょう。

metestという変数にいれます。

RMeCabC

metest <- RMeCabC(“わたしはグミが好きだ”)

metest

[[1]]
名詞 
“わたし”

[[2]]
助詞 
“は”

[[3]]
名詞 
“グミ”

[[4]]
助詞 
“が”

[[5]]
名詞 
“好き”

[[6]]
助動詞 
“だ”

この結果になります。しっかり単語ごとに分けてありますし、品詞名もついています。

RMeCabC文字列を形態素解析(単語に分けたり、品詞名をつける)する

リストの各要素にアクセス

上で表示された縦長の結果は、リスト形式となっています。

各要素にアクセス

metest[1]

[[1]]

名詞 

“わたし”

各要素にアクセス

metest[3]

[[1]]

名詞 

“グミ”

このように各要素にアクセスすることができます。

変数名[数字]数字で指定した要素を表示

リスト形式→ベクトル形式

先ほどの縦長に書かれたリスト形式のものを、ベクトル形式にしていきます。

理由として、ベクトル形式の方が見やすく、便利だからです。

リスト形式→ベクトル形式

metest1 <- unlist(metest)

metest1

  名詞  助詞  名詞  助詞  名詞  助動詞 

“わたし”  ”は”  ”グミ”  ”が”  ”好き”  ”だ”

この結果になります。

縦書きのリスト形式からベクトル形式になりました。

unlist()ベクトル形式にする

ベクトルの各要素にアクセス

リスト形式と同じように、ベクトル形式の要素にもアクセスできます。

ベクトル要素アクセス

metest1[1]

名詞
“わたし”

変数名[数字]数字で指定した要素を表示

品詞情報だけを表示

さきほどのやり方だと、品詞と単語が同時に表示されてしまいました。

品詞情報だけ取り出す方法もあります。

品詞情報のみ表示

names(metest1)

[1]”名詞” “助詞” “名詞” “助詞” “名詞” “助動詞”

names(変数名)品詞情報のみ表示

品詞情報の一部を表示

こちらも一部を取り出すことができます。

品詞情報の一部を表示

names(metest1[1])

[1] “名詞”

names(変数名[数字])品詞情報の数字で指定した部分を表示

まとめ:RMeCabCで形態素解析できる

まとめ

  • RMeCabCで
  • 単語ごとに分けられる
  • 品詞を表示することができる

▼ゼロから始めるR言語に戻る▼

R言語
【随時更新】ゼロから始めるR言語【2018/3/30日更新】RとRStudioのインストールからグラフ・図・分析、テキストマイニング、スクレイピングなどをやっていきます。ネットでRを勉強したい人は是非ご覧ください。...

データサイエンティストになりたいなら

  • データサイエンティストになりたいけど、漠然とRの勉強をしている

もしそうならば、戦略的に勉強しましょう。戦略的に勉強しなければデータサイエンティストになるのは夢のままになってしまう可能性があります。

データサイエンティストになるためのおすすめの勉強方法・講座を3つご紹介します。

①通勤講座でデータサイエンティストの講座を受ける

  • ビジネスにデータを活用したいが方法が分からない。
  • ビックデータをどう扱えばよいか分からない。
  • データサイエンティストになりたいが、どうすればいいのか分からない。

このような場合、データサイエンティスト基礎講座 を受けてるのはどうでしょうか。動画によって、上のような悩みを解決してくれます。

まずデータサイエンティスト の基礎を学んでみて、ビジネススキルが足りなかったらUdemy で勉強するのが良いです。

いまなら10%クーポンもありますし、無料の動画もあります。今行動しないと一生やりませんので、もう少し下を見てからで良いのでご覧ください。

▼まずデータサイエンティストの基礎を学ぶ▼

データサイエンティストの基礎を学ぶ>>

②Udemyのデータサイエンティスト講座を受ける  

「Udemy」も動画で学ぶタイプの講座です。データサイエンティストになるための講座がそこそこあります。

通勤講座とちがうのが安さです。どちらも内容の質が良いことは間違えないのですが、Udenyは安めです。

「自分この部分の知識がないな」と思ったときの補強でも使えますね。一度講座をとって気に入らなかったら、全額返金できます。

▼データサイエンティストの基礎を学んだり、知識の補強をする▼

 Udemyのデータサイエンティスト講座を受ける>>

③データサイエンティスト育成スクールにいく

本気でデータサイエンティストになりたいなら、このスクールに行くのがおすすめです。

データサイエンティストに必要な知識は膨大です。統計学、機械学習、人工知能、データベース、プログラミング、ビジネススキルなどなど。

その知識をデータサイエンティストとしての経験がある先生たちが、オフラインで教えてくれます。

動画です。ご覧ください。

どうですか、めっちゃ良いですよね。ここは他の講座と違うなと思った部分があるのですが、転職支援もしてくれます。

さらに

データサイエンティスト全コースを一括で申し込んでいただいた方のみ、
ブートキャンプ終了時にご満足いただけない場合は受講料を全額返金します。

返金保障もあります。

もしまだ心配な方は説明会もありますので、いって見てください。

  • 未経験からデータサイエンティスト目指せる(Rを触っているあなたならもっと安心)
  • 返金保障あり
  • データサイエンティストに必要な知識を学べる
  • オフライン
  • データサイエンティスト経験がある先生に質問ができる
  • 転職支援あり

もう一度言います。本気でデータサイエンティストを目指すならおすすめです。

▼データサイエンティストになる▼

未経験からデータサイエンティストになる>> 

どれにしますか

①と②の場合はまず基礎を学んで、足りないところを補充して転職という感じです。③は転職支援もあるので安心です。

思いたったときに行動しなければ意味がありません。将来的にデータサイエンティストになりたいなら今すぐ行動しましょう。

データサイエンティストの基礎を学ぶ
通勤講座のデータサイエンティストの講座を受ける  

データサイエンティストの基礎を学んだり、知識の補強をする
Udemyのデータサイエンティスト講座を受ける  

本気でデータサイエンティストを目指す
データサイエンティスト育成スクールにいく

 

ABOUT ME
さぎのみや
さぎのみや
ゲーム開発を手助けるメディア【ユニシャー】を運営しているさぎのみやの個人ブログです。自分の考えや役にたったことを書いております。自分の芯がある人が好きです。→Amazonほしいものリスト
ゲーム開発を手助けるメディア「Unishar-ユニシャー」
  • Unityを勉強したい
  • とりあえずUnityを使ってゲームを作りたい

このような悩みを解決してくれる、アクセス急上昇中のUnityメディア「Unishar-ユニシャー」

Unityでのゲーム開発に役立つことばかりです。

Unity専門メディア「Unishar-ユニシャー」→