スポンサーリンク

【コピペOK】CentOSにMecabを4ステップでインストールする手順

★悩み★
・形態素解析のためにMecabをインストールしたいけど方法が分からない。
・yumでMecabをインストールする方法が分からない。
・PythonでMecabを使いたいけど方法が分からない。

こういった「悩み」に答えます。

★本記事の内容★
1. Mecabとはどういったソフトウェアなのか?【簡単な説明】
2. Mecabのインストール手順【コピペでOK】
3. Mecabの動作確認【コピペでOK】
4. PythonでMecabを使用【ソースコードあり】

この記事を書いている筆者は、約7年間、Mecabを使い込んでいます。
Mecabの使用歴が長いため、今までに数十回ほどCentOSにMecabをインストールしたことがあります。
数回ほどCentOSにMecabをインストールした際に、毎回「Mecab インストール 手順」とGoogle検索し、時間を無駄にしていることに気づきました。
そんなことに気づいた筆者は、コピペでMecabをインストールする手順書を執筆するに至りました。

今回は、「コピペでCentOSにMecabをインストールする手順」に関して分かりやすく解説してきます。

Mecabとはどういったソフトウェアなのか?

Mecabは、「自然言語処理の形態素解析」を実現できるソフトウェアになります。
Mecabの開発元である公式ページにおいては、下記のように説明されています。

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。

http://taku910.github.io/mecab/

Mecabを使うことで、下記のような「形態素解析」を実現できます。

% mecab
すもももももももものうち
すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
参照先:http://taku910.github.io/mecab/

「形態素(言語で意味を持つ最小単位)」を抽出することができるMecabは、自然言語処理を扱うデータ分析では非常によく利用されるソフトウェアです。

CentOSにMecabを4ステップでインストールする手順

CentOSにMecabをインストールする手順についてご紹介します。
インストール手順は、わずか4手順です。
全手順において、コピペをするだけですので、30分もかからず、MecabをCentOSにインストールすることができます。

下記にご紹介します全ての手順は、CentOS上の「端末」アプリケーションで実施します。
CentOSにて、「端末」アプリケーションの起動をしてください。

手順(1):パッケージのインストール

まずは、パッケージをインストールするために、下記のコマンドを実行します。

# yum install --nogpgcheck -y https://packages.groonga.org/centos/groonga-release-latest.noarch.rpm

手順(2):Mecabのインストール

続いて、MecabをCentOSにインストールするために、下記のコマンドを実行します。

# yum -y install mecab mecab-ipadic mecab-devel patch --nogpgcheck

手順(3):新出単語と固有表現に強いmecab-ipadic-NEologdのダウンロード

次に、Mecabが形態素解析をするための「辞書」をダウンロードします。
今回は、新出単語や固有表現に強い辞書である「mecab-ipadic-NEologd」のダウンロード手順をご紹介します。

「mecab-ipadic-NEologd」をダウンロードするために、下記のコマンドを実行します。

# git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

手順(4):mecab-ipadic-NEologdのインストール

続いて、「mecab-ipadic-NEologd」をインストールするために、下記のコマンドを実行します。

# cd mecab-ipadic-neologd
# ./bin/install-mecab-ipadic-neologd -n -a

上記の4手順を実施することで、CentOSにMecabをインストールすることができました。

インストールしたMecabの動作確認

次は、CentOSにMecabが正常にインストールされたことを確認し、動作確認をしてきましょう。

Mecabのインストール確認

CentOSにMecabが正常にインストールされたかを確認するために、以下のコマンドを実行します。

# which mecab
/usr/bin/mecab

上記のような実行結果の場合、Mecabが正常にインストールできたと考えられます。
下記のような実行結果である場合、Mecabが正常にインストールできていないと判断ができます。

# which mecab
/usr/bin/which: no mecab in ~~~~~

Mecabの動作確認

Mecabを起動し、例文「CentOSにMecabのインストールができました。」を入力して見ましょう。

# mecab -d /usr/lib64/mecab/dic/mecab-ipadic-neologd/
CentOSにMecabのインストールができました。
CentOS	名詞,固有名詞,一般,*,*,*,CentOS,セントオーエス,セントオーエス
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
Mecab	名詞,一般,*,*,*,*,*
の	助詞,連体化,*,*,*,*,の,ノ,ノ
インストール	名詞,一般,*,*,*,*,インストール,インストール,インストール
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ
でき	動詞,自立,*,*,一段,連用形,できる,デキ,デキ
まし	助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。	記号,句点,*,*,*,*,。,。,。
EOS

上記のように例文「CentOSにMecabのインストールができました。」をMecabを用いて形態素解析をすることができました。

PythonでMecabを利用する方法

データ分析をする上で、プログラミング言語の一つである「Python」を使用する人が多いと思います。
ここからは、PythonでMecabを利用する方法についてご紹介します。

Pythonをインストールされていない方は、以下の記事をご覧ください。簡単にPythonをインストールすることができます。

PythonのMecabライブラリをインストール

PythonでMecabを使用するためには、「mecab-python3」というライブラリが必要です。
「mecab-python3」をインストールするために、以下のコマンドを実行しましょう。

# pip install mecab-python3

「mecab-python3」が正常にインストールされたことを確認するために、以下のコマンドを実行しましょう。

# pip list | grep mecab
mecab-python3 (0.996.5)

上記のように出力されれば、「mecab-python3」が正常にインストールされたことが分かります。

PythonでMecabを使った形態素解析【ソースコードあり】

最後に、PythonでMecabを使った形態素解析を行いましょう。
Mecabを使ったPythonのソースコードは、以下のようになります。

import MeCab

text = "CentOSにMecabのインストールができました。"

mecab_obj = MeCab.Tagger("-Ochasen -d /usr/lib64/mecab/dic/mecab-ipadic-neologd/")
node = mecab_obj.parseToNode(text)
while node:
  print(node.feature)
  node = node.next

上記のソースコードをmecab_test.pyというファイル名で保存しましょう。
その後、mecab_test.pyを実行するために、以下のコマンドを実行します。

# python test.py 
BOS/EOS,*,*,*,*,*,*,*,*
名詞,固有名詞,一般,*,*,*,CentOS,セントオーエス,セントオーエス
助詞,格助詞,一般,*,*,*,に,ニ,ニ
名詞,一般,*,*,*,*,*
助詞,連体化,*,*,*,*,の,ノ,ノ
名詞,一般,*,*,*,*,インストール,インストール,インストール
助詞,格助詞,一般,*,*,*,が,ガ,ガ
動詞,自立,*,*,一段,連用形,できる,デキ,デキ
助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
記号,句点,*,*,*,*,。,。,。
BOS/EOS,*,*,*,*,*,*,*,*

以上のようにPythonからもMecabを用いた形態素解析ができましたね!

形態素解析とセットでよく使用する「係り受け解析」に関して興味がある方は、こちらをご覧ください。

【まとめ】CentOSにMecabを4ステップでインストールする手順

今回の記事を通して、コピペベースでMecabをインストールし、PythonでMecabを使用することができる手順をご紹介することで、以下の悩みを解消しました。

★悩み★
・形態素解析のためにMecabをインストールしたいけど方法が分からない。
・yumでMecabをインストールする方法が分からない。
・PythonでMecabを使いたいけど方法が分からない。

CentOSにMecabをインストールすることに困っているあなた」や「PythonでMecabを使用するのに困っているあなた」にこの記事が少しでも役に立てれば幸いです。

コメント

タイトルとURLをコピーしました