★悩み★
・Linux向けのOCR(文字認識)ソフトであるTesseractを使ってみたいな。
・TesseractをLinuxにインストールできるのかなぁ。
・LinuxにTesseract(OCR/文字認識ソフト)をインストールできたのかな?
こういった「悩み」に答えます。
★本記事の内容★
➀ Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法をご紹介
➁ LinuxにTesseractがインストールできたかを確認する方法をご紹介
これからご紹介する「【Linux向け】無料OCR(文字認識)ソフトTesseractをインストール」を実践したことで、筆者は10分以内でTesseractをLinux(CentOS/RHEL)にインストールできました。
記事の前半では「Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法」をコマンドベースで紹介します。
記事の後半では「LinuxにTesseractがインストールできたかを確認する方法」を紹介します。
この記事を読み終えることで、「Tesseract(OCR/文字認識ソフト)をインストールする方法」を把握できます。
★Tesseractとは★
Tesseractは、Google社が開発しているオープンソースの光学式文字認識ソフトウェアです。Tesseractのライセンスは、Apache License 2.0(2021年10月11日時点)であるため、「無料で画像内の文字抽出」ができます。
メリット/デメリットや事例に関しては、以下の記事をご覧ください。
>> 【要点】Tesseractとはを解消!初心者向けに特徴から使い方を図解
また、UbunutuにTesseractをインストールする方法を知りたい方には、以下の記事がオススメです。
>> 【Ubuntu向け】Tesseract(OCRフリーソフト)のインストール手順
ちなみに、「Tesseractで英数字を文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
>>【コピペOK】Tesseractで英数字を文字認識(OCR)する手順
また、「Tesseractで日本語を文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
>>【コピペOK】Tesseractで日本語を文字認識(OCR)する手順
さらに、「PythonでTesseractを使った文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
>>【最短5分】PythonとOCRでPDFや画像から文字認識をする方法
また、「RubyでTesseractを使った文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
>>【最短5分】RubyでTesseractを使ってOCR(文字認識)する手順
Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法
「Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法」に関してご紹介します。
★Tesseract(OCR/文字認識ソフト)をインストールするまでの流れ★
手順1:Tesseractのリポジトリを追加
手順2:yum(dnf)でTesseractをインストール
上記手順を実施することで、Tesseract(OCR/文字認識ソフト)をインストールできます。
上記の各手順は、以下の日時と環境で動作確認済みです。
動作確認済み日時:2021年10月6日
動作確認済み環境:CentOS Linux release 7.7.1908 (Core)
以降で、上記「Tesseract(OCR/文字認識ソフト)をインストールするまでの流れ」の各手順に関してご説明します。
手順1:Tesseractのリポジトリを追加
「手順1:Tesseractのリポジトリを追加」に関して解説します。
Tesseractをインストールするために、外部サイトに公開されているリポジトリを追加しましょう。
Tesseractのリポジトリを追加するために、「端末またはコマンドプロンプト」を起動し、以下のコマンドを順に実行してください。
# yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/
# rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
# ls /etc/yum.repos.d/ | grep download
download.opensuse.org_repositories_home_Alexander_Pozdnyakov_CentOS_7_.repo
#
コマンド実行後、「download.opensuse.org_repositories_home_Alexander_Pozdnyakov_CentOS_7_.repo」が表示された場合、「正常にTesseractのリポジトリを追加できた」と判断できます。
以上で、「手順1:Tesseractのリポジトリを追加」は完了です。
手順2:yum(dnf)でTesseractをインストール
「手順2:yum(dnf)でTesseractをインストール」に関して解説します。
yum(dnf)コマンド経由でTesseractをインストールしましょう。
Tesseractをインストールするために、以下のコマンドを順番に実行してください。
# yum install tesseract
# yum install tesseract-langpack-deu
以上で、「手順2:yum(dnf)でTesseractをインストール」は完了です。
上記の流れで、Tesseract(OCR/文字認識ソフト)をインストールできました。
LinuxにTesseractがインストールできたかを確認する方法
「LinuxにTesseractがインストールできたかを確認する方法」に関してご紹介します。
★Tesseractがインストールできたかを確認する方法★
・Tesseractのバージョンを確認するコマンドを実行
・TesseractのコマンドPathを確認
上記でTesseract(OCR/文字認識ソフト)がインストールできたかを確認できます。
上記の各操作は、以下の日時と環境で動作確認済みです。
動作確認済み日時:2021年10月6日
動作確認済み環境:CentOS Linux release 7.7.1908 (Core)
以降で、上記「Tesseractがインストールできたかを確認する方法」の各項目に関してご説明します。
Tesseractのバージョンを確認するコマンドを実行
「Tesseractのバージョンを確認するコマンドを実行」に関して解説します。
Tesseractのバージョンを確認するコマンドを実行することで、TesseractがLinuxにインストールされたかを確認できます。
Tesseractのバージョンを確認するために、「端末またはコマンドプロンプト」を起動し、以下のコマンドを実行してください。
# tesseract -v
tesseract 4.1.1-rc2-20-g01fb
leptonica-1.76.0
libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7 : libwebp 0.3.0
Found AVX2
Found AVX
Found SSE
#
コマンド実行後、「tesseract <バージョン名>」が表示された場合、「正常にTesseractをLinuxにインストールできた」と判断できます。
以上が、「Tesseractのバージョンを確認するコマンドを実行」となります。
TesseractのコマンドPathを確認
「TesseractのコマンドPathを確認」に関して解説します。
TesseractのコマンドPathを確認することで、TesseractがLinuxにインストールされたかを確認できます。
TesseractのコマンドPathを確認するために、「端末またはコマンドプロンプト」を起動し、以下のコマンドを実行してください。
# which tesseract
/usr/bin/tesseract
#
コマンド実行後、「/usr/bin/tesseract」が表示された場合、「正常にTesseractをLinuxにインストールできた」と判断できます。
以上が、「TesseractのコマンドPathを確認」となります。
上記の方法で、LinuxにTesseractがインストールできたかを確認できました。
【まとめ】無料OCR(文字認識)ソフトTesseractをインストール【Linux向け】
今回の記事を通して、「【Linux向け】無料OCR(文字認識)ソフトTesseractをインストール」をご紹介することで、以下の悩みを解消しました。
★悩み★
・Linux向けのOCR(文字認識)ソフトであるTesseractを使ってみたいな。
・TesseractをLinuxにインストールできるのかなぁ。
・LinuxにTesseract(OCR/文字認識ソフト)をインストールできたのかな?
「Tesseract(OCR/文字認識)をインストールする手順は?」や「Tesseractがインストールできたか確認する方法は?」で悩んでいるあなたにこの記事が少しでも役に立てれば幸いです。