スポンサーリンク

【Linux向け】Tesseract(OCR/文字認識)をインストールする手順

【Linux向け】Tesseract(OCR/文字認識)をインストールする手順

 

★悩み★
・Linux向けのOCR(文字認識)ソフトであるTesseractを使ってみたいな。
・TesseractをLinuxにインストールできるのかなぁ。
・LinuxにTesseract(OCR/文字認識ソフト)をインストールできたのかな?



こういった「悩み」に答えます。
 

★本記事の内容★
➀ Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法をご紹介
➁ LinuxにTesseractがインストールできたかを確認する方法をご紹介



これからご紹介する「【Linux向け】Tesseract(OCR/文字認識)をインストールする手順」を実践したことで、筆者は10分以内でTesseractをLinux(CentOS)にインストールできました。

記事の前半では「Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法」をコマンドベースで紹介します。
記事の後半では「LinuxにTesseractがインストールできたかを確認する方法」を紹介します。

この記事を読み終えることで、「Tesseract(OCR/文字認識ソフト)をインストールする方法」を把握できます。
 

★Tesseractとは★
Tesseractは、Google社が開発しているオープンソースの光学式文字認識ソフトウェアです。Tesseractのライセンスは、Apache License 2.0(2021年10月11日時点)であるため、「無料で画像内の文字抽出」ができます。

参照:Tesseractとは(Wiki)



ちなみに、「Tesseractで英数字を文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
 


ちなみに、「Tesseractで日本語を文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
 


 

Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法

Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法


「Tesseract(OCR/文字認識ソフト)を2手順でインストールする方法」に関してご紹介します。

★Tesseract(OCR/文字認識ソフト)をインストールするまでの流れ★
手順1:Tesseractのリポジトリを追加
手順2:yum(dnf)でTesseractをインストール



上記手順を実施することで、Tesseract(OCR/文字認識ソフト)をインストールできます。
 

上記の各手順は、以下の日時と環境で動作確認済みです。
動作確認済み日時:2021年10月6日
動作確認済み環境:CentOS Linux release 7.7.1908 (Core)



以降で、上記「Tesseract(OCR/文字認識ソフト)をインストールするまでの流れ」の各手順に関してご説明します。
 

手順1:Tesseractのリポジトリを追加

「手順1:Tesseractのリポジトリを追加」に関して解説します。
 

Tesseractをインストールするために、外部サイトに公開されているリポジトリを追加しましょう。



Tesseractのリポジトリを追加するために、「端末またはコマンドプロンプト」を起動し、以下のコマンドを順に実行してください。

# yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/
# rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
# ls /etc/yum.repos.d/ | grep download
download.opensuse.org_repositories_home_Alexander_Pozdnyakov_CentOS_7_.repo
# 



コマンド実行後、「download.opensuse.org_repositories_home_Alexander_Pozdnyakov_CentOS_7_.repo」が表示された場合、「正常にTesseractのリポジトリを追加できた」と判断できます。

以上で、「手順1:Tesseractのリポジトリを追加」は完了です。
 

手順2:yum(dnf)でTesseractをインストール

「手順2:yum(dnf)でTesseractをインストール」に関して解説します。
 

yum(dnf)コマンド経由でTesseractをインストールしましょう。



Tesseractをインストールするために、以下のコマンドを順番に実行してください。

# yum install tesseract 
# yum install tesseract-langpack-deu



以上で、「手順2:yum(dnf)でTesseractをインストール」は完了です。
 

上記の流れで、Tesseract(OCR/文字認識ソフト)をインストールできました。


 

LinuxにTesseractがインストールできたかを確認する方法

LinuxにTesseractがインストールできたかを確認する方法


「LinuxにTesseractがインストールできたかを確認する方法」に関してご紹介します。

★Tesseractがインストールできたかを確認する方法★
・Tesseractのバージョンを確認するコマンドを実行
・TesseractのコマンドPathを確認



上記でTesseract(OCR/文字認識ソフト)がインストールできたかを確認できます。
 

上記の各操作は、以下の日時と環境で動作確認済みです。
動作確認済み日時:2021年10月6日
動作確認済み環境:CentOS Linux release 7.7.1908 (Core)



以降で、上記「Tesseractがインストールできたかを確認する方法」の各項目に関してご説明します。
 

Tesseractのバージョンを確認するコマンドを実行

「Tesseractのバージョンを確認するコマンドを実行」に関して解説します。
 

Tesseractのバージョンを確認するコマンドを実行することで、TesseractがLinuxにインストールされたかを確認できます。



Tesseractのバージョンを確認するために、「端末またはコマンドプロンプト」を起動し、以下のコマンドを実行してください。

# tesseract -v
tesseract 4.1.1-rc2-20-g01fb
 leptonica-1.76.0
  libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7 : libwebp 0.3.0
 Found AVX2
 Found AVX
 Found SSE
# 



コマンド実行後、「tesseract <バージョン名>」が表示された場合、「正常にTesseractをLinuxにインストールできた」と判断できます。

以上が、「Tesseractのバージョンを確認するコマンドを実行」となります。
 

TesseractのコマンドPathを確認

「TesseractのコマンドPathを確認」に関して解説します。
 

TesseractのコマンドPathを確認することで、TesseractがLinuxにインストールされたかを確認できます。



TesseractのコマンドPathを確認するために、「端末またはコマンドプロンプト」を起動し、以下のコマンドを実行してください。

# which tesseract
/usr/bin/tesseract
# 



コマンド実行後、「/usr/bin/tesseract」が表示された場合、「正常にTesseractをLinuxにインストールできた」と判断できます。

以上が、「TesseractのコマンドPathを確認」となります。
 

上記の方法で、LinuxにTesseractがインストールできたかを確認できました。


 

【まとめ】Tesseract(OCR/文字認識)をインストールする手順【Linux向け】

【まとめ】Tesseract(OCR/文字認識)をインストールする手順【Linux向け】


今回の記事を通して、「【Linux向け】Tesseract(OCR/文字認識)をインストールする手順」をご紹介することで、以下の悩みを解消しました。
 

★悩み★
・Linux向けのOCR(文字認識)ソフトであるTesseractを使ってみたいな。
・TesseractをLinuxにインストールできるのかなぁ。
・LinuxにTesseract(OCR/文字認識ソフト)をインストールできたのかな?



Tesseract(OCR/文字認識)をインストールする手順は?」や「Tesseractがインストールできたか確認する方法は?」で悩んでいるあなたにこの記事が少しでも役に立てれば幸いです。

タイトルとURLをコピーしました