【Windows向け】Tesseract(OCR/文字認識)のインストール手順

 

★悩み★
・Windows向けのOCR(文字認識)ソフトであるTesseractを使ってみたいな。
・OCRソフトであるTesseractをWindowsにインストールできるのかなぁ。
・WindowsにTesseract(OCR/文字認識ソフト)をインストールできたのかな?



こういった「悩み」に答えます。
 

★本記事の内容★
➀ WindowsにTesseract(OCR/文字認識ソフト)をインストールする方法
➁ WindowsにTesseractがインストールできたかをPATHとコマンドで確認



これからご紹介する「【Windows向け】Tesseract(OCR/文字認識)をインストールする手順」を実践したことで、筆者は10分以内でTesseractをWindows 11 proにインストールできました。
 

記事の前半では「WindowsにTesseract(OCR/文字認識ソフト)をインストールする方法」をコマンドベースで紹介します。
記事の後半では「WindowsにTesseractがインストールできたかをPATHとコマンドで確認する方法」を紹介します。
 

この記事を読み終えることで、「WindowsにTesseract(OCR/文字認識ソフト)をインストールする方法」と「PATHとコマンドで、TesseractがWindowsにインストールできたことを確認する方法」を把握できます。
 

★Tesseractとは★
Tesseractは、Google社が開発しているオープンソースの光学式文字認識ソフトウェアです。Tesseractのライセンスは、Apache License 2.0(2021年10月11日時点)であるため、「無料で画像内の文字抽出」ができます。
メリット/デメリットや事例に関しては、以下の記事をご覧ください。
>> 【要点】Tesseractとはを解消!初心者向けに特徴から使い方を図解



ちなみに、「Tesseractで英数字を文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
>> Tesseractで英数字を文字認識(OCR)する手順
 

ちなみに、「Tesseractで日本語を文字認識(OCR)する手順」を知りたい方は、以下の記事をご覧ください。
>> Tesseractで日本語を文字認識(OCR)する手順
 


  

WindowsにTesseract(OCR/文字認識ソフト)をインストールする方法


「WindowsにTesseract(OCR/文字認識ソフト)をインストールする方法」に関してご紹介します。
 

★WindowsにTesseract(OCR/文字認識ソフト)をインストールする流れ★
手順1:TesseractのWindows向けインストーラーをダウンロード
手順2:インストーラーでTesseractをWindowsにインストール



上記手順を実施することで、WindowsにTesseract(OCR/文字認識ソフト)をインストールできます。
 

上記の各手順は、以下の日時と環境で動作確認済みです。
動作確認済み日時:2022年5月9日
動作確認済み環境:Windows 11 pro



以降で、上記「WindowsにTesseract(OCR/文字認識ソフト)をインストールする流れ」の各手順に関してご説明します。
 

手順1:TesseractのWindows向けインストーラーをダウンロード

「手順1:TesseractのWindows向けインストーラーをダウンロード」に関して説明します。
 

WindowsにTesseractをインストールするために、Webブラウザ経由でインストーラーをダウンロードしましょう。



Webブラウザで、Windows向けTesseractのインストーラーをダウンロードできるページを開きましょう。
>>Windows向けTesseractのインストーラーをダウンロードできるページ
 

ページ表示後、「.exe」(下図の赤枠)をクリックしてください。
 

Windows向けTesseractのインストーラーをダウンロードする



クリック後、「.exe」のファイルがダウンロードされたことを確認しましょう。(下図の赤枠)
 

ダウンロードしたWindows向けTesseractのインストーラーを確認



以上で、「手順1:TesseractのWindows向けインストーラーをダウンロード」は完了です。
 

手順2:インストーラーでTesseractをWindowsにインストール

「手順2:インストーラーでTesseractをWindowsにインストール」に関して説明します。
 

ダウンロードしたWindows向けTesseractのインストーラーを起動し、インストールしましょう。



先ほどダウンロードした「.exe」(今回だと、tesseract-ocr-w64-setup-v5.0.1.20220118.exe)ファイルをクリックしてください。
 

ダウンロードしたWindows向けTesseractのインストーラーを起動



Windows向けTesseractのインストーラーを起動後、「English」(下図の赤枠)を選択し、「OK」ボタンをクリックします。
 

インストーラーの言語を英語に設定



クリック後、下図のような「Welcome to Tesseract-OCR Setup」の画面が表示されます。
英語の説明を読み終えた後に、「Next」(下図の赤枠)をクリックしてください。
 

インストーラーの概要を確認



クリック後、下図のような「Tesseract-OCRのライセンス同意書」が表示されます。
ライセンス同意書を確認した後に、「I Agree」(下図の赤枠)をクリックしましょう。
 

インストーラーの同意者



クリック後、下図のような「インストールしたTesseractをどのユーザーが利用するか?」を設定する画面が表示されます。
今回は、「Install for anyone using this computer」を選択し、「Next」(下図の赤枠)をクリックしてください。
 

インストールしたTesseractを利用するユーザを設定



クリック後、下図のような「追加でインストールするTesseractのオプション」を選択する画面が表示されます。
まずは、Tesseractで日本語のスクリプトを扱うために、「Additional script data」(下図の赤枠)をクリックしましょう。
 

追加でインストールするオプションを選択



クリック後、「Japanese script」と「Japanese vertical script」(下図の赤枠)をクリックします。
 

インストールするTesseractで日本語スクリプトを扱えるように設定



続いて、Tesseractで日本語をOCRするために「Additional language data」(下図の赤枠)を選択してください。
 

追加でインストールする言語を選択



クリック後、「Japanese」と「Japanese(vertical)」(下図の赤枠)を選択します。
 

インストールするTesseractで日本語を扱えるように設定



選択後、「Next」(下図の赤枠)をクリックしてください。
 

Tesseractで追加でインストールするオプション選択画面



クリック後、下図のように「Tesseractをインストールするフォルダを選択する画面」が表示されます。
Tesseractをインストールするフォルダを選択後、「Next」をクリックしましょう。
 

Tesseractをインストールするフォルダを選択



クリック後、下図のような「Tesseractのショートカット作成の設定画面」が表示されます。
ショートカット作成不要の場合、「Do not create shortcuts」(下図の青枠)を選択してください。
設定後、「Install」(下図の赤枠)をクリックしましょう。

 

ショートカットに関する設定画面



クリック後、WindowsにTesseractのインストールが開始します。
1分後ぐらいに、下図のような「Installation Complete」画面が表示されます。
表示後、「Next」(下図の赤枠)をクリックしてください。

 

WindowsにTesseractのインストール完了



クリック後、下図のように「Completing Tesseract-OCR Setup」の画面が表示されます。
WindowsにTesseractがインストールできたため、「Finish」(下図の赤枠)をクリックし、Tesseractのインストーラーを終了させましょう。
 

インストーラー終了画面



以上で、「手順2:インストーラーでTesseractをWindowsにインストール」は完了です。
 

上記の流れで、Tesseract(OCR/文字認識ソフト)をWindowsにインストールできました。


 

WindowsにTesseractがインストールできたかをPATHとコマンドで確認


「WindowsにTesseractがインストールできたかをPATHとコマンドで確認」に関してご紹介します。
 

★WindowsにTesseractがインストールできたかを確認する方法★
・Tesseractのバージョンを確認するコマンドを実行
・TesseractのコマンドPATHを確認



上記でWindowsにTesseract(OCR/文字認識ソフト)がインストールできたかを確認できます。
 

上記の各操作は、以下の日時と環境で動作確認済みです。
動作確認済み日時:2022年5月9日
動作確認済み環境:Windows 11 pro



以降で、上記「WindowsにTesseractがインストールできたかを確認する方法」の各項目に関してご説明します。
 

Tesseractのバージョンを確認するコマンドを実行

「Tesseractのバージョンを確認するコマンドを実行」に関して説明します。
 

Tesseractのバージョンを確認するコマンドを実行することで、TesseractがWindowsにインストールされたかを確認できます。



Tesseractのバージョンを確認するために、「コマンドプロンプト」を起動し、以下のコマンドを実行してください。

C:\>"C:\Program Files\Tesseract-OCR\tesseract.exe" --version
tesseract v5.0.1.20220118
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5
 Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0

C:\>



コマンド実行後、「tesseract <バージョン名>」が表示された場合、「正常にTesseractをWindowsにインストールできた」と判断できます。
 

以上が、「Tesseractのバージョンを確認するコマンドを実行」となります。
 

TesseractのコマンドPATHを確認

「TesseractのコマンドPATHを確認」に関して解説します。
 

TesseractのコマンドPATHを確認することで、TesseractがWindowsにインストールされたかを確認できます。



TesseractのコマンドPATHを確認するために、「コマンドプロンプト」を起動し、以下のコマンドを実行してください。

C:\>where /r . tesseract.exe
C:\Program Files\Tesseract-OCR\tesseract.exe

C:\>



コマンド実行後、「<Tesseractをインストールしたフォルダ>\tesseract.exe」が表示された場合、「正常にTesseractをWindowsにインストールできた」と判断できます。
 

以上が、「TesseractのコマンドPATHを確認」となります。
 

上記の方法で、WindowsにTesseractがインストールできたかを確認できました。


 

【まとめ】Tesseract(OCR/文字認識)をインストールする手順【Windows向け】


今回の記事を通して、「【Windows向け】Tesseract(OCR/文字認識)をインストールする手順」をご紹介することで、以下の悩みを解消しました。
 

★悩み★
・Windows向けのOCR(文字認識)ソフトであるTesseractを使ってみたいな。
・OCRソフトであるTesseractをWindowsにインストールできるのかなぁ。
・WindowsにTesseract(OCR/文字認識ソフト)をインストールできたのかな?



Tesseract(OCR/文字認識)をWindowsにインストールする手順は?」や「TesseractがWindowsにインストールできたか確認する方法は?」で悩んでいるあなたにこの記事が少しでも役に立てれば幸いです。

コメント