PDF ドキュメントを OCR する方法

紙の文書をスキャンして PDF にすると、それらの文書とその内容の写真を効果的に作成できます。実際には、これは、結果として得られた PDF をコピーしたり注釈を付けたい場合に、テキストを検索したり選択したりすることはできないことを意味します。その理由は、スキャンされた画像 PDF ファイル内のテキストがコンピューターで認識されないためです。

PDF を検索可能にしたり、Word や Excel などの編集および処理のために別のファイル形式に変換したりするには、まず PDF に対して OCR を実行する必要があります。 OCR は光学式文字認識の略です。このテクノロジーにより、コンピュータは画像内に閉じ込められたテキストを認識して読み取ることができます。

スキャンした PDF をすばやく OCR する方法を説明します。

最初のステップは、信頼できる OCR PDF コンバーターを入手することです。このハウツーガイドでは、以下を使用しています。Able2Extract プロフェッショナル、OCR PDF デスクトップソフトウェア。他のほとんどのデスクトップツールと同じようにコンピューターにインストールし、起動して画像 PDF ファイルを開きます。

次のステップでは、ドキュメント全体に対して OCR を実行するかどうかを指定します (すべて選択オプション)、または 1 つの領域だけ (エリアを選択）。 PDF 全体を OCR することを選択しました。

選択したら、に進みますファイルメニューを選択し、検索可能な PDF に変換。

Able2Extract は PDF 上で OCR を迅速に実行し、以下のスクリーンキャプチャに示すように、PDF からテキストを検索して選択できるようになります。

画像 PDF からテキストのロックを解除し、MS Word などの編集可能な形式にエクスポートするには、上で説明したようにコンテンツを選択した後、言葉Able2Extract のメインツールバーの [ファイルタイプに変換] の下にあるアイコンをクリックします。ソフトウェアはデフォルトで OCR を実行し、画像ファイルからテキストを抽出します。

OCR 変換の結果、完全に編集可能なテキストを含む書式設定された Word 文書が作成されます。まったく同じ方法で、スキャンした PDF 表を Excel に変換したり、画像 PDF プレゼンテーションを PowerPoint などに変換したりできます。

Able2Extract は、PDF を処理するためのオールインワン PDF ソリューションです。これは、Mac、Windows、および Linux ディストリビューションで利用できるクロスプラットフォームソフトウェアです。 PDF を OCR する機能とは別に、ユーザーは次のことが可能になります。