画像ファイルの中に記載されたテキストを読み取る「GT Text」

gt_00.jpg
テキストであれば何でもコピペ可能なのがパソコンのいいところだが、画像ファイルの中のテキストだけは手が出せない。しかし、「GT Text」があれば大丈夫。画像ファイルに記載されたテキストを抽出して、クリップボードにコピーしてくれるツールだぞ。

「画像ファイル内の長文を取り出したいけど、画像だからコピペできないし、キーボードで手打ちするしかないのか…」と諦めるのはまだ早い。「GT Text」は画像ファイル内のテキストを読み取り、テキストデータに変換できるツールだ。
使い方は、読み取りたい範囲を選択するだけ。その内部のテキストをクリップボードにコピーしてくれる。英文の場合はほぼ100%の精度で抽出が可能だぞ。
残念なのが、日本語の抽出精度が非常に低い点。下の手順を見てもらえば分かるが、読解可能なレベルではない。画像内の英語の長文を抽出する用途にのみ使うのが無難だろう。

■ 画像ファイルから英語のテキストを抽出する

gt_01-thum.jpg
GT Text」をダウンロードしてインストール。起動すると、ファイル選択画面が表示されるので、ファイル形式を指定して、テキストを読み取りたい画像ファイルを選択しよう

gt_02-thum.jpg
GT Textに画像ファイルを読み込んだら、ツールバーの左から2番目の点線ボタンをクリックする

gt_03-thum.jpg
破線の領域選択で、読み取りたい領域を囲って指定する

gt_04-thum.jpg
選択範囲内の読み取り結果のダイアログが表示される。内容が正しいのを確認して「続行」をクリックしよう

gt_05-thum.jpg
すると、読み取ったテキストがクリップボードに保存される。適当なテキストエディタにペーストしよう

■ 画像ファイルから日本語のテキストを抽出する

gt_06-thum.jpg
GT Textを起動して「File」→「Preferences」をクリック

gt_07-thum.jpg
「Preferences」が開いたら「Add languages」をクリックしよう

gt_08-thum.jpg
「Select components to install」から「Download and Install Japanese data」にチェックを入れて「Install」をクリック

gt_09-thum.jpg
「Preferences」の「Text Recognition Language」に「jpn」が追加されているので、選択して「OK」をクリック

gt_10-thum.jpg
画像ファイルの中から日本語の領域を選択してみよう

gt_11-thum.jpg
テキストの抽出が行われる。が、日本語の場合は精度が非常に低いので、実用性はイマイチ

2011年12月05日 19時38分
©教えて君.net All Rights Reserved.