ウェブの画像内の文章をテキストデータとして抽出しコピペできるChrome拡張

0606_00.jpg

ウェブでコピー&ペーストできるのはテキストデータのみ。画像ファイルに記載されているテキストには無力……だったが、画像内のテキストデータを読み取って、テキストとして処理できるChrome拡張が「Project Naptha」だ。

「Project Naptha」は、ウェブにある画像内の文字を、テキストデータとして処理できるChrome拡張だ。拡張を導入すると、ウェブの画像内にあるテキストを選択できるようにある。後はそれを通常のテキストと同様に、コピー&ペーストすれば貼り付けられるようになるのだ。
ただし、テキスト取り込みの精度は必ずしも高くなく、英字でも画像によっては全く見当外れの文字がコピーされることも少なくない。また日本語に関しては、失敗することがほとんど。
それでも、相性のいい画像にある英語の長文テキストを抜き出す際には、手打ちの労力を大幅に減らせるだろう。今のところ用途は限られるが、将来の発展に期待したい拡張。

■ ウェブの画像内のテキストをコピペする

naptha_01-thum.jpg
Project Naptha」を公式サイトからダウンロードし、Chromeにインストールしよう

naptha_02-thum.jpg
画像内のテキストを選択しよう。公式サイトにある「The Tyger」という画像で実験。画像内のテキストを選択したら、右クリックメニューで「Copy Text」をクリック

naptha_03-thum.jpg
テキストエディタに貼り付ける。画像内の英語の文章が、テキストデータとして扱えるようになっているのが分かる

naptha_04-thum.jpg
今度は別の画像で実験。ニューヨークタイムズのトップページを画像ファイルとしてキャプチャ・ウェブに公開して本文をコピーしてみた

naptha_05-thum.jpg
テキストエディタに貼り付ける。ところどころで英文が崩れているのが分かる。このように画像によっては正しく取り込めないので注意

2014年06月06日 18時22分
©教えて君.net All Rights Reserved.