インターネット上で使える米Googleの無料オフィスツール「Googleドキュメント」で、画像ファイルやPDFファイル内にある日本語の文字を抽出し、テキストに変換できるOCR機能が利用可能になっている。
Googleドキュメントは、2010年6月から画像やPDFからアルファベットなどを読み取ってテキスト化するOCR機能を導入していたが、今回これを拡張して日本語を含む合計34の言語に対応した。
OCR機能が利用できるのはデジタルカメラの撮影写真をはじめ、スキャナーで取り込んだ文書や、パソコン画面のスクリーンショットなど、JPEG、GIF、PNG形式の画像ファイルとPDFファイル。変換できるファイルの容量は最大2MBだ。
本記事は、ニフティのニュースサイト「@niftyビジネス」向けに弊社が執筆した記事「Googleドキュメント、写真やスキャン画像をテキスト変換する日本語OCRに対応」の一部です。全文は、@niftyビジネスのサイトにてお読みください。