« リンク集にNAT 愛 EYEプロジェクトを追加 | メイン | 無料登録でもれなく500円がもらえます »

2005年04月15日

セキュリティのかかったPDFファイルからテキストを抽出する方法

Adobe社のアクセシビリティ対応とスクリーンリーダーがこれに対応したことより、スクリーンリーダーを利用してPDFファイルの読み上げが可能になってきました。しかし、PDFファイルのセキュリティの設定によっては、残念ながら読み上げできない場合があります。そこで、このようなPDFを読み上げさせる方法をいくつか紹介します。

「xdoc2txt」を使う

xdoc2txt」というフリーウェアがあります。二つのファイルをダウンロードしなければならなかったりショートカットを作成したりと準備が必要なので簡単に使い方を説明します。

まず、こちらのページから以下の二つのファイルをダウンロードします。

  • xdoc2txt 1.16 ( d2txt116.lzh /107KB )
  • cryptlib.dll Ver1.00 ( crypt100.lzh / 37KB )

※バージョンアップによりファイル名の数字が変わる場合があります。

上記二つのファイルをダウンロードしたら解凍します。
一つ目の「xdoc2txt 1.14 ( d2txt114.lzh /98KB )」を回答したフォルダに、二つ目の「cryptlib.dll Ver1.00 ( crypt100.lzh / 37KB )」を回答したフォルダにある「cryptlib.dll」をコピーして、それを「Program Files」に置いてください。

「xdoc2txt.exe」のショートカットを作成して、「Send to」(送る)へコピーします。

「ファイル」メニューの「プロパティ」、またはAlt+エンターキーでこのショートカットのプロパティを開いて、リンク先の後ろに
 -f -n
を追加してください。

【例】 "C:\Program Files\d2txt\xdoc2txt.exe" -f -n

以上で準備完了です。テキスト抽出するには、エクスプローラで目的のPDFファイルを選択して、「ファイル」メニューの「送る」メニューにある、「xdoc2txt.exe」のショートカットを選んで送ります。

「iTextFront」を使う

フリーのPDF操作ツールで「iTextFront」というのがあります。このツールを使えばPDFのセキュリティ保護機能を解除できる場合があります。保護機能が解除できれば、スクリーンリーダーで読ませたり、Adobe Readerを利用してテキストファイルに保存したりすることが可能になります。

「ALTAIR(アルティア) for Windows」を使う

音声・点字エディタの「ALTAIR for Windows(WinALTAIR)」には、PDFファイルなどのテキスト部分を抽出して読み上げる機能があります。Adobe Readerとスクリーンリーダーの組み合わせで読めないものでも、ALTAIR for Windowsを使えば読めることもあります。

「TextPorter(テキストポーター)」を使う

アンテナハウスから発売されている「TextPorter」を利用すれば、PDFファイルをテキストファイルに変換することができます。AdobeReaderとスクリーンリーダーの組み合わせで読めないPDFでもテキスト変換できることがあるようです。

パスワードのかかったPDFの場合

パスワードのかかったPDFファイルを解除するには、「Adobe Acrobat(リーダーではない)」でパスワードを入力すれば解除できるようです。

PDFを作成される場合はアクセシビリティを考慮して

以上いくつか方法を書いてきましたが、これらはどうしても読めない場合の非常手段です。作成者側がPDFを作るときにアクセシビリティを考慮していただく方がいいのはいうまでもありません。アクセシブルなPDFファイルの作成方法については以下のページが参考になります。
Adobe Acrobat - Acrobat accessibility(日本語)
Adobe Acrobat - How To Create Accessible AdobeR PDF Files Booklet(英語)

以下参考URLです。


やさしくPDF OCR v2.0 for Windows

メディアドライブ
2005-03-11





TextPorter V3



アンテナハウス

2002-06-28







投稿者 Dream : 2005年04月15日 19:49

この記事はあなたのお役に立ちましたか?もし気に入っていただけたのでしたら、是非人気blogランキングをクリックしてください。

トラックバック

このエントリーのトラックバックURL:
http://www.sf-dream.com/cgi/mt33/mt-tb.cgi/297

コメント

はてな http://q.hatena.ne.jp/1115015484#a9 によると、
http://www.bravaviewer.jp/reader.htm
で配布されている「Brava! Reader」(無料)が性能高いとのことです。

注意:Brava! Readerには利用期限(約半年)が設定されています。利用期限が過ぎたソフトウェアは利用できなくなりますが、本サイトから最新バージョンをダウンロードして再インストールすれば、引き続き無料でご利用頂けます。

投稿者 itochan [TypeKey Profile Page] : 2006年07月23日 18:50

コメントしてください




保存しますか?