タイトル | : xdoc2txtでpptから抽出されない |
記事No | : 609 |
投稿日 | : 2010/09/30(Thu) 15:22:04 |
投稿者 | : koma |
現在、社内で全文検索を導入しようとしている中で、フィルターをいろいろ検証していたのですが、ある特定のPowerPoint文書からワードが抽出できないケースがあり、原因が掴めない状況で困っています。
<使用環境> Windwos XP SP3 MS Office Pro 2003 (2007互換機能パックもインストール済) ※昔、Office2000を使っていてアンインストールした経緯あり xdoc2txt 1.37 (2010/05/16版)
<実行形式> xdoc2txt aaa.ppt > aaa.txt でやった結果です。
<現象> ケース1.全く読めないpptがある。 aaa.txtの中身が空っぽで出力される。(当然aaa.pptは中身が沢山詰まった文書です)
ケース2.一部のテキストボックスが読めないpptがある。 一部の読めるテキストボックスから抽出されたワードだけが、aaa.txtへ出力される。
ケース3.上記のケース1とケース2のテストを何度となくやっていると、ケース2の一部は読めていたテキストボックスも読めなくなり、ケース1と同じように出力が空っぽになる。
上記のテストに使用したppt文書は、壊れたファイルとかではありません。普通に読み書き可能な正常なPowerPoint文書です。 ※もし調査の為に必要であれば、pptファイルを送付することは可能です。
以上、よろしくお願い致します。
|