2.0でのテキスト書き出し

[5528]2.0でのテキスト書き出し 投稿者:斎藤 投稿日:2004/12/06(Mon) 17:37
2.0のドキュメントからテキストのみを書き出したいのですが、そのような機能はありますか。テキストボックス単位のはわかりますが、ファイル全体を一度で書き出したいのです。
テクストボックスが1ページに100こぐらいあり、テキストボックス単位では意味がありません。コピー&ペーストでは大変なので、どうにかならないかと相談に来ました。よろしくお願いします。
» 1
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:YUJI 投稿日:2004/12/06(Mon) 21:42
PDFに書き出した後、Acrobatからテキストを書き出してはどうですか。
» 2
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:斎藤 投稿日:2004/12/07(Tue) 00:08
YUKIさまありがとうございます。
PDFで保存して、Acrobt5.0で開きましたが、テキスト書き出しがありません。Acrobtにテキスト書き出しはありますか。
わかりませんでした。よろしくお願いします。
» 3
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:流星 投稿日:2004/12/07(Tue) 00:20
Acrobatでは「名前を付けて保存」で種類を「テキスト(アクセシビリティ可能)」にします。

あと、フォントってOpenTypeFontですか?
私はTTFのフォントで作成された縦書きのPDFAcrobatで書き出すと文字が化けるので、困っています。
縦書きでもInDesignから書き出したPDFでテキストが綺麗に抜ける方法って知ってますか?
以前からテキスト抽出については興味があったので…
» 4
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:斎藤 投稿日:2004/12/07(Tue) 09:03
流星様、コメントありがとうございまう。
使用フォントはNew CIDです。また別名で保存ではテキスト形式で保存がなく、リッチテキストがあります。リッチテキスト保存では制御コードでわけがわかりません。
» 5
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:川村 投稿日:2004/12/07(Tue) 10:16
弊社で提供しているPlug-inであるDataBoxに付属するBoxDataという、ページアイテムの情報を書き出すツールがあります。そのBoxDataにご希望の機能もあり、一括又は指定したページ範囲でテキストのみの書き出しができます。申し訳ありませんが、BoxDataは単独では提供していません。スクリプトを書けば可能とは思いますが、私はあまりスクリプトを使用しませんので... Acrobatからのテキスト形式保存は、6.0以降でサポートされたようです。
» 6
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:err 投稿日:2004/12/07(Tue) 15:29
>BoxDataにご希望の機能もあり、一括又は指定したページ範囲でテキストのみの書き出しができます。

テキストの書き出し順はどのように制御されてるんですか?
座標?
重なり順?

『ご希望の機能』って書き方が、商売上手ですね。
希望通りテキストが書き出されるとは限りません。『テキスト書き出し機能』と書くべきでは?

スクリプトで簡単に書き出せますが、この順序が問題なんですよ。
本文に画像とキャプションをインラインとか、段抜き見出しを別フレーム回り込みで作ってたりすると、順序はメチャクチャなんですよね。

書き出す必要性があるなら、最初からXMLタグ付けしておくとか、PDFから抜き出しが現実的だと思うなぁ
» 7
[5528へのレス]Re: 2.0でのテキスト書き出し 投稿者:斎藤 投稿日:2004/12/07(Tue) 16:24
川村様

情報ありがとうございます。テキスト書き出しは6.0からのサポートなのですね。まだ OS Xには移行していないので5.0なのです。またDataBoxの件は参考になりました。検討して見なすが、今後の使用予定が未定なので難しいかもしれません。
ともかくありがとうございました。
この記事の書き込み元へのリンク (コメントや質問などはこちらへどうぞ)

このページをシェア