InDesignCC2015でのテキスト抽出
[9048]InDesignCC2015でのテキスト抽出 投稿者:にも 投稿日:2016/10/11 09:36:49
Windows7でInDesign CC2015を使用しています。
テキストを取り出す方法は、
PDF化→Wordにテキストをコピペする
以外にあるでしょうか?
翻訳して、後でInDesignに埋め戻す予定です。
よろしくお願いいたします。
テキストを取り出す方法は、
PDF化→Wordにテキストをコピペする
以外にあるでしょうか?
翻訳して、後でInDesignに埋め戻す予定です。
よろしくお願いいたします。
[9049]Re: InDesignCC2015でのテキスト抽出 投稿者:Uske_S 投稿日:2016/10/11 10:46:57
いろいろやりようはありますが、わざわざPDFを介していらっしゃるということは、リンクファイル内のテキストなどもまとめて拾いたいということでしょうか?
あくまでも個人的に、ですが、HTMLに書き出したものをブラウザで開いてテキストエディタにコピペ、という方法が多いです。
とはいえ単純なコピペなので、字形やアンカー付きオブジェクト等は正しく取れません。
どんなデータから抽出するか(データの作られ方)、どれくらい抽出するか(ボリュームと範囲)、というのを見極めていくつか試してみるとよいかと思います。
ぱっと思いつく範囲では、データからコピペ、PDF経由、HTML経由、XML経由、外部ツール(スクリプト等)の利用、などです。
リンクされたファイルの文字までいっぺんに抽出したい場合は、PDFやHTMLが便利だと思いますよ。
あくまでも個人的に、ですが、HTMLに書き出したものをブラウザで開いてテキストエディタにコピペ、という方法が多いです。
とはいえ単純なコピペなので、字形やアンカー付きオブジェクト等は正しく取れません。
どんなデータから抽出するか(データの作られ方)、どれくらい抽出するか(ボリュームと範囲)、というのを見極めていくつか試してみるとよいかと思います。
ぱっと思いつく範囲では、データからコピペ、PDF経由、HTML経由、XML経由、外部ツール(スクリプト等)の利用、などです。
リンクされたファイルの文字までいっぺんに抽出したい場合は、PDFやHTMLが便利だと思いますよ。
[9050]Re: InDesignCC2015でのテキスト抽出 投稿者:にも 投稿日:2016/10/11 17:11:47
Uske_Sさん、ありがとうございます。
HTMLからテキストエディタにコピペで、テキストを取り出すことができました。PDFからのコピペだと、大幅にテキストの順番が崩れてしまうのですが、HTMLからのコピペは、ほぼ原稿どおりの順番になっています。アドバイスありがとうございました。
HTMLからテキストエディタにコピペで、テキストを取り出すことができました。PDFからのコピペだと、大幅にテキストの順番が崩れてしまうのですが、HTMLからのコピペは、ほぼ原稿どおりの順番になっています。アドバイスありがとうございました。
この記事の書き込み元へのリンク (コメントや質問などはこちらへどうぞ)