XML書き出しについて

[1912]XML書き出しについて 投稿者:ごと 投稿日:2003/03/21(Fri) 16:37
インデザインでXML書き出しすると改行が削除されますが、改行データを残したままXML書き出しすることは可能なのでしょうか?インデザイン、XML書き出し、tradosで翻訳、XML読み込み、というフローで他言語の書類を作りたいのですが、XML書き出しで改行データが削除されるためtradosでうまく翻訳できません。また、XMLを使用しての書類作成のノウハウについて、ご教授いただけるとありがたいです。よろしくお願い致します。
» 1
[1912へのレス]Re: XML書き出しについて 投稿者:うえだ 投稿日:2003/03/24(Mon) 12:42
>インデザインでXML書き出しすると改行が削除されますが、改行データを残したままXML書き出しすることは可能なのでしょうか?

私の環境では、ちゃんと改行コードは残ります。
MacからWin等で、改行コードが変換されておかしくなっているとか、そう言うことはないですか?

>改行データが削除されるためtradosでうまく翻訳できません。

これ、良くわかりません。
うまく翻訳できないとは、翻訳ソフトの精度の話でしょうか?
エラーが出るのでしょうか?
» 2
[1912へのレス]Re: XML書き出しについて 投稿者:ごと 投稿日:2003/03/25(Tue) 12:35
説明不足で申し訳ございませんでした。
使用OSはWindowsXP(Pro)でインデザインのバージョンは2.02の日本語版です。エンコーディングをUTF-8、詳細設定は全て空白でXML書き出しを行うと改行コードが削除されベタ文になってしまいます。また、エンコーディングがShift-JISでは改行はきちんと表示されますが、「Latin-1文字を含みます。文字を処理することはできません。」というメッセージが表示されます。恥ずかしながらこの意味もよく分かりません。そのためエラーメッセージがでないUTF-8で改行データを残したまま出力できないものかと質問しました。

改行データが削除されるためtradosでうまく翻訳できないというのは、tradosは、一文単位で翻訳するため
1.This is a pen.
2.I am Mike.
という文の場合、改行データが削除されると
1.This is a pen.2.I am Mike.
となり、1.This is a pen.2.で翻訳がかかってしまうということです。
つたない説明で申し訳ないのですが、ご教授お願いします。
» 3
[1912へのレス]Re: XML書き出しについて 投稿者:うえだ 投稿日:2003/03/26(Wed) 18:30
私もあまりくわしくないのですが、「Latin-1文字を含みます。」ってことは、「A」の上に「^」とか「e」の上に「'」とかそう言う文字が含まれていると言うことですよね?

それをXML書き出し
S-jisだとHTML仕様なのか、例えば「e」の上に「'」だと「é」となりますね。
UTF-8だとJeditでutf8で開くと、「e'」と2文字になってました。
タグ付きテキストで書き出すと、「<00E9>」ユニコード番号。
コピペ及びテキスト書き出しすると飛んでしまう。

余談ですが、S-jis、UTF-8ともに、ブラウザIE5.1以降くらいならオリジナル通り表示されると思ういます。

改行の件ですが、何で開いて確認されていますか?
『tradosで開いてみると』ということでしょうか?
UTF-8には対応していますか?
UTF8として開けば改行されていると思いますが、S-jisとして開くと改行コードが化けたり飛んじゃうようです。

私が、MacOS9.2.2なので、検証結果が変わるかもしれません。
WindowsXPならユニコードネイティブ対応だと思うので、OSやインデザインの言語設定でも変わるかもしれません。

あまりチカラになれないコメントですいません。
» 4
[1912へのレス]Re: XML書き出しについて 投稿者:ごと 投稿日:2003/03/28(Fri) 03:25
ご指導ありがとうございました!!

私の環境では、以下の結果になりました。

※EmEditorと秀丸を使用し確認しております。(ともにユニコードに対応しております。)

タグ付きテキストでéと改行を出力
<SJIS-WIN> é→<00E9>
<ASCII-WIN> é→<0x00E9>
<ANSI-WIN> é→é
<UNICODE-WIN> é→é
改行コード
普通の改行 CR+LF
強制改行 LF

XMLでéと改行を出力
<シフトJIS> é→é
改行コード
普通の改行 CR
強制改行 消える
※ただし、XML宣言の後または、テーブルタグの後の改行あり(LF)
<UTF-8> é→é
改行コード
普通の改行 消える
強制改行 消える
※ただし、XML宣言の後または、テーブルタグの後の改行あり(LF)
この記事の書き込み元へのリンク (コメントや質問などはこちらへどうぞ)

このページをシェア