ユニコードでタグの読み込み

[8208]ユニコードでタグの読み込み 投稿者:ぶん 投稿日:2006/02/06(Mon) 12:11
いつも拝見させていただいてます。
初めて質問させていただきます。
環境はG5 デュアル2.5G OSX 10.4.3 インデザインCS2(4.0.2)です。
インデザインへのタグの取り込みが、UNICODEでしようとすると、タグテキストとして認識されません。
インデザインから書き出したファイルを取り込むと問題ないのですが、エディターで編集・保存したものだと、テキストと認識されてしまいます。
ヘッダーは<UNICODE-MAC>になっており、保存時のエンコーディングをUTF-16と8で試しましたがだめでした。

解決策など知っている方いらっしゃいましたら、よろしくお願いします。
» 1
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:pi&pu 投稿日:2006/02/06(Mon) 12:22
テキストエディットの環境設定で「標準テキストのエンコーディング」の「ファイルを開くとき」「ファイルを保存するとき」ともにプルダウンメニューから「エンコーディングリストのカスタマイズ…」で「Unicode(UTF-16BE)」をチェックして加えてください。そしてInDesignから書き出したタグテキストを開く/保存を「unicode(UTF-16BE)」でやってみてください。どうやらTigerからテキストエディットがアップデートして、UTF-16BE(ビッグエンディアン)を認識するようになったようです。よくわかりませんが
» 2
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:ぶん 投稿日:2006/02/06(Mon) 13:32
pi&puさんありがとうございます。出来ました。
utf-16が3種類あるのを初めて知りました。
Jeditでもエンコーディングのカスタマイズでうまくいきました。
ありがとうございました。
» 3
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:川村 投稿日:2006/02/06(Mon) 14:16
Unicodeは通常2バイト(16ビット)で表現され、上位バイトと下位バイトに入るコードの順序によりビッグエンディアン(BE)とリトルエンディアン(LE)の別があります。このバイトオーダーは、68k及びPowerPCと、Intel系CPUの処理方法に起因し、Intel Macへの移行の最大の壁となるものです。

InDesignはタグをUnicodeで読み書きするさいに、通常Unicodeテキストの先頭に置かれるバイトオーダー文字を処理できません。エディターで16BE、16LEを選択すると、このバイトオーダー文字無しで読み書きできます。Mac版とWin版で書き出したタグはバイトオーダーが逆になっていますが、InDesignは自動識別しています。
» 4
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:ぶん 投稿日:2006/02/06(Mon) 15:18
川村さん詳しい説明、ありがとうございます。
しかし、先ほどはうまくいったのですが、今作業をしたところ、
「このファイルを割り付けできません。要求された操作用のフィルタが見つかりません。」
とダイアログが出てしまい、読み込めません。プレインテキストでも同様です。
流れとしては
word 2004 MACからテキスト書きだし→エディタ(テキストエディット&JeditX)でUTF16-BEで保存→読み込み
です。

インデザインでタグ書きだし→エディタでUTF16-BEに保存→読み込み
ではうまくいくのですが・・・。

たびたび申し訳ありません。よろしくお願いします。
» 5
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:川村 投稿日:2006/02/06(Mon) 16:44
タグ形式と識別できないテキストを16BEで保存しているようです。
タグ形式ならテキストの先頭にタグ用のヘッダー(<UNICODE-MAC>と改行)を付加し、16BEで保存して下さい。プレーンテキストなら通常のUnicodeテキスト(UTF-16)として保存して下さい(バイトオーダー文字が付加されます)。
» 6
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:ぶん 投稿日:2006/02/06(Mon) 18:31
川村さんありがとうございます。
恥ずかしながら、ヘッダーに改行を入れ忘れてました。
ヘッダーを取っても読み込めなかったので、分からなくなってしまいました。
これを機会にUNICODEについて勉強したいと思います。
でも、ちょっと調べてみただけで、同じユニコードでもUTF-16,8,7,32、UCS-2,4などがあって混乱してします。
pi&puさん、川村さんありがとうございました。
» 7
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:ぶん 投稿日:2006/02/06(Mon) 20:19
たびたびすみません。
今、作業をしていたのですが、Jedit上で、エンコーディングをutf-16BEにして保存すると、カギ括弧の閉じ(」)が(《)に化けてしまいました。
テキストエディットでエンコーディング変換したものをJeditでutf-16BEを指定して開けば問題ありませんでした(自動だとutf-16になり化けてしまいます)。

インデザインのことでは無いのですが、知っている方がいらしたらお願いいたします。
» 8
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:NAOI 投稿日:2006/02/07(Tue) 14:48
試してみたところ、わたしの環境(Mac OS X 10.4.4)では、テキストエディット(1.4)からUTF-16BE形式で保存したテキストであっても、Jedit X(1.30)で開くと終わりかぎ括弧(U+300d)が始め二重山括弧(U+300a)に化けて表示され、これを別名保存するとファイル・データもU+300aに置き換わっていました。Jedit Xのバグだと思います。販売元に問い合わせてみてください。
» 9
[8208へのレス]Re: ユニコードでタグの読み込み 投稿者:ぶん 投稿日:2006/02/09(Thu) 09:16
NAOIさんありがとうございます。
artman21に問い合わせたところ、JeditXでの問題を確認・修正して頂きました。正式な修正版は次回のリビジョンアップにて対応するとのことでした。
文字化けする文字は文字コードの下二桁が「0d」のものが、「0a」に置き換ります。
みなさんありがとうございました。

  おすすめ投票