タグ付きテキストと強制改行

[10478]タグ付きテキストと強制改行 投稿者:(-_-メ) 投稿日:2006/12/22(Fri) 17:39
強制改行をタグ付きテキストに書き出すと、エディタ上では単なる改行として扱われてしまうのは仕方のないことなんでしょうか。
中国語と日本語の混在テキストを扱うため、書き出しはUnicodeで書き出しています。
Jedit Xでは、エンコードをUnicode(UTF-16BE)で開いています。
今までは書き出す前に強制改行を何かのマークに置換していましたが、もっとスマートにやる方法がないものかと考えています。

InDesign CS2(Mac版)
Jedit X
» 1
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:せうぞー 投稿日:2006/12/22(Fri) 19:38
流星さんが以前しらべていただいたものが下記にあります。
http://www.seuzo.jp/rubbs/search_html/msg01359.html
強制改行は<000A>でいけますね。
» 2
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:(-_-メ) 投稿日:2006/12/24(Sun) 05:36
書き出した時にコードで書き出されませんし、
エディタで開くと、普通の改行と区別がつかなくないですか?

読み込む時は<000A>でいけるんですから、
書き出し時もコードで書き出されるとありがたいんですがね……。
» 3
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:(-_-メ) 投稿日:2006/12/25(Mon) 20:12
変な時間に書き込んだら、お礼を忘れていました。
たいへん有用なURLを教えていただき、ありがとうございました。
活用させていただきます。
» 4
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:kuroda 投稿日:2006/12/26(Tue) 14:53
すみません,タグ付きテキストのことで便乗させて質問させてください。
(-_-メ)さんと同じ環境,InDesignCS2,macos10.4.8,jeditxを使用して,Unicode(UTF-16BE)保存しております。<UNICODE-MAC>とヘッドに付けておりますが,強制改行<000A>と入れても,InDesignでテキストを配置すると<000A>と出てしまいます。ちゃんと強制改行として認識されている方もいらっしゃるのでしょうか? 何かやり方が悪いのでしょうか? ご存知の方おりましたら,よろしくお願いします。
» 5
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:流星 投稿日:2006/12/27(Wed) 01:32
>kurodaさん
MAC環境ではないので違うかも知れませんが、
<000D>や<000A>は<SJIS-WIN>で使えます。
こちらはW2K/InDesign3.01の環境で読み込み確認しました。


>(-_-メ)さん
データ書き出し・タグテキストで書き出される強制改行はLFですので、直接改行として扱われてしまうのです。
> エディタで開くと、普通の改行と区別がつかなくないですか?
当方はEmEditorを使っていますが、通常の改行CRLFとは違っています。文字コードは&hAなのでUnicodeでの指定では<000A>となります。
>書き出し時もコードで書き出されるとありがたいんですがね……。
SpecialCharacterの取り扱い部分ですが、書き出す際のオプションで指定できると嬉しかったりしますね。
» 6
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:kuroda 投稿日:2006/12/27(Wed) 09:13
流星様,ご返答ありがとうございました。
windowsでは認識するのですね。macでは今の環境では駄目なのかも知れませんね。今度,違うエディターで試してみようかと思います。
» 7
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:KOUJI 投稿日:2006/12/27(Wed) 14:31
>macでは今の環境では駄目なのかも知れませんね。
Macで試してみましたが<000A>で強制改行を認識しました。
1行目のヘッダとテキストのエンコーディングが違っているとかはありませんか?
» 8
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:(-_-メ) 投稿日:2006/12/27(Wed) 17:45
流星さん、ありがとうございます。
そうですか。Winのエディタでは違いの分かるものもあるんですね。

書き出したタグを見ても文字として違いが分からなくなってしまっているので、
改行してしまった後の行先頭にタグがついていない、もしくは通常の書き出しでは
ありえないようなタグの付いている部分を拾って、そこに強制改行のUnicodeを差し込んでいく
という作業をしています。
» 9
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:kuroda 投稿日:2006/12/28(Thu) 12:56
KOUJI 様,ご説明ありがとうございます。
>1行目のヘッダとテキストのエンコーディングが違っているとかはありませんか?
上記の通り<UNICODE-MAC>改行を一行目につけてUnicode(UTF-16BE)で保存しており,間違っているとは思えないのですが。<000A>以外はタグとして認識されていますし……。
ちなみに強制改行するところに<000A>といれればいいんですよね。
何かすごく単純なミスでもしているのでしょうか?
自分で調べでみます。
» 10
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:KOUJI 投稿日:2006/12/28(Thu) 14:28
kurodaさん
説明不足でごめんなさい。SJISで試しました。
Unicodeだと認識してくれません。
» 11
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:いき 投稿日:2006/12/28(Thu) 14:36
WindowsXP pro sp2・InDesignCS2で試しました。
やはりUNICODEだと<000A>を文字列としか認識してくれません。
» 12
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:kuroda 投稿日:2006/12/28(Thu) 19:25
KOUJI様、いき様、ご返答ありがとうございます。
Unicodeではダメなのですね。残念ですが、現状ではSJISと使い分けるしかないですね。
» 13
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:KOUJI 投稿日:2006/12/28(Thu) 20:00
>現状ではSJISと使い分けるしかないですね。
もしくは、検索文字用の適当な文字を入れておいて、配置後に「^n」に全置換するかですね。こちらの方が面倒じゃないかも。
» 14
[10478へのレス]Re: タグ付きテキストと強制改行 投稿者:four 投稿日:2006/12/29(Fri) 15:39
> (-_-メ)さん
>書き出した時にコードで書き出されませんし、
>エディタで開くと、普通の改行と区別がつかなくないですか?

私は Macユーザーです。Macのエディターでもちゃんと区別するエディターはあります。

TextWrangler というエディターなら、強制改行のコードは改行されません。
http://www.barebones.com/products/textwrangler/
フリーウエアですがメニューは英語でしか使えません。もちろんデータそのものは日本語でも扱えます(^^)

ファイルを開いてから、ファイルメニューから Reopen Using Encoding で正しく「Unicode(UTF-16)」を選んだください。そして「show invisibles」のモードにするとコントロールコードはすべて「?」の逆さまの文字になって表示され確認できますメニューからパレットを表示するとコードの値が確認できます。強制改行、ここまでインデントなどのコードがちゃんとわかります。

そして、その「?」の逆さまの文字をコピペして検索置換できます。

強制改行の場合は、ちょっと変なコツがいります・・・今、試したのですが、
検索したのちに、一度検索ウィンドウを閉じてもう一度検索ウィンドウを表示します。
その後、再び検索すると強制改行の位置にマッチします。
ちなみに、ここまでインデントは普通に検索できました。

よかったら一度試してみてください。
この記事の書き込み元へのリンク (コメントや質問などはこちらへどうぞ)

このページをシェア