正規表現で丸数字を検索したい

[1570]正規表現で丸数字を検索したい | 投稿者:ちこ | 投稿日:2008/08/08(Fri) 17:35:40
お世話になります。
環境は、MacOS10.5 CS3です。

正規表現で丸数字を検索したく、丸1?丸10のUnicodeを調べて
[\x{2460}-\x{2469}]+
としたのですが、引っかかりません。

正規表現が間違っているのでしょうか。
ヒントをいただけると助かります。

よろしくお願いいたします。
» 1
[1572]Re: 正規表現で丸数字を検索したい | 投稿者:いき | 投稿日:2008/08/08(Fri) 22:00:04
失礼を承知で確認ですが。
GREPタブで検索されましたか?
» 2
[1573]Re: 正規表現で丸数字を検索したい | 投稿者:せうぞー | 投稿日:2008/08/08(Fri) 22:15:17
以前(InDesign 5.0.2)で調べた時、リテラルがマッチしない文字はhex0020?hexEEEEで2500字以上ありました。
http://d.hatena.ne.jp/seuzo/20080602/1212397579
このうち、Unicode表記でマッチするのはu30A1「ァ」?u30F4「ヴ」、uE00A?uE02Dのみ。つまり、リテラルが使えない文字のほとんどはUnicode表記も使えない。という結果。
http://d.hatena.ne.jp/seuzo/20080602/1212409463

つまりバグですね。orz
» 3
[1574]Re: 正規表現で丸数字を検索したい | 投稿者:ちこ | 投稿日:2008/08/09(Sat) 08:11:29
いき様、せうぞー様
早速のコメントありがとうございます。

いき様
<GREPタブで検索されましたか?
No.1515の件でご指摘を受けて以来、GREPタブを使って、正規表現検索の勉強をしています。覚えるのに一苦労ですが、非常に役立っています。

せうぞー様
<リテラルが使えない文字のほとんどはUnicode表記も使えない・・・
<つまりバグですね。orz
そうなんですかー・・・・
カタカナはUnicodeで対処できたので、丸数字も・・・と思ったんですが。
http://d.hatena.ne.jp/seuzo/20080520/1211268445

正規表現で丸数字を検索して、段落スタイルを適用させたかったのに困った・・・

ということは、手作業もしくは、
@① あいうえお のようにマーキングを使って後で削除しかないでしょうかね?^^;
» 4
[1575]Re: 正規表現で丸数字を検索したい | 投稿者:いき | 投稿日:2008/08/09(Sat) 08:59:20
えっと、ごめんなさい。
私の環境(WindowsXP sp2/CS3_J 5.0.3.662)では、添付画像の通りマッチするのですが……。
attached image
» 5
[1576]Re: 正規表現で丸数字を検索したい | 投稿者:いき | 投稿日:2008/08/09(Sat) 11:11:15
連投失礼します。
会社のMACで試したら、マッチしません……。
» 6
[1578]Re: 正規表現で丸数字を検索したい | 投稿者:せうぞー | 投稿日:2008/08/09(Sat) 12:22:58
>@① あいうえお のようにマーキングを使って後で削除しかないでしょうかね?^^;

あるいは、InDesign内の正規表現ではなくて、プレーンテキストの状態でエディタで処理しておくとか。
» 7
[1580]Re: 正規表現で丸数字を検索したい | 投稿者:ちこ | 投稿日:2008/08/09(Sat) 16:25:06
いき様、せうぞー様
度重なるコメントありがとうございます。

いき様
わざわざご検証いただきましてすみません。
Macではダメで、Windows CS3の環境ではマッチするということですか・・・

正規表現を使ってもどうしてもマッチしないものがあるんですね。
勉強になります。。。
» 8
[1581]Re: 正規表現で丸数字を検索したい | 投稿者:いき | 投稿日:2008/08/09(Sat) 17:09:20
追加情報です。私の環境(win)にて、
[①-⑩]+
とリテラルで検索した場合もマッチします。
» 9
[1584]Re: 正規表現で丸数字を検索したい | 投稿者:ちこ | 投稿日:2008/08/11(Mon) 10:31:08
いき様
いろいろとご検証ありがとうございます。

せうぞー様の「\」を「\」に変えたら丸数字がマッチし始めたというアドバイスをもとに、私のほうでもいろいろと検証してみましたところ、あることがわかりました。
正規表現とは言えないようなものですが・・・

添付画像のように①?⑩を表記しておき、
GREPタグで、①のUnicode(2460)のみで検索したところ、②、④、⑥がマッチします。
同様にいくつか試してみた結果、
[\x{123456789}]とすれば、どの丸数字にもマッチします(たぶん)
Unicode(2474)の(1)やローマ数字の1にはマッチしません。

不思議です。なぜかはわかりません・・・
attached image
» 10
[1585]Re: 正規表現で丸数字を検索したい | 投稿者:(-_-メ) | 投稿日:2008/08/11(Mon) 10:33:19
私もこの件では悩まされていたんですが、何も情報を持ち合わせていないので経過を見させていただいていました。

しかし、バグ、しかもMac版のみのバグですかぁ。
学参ものやっていると、この手の丸数字はものすごく出てくるので困りますね。
事前にタグ処理するという方法もとれますが、場合によってはそれもできないことがありますし。

せっかくの正規表現対応がこれではね……。
» 11
[1586]Re: 正規表現で丸数字を検索したい | 投稿者:ちこ | 投稿日:2008/08/11(Mon) 10:54:17
追記

「\x」がなくてもマッチする・・・
Unicode表記してないし、当たり前と言えば当たり前なのかも・・・
» 12
[1587]Re: 正規表現で丸数字を検索したい | 投稿者:kin | 投稿日:2008/08/11(Mon) 17:50:43
私もちょうどこの件で悩んでおりました。
バグですか。簡単には解決しなさそうですね。

「1」で検索すると丸数字の10の位が全部マッチします(赤い下線部がマッチ)。
[0-9]や\dで検索しても丸数字がマッチするのでおかしいと思い試してみました。
» 13
[1588]Re: 正規表現で丸数字を検索したい | 投稿者:kin | 投稿日:2008/08/11(Mon) 17:54:57
失礼しました。画像が添付されてませんでした。
attached image
この記事の書き込み元へのリンク (コメントや質問などはこちらへどうぞ)

このページをシェア