Article title grep
例:Wikipedia日本語版の記事のうち、タイトルが「スター」で終わるものを検索する
正規表現でマルチバイト文字の扱いが微妙
正規表現としては正しくても(?)検索がうまくいかない場合がある?


にはArticle title grepの細かい仕様が分からない
正規表現エンジンと文字列のエンコーディングに依存するから僕も正解はわからない

[ア-ン]
を使おうとしたが使えないっぽい

取り敢えず日本語の文字は3文字扱いになってる様子
^...ー......ー...$
で近いものが得られる
カタカナに限っていないけど伸ばし棒があるのでだいたいひらがなとカタカナになる
これでもだいぶ助かります!ありがとうございます

UTF8のバイト列になってるパターンか…

えー、嘘くさいなぁ
関連項目