yahoo pipes 正規表現をサポート

ひととおり触ってみたあとで O’Reilly Radar > Pipes and Filters for the Internet を読んで

In The UNIX Programming Environment, Kernighan and Pike write that at the heart of the Unix philosophy “is the idea that the power of a system comes more from the relationships among programs than from the programs themselves.”

っていうところにほんとそうだなーとおもったりしながら機能強化をまっていた yahoo pipes が正規表現をサポートしたそうで、日本語のマッチングができるかどうかちょっとだけ試してみました。

正規表現もいろいろ方言があるのでどのタイプのやつがサポートされているのか知りたくて、ヘルプからたどれるサンプルをみると前方参照をつかったreplaceもサポートされています。
ためしたかんじでは文字クラス指定子( [0-9] で数字にマッチするやつ )と16進数( ¥x30 で 0にマッチ)があって、[:xdigit:] は 単純に [dgitx:] にマッチしたのでperl/javascript互換の正規表現のようです。

\x732b (unicodeの”猫”) も \x732b (エンディアンをかえたもの) も \xe7\x8c\xab (UTF-8の”猫”) も 猫 もやっぱりマッチしないので、日本語でフィルタしたいというのはまだできない雰囲気です。

今日見たら前回のpipesエントリで使わせていただいたcodezineのフィードの中身が少し変わっていて驚きました。あんなにたくさんみんなに見られるとは思ってませんでした。ほんとにごめんなさい…


About this entry