[PHP-users 13286] Re: HMTML Tag の回避策

Reiji Matsumoto php-users@php.gr.jp
Fri, 14 Feb 2003 21:50:02 +0900


仲村様

その後、音沙汰無しで申し訳ありませんでした。
色々準備したりしていてちょっと手間取っております。
土日中にケリを付けたいと思います。

>   $tag["a"] = array ("href" => "{http|ftp}://[a-zA-Z%~/]+"); ...
>   $tag["b"] = array ();
>   $tag["font"] = array ("color" => "[a-zA-Z#]+","size" =>
"{large|small|...}");
>  として 関数に 文字列と$tag を渡し ereg 等でフィルターをかければと
> 頭では考えた訳なんですが
基本的にはこんな感じで作っています。ただしタグが本当にタグであるのか
判定するのが色々と厄介でSAXを利用しているわけなのですが、必然的にXHTML
準拠のページしか正しく判断できません。ある程度はSAXでパースする前に補正
していますが、それでも掲示板の書き込み時にXHTMLを要求するのはあまりに
シビアすぎるため少し困っています。
Tidyならもっとラフな記述も判断できるため導入を考えています。
ただしTidyのphpラッパーは無いようですので、Tidyをプロセス起動するか
ラッパーを作成しなければなりません。当然ですが理想はラッパーを作成する
事だと思います。

#Tidyのページ
英語
http://www.w3.org/People/Raggett/tidy/
日本語(かなり古いようです)
http://www.w3.org/People/asada/tidy/

現状、ただのphpスクリプトでありそんな大したものでもないのですが、
公開したいと思います。もう少しだけお待ち下さい。

Matsumoto@Sp