[PHP-users 13296] Re: HMTML Tag の回避策

NAKAMURA Takeshi php-users@php.gr.jp
Fri, 14 Feb 2003 23:40:53 +0900


こんにちは、仲村です

> その後、音沙汰無しで申し訳ありませんでした。
> 色々準備したりしていてちょっと手間取っております。
> 土日中にケリを付けたいと思います。
既に忘れられてしまったかと思ってました。よかった。

> 判定するのが色々と厄介でSAXを利用しているわけなのですが、必然的にXHTML
> 準拠のページしか正しく判断できません。ある程度はSAXでパースする前に補正
> していますが、それでも掲示板の書き込み時にXHTMLを要求するのはあまりに
> シビアすぎるため少し困っています。

> Tidyならもっとラフな記述も判断できるため導入を考えています。
> ただしTidyのphpラッパーは無いようですので、Tidyをプロセス起動するか
> ラッパーを作成しなければなりません。当然ですが理想はラッパーを作成する
> 事だと思います。

 なるほど、Tidyですか。SAXへ渡す前のフィルターとして使用すると...
プロセスとして起動した場合、fork の負荷が結構ありそうですね。
 今回に限らず、Wrapper の Tidy が使えるようになると ラフに作った php の出力を
Tidyへ通したりできて、嬉しいかも知れませんね。

> 現状、ただのphpスクリプトでありそんな大したものでもないのですが、
> 公開したいと思います。もう少しだけお待ち下さい。
 期待しております。

# Tidyと言えば 私の英語力の無さのため、何が違う方向へ動きいそうな Bug レポートが...
# https://sourceforge.net/tracker/index.php?func=detail&aid=673059&group_id=27659&atid=390963
# 入力のHTMLが charset=raw な場合、弾こうとしている?
# 新しい charset が定義されたらどうするんだ?