[PHP-users 32910] Re: HTMLの解析がうまくいかない

Daichi Kamemoto daikame @ gmail.com
2007年 11月 27日 (火) 01:00:35 JST


ゆどうふです。

> phpと正規表現でHTMLの解析・オブジェクト化をされた経験のある方に、是非助
言をいただきたく思います。

正規表現でのHTMLの解析もオブジェクト化もこれっぽっちもしたないのですが、原
因はその辺じゃなさそうなので。

function _superimposeTag($tagArray, &$parentElement) の定義は$tagArrayも参
照で渡さないと望む動作にならないと思います。
あと、その中でのtrue falseの返し方が違いませんか?

if (substr($tag[1], 0, 1) == '/') {
-    return true;
+    return false;
} else {

だったり

    $parentElement->append($object);
-    return false;
+    return true;
}

だったりしませんかね。

これでひとまず望む動作にはなると思います。

でも、これって<script>タグの中までパースするからjavascript内にタグが書いて
あったりすると泣きそうになりませんか?
異常系でいえば<img name="><" src="hogehoge" />の類もダメですよね。

なんとなく、そんな感じで。


PHP-users メーリングリストの案内