[PHP-users 35000] Re: htmlタグの<と単なる<の区別

うすき ujuworld @ yahoo.co.jp
2010年 2月 15日 (月) 03:53:34 JST


うすきです。

> うまい正規表現を考えれば、タグをとりのぞくことができるでしょうか?

ちょっと作ってみました。

$test = '<table summary="2>1" id="2>1" target="2>1">';
//                  ↓受け付けるタグ
if (preg_match('/<(a|table)((?:\s+[\w\-]+="[^"]*")*)>/', $test, $mch)) {
    $nodeName = $mch[1];
    $attributes = isset($mch[2])? $mch[2] : "";
    $attributes = preg_replace_callback(
        '/\s+(\w+)="([^"]*)"/', 'atrconv', $attributes
    );

    // テスト出力
    echo '<pre>';
    echo htmlspecialchars("<$nodeName$attributes>");
    echo '</pre>';
}
function atrconv($mch) {
    // ← 許可するタグと属性のチェック処理・サニタイズ
    return " ". $mch[1].'="'. htmlspecialchars($mch[2]) .'"';
}

// 結果
<table summary="2&gt;1" id="2&gt;1" target="2&gt;1">

HTML開きタグのみですが、こんな感じでブラッシュアップしていって、繰り返せ
ばある程度までは簡単にいけるかも知れません。
再帰的にパースを行わないので、開きと閉じの対応や入れ子不良等は、筆者側の
責任でちゃんとやって貰う必要があります。


> に話がもどってしまいます。そうすると、校正ミス、校正もれが起こる可能性が
> あり避けたいのです。

これについては萩原さんのいわれているとおり、Wikiを採用するのが最適なよう
な気がします。ソース状態の可読性はHTMLより良いと思いますので。



-- 

--------
uju
--------------------------------------
VANCOUVER 2010 Olympic News [Yahoo! Sports/sportsnavi]
http://pr.mail.yahoo.co.jp/olympic/


PHP-users メーリングリストの案内