[PHP-users 35000] Re: htmlタグの<と単なる<の区別
うすき
ujuworld @ yahoo.co.jp
2010年 2月 15日 (月) 03:53:34 JST
うすきです。
> うまい正規表現を考えれば、タグをとりのぞくことができるでしょうか?
ちょっと作ってみました。
$test = '<table summary="2>1" id="2>1" target="2>1">';
// ↓受け付けるタグ
if (preg_match('/<(a|table)((?:\s+[\w\-]+="[^"]*")*)>/', $test, $mch)) {
$nodeName = $mch[1];
$attributes = isset($mch[2])? $mch[2] : "";
$attributes = preg_replace_callback(
'/\s+(\w+)="([^"]*)"/', 'atrconv', $attributes
);
// テスト出力
echo '<pre>';
echo htmlspecialchars("<$nodeName$attributes>");
echo '</pre>';
}
function atrconv($mch) {
// ← 許可するタグと属性のチェック処理・サニタイズ
return " ". $mch[1].'="'. htmlspecialchars($mch[2]) .'"';
}
// 結果
<table summary="2>1" id="2>1" target="2>1">
HTML開きタグのみですが、こんな感じでブラッシュアップしていって、繰り返せ
ばある程度までは簡単にいけるかも知れません。
再帰的にパースを行わないので、開きと閉じの対応や入れ子不良等は、筆者側の
責任でちゃんとやって貰う必要があります。
> に話がもどってしまいます。そうすると、校正ミス、校正もれが起こる可能性が
> あり避けたいのです。
これについては萩原さんのいわれているとおり、Wikiを採用するのが最適なよう
な気がします。ソース状態の可読性はHTMLより良いと思いますので。
--
--------
uju
--------------------------------------
VANCOUVER 2010 Olympic News [Yahoo! Sports/sportsnavi]
http://pr.mail.yahoo.co.jp/olympic/
PHP-users メーリングリストの案内