ValidなHTML。

文法に照らし合わせてみて正しいプログラム(ページの記述含む)を、
『Validである』という言い方をする。
valid
【形-1】 有効{ゆうこう}な、通用{つうよう}する
【形-2】 正当{せいとう}な、根拠{こんきょ}のある、主張{しゅちょう}の正しい、事実{じじつ}に合っている、妥当{だとう}な、確かな、穏当{おんとう}な、正当{せいとう}な手続き{てつづき}を経た
blogが検索エンジンの検索結果を席巻して久しいが、
結局その理由も、blogの吐くHTMLが正しいから、ということに他ならない。
今仕事を手伝ってくれてるスタッフが、いわゆる『ホームページ作成ソフト』を使ってるのだけど、
その吐くHTMLのひどさと言ったらない。
もちろん、そのスタッフの仕事はしっかりしてるのだけど、ソースを眺めてしまうとね…
あちこちに無駄タグがあったり、
改行の取り方がまちまちだったり、
font, b, i ,uタグ、tableタグ使い放題だったり、
もちろんそれだけでinvalidとは言えないけれども、
良いところと言えば、インデントをきちんとしてくれる…くらいか。
タイトルを入れるかどうかも明示的ではないし、うーん。

まぁ、作成ソフトは極端な例にせよ、
検索エンジンてのは、一般的にHTMLはValidではない、という視点に立って
DBを構築してきたような気がする。
そりゃそうだ、人が書くだからどうしたって、人によって形式はまちまちなんである。
一方でblog(というか、CMS一般に)は形式自体はソフトにお任せだ。
全てほぼValidに従って整形してくれる。
ページ内にリンクも多いし、収集しやすいのは当然なんである。

何かを検索していてblogがヒットするというのは…
便利なことも多いが、必ずしも便利ばかりでもない。
blogのエントリは多くの場合、このサイトのように、メモのように書き捨てられている。
ひどい人になると、ニュースソースしかなく、外から見るとただの噂にしか見えない。
そんなサイトがいくつも引っかかってもねぇ…Validな検索結果とは言えない。

何か、新しいアルゴリズムを発明するべき時期が来たんでは…