|
|
つまり、infoseekに限って言えば、descriptionは100害有って一利無しなのだ。 現に最初のページはdescriptionの内容だけが表示ランキングに使われてる。descriptionを書くと、たかだか80文字しか表示ランキングに反映されないのだ。本文は無視されてしまう。 なんでこんな仕様になってるのか理解に苦しむ所だ。しかも表示ランキングの方法は検索されるキーワードとその関連キーワードがinfoseekに蓄積されてる評価文字との合致回数で計算しているので、descriptionしか蓄積されてないページは不利になる。逆に1ページが長い文章で書かれていると表示ランキングが高くなる。 キーワード「予備校 北見工業大学」(そんなキーワードで検索する奴が居るとも思われないが)で検索すると http://hokkaido-potho.hp.infoseek.co.jp/1891/novel002_1.htmが11位に表示される。このページは今は無いのだがinfoseekでは身内(ドメイン名がinfoseekのページ)を上位表示するのでこのように出てくる。 このページもdescriptionの行が無い。 |
|
|
googleに近いと思うのだがリンクを辿ったロボットが収集するデータは先に書いたようにdiscriptionが有ればこの内容、無ければ本文全体のようだ。googleは本文全体をキャッシュしている(ま、著作権法に照らすと微妙な部分は有るが)。憶測だがinfoseekはデータ容量の関係から最初はdescriptionのみ収集していたのだろう。その為にホームページ作者の意図が把握できて正確なヒットをしたと思う。しかし、日本語だけで30億ページもキャッシュしているgoogleに対向するためにはdescriptionのみでは収集するページ数に限界が有るのでdecriptionの無いページ対策を施した時にミスが有って旧来の収集データの人々は僅か80文字、新参者はページ全体とギャップが発生したのだろう。 「正直者は馬鹿を見るinfoseek」が誕生してしまったのだ。 |
|
|||
現時点で有効な方法として 1)descriptionを外す 2)外したページ全部を再検索依頼する の2点だろうか。先週再検索登録を行ったが結果が出るまでは1,2週間かかるかもしれない。 周知のようにgoogleは現時点ではmetaを読まないことが確認されてるから、googleの上位表示には影響は無い。それよりも最近の検索エンジンでは同一キーワードで複数の検索エンジンをコールして、その表示ランクを集計して表示する機能のものもある。このような検索エンジンではinfoseek対策は有効に反映される。 ロボットサーチ.comなんかでは複数ロボット検索のサマリーを表示するので「腐ってもinfoseek」での上位表示は外せないのだ。 infoseekの上位表示の結果が出たらまたレポートしよう。 検索エンジン研究はまだまだ続く。 |
|||
2003.05.12 (c)Mint | |||
|