googleアクセスアップ研究(9)

infoseek研究に土俵を移して
 最初の表紙ページがinfoseekでどのように検索されるかと言うと、キーワード「北海道 自転車 紀行 212」で初めて1位に表示される。「北海道 自転車」では圏外、逆に「北海道 自転車 紀行」では旅行記のリンク集であるページが表示される。このリンク集は手抜きなので<meta name="description"の行が無い。
 つまり、infoseekに限って言えば、descriptionは100害有って一利無しなのだ。
現に最初のページはdescriptionの内容だけが表示ランキングに使われてる。descriptionを書くと、たかだか80文字しか表示ランキングに反映されないのだ。本文は無視されてしまう。
 なんでこんな仕様になってるのか理解に苦しむ所だ。しかも表示ランキングの方法は検索されるキーワードとその関連キーワードがinfoseekに蓄積されてる評価文字との合致回数で計算しているので、descriptionしか蓄積されてないページは不利になる。逆に1ページが長い文章で書かれていると表示ランキングが高くなる。
キーワード「予備校 北見工業大学」(そんなキーワードで検索する奴が居るとも思われないが)で検索すると http://hokkaido-potho.hp.infoseek.co.jp/1891/novel002_1.htmが11位に表示される。このページは今は無いのだがinfoseekでは身内(ドメイン名がinfoseekのページ)を上位表示するのでこのように出てくる。
このページもdescriptionの行が無い。
infoseekの構造
 googleに近いと思うのだがリンクを辿ったロボットが収集するデータは先に書いたようにdiscriptionが有ればこの内容、無ければ本文全体のようだ。googleは本文全体をキャッシュしている(ま、著作権法に照らすと微妙な部分は有るが)。憶測だがinfoseekはデータ容量の関係から最初はdescriptionのみ収集していたのだろう。その為にホームページ作者の意図が把握できて正確なヒットをしたと思う。しかし、日本語だけで30億ページもキャッシュしているgoogleに対向するためにはdescriptionのみでは収集するページ数に限界が有るのでdecriptionの無いページ対策を施した時にミスが有って旧来の収集データの人々は僅か80文字、新参者はページ全体とギャップが発生したのだろう。
「正直者は馬鹿を見るinfoseek」が誕生してしまったのだ。
infoseek対策
 現時点で有効な方法として
1)descriptionを外す
2)外したページ全部を再検索依頼する
の2点だろうか。先週再検索登録を行ったが結果が出るまでは1,2週間かかるかもしれない。
周知のようにgoogleは現時点ではmetaを読まないことが確認されてるから、googleの上位表示には影響は無い。それよりも最近の検索エンジンでは同一キーワードで複数の検索エンジンをコールして、その表示ランクを集計して表示する機能のものもある。このような検索エンジンではinfoseek対策は有効に反映される。
ロボットサーチ.comなんかでは複数ロボット検索のサマリーを表示するので「腐ってもinfoseek」での上位表示は外せないのだ。
infoseekの上位表示の結果が出たらまたレポートしよう。
検索エンジン研究はまだまだ続く。
2003.05.12 (c)Mint
Top Back Next