形態素解析説明画像3

Googleなどの自然言語検索エンジンは形態素解析という仕組みで言語を理解しています。
形態素解析とは助詞や接続詞などの言語ルールと単語リスト(辞書のようなもの)を情報源として一つの文をバラバラにし、最小単位の単語に噛み砕いて言葉を理解する仕組みの事です。

詳しくはWikipedia(形態素解析)を確認して下さい(笑)

今回の記事では、このブログの2011年2月15日の記事をGoogleで検索した結果を用いて説明します。

[ウェブマスターツール 利用のススメ]
をGoogle検索して頂くと、このブログが上位表示されると思います。
この検索結果ページのキャッシュをクリックして頂く事でGoogleが形態素解析をした単語を見ることが出来ます。

形態素解析説明画像1

 

キャッシュのページでは
[ウェブ][マスター][ツール][利用][の][ススメ]
と区切られて表示されていると思います。(2012年2月17日現在)
この区切られた文字列が形態素解析された単語になります。

形態素解析説明画像2

上記の画像キャッシュページの画像には助詞の[の]も分割されて入っていますが、[の]などの助詞を検索結果に含めてしまうと大量に検索エンジンにヒットしてしまう為、検索精度向上の為にストップ語(ストップワード)という扱いにされ検索対象から除外しなければなりません。
ちなみに他にも[が][を][です][ます]などもストップ語(ストップワード)となっています。
(2012年2月17日現在)

試しに
[ウェブマスターツール 利用ススメ]
[ウェブマスターツール 利用ススメ]
で検索を行なってみて下さい。

[ウェブマスターツール 利用ススメ]
とほぼ同じ結果が表示されると思われます。(2012年2月17日現在)

形態素解析説明画像3

これは何を意味しているかと言うと、
例えば
[ウェブマスターツール利用 ススメ]というキーワードで上位表示したい場合、
titleタグや本文などに[ウェブマスターツール利用 ススメ]と無理に同じ状態で記述する必要は無い
という事になります。

[ウェブマスターツール利用ススメます]や、
[ウェブマスターツール利用ススメ] (これは日本語が変ですが。。)
といった形で、助詞で区切った言葉をtitleタグや本文中に含めていれば、
[ウェブマスターツール利用ススメ]で上位表示を狙う事が可能になるという事になります。
(例えが少々ややこしいですが・・・)

形態素解析説明画像4

もし上位表示させたいキーワードをtitleタグや本文中に自然に含めるのが難しいと感じているなら、
そのキーワードで検索をして表示されたサイトのキャッシュを確認し、形態素解析をした結果を確認してみる事をお勧めします。

意外な所で単語が分割されて認識されている場合、
不自然にキーワードを詰め込みすぎない自然な文章を作成する事が出来るかも知れません。
特にロングテールキーワードで上位表示を狙っているウェブマスターの方は、さりげなく本文にさりげなくキーワードを入れ込むヒントに使えますので、有効活用出来るのではないでしょうか?

※本ブログに記載されている情報は、私の見解に基づく場合が多々ございます。
 掲載記事を参考にした事による損害については、その責任を負いかねます。
 自己責任で、掲載情報を参考にして頂ければと思います。

※本記事の追記と補足(2012.2.18)
先日投稿したこちらの記事について補足です。
形態素解析では「助詞はストップワードとして無視される」とありますが検索結果では多少の変化が起こります。
それらを含む記事内の一部の表現を変更しました。