日本語検索の問題

インターネットで情報や情報の記載されているホームページを探し出そうとする場合、一番多い方法はインターネット検索サイトで、探したい単語を入力して検索結果から探し出すことですね。
仕事上、頻繁に日本語検索を行う必要のある方なら大概の場合、日本語の奥の深さと言っていいやら、コンピュータと日本語は相性が悪いと思ったり、小さい壁に突き当たるのです。

少し前にテレビコマーシャルでやっていましたが、ラーメンを検索しようとすると、

ラーメン(カタカナ)

らーめん(平仮名)

拉麺(漢字)

と三種類で同じ物を表現していますね。

更に送りがなの問題

見積もり(私の漢字辞書で最初に変換されて出てくる状態)

見積り(送りがなとして一番正しい気がします)

見積(見積書として提出する場合この表現が一般的ですね)

どの入力をしてもそれなりの検索をしてくれますが、検索総件数や順位は微妙に違ってきています。

むかし”ドラえもん”の正しい表記なんて話題も有りましたが。

ラーメンとかドラえもんなら良いのですが、個別の商品名とか会社名の場合は送りがなが違っていると出てこないことが多いのです。

電気店でも○○電気、○○電機、○○電器とありまして間違えると検索しても出てこないのです。

解決方法としてインターネット上の日本語を簡素化・・・出来るわけ無いですね。

すべて平仮名で入れると漢字に変換した結果が場合によって数種類出てきて当たってそうな変換名でOKすると検索される、よく分からなければ全ての漢字変換と送りがなで検索する方法はだめでしょうか?

追伸

日本語検索技術も随分と進んできまして表記のゆれなども考慮して検索されるようになってきましたが、インターネットに氾濫する文字情報も爆発的に増えてきたのでありまして、検索する側も選別が大変になってきているのです。