ネット上のスラング、誤字、ギャル語と検索エンジンの関係
ITという言葉が作られる前、インターネットは一定の世界の人達しか存在しない世界であった。
年齢で言えば成人が多く、最も若い層は .ac.jp からの接続であり、それでも数は少なく浮いた存在でもあった。
逆に現状では若い世代のネット利用が増え、それに従いネットスラングや、誤字、ギャル語と表現するのか「私は」ではなく「私ゎ」の様な表現を好む人達もネットで文章を公開している時代である。
ここで気になったのが、その様な特殊な文章に対して、検索エンジンがどう対応しているかである。 単純なパターンマッチなのか、単語単位での検索を行うか、最近では関連用語も踏まえて、検索キーワードと、文章の関連性度の高さを決定する方向に進めているという話もある。
ここで思い出すのが、ネット上の文章を検索する場合を考慮して、用いる文字、用語を統一しようとしたパソコン通信時代の話である。
この運動を簡単に説明すると、「誤字を無くそう」「半角カタカナは使うな」「アルファベットと数字は半角で入力すべき」といった内容であったのだが、私の意見としては、そうした規定フォーマットに従って無いテキストは、内容も価値が無い場合が多い為、検索結果に該当しなくて丁度良かったのである。
「誤字が多い文章は、価値が無い可能性が高い文章である」に関しては、その文章は、見直しもしていないか、本当に知識の無い人が書いた文章である為、価値が無いのは当然である。
問題は「半角カタカナ~」の部分なのだが、これは私自身が「半角カタカナ」を用いている文章に嫌悪を感じていたため、「半角カタカナ」を使用している文章とは理解し合う事が難しかった事が原因であるとも言える。
逆に言えば、「半角カタカナ」が好きな人には「半角カタカナ」を使用した文章の方が親しみ易く理解し易いのかもしれないし、私自身も、英数字も全て全角で入力する(主に当時の年配者)宛てには、敢えて全角英数字を使用したメールを送信したりする。
最近では、全ての段落をセンタリングした文章を見かける事は少なくなったが、インターネットが普及し始めの頃は「文章を書く習慣の無かった人が、やってしまう読み難い書式例」として批判を得る事が多かった手法ではあるが、当時センタリングを好んだ人は、他人がセンタリングをした文章を「読みやすい」と感じていたのでは無いだろうか。
同じ様に、スラングや「私ゎ」を好む層には、やはりスラングや「私ゎ」を、ふんだんに盛り込んだ文章の方が共感も理解も得易い文章であり、その層が検索エンジンによる検索を行った際に求める文章は「私は~である」の様な文章では無く、「私ゎ~なの★」の様な文章なのではないのだろうか。
要するに、私が検索エンジンの開発者さんに言いたい事は、あんまり誤字脱字までを汲み取ったり、表現の違いまでを考慮しても、利用者の求める検索結果は出ないのでは無いかという予測である。
余りにも検索エンジンが気を回しすぎて、私の検索結果に「私ゎ」などを含む文章が出力されても嬉しくとも何とも無いからだ。私にとって「私ゎ」を含む文章は価値が無い文章であるし、「私ゎ」を好む人にとって、私の文章は価値の無いものである筈だからである。
最後に「私ゎ」が嫌いな私にとっての助言メモだが、私も「私ゎ」を好む層を対象読者とした文章を記述する必要がある際は、妙なプライドを捨てて「私ゎ」をふんだんに盛り込まないといけない。陥り易いミスとしては、対象読者が読めない可能性も高い漢字を使用してしまう事は無いだろうか。
自分が書いた文章は、読んでもらい理解してもらう事が得であり、他者が記述した意義のある文章は、読めて理解出来る事が得である。