はなくそモグモグ

webサイト:http://kusonote.fool.jp

【純文学】シャムさんの脳内辞書を考察。【順文学】

f:id:zaqmju7:20150923071417p:plainはいドウモ~~ォ↑↑↑、社会のゴミでぇ~~っすゥ・・・・

あの、失踪はしてないんですよ、ほならね、何をしてたんかって言うたらね。

ゾット帝国を2週目してたんですよ、その2周目がね、その2周目をですね、時代考証やキャラデザ等をしながらじっくり読み進めてたらね、時間がかかったわけですよ~

「お話がながいよ~」って言う人もいるかも知れへんから、ここまでにしておくわ。

 

syamu game syamu_game syamu game syamu_game syamu game 

 

え~今回はですね、シルバーウィークということで、ゾッ帝の解説記事を出そうと思ったんですが、読んでて「なんか、同じ表現ばっかり出てくるなぁ」って思ったんですね、だから、それを伝えようと思って、ゾッ帝の頻出語句を自力で検索して探していたんですね。

僕、プログラムとかできないんで。形態素解析とか、自然言語処理に強くないので、検索は全て自力でやりました、自力です。そしたら三日ぐらいかかってしまって、Excelの使い方もわからなかったんで、検索して、なんとか。

 

そしたらですね、やってる途中に、Twitterとかで形態素解析をしている方々がちらほらいて「あ、やっぱ考えることは同じなんですね~」と思いましたね、です、が。決してパクリではございません、全て。オリジナルでスゥウゥゥゥゥ。

 

 この方の形態素解析を参考にしました。

 

表現の抽出の際の選考条件は

 

・シャムさんが選んだ言葉

例えば、「男」や「機械」などの普遍的な表現は選択できないじゃないですか。「男」「機械」は基本、他の単語に代替しないし、なによりそれを書く機会が多い。

ですから単純に語彙の頻度だけを測定しても、そりゃあ「こそあど」などの代名詞やら副詞やら、助動詞やらが上位に来るのは決まっていて。面白くない、何かが足りない。

そこでそれらを僕の主観で除外してですね、「オートマチック銃」など、「シャムさんが選んだ」であろう言葉のみを抽出しました。

「オートマチック銃」というのは、まぁ世間一般で言う「自動式拳銃」のことじゃないですか。ですから、自動式拳銃を、故意なのかガチのガイジなのか「オートマチック銃」と表現した、その言葉の選択性に注目して要素を集めました。

 

・シャムさんの生活が垣間見えるもの

 まぁ上記の言葉の選択性で選んだに尽きるんですが、その中でも、シャムさんの生活やその当時の心境を彷彿とさせるような表現によりました。

例えば「キス」という表現は、ゾッ帝内で20回ほど出てくるんですが、それをですね、時期別に折れ線グラフで表したところ。

f:id:zaqmju7:20150923083535p:plain

━━ 使用回数 ‐‐‐‐ 更新頻度

 

一月を10日ずつ3つにわけた要素でゾッ帝作成時期から更新が途絶えるまでの使用回数を時期別に表したものなんですが。

すなわち10日間の区切りで何回使用されたか、を表しているんですが、使用回数がゼロのときとある時は数回使用したりと波があるんですね。

ですからこのことから、浜川裕平先生には性欲の一定周期があって、そのフラストレーションを発散させるために小説でエッチなシーンが描写されるのではないか

といったようなことが予測されます。

このように、グラフにした時に、一考の余地がある結果が得られそうなものを重点的にピックアップしました。

 

 

 

 

 

そしてそれらの要素を一定数集めて散布図にしてみました。

f:id:zaqmju7:20150923075318p:plain

google検索というのは最適化されてますんで例えば「うんち」って検索したとしても、うんちを含むページが全て出てくるわけでは無いんですね。そういった意味ではあまり参考になりませんが、あくまで「その表現が日本中に浸透しているのか」という指標として参考程度に、ということでお願いします。

そうすれば、基本はこの散布には正の相関が現れるはずなんですよ。

正の相関というのは要素がプラス方向「/」のように比例する感じですね、というのも、「検索数が多い表現=他でもよく使われる表現」ですから、普通は他でもよく使われる表現が多くなり、他ではあまり使われない表現が少なくなるものじゃないですか。

検索数が多い(他でもよく使われる)と使用頻度も上がり、検索数が少ない(他ではあまり使われない)と使用頻度も下がる、このようにy=xに、縦に増えるほど横にも増えるはずなんですよ。普通は。

で、逆に「負の相関」があったらですね、要素がマイナス方向「\」へ比例すると。みんなが使う表現ほど少なく、一般的に使われない表現ほど多く使う。こういう傾向にあればシャムさんはひねくれ者か、自分独特の表現を重んじる。まぁある意味、表現者として適正のある傾向ですよね。

で、シャムさんはどっちになるのかというと、なんと相関係数が「0.019546255」。

これは何を意味するかというと、相関がない。

 

つまりですね、シャムさんの頭の中では表現や語彙が一般的に使われる使われない関係なしに、完全に脳内辞書がシャム仕様になってるんですね。。。

完全に、世間一般の日本語の価値観と乖離した、「順文学」ワールドが形成されてるというわけです。

良く言えば、周りに流されない自分の世界を持っている。(大衆作品には不適正だが、純文学などでは高評価される点)

悪く言えば、本を全く読んでいない。もっといえば活字に触れるキカイ…すらないのではないだろうか。

 

よし、そろそろ口調が戻ってきましたね。

この三日間、誰とも話さず、シャムさんの文字を読みながら、シャムさんのフリートークとオリジナル曲を聞きながら作業していたので、言葉選びやら句読点やらが完全にシャム一色になってしまっていて、夢でもシャムさんが出てきて地獄でしたね。

特にオリジナル曲を長期にわたって聞くと頭おかしなるで。

 

ではリハビリはこのぐらいにして

次回の記事では、これらの要素をひとつひとつ解剖していってですね

なぜ同じ表現を使ってしまうのかというのを徹底的に考察していきたいと思います。

 

それではカットしていきます。

ほいじゃ、カッツッツ~~