infoseiri’s blog

映画から食からサッカーまで

伸びしろ十分?(内容注意)

毎月勤労統計のはなし

みなさんは興味ありますかね

 

政府機関が杜撰な統計調査をしていると、

結構困るんですよね

 

なぜかというと、

人口だったり、経済だったり、

社会科学調査の分野では頻繁に政府統計を引用するからなんです。

 

政治的には、

野党が批判材料として使っているようですが、

統計をかじった身からすると、

どんな調査法をとって、この調整がどのように結果に影響するのかを調べるべきだと

 

様々な視点から物事を考えられるので、知識は持っておくことに越したことはないと実感

 

 

まじめな前置きで始まったのですが

さて、今回は

アダルトな話題を

 

僕に対するみなさんのイメージをそこまで深く想像したことはないですが、

 

僕にだって

人並みの性欲はあります

(胸を張って言うな)

 

だけど、ただたんに楽しむだけじゃ物足りない

そんな人に朗報

 

VRって知っていますか?

 

ニュースで取り沙汰されたりして、

一時期有名になった⬇︎です

 

f:id:infoseiri:20190210080824j:plain

 

これが、AVでも使えるんですよ(/ω\)

 

ネットカフェとかビデオボックスなんかで

3DVRだとか宣伝があったりしますよね

 

繁華街なんかの電光?広告なんかでキラキラ面白そうだったので、行ってきました。

 

今回向かったのは、

 宝島というビデオボックスです。

 

なぜ上野なのかって?

適当にそこらへんぶらぶらしていたからです。

本当は動物園行きたかったんですが、あいにくの天気だったので(>_<)

 

アメ横(初めて)をぶらぶらうろついて、活気のいいお兄さんが

「閉店セールです。90%引き!」

などなど呼び込みをするのを見ていました。

 

高校の時に、東京旅行をした部活の先輩が、

アメ横楽しかった、というかめっちゃ安く色々買えた」

といっていたので、どんなものが売っているのか、以前から不思議ではありました。

 

食料品から服まで何でもそろっているんですねあそこは

 

さらに、年末だったこともあり、

お客さんでごった返していました_(:3 」∠)_

 

まあその群衆の中をかき分けて、紳士の社交場((笑)へ

 

気になるアダルトVR料金はこんな感じ(公式HPから)

f:id:infoseiri:20190210082247p:plain

カードが使えなかったので、現金で支払いました。

 

まずは、機器の扱い方を受け付けのお兄さんから説明されました。

「ここが電源ボタンで、ここは音量。

ネット接続しているので、ストリーミング再生できますが、

HDにも接続しており、そちらで見た方が高画質にはなります。

~~~~~」

といった、説明を5分少々でしょうか。

なんといっても初体験だったのでね。( ・´ー・`)

しっかり聞いて、さっそく個室の方へ

 

エレベータで上階に移動し中に入ってみると、

普段よく利用するネットカフェのフルフラットシートとほぼほぼ同じような設計。

f:id:infoseiri:20190210082749j:plain

 

座椅子があって、テレビがあってという感じです

 

1時間で申し込んだので、あまり時間がない( ゚Д゚)

さっそく準備に取り掛かりました。

 

部屋の隅のコンセントに

VR本体の電源ケーブルとHDの電源ケーブルを差し込みます。

 

そこからの初期設定?はそこまで難しくはありません。

というのも自分はVRが全くの未経験ではなかったので( 一一)

(VOX VRというスマホでできるものを家でやったことあり)

f:id:infoseiri:20190210083200j:plain

 

 

イヤホンを装着してその上から↑のようなヘルメットをかぶるんですが

僕の頭が大きいからかな(。´・ω・)?

なかなかうまくフィットしない

 

結構きつめにしないと、だんだんずれてきてしまったりして面倒でした。

集中できずにイライラしてしまっては元も子もありませんね。

 

んでんで、その性能?効果?はいかほどだったかというと

作品ラインナップは確かに充実していたのですが

肝心の機械の方が…( 一一)

 

そこまでの3D感というか立体感というか、は得られませんでした。

特にきつかったのは、

女優さんとの距離が近くなりすぎると映像が二重になる

んですよね。

え、ナニコレ気持悪(@_@)

ってなり、全然集中できなかった

 

ここのお店だけかもしれませんが、使っている機械は統一だと思うのでどうなんだろう(。´・ω・)?

 

まだまだ、伸びしろがあるということですかね

 

ではでは、

($・・)/~~~

更新をスムーズに

突然ですが、

囚人のジレンマっていうのをご存知でしょうか

 

前にも紹介した気はするのですが、

ゲーム理論

 

infoseiri.hatenablog.com

 

における基本的な

問題?例?

です。

 

ジレンマっていうのは

葛藤とか板挟みの状況のことですね_(:3 」∠)_

 

本当にやりたいのはこっちなのに、

違う選択肢を取らざるを得ないという

 

いかにももどかしい感じですΣ(-᷅_-᷄๑)

 

 

その囚人のジレンマとやらに、早速入っていきましょう

 

留置所に2人の共犯らしき容疑者がいます。

裁判で使うための証拠探しのため、警察は取り調べの真っ最中です。

しかし、物証はなかなか得られません。

そこで、自白させる方針に切り替えました。

2人のうちどちらも自白すれば、罪は決定的となり両方とも禁錮5年。

片方しか自白しなければ、自白した方は禁錮1年。黙秘した方は禁錮5年となってしまいます。

どちらも口をつぐんでしまえば、確証が得られず禁錮3年となります。

 

 

別々の留置場に入れられた(話し合いはできない)2人の囚人に、あなたがもしなったとしたら、

どんな手をとればいいのでしょう(´-`).。oO

 

当然、相手が裏切れば(自白してしまえば)、自分も自白した方が良い。

たとえ、裏切らなくても(黙秘しても)、自分だけ自白すればよいですね。

 

そう、結局は相手の戦略(自白と黙秘)に依存せず、自分は自白した方がよい。

という結論に至るんです。

 

その結果もたらされるのが、禁固5年で、

両方黙秘した際の禁固3年よりも長くなるのにもかかわらずです。

 

 

 

 

前置きが長くなりましたが、

今回は免許の更新について

 

f:id:infoseiri:20190210080228j:plain

初めて免許の更新に行ってきました。

というのも、メルカリを使い、家の雑貨を整理?断捨離?していて

キュラーズという貸し倉庫で一旦保管しようとなったからなのです( ◠‿◠ )

f:id:infoseiri:20190210080307j:plain


 

 

その際に、

冷蔵庫、乾燥機、洗濯機がまだ残っていたのを見て、

あっ_| ̄|○

これ重くて運ぶのめんどくさいな

 

せっかくの機会なので、

タイムズカーシェアリングで荷物運びをすることに決めました。

 

カーシェアの会員登録で、当然ですが運転免許をアップロードしないといけません。

よし免許免許は財布の中っと、

( ゚д゚)有効期限が2週間後だと、、、

 

かなりショックでした

自分がサボっていたというか、たんに確認し忘れていただけですが

 

このままでは、徒歩15分近い距離を

アレらを持ったまま移動するはめに((((;゚Д゚)))))))

(キャスター付きのオフィスチェアを持っていたので、最初はそれで運ぶつもりだった)

 

でも、そういえば(`・∀・´)

タイムズカーシェアリングは学生プランとかいうのもあるし、

いまならキュラーズの特典も付いてくるな

 

こんな感じで、早速免許センターへゴーε=ε=ε=ε=ε=ε=┌(; ̄◇ ̄)┘

 

免許の更新の詳細は⬇︎

 

www.keishicho.metro.tokyo.jp

 

初めてだと取得年から3年後の誕生日までしか使えません。(自分の場合は、2年前の夏にとった)

1月が🎂なので、正確な期限は2月の中旬ぐらいまででした

 

大学へ行き、休学の届け出もしようと思っていたので

その通り道上にある免許センターへ(^^)

 

まあ、30分ぐらいだろ(^ ^)

あっ、初めての方ですね。初めての方は試験場のみになります。

 

へ、٩( ᐛ )و

一瞬止まった後、気がつきました。

 

初めての更新は試験場のみらしいです。⬇︎

 

まあ、どうせ大学に行く途中だったし、いいか( ´ ▽ ` )きりかえてこ

 

そこから15分ぐらいで大学に着くと、

試験期間につき、入校制限の張り紙が(-_-;)

そういえば、受験シーズンだ、いま

 

塾のバイトやっているくせに、気づかないなんて、この日は頭が全然回っていませんでした。

 

 

再び気を取り直し、電車で試験場へ

受付で更新の旨を伝え、列に並びました。

 

雰囲気は健康診断のような感じで、

番号順に次の列に移動していきました。

 

健康診断の雰囲気自体は、そこまで嫌じゃないんですが、

ひたすら続く、流れ作業感に|( ̄3 ̄)|

こういうのって機械化っていうか

人員削減できないんですかね

紙の説明と番号があれば、欲を言えばタブレット端末みたいなものがあれば

充分だと思うんですけど(´-`).。oO

f:id:infoseiri:20190210080531j:plain


 

 

こんなグチ言ってても、

暗証番号を作るところ?でミスってましたけどね(^_^;)

係員に必死に質問してたし

なにそれっ?って

 

 

そんなかんじで、

視力検査

今まで大事に?使っていた免許に穴を開けられ(もう使えない印っぽい)

写真撮影

を終えて、エレベーターで講習室へ

 

この時点で、10時半ぐらいだったのですが、

講習室前のホワイトボードには、開始時刻

11:20〜

とのこと

 

窓が開いていて、室内が少し肌寒かったので

廊下の日当たりの良いベンチで

スマホいじってました。

 

このときに、面白いものを見つけたんですよ。

reducegoって知ってますか?

これは、違う記事で書こう(まだ、実際に利用したことはないし)

f:id:infoseiri:20190210080628j:plain


 

 

2時間ないぐらいの指導の後、

ついに念願の?新免許を手にすることができました👏

 

ゴールド免許になれば、次回更新時の講習時間も短くなるようなので、

安全運転に気をつけたいですね(運転を全くと言っていいほど普段しないので、なんとかなるでしょう)

 

カーシェアについては、

実際に使ったときに改めて

 

ではでは

(・◇・)/~~~

 

 

 

 

 

 

 

映画レビュー グレムリン

 

突然ですが、この前というか最近というか

 

小麦に無限大の可能性を感じています、私は。

 

小麦粉を水と卵と一緒に混ぜますよね(片栗粉などもあればそれも合わせる)

 

それをフライパンで、両面焼くわけです。

すると、あら不思議

簡単に、お好み焼きっぽい粉物の主食が( ゚Д゚)

f:id:infoseiri:20190209120037j:plain

 

粉を混ぜる際に、

  • カレー粉
  • チリパウダー
  • 味噌
  • 砂糖

なんかを、味付けとして入れるだけで、七色の可能性を感じました。

 

カレー粉だったら、ナンみたいにして、レトルトカレーと合わせても良いですし

味噌やプレーンだったら、お好み焼きみたいにノリや鰹節を上にトッピングしてソースで

 

お金がない貧乏さゆえに生まれた、この料理ですが(うーん、コメもパンもないし、面もこの前消費しちゃったしな。そういえば冷凍庫に粉がある。それを焼けば何とかなるんじゃね( ・´ー・`)の発想)

そこまで味とかに執着しない、腹が満たせればひとまずおk(*^_^*)

な私にはぴったりでした。

 

冷蔵庫を空にするために、他にも

  • プリン
  • チリパウダーを大量に使ったスープ
  • 醤油大量の煮込み料理

 

なんかも作ったので、後で記事にしますね

 

 

 

前置きはここまで

さて、今回は

グレムリン」という映画についてのレビューをば

 

自分が契約しているAmazonPrimeにおいて、見放題が終了する映画というカテゴリーがあるんですが、

そこに入っていました。

 

これはみておかないと、なんか損をした感じ(ー_ー)!!

とおもい、さっそく視聴することに

 

  • 事前知識として、
  • 洋画
  • モンスターが出てくる
  • 水をあげると?触ると?増える

 

というようなことは、聞いたことがあったのですが、それ以外の詳細については全く_(:3 」∠)_

 

そんななかで再生ボタンを押し始まると

あらすじは

外国人のあるお父さん(発明家らしいが、かなりへんてこな発明品なので地震でプロモーションというかセールスをして飛び回っている)が、中国に仕事?旅行?でいったときに、路地裏のお店(知る人ぞ知るというか、かなり怪しいというか)で、モグワイと呼ばれる生き物?を息子のプレゼント用に購入します。

f:id:infoseiri:20190209113739j:plain

見た目はかわいい?愛らしい?ペットって感じですね(=゚ω゚)ノ

 

しかし、このモグワイもともと売り物ではないっぽく、半ば強引に家に連れて帰った形。

というのも

水に触れると、凶暴な性格を持った分身が出現(5匹)

f:id:infoseiri:20190209120138j:plain

真夜中を過ぎて、餌をあげてもダメ(主人公の息子は、自身の時計の故障に気づかず、肉をあげてしまい、大変なことに)

てな感じで、増殖する悪いモグワイによって町がたくさん荒らされていきます。

 

しかし、何も対処法がないというわけでもなく、

光に弱いため、デジカメのフラッシュや車のヘッドミラーによって退治することができます。

 

 

と、話の展開?モグワイの生態?に関してはこんな感じ

 

感想としては、

水をかけられて増殖していくモグワイが、町を荒らす

具体的には、犬をイルミネーションランプを使ってぐるぐる巻きにし、極寒の家の外に放置

とか

パブで踊り狂う(換気扇?部屋の天井に設置されたくるくる回るやつにぶら下がって遊んだり、酒やたばこにはまる)

様子を見て、水から出てきた悪いモグワイは人間に似ているなあと思いました。自堕落で、好奇心が旺盛で、好きなことや無駄に見えることを楽しんでいる(なんか、コンセントに指突っ込んで感電を楽しんでいる、気が狂った奴いました。)

 

まあ、お金稼ぎのような知恵はなく、ただ無邪気に遊んでいる、赤ちゃんのようなものなので、実際の人間よりかはかわいらしいものですが。

 

最後までなれませんでしたけどねあのフォルムに

どう見たってかわいくはないもの

 

この前塾の英語テキストで、

子犬は人間に対して視線を合わせじっと見つめることで

人間に愛情?かわいらしさ?を芽生えさせる

というような教材を読みましたが

 

このモグワイに見つめられてもねえ( ・´ー・`)

 

 

僕なら、まずなんでこんなもん買ってきたのか

お父さんのセンスを疑うな( 一一)

 

 

ではでは、

👋

不真面目経済学部制による資本主義の勉強

東京で雪が降っていますね。この頃はいつも寒い寒い嘆いていました私にとって、(>_<)

これは致命的な一撃

去年もかなり降って、確か結構積もったりしていたような

 

お外に出られない病にますます拍車がかかります(ー_ー)!!

 

アルバイト先の先生は、この中でも野球をやると先日言っていまして、

正気の沙汰ではない何かを感じました。( ・´ー・`)

 

野球って、僕は経験がほとんどないし、テレビで親が見ているのを受動的に見ていたぐらいなんですが、

冬はどうなんですかね?(。´・ω・)?

 

厚着してできたりするんでしょうか?

 

とりあえず、その先生にはくれぐれもけがなどしないよう気を付けてもらいたいものです。

 

 

 

前置きはここまでで、

今回は資本主義について勉強しましょう。

以前、漫画のことでアニメの方が情報がすんなり入ってきやすい(↓のまえおきで)

 

infoseiri.hatenablog.com

 と意見を述べました。

 

なので今回もビデオを使って、わかりやすく(^_-)-☆

 

 

 

今回紹介するのがこれ(^^)/

www.youtube.com

 

資本主義とは何か、経済学部なんですけど

本を読まなかったり、好きな分野の本(数理系、金融工学とか(

を読んでいたので深く考えたことが全然ありませんでした。

 

マルクス資本論には、資本主義社会とはすべてのものが商品になるような仕組みだそうです。

それによって、誰もが自由に好きなものを売り買いできるわけですね。

でも、アメリカ社会を見ると自由とはかけ離れた格差が広がっている様子。

富を築くために、企業が従業員に保険

f:id:infoseiri:20190209112037p:plain


をかけたりして、労働者の死を歓迎するといった、非人道的なことも行われています。

キリスト教の貧しいものを救済し、富めるものを貧しくという教えに反しているため、

協会の社会的重要性も高いであろうアメリカでは、非常にショッキングな問題なのでは

政府としては、競争や利益重視を教育として推し進め、正しいものだと抑え込んでいます。富裕層の所得税をどんどん比較して、上流階級の成長のみを応援する様子。

 

この監督の作品は、

ja.wikipedia.org

今まで全然知らなかったんですが

教養の深さだったり、意外な一面をされてとても面白かったです。(もともとジャーナリストらしい)

勉強にもなりました。

お弁当屋さん #2

またまた自慢話というか現状報告から

 

今まで、統計に関する記事をいくつか挙げていました。

 

infoseiri.hatenablog.com

infoseiri.hatenablog.com

infoseiri.hatenablog.com

infoseiri.hatenablog.com

infoseiri.hatenablog.com

infoseiri.hatenablog.com

 

この中で異質なのはどれでしょう?

 

はい、そうですね。

統計検定の勉強ってやつですね。

 

この前(といっても11月ですが)

テストセンターに試験を受けに行き、

f:id:infoseiri:20190130075646j:plain

無事、合格しました。(*^_^*)

 

いやー、なんでテストってあんなに緊張するんでしょうか?

初めてのコンピュータ試験で、

勝手がわからずいろいろ焦った+テストによるプレッシャーで

かなりてんぱった中、問題に挑んできました。

 

そうそう、試験中は電卓使用可なんですが、

僕がもっている電卓、ルートついてなかったんですよ(~_~;)

あとからそれに気づいて(統計検定で、必ずではないけれど使う機会があります。)

マジでピンチでしたね(ー_ー)!!

 

まあ、手計算で何とかしたんですが。

高校生以来の久々だったなあ、40*40=1600だから、40よりかはでかいか。

みたいな、2乗の計算を頭の中でやっていました。

 

まあ、終わり良ければ総て良し。

終わったことは気にせずに前に進んでいきましょう。

 

 

ということで、

どうもこんにちは、赤猫です。

 

今回は

以前利用したお弁当屋さんについて紹介したいと思います。

ボリューミーなあの店とは別ですよ。(油モノばかり食べていると、健康にも悪いだろうし、気分転換( `ー´)ノ)

 

 

 ↓にあります。海鮮丼のお店になります。

チェーン店っぽいですね。googlemapで調べただけでも、高田馬場・両国などがヒットしました。

丼丸

これが公式HP らしいです。関東23区に展開しているそうな。

 

 

外で色々食べる、その爽快感にはまってしまって、

立ち寄ったんですよね。

 

そうしたら、ちょうどハロウィンの時期だったので

ハロウィン丼なるものが

これで本当にいいのか・やってしまったんじゃという後ろめたさは少しありましたが

 

なんといっても安いのが、学生の身分としては助かりました。

ワンコイン

f:id:infoseiri:20190130085646j:plain

何でもかんでも安いものに飛びつくのは、、、

経済的に考えてもどうかとは思うんですがね(~_~;)

 

まあ、今は食レポなんで

出てきたハロウィーン丼は

f:id:infoseiri:20190130085856j:plain

こんなかんじで。とにかく豪華( `ー´)ノ

サーモン入ってマグロ入って、極めつけにイクラですからね。

 

近くの公園に移動して、青空と太陽のもといただきました。

 

普段のスーパーだと、値段が高くて(肉類に比べると)敬遠しがちだったので。

久々に食べて、海が近くにあってよかった(*^_^*)

とても幸せな気分になれました。

 

切り身を用意して、

お刺身が異常なほど食べたくなる時が家でもあるんですが、

なんかうまくいかないんですよね。

 

たぶん切り方が下手で、厚さが一定にならない分

触感とか味にばらつきが出ているのではと(;^ω^)

 

まあ、お寿司とかはお店でプロに用意してもらった方が

断然おいしいって聞きますし

あきらめて外に行きましょう(=゚ω゚)ノ

 

 

それではこれぐらいで

ではでは、(@^^)/~~~

お弁当屋さん ♯1

寒さの厳しいこの季節

いつものようにポケットに手を突っ込みながら、歩いていると

前方からベビーカーを押しながら近づいてきていた

お母さんを見て気づきました。

 

歩道脇の植木?というか垣根?が、不用意に出っ張っていたので

躓いてしまったのです。

 

なんでこの部分だけ飛び出ているんだろう?

他のところは歩道の向きと平行にまっすぐ整列しているのに。

 

近くに植えてある気が邪魔になっているのが多分原因だと思うのですが、

 

 

やる必要がないのに、やる理由が存在しないのに

やってしまうこと

逆に、やらなくてもいい・やらない方がいいのに

やってしまうこと

 

 

有名な誰かが、

「人間は無駄なことを追求することで、喜びを得られる唯一の動物だ」

的なことを言っていた気がします。

 

的を得ていると改めて実感しました。

 

 

前置きはこれぐらいで、

どうもこんにちは赤猫です。

今回はお弁当の話。

 

皆さんは外で食べるのと中で食べるのとではどちらがお好きですか?

 

今のこの凍え死んでしまいそうな寒さだと、

流石に中の方が多数派だとは思いますが

 

天気が良い日には外で食べるのもすがすがしくて気持ち良いですよ。

お昼の息抜き・リフレッシュにもなりますし

(食後の軽い運動も兼ねて)

 

 

ということで今回紹介するお店は

 

 

↑にあります

 

キッチンカロリーというお店です。

神保町駅の近くにも同じ名前のお店があるようですが、つながりはよくわかりません<m(__)m>

初めてそっちの方の存在を知りました。)

 

外観はこんな感じ

f:id:infoseiri:20190125102149j:plain

左側に食券売機、中央に店内へ入るドア、右にお弁当用カウンター

 

メニューとしましては、

その店名の通り、

唐揚げからエビフライ、ハンバーグ、生姜焼きなど

カロリーえぐい奴ばかりで元気がでそうなものが並んでいます。

 

 

私は、1回しか店内利用したことがないのですが、

その時は

f:id:infoseiri:20190125102542j:plain

こんな感じの、エビフライ+ハンバーグ+ご飯大盛り+スープ

みたいなランチを食べました(超満腹になりました。)

 

 

今回お勧めするのは、

ワンコイン(500円)の

  • 唐揚げ弁当
  • ハンバーグ弁当
  • 生姜焼き弁当
  • とんかつ弁当

たちです(=゚ω゚)ノ

 

メインディッシュはそれぞれのメニュー名通りで、おまけに

ごはん(ちょっと小さめの入れ物)とキャベツ千切りと揚げ物(唐揚げかコロッケ)

がついてくるんです。(; ・`д・´)

 

そしてそして、締めに待っているのが、

スパゲッティです。

お弁当でよく見る、油物の下に下敷きのように置いてあるやつです。

f:id:infoseiri:20190130152909j:plain

 

特に味は付いたりしていないんですが、

唐揚げやトンカツの油を吸った麺は、

ツルツルなどに入っていきます。

メインディッシュを食べ終わったスイーツがわりです(゚∀゚)

 

 

このように、ワンコインで4種類も違う味を楽しめて

お腹をいっぱいにすることができる

とても素晴らしいお店です。

ぜひ足を運んでみてください。

 

 

ではでは、(・◇・)/~~~

 

ベイズ推定(データ処理編)

どうもこんにちは赤猫です。

皆さんはカレーが好きでしょうか。よく、カレー嫌いな子供はいないって言いますよね。給食の時とかもよく争いになっていた気がします。大人になってもインド人がやっているお店、とくにナンは人気ですよね。なぜこの話をしたかというと、辛いものが好きなんですが、(ほかにもタンタンメンとか)食べると必ずおなかの調子が悪くなるんですよね。この対策をどうにかしたい。なぜお腹が痛くなったり、翌日の排便がつらくなったりするのか。辛みが刺激成分だからですよね、たぶん。それは若手いるんですが、どうしても食べたい、おいしいから。という堂々巡りの状態になっているのですが、いったいどうすればいいのでしょうか。逆に甘いものを食べて中和?辛みに体が食べるぐらい、何回も食べてみる?結論を見つけたいですね。

 

 

 

では今回も続きをやっていきましょう。実際にどうするかが大事ですからね。この前は理論的なことをやりましたが。

 

infoseiri.hatenablog.com

 流れをざっと説明すると

  1. まず元データの確認
  2. データの下処理
  3. 確率を求める

という順番になります。前も言いましたが、やはり2.の下処理が一番手間です。分析をどれだけ早く終わらせるかという点においては、どの方法を使うのか考えつくのも大事ですが。もうこの前処理にほぼかかっているのではと思うぐらい。まあ自分が知っている分析方法が少なすぎるのもあると思います。

 

データの下処理で何をしたかというと

  • 大文字をすべて小文字に
  • 数字を全部削除
  • 記号を全部削除
  • 動詞の変化形(英文だったので)を原型に

という処理です。エクセルでできそうなところもあるような気がするけど…時間があればまた調べようかな。

それではやっていきましょう。メールのデータを使います。

http:// www. dt. fee. unicamp. br/ ̃ tiago/ smsspamcollection/

というところにメールのデータがあり、それを加工したものを使っているようです。

データを読み込み、概観してみる

f:id:infoseiri:20181022113001p:plain

何も考えず、(stringsAsFactorsでファクターとして読み込むのか文字列として読み込むのか指定しなかった)ため、バグってますね。元に戻しましょう。

f:id:infoseiri:20181022113246p:plain

これでちゃんと文字列として読み込まれました。5559通のメールがあり

  • メールの種類(スパムかどうか)
  • メールの本文

から成り立つデータのようです。

ここから下処理をしていきます。文字の分析にはtmというパッケージが用意されているらしく、それを使うためにこのデータをコーパスと呼ばれる専用のデータ形式に直すよう…

f:id:infoseiri:20181022114014p:plain

VCorpusというのは揮発性でPCのメモリに格納されるらしく、PCorpusとすると永続的に格納できるよう。まあ、それはよいとして、コーパスに変形したことで、データの中身もいろいろ変わっていますね。日付や筆者なんか、文字は何語で書かれているのかなどもあります。

それでは、引き続いて大文字を小文字に直そうと思います。

f:id:infoseiri:20181022114550p:plain

あれーできない。文字コードが違うようで。いろいろ調べて(googleで「R tolower エラー」と検索)見ると…

f:id:infoseiri:20181022120102p:plain

iconvというものを使って、マルチバイト文字を読み込める形に変えろと

 

ではでは、

(@^^)/~~~