お肉の検査員の統計解析日記

非エンジニアのお肉の検査員が日々の業務で発見した統計解析(主にRを使った)について情報発信します

お肉の検査員でもできる!住所データの可視化方法

どうもお肉の検査員です(6回目)。

今回は、備忘録を兼ねて住所データを簡単に緯度経度情報に変換する方法と、緯度経度データを地図上に可視化する方法について書いていきたいと思います。

 可視化するのは、滋賀県が発祥の地(本店は滋賀県野洲市にあります)である来来亭の店舗の位置にしたいと思います。というのも、先日まで来来亭のラーメンパスで、1か月間ラーメン無料で美味しく食べることが出来たため、その恩返し(?)も兼ねて、どこに店舗があるのかを示したいと思います。来来亭の無料パスについての詳細は、来来亭のホームページをご覧ください。
www.rairaitei.co.jp

続きを読む

お肉の検査員でもできる!!積み上げ棒グラフを使った時系列データの可視化方法

 どうもお肉の検査員です(5回目)。

 今回は、備忘録を兼ねてggplot2で、時系列データを積み上げ棒グラフを使って可視化をする方法を紹介したいと思います。

 最終的に、このような図を書くためのコードを以下で紹介します。

f:id:purerazz:20200222232213p:plain
R020220時点の国内居住者のコロナウイルス届出数

 今回の題材は、新型コロナウイルスの国内居住者の患者数と確定日の情報を積み上げ棒グラフを使って描画する方法です。

  • 可視化に必要なパッケージ
  • データの入手と表示
  • データの整形
  • 可視化する
続きを読む

お肉の検査員でもできるRを使った小地域や中学校区単位のコロプレスマップの書き方

こんにちは。
お肉の検査員です(4回目)。

今回は、コロプレスマップをRで書く方法について紹介させていただきます。
これは、2年前に実行したものを備忘録を兼ねてコードをアップするだけの記事になります(汗)。

 さて、私は普段都道府県ごとの比較をするために、コロプレスマップを書いています。コロプレスマップとは、区画別段彩図ともいいまして、統計地図の1つで,統計区ごとにそこの統計量を段階区分で色区分した指定色を塗った地図のことです。詳しくはコトバンクのサイトをご覧ください。
kotobank.jp

 都道府県レベルや市町レベルではMANDARAを使うと、私のような非エンジニアの人でもとても簡単に無料でコロプレスマップを書くことができます。

しかし、中学校単位や小地域(〇〇市〇〇町〇丁目のような)のコロプレスマップを書くのは簡単にはできませんでした。ただ書く方法として埼玉県の方が記載してくれています。
www.pref.saitama.lg.jp

が、なかなか理解できませんでした。。。私の理解力に問題がありますね。。。

 そこで、Rを使い小地域や中学校区単位のコロプレスマップを書く方法について紹介したいと思います。なぜ中学校区単位のコロプレスマップを書く必要があるか?と言いますと、私が普段関わっている健康づくりの仕事では市町の単位のみならず、市町の中の中学校区単位で高齢化率や喫煙率や運動実施率など生活習慣や脳卒中や心疾患のような罹患率を可視化することがあるためです。

 では早速その方法について書いていきますね。

続きを読む

お肉の検査員でも分かるTwitter分析

 どうも、お肉の検査員です(3回目)。
 さて、今回はツイッター解析をRで手軽に実装する方法について書いていきたいと思います。
 本当はggplot2の図に数字を入れる方法について書こうと思っていましたが、先週出張にいったとき沖縄県の観光に携わっている人に出会いまして、その時沖縄の観光名所について話を聞きました。すごく魅力的な場所が多くあるので観光地として人気があるのがうなずけました。いつか行ってみたい。
その方は、沖縄県のイメージ調査として観光客の人たちにアンケートを取っているみたいですが、なかなかの金額になるみたいですので、実際問題として、おいそれとイメージ調査することは出来なそうな気がします。そこで、気軽に無料でイメージ調査(?)できるTwitterの情報を使って沖縄県のイメージをつかんでみたいと思いました。また同時に僕が住んでいる滋賀県とブログのタイトルの由来になっている牛についても、世間の人たちがどのようなイメージを持っているのかを解析?したので、その解析コードについて忘れる前に書いてみたいと思います。

 なお、やってみた系の記事になっていますので、詳しくテキストマイニングを知りたい方は、後述する書籍を必ずご覧ください。また、Twitterの情報をとったのは、全て2月8日の18:30頃のものです。

続きを読む

オフライン環境におけるRパッケージのインストール方法について

 さて、初回のブログ内容は、『業務用パソコンがネットにつながらないためRのインストールやパッケージのダウンロードができない』問題に対しての一つの解決策について取り上げたいと思います。ちょっとしたデータ(1000行くらい?)ならエクセルの関数を使って集計や図示することができますが、それよりも大きなデータになるとエクセルでは時間がかかったり関数を複数入れこんだりして煩雑になります。その際Rを使うと簡潔なコードを書くだけで高速に結果が出てきます。特にtidyverseパッケージは神レベルの使いやすさですので、使用されたことがない方は是非一度使ってみてください。

 近年、EBPM(エビデンス・ベースト・ポリシー・メイキング。証拠に基づく政策立案)に注目が集まっているので、データ解析ソフトであるRに注目が集まると思います。無料ですし。

続きを読む

お肉の検査員の自己紹介

 自己紹介

 

 はじめまして。お肉の検査員と言います。普段は関西某県(昨年のM-1優勝者のネタにもなっています)で、研究職公務員としてRを使ったデータ解析を行っています。R歴は5年程度になります。職場でRを使うのは私一人のため、エラーがでたり、コードの書き方が分からない等困った状況になった場合は、ネットで情報検索して解決しています。特に、hikaru1122さんLogics of Blueさん、MrUnadonさん、中澤港先生などすごい方々のブログに助けられていることが多いです。本当にありがとうございます。

 

 さて簡単な自己紹介をしたいと思います。

 

  • 出身学科:獣医学科で学部生時代は外科学を、院生時代は獣医公衆衛生学を専攻していました。大学では全くプログラミングなどをしてこなかったので全て独学です。
  • 大学時代の研究テーマ:アキレス腱の治癒に関連する要因探索(学部)、次世代シーケンサーを用いた牛舎の空気中の細菌叢解析(院)
  • 職場の研究テーマ:人の特定健康診査やレセプト情報、介護情報といったビッグデータを解析し健康寿命延伸のための施策を考える。
  • 所属する勉強会:Kobe-R(近年開催はありませんが…)で運営協力をさせてもらっています。
  • ブログの名前の由来:前の職場が牛肉や豚肉の検査をするところで、そこで肉の検査(細菌検査や病理学検査など)をしていたことに由来します。

https://1.bp.blogspot.com/-POWdo2TC8K4/XZR9ZhucxgI/AAAAAAABVSQ/5G324lg6Znckqqun8Pesh8eCT7cqq837ACNcBGAsYHQ/s1600/food_niku_pack_komagire.png

 引用元:かわいいフリー素材集 いらすとや

 

 ちなみに、個人的にお肉の検査と言っていますが、正式にはと畜検査と言います。と畜検査とは、以下の東京都のサイトがすごく分かりやすいです。

 

www.fukushihoken.metro.tokyo.jp

 

 今は仕事で人の健康に関連するデータ解析をしていますが、元々は上記自己紹介であげたようにデータ解析と全く無縁でした。 

 こんな私がなぜブログを始めようと思ったかと言いますと、私自身が5年間Rを使うことである程度慣れてきたこと、また、今まで色々な方々のブログに助けられてきたので、私も情報発信することで今からRを使って解析をしたいと思っている非エンジニアの方のお役に少しでも立てることが出来れば、との気持ちで30歳後半になり初めてブログで情報発信しようと思いました。なにせ初めてなもので間違いや勘違いなど多くあると思いますが、ご指摘をいただけると大変ありがたいです。

  

 基本的には、私と同じ非エンジニアの方向けに主にRについて記事を書いていきたいと考えています。内容は、日々の業務で役立った内容(ggplot2の使い方やdplyrを使った集計方法など)についてコードとともに簡単な解説を加えていきたいと考えています。また、私自身が忘れっぽいので本人の備忘録も兼ねようと思っています。

 

 一部、CNNなどはPythonも使いますので、追々関連記事も書いていきたいと考えています。

 

 どうぞ宜しくお願い致します。