38
情報リテラシ第二 http://www.e.gsic.titech.ac.jp/~ykuno/index.html 第三回(前半) Excel その3 ★ 課題の告知

情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

情報リテラシ第二

http://www.e.gsic.titech.ac.jp/~ykuno/index.html

第三回(前半)

Excel その3

★ 課題の告知

Page 2: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

まずは散布図

Page 3: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

入手したデータの分析・考察

• Excelにはデータを統計処理する機能が備わっている。分析ツールも利用できる。

• もっとも手軽な分析・考察の方法を紹介する。

• ある2つのデータセットが互いに何かの関係(因果関係でなくとも相関する関係)にあるのか/ないのか? どの位の強さの関係があるのか?

Page 4: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

アドイン分析ツールの使い方

• シート上のデータを統計手法で分析

<使い方>• ファイルメニューの[Excel のオプション] → [アドイン] をクリック→ [分析ツール] チェックし設定ボタンを押す→ 有効なアドインのリストのうち、分析ツールをチェックする」

• データメニューに分析ツールという項目が載るようになる

• 一番簡単に使える基本統計情報やヒストグラムを使ってみよう

• 近似曲線を求めるための回帰分析も行える

3kaidata.xlsx

Page 5: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

データ分析の作業統計データから『関係』を見つける

● 統計データを整理や加工計算して見方を変えたり、グラフにして視覚化してみることで発見することが多い。

● 加えて、

統計データどうしを突き合わせることで、意外な発見をする可能性がある!(関係がないことを確かめることも含む)

Page 6: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

異なるデータを突き合わせる、とは

• 軸になる「(同じ)何か」について測定した別々の値を、散布図にプロットする。

• 別々の2つの値の間に、正の相関や負の相関の傾向があるか、相関関係はないか、大まかな傾向が分かる。

• 正の相関や負の相関があったとしても、その2つの値の間に直接の因果関係があるかは分からない。

Page 7: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

y = 7E-05x + 0.4257R² = 0.2217

0

5

10

15

20

25

30

35

0 50000 100000 150000 200000 250000 300000 350000

平均気温

ビール出荷量

h25月別ビール出荷量と平均気温の関係月 出荷(KL) 平均気温

1月 128652 5.5

2月 167260 6.2

3月 202210 12.1

4月 228034 15.2

5月 223515 19.8

6月 262653 22.9

7月 301986 27.3

8月 261556 29.2

9月 197299 25.2

10月 225513 19.8

11月 231757 13.5

12月 316592 8.3

月別のビール出荷量と平均気温

Page 8: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

県別の学童男女の身長

y = 0.7407x + 27.726R² = 0.4645

108.5

109.0

109.5

110.0

110.5

111.0

111.5

109.5 110.0 110.5 111.0 111.5 112.0 112.5

h20女身長

h20男身長

h20女身長とh20男身長 子供の身長が高い県は、男女ともに高い傾向が見られる。子供が育つ県による違いで、子供の身長に影響する事柄が何か存在する可能性はあるかもしれない。

Page 9: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

• 国別: 一人当たりの年間収入と平均寿命

• 個人ごと: 入学試験の成績と入学後の成績

• 国別や県別: 男性の平均身長と女性の平均身長

• 県別: 婚姻率と離婚率

• 県別: 醤油消費とソース消費

• 年ごと: 4~9月の平均気温とその年収穫のワインの価格

Page 10: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

総務省統計局e-statのデータベースを使ってみよう。データベースのデータ全体が大き過ぎる場合、必要な項目のデータをだけを適切な形で抜き出して使う。

Page 11: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

e-stat

• 総務省統計局 http://www.stat.go.jp/

• e-stat

• 分野 、 企業・家計・経済 、 家計調査

• データ種別は、データベースの家計調査

---

例題とするデータは、家計調査のデータベースに入っている

クリック

Page 12: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

目的の調査

• 家計収支編 二人以上の世帯 にのみ、

月次報告があるので、それを選んでみる。月別が一番詳細な生データそうだから。

クリック

Page 13: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

目的を明瞭にし、データベースを選ぶ

• (用途分類ではなく、具体的な)品目分類を見てみよう。

• また、支出金額を調べたい、

•品目分類(2020改定)(総数:金額)のDBボタン

(データベースを見ると、調べたいデータは、2000年(h12)から以降しかデータがないことが分かる)

Page 14: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

クリック

Page 15: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

項目の絞り込みや表示位置のページ上部(欄外)への変更を行ってください。

(1)こちらの画面で項目を絞ってから、

(2)こちらの画面でレイアウトを決めて、取り出したデータを表示させる

Page 16: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

表示項目選択

(1) 「選択/全項目」の値に注目。

(2) 選択項目を絞り込む事項は、「項目を選択」ボタンを押す。

Page 17: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

品目分類の項目選択画面

(1) 全項目の一覧が出たら、選択する項目だけチェックボックスを選んだ状態にする。

(2) 全項目数が多すぎる時は、一度「全解除」ボタンを押してから、必要な項目だけ選ぶ。

(3) 選び終わったら確定ボタン。ら

Page 18: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

項目を絞って、目的のデータを抜き出す

表示項目選択

• 品目分類が703あるのを、2つ(例:やきとりとビールなど)

★ 各自好きな項目のデータ選択で良い

• 世帯区分は、どれかひとつ(例:二人以上の世帯)

• 地域区分は53あるが、全国だけ

• 時間軸(月次)は、とりあえず全部

Page 19: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

表示項目選択

(1) 右の画面に戻ったら、「選択/全項

目」の選択の値が絞られたのを確認。

(2) 確定ボタンを押す。

(1) 次は、レイアウト設定画面を設定。

Page 20: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

レイアウト設定画面

表示項目を表示する配置を決める。マウスでドラグして配置、指定。

(1) 列表示が「品目分類」

(2) 行表示が「時間軸」

Page 21: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

レイアウト設定で別の見方を

• レイアウト設定

行データを注目の視点(時間軸や地域区分など)に取り換える

• 行を月次、列を品目にすると、月単位時系列データ

• (全国でなく都市を選んでおき)行を地域区分、列を品目にすると、都市別データ、時間軸は絞った方がいいかもしれない

Page 22: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

レイアウト設定画面の表示オプションを選ぶ

注釈は表示しない

桁区切り(,)を使用しない

データがない行は表示しない

データがない列は表示しない

レイアウト設定が終わったら、「設定して表示を更新」ボタンを押す。

Page 23: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

DBからのデータ抜き出し完了、次はダウンロード

vv

Page 24: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

● Excelを持っていればxlsx形式。(場合によっては、CSVで)

●ヘッダ、コードの出力指定を確認してから、ダウンロードボタンを押す。

Page 25: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

v vv

クリック

Page 26: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

ダウンロードされてきたファイルは、分かりやすいファイル名に付け替えよう。

ファイル名を付けることについて:ファイルを作る時はファイル名を付けますが、これからは、ファイル名を全角文字(ひらかなや漢字)で付けない方が良い場合があります。コマンド行でファイルを指定して使う時のためには、半角英数字の名前が便利です。インターネット上に公開したりするファイルは半角英数字の名前の方が無難です。今回は、「yakitori.xlsx」でなく「やきとり.xlsx」でも良いかもしれません。全角文字でファイル名を付けて差し支えない場合と、半角英数字にするべき場合を意識してファイル名を決めましょう。

Page 27: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

分析作業準備

• ダウンロードされたファイルの表は、行数の多い大きな表なので、見出しの行に「表示メニューのウィンドウ枠を固定」が指定されている。

• 緑の三角のついたセルは、セルの中身のデータがエラー状態(数値なのに文字扱いのエラー)。エラーを解除するには、緑の三角のついたセルを全部選び、その時に表示される黄色いびっくりマークをクリックして「数値に変換する」

Page 28: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

分析作業から

• 選んだ2つの項目の消費金額の相関関係を調べる。

• 2000-2020のすべての月のデータを使うと、ビールのお供はやきとりでなく、断然ぎょうざ。

• やきとり代とビール代では、2000-2020のすべての月のデータを使うとR2値0.1弱でごく弱い正の相関? でも、2000-2014では、R2値0.37の正の相関があった。

• 2015年以降、「家飲みシーンにおける、やきとりとビールの関係に、一体何があったのか?」のテーマは追求に値する。

Page 29: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

(1) 皆さんもそれぞれに、興味深い統計データを探しましょう。(2) 興味深いデータを見つけるためには、自分の頭の中で大ま

かなテーマを決めて、データを探してみることです。また、データはグラフに描いてみるなど分析しないと興味深いかどうか分からないので、いろいろ手元で作業してみることです。データを突き合わせて興味深い現象を見つけるというのも候補です。

(3) 興味深いテーマや、そのテーマに関わる興味深い統計デー

タ探しを、早めに行いましょう。それらを見つけないと、この授業の今後の課題はできません。

Page 30: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備
Page 31: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

レポート課題の狙い

• 自分でテーマを決め、調べて、レポートにまとめあげる。

• 調べる時は、自分がレポートで主張する事柄の、できる限り一番元になった情報(生のデータを自分の手で分析することも含む)を自ら確認し、主張の根拠とすること。他人が分析してまとめたものや、他人の意見や考察を引き写ししない。

• レポートを、きちんとした学術的な文書として仕上げる。

Page 32: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

テーマの選び方や文書作成について

• 自分が調べたいと思っているテーマで良いです。ただし、そのテーマに関係する統計データを分析する作業を通じて考察を深める、というプロセスを必ず含んで下さい。

• レポートを書くのに使用する文書作成ツールは、WordでもOverleafなどのTeXツール、どちらでも良いです。

Page 33: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

どうしてもテーマ選びに困る人

• IPAの動画やしおりを参考に、https://www.youtube.com/playlist?list=PLF9FCB56776EBCABB

https://www.ipa.go.jp/security/antivirus/shiori.html

• 情報セキュリティに関わるテーマをひとつ選び、

• 被害の実態などのデータ(統計データや新聞データベースなど)を具体的に調べて紹介し、

• 最後は、その対策までをまとめる。

ということで、一応レポートの内容や体裁は整うでしょう。

Page 34: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備
Page 35: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

発表のために• レポートをきちんと書き上げなくても、テーマ調べの内容ができてきたら、特に今回のレポートで一番売りにできる成果が見定まってきたら、発表の準備に入ることができます。

• レポートの概要・あらすじは、先に発表できます。発表会で発表する予定がある場合は予告ができます。

Page 36: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

この授業の課題(予定)• 今回は、レポートの概要、最も主張できる事柄を、1枚のポスターに分かりやすくまとめる課題を出す予定です。(ポスターセッション用のポスターに作成)

• また、実際に発表を行う時に使用する、(PowerPointなどの)プレゼンソフトでスライドを作る課題を出す予定です。

• 課題が多すぎる場合は、様子を見て加減しますが、しっかりしたレポートが書けていれば、ポスター作成やスライド作成はそれほど時間を掛けなくて良いと思います。まずは、レポートの内容をしっかり作り、きちんとレポートを書くことを目指しましょう。

Page 37: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備
Page 38: 情報リテラシ第二ykuno/2qExcel3.pdfExcel その3 課題の告知 まずは散布図 入手したデータの分析・考察 • Excelにはデータを統計処理する機能が備

課題の出題や実施のスケジュール目安

• 7/8本日 課題の告知、テーマや統計データ探し開始のお願い、TeXの基本

• 7/15 文書作成

• 7/22 文書作成

• 7/29 PowerPoint

• 8/5