データバンク

―― 分析の基礎力を養う演習用データ集 ――
発展 統計検定、ベイズ統計も予定

最終更新日 2021/10/12
  更新履歴 あなたは 番目の訪問者です。

 総合案内サイトへどうぞ(関連サイト多数!)

このサイトの有用な役立て方

 このサイトはエクセルによる計算を前提としています。ただし、「統計は計算だ」と思わないで下さい。統計計算が数学と異なるのは、計算の内容、結果の意味するところであって、結果の表現の仕方と解説などの練習も大切だという点にあります。 なお、エクセルの「ヘルプ」やマニュアルは助けになることもありますが、解説は不正確・不十分であることがあります。ぜひ教科書・参考書用語集などを参照して正しい基礎知識を学んで下さい。
 注意)このサイトのエクセル・データにアクセスしてすぐ計算をしようとする人がいますが、データをいったんダウンロードしてからでないと、エクセルの計算はできません。まず、保存してください。

 ご質問、ご感想などをお寄せください


制作者松原望は聖学院大学大学院は退職しましたが、なお客員教授としてあるいは東京大学名誉教授として、研鑽を積み社会に微力ながら貢献してゆくつもりです[2014.3]

制作者松原望は上智大学を定年退職し、聖学院大学大学院政治政策学研究科教授に就任いたしました。今後も一般の方のいっそうの有効利用をめざして充実を図っていくつもりですので、従来にもまして皆様のご活用を歓迎致します。今後もよろしく。[2008/4]

制作者松原望は、東京大学を定年退官し、上智大学教授《東京大学名誉教授)となりましたが、本サイトはすでに事実上全国的利用となっていました。今後、上智大学の授業を念頭において作成を続けますが、一般の方の利用は従来通り歓迎致します。今後もよろしく。[2004/4]

責任編集 :松原 望(Nozomu Matsubara, Ph.D.)

東京大学大学院新領域創成科学研究科教授・
総合文化研究科及経済学研究科教授(兼)、
放送大学客員教授
専攻:相関社会科学、統計学
メールアドレス


「ヨーロッパ最高地点」も正しく数で(ユングフラウ・ヨッホ)(2007.1.11up)

What's New?

目次

1 基礎練習用データ

 『わかりやすい統計学:改訂版』(2009年1月発刊)のサポート・サイトできました。 New !

 『入門統計解析』(医学・自然科学)例題、練習問題の課題はここにあります。

 『統計学入門』(東京大学出版会)例題、練習問題の課題はここにあります。

簡便な解説は、『統計学100のキーワード』(弘文堂)あるいは、各レベルの学び方のサイト参照。

 

  名前 目的
1-0a エクセルの基本計算 和(行、列)、命令複写、絶対参照、並替え、順位、累積和、グラフ(折れ線、散布図)、分析ツール
 数学の基本に不安 New !
1-0b 県別経済成長率(1985-1993) 時系列データは折れ線グラフ、横断面(クロス・セクション)データはヒストグラム、散布図(相関図)などいろいろ。
1-0c 時系列の初歩 デパート、チェーンストア売上高、自動車生産台 数推移から何を読む?
解説:「わかりやすい統計学」
1-0d 相関関係 樹高・樹幅、身体計測(ゴルトン)、兄弟姉 妹の身長、年齢と血圧、持家率と自民得票率[新規]
1-0e 平均、平均偏差、分散、標準偏差 電卓でも簡単に計算でき、理解はOK
1-1a ますデータ 平均、分散、標準偏差、分布の形【旧1-1】
†1-1b 血糖値データ 平均、分散、標準偏差、最大・最小、度数分布、ヒストグラム
1-1c 経済の計量の基礎統計的方法 New ! ローレンツ曲線、ジニ係数、パレート分布、時系列・横断面統合 etc.(制作進行中)
1-2a 私鉄データ 散布図、相関係数
1-2b 体力運動能力データ 相関係数行列の作成、標準得点、偏差値、レーダー・チャート
†1-2c 収縮期および拡張期血圧データ 平均、分散、標準偏差、共分散、相関係数
1-2d 目で見る相関関係 相関係数 r=0.9, 0.7, 0.5, 0.3 の 4 ケース
1-3a 広告費の効果 通常の線形回帰【旧1-3】
1-3b 回帰分析演習 解説目的の数値例
1-4 売り上げ予測 片対数変換をしてから、線形回帰
1-5 需要の所得弾力性 両対数変換をしてから、線形回帰
1-6 地域別売り上げ(グループ化データ) 層別された相関関係(規模別、全体)、人口
1-7a 場所別温度 回帰直線(方程式)、予測・推定【旧1-7】
1-7b 米ソ軍事支出の回帰分析 時系列データ(2 系列)の表示、回帰分析、散布図
1-8a 年齢&血圧・肺活量 重回帰、重相関係数、予測・推定【旧1-8】
†1-8b 催眠剤の効果/年齢・血液関連データ 散布図、相関係数、偏相関係数、重回帰、決定係数
1-9a CO2 データ(温暖化) 時系列データ表示、月次の周期変動、超長期の傾向線(トレンド)の検出【旧1-9】
1-9b 気象データ New ! 都市別平均気温(月毎) 、明治以来年別平均気温etc
1-10a 度数のクロス表の分析(計算機能付き) 独立性(無関連性)をカイ 2 乗分布で検定。エクセルには関数ないが本サイトに掲載のプログラムでOK。【旧1-10】
†1-10b 医学分野でのクロス表 血液型とがん
1-10c 人文・社会分野でのクロス表 マンション評価/刑事裁判と人種
1-11 アンケート入力例 ケース×変数で入力、分析スタート。アンケートは 正式には「質問票(紙)」
1-12 スタートアップ調査データ 松原・松本共著 『Excelではじめる社会調査データ分析』(丸善)の教材。

†:医学・看護学・保健学のための共通基礎サイト

注意) Excel データを開いたりダウンロードしたりする際にユーザー名とパスワードの入力を求められた場合は、<キャンセル>をクリックすればそのまま表示・ダウンロードできます。

2 応用統計分析データ

 『わかりやすい統計学:改訂版』(2009年1月発刊)のサポート・サイトできました。 New !

 『入門統計解析』(医学・自然科学)例題、練習問題の課題はここにあります。

 『統計学入門』(東京大学出版会)例題、練習問題の課題はここにあります。

  名前 目的
2-0 演算用数値例 エクセルによる基本行列計算の操作
 数学の基本に不安 New !
2-1 食品衛生データ データ図示、標準得点(偏差値)、3 シグマ基準での管理、順序統計量、ヒストグラム
2-2a 株式データ 平均、分散(リスク)、ポートフォリオ計算【旧1-7】
2-2b 温泉データ New ! 各都道府県別の温泉関連データ。記述統計、相関、回帰を含む総合演習
2-3a アイリス分類データ 平均、分散、相関係数(種別、全)
2-3b 大気汚染データ 判別分析(多変量解析)によるデータ判定
2-3c 水質データ 主成分分析でデータ集約(データの背後をつかむ)、主成分の解釈の仕方も
2-3d 因子分析実例《セールスマンデータ)
因子分析(q 個の因子を仮定しそれの影響の具合を算出、発見・確認)、因子の解釈の仕方。因子得点も入れ、個人評価も(新)
2-3e マーケティング・データ(顧客の分析) 共分散構造分析(構造方程式モデル)
2-3f SPSS:アルトマンの倒産予測分析(制作中) 多変量解析(判別分析)による倒産予測の始まり。
ただいま制作中。
2-4 銅消費と経済成長 経済データ(時系列)と弾力性
2-5a 心臓病件数(時系列) [旧2-5] データのグラフ表示、季節性
2-5b 上級時系列分析 時系列分析の基礎的方法概説。データ例豊富。
2-6a 対照群との比較 2 サンプル比較の 2 例 ―― スチューデントの t 検定
2-6b 実験の計画とデータ 処理条件を「分散分析」で比較する。最終結果つき。3元配置も可能。
†2-6c 同、演習問題 生物統計方面の分散分析(シェッフェ)
†2-6d  同、 共変量のある因子比較 共分散分析(スネデカー、シェッフェ)
2-7a ノンパラメトリック法 順位の相関と重なり、ランダム性、変化方向
(練習用に円周率(π)を登載)【旧2-7】
2-7b  同、総合練習 <制作中>
2-8 量・反応関係 量から 0-1 反応を予測。ロジット、プロビット分析
2-9a 回帰式による予測1 資本金から従業員数を予測する。 「t 値」の有意性の見方の実際 。単回帰の場合。
2-9b 回帰式による予測2 英国の輸入データのマクロ分析(輸入関数同定)。ジョンストンの教科書にある重回帰の実際。読み方を解説。
2-9c 回帰式による予測3 回帰診断(回帰分析の結果解釈を詳しくおこなう)
2-9d 回帰式による予測4(多重共線) 多重共線を数値例と「セメント・データ」「ロングレーの実例」(未)で学ぶ
2-9e 回帰式による予測5 系列相関の検出とダービン・ワトソン比
2-9f 回帰式による予測6(制作中) 誤差の分散が均一でないケース
2-9g 回帰式による予測7(制作中) エコノメトリックスの方法をクラインのテキスト上のデータで実習
2-9h 回帰式による予測8(制作中) モデル推定法のいくつか(GLS, 2SLS, SUR)
2-9i 回帰式による予測(制作中) 直交多項式によ る計算効率化 <制作中>
2-10a ベイズ統計学入門(制作中) 本格解説
2-12 コンピュータ統計学(制作中) ブートストラップ法、交差検証法 etc.
2-13 ランダム・サンプリング(制作中) 社会調査のためのサンプル抽出
†2-15c 多重比較 医学、薬学などの実例
2-16 正規性のテスト サンプルは正規分布からとられたと認められるか?
†2-17 生存時間の分析 <制作中>
 2-18  建物利用面積割合による地域分類  クラスター分析入門

3. 経済・社会・政治 データアーカイブ

4. 数学・統計用語集
   松原望編『統計学100のキーワード』(弘文堂)

5. 有用な統計分析関連のウェブサイト・リスト(統計数理研究所清水信夫氏作成)

6. リンク集 (制作中)

7. 分析力・総合力をつける応用分野別分析演習データ・アーカイブ(2004.5 スタート)

  分野 名前 内容 出典・作成者など備考
7-1a 国際政治 COW 国力データ 国別人口・生産力・軍備量etc. 時系列 Correlates of War(英)
7-1b 国際政治 国際システム・データ 国際システムとしての諸国家の指標値、2000年値増補 1988年値訂正(2006.3.20)
7-2a 国際経済 国際金融統計(IFS)抜粋 国際通貨基金(IMF)  
7-2b 国際経済 世界開発報告 世界銀行(The World Bank)による開発指標データ  
7-3a 日本経済 為替・株式・債券時系列データ(週足) 毎週更新。2007.5月グラフ化開始(およそ4半期毎に更新)  
7-3b 日本経済 日銀金融経済指標 随時更新  
7-3c 日本経済 国民経済計算(SNA)紹介 国民経済計算年報(平17)より 総務庁
7-3d 日本経済 景気動向指数 先行系列、一致系列、遅行系列の3系列 内閣府
7-4a 地方財政 各都道府県財政力データ 自治体データシリーズ 市町村合併中につき当面休止中
7-5a 日本社会 犯罪統計の概要(制作中) 自治体統計シリーズ(時系列を含む) 警察庁刑事局
7-5b 日本社会 交通統計の概要(制作中) 自治体統計シリーズ(時系列を含む) 警察庁交通局
7-5c 日本社会 各都道府県別人口 (1)    同CSV 年齢3区分別(2001年) 総務省『人口推計年報』
7-5d 日本社会 人口再生産率関係統計  同CSV 合計(年齢別)特殊出生率 TFR など 厚労省人口問題研
7-5e   県の民力(埼玉県の場合) New ! 多目的型地域データベース 朝日新聞社

姉妹サイト

 総合案内サイト

 計量社会科学ワークショップ
 基礎統計ワークショップ
  放送大学『統計の考え方』 => 地方公務員研修用に発展解消 New !
 より進んだ統計分析


作成者情報
Copyright © 2000- データバンク. All rights reserved.
最終更新日 : 2011/12/25 .