R Club - Day 05

class: center, middle, inverse, title-slide

# R Club - Day 05
## <a href="https://opueco.github.io/rclub-slides/2019f-05/slides.html" class="uri">https://opueco.github.io/rclub-slides/2019f-05/slides.html</a>
### Kenji Sato
### 2019/6/5

---

## 復習

- 仮説検定の考え方
- 二項検定
- t検定

---

## 今日の範囲

- 奥村§3.5, 3.7, 3.8
  - ただし 3.7, 3.8 は関連問題を紹介しているので各自で読む
- スキップの項
  - §3.6 はさんざんやったのでスキップ
  - 最尤法の話は必要に迫られたらやる

---

**t検定の例**

ある機械で生産された10個の製品の重量を測定したところ  
101.1, 103.2, 102.1, 99.2, 100.5, 101.3, 99.7, 100.5, 98.9, 101.4  
のような結果を得た。母平均は100gと考えてよいか。有意水準5%で検定せよ。 (東大統計教室『統計学入門』p.252))

```r
w <- c(101.1, 103.2, 102.1, 99.2, 100.5, 101.3, 
       99.7, 100.5, 98.9, 101.4)
t.test(w, mu = 100)
```

```
## 
## 	One Sample t-test
## 
## data:  w
## t = 1.8909, df = 9, p-value = 0.0912
## alternative hypothesis: true mean is not equal to 100
## 95 percent confidence interval:
##   99.8449 101.7351
## sample estimates:
## mean of x 
##    100.79
```

---

## 仮説を変えてみる (1/)

帰無仮説 `$\mu = 100$` のもとでは，p値は 0.09。5%水準では有意ではない。
`$\mu = 101$` にするとどうなる？

```r
t.test(w, mu = 101)
```

```
## 
## 	One Sample t-test
## 
## data:  w
## t = -0.50265, df = 9, p-value = 0.6273
## alternative hypothesis: true mean is not equal to 101
## 95 percent confidence interval:
##   99.8449 101.7351
## sample estimates:
## mean of x 
##    100.79
```

---

## 仮説を変えてみる (2/)

`$\mu = 102$` にすると？

```r
t.test(w, mu = 102)
```

```
## 
## 	One Sample t-test
## 
## data:  w
## t = -2.8962, df = 9, p-value = 0.0177
## alternative hypothesis: true mean is not equal to 102
## 95 percent confidence interval:
##   99.8449 101.7351
## sample estimates:
## mean of x 
##    100.79
```

p値は `$0.02$`。データは `$\mu = 102$` をサポートしないようだ。

---

## 信頼区間 confidence interval

この数字が変化していないことにお気づきだろうか？

```
## 95 percent confidence interval:
##   99.8449 101.7351
```

95% 信頼区間（confidence interval）というのは，5%水準で帰無仮説が棄却されないような帰無仮説の範囲である。したがって，

.box2[
信頼区間の中におさまるように仮説を選べば p値は有意水準を下回らない。逆に，信頼区間の外側に仮説を選べば p値は有意水準を上回る。
]

---

## 信頼区間に関する注意

「真の母平均が 95% の確率で信頼区間の中に入る」ということでは**ない**。

通常，95%信頼区間の意味は次のように説明される。

1. 信頼区間は確率変数であり，データを観測するたびに信頼区間が変わる。
2. データを100回観測して 100通りの信頼区間を作ったら，95通りは真の未知母数を含む。

動くのが信頼区間で，母数は動かないというのをイメージできればOK。図を使って見てみよう。

---

**真の母数（未知）** `$\mu$` を持つ未知の分布にしたがって生成されたデータを持っている。その **標本平均（固定値）** は `$\bar{x}$`

---

データから `$\mu$` について何がわかるか？

---

仮説検定の考え方を使う。色付き部分は 5%。 `$\mu = \mu_0$` は棄却

---

`$\mu_0$` を増やしてみる。これも棄却。

---

さらに `$\mu_0$` を増やしてみる。これはぎりぎり棄却されない。

---

さらに `$\mu_0$` を増やしてみる。棄却されない。

---