Issuu on Google+

^

^11^1^113

線性迴歸分析 13.1迴歸分析初論 13.2兩變項間之相關係數 13.3簡單線性迴歸 13.4炙,《與^之抽樣分配 13.5相關參數之區間估計及假設檢定 13.6資料型態不同之表達及模式改變 13.7殘差分析 13.8複迴歸分析 13.9虛擬變數 精選練習


線性迴歸分析

1 3 . 1 迴 歸 分 析 初 論

一.

問題 某公司業務部經理想要了解該公司影響銷售業績(力之主要因素並希望能

建立一預測模式。案子交由市調部門做市場調査,發現有許多似乎都是很主 要之變項因素(例如:廣告費、交際費、銷售員佣金…等)。如果該業務經理 只想找出一個或數個重要的相關之變項因素^,^,…,^),如何尋找出?並 如何建立預測模式? 變項7稱爲依變項((^卵!!&!^ ^ ^ ! ^ ) , X: , ^ ,…,X。這些變項稱爲自 2

變項。

二. 何謂「迴歸」(「㊀^㊀^^巾? 早 在 1 8 8 5 ,髙登(?. 。^!仂!!)在"!16^6881011 1161:6(11*8117

8^*1!^"

^0^317(18

1116(11001*11^ 111

̶文中發表他有關根據父母身體特性預測子女身體特性

的研究結果。他發現「身高偏髙的父母,其子女平均身高要低於他們的父母 之平均身高;相反的,身高矮的父母,其子女平均身髙卻要髙於他們的父母 之平均身高」。他在此預測工作之論文中利用"^&6881011"這一字來表示此效 應

【11

,亦即兩極端分數會「迴歸」到平均數之現象,因此,用一個變項去預

測另一變項的方法稱之爲迴歸分析。迴歸一詞本有其特殊意義,現已經將其 一般化,用以敘述兩個或兩個以上變項間之關係,故知迴歸分析是以一個或 多個自變項(^&^!!&^

^^!&^)描述、預測或控制一特定依變項

叫這個字的中文意思是「回歸、復歸」,還有「退化」的意思。統计上則普遍譯為回 歸。 13-3


—非讚不可研究所^^"罾#罾

0^^1^6111;

^^^^)的分析,用途非常廣泛,尤是對於不能以實驗方法取

得之社會現象的研究與分析,極爲重要。

三. 簡單迴歸、複迴歸及多變量迴歸 1.用一個自變項預測一個依變項,建立之迴歸關係,稱之爲簡單迴歸(^!!^^ 2,用多個自變預測一個依變項,建立之迴歸關係稱之爲複迴歸(!!!!!化^^ 3^用多個自變項預測數個依變項,建立之迴歸關係稱之爲多變量迴歸

四. 建立迴歸關係之觀點 首先以簡迴歸爲例:若有一組觀察成對資料^^6(1

如下:

假設數學模式是

這樣的通常只是我們的猜想,因此會有誤差,於是就必須要更進一步發 展統計模式。意思是說,我們會去試不同的【00 ,其中最簡單的是一次的關 係式,1.6., ^ 0 ^ 3 十 1 ^ 的 形 式 。

至於我們如何去設立並發展統計模式,我們會設 7; ^ ^(^;) ^ 8

4 1

1 二1,2,。、11

這裡面的6 ,是我們認定的「誤差」,這是因爲我們也知道,不可能所有的II 個點,都滿足^:&^這樣的好關係,因此我們也不需要使得所有II對的點

I

13-4 |

酷 ^ ^


@0@@線性迴歸分析 都滿足^-^^

,我們只要找到一函數使得《幻和,的値接近即可;而點力

與饤、)之距離,將其視爲誤差(枕!:加,記作。 目標:找出一函數【00使所有的其誤差^都要小

【21

13.2兩變項間之相關係數 我們可將(^,^)這些點,將它們定在〈X,力座標圖上。這叫做「散布圖 (^^^ ^ \

。利用散布圖,我們可對一組點作相關的分類。

一. 完 全 正 相 關 ( ^ ^ ( ^ |3051!176 00^613*1011 ^ 例如(^,力各點是這樣的: X

1

2

3

4

5

7

1

2

3

4

5

所是所有的點都落在同一直線的情形,且這是具有正斜率之直線。

二. 正 相 關 ^ ㊀ 辻 ^ 。。「「^^。!!) 如果(^,力是下面的樣子:

121

X

1

1

2

2

3

3

4

5

V

1

2

1

3

2

4

3

5

只要函數《可以選取複雜的型式,我們一定找得出這樣一個《恰妊使得6 ^ 0

VI ,

但這並不好。我們要找的是具有簡單型式的《,因為過分複雜的(對於預測的能力 就相對的差。這叫做0^61*61;:只顧了擬合,卻忘了預測。

I

13-5


—非81不可研究所^^,罾,000@

如果我們多畫一些這類的點在點上,這些點就會散布得像一個具有長軸 爲正斜率之橢圓。

三. 零相關―厂。。。「「㊀^!。!^) 設有以下的各點,這恰好產生了零相關。 X

1

2

3

4

4

5

6

7

7

4

2

3

5

7

6

2

3

當數據不多的時候,零相關是較不易從圖上一眼就看得出來的。但是當II很 大的時候,如…,:),"",…,!1的散佈圖像一個長軸、短軸分別和^軸與 ^軸平行的橢圓時,就像是零相關的樣子。

四. 負 相 關 ( ! ^ ^ ! ^

00^0\3\\0^

下面的這組數據呈負相關: X

1

2

3

4

4

5

6

7

4

2

3

1

2

1

0

如果我們多畫一些這類的點在圖上,這些點就會散布得像一個具有長軸爲負 斜率之橢圓。

^^^^811(1361^601 116931^6 00「「61311〇门) 下面這一組點呈完全負相關:

13-6

X

1

2

3

4

4

5

6

7

6

5

4

3

3

2

1


第I十

線性迴翻分析

這是所有的點都落在一條具有負斜率之直線的情形。 兩變項的相關,我們可以透過散佈圖^^忧^ 1 0 0 ,藉著直線一橢圓之 ?

間的變化看出:完全正相關-正相關-零相關-負相關-完全負相關五種型態。在 完全正(負)相關時,二變項可以說有一直線關係可以完全解釋;正(負)相關是 指二變項只能用一個擺得不正的橢圓(意指橢圓是斜的,不論是左斜還是右斜) 去解釋彼此間約略之直線關係;但當圖形成爲一個標準型的橢圓時,表示二 變項在解釋上並無直線關係可以說明,因此稱二變項零相關或無關。 標 準 型 的 椭 0

, ^ 程 式 為

其 長 短 轴 不 一 定 著 長 。

上面講的都是直觀的感覺,並且是「在假設〈X,力都來自一個二元常態 分布」這個條件下的直觀,但並不是相關性的定義。相關性是用下一節所講 的相關係數來定義的,而這和橢圓的假設是沒有關係的。

六.?63「50门相關係數 二變項(爲方便以後的說明,我們一律用X與7代表)的相關係數的數學 定義可見下面的公式。基本上,只要有II對實數,分別爲(、,^),^^^),… ,^。,^)就可以計算,雖然我們並不曾規定它們需來自某一個二元常態分 布,但是如果〈X,力的散佈圖和一個橢圓相去太遠時,相關係數除了可以硬 行計算之外,其意義並不大。


—非〖8不可研究所^

相關係數的計算公式爲 ^"^(^! 一 又 ) - ! )

化,'-纩11々「力

2

可以證明:-1;!^ ^ 1 。 我 們 若 是 將 乂 二 & ^ … 八 ^ , : ^ : ^ , … , ; / 力 設 想 成 兩 個 1 1 - 举 的 向 量 , 而 它 們 的 「 夹 角 」 4 6

,别

:》,~ 0 0 3 0

這 是 | 『 ^

| ^ 1 的 主 要 理 由 。 0 此 ' 若 0

交 」 。 利 用 垂 直 的 性 贤

1

= 90。'則1\

^0

' 乂 及 ^ 兩 向 量 恰 锊 「 正

慠 逋 當 的 畢 氏 窆 理 型 的 兮 解 】 弒 是 變 方 兮 析 0 ^ 0 ^ 〉 的

基 本 概 念 。

例:2.1若從某國小五年級甲班出15名學生,其智商(幻與數學成績(力如 表13.1所示。 表13.1智商與數學成績 智商X

100

95

110

72

86

105

88

94

數學成績V

70

60

82

50

61

80

65

68

智商X

68

130

84

108

120

90

78

數學成績V

40

96

58

78

90

64

55

試求算這組樣本的相關係數。 解:先由所給的數攄計算下面必需要算的量: ^ 1 4 2 8 , 》 ^ ^ 140138. ^1017,

13-8 | 統計^評篛

力 二 100424

^ 72179,11 - 1 5


第1十

線性迴歸分析

故得③ 83^

^ 3605.6, 3 8 、 ^ 4192.4, 8 、 ^ 3 2 2 6 . 4

\乂

^

3

而 3605.6

二 0.9804

74192.4x3226.4 故 得 ! ^

0.9804

七.相關係數「與散佈圖之關係 1.當所有點都完全落在同一條正斜率之直線上時,則,即爲完全正 相關。 1當所有點都落在長軸爲正斜率之橢圓內時,則0〈『^1

,即爲正相關。

3^當所有點都均勻散佈在一標準型的橢圆時,則!" : 0 ,即爲無相關。 4,當所有點都落在長軸爲負斜率之橢圓內時,則-1 〈!" ^ 0 ,即爲負相關。 5,當所有點都落在一條負斜率直線上時,則!" 二-1 ,即爲完全負相關。 有相關存在不一定有因果關係存在。例如智商分數與數學分數正相關表 示智商愈高者,數學分數愈有可能分數較高,當然比例也許可以說原因是智 商,結果爲數學分數(智商高低造成數學分數之高低)。但也有可能看國語與 數學之相關係數若爲正相關,當然表示國語分數愈高者,則其數學分數愈有 可能較高。但絕不是因爲念了國語而造成數學分數高,此二變項就沒有因果 關係了【 。 41

131

38^ ^ ^ ( ^ ; - 幻

2

,其它的符號請類推。這是常用到的符號,要

記一下。 !4'這一段話,說得難聽一點就是愈描愈黑。事貧是:世人會認為高相關暗示著因果 關係,統計學家雖知道標準答案是「雖有可能,俚不能如此認為」,還是有時忍不 住也那麼想。

I

13-9 | 统灣評詞


―非^不可研究所^^",^冑

八.秩相關係數

#

0

0

^

【5】

秩(!^!^)的意思就是「依大小排名」(小的排在前面),例如若是 、二 3 ^

2

二5,^ ^ 4 ,則我們知道、最小,、其次,^最大,故^的秩是

1,^的秩是2,^ 的秩是3。 2

適用時機:在一般的迴歸裡是不用來做的;在求秩序相關係數的 時候,我們多半對X及^的値沒有太多信心,而因此寧可比較信任它們彼此 之間的大小排名關係。這是無母數的想法。 計算公式: 1.斯皮爾曼秩相關②^&!"111311 1^1^⑦^^^忖。!!)係數

其中3 爲^和、的秩之差。 ;

2國肯德爾秩相關(!^!^&^ 8, X ~~

1^11^: 001-161&!;^!!) ―

其中&是一種表示秩失序之量變。 這兩個量,I中的山不難懂,但I裡的&就較難。它的計算方式,見例 2.2的步驟即可。 例2.2某老師根攄班上10位學生在資任與公正這兩種行爲特質上作了一 個評1:,其評定結粜如表13.2所示:

【51這一小段是和一般的迴歸的討論不相干的。

| 13-10 | 統計學評篛


線性迴歸分析

第1+

表13.2求秩相關的數據 學生編號

1

2

3

4

5

6

7

8

9

10

X之名次

2

10

4

1

3

6

8

9

5

7

V之名次

1

4

2

6

7

3

5

10

9

8

試求卩"^&【III&II②!^!!&!!'8 I兩種之秩相關係數。 解:①81)6^111&II秩相關係數。計算的詳情如表13.3 : 表13.3求秩相關的數據 學生編號

1

2

3

1

6

2

4 一

5

5

6

7

-4

3

3

8 一

1

9 -4

10 一

1

由此可算出7^=118故 ? ^ 0.2848 10(102 -1〉 6

②&^&!!'8秩相關係數 ①先利用X之秩由小至大排序,並配上相對應7値的次序如表13.4。 表13.4求秩相關的數據 X

1

2

3

4

5

6

7

8

9

10

6

1

7

2

9

3

8

5

10

4

不妨根據這個表定義^ ^6,7 ^ 1 』 2

3

^7,…,;^。 ^ 4 。

②求失序的量數(!!^犯!!化0^83^ :相對X變項的自然次序,? 變項的等第便出現某種程度的等第失序。所謂8'値是根據此時之 I變項之等第兩兩比較,當^之秩有自然次序則權數記+ 之等第不合乎自然次序則權數記-1

161

1 ;若V

。這樣說也許較不明白^ 。考

你當然不會明白,因為我也是肴了例子的實際計算一次才懂的。 I 13-11


―非〖8不可研究所^^"^^自

1#:1〈7時,^

的値。它可能爲正,但也可能爲負(但絕不會

0 ,因爲^,^,…,7。是沒有同秩的),定義如下: 若^ 1 产 0

1^=1

二―1

若 ^ -乂〗^0

广10、 二 45個1 之中(注意到要維持著1 〈 3的關係) 、2^

'!1、

則我們在

;|

求它們的和 1-1 1=1 1=1+1

I!]

2

11(11

"!)

'就是1^611(1&II 8 1-311^; 001'! 61311011 006^016111:,文獻中又稱爲 1

^ 13.5列舉了所有 是 [ - ^

,

個計算,;^-^的差,列在上一格。若

〈0 ,貝卩「沒有失序」,因此其下的、記爲+ 1 ;反之,

若 & - ^ 〉 0 ,則「這一對」次序不合,因此我們記相封應爲 1^-1

。各列的、總和記在右側,全部的;之總和記在右下角,

而這就是3'的値。計算見表13.4 。

| 13-12 1

^ 弊 ^


@0@⑨線性迴歸分析

表13.5

3

1 二1 1

=2

1 =

2

3

-1

1

4

5

6

7

8

9

10

3謹

1

1

-1

1

-1

1

-1

1

1

1

1

1

1

1

一1

1

-1

1

-1

1

I -1

8 -1

1

1

1

1

1

1

6

一1

-1

一1

1

-1

-3

1

1

1

4

-1

1

一1

一1

1

-1

0

一1

1

1

3

1=4 1 =

3'的計算

5

1= 6

1

1= 7 1=8 1-9

811111 01*1381; 0011111111 ~ 11

③ 口

…丄^0.244 10(10 -1〉

我 們 認 為 會 老 3 ^ 3 0 1 1 & I I

001-1-61311011的可能已^不犬,但缌還有

一點;但1(611^11、 1 & I I 攙 會 更 小 。 固 為 要 你 們 腎 遑 樣 麻 頌 公 式 的 研 究 所 ; 肯 定 是 唷 一 點 無 聊 。

1 3 . 3 簡 單 線 性 迴 歸 ―,簡單線性迴歸模型(㊀鄉^

11化3「 「69「655!011卬。^!)

模型的公式是: ^

二∼十^;十5 ,^1,2广、11 ^ ;

(仏》

其中,^表示第1個依變項觀測値;^表示第1個自變項觀測値(此模型中視

| 13-13 | 統計学評譎


^"非10不可研究所"^

爲一已知常數);13。,^爲迴歸參數;^表示誤差項(^『(^ 的数據形式是((、,^),::

!;^!!!)。你能看到

1,2,…,!。如沒有特別說明,、被看成爲非随機

白勺常數(!^!!-丄& ' !!^)!!) ; 乂;被看成爲隨機量(化!^。!!!)。 對 於 數 據 ( ^ , , ^ ) 的 寫 法 , 遠 裡 有 一 點 舍 混 。 較 好 的 寫 法 是 ( ? ^

, 乂 ) ^ 遑

是 將 X ; 看 成 已 知 章 數 ; 而 將 乂 看 成 ( 假 裝 南 志 被 觀 剁 到 的 ) 隨 檄 燮 數 。 傳 统 的 统 計 推 绘 的 条 搆 是 1 樣 的 :

1 . 先 假 設 的 兮 布 為 包 括 唷 ^ 個 ^ 知 枣 數 6 的 甚 〈 聯 合 ) 兮 布 。 雖 哺 數 據 ( ^ , ^ ) , 但 假 裝 沒 哺 看 見 。

1在「這^都是随機燮數』並有其兮析」的儆設下,嫩數學的推導,"求6的 估 計 公 式 , 或 者 信 賴 區 間 、 假 設 檢 定 蔷 。

3 , 蔷 得 到 這 ^ 後 , 再 「 忽 然 看 到 」 真 的 ( ! & 1 3

; 將 之 代 " 2 , 中 所 得 的 公 式 來 慠

荅 杀 。

遑 雖 唷 ^ 掩 耳 ^ 鈴 , 但 的 確 傳 疣 的 推 論 邏 輯 ( 理 狳 都 是 別 的 大 高 手 營 你 推 導 的 ; 小 老 百 姓 只 要 杳 用 橫 好 。 大 高 手 導 公 式 的 時 候 , 當 然 看 不 到 你 的 0 此 他 得 靠 假 想 的 來 慠 問 祖 ) 。 這 叫 俊 「 模 型 導 向 〈 1 1 1 0 ( 1 6 1

(!!:!∼!!)」的^式。

在 這 種 想 法 下 , 我 們 南 可 " 將 〈 X ; , 乂 ) 想 像 成 唷 一 個 二 元 聯 合 兮 布 ; 而 對 於 標 準 的 迴 歸 , 又 儆 設 3

X ; 的 值 是 可 " 被 我 們 揎 剁 的 ( 例 如 在 設 岌 的 溫 度 乂 ^ 下 慠 實

殮 ' 求 反 應 X 的 值 ) 。

5 1 為 在 忠 慠 贲 驗 前 我 們 ^ 知 遭 牝 揎 剁 温 度 , 故 可 ^ 乂 , 假 想 南 志 看 到

"

1

^ 常 數 。 佴 乂 困

故 為 随 機 量 。

(^;,^),^;,乂)

本 ^

"

'

1

3

'

( 乂 ; , 乂 ) 都 不 加 " 區 兮 。 遑 雖 然 唷 點 " 。 ! ) ^ ' 但 资 璨 上 1 5 4 ^ 工

湖 上 大 概 就 是 如 此 ~ 你 一 個 入 清 清 楚 楚 也 濟 不 : ? 事 , 我 們 也 用 ( 乂 ; , ^ ) 的 鸾 法 。

它應该1^11(10111畤^棱真1,31^0111

| 13-14 |

1

應 ^ 真

11011-!"3II30111

1

就 其 它 是


線性迴歸分析

篛I十

11011-1&11(10111。好在台灣的斫究所多半也沒有遠麼老究。你^唷從上、下^裡丟 判 斷 。 我 們 也 偶 然 用 一 下 犬 鸾 , 你 知 遺 我 們 在 想 甚 麼 就 好 3

二. 模型假設 在(巧.》中,一般的基本假設是 1. 2 ( 8 ^ = 0

2, 一 ^ ) "

2

3, ^之間相互獨立

以上1-4 ,可簡單地寫成^ ~ 11(1 1^(0, ^ ) 。 2

三. 迴歸參數的點估計 1.卩。,∼之最小平方估計量(。"(!!!!&!^ 16&81; 8(111&16 68*11113*01:, 。!;犯)

鄉 。 , ^ ^ ! ^ ^ - ^ 1-1

一!^)

2

1=1

這裡9代表的意思是「所有誤差的平方和」。如果9的値小,則各項誤 差都小。所以我們希望9的値愈小愈好。要求9的極小値,可由令偏微 分爲零而得,取 ^ :2 邵0

^

~ | 3 ~ ^卜》二 0

^ ^ ^ ^ 。 - ^ ( - 、 ) ^

0 ^

^

( 輯 ( ^ )

13-15


1~非損不可研究所統^"學評論

視 [ ^ , & 爲 未 知 數 , 聯 立 解 ( ^ ^ ( 巧 ^ ,得^北的0二85; 爲: 171

^ ― 工 & ― 又 乂 & ̶ ^ ― 33∼ 〖-幻

2

上式的另一表示法爲

其中!^爲? ^8011相關係數。不難看出!^與^同號〈重要)。 6

2, 2 ( 7 I 乂 ^ ^ ^ 及 、 之 點 估 計 這一段討論在乂二^的條件下的情形。這分爲兩個情況。卩)若、恰爲 ^,^,…^。中之一,此時因已看到^的値^或至少知道不久就要看到), 故無所謂要對&做甚麼估計。我們最多只是估計

這個「參數」而已。②若^不是、,^,…,、中之一,則相對的、就不 在361:中間,我們就可以說「估計、^

0 。 十 & 、 ^)」。足標【表

示^111!]:6 :因爲在、這一點,我們尙還未看到丫的値。 由於 ^ 丫

I X ^ 、 〉^ 2 ( 1 3 。 十 & 十 、 〉 ^|3。十[^、

(母體迴歸直線),且^, ^分別估計13。,^ 。 因 此 , 》 ^ ^ + ^ 、 稱 爲 迴 ;

歸方程式(!"6^6881011 ^^!!&^^!!),、稱爲擬合値(&忧6(1 ^&!^),故可利

171

這 是 0 1 ^ 1 1 1 3 1 ^ 1 6 3 3 1 ; ^ 1 1 3 1 ^ 8 681±1131:6

,簡稱0乙85:,或者逕自叫做135:。此處,

0 1 - ^ 1 1 1 3 ^ 指 「 不 加 權 」 而 言 。 若 將 9 改 為 , 則 叫 做 ∼ 6 1 ^ 1 1 ; 6 3 16381 8(111&化3。 二 者 的 做 法 其 實 是 非 常 類 似 的 。 這 都 是 所 謂 的 「 最 小 平 方 法 」 也 。


線性迴歸分析

用 ^

十 ^ 、 估 計 ^ 丫 1 乂^、)。進而對於未來的觀測値^!1:111*6

^^^^!:^&^]!)

V『作出預測。

未來的觀測値(假設在X 二 ^時),因爲尙未看到,故只能將之想成 ^

二 ∼ + ^ 十 ^ ' ^ ∼ 聊 ^

它的平均値爲2(^1

2

、^^+^、。故可用叭來估計(若、是

乂^&,…,。其中之一〉,或預測(若、不是^,^,…,、其中之一)。公式 都是一樣的,但「預測」時,因、處尙無真正的取樣,故》之中尙含 有6^∼^^,一)這一個量,「預測」時要將之考慮進去。不久還要再討論 此點。 3, ^ 之 點 估 計 在後面我們將證明 』 二 》力-么〉: 11-2

因此以

11-2

來估計一,是可行的。此處,"^) 爲殘差(!:&卅!!&1〉的平方和, 2

而「殘差」是指「經由迴歸之後所得的殘差」,因此又叫做誤差的平方和 (^磁0^

3^1131-63

0"讚,^犯);除以它的自由度II

差平方和的平均⑧〈1116311

3(11131-6

的迴歸而得到的1^132 , 而 ^ 二

-

2之後,叫做「誤

61!'0。」,記作1^32 。這是經由這樣 是?的不偏估計量。以上的討論,

即使是針對較複雜的迴歸而言也是一樣的。

181

有些書叫做「均方差」 13-17


―非損不可研究所統^"學評論 0

0

^

^

例3.1 7;

^ ^

0

811^13036 7011 31,6 & 8 ^ 6 ( 1 七 0 6 8 * 1 1 1 1 3 6 6 & 1*6^1*6881011 0 1 0 ^ 6 1 ^ [^^! ^ 6; \18111^ 1116 11161110(1 0? 1113X11111101 ^&^丄!!!^^. ?16&86

^61*1^6 1116 6X1)11113-101*8 0? [ ^ , ^ 311(1 (^" ^ 15 ^ 1 6 ^^!;!!!!^!:^!' 0 ^ 0

2

1)1386(1?

解:因爲V;∼卅^卵!!&!!!:"②。+(3 ,0 ),故可將概度函数寫成 2

1X;

、 9 」 1=1 ^2兀0一

2『

取概度函数的對數,得

2

- 2(7 ( 乂 ' - 1 ^ ) : 對函數9就(^,^,一做偏微分,並令它們爲零,可解得11 ,11^1 ^31:1 11 01

6

0

3

如下: ^ 。 ^ 》 , ) ^ 冗 ^ " 》 , 。 " 》 ^ '

這有三個未知數,三個方程式,解之得

》、-50

2

88^

因此我們可直接算出取^)^^!!-2沁 力一。因此,一的]^!!^是一 2

II

| 13-18


@0@0線性迴歸分析

0力。

個有偏差的估計量0)1&86(1

除了 ― 之 1 ^ 1 1 ^ 與 0 乙 8 2 不 同 外 , 0 。 , & 之 與 0 1 ^ 2 相 同 。

例3.2雷鳥模型公司在從事其新產品?18戰機模型試銷時,由不同試銷 點獲得以下訂價與每日銷量資料,列入表13.6 ,請回答下列問題並列出計算 過程。

^ 表13.6訂價與銷售量 訂價X

1

1

2

3

3

4

5

5

銷量V

36

33

31

29

27

25

23

20

(丄)畫出散佈圖,並依圖判斷價格與銷量間是否存有線性關係? 〈2〉請求出銷售量與定價關係之最小平方估計迴歸線^|3 ^ 0

此一估計迴歸線是否適當?請解釋。 請透過統計檢定驗證這兩個變數間是否有顯著關係?使用01 二 0.05 。 假設雷鳥公司最後決定將此產品價格訂爲54 ,請計算其每一銷售點每曰 銷售量的95。^區間估計。 解:直接計算得

2^

^

24, ^ 卜 9 0 , 2 x ^ = 6 1 4

: 224,》『二 6470, 11 = 8

故 24 ^ 9 0 ~ ~ ^ 1 8 8 2

88^ X

224 8 8 ^ ^ 6 4 7 0 - ^ = ^ = 198 ^ 8 2

8 8 ^ ^ ―58

由此可算出]^88 = 1.8948 。本題的散佈圖(就&忧枕1)1010 ,見圖13.1 。

13-19


-非^不可研究所 統計學評論

30 20 10

圖13.1 表13.6的散布圖 依照圆13.1判斷,X與X應該有很強之負斜率之線性相關。這回答了(工)。 ^ 88^ & :^

58 ^ ~ 二 ― 矿 ― 3 . 2 2 , 0。 : ^ ― ^

故迴歸線爲7 ^ 37.67

: 37.67

。這回答了②。

關於的答案爲「是」,由於利用最小平方法估計此線,表示此線在誤 差平方和準則下是最接近此點之線。且從散佈圖可知相當吻合。 關於(勺,假設檢定爲下面的形式: I V

二0

我們使用檢定量 丁 ^

夂 ! ' \4一82

33^ 1

在下一節,我們會證明I 的分布恰好是自由度爲11-2-6的^分布。: 表得拒絕域爲0 ^《I 7 卜 ^ ( ^ )

| 13-20

^ ^ 藤

^

2.447》。將資料代入檢定量公式


- 3.22 二

,-(-3.22)2x18 6 18

故 拒 絕 I I 。 , 其 中 ] ^ 8 2 ^ 3 、 - ^ ^ ^ ^ / ( ! ! - ^ ) ^ ^ 』 ^ ^ 。結論:在 仏二 0 . 0 5 的 水 準 下 , 會 顯 著 不 等 於 0 ,即X與7有顯著相關。這回答 了④。 最後,我們来做:關於》在X:、時的95。冗預測區間,可由下公式 求得 丫 ^ 嶋 ( 。 ― 2 \

1\

代入巳求出的各値,0^ 4 ) ^ ( 2 1 . 1 3 , 28,45】爲"^之957。預測區間

13.4氐丄與义之抽樣分配 本章到目前爲止,我們不曾細分7和V的不同。因爲尙沒有十分必要来 作區分。但若談到分布,我們就得明白地用不同的符號,大體而言書用大寫 的乂,丫,2等表示隨機變數,你不妨將之想像爲「理論上存在,但尙未實地去 觀測的」隨機變數。而小寫的X, 7, 2等則視爲已經實驗測量而看到的眞實數 據;大寫的爲隨機才有分布,小寫的爲常數故無分布。比如說:若是要求^^ 及^的分布時,我們就得假想「13際取樣本的工作尙未開始」,故^^及^公 式中的^,1 = 1,2,…,!1都得想成、,、,…,"^ ,因爲這樣子才可能有〈我們要 計算)分布的存在。 注意到^。,^與^都可寫成义,7 ,…,V。的線性組合(^.可寫成 2

&0+3.^1 ^

^2十一十、1;的形狀)。因此它們的分布都是常態分布,在

13-21


^~非!8不可研究所~^1^8^~~04^0#

求分布的時候,我們只要計算出它們的期望値及變異數就好,這是因爲常態 分布只靠這兩個參數就可以決定。

―,^的分布 & 二

: 88^

33^

:證明】: 由假定乂

^ + ^ ^ ^ ^

2

) , 且 —又)(乂 ―

33^ 38^

88^ ^ 7

X;

一5

33,

^

、83、

令、-50/38、,故、與乂無關,視爲常數。故可知^爲乂之線性 組合,由於乂爲常態分布(常態分布之線性組合仍爲常態分布),故

^1101:111^

。下面我們再進一步計算^^ 〕 和 〃 ^ ( ^ 〉。直接取期望値得

這是因爲我們可以容易算出來 故在以^"古計&時,是一線性不偏估計量(!!!^^

1111131356^ 6 8 * 1 1 1 1 ^ ^ ,

乂 ^ " 趴 ) ^ 乂化!;^^;乂) ^ ( ^ ^ 『 ^ ^ ( ^ ) ^ 。最後,我們來求\^1^。也是直接代入,得

| 13-22 | 統^學評篛

83^


線性迴歸分析

這是因爲我們也很容易算出來 1

》 卜

88^

二. I 的 分 布 1 ^0∼卿0,

^

― 十

[證明】 1.因爲氏可寫成^的線性組合,故&亦爲常態。 ^

-

^^

^ ^ ^ + ^ - ^ ^ ^

故^是0。的線性不偏估計量。 3^ ^ " ( ^ 。 〉 二 ^ " ( ? ̶ 夂 5 0 二 ^ " ( ^ ) 十 ^ " ( ― 趴 又 ) ― 2 0 ^ ( 7 , ^ 5 0 2 ^

―2 2 2乂 X 0

11

1 二

^

― 十

88^

0 0 ^ ( 7 , ^ 〉 : 。0乂 I

II

、 乂 II

十00乂

00乂

十00乂 ^ 1

气 "

II

,&义 II

十0〇乂

V V

十…十00乂

乂 、 \

V 十

十 … 十

11

1 13-23 |


非^不可研究所

統計學評論

十00乂

X

〈X 玍 11

^

丄 ) 义

十…十00乂

II

但以上的II XIII項中,除對角線的部份之外,其他各項均爲0 ,故 。 。 ^ ' ^ 上 ? 十 ∼ II

十 … 十 二 0

2

II

II

因爲^;、 二0是容易算出來的。

三.么的分布 ^

二 ^ + ^ ∼ 卿

0

4 ^ ,

1

( ^ - 又 V

一) 5丑

明】

1.我們前此已證明^,∼均是常態,故知么的分布亦是常態。 2,

^ ^ ^ ^ + ^ ^ - ^ + ^ ;

3, ^ ( 夂 〉 二 ^

^

"

(

^

)

1 ― 十 11

1

88^

00 ^

X 十乂 2

: :

。 十 2 x ^ 0 0 ^ ( 1 ; ^ 5 ― ^。乂①】,^刃 2

一2

|

0 十2乂;【0 — ^/31,(^X1 2

1

X:十X;

^ " 4

88^ ―2 2 X 十乂#

0

| 13-24 | 統計學評謫

^

9

0一

2乂;又 2 ― 0

88^


" - 元 2 ̶ 2 x ^ + 5^、 十

―十

33^

II

II

1+

線性迴歸分析

^一紆 58^

這上面三題都來自於簡單的想法:若乂∼^^"^^^:^义…,!!爲互相獨 立,則 》 乂 ∼ 化 , ' 》 ^

2

)

若另有一個^卜^ ,則

這 三 題 的 計 算 雖 然 繁 雜 , 但 你 只 要 抓 住 及 ^ ,當它們寫成X引^時, 各係數的形式一決定就一切都解決了 〔你只剩下代數運算),這些都是常態分 布的特性。

13.5相關參數之區間估計及假設檢定 一.&的信賴區間 ^之100(1-00^^賴區間,我們可以用以下的標準作法完成 1. ( ^ 的 點 估 計 可 用 ^

1樞紐量用:1\

^ - ^ ^ - ^ "

2

)

3^主要被用到的公式是: 1-01 ^ ?[-^/^(!! 一 2〉 3 1\ 5 1,2(11 ̶ 2)1

| 13-25 I ^計^評^


禺工十.

丄 由 此 導 出 ^ ^ 1 0 0 ( 1 -06)0/0信賴區間爲:^"^(!!一^)

88^

二. |3。的信賴區間 |3 之100(1 -

^信賴區間的作法也也類似:

0

1. &旳點估計可用^) 1樞紐量用:

、二 ^ 十 丄 、

∼!:&^)

88^

II

3^主要被用到的公式是: 1 - 01 ^

?[-(!! - 2〉《? ; 、 ! ( ! ― 2〉】 0

2

4由此可導出|3。之100(1-")。/。信賴區間爲: |3 土 ^ ; " " ! ! 一 2人 ; 十 ^ 0

三曰(丫 | X^

河82

的信賴區間

對於求2(7 | X ^

之100(1 -旬。/。信賴區間,步驟也差不多是一樣的

1. ^ ( ^ | X ^ X 。 的 點 估 計 可 用 叭 ^ ^ 。 十 ^ 2,樞扭量則用 九 - ^ 2、 1 !∼-元) ^82 V ∼ 』 11

13^26~

8

∼^一2〉


#0@@線性週歸分析

3,所用到的主要公式是: ^ ? [ - 1 . ^ ( 1 1 - 2〉 5 丁 "

1:^2(11-2)1

1 由 此 可 導 出 | ^^乂^之川^以-^信賴區間爲: 7乂 土 、 / " ! !

1 ^ 0^

̶2入一十 II

33,

四.丫,的信賴區間 關於》之100(1 ~ 00^信賴區間的求法也基本和前面一樣: 1 . 點 估 計 用 入 ^ ^。十夂:^以預估、。 2,利用 V 『 ∼ 一 。 十 ^ ,

2

) ,

7? ~ ^ 13。十13;化'

0

以及\和^獨立的性質,可導出 丁 ^

1-9

~\2

十丄+ ^ II

-̶又〉 8 1

而這是我們主要會用到的公式 3^ ^之比^)"-力。/。信賴區間: 1 ^ 1+- + II

―吖 88^

廳 2

請留心我們所用的符號。基本上,我們的想法是、:^+^,,而

13-27 國 」 : 罾乂 : : ― ^~


非!II不可研究所統^"學評論

^

1第I十

4。十^、是^、時的一個未知(但非隨機)値。因此我們用小寫的^ ;

&因爲包含了 ^成爲隨機的,故用大寫;而^則只是^的估計値而巳,其 隨機性被符號「门喑示了 。 注 意 到 根 號 中 的 1 ,這是因^∼^1(0,

是「尙未發生的誤差」故和

^,…,^。這II個已知觀測量所產生的額外誤差獨立。考類似的題目時,不要 忘了1的存在。 本 小 節 主 要 用 到 的 性 ^ 是 : ^ , & 及 叭 都 是 章 態 兮 布 , 而 (!!一^)^ ~ 0 \

2

^

―:鄱和^,^獨鱼1才有"上各公

^此外,所唷的殘盖^

式中的1;兮布出現,這個性質雖在所唷的迴歸中都掌出來用』但嚴格锐来^嘈章 裟兮布才唷。绶明這件事雖繁而不難。151為這^量都是章態兮布,我們只要滢明 它 們 之 間 的 ^ 關 ^ 數 是 0 ^ 。 關於^,^反0之假設撿定'兮逑如下:

五.^之假設檢定

遑是「雙尾」檢定,單尾的作法類似,我們就不一一说明3 入:一個比鲮好推廣,將來的0116

^

。我們自兩個角度切

^0乂八的作法是此法自然的推廣;另

一個直接自1:兮布、手】比鷇好"!綦。 方法一

:「-檢定(。^!^"卜怡^)

利用前述的變數分析之平方和〈變異)之分解,我們有^

!9'這個證明是可以硬做的,只要手上的功夫夠,就應該做得出來。由此可^明

| 13-28 |


@0@@

1^(7;

- 歹 )

2

《 ( 夂 - 歹 )

2

十 ! ^

1

線性迴歸分析

― 夂 "

而這可解釋爲 總變異(^丁。):迴歸變異^^冗)^殘差變異②犯) 由此可得^10乂八表(表13.7〉。 表13.7

0116-^3^

,〇乂八131316

變異^源

平方和

自甶度

均方和

迴歸

8811

1

1^1811 = 8511/1

殘差

11-2

總變異

11-1

?-值 ?

贾32二 3 3 2 / ( 1 1 - 2〉

由此得拒絕域:0:化〉1^(1, 11-2》,而本檢定的決策法則當然是: 當? 6 0 則 拒 絕 I I 。 , 表 示 引 進 X 可 以 有 效 解 釋 ;若當? 2 0則接受8。,表 7

示引進X無法有效解釋^。 對於迴歸分析常用到所謂的「判定係數」^06伍016111 "^化!"^!!^。!!), 又叫只^&^^巧),對於簡單迴歸而言, ^2

5311 ―337

0

其意義爲引進自變數X後,該迴歸直線可以解釋依變數 變異,佔總變異中 7

2

2

之比例。簡言之,II 爲引進X後的解釋能力,II 愈高代表該迴歸方程式預測 能力愈高;反之愈差。它的其它性質有: 1. 0 ^

;1

2

832^88 ~13^88^ 1

,這是前面用過的性質。 | 13-29 | 統計學評譎


1

非讓不可研究所矹^^ 罾,

其中±號由&^的符號決定。 " 上 公 式 只 是 對 閜 翠 镍 性 迴 歸 的 模 型 7 = 而言,也'有一個II

2

1

^

, 公 式 則 鲛 複 雜 。

2

2

對一般的複迴歸而言,我們常希望看到一個大一點的II 値。然而II 的 値大有兩種情形,一種是這個値眞的大,這是我們所希望的,因爲我們可以 毫無懷疑的去判定這條回歸線是不是眞的能夠解釋3的變異。但是另一種情 2

況是我們不願見到,因爲II 可能因爲自由度的影響而變的大,這種大値是虛 假的,會造成我們的誤判。 經濟學家有時利用「修正判定係數(&(!扣3116(1 !^)」: 2

3(13113*16^ 1 1 ^ 1 - " ^ " ( ! - ^ ) 11-1-11 2

2

(其中,1^表示模型中的|3的個數,比如說,對於簡迴歸而言,1^ = 2 ,做到 複迴歸的時候,&的値會大些。〉比較3(^118&6(1 I I 和 I I ,如果兩個很接近, 2

2

2

2

表示II 所顯示的値是可靠的,相反的,如果兩個値相差很多,表示II 的大 値是受自由度的影響,並不能做爲我們判斷模型判斷力的解釋。 但學者對於&力118*6(1 I I

2

看 法 並 不 一 鈥 。 我 們 比 毂 認 急 那 是 野 狐 襌 ^ 沒 唷 甚

麼 真 正 的 惫 思 : 玩 一 個 小 花 搶 而 已 。 但 我 們 邃 : ! 在 此 一 瑗 ^ 誰 知 遭 你 會 遇 到 怎 樣 的 改 舂 入 ?

13-30


線性迴歸分析

六.1^15^之計算與性質 1^182的定義是

11-2

而可以證明^^^^二?,故若用^

:^132 , 則 ^ 爲 一 的 不 偏 估 計 量 。

這就是前面所用的一些1;-檢定,分母都有382的道理。一因爲我們要用它 。所以分母上的1^35:都是以7^的形式出

來估計?以消去分子上的^ 現。

"上的講法看似很繁雜〉但鄱是「々然可橫」,固為基本上它們卩是在計其 1 ,丫2,∼,了 。 的 一 個 二 坎 的 期 望 值 1 遠 呰 量 都 可 先 寫 成

11∼巧

3 =

1=1户1

的形式,其中、是與丫。^,"',丫。鄱無關^的章數。(!)此

1=1 ^ 1

二力V"(丫,〉十2 1=1

2

^〉

1^

但^∼乂①。^^^;,^),這^量鄱可直接代入上式再慠一小代數的笙理簡 化面已。遑^技街工作基本上只是要求你的代數計^ ,但真正的關鍵則是 581

0

^ 38^ + 332

的兮解。遑個式子不僅要背,而且還要'(董。要憧的是^

^885^11-2〉不^可用

来估計?,而且^唷:

| 13-31 |


非 8 9 不 可 研 究 所 統 計 學第 評I 十 論, @ 0 0 #

2,

1^82和8811兩项是獨立的』其實

3, ^ 。 , ^ 》 和 8 8 5 : 也 是 獨 立 的 。

而 這 ^ 性 赏 才 構 成 3 迴 歸 中 的 ? , 1;苓檢定的性赏。

方法二

檢定00(^1011131 1-1630

此法自樞紐量:

出發,將3。之等號條件代入樞紐量 131-0

^的公式,其實不用去背,但你要知道它背後的想法就不難。若要檢定 11 :^^0 0

,我們當然要選一個^出來,而我們已有(當II。爲眞

時)趴∼∼。,!^ )的形式,。可用^8冗來估計,故我們知道所要的?,形 2

式當然是^

/、/^!^的樣子,其餘的只是計算一下常數&應該是多少就可

以了 。這個道理用到的8。卬二0也是可用的。 拒 絕 域 是 0 = 1 丁 | ^ ^(!! ~ 2)1 。 至 於 利 用 樞 紐 量 7 反 解 求 & 的 信 賴 區間,因爲也蠻簡單,我們就不做了 。 I檢定與&檢定的關係其實蠻簡單


這是偶然會考的性質。基本上〖的分布是由 X

的形式所構成,其中X ~ ∼ 0 , 1〉, 8 ~ 2

,而X和 獨立。?則由兩個獨 2

8

2

立的X 分布(分別除去自由度)之商而得。但在乂∼!^^丄)時,?∼?(!!), 這才是了 0 0 : ^ 1 , 0 的 基 本 道 理 。 2

知 道 對 [ ^ 所 作 的 雙 尾 的 撿 窆 之 後 , 其 ^ 闞 於 之 右 尾 、 左 尾 或 其 它 值 撿 定 也 鄱 可 " 立 即 鸾 出 。 我 們 不 在 此 细 就 , ^ 列 式 舉 出 它 們 的 拒 ^ 减 :

0 ^ IX ^

左尾

1^(11

^^(!:^^-^))

右尾

七.關於|3。之假設檢定:^630

這 是 雙 逄 儼 鼓 ' 覃 逄 假 狻 的 問 趙 。 1 9 為 只 要 少 少 改 一 下 雙 邊 的 嫩 法 ^ 锊 ' 我 們 就 不 説 3

檢定統計量用 了— 0 0 ~ ^ 0

而我們的拒域是:0 二 ( ! I |

〉^2(11-2)1

此處,I之分母仍然是

13-33


第工十.

某常數 的形式。若可以算出乂^^卜-^?中的!^値,這個公式也不需要背,前面 已計算過。

八.關於0之假設檢定與信賴區間 此 處 " 旨 ( 、 , ^ ) , 1=1,2,…,!1這II對「二元分布」的相關係數,一般情 形下,我們之所以願意來做7 = 0 。 十 & 1 + 6這樣的迴歸,就是因爲我們相信 X與7之間是有關係的!因此,II。 :0的檢定,並沒有多大的意義。此外, 因爲之分布並不是1;或7等我們所熟知的分布,故所用的檢定都是近似 的^!^化&!!!^^!!)。因此,關於^的檢定被考的機會不大,在此我們只是聊 備一格。 不妨先考慮以下的雙尾情形:

可用檢定統計量: 丄11711-2

此時拒絕域爲0^(1 ^^^(!!-^)),至於左尾或右尾的情形讀者不妨自己 補上。 另一種檢定是針對

13^34


^0-9

= 90

其檢定統計量:(利用厶轉換),取 十 I

2 7

2

! - ^

卿,!)

入'II - 3

此時拒絕域爲0 ^ || 2 | ^ 、^)〔雙尾)。 利用71 11 , 2-轉換,也可求9的信賴區間(主要是因爲上一段中的(?。 8

61

可以是任何卜1, 1〉中的値得緣故),因爲

2

其中

1-11 9

2

2

15

1 + ^3

1.先求2。之100(1-力^信賴區間,我們仍用樞軸求解的方法,可算出 2—

1

:12 1 1 - 3

^2

^

^ 2 + 2^ ^111-3

1. 9之100(1-^。/。信賴區間,可再由上式解出^而得。令 乙二 2

1

2 ^

11-3

11-3

則 1 ^ 2 。 ^ II相等於 I

1^ 1 2

+ 0

1~

I

9

因此

13-35

統^ 9評譎


#00^

-非〗8不可研究所^^"^^冑

由此解出9 , 得 | 3 之 " ( ^ - 0 0 ^ 信 頼 區 間 爲 6^-1 6

化 十 1 ,

2

1

6

十 1

例5.1研究員工在一年中曠職天數與員工住家與公司間距離之間關係選 出十名員工得到以下資料,如表13.8所示 表13.8

距離與^職

住家與公司距離

4

6

7

9

11

13

14

17

17

21

曠職天數

8

5

8

7

6

3

5

2

4

2

^求最小平方估計迴歸式。 求樣本相關係數,已知、^化)^ 2.306 。 當員工住家距離公司8單位下,求員工曠職天數期望値的95。4信賴區間。 解:^據所給的數據,先算出 》 二

19,》

: 500

: 1687,

2

1 ^ = 5 0 , ^ 乂 二 296, 11 = 10 2

3 3 ^ 二 270.9, 8 8 、 ^ 46, 8 8 ^ ^ ―95 X

(工)& :88 ^83乂 !0

7

入》

0.3507,^0 :歹一&^:9,173

,故7^9,173 —

0,3507乂 ② 匸 ―

二一 0.851

③ ∼ " ^ 之 9 5 。 兀 可 信 區 間 , 求 法 如 下 : 因 爲 》 ^ 9 , 173-0.3507 X8=6.3674,故所求的答案是。

| 13-36 |


I

線性迴歸分析

1+

②-玎 88^

II

但 可 求 出 爲 ^32 ^

88^ - ^

, 38^

11-2

46 - (-0.3507)2 ~ 270.9 ^ 1.585 8

故最後的答案是 2、

6.3674 ± 2.2306 X

或者【5.22, 7.515;!爲^,

|;

〈8-;11.9〉

X

10 1 \

270.9

1.585

^之957。可信區間。

9\ 5.2利用迴歸分析的方法研究表13.9中的廣告費用(力與每週銷售量(^) 的關係,假設其關係式爲^ ^ ^ + ^

,资料及一個典型的統計軟體

報表如表13.9 。 已 知 ^ 〈5〉 ^ 1 . 4 7 6 , " 加 巧 ) : 2 . 0 1 5 , " 加 ④ 二 2.132, 10^(4)^1.333

表13.9廣告與銷售 每週銷售量V

10.2

1.5

16.1

20.3

廣告費用X

1.0

12.5

1.5

2.0

25.6 ,5

28.0 3.0

表13.10 廣告的八^〇乂八丁的16 80111"(;6

3丄

83

1^8

1^0(161

1

261.96637

261.96637

51:1-0 !'

4

5.50196

11.3755

5

267.46833

190.453

0.0002

0由33&計算957。關於&之信賴區間 〈2〉下列問題由382報表的結果回答:

| 13-37 | 統計學誶II


非 讚 不 可 研 究 所 " ^ ^ ^第工十 ~#00#

(&) 8 8 2 : ^ ^ ^ ^ , 2^01: 3 丄 : ^ ^ ^ ^

^:

^

^

(!))寫下最小平方迴歸直線二 ― ( ^ ) 用 X (廣告費用)預測叭每周的銷售量週)是否適當117 ? ((!)檢定

1^31116 : ^ ^ ^ ^ ^

;檢定結果:^^^^^

⑨ 當 X ^ 1.75時,,^

,此時800的95。龙信賴區間爲何?

解:因爲計算和前一題很像,我們就不做了 。只提供答案。(^之907。可信 區間爲【7.942, 1 0 . 8 4 5 】 。 3 = 0.9896 ; 而 》 ^ 1.004十9,393义;問題((!) 的答案是「是」,因爲之?-化沘顯著,且II

2

^97,93。乂非常

髙 。 關 於 3 。 , 可 算 出 的 1 ) ^ 8 1 1 1 6 是 0 . 0 0 0 2 ,故拒絕II。。而 兮^ 17.443 , ^:⑨之957 可信區間爲【16.093, 18.793】。 0

例5.3簡單直線迴歸分析中,需計算一個變異數分析表如表13.11 。 表 1 3 . 1 1 八 " 0 ^ (不完全) 變異來源 迴歸

平方和 ? ? 9

誤差 合3十

均方 ?

自由度

9244.95 19

(丄)完成表13.11。 (^)此表欲檢定之II。爲何? II。所表示意義爲何? 巧)求簡單判定係數II 。 2

解 : ^

13-38

的結果見表13.12 。

?-値 165.21


線性迴歸分析

表13.12八!\10乂八 80111*06

平方和

自由度

均方

1^

迴歸

1527358.19

1

1527358.19

165.21

誤差

166409.10

18

9244.95

1693767.29

19

②^。:∼^0

丑。表示不須引進此111163!" 1-6^1-6861011 1110^61來解釋7 。 ②)!^ ^ 8811/38X0

二 犯 ?

0

/ 。

例 5 . 4 隨 機 抽 取 甲 地 3 0 個 家 庭 , 得 其 收 入 與 支 出 之 之 相 關 係 數 1 、 ^ 0.6 (工)試求0之95化信賴區間。 (^)試以00 = 0 . 0 5 檢 定 0 = 0.5 。 ( ^ ) 試 以 0 = 0 . 0 1 檢 定 ^ ^ 二0 解 : 山 因 爲 I I ^ 0.6 ,我們利用2-^311^01^31:1011 ,得 2 = ^111 ^ 0.693 2 1-0.6 1 +

0

6

而2。之957。可信區間爲 1 0^

0.6931 ±

二【0.3159, 1.071

由此解出9之95。:信賴區間爲【0.3058, 0.7895〗。 ②

11

0

0.5

代 入 2 的 公 式 , 可 算 出 實 測 的 2 値 是 2 。 ^ 0 . 7 4 7 2 ,而知2。《0 , 故不能拒絕8。。至於

| 13-39 ^ ^ 9 5 二^


非狼不可研究所統計學評論

# 4 ^ 0 ^

11 : ^ 0^ 0

:^^0

则 以 前 法 算 出 ^ 測 的 I 値 是 3 . 9 7 ^ 0 ,故可拒絕II。。

13.6資料型態不同之表達及模式改變 一 . 利用原始資料表達簡單線性迴歸 假設原始資料(化^ 431;^的形式是:(^;,:^),!:^,?,…,!!,模式(!^^工;) 是^ ^^+^!^!+^!。此時,迴歸方程式是夂X

如果我們令7;

- ^^;:、-又,而利用這樣「位移後」的資料表達

簡單線性迴歸。針對位移之後的資料,模式變成:寸^ 而& ^ ^

,其中,

,其中的& ^ 0 ,

。這就是說,經過這樣的轉換,我們可以強迫,迴歸直線通過原點。

二. 利用一般的線性轉換來表達簡單線性迴歸 設 X ^ ^ 十 V , V : & 2 十 , 而 針 對 〔 X ; , 7;〉來做迴歸,我們會得到 1

7^^ ^^ 0

,其&,^,1 = 0,1之間的關係,可以用下面的「代入」方式得

到:

( & 2 十 ^ 2 ^ 0 ^ 00十^1 ( & I 十 ^ ! ^ ' )

0

则這樣的強迫是假的,因為我們換了一個原點,而新原點是原來就要經過的。

13-40 統計學評,


#0@@線性罾^^^斤

換句話說,我們有

這 兩 個 例 孑 卩 説 明 一 件 事 : ^ 反 X 間 乏 關 ^ 3不^] X 及 乂 之 間 的 任 何 锞 性 尺 度而改燮。例如X若為溫度時』我們可用專氏或老攝氏的X值都沒唷關係。^為 7若是和X唷迴歸,! ] ^ 4 1 1 : ^ 的 值 ^ 溫 度 的 改 燮 而 決 定 的 ( 溫 度 急 物3 里 現 象 〉 1 ,

至於專氏或攝氏别;1入為的翠位^入急的覃位不應玆影饗I然上先天就唷的性 質'尤其是遑個單位是「镍性」的時候。〈專氏和攝氏乏間的關係是一欢的: ?

0

-1.80 十32〉 0

例6.1

―組成對資料^,^口^:^,…,!!,若以

模式一 : 乂 : | 3

0

十 十 6 及

模式二 : X ^ 06 ^ 0

十 ^

分別利用最小平方法得到 7 = 5。十趴乂,乂^。十^乂

則 是 否 們 有 ^ 一 ^ ^ 1 ?爲甚麼? 解:不一定成立。因爲答案是:6^x^=1^

。你只要算一下便會知道。這

是因爲在模式一之下,最小平方法所指的距離是指「垂直距離」,而模 式二之下,因爲X, V互換,變成了 「水平距離」。 例6.2設有一迴歸模型力,現將每一\的値改爲10^

;請

2

問&^與^有何改變(其中&與&分別爲與|3的估計値,II 表示判定係數)? 》 ^ - ^ ( ^ ― ! ^ ) :

解:

^'二

~ ~ 》 1 ^ ― !^)

2

1;88^ ^ 1 ^

― 1^ 83^ ― : 2

且 6. ^ 1

2

2

而8 的値不會改變。答案:艮會變成^/!^旦&和3 的値不會改變。

13-41 計 孚 賤


— 非 8 1 不 可 研 究 所 # 0 0 @

上面我們討論了資料改變形態時對迴歸所產生的影響,接著我們再討論 因模式改變所產生的變化。

三.無截距模式 如果我們先就規定|3。 : 0 ,而模型變爲 VI

二 卩 ^ ! 十 6 ^ 1 二1,2,…,!1

此時,迴歸方程式爲""^

,其中^ ^ 2 x ^ / 2 ^

减)-|3 ,V 1^ ) = 1

&

1

^

。此時,

7

但 表 要 作 修 改 , 我 們 將 新 的 表 列 在 表 1 3 . 1 3 裡 面 。 表13.13八1^10^\^11|3。二0

88

80111*06 116&1*6551011

1 11-1

101&1

11

2 ^

四.非線性迴歸模式 對於非線性模式的迴歸,基本上沒有一定的解決的方法。這一點和線性

1

11】

這才是「強迫迴歸方程式通過原點」。因為一開始我們就規定了 0。 ^ 0 。我們只是

盔力地去找一個最好的I罷了

13-42


綜性迴歸分析

第I十

迴歸不同。非線性模型是幾乎不會考的。但我們在此提出來說,主要是講二 者的不同。線性是指「一次式」的意思。如V 二 ^ + !^ , 表 出 ^ 是 X 的 一 次 函數。但是,如果模型是

這仍然是線性模型(用1^3仍然可解)。道理是在哪裡呢?

X

原來,我們是把未知參數當作主要的被處理的對象的。而不是看自變數 。只要沒有^',^叭^)這種項,而所有的13都以一次的形式出現時,這都

叫做線性模型。而

, 【

6

- 一 —

6

々 】 十

6

這些例子,都是非線性模型。

十V【&11(1 0131:31116(1 1:116 0 1 . 8 七1116

1110^61

1133

3

IX十十4【,^1161*6

8110\^

^

68^1II1^(;6 3 8

001181&111; 161 111 1

^ 二 ^ 乂 ^ ^ ^ / ^ ^ 乂 ^ ; .

30

111&1

乂【18

1 ^ 0 ^ 6 ^ 6 !", 1116

301^1&11^

^ 6 1 1

6乂

0 ^111

1)6

1138 2 6 1 0 6X^601;&11011.

15 1 ) 1 & ^ ^ ^ .

1)61:1^6 ^ 6

0011^11:1011 1111^6!' \^ 111011

1111131356(1 6^611 1?1011^11 1:116 \^1^011^ 1110^61

1186)1

&1 13 1116 ! ! ! ! ^ ! ^ ^

!!!^!'!)!'^!;&1;1011 0【七1^6 0 0 1 1 ( ^ ^ 0 1 1 乂011 ^ ! ' ^ ^ ? 》 ^ ( 乂 》

解 : 聊 ^ 5:

1^ 13-43 統計^評譎

|


故 ^ 爲 0 的 有 偏 估 計 量 。 若 2 、 ^ 0 ,則51(^ = 0 。 故 在 2 、 : 0 的 條 件下,&即爲0之不偏估計量。 此一部伶是出得鷇好的趙3 , 01在::0^十陬4十、的模型中^演的是「載 距」的角色』01 = 0 表 示 沒 唷 載 距 , 或 老 迴 歸 直 镍 為 通 遏 覃 點 的 直 镓 。 我們假裝01 = 0 時 ' 對 | 3 之 估 計 , 在 一 般 堉 形 之 下 所 泉 現 的 現 象 是 一 條 被 扭 曲的直镓。而逭表現在

卜 的公式上。不扭曲的^

1公式是

X 、 -

X

而在元二0時'這兩個公式是一樣的。

例6.4假如你有一組(^^:), 1 =

1,2,…,!1

,而你要做了個「通過原點」

的迴歸。如果你手上的軟體只能做普通的迴歸〈不能強迫通過原點),請問你 有沒有辦法利用現有的軟體,來做出「一定通過原點」的迴歸? 解:不妨將原始的數據人爲地加倍:在(、,^)之外再補上相對稱的 ( - ^ , ^ ) 。 這 樣 一 共 有 了 211個點。將這211個點套入手上的數據,則 你 必 然 會 得 到 ^ :0的迴歸結果,而所得的&也恰好的對的。

13-44


13.7殘差分析(「㊀^^!^^ 31131 乂㊀^) ―,殘差(「^(^!) 殘差(『^化^)的概念爲「模型中不能解釋的各部份」定義則是: 6

1 ~ 7;

^ 1 ~ 1,2,一,11

其中^是由^

夂、所計算出來的,而I與趴則由下面的正規方

111^(1101*111^1 6 ^ 1 1 3 ^ 1 0 1 1 ) ^ 1 ^ 《

&

^

^

不闾的模型會有不同的歿差。例如模型是^^^+^^ + ^的時候1即使 ( ^ , ^ ) , 這 0 對 资 料 都 沒 唷 燮 ' 所 得 的 戏 差 就 和 & 。 的 模 型 不 同 。

二.歹戔差分析(「^。!^ ^ 力 ^ )

【證明】因爲&二^ — ^ 又 7;

十 ^ \二 ^ 一 ^ 力 + ^ ^

二歹牛&

一义)

因此 2^、―夂)^!^^十^十趴^

―幻】^0十队^0二0

2,

【證明】因爲

13-45 ^計學評論


0

3, ^

6

^ ! 二

^ :2^1-么) 6

0

【證明】由

4,》凼^0 【 證 明 】 ^ ^ ^ ^ + ^ ) ^ ^ ^ ^ ! ^ ^ ) 4乂0十队乂0二0

三.殘差圖("^(!^^ |3101》之功能 殘差圖泛指將6 定在座標軸上的各種圆形。它可用來診斷^6^ = 0 及 4

乂&!^):^ 這兩個條件。 2

我們所用的模型,大體都是7^忧13。,^^這一類的形式。殘差相當 於 6 ^7 -^,~,夂) 4

1

因此可將���看成「估計6 」用的。最早的假設是6 4

4

1^(0, 一),利用殘

差圖,目的就是在模型已擬合完之後,回過頭來檢査一下看看我們最早關於 誤差6 ~ 1^(0, 口 )的假設,有沒有明顯的失誤。 2

如果看得懂上面的討論,對於下面的說明你就差不多會明白了 。


線性迴歸分析

四.對時間作殘差圖 取 ,1二1,2,…,!1 61

,而將仏^)定在座標圖上。在此,我們將資料的原

始次序看成時間。你們也許得到圖13.2中的其中之一的型態。如果概略像圖 1 3 . 2 ^ ,這樣的殘差圖就好像符合IX、^二^),^^^): ?之假設,又叫做誤 差的同質性(!^贈冗^^!^一)。你大概得到了正常的殘差。如果得到的是 圖13.2(1^

,這大概表示變異數不是常數,而是跟著時間增加而上升。這暗示

著,也許我們做「加權迴歸」會較好。如果得到的是13.2(0型,這暗示著模 型裡也許少了某一個一次項。至於13.2(3〉,則暗示著也許我們需要加進某一 個二次項。

五.對么作殘差圖

(^)

((!)

圖13.2四種殘差型態 我們仍然取 ,1:1,2,一,!1如前,但將(义,6》,定在座標圖上。你們也 61

許得到圖13.2中的其中之一的型態。如果概略像13.2(3〕,這樣的殘差圆就 好像符合2〈:0,

乂^众):?之假設,又叫做誤差的同質性

(!^!!!^∼^!化!^化力。你大概得到了正常的殘差。如果得到的是13.2(4 ,這 大概表示變異數不是常數,而是跟著時間增加而上升。這暗示著,也許我們 做「加權迴歸」會較好。也許對^先做某些變換會較好。如果得到的是圖13.2(0 型,這暗示著模型大概是選錯的。因爲這顯示的是有系統地先負後正。有時,

13-47 統計學評論


非^不可研究所統計學評論

勉強地硬叫模型通過原點也會產生這樣的現象。至於圆13.2(3〕,暗示著也許 我們需要加額外的項。比如加進某一個二次項,或者交叉項。

六. 對某自變數∼作殘差圖 我們仍然取^, 1 = 1,2,…^如前,但先選定一個〗而將^』1, 6》定在座標 圖上。你們也許得到圖13.2中的某中之一的型態。如果概略像圖13.2(3〉, 這 樣 的 殘 差 圖 就 好 像 符 合 ^ 二 0, ^ & 介 ) ^ 一之假設,又叫做誤差的同質 性(!^脚^^^-^矽)。你大概得到了正常的殘差。如果得到的是圖13.2(1^ , 這大概表示變異數不是常數,而是跟著時間增加而上升。這暗示著,也許我 們做「加權迴歸」會較好。也許對^先做某些轉換會較好。如果得到的是圆 13.2(0型,這暗示著模型大概是選錯的。因爲這顯示的是有系統地先負後正。 至於圖^^((!),則暗示著也許我們需要加額外的項。比如加進某一個二次項, 或者交叉項。

七. 殘差之檢定 (一)隨機性之檢定(怡51《0「巧^。!"!!^^) 1 . 連 檢 定 ( ^ ! ! ^ 6 3 ^ :—般以殘差(^)正負號出現的連續數(『皿)數來決 定隨機與否。 1. 1)111*13111-^31:8011 1681;:若乂(; 二 0

0

十 十 6 【 且 8 ^

^

十|!【

一般稱爲一階自我迴^^I莫5&(!^?亡-^!^^" 3111;0~1 6^6881^6 1110(161; ^ ( ! ) ) 其 中 爲 千 擾 項 & 1 1 0 6 1;醒),X稱爲自我相關係數 (^"化-⑦!^力&!^!! 006伍(^!^)。這個檢定的目的是看、,1: ^ :!乂…,11是 不是獨立的。(此時最好1: 二 1,2,…,!1代表某一個自然的次序,例如時間。 否則這個檢定是沒有什麼意義的。〉 1

我們以右尾的檢定爲例:

13-48


⑩ 0 @ 0 醋 鶴 飾

9

0

:人:0, 1^ : X 〉 0

假 如 0 〉 3。則接受8。;假如0 〈九,則拒絕3。;若屯《0 ^

、 ,

則無定論。(其中^和的値,要靠査1)111:1)111-^^3011表【 。、 12】

至於左尾的檢定是 8

0

0

0

我們會用

! : - ^

假如!)〉』則接受II。;假如0 〈 3 ^ , 則 拒 絕 I I 。 ; 若 ^ 0 5 3 ^ ,貝0 無定論。(其中(^和^的値,仍要靠查1)1111)111-^^8011査。〉 (二) 數 異 數 同 質 性 之 檢 定 可用8&忖16^ 檢定(參見第十二章) 3

(三) 常 態 性 檢 定 常用到的方法包括了。?適合度檢定、②^^適合度檢定、 0)1,11116^01:8檢定,和④常態機率圆((^々13100 。這些我們在第十四章 講。 殘盖乏撿定不外孚將^,^,…,、看成為II個11^的1^(0,

來加"檢

驗而已。一般我們不會在素、這II個61之間只嘴11-2個自由度的事實。 歿盖今析在责務上唷其^要】13為它著於要告訴我們^面所慠的迴歸

【12!這個表可見1)1111)111 311(1 ^ 3 * 3 0 1 1

(^!), 310^11^&,

口.173 。 我 們 不 附 上 , 是 因

為我們認為這不會考。你們只是去考碩士班耶! | 13-49 |


非88不可研究所統計學評論

是好是瓖。在老場裡^為需要大量的計算^所"不太唷機會被老刭。在實 務中》"上各檢定多藉電腦軟齄来傲'現在很少入用手來計其戏盖^並加 以兮析的3 。 我們雖邃沒噂耩到複迴歸,但是在複迴歸裡,戏盖兮析基本上是同樣 遺理的。逭一小段所講的^同樣適用在複迴歸裡。

13.8複迴歸分析 一.複迴歸線'I生模式(①口^?^ 11|163「 「69「6551〇门^(!^!) 這一節需要一些線性代數的工夫。但首先讓我們將符號略改一下。在簡 單的迴歸裡,我們用7 = 13。十13^ + 6 。這是有9 = 2 個 1 3 的 情 形 。 其 中 & 是 4-^X4-6的樣子,而截矩成爲|^ 。

「截矩」。我們要先將它改爲7

這樣的寫法對一般的!)個|3時較簡單。模型的公式是 V ^

^1十^2十…十^ 十8 ?

在上面,我們只要認定、-1總是成立,就變成「截矩」的形式。複迴歸的資 料基本形式如下(只是多加上足標1 ,表示這是第1個觀測値: (乂^^,…∼),1

^

1,2,…,!1

其自變數部份,一般都利用一個!^!)的矩陣X來表達資料模式:

^

乂11

^12

^21

^22

13-50 |

乂 叩


@0@@

線性^^歸^析

稱爲(這個複迴歸的)設計矩陣^681印!!!"^)。若設^ 乂二 ( 乂 1,72,'-',7 ^ 0

6 二 (^,^,…,&。〉【

則複迴歸的模型就可用矩陣的符號簡寫成 "

其中& ~ 11^ ^①,一),這一點和簡單迴歸是一樣假設的。複迴歸和簡單迴歸 的不同,只是在0的値是2還是比2大而已。如果要考慮到「截矩」的需要, 我 們 只 要 規 定 X 第 一 直 行 的 ^ ^ 1^ 1 ^ !, 2,∼,11便好。這裡,X中的各項, 也都是「假設都爲已知」。 關於13的點估計,可利用最小平方法而得到 X

II

13-4

[證明】9

二 2^『二 8 ^ 二 ( ^ ― 乂 ^ & ― 乂 ^ )

二 / 邓 ^ 乂 ^

+ ^ & 乂 ! ^

封向量13做微分,得

二―2乂 1 了十213 X X 1

二0

解之得

【13】符號1:表示「行列互換((^!!印。^)」。

13-51 ^祖培


^0 上面〖的公式,III惑浚^!時用3镓性代數中的矩?專計其(甚至還對向量嫩擻 今),想^會唷入看不權。嚕兩個^法可解決這個問祖』其一是取X為一個3x2 的小矩?專,你一步一步的硬其。此法雖苯,但你傲逷一兩欢之後,就會弄清楚上 面的符號究免在慠^付磨事3 。 不逷現在學生鄱不肯下苦功。(!)此茅二個^法是你至少要會背&的公式,固 為這個公式贵在重要。至於背^也不^死背1下面的思老逷程^可絮助你記得。 模 型 是 1 而 我 們 要 求 &

。首先煆設5 = 9〈完全沒有錤差)"則我們

有 5 ^ 乂0 ^

(^^)

遑個簡單的式子。而逭個式孑當然不對(固為慠迴歸就是儆狻6^0〉,但萬一對 1,我們就應该反解成

乂 -

1

^ ^

( 卿

這個遭理和V 二 3乂可解出X : 3 ^ 7 應 玆 是 一 樣 的 。 但 是 ^ 慑 豸 1 甚 麼 叫 嫩 乂 ― 1 " 的反矩?專)呢? 學逷一點點镍性代數的入(我得假設你至少知遭付磨叫矩?車、反矩陴^否則 你要老研究所實在很難)應玆知道'只唷^形(例如3x3或5x5逭一種的)矩?專^ 才可能有反矩陴的。一殽長^形的(例如8x4或10x5)^1^ ^是無法求出反矩啤 的。固此(^^)唷畤裉岑速X

- 1

的定義鄱邃沒唷』所"也不可能會正確。

解決的汸法是先想法子把(巧名)改寞成有一個^形矩啤的形式。例如狻X急 一個XIX ! ) 的 矩 陴 , 那 麼 把 X 的 列 燮 成 行 , 行 燮 成 列 ) 弒 是 一 個 ! ) X I I 的 矩 陣 。

而乂4乂就:!一個

13-52


^

(^) X !!) X (!! X 口) ^ 口 X 口 1

的方形矩陣!因此我們不妨在(巧^)的兩側同乘X 得到

因爲^乂〈看成爲一個矩陣)是方形的,所以我(門在(^.?)的兩側同乘以 (乂^)-

1

,得到

上面的討論並不是「解」13的方法,只是幫助你背卩公式的方法。

二. ^之抽樣分布 ^丽①,(^)-!?)

其中]VI^是指「多元常態分布」(111^^11;1V31:1&16 1101:11131 ^13^1'1I^^11:10I1),記住 在複迴歸裡&是維向量,它的分布非是多元的不可。

三. 變異分析表 我們將^0^\表列在表13.14裡。 在穠迴歸裡,除3苻號殺複雜之外,基本概念和簡覃迴歸充全柏同。例如 ^。,^在簡覃迴歸中是章態兮布』在複迴歸中?是將之改成^—艮,^,…,^^通 通都是章態兮布。332在簡迴歸中:1?兮布(杀上'遠在複迴歸裡也是對的, 唯 一 的 不 同 點 是 自 由 度 要 用 1 1 — ! ) ' (?)^ 2 是 簡 覃 迴 歸 的 惰 形 ) 。 而 8 8 2 和

13-53 統計孥評譎


^一非81不可研究所杌酊竽胖酾

(^, & 2 ,∼,^^獨立,也是對的。(!)此

複迴歸的六闪0^

表13.14

&

80111:06 11681*6881011

88

?-!

^

(

^

"

^

11681(111211 !!一!)

1

1

( 乂 - 乂 ― ^ )

1是一個全部是1的行向量 的基本形式(再綢節一下兮子兮母的章數)就是1;-兮布。逭呰工作用手嫩蜎頊入的 (尤其是在?犬的畤候)。但目黹鄱用敢邇来傲'固此「解雄軟徽報表」反而是比 鉸容易砉到的。

(一) |5|之100(1 ― "。/。信賴區間 " " 爿 良 ) 其中叭^)表示^的估計標準誤。它可由(^叉)— " 矩陣中對角線第1個 1

元素代入(用^82估計一)而得

14

1 。

(二) 關於|3的假設檢定 1.整體性((^^-&11〉 1^檢定

!^:&,&,…,∼不全爲。

1 1如果!^4,你用手做就十分吃力 14

13-54 I

2


線性迴歸分析

1+

譆留"到-'我們是從0 開始其的】遠著於是假設3 2

X矩啤的第一

行 全 是 1 。如果問^是「通過泞、點(無裁距)的模型』我們就是從(^起^ 。 不通,這時X的第一行就不是「全是1」的格式。

像這樣的問題裡,我們對!)個0中,只問了其中的9-1個。它應該怎 樣解呢?我們在此講一個更一般的情形:不妨假設我們要問 ^0

^ 2 = ^ = ^ 5

二0,13,&, 13 不盡爲二0 2

5

(對於這三個之外的13値,我們不聞不問。〉 首 先 , 我 們 將 矩 陣 X 的 第 二 、第四和第六行調到前三行來。我們可 得一個新的矩陣X,。它的前三行相當於13 , 13 , 13 。換句話說,模型 2

4

6

變成

而我們問:對於這樣的模型,它的前三行所對應的13、是否爲0? 所以,爲了簡單起見,我們不妨直接討論 只

^

0

2

―∼^0,仏:^,&,…,^不盡爲0〔"〈口〉

用上面的問題來討論,問題的本質是一樣的,但符號會簡單些。 將X分爲乂^及乂 兩個矩陣。其中X,爲II X 1:由X的前1,行組成;乂2 2

爲 I I X (!)-力由乂―的後9 - 1:行組成。我們寫 又 二 ^

:、)

設? ^ ( ^ , ^ , … ' [ ^ ) , ? 八 ^ ^ " , . . . 為 ) 【 。 而 原 模 型 1

~1

~2

"

就變成了

7十8

7^^-17 -1

∼2

~

而我們的問題就變成了 1 13-55 | ^計^^袋


非 ^ 不 可 研 究 所 ^ ^ 罾 , 冑

11 :7 ^卬'。,…,。)、!!, :7 ^。,。'…'(^ 0

~1

~1

解這樣的問題,步驟如下: (工)先以這樣的模型求出^ 。 〈2〉再自^^乂 2 7 十8這樣的「部分模型」中求出二 。 (!!-^^-? ②)取? : :^^

~ ?0, !!-?)

而在7的値大的時候拒絕8。。 對於這樣的問題,其實已有一點超過範園了。我們只將相II的&"0^ 表寫在表13.15裡。 現在回到可整體性的檢驗(?^ 9 - 1 的 情 形 〉 。 利 用 表 1 3 . 1 5 中 ^ 1 0 ^ 表之?-11爲檢定統言十量,^&絕^^。 ^ (!^ 〉

(口一 1, 11 一 口》,若^ 6 0 ,

表示這9-1個解釋變數同時引進模式中可以有效解釋V的變異。 表13.15 「3(1131複迴歸的/^0乂八 83

80111*06 ^116 10

|3

9 1

#

1:

61-1-0 !'

1:01:9.1

11

圹7


線性迴歸分析

第1+ 1單一的(〖!^^&!!^)

1;-檢定

這是「雙尾的形式,覃尾的^形,不論在左尾或右尾』|十^顏似」, 我們就不講3 。爿一個镦法是用上一小^中的1.-1的辧法』你們得到一 個自由度為(丄,II-?)的?兮布。遭理是一樣的'但用(;来看要直觀得多。

我們用

丁 丄 3〔

而在I X 1的値大於忆^!!-!))時拒絕8。。 複迴歸固然是最重要的疣計^法之一;但很妙的事:!它不易被老, 主要是^急在老試時1你不夂能要求;#生求一個!^!)矩障的反矩?專。多 半的畤候最多2是老一下0 = 2的時候,唷時3x3矩^的反矩障也是要 求的^ ^ 當 於 解 一 個 三 元 一 欢 方 ^ 式 。 目 ^

,大多數的禳迴歸工作都是

雷腦戟弒在慠。

例8.1某多元迴歸分析問題之資料如表13.16 。 表13.16某多元迴歸分析問題之資料 ^1

4

2

9

4

27

18

6

81

4

3

16

9

40

30

12

100

2

1

2

1

4

2

1

2

4

9

2

3

4

9

18

27

6

81

20

5

5

25

25

100

100

25

400

311111

50

15

15

55

51

187

179

51

666

1116&11

10

3

3

1

X】

^2

9

3

10

V

乂 乂 2

2


—非81不可研究所^旨&罾㈱@00@

(丄)此線性迴歸式爲》^ | 3 。 十 十 ^

2

^

,它的1101:111^1 6 ^ 1 1 ^ 1 0 1 1 8 是

2

請計算出線性迴歸方程式。 ②計算.II

2

⑧請說明3^與^ 如何影響乂? 2

解:卩)將結果帶入1101:11^1 6(111&410118 ,得 十15|3

50 = 5(3。

2

187 = 15(3。十55卩 1 十5113

2

179 = 1 5 ^ + 5 1 ^ + 5 1 1 3 2

利用聯立方程式可得八 ^

0

: -4.5,趴^2^ ^ 2

2.833

故迴歸方程式爲 歹 二 一 ^ + ^ 乂 ^ ^ 2.833x2 ②881

0

^

" ( ^ ^ )

2

1

x

1

^ 6 6 6 ~ 5 0 15 ^ 166 2

我們可代入迴歸方程式以求出所有的、,見表13.17 。 表13.17

^

2

VI

由此算出

13-58

^69!'633100 1*631111 0【6X3^(316 8.1 3

4

1

2

5

2

3

2

3

5

7.166

11.999

3.166

7.999

19.66、

9

10

2

9

20

1.834

- 1.999

- 1.166

- 1.001

0.335


線性迴歸分析

8811 = 33X0 - 3 5 2 = 1 5 6 . 6 6 7 II

2

^

-

^

94.08^/0

,則7會增加2個單位;當^不變

邙)當^不變時,則變動一單位之^

時,則變動一單位之^ ,則會增加2.833個單位V 。 遑14目老得唷點難3

,你需要3解一個三元聯立一攻^程式』這雖是高中

就该會嫩,但你邃記樣呢?步驟是要學一下的。我們又故^引用13。 , I 思 是锐,別人一岌要用我們的苻號,尤其是在老試的畤候。

例8.2

八II 017(111131"乂 1&381^-51^1131-68 1-6^1-6381011 111 1116 &17111: 7 =

1 ^

^ ^3X3

^8

18 & ^ 6 ( 1 1)0 & 83011)16 0【23 0^86^31:10113^ 1^681111;3 0? 031011131;10118 31:6 ^ 6 1 1 &8 ?0110^ 5 ^

~4

0

0~

0

10

7

,X【乂 二 4

0

7

5

3

X 、 ―

~12

乂1乂 ^ 118

& 11^

( ! ) 001111)161:6 1116 031011131)10118 1 0 0^1:3111 63^111131:63 0【4116 006^1016111;8 111

(^) 丁634: 1116 1171)0*116318 11131; ^ 〔3〉 0^10111316(1 ^ 1 6 I I

解:這是一個II ^

&I

2

1

^ |3 ^ ^ 2

3

^

0

^

1116 ^6^1*6881011 ^

23的「無截矩」模型。我們用公式(^.^硬解便好,因爲

一般的最小平方解,根本不管你有沒有截姖。 (工)X ^㊀乂^ 一 乂 十 。 2

(^) 1;887 ^ 0

7 ^

= 118 。 這 裡 的 「 I I 」 表 現 的 是 " ! ^ ^ " " " !0'1-

1116311

的意思,這是因爲模型中已假設了無截矩,因此最後所得的迴���方程 式通過原點,不需再針對原點做調節。用表??的公式,我們有

| 13-59 | 統計孥評^


第I十

8811 ^ ^ ^ ( ^ ^ ) "

1

X V ^ 〈XV 〉 ^ ^ 0 2 , 4, 3 〉 ^ 〈3, ― 1, 2 〉 1

^ 3 6 - 4 + 6 = 38 8 8 2 ^ 8 8 1 一 8811 ^ 118 — 38 0

80

表13.18 80111*06

88

(!丄

116^1:6331011

38

3

12.667

80

20

4

10*^1

118

隱 3.167

23

我們只寫答案,請自行驗算。 ? ^ 1^1811/1^82 ^ 3.167 ;自由度是3, 20 ; I I ^ 2

32.2^0

岑级的要點是「無栽距」,惫思是措0。 ^ 0 ^但這其實沒有真正的不一樣, 所謂的有載距情形'矩?車燮成11X4而已(第一個直行全配上1即可〉。^1此, 有沒有載距,模型都是

唯一的不同是X矩?專的最左逄第一個直^"不是全急1而已。

例8,3表13.19和表13.20爲調査4個變數相互關係統計分析結果,請 依據此結果回答以下問題: (!)所用的統計分析方法可能爲何? (^)此4個變數相互變動關係爲何?請以數學詳細說明。 2

(^)說明本題II 之數値代表什麼意義? 如何解釋1*1013 ^ ?各項數値的意義?哪一個變數可不列入解釋? 〈5〉研究的虛無假設(!!!!!! !!^^^!^^^)爲哪些?

13-60


線性迴歸分析

表13.19 80111X6

例8.3中的^1〇乂厶表

0?

33

3\18

3

950.16

316.72

6

99.43

16.57

9

1049.60

胞 ^

0 101&1

19.11

0.0018

尺001 1\182 ^ 4.07091, I I 二 0.9053 2

1)613611^6111 1116311 ^

45.20 ^ ^ 1 1 3 1 : 6 ( 1

I I 二 0.8579 2

解:這個題目也是蠻典型的,不要你計算,但是耍你解釋意義。因已有報表, 所以我們只給答案,希望你能從報表中核對。迴歸方程式是 》 二 化 ^ + ^ ) . 。 ^ ^4.67x2 一0.325x3 表13.20參數估計表 ^3.1-1&1^16

0?

111161-061)1; 1

8, 6 ^ 0 1 :

1 &1- 8 。 : 0 二 0

|1|

17.14

7.109

2.411

0.0525

^1

1

013

006

2.211

0.0691

^

1

4.67

816

2.576

0.0420

1

~0^325

0.488

-0.661

0.5296

2

^3

用、^ ,^變項引進該迴歸模式可以解釋X變項之變異佔?總變異之 2

90,530/0 。?1013〉 | ? | 爲 各 ^ ^ ^ 1 雙 尾 檢 定 之 口 - 乂 1 1 1 , 如 诒 1 1 ^ 6 ^ ( ^ ) 6

3

6

6

之?1-01?〉 1 7 1 = 0.0525表示?[! X | ^ 2.41 !] ^ 0.0525 ^ !) ~

^ 06

二 0 . 1 則 表 示 8 。 : 3。 :^),!^ :|3。 #0爲拒絕II。,其餘各値意義皆同。若 設0^ 二 0 . 1 則 唯 有 變 項 不 需 引 進 1 ^ 0 ( ^ 1 中 來 解 釋 ^ 。

| 13-61 酷^:


^-非81不可研究所罾㈱@0#@

例8,4以7對^,^ ^ ^ ^ 做複迴歸,模式爲 2

3

4

5

" ! ^ + ^ + … + ^

^

( 卿

得到下列部分^0^入表(見表13.21〉。 (工)請將上述的表13.21完成。 ②試問II

2

^ ?並在01 ^ 0.05下檢定

是否顯著? 表13.21 變異來源

部分八"八表

自由度

平方和

均方和

?-値

迴歸 80

殘差 總差

45

230

③若7對^ ^ ,、,、做複迴歸得殘差平方和爲8811 = 110 ,試問對此模式 2

3

②石)檢定8。 解:(!)

^ ^ ^ ^ ? ^ ^ ^ ^ ^ ) 表,見表13.22 。 表13.22

/^(^八表

變異來源

自由度

平方和

均方和

^値

迴歸

5

150

30

15

殘差

40

80

2

總變異

45

230

針對五個0都是0的檢定,計算出的&値是15 ? 謹 巧 , 扎 ) ^ 2.4495而言,應拒絕II。。若只是考慮8。

,對於 ^ 0 ,則

叫做1)^1:131化"。此時,應叫電腦造一個如13.22表,用前面已提 過的一般做法,看^的値及它的81^1^&1(1 6 ^ 0 1 ,由此算7値:

13-62


^

^

^

-

卿 》 傳統的用手來做的方法是算 ^ ^ ^ 8 1 ^ | ^

^

^

^

) : 30/1 :

一 矹 犯 " ^ ^ ^ ^ )

1

5

― 80/40 ―

而^。5(1, 40〉 ^ 4.0847 ,故應認定&本0 。但這是有點超過範圍的。

例8.5

^ 3111(^7 0^ 86^61:31 111111(11:6(1 ^1^0&8301:8 33131:163 111 3 131^6 5

61^811;7 ^161(16^ 1116 ?0110^111^ 1111111;1^16 8 二 2306十18人十1005十4900十1907十501 丁116 81;3111^31^ 61*1:0!" 0『1±6 1:68^601;1^6 6811111 &16(1 931*31116七61:8 31*6

② ) 鸭 ( 卩 ) ( ^ ) ^1X1&

& 9 5 ^ 001111^61106 111!;61:^313 & 11(1 1116 001*1*651)011(16111; 1-1*^1:103 0? 0

63011 0^ 1;11656 ^31 31116161:3 \^1161:6 ?01: 63011 131:0^63301: 1

1

5

1

8 ^ 1116 & 11111131 3 & ( ( ! ^ ! ^ ^ ) 3 二 !111111136『0^1)00^3 ^1:1^611 八 二

2 ^

!!!!!!!!^丄'0?

1300^8 \乂1:14;1:611

0【6X06116111; 31*1:10168 \^1:1忱611

0 二 11111111361: 0『?11. 0,8 8111)6^86(1 X

^ !!以!!!^!"

0?

6X^)61-161106

X ^ 1:63011111^ 6^3111311011

1-686111:6(1 ^

1 0卩0^

(工)?111 111 1;116 131^11^8 1)610^ ^ 6 ^ ^ ^ & ^ ! ! . (^) 31*1607 6X^)13.1^1 ^16 1113.11611068 011 口!"0『633013, 1110011163 1^7 111^110& 1

^ ^ 6 1 : 6 811*0113 6^1(161106 6X1318 3)1 (^. ^1161*6 1七^068 110七 (^) ^113\^61~ 丁1:116 01: ?&186. 1^ ?3136, 001^601; 11

006^&016111; 6 13

6511111 &16(1 1;0 1)6 230^ 0*1161: 300131 8016111:18*8 1111^111; 0011601; 0(1161: 831111)163

| 13-63 | 統計^^議


―非诅不可研究所統計學評論

【1-0111 1;116 331116 00|3111^10111 3 ^ 031011131;6 011161- 681:111131:6、 7116 ^1811:1131.111011 0^ ^ 6 8 6 63111113163 ^0111(1 1)6 06111)61:0^ &1*01111(1 1116 1;1:116 ^0^111311011

0【230,

解:〖1〉各|3的957。的可信區間分別爲 【64.44, 254.56】,【2.32, 33.68】,【45.12, 154.88〗 【372,4, 607.6】,【156.6, 223.32】,卜675.2, 775.2】 請自行驗證。 ^ 由 ^ 之 1 - 1 : ^ 1 0 可 知 , 在 8 , 八 , 0 , V存在時,IX教學評鑑),可以 不須引進1110(161中解釋8〈所得)。 ③?&186 : 130"只是其中一估計値,應更正爲"3101111(1 ^ 6

116

1)0^11131:1011 ^1116 0 「 。

1 3 - 9 虛 擬 變 數 ― 睡 " ^ & ㊀ ) 我們做迴歸的時候,總是假設自變數X是連續型的:我們可在 X ^ 1.32, X ^2.57這些「任意點」做。 前面學過的問题卻不是如此,例如夂6

5

0, 0之四種「處理」,

其中並沒有八^ 3 ^ 0 ^ 0的規定,甚至於八,3 0, 0也並不是需要是實敏(例 5

如四種不同的化學物質)。 如果某一個變項X ,是名義變項(!^!^!!" ^^&!)^)時,必須利用虛擬變 項量化再引進模式內。 例如問題中若有甲、乙、丙三位銷售量,我們欲比較他們的銷售成績, 用迴歸來解的話,可設模型爲 V; ^ 。 十 | 3 ^ 1 十 | 3 ! ) " 十 卩 0 十 ^ 2

| 13-64 |

3

2 1


^

其中,^表銷售量,\表交際費,而 0 ^ 二1若這一筆生意是由甲售貨員完成 二其它情形 0

2 1

若這一筆生意是由乙售貨員完成 :其它情形

這裡面0"就是所訂(^!!!!!^ ^ ^ 1 3 ^ 6 。這是利用0, 1的値的函數來表達屬 性資料的方法。因爲甲可由!^二:^,!^,-^)表示出柬;乙可由 0

1 ;

^0,0

^0表示出來;丙可由0^ ^ 0 , 0 ^ ^ 0 表 示 出 來 。

21

在這個問題裡,若& : 0 ,則表示交際費與銷售量無題著的相依(可用I 檢定)。若13

2

13 : 0 ,則表示銷售量和售貨員沒有顯著關係(用^檢定)。 3

以上是純將一個^0^\改成迴歸來做的方式。一般我們只有在有少數 的屬性變数時,才用^1111117^1:131)16的技術。 例9.1變異數分析與迴歸分析之關係:(線性模式11116^ !!!^&丄) 若某數學老師有三套教材(人8, 0

,該老師欲比較該三套教材對成績之影

響,今選定12個學生依完全隨機^驗設計乃得表13.23中的資料。 表13.23三套教材對成績之影響 教材

0

成^ 72

89

80

68

84

76

93

54

40

70

68

78

〔1〉利用0116-^37變異數分析,^0乂4表如表??所示。由於1^値 二 1.06 2 0所以接受II。,表示三套教材無顯著差異。


—非89不可研究所統計學評諭

〈2〉利用迴歸分析,則模型爲 ^ ^ 0 十 ^ " 十 卩 ^ 十 ^

VI

其中, 3^=1

\

2

1

厶教材

二0

0其它情形

:1

8教材

二0

其它情形

而 我 們 檢 定 8 。 : & ^ | 3 ^ 0 。 這 時 , 檢 定 統 計 量 是 7 1 ^ 8 1 1 / ^ 1 3 8 ,自 2

由度是〈2, 9 〉 。 而迴歸的^0乂八表,可見表13.24 。 表13.24例9.1中的六1^0^八表 80111*06

4丄

矹且

116516881011

451.167

2

225.583

^!!"。!"

1917.500

9

213.256

2368.667

11

1.059

0.3864

1 1 0 0 1 矹 8 2 ^ 14.59642, I I ^ 0.1905 2

1)613611(16111; 1116&11 二 72.66667, ^ 1 1 8 1 ; 6 ^ 只 由 表 中 知 7 値 ^

2

二 0.0106

1.059《0 ,所以接受3。表示, | 3 均 與 0 無 2

顯 著 差 異 , 即 ^ , ^ 無 法 有 效 解 釋 7 ;因此結果與^變異數分析結論完全相 2

同。 用虛掇燮數'2是把單向^10^利用迴歸的^法嫩而已。事實上,任何 複雜的贵驗狻計可已燮成迴歸的形式》用迴歸去傲的铉果也不會和原先的實驗設 計^矛盾。逭:10急此二者概念是全然一敎的。

13-66 ":''化:


^@線性迴歸分析

第I十

^精選練習 1.今某收視調査中心針對10個電視節目之排行調査,結果如表13.25 。

表13.25電視節目之排行調查 電視節目

1

2

3

4

5

6

7

8

9

10

男生排行

1

5

8

7

2

3

10

4

6

9

女生排行

5

10

6

4

7

2

9

8

1

3

在顯著水準爲107。之下,男女生對該10個電視節目之排行序有關係嗎? 2暑III 3 11131111&0^1111112 1)1*00688 1116 35861111)17 11116 8^)66(1 (&61 V ^38七11011^11: 1;0 3^&0^ ^ 6 !!!!!!!!)^! 0^ ( ! ^ & 0 ^ 6

&1:1;8〖01111(1 (!!!!-!!^ 4116

1

11181)601:1011 ^1:00688^ 1^0 1681; 1;1118七!^。)^, 01&II&&61116111: ^ ^ ^ ( ! & 31^11&41011 ^1161*6 1^116 881116 1)31011 0〖^811:1;8 \^^8 11181)6(^6(1 \^811&11^

&

^31*16^ 0^ 11116 8()66(18. ^3^)1& 13.26 1)610^ ^ 6 8 ^ 6 001160^6(1 (!^^. ( ! ) 611(1 1116 0011:61511;1011 006^6016111; 0【11116 8^)66(1 311(1 11111111)61: 0^ ( ! ^ & 0 ^ 6 13811:1:8【01111(1, 311(1 4684 1^ 1七13 81^1116081111; 01 二 0.05 ^ ?

表13.26

11116 5|36601 30^ ^6^601^6 ^3113

1.1116 81)66^

20

20

40

30

60

40

0 6 & 0 ^ 6 1)8^8

21

19

15

16

14

17

②(^^工。!)七116 68^1111&^6(1 1*6^6881011 6(1113*1011

161&468 11116 8^)66(1

10 111& 11\11![^&V 0【(!^&0^6 9511^8 &1111(1, 811(1 1;681; 15 1)116 6 1 18 31^111663111; 06 ^ 0.05 ^ (㊀)016^61015 & 9 5 ^ 00116(161106 1111;61:11&1 40 ^1:6^101 1116 1116311 11111111)61: 0^ ^6^601:1^6 1)31*1:8 &^ & 11116 81)66(1 0^ 50 &61; ^ ! " 111111111;6^ 3, 1116 83131^ (^) 311(1 \ ^ 0 ^ 6X^)61:161106 (乂) 0^ 1611 61111)107668 8116 38 &11。\^: X 、 ^ 1 2 . 8 , ^ 7 1 : 593.5, ^

^ 21.64

13-67 ;"? ? , I :【; '' . 1


―非报不可研究所統計學評論

》 ; 乂 ; 二 974.33,

二 44578.4

(工)^ !!&1; 13 1116 1111631^ 1 ^ 6 ^ 6 3 3 1 0 1 1 60(1131:1011 0 ^ 7

X?

7

(^) 1186 ^ 1 0 乂 八 ^ 0 01 二

0.05

口 6 1 『 I I I ^ 6 七 6 8 1 0 ^ 81^111^091106 0 ^ 1 6^^6331011 ^11:11 1

〈3〉 \^1131; 31*6 1;116 1)3310

353111111)1:10118

0 ^ 81111^16

1111631: 1*6^1*6881011

1110(161?

4^假設你對一組樣本數爲二十的樣本,&),1二1,2,一,20 ,用最小平方法 估計一簡單迴歸模型到如下的迴歸式:夂二-2^4、你發現、的觀察値 分佈在0和20之間,而由上述迴歸式所得出的殘差分佈在正負1之間。 當 你 正 覺 得 快 完 工 之 際 , 忽 然 發 現 你 漏 掉 了 一 個 樣 本 (!)若不改動已做成的迴歸式,請問該漏失樣本會有多大的殘差? 若用所有二十一個樣本重新計算之截距和斜率的最小平方估計値爲3 和13 ,請在下面兩題圈選正確的答案並解釋之: (^^將大於-2 0^)3將小於- 2 ((:)&將等於-2 (力不能決定 ②13將大於4 ① !)將小於4 ② 6將等於4 化)不能決定 遑是好趙目。 5^

^ 0 1 1 0 ^ 1 1 1 ^ ^1)16

^1-0^1115

86&8011

31101^6 1116 1116(11311 8011 !^!!!口㊀!^七"!^

311(1

1116

311101111七

0 ? ^0\^1;11

^1:10111!;111:6 1:68631*01161^3 0^4;&1116(1 1\\6 1116 0011 !!!:!:^. 7116

|~13^68 統計學評議

11^6

1)6611 00(^6(1亡0

1116

0 『 1 0 1 X 1 3 1 0 卩1&111;8一

&0111 1 4 100&110113 3(3!"053 & 0^1011131:10118 111


線性迴歸分析

731)16 13.27.

(又)1631; 1:116 111111 113^01;116818 ^13.1

18, 1 1 1 6 1 3 110 1111631,

^ 6 ^ ^ 6 3 8 1 0 1 1 1 ^ 6 ^ 6 6 1 1 1;6111 口^!^亡!!)^ 311(1 ^『0\\^10 ^ 乙61

0: 二 0.05

11163115 0 『 ^ 6

^

311(1 36161'!111II6 1;116 13-^31116^

表13.27

5011甶11^6「3III「6 3口3 0「0\^11

丁6卿61'&七111乇:

6.2

2.0

4.5

3.5

6.0

3.1

0

0.42

0.05

0.30

0.18

0.38

0.19

0.02

5.0

1

3.0

3.6

5.5

4.0

4.1

0.34

0.03

0.18

0.21

0.36

0.24

0.25

1611113 61*3.1:1116

6, 丁116 1*6^1*6381011 1110^61 15

8口1313086 1113七〈X ; (工)0^6

^》,1

18 3 6.^9^ 861; ^0111 ^ 1 8 !"!!^^^!.

1116 16381; 8(^1131-68〇3^1113七01^ 0 ^

110 ^61*1^^1:1011 13 (^) 0 ^ 6

二 1,2,國國國,II

1 0 0 ( 1 ― (^) /。 001111(161106 1111;61^31 0〖1116&II

1

(^) 0 ^ 6 七 1 1 6

1^68^01186

0

X 。 ^ (!]XI?1*6881011 0111 乂, 110 ^ 6 1 1 ^ 3 ^ 1 0 1 1 15 ! ! ^ ^ ^ ^ ) 6乂!^'6881011 0? &

『1111-6 1*651301136 ^ 2x^)13111

( ^ ^ ^ 1 * 6 8 8 1 0 I I 。!!丄^,

!^^")

1116 6 ^ ^ 1 6 3 3 1 0 1 1 0 『 3

1-63^)01156

(! 311(1

& ' ^ 6 1

100(1 ~

^1*6(1101:1011 111161^51 ^01: 3

乂。. (!^^^1*6881011 0111乂, 110 ^61*1^^1:1011 18 1166 331116 ( ! ^ ^ ^ , 3 131:6^10^10II 1 ^ 1 6 1 ^ 3 1 & ! ' 3 ("亡111:6

乂8 0011^31118 ^ 6

001-1-68^011(1111^ 00110(161106

111^61^31

『01, 1;116 1116311 1*68^01186 ^ 1. ? 1 1 ; 1 1 1 1 6

7 ^ |3 ^ ^ 2 ~ ^ ) ^ 匕乂七116

11161110(1 0 ^ 16&8^ 81311&163,七0

3

^ 6

3 & 1 3 1 , 6 0 0 1 ^ 6 3 111 1116 & 1 1 0 ^ 111^ ( ; ^ 已

X

0

1

V

1

3

2 5

3

4

5

6

&目不瓖。

厂13-69」 统 輕 ^


8,

8111)1)086

111 1116 ^^。!^!!丄!) 1 ) 6 * ^ 6 6 1 1 ^ ( ^ & ( ! ^ X! 111117 ^ 。 鹏 ) . 八 1 * 8 1 1 1 ( 1 0 1 1 1 3811111)16 0^

&V& 11^61*6816(1

3^/61^!!^-^^^)

8111(1

01)861^31:10118

(乂^,乂;) ^ 8 1 8 (!!:&^! 5111(1 8 811111316 11116&1 1 6 ^ 1 6 8 8 1 0 1 1 1^518

6*1:6(1 1111(161: 4116 6)110^1115 888111111)1:10118: 71

乂"

\^11086

^

+ 卩 , " 十 :

乂311168

01& 6x6(1 8, 8

( ^ ^ ! ) ! ! ^ ^ . 818 1101*111&1 ( ! ^ ! ^ ) ! ! ! ! 。 ! !

8 1 6 111^61)611(1611117

1(16111103117

1116&II 0 8111(1 ^3110110&

0

^ ?116

2

1 6 ^ 6 8 8 1 0 1 1 1110(161 18 6 ^ 6 ( 1 31101 1116 311&17818 0 ^ ^811:1211106 1^1)16 18 118*6(1 1111 &1)16 13.28. 1

表 1 3 . 2 8 八 " ( ^ 八 1 3 5 1 6 ,0「

8

88 11651*6881011

0^(7,∼)二

279

11

121

12

701)311 (丄)?10^6仇&4

1

0 , \\^161:6

^

18 1116 01(1111807丄 " 8(11131*6 6

( ^ ) 0 0 1 1 1 1 ) 1 1 * 6 0 0 1 1 6 1 & 1 1 0 1 1 0 0 6 & 1 6 1 1 1 ; 1 ) 6 1 ^ 6 6 1 1 X ! &11(1 (^) 0116 11101*6 111(161)611(16111; ^511*1811)16 18 51(1(16(1 &11(1 & 116\^ 1110(161 乂 巧 +

^ 十 | 3

2

2

十 6

18 6 4 ^ 6 丄 1 1 1 6 811111 0 ^ 8(111511:68 0亡6X10118 100. 1 6 8 1 ;

0.05 ,

(斗)^1101:1161:

13

0011011181011?

[& 13 3 ^ 6 ( 1 &11(1 81 116\^ 1110(161 5 ^ 0 6 十 卩 1 乂

十^3X3 4-6 18 ^ ^ ( ! . 111111 1151)01116818

1*681111; 111(110811^^ ^0.1

1

2

2

^ 2

^111 1 6 3 6 0 4 1)116

I I 。 : |3 二 0, 1^ : 卩 # 0 &1: 01 二 0 . 0 5 , 00X0^^16

1681111; 0 ^ 〈3〉 8111(1 (^), &6X^1^111

2

1;116

^ 又 ^ 6 1:681111:8 016 \^16 8&1116 0 1

趙目是用"出的'可是現在研究所的畢|生恐怕鄱嫩不出逭一趙3 。

13-70

^^


9 , 0 ^ 3 011 3 ^6^611(1611(3 ^31*1&1)16 ( ^ ) 3 1 1 ^ 011 0116 111^65)611(16111;

匕16 ( ^ )

力61(163 1;116 ^0110^111^ 111^01*11131:100:

( ! ) 1 ) 6 ^ 6 1 0 ^ 1:116 1638七8(11131,68 1*6^1*6831011 6(^113^1011 (!)

3111)1)056 1116 1116311 5^1131:6 &1X01 1^182 ^ 23.78 ^ ^1 01 ^ 0.05, 1;116 31^111^1031106

10.

^ ^ ^ ^ ^ ^ ,

0 ^ 1116 8 1 0 ^ 6 0 ^ 1116 1 * 6 ^ 6 3 8 1 0 1 1

11116 ^ ^

^

^

I ^

^

61.111 11131: 36118 3111^ 5 6 1 ^ 1 0 6 3 1111111001111311^61*8 1^ 001106!'116(1 31)0111; 1116 ^01111116 0 〖 8 6 ^ 1 0 6 3 03115^ 丁 116 ! ^ ^ 丄 ! ^

11111111)61: 0 【 8 6 1 ^ 1 0 6 1601111101 & I I 3

^ 1 0 1 ^ 8 111 31111081; 9【01301'!;1011 1 0 ^ 1 6 11111111)61: 0 ^ 861*^106 03115. 1)18011551011 ^ 6

861^106

1113113^61: 111(^10&168

\^\\2^

1116 1^6^ ^31-1&13168 111

^6661*111111111^ 1116 乂01111116 0 ^ 3 6 1 ^ 1 0 6 3 03118 3 6 6 1 1 1 七 0 1^6 1116 1111111136!" 0〖 001111311^61:8 18 1136, ^116 II11111 ! ) ^ ! ' 0 ^ 116^丄118七&11&!;丄0113, ^ 1 1 6 1 1 1 6 0 ? 1101; 3 11101161

011311^6

161X1^6! ^!!!^. 1

11&8 1)6611

1,60611七1 乂, &11(1 1116 ^ 6 1 8 ^ 6

(!!!^!!【61111)613111^68 163(1 10 11101,6 ^601116111; 001111)1^61:

1;1,01110165, 6 8 ^ 6 0 1 3 1 1 7 (工)06&116

111 ^ 0 ( 1 1 1 0 6 ( 1

11111)61*^6011^ & 1 ^ 0 0 I I 1^11:10116^1 0 ^ ' & 0 6 3 ^

&11(1 1181; ^ 6

^613611^6111; ^ 3 1 * 1 & ^ ^ ( ^ )

311(1 111(161)611(16111

& ^ ^ ( ^ ) 111 11118 0&86^ (^)人1113301

1

001181(161^11011 111 8616(2(^118 1^6(11(^1011 ^^13^\08

15【116

口【01)16111 0 ^ 00111116^!-!^. 06^1116 ^1131: 1116 00111116^1-1^ 11163113 3X1(1 1:116 ^0851)316 1-651111:8 31-6. ( ^ ) 15 00111116&]:1^ 3 003311)16卩1:01316111 111 11118 0 3 8 6 ? 1 ^ 0 ^ 七 0 3 ^ 0 1 ( 1 11;?

共锞性^0111116&!:辻力是指)^乂這個矩陣^ ^ 當 捿 近 於 一 個 逍 化 矩 陣 的 锖 形 。 此 畤 非 章 不 穩 定 , 面 迴 歸 就 嫩 不 ^ 。

13-71


非頃不可研究所統計學評論

第工十,

11.某工程材料商爲了解新產品之應變(^)與應力00間之關連,特請請營建系 之材料實驗室進行試驗,並取得實驗資料表13.29 。 (工)假設應變00與應力@滿足直線模型,請計算並列出直線迴歸方程式。 ②設

6 1

爲直線迴歸方程式之殘差,試證明^0

⑧同上,試證明^;、6^=0

。其中^^^+^),;。

表13.29新產品之應變與應力間之關連 1

2

3

4

5

6

7

8

9

10

應力00

30

40

40

50

50

60

70

80

80

90

應變⑦

1.6

2.1

2.6

3.6

4.2

4,3

4.9

5.5

5.3

6.2

12.如果你觀察某一國家1920到1960年間一個長期的總體時間序列所得與 消費的關係:^八。十八^十6 你發現第二次世界大戰(^^&:^^^)的 4

那段時間,所得和消費的關係似乎和長期的趨勢有所不同,請問在迴歸 分析中你要如何處理這段時間的資料? 如果你觀察某一國家1960到1997年間的總體時間序列所得與消費的關 係,你知道該過去嚴格的進口管制,自從1985年之後,解除貿易管制, 完全開放進口

,影響請問這個情況在迴歸分析中如何處理?

逭一通沒有標準答岽,全靠你一枝筆自己發揮。 13.某冰淇淋連銷店執行長欲瞭解夏季氣溫對冰淇淋銷售額的影響效果,隨 機觀察14天,其結果如表13.30所示。 ① 繪 製 平 均 銷 售 額 之 ( 旬 枝 葉 圖 一 : ! ! &11(1 1 6 ^ ⑨ 盒 鬚 圖 ( ^ ( ^ 6

311(1

^1118^6^ ( 力 計 算 叉 ^ , ^ ^ 、中位數、9 ,叉丽等五種彙總量數。(以 3

上(&)(^((:)三者之繪製圖表及粱總量數,必須併列對應表示之) (^)繪製散佈圖(^(;&忧61: 61^2^ (^)

(&)試問氣溫與冰淇淋平均銷售額之間,是否有線性關係,請計算兩者 相關係數1:,並予證明。⑨若兩者有線性關係,請利用最小平方(^犯^: 1116比。(!)估計法,求出線性關係方程式。

13-72


線性迴歸分析

第I十

〈4〉 (&)求判定係數^06伍016111; 0【^^^!!!&^!!),並解釋其意義。⑨求 2

調整後的1^(^118*6(1

,並與判定係數II 作比較。

(^)在0^ = 0.05下,是否有證據顯示氣溫與銷售額間存在線性關係? (^)若將氣溫資料轉換爲華氏(,)溫度,則新模式與原模式有何異同,請 說明之。(不必計算) 表13.30氣溫對冰淇汴『銷售額的量8響 4 2 3

5

22.8

23.9

26.7

47,040

50,400

57,400

66,080

6

7

8

9

10

氣溫

27.8

29.4

31.1

32.2

32.8

銷售額

63,000

75,040

81,200

87,920

85,680

11

12

13

14

氣溫

33.3

23.9

36.7

37.8

銷售額

90,720

53,760

75,200

91,840

21.1

氣溫

^

0

銷售額 曰

14. 8111)1)086 7011 1151(1 &0.1& 10 00X181^1 ^111101;1011 7

0

^ ^!'"!^^"

1

^1161:6

^ 6 0^01)13-1)01151& 1)10(1110*1011 8

乂 二 011*1)114 , 1| 二1&1)01: 1111)111;,

(工)110\^ ^0111(1 ^011 1681;七116 115^)0*116818

^&^^

311(1

&16 001181;&111;

16*111:118 ^0 8081& 1)386(1 011 ^ 6 1111168*1101:6(1 3111(1 1*681^1^01:6(1 16&81: 8(^11&

(^) 11*116 ^0111^

8&100^61:8 ^ 0 1)61:10(18, 1951-1970 &11(1 1971-1990, 110^ 1;681

I ^ 6 00^6X8

&^10&8^ 1951-1970 &11(1 1971-1990,

110^ ^0111(1 7011 1:681; 1113^ ^ 6 ^1*0(111011011〖1111(^1011 11&8 1111(161:50116 8 8*1*1101111:^1 01131156 1)6^6611 4116 1^0 1)61:10(18? 1 5 . 已 知 廠 商 之 廣 告 費 X 與 營 業 收 入 7

(十萬元)的迴歸模型爲

5 ( 7 ^ ^ ^ ^ + ^ ^殘差變異數乂虹^ I \ 〉 ^ 2 。 若 X 之 單 位 不 變 而 只 將

I 13-73


— 非 ! 8 不 可 研 究 所 ^ ^ " ^ ^ ^ ,

V的單位改爲〔萬元),則回歸模型成爲(丄)

,殘差變異數成爲

16.隨機抽測100名證券從業人員,得其性向測驗成績^的資料,由此樣本 資料檢定成續之母體分布是否爲常態分布,其檢定方法可以爲(工) 檢定法或

5001-6法,則可視分割點之常態分數

〈2〉―。若依11(^1^31

2 與&的座標點近於

^

算相關係數,依

布作母數0是否爲

線而作判斷;但最好是以 與^數列求 21

分布、或

(?)

分布、或

的檢定後,再作判斷。

(^)

遠是趁出程度的14目。 17. ^

811111)16 1^6^1-6881011 3II&17518 ^ 3 5

^61^01*1116(1 011 3 1-311(10111 33101316

^ 6 1 1 6 1 * 3 1 : 1 1 1 ^ ^ 0 1 1 0 ^ 1 1 1 ^ 31111111131'乂 81;31;181:108

》 》

^ 2

7 8 8 , 》 ^ 2 3 6 8 , 》 乂 ^ 128592 二44162,》

2

二 380858, 11 = 15

(丄)1)6^61013 1116 60(11311011 0^ 1116 1633七圍33!"6 11116 ( ^ ) 丁 6 8 1 化 " 3 ^11*601 161 &11。 11811^3 (^^ ( ^ ) ? 161^101; 乂 ^11611 ( ^ ) ?111(1 3 9 5 ^ 0

0 〉 1181115 ^ ~ 0.05

X ^ 6 0 ^八88111116 3 10 ^ 0

!'^^

1-6(1101:1011 111 ^ ! ^ ^ ! )

0011^1(161106 1 1 1 1 6 1 ^ 3 1 ^

18.抽査六家廠商,得電視廣告費^

,報紙廣告費^及銷售額7的資料,經

計算得迴歸變異昍化…人-^),殘差變異^^、,^)^",則 ^卜^與,的複判定係數爲

^

;但若拿掉自變數^的資料,可

得3320^ 〉 ^ 18 ,則^與7的相關係數爲

0

―。

逭也有點難。 19. 丁 0 36七61:1111116化!^^!;!!^!

1

0『3

^ ^ ^ ! '

6 X ^ 3 961:80111161 3『6 1166(16(1 &!" \^

3^6111;111 6 ^31*1^ ^ 0 1 1 1 ^ 111^6 ^0 &11(1 3 1110(161

^0111(1 &110\^ 111111 10 1 ) 1 : 6 ( 1 1 0 1 ; ^ 3 ^ 8

3 ^ 6 1 1 ^ & 1 1 0 6 63011 11101:11111^ 136(01:6

01)611111^ 1^386^ 011 1116 3&乂 0? 1116 \^66化311(1 3(51131*68 681;111131;1011 1681111;8 0? ^111111^ 3 0

1 13-74 琉計學評譎

^\\6

1

00111^11:10113^ 1.6&51; 8 0『&1:& &1*6 0011601:6(1 011


^第I十

^0線性迴歸分祈

X&1316 13.31.

表 1 3.31

1.6331 59口3「65 651![!1311011 「651)115 001131:3.111;

-110

? II 1-1111161:61*8

32

281101^68

^12

^13

89

14

(!^)

11— ^ 0.65 ; ?1^111-65 111 ^31-6111116863 31*6 34;&11(131'(! 1 ^ 6 ^ 1 & ^ ! ! ^ . X 。 ^ 1 辻 ^ ^ 6 6 ^ 6 1 1 ( 1 , 0 01; 1161*^186; X 。 ~ 1还8111111乂, 0 1;1161^186 ; 311(1 X 。 ^ ^1-6(1101:611 3311 乂 111^11 1:6111^61-31:111-6 (。?) ( 工 ) 2 x ^ 1 3 1 1 1 1116 1-6380111115 0 ^ 1635^ 3(11131,63 11161110(1

(^)

1111:61-1)1-61;

1116

006^1016111;3

6^1(^61106 ^0 000.01111^6 1^11^

0^ X 。

311(1 X 。 ,

18

^61*6

31156016^

11118 1110(161 18 1186^111 111 4116 131*6^10^10II 0【

3^611(131106?

( ^ ) 18 1;1161^6 811^1016111; 6 ^ 1 ( 1 6 1 1 0 6 七 0 0011011.1(16

1116&II 3^611(13.1106 111

01-63863 011 8111111 乂 〔13乂? (^) 8111)1)086 1:116 9 0 ^ ( ^ ^ ( ! ^ : ! ^ ) ! ! 0

3111111 乂 ^ 6 6 ^ 6 0 ^

1111:61^31【01: 6116 3 ^ 6 1 1 ( 1 3 1 1 0 6

& 01,6(11(^6(1

111^11

011 &

161111)61*31; 111*6 0【 95。? 18

〈625, 1135》1x1161'口'61; 11115丄!!^'^.

20,假設迴歸模型爲 二 0 6 十 ( ^ ; 十 7 : 十 6 ; , 丄 二 1,2,-'' ,11

【1又

則13之正確的最小平方估計式是

而3之不正確的最小平方估計式是

| 13-75 | 统計學評篛


非 ^ 不 可 研 究 所 ^ ^ " , ^ 冑 0 0 0 #

\…、∼∼

仏 . 2 ^ 工

我們也知道

2

〈1〉請證明6是^之不偏誤的(!!!^^化^)估計式,而13'是0之偏誤的估計 式。 若^ 爲、和 之間的相關係數,請詳細說明?巧:0.99對6和6'之 2

2;

偏誤性及有效性等基本統計性質的影響。

| 13-76 |


Regression of statgradexam 13