TVCT c3

4. Các tham số thống kê củamộtmẫu

„ Trị số bình quân:

„ Hệ số phân tán:

„ Hệ số thiên lệch:

x

x

i ∑ =

1

1

2

= ∑

k

C i

v

3

3

3

1

v

Cn

k

C

= ∑

x

x

k i

=

„Số đông: Là trị số xuấthiện nhiềunhất trong chuỗi

số: xd15

„ Sốđông xđ16

Ý nghĩa của các đặc trưng

„ Trị số bình quân

„ là đại biểu chung cho chuỗi số

„ bịảnh hưởng lớn bởi các giá trị cực đoan nhất

là trong trường hợp chuỗi thống kê ngắn17

„ Hệ số phân tán:

„ Biểu thị độ phân tán của chuỗi số

„ Là một số không có thứ nguyên nên có thể dùng

để so sánh các chuỗi số có thứ nguyên khác nhau18

„ Hệ số thiên lệch:

„ Nếu Cs>0 đường phân bố lệch dương

„ Nếu Cs<0 đường phân bố lệch âm

„ Nếu Cs=0 đường phân bố đối xứng19

Sai số lấymẫu:

Vì mẫuchỉ là mộtbộ phậnrấtnhỏ củatổng thể nên các đặctrưng

thống kê củamẫu không bằng các đặctrưng thống kê củatổng

thể, nó có mộtsaisố nhất định gọilàsaisố lấymẫu.

„ Đốivớitrị số bình quân

„ Đốivớihệ số phân tán

„ Đốivớihệ số thiên lệch

x

x

σ

σ = ()

Cv

x

100

% = ′ σ

Sai số tuyệt đốiSaisố tương đối

2

1

2

v

v

Cv C

C += σ () () %1

2

100

% 2

v Cv C

+= ′ σ

() 42

561

6

vv Cs

CC

++= σ () () 42

561

6100

% vv

Cs

CC

nC

++ = ′ σ20

6. Đường tần suất

„ Đường tầnsuấtlà đường quan hệ giữatần

suất và giá trị củabiếnngẫu nhiên.

„ Đường tầnsuất kinh nghiệm:

„ là đường cong trơn đi qua trung tâm nhóm

điểmbiểudiễntầnsuấtxuấthiệncủa đại

lượng ngẫu nhiên nhậngiátrị X≥xi

„ Đường tầnsuấtlýluận

„ là đường cong toán học được dùng để biểuthị

quy luậtphânbố xác suấtcủa đạilượng ngẫu

nhiên21

xi-1 xi

xxi

x

1 1

F(x) P

f(x)

p(xi

F(xi

Hμm mËt ®é x¸c suÊt Hàm mật độ tấn xuất

Hμm ph©n phèi x¸c suÊt

Hàm phân phốixác

xuất22

Đường tần suất kinh nghiệm lưu lượng bình quân năm vẽ trên giấy thường

400

500

600

700

800

900

1000

1100

1200

1300

1400

0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00

P(%)

Qn(m3/s) Đường tầnsuất kinh nghiệm23

Các công thứctínhtầnsuất kinh nghiệm

thường dùng trong thuỷ văn

„ Công thứctínhtầnsuất:

„ Công thứctổng quát:

„ Công thứcsố trung bình

Hazen

„ Công thứckỳ vọng

Kritxki Menken

„ Công thứcsố giữa

Chêgôđaép

m P

5,0 −

= 100%

1 +

=

m P 100%

4,0

3,0

+

=

m P 100%

m xXP =≥ )(

2b1n

bm )xP(X i

−+

=≥24

Giấytầnsuất

§−êng tÇn suÊt l−îng m−a mïa -tr¹m madrak

5,00%

3,00%

1,50% 1,00%

0,50% 0,33%

0,20%

0,10%

0,01%

10,00%

20,00% 25,00%

30,00%

40,00%

50,00%

60,00%

70,00%

75,00% 80,00%

85,00%

90,00%

95,00%

97,00%

99,00%

99,90%

99,99%

2,00%

0

200

400

600

800

1000

1200

1400

P(%)

L−îng m−a X(mm)

C¸ c tham sè thèng kª

XTB = 558 mm

CV = 0,25

CS = 0,5

D¹ ng ph©n bè: Pearson

III25

Vẽđường tầnsuất kinh nghiệm

„ Lậpbảng mẫu

„ Cột1: Thứ tự

„ Cột2: Chuỗisố liệu đãsắpxếptừ

lớn đếnnhỏ

„ Cột3: Hệ số biếnsuấtKi

=Xi

/Xbq

„ Cột4: Tínhtầnsuấtkinhnghiệm

theo một trong các công thứctần

suất kinh nghiệmthường dùng

trong thuỷ văn

„ Chấm quan hệ cột1 hoặccột 3 và cột4

lên giấytầnsuất

„ Vẽđường cong trơn đi qua trung tâm

nhóm điểm được đường tầnsuấtkinh

nghiệm

TT Xi↓ Ki Pi

(1) (2) (3) (4)

Th.h

3 đ26

Đường tần suất lý luận

„ Đường tầnsuấtlýluận

„ là đường cong toán học được dùng để biểuthị

quy luậtphânbố xác suấtcủa đạilượng ngẫu

nhiên

„ Các dạng đường tầnsuấtlýluậnthường

dùng:

„ Luật phân phốixácsuất Pearson III

„ Luật phân phốixácsuất Kritxki-Menken

„ Ảnh hưởng của các tham số thống kê đến

dạng đường tấn suât27

Hμm mËt độ x¸c suÊt lý thuyÕt vÏ tõ mÉu c¸c tμi liÖu thùc

nghiÖm

x

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

<2030405060708090100>105

f(x)28

Luật phân phốixácsuất Pearson III

„ Tác giả: Nhà thống kê sinh vậthọcngườiAnh

Pearson

„ Điềukiện để lậphọđường cong hàm mật độ xác

suất:

„ Tạisốđông hệ số góc củatiếptuyếnbằng 0

„ Hai đầuhoặcmột đầunhậntrục hoành làm đường

tiệmcận

„ PT vi phân củahọđường cong hàm mật độ xác suất:

dx

xcxcc

xfxx

xdf

d

2

210 ++

=29

Luật phân phốixácsuất Pearson III (tiếp)

„ Chuyểngốctọa độ về trị số bình

quân. và giải được 13 nghiệmkhác

nhau (họđường Pearson)

„ Vớic2=0 thì nghiệmlàhàmmật độ

Pearson III có dạng:

„ x0: giá trị nhỏ nhấtcủa hàm mật

độ xác suất

() 0 1

0

xx

exxxf

−− −

Γ

= β α

α

α

β

x

CC

C

sv

==

2

4

2

βα

x

C xx v 2

0 −=

Cs

y0

xđ ⎯x

a

d

y

x

0

sv ccx ,,30

Luật phân phốixácsuất Pearson III (tiếp)

„ Khi chuyểntrụctọa độ về vị trí sốđông, phương trình

hàm mật độ có dạng:

„ Trong đó

„ y0: là giá trị lớnnhấtcủa hàm tương ứng vớisố

đông xđ

„ d: bán kính lệch (khoảng cách giữatrị số bình quân

và sốđông)

„ a: khoảng cách từ vị trí sốđông đếngiátrị nhỏ nhất

y0

xđ ⎯x

a d

y

x0

sv ccx ,,

d

x

d

a

a

x

yxf

+= .)1()( max31

Luật phân phốixácsuất Pearson III (tiếp)

„ Đặc điểm chính:

„ Dạng hàm mật độ xác suấtcómộtsốđông, một đầubị chặn

tạix=x0, một đầunhậntrục hoành làm đường tiệmcậnkhix

→+∞

„ Có 3 đặctrưng ⎯x, Cv, Cs là tham số. Khi các đặctrưng này

đượcxác định thì hàm mật độ xác suấtvà đường tầnsuất

đượcxác định

„ Phân phốilệch phụ thuộc vào bán kính lệch d

„ d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số

bình quân)

„ d<0: lệch âm (đỉnh của hàm mật độ nằm bên phảitrị số

bình quân)

„ d=0: đỉnh củahàmmật độ trùng vớivị trí số bình quân

„ Điềukiện ứng dụng:

x

x

k

k

C CC v

sv

0

0

0

1

2

2 =

≤≤32

Đường tầnsuất

+∞

−− −

+∞

Γ

==≥=

0

0

0

1

0 )()()(

x

xx

x

dxexx xfxXPxF β α

α

α

β

∞ −

+=

0

.)1()( max

x

d

x

d

a

dxe

a

x

yXF

Tầnsuấtcủa đạilượng X: 33

Bảng Fôxtơ-Rưpkin

„ Bảng Fôxtơ-Rưpkin: thể hiện quan hệ giữa Φ (khoảng

lệch tung độ) vớiCs

và P.

„ xP (giá trị của ĐLNN X tương ứng vớitầnsuấtP)

„

„ Trong đó: Kp là hệ số biếnsuấtcủa đạilượng X

)1( +Φ== v pP Cxxkx

),(

1

PCf

C

Kxx

v

x

=

=

σ34

Trích bảng Fôxtơ-Rưpkin

Bảng tra khoảng lệch tung độ Φ của đường tần suất lý luận Piếc-sơn III

Cs P 0,01 0,1 0,5 1 3 5 10 20 50 70 75 90 95 97 99 99,9

0,0 3,72 3,09 2,58 2,33 1,88 1,64 1,28 0,84 0,00 -0,52 -0,67 -1,28 -1,64 -1,88 -2,33 -3,09

0,1 3,94 3,23 2,67 2,40 1,92 1,67 1,29 0,84 -0,02 -0,53 -0,68 -1,27 -1,62 -1,84 -2,25 -2,95

0,2 4,16 3,38 2,76 2,47 1,96 1,70 1,30 0,83 -0,03 -0,55 -0,69 -1,26 -1,59 -1,79 -2,18 -2,81

0,3 4,38 3,52 2,86 2,54 2,00 1,73 1,31 0,82 -0,05 -0,56 -0,70 -1,24 -1,55 -1,75 -2,10 -2,67

0,4 4,61 3,67 2,95 2,62 2,04 1,75 1,32 0,82 -0,07 -0,57 -0,71 -1,23 -1,52 -1,70 -2,03 -2,54

0,6 5,05 3,96 3,13 2,75 2,12 1,80 1,33 0,80 -0,10 -0,59 -0,72 -1,20 -1,45 -1,61 -1,88 -2,2735

Ứng dụng bảng Fôxtơ-Rưpkin

P(%) 0.11.05 10.. 50.. 7580909999.9

Φ(Cs,P)

Kp=Φ.Cv+1

xp=Kp.⎯x

Lưuý: KhiCs<0 thì Φp (Cs<0)=-Φ100-P(Cs>0)

VD: Φ1%(Cs=-1)=-Φ99%(Cs=1)=1,5936

Luật phân phốixácsuất Kritxki-Menken

„ Điềukiện:

„ Có thể dùng 3 đặctrưng ⎯x, Cv, Cs làm tham số của hàm

mật độ

„ Chỉ có mộtsốđông

„ Giá trị của ĐLNN nằm trong phạmvi 0≤x≤+∞

„ Phương trình hàm mật độ xác suất:

„ Trong đó: a, b là các hằng số;

„ Ứng dụng: Tương tự hai ông Kritxki-Menken cũng lập

bảng tra sẵnhệ số môđuyn Kp phụ thuộcvàoCv, Cs và P.

a

x

ex

xf

1

1

− −

Γ

=

α α

α

α

αα

α

2

2

1

v x C

x

= ⎟

=

σ

α37

Giấytầnsuất

§−êng tÇn suÊt l−îng m−a mïa -tr¹m madrak

5,00%

3,00%

1,50% 1,00%

0,50% 0,33%

0,20%

0,10%

0,01%

10,00%

20,00% 25,00%

30,00%

40,00%

50,00%

60,00%

70,00%

75,00% 80,00%

85,00%

90,00%

95,00%

97,00%

99,00%

99,90%

99,99%

2,00%

0

200

400

600

800

1000

1200

1400

P(%)

L−îng m−a X(mm)

C¸ c tham sè thèng kª

XTB = 558 mm

CV = 0,25

CS = 0,5

D¹ ng ph©n bè: Pearson

III38

Ảnh hưởng của các tham số thống kê đến

đường tầnsuất

„ Ảnh hưởng củatrị số bình quân:

„ Trị số trung bình ảnh hưởng đếnvị trí của đường tần

suấtso vớitrục hoành.

Cv=const

Cs=const

⎯X2>⎯X>⎯X1

P%

Kp

⎯X ⎯X1

⎯X2

⎯X1<⎯X239

Ảnh hưởng của các tham số thống kê đến

đường tầnsuất(tiếp)

„ Ảnh hưởng củahệ số phân tán

„ Hệ số Cv ảnh hưởng đến độ dốccủa đường tầnsuất

⎯X =const

Cs=const

Cv2

> Cv1

P%

Kp

Cv2

Cv140

Ảnh hưởng của các tham số thống kê đến

đường tầnsuất(tiếp)

„ Ảnh hưởng củahệ số thiên lệch

„ Hệ số Cs ảnh hưởng đến độ cong của đường tầnsuất

⎯X =const

Cv=const

Cs2

> Cs1

P%

Kp

Cs>0

Cs<0

Cs=041

8. Phương pháp vẽđường tầnsuấtlýluận

thường dùng

„ Phương pháp thích hợpdần

„ Phương pháp 3 điểmcủa Alechxayep

Nguyên tắc chung:

„ Xác định các tham số thống kê (⎯X, Cv, Cs)

„ Lựachọndạng phân phốixácsuất

„ Sử dụng các bảng tra xác định tọa độ đường tầnsuấtlýluận

„ Kiểmtrasự phù hợpgiữa ĐTSKN và ĐTSLL và điềuchỉnh

P(%) 0.11.05 10.. 50.. 7580909999.9

Kp

xp=Kp.⎯X42

Phương pháp thích hợpdần

„ Vẽđường tầnsuất kinh nghiệm

„ Xác định các đặctrưng thống kê: ⎯X, Cv

„ Giảđịnh Cs=mCv, vớim=1(hoặc 2,3,4,5,6)

„ Lựachọndạng đường phân phốixácsuất (PIII hoặc

KM)

„ Xây dựng đường tầnsuấtlýluận

„ Kiểmtrasự phù hợpgiữa đường TSLL và đường

TSKN

„ Nếuchưaphùhợpgiả thiếtlại m và tính lại

„ Nhận xét: Phương pháp trực quan, dễ dàng nhậnxét

và xử lý điểm. Nhược điểmlàphảithử dầnmấtnhiều

thờigian43

Ví dụ về so sánh sự phù hợpgiữa

ĐTSLL và ĐTSKN

§−êng tÇn suÊt l−îng m−a mïa -tr¹m

madrak

5,00%

3,00%

1,50% 1,00%

0,50% 0,33%

0,20%

0,10%

0,01%

10,00%

20,00% 25,00%

30,00%

40,00%

50,00%

60,00%

70,00%

75,00% 80,00%

85,00%

90,00%

95,00%

97,00%

99,00%

99,90%

99,99%

2,00%

0

200

400

600

800

1000

1200

1400

P(%)

L−îng m−a X(mm)

C¸ c tham sè thèng kª

XTB = 558 mm

CV = 0,1

CS = 0,2

Chưaphùhợp44

Ví dụ về so sánh sự phù hợpgiữa

ĐTSLL và ĐTSKN

§−êng tÇn suÊt l−îng m−a mïa -tr¹m

madrak

5,00%

3,00%

1,50% 1,00%

0,50% 0,33%

0,20%

0,10%

0,01%

10,00%

20,00% 25,00%

30,00%

40,00%

50,00%

60,00%

70,00%

75,00% 80,00%

85,00%

90,00%

95,00%

97,00%

99,00%

99,90%

99,99%

2,00%

0

200

400

600

800

1000

1200

1400

P(%)

L−îng m−a X(mm)

C¸ c tham sè thèng kª

XTB = 558 mm

CV = 0,2

CS = 0,4

Phù hợp45

Phương pháp 3 điểm

„ Vẽđường tầnsuất kinh nghiệm

„ Lựachọnbộ 3 điểmtrên đường TSKN

(x1, p1), (x2, p2), (x3,p3)

„ Nên chọnbộ 3 điểm đãcósẵnbảng tra:

VD: (X1%, X50%, X99%)(X3%, X50%, X97%)

(X5%, X50%, X95%)(X10%, X50%, X90%)

„ Tính hệ số lệch S

31

231

31

231 2 2

φφ

φ φ φ

− +

=

− +

=

xx

xxx

S46

Phương pháp 3 điểm(tiếp)

„ Tra quan hệ S=f(Cs) xác định Cs

„ Tra Φ50%, Φ1-Φ3 theo Cs

„ Tính độ lệch quân phương

„ Tính Xtb =X50%-σΦ50%

„ Tính hệ số phân tán Cv

„ Có⎯X, Cv, Cs vẽđường TSLL. Kiểmtrasự phù hợp

của Đường TSLL và đường TSKN

31

31

φφ

σ

=

xx

X

Cv

σ

=47

Ví dụ về so sánh sự phù hợpgiữa

ĐTSLL và ĐTSKN

§−êng tÇn suÊt l−îng m−a mïa -tr¹m

madrak

5,00%

3,00%

1,50% 1,00%

0,50% 0,33%

0,20%

0,10%

0,01%

10,00%

20,00% 25,00%

30,00%

40,00%

50,00%

60,00%

70,00%

75,00% 80,00%

85,00%

90,00%

95,00%

97,00%

99,00%

99,90%

99,99%

2,00%

0

200

400

600

800

1000

1200

1400

P(%)

L−îng m−a X(mm)

C¸ c tham sè thèng kª

XTB = 558 mm

CV = 0,1

CS = 0,2

Chưaphùhợp48

Ví dụ về so sánh sự phù hợpgiữa

ĐTSLL và ĐTSKN

§−êng tÇn suÊt l−îng m−a mïa -tr¹m

madrak

5,00%

3,00%

1,50% 1,00%

0,50% 0,33%

0,20%

0,10%

0,01%

10,00%

20,00% 25,00%

30,00%

40,00%

50,00%

60,00%

70,00%

75,00% 80,00%

85,00%

90,00%

95,00%

97,00%

99,00%

99,90%

99,99%

2,00%

0

200

400

600

800

1000

1200

1400

P(%)

L−îng m−a X(mm)

C¸ c tham sè thèng kª

XTB = 558 mm

CV = 0,2

CS = 0,4

Phù hợp49

Ví dụ bảng tra S~Cs trường hợp P=1_50_99%

S012345678 9

0 0.00 0.03 0.05 0.07 0.10 0.12 0.15 0.17 0.20 0.23

0.1 0.26 0.28 0.31 0.34 0.36 0.39 0.41 0.44 0.47 0.49

0.2 0.52 0.54 0.57 0.59 0.62 0.65 0.67 0.70 0.73 0.76

0.3 0.78 0.81 0.84 0.86 0.89 0.92 0.94 0.97 1.00 1.02

0.4 1.05 1.08 1.10 1.13 1.16 1.18 1.21 1.24 1.27 1.30

0.5 1.32 1.36 1.39 1.42 1.45 1.40 1.51 1.55 1.58 1.61

0.6 1.64 1.68 1.71 1.74 1.78 1.81 1.84 1.88 1.92 1.95

0.7 1.99 2.03 2.07 2.11 2.16 2.20 2.25 2.30 2.40 2.39

0.8 2.44 2.50 2.55 2.61 2.67 2.74 2.81 2.89 2.97 3.05

0.9 3.14 3.22 3.33 3.46 3.59 3.73 3.92 4.14 4.44 4.9050

Ví dụ về bảng tra quan hệ Cs~Φ

Cs Φ50% Φ1%-Φ99% Φ3%-Φ97% Φ5%-Φ95% Φ10%-Φ90%

0 0.000 4.652 3.762 3.290 2.564

0.1 -0.017 4.648 3.756 3.287 2.560

0.2 -0.233 4.645 3.750 3.284 2.557

0.3 -0.055 4.641 3.743 3.278 2.550

0.4 -0.680 6.637 3.736 3.273 2.543

0.5 -0.081 4.633 3.732 3.266 2.532

0.6 -0.100 4.629 3.727 3.259 2.522

0.7 -0.116 4.624 3.718 3.246 2.510

0.8 -0.132 4.620 3.709 3.233 2.49851

9. Phân tích tương quan

a. Khái niệm chung

x

y

x

y y

x

y

x

y

c

Quan hệ hàm số

Quan hệ độclập

(Không quan hệ)52

Quan hệ tương quan

„ Hai đạilượng X và Y đượcgọilàcóquanhệ tương quan thống

kê với nhau nếuvớimỗitrị số củaX, đạilượng Y có thể nhận

các giá trị khác nhau mộtcáchngẫu nhiên. Ngượclại, vớimỗi

giá trị của Y thì X cũng có thể nhận các giá trị khác nhau một

cách ngẫu nhiên. Tuy nhiên, nếutậphợp nhiềusố liệuthống kê

thì quan hệ giữa X và Y có tính quy luậtvàtạo thành mộtxuthế

nào đó.

x

y

x

y

Tương quan tuyến tính Tương quan phi tuyến53

b. Tương quan của2 đạilượng ngẫu nhiên

Đường hồiquy

„ Đặttương ứng mỗigiátrị của đạilượng này vớigiá

trị trungbìnhcủa các giá trị tương ứng của đạilượng

kia ta đượchàmhồi quy. Đường phốihợptốtnhất

biểuthị hàm hồi quy củatổng thểđượcgọilà đường

hồiquy.

„ Tương quan giữa hai đạilượng X và Y đượcgọilà

tuyếntínhnếucả hai hàm hồiquy đềulàtuyến tính.

„ Đường hồiquycủa y theo x là: y = f1(x)

„ Đường hồiquycủa x theo y là: x=f2(y)54

Xây dựng phương trình hồi quy của Y theo X

y = 0.041x + 1.1284

0.00

5.00

10.00

15.00

20.00

25.00

0.0 100.0 200.0 300.0 400.0 500.0

X

Y

(xi

,yi

(xi

,y)

xi

yi

y55

Xác định phương trình hồi quy bằng

phương pháp giải tích

„ Phương trình của đường thẳng hồiquy

y = ax +b

„ Khoảng lệch giữa điểmthực đo(xi

, yi

) với đường

thẳng hồiquylà:

yi

-y = yi

-(axi

+b)

„ Theo nguyên lý bình phương nhỏ nhất, muốncho

đường thẳng phốihợptốtnhấtthìtổng bình phương

củakhoảng lệch phảinhỏ nhất, nghĩalà:

() ( ) ∑∑ = =

=−−=−

axbyyy

1

2

1

2

min56

„ Muốnvậy:

„ Giảihệ phương trình trên rút ra a, b và thay vào ta có:

„ Trong đó γ là hệ số tương quan

0

0

2

2

=

−−∂

=

−−∂

baxy

a

baxy

() xxyy

x

y

−=−

σ

σ

γ

() () ∑∑

∑ =

− −

−−

=

yyxx

yyxx

2 2

1

γ

== i i

1157

Ví dụ

„ Xây dựng quan hệ tương quan giữa hai đại lượng Y

và X dựa trên tài liệu thực đo.

STT Xi

Yi

(Xi

-Xtb) (Yi

-Ytb) (Xi

-Xtb)2 (Yi

-Ytb)2 (Xi

-Xtb)(Yi

-Ytb)

1 359.7 9.49 79.70 -3.11 6351.48 9.679 -247.95

2 236.9 7.56 -43.09 -5.04 1856.64 25.410 217.20

3 199.6 6.70 -80.46 -5.90 6473.75 34.806 474.68

4 268.3 14.04 -11.73 1.43 137.48 2.058 -16.82

5 205.3 11.34 -74.73 -1.26 5584.68 1.599 94.49

6 215.0 10.80 -65.02 -1.81 4228.06 3.258 117.37

7 212.6 9.73 -67.46 -2.88 4551.14 8.284 194.17

8 250.6 9.21 -29.44 -3.40 866.82 11.545 100.04

9 255.3 9.78 -24.73 -2.82 611.80 7.949 69.74

10 329.7 12.31 49.65 -0.30 2465.31 0.088 -14.70

11 181.2 12.41 -98.80 -0.20 9761.19 0.039 19.54

12 312.6 12.29 32.59 -0.31 1061.97 0.095 -10.07

13 301.7 11.78 21.62 -0.82 467.42 0.675 -17.76

14 249.4 14.80 -30.65 2.20 939.46 4.821 -67.30

15 206.4 12.21 -73.65 -0.39 5424.12 0.153 28.82

16 401.7 19.18 121.64 6.58 14796.93 43.304 800.48

17 298.0 14.69 17.92 2.09 321.23 4.368 37.46

18 286.2 10.29 6.20 -2.31 38.49 5.338 -14.33

19 402.8 22.46 122.72 9.86 15060.03 97.197 1209.87

20 427.8 20.99 147.72 8.38 21821.00 70.274 1238.32

TB 280.0 12.60 Tổng 102819.01 330.94 4213.2658

Xây dựng phương trình hồi quy của Y theo X

y = 0.041x + 1.1284

0.00

5.00

10.00

15.00

20.00

25.00

0.0 100.0 200.0 300.0 400.0 500.0

X

Y

γ = 0.759

c. X¸c ®Þnh ph−¬ng tr×nh t−¬ng quan b»ng ph−¬ng ph¸p ®å gi¶i

- Ph−¬ng ph¸p ®å gi¶i lμ ph−¬ng ph¸p x¸c ®Þnh ®−êng håi quy b»ng c¸c vÏ

®å thÞ quan hÖ hai ®¹i l−îng ngÉu nhiªn. Ph−¬ng ph¸p ®å gi¶i ®−îc tiÕn hμnh theo

nh÷ng b−íc nh− sau:

1. ChÊm ®iÓm quan hÖ thùc nghiÖm gi÷a hai ®¹i l−îng X vμ Y.

2. Qua trung t©m nhãm ®iÓm quan hÖ kÎ ®−êng th¼ng sao cho phï hîp nhÊt

víi c¸c ®iÓm kinh nghiÖm vμ coi ®−êng ®ã lμ ®−êng håi quy tuyÕn tÝnh cã d¹ng:

y=b0+b1x.

3. X¸c ®Þnh gi¸ trÞ b0 vμ b1 b»ng c¸ch chän hai ®iÓm bÊt kú trªn ®−êng th¼ng

®· vÏ cã to¹ ®é lμ (x1, y1) vμ (x2, y2. LËp hÖ ph−¬ng tr×nh:

y1=b0+b1x1

y2=b0+b1x2

Gi¶i hÖ ph−¬ng tr×nh trªn sÏ t×m ®−îc b0 vμ b1.

4. HÖ sè t−¬ng quan trong tr−êng hîp nμy x¸c ®Þnh:

α = cos ⎯ π

Víi m - sè ®iÓm ë gãc phÇn t− thø I vμ III, n - tæng sè ®iÓm quan hÖ. 60

Hinh 4.8 Quan hÖ Y ~ X vμ X ~ Y

0

1

2

3

4

5

6

7

8

9

10

0246810

X

Y

α

β

β

),( yx61

Ý nghĩacủahệ số tương quan

„ Kiểmtramức ý nghĩacủaviệcxác định các

phương trình hồi quy:

„ Phương trình hồiquy

„ Các tham số và hệ số tương quan củapt hồi

quy

„ Các tham số: a,b

„ Hệ số tương quan: r62

Ý nghĩacủahệ số tương quan

),(

2

1

2 ~

pvb t

=

r - Hệ số tương quan

tb(v,p).

-giátrị tra bảng củatiêuchuẩn Student

v - bậctự do: v=n-2

p - Mức đánh giá (%)

Mức có ý nghĩa đượcchọn theo mục đích yêu cầu

củathực nghiệm, thông thường: p≤ 5%63

c. Tương quan đabiến

„ Phương trình tuyến tính biểuhiệnmối liên hệ giữa nhiều

biếncódạng tổng quát :

„ Giả thiếtcủaphương trình hồi qui nhiềubiến:

ƒ Mối quan hệ giữa đạilượng (biến) phụ thuộcvà

đạilượng (biến) độclậplàmối quan hệđường

thẳng.

ƒ Các đạilượng độclậpcóthể là các đạilượng liên

tụchoặcrờirạc.

ƒ Sai số tính toán giữagiátrị thực đovàtínhtoán

tuân theo luật phân bố chuẩnvớigiátrị trung bình

là 0.

„

nn xxx xaxaxaay n

++++= ... 22110 ,..., 2164

Xác định các tham số củaphương trình

tương quan đabiến

„ Các hệ số ai

đượcxác định bằng phương pháp bình

phương nhỏ nhấtvàai

phảithoả mãn hệ phương trình

sau:

Để đánh giá mức độ chặtchẽ mối liên hệ tương quan tuyến

tính giữa nhiềutiêuthứcngườitathường dùng hai loại

hệ số tương quan là: hệ số tương quan bộivàhệ số

tương quan riêng.

++ + +=

............

+++ +=

++ ++=

++++=

∑∑∑∑ ∑

∑∑∑∑ ∑

∑∑∑∑ ∑

∑ ∑ ∑ ∑

2

2 21 1 0

2

2

2212120 2

1 212

2

11101

22110

...

.

...

...

... .

xaxxaxxaxayx

xxaxaxxaxayx

xxaxxaxaxayx

xaxaxaany65

Tương quan đabiến

„ Hệ số tương quan bội

„ Hệ số tương quan bội(kýhiệu là R) dùng để đánh giá mức độ

chặtchẽ biếnphụ thuộc và các biến độclập.

„ Hệ số tương quan bội được tính theo công thức:

„

„ Hệ số tương quan bội bao giờ cũng dương và nằm trong phạmvi

từ 0 đến1. Tuỳ theo trị số R lớn hay nhỏ mà kếtluậnmức độ chặt

chẽ củamối liên hệ.

„ Các tính chấtcuả hệ số tương quan bộiR:

„ + Nếu R= 0 thì không có tương quan tuyến tính.

„ + NếuR cànggần đến 1 thì tương quan càng chặtchẽ

„ + NếuR=1 thìtương quan là hàm số.

() ∑

−= 2

2

...

...,,

21

21

1

yy

yy

R n

xxx

xxxy66

Tương quan đabiến

Kiểm định thống kê

a) Phép thử toàn cục (Ftest)

Kếtluậnbiếnlượng :

Trong đó: n là độ dài củachuỗisử dụng trong phân tích

m là số biến độclậpsử dụng trong phân tích

R

T

MS

MS

F =

1

~

1

2

−−

=

yy

MS

T

1

1

2

− −

=

yy

MS

R67

Tương quan đabiến

„ Nếu Ftính<Fbảng (Bảng tra được đưaratrongPhụ lục1)

ởđộ tự do k và (n-k-1):

„ → tương quan đabiến không thậtsự tồntại ở mứcý

nghĩa α =0,05 hoặc0,01Æ loại

„ Nếu Ftính<Fbảng.

„ → Tổ hợptuyếntínhcủa k góp phầncóý nghĩavàosự

biến thiên củabiếnphụ thuộcY. 68

c. Tương quan đabiến

Bước3: Kiểm định thống kê

b) Phép thử riêng biệt(Ttest

Nhằm đánh giá từng đạilượng ngẫu nhiên liệucó ảnh hưởng đến

biếnphụ thuộc không (Chao, 1981 [18]).

Trong quá trình kiểmtratasử dụng hàm phân bố t vớibậctự do là

n- (k+1). Giá trị t giớihạn đượctrabảng với độ tin cậy là 95%.

: giá trị trung bình

: giá trị kì vọng

s : sai số quân phương

n : số phầntử

X

=

μ

X

μ69

Tương quan đabiến

b) Phép thử riêng biệt(Ttest

Nhằm đánh giá từng đạilượng ngẫu nhiên liệucó ảnh hưởng đến

biếnphụ thuộc không.

Trong quá trình kiểmtratasử dụng hàm phân bố t vớibậctự do

là n- (k+1).

Giá trị t giớihạn đượctrabảng với độ tin cậy là 95%.

Cjj

-làcácsố hạng chéo củama trậnnghịch đảoXTX-1

j

j

S

t = jjR b b CMS MSS j j

==70

Tương quan đabiến

„Lựachọnphương trình hồi quy tốtnhất

ÆPhương trình cho hệ số tương quan cao nhất

Æ Phương trình có ít thông số nhất71

Bạn đang đọc truyện trên: AzTruyen.Top

Tags: