TVCT c3
4. Các tham số thống kê củamộtmẫu
Trị số bình quân:
Hệ số phân tán:
Hệ số thiên lệch:
x
x
i ∑ =
1
1
2
−
−
= ∑
k
C i
v
3
3
3
1
v
Cn
k
C
−
−
= ∑
x
x
k i
=
Số đông: Là trị số xuấthiện nhiềunhất trong chuỗi
số: xd15
Sốđông xđ16
Ý nghĩa của các đặc trưng
Trị số bình quân
là đại biểu chung cho chuỗi số
bịảnh hưởng lớn bởi các giá trị cực đoan nhất
là trong trường hợp chuỗi thống kê ngắn17
Hệ số phân tán:
Biểu thị độ phân tán của chuỗi số
Là một số không có thứ nguyên nên có thể dùng
để so sánh các chuỗi số có thứ nguyên khác nhau18
Hệ số thiên lệch:
Nếu Cs>0 đường phân bố lệch dương
Nếu Cs<0 đường phân bố lệch âm
Nếu Cs=0 đường phân bố đối xứng19
Sai số lấymẫu:
Vì mẫuchỉ là mộtbộ phậnrấtnhỏ củatổng thể nên các đặctrưng
thống kê củamẫu không bằng các đặctrưng thống kê củatổng
thể, nó có mộtsaisố nhất định gọilàsaisố lấymẫu.
Đốivớitrị số bình quân
Đốivớihệ số phân tán
Đốivớihệ số thiên lệch
x
x
σ
σ = ()
Cv
x
100
% = ′ σ
Sai số tuyệt đốiSaisố tương đối
2
1
2
v
v
Cv C
C += σ () () %1
2
100
% 2
v Cv C
+= ′ σ
() 42
561
6
vv Cs
CC
++= σ () () 42
561
6100
% vv
Cs
CC
nC
++ = ′ σ20
6. Đường tần suất
Đường tầnsuấtlà đường quan hệ giữatần
suất và giá trị củabiếnngẫu nhiên.
Đường tầnsuất kinh nghiệm:
là đường cong trơn đi qua trung tâm nhóm
điểmbiểudiễntầnsuấtxuấthiệncủa đại
lượng ngẫu nhiên nhậngiátrị X≥xi
Đường tầnsuấtlýluận
là đường cong toán học được dùng để biểuthị
quy luậtphânbố xác suấtcủa đạilượng ngẫu
nhiên21
xi-1 xi
xxi
x
1 1
F(x) P
f(x)
p(xi
F(xi
Hμm mËt ®é x¸c suÊt Hàm mật độ tấn xuất
Hμm ph©n phèi x¸c suÊt
Hàm phân phốixác
xuất22
Đường tần suất kinh nghiệm lưu lượng bình quân năm vẽ trên giấy thường
400
500
600
700
800
900
1000
1100
1200
1300
1400
0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00
P(%)
Qn(m3/s) Đường tầnsuất kinh nghiệm23
Các công thứctínhtầnsuất kinh nghiệm
thường dùng trong thuỷ văn
Công thứctínhtầnsuất:
Công thứctổng quát:
Công thứcsố trung bình
Hazen
Công thứckỳ vọng
Kritxki Menken
Công thứcsố giữa
Chêgôđaép
m P
5,0 −
= 100%
1 +
=
m P 100%
4,0
3,0
+
−
=
m P 100%
m xXP =≥ )(
2b1n
bm )xP(X i
−+
−
=≥24
Giấytầnsuất
§−êng tÇn suÊt l−îng m−a mïa -tr¹m madrak
5,00%
3,00%
1,50% 1,00%
0,50% 0,33%
0,20%
0,10%
0,01%
10,00%
20,00% 25,00%
30,00%
40,00%
50,00%
60,00%
70,00%
75,00% 80,00%
85,00%
90,00%
95,00%
97,00%
99,00%
99,90%
99,99%
2,00%
0
200
400
600
800
1000
1200
1400
P(%)
L−îng m−a X(mm)
C¸ c tham sè thèng kª
XTB = 558 mm
CV = 0,25
CS = 0,5
D¹ ng ph©n bè: Pearson
III25
Vẽđường tầnsuất kinh nghiệm
Lậpbảng mẫu
Cột1: Thứ tự
Cột2: Chuỗisố liệu đãsắpxếptừ
lớn đếnnhỏ
Cột3: Hệ số biếnsuấtKi
=Xi
/Xbq
Cột4: Tínhtầnsuấtkinhnghiệm
theo một trong các công thứctần
suất kinh nghiệmthường dùng
trong thuỷ văn
Chấm quan hệ cột1 hoặccột 3 và cột4
lên giấytầnsuất
Vẽđường cong trơn đi qua trung tâm
nhóm điểm được đường tầnsuấtkinh
nghiệm
TT Xi↓ Ki Pi
(1) (2) (3) (4)
Th.h
3 đ26
Đường tần suất lý luận
Đường tầnsuấtlýluận
là đường cong toán học được dùng để biểuthị
quy luậtphânbố xác suấtcủa đạilượng ngẫu
nhiên
Các dạng đường tầnsuấtlýluậnthường
dùng:
Luật phân phốixácsuất Pearson III
Luật phân phốixácsuất Kritxki-Menken
Ảnh hưởng của các tham số thống kê đến
dạng đường tấn suât27
Hμm mËt độ x¸c suÊt lý thuyÕt vÏ tõ mÉu c¸c tμi liÖu thùc
nghiÖm
x
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
<2030405060708090100>105
f(x)28
Luật phân phốixácsuất Pearson III
Tác giả: Nhà thống kê sinh vậthọcngườiAnh
Pearson
Điềukiện để lậphọđường cong hàm mật độ xác
suất:
Tạisốđông hệ số góc củatiếptuyếnbằng 0
Hai đầuhoặcmột đầunhậntrục hoành làm đường
tiệmcận
PT vi phân củahọđường cong hàm mật độ xác suất:
dx
xcxcc
xfxx
xdf
d
2
210 ++
−
=29
Luật phân phốixácsuất Pearson III (tiếp)
Chuyểngốctọa độ về trị số bình
quân. và giải được 13 nghiệmkhác
nhau (họđường Pearson)
Vớic2=0 thì nghiệmlàhàmmật độ
Pearson III có dạng:
x0: giá trị nhỏ nhấtcủa hàm mật
độ xác suất
() 0 1
0
xx
exxxf
−− −
−
Γ
= β α
α
α
β
x
CC
C
sv
⎟
⎠
⎞
⎜
⎝
⎛
==
2
4
2
βα
x
C xx v 2
0 −=
Cs
y0
xđ ⎯x
a
d
y
x
0
sv ccx ,,30
Luật phân phốixácsuất Pearson III (tiếp)
Khi chuyểntrụctọa độ về vị trí sốđông, phương trình
hàm mật độ có dạng:
Trong đó
y0: là giá trị lớnnhấtcủa hàm tương ứng vớisố
đông xđ
d: bán kính lệch (khoảng cách giữatrị số bình quân
và sốđông)
a: khoảng cách từ vị trí sốđông đếngiátrị nhỏ nhất
y0
xđ ⎯x
a d
y
x0
sv ccx ,,
d
x
d
a
a
x
yxf
−
+= .)1()( max31
Luật phân phốixácsuất Pearson III (tiếp)
Đặc điểm chính:
Dạng hàm mật độ xác suấtcómộtsốđông, một đầubị chặn
tạix=x0, một đầunhậntrục hoành làm đường tiệmcậnkhix
→+∞
Có 3 đặctrưng ⎯x, Cv, Cs là tham số. Khi các đặctrưng này
đượcxác định thì hàm mật độ xác suấtvà đường tầnsuất
đượcxác định
Phân phốilệch phụ thuộc vào bán kính lệch d
d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số
bình quân)
d<0: lệch âm (đỉnh của hàm mật độ nằm bên phảitrị số
bình quân)
d=0: đỉnh củahàmmật độ trùng vớivị trí số bình quân
Điềukiện ứng dụng:
x
x
k
k
C CC v
sv
0
0
0
1
2
2 =
−
≤≤32
Đường tầnsuất
+∞
−− −
+∞
−
Γ
==≥=
0
0
0
1
0 )()()(
x
xx
x
dxexx xfxXPxF β α
α
α
β
∞ −
+=
0
.)1()( max
x
d
x
d
a
dxe
a
x
yXF
Tầnsuấtcủa đạilượng X: 33
Bảng Fôxtơ-Rưpkin
Bảng Fôxtơ-Rưpkin: thể hiện quan hệ giữa Φ (khoảng
lệch tung độ) vớiCs
và P.
xP (giá trị của ĐLNN X tương ứng vớitầnsuấtP)
Trong đó: Kp là hệ số biếnsuấtcủa đạilượng X
)1( +Φ== v pP Cxxkx
),(
1
PCf
C
Kxx
v
x
=
−
=
−
=Φ
σ34
Trích bảng Fôxtơ-Rưpkin
Bảng tra khoảng lệch tung độ Φ của đường tần suất lý luận Piếc-sơn III
Cs P 0,01 0,1 0,5 1 3 5 10 20 50 70 75 90 95 97 99 99,9
0,0 3,72 3,09 2,58 2,33 1,88 1,64 1,28 0,84 0,00 -0,52 -0,67 -1,28 -1,64 -1,88 -2,33 -3,09
0,1 3,94 3,23 2,67 2,40 1,92 1,67 1,29 0,84 -0,02 -0,53 -0,68 -1,27 -1,62 -1,84 -2,25 -2,95
0,2 4,16 3,38 2,76 2,47 1,96 1,70 1,30 0,83 -0,03 -0,55 -0,69 -1,26 -1,59 -1,79 -2,18 -2,81
0,3 4,38 3,52 2,86 2,54 2,00 1,73 1,31 0,82 -0,05 -0,56 -0,70 -1,24 -1,55 -1,75 -2,10 -2,67
0,4 4,61 3,67 2,95 2,62 2,04 1,75 1,32 0,82 -0,07 -0,57 -0,71 -1,23 -1,52 -1,70 -2,03 -2,54
0,6 5,05 3,96 3,13 2,75 2,12 1,80 1,33 0,80 -0,10 -0,59 -0,72 -1,20 -1,45 -1,61 -1,88 -2,2735
Ứng dụng bảng Fôxtơ-Rưpkin
P(%) 0.11.05 10.. 50.. 7580909999.9
Φ(Cs,P)
Kp=Φ.Cv+1
xp=Kp.⎯x
Lưuý: KhiCs<0 thì Φp (Cs<0)=-Φ100-P(Cs>0)
VD: Φ1%(Cs=-1)=-Φ99%(Cs=1)=1,5936
Luật phân phốixácsuất Kritxki-Menken
Điềukiện:
Có thể dùng 3 đặctrưng ⎯x, Cv, Cs làm tham số của hàm
mật độ
Chỉ có mộtsốđông
Giá trị của ĐLNN nằm trong phạmvi 0≤x≤+∞
Phương trình hàm mật độ xác suất:
Trong đó: a, b là các hằng số;
Ứng dụng: Tương tự hai ông Kritxki-Menken cũng lập
bảng tra sẵnhệ số môđuyn Kp phụ thuộcvàoCv, Cs và P.
a
x
ex
xf
1
1
−
⎟
⎠
⎞
⎜
⎝
⎛
− −
Γ
=
α α
α
α
αα
α
2
2
1
v x C
x
= ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
=
σ
α37
Giấytầnsuất
§−êng tÇn suÊt l−îng m−a mïa -tr¹m madrak
5,00%
3,00%
1,50% 1,00%
0,50% 0,33%
0,20%
0,10%
0,01%
10,00%
20,00% 25,00%
30,00%
40,00%
50,00%
60,00%
70,00%
75,00% 80,00%
85,00%
90,00%
95,00%
97,00%
99,00%
99,90%
99,99%
2,00%
0
200
400
600
800
1000
1200
1400
P(%)
L−îng m−a X(mm)
C¸ c tham sè thèng kª
XTB = 558 mm
CV = 0,25
CS = 0,5
D¹ ng ph©n bè: Pearson
III38
Ảnh hưởng của các tham số thống kê đến
đường tầnsuất
Ảnh hưởng củatrị số bình quân:
Trị số trung bình ảnh hưởng đếnvị trí của đường tần
suấtso vớitrục hoành.
Cv=const
Cs=const
⎯X2>⎯X>⎯X1
P%
Kp
⎯X ⎯X1
⎯X2
⎯X1<⎯X239
Ảnh hưởng của các tham số thống kê đến
đường tầnsuất(tiếp)
Ảnh hưởng củahệ số phân tán
Hệ số Cv ảnh hưởng đến độ dốccủa đường tầnsuất
⎯X =const
Cs=const
Cv2
> Cv1
P%
Kp
Cv2
Cv140
Ảnh hưởng của các tham số thống kê đến
đường tầnsuất(tiếp)
Ảnh hưởng củahệ số thiên lệch
Hệ số Cs ảnh hưởng đến độ cong của đường tầnsuất
⎯X =const
Cv=const
Cs2
> Cs1
P%
Kp
Cs>0
Cs<0
Cs=041
8. Phương pháp vẽđường tầnsuấtlýluận
thường dùng
Phương pháp thích hợpdần
Phương pháp 3 điểmcủa Alechxayep
Nguyên tắc chung:
Xác định các tham số thống kê (⎯X, Cv, Cs)
Lựachọndạng phân phốixácsuất
Sử dụng các bảng tra xác định tọa độ đường tầnsuấtlýluận
Kiểmtrasự phù hợpgiữa ĐTSKN và ĐTSLL và điềuchỉnh
P(%) 0.11.05 10.. 50.. 7580909999.9
Kp
xp=Kp.⎯X42
Phương pháp thích hợpdần
Vẽđường tầnsuất kinh nghiệm
Xác định các đặctrưng thống kê: ⎯X, Cv
Giảđịnh Cs=mCv, vớim=1(hoặc 2,3,4,5,6)
Lựachọndạng đường phân phốixácsuất (PIII hoặc
KM)
Xây dựng đường tầnsuấtlýluận
Kiểmtrasự phù hợpgiữa đường TSLL và đường
TSKN
Nếuchưaphùhợpgiả thiếtlại m và tính lại
Nhận xét: Phương pháp trực quan, dễ dàng nhậnxét
và xử lý điểm. Nhược điểmlàphảithử dầnmấtnhiều
thờigian43
Ví dụ về so sánh sự phù hợpgiữa
ĐTSLL và ĐTSKN
§−êng tÇn suÊt l−îng m−a mïa -tr¹m
madrak
5,00%
3,00%
1,50% 1,00%
0,50% 0,33%
0,20%
0,10%
0,01%
10,00%
20,00% 25,00%
30,00%
40,00%
50,00%
60,00%
70,00%
75,00% 80,00%
85,00%
90,00%
95,00%
97,00%
99,00%
99,90%
99,99%
2,00%
0
200
400
600
800
1000
1200
1400
P(%)
L−îng m−a X(mm)
C¸ c tham sè thèng kª
XTB = 558 mm
CV = 0,1
CS = 0,2
Chưaphùhợp44
Ví dụ về so sánh sự phù hợpgiữa
ĐTSLL và ĐTSKN
§−êng tÇn suÊt l−îng m−a mïa -tr¹m
madrak
5,00%
3,00%
1,50% 1,00%
0,50% 0,33%
0,20%
0,10%
0,01%
10,00%
20,00% 25,00%
30,00%
40,00%
50,00%
60,00%
70,00%
75,00% 80,00%
85,00%
90,00%
95,00%
97,00%
99,00%
99,90%
99,99%
2,00%
0
200
400
600
800
1000
1200
1400
P(%)
L−îng m−a X(mm)
C¸ c tham sè thèng kª
XTB = 558 mm
CV = 0,2
CS = 0,4
Phù hợp45
Phương pháp 3 điểm
Vẽđường tầnsuất kinh nghiệm
Lựachọnbộ 3 điểmtrên đường TSKN
(x1, p1), (x2, p2), (x3,p3)
Nên chọnbộ 3 điểm đãcósẵnbảng tra:
VD: (X1%, X50%, X99%)(X3%, X50%, X97%)
(X5%, X50%, X95%)(X10%, X50%, X90%)
Tính hệ số lệch S
31
231
31
231 2 2
φφ
φ φ φ
−
− +
=
−
− +
=
xx
xxx
S46
Phương pháp 3 điểm(tiếp)
Tra quan hệ S=f(Cs) xác định Cs
Tra Φ50%, Φ1-Φ3 theo Cs
Tính độ lệch quân phương
Tính Xtb =X50%-σΦ50%
Tính hệ số phân tán Cv
Có⎯X, Cv, Cs vẽđường TSLL. Kiểmtrasự phù hợp
của Đường TSLL và đường TSKN
31
31
φφ
σ
−
−
=
xx
X
Cv
σ
=47
Ví dụ về so sánh sự phù hợpgiữa
ĐTSLL và ĐTSKN
§−êng tÇn suÊt l−îng m−a mïa -tr¹m
madrak
5,00%
3,00%
1,50% 1,00%
0,50% 0,33%
0,20%
0,10%
0,01%
10,00%
20,00% 25,00%
30,00%
40,00%
50,00%
60,00%
70,00%
75,00% 80,00%
85,00%
90,00%
95,00%
97,00%
99,00%
99,90%
99,99%
2,00%
0
200
400
600
800
1000
1200
1400
P(%)
L−îng m−a X(mm)
C¸ c tham sè thèng kª
XTB = 558 mm
CV = 0,1
CS = 0,2
Chưaphùhợp48
Ví dụ về so sánh sự phù hợpgiữa
ĐTSLL và ĐTSKN
§−êng tÇn suÊt l−îng m−a mïa -tr¹m
madrak
5,00%
3,00%
1,50% 1,00%
0,50% 0,33%
0,20%
0,10%
0,01%
10,00%
20,00% 25,00%
30,00%
40,00%
50,00%
60,00%
70,00%
75,00% 80,00%
85,00%
90,00%
95,00%
97,00%
99,00%
99,90%
99,99%
2,00%
0
200
400
600
800
1000
1200
1400
P(%)
L−îng m−a X(mm)
C¸ c tham sè thèng kª
XTB = 558 mm
CV = 0,2
CS = 0,4
Phù hợp49
Ví dụ bảng tra S~Cs trường hợp P=1_50_99%
S012345678 9
0 0.00 0.03 0.05 0.07 0.10 0.12 0.15 0.17 0.20 0.23
0.1 0.26 0.28 0.31 0.34 0.36 0.39 0.41 0.44 0.47 0.49
0.2 0.52 0.54 0.57 0.59 0.62 0.65 0.67 0.70 0.73 0.76
0.3 0.78 0.81 0.84 0.86 0.89 0.92 0.94 0.97 1.00 1.02
0.4 1.05 1.08 1.10 1.13 1.16 1.18 1.21 1.24 1.27 1.30
0.5 1.32 1.36 1.39 1.42 1.45 1.40 1.51 1.55 1.58 1.61
0.6 1.64 1.68 1.71 1.74 1.78 1.81 1.84 1.88 1.92 1.95
0.7 1.99 2.03 2.07 2.11 2.16 2.20 2.25 2.30 2.40 2.39
0.8 2.44 2.50 2.55 2.61 2.67 2.74 2.81 2.89 2.97 3.05
0.9 3.14 3.22 3.33 3.46 3.59 3.73 3.92 4.14 4.44 4.9050
Ví dụ về bảng tra quan hệ Cs~Φ
Cs Φ50% Φ1%-Φ99% Φ3%-Φ97% Φ5%-Φ95% Φ10%-Φ90%
0 0.000 4.652 3.762 3.290 2.564
0.1 -0.017 4.648 3.756 3.287 2.560
0.2 -0.233 4.645 3.750 3.284 2.557
0.3 -0.055 4.641 3.743 3.278 2.550
0.4 -0.680 6.637 3.736 3.273 2.543
0.5 -0.081 4.633 3.732 3.266 2.532
0.6 -0.100 4.629 3.727 3.259 2.522
0.7 -0.116 4.624 3.718 3.246 2.510
0.8 -0.132 4.620 3.709 3.233 2.49851
9. Phân tích tương quan
a. Khái niệm chung
x
y
x
y y
x
y
x
y
c
Quan hệ hàm số
Quan hệ độclập
(Không quan hệ)52
Quan hệ tương quan
Hai đạilượng X và Y đượcgọilàcóquanhệ tương quan thống
kê với nhau nếuvớimỗitrị số củaX, đạilượng Y có thể nhận
các giá trị khác nhau mộtcáchngẫu nhiên. Ngượclại, vớimỗi
giá trị của Y thì X cũng có thể nhận các giá trị khác nhau một
cách ngẫu nhiên. Tuy nhiên, nếutậphợp nhiềusố liệuthống kê
thì quan hệ giữa X và Y có tính quy luậtvàtạo thành mộtxuthế
nào đó.
x
y
x
y
Tương quan tuyến tính Tương quan phi tuyến53
b. Tương quan của2 đạilượng ngẫu nhiên
Đường hồiquy
Đặttương ứng mỗigiátrị của đạilượng này vớigiá
trị trungbìnhcủa các giá trị tương ứng của đạilượng
kia ta đượchàmhồi quy. Đường phốihợptốtnhất
biểuthị hàm hồi quy củatổng thểđượcgọilà đường
hồiquy.
Tương quan giữa hai đạilượng X và Y đượcgọilà
tuyếntínhnếucả hai hàm hồiquy đềulàtuyến tính.
Đường hồiquycủa y theo x là: y = f1(x)
Đường hồiquycủa x theo y là: x=f2(y)54
Xây dựng phương trình hồi quy của Y theo X
y = 0.041x + 1.1284
0.00
5.00
10.00
15.00
20.00
25.00
0.0 100.0 200.0 300.0 400.0 500.0
X
Y
(xi
,yi
(xi
,y)
xi
yi
y55
Xác định phương trình hồi quy bằng
phương pháp giải tích
Phương trình của đường thẳng hồiquy
y = ax +b
Khoảng lệch giữa điểmthực đo(xi
, yi
) với đường
thẳng hồiquylà:
yi
-y = yi
-(axi
+b)
Theo nguyên lý bình phương nhỏ nhất, muốncho
đường thẳng phốihợptốtnhấtthìtổng bình phương
củakhoảng lệch phảinhỏ nhất, nghĩalà:
() ( ) ∑∑ = =
=−−=−
axbyyy
1
2
1
2
min56
Muốnvậy:
Giảihệ phương trình trên rút ra a, b và thay vào ta có:
Trong đó γ là hệ số tương quan
0
0
2
2
=
∂
−−∂
=
∂
−−∂
∑
∑
baxy
a
baxy
() xxyy
x
y
−=−
σ
σ
γ
() () ∑∑
∑ =
− −
−−
=
yyxx
yyxx
2 2
1
γ
== i i
1157
Ví dụ
Xây dựng quan hệ tương quan giữa hai đại lượng Y
và X dựa trên tài liệu thực đo.
STT Xi
Yi
(Xi
-Xtb) (Yi
-Ytb) (Xi
-Xtb)2 (Yi
-Ytb)2 (Xi
-Xtb)(Yi
-Ytb)
1 359.7 9.49 79.70 -3.11 6351.48 9.679 -247.95
2 236.9 7.56 -43.09 -5.04 1856.64 25.410 217.20
3 199.6 6.70 -80.46 -5.90 6473.75 34.806 474.68
4 268.3 14.04 -11.73 1.43 137.48 2.058 -16.82
5 205.3 11.34 -74.73 -1.26 5584.68 1.599 94.49
6 215.0 10.80 -65.02 -1.81 4228.06 3.258 117.37
7 212.6 9.73 -67.46 -2.88 4551.14 8.284 194.17
8 250.6 9.21 -29.44 -3.40 866.82 11.545 100.04
9 255.3 9.78 -24.73 -2.82 611.80 7.949 69.74
10 329.7 12.31 49.65 -0.30 2465.31 0.088 -14.70
11 181.2 12.41 -98.80 -0.20 9761.19 0.039 19.54
12 312.6 12.29 32.59 -0.31 1061.97 0.095 -10.07
13 301.7 11.78 21.62 -0.82 467.42 0.675 -17.76
14 249.4 14.80 -30.65 2.20 939.46 4.821 -67.30
15 206.4 12.21 -73.65 -0.39 5424.12 0.153 28.82
16 401.7 19.18 121.64 6.58 14796.93 43.304 800.48
17 298.0 14.69 17.92 2.09 321.23 4.368 37.46
18 286.2 10.29 6.20 -2.31 38.49 5.338 -14.33
19 402.8 22.46 122.72 9.86 15060.03 97.197 1209.87
20 427.8 20.99 147.72 8.38 21821.00 70.274 1238.32
TB 280.0 12.60 Tổng 102819.01 330.94 4213.2658
Xây dựng phương trình hồi quy của Y theo X
y = 0.041x + 1.1284
0.00
5.00
10.00
15.00
20.00
25.00
0.0 100.0 200.0 300.0 400.0 500.0
X
Y
γ = 0.759
c. X¸c ®Þnh ph−¬ng tr×nh t−¬ng quan b»ng ph−¬ng ph¸p ®å gi¶i
- Ph−¬ng ph¸p ®å gi¶i lμ ph−¬ng ph¸p x¸c ®Þnh ®−êng håi quy b»ng c¸c vÏ
®å thÞ quan hÖ hai ®¹i l−îng ngÉu nhiªn. Ph−¬ng ph¸p ®å gi¶i ®−îc tiÕn hμnh theo
nh÷ng b−íc nh− sau:
1. ChÊm ®iÓm quan hÖ thùc nghiÖm gi÷a hai ®¹i l−îng X vμ Y.
2. Qua trung t©m nhãm ®iÓm quan hÖ kÎ ®−êng th¼ng sao cho phï hîp nhÊt
víi c¸c ®iÓm kinh nghiÖm vμ coi ®−êng ®ã lμ ®−êng håi quy tuyÕn tÝnh cã d¹ng:
y=b0+b1x.
3. X¸c ®Þnh gi¸ trÞ b0 vμ b1 b»ng c¸ch chän hai ®iÓm bÊt kú trªn ®−êng th¼ng
®· vÏ cã to¹ ®é lμ (x1, y1) vμ (x2, y2. LËp hÖ ph−¬ng tr×nh:
y1=b0+b1x1
y2=b0+b1x2
Gi¶i hÖ ph−¬ng tr×nh trªn sÏ t×m ®−îc b0 vμ b1.
4. HÖ sè t−¬ng quan trong tr−êng hîp nμy x¸c ®Þnh:
α = cos ⎯ π
Víi m - sè ®iÓm ë gãc phÇn t− thø I vμ III, n - tæng sè ®iÓm quan hÖ. 60
Hinh 4.8 Quan hÖ Y ~ X vμ X ~ Y
0
1
2
3
4
5
6
7
8
9
10
0246810
X
Y
α
β
β
),( yx61
Ý nghĩacủahệ số tương quan
Kiểmtramức ý nghĩacủaviệcxác định các
phương trình hồi quy:
Phương trình hồiquy
Các tham số và hệ số tương quan củapt hồi
quy
Các tham số: a,b
Hệ số tương quan: r62
Ý nghĩacủahệ số tương quan
),(
2
1
2 ~
pvb t
−
−
=
r - Hệ số tương quan
tb(v,p).
-giátrị tra bảng củatiêuchuẩn Student
v - bậctự do: v=n-2
p - Mức đánh giá (%)
Mức có ý nghĩa đượcchọn theo mục đích yêu cầu
củathực nghiệm, thông thường: p≤ 5%63
c. Tương quan đabiến
Phương trình tuyến tính biểuhiệnmối liên hệ giữa nhiều
biếncódạng tổng quát :
Giả thiếtcủaphương trình hồi qui nhiềubiến:
Mối quan hệ giữa đạilượng (biến) phụ thuộcvà
đạilượng (biến) độclậplàmối quan hệđường
thẳng.
Các đạilượng độclậpcóthể là các đạilượng liên
tụchoặcrờirạc.
Sai số tính toán giữagiátrị thực đovàtínhtoán
tuân theo luật phân bố chuẩnvớigiátrị trung bình
là 0.
nn xxx xaxaxaay n
++++= ... 22110 ,..., 2164
Xác định các tham số củaphương trình
tương quan đabiến
Các hệ số ai
đượcxác định bằng phương pháp bình
phương nhỏ nhấtvàai
phảithoả mãn hệ phương trình
sau:
Để đánh giá mức độ chặtchẽ mối liên hệ tương quan tuyến
tính giữa nhiềutiêuthứcngườitathường dùng hai loại
hệ số tương quan là: hệ số tương quan bộivàhệ số
tương quan riêng.
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎨
⎧
++ + +=
............
+++ +=
++ ++=
++++=
∑∑∑∑ ∑
∑∑∑∑ ∑
∑∑∑∑ ∑
∑ ∑ ∑ ∑
2
2 21 1 0
2
2
2212120 2
1 212
2
11101
22110
...
.
...
...
... .
xaxxaxxaxayx
xxaxaxxaxayx
xxaxxaxaxayx
xaxaxaany65
Tương quan đabiến
Hệ số tương quan bội
Hệ số tương quan bội(kýhiệu là R) dùng để đánh giá mức độ
chặtchẽ biếnphụ thuộc và các biến độclập.
Hệ số tương quan bội được tính theo công thức:
Hệ số tương quan bội bao giờ cũng dương và nằm trong phạmvi
từ 0 đến1. Tuỳ theo trị số R lớn hay nhỏ mà kếtluậnmức độ chặt
chẽ củamối liên hệ.
Các tính chấtcuả hệ số tương quan bộiR:
+ Nếu R= 0 thì không có tương quan tuyến tính.
+ NếuR cànggần đến 1 thì tương quan càng chặtchẽ
+ NếuR=1 thìtương quan là hàm số.
() ∑
∑
−
−
−= 2
2
...
...,,
21
21
1
yy
yy
R n
xxx
xxxy66
Tương quan đabiến
Kiểm định thống kê
a) Phép thử toàn cục (Ftest)
Kếtluậnbiếnlượng :
Trong đó: n là độ dài củachuỗisử dụng trong phân tích
m là số biến độclậpsử dụng trong phân tích
R
T
MS
MS
F =
1
~
1
2
−−
−
=
∑
yy
MS
T
1
1
2
− −
−
=
∑
yy
MS
R67
Tương quan đabiến
Nếu Ftính<Fbảng (Bảng tra được đưaratrongPhụ lục1)
ởđộ tự do k và (n-k-1):
→ tương quan đabiến không thậtsự tồntại ở mứcý
nghĩa α =0,05 hoặc0,01Æ loại
Nếu Ftính<Fbảng.
→ Tổ hợptuyếntínhcủa k góp phầncóý nghĩavàosự
biến thiên củabiếnphụ thuộcY. 68
c. Tương quan đabiến
Bước3: Kiểm định thống kê
b) Phép thử riêng biệt(Ttest
Nhằm đánh giá từng đạilượng ngẫu nhiên liệucó ảnh hưởng đến
biếnphụ thuộc không (Chao, 1981 [18]).
Trong quá trình kiểmtratasử dụng hàm phân bố t vớibậctự do là
n- (k+1). Giá trị t giớihạn đượctrabảng với độ tin cậy là 95%.
: giá trị trung bình
: giá trị kì vọng
s : sai số quân phương
n : số phầntử
X
⎟
⎠
⎞
⎜
⎝
⎛
−
=
−
μ
X
−
μ69
Tương quan đabiến
b) Phép thử riêng biệt(Ttest
Nhằm đánh giá từng đạilượng ngẫu nhiên liệucó ảnh hưởng đến
biếnphụ thuộc không.
Trong quá trình kiểmtratasử dụng hàm phân bố t vớibậctự do
là n- (k+1).
Giá trị t giớihạn đượctrabảng với độ tin cậy là 95%.
Cjj
-làcácsố hạng chéo củama trậnnghịch đảoXTX-1
j
j
S
t = jjR b b CMS MSS j j
==70
Tương quan đabiến
Lựachọnphương trình hồi quy tốtnhất
ÆPhương trình cho hệ số tương quan cao nhất
Æ Phương trình có ít thông số nhất71
Bạn đang đọc truyện trên: AzTruyen.Top