audiovideo
Câu 1: Trình bày mục đích, pp các kỹ thuật nén tín hiệu Audio?
A, Mục đích :
Để có âm thanh trung thực và chất lượng dịch vụ thỏa mãn yêu cầu thì tốc độ
dữ liệu phải lớn. Do vậy, khó khăn cho việc lưu trữ, truyền dẫn và giá thành thiết bị ->
fải thực hiện nén.
B, pp nén:
1- Nén ko tổn hao :
- Loại bỏ dư thừa thống kê,các thông tin xuất hiện trong sig mà có thể dự báo trước.
- Tỉ số nén thấp (khoảng 2÷1) phụ thuộc vào độ phức tạp của sig nguồn.
- Thường sd Kt mã hóa dự đoán trong miền .
- Thuật toán vi sai :
+, sig âm thanh có đặc tính lặp đi lặp lại -> x.hiện sự dư thừa số liệu, t.tin lặp lại đc
loại bỏ trong q.trình mã hóa và đc đưa vào lại trong q.trình giải mã sd Kt DPCM.
+, Các Kt audio đầu tiên đc phân .tích thành tập hợp các dải băng con bao gồm 1 số
lượng âm thanh rời rạc, sau đó DPCM đc sd để dự báo các sig lặp lại theo chu kỳ. Sd
ADPCM đc kq tốt hơn.
- Mã hóa Entropy :
+, Tận dụng độ dư thừa trong cách miêu tả các hs băng con dẫ LTH nhằm cải thiện
tính hiệu quả của q.trình mã hóa. Các LTH đc gửi đi theo sự tăng dần của tần số.
+, K.q nhận đc là bảng mã tối ưu thống kê các g.trị miền t.số thấp và cao sd mã hóa
Huffman, lemper-zip để nén.
2- Nén tổn hao :
- Hệ thống thính giác con ng ko thể fân biệt các thành phần phổ có biên độ nhỏ giữa các
thành phần phổ có biên độ lớn.
-Hệ số nén lớn (2÷1) phụ thuộc vào q.trình nén và giải nén chất lượng audio yêu cầu.
- Kt che: đối với các sig trong miền và tần số.
- Che mức tạp âm lượng tử cho từng âm độ của sig âm thanh = cách chỉ định số bit vừa
đủ để chắc chắn rằng mức nhiễu lượng tử luôn nằm dưới mức g.trị cần che.
- Mã hóa ghép : Khai thác độ dư thừa trong hệ thống audio đa kênh với các TP số liệu
trong các kênh giống nhau. Mã hóa 1 fần s.liệu chung trên 1 kênh và chỉ định cho bộ
giải mã lặp lại sig đó trên các kênh còn lại.
Câu 2: Trình bày mục đích, pp các kỹ thuật nén tín hiệu Video?
A, Mục đích :
Các hệ thống nén số liệu là sự phối hợp của rất nhiều các kỹ thuật xử lý
nhằm giảm tốc độ bit của tín hiệu số mà vẫn đảm bảo chất lượng ảnh phù hợp với một
ứng dụng nhất định.
B, pp nén :
1- Nén không mất thông tin:
Cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén. Đây là một quá
trình mã hoá có tính thuận nghịch. Hệ số nén phụ thuộc vào chi tiết ảnh được nén và
nhỏ hơn 2:1.
a) Mã hoá với độ dài (của từ mã) thay đổi (VLC)
Phương pháp này là mã hoá Huffman và mã hoá entropy, dựa trên khả năng
xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết lập một từ mã
ngắn cho các giá trị có tần suất xuất hiện cao nhất và từ mã dài cho các giá trị còn lại.
Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử dụng để tạo lại giá trị tín
hiệu ban đầu.
b) Mã hoá với độ dài (của từ mã) động (RLC)
Dựa trên sự lặp lại của cùng giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự
bắt đầu và kết thúc của giá trị được lắp lại. Chỉ các mẫu có giá trị khác không mới được
mã hoá. Số mẫu có giá trị bằng không sẽ được truyền di dọc theo cùng dòng quét. Cuối
cùng, các chuỗi 0 được tạo ra bằng quá trình giải tương quan như phương pháp DCT
hay DPCM.
c) Sử dụng khoảng xoá dòng và mành
Vùng thông tin xoá được loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông tin
tích cực của ảnh -> thông tin xoá dòng và xoá mành sẽ không được ghi giữ và truyền đi.
Chúng được thay bằng các dữ liệu đồng bộ ngắn hơn tuỳ theo các ứng dụng.
d) Biến đổi cosin rời rạc (DCT)
Quá trình DCT thuận và nghịch được coi là không mất thông tin nếu độ dài từ
mã hệ số là 13 hoặc 14 băng tần đối với dòng video số sử dụng 8 bit biểu diễn mẫu.
Nếu độ dài từ mã hệ số của phép biến đổi DCT nhỏ hơn, quá trình này trở nên có mất
thông tin.
2- Nén có mất thông tin
Sử dụng hai hoặc nhiều hơn các kỹ thuật xử lý nhằm đạt được một sự biểu
diễn mã hoá thuận lợi tín hiệu hình ảnh. Nén có mất thông tin đạt được hệ số nén cao
hơn so với phương pháp nén không mất thông tin, vào cỡ 2:1 đến 100: 1. Sau khi nén,
một số thông tin sẽ bị mất và chất lượng ảnh bị suy hao do quá trình làm tròn và loại
bỏ giá trị trong phạm vi khung hình hay giữa các khung hình. Hệ số nén có thể thay đổi
theo chi tiết ảnh và cho phép tạo ra dòng bit có tốc độ không đổi, phục vụ cho các ứng
dụng lưu trữ và truyền dẫn. Tốc độ dòng số liệu đạt được trong hệ thống nén có mất
thông tin phụ thuộc vào yêu cầu chất lượng ảnh cần có.
a) Lấy mẫu con (Subsampling)
Phương pháp nén rất có hiệu quả, song độ phân giải của ảnh sau khi giải nén giảm
so với ảnh ban đầu. Vì vậy, kỹ thuật lấy mẫu con không áp dụng cho tín hiệu chói.
b) Điều xung mã vi sai (DPCM)
Là phương pháp mã hoá dự đoán, thay vì truyền đi toàn bộ các mẫu, kỹ thuật
này chỉ mã hoá và truyền đi sự khác nhau giữa các giá trị mẫu. Giá trị sai lệch được
cộng vào giá trị mẫu đã được giải mã trong quá trình giải nén để tạo lại giá trị mẫu cần
Quá trình DPCM làm giảm lượng entropy của tín hiệu ban đầu. Tất cả các
giá trị sai lệch giữa các mẫu tập trung quanh giá trị 0 vì trong các ảnh sự xuất hiện các
vùng đều có khả năng cao. Nhằm tránh các lỗi các thể xuất hiện trong khi truyền. Mã
hoá DPCM cũng sử dụng thêm các kỹ thuật dự đoán và lượng tử hoá thích nghi để hoàn
thiện thêm kỹ thuật nén này.
c) Lượng tử hoá và mã hoá VLC các hệ số DCT: Phối hợp ba kỹ thuật này cho
phép biểu diễn một khối các điểm ảnh bằng một số ít các bit, do đó tạo được một hiệu
quả nén rất cao.
Câu3: Mã hóa FANO-shannon:
Theo lý thuyết thông tin của Shannon thì tỉ lệ nén tốt nhất mà chúng ta có thể
đạt được chính là entropy nguồn. Shannon và Fano đã tìm ra một phương pháp nén mới
mà dựa trên xác suất xuất hiện của những symbol nguồn bên trong một lượng thông
tin. Cơ bản phương pháp này sử dụng những từ mã có độ dài thay đổi để mã hoá các
symbol nguồn thông qua xác suất của chúng. Với những symbol có xác suất xuất hiện
càng lớn thì từ mã dùng để mã hoá chúng càng ngắn.
Các bước mã Shannon - Fano:
a) Bước 1: Sắp xếp các symbol nguồn với xác suất xuất hiện của chúng theo
thứ tự giảm dần.
b) Bước 2: Chia tập đã sắp xếp đó thành hai phần sao cho tổng xác suất xuất
hiện của các symbol ở mỗi phần xấp xỉ nhau.
c) Bước 3: Mã sử dụng bit 0 để mã hoá cho các symbol trong phần 1 và bit 1
mã hoá cho các symbol trong phần 2.
d) Bước 4: Quay trở lại bước 2 và tiếp tục làm cho tới khi mỗi phần chia chỉ
còn lại 1 symbol.
Câu 4: Mã hóa huffman:
Mã Huffman thuộc loại mã entropy hoặc mã thống kê. Tư tưởng chính là dùng VLC
(Variable Length Coding), sử dụng ít bit để mã các giá trị hay xảy ra (xác suất xuất hiện
cao) và nhiều bit để mã các giá trị ít xảy ra (xác suất xuất hiện thấp). Từ đó tốc độ bit
sẽ giảm một cách đáng kể.
Độ dài trung bình của từ mã Huffman giới hạn trên bởi
log2
H+P+
log e
e
H là lượng entropy nguồn, P là xác suất của tất cả các symbol
Các bước mã hoá Huffman:
a) Bước 1: Liệt kê các xác suất của các symbol nguồn, và tạo ra các tập mút
bằng cách cho những xác suất này thành các nhánh của cây nhị phân.
b) Bước 2: Lấy 2 nút với xác suất nhỏ nhất từ tập nút và trạo ra 1 xác suất mới
bằng tổng xác suất của xác suất đó.
c) Bước 3: Tạo ra mọt nút mẹ với các xác suất mới, và đánh dấu 1 cho nút con
ở trên và 0 cho nút con ở dưới.
d) Bước 4: Tạo tiếp tập nút bằng cách thay thế 2 nút với xác suất nhỏ nhất cho
nút mới. Nếu tập nút chỉ chứa 1 nút thì kết thúc, ngược lại thì ta quay lại bước 2.
Bộ mã sẽ được thiết lập bằng cách dùng một tập hợp data và đánh giá xác suất
của mỗi sự kiện. Sự tối ưu có thể đạt được bằng cách thiết kế một bảng mã riêng biệt
cho mỗi phần tử được mã hoá. Nhưng điều này sẽ làm tăng số bảng mã.
Muốn lập được bảng mã cần tính xác suất xuất hiện mỗi phần tử ảnh trong
tập mã. Dựa vào đó xây dựng một cây không cân bằng (tức gồm một số nhánh không
dài bằng nhau). Mức độ không cân bằng của cây phụ thuộc vào xác suất xuất hiện của
các phần tử. Một cây được xây dựng như vậy gọi là cây mã Huffman.
Nút gốc (8)
0
Nút nhánh (4)
.
.
0
Nút nhánh (2)
.
0
Nút lá
d (1)
Hình 6.11 Cây mã Huffman
.
1
Nút lá
c (1)
Cây mã Huffman là một cây nhị phân có các nhánh được gán cho giá trị 0 hoặc
1. Gốc của cây được gọi là nút mốc, còn các điểm rẽ nhánh được gọi là các nút nhánh.
Điểm kết thúc của một nhánh được gọi là nút lá. Mỗi nút lá được gán tương ứng với
một phần tử cần mã hoá. .Từ một nút nhánh, khi rẽ thành hai nhánh mới thì nhánh bên
trái được gán cho giá trị 0 và nhánh bên phải được gán cho giá trị 1 (việc gán này có thể
làm ngược lại). Từ mã của một symbol được xác định bằng cách đi từ gốc đến nút lá
tương ứng với symbol đó. Các bit của các từ mã được tập hợp từ các giá trị tương ứng
của nhánh phai đi qua.
Câu 5: Phân tích sơ đồ mã hoá/giải mã theo chuẩn nén Video H.261?
Sơ đồ mã hóa trong khung
“Control” điều khiển tốc độ bit và bộ đệm, nếu bộ đệm đầy thì giảm tốc độ bit.
“Memory” dùng để lưu hình ảnh được khôi phục lại
với mục đích tìm véc tơ chuyển động cho Frame P tiếp
theo
Phần dưới này tớ thêm vào không biết dúng k, tùy mọi người học nha
Trong bộ mã hóa H261, có 3 thành phần chính là prediction, block tranformation,
quantization & entropy coding
Prediction:
H261 định nghĩa hai loại mã khác nhau:
INTRA coding: mỗi block 8*8 pixel được mã hóa một cách độc lập và được gửi đi
trực tiếp tới tiến trình chuyển đổi block (block transformation process)
ENTER coding: mỗi frame được mã hóa có sự liên quan đến frame khác. Độ sai
lệch được tính toán giữa một vùng 16*16 pixel với một macroblock của frame
trước.
Block transformation:
H261 hỗ trợ việc bù đắp những mất mát của quá trình chuyển động trong bộ mã
hóa như một tùy chọn. Trong việc bồi thường chuyển động, một vùng tìm kiếm được
xây dựng dựa trên frame trước để xác định macroblock tham chiếu tốt nhất. Cả độ sai
lệch ước tính cũng như vector chuyển động, xác định giá trị và hướng di chuyển giữa
macroblock được mã hóa và vùng tham chiếu đã chọn đều được gửi đi. Cùng tìm kiếm
cũng như làm thến nào để tính toán vector chuyển động không tùy thuộc vào sự chuẩn
hóa. Thành phần nằm ngang và thẳng đứng của vector phải có giá trị nguyên nằm trong
khoảng-15 đến 15.
Trong sự biến đổi khối, những frame mã hóa theo kiểu INTRA cũng như những
sai số dự đoán đều được đưa vào trong khối 8*8. Mỗi khổi sẽ được xử lý bởi 1 hàm
FDTC hai chiều.
Quantization & Entropy coding:
Mục đích của bước này là đạt được sự nén tốt hơn bằng các hệ số DTC để đạt
được chất lượng đòi hỏi. Số lượng tử hóa là 1 đối với các hệ số INTRA và là 31 cho tất
cả các hệ số khác
Mã hóa Entropy kéo theo sự nén tốt hơn được thực hiện bằng cách gán những
từ mã ngắn hơn cho sự kiện phổ biến và sử dụng những sự kiện ít phổ biến hơn. Mã
hóa huffman thường được sử dụng trong trường hợp này.
Nói cách khác, chúng ta có thể mất một vài hệ số trong việc chuyển đổi bằng
cách sử dụng ít bit hơn so với số bit cần thiết cho tất cả các giá trị. Chúng ta sẽ dùng
những từ mã ngắn hơn đối với giá trị thông thường.
Câu 6: Phân tích sơ đồ mã hoá/giải mã theo chuẩn nén Video H.263?
Khái niệm
• Tiêu chuẩn cải tiến H.261 cho video tốc độ thấp, có thể truyền trên mạng điện thoại
công cộng PSTN ,được công nhận vào năm 1996
• Giông như H.261, mã hoá DCT cho các MB trong I Frame và DCT sai biệt dự đoán
trong P Frame.
• tốc độ tối thiểu
• Ưu ñiem:
• Chính xác sai biệt dự đoán tới ½ pixel.
• Không hạn chế vec tơ chuyển động
• Mã hóa số học theo cú pháp.
• Dự đoán thuận lợi với các khung P.
• Ngoài CIF, QCIF, H.263 còn hỗ trợ SQCIF, 4 CIF và 16CIF với độ phân giải tín hiệu
Chói tuần tự là là 128x96, 704x576, 1408x1152. Độ phân giải tín hiueej sắc bằng ¼
tín hiệu chói.
Về bản chất, H.263 kết hợp các tính năng của H.261 cùng với MPEG, và được tối
ưu hóa cho tốc độ bit rất thấp. Về tỷ số tín hiệu nhiễu (SNR), H.263 có thể cung cấp
3-4 được dB trên H.261 với tốc độ bit dưới 64 kbits / s. Trong thực tế, H.263 cung cấp
mã hóa cao cấp hiệu quả như của H.261 ở tất cả các tỷ lệ bit. Khi so sánh với MPEG-1,
H.263 có thể cho tiết kiệm 30% tỷ lệ bit.
H.263 được xây dựng trên đầu trang của H.261, các cấu trúc chính của hai tiêu
chuẩn cơ bản là giống nhau. Vì vậy, chúng tôi sẽ chỉ tập trung vào sự khác biệt giữa hai
tiêu chuẩn. Sự khác biệt chính là:
1. H.236 hỗ trợ các định dạng hình ảnh nhiều hơn, và sử dụng một cấu trúc gob
khác nhau.
2. H.263 sử dụng bồi thường chuyển động nửa PEL, nhưng lưu ý lọc vòng lặp sử
dụng như trong H.261.
3. H.263 sử dụng 3D VLC để mã hóa các hệ số DCT.
4. Ngoài các thuật toán mã hóa cơ bản, bốn tùy chọn có thể thương lượng giữa
các bộ mã hóa và giải mã các cung cấp cải thiện hiệu suất.
5. H.263 cho phép kích thước bước lượng tử hóa để thay đổi ở mỗi MB với chi
phí ít hơn.
Câu 7. Sơ đồ mã hóa, giải mã tín hiệu video theo chuẩn nén MPEG1.
Sơ đồ mã hóa
Sơ đồ giải mã:
Câu 8. Nêu kiến trúc và thuật toán nén tín hiệu adio theo chuẩn MPEG-1.
Thuật toán:
Câu 9. Sơ đồ mã hóa nén tín hiệu audio AC-3.
• Sơ đồ:
Bộ mã hóa sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ số trong
miền tần số. Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm nhiều phần số mũ và phần
định trị. Các tập số mũ được mã hóa thông qua phổ tín hiệu và xem như là đường bao
phổ. Sử dụng phân phối bit xác định số bit cần mã hóa mỗi định trị dựa vào đường bao
phổ. Đường bao phổ và các định trị được lượng tử cho 6 khối âm thanh ( 1536 mẫu âm
thanh ) được định dạng khung rồi chuyển đi.
Câu 21: Entropy là gì? Tính Entropy cho hai Block ảnh sau...
+ Entropy là gì? Entropy của hình ảnh là một giỏ trị cú ý nghĩa quan trọng, bởi
nó xác định số lượng bit trung bình tối thiểu cần thiết để biểu diễn một phần tử
ảnh. Trong công nghệ nén không tổn hao, entropy là giới hạn dưới của tỉ số bit/
pixel. Nếu tín hiệu video được nén với tỉ số bit/phần tử nhỏ hơn entropy, hình
ảnh sẽ bị mất thông tin và quá trình nén sẽ có tổn hao.
Entropy đo giá trị thông tin trung bình chứa đựng trong một bức ảnh và
theo đó, entropy cũng xác định lượng thông tin trung bình nhỏ nhất biểu diễn bởi
mỗi giá trị nhị phân qua quá trình mã hóa, để bảo toàn được khả năng khôi phục
ảnh tốt. Theo lý thuyết, độ dài trung bình của một từ mã (cũng tương đương với
tốc độ bit thu được) qua một phương pháp nén không thể nào nhỏ hơn entropy
của bức ảnh, một số thông tin của bức ảnh sẽ bị mất.
Theo quan điểm của lý thuyết thông tin, lượng thông tin của từng phần tử
ảnh được định nghĩa là logarit cơ số hai của nghịch đảo xác suất xuất hiện của
phần tử ảnh đó:
l ( xi ) = log
1
=− log 2 P xi
2 P x
Trong đó: l(xi) - lượng thông tin của phần tử ảnh xi (được tính bằng bit).
P(xi ) - xỏc suất xuất hiện của phần tử ảnh xi.
Nếu một hình ảnh được biểu thị bằng các phần tử x1, x2, x3.... Xác suất xuất
hiện của từng phần tử tương ứng sẽ là P(x1), P(x2), P(x3)....
Biết được lượng tin tức của từng phần tử ảnh chưa đủ, cũn cần phải biết được
lượng tin tức bình quân của cả tập hợp các phần tử ảnh của hình ảnh. Lượng tin
tức bình quân ấy người ta gọi là entropy, được biểu diễn bằng biểu thức bình
quân thống kê sau: Gọi lượng thông tin trung bình của hình ảnh H(x) (entropy
của hình ảnh), ta có.
H (x) =
i=l
N
∑ P x l x
i i
=−
i=l
N
∑ P x
i
log2 P xi
Bạn đang đọc truyện trên: AzTruyen.Top