335
TCVNT I Ê U C H U Ẩ N Q U Ố C G I A TCVN xxxx : 201x CÔNG NGHỆ THÔNG TIN - MÃ HÓA ẢNH CHUYỂN ĐỘNG VÀ THÔNG TIN ÂM THANH KẾT HỢP – PHẦN 2: VIDEO “Information technology -Generic coding of moving pictures and associated audio information” - Part 2: Video

 · Web viewTiêu chuẩn Quốc gia này xác định việc mã hoá đại diện thông tin ảnh cho phương tiện lưu trữ kỹ thuật số và truyền thông phim

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

TCVNT I Ê U C H U Ẩ N Q U Ố C G I A

TCVN xxxx : 201x

CÔNG NGHỆ THÔNG TIN - MÃ HÓA ẢNH CHUYỂN ĐỘNG VÀ THÔNG TIN ÂM THANH KẾT HỢP –

PHẦN 2: VIDEO

“Information technology -Generic coding of moving pictures and associated audio information” - Part 2: Video

HÀ NỘI – 201x

ffffTCVN T I Ê U C H U Ẩ N Q U Ố C G I A

TCVN xxxx : 2017

CÔNG NGHỆ THÔNG TIN - MÃ HÓA ẢNH CHUYỂN ĐỘNG VÀ THÔNG TIN ÂM THANH KẾT HỢP - PHẦN 2: VIDEO

ISO/IEC 13818-2: “Information technology -Generic coding of moving pictures and associated audio information” - Part 2: Video

HÀ NỘI – 2017

MỤC LỤC

Lời nói đầu...............................................................................................................................................41. Phạm vi áp dụng..................................................................................................................................52. Tài liệu viện dẫn...................................................................................................................................53. Định nghĩa............................................................................................................................................5Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:................................................................54. Các ký hiệu và chữ viết tắt...............................................................................................................194.1. Các toán tử số học.........................................................................................................................194.2. Các toán tử logic............................................................................................................................204.3. Các toán tử quan hệ.......................................................................................................................204.4. Các toán tử thao tác bit (Bitwise).................................................................................................204.5. Phép gán..........................................................................................................................................214.6. Các Nhận dạng................................................................................................................................214.7. Hằng số............................................................................................................................................214.8. Thuật ngữ viết tắt...........................................................................................................................215. Quy ước..............................................................................................................................................245.1. Cách mô tả cú pháp dòng bit........................................................................................................245.2. Định nghĩa chức năng....................................................................................................................255.2.1. Định nghĩa hàm bytealigned()....................................................................................................255.2.2. Định nghĩa hàm nextbitst().........................................................................................................255.2.3. Định nghĩa hàm next_start_code().............................................................................................255.3. Dự phòng, cấm và bit đánh dấu (marker_bit)..............................................................................255.4. Độ chính xác số học.......................................................................................................................266. Cú pháp và ngữ nghĩa dòng bit video.............................................................................................266.1. Cấu trúc dữ liệu mã hóa video......................................................................................................266.1.1. Chuỗi video..................................................................................................................................266.1.2. Lát cắt...........................................................................................................................................356.1.3. Khối Macroblock..........................................................................................................................366.1.4. Khối...............................................................................................................................................376.2. Cú pháp dòng bit video..................................................................................................................386.2.1. Mã bắt đầu....................................................................................................................................386.2.2. Chuỗi Video..................................................................................................................................396.2.3. Tiêu đề ảnh...................................................................................................................................436.2.4. Lát cắt – Slice...............................................................................................................................516.2.5. Khối – Macroblock.......................................................................................................................516.2.6. Khối...............................................................................................................................................536.3. Các ngữ nghĩa dòng bit video.......................................................................................................546.3.1. Các quy tắc ngữ nghĩa cho các cấu trúc cú pháp cao hơn....................................................546.3.2. Chuỗi video..................................................................................................................................556.3.3. Tiêu đề chuỗi................................................................................................................................556.3.4. Mở rộng và dữ liệu người dùng.................................................................................................586.3.5. Mở rộng chuỗi..............................................................................................................................58

1

6.3.6. Mở rộng hiển thị chuỗi................................................................................................................596.3.7. Mở rộng chuỗi có thể mở rộng..................................................................................................636.3.8. Nhóm tiêu đề ảnh.........................................................................................................................646.3.9. Tiêu đề ảnh...................................................................................................................................656.3.10. Mở rộng mã hóa ảnh.................................................................................................................676.3.11. Mở rộng ma trận lượng tử........................................................................................................706.3.12. Mở rộng hiển thị ảnh.................................................................................................................726.3.13. Mở rộng phần mở rộng trục hồi tiếp.......................................................................................746.3.14. Khả năng mở rộng ảnh tưng phần..........................................................................................746.3.15. Mở rộng bản quyền...................................................................................................................756.3.16. Lát cắt (Slice).............................................................................................................................766.3.17. Khối Macroblock........................................................................................................................776.3.18. Khối.............................................................................................................................................816.3.19. Phần mở rộng các tham số của máy ảnh...............................................................................816.3.20. Mở rộng ITU-T............................................................................................................................836.3.21. Dữ liệu mô tả nội dung.............................................................................................................837. Quá trình giải mã video.....................................................................................................................897.1. Các cấu trúc cú pháp cao hơn......................................................................................................897.2. Giải mã độ dài thay đổi..................................................................................................................907.2.1. Các hệ số DC trong khối bên trong...........................................................................................907.2.2. Các hệ số khác.............................................................................................................................917.3. Quét ngược.....................................................................................................................................937.3.1. Quét ngược cho ma trận tải về..................................................................................................947.4. Lượng tử hóa nghịch đảo - Inverse quantization.......................................................................947.4.1. Hệ số trong DC.............................................................................................................................957.4.2. Các hệ số khác.............................................................................................................................957.4.3. Độ bão hòa...................................................................................................................................967.4.4. Kiểm soát không phù hợp..........................................................................................................967.4.5. Tổng kết........................................................................................................................................987.5. DCT nghịch đảo..............................................................................................................................997.5.1. Các khối không mã hóa và bỏ qua các khối macroblock........................................................997.6. Bù chuyển động..............................................................................................................................997.6.1. Các chế độ dự đoán..................................................................................................................1017.6.2. Trường dự đoán và lựa chọn khung.......................................................................................1017.6.3. Các vectơ chuyển động............................................................................................................1047.6.4. Hình thành dự đoán..................................................................................................................1117.6.5. Lựa chọn vectơ chuyển động..................................................................................................1127.6.6. Bỏ qua macroblocks.................................................................................................................1147.6.7. Kết hợp các dự đoán.................................................................................................................1157.6.8. Thêm dữ liệu dự đoán và hệ số...............................................................................................1167.7. Khả năng mở rộng không gian...................................................................................................1167.7.1. Cấu trúc cú pháp cao hơn........................................................................................................1167.7.2. Dự đoán trong lớp tăng cường................................................................................................116

2

7.7.3. Hình thành dự đoán theo không gian......................................................................................1177.7.4. Lựa chọn và kết hợp dự đoán không gian và thời gian........................................................1227.7.5. Cập nhật các dự đoán vector chuyển động và lựa chọn vector chuyển động...................1247.7.6. Bỏ qua macroblocks.................................................................................................................1257.7.7. Sự tràn bộ đệm VBV ở tầng dưới............................................................................................1267.8. Khả năng mở rộng SNR...............................................................................................................1267.8.1. Cấu trúc cú pháp cao hơn........................................................................................................1297.8.2. Macroblock.................................................................................................................................1327.9. Khả năng mở rộng thời gian.......................................................................................................1337.9.1. Cấu trúc cú pháp cao hơn........................................................................................................1357.9.2. Những hạn chế dự đoán theo thời gian..................................................................................1377.10. Phân vùng dữ liệu......................................................................................................................1377.11. Khả năng mở rộng lai.................................................................................................................1397.12. Kết quả của quá trình giải mã...................................................................................................1408. Các mức và đặc tính (Level- profile)..............................................................................................1438.1. Độ tương thích của ISO/IEC 11172-2..........................................................................................1458.2. Mối quan hệ giữa các Profile được xác định.............................................................................1458.3. Mối quan hệ giữa các mức đã xác định.....................................................................................1478.4. Các lớp có thể mở rộng...............................................................................................................1478.4.1. Kết hợp lớp cho phép...............................................................................................................1498.4.2. Các ràng buộc cụ thể về Multi-view Profile............................................................................1508.5. Giá trị tham số cho các profiles, levels và lớp đã xác định.....................................................1518.6. Yêu cầu về bộ giải mã tương thích.............................................................................................1539. Nhận dạng Đăng ký bản quyền......................................................................................................1559.1. Tổng quát......................................................................................................................................1559.2. Hoạt động của Cơ quan đăng ký bản quyền (RA).....................................................................156Phụ lục A – Phép biến đổi cosine rời rạc đảo ngược(Quy định)....................................................157Phụ lục B - Bảng mã chiều dài thay đổi(Quy định)..........................................................................158Phụ lục C - Xác nhận bộ đệm video(Quy định).................................................................................172Phụ lục E - Giới hạn về đặc tính và mức (Tham khảo)....................................................................182Phụ lục F - Các tính năng được hỗ trợ bởi thuật toán (Tham khảo)..............................................212Phụ lục G - Thủ tục đăng ký(Tham khảo)..........................................................................................241Phụ lục H - Đơn đăng ký (Tham khảo)...............................................................................................243Phụ lục I - Cơ quan Đăng ký - Sơ đồ cơ cấu hành chính(Tham khảo)...........................................244Phụ lục K - Tác động của thực tiễn đối với các chuỗi bit không liên tiếp trong việc xem xét hiển thị quét liên tiếp(Tham khảo)..............................................................................................................250Tài liệu tham khảo...............................................................................................................................258

3

Lời nói đầu

TCVN xxxx-x:2017 được xây dựng trên cơ sở biên soạn từ Tiêu chuẩn quốc tế ISO/IEC 13818-2 (2013) - Information technology - Generic coding of moving pictures and associated audio information - Part 2: Video.

TCVN xxxx-x:2017 do Viện Khoa học Kỹ thuật Bưu điện, Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.

4

TCVN xxxx : 2017

TIÊU CHUẨN QUỐC GIA TCVN xxxx:2017

CÔNG NGHỆ THÔNG TIN - MÃ HÓA ẢNH CHUYỂN ĐỘNG VÀ THÔNG TIN ÂM THANH KẾT HỢP - PHẦN 2: VIDEO

“Information technology -Generic coding of moving pictures and associated audio information”- Part 2: Video

1. Phạm vi áp dụng

Tiêu chuẩn Quốc gia này xác định việc mã hoá đại diện thông tin ảnh cho phương tiện lưu trữ kỹ thuật số và truyền thông phim ảnh kỹ thuật số và xác định quá trình giải mã. Các đại diện hỗ trợ truyền tốc độ bit không đổi, truyền tốc độ bit biến đổi, truy cập ngẫu nhiên, nhảy kênh, giải mã có thể mở rộng, chỉnh sửa dòng bit, cũng như các chức năng đặc biệt như tua nhanh, tua lại, tua chậm, tạm dừng và dừng hình. Tiêu chuẩn Quốc gia này phù hợp với tương thích với tiêu chuẩn ISO/IEC 11172-2 hoặc tương thích với các định dạng SDTV, HDTV, EDTV.

Tiêu chuẩn Quốc gia này chủ yếu áp dụng cho phát sóng truyền hình và truyền thông,thiết bị lưu video kỹ thuật số. Các phương tiện lưu trữ có thể được kết nối trực tiếp với bộ giải mã, hoặc thông qua các phương tiện truyền thông như các bus, LAN, hoặc các đường truyền viễn thông.

2. Tài liệu viện dẫn

Các tài liệu viện dẫn sau đây là cần thiết để áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất (bao gồm cả các sửa đổi, bổ sung).

IEC 60401 (1986), Thời gian và điều khiển mã hóa đối với máy ghi băng hình video; ISO / IEC 11172-2: 1993, Công nghệ thông tin - Mã hóa ảnh chuyển động và âm

thanh; liên quan cho các phương tiện lưu trữ kỹ thuật số lên đến khoảng 1,5Mb/s - Phần 2: Video;

ISO/IEC 23002-1: 2006, Công nghệ thông tin - Công nghệ video MPEG - Phần I: Các yêu cầu chính xác để thực hiện chuyển đổi cosine rời rạc biến đổi ngược 8x8;

Khuyến nghị ITU-R BT.470-6 (1998), Các hệ thống truyền hình thông thường; Khuyến nghị ITU-R BT.601-7 (2011), Các thông số mã hóa của truyền hình kỹ thuật

số cho tiêu chuẩn 4:8 và tỉ lệ màn hình rộng 16:9; Khuyến nghị ITU-T 11.320 (2004), Hệ thống điện thoại băng thông hẹp và các thiết

bị đầu cuối.

3. Định nghĩaTiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:

3.1. Ảnh –picture

Dữ liệu ảnh nguồn, dữ liệu được mã hoá hoặc tái tạo. Một nguồn hoặc ảnh tái tạo bao

5

TCVN xxxx : 2017

gồm ba ma trận hình chữ nhật của số 8bit đại diện cho độ chói và hai tín hiệu sắc màu. Một "ảnh được mã hoá" được định nghĩa trong mục 3.21. Trong Tiêu chuẩn này. Đối với video liên tiếp, một ảnh giống hệt với một khung, trong khi đối với video xen kẽ, một ảnh có nghĩa là một khung, hoặc trường trên cùng hoặc trường dưới cùng của khung phụ thuộc vào ngữ cảnh.

3.2. Ảnh B, ảnh mã hóa dự đoán hai chiều - B- picture, bidirectionally predictive-coded picture

Một ảnh được mã hoá bằng cách sử dụng dự đoán được bù trừ chuyển động trước hoặc các trường hoặc khung tham chiếu tiếp theo.

3.3. Ảnh D – D-picture

Một loại ảnh không được sử dụng trừ ISO/IEC 11172-2.

3.4. Ảnh I, mã hoá trong ảnh- I-picture, intra-coded picture

Một ảnh được mã hoá chỉ sử dụng thông tin từ chính nó.

3.5. Ảnh lớn - big picture

Một ảnh mã hoá có thể gây ra sự tràn lên bộ đệm của VBV như được định nghĩa trong C.7. Ảnh lớn chỉ có thể xảy ra trong các dãy ở đó low_delay bằng 1. "Bỏ qua ảnh"-"Skipped picture" là một thuật ngữ đôi khi được sử dụng để mô tả cùng một khái niệm.

3.6. Ảnh mã hoá– coded picture

Một ảnh được mã hoá được làm từ một tiêu đề ảnh, các phần mở rộng tùy chọn ngay sau nó và các dữ liệu ảnh ngay sau nó. Một ảnh được mã hóa có thể là một khung được mã hoá hoặc một trường được mã hóa.

3.7. Ảnh P - P-picture

Ảnh dự đoán được mã hóa: Một ảnh được mã hóa bằng cách sử dụng bù chuyển động trước trường dữ liệu tham chiếu hoặc khung.

3.8. Biến đổi cosine rời rạc- discrete cosine transform (DCT)

Hoặc là biến đổi cosine rời rạc thuận hoặc là biến đổi cosine rời rạc ngược. DCT là một sự chuyển đổi trực giao có thể đảo ngược, rời rạc. DCT nghịch đảo được định nghĩa trong Phụ lục A của Tiêu chuẩn này.

3.9. Biến đổi ngược DCT, IDCT-Inverse DCT, IDCT

Đảo ngược biến đổi cosine rời rạc, như được định nghĩa trong Phụ lục A.

3.10. Bộ đệm đầu vào bộ giải mã- decoder input buffer

Bộ đệm The First-In First-Out (FIFO) vào - ra đầu tiên được chỉ định trong trình kiểm tra

6

TCVN xxxx : 2017

đệm video.

3.11. Bộ dự đoán –predictor

Một sự kết hợp tuyến tính của các giá trị mẫu đã được giải mã trước đó hoặc các thành phần dữ liệu.

3.12.Bộ giải mã –decoder

Một thực thể của một quá trình giải mã.

3.13. Bộ giải mã Profile xxx- xxx profile decoder

Bộ giải mã có khả năng giải mã một hoặc một hệ thống phân cấp có thể mở rộng các dòng bit, trong đó lớp trên phù hợp với các đặc tả của xxx profile (với xxx là bất kỳ tên Profile nào được xác định).

3.14. Bộ kiểm tra đệm video- Video buffering verifier (VBV)

Bộ giải mã giả thuyết được kết nối với đầu ra của bộ mã hóa. Mục đích của nó là cung cấp một sự hạn chế về sự biến đổi của tốc độ dữ liệu mà một bộ mã hóa hoặc quá trình chỉnh sửa có thể tạo ra.

3.15. Bộ lượng tửtheo tỷ lệ- quantizer scale

Một hệ số thành phầntỷ lệ được mã hoá trong dòng bit và được sử dụng bởi quá trình giải mã để chia theo tỷ lệ giải lượng tử hóa.

3.16. Bộ mã hóa – encoder

Một thực thể của một quá trình mã hóa.

3.17. Bỏ qua khối macroblock- skipped macroblock

Một macroblock trong đó không có dữ liệu nào được mã hóa.

3.18. Bù chuyển động - motion compensation

Việc sử dụng các vector chuyển động để nâng cao hiệu quả của việc dự đoán giá trị mẫu. Dự đoán sử dụng các vectơ chuyển động để cung cấp bù vào các khung tham chiếu trong sau và/ hoặc trước và các trường tham khảo có chứa các giá trị mẫu đã được giải mã trước đây được sử dụng để tạo thành lỗi dự đoán.

3.19. Buộc phải cập nhật - forced updating

Quá trình mà các macroblocks được mã hóa nội bộ theo thời gian để đảm bảo rằng các lỗi không phù hợp giữa các quá trình nghịch đảo DCT trong các bộ mã hóa và bộ giải mã không thể tích lũy quá mức.

3.20. ByteChuỗi 8 bit.

7

TCVN xxxx : 2017

3.21. Các hệ số DCT lượng tử hóa- quantized DCT coefficients

Hệ số DCT trước khi tái lượng tử. Một đại diện được mã hóa chiều dài biến đổi lượng tử DCT được truyền đi như là một phần của dòng bit video được mã hoá

3.22. Các thông số mã hóa- coding parameters

Tập hợp các tham số người dùng định nghĩa đặc trưng cho một dòng bit video được mã hóa. Dòng bit đặc trưng bởi các tham số mã hóa. Bộ giải mã đặc trưng bởi các dòng bit mà chúng có khả năng giải mã.

3.23. Chẵn lẻcủa trường- parity (of field)

Tính chẵn lẻ của một trường tin có thể là trên hoặc dưới cùng.

3.24. Chẵn lẻ đối diện - opposite parity

Chẵn lẻ đối diện của đỉnh là đáy, và ngược lại.

3.25. Chạy – run

Số hệ số zero trước một hệ số không bằng 0, theo thứ tự quét. Giá trị tuyệt đối hệ số không bằng 0 được gọi là "mức".

3.26. Chỉnh sửa – editing

Quá trình mà một hoặc nhiều dòng bit mã hóa được điều khiển để tạo ra một dòng bit được mã hóa mới. Việc tuân thủ các dòng bit đã chỉnh sửa phải đáp ứng các yêu cầu được xác định trong Tiêu chuẩn này.

3.27. Chuỗi video- video sequence

Cấu trúc cú pháp cao nhất của dòng bit video được mã hoá. Nó chứa một cảnh của một hoặc nhiều khung mã hoá.

3.28. Cờ - Flag

Một biến số nguyên một bit có thể lấy một trong hai giá trị (0 và 1).

3.29. Đặc tính – Profile

Một tập hợp con được định nghĩa của cú pháp của Tiêu chuẩn này.Chú ý - Trong Tiêu chuẩn này. từ "profile" được sử dụng như đã định nghĩa ở trên không nên nhầm lẫn với các định nghĩa khác của "profile " và đặc biệt nó không có ý nghĩa được xác định bởi nhóm đặc biệt JTC1 của ISO/IEC về Tiêu chuẩn chức năng.

3.30. Đại diện được mã hoá- coded representation

Một thành phần dữ liệu được biểu diễn dưới dạng được mã hóa của nó.

3.31. Định dạng sắc màu - chrominance format

8

TCVN xxxx : 2017

Định nghĩa số khối màu trong một khối macroblock.

3.32. Độ bão hòa–saturation

Giới hạn một giá trị vượt quá phạm vi xác định bằng cách đặt giá trị lên tối đa hoặc tối thiểu của phạm vi nếu thích hợp.

3.33. Dòng bit profile xxx - xxxprofile bíttream

Một dòng bit của một phân cấp có thể mở rộng với một tham số profile tương ứng với xxx. Lưu ý rằng dòng bit này chỉ có thể được giải mã cùng với tất cả các dòng bit lớp thấp hơn (trừ khi nó là một dòng bit lớp cơ sở).

3.34. Dòng bit video được mã hoá -coded video bitstream

Một đại diện được mã hoá của một hoặc nhiều ảnh như định nghĩa trong Tiêu chuẩn này.

3.35. Dòng, dòng bit - stream, bitstream

Một loạt theo thứ tự của các bit tạo thành mã biểu diễn của dữ liệu.

3.36. Dự đoán –prediction

Việc sử dụng dự đoán để cung cấp tính toán giá trị mẫu hoặc thành phần dữ liệu đang được giải mã.

3.37. Dự đoán 16x8 - 16x8 prediction

Một cơ chế dự đoán tương tự như dự đoán dựa trên trường nhưng ở đó kích thước khối dự đoán là 16x8 mẫu độ chói.

3.38. Dự đoán dựa trên trường cơ sở- Field-based prediction

Một cơ chế dự đoán chỉ sử dụng một trường của khung tham chiếu. Kích thước khối dự đoán là 16x16 mẫu độ chói.

3.39. Dự đoán khung cơ sở - frame-based prediction

Một cơ chế dự đoán sử dụng cả hai trường của khung tham chiếu.

3.40. Dự đoán ngược - backward prediction

Dự đoán từ khung tham chiếu trong tương lai (trường).

3.41. Dự đoán nguyên tố kép- dual-prime prediction

Một cơ chế dự đoán, trong đó hai dự đoán dựa trên trường cơ sở được dự đoán trung bình. Kích thước khối dự đoán là 16x16 mẫu độ chói.

3.42. Dự đoán theo không gian- spatial prediction

Dự đoán xuất phát từ một khung giải mã của bộ giải mã lớp thấp hơn được sử dụng trong

9

TCVN xxxx : 2017

khả năng mở rộng theo không gian.

3.43. Dự đoán theo thời gian- temporal prediction

Dự đoán được bắt nguồn từ các khung tham chiếu hoặc các trường khác với những gì được xác định là dự đoán theo không gian.

3.44. Dự dự đoán - forward prediction

Dự đoán từ khung tham chiếu trước đó (trường).

3.45. Dữ liệu ảnh - picture data

Trong các hoạt động VBV, dữ liệu ảnh được xác định là tất cả các bit của ảnh được mã hóa, tất cả các tiêu đề và dữ liệu người dùng ngay trước nó nếu có (bao gồm bất kỳ nhồi vào nào giữa chúng) và tất cả các nhồi vào theo nó, đến (nhưng không bao gồm) mã bắt đầu tiếp theo, ngoại trừ trường hợp mã bắt đầu tiếp theo là mã cuối cùng của chuỗi mã hóa, trong trường hợp nó được bao gồm trong dữ liệu ảnh.

3.46. Dự phòng –reserved

Thuật ngữ "reserved" khi sử dụng trong các mục xác định dòng bit được mã hóa, chỉ ra rằng giá trị này có thể được sử dụng trong tương lai cho các phần mở rộng được định nghĩa trong ITU-T ISO/IEC.

3.47. Giải lượng tử hóa- dequalization

Quá trình thay đổi tỷ lệ các hệ số lượng tử hóa DCT sau khi thể hiện trong dòng bit đã được giải mã và trước khi chúng được thể hiện để nghịch đảo DCF.

3.48. Giải mã - decoding (process)

Quá trình đọc dòng bit video được mã hoá ở đầu vào và tạo ra các ảnh được giải mã, được xác định trong Tiêu chuẩn này.

3.49. Hệ số AC - AC coefficient

Bất kỳ hệ số DCT nào mà tần số trong một hoặc cả hai không bằng không.

3.50. Hệ số DC - DC coefficient

Hệ số DCT có tần số bằng 0 trong cả hai chiều.

3.51. Hệ số DCT- DCT coefficient

Biên độ của một hàm cơ sở cosine cụ thể.

3.52. Kênh - channel

Một phương tiện kỹ thuật số lưu trữ hoặc vận chuyển một dòng bit được xây dựng theo Tiêu chuẩn này.

3.53.

10

TCVN xxxx : 2017

Khả năng mở rộng –scalability

Khả năng mở rộng là khả năng của bộ giải mã để giải mã một tập hợp thứ tự các dòng bit để tạo ra một chuỗi cấu trúc tái tạo. Hơn nữa, video hữu ích được xuất ra khi các tập hợp con được giải mã. Tập hợp con tối thiểu có thể được giải mã là dòng bit đầu tiên trong tập hợp gọi là lớp cơ sở. Mỗi dòng bit khác trong tập hợp được gọi là lớp tăng cường. Khi đặt một lớp tăng cường cụ thể, "lớp dưới" đề cập đến dòng bit đi trước lớp tăng cường.

3.54. Khả năng mở rộng lai- hybrid scalability

Khả năng mở rộng lai (Hybrid) là sự kết hợp của hai (hoặc nhiều hơn) loại khả năng mở rộng.

3.55. Khả năng mở rộng SNR- SNR scalability

Một loại khả năng mở rộng mà (các) lớp tăng cường chỉ chứa dữ liệu sàng lọc mã cho các hệ số DCT của lớp dưới cùng.

3.56. Khả năng mở rộng theo không gian- spatial scalability

Một loại khả năng mở rộng, trong đó một lớp tăng cường sử dụng các dự đoán từ dữ liệu mẫu có nguồn gốc từ lớp dưới mà không sử dụng các vector chuyển động. Các lớp có thể có kích thước khung hình khác nhau, tốc độ khung hoặc các định dạng độ sắc màu.

3.57. Khả năng mở rộng theo thời gian- temporal scalability

Một loại khả năng mở rộng, ở đó một lớp tăng cường cũng sử dụng các dự đoán từ dữ liệu mẫu lấy từ một lớp dưới sử dụng các vec tơ chuyển động. Các lớp có kích thước khung giống nhau, và các định dạng độ sắc nét, nhưng có thể có tốc độ khung hình khác nhau.

3.58. Khối – block

Một ma trận 8 hàng và 8 cột của các mẫu, hoặc các hệ số 64 DCT (nguồn, đã lượng tử hoá hoặc không lượng tử hóa).

3.59. Khối macroblockBốn của 8 bằng 8 khối dữ liệu độ chói và hai (cho định dạng sắc màu - chrominance 4:2:0), 4 (cho định dạng sắc màu 4:2:2) hoặc 8 (cho định dạng sắc màu 4:4:4) 8 bằng 8 khối dữ liệu màu từ 16 đến 16 phần của thành phần độ chói của ảnh. Macroblock đôi khi được sử dụng để tham khảo dữ liệu mẫu và đôi khi để biểu diễn mã của các giá trị mẫu và các thành phần dữ liệu khác được định nghĩa trong tiêu đề macroblock của cú pháp được định nghĩa trong Trong Tiêu chuẩn này. Cách sử dụng là rõ ràng từ ngữ cảnh.

3.60. Khung –Frame

Một khung chứa các dòng thông tin không gian của tín hiệu video. Đối với video liên tiếp, những dòng này chứa các mẫu bắt đầu từ một thời điểm tức thì và tiếp tục qua các dòng nối kế tiếp xuống dưới cùng của khung. Đối với video xen kẽ, khung bao gồm hai trường, trường trên cùng và trường dưới cùng. Một trong những trường này sẽ bắt đầu từ một

11

TCVN xxxx : 2017

khoảng thời gian sau trường khác.

3.61. Khung ảnh B - B-frame picture

Một khung ảnh B.

3.62. Khung ảnh I- I-frame picture

Cấu trúc Khung ảnh I.3.63. Khung ảnh P - P-frame pictureCấu trúc khung ảnh P.

3.64. Khung ảnh, cấu trúc khung ảnh- frame picture, frame structure picture

Một khung hình cấu trúc ảnh là một ảnh mã hóa với picrure_structure bằng "Frame".

3.65. Khung B mã hóa- coded B-frame

Một khung ảnh B hoặc một cặp khung ảnh B.

3.66. Khung chu kỳ - frame period

Thuận nghịch của tốc độ khung.

3.67. Khung I mã hoá- coded l-frame

Một khung ảnh l hoặc một cặp trường ảnh, trong đó trường ảnh đầu tiên là ảnh l và trường ảnh thứ hai là một ảnh I hoặc ảnh P.

3.68. Khung mã hóa- coded frame

Một khung được mã hóa là một khung I được mã hoá, một khung P được mã hoá hoặc một khung B được mã hóa.

3.69. Khung P mã hóa- coded P-frame

Một khung ảnh P hoặc một cặp trường ảnh P.

3.70. Khung tham chiếu- reference frame

Một khung tham chiếu là một khung tái tạo đã được mã hóa dưới dạng một khung I được mã hoá hoặc một khung P được mã hoá. Các khung tham chiếu được sử dụng để dự dự đoán và ngược lại khi các ảnh P và ảnh B được giải mã.

3.71. Khung tham chiếu tiếp theo (trường)- future reference frame (field)

Một khung tham chiếu tiếp theo(trường) là một khung tham chiếu (trường) xảy ra vào một thời gian sau đó so với ảnh hiện tại theo thứ tự hiển thị.

3.72. Khung tham chiếu trường trước- past reference frame (field)

12

TCVN xxxx : 2017

Một khung tham chiếu trong quá khứ (trường tin) là một khung tham chiếu (trường tin) xảy ra ở một thời gian sớm hơn so với ảnh hiện tại theo thứ tự hiển thị.

3.73. Kỹ thuật nén– compression

Giảm số bit được sử dụng để trình diễn một mục dữ liệu.

3.74. Lát cắt –slice

Một loạt liên tiếp các macroblock mà tất cả đều nằm trong cùng một hàng ngang của macroblocks.

3.75. Liên tiếp –progressive

Đặc điểm của khung phim, nơi tất cả các mẫu của khung đại diện giống ban đầu trong thời gian.

3.76. Lỗi dự đoán- prediction error

Sự khác biệt giữa giá trị thực của một mẫu hay thành phần dữ liệu và dự đoán của nó.

3.77. Lớp – layer

Trong một phân cấp có thể biểu thị một trong số các tập hợp dòng bit được yêu cầu và kết quả của quá trình giải mã liên quan (bao gồm cả giải mã tất cả các lớp bên dưới lớp này).

3.78. Lớp cơ sở - base layer

Đầu tiên, lớp giải mã độc lập của một phân cấp có thể mở rộng.

3.79. Lớp dòng bit- layer bitstream

Một dòng bit duy nhất liên kết với một lớp cụ thể (luôn được sử dụng cùng với lớp phủ, ví dụ "dòng bit lớp tăng cường").

3.80. Lớp dưới - lower layer

Một tham chiếu tương đối đến lớp ngay bên dưới một lớp tăng cường nhất định (bao gồm cả giải mã tất cả các lớp bên dưới lớp tăng cường này).

3.81. Lớp tăng cường - enhancement layer

Một tham chiếu tương đối với một lớp (trên lớp cơ sở) trong một phân cấp có thể mở rộng. Đối với tất cả các dạng khả năng mở rộng, quá trình giải mã của nó có thể được mô tả bằng cách tham chiếu đến quá trình giải mã lớp dưới và quá trình giải mã bổ sung thích hợp cho bản thân lớp tăng cường.

3.82. Lớp trên cùng- top layer

Lớp trên cùng (với nhận diện lớp cao nhất) của một hệ thống phân cấp có thể mở rộng.

3.83.

13

TCVN xxxx : 2017

Mã bắt đầu (hệ thống và video)-start codes (system and video)

Mã 32 bit được nhúng trong dòng bit được mã hóa đó là duy nhất. Chúng được sử dụng cho một số mục đích bao gồm xác định một số cấu trúc trong cú pháp mã hóa.

3.84. Mã hóa (quá trình) - encoding (process)

Một quá trình, đọc một dòng ảnh đầu vào và tạo ra một dòng bit mã hoá hợp lệ như được xác định trong Tiêu chuẩn này.

3.85. Mã hóa chiều dài thay đổi- variable length coding (VLC)

Một quy trình đảo ngược cho mã hóa gán các từ mã ngắn hơn cho các sự kiện thường xuyên và từ mã dài hơn tới các sự kiện ít thường xuyên hơn.

3.86. Mã hóa trong- intra coding

Mã hóa một macroblock hoặc ảnh chỉ sử dụng thông tin từ macroblock hoặc ảnh đó.

3.87. Mã non-intra- non-intra coding (Không mã hóa bên trong)

Mã hoá một macroblock hoặc ảnh sử dụng thông tin từ bản thân nó và từ cả hai Macroblocks và ảnh xảy ra vào những thời điểm khác.

3.88. Ma trận lượng tử - quantization matrix

Một tập gồm sáu mươi bốn giá trị 8bit được sử dụng bởi bộ giải lượng tử.

3.89. Mbit1 000 000 bit.

3.90. Mức –level

Một tập hợp các ràng buộc cho các giá trị có thể được thực hiện bởi các tham số trong một profile cụ thể của Tiêu chuẩn này. Profile có thể chứa một hoặc nhiều mức. Trong một ngữ cảnh khác, mức là giá trị tuyệt đối của hệ số không bằng không.

3.91. Nguồn; đầu vào- source; input

Thuật ngữ được sử dụng để mô tả các tài liệu của video hoặc một số thuộc tính của nó trước khi mã hóa.

3.92. Nhồi (bit), nhồi (byte)- stuffing (bits), stuffing (bytes)

Các từ mã có thể được chèn vào dòng bit được mã hoá mà chúng bị loại bỏ trong quá trình giải mã. Mục đích của chúng là tăng tốc độ bit của dòng mà nếu không nó sẽ thấp hơn tốc độ bit mong muốn.

3.93. Nhóm ảnh - group of pictures

Một khái niệm chỉ được xác định trong ISO/IEC 11172-2 (MPFG-1 Video). Trong Tiêu chuẩn này, một chức năng tương tự có thể đạt được bằng cách chèn các tiêu đề nhóm

14

TCVN xxxx : 2017

các hình ảnh.

3.94. Phân cấp có thể mở rộng- scalable hierarchy

Dữ liệu video được mã hóa bao gồm một tập hợp thứ tự nhiều hơn một dòng bit video.

3.95. Phân cấp có thể mở rộng profile xxx- xxx profile scalable hierarchy

Tập hợp dòng bit trong đó lớp trên phù hợp với các thông số kỹ thuật của xxx profile.

3.96. Phân vùng dữ liệu- Data partitioning

Một phương pháp để chia dòng bit thành hai dòng bit riêng biệt cho các mục đích phục hồi lỗi. Hai dòng bit phải được kết hợp lại trước khi giải mã.

3.97. Phát sóng màu - chroma simulcast

Một loại khả năng mở rộng (là một tập hợp con của khả năng mở rộng SNR), trong đó các lớp tăng cường chỉ chứa dữ liệu sàng lọc mã cho các hệ số DC, và tất cả các dữ liệu cho các hệ số AC, của các thành phần màu sắc.

3.98. Phương tiện lưu trữ kỹ thuật số- digital storage media (DSM)

Thiết bị lưu trữ hoặc thiết bị truyền dẫn kỹ thuật số.

3.99. Quá trình hiển thị- display process

Quá trình (không có quy chuẩn) mà khung tái tạo được hiển thị.

3.100. Sắp xếp byte - byte aligned

Một bit trong một dòng bit mã hóa được sắp xếp byte nếu vị trí của nó là một bội số của 8 bit từbit đầu tiên trong dòng.

3.101. Sắp xếp lại độ trễ- re-ordering delay

Trễ trong quá trình giải mã là do sự sắp xếp lại khung.

3.102. Sắp xếp lại khung- frame re-ordering

Quá trình sắp xếp lại các khung được tái tạo khi thứ tự mã hoá khác với thứ tự hiển thị. Sắp xếp lại khung xảy ra khi khung B có mặt trong một dòng bit. Không có Sắp xếp lại khung khi giải mã các dòng bit trễ thấp.

3.103. Tái tạoảnh- reconstructed picture

Ảnh tái tạo thu được bằng cách giải mã một ảnh được mã hóa. Một ảnh tái tạo là khung tái tạo (khi giải mã một khung ảnh), hoặc một trường của khung tái tạo (khi giải mã một trường ảnh). Nếu ảnh được mã hóa là một trường ảnh, thì ảnh tái tạo là trường trên cùng hoặc trường dưới cùng của khung tái tạo.

3.104.

15

TCVN xxxx : 2017

Tái tạo khung - reconstructed frame

Khung dựng lại bao gồm ba ma trận chữ nhật của số 8-bit đại diện cho độ chói và hai tín hiệu sắc màu. Một khung tái tạo thu được bằng cách giải mã một khung được mã hoá.

3.105. Tham số - parameter

Một biến trong cú pháp Trong Tiêu chuẩn này có thể có một trong một loạt các giá trị. Một biến có thể lấy một trong hai giá trị được gọi là cờ.

3.106. Thành phần- component

Ma trận, khối hoặc mẫu đơn lẻ từ một trong ba ma trận (độ chói và hai độ sắc màu) tạo nên một ảnh.

3.107. Thành phần độ chói- luminance component

Một ma trận, khối hoặc mẫu đại diện đơn lẻ cho một đại diện đơn sắc của tín hiệu và liên quan đến màu sắc chính 'theo cách được định nghĩa trong dòng bit . Biểu tượng được sử dụng cho độ chói là Y.

3.108. Thành phần dữ liệu- data element

Một mục dữ liệu được biểu diễn trước khi mã hóa và sau khi giải mã.

3.109. Thành phần sắc màu- chrominance component

Một ma trận, khối hoặc một mẫu đại diện cho một trong hai tín hiệu khác biệt màu sắc liên quan đến các màu cơ bản theo cách được định nghĩa trong dòng bit. Các ký hiệu được sử dụng cho các tín hiệu màu sắc là Cr và Cb.

3.110. Thông tin phụ- side information

Thông tin trong dòng bit cần thiết để điều khiển bộ giải mã.

3.111. Thứ tự hiển thị- display order

Thứ tự các ảnh giải mã được hiển thị. Thông thường đây là thứ tự mà chúng được trình diễn ở đầu vào bộ mã hóa.

3.112. Thứ tự mã hoá- coded order

Thứ tự mà các ảnh được truyền tải và giải mã. Thứ tự này không nhất thiết giống như thứ tự hiển thị.

3.113. Thứ tự quét zigzag- Zigzag scanning order

Một thứ tự sắp xếp cụ thể của hệ số DCT từ (xấp xỉ) tần số không gian thấp nhất đến cao nhất.

3.114. Tỉ lệ khuôn dạng mẫu - sample aspect ratio (SAR)

Điều này chỉ ra khoảng cách tương đối giữa các mẫu. Nó được định nghĩa (cho mục đích

16

TCVN xxxx : 2017

của Tiêu chuẩn này), như là sự dịch chuyển theo chiều thẳng đứng của các dòng của các mẫu độ chói trong một khung chia cho sự dịch chuyển ngang của các mẫu độ chói. Do đó, các đơn vị của nó là (mét cho mỗi dòng) ÷ (mét trên một mẫu).

3.115. Tiêu đề - header

Một khối dữ liệu trong dòng bit được mã hóa có chứa mã số đại diện của một số thành phần dữ liệu liên quan đến dữ liệu được mã hóa đi theo tiêu đề trong dòng bit.

3.116. Tính toán chuyển động - motion estimation

Quá trình ước lượng vectơ chuyển động trong quá trình mã hóa.

3.117. Tốc độ bit - bit rate

Tốc độ dòng bit mã hóa được phân phối từ môi trường lưu trữ tới đầu vào của bộ giải mã.

3.118. Tốc độ bit không đổi- constant bit rate

Hoạt động ở đó tốc độ bit không đổi từ đầu đến cuối của dòng bit được mã hóa.

3.119. Tốc độ bit thay đổi- variable bit rate

Hoạt động ở đó tốc độ bit thay đổi theo thời gian trong quá trình giải mã của một dòng bit được mã hoá.

3.120. Tốc độ khung - frame rate

Tốc độ khung hình được xuất ra từ quá trình giải mã.

3.121. Trạng thái cấm – forbidden

Thuật ngữ "cấm" khi sử dụng trong các mục xác định dòng bit được mã hóa cho thấy giá trị không bao giờ được sử dụng. Điều này thường là để tránh mô phỏng mã bắt đầu.

3.122. Trường –field

Đối với tín hiệu video xen kẽ, "trường" là sự lắp ráp các dòng luân phiên của một khung. Vì vậy, một khung xen kẽ bao gồm hai trường, một trường trên cùng và một trường dưới cùng.

3.123. Trường ảnh B - B-field picture

Một cấu trúc trường ảnh B.

3.124. Trường ảnh I - I- field picture

Một cấu trúc trường ảnh I.3.125. Trường ảnh I- I-field picture

Một cấu trúc trường ảnh I.

17

TCVN xxxx : 2017

3.126. Trường ảnh, trường cấu trúc ảnh- Field picture, Field structure picture

Một trường cấu trúc ảnh là một ảnh được mã hóa với picture_structure bằng "Trường trên cùng" hoặc "Trường dưới cùng"

3.127. Trường chu kỳ - Field period

Thuận nghịch của hai lần tốc độ khung.

3.128. Trường dưới cùng - bottom field

Một trong hai trường bao gồm một khung. Mỗi dòng của một trường dưới cùng là vị trí không gian ngay bên dưới dòng tương ứng của trường hàng đầu.

3.129. Trường tham chiếu- reference field

Trường tham chiếu là một trường của một khung tái tạo. Trường tham chiếu được sử dụng để dự dự đoán và sau, khi các ảnh P và các ảnh B được giải mã. Lưu ý rằng khi trường các ảnh P được giải mã, dự đoán trường các ảnh P thứ hai của một khung được mã hoá sẽ sử dụng trường được tái tạo lại đầu tiên của khung được mã hoá giống nhau làm một trường tham chiếu.

3.130. Trường trên cùng- top field

Một trong hai trườngbao gồm một khung. Mỗi dòng của một trường hàng đầu là vị trí không gian ngay phía trên đường tương ứng của trường dưới cùng.

3.131. Truy cập ngẫu nhiên- random access

Quá trình bắt đầu để đọc và giải mã dòng bit mã hóa tại một điểm tùy ý.

3.132. Tua ngược - fast reverse playback

Quá trình hiển thị trình tự ảnh ngược lại thứ tự hiển thị nhanh hơn thời gian thực.

3.133. Tua nhanh - fast forward playback

Quá trình hiển thị một chuỗi, hoặc các phần của một dãy, thứ tự ảnh hiển thị trên màn hình nhanh hơn thời gian thực.

3.134. Tương thích ngược - backward compatibility

Một tiêu chuẩn mã hoá mới hơn tương thích ngược với tiêu chuẩn mã hóa cũ hơn nếu bộ giải mã được thiết kế để hoạt động với tiêu chuẩn mã hóa cũ hơn có thể tiếp tục hoạt động bằng cách giải mã tất cả hoặc một phần của dòng bit được tạo theo tiêu chuẩn mã hóa mới hơn.3.135. Tương thích chuyển tiếp - forward compatibility

Một tiêu chuẩn mã hoá mới hơn tương thích với tiêu chuẩn mã hoá cũ hơn nếu bộ giải mã được thiết kế để hoạt động với chuẩn mã hóa mới hơn có thể giải mã các dòng bit của

18

TCVN xxxx : 2017

tiêu chuẩn mã hóa cũ.

3.136. Tỷ lệ hiển thị- display aspect ratio

Tỷ lệ chiều cao chia cho chiều rộng (trong các đơn vị đo không gian như centimet) của màn hiển thị dự định.

3.137. Vector chuyển động - motion vector

Một vector hai chiều được sử dụng cho sự bù chuyển động cung cấp bù từ vị trí tọa độ trong ảnh hoặc trường hiện tại đến tọa độ trong một khung tham chiếu hoặc trường tham chiếu.

3.138. Vector chuyển động chuyển tiếp -- forward motion vector

Một vector chuyển động được sử dụng để bù chuyển động từ một khung tham chiếu hoặc trường tham chiếu tại một thời gian trước đó theo thứ tự hiển thị.

3.139. Vector chuyển động ngược - backward motion vector

Một vector chuyển động được sử dụng cho việc di chuyển từ một khung tham chiếu hoặc trường tham chiếu vào một thời gian chậm hơn theo thứ tự hiển thị.

3.140. Video được mã hóa với tốc độ bit không đổi- constant bit rate coded video

Dòng bít video được mã hóa với độ bit không đổi.

3.141. Xen kẽ- interlace

Đặc tính của các khung truyền hình thông thường, nơi các dòng xen kẽ của khung thể hiện các trường hợp khác nhau trong thời gian. Trong một khung xen kẽ, một trong các trường này có nghĩa là để được hiển thị đầu tiên. Trường này được gọi là trường trên cùng. Trường đầu tiên có thể là trường trên cùng hoặc trường dưới cùng của khung.

4. Các ký hiệu và chữ viết tắtCác toán tử toán học dùng để mô tả Tiêu chuẩn này tương tự như tiêu chuẩn được sử dụng trong ngôn ngữ lập trình C. Tuy nhiên, phân số nguyên với việc bỏ hết các số hạng và làm tròn được xác định cụ thể. Các toán tử bit được định nghĩa giả định bổ sung hai thành phần đại diện của số nguyên. Số và đếm vòng lặp thường bắt đầu từ 0.

4.1. Các toán tử số học+ Phép cộng

- Phép trừ

++ Phéptăng

- - Phépgiảm

* hoặc x

Phép nhân

^ Phéplũy thừa

19

TCVN xxxx : 2017

/ PhépPhân chia số nguyên với bỏ hết các số hạng của kết quả về 0. Ví dụ. 7/4 và -7/4 được cắt ngắn là 1 và -7/4và 7/-1 được cắt ngắn thành - 1.

// Phân chia số nguyên với làm tròn đến số nguyên gần nhất. Giá trị nửa số nguyên được làm tròn từ 0 trừ khi được quy định khác. Ví dụ 3//2 được làm tròn thành 2. và -3//2 được làm tròn thành -2.

DIV Phân chia số nguyên Với cắt ngắn kết quả về phía cực âm. Ví dụ 3 DIV 2 được làm tròn thành 1, và -3 DIV 2 được làm tròn thành -2.

÷ Được sử dụng để chỉ sự phân chia các phương trình toán học mà không cắt bớt hoặc làm tròn.

% Vận hành Modulus. Xác định chỉ cho số dương. (lấy phần dư)

1 x> 0

Sign() Phép gán Sign (x) = 0 x = = 0-1 x <0

Abs()Phép giá trị tuyệt đối Abs(x) = x x≥ 0

- x x< 0

∑i=a

i< b

f (i) Phép Tổng của f(i) với i lấy các giá trị nguyên từ a trở lên, nhưng không bao gồm b.

Floor() Phép làm tròn xuống: số nguyên lớn nhất ít hơn hoặc bằng đối số.

Round()

Phép làm tròn lên: Sign(x) * Floor(Abs(x) + 0.5 ), cho một đối số x.

4.2. Các toán tử logic|| Logical OR

&& Logical AND

! Logical NOT

4.3. Các toán tử quan hệ> Lớn hơn

≥ Lớn hơn hoặc bằng

< Nhỏ hơn

≤ Nhỏ hơn hoặc bằng

= = Bằng

! = Không bằng

max […] Giá trị lớn nhất trong danh sách đối số

min [….] Giá trị tối thiểu trong danh sách đối số

4.4. Các toán tử thao tác bit (Bitwise)& AND

I OR

20

TCVN xxxx : 2017

» Di chuyển về bên phải với phần ký hiệu mở rộng

« Di chuyển về bên trái và điền vào với số 0

4.5. Phép gán= Gán bằng (Assignment operator) Nhóm toán tử gán (Assignment

Operators): dùng để gán dữ liệu cho biến.

4.6. Các Nhận dạngCác phép ghi nhớ sau đây được định nghĩa để mô tả các kiểu dữ liệu khác nhau được sử dụng trong dòng bit được mã hóa.

bslbf Bit string, bit bên trái đầu tiên (left bit first), trong đó "left" là thứ tự trong chuỗi bit ghi trong Tiêu chuẩn này. Chuỗi bit được viết bằng một chuỗi 1 và 0 bên trong các dấu nháy đơn, ví dụ: '1000 0001'. Các khoảng trống trong một chuỗi bit chỉ là để cho dễ đọc và nó không có ý nghĩa.

uimshf số nguyên không dấu, bit đầu tiên quan trọng nhất

simsbf Ký hiệu số nguyên, ở hai định dạng bổ sung, bit ký hiệu quan trọng nhất trước tiên.

vlclbf Mã biến chiều dài, bit trái đầu tiên, trong đó "trái" dùng để chỉ thứ tự các mã VLC bằng văn bản. Thứ tự byte của từ nhiều byte là byte quan trọng nhất đầu tiên.

Trong các mụcmô tả cú pháp, bất kỳ thành phần cú pháp nào chỉ có thể lấy các giá trị dương hoặc không dấu (như một cờ có thể bằng 0 hoặc 1) được mô tả với nhận dạng là “uimsbf”. Nếu thành phần cú pháp có thể có một giá trị âm, nó được mô tả với nhận dạng là “simsbf”. Nếu tành phầncú pháp có giá trị không đổi (ví dụ: marker_bit) thì nó được mô tả với nhận dạng là “bslbf”. Nếu thành phầncú pháp đại diện cho mã có độ dài biến, nó được mô tả với nhận dạng là “vlclbf”.

4.7. Hằng sốSố π 3.14159265359

Số e 2.71828182845

4.8. Thuật ngữ viết tắt

Cụm tư viết tắt – Thuật ngữ Tiếng Anh Nghĩa tiếng Việt

AVC Advanced video coding Mã hóa video nâng cao (xem ISO/IEC 14496-10)

AVC video elementary stream

AVC video elementary stream

Dòng cơ sở video AVC

AES Advanced Encryption Standard

Tiêu chuẩn mã hóa cải tiến

bslbf bit serial leftmost bit first Bit tận cùng bên trái nối tiếp bit đầu tiên

CBR Constant Bit Rate coding Mã hoá tốc độ bit không đổi

21

TCVN xxxx : 2017

Cụm tư viết tắt – Thuật ngữ Tiếng Anh Nghĩa tiếng Việt

DVB-CDigital Video Broadcasting- Cable

Truyền hình cáp số DVB-C

DVD Định dạng đĩa DVD

DVB - SDigital Video Broadcasting-Satellite

Truyền hình số vệ tinh DVB-S

DVB -T Digital Video Broadcasting - Terrestrial

Truyền hình số mặt đất DVB-T

EDTV Enhanced Definition Television

Truyền hình có độ nét mở rộng EDTV (nhận tín hiệu đầu vào HDTV, nhưng phải downconvert tín hiệu xuống để phù hợp với độ phân giải hiển thị trên màn hình EDTV)

GOP Group of pictures Nhóm ảnh

DAR Display Aspect Ratio Tỷ lệ khuôn dạng hiển thị

DCT Discrete cosine transform Biến đổi cosine rời rạc

DCF Quantized DCT coefficients Các hệ số DCT lượng tử hóa

DSM - CC Digital Storage Media - Command and Control

Phương tiện lưu trữ kỹ thuật số - điều khiển và kiểm soát

DTV Digital Television Thiết bị truyền hình kỹ thuật số

DVB Digital Video Broadcast Truyền hình kỹ thuật số

ES elementary stream Dòng cơ sở

IEC Ủy ban Kỹ thuật Điện Quốc tế

International Electrotechnical Commission

ISO Tổ chức tiêu chuẩn hóa quốc tế

International Organization for Standardization

ITU - TLiên minh viễn thông quốc tế - Lĩnh vực tiêu chuẩn hóa viễn thông

International Telecommunication Union – Telecommunication Standardization Sector

HDTV High Definition Television Truyền hình độ phân giải cao

MPEG Moving Pictures Experts Group

Nhóm chuyên gia ảnh động

MPEG-2 Moving Pictures Experts Group - 2

Một chuẩn mã hóa hình ảnh âm thanh, xem ISO/IEC 13818 [18].

Mnomonic Multiplex Nhận dạng

NAL Network abstraction layer Lớp trừu tượng hóa mạng

Numbits Số bit

NTSC National Teltevision System Committee

hệ truyền hình được sử dụng hầu hết ở Bắc Mỹ và Nam Mỹcó tần số quét ngang là 60Hz (tương đương 30 khung

22

TCVN xxxx : 2017

Cụm tư viết tắt – Thuật ngữ Tiếng Anh Nghĩa tiếng Việt

hình/s).Mỗi khung hình được tao ra bởi 525 dòng quét đơn

PAL Phase Alternating Line Chuẩn phát hình PALhệ truyền hình được dùng phần lớn ở Châu Âu, châu ÁChuẩn PAL có tần số quét ngang là 50Hz (tương đương 25 khung hình/s)Mỗi khung hình được tao ra bởi 625 dòng quét.

PES Dòng cơ bản đã gói hóa

PMV Predictors for Motion Vectors

PCM Điều chế xung mã

PSI Program Specific Information

Thông tin xác định chươngtrình

QAM Quadrature Amplitude Modulation

Điều biên cầu phương

RGB Thành phần màu truyền hình - Đỏ, Xanh lục và xanh dương

RID Responsibilities of the Registration Authority

Thủ tục yêu cầu đăng ký định danh

SAR Sample aspect ratio Tỉ lệ khuôn dạng mẫu

SEI Supplementary enhancement information

Thông tin cải tiến bổ sung

SDTV Standard Definition Television

Truyền hình độ nét tiêu chuẩn

SECAM Sequentiel Couleur A Meorire

Hệ truyền hình SECAM

SMPTESNR Tỷ lệ tín hiệu nhiễu Signal to Noise Ratio

SI Service Information Thông tin dịch vụ

STB Set Top Box Thiết bị giải mã kỹ thuật số có nguồn điện độc lập

STC System Time Clock Đồng hồ thời gian hệ thống

simsbf Signed integer, in two’s complement format, most significant (sign) bit first.

Ký hiệu số nguyên, ở hai định dạng bổ sung, bit ký hiệu quan trọng nhất trước tiên.

TS Transport stream Dòng truyền tải

uimsbf unsigned integer most Số nguyên không dấu bit quan trọng

23

TCVN xxxx : 2017

Cụm tư viết tắt – Thuật ngữ Tiếng Anh Nghĩa tiếng Việt

significant bit first nhất đầu tiên

UPC Usage Parameter Control Kiểm soát thông số sử dụng

VBR Variable Bit Ratecoding Mã hoá tốc độ bit biến đổi

VBV Video buffering verifier Bộ kiểm tra đệm video

VLC Variable length coding Mã hóa chiều dài thay đổi

vldbf Variable length code, left bit first

Mã biến chiều dài, bit trái đầu tiên, trong đó "trái" dùng để chỉ thứ tự các mã VLC bằng văn bản. Thứ tự byte của từ nhiều byte là byte quan trọng nhất đầu tiên.

VUI Video Usability Information Thông tin sử dụng videohexadecimal Hexadecimal Hệ thập lục phân (hay hệ đếm cơ số

16)Y/C (Tín hiệu) Chói/Màu

5. Quy ước

5.1. Cách mô tả cú pháp dòng bit

Dòng bit thu được bởi bộ giải mã được mô tả trong 6.2. Mỗi mục dữ liệu trong dòng bit được in đậm. Nó được mô tả bởi tên của nó, chiều dài của nó bằng các bit, và một nhận dạng về kiểuvà thứ tự truyền của nó.

Hành động gây ra bởi việc giải mã dữ liệu trong một dòng bit phụ thuộc vào giá trị của thành phần dữ liệu đó và các thành phần dữ liệu được giải mã trước đây. Việc giải mã các thành phần dữ liệu và xác định các biến trạng thái được sử dụng trong giải mã của chúng được mô tả trong 6.3. Các cấu trúc sau đây được sử dụng để diễn tả các điều kiện khi các thành phần dữ liệu có mặt và nằm trong kiểu bình thường:

while ( condition ) { Nếu điều kiện là đúng, thì nhóm các thành phần dữ liệu sẽ xảy ra tiếp theo trong dòng dữ liệu. Điều này lặp lại cho đến khi điều kiện không đúng.

data_element

}do {

Data_element Thành phần dữ liệu luôn luôn xảy ra ít nhất một lần} while ( condition ) Thành phần dữ liệu được lặp lại cho đến khi điều kiện không đúng

if ( condition ) { Điều kiện là đúng, sau đó nhóm dữ liệu đầu tiên xảy ra tiếp theo trong dòng dữ liệuData_element

}else { Nếu điều kiện không đúng, thì nhóm thứ hai của các phần tử dữ liệu xảy ra tiếp theo trong dòng dữ liệu.

data .element

}for (i = m. i < n, i++) {Nhóm các phần tử dữ liệu xảy ra (m - n) lần Điều kiệncấu trúc trong nhóm các phần tử dữ liệu có thể phụ thuộc vàogiá trị của biến điều khiển vòng lặp i. được đặt là 0 chosự xuất hiện đầu tiên, gia tăng bằng một cho sự xuất hiện thứ hai, và vân vân

data_element. . .

}

24

TCVN xxxx : 2017

/* comment... */ Chú giải giải thích có thể bị xóa hoàn toàn mà không thay đổi bất kỳ cách nào trong cú pháp.

Cú pháp này sử dụng quy ước 'C-code' rằng một biến hoặc biểu thức đánh giá một giá trị khác không tương đương với điều kiện đúng và một biến hoặc biểu thức đánh giá một giá trị bằng không tương đương với điều kiện sai. Trong nhiều trường hợp một chuỗi chữ được sử dụng trong một điều kiện. Ví dụ:

if (sealable_mode == "spatial_scalability") ...

Trong những trường hợp như vậy, chuỗi ký tự được sử dụng để mô tả giá trị của thành phần dòng bit trong 6.3. Trong ví dụ này, chúng ta thấy rằng "khả năng mở rộng theo không gian" được định nghĩa trong Bảng 6-10 được thể hiện bởi số nhị phân hai bit '01'.

Như đã lưu ý, nhóm các thành phần dữ liệu có thể chứa các cấu trúc có điều kiện lồng nhau. Để cho chắc chắn, các { } được bỏ qua khi chỉ có thành phần dữ liệu sau:

data_element [n] Thành phần dữ liệu [n] là thành phần thứ (n + 1) của một mảng dữ liệu.

data_element [m][n] Thành phần dữ liệu [m][n] là thành phần thứ (m + 1, n + 1) của một mảng dữ liệu hai chiều.

data_element [l][m][n] Thành phần dữ liệu [l][m][n] là thành phần thứ (l+1, m+1, n+1) của một mảng dữ liệu ba chiều.

5.2. Định nghĩa chức năng

Một số chức năng tiện ích cho thuật toán mã hóa ảnh được xác định như sau.

5.2.1. Định nghĩa hàm bytealigned()

Hàm bytealigned() trả về 1 nếu vị trí hiện tại nằm trên một ranh giới byte, đó là bit tiếp theo của dòng bit là bit đầu tiên trong byte. Nếu không nó sẽ trả về 0.

5.2.2. Định nghĩa hàm nextbitst()

Hàm nextbits() cho phép so sánh một chuỗi bit với các bit tiếp theo được giải mã trong dòng bit.

5.2.3. Định nghĩa hàm next_start_code()

Hàm next_start_code() loại bỏ bất kỳ bit không (zero bit) và byte nhồi không (zero byte) nào, và xác định vị trí bắt đầu tiếp theo

next_start_code() { Số bit Nhận dạngwhile ( !bytealigned() )

zero_bit 1 ‘0’while ( nextbit() ! = '0000 0000 0000 0000 0000 0001’ )

zero_byte 8 ‘0000 0000’}

Chức năng này kiểm tra xem vị trí hiện tại có byte đã được điều chỉnh hay không. Nếu không, bit nhồi không (zero bit) sẽ hiện diện. Sau đó, bất kỳ số lượng byte nhồi không (zero byte) nào có thể có mặt trước mã bắt đầu. Vì vậy, mã bắt đầu luôn luôn được điều chỉnh liên tục và có thể được đặt trước bởi bất kỳ số bit nhồi không (zero bit) nào.

25

TCVN xxxx : 2017

5.3. Dự phòng, cấm và bit đánh dấu (marker_bit)

Các thuật ngữ "dự phòng" và "cấm" được sử dụng trong mô tả một số giá trị của một vài trường trong dòng bit mã hoá.

Thuật ngữ "dự phòng" chỉ ra rằng giá trị có thể được sử dụng trong tương lai cho các phần mở rộng được xác định trong ITU-T ISO/IEC.

Thuật ngữ "cấm" cho biết giá trị không bao giờ được sử dụng (thường là để tránh mô phỏng mã bắt đầu).

Thuật ngữ "bit đánh dấu" chỉ ra một số nguyên một trong số đó là giá trị zero được cấm (và nó sẽ có giá trị 1). Các bit đánh dấu được giới thiệu ở một số điểm trong cú pháp để tránh mô phỏng mã bắt đầu.

5.4. Độ chính xác số học

Để giảm sự khác biệt khi triển khai Tiêu chuẩn này, các quy tắc sau cho các phép toán số học được xác định:

a) Trường hợp không xác định được một kết quả chính xác về phương diện chính xác, chẳng hạn như trong tính toán của IDCT, độ chính xác phải đủ để các lỗi chính không xảy ra ở các giá trị số nguyên cuối cùng.

b) Trường hợp các giá trị được đưa ra bởi dấu hai chấm, điểm cuối cùng được đưa ra nếu một khung được hiện diện và loại trừ nếu sử dụng các ký tự 'ít hơn' (<) và ‘lớn hơn' (>). Ví dụ, [a: b> có nghĩa là từ a đến b, bao gồm a nhưng không bao gồm b]

6. Cú pháp và ngữ nghĩa dòng bit video

6.1. Cấu trúc dữ liệu mã hóa video

Dữ liệu video đã mã hóa bao gồm một tập hợp các dòng bit video yêu cầu, được gọi là các lớp. Nếu chỉ có một lớp, dữ liệu mã hóa video được gọi là dòng bit không thể mở rộng. Nếu có hai lớp hoặc nhiều hơn, dữ liệu mã hóa video được gọi là phân cấp có thể mở rộng.

Lớp đầu tiên (của tập hợp theo thứ tự) được gọi là lớp cơ sở, và nó luôn luôn có thể được giải mã độc lập. Xem từ mục 7.1 đến mục 7.6 và mục 7.12 để mô tả quá trình giải mã cho lớp cơ sở, trừ trường hợp Phân vùng dữ liệu, được mô tả trong mục 7.10.

Các lớp khác được gọi là các lớp tăng cường, và chỉ có thể được giải mã cùng với tất cả các lớp thấp hơn (các lớp trước trong tập hợp theo thứ tự), bắt đầu với lớp cơ sở. Xem từ mục 7.7 đến mục 7.11 để biết mô tả quá trình giải mã cho phân cấp có thể mở rộng.

Xem Tiêu chuẩn này mô tả cách thức các lớp có thể được ghép ghép lại với nhau.

Lớp cơ sở của một hệ thống phân cấp có thể mở rộng phù hợp với Tiêu chuẩn kỹ thuật này hoặc các tiêu chuẩn khác như ISO/IEC 11172-2.Xem chi tiết trong mục 7.7 đến mục 7.11. Các lớp tăng cường phải tuân thủ Tiêu chuẩn kỹ thuật này.

Trong tất cả các trường hợp ngoài phân vùng dữ liệu, lớp cơ sở không chứa một scquence_scalable_extension(). Các lớp tăng cường luôn chứa sequence_scalable_extension().Nói chung, dòng bit video có thể được coi là một cấu trúc cú pháp trong đó các cấu trúc cú pháp chứa một hoặc nhiều cấu trúc cấp dưới. Ví dụ, cấu trúc "picture_data()" chứa một hoặc nhiều cấu trúc cú pháp "sliced" mà trong phiên có chứa một hoặc nhiều cấu trúc "macroblock()".Cấu trúc này rất giống với cấu trúc được sử dụng trong ISO/IEC 11172-2.

26

TCVN xxxx : 2017

6.1.1. Chuỗi video

Dòng cú pháp cao nhất của dòng bit mã hóa video là chuỗi video.

Một chuỗi video bắt đầu với một tiêu đề chuỗi có thể theo sau bởi một nhóm tiêu đề ảnh và sau đó bằng một hoặc nhiều khung được mã hoá. Thứ tự của các khung được mã hoá trong dòng bit được mã hoá là thứ tự trong đó bộ giải mã xử lý chúng, nhưng không nhất thiết theo đúng chuỗi hiển thị. Chuỗi video bị chấm dứt bởi mã kết thúc chuỗi. Tại các điểm khác nhau trong chuỗi video, một khung được mã hóa cụ thể có thể được đặt trước bằng một tiêu đề hủy bỏ hoặc một nhóm tiêu đề ảnh hoặc cả hai. (Trong trường hợp cả tiêu đề lặp lại và một nhóm tiêu đề ảnh ngay trước một ảnh cụ thể, nhóm của tiêu đề ảnh sẽ làm theo các chuỗi tiêu đề lặp lại)

6.1.1.1. Chuỗi liên tiếp và xen kẽTiêu chuẩn kỹ thuật đề cập đến mã hóa của cả hai chuỗi liên tục và xen kẽ.

Đầu ra của quá trình giải mã, đối với các chuỗi xen kẽ, bao gồm một loạt các trường tái tạo được tách ra trong thời gian bởi một trường chu kỳ. Hai trường của một khung có thể được mã hóa riêng (trường ảnh). Ngoài ra, hai trường có thể được mã hoá với nhau dưới dạng một khung (khung ảnh). Cả khung ảnh và trường ảnh đều có thể được sử dụng trong một chuỗi video duy nhất.

Trong chuỗi liên tiếp mỗi ảnh trong chuỗi sẽ là một khung hình. Chuỗi, ở đầu ra của quá trình giải mã, bao gồm một loạt các khung được tái tạo được tách ra theo thời gian bởi một chu kỳ khung.

6.1.1.2. KhungKhung bao gồm ba ma trận số nguyên hình chữ nhật: ma trận độ chói(Y), và hai ma trận sắc màu (Cb và Cr).

Mối quan hệ giữa các thành phần Y, Cb và Cr và các tín hiệu Đỏ, Xanh lục và xanh dương (tương tự), (E'R, E'G và E'B), màu sắc cơ bản và các đặc tính chuyển đổi của khung nguồn này được xác định trong dòng bit (hoặc được chỉ định bởi một số phương tiện khác). Thông tin này không ảnh hưởng đến quá trình giải mã.

6.1.1.3. TrườngMột trường bao gồm tất cả các dòng khác của mẫu trong ba ma trận số nguyên hình chữ nhật đại diện cho một khung.

Một khung là sự kết hợp của một trường trên cùng và một trường dưới cùng. Trường trên cùng là trường chứa dòng trên cùng của mỗi ma trận. Trường dưới cùng là trường chứa dòng dưới cùng của mỗi ma trận.

6.1.1.4. ẢnhMột ảnh được mã hóa được làm bằng một phần đầu ảnh, các phần mở rộng tùy chọn ngay sau nó và các dữ liệu ảnh sau đây. Một ảnh mã hóa có thể là một khung được mã hoá hoặc một trường được mã hoá.

Một khung ảnh I hoặc một cặp trường ảnh, trong đótrường ảnh đầu tiên là ảnh I vàtrường ảnh thứ hai là ảnh I hoặc ảnh P, được gọi là mã hóa khung I.Một khung ảnh P hoặc một cặp trường ảnh P được gọi là mã hóa khung P.

Một khung ảnh B hoặc một cặp trường ảnh B được gọi là mã hóa khung B.

Một khung I mã hoá, một khung P mã hóa hoặc một khung Bmã hóa được gọi là khung mã hoá.

Ảnh tái tạo được thu được bằng cách giải mã một ảnh được mã hóa, tức là một tiêu đề

27

TCVN xxxx : 2017

ảnh, các phần mở rộng tuỳ chọn ngay sau đó, và dữ liệu ảnh. Một ảnh được mã hóa có thể là khung ảnh hoặc trường ảnh. Một ảnh tái tạo là khung tái tạo (khi giải mã một khung hình), hoặc một trường của khung tái tạo (khi giải mã một trường ảnh).

6.1.1.4.1. Trường ảnh Nếu sử dụng các trường ảnh, thì chúng sẽ xuất hiện theo cặp (một trường trên cùng theo một trường dưới cùng, hoặc một trường dưới cùng theo một trường trên cùng) và cùng nhau tạo thành một khung được mã hoá. Hai trường ảnh bao gồm một khung được mã hóa sẽ được mã hoá trong dòng bit theo thứ tự mà chúng sẽ xuất hiện ở đầu ra của quá trình giải mã.

Khi ảnh đầu tiên của khung được mã hoá là một trường ảnh P, ảnh thứ hai của khung được mã hoá cũng sẽ là một trường ảnh P. Tương tự như vậy khi ảnh đầu tiên của khung được mã hoá là một trường ảnh B, ảnh thứ hai của khung được mã hoá cũng sẽ là một trường ảnh B.

Khi ảnh đầu tiên của khung được mã hoá là một trường ảnh I, ảnh thứ hai của khung ảnh phải làtrường ảnh I hoặc trường ảnh P. Nếu ảnh thứ hai là trường ảnh P, thì áp dụng những ràng buộc nhất định (xem 7.6.3.5).

6.1.1.4.2. Khung các ảnh Khi mã hóa các chuỗi xen kẽ bằng cách sử dụng khungảnh, hai trường của khung sẽ được xen kẽ với nhau và sau đó toàn bộ khung được mã hoá như một khung ảnh đơn lẻ.

6.1.1.5. Các loại ảnhCó ba loại ảnh sử dụng các phương pháp mã hóa khác nhau:

-Một ảnh mã hóa trong ảnh (I) được mã hóa bằng cách sử dụng thông tin chỉ từ chính nó;

-Một ảnh được mã hoá dự đoán (P) là một ảnh được mã hóa bằng cách sử dụng dự đoán bù chuyển động từ một khung tham chiếu trong quá khứ hoặc trường tham chiếu trước đây;

-Một ảnh được mã hóa dự đoán hai chiều (B) là một ảnh được mã hóa bằng cách sử dụng dự đoán bù chuyển động từ (các) khung tham chiếu trước hoặc sau.

6.1.1.6. Chuỗi tiêu đề Chuỗi tiêu đề video bắt đầu với một sequence_header_code và được theo sau bởi một loạt các thành phần dữ liệu. Trong tiêu chuẩn kỹ thuật này, sequence_header() sẽ được theo sau bởi sequence_extension() bao gồm các thông số khác ngoài các tiêu chuẩn được sử dụng bởi ISO/IEC 11172-2. Khi có sequence_extension(), cú pháp và ngữ nghĩa được định nghĩa trong ISO/IEC 11172-2 không áp dụng, và áp dụng tiêu chuẩn kỹ thuật hiện tại.

Trong các tiêu đề lặp lại tất cả các thành phần dữ liệu với các ngoại lệ cho phép xác định các ma trận lượng tử (load_intra_quantiser_matrix, load_non_intra_quantiser_matrix và tùy chọn intra_quantiser_matrix và non_intra_quantiser_matrix) sẽ có cùng giá trị như trong chuỗi tiêu đề đầu tiên. Ma trận lượng tử có thể được xác định lại mỗi khi một chuỗi các tiêu đề xảy ra trong dòng bit (lưu ý rằng các ma trận lượng tử cũng có thể được cập nhật bằng cách sử dụng quant_matrix_extension()).Tất cả các phần tử dữ liệu trong sequence_extension() tiếp theo là một sequence_header() lặp lại, sẽ có cùng giá trị như trong sequence_extension() đầu tiên.

Nếu sequence_scalable_extension() xảy ra sau khi sequence_header() đầu tiêntất cả các tiêu đề sắp xếp tiếp theo sẽ được theo sau bởi sequence_scalable_extension(),trong đó tất cả các phần tử dữ liệu giống như trong phần đầu tiên của

28

TCVN xxxx : 2017

sequence_scalable_extension() Ngược lại nếu không có sequence_scalable_extension() xảy ra giữa sequence_header() đầu tiên và picture_header() đầu tiên, sau đó sequence_scalable_extension() sẽ không xảy ra trong dòng bit.

Nếu một sequence_display_extension() xảy ra sau khi sequence_header() đầu tiên tất cả các tiêu đề tiếp theo sẽ được theo sau bởi sequence_display_extension() trong đó tất cả các phần tử dữ liệu giống như trong phần đầu tiên của sequence_display_extension() Ngược lại nếu không có sequence_display_extension() xảy ra giữa sequence_header() đầu tiên và picture_header() đầu tiên, sau đó sequence_display_extension() sẽ không xảy ra trong dòng bit.

Lặp đi lặp lại chuỗi tiêu đềcho phép các phần tử dữ liệu của tiêu đề ban đầu được lặp lại để có thể truy cập ngẫu nhiên vào chuỗi video.

Trong dòng bit được mã hoá, ảnh đầu tiên sau một chuỗi tiêu đề hoặc một phần đầu của dãy lặp lại sẽ hoặc là một ảnh I hoặc là một ảnh P, nhưng không phải là ảnh B. Trong trường hợp một khung xen kẽ được mã hoá như là hai trường ảnh riêng biệt, một tiêu đề lặp lại tiêu đề sẽ không đứng trước thứ hai của hai trường ảnh.

Nếu một dòng bit được chỉnh sửa sao cho tất cả các dữ liệu trước bất kỳ phần nào của các tiêu đề lặp lại được loại bỏ (hoặc truy cập ngẫu nhiên vào tiêu đề đó) thì kết quả dòng bit sẽ là một dòng bit hợp lệ tuân thủ với Tiêu chuẩn kỹ thuật này. Trong trường hợp ảnh đầu tiên của dòng bit kết quả là một ảnh P, có thể nó sẽ chứa khối macroblocks không phải là nội bộ. Kể từ khi tham chiếu các ảnh yêu cầu của quá trình giải mã là không có sẵn, ảnh tái tạo có thể không được xác định đầy đủ. Thời gian làm mới toàn bộ khung hình phụ thuộc vào kỹ thuật làm mới được sử dụng.

6.1.1.7.Nhóm ảnh I và tiêu đề nhóm ảnhNhóm ảnh I được dự kiến nhằm hỗ trợ truy cập ngẫu nhiên vào chuỗi. Các ứng dụng yêu cầu truy cập ngẫu nhiên, phát đi nhanh, hoặc phát ngược lại nhanh có thể sử dụng Các ảnh I tương đối thường xuyên.

Nhóm ảnh I cũng có thể được sử dụng ở cắt cảnh hoặc các trường hợp khác mà bù chuyển động không có hiệu quả.

Nhóm tiêu đề ảnh là một tiêu đề tùy chọn có thể được sử dụng ngay trước khi một khung được mã hoá cho bộ giải mã nếu ảnh liên tiếp B đầu tiên ngay sau khung l mã hóa có thể được xây dựng lại đúng trong trường hợp truy cập ngẫu nhiên. Có hiệu lực, nếu khung tham chiếu trước không có sẵn, những ảnh B này, nếu có, không thể được xây dựng lại đúng trừ khi chúng chỉ sử dụng dự đoán ngược hoặc mã hóa trong. Điều này được xác định chính xác hơn trong mục mô tả close_GOP và broken_link. Một nhóm các tiêu đề ảnh cũng chứa một thông tin mã thời gian mà không được sử dụng bởi quá trình giải mã.

Trong dòng bit được mã hóa, khung được mã hóa đầu tiên sau một nhóm tiêu đề ảnh sẽ là một khung l mã hóa.

6.1.1.8. Định dạng 4:2:0Trong định dạng này, các ma trận Cb và Cr phải bằng một nửa kích thước của ma trận Y trong cả hai chiều ngang và chiều dọc. Ma trận Y sẽ có một số các dòng và mẫu.Chú ý - Khi các khung hình xen kẽ được mã hoá dưới dạng các trường, ảnh được dựng lại sẽ được chia thành một phần bởi ma trậnY với một nửa số dòng là khung tương ứng. Như vậy, tổng số dòng trong ma trậnY của toàn bộ khung sẽ chia cho bốn.

Các mẫu độ chói và độ màu sắc được bố trí như thể hiện trong hình 6-1.

Để xác định cụ thể thêm về cách sắp xếp. Hình 6-2 và 6-3 cho thấy vị trí dọc và thời gian

29

TCVN xxxx : 2017

của các mẫu trong một khung xen kẽ. Hình 6-4 cho thấy vị trí dọc và thời gian của các mẫu trong khungliên tiếp.

Trong mỗi trường của một khung xen kẽ, các mẫu độ màu sắc không nằm (theo chiều dọc) giữa các mẫu độ chói của trường, vì vậy vị trí không gian của các mẫu độ sắc màu trong khung là như nhau cho dù khung được biểu diễn như là một khung ảnh đơn lẻ hoặc hai trường hình ảnh.

X X X X X X X Xo o o oX X X X X X X XX X X X X X X Xo o o oX X X X X X X XX X X X X X X Xo o o oX X X X X X X X

X Mẫu đại diện độ chói

O Mẫu đại diện sắc màu

Hình 6-1 – Các mẫu vị trí của độ chói và sắc màu– Dữ liệu 4:2:0

Trường trên cùng

Trường dưới cùng

XO

XX

O X

XO

XX

OThời gian

Hình 6-2 –Vị trí theo trục đứng và vị trí theo thời gian của các mẫu trong một khung xen kẽ với top_loop_first = 1

30

TCVN xxxx : 2017

Trường trên cùng

Trường dưới cùng

XO

XX

OX

XO

XX

OThời gian

Hình 6-3 – Vị trí theo trục đứng và vị trí theo thời gian của các mẫu trong một khung xen kẽ với top_loop_first = 0

Khung

XOXXOXXOXXOX

Thời gian

Hình 6-4 – Vị trí theo trục đứng và vị trí theo thời gian của các mẫu trong

31

TCVN xxxx : 2017

khung liên tiếp6.1.1.9.Định dạng 4:2:2Trong định dạng này, các ma trận Cb và Cr phải bằng một nửa kích thước của ma trận Y theo chiều ngang và kích thước tương đương với ma trận Y theo chiều dọc. Ma trận Y thậm chí sẽ có một số lượng các mẫu.Chú ý - Khi các khung hình xen kẽ được mã hoá dưới dạng các trường, ảnh được dựng lại sẽ được chia thành một phần bởi ma trậnYvới một nửa số dòng là khung tương ứng. Như vậy, tổng số dòng trong ma trậnY của toàn bộ khung sẽ chia cho hai.

Các mẫu độ chói và độ màu sắc được bố trí như thể hiện trong hình 6-5.

Để xác định cụ thể thêm về cách sắp xếp. Hình 6-6 cho thấy vị trí (dọc) của các mẫu khi khung được tách ra làm hai trường.

6.1.1.10. Định dạng 4:4:4 Trong định dạng này, các ma trận Cb và Cr phải có cùng kích thước với ma trận Y theo chiều ngang và chiều dọc. Chú ý - Khi các khung hình xen kẽ được mã hóa dưới dạng trường ảnh, ảnh được dựng lại từ mỗi trường các ảnh này sẽ có một ma trận Y với một nửa số dòng như khung tương ứng. Tổng số dòng trong ma trận Y của toàn bộ khung sẽ được chia cho hai.

Các mẫu độ chói và độ sắc nét được bố trí như thể hiện trong hình 6-6 và 6-7.

6.1.1.11. Sắp xếp lại thứ tự khung Khi dãy chứa các mã hóa khung B, số lượng các khung B mã hoá liên tiếp là thay đổi và không bị chặn. Khung mã hoá đầu tiên thay đổi một chuỗi tiêu đề sẽ không phải là khung B.

Một chuỗi có thể không chứa các mã hóa khung P. Một chuỗi cũng có thể không chứa các mã hóa khung I trong trường hợp đó một số yêu cầu được yêu cầu bắt đầu từ chuỗi và trong chuỗi ảnh hưởng đến truy xuất ngẫu nhiên và phục hồi lỗi.

Thứ tự của các khung mã hoá trong dòng bit, còn được gọi là thứ tự mã hoá, là thứ tự trong đó một bộ giải mã dựng lại chúng. Thứ tự của các khung tái tạo ở đầu ra của quá trình giải mã, còn được gọi là trật tự hiển thị, không phải lúc nào cũng giống như trật tự được mã hoá và phần phụ này xác định các quy tắc của việc sắp xếp lại khung sẽ xảy ra trong quá trình giải mã.

Khi dãy không chứa các mã hóa khung B, thứ tự mã hoá cũng giống như thứ tự hiển thị. Điều này đặc biệt đúng khi low_delay là một.

Khi các khung ảnh B nằm trong dãy, sắp xếp lại được thực hiện theo các quy tắc sau:

- Nếu khung hiện tại theo thứ tự mã hóa là một khung B, khung đầu ra là khung được dựng lại từ khung B đó.

- Nếu khung hiện tại theo thứ tự mã là khung I hoặc khung P, khung đầu ra là khung được dựng lại phía trước khung I hoặc khung P nếu có. Nếu không tồn tại, ở đầu của dãy, không có khung được xuất ra.

Khung được dựng lại từ khung I cuối cùng hoặc khung P được xuất ra ngay sau khi khung tái tạo lại khi khung được mã hoá cuối cùng trong chuỗi được xóa khỏi bộ đệm VBV.

Sau đây là ví dụ về khung hình được lấy từ đầu đoạn video. Trong ví dụ này, có hai khung được mã hoá khung B giữa các khung được mã hoá kế tiếp và cũng có hai khung B được mã hóa giữa các khung I và P với mã hoá liên tiếp và tất cả các ảnh đều là ảnh khung.

32

TCVN xxxx : 2017

Khung '1I' được sử dụng để tạo ra một dự đoán cho khung '4P'. Khung '4P' và '1I' được sử dụng để tạo dự đoán cho các khung '2B' và '3B'. Do đó thứ tự của các khung được mã hoá trong dãy mã hóa sẽ là '1I', '4P' '2B', '3B'. Tuy nhiên, bộ giải mã sẽ hiển thị chúng theo thứ tự '1I', '2B', '3B', '4P'.

Tại đầu vào bộ mã hoá:

1 2 3 4 5 6 7 8 9 10 11 12 13I B B P B B P B B I B B P

Tại đầu ra bộ mã hoá, trong dòng bit được mã hóa và tại đầu vào bộ mã hoá:

1 4 2 3 7 5 6 10 8 9 13 11 12

I P B B P B B I B B P B B

Tại đầu ra bộ mã hoá:

1 2 3 4 5 6 7 8 9 10 11 12 13

X Đại diện mẫu độ chói

O Đại diện mẫu sắc màu

Hình 6-5 - Vị trí của các mẫu độ chói và độ màu sắc - dữ liệu 4:2:2

33

TCVN xxxx : 2017

Khung Trường Trường

trên cùng dưới cùng

Hình 6-6 - Vị trí theo trục đứng của các mẫu có dữ liệu 4:2:2 và 4:4:4

34

TCVN xxxx : 2017

X Mẫu đại diện độ chói

O Mẫu đại diện màu sắc

Hình 6-7 - Vị trí của các mẫu độ chói và độ màu sắc - dữ liệu 4:4:4

6.1.2. Lát cắt

Một lát là một loạt các số lượng tùy ý của khối macroblocks liên tiếp. Các khối macroblocks đầu tiên và cuối cùng của một lát sẽ không bỏ qua khối macroblocks. Mỗi lát sẽ chứa ít nhất một khối macroblock. Lát cắt không được trùng lặp. Vị trí của lát có thể thay đổi từ ảnh này sang hình khác.

Khối Macroblock đầu tiên và cuối cùng của một lát sẽ nằm trong cùng hàng ngang của macroblocks.

Các lát sẽ xuất hiện ở dòng bit theo thứ tự mà chúng gặp phải, bắt đầu từ phía trên bên trái của ảnh và tiến hành bằng thứ tự quét raster-scan từ trái sang phải và từ trên xuống dưới (minh họa trong các hình 6-8 và 6-9 theo thứ tự chữ cái).

6.1.2.1. Cấu trúc lát cắt chungNói chung dễ dàng không cần cho các lát để bao phủ toàn bộ hình ảnh. Hình 6-8 cho thấy trường hợp này. Những khu vực không có trong một lát không được mã hoá và không có thông tin nào được mã hóa cho những khu vực như vậy (trong ảnh cụ thể).

Nếu các lát không bao phủ toàn bộ bức tranh, thì yêu cầu là nếu sau đó ảnh được sử dụng để tạo thành các dự đoán, thì dự đoán sẽ chỉ được thực hiện từ những vùng của ảnh được bao quanh trong lát. Đó là trách nhiệm của bộ mã hóa để đảm bảo điều này.

Tiêu chuẩn kỹ thuật này không xác định hành động nào mà bộ giải mã phải thực hiện ở các vùng giữa các lát.

6.1.2.2. Cấu trúc lát cắt bị hạn chếỞ một số mức quy định nhất định của các cấu hình được xác định, một cấu trúc lát cắt bị giới hạn được minh họa trong Hình 6-9. Trong trường hợp này, mỗi khối macroblock trong ảnh sẽ được đóng trong một lát cắt.

Trường hợp một mức quy định của mộtđặc tính profile xác định yêu cầu cấu trúc lát cắt

35

TCVN xxxx : 2017

tuân thủ những hạn chế được nêu cụ thể trong mục này, thuật ngữ "cấu trúc lát cắt hạn chế" có thể được sử dụng.

Hình 6-8 - Cấu trúc chung lát cắt

Hình 6-9 - Cấu trúc giới hạn của lát cắt

6.1.3. Khối Macroblock

Khối Macroblock chứa một phần của thành phần độ chóivà các thành phần độ sắc màu tương ứng theo không gian. Thuật ngữ macroblock có thể tham khảo mã nguồn và giải mã dữ liệu hoặc các phần tử dữ liệu được mã hóa tương ứng. Một macroblock bị bỏ qua là một macroblock mà không có thông tin được truyền đi (xem mục 7.6.6). Có ba định

36

TCVN xxxx : 2017

dạng màu cho một macroblock, cụ thể là định dạng 4:2:0, 4:2:2 và 4:4:4. Các thứ tựcủa khối trong một macroblock sẽ khác nhau cho mỗi định dạng khác nhau về màu sắc và được minh họa dưới đây.

Một khối Macroblock 4:2:0 gồm 6 khối. Cấu trúc này chứa các khối 4Y, 1Cb và 1Cr và thứ tự khối được mô tả trong Hình 6-10.

Y Cb Cr Hình 6-10 - Cấu trúc Macroblock 4:2:0Một khối Macroblock 4:2:2 gồm 8 khối. Cấu trúc này chứa các khối 4Y, 2Cb và 2Cr và thứ tự khối được mô tả trong Hình 6-11.

Y Cb Cr Hình 6-11 - Cấu trúc Macroblock 4:2:2

0 1 4 8 5 9

2 3 6 10 7 11

Y Cb Cr Hình 6-12 - Cấu trúc Macroblock 4:4:4Trong nhóm khung ảnh, nơi có thể sử dụng cả hai khung và trường DCT, được sắp xếp bên trong macroblock là khác nhau trong từng trường hợp.

Trong trường hợp mã hóa khung DCT, mỗi khối sẽ bao gồm các dòng từ hai trường luân phiên. Điều này được minh họa trong Hình 6-13.

Trong trường hợp mã hoá trường DCT, mỗi khối sẽ bao gồm các dòng chỉ từ một trong hai trường. Điều này được minh họa trong Hình 6-14.

Trong trường hợp cấu trúc các khối màu sắc phụ thuộc vào định dạng màu sắc đang được sử dụng. Trong trường hợp các định dạng 4:2:2 và 4:4:4 (trong đó có hai khối theo chiều đứng của macroblock) các khối màu sắc được xử lý giống hệt như các khối độ chói. Tuy nhiên, ở định dạng 4:2:0 các khối màu sắc sẽ luôn được tổ chức trong cấu trúc khung cho mục đích mã hóa DCT. Tuy nhiên, cần lưu ý rằng các dự đoán dựa trên trường có thể được thực hiện cho các khối này mà trong trường hợp tổng quát yêu cầu phải có dự đoán cho các vùng 8x4 (sau khi lọc nửa mẫu).

Trong các trường ảnh, mỗi ảnh chỉ chứa các dòng từ một trong các trường. Trong trường hợp này, mỗi khối bao gồm các dòng được lấy từ các dòng tiếp theo được minh họa trong hình 6-13.

6.1.4. Khối

Thuật ngữ "khối" có thể tham chiếu dữ liệu nguồn và dữ liệu được tái tạo hoặc hệ số DCT hoặc các phần tử dữ liệu được mã hóa tương ứng.

37

TCVN xxxx : 2017

Khi "khối" tham chiếu đến nguồn dữ liệu tái tạo, nó tham chiếu đến một phần trực giao của độ chóihoặc thành phần độ màu sắc với cùng một số dòng và mẫu, có 8 dòng và 8 mẫu trong khối.

Hình 6-13 - Cấu trúc macroblock độ chói trong mã hóa khung DCT

Hình 6-14 - Cấu trúc macroblock độ chói trong mã hóa trường DLT

6.2. Cú pháp dòng bit video

6.2.1. Mã bắt đầu

Mã bắt đầu là các mẫu bit cụ thể mà nếu không xảy ra trong luồng video.

Mỗi mã bắt đầu bao gồm một tiền tố mã bắt đầu theo sau bởi một giá trị mã bắt đầu. Tiền tố Mã bắt đầu là một chuỗi của hai mươi ba bit với các giá trị không, sau đó là một bit với giá trị một. Tiền tố mã bắt đầu là chuỗi bit '0000 0000 0000 0000 0000 0001'

Giá trị mã bắt đầu là một số nguyên tám bit xác định loại mã bắt đầu. Hầu hết các loại mã bắt đầu chỉ có một giá trị mã bắt đầu. Tuy nhiên, slice_start_code được đại diện bởi nhiều giá trị mã bắt đầu, trong trường hợp này giá trị mã bắt đầu là slice_vertical_position cho lát cắt.

Tất cả mã bắt đầu sẽ là byte đồng chỉnh. Điều này sẽ đạt được bằng cách chèn các bit với giá trị bằng không trước khi tiền tố mã bắt đầu sao cho bit đầu tiên của tiền tố mã bắt đầu là bit đầu tiên (quan trọng nhất) của một byte.

Bảng 6-1 xác định giá trị mã bắt đầu cho mã bắt đầu được sử dụng trong dòng bit video.

Việc sử dụng mã bắt đầu được định nghĩa trong mô tả cú pháp sau với ngoại lệ của chuỗi sequence_error_code. Mã lỗi chuỗiđã được phân bổ để sử dụng bởi giao diện truyền

38

TCVN xxxx : 2017

thông để chỉ ra lỗi mà không thể điều chỉnh được phát hiện.

Bảng 6-1 – Các giá trị của mã bắt đầu

Tên Giá trị của mã bắt đầu (hexadecimal)

picture_start_code 00slice_start_code 01 đến AFreserved B0reserved B1user_data_start_code B2Sequence_header_code B3scquence_error_code B4extension_start_code B5reserved B6Sequence_end_code B7group_start_code B8System_start_codes (Chú ý) B9 đến FFChú ý – System_start_codes được định nghĩa trong Phần 1 của Tiêu chuẩn này

6.2.2. Chuỗi Video

video_sequence() { Số bit Nhận dạngnext_start_code()sequence_header()if ( nextbits() == extension_start_code ) {

sequence_extcnsion()do {

extension_and_user_data( 0)do {

if (nextbits() group_start_code) {group_of_pictures_header()extension_and_user_data( 1 )

}Picture_header()picture_coding_extension()extension_and_user_data( 2)Picture_data()

} while ((nextbits() == picture_start_code) ||(nextbits() == group_start_code))

if ( nextbits() ! = sequence_end_code ) {sequence_header()Sequence_extension()

}} while ( nextbits() ! = sequence_end_code )

} else {/* ISO/IEC 11172-2 */

}Sequence_end_code 32 bslbf

}

39

TCVN xxxx : 2017

6.2.2.1. Tiêu đề chuỗi

sequenee_header() { Số bit Nhận dạng

scquence_header_code 32 bslbfhorizontal_size_value 12 uimsbfvertical_size_value 12 uimsbfaspect_ratio_information 4 uimsbfframe_rate_code 4 uimsbfbit_rate_value 18 uimsbfmarker_bit 1 bslbfvbv_buffer_size_value 10 uimsbfconstrained_parameters_flag 1 bslbfload_infra_quantiser_matrix 1 uimsbf

If ( load_intra_quantiser_matrixintra_quantiser_matrix[64] 8*64 uimsbf

load_non_intra_quantiser_matrix 1 uimsbfif (load_non_intra_quantiser_matrix

)non_intra_quantiser_matrix[64] 8*64 uimsbfnext_start_code()

}

6.2.2.2. Mở rộng và dữ liệu người dùng

extension and user data( i) { Số bit Nhận dạng

while (( nextbits() == extension_start_code ( nextbits() == user_data_start_code )) {

if ((i != 1) && ( nextbits() == extension_start_code ))extension_data( i)

if ( nextbits() == userdata_start_code )User_data()

}}

6.2.2.2.1. Mở rộng dữ liệuextensiondata ( i) { Số bit Nhận dạng

while ( nextbits()== extension_start_code ) {extension_start_code 32 bslbfif (i == 0) {/* follows sequence_extension() */

if ( nextbits()== "Sequence Display Extension ID” )sequence_display_extension()

else if ( nextbits()== "Sequence Scalable Extension ID” )

sequence scalable extension()Else

40

TCVN xxxx : 2017

extensiondata ( i) { Số bit Nhận dạng while ( nextbits() != '0000 0000 0000 0000 0000 0001’ )

reserved_extension_data_byte 8 uimsbf}

/* NOTE - i never takes the value 1 because extension_data()never follows a group_of_pictures_header() */

if (i == 2) {/* follows picture_coding_extension() */if ( nextbits() == "Quant Matrix Extension ID" )

quant_matrix_extension()else if ( nextbits() == "Copyright Extension ID" )copyright_extension()

else if ( nextbits() == "Picture Display Extension ID" )picture_display_extension()

else if ( nextbits()== "Picture Spatial Scalable Extension ID" )picture_spatial_scalable_extension()

else if (nextbits()== "Picture Temporal Scalable Extension ID" )picture_temporal_scalable_extension()

else if ( nextbits()== "Camera Parameters Extension ID" )camera_parameters_extension()

else if ( nextbits()= "ITU-T Extension ID" )ITU-T_extension()

Elsewhile ( nextbits!) != '0000 0000 0000 0000 0000 0001’ )reserved_extension_data_byte 8 uimsbf}

}}

6.2.2.2.2. Dữ liệu người dùng

user_data() { Số bit Nhận dạnguser_data_start_code 32 bslbfwhite( nextbits() != ‘0000 0000 0000 0000 0000 0001' ) {Userdata 8 uimsbf}next start code()}

6.2.2.3. Mở rộng chuỗi

41

TCVN xxxx : 2017

scquence_extension() { Số bit Nhận dạngextension_start_code 32 bslbfextension_start_code_identifier 4 uimsbfprofile_and_level_indication 8 uimsbfprogressive_sequence 1 uimsbfchroma_format 2 uimsbfhorizontal_size_extension 2 uimsbfvertical_size_evtension 2 uimsbfbit_rate_extension 12 uimsbfMarker_bit 1 bslbfvbv_buffer_size_extension 8 uimsbflow_delay 1 uimsbfframe_rate_extension_n 2 uimsbfframe_rate_extension_d 5 uimsbfnext_start_code()

}

6.2.2.4. Mở rộng chuỗi hiển thị sequence_display_extension() { Số bit Nhận dạng

extension_start_code_identifier 4 uinisbfvideo_format 3 uinisbfcolour_description 1 uirnsbfif ( colour_description ) {

colour_primaries 8 uirnsbftransfer_characteristies 8 uirnsbfmatrix_coefficients 8 uirnsbf

}display_horizontal_size 14 uirnsbfmarker_bit 1 bslbfdisplay_vertical _size 14 uirnsbfnext_start_code()

}

6.2.2.5. Mở rộng chuỗi có thể mở rộng

sequence_scalable_extension() { Số bit Nhận dạng

extension_start_code_identifier 4 uimsbf

scalable_mode 2 uimsbf

layer_id 4 uimsbf

if (scalable_mode == "spatial scalability") {

lower_layer_prediction_horizontal_size 14 uimsbf

42

TCVN xxxx : 2017

sequence_scalable_extension() { Số bit Nhận dạng

marker_bit 1 bslbf

lower_layer_prediction_vertical_size 14 uimsbf

horizontal_subsampling_factor_m 5 uimsbf

horizontal_subsampling_factor_n 5 uimsbf

vertical_subsampling_factor_m 5 uimsbf

verticaI_subsampling_factor_n 5 uimsbf

}

if ( scalable mode == "temporal scalability" ) {

picture_mux_enable 1 uimsbf

if (picture_mux_enable)

mux_to_progressive_sequence 1 uimsbf

picture_mux_order 3 uimsbf

picture_mux_factor 3 uimsbf

}

next_start_code()

}

6.2.2.6. Tiêu đề của nhóm ảnh sequence_display_extension() { Số bit Nhận dạng

group_start_code 32 bslbftime_code 25 bslbfclosed_gop 1 uimsbfbroken_link 1 uimsbf

next_start_code()}

43

TCVN xxxx : 2017

6.2.3. Tiêu đề ảnh

6.2.3.1. Mở rộng mã hóa ảnhpicture_coding_extension() { Số bit Nhận dạng

extension_start_code 32 bslbfextension_start_code_identifier 4 uimsbff_code[0][0] /* forward horizontal */ 4 uimsbff_code[0][1] /* forward vertical */ 4 uimsbff_code[1][0] /* backward horizontal */ 4 uimsbff_code[1][1] /* backward vertical */ 4 uimsbfintra_dc_precision 2 uimsbfpicture_structure 2 uimsbftop_field_first 1 uimsbfframe_pred_frame_dct 1 uimsbfconcealment_motion_vectors 1 uimsbfq_scale_type 1 uimsbfintra_vlc_format 1 uimsbfalternate_scan 1 uimsbfrepeat_first_field 1 uimsbfchroma_420_type 1 uimsbfprogressive_frame 1 uimsbfcomposite_display_flag 1 uimsbf

picture_header() { Số bit Nhận dạngpicture_start_code 32 bslbftemporal_reference 10 uimsbfpicture_coding_type 3 uimsbfvbv_delay 16 uimsbfif ( picture_coding_type == 2 || picture_coding_type == 3) {

full_pel_forward_vector 1forward_f_code 3 uimsbf

}if ( picture_coding_type == 3 ) {

full_pel_backward_vector 1 1backward_f_code 3 uimsbf

}while ( nextbits() == '1' ) {

extra_bit_picture /* with the value “1” */ 1 uimsbfextra_information_picture 8

}extra_bit_picture /* with the value “0” */ 1 uimsbfnext_start_code()

}

44

TCVN xxxx : 2017

picture_coding_extension() { Số bit Nhận dạngif ( composite_display_flag ) {

v_axis 1 uimsbffield_sequence 3 uimsbfsub_carrier 1 uimsbfburst_amplitude 7 uimsbfsub_carrier_phase 8 uimsbf

}next_start_code()

}

6.2.3.2. Mở rộng ma trận lượng tửquant_matrix_extension() { Số bit Nhận dạng

extension_start_code_identifier 4 uimsbfload_intra_quantiser_matrix 1 uimsbf

if ( load_intra_quantiser_matrix )intra_quantiser_matrix [64] 8 * 64 uimsbf

load_non_intra_quantiser_matrix 1 uimsbfif ( load_non_intra_quantiser_matrix )

non_intra_quantiser_matrix[64] 8 * 64 uimsbfload_chroma_intra_quantiser_matrix 1 uimsbf

if ( load_chroma_intra_quantiser_matrix )chroma_intra_quantiser_matrix[64] 8 * 64 uimsbf

load_chroma_non_intra_quantiser_matrix 1 uimsbfif ( load_chroma_non_intra_quantiser_matrix )

chroma_non_intra_quantiser_matrix[64] 8 * 64 uimsbfnext_start_code()

}

6.2.3.3. Mở rộng hiển thị ảnhpicture_display_extension() { Số bit Nhận dạng

extension_start_code_identifier 4 uimsbffor ( i=0; i<number_of_frame_centre_offsets; i++ ) {

frame_centre_horizontal_offset 16 simsbfmarker_bit 1 bslbfframe_centre_vertical_offset 16 simsbfmarker_bit 1 bslbf

}next_start_code()

}

6.2.3.4. Mở rộng ảnh có thể mở rộng theo thời gianpicture_temporal_scalable_extension() { Số bit Nhận dạng

45

TCVN xxxx : 2017

extension_start_code_identifier 4 uimsbfreference_select_code 2 uimsbfforward_temporal_reference 10 uimsbfmarker_bit 1 bslbfbackward_temporal_reference 10 uimsbfnext_start_code()

}

6.2.3.5. Mở rộng ảnh có thể mở rộng theo không gian picture_spatial_scalable_extension() { Số bit Nhận dạng

extension_start_code_identifier 4 uimsbflower_layer_temporal_reference 10 uimsbfmarker_bit 1 bslbflower_layer_horizontal_offset 15 simsbfmarker_bit 1 bslbflower_layer_vertical_offset 15 simsbfspatial_temporal_weight_code_table_index 2 uimsbflower_layer_progressive_frame 1 uimsbflower_layer_deinterlaced_field_select 1 uimsbfnext_start_code()

}

6.2.3.6. Mở rộng bản quyền

Copyright_extension() { Số bit Nhận dạngextension_start_code_identifier 4 uimsbf

copyright_flag 1 uimsbf

copyright_identifier 8 uimsbf

original_or_copy 1 uimsbf

reserved 7 bslbf

marker_bit 1 bslbf

Copyright_number_1 20 uimsbf

marker_bit 1 bslbf

copyright_number_2 22 uimsbf

marker_bit 1 bslbf

copyright_number_3 22 uimsbf

next_start_code()}

6.2.3.7. Dữ liệu ảnhpicture_data() { Số bit Nhận dạng

46

TCVN xxxx : 2017

do {slice()

} while ( nextbits() == slice_start_code )next_start_code()

}

6.2.3.7.1. Mở rộng các tham số của máy ảnh

camera_parameters_extension() { Số bit Nhận dạngextension_start_code_identifier 4 uimsbfreserved 1 uimsbfcamera_id 7 uimsbfmarker_bit 1 bslbfheight_of_image_device 22 uimsbfmarker_bit 1 bslbffocal_length 22 uimsbfmarker_bit 1 bslbff_number 22 uimsbfmarker_bit 1 bslbfvertical_angle_of_view 22 uimsbfmarker_bit 1 bslbfcamera_position_x_upper 16 uimsbfmarker_bit 1 bslbfcamera_position_x_lower 16marker_bit 1 bslbfcamera_position_y_upper 16 uimsbfmarker_bit 1 bslbfcamera_position_y_lower 16marker_bit 1 bslbfcamera_position_z_upper 16 simsbfmarker_bit 1 bslbfcamera_position_z_lower 16 uimsbfmarker_bit 1 bslbfcamera_direction_x 22 uimsbfmarker_bit 1 bslbfcamera_direction_y 22 uimsbfmarker_bit 1 bslbfcamera_direction_z 22 uimsbfmarker_bit 1 bslbfcamera_plan_vertical_x 22 uimsbfmarker_bit 1 bslbfcamera_plan_ vertical_y 22 uimsbfmarker_bit 1 bslbf

47

TCVN xxxx : 2017

camera_parameters_extension() { Số bit Nhận dạngcamera_plan_ vertical_z 22 uimsbfmarker_bit 1 bslbfreserved 32 uimsbfnext_start_code()

}

Chú ý – Các thông số được đánh dấu là ‘reserved’ trong mở rộng các tham số của máy ảnh sẽ đặt là 0 (zero). Những giá trị khác được dự phòng cho tương bởi ITU-T ǀ ISO/IEC

6.2.3.7.2. Phần mở rộng ITU-T

ITU-T_extension() { Số bit Nhận dạngextension_start_code_identifier 4 uimsbf

while(nextbits()! = ‘0000 0000 0000 0000 0000 0001’ {ITU-T_data 1 uimsbf

} next_start_code() }

6.2.3.7.3. Dữ liệu mô tả nội dung

Content_description_data() { Số bit Nhận dạngdata_type_upper 8 uimsbfmarker_bit 1 bslbfdata_type_lower 8marker_bit 1 bslbfdata_length 8 uimsbfif ( datatype == "Padding Bytes" )

padding_bytes()else if ( data_type == "Capture Timecode" )

capture_timecode()else if ( data_type == "Additional Pan-Scan Parameters" )additional_pan_scan_parameters()else if ( data_type == "Active Region Window" )

active_region_window()else if ( data_type == "Coded Picture Length" )

coded_picture_length()else

for ( i = 0; i < data_lenglh; i ++ ) {marker_bit 1 bslbfreserved_content_description_data 8 uimsbf

}}

6.2.3.7.3.1. Các byte đệm - Padding bytes

padding bytes() { Số bit Nhận dạng

48

TCVN xxxx : 2017

for ( i = 0; i < data length; i ++ ) {marker_bit 1 bslbfpadding_byte 8 bslbf

}}

6.2.3.7.3.2. Ghi mã thời gian

capture_timecode() { Số bit Nhận dạngmarker_bit 1 bslbftimecode_type 2 uimsbfcounting_type 3 uimsbfreserved_blt 1 uimsbfreserved_bit 1 uimsbfreserved_bit 1 uimsbfif ( counting_type != 0 ) {

marker_bit 1 bslbfnframes_conversion_code 1 uimsbfclock_divisor 7 uimsbfmarker_bit 1 bslbfnframes_multiplier_upper 8 uimsbfmarker_bit 1 bslbfnframes_multiplier_lower 8

}frame_or_field_capture_timestamp()if ( timecode type == '11')

frame_or_field_capture_timestamp()}

6.2.3.7.3.2.1.Ghi lại mốc thời gian khung hoặc trường

frame_or_field_capture_timestamp() { Số bit Nhận dạngif (counting_type ! = 0 ) {

marker_bit 1 bslbfnframes 8 uimsbf

}marker_bit 1 bslbftime_discontinuity 1 uimsbfprior_count_dropped 1 uimsbftime_offset_part_a 6 simsbfmarker_bit 1 bslbftime_offset_part_b 8marker_bit 1 bslbftime_offset_part_c 8marker_bit 1 bslbftime_offset_part_d 8marker_bit 1 bslbf

49

TCVN xxxx : 2017

units_of_seconds 4 uimsbftens_of_seconds 4 uimsbfmarker_bit 1 bslbfunits_of_minutes 4 uimsbftens_of_minutes 4 uimsbfmarker_bit 1 bslbfunits_of_hours 4 uimsbftens_of_hours 4 uimsbf

}

6.2.3.7.3.3.Các tham số quay-quét (pan-scan) bổ sung

additional_pan scan_parameters!) { Số bit Nhận dạngmarker_bit 1 bslbfaspect_ratio_information 4 uimsbf

reserved_bit 1 bslbfreserved_bit 1 bslbfreserved_bit 1 bslbf

display_size_present 1 bslbfif (display size present == ’1’) {

marker_bit 1 bslbfreserved_bit 1 bslbfreserved_bit 1 bslbfdisplay_horizontal_size_upper 6 uimsbfmarker_bit 1 bslbfdisplay_horizontal_size_lower 8marker_bit 1 bslbfreserved_bit 1 bslbfreserved_bit 1 bslbfdisplay_vertical_size_upper 6 uimsbfmarker_bit 1 bslbfdisplay _vertlcal_size_lower 8

}for ( i = 0; i < number_of_frame_centre_offsets; i ++ ) {

marker_bit 1 bslbfframe_centre_horizontal_offset_upper 8 simsbfmarker_bit 1 bslbfframe_centre_horizontal_offset_lower 8marker_bit 1 bslbfframe_centre_vertical_offset_upper 8 simsbfmarker_bit 1 bslbfframe_centre_vertical_offset_lower 8

}}

6.2.3.7.3.4.Vùng cửa sổhoạt động

Active_region_window() { Số bit Nhận dạngmarker_bit 1 bslbf

50

TCVN xxxx : 2017

top_left_x_upper 8 uimsbfmarker_bit 1 bslbftop_left_x_lower 8marker_bit 1 bslbftop_left_y_upper 8 uimsbfniarker_bit 1 bslbftop_left_v_lower 8marker_bit 1 bslbfactive_horizontal_size_upper 8 uimsbfmarker_bit 1 bslbfactive_horizontal_size_lower 8marker_bit 1 bslbfactive_vertical_size_upper 8 uimsbfmarker_bit 1 bslbfactive_vertical_size_lower 8

}

6.2.3.7.3.5.Độ dài ảnh mã hóacoded_picture_length() { Số bit Nhận dạng

marker_bit 1 bslbfpicture_byte_count_part_a 8 uimsbfmarker_bit 1 bslbfpicture_byte_count_part_b 8marker_bit 1 bslbfpicture_byte_count_part_c 8marker_bit 1 bslbfpicture_byte_count_part_d 8

}

6.2.4. Lát cắt – Slice

slice() { Số bit Nhận dạngslice_start_code 32 bslbfif (vertical_size > 2800)

slice_vertical_position_extension 3 uimsbfif ( <sequence scalable extension() is present in the bitstream> )

if (scalable_mode == “data partitioning” )priority_breakpoint 7 uimsbf

quantiser_scale_code 5 uimsbfif ( nextbits() == '1' ) {

intra_slice_flag 1 bslbfintra_slice 1 uimsbfreserved_bits 7 uimsbfwhile ( nextbits() == '1' ) {

extra_bit_slice /* with the value “1” */ 1 uimsbf

extra_information_slice 8

51

TCVN xxxx : 2017

slice() { Số bit Nhận dạng}

}extra_bit_slice /* with the value “0” */ 1 uimsbfdo {

macroblock()} while ( nextbits() != '000 0000 0000 0000 0000 0000' )next_start_code()

}

6.2.5. Khối – Macroblock

macroblock_modes() { Số bit Nhận dạngmacroblock_type 1-9 vlclbf

if (( spatial_temporal_weight_code_flag== 1 ) &&( spatial_temporal_weight_code_table_index != '00')) {spatial_teniporal_weight_code 2 uimsbf

}if ( macroblock_motion_forward ||

macroblockmotionbackward) {if ( picture_structure == 'frame') {

if ( frame_pred_frame_dct == 0 )frame_motion_type 2 uimsbf

} else {field_motion_type 2 uimsbf

}}

if (( picturestructure == "Frame picture" ) &&( frame_pred_frame_dct == 0 ) &&( macroblock_intra | macoblock_pattern)){dct_type 1 uimsbf

} }

6.2.5.1. Các kiểu khối macroblock

macroblock_modes() { Số bit Nhận dạngmacroblock_type 1-9 vlclbf

if (( spatial_temporal_weight_code_flag== 1 ) &&( spatial_temporal_weight_code_table_index != '00')) {spatial_teniporal_weight_code 2 uimsbf

}if ( macroblock_motion_forward ||

macroblockmotionbackward) {if ( picture_structure == 'frame') {

52

TCVN xxxx : 2017

macroblock_modes() { Số bit Nhận dạngif ( frame_pred_frame_dct == 0 )

frame_motion_type 2 uimsbf

} else {field_motion_type 2 uimsbf

}}

if (( picturestructure == "Frame picture" ) &&( frame_pred_frame_dct == 0 ) &&( macroblock_intra | macoblock_pattern)){dct_type 1 uimsbf

} }

6.2.5.2. Các vec-tơ chuyển động

motion_vectors ( s ) { Số bit Nhận dạngif ( motion_vector_count == 1 ) {

if (( mv_format == field ) && ( dmv != 1))motion_vertical_field_select[0][s] 1 uimsbfmotion_vector( 0, s)

} else {niotion_vertical_field_select[()l[sl 1 uimsbfniotion_vector( 0, s)motion_vertical_field_select[ 1 ][s] 1 uimsbfmotion_vector( 1, s )

}}

6.2.5.2.1. Vec-tơ chuyển động

motion_vectors ( r, s ) { Số bit Nhận dạngmotion_code[r][s][0] 1-11 vlclbfif (( f_code[s][0] != 1) && ( motion_code[r][s][0] != 0 ))

motion_residual[r][s][0] 1-8 uimsbfif (dmv == 1)

dmvector[0] 1-2 vlclbfmotion_code[r][s][1] 1-11 vlclbfif (( f_code[s][1] != 1) && ( motion_code[r][s][1] != 0 ))

motion_residual[r][s][l] 1-8 uimsbfif (dmv == 1)

dmvector[1] 1-2 vlclbf

6.2.5.3. Mẫu khối mã hóa

coded_block_pattern () { Số bit Nhận dạngcoded_block_pattern_420 3-9 vlclbfif ( chroma_format == 4:2:2 )

coded_block_pattern_1 2 uimsbf

53

TCVN xxxx : 2017

if ( chroma_format == 4:4:4 )coded_block_pattern_2 6 uimsbf

}

6.2.6. Khối

Cú pháp chi tiết cho các thuật ngữ "Hệ số DCT đầu tiên", "Hệ số chuỗi con DCT" và "Kết thúc Khối" được mô tả đầy đủ trong mục 7.2.Trường con này không ghi rõ cú pháp của lớp khối khi phân vùng dữ liệu được sử dụng. Xem mục 7.10.

block( i) { Số bit Nhận dạngif ( pattem_code[i]) {

if ( macroblock_intra ) {if (i < 4 ) {

dct_dc_size_luminance 2-9 vlclbfif(dct_dc_size_luminance != 0)

dct_dc_differential 1 - 11 uimsbf} else {

dct_dc_size_chrominance 2-10 vlclbfif(dct_dc_size_chrominance != 0)

dct_dc_differential 1 - 11 uimsbf}

} else {First DCT coefficient 2-24 vlclbf

}while ( nextbits() != End of block )

Subsequent DCT coefficients 3-24 vlclbfEnd of block 2 or 4 vlclbf

}}

6.3. Các ngữ nghĩa dòng bit video

6.3.1. Các quy tắc ngữ nghĩa cho các cấu trúc cú pháp cao hơn

Nội dung này chỉ ra các quy tắc chi phối cách thức mà các thành phần cú pháp cấp cao có thể được kết hợp với nhau để tạo ra một dòng bit hợp lệ. Các mục tiếp theo mô tả ý nghĩa ngữ nghĩa của tất cả các trường trong dòng bit video.

Hình 6-15 minh họa cấu trúc cấp cao của dòng bit video.

54

TCVN xxxx : 2017a) Sau một nhóm tiêu đề ảnh (GOP), ảnh đầu tiên sẽ là ảnh I

Hình 6-15 - Tổ chức dòng bit mức caoCác quy tắc ngữ nghĩa sau được áp dụng:

Nếu sequence_header() đầu tiên của chuỗi không được theo sau bởi sequence_extension(), thì dòng phải phù hợp với ISO/IEC 11172-2 và không được ghi lại trong Tiêu chuẩn kỹ thuật này.

Nếu sequence_header() đầu tiên của dãy được theo sau bởi một sequence_extension(), thì tất cả các lần xuất hiện tiếp theo của sequence_header() cũng sẽ ngay lập tức theo sau bởi một sequence_extension().

sequence_extension() sẽ chỉ xảy ra ngay sau khi một sequence_header() Sau một sequence_header() sẽ có ít nhất một ảnh được mã hóa trước khi một

sequence_header() hoặc một sequence_end_code. Điều này ngụ ý rằng sequence_extension() sẽ không đứng trước một sequence_end_code.

Nếu sequence_extension() xảy ra trong dòng bit , thì mỗi picture_header() sẽ được theo sau bởi một picture_coding_extension().

sequence_end_code sẽ được đặt ở cuối của dòng bitđể sau khi giải mã và đặt lại khung, sẽ không có khung bị thiếu.

Picture_coding_extension() chỉ xảy ra ngay sau một picture_header(). Khung mã hoá đầu tiên sau một nhóm picture_header() sẽ là một khung Imã hóa.

Một số phần mở rộng khác nhau được định nghĩa ngoài sequence_extension() và ảnh coding_extension(). Tập hợp các phần mở rộng cho phép là khác nhau tại mỗi điểm khác nhau trong cú pháp mà tiện ích mở rộng được cho phép. Bảng 6-2 định nghĩa mã hóa nhận dạng mã mở rộng bốn bit cho mỗi phần mở rộng.

Bảng 6-2 – Các mã extension_start_code_identifier

extension_start_code_identifier Tên0000 Dự phòng0001 ID mở rộng chuỗi0010 ID mở rộng hiển thị chuỗi0011 ID mở rộng ma trận lượng tử0100 Dự phòng0101 ID mở rộng chuỗi có thể mở rộng 0110 Dự phòngO111 ID Mở rộng hiển thị ảnh1000 ID Mở rộng mã hóa ảnh1001 IDMở rộng ảnhcó thể mở rộng theo không gian1010 ID Mở rộng ảnh có thể mở rộng theo thời gian1011 Dự phòng1100 Dự phòng……1111 Dự phòng

55

TCVN xxxx : 2017

Tại mỗi điểm mà phần mở rộng được cho phép trong dòng bit bất kỳ số lượng các phần mở rộng từ tập hợp được cho phép có thể được bao gồm. Tuy nhiên, mỗi loại gia hạn sẽ không xảy ra nhiều lần.

Trong trường hợp bộ giải mã gặp một phần mở rộng với mã nhận dạng mở rộng được mô tả là "Dự phòng" trong Tiêu chuẩn kỹ thuật này, bộ giải mã sẽ loại bỏ tất cả các dữ liệu tiếp theo cho đến khi mã khởi đầu tiếp theo. Yêu cầu này cho phép xác định của phần mở rộng tiếp theo tương thích với Tiêu chuẩn kỹ thuật này.

6.3.2. Chuỗi video

sequence_end_code - là chuỗi bit '0000001B7' theo hệ thập lục phân. Nó kết thúc một chuỗi video.

6.3.3. Tiêu đề chuỗi

sequence_header_code - là chuỗi bit '000001B3' theo hệ thập lục phân. Nó xác định bắt đầu của một tiêu đề chuỗi.

horizontal_size_value - từ này hình thành 12 bit ít quan trọng nhất của horizontal_size.

vertical_size_value - Từ này tạo thành 12 bit ít quan trọng nhất của vertical_size.

horizontal_size - là một số nguyên không dấu 14bit, 12 bit ít quan trọng được định nghĩa trong horizontal_size_value, 2 bit quan trọng nhất được định nghĩa trong horizontal_size_extension.Horizontal_size là chiều rộng của phần hiển thị của thành phần độ chói của ảnh trong các mẫu. Chiều rộng của thành phần độ chói của ảnh trong macroblocks, chiều rộng mb, là (horizontal_size + 15)/16. Phần hiển thị được canh lề trái trong các ảnh được mã hóa.

Để tránh khởi chạy mã bắt đầu horizontal_size_value không được bằng không. Điều này ngăn cản các giá trị kích thước ngang là bội số của 4096.

vertical_size - là một số nguyên không dấu 14bit, 12 bit quan trọng được định nghĩa trong vertieal_size_value, 2 bit quan trọng nhất được định nghĩa trong vertical_size_extension.vertical_size là chiều cao của phần hiển thị của thành phần độ chói của khung trong các đường.

Trong trường hợp progressive_sequence là ‘1’ chiều cao của thành phần độ chóicủa các khung trong các macroblock được mã hóa. mb_height. là (vertical_size + 15)/16.

Trong trường hợp progressive_sequence là '0', chiều cao của thành phần độ chóiđược mã hóa của các khung hình trong macroblocks_mb_height, là 2 * ((vertical_size + 31)/32) Chiều cao của thành phần độ chóiđược mã hóa của các trường ảnh trong các macroblocks_mb_height, là ((vertical_size + 31)/32).

Phần hiển thị được chỉnh trên cùng trong các ảnh được mã hóa.

Để tránh khởi chạy mã bắt đầu vertical_size_value không bằng không. Điều này ngăn cản các giá trị của vertical_size là bội số của 4096.

Aspect_ratio_information - Đây là một số nguyên bốn bit được định nghĩa trong Bảng 6-3.

Bảng 6-3 - aspect_ratio_information (Thông tin tỉ lệ)

aspect_ratio_information Tỷ lệ khuôn dạng mẫu DAR0000 Cấm Cấm0001 10 (Mẫu ô vuông) -

56

TCVN xxxx : 2017

aspect_ratio_information Tỷ lệ khuôn dạng mẫu DAR0010 3 ÷ 40011 - 9 ÷ 160100 - 1 ÷ 2.210101 Dự phòng

... ...1111 - Dự phòng

Thông tin tỷ lệ co giãn hoặc là xác định "Tỷ lệ khuôn dạng mẫu" (SAR) của khung tái tạo là 1,0 (Mẫu ô vuông), hoặc là cách khác nó cho ra "Tỷ lệ khuôn dạng hiển thị " (DAR).

Nếu chuỗisequence_display_extension() không có mặt, thì dự kiến rằng toàn bộ khung được tái tạo sẽ được ánh xạ tới toàn bộ khu vực hoạt động của màn hình. Tỷ lệ khuôn dạng mẫu có thể được tính như sau:

SAR = DAR xhorizontal¿ ¿vertical¿ ¿¿¿Chú ý 1 - Trong trường hợp này, horizontal_size và vertical_size bị ràng buộc bởi SAR của nguồn và DAR được chọn.

Nếu sequence_display_extension() hiện diện thì tỉ lệ khuôn dạng mẫu có thể được tính như sau:

SAR = DAR xdisplay¿display¿¿¿

frame_rate_code - Đây là một số nguyên bốn bit được sử dụng để định nghĩa frame_rate_value như thể hiện trong Bảng 6-4. frame_rate có thể được bắt nguồn từ frame_rate_value, frame_rate_extension_n và frame_rate_extension_d như sau:

frame_rate = frame_rate_value x (frame_rate_extension_n + 1) ÷

( frame_rate_extension_d + 1)Khi một mục nhập vào cho tỉ lệ khuôn dạng tồn tại trực tiếp trong Bảng 6-4, frame_rate_extension_n và frame_rate_extension_d sẽ là 0, (frame_rate_extension_n + l) và (frame_rate_extension_d + 1) không có ước số chung lớn hơn một.

Bảng 6-4 - frame_rate_code

frame_rate_code frame_rate_value0000 Cấm0001 24 000 ÷ 1001 (23.976...)0010 240011 250100 30 000 ÷ 1001 (29.07...)0101 300110 500111 60 000 ÷ 1001 (59.94...)1000 601001 Dự phòng…… ...1111 Dự phòng

Nếu progressive_sequence là '1' khoảng thời gian giữa hai khung liên tiếp ở đầu ra của quá trình giải mã là sự nghịch đảo của khung hình. Xem hình 7-18.

57

TCVN xxxx : 2017

nếu progressive_sequence là '0' thì khoảng thời gian giữa hai trường liên tiếp ở đầu ra của quá trình giải mã là một nửa nghịch đảo của tốc độ khung. Xem hình 7-20.

Frame_rate được báo hiệu trong lớp liên tục của khả năng mở rộng theo thời gian là tốc độ khung kết hợp sau khi hoạt động ghép theo thời gian nếu miêu tả ảnh trong sequence_scalable _extension() được đặt là ‘1’.

bit_rate_value - thấp hơn 18 bit của tốc độ bit.

bit_rate - Đây là một số nguyên 30 bit. 18 bit thấp hơn của số nguyên là trong bit_rate_value và trên 12 bit là bit_rate_extension. bit_rate được đo bằng đơn vị 400 bit/giây, được làm tròn lên. Giá trị 0 không được phép.

Tốc độ bit quy định giới hạn tốc độ hoạt động tối đa của VBV như được định nghĩa trong C.3.

VBV hoạt động ở một trong hai chế độ tùy thuộc vào các giá trị mã hoá trong vbv_delay. Trong tất cả các trường hợp (cả hai hoạt động tốc độ bit không đổi và biến đổi), tốc độ bit được chỉ định sẽ là giới hạn trên của tốc độ bit mà ở đó dữ liệu mã hoá được cung cấp cho đầu vào của VBV.Chú ý 2 - Vì hoạt động tốc độ bit không đổi chỉ đơn giản là một trường hợp đặc biệt của hoạt động tốc độ bit biến đổi không có yêu cầu rằng giá trị của tốc độ bit là tốc độ bit thực tế tại đó dữ liệu được cung cấp. Tuy nhiên, nó được khuyến cáo trong trường hợp hoạt động tốc độ bit liên tục mà bit_rate nên đại diện cho tốc độ bit thực tế.

marker_bit - đây là một bit sẽ được đặt là '1'. Bit này ngăn việc mô phỏng mã bắt đầu,

vbv_buffer_size_value - 10 bit thấp hơn của kích thước bộ đệm vbv.

vbv_buffer_size - là một số nguyên 18 bit. 10 bit thấp hơn của số nguyên nằm trong giá trị vbv_buffer_size và 8 bit trên có trong vbv_buffer_size_extension. Số nguyên định nghĩa kích thước bộ đệm VBV (Trình kiểm soát bộ nhớ đệm video, xem Phụ lục C) cần thiết để giải mã chuỗi. Nó được xác định là:

B = 16 * 1024 * vbv_buffer_sizeTrong đó B là kích thước bộ đệm VBV tối thiểu trong các bit cần thiết để giải mã chuỗi (xem Phụ lục C).

constrained_parameters_flag -Cờ này (được sử dụng trong ISO/IEC 11172-2) không có ý nghĩa trong Tiêu chuẩn kỹ thuật này và sẽ có giá trị '0'.

load_intra _quantiser_matrix - Xem 6.3.11 "Quant_matrix_extension".

intra_quantiser_matrix - Xem phần 6.3.11 "Quant matrix extension".

load_non_intra_quantiser_matrix - Xem phần 6.3.11 "Quant_matrix_extension".

non_intra_quantiser_matrix - Xem 6.3.11 "Quant_matrix_extension".

6.3.4. Mở rộng và dữ liệu người dùng

extension_start_code - Là chuỗi bit '000001B5' trong hệ thập lục phân. Nó xác định sự khởi đầu của các phần mở rộng ngoài ISO/IEC 11172-2

6.3.4.1. Dữ liệu người dùnguser_data_start_code - là chuỗi bit '000001B2' trong hệ thập lục phân. Nó xác định sự bắt đầu của dữ liệu người dùng. Dữ liệu người dùng tiếp tục cho đến khi nhận được mã bắt đầu khác.

user_data - Đây là một số nguyên 8 bit, một số tùy ý có thể đi theo nhau. Trừ khi được đề cập trong Phụ lục D, các giá trị và ngữ nghĩa của dữ liệu người dùng được gửi như các

58

TCVN xxxx : 2017

phần tử cú pháp user_data được xác định bởi người dùng cho các ứng dụng cụ thể của chúng. Trong dãy các byte liên tục user_data sẽ không có một chuỗi của 23 hoặc nhiều hơn liên tiếp các bit không. Trừ khi được quy định trong Phụ lục D, dữ liệu người dùng sẽ không bắt đầu bằng chuỗi bit '4a503344' theo hệ thập lục phân.

6.3.5. Mở rộng chuỗi

extension_start_code_identifier - Đây là một số nguyên 4 bit xác định phần mở rộng. Xem Bảng 6-2.

profile_and_level_indication - Đây là một số nguyên 8 bit được sử dụng để báo hiệu nhận dạng profile và mức. Ý nghĩa của các bit được cho thấy trong mục 8.Chú ý: Trong một phân cấp có thể mở rộng, các dòng bit của mỗi lớp có thể thiết lập profile_and_level_indication với một giá trị khác như được chỉ ra trong điều 8.progressive_sequence - Khi được đặt là '1', chuỗi video được mã hóa chỉ chứa các ảnh liên tục khung. Khi progressive_sequence được đặt là ‘0’, chuỗi video được mã hóa có thể chứa cả khung ảnh và trường ảnh, và khung ảnh có thể là các khung hình liên tục hoặc xen kẽ.

chroma_format - Đây là một số nguyên hai-bit cho biết định dạng độ sắc màu ‘chrominance’ như được định nghĩa trong Bảng 6-5. horizontal_size_extension - Số nguyên 2 bit này là 2 bit quan trọng nhất từ horizontal_size.vertical_size_extension - Số nguyên 2 bit này là 2 bit quan trọng nhất từ vertical_size.

bit_rafe_extension - Số nguyên 12 bit này là 12 bit quan trọng nhất từ bit_rate.vbv_buffer_size_extension - Số nguyên 8 bit này là 8 bit quan trọng nhất từ vbv_buffer_size.

Bảng 6-5 - Ý nghĩa của chroma_format

chroma_format Ý nghĩa00 Dự phòng01 4:2:010 4:2:211 4:4:4

low_delay - Cờ này, khi được thiết lập là '1', chỉ ra rằng chuỗi không chứa bất kỳ ảnh B nào, trễ sắp xếp lạithứ tự khung không có trong mô tả VBV và rằng dòng bit có thể chứa "ảnh lớn" tức là C.7 của VBV có thể được áp dụng.

Khi được thiết lập là '0', nó cho biết chuỗicó thể chứa các ảnh B, rằng sự trễ đặt lại khung có trong mô tả VBV và rằng dòng bit không chứa ảnh lớn, nghĩa là C.7 của VBV không áp dụng .

Cờ này không được sử dụng trong quá trình giải mã và do đó có thể bị bỏ qua bởi các bộ giải mã, nhưng nó là cần thiết để xác định và xác minh sự tuân thủ của các dòng bit trễ thấp.

frame_rafe_extension_n - Đây là một số nguyên 2 bit được sử dụng để xác định

59

TCVN xxxx : 2017

frame_rate. Xem frame_rate_code.

frame_rate_extension_d -Đây là một số nguyên 5 bit được sử dụng để xác định frame_rate. Xem frame_rate_code.

6.3.6. Mở rộng hiển thị chuỗi

Tiêu chuẩn kỹ thuật này không xác định quá trình hiển thị. Thông tin trong phần mở rộng này không ảnh hưởng đến quá trình giải mã và có thể bị bỏ qua bởi bộ giải mã phù hợp với Tiêu chuẩn kỹ thuật này.

video_format - Đây là một số nguyên ba bit cho biết ảnh của các ảnh trước khi được mã hoá theo Tiêu chuẩn kỹ thuật này. Ý nghĩa của nó được xác định trong Bảng 6-6. Nếu sequence_display_extension() không có trong dòng bit, thì định dạng video có thể được giả định là "Định dạng video không xác định".

Bảng 6-6 -Ý nghĩa của video_format

video_format Ý nghĩa000 Hợp phần001 PAL010 NTSC011 SECAM100 MAC101 Định dạng video không xác định110 Dự phòng111 Dự phòng

colour_description - Một cờ nếu được đặt là '1' cho thấy sự có mặt của colour_primaries,transfer_characteristics và matrix_coefficients trong dòng bit.

colour_primaries - Số nguyên 8 bit này mô tả tọa độ màu sắc của các số nguyên nguồn ban đầu và được xác định trong Bảng 6-7.

Trong trường hợp sequence_display_extension() không có trong dòng bit hoặc colour_description là zero, thì màu sắc được giả định là ngầm định bởi ứng dụng.

transfer_characteristics - Số nguyên 8 bit này mô tả đặc tính truyền tải quang điện tử của ảnh nguồn và được xác định trong Bảng 6-8

Bảng 6-8 - màu sắc cơ sởGiá trị Cơ sở Thông tin lưu ý *

0 Cấm

1

primary x ygreen 0.300 0.600blue 0.150 0.060red 0.640 0.330white D65 0.3127 0.3290

ITU-R BT.709 [2]Rec. ITU-R BT.1361 [4], hệ thống màu sắc quy ước thông thường hoặc hệ thống màu sắc mở rộng phạm vi IEC 61966-2-4 [9]Phụ lục B của SMPTE RP 177 [ 17]

2 Không xác địnhĐặc điểm ảnh không xác định hoặc được xác định bởi ứng dụng

3 Dự phòng Sử dụng trong tương lai bởi ITU-T | ISO/IEC

60

TCVN xxxx : 2017

Giá trị Cơ sở Thông tin lưu ý *

4

primary x ygreen 0.21 0.71blue 0.14 0.08red 0.67 0.33white D65 0.310 0.316

ITU-R BT.470, System M (historical)NTSC-1953 [16], tiêu chuẩn truyền dẫn cho truyền hình màu US 47 CFR 73.682 (a) (20) [20]

5

primary x ygreen 0.29 0.60blue 0.15 0.06red 0.64 0.33white D65 0.3127 0.3290

Rec. ITU-R BT.470, System B, G (historical)Rec. ITU-R BT.60I (xem mục 2), 625Rec. ITU-R BT.1358 [3], 625Rec. ITU-R BT.I700 [5], 625 PAL or 625 SECAM

6

primary x ygreen 0.310 0.595blue 0.155 0.070red 0.630 0.340white D65 0.3127 0.3290

(Chức năng giống như giá trị 7)Rec. ITU-R BT.60I (xem mục 2), 525. ITU-R BT.1358 [3], 525 ITU-R BT.1700 [5], NTSC SMPTE ST 170 [18]

7

primary x ygreen 0.310 0.595blue 0.155 0.070red 0.630 0.340white D65 0.3127 0.3290

(Chức năng giống như giá trị 6) SMPTE ST 240 [19]

8-255 Dự phòng Sử dụng trong tương lai bởi ITU-T | ISO/IEC

* [x] Chỉ ra mục ‘x’ trong danh mục tài liệu tham khảo của Tiêu chuẩn này

Trong trường hợp sequence_display_extension() không có trong dòng bit hoặc colour_description là zero, thì màu sắc được giả định là ngầm định bởi ứng dụng.

matrix_coefficients – Là một số nguyên tám bit mô tả các hệ số ma trận sử dụng trong thu tín hiệu độ chói và màu sắc từ ba màu cơ bản xanh lá cây , xanh dương và đỏ được xác định trong bảng 6-9

61

TCVN xxxx : 2017

Bảng 6-9 - Đặc điểm chuyển tải

Giá trị Ma trận Thông tin lưu ý *0 Cấm

1

E'Y = 0.7152 E’G + 0.0722 E'B + 0.2126 E'R

E'PB = - 0.3854 E'G + 0.5000 E'B - 0.1146 ER

E'PR = - 0.4542 E’G - 0.0458 E'B + 0.5000 ER

ITU-R BT.709 [2]ITU-R BT.1361 [4], hệ thống màu sắc thông thường và hệ thống màu sắc mở rộng IEC 61966-2-4 [9], XVYCC709

Phụ lụcB của SMPTE RP 177 [17]

2 Không xác định Đặc điểm ảnh không xác định hoặc được xác định bởi ứng dụng

3 Dự phòng Sử dụng trong tương lai bởi ITU-T │ ISO/IEC

4E'Y = 0.59 E'G + 0.11 E'B + 0.30 E'RE'PB = - 0.331 E'G + 0.500 E’B - 0.169 E'RE'PR = - 0.421 EG - 0.079 E'B + 0.500 E’R

NTSC-1953 [16], tiêu chuẩn truyền dẫn cho truyền hình màu US 47 CFR 73.682 (a) (20) [20]

5

E'Y = 0.5870 EG + 0.1140 E'B + 0.2990 E’R

E'PB = - 0.3313 E'G + 0.5000 E'B - 0.1687 ER

E'PR = - 0.4187 E'G - 0.0813 E'B + 0.5000 ER

(chức năng giống như giá trị 6)ITU-R BT.470, System B, G (historical)ITU-R BT.601 (xem mục 2), 625ITU-R BT.1358 [3], 625ITU-R BT. 1700 [5], 625 PAL or 625 SECAM IEC 61966-2-4 [9], XVYCCM,

6

E'Y = 0.5870 EG + 0.1140 E’B + 0.2990 E'R

E'PB = - 0.3313 E’G + 0.5000 E'B - 0.1687 E'R

E'PR = - 0.4187 E’G - 0.0813 E'B + 0.5000 ER

(chức năng giống như giá trị 5)ITU-R BT.601 (xem mục 2), 525 ITU-R BT. 1358 525 ITU-R BT 1700 NTSC SMPTE ST 170 [18]

7

E'Y = 0.701 E'G + 0.087 E'B + 0.212 E'R

E'PB = - 0.384 E'G + 0.500 E'B - 0.116 E’R

E'PR = - 0.445 E'G - 0.055 E’B + 0.500 E'R

SMPTE ST 240 [19]

8 YCgCo Được xác định như chỉ định dưới đây9-255 Dự phòng Sử dụng trong tương lai bởi ITU-T |

ISO/IEC* [x] Chỉ ra mục ‘x’ trong danh mục tài liệu tham khảo của Tiêu chuẩn này

Trong Bảng 6-9:

Khi transfer_charaetcristics không bằng 11 hoặc 12, các giá trị E'R, E’G và E'B tương tự với các giá trị từ 0 và 1;

Khi transfer_charaetcristics bằng 11 (IEC 61966-2-4 (9)) hoặc 12 (RCE. ITU-R BT.I36I (4), hệ thống màu sắc mở rộng), E'R, E’G và E'B là tín hiệu tương tự với phạm vi lớn hơn mà không được xác định trong Tiêu chuẩn này;

Màu đen danh định được coi là có thuộc tính E'R = 0, E'G = 0 và E'B = 0;

Màu trắng danh định được coi là có thuộc tính E'R = 1, E'G = 1 và E'B = 1

Nếu hệ số ma trận không bằng 8, áp dụng như sau đây:

- Tín hiệu tương tự E'Y với giá trị 0 kết hợp với màu đen danh định và giá trị 1 có kết hợp với màu trắng danh định;

62

TCVN xxxx : 2017

- Tín hiệu tương tự EPB và EPR với giá trị 0 kết hợp với cả hai màu trắng danh định và màu đen danh định;

- Khi transfer_characteristies không bằng 11 hoặc 12, E'Y có các giá trị từ 0 đến 1;

- Khi transfer_charactcristics không bằng 11 hoặc 12, EPB và EPR có giá trị từ -0.5 đến 0.5;

- Khi transfer_charactcristics bằng 11 (IEC 61966-2-4 [9]), hoặc 12 (ITU-R BT.136I [4]), E'Y, EPB và EPR với một phạm vi lớn hơn mà không được quy định trong Tiêu chuẩn này:

- Y, Cb và Cr có liên quan đến E'Y, EPB và EPR theo các công thức sau:

- Nếu không (matrix_coefficients bằng 8 (YCgCo)), áp dụng sau đây:

Chú ý 1 - Theo mục đích của thuật ngữ YCgCo được sử dụng trong Bảng 6-9, Cb và Cr của các phương trình trên có thể được gọi là Cg và Co, tương ứng, phép chuyển nghịch đảo cho ba phương trình trên nên được tính như sau:

t = Y – (Cb -128)

G = Y + (Cb -128)

B = t – (Cr - 128)

R = t + (Cr - 128)Chú ý 2 - Quá trình giải mã được đưa ra bởi Tiêu chuẩn này giới hạn các giá trị mẫu cho Y, Cr và Cb trong khoảng [0:255] Do đó, các giá trị mẫu bên ngoài phạm vi hàm ý bởi các phương trình trên đôi khi có thể xảy ra ở đầu ra của quá trình giải mã. Đặc biệt các giá trị mẫu 0 và 255 có thể xảy ra.

Trong trường hợp sequence_display_extension() không có trong dòng bit hoặc colour_description là zero thì các hệ số ma trận giả định được ngầm định bởi ứng dụng.Chú ý 3 - Trong các ứng dụng có thể có tín hiệu với nhiều hơn một loạt các màu sắc cơ bản, chuyển các đặc tính và/hoặc các hệ số ma trận, nên truyền một phần mở rộng chuỗi hiển thị với việc loại bỏ màu sắc được đặt thành một. và để xác định các giá trị thích hợp cho các thông số đo màu

display_horizontal_size - Xem display_vertical_size.

display_vertical_size – display_horizontal_size và display_vertical_size kết hợp với nhau xác định một hình chữ nhật có thể được coi là khu vực hoạt động "dự kiến hiển thị". Nếu hình chữ nhật này nhỏ hơn kích thước khung mã hoá, thì quá trình hiển thị có thể được dự kiến chỉ hiển thị một phần của khung được mã hóa. Ngược lại, nếu hình chữ nhật hiển thị lớn hơn kích thước khung được mã hoá, thì quá trình hiển thị có thể được dự kiến sẽ hiển thị các khung được dựng lại trên một phần của thiết bị hiển thị thay vì trên toàn bộ thiết bị hiển thị.

display_horizontal_size sẽ có cùng đơn vị như horizontal_size (mẫu của các khung được mã hóa). display_vertical_size sẽ được đặt trong các đơn vị giống như vertical_size (dòng của khung được mã hóa).

63

TCVN xxxx : 2017

display_horizontal_size và display_vertical_size- không ảnh hưởng đến quá trình giải mã nhưng có thể được sử dụng bởi quá trình hiển thị không được chuẩn hóa trong Tiêu chuẩn này.

6.3.7. Mở rộng chuỗi có thể mở rộng

Đó là một giới hạn cú pháp rằng nếu một sequence_scalable_extension() hiện diện trong dòng bit sau một sequence _extension(), thì sequence_scalable_extension() sẽ theo dõi mọi sự xuất hiện khác của sequence _extension(). Do đó một dòng bit hoặc là có thể mở rộng hoặc là không. Không thể kết hợp khả năng mở rộng và không có khả năng mở rộng mã hóa trong một chuỗi.

scalable_mode - Cho biết loại mở rộng được sử dụng trong chuỗi video. Nếu không có sequence_scalable_extension() có trong dòng bit, thì không có khả năng mở rộng nào được sử dụng cho chuỗi đó. scalable_mode cũng chỉ ra các bảng kiểu macroblock sẽ được sử dụng. Tuy nhiên, trong trường hợp khả năng mở rộng không gian nếu không có picture_spatial_scalable _extension() cho một ảnh nhất định, thì ảnh đó sẽ được giải mã theo cách không có khả năng mở rộng (chẳng hạn như sequence_scalable_extension() đã không có mặt).

Bảng 6-9 – Xác định scalable_mode

Scalable_mode Ý nghĩa picture_spatial_scalable_extension()

Macroblock_type_tables

Không có sequence_scalable_extension()

B-2, B-1 và B-400 Phân vùng dữ liệu B-2, B-3 và B-4

01Có thể mở rộng theo

không gianCó mặt B-5, B-6 và B-7

Không có B-2, B-3 và B-410 Có thể mở rộng SNR B-8

11 Có thể mở rộng theo thời gian

B-2, B-3 và B-4

Layer_id - Đây là một số nguyên xác định các lớp trong một hệ thống phân cấp có thể mở rộng. Lớp cơ sở luôn có layer_id = 0. Tuy nhiên, lớp cơ sở của một hệ thống phân cấp có thể mở rộng không mang chuỗi sequence_scalable_extension() và do đó layer_id, ngoại trừ trường hợp phân vùng dữ liệu. Mỗi lớp kế tiếp có một layer_id cao hơn một lớp mà nó là một sự tăng cường.

Trong trường hợp phân vùng dữ liệu layer_id sẽ là số không cho phân vùng số không và layer_id sẽ là một cho một phân vùng.

lower_layer_prediction_horizontal_size - Đây là một số nguyên 14 bit cho biết kích thước ngang của khung lớp dưới được sử dụng để dự đoán. Điều này sẽ chứa giá trị chứa trong honzontal_size (horizontal_size_Value và horizontal_size_extension()) trong dòng bit thấp hơn .

lower_layer_prediction_vertical_size - Đây là một số nguyên 14 bit chỉ ra kích thước dọc của khung lớp dưới được sử dụng để dự đoán. Điều này sẽ chứa giá trị nằm trong vertical_size (vertical_size_value và vertical_size_extension) trong lớp dòng bit thấp hơn.

horizonlal_subsampling_factor_m - Điều này ảnh hưởng đến quá trình tăng thanh không gian có thể mở rộng, như được định nghĩa trong mục 7.7.2. Giá trị 0 không được phép.

horizonlal_subsampling_factor_n - Điều này ảnh hưởng đến quá trình up_sampling (lấy mẫu) theo không gian, như được định nghĩa trong mục 7.7.2. Giá trị 0 không được phép.

64

TCVN xxxx : 2017

vertical_ subsampling_factor_m - Điều này ảnh hưởng đến quá trình tăng thanh không gian có thể mở rộng, như được định nghĩa trong mục mục 7.7.2. Giá trị 0 không được phép.

vertical_subsampling_factor_n - Điều này ảnh hưởng đến quá trình tăng thanh không gian có thể mở rộng, như được định nghĩa trong mục 7.7.2. Giá trị 0 không được phép.

picture_mux_enable - Nếu đặt thành 1, picture_mux_order và picture_mux_factor được sử dụng để tái ghép kênh trước khi hiển thị.

mux_to_progressive_sequence - Cờ này khi đặt là ‘1’ chỉ ra rằng các ảnh được giải mã tương ứng với hai lớp sẽ được ghép theo thời gian để tạo ra một chuỗi liên tục để hiển thị. Khi việc ghép theo thời gian được tạo ra để tạo ra một chuỗi xen kẽ cờ này sẽ là '0'

picture_mux_order - Nó biểu thị số lượng các ảnh lớp tăng cường trước ảnh lớp cơ sở đầu tiên. Do đó, nó hỗ trợ ghép lại các ảnh trước khi hiển thị vì nó chứa thông tin cho việc đảo ngược demultiplexing được thực hiện ở bộ mã hóa.

picture_mux_factor - Nó biểu thị số lượng ảnh lớp tăng cường giữa các ảnh lớp cơ sở liên tiếp để cho phép tái ghép chính xác và các lớp nâng cao để hiển thị. Nó cũng hỗ trợ ghép lại các ảnh trước khi hiển thị vì nó chứa thông tin để đảo ngược tái ghép thời gian thực hiện tại bộ mã hóa. Giá trị '000' được dùng để dự phòng.

6.3.8. Nhóm tiêu đề ảnh

group_start_code - Mã bắt đầu của nhóm là chuỗi bit '000001B8' theo hệ thập lục phân. Nó xác định sự bắt đầu của một nhóm tiêu đề ảnh.

time_code - Đây là một số nguyên 25 bit chứa các nội dung sau: drop_frame_flag,time_code_hours, time_code_minutes, marker_bit, time_code_seconds và time_code_pictures như trong Bảng 6-11. Các thông số tương ứng với các thông số được định nghĩa trong ấn bản tiêu chuẩn IEC 60461 cho "mã thời gian và kiểm soát cho máy ghi băng video". Mã thời gian đề cập đến ảnh đầu tiên sau khi nhóm quay ảnh tiêu đề có tham chiếu thời gian bằng không. drop_frame_flagcó thể được đặt là '0' hoặc '1'. Nó có thể được đặt là '1' chỉ khi tốc độ khung hình là 29,97 Hz. Nếu nó là '0' thì các ảnh được tính giả định làm tròn số ảnh gần nhất của ảnh mỗi giây, ví dụ 29,97 Hz sẽ được đếm và làm tròn là 30 Hz. Nếu nó là '1' thì các số ảnh 0 và 1 ở đầu mỗi phút, ngoại trừ các phút 0, 10, 20, 30, 40, 50 được bỏ qua.

Chú ý - Thông tin thu được bởi time_code không đóng vai trò trong quá trình giải mã.

Bảng 6-11 - Mã thời gian (time_code)

time_code Phạm vi giá trị Số bit Nhận dạngdrop_frame_flag 1 uimsbftime_code_hours 0 - 23 5 uimsbftime_code_minutes 0 - 59 6 uimsbfmarker_bit 1 1 bslbftime code seconds 0 - 59 6 uimsbftime_code_pictures 0 - 59 6 uimsbf

closed_gop - Đây là một cờ một bit cho thấy bản chất của các dự đoán được sử dụng trong các ảnh B-liên tiếp đầu tiên (nếu có) ngay sau khung mã 1 đầu tiên sau nhóm tiêu đề hình ảnh.

closed_gop- Được đặt là ‘1’ để chỉ ra rằng các ảnh B đã được mã hóa chỉ sử dụng đoán

65

TCVN xxxx : 2017

ngược hoặc mã hóa nội bộ.

Bit này được cung cấp để sử dụng trong bất kỳ chỉnh sửa nào xảy ra sau khi mã hóa. Nếu các ảnh trước đó đã được gỡ bỏ bằng cách chỉnh sửa, broken_link có thể được đặt là ‘1’ sao cho bộ giải mã có thể tránh hiển thị các ảnh B sau ảnh 1 đầu tiên sau nhóm tiêu đề ảnh. Tuy nhiên, nếu bit closed_gop được đặt là ‘1’, thì trình biên tập có thể chọn không đặt bit broken_link vì các ảnh B này có thể được giải mã chính xác.

Broken_link - Đây là một cờ một bit sẽ được đặt là ‘0’ trong suốt quá trình mã hóa. Nó được đặt là '1' để chỉ ra rằng những ảnh B liên tiếp đầu tiên (nếu có) ngay sau khung I được mã hoá đầu tiên theo nhóm của tiêu đề ảnh có thể không được giải mã chính xác vì khung tham chiếu được sử dụng để dự đoán không phải là sẵn có (vì hành động chỉnh sửa).

Bộ giải mã có thể sử dụng cờ này để tránh hiển thị khung không thể giải mã chính xác.

6.3.9. Tiêu đề ảnh

picture_start_code - là một chuỗi gồm 32 bit có giá trị 00000100 trong hệ thập lục phân.

temporal_reference - Tham số temporal_reference là một số nguyên không dấu 10 bit liên kết với mỗi hình mã hóa.

Các đặc điểm kỹ thuật đơn giản sau chỉ áp dụng khi low_delay bằng không.

Khi một khung được mã hóa ở dạng hai trường ảnh , temporal_reference liên kết với mỗi ảnh sẽ giống nhau (được gọi là temporal_reference của khung được mã hoá). Mốc thời gian của mỗi khung mã sẽ tăng dần theo một modulo 1024 khi được kiểm tra theo thứ tự hiển thị tại đầu ra của quá trình giải mã, trừ khi một nhóm tiêu đề ảnh xảy ra. Trong số các khung được mã hoá sau một nhóm tiêu đề ảnh, tham chiếu thời gian của khung được mã hoá được hiển thị trước tiên sẽ được đặt là 0.

Các đặc điểm kỹ thuật chung sau áp dụng khi độ trễ thấp bằng không hoặc một.

Nếu ảnh A không phải là một ảnh lớn, chẳng hạn bộ đệm VBV chỉ được kiểm tra một lần trước khi ảnh A mã hoá được lấy ra khỏi bộ đệm VBV và nếu N là temporal_refcrence của ảnh A, thì việc tính thời gian của ảnh B ngay sau ảnh A theo thứ tự hiển thị bằng:

• 0 nếu có một nhóm tiêu đề ảnh hiện diện giữa ảnh A và ảnh B (theo thứ tự mã hoá).

• (N + 1)% 1024 nếu ảnh B là một khung hình hoặc là trường đầu tiên của một cặp trường ảnh.

• N nếu ảnh B là trường thứ hai của một cặp trường ảnh.

Khi low_delay bằng một, có thể có các tình huống mà bộ đệm VBV sẽ được kiểm tra lại nhiều lần trước khi loại bỏ một ảnh được mã hóa (gọi là ảnh lớn) từ bộ đệm VBV.

Nếu ảnh A là một ảnh lớn và nếu K là số lần mà bộ đệm VBV được kiểm tra lại theo định nghĩa trong C.7 (K> 0), nếu N là tham chiếu thời gian của ảnh A, thì tham chiếu thời gian ảnh B ngay sau ảnh A theo thứ tự hiển thị bằng:

• K% 1024 nếu có một nhóm tiêu đề ảnh hiện diện giữa ảnh A và ảnh B (theo thứ tự mã hoá).

• (N + K + 1)% 1024 nếu ảnh B là một khung ảnh hoặc là trường đầu tiên của một cặp trường hình ảnh.

• (N + K)% 1024 nếu ảnh B là trường thứ hai của một cặp trường ảnh.Chú ý 1 - Nếu ảnh lớn là trường đầu tiên của khung được mã hoá bằng các trường ảnh, thì

tham chiếu thời gian của hai trường ảnh của khung đã được mã hóa là không được nhận diện

66

TCVN xxxx : 2017

picture_coding_type - picture_coding_type xác định xem một ảnh là một ảnh mã hoá bên trong (I), ảnh được mã hóa dự đoán (P) hoặc ảnh mã hoá dự đoán hai chiều (B). Ý nghĩa của picture_coding_type được định nghĩa trong Bảng 6-12.Chú ý 2 - Tiêu chuẩn kỹ thuật này không hỗ trợ các ảnh có mã hoá nội bộ chỉ có các hệ số DC (Các ảnh D) có thể được sử dụng trong ISO/IEC 11172-2

Bảng 6-12 - picture_coding_type (kiểu mã hóa ảnh)

picture_coding_type

Phương pháp mã hóa000 Cấm001 mã hóa trong (I)010 mã hóa dự đoán (P)011 mã hóa dự đoán theo hai chiều (B) 100 Không được sử dụng (dc intra-coded (D)) theo tiêu chuẩn ISO/ IEC

11172-2)101 Dự phòng110 Dự phòng111 Dự phòng

vbv_delay- vbv_delay là một số nguyên không dấu16 bit. Trong tất cả các trường hợp khác thì khi vbv_delay có giá trị FFFF hệ thập lục phân, giá trị vbv_delay là số chu kỳ của một đồng hồ 90 kHz bắt nguồn từ đồng hồ hệ thống 27 MHz mà VBV sẽ đợi sau khi nhận được byte cuối cùng của mã bắt đầu ảnh trước giải mã ảnh, vbv_delay sẽ được mã hóa để đại diện cho trễ như đã nêu ở trên hoặc nó sẽ được mã hoá với giá trị FFFF hệ thập lục phân.

Nếu bất kỳ trường vbv_delay nào trong một dãy được mã hoá với FFFF hệ thập lục phân, thì tất cả các giá trị này sẽ được mã hóa với giá trị này. Nếu vbv_delay lấy giá trị FFFFhệ thập lục phân, đầu vào của dữ liệu vào bộ đệm VBV được định nghĩa trong C.3.2, nếu không thì đầu vào cho bộ đệm VBV được định nghĩa trong C.3.1.

Nếu low_delay bằng '1' và nếu dòng bit chứa các ảnh lớn, các giá trị vbv_delay được mã hóa trong picture_header() của ảnh lớn có thể sai nếu không bằng FFFF hệ thập lục phân.Chú ý 3 - Có một số cách tính vbv_delay trong một bộ mã hóa.

Trong tất cả các trường hợp nó có thể được tính bằng cách lưu ý rằng trễ đầu cuối thông qua bộ mã hóa và bộ đệm bộ giải mã là không thay đổi cho tất cả các ảnh. Bộ mã hóa có khả năng biết được trễ của mã bắt đầu ảnh có liên quan trong bộ đệm bộ mã hóa và độ trễ cuối cùng tổng thể. Do đó, giá trị được mã hóa trong vbv_delay (độ trễ bộ đệm bộ giải mã của mã bắt đầu ảnh) được tính như là trễ tổng số trễ thấp của mã bắt đầu ảnh tương ứng trong bộ đệm bộ mã hóa được đo trong các khoảng thời gian của một đồng hồ 90 kHz thu được từ 27 MHz đồng hồ hệ thống.

Ngoài ra, đối với hoạt động tốc độ bit không đổi, vbv_delay có thể được tính từ trạng thái của VBV như sau:

vbv_delayn = 90 000 * Bn* / R

Ở đây:

n> 0

Bn * = Occupancy VBV, được đo bằng các bit, ngay trước khi loại bỏ ảnh n khỏi bộ đệm, nhưng sau khi gỡ bỏ bất kỳ tiêu đề nào, người sử dụng dữ liệu và nhồi tức thời đi trước các yếu tố dữ liệu của hình n.

67

TCVN xxxx : 2017

R = tốc độ bit thực tế (nghĩa là độ chính xác đầy đủ chứ không phải giá trị được định lượng cho bởi bit_rate trong tiêu đề chuỗi).

Một phương pháp tương đương để tính vbv_delay cho tốc độ bit biến đổi có thể được lấy từ phương trình trong C.3.1. Điều này sẽ ở dạng một mối quan hệ lại xảy ra cho vbv_delay với vbv_delay trước đó, thời gian giải mã của các ảnh hiện tại và trước đó, và số byte trong ảnh trước. Phương pháp này có thể được áp dụng nếu, tại thời điểm vbv_delay được mã hoá, tốc độ bit trung bình của việc truyền dữ liệu ảnh của ảnh trước đó đã được biết đến.

full_pel_forward_vector - Cờ này được sử dụng trong ISO/IEC 11172-2 không được sử dụng bởi Tiêu chuẩn này. Nó sẽ có giá trị là '0'.

forward_f_code - Chuỗi 3 bit (được sử dụng trong ISO/IEC 11172-2) không được sử dụng bởi Tiêu chuẩn này. Nó sẽ có giá trị là ‘111’.

full_pel_backward_vector - Cờ này được sử dụng trong ISO/IEC 11172-2 không được sử dụng bởi Tiêu chuẩn này. Nó sẽ có giá trị là '0'

backward_f_code - Chuỗi 3 bit này (được sử dụng trong ISO/IEC 11172-2) không được sử dụng bởi Tiêu chuẩn này. Nó sẽ có giá trị '111'.

extra_bit_picture - Cờ này cho thấy sự hiện diện của các thông tin thêm sau. Nếu extra_bit_picture được đặt là ‘1’, content_description_data() sẽ theo nó. Nếu nó được đặt là '0', không có thêm content_description_data() nữa trong tiêu đề ảnh này.

exfra_informalion_picture - Dành riêng. Bộ giải mã phù hợp với Đặc điểm này gặp phải extra_information_picture trong một dòng bit sẽ bỏ qua nó (tức là xóa phía trước dòng bit và loại bỏ). Một dòng bit phù hợp với Tiêu chuẩn kỹ thuật này sẽ không chứa cú pháp này.

6.3.10. Mở rộng mã hóa ảnh

f_code[s][t] - Một số nguyên không dấu 4 bit lấy giá trị từ 1 đến 9, hoặc 15. Giá trị zero bằng không được cấm và các giá trị từ 10 đến 14 được dành riêng. Nó được sử dụng trong việc giải mã vectơ chuyển động, xem mục 7.6.3.1.

Trong ảnh I, trong đó concealment_motion_vectors là số không f_code[s][t] không được sử dụng (vì vectơ chuyển động không được sử dụng) và sẽ lấy giá trị 15 (tất cả các giá trị đó).

Tương tự như vậy, trong ảnh I hoặc một ảnh P,f_code [l][t] không được sử dụng trong quá trình giải mã (vì nó đề cập đến các vectơ chuyển động ngược) và sẽ lấy giá trị 15 (tất cả các giá trị đó).

Xem Bảng 7-7 về ý nghĩa của các chỉ số: s và t.

intra_dc_precision - Đây là một số nguyên 2 bit được định nghĩa trong Bảng 6-13.

Bảng 6-13 - Độ chính xác của Infra DC

intra_dc_precision Độ chính xác (bits)00 801 910 1011 11

Quá trình lượng tử hóa nghịch đảo đối với các hệ số Intra DC được sửa đổi bởi tham số

68

TCVN xxxx : 2017

này như đã giải thích trong mục 7.4.1.

picture_structure -Đây là một số nguyên 2 bit được định nghĩa trong Bảng 6-14.

Bảng 6-14 - Ý nghĩa của cấu trúc ảnh

pirture_structure Ý nghĩa00 Dự phòng01 Trường trên cùng10 Trường dưới cùng 11 Khung ảnh

Khi một khung được mã hoá trong các hình thức hai trường, cả hai trường phải có cùng một loại mã hình ảnh, trừ trường hợp mã hoá đầu tiên là một ảnh I, trong trường hợp đó, thứ hai có thể là ảnh l hoặc một ảnh P.

Trường mã hoá đầu tiên của khung có thể là trường trên cùng hoặc trường dưới cùng, và trường tiếp theo phải có tính chẵn lẻ đối nhau.

Khi một khung được mã hoá trong các hình thức của trường vực hình ảnh, các yếu tố cú pháp sau đây có thể được đặt độc lập trong mỗi trường ảnh:

• f_code [0] [0], f_code [0] [1]:

• f_code [1] [0], f_code [1] [1];

• intra_dc_precision, concealment_motion_vectors, q_scale_type;

• intra_vlc_format, alternate_scan;

• vbv_delay;

• temporal_reference.

top_field_first - Ý nghĩa của phần tử này phụ thuộc vào picture_structure,progressive_sequence và repeat_first_field.Nếu progressive_sequence bằng '0', cờ này cho biết trường của khung tái tạo là đầu ra đầu tiên bởi quá trình giải mã.

Trong một trường ảnh, top_field_first sẽ có giá trị '0’ và trường đầu ra duy nhất bởi quá trình giải mã là trường ảnh được giải mã.

Trong một khung hình top_field_first được thiết lập là ‘1’ cho biết trường trên cùng của khung tái tạo là trường đầu tiên xuất ra bởi quá trình giải mã, trường đầu tiên được đặt là '0' cho biết trường dưới cùng của khung tái tạo là trường đầu tiên đầu ra bằng quá trình giải mã.

Nếu progressive_sequence bằng ‘1’, cờ này, kết hợp với trường repeat_first_field, chỉ ra bao nhiêu lần (một, hai hoặc ba) khung tái tạo được xuất ra bởi quá trình giải mã.

Nếu repeat_first_field được đặt là ‘0’, top_field_first sẽ được đặt là ‘0’. Trong trường hợp này, đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm một liên tục khung.

Nếu top_field_first được đặt là ‘0’ và repeat_first_field được đặt là ‘1’, đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm hai khung hình giống hệt nhau.

69

TCVN xxxx : 2017

Nếu top_field_first được đặt là 1 và repeat_first_field được đặt là ‘1’, đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm ba khung hình giống hệt nhau.

frame_pred_frame_dct - Nếu cờ này được đặt là ‘1’, thì chỉ dùng khung-DCT và khung dự báo. Trong một trường ảnh, nó sẽ là '0'. frame_pred_frame_dct sẽ là ‘1’ nếu progressive_sequence là ‘1’. Cờ này ảnh hưởng đến cú pháp của dòng bit.

concealment_motion_vectors - Cờ này có giá trị ‘1’ để cho biết rằng các vector chuyển động được mã hóa trong macroblocks bên trong. Cờ nàycó giá trị '0' để cho biết rằng không có vectơ chuyển động được mã hoá trong Macroblocks.

q_scale_type - Cờ này ảnh hưởng đến quy trình lượng tử nghịch đảo như mô tả trong 7.4.2.2.

intra_vlc_format - Cờ này ảnh hưởng đến việc giải mã dữ liệu hệ số chuyển đổi như mô tả trong mục 7.2.2.1.

alternate_scan - Cờ này ảnh hưởng đến việc giải mã dữ liệu hệ số chuyển đổi như mô tả trong 7.3.

repeat_firsl_field - Cờ này chỉ áp dụng được trong khung hình; trong mộttrường ảnh nó sẽ được thiết lập là không và không ảnh hưởng đến quá trình giải mã.

Nếu progressive_sequence bằng ‘0’ và progressive_frame bằng ‘0’. repeat_first_field sẽ là ‘0’, và đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm hai trường.

Nếu progressive_sequence bằng ‘0’ và progressive_frame tương đương với ‘1’:

Nếu cờ này được đặt là 0. đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm hai trường. Trường đầu tiên (trường trên hoặc dưới cùng được xác định bởi trường hàng đầu đầu tiên) được theo sau bởi trường khác.

Nếu nó được đặt thành 1, đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm ba trường. Trường đầu tiên (trường trên hoặc dưới cùng được xác định bởi top_field_first) được theo sau bởi trường khác, sau đó trường đầu tiên được lặp lại.

Nếu progressive_sequence bằng 1:

Nếu cờ này được đặt là 0, đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm một khung.

Nếu nó được đặt thành 1, đầu ra của quá trình giải mã tương ứng với khung tái tạo này bao gồm hai hoặc ba khung, phụ thuộc vào giá trị của top_field_first.chroma_420_type - Nếu sắc màu là "4:2:0", giá trị của chroma_420_type sẽ giống như progressive_frame; chroma_420_type khác không có ý nghĩa và sẽ bằng 0. Cờ này tồn tại vì lý do lịch sử.

progressive_frame - Nếu progressive_frame được đặt là 0, nó chỉ ra rằng hai trường của khung là các trường xen kẽ, trong đó một khoảng thời gian của khoảng thời gian trường tồn tại giữa (các mẫu không gian tương ứng) của hai trường. Điều này dễ dàng áp dụng các hạn chế sau đây:

• repeat_first_field sẽ là 0 (hai trường thời gian).

Nếu progressive_frame được đặt là 1 nó chỉ ra rằng hai trường (của khung) là thực sự từ cùng thời điểm ngay như nhau. Trong trường hợp này, một số hạn chế đối với các tham số và cờ khác trong dòng bit được áp dụng:

• picture_structure sẽ là "Khung";

• Nếu progressive_sequence bằng 1, thì frame_pred_frame_det sẽ là 1.

progressive_frame được sử dụng khi chuỗi video được sử dụng làm lớp dưới của một

70

TCVN xxxx : 2017

dải không gian có thể mở rộng. Ở đây nó ảnh hưởng đến quá trình lấy mẫu được sử dụng trong việc hình thành dự đoán trong lớp nâng cao từ lớp dưới.

composite_display_flag - Cờ này được đặt là 1 để chỉ ra rằng các trường sau đây được sử dụng khi các ảnh đầu vào đã được mã hóa dưới dạng video kết hợp (tương tự) trước khi mã hóa vào một dòng bit phù hợp với tiêu chuẩn này. Nếu nó được đặt là 0, thì các tham số này không xảy ra trong dòng bit.

Thông tin liên quan đến ảnh ngay sau phần mở rộng. Trong trường hợp ảnh này là một khung hình, thông tin liên quan đến trường đầu tiên của khung đó. Các thông tin tương đương cho trường thứ hai có thể được bắt nguồn (không có cách nào để đại diện cho nó trong dòng bit).Chú ý 1 - Các thành phần cú pháp khác nhau được bao gồm trong dòng bit nếu composite_display_flag là 1 không được sử dụng trong quá trình giải mã.

Chú ý 2 - trường repeat_first_ sẽ làm cho trường video tổng hợp bị hủy bỏ khỏi 4trường hoặc 8trường.

v_axis - Một số nguyên 1 bit chỉ được sử dụng khi dòng bit đại diện cho một tín hiệu đã được mã hoá trước đó theo hệ thống PAL. v_axis được đặt là 1 trên một dấu hiệu dương, nếu không v_axis được đặt là 0.

field_sequence - Một số nguyên 3 bit xác định số trường trong chuỗi 8 trường được sử dụng trong các hệ thống PAL hoặc bốn trường được sử dụng trong các hệ thống NTSC như được định nghĩa trong Bảng 6-15.

Bảng 6-15 - Định nghĩa field_sequence

Field_sequence Khung Trường000 1 1001 1 2010 2 3011 2 4100 3 5101 3 6110 4 7111 4 8

sub_carrier - Đây là một số nguyên 1 bit. Đặt là 0 có nghĩa là mối quan hệ tần số sóng mang phụ/dòng là chính xác. Khi đặt là 1 mối quan hệ là không chính xác.

burst_amplitude - Đây là một số nguyên 7 bit xác định biên độ burst (chỉ dành cho PAL và NTSC). Biên độ của sóng mang phụ burst được lượng tử hóa như là một tín hiệu độ chói ITU-R BT.601, với MSB bị bỏ qua.

sub_carrier_ phase - Đây là một số nguyên 8 bit xác định pha của sóng mang phụ tham chiếu tại địa điểm đồng bộ hoá trường đối với trường bắt đầu, như được định nghĩa trong Khuyến nghị ITU-R BT.470 (mục 6-16).

Bảng 6-16 - Định nghĩa của sub_carrier_phase

71

TCVN xxxx : 2017

6.3.11. Mở rộng ma trận lượng tử

Mỗi ma trận lượng tử có một bộ các giá trị mặc định. Khi sequence_header_code được giải mã tất cả các ma trận sẽ được đặt lại về giá trị mặc định của chúng. Có thể tải xuống ma trận do người dùng định nghĩa và điều này có thể xảy ra trong một sequence_header() hoặc trong quant_matrix_extension().

Với dữ liệu 4:2:0 chỉ có hai ma trận được sử dụng, một trong những khối bên trong khác chokhối không phải bên trong.

Với dữ liệu 4:2:2 hoặc 4:4:4 bốn ma trận được sử dụng. Cả ma trận bên trong và không phải bên trong đều được cung cấp cho cả khối độ chói và cho các khối sắc màu. Lưu ý rằng, tuy nhiên, có thể tải cùng một ma trận người dùng đã xác định vào cả ma trận độ chói và độ sắc màu cùng một lúc.

Ma trận mặc định cho các khối bên trong (cả độ chói và độ sắc màu) là:

Hình 6-16 - Ma trận mặc định cho khối bên trong

Ma trận mặc định cho các khối không phải bên trong (độ chói và độ sắc màu) là:

72

TCVN xxxx : 2017

Hình 6-17 - Ma trận mặc định cho các khối không phải bên trong load_intra_quantiser_matrix - Đây là một cờ một bit được thiết lập là ‘1’ nếu intra_quantiser_matrix bên trong. Nếu nó được đặt là '0' thì không có sự thay đổi trong các giá trị sẽ được sử dụng.

intra_quantiser_matrix - Đây là danh sách 64 số nguyên không dấu 8 bit. Các giá trị mới, được mã hoá trong trình tự quét zigzag mặc định như mô tả trong 7.3.1, thay thế các giá trị trước đó. Giá trị đầu tiên sẽ luôn là 8 (giá trị từ 1 đến 7 và 9 đến 255 được dùng để dự phòng). Đối với tất cả các số nguyên 8bit không dấu, giá trị zero là bị cấm. Với dữ liệu 4:2:2 và 4:4:4 các giá trị mới sẽ được sử dụng cho cả hai ma trận độ chói và ma trận sắc màu. Tuy nhiên, ma trận sắc màu sau đó có thể được nạp với một ma trận khác nhau.

load_non_intra_quantiser_matrix - Đây là một cờ một bit được đặt là 1 nếu non_intra_quantiser_matrix theo sau. Nếu nó được thiết lập là '0' thì không có thay đổi trong các giá trị sẽ được sử dụng.

non_intra_quantiser_matrix - Đây là danh sách 64 số nguyên không dấu 64 bit. Các giá trị mới, được mã hoá trong trình tự quét zigzag mặc định được mô tả trong mục 7.3.1, thay thế các giá trị trước. Đối với tất cả các số nguyên 8 bit không dấu, giá trị số 0 là bị cấm. Với dữ liệu 4: 2: 2 và 4: 4: 4, các giá trị mới sẽ được sử dụng cho cả hai ma trận độ chói không phải trong nội bộ và ma trận sắc màu không phải bên trong. Tuy nhiên, ma trận màu sắc không phải bên trong sau đó có thể được nạp với một ma trận khác.

load_chroma_intra_quantiser_matrix - 'Đây là một cờ một bit được đặt là ‘1’ nếu chroma_intra_quantiscr_matrix theo sau. Nếu nó được đặt là ‘0’ thì không có sự thay đổi trong các giá trị sẽ được sử dụng. Nếu chroma_format là "4:2:0" cờ này sẽ lấy giá trị '0'.

chroma_intra_quantiser_matrix - Đây là danh sách sáu mươi bốn số nguyên không dấu 8 bit. Các giá trị mới, được mã hoá trong trình tự quét zigzag mặc định như mô tả trong 7.3.1, thay thế các giá trị trước đó. Giá trị đầu tiên sẽ luôn là 8 (các giá trị từ 1 đến 7 và từ 9 đến 255 được dành riêng). Đối với tất cả các số nguyên 8 bitkhông dấu, giá trị zero bị cấm.

Ioad_chroma_non_intra_quantiser_matrix - Đây là một cờ một bit được đặt là ‘1’ nếu chroma_non_intra_quantiser_matrix theo sau. Nếu nó được đặt là ‘0’ thì không có sự thay đổi trong các giá trị sẽ được sử dụng. Nếu màu sắc là "4:2:0", cờ này sẽ lấy giá trị '0'.

chroma_non_intra_quantiser_matrix - là một danh sách sáu mươi bốn số nguyên

73

TCVN xxxx : 2017

không dấu 8 bit. Các giá trị mới, được mã hoá trong trình tự quét zigzag mặc định như mô tả trong mục 7.3.1, thay thế các giá trị trước đó. Đối với tất cả các số nguyên 8 bit không dấu, giá trị 0 (zero) bị cấm.

6.3.12. Mở rộng hiển thị ảnh

Tiêu chuẩn kỹ thuật nào không xác định quá trình hiển thị. Thông tin trong phần mở rộng này không ảnh hưởng đến quá trình giải mã và có thể bị bỏ qua bởi bộ giải mã phù hợp với Tiêu chuẩn kỹ thuật này.

Phần mở rộng hiển thị ảnh cho phép vị trí của hình chữ nhật hiển thị có kích thước được chỉ định trong sequence_display_extension() được di chuyển trên cơ sở từng phần hình ảnh. Một ứng dụng cho việc này là việc thực hiện quét ảnh.

frame_center_horizoiital_offset - Đây là một số nguyên 16 bit cho horizoiital_offset trong các đơn vị mẫu 1/16. Một giá trị dương sẽ chỉ ra rằng trung tâm của khung tái tạo nằm ở bên phải của tâm của hình chữ nhật hiển thị.

frame_center_vertical_offset - Đây là một số nguyên 16 bit cho vertical_offset trong các đơn vị mẫu 1/16. Một giá trị dương sẽ chỉ ra rằng trung tâm của khung tái tạo nằm ở bên phải của tâm của hình chữ nhật hiển thị.

Kích thước của vùng hình chữ nhật hiển thị được xác địnhtrong sequence_display_extension(). Các tọa độ của vùng trong hình mã hoá được xác định trong picture_display_extension().

Tâm của khung tái tạo là trung tâm của hình chữ nhật được xác định bởi horizontal_size và vertical_size.

Kể từ (trong trường hợp của một chuỗi liên quan) một hình được mã hóa có thể liên quan đến một, hai hoặc ba trường được giải mã, picture_display_extension() Có thể chứa tối đa ba lần.

Số lượng các hiệu ứng trung tâm khung hình trong picture_display_extension() được định nghĩa như sau:

Một picture_display_extension() sẽ không xảy ra trừ khi một

74

TCVN xxxx : 2017

sequenee_display_extension() theo sau sequence_header().

Trong một cách dễ dàng rằng một ảnh nhất định không có một picture_display_extension(), sau đó sẽ được sử dụng bù đắp trung tâm khung được giải mã gần đây nhất. Lưu ý rằng mỗi bù của khung trung tâm bị mất đều có cùng giá trị (ngay cả khi đã có hai hoặc ba điểm ảnh trung tâm khung trong picture_display_extension()). Sau một sequence_header(), giá trị zero sẽ được sử dụng cho tất cả các giá trị trung tâm khung cho đến khi một picture_display_extension() xác định các giá trị khác không.

Hình 6-18 minh hoạ các tham số hiển thị ảnh. Như được hiển thị, các hiệu chỉnh trung tâm khung có trong picture_display_extension() sẽ xác định vị trí trung tâm của khung tái tạo từ trung tâm của hình chữ nhật hiển thị.Chú ý 1 - Hình chữ nhật hiển thị cũng có thể lớn hơn khung được dựng lại.

Chú ý 2 - Ngay cả trong một trường ảnh frame_centre_vertical_offset vẫn thể hiện sự bù của khung trung tâm trong 1/16 * của một dòng khung (không phải là dòng trong trường)

Chú ý 3 - Trong ví dụ của hình 6-17 cả frame_centre_vertical_offset và frame_centre_vertical_offset đều có các giá trị âm.

6.3.12.1. Quay-quét (Pan-scan)Các giá trị trung tâm khung có thể được sử dụng để thực hiện quay- quét, trong đó một vùng hình chữ nhật được xác định có thể được quét trên toàn bộ khung tái tạo.

Ví dụ: thiết bị này có thể được sử dụng để xác định cửa sổ tỷ lệ co 4:3 theo định dạng ảnh được mã hóa 16:9. Điều này sẽ cho phép bộ giải mã tạo ra các ảnh có thể sử dụng cho một bộ truyền hình độ nét chuẩn thông thường từ một định dạng được mã hóa nhằm xác định nâng cao. Vùng tỷ lệ co 4:3 được dự định chứa vùng "chú ý nhất" của ảnh.

Vùng tỷ lệ co 4:3 được xác định bởi display_horizontal_size và display_vertical_size. Kích thước khung hình 16:9 được xác định bởi horizontal_size và vertical_size.

Hình 6-18 – Các thông số bù khung trung tâm

6.3.13. Mở rộng phần mở rộng trục hồi tiếp

Chú ý - Xem thêm mục 7.9.

reference_select_code - Đây là mã 2 bit xác định khung tham chiếu hoặc trường tham chiếu để dự đoán tùy thuộc vào loại hình ảnh.

forward_temporal_reference - Giá trị số nguyên không dấu 10 bit cho biết tham chiếu

75

TCVN xxxx : 2017

thời gian của khung lớp dưới sẽ được sử dụng để cung cấp dự đoán trước. Nếu lớp dưới cho biết tham chiếu thời gian với hơn 10 bit, các bit có ít ý nghĩa nhất được mã hoá ở đây. Nếu lớp dưới cho thấy tham chiếu thời gian với ít hơn 10 bit, tất cả các bit được mã hoá ở đây và các bit quan trọng hơn sẽ được đặt là 0.

forward_temporal_reference - Giá trị số nguyên không dấu 10 bit cho biết tham chiếu thời gian của khung lớp dưới sẽ được sử dụng để cung cấp dự đoán về phía trước. Nếu lớp dưới cho biết tham chiếu thời gian với hơn 10 bit, các bit có ít ý nghĩa nhất được mã hoá ở đây. Nếu lớp dưới cho thấy tham chiếu thời gian với ít hơn 10 bit, tất cả các bit được mã hoá ở đây và các bit quan trọng hơn sẽ được đặt là 0.

backward_temporaI_referrence - Giá trị số nguyên không dấu10 bit cho biết tham chiếu thời gian của khung lớp dưới sẽ được sử dụng để cung cấp dự đoán sau đó. Nếu lớp dưới cho biết tham chiếu thời gian với hơn 10 bit, các bit có ít ý nghĩa nhất được mã hoá ở đây. Nếu lớp dưới cho thấy tham chiếu thời gian với ít hơn 10 bit, tất cả các bit được mã hoá ở đây và các bit quan trọng hơn sẽ được đặt là 0.

6.3.14. Khả năng mở rộng ảnh tưng phần

lower_layer_temporal_reference – Một giá trị số nguyên không dấu 10 bit cho biết tham chiếu theo thời gian của khung lớp dưới sẽ được sử dụng để cung cấp dự đoán. Nếu lớp dưới cho biết tham chiếu theo thời gian với hơn 10 bit, các bit ở đây có ít ý nghĩa nhất được mã hoá. Nếu lớp dưới cho thấy tham chiếu thời gian với ít hơn 10 bit, tất cả các bit được mã hoá ở đây và các bit quan trọng hơn sẽ được đặt là 0.

lower_layer_horizontal_offset - Số nguyên có dấu (bổ sung hai số) 15 bit này cho biết độ bù ngang (của góc trên cùng bên trái) của việc lấy mẫu tăng lên khung lớp dưới cùng có quan hệ với ảnh lớp tăng cường. Nó được thể hiện bằng các đơn vị của chiều rộng mẫu ảnh tăng cường. Nếu định dạng sắc màu là 4:2:0 hoặc 4:2:2, thì tham số này phải là một số chẵn.

lower_layer_vertical_offset - Số nguyên có dấu (bổ sung hai số) 15 này cho biết độ bù dọc (của góc trên cùng bên trái của việc lấy mẫu tăng lên khung lớp dưới cùng có quan hệ với ảnh lớp tăng cường.. Nó được thể hiện bằng các đơn vị của chiều cao mẫu ảnh tăng cường. Nếu định dạng sắc màu là 4:2:0, thì tham số này phải là một số chẵn.

spatial_temporal_weight_code_table_index - Số nguyên 2bit này chỉ ra bảng mã trọng số theo thời gian theo không gian sẽ được sử dụng như được xác định trong mục 7.7. Các giá trị cho phép của spatial_temporal_weight_code_table_index được xác định trong Bảng 7-21.

lower_layer_progressive_frame - Cờ này sẽ được đặt là 0 nếu khung dưới cùng là xen kẽ và sẽ được đặt là '1' nếu khung dưới cùng là liên tiếp. Việc sử dụng cờ này trong quá trình lấy mẫu tăng lên mở rộng theo không gian được định nghĩa trong mục 7.7.

lower_layer_deinterlaced_field_select - Cờ này ảnh hưởng đến quá trình lấy mẫu tăng lên mở rộng theo không gian được định nghĩa trong mục 7.7.

6.3.15. Mở rộng bản quyền

extenslon_start_code_identifler - Đây là một số nguyên 4 bit xác định phần mở rộng (xem Bảng 6-2).

copyright_flag - Đây là cờ một bit. Khi cờ bản quyền được đặt là ‘1’, nó cho biết rằng nguồn video được mã hoá trong tất cả các ảnh được mã hoá sau phần mở rộng bản quyền, theo thứ tự mã hóa, đến phần mở rộng bản quyền tiếp theo hoặc cuối của chuỗi

76

TCVN xxxx : 2017

mã hóa, được cấp bản quyền. Copyright_identifier và copyright_number xác định tác phẩm có bản quyền. Khi cờ bản quyền được đặt là ‘0’, tài liệu này không cho biết nguồn video được mã hoá trong tất cả các ảnh được mã hoá sau khi mở rộng bản quyền, theo thứ tự mã hóa, có bản quyền hay không.

copyright_identifler - Đây là một số nguyên 8 bit do Cơ quan đăng ký cung cấp bởi ISO/IEC JTCI/SC29. Giá trị 0 chỉ ra rằng thông tin này không có sẵn. Giá trị bản quyền của copyright_number sẽ bằng không khi copyright_identifler bằng không.

Khi cờ bản quyền được đặt là ‘0’, bản quyền không có ý nghĩa và sẽ có giá trị 0.

original_or_copy - Đây là một cờ một chút. Nó được đặt là ‘1’ để cho biết rằng tài liệu là một bản gốc, và thiết lập để '0' để cho biết rằng nó là một bản sao.

reserved - Đây là một số nguyên 7 bit, dành cho phần mở rộng trong tương lai. Nó sẽ có giá trị bằng không.

copyright_number_1 - Đây là một số nguyên 20 bit, đại diện cho các bit 44 đến 63 của copyright_number.

copyright_number_2 - Đây là một số nguyên 22 bit, đại diện cho các bit 22 đến 43 của copyright_number.

copyright_number_3 - Đây là một số nguyên 22 bit, đại diện cho các bit từ 0 đến 21 của copyright_number.

copyright_number - Đây là một số nguyên 64 bit, bắt nguồn từ copyright_number_ 1, copyright_number_2 và copyright_number_3 như sau:

copyright_number = (copyright_number_1<< 44) + (copyright_number_2<< 22) + copyright_number_3

Ý nghĩa của copyright_number được xác định chỉ khi copyright_flag được đặt là ‘1’. Trong trường hợp này, giá trị của copyright_number xác định độc nhất tác phẩm có bản quyền được đánh dấu bởi tiện ích có bản quyền. Giá trị 0 cho copyright_number cho biết rằng không có số nhận dạng của tác phẩm có bản quyền.

Khi copyright_flag được đặt là ‘0’, copyright_number không có ý nghĩa và sẽ có giá trị 0.

6.3.16. Lát cắt (Slice)

slice_start_code - là một chuỗi gồm 32 bit. 24-bit đầu tiên có giá trị 000001 theo hệ thập lục phân và 8-bit cuối cùng là slice_vertical_position có giá trị trong khoảng từ 01 đến AF thập lục phân.

slice_vertical_ position - Điều này được đưa ra bởi tám bit cuối cùng của slice_start_code. Nó là một số nguyên không dấu cho vị trí thẳng đứng trong các đơn vị khối macroblock của macroblock đầu tiên trong lát cắt.

Trong ảnh lớn (khi kích thước thẳng đứng của khung lớn hơn 2800 dòng) thì vị trí dọc của lát được mở rộng bởi slice_vertical_position_extension.Hàng macroblock có thể được tính như sau:

Nếu(vertical_size > 2800)

mb_row = (slice_vertical_position_extension « 7) + slice_vertical_position - 1;

Mặt khácmb_row = slice_vertical_position -1;

Slice_vertical_position của hàng đầu tiên của macroblocks là một. Một số lát có thể có cùng slice_vertical_position, vì các slice có thể bắt đầu và kết thúc ở bất cứ đâu. Giá trị

77

TCVN xxxx : 2017

lớn nhất của slice_vertical_position là 175 trừ khi slice_vertical_position_extension có trong trường hợp slice_vertical_position sẽ nằm trong khoảng [1: 128].

priority_breakpoint - Đây là một số nguyên 7 bit chỉ ra điểm trong cú pháp mà dòng bit sẽ được phân chia. Các giá trị cho phép và cách giải thích ngữ nghĩa của chúng được đưa ra trong Bảng 7-30, prionty_breakpoint sẽ lấy giá trị 0 trong phân vùng I.

quantiser_scale_code - Một số nguyên không dấu 5 bit trong dải từ 1 đến 31. Bộ giải mã sẽ sử dụng giá trị này cho đến khi mã số lượng tử khác được tìm thấy trong slice() hoặc macroblock(). Giá trị 0 không được phép.

slice_extension_flag - Cờ này sẽ được đặt là '1' để biểu thị sự hiện diện của intra_slice, slice_picture_id_enable, slice_picture_id trong dòng bit.

intra_slice - Cờ này sẽ được đặt là ‘0’ nếu bất kỳ macroblocks nào trong lát cắt không là các macroblocks trong. Nếu tất cả các macroblocks, là khối macroblocks trong, sau đó lát cắt trong intra_slice có thể được đặt là ‘1’.

Intra_slice có thể được bỏ qua từ dòng bit (bằng cách thiết lập intra_slice_flag là '0'), trong đó dễ dàng nó sẽ được giả định có giá trị bằng không.

intra_slice không được sử dụng bởi quá trình giải mã. intra_slice được dùng để hỗ trợ một ứng dụng DSM trong việc thực hiện FF/FR (xem F.12).

slice_picture_id_enable - Cờ này điều khiển ngữ nghĩa của slice_picture_id. Nếu slice_piclure_id_enable được đặt là ‘0’, slice_picture_id không được sử dụng bởi Tiêu chuẩn kỹ thuật này và sẽ có giá trị bằng không. Nếu slice_piclure_id_enable được đặt là ‘1’, slice_pieture_id có thể có giá trị khác với không.

slice_picture_id_enable phải có cùng một giá trị trong tất cả các lát cắt của một ảnh. slice_piclure_id_enable có thể được bỏ qua từ dòng bit (bằng cách thiết lập slice_extension_flag là ‘0’), trong trường hợp đó nó sẽ được giả định có giá trị bằng không.

slice_picture_id_enable không được sử dụng bởi quá trình giải mã.

slice_picture_id - Đây là một số nguyên 6 bit. Nếu slice_piclure_id_enable được đặt là ‘0’, slice_pieture_id không được sử dụng bởi Tiêu chuẩn kỹ thuật này và sẽ có giá trị bằng không. Nếu slice_piclure_id_enable được đặt là ‘1’, slice_picture_id được xác định ứng dụng và có thể có bất kỳ giá trị nào, với ràng buộc rằng slice_pieture_id sẽ có cùng giá trị trong tất cả các lát của một hình ảnh.

slice_pieture_id không được sử dụng bởi quá trình giải mã. slice_pieture_id được dùng để hỗ trợ phục hồi các lỗi nghiêm trọng của các lỗi đối với một số loại ứng dụng nhất định. Ví dụ, ứng dụng có thể tăng slice_picture_id với mỗi ảnh truyền qua, do đó trong trường hợp lỗi burst, khi một số látcắt bị mất, bộ giải mã có thể biết được nếu lát sau lỗi burst thuộc ảnh hiện tại hoặc ảnh khác, có thể là trường hợp nếu ít nhất một tiêu đề ảnh đã bị mất.

extra_bit_slice - Cờ này cho thấy sự hiện diện của các thông tin thêm sau. Nếu extra_bit_slice được đặt là ‘1’, extra_information_slice sẽ theo nó. Nếu nó được đặt là ‘0’, không có dữ liệu sau nó. extra_bit_slice sẽ được đặt là ‘0’, giá trị '1' được dành riêng cho các phần mở rộng tương lai có thể được định nghĩa bởi ITU-T│ISO/IEC.

extra_informalion_slice – Dự phòng. Bộ giải mã phù hợp với Tiêu chuẩn kỹ thuật này gặp phải thông số extra_information_slice trong một dòng bit sẽ bỏ qua nó (tức là gỡ nó khỏi dòng bit và loại bỏ). Một dòng bit phù hợp với Tiêu chuẩn kỹ thuật này sẽ không chứa phần tử cú pháp này.

78

TCVN xxxx : 2017

6.3.17. Khối Macroblock

Chú ý - "macroblock_stuffing" được hỗ trợ trong tiêu chuẩn ISO/IEC 11172-2 sẽ không được sử dụng trong một dòng bit được xác định bởi Tiêu chuẩn kỹ thuật này.

macroblock_escape - Macroblock_escape là một chuỗi bit cố định '0000 0001 000' được sử dụng khi sự khác biệt giữa macroblock_address và previous_macroblock_address lớn hơn 33. Nó làm cho giá trị của macroblock_address_increment lớn hơn 33 so với giá trị sẽ được giải mã bởi chuỗi con macroblock_escape và các từ mã macroblock_address_inerement.Ví dụ: nếu có hai mã bắt đầu macroblock rút khỏi mã địa chỉ macroblock trước khi tăng địa chỉ macroblock thì 66 sẽ được thêm vào giá trị được chỉ định bởi macroblock_address_inerement.

macroblock_address_increment - Đây là một mã số chiều dài biến số được mã hoá theo Bảng B.1 cho biết sự khác biệt giữa macroblock_address và previous_macroblock_address. Giá trị tối đa của macroblock_address_increment là 33. Các giá trị lớn hơn giá trị này có thể được mã hoá bằng cách sử dụng từ viết tắt macroblock_escape.Macroblock_address là một biến xác định vị trí tuyệt đối của macroblock hiện tại. Macroblock_address của macro bên trái phía trên là zero.

Previous_macroblock_address là một biến xác định vị trí tuyệt đối của macro không khóa cuối cùng không được bỏ qua (xem mục 7.6.6. cho xác định các macroblock đã bị bỏ qua) ngoại trừ khi bắt đầu của một látcắt. Vào đầu của một slice previous_macroblock_address được đặt lại như sau:

previous_macroblock_address = (mb_row * mb_width) -1

Các horizontal_spatial_position trong các đơn vị macroblock của một macroblock trong hình (mb_column) có thể được tính từ macroblock_address như sau:

mb_column = macroblock_address% mb_widthnơi mà chiều rộng mb là số lượng macroblocks trong một hàng của ảnh.

Trừ khi bắt đầu một lát cắt, nếu giá trị của macroblock_address phục hồi từ macroblock_address_increment và mã macroblock_escape (nếu có) khác với address_macroblock trước đó bởi nhiều hơn một số macroblocks đã được bỏ qua. Đó là một yêu cầu như sau:

• Không có các macroblocks bị bỏ qua trong các ảnh l ngoại trừ khi một trong hai

- picture_spatial_scalable_extension() theo sau picture_header() của ảnhhiện tại; hoặc là

- sequence_scalable_extension() có trong dòng bit và scalable_mode = "khả năng mở rộng SNR".

• Trong ảnh B, sẽ không có các macroblok được bỏ qua ngay sau một macroblock, trong đó macroblock_intra là một.

Cần lưu ý rằng cú pháp không cho phép bỏ qua macroblock đầu tiên và cuối cùng của một lát cắt.

6.3.17.1. Chế độ Macroblockmacroblock_type - Chỉ số mã hóa chiều dài biến thể cho biết phương pháp mã hoá và nội dung của macroblock theo Bảng B.2 đến B.8. được chọn bởi picture_coding_type và sealable_mode.

79

TCVN xxxx : 2017

macroblock_quant - Lấy từ macroblock_type theo bảng B.2 đến B.8. Điều này được thiết lập là 1 để chỉ ra rằng quantiser_scale_code có mặt trong dòng bit.

macroblock_motion_forward - Lấy từ macroblock_type theo bảng B.2 đến B.8. Cờ này tác động đến cú pháp dòng bit và được sử dụng bởi quá trình giải mã.

macroblock_motion_backward - Lấy từ macroblock_type theo Bảng B.2 đến B.8. Cờ này tác động đến cú pháp dòng bit và được sử dụng bởi quá trình giải mã.

macroblock_type_pattern - Lấy từ macroblock_type theo Bảng B.2 đến B.8. Điều này được thiết lập là 1 để cho biết rằng coded_block_pattern () hiện diện trong dòng bit.

macroblock_intra - Lấy từ macroblock_type theo bảng B.2 đến B.8. Cờ này tác động đến cú pháp dòng bit và được sử dụng bởi quá trình giải mã.

spatial_temporal_weight_code_flag - Lấy từ macroblock_type. Điều này cho biết liệu spatial_temporal_weight_code có trong dòng bit hay không.

Khi spatial_temporal_weight_code là '0' (chỉ ra rằng spatial_temporal_weight_code không có trong dòng bit) spatial_temporal_weight_class được lấy từ bảng B.5 đến B.7. Khi spatial_temporal_weight_code_flag là ‘1’ spatial_temporal_weight_class được lấy ra từ phía trước Bảng 7-20.

spatial_temporal_weight_code - Đây là mã hai bit được chỉ thị,trong khả năng mở rộng theo không gian, làm thế nào để dự đoán theo không gian và theo thời gian sẽ được kết hợp để tạo thành dự đoán cho macroblock. Một mô tả đầy đủ về làm thế nào để hình thành dự đoán khả năng mở rộng theo không gian được cho biết trong mục 7.7.

frame_motion_type - Đây là mã hai bit cho biết kiểudự đoán macroblock, được định nghĩa trong Bảng 6-17.

Bảng 6-17 - Ý nghĩa của frame_motion_fype

Mã Spatial_temporal_weight_class

Kiểu đoán trước

motion_vector_count

Mv_format dmv

00 Reserved01 0, 1 Field-based 2 Trường 001 2, 3 Field-based 1 Trường 010 0, 1, 2, 3 Frame-based 1 Khung 011 0, 2, 3 Dual-Prime 1 Trường 1

Nếu frame_pred_frame_dct bằng 1 thì frame_motion_type sẽ bị bỏ qua khỏi dòng bit. Trong trường hợp này việc giải mã vector chuyển động và sự hình thành dự đoán sẽ được thực hiện như thể frame_motion_type đã chỉ ra "Dự đoán khung cơ sở".

Trong trường hợp Macroblocks trong (trong một khung ảnh) khi concealment_motion_vectors bằng 1 frame_motion_type không có trong dòng bit. Trong trường hợp này, chuyển động mã vạch và cập nhật các dự đoán vector dự đoán sẽ được thực hiện như thể kiểu chuyển động của khung đã cho thấy "Khung – cơ sở " (xem mục 7.6.3.9).

field_motion_type - Đây là mã hai bit cho biết loại dự đoán macroblock, được xác định trong Bảng 6-18.

Bảng 6-18 - Ý nghĩa của field_motion_type

Mã Spatial_temporal_weight_class

Kiểu đoán trước

motion_vector_count Mv_format dmv

00 Dự phòng01 0, 1 Field-based 1 Trường 0

80

TCVN xxxx : 2017

10 0, 1 16X8 MC 2 Trường 011 0 Dual-Prime 1 Trường 1

Trong trường hợp Macroblocks trong (trong một trường ảnh) khi che giấu motion_vectors bằng 1 field_motion_type không có trong dòng bit. Trong trường hợp này, motion_vector giải mã và cập nhật các dự đoán của motion_vector sẽ được thực hiện như thể field_motion_type đã chỉ ra " trường– cơ sở " (xem 7.6.3.9).

dct_type - Đây là một cờ chỉ ra cho dù các macroblock là khung DCT mã hoặc trường DOT được mã hoá. Nếu nó được đặt là '1', macroblock là trường DCT đã được mã hoá,

Trong trường hợp dct_type không có trong dòng bit, thì giá trị của dct_type (được sử dụng trong phần còn lại của quá trình giải mã) sẽ được lấy ra như trong Bảng 6-19.

Bảng 6-19 - Giá trị của dct_type nếu dct_type không có trong dòng bit

Điều kiện dct_type

picture_structure == "field" Không sử dụng vì không có sự khác biệt khung/trường trong một trường ảnh.

frame _pred_frame_dct == 1 0 ("khung")

!(macroblock_intra || macroblock_pattem)Không sử dụng - Macroblock không được mã hoá

macroblock bị bỏ qua Không sử dụng - Macroblock không được mã hoá

6.3.17.2.Vectơ chuyển độngMotion_vector_count được lấy từ dạng chuyển động trường hoặc kiểu chuyển động của khung như được chỉ ra trong các bảng 6-17 và 6-18.

Mv_format được lấy từ kiểu chuyển động trường hoặc kiểu chuyển động của khung như được chỉ ra trong các bảng 6-17 và 6-18. Mv_format cho biết vector chuyển động là một trường chuyển động trường hoặc một vector chuyển động khung. mv_format được sử dụng trong cú pháp của các vec tơ chuyển động và trong quá trình dự đoán vector chuyển động.

dmv có nguồn gốc từ field_motion_type hoặc frame_motion_type như được chỉ ra trong các bảng 6-17 và 6-18.

motion_vertical_field_select [r][s] -Cờ này chỉ ra trường tham chiếu nào sẽ được sử dụng để tạo thành dự đoán. Nếu motion_vertical_field_select [r][s] bằng không, thì trường tham chiếu đầu sẽ được sử dụng, nếu nó là một thì trường tham chiếu dưới cùng sẽ được sử dụng. (Xem bảng 7-7 về ý nghĩa của các chỉ số r và s)

6.3.17.3 Vectơ chuyển độngmotion_code[r][s][t] - Đây là mã chiều dài thay đổi, như được định nghĩa trong Bảng B.10, được sử dụng trong giải mã vector chuyển động như mô tả trong mục 7.6.3.1 (Xem Bảng 7-7 về ý nghĩa của chỉ số r, s và t)

motion_residual[r][s][t] - Đây là một số nguyên được sử dụng trong giải mã vector chuyển động như mô tả trong 7.6.3.1. (Xem Bảng 7-7 cho ý nghĩa của các chỉ số r, s và t) Số lượng bit trong dòng bit cho motion_residual[r][s][t], r_size, được lấy từ f_codec[s][t] như sau:

r_size = f_code[s][t] - 1Chú ý - Số bit cho cả hai motion_residual[0][s][t], và motion_residual[1][s][t], được biểu thị bằng

81

TCVN xxxx : 2017

f_code[s][t].

Dm_vector(t) - Đây là mã chiều dài thay đổi, như được định nghĩa trong Bảng B.11, được sử dụng trong giải mã vector chuyển động như mô tả trong mục 7.6.3.6. (Xem Bảng 7-7 về ý nghĩa của chỉ số t)

6.3.17.4.Mẫu khối mã hóacoded_block_pattern_420 - Mã chiều dài thay đổi được sử dụng để lấy được biến cbp theo Bảng B.9.

coded_block_pattern_1coded_block_pattern_2 - Đối với dữ liệu 4:2:2 và 4:4:4, mẫu khối được mở rộng bằng cách thêm mã nhị phân hai bit hoặc sáu bit cố định, coded_block_pattern_1 hoặc coded_block_ pattern_2. Sau đó, pattern_code[i] được sinh ra bằng cách sử dụng các lệnh sau:

Nếu pattern_code [i] bằng 1, i = 0 đến (block_count = =1). sau đó khối số i được xác định trong hình 6-10, 6-11 và 6-12 được chứa trong macroblock này.

Số "block_count" xác định số khối trong macroblock được lấy từ định dạng sắc màu như trong Bảng 6-20.

Bảng 6-20 - block_count như một hàm của chroma_formatchroma_format Block_count

4:2:0 64:2:2 84:4:4 12

6.3.18. Khối

Các ngữ nghĩa của khối() được mô tả trong điều khoản 7.

6.3.19. Phần mở rộng các tham số của máy ảnh

Camera_id - Số trong camera_id xác định máy ảnh.

height_of_image_device - Đây là một số nguyên không dấu 22bit xác định độ cao của thiết bị ảnh. Giá trị của nó được đo với độ phân giải 0.001mm và có phạm vi từ 0 đến 4 194.303 mm.

focal_length - Đây là một số nguyên 22 bit không dấu chỉ rõ độ dài tiêu cự. Giá trị của nó

82

TCVN xxxx : 2017

được đo bằng độ phân giải 0.001mm và có phạm vi từ 0 đến 4 194.303 mm.

f_number - Đây là một số nguyên không dấu 22 bit mà cụ thể F-number. F-number được xác định bởi (focal_length)/(khẩu độ ống kính hiệu dụng). Giá trị của nó được đo bằng độ phân giải 0,001 và có khoảng từ 0 đến 4 194.303.

vertieal_angle_of_view - Đây là một số nguyên không dấu 22 bit xác định góc thẳng đứng của trường xem được xác định giữa các cạnh trên và dưới của thiết bị ảnh. Giá trị của nó được đo với độ phân giải 0.0001 độ và có phạm vi từ 0 đến 180 độ.

camera_position_x_upper, camera_position_y_upper. camera_position_z_upper - Những từ này cấu thành 16 bit quan trọng nhất của vị trí máy ảnh x, vị trí máy ảnh y và vị trí máy ảnh z tương ứng.

camera_position_x_lower, camera_position_y_lower, camera_position_z_lower - Những từ này tạo thành 16 bit ít quan trọng nhất của camera_position_x, camera_position_yvà camera_position_z tương ứng.

camera_position_x, camera_position_y và camera_position_z - Một bộ các giá trị này cụ thể vị trí của điểm lọt sáng của máy ảnh trong một hệ thống tọa độ thế giới do người sử dụng quy định. Mỗi giá trị này phải được đo với độ phân giải 0,001 mm và có dải + 2 147 483,647 mm đến -2 147 483,648 mm. Camera_position_x là một số nguyên có dấu (số bổ sung hai) 32 bit, 16 bit ít quan trọng nhất được định nghĩa trong camera_position_x_lower, 16 bit quan trọng nhất được định nghĩa trong camera_position_x_upper. Camera_position_y là một số nguyên 32 bit đã ký kết (hai bổ sung), 16 bit ít quan trọng nhất được xác định ở vị trí camera y thấp hơn, 16 bit quan trọng nhất được định nghĩa trong camera_position_y_upper. Camera_position_z là một số nguyên 32 bit có dấu (hai bổ sung), 16 bit ít quan trọng nhất được định nghĩa trong camera_position_z_lower, 16 bit quan trọng nhất được định nghĩa trong camera_position_z_upper.

camera_direction_x, camera_direction_y, camera_direction_z - Một bộ các giá trị này chỉ định hướng của máy ảnh. Hướng của máy ảnh được xác định bằng cách sử dụng vector từ điểm lọt sáng đến một điểm nằm phía trước máy ảnh và nằm trên trục quang của máy ảnh. Mỗi giá trị này là số nguyên 22 bit có dấu (hai bổ sung) và có dải từ +2 097 151 đến -2 097 152.

image_plane_vertical_x, image_plane_vertical_y, image_plane_vertical_z - Một bộ các giá trị này chỉ định hướng trên của máy ảnh. Hướng phía trên của máy ảnh được xác định bằng cách sử dụng vector nằm song song với cạnh bên của thiết bị ảnh và từ cạnh đáy đến cạnh trên cùng. Mỗi các giá trị này là số nguyên 22 bit có dấu (hai bổ sung) và có dải từ +2 097 151 đến -2 097 152.

Hình 6-19 - Giải thích các thuật ngữ này theo ảnh.

83

TCVN xxxx : 2017

6.3.20. Mở rộng ITU-T

Việc sử dụng phần mở rộng này được định nghĩa trong Phụ lục A của ITU-T H.320.

6.3.21. Dữ liệu mô tả nội dung

Data_type_upper, data_type - hai giá trị số nguyên không dấu 8 bit chứa các bit quan trọng nhất và ít có ý nghĩa nhất tương ứng với giá trị của dữ liệu số nguyên không dấu data_type 16 bit định nghĩa kiểu dữ liệu mô tả nội dung. Các ngữ nghĩa của data_type được xác định trong bảng 6-21.

Bảng 6-21 - giá trị data_type

Giá trị Ý nghĩa

0000 0000 0000 0000 Dự phòng0000 0000 0000 0001 Đệm các bytes0000 0000 0000 0010 Ghi mã thời gian0000 0000 0000 0011 Các tham số pan-scan bổ sung0000 0000 0000 0100 Cửa sổ khu vực hoạt động0000 0000 0000 0101 Chiều dài ảnh được mã hóa0000 0000 0000 0110 Dự phòng

... Dự phòng1111 1111 1111 1111 Dự phòng

data_length - Một số nguyên không dấu 8 bit xác định số lượng dữ liệu còn lại để thực

84

TCVN xxxx : 2017

hiện trong phần còn lại của cấu trúc dữ liệu mô tả nội dung, thể hiện bằng đơn vị 9 bit. Số bit dữ liệu đi theo trong phần còn lại của cấu trúc dữ liệu mô tả nội dung sẽ bằng data_length * 9.

reserved_content_description_data - Số nguyên không dấu 8 bit được bảo vệ. Bộ giải mã gặp dữ liệu mô tả nội dung dành riêng trong dòng bit sẽ bỏ qua nó (tức là xóa khỏi dòng bit và loại bỏ). Một dòng bit phù hợp với tiêu chuẩn kỹ thuậtnày sẽ không có thành phần cú pháp như vậy.

Trong một trường hợp mà một bộ giải mã gặp một số nguyên không dấu data_type được mô tả như là "dự phòng" trong Bảng 6-21, bộ giải mã sẽ loại bỏ các cặp tiếp theo của marker_bit và reserved_content_description_data mà theo data_length trong dòng bit. Số cặp tương ứng phải bằng dải dữ liệu. Yêu cầu này cho phép định nghĩa tương lai của phần mở rộng tương thích với Đtiêu chuẩn kỹ thuậtnày.

reserved_bit - Số nguyên không dấu 1 bit dự phòng. Nó sẽ bằng '0' trong dòng dòng bit phù hợp với tiêu chuẩn kỹ thuậtnày. Giá trị ‘1’ được dành cho tương lai tương thích với ITU-T ISO/IEC. Bộ giải mã phù hợp với tiêu chuẩn kỹ thuậtnày sẽ cho phép một giá trị '0' hoặc ‘1’ cho bit dự phòng.

6.3.21.1. Các byte đệmpadding_byte - Một chuỗi 8 bit, bằng '0000 0000'. Tất cả các giá trị khác đều bị cấm.Chú ý - Mục đích của byte đệm là lo cho phép bao gồm một số byte dữ liệu được bao gồm trong tính toán VBV.

6.3.21.2. Ghi mã thời gianGhi mã thời gian mô tả thời gian bắt nguồn hoặc thời gian tạo ra của các trường hoặc khung nội dung.

Nó chứa các mốc thời gian tuyệt đối cho khung hoặc các khung liên quan. Chỉ có một ghi mã thời gian cho mỗi ảnh sẽ có mặt trong dòng bit. Mã thời gian này sẽ không được ưu tiên hơn bất kỳ mã thời gian nào được chỉ định để trình bày hoặc giải mã ở cấp đa hệ thống, ví dụ như mốc thời gian trình bày hoặc mốc thời gian giải mã được định nghĩa trong ITU-T H.222.0 ISO/IEC 13818-1 [6].

timecode_type - Một số nguyên 2 bit cho biết số mốc thời gian liên quan đến ảnh này như được định nghĩa trong Bảng 6-22. Các giá trị '00', '10’and '11' chỉ được sử dụng khi cấu trúc ảnh bằng 'khung Hình ảnh'. Giá trị '00' chỉ ra rằng hai trường tạo nên khung có cùng thời gian chụp. Khi timecode_type bằng '11', mốc thời gian đầu tiên liên quan đến trường đầu tiên của khung và mốc thời gian thứ hai liên quan đến trường thứ hai của khung.

Bảng 6-22 - timecode_type_valuesGiá trị Ý nghĩa

00 Một mốc thời gian cho khung01 Một mốc thời gian cho trường đầu tiên hoặc duy nhất

10 Một mốc thời gian cho trường thứ hai

11 Hai mốc thời gian, một cho mỗi hai trường

Counting_type - Một số nguyên 3 bit chỉ ra phương pháp được sử dụng để bù đắp thông số n khung của khung thời gian hoặc các mốc thời gian chụp trường để giảm tích lũy trôi trong các tham số còn lại của mỗi mốc thời gian.

85

TCVN xxxx : 2017

Bảng 6-23 - counting_type_valuesGiá trị Ý nghĩa

000 Tham số nframes không được sử dụng

001 Không bỏ giá trị đếm nframes

010 Giảm các giá trị zero của nframes

011 Bỏ các giá trị nframes tối đa cho mỗi nframes_count100 Bỏ hai giá trị thấp nhất (giá trị 0 và 1) khi units_of_seconds và

tens_of_seconds bằng 0 và các units_of_ minutes không bằng không101 Bỏ các giá trị đếm nframes không xác định110 Bỏ số lượng không xác định của các giá trị đếm nframes không xác định111 Dự phòng

nframes_conversion_code - Một số nguyên không dấu 1 bit chỉ ra hệ số chuyển đổi được sử dụng để xác định khoảng thời gian được chỉ ra bởi các tham số nframes của mỗi khung thời gian hoặc trường bắt giữ dấu thời gian. Các yếu tố quy định là 1000 + nframes_conversion_code.clock_divisor - Một số nguyên không dấu 7 bit chứa số đơn vị của đồng hồ hệ thống 27 MHz được sử dụng để tạo ra mốc thời gian tương ứng cho mỗi khung thời gian hoặc trường chụp mốc thời gian.

nframes_multiplier_upper, nframes_multiplier_lower - Các bit đáng chú ý và ít nhất có dấu hiệu tương ứng của nframes_multiplier.

nframes_multiplier - Hệ số số nguyên không dấu được sử dụng để tạo ra mốc thời gian tương ứng cho mỗi khung thời gian hoặc trường chụp mốc thời gian như được chỉ định bởi nframes_muiltiplier_upper và nframcs_multiplier_lower.6.3.21.2.1. Mốc thời gian ghi lại khung hoặc trườngnframes- Một số nguyên không dấu 8 bit chứa số lần gia tăng thời gian để thêm vào việc lấy mốc thời gian tương đương. Giá trị của nframes không được lớn hơn giá trị của max_nframes như xuất phát từ công thức sau:

Ở đây "/" cho biết toán tử phân chia được định nghĩa trong 4.1.

time_discontinuity - Một cờ 1 bit cho biết có sự gián đoạn về thời gian hay thời gian giữa mốc thời gian trước và mốc thời gian hiện tại đã xảy ra. Nếu đặt là '0', sự khác biệt về thời gian có thể được tính giữa các mốc thời gian hiện tại và trước đó là thời gian hiển thị lý tưởng của khung hoặc trường trước đó. Nếu đặt là '1', sự khác biệt về thời gian có thể được tính giữa các mốc thời gian hiện tại và trước đó không có ý nghĩa được định nghĩa. Nếu chỉnh sửa xảy ra mà kết quả trong thời gian hoặc gốc thời gian không liên tục hoặc nếu trường trước đó hoặc khung thời gian không có sẵn, bit thời gian gián đoạn sẽ được đặt thành '1'.

prior_count_dropped - Một cờ 1 bit cho biết liệu đếm một hoặc nhiều giá trị của tham số nframes đã được bỏ để giảm tích lũy trôi trong các tham số còn lại của dấu thời gian. Sẽ bằng 0 nếu counting_type là '001'. Sẽ bằng 0 nếu counting_type là '010' và nframes không bằng 1. Sẽ bằng 0 nếu counting_type là '011' và nframes không bằng 0. Sẽ bằng 0 nếu counting_type là '100' và nframes không bằng 2 .

time_offset_part_a - Một số nguyên 6 bit có chứa các bit quan trọng nhất của bù thời

86

TCVN xxxx : 2017

gian.

time_offset_part_b - Một số nguyên không dấu 8 bit chứa bit thứ hai quan trọng nhất của bù thời gian.

time_offset_part_c - Một số nguyên không dấu 8 bit chứa bit quan trọng thứ ba của bù thời gian (time_offset).

time_offset_part_d - Một số nguyên không dấu 8 bit chứa ít bit quan trọng nhất của bù thời gian.

time_offset - Một số nguyên dương 30 bit có dấu là số chu kỳ đồng hồ (trong chu kỳ đồng hồ ban đầu của hệ thống 27 MHz hoặc với một tần số đồng hồ được sửa đổi bởi đồng hồ) được bù từ thời gian được xác định bởi các tham số khác của khung hoặc trường mốc thời gian để xác định mốc thời gian tương đương cho trường hợp hiện tại hoặc khung đã được chụp. Khi counting_type là 0, giá trị của time_offset sẽ được hạn chế bởi bộ mã hóa ít hơn 27 000 000 về cường độ.

units_of_seconds - Một số nguyên không dấu 4 bit được sử dụng để tính mốc thời gian tương đương. Nó đại diện cho phần của mốc thời gian của trường hoặc khung này được đo bằng giây theo modulo 10. Bảng 6-24 định nghĩa phạm vi giá trị cho phép.

Bảng 6-24 - giá trị của units_of_secondsGiá trị Ý nghĩa

0000-1001 số giây modulo 101010-1111 Cấm

tens_of seconds - Một số nguyên không dấu 4 bit được sử dụng để tính mốc thời gian tương đương. Nó đại diện cho phần của mốc thời gian của trường hoặc khung này được đo bằng giây chia cho 10. Bảng 6-25 định nghĩa phạm vi giá trị cho phép.

Bảng 6-25 - tens_of_seconds_values

Giá trị Ý nghĩa0000-0101 Số giây / 100110-1111 Cấm

units_of_minutes - Một số nguyên 4bit được sử dụng để tính mốc thời gian tương đương. Nó đại diện cho phần của mốc thời gian của trường hoặc khung này được đo bằng phút modulo 10. Bảng 6-26 xác định phạm vi giá trị cho phép.

Bảng 6-26 - giá trị units_of_minutesGiá trị Ý nghĩa

0000-1001 Số phút modulo 101010-1111 Cấm

tens_of_minutes - Một số nguyên 4 bit được sử dụng để tính mốc thời gian tương đương. Nó đại diện cho phần mốc thời gian của trường hoặc khung này được tính bằng giây chia cho 10. Bảng 6-27 định nghĩa phạm vi giá trị cho phép.

Bảng 6-27 - giá trị tens_of_minutes

Giá trị Ý nghĩa0000-0101 Số giây / 100110-1111 Cấm

87

TCVN xxxx : 2017

units_of_hours - Một số nguyên 4 bit được sử dụng để tính mốc thời gian tương đương. Nó đại diện cho phần mốc thời gian của trường hoặc khung này được đo bằng giờ modulo 10. Bảng 6-28 xác định phạm vi giá trị cho phép. Nó sẽ không vượt quá giá trị "3" nếu tens_of_hours bằng "2".

Bảng 6-28 - giá trị của units_of_hours

Giá trị Ý nghĩa0000-1001 số giờ modulo 101010-1111 bị cấm

tens_of_hours - Một số nguyên 4 bit được sử dụng để tính mốc thời gian tương đương. Trường này đại diện cho phần mốc thời gian của trường hoặc khung này được tính bằng giờ chia cho 10. Bảng 6-29 xác định phạm vi giá trị cho phép.

Bảng 6-29 - giá trị tens_of_hours

Giá trị Ý nghĩa0000-0010 Số giờ / 100011-1 111 bị cấm

Khi counting_type là 0, mốc thời gian tương ứng được biểu diễn trong chu kỳ đồng hồ hệ thống 27 MHz được xác định theo công thức sau:

equivalent_timestamp = (60 * (60 * (units of hours + 10 * tens of hours) +(units_of_minutes + 10 * tens_of_minutes)) + units of scconds + 10 * tens_of_scconds) *

27 000 000 + time_offsetKhi counting_type là 0, các giá trị của các tham số trong mốc thời gian bị hạn chế bởi bộ mã hóa sao cho số tương đương không được nhỏ hơn 0 và không được vượt quá 2 332 799 999 999.

Khi counting_type không phải là 0, mốc thời gian tương ứng được biểu diễn trong chu kỳ đồng hồ hệ thống 27 MHz được xác định theo công thức sau:

equivalent_timestamp = (60 * (60 * (units_of_hours + 10 * tens_of_hours) +(units_of_minutes + 10 * tens_of_minutes)) +

units_of_scconds + 10 * tens_of_seconds) * 27 000 000 +(nframes * (nframes_multiplier * (1000 + nframes_conversion_code)) +

Time_offset) * clock_divisorKhi counting_type không phải là 0, các giá trị của các tham số trong mã thời gian sẽ bị hạn chế bởi bộ mã hóa sao cho equivalent_timestamp không được nhỏ hơn 0.

Hai ident_timestamp giống hệt nhau được tính từ khung liên tiếp (hoặc các trường) mà không có sự can thiệp. time_discontinuity chỉ ra rằng cả hai khung (hoặc trường) đã được chụp hoặc tạo ra cùng một lúc trong thời gian.

6.3.21.3. Các tham số Quay- quét (pan-scan) bổ sungCác tham số pan-scan bổ sung cho phép vận chuyển thông tin pan-scan cho nhiều loại hiển thị. Ví dụ: nếu thông tin được mã hóa cho quá trình quét pan-scan trong tiêu đề chuỗi, phần mở rộng hiển thị trình tự và phần mở rộng hiển thị ảnh được sử dụng để xác định các thông số cần thiết để đại diện trên màn hình tỉ lệ 4:3, các tham số pan-scan có thể xác định các thông số cần thiết để hiển thị trên màn hình tỉ lệ 16:9.

aspect_ratio_information - Một giá trị số nguyên 4 bit được định nghĩa trong 6.3.3 (tiêu

88

TCVN xxxx : 2017

đề chuỗi). Một giá trị cho thông tin tỷ lệ co bằng với giá trị được xác định trong tiêu đề chuỗi() Sẽ không xảy ra.

display_size_present - Một cờ 1 bit, khi được thiết lập là '1', cho thấy sự hiện diện của display_ horizontal_size_upper, display_horizontal_size_lower, display_vertical_size_upper và display_vertical_size_lower. Khi đặt thành '0', các giá trị trước đó của display_horizontal_size và display_vertical_size tương ứng với giá trị của aspect_ratio_infonnation sẽ được sử dụng. Đối với một tỷ lệ khía cạnh cụ thể, trường này phải được đặt là ‘1’ trong tiêu đề ảnh đầu tiên sau bất kỳ sequence_header() nào. Sau một sequencc_header(), giá trị của display_horizontal_size và hiển thị kích thước dọc sẽ là giá trị được xác định trong sequence_display_extension().display_horizontal_size_upper - 6 bit quan trọng nhất của display_horizontal_size.

display_horizontal_size_lower -8 bit ít quan trọng nhất của display_horizontal_size.display_horizontal_size - Giá trị số nguyên 14 bit được xác định trong mục 6.3.6 (Mở rộng hiển thị chuỗi). Đối với bất kỳ giá trị cụ thể nào của thông tin tỷ lệ co, giá trị của tham số này sẽ vẫn giữ nguyên cho chuỗi.

display_verlical_size_upper -6 bit quan trọng nhất của kích thước chiều dọc hiển thị.

display _vertical_size_lower - 8 bit nhỏ nhất có kích thước hiển thị dọc.

display_verlical_size - Giá trị số nguyên 14 bit được định nghĩa trong mục 6.3.6 (Mở rộng hiển thị chuỗi). Đối với bất kỳ giá trị cụ thể nào của aspect_ratio_infonnation, giá trị của tham số này sẽ vẫn giữ nguyên cho chuỗi.

frame_centre_horizontal_ofrsel_upper, frame_centre_horizontal_offset_lower - 8 bit quan trọng nhất và ít có ý nghĩa nhất, tương ứng, của frame_centrer_horizontal_oflset.frame_centrer_horizontal_oflset.- Số nguyên có dấu 16 bit được định nghĩa trong mục 6.3.12 (phần mở rộng hiển thị hình ảnh).

frame_centrer_vertical_offset_upper, frame_centrer_vertical_offset_lower - 8 bit quan trọng nhất và ít có ý nghĩa nhất, tương ứng, của frame_centrer_vertical_offset.frame_centre_vertical_oflfset - Số nguyên ký số 16 bit được định nghĩa trong mục 6.3.12 (phần mở rộng hiển thị hình ảnh). Sau một sequence_header(), giá trị 0 sẽ được sử dụng cho tất cả các hiệu ứng trung tâm khung cho đến khi một picture_display_extension() xác định các giá trị khác không.

number_of_frame_centre_offsets - Một số nguyên được định nghĩa trong mục 6.3.12. Sau một tiêu đề chuỗi, giá trị 0 sẽ được sử dụng cho tất cả các hiệu ứng trung tâm khung cho đến khi phần mở rộng hiển thị ảnh xác định các giá trị khác không.

6.3.21.4. Cửa sổ vùng hoạt độngCửa sổ vùng đang hoạt động chứa các số nguyên xác định hình chữ nhật trong khung dựng lại được dự định hiển thị. Cửa sổ này không được lớn hơn hình chữ nhật được xác định bởi horizontal_size và vertical_size được định nghĩa trong mục 6.3.3. Không có nhiều hơn một cửa sổ vùng hoạt động cho mỗi ảnh sẽ có mặt trong dòng bit. Khi khung được mã hoá dưới dạng hai trường ảnh, cửa sổ vùng hoạt động nằm không có trong trường ảnh thứ hai.

top_left_x_upper. lop_leff_x_lower - 8 bit quan trọng nhất và ít quan trọng nhất, tương ứng, của đỉnh trái x.

top_left_x - Một số nguyên 16 bit xác định số mẫu trong một đường biểu diễn thành phần độ chói trong khung tái tạo, cùng với top_left_y, cụ thể là góc trên cùng bên trái của hình chữ nhật active_region_window.

89

TCVN xxxx : 2017

top_left_y_upper, top_left_y_lower - 8 bit quan trọng nhất và ít có ý nghĩa nhất, tương ứng, của top_left_y.top_left_v - Một số nguyên 16 bit xác định số dòng cho thành phần độ chói trong khung được dựng lại mà cùng với top_left_x. chỉ định người trên bên trái của hình chữ nhật active_region_window.

aclive_region_horizontal_size_upper, active_region_horizonfal_size_lower - 8 bit quan trọng nhất và ít có ý nghĩa nhất, tương ứng, kích thước ngang của vùng hoạt động.

active_region_horizontal_size - Một số nguyên 16 bit, cùng với active_region_vertical_size, xác định một hình chữ nhật nằm trong thành phần độ chói có thể được coi là khu vực hoạt động. Nếu hình chữ nhật này nhỏ hơn kích thước khung mã hoá, thì quá trình hiển thị chỉ nên hiển thị phần đó của khung được mã hóa. Giá trị này không được lớn hơn kích thước ngang của khung được mã hóa. Giá trị'0 'chỉ ra rằng kích thước là không rõ.

active_region_vertical_size_upper, actlve_region_ vertical_size_lower -8 bit quan trọng nhất và ít có ý nghĩa nhất, tương ứng, của active_region_vertical_size.

active_region_vertical_size – Xem active_region_horizontal_size. Giá trị này không được lớn hơn vertical_size của khung được mã hóa. Giá trị'0' chỉ ra rằng kích thước là không rõ.

Trong trường hợp một khung nhất định không có cửa sổ vùng hoạt động hiện diện trong dòng bit, thì cửa sổ vùng hoạt động đã được giải mã gần nhất sẽ được sử dụng. Sau một tiêu đề trình tự, tham số cửa sổ vùng hoạt động tham số Kích thước ngang vùng hoạt động và kích thước dọc vùng hoạt động sẽ được đặt lại là ‘1’ giá trị kích thước ngang và chiều dọc được xác định trong tiêu đề của trình tự, và phía trên cùng bên trái x và trên cùng bên trái y sẽ là đặt lại là 0.

6.3.21.5.Chiều dài ảnh mã hoá Độ dài ảnh được mã hoá xác định số byte được bao gồm từ byte đầu tiên ngay sau slice_start_code đầu tiên của ảnh đến byte đầu tiên của mã tiền tố bắt đầu ngay sau macroblock cuối cùng của ảnh. Không được nhiều hơn một chiều dài ảnh được mã hoá cho mỗi ảnh sẽ có mặt trong dòng bit.

picture_byte_count_part_a, piclure_byte_count_part_b, picture_byte_count_part_c. picture_byte_count_part_d -8 bit quan trọng nhất, quan trọng thứ hai, quan trọng thứ ba và ít có ý nghĩa nhất của picture_byte_count.picture_byte_count - Một số nguyên không dấu 32 bit cho biết số byte bắt đầu với byte đầu tiên của slice_start_code đầu tiên của ảnh hiện tại và kết thúc bằng byte trước mã tiền tố bắt đầu ngay sau macroblock cuối cùng của ảnh đó. Giá trị '0' được cho phép. Giá trị '0' cho biết độ dài của ảnh không xác định.

7. Quá trình giải mã video

Mục này cụ thể hóa quá trình giải mã mà bộ giải mã phải thực hiện để tái tạo các khung từ dòng bit được mã hoá.

Chức năng IDCT được sử dụng trong quá trình giải mã để tính toán f[y][x] có thể sử dụng bất kỳ phương pháp ước lượng tích phân số IDCT số nguyên số toán học được xác định trong Phụ lục A, với điều kiện xấp xỉ phù hợp với các yêu cầu chính xác được nêu trong Phụ lục A.

Trong mục 7.1 đến mục 7.6, quy trình giải mã đơn giản nhất được chỉ định, trong đó không sử dụng các tính năng khả năng mở rộng. Các mục 7.7 đến mục 7.11 chỉ định quá

90

TCVN xxxx : 2017

trình giải mã khi mở rộng được sử dụng. Mục 7.12 xác định đầu ra của quá trình giải mã.

Hình 7-1 là một sơ đồ của quá trình giải mã video mà không có bất kỳ khả năng mở rộng. Sơ đồ được đơn giản hóa cho rõ ràng.Chú ý - Trong suốt mô tả này, các mảng được biểu diễn dưới tên [q][p] trong đó 'q' là chỉ số trong chiều dọc và 'p' chỉ số theo chiều ngang

Hình 7-1 - Quy trình giải mã video đơn giản

7.1. Các cấu trúc cú pháp cao hơn

Các tham số và cờ khác nhau trong dòng bit cho macroblock() và tất cả các cấu trúc cú pháp trên macroblock() sẽ được diễn giải như được chỉ ra trong phần 6. Nhiều trong số các tham số và cờ ảnh hưởng đến quá trình giải mã được mô tả trong các mục dưới đây. Một khi tất cả các macroblocks trong một ảnh đã được xử lý, toàn bộ ảnh sẽ được tái tạo.

Các dãy khung tái tạo sẽ được kết hợp thành cặp để tạo khung tái tạo. (Xem "picture_structure" trong mục 6.3.10.)

Các dãy khung tái tạo sẽ được sắp xếp lại theo mô tả trong mục 6.1.1.11.

Nếu progressive_sequence == 1 khung tái tạo sẽ được xuất ra từ quá trình giải mã ở các khoảng thời gian đều đặn của khoảng thời gian khung như minh họa trong hình 7-19.

Nếu progressive_sequence == 0, các khung tái tạo sẽ được chia thành một dãy các trường sẽ được xuất ra từ quá trình giải mã theo khoảng thời gian đều đặn của khoảng thời gian trường, như thể hiện trong hình 7-20. Trong trường hợp một khung hình có repeat_first_field == 1 trường đầu tiên của khung sẽ được lặp lại sau trường thứ hai. (Xem "repeat_first_field" trong mục 6.3.10.)

7.2. Giải mã độ dài thay đổi

Mục 7.2.1 xác định quá trình giải mã được sử dụng cho hệ số DC (n = 0) trong một khối mã trong, (n là chỉ số của hệ số trong trình tự quét zigzag thích hợp), mục 7.2.2 chi tiết quá trình giải mã cho tất cả các hệ số khác, các hệ số AC (n> 0) và các hệ số DC trong các khối không mã hoá trong.

Cho cc biểu thị thành phần màu. Nó liên quan đến số khối được chỉ ra trong Bảng 7-1. Như vậy, cc là 0 đối với thành phần Y, một cho thành phần Cb và hai cho thành phần Cr.

Bảng 7-1 - Định nghĩa cc, chỉ số thành phần màu sắc

91

TCVN xxxx : 2017

ccSố khối 4:2:0 4:2:2 4:4:4

0 0 0 01 0 0 02 0 0 03 0 0 04 1 1 15 2 2 26 1 17 2 28 19 210 111 2

7.2.1. Các hệ số DC trong khối bên trong

Các hệ số DC trong khối trong macroblocks bên trong được mã hoá dưới dạng mã chiều dài thay đổi có nghĩa là det_dc_size như được định nghĩa trong các bảng B.12 và B.13. Nếu dct_dc_size không bằng số không, sau đó sẽ được theo sau bởi một mã chiều dài cố định, dct_dc_differcntial, của bitdct_dc_size. Một giá trị khác biệt được thu hồi lần đầu tiên từ dữ liệu được mã hóa được thêm vào một dự đoán để thu hồi hệ số giải mã cuối cùng.

Nếu cc là 0 thì bảng B.12 sẽ được sử dụng cho dct_dc_size. Nếu cc không phải là không, thì Bảng B.13 sẽ được sử dụng cho det_dc_size.

Ba yếu tố dự đoán được duy trì, một cho mỗi thành phần màu, cc. Mỗi lần một hệ số DC trong một khối trong macroblock bên trong được giải mã thì dự đoán sẽ được cộng vào sự khác biệt để phục hồi hệ số thực tế. Sau đó, dự đoán sẽ được thiết lập để giá trị của hệ số chỉ cần giải mã. Vào những thời điểm khác nhau, như mô tả dưới đây, các dự đoán sẽ được đặt lại. Giá trị đặt lại được lấy từ tham số intra_de_precision như được chỉ ra trong Bảng 7-2.

Bảng 7-2 - Quan hệ giữa intra_dc_precision và giá trị đặt lại của dự đoán trước

Intra_dc_precision Các bít đoán trước Giá trị đặt lại0 8 1281 9 2562 10 5123 11 1024

Các dự đoán sẽ được đặt lại về giá trị đặt lại vào những thời điểm sau:

• Vào đầu của một lát cắt.

• Bất cứ khi nào một macroblock trong không được giải mã.

• Bất cứ khi nào một macroblock bị bỏ qua, tức là, khi macroblock_address_increment> 1.

Các dự đoán được biểu thị là dct_de_pred[cc].

QFS [0] sẽ được tính từ dct_de_size và dct_de_differential bởi bất kỳ quy trình tương đương như:

if ( dc_dct_size == 0 ) {dct_diff = 0;} else {

92

TCVN xxxx : 2017

half_range = 2 ^ ( dc_dct_size - 1 )if ( dc_dct_differential >= half_range )dct_diff = dc_dct_differential;elsedct_diff = (dc_dct_differential + 1) - (2 * half_range);}QFS[0] = dc_dct_pred[cc] + dct_diff;dc_dct_pred[cc] = QFS[0]

Chú ý 1 - Ký hiệu ˄biểu thị công suất (không phải XOR).

Chú ý 2 - dct_diff và half_range là các biến theo thời gian, không được sử dụng ở nơi khác trong Tiêu chuẩn kỹ thuật này.

Đó là một yêu cầu của dòng bit mà QFS [0] sẽ nằm trong phạm vi:

0 đến ((2^(8 + intra_dc_precision))-1)

7.2.2. Các hệ số khác

Tất cả các hệ số trừ các hệ số DC bên trong sẽ được mã hoá bằng sử dụng bảng B.14, B.15 và B.16.

Trong tất cả các trường hợp mã chiều dài biến trước tiên sẽ được giải mã bằng cách sử dụng hoặc là Bảng B.14 hoặc là Bảng B.15. Giá trị giải mã của mã này thể hiện một trong ba cách sau:

1) Kết thúc Khối - Trong trường hợp này không có nhiều hệ số trong khối, trong đó làm giảm phần còn lại của hệ số trong khối (những giá trị chưa được giải mã) sẽ được đặt là 0. Đây là ký hiệu "End of block" trong đặc tả cú pháp của mục 6.2.6.

2) Hệ số "bình thường", trong đó giá trị chạy và mức được giải mã theo sau bởi một bit, s, cho biết dấu hiệu của hệ số ký hiệu được tính từ mức và s như hình dưới đây, các hệ số vận hành phải được đặt thành Zero và hệ số tiếp theo sẽ có giá trị signed_level.

Nếu (s ==0)

signed_level = level;

Mặt khác

signed_level = (-level);

3) Một "Escape" hệ số mã hoá. Trong đó các giá trị của run và signed_level được được gắn với chiều dài được mã hóa như mô tả trong mục 7.2.2.3.

7.2.2.1. Chọn bảngBảng 7-3 chỉ ra bảng nào sẽ được sử dụng để giải mã các hệ số DCT.

Bảng 7-3 - Lựa chọn các bảng VLC hệ số DCT

inlra_vlc_format 0 1Intra blocks (macroblock_intra = 1)

B.14 B 15

non-intra blocks (macroblock_intra = 0)

B.14 B. 14

7.2.2.2.Hệ số thứ nhất của khối không phải là khối bên trong Trong trường hợp hệ số thứ nhất của một khối phải không phải là khối bên trong (một khối macroblock không phải là khối bên trong) Bảng B.14 được sửa đổi như được chỉ ra trong Chú ý 2 và 3 ở cuối Bảng đó.

93

TCVN xxxx : 2017

Sửa đổi này chỉ ảnh hưởng đến mục nhập đại diện cho run = 0, level = ± 1. Vì không thể mã hóa một kết thúc của khối như là hệ số thứ nhất của một khối (khối sẽ "không mã hoá" trong trường hợp này) không có khả năng vì sự tồn tại không rõ ràng.

Các vị trí trong cú pháp sử dụng Bảng sửa đổi này được biểu thị bằng "Hệ số DCT đầu tiên" trong đặc tả cú pháp của 6.2.6. Phần còn lại của hệ số được biểu thị bằng "Các hệ số DCT tiếp theo".Chú ý - Trong trường hợp Bảng B.14 được sử dụng cho khối bên trong, hệ số thứ nhất phải được mã hoá như đã nêu trong mục 7.2.1. Do đó, bảng B.14 không được sửa đổi bởi vì hệ số thứ nhất sử dụng bảng B.14 là hệ số thứ hai trong khối.

7.2.2.3. Mã thoát Nhiều kết hợp có thể của chạy và mức (run and level)không có mã chiều dài thay đổi để đại diện cho chúng. Để mã hoá các kết hợp thống kê hiếm thấy này, một phương pháp mã hóa thoát được sử dụng.

Bảng B.16 định nghĩa phương pháp mã hóa thoát. Thoát khỏi VLC được theo sau bởi mã chiều dài 6 bit cố định cho "chạy"- “run”. Điều này được theo sau bởi mã độ dài cố định 12bit cho các giá trị "signed_level".Chú ý - Chú ý đến phương pháp mã hoá thoát được sử dụng trong Tiêu chuẩn kỹ thuật này khác với cách sử dụng trong ISO/IEC 11172-2.

7.2.2.4.Tóm tắtĐể tóm tắt mục 7.2.2, quá trình giải mã độ dài thay đổi sẽ tương đương như sau. Khi bắt đầu quá trình này n sẽ lấy giá trị zero cho các khối không phải là khối bên trong và một cho các khối bên trong.

eob_not_read = 1;while ( eob_not_read ){<decode VLC, decode Escape coded coefficient if required> if ( <decoded VLC indicates End of block>) { eob_not_read = 0; while ( n< 64) { QFS[n] = 0; n = n + 1; } } else { for ( m = 0; m <run; m++ ) { QFS[n] = 0; n = n + 1; } QFS[n] = signed_level n = n + 1; }}

Chú ý - eob_not_read và m là các biến theo thời gian không được sử dụng ở nơi khác trong Tiêu chuẩn kỹ thuật này.

7.3. Quét ngược

Dữ liệu ở đầu ra của bộ giải mã độ dài biến đổiđược biểu thị bởi QFS[n], n nằm trong khoảng từ 0 đến 63.

94

TCVN xxxx : 2017

Mục này cụ thể cách thức mà trong đó các dữ liệu một chiều, QFS [n], được chuyển thành một mảng hai chiều của các hệ số được biểu hiện bởi QF[v][uj, u và v cả hai đều nằm trong khoảng từ 0 đến 7.

Hai mẫu quét được xác định. Việc quét sẽ được sử dụng sẽ được xác định bởi alternate_scan được mã hoá trong phần mở rộng ảnh mã hoá.

Hình 7-2 định nghĩa quét [alternate_scan][v][u] cho trường hợp alternate_scan bằng không. Hình 7-3 định nghĩa quét [alternate_scan][v][u] cho trường hợp quét thay thế là một.

Quét nghịch đảo sẽ là bất kỳ quy trình tương đương như sau:

for (v = 0; v < 8; v++)

for (u = 0; u < 8; u++)

QF[v][u] = QFS[scan[alternate_scanl[v][u]]Chú ý - Các mẫu quét được xác định ở đây thường được gọi là "zigzag_scanning_older".

Hình 7-2 - Định nghĩa quét [0][ v][ u]

95

TCVN xxxx : 2017

Hình 7-3 - Định nghĩa quét [1][ v][ u]

7.3.1. Quét ngược cho ma trận tảivề

Khi các ma trận lượng tử được tải về, chúng được mã hoá trong dòng bit theo thứ tự quét được chuyển đổi thành ma trận hai chiều được sử dụng trong lượng tử nghịch đảo theo cách giống hệt với các hệ số.

Đối với ma trận tải về, quét được xác định bởi hình 7-2 (tức là quét [0] [v] [u]) sẽ luôn luôn được sử dụng.

Cho W[w][v][u] biểu thị ma trận trọng số trong các bộ lượng tử hóa nghịch đảo (xem mục 7.4.2.1), và W'[w][n] biểu thị ma trận như nó được mã hoá trong dòng bit. Tải về ma trận sau đó sẽ tương đương như sau:

for (v = 0; v < 8; v++) for (u = 0; u < 8: u++)

W[w][v)[u] = W’[w][scan(0][v][u]]

7.4. Lượng tử hóa nghịch đảo - Inverse quantization

Các mảng hai chiều của các hệ số, QF[v][u], được lượng tử hóa nghịch đảo để tạo ra các hệ số DCT tái tạo. Quá trình này về bản chất là sự nhân lên bởi kích thước bước lượng tử. Kích thước bước lượng tử hóa được sửa đổi bởi hai cơ chế; một ma trận trọng số được sử dụng để thay đổi kích thước bước trong một khối và một yếu tố tỷ lệ được sử dụng để kích thước bước có thể được sửa đổi với chi phí chỉ một vài bit (so với mã hóa toàn bộ một ma trận trọng số mới).

Hình 7-4 minh họa quá trình lượng tử hóa tổng thể nghịch đảo. Sau khi lượng tử hóa số học đảo ngược thích hợp, các hệ số kết quả, F''[v][u]. được bão hòa để tạo ra F’[v][u] và sau đó một hoạt động kiểm soát phù hợp được thực hiện để cung cấp cho các hệ số DCT tái tạo cuối cùng, F[v][u].

Chú ý - Chú ý đến thực tế là phương pháp đạt được sự kiểm soát không phù hợp trong tiêu chuẩn kỹ thuật này khác với phương pháp được sử dụng bởi ISO/IEC 11172-2

96

TCVN xxxx : 2017

Hình 7-4 - Quá trình lượng tử nghịch đảo

7.4.1. Hệ số trong DC

Các hệ số DC của các khối được mã hoá bằng nội mã sẽ được đảo ngược lượng tử theo một cách khác với tất cả các hệ số khác.

Trong các khối bên trong F"[0][0] thu được bằng cách nhân QF[0][0] bằng một hệ số nhân liên tục, intra_dc_mult (hằng số theo nghĩa là nó không được sửa đổi bởi ma trận trọng số hoặc hệ số quy mô) Số nhân có liên quan đến tham số intra_dc_precision được mã hóa trong phần mở rộng ảnhmã hoá Bảng 7.4 cụ thể mối quan hệ giữa intra_dc_precision và intra_de_mult.Như vậy; F"[0][0] = intra_dc_mult x QF[0][0]

Bảng 7-4 - Quan hệ giữa intra_dc_precision và intra_dc_mult

lntra_dc_precision Các bit đoán trước lnlra_dc_mult0 8 81 9 42 10 23 11 1

7.4.2. Các hệ số khác

Tất cả các hệ số khác với hệ số DC của khối bên trong sẽ được đảo ngược lượng tử theo quy định trong phần phụ dưới này.

7.4.2.1. Ma trận trọng số

Khi dữ liệu 4:2:0 được sử dụng, hai ma trận trọng số được sử dụng. Một sẽ được sử dụng cho khối trong macroblocks và một cho khối macroblocks không phải là khối bên trong. Khi dữ liệu 4:2:2 hoặc 4:4:4 được sử dụng, bốn ma trận được sử dụng cho phép các ma trận khác nhau được sử dụng cho dữ liệu độ chói và độ sắc. Mỗi ma trận có một bộ giá trị mặc định có thể bị ghi đè bởi việc nạp một ma trận do người dùng định nghĩa như được giải thích trong mục 6.2.3.2.

Để các ma trận trọng số được ký hiệu bởi W[w][v][u] trong đó w lấy các giá trị 0 đến 3 cho biết trong số các ma trận đang được sử dụng, bảng 7-5 tóm tắt các quy tắc về việc lựa chọn w.

97

TCVN xxxx : 2017

Bảng 7-5 - Lựa chọn w

42:0 4:2:2 và 4:4:4Độ chói độ sắc Độ chói Độ sắc (cc = 0) (cc ≠ 0) (cc = 0) (cc ≠ 0)

Intra blocks (macroblock_intra = 1) 0 0 0 2

non-intra blocks (macroblock_intra = 0) 1 1 1 3

7.4.2.2. Hệ số quy mô định lượng

yếu tố quy mô lượng tử được mã hoá dưới dạng mã độ dài cố định 5 bit, quantiser_scale_code. Điều này cho thấy quantiser_scale phù hợp để áp dụng trong phép toán số lượng tử nghịch đảo.

q_scale_type (được mã hoá trong phần mở rộng mã hoá hình ảnh) cho biết trong đó hai ánh xạ giữa quantiser_scale_code và quantiser_scale sẽ được áp dụng. Bảng 7-6 cho thấy hai ánh xạ giữa mã quy mô lượng tử và thang đo lượng tử.

7.4.2.3. Các công thức tái thiết

Phương trình số học cụ thể sau đây để tái tạo lại F"[v][u] từ QF[v][u] (cho tất cả các hệ số ngoại trừ hệ số DC bên trong).

Ở đó:

Chú ý: Phương trình trên sử dụng toán tử "/" theo định nghĩa trong mục 4.1.

7.4.3. Độ bão hòa

Các hệ số kết quả từ số học lượng tử nghịch đảo được bão hòa nằm trong khoảng

[-2048:+2047], Do đó:

7.4.4. Kiểm soát không phù hợp

Kiểm soát không phù hợp sẽ được thực hiện bằng bất kỳ quy trình nào tương tự như sau. Thứ nhất, tất cả các hệ số bão hòa, tái tạo, F'[v][u] trong khối sẽ được tổng kết. Giá trị này sau đó được kiểm tra để xác định xem nó là lẻ hay thậm chí. Nếu số tiền đó thậm chí còn phải được điều chỉnh chỉ bằng một hệ số; F[7][7]. Như vậy:

98

TCVN xxxx : 2017

Chú ý 1 - Cần lưu ý rằng điều chỉnh trên đối với F[7][7] chỉ đơn giản có thể được thực hiện bằng cách đánh số bit ít nhất có ý nghĩa của sự thể hiện bổ sung hai của hệ số Cũng từ đó chỉ có "bất thường" hay " "của OR gây chú ý nhất” (chỉ có bit ít quan trọng nhất) có thể được sử dụng để tính tổng “sum”.

Chú ý 2 - Cảnh báo - Các đầu vào khác không nhỏ cho IDCT có thể dẫn đến kết quả đầu ra zero-zero cho một số xấp xỉ IDCT phù hợp với các yêu cầu được nêu trong Phụ lục A. Nếu điều này xảy ra trong bộ mã hoá, sự không phù hợp có thể xảy ra trong bộ giải mã sử dụng khác xấp xỉ IDCT phù hợp hơn so với xấp xỉ được sử dụng trong mô hình hóa quá trình giải mã trong bộ mã hóa. Một bộ mã hóa nên tránh vấn đề này và có thể làm như vậy bằng cách kiểm tra đầu ra của xấp xỉ IDCT riêng của nó Nó phải đảm bảo rằng nó không bao giờ chèn bất kỳ hệ số khác không vào dòng bit khi khối trong truy vấn khôi phục lại bằng không thông qua các IDCT chức năng xấp xỉ của bộ mã hóa riêng . Nếu hành động này không được thực hiện bởi bộ mã hóa, tình huống có thể nảy sinh khi có sự khác biệt lớn giữa các bảng mã và bộ giải mã.

Bảng 7-6 – Mối quan hệ gữa quantiser_scale_code và quantiser_scale

99

TCVN xxxx : 2017

7.4.5. Tổng kết

Tóm lại quá trình lượng tử nghịch đảo là bất kỳ quá trình nào về số lượng tương đương với:

100

TCVN xxxx : 2017

7.5. DCT nghịch đảo

Khi các hệ số DCT, F[v][u] được xây dựng lại, một hàm DCT phù hợp với các yêu cầu chính xác được nêu trong Phụ lục A sẽ được áp dụng để lấy các giá trị biến đổi nghịch đảo f[y][x], là số nguyên.

7.5.1. Các khối không mã hóa và bỏ qua các khối macroblock

Trong một macroblock không bị bỏ qua, nếu mã mẫu [i] là một cho một khối nhất định trong macroblock, thì dữ liệu hệ số được bao gồm trong dòng bit của khối đó. Điều này được giải mã bằng cách sử dụng như đã nêu trong các mục trước.

Tuy nhiên, nếu pattern_code[i] là zero, hoặc nếu macroblock được bỏ qua, thì khối đó không chứa dữ liệu hệ số. Các hệ số miền mẫu f[y][x] cho khối đó sẽ lấy giá trị bằng không.

7.6. Bù chuyển động

Quá trình bù chuyển động tạo ra các dự đoán từ những ảnh được giải mã trước đó được kết hợp với dữ liệu hệ số (từ đầu ra của IDCT) để thu hồi các mẫu được giải mã cuối cùng. Hình 7-5 cho thấy một sơ đồ đơn giản của quá trình này.

101

TCVN xxxx : 2017

Hình 7-5 - Quá trình bù chuyển động đơn giảnNói chung, có tới bốn dự đoán riêng biệt được tạo ra cho mỗi khối được kết hợp với

nhau để tạo thành khối dự đoán cuối cùng p[y][xj.

Trong trường hợp của Macroblocks mã hóa trong không có dự đoán được hình thành để p[y][x] sẽ là số không. Độ bão hòa thể hiện trong hình 7-5 vẫn cần thiết để loại bỏ các giá trị và giá trị tiêu cực vượt quá 255 (nếu có) phía trước f[y][x], Macroblocks mã hóa trong có thể mang các vector chuyển động được gọi là "các vectơ chuyển động che giấu". Mặc dù điều này không có dự đoán được hình thành trong quá trình bình thường của các sự kiện. Thông tin vectơ chuyển động này được dự định để sử dụng một cách dễ dàng mà các lỗi dòng bit ngăn cản việc giải mã thông tin hệ số. Cách thức mà bộ giải mã sử dụng thông tin này không được chỉ rõ. Yêu cầu duy nhất cho các vector chuyển động này là nó sẽ có cú pháp chính xác cho các vectơ chuyển động. Mô tả về cách thức mà các vec tơ chuyển động này có thể được sử dụng có thể tìm thấy trong mục 7.6.3.9.

Để thiết lập một yêu cầu về sự tuân thủ dòng bit, một giá trị gia tăng dự đoán sẽ được bắt nguồn cho mỗi macroblock trong ảnh P như sau. Nếu một macroblock trong ảnh hiện tại bị bỏ qua, giá trị gia tăng dự đoán sẽ bằng 0. Nếu không, giá trị gia tăng dự đoán sẽ bằng 1.

Để thiết lập một yêu cầu về sự phù hợp dòng bit, đối với mỗi khoá macroblock trong mỗi ảnh I và ảnh P, một số dự đoán sẽ được tính như sau. Nếu một macroblock là một macroblock mã hóa bên trong, số dự đoán của nó sẽ bằng 0. Nếu không, nếu ảnh hiện tại là một trường ảnh và ảnh tham chiếu được tái tạo gần đây nhất cũng là một trường ảnh hoặc nếu ảnh hiện tại là một khung ảnh và ảnh tham chiếu được xây dựng lại gần đây

102

TCVN xxxx : 2017

nhất cũng là một khung ảnh, số đếm dự đoán cho một macroblock trong ảnh hiện tại sẽ bằng với giá trị gia tăng số đếm cộng với giá trị của số đếm dự đoán cho macroblock trong ảnh tham chiếu được tái dựng gần đây nhất mà tương ứng với vị trí của macroblock đã chọn trong ảnh hiện tại. Nếu không, số dự đoán cho một macroblock trong ảnh hiện tại sẽ bằng với giá trị đếm gia tăng dự đoán cộng với giá trị tối đa của hai giá trị dự đoán cho các macroblocks trong vùng của ảnh tham chiếu được tái tạo gần đây nhất tương ứng với vị trí của macroblock đã chọn trong ảnh hiện tại.

Đó là yêu cầu về sự phù hợp của dòng bit đối với mỗi macroblock trong ảnh P, giá trị dự đoán kết quả phải nhỏ hơn 132.

Trong trường hợp một khối không mã hoá, hoặc vì toàn bộ macroblock được bỏ qua hoặc khối cụ thể không được mã hoá thì không có hệ số dữ liệu. Trong trường hợp f[y][x]này là số không và các mẫu được giải mã chỉ là dự đoán, p[y][x].

7.6.1. Các chế độ dự đoán

Có hai phân loại chính của chế độ dự đoán:

- dự đoán trường; và

- Dự đoán khung.

Trong dự đoán trường, dự đoán được thực hiện độc lập cho từng trường bằng cách sử dụng dữ liệu từ một hoặc nhiều trường được giải mã trước đó, dự đoán khung hình thành một dự đoán cho khung từ một hoặc nhiều khung đã giải mã trước đó. Phải hiểu rằng các trường và khung hình phía trước mà dự đoán được thực hiện có thể đã được giải mã, bản thân, như là một trong hai trường ảnh hoặc khungảnh.

Trong mộttrường ảnh, tất cả các dự đoán đều là các trường dự đoán. Tuy nhiên, trong một khung ảnh có thể sử dụng dự đoán trường hoặc dự đoán khung (được chọn trên một macroblock bởi macroblockcơ sở).

Ngoài việc phân loại chính của dự đoán trường hoặc khung, hai chế độ dự đoán đặc biệt được sử dụng:

• 16x8 bù chuyển động - Trong đó có hai vectơ chuyển động được sử dụng cho mỗi macroblock. Vùng chuyển động đầu tiên được sử dụng cho vùng trên 16x8, phần thứ hai cho vùng dưới 16x8. Trong trường hợp một macroblock dự đoán hai chiều sẽ có tổng cộng bốn vector chuyển động vì sẽ có hai cho dự đoán trước và hai cho dự đoán sau. Trong chi tiết kỹ thuật này 16x8 bù chuyển động sẽ chỉ được sử dụng với các trường ảnh .

• Nguyên tố kép (Dual-prime)- Trong đó chỉ có một vector chuyển động được mã hoá (ở dạng chính thức) trong dòng bit cùng với một vector chuyển động nhỏ. Trong sự dễ dàng của các trườngảnh, hai vector chuyển động sau đó được rút ra từ thông tin này. Chúng được sử dụng để tạo dự đoán từ hai trường tham chiếu (một đầu, một đáy) được tính trung bình để tạo thành dự đoán cuối cùng. Trong sự dễ dàng của khung ảnh hình quá trình này được lặp lại cho hai trường để tổng cộng bốn dự đoán trường được thực hiện. Chế độ này chỉ được sử dụng trong hình P, nơi không có khoảng thời gian B giữa các trường hoặc khung dự đoán và tham khảo.

7.6.2. Trường dự đoán và lựa chọn khung

Việc lựa chọn trường và khung được sử dụng để hình thành dự đoán sẽ được thực hiện như đã nêu cụ thể trong điều này.

103

TCVN xxxx : 2017

7.6.2.1. Dự đoán trường

Trong nhóm ảnh P, hai trường tham chiếu mà từ đó các dự đoán sẽ được thực hiện là trường gần nhất đã được giải mã gần đây nhất và trường cuối cùng được giải mã gần đây nhất được giải mã. Trường hợp đơn giản nhất được minh hoạ trong hình 7-6 sẽ được sử dụng khi dự đoán ảnh đầu tiên của một khung được mã hóa hoặc khi sử dụng dự đoán trường trong một khung hình. Trong những trường hợp này, hai trường tham chiếu là một phần của cùng một khung tái tạo.

Chú ý 1 - Các trường tham khảo có thể được tái tạo lại từ hai trường hoặc một khung hình.

Chú ý 2 - Trong trường hợp dự đoán mộttrường ảnh, trường được dự đoán có thể là trường trên cùng hoặc trường dưới cùng

Hình 7-6 - Dự đoán trường đầu tiên hoặc dự đoán trong khung ảnh trường hợp khi dự đoán trường ảnh thứ hai của một khung được mã hóa phức tạp hơn bởi vì hai trường gần đây nhất

các trường tham chiếu được giải mã sẽ được sử dụng, và trong trường hợp này, trường tham chiếu gần đây nhất thu được từ việc giải mã trường ảnh đầu tiên của khung được mã hóa, hình 7 -7 minh họa tình huống khi ảnh thứ hai này là trường dưới cùng.

hình 7-8 minh họa tình huống khi ảnhthứ hai này là trường trên cùngChú ý 3 - Trường tham chiếu trước đó chính nó có thể được xây dựng lại để bởi mã hóa một

trường ảnhhoặc khung ảnh.

104

TCVN xxxx : 2017

Hình 7-7 - Dự đoán trường ảnh thứ hai khi nó là trường dưới cùng

Hình 7-8 - Dự đoán trườngảnh thứ hai khi nó là trường hàng đầuDự đoán trường trong ảnh B sẽ được làm từ hai phần của hai khung giáp ranh tái tạo gần đây nhất. Hình 7-9 minh hoạ tình huống này.

Chú ý 4 - Các khung tham chiếu có thể đã được tái tạo từ hai trường ảnh mã hoá hoặc một khung mã hoá đơn lẻ

Hình 7-9 - Dự đoán trường của các trường ảnh B hoặc khung ảnh B7.6.2.2. Dự đoán khung

Trong dự đoán nhóm ảnh P sẽ được thực hiện từ khung tham chiếu được tái tạo lại gần đây nhất. Điều này được minh họa trong hình 7-10.

105

TCVN xxxx : 2017

Chú ý 1 - Khung tham chiếu có thể được mã hoá dưới dạng hai trường ảnh hoặc một khung ảnh đơn

Hình 7-10 - Dự đoán khung cho ảnh I và ảnh PTương tự, dự đoán khung trong ảnh B sẽ được làm từ hai khung tham chiếu được tái tạo gần đây nhất như được minh họa trong Hình 7-11.

Chú ý 2 - Các khung tham chiếu có thể đã được mã hoá dưới dạng hai trường ảnhhoặc một khung ảnh đơn lẻ

Hình 7-11 - Dự đoán khung cho ảnh B

7.6.3. Các vectơ chuyển động

Các vectơ chuyển động được mã hóa khác với các vec tơ chuyển động được giải mã trước đây để giảm số bit cần thiết để biểu diễn chúng. Để giải mã các vec tơ chuyển động, bộ giải mã phải duy trì bốn bộ dự đoán vector chuyển động (mỗi tập hợp với một thành phần nằm ngang và dọc) biểu thị PMV[r][s][t]. Đối với mỗi dự đoán, một vector chuyển động. vector'[r][s][t] lần đầu tiên xuất phát. Điều này sau đó được cố định tùy thuộc vào cấu trúc lấy mẫu (4:2:0, 4:2:2 hoặc 4:4:4) để cho một vector chuyển động, vector[r][s][t], cho mỗi thành phần sắc màu. Ý nghĩa kết hợp với kích thước trong mảng này được định nghĩa trong Bảng 7-7.

Bảng 7 - Ý nghĩa các chỉ số trong PMV[r][s[t], vector[r][s][t] và vector[r][s][t]

0 1

r vector chuyển động đầu tiên trong Macroblock

vector chuyển động thứ hai trong Macroblock

s vector chuyển động xuôi vector chuyển động ngượct Thành phần ngang Thành phần dọc

Chú ý - r cũng lấy giá trị 2 và 7 cho các vectơ chuyển động có nguồn gốc được sử dụng với dự đoán hai nguyên tố. Vì những vectơ chuyển động này được sinh ra nên chúng không có các vector dự đoán.

7.6.3.1. Giải mã các vectơ chuyển động

Mỗi thành phần vector chuyển động, vector'[r][s][t], sẽ được tính bằng bất kỳ quá trình nào

106

TCVN xxxx : 2017

tương đương với một phần sau. Lưu ý rằng các dự đoán vector vector cũng sẽ được cập nhật bởi quá trình này.

Các thông số trong dòng bit phải sao cho các vector chuyển động vi phân, delta, nằm trong khoảng [thấp: cao]. Ngoài ra, vectơ chuyển động tái tạo, vector'[r][s][t] và giá trị cập nhật của dự đoán vector vectơ PMV[r][s][t] cũng nằm trong khoảng [thấp: cao] ,

kích thước r, f, delta, cao, thấp và dải là các biến tạm thời không được sử dụng trong phần còn lại của Tiêu chuẩn kỹ thuật này.

motion_code [r][s][t] và motion_residual [r][s][t] là các trường thu hồi được từ dòng bit, định dạng mv được khôi phục từ dòng bit bằng các bảng 6-17 và 6-18.

r, s và t chỉ rõ thành phần vector chuyển động cụ thể đang được xử lý như được xác định trong Bảng 7-7.

vector'[r][s][t] là vector chuyển động cuối cùng được tái tạo cho thành phần độ chói của macroblock.

Giá trị vector [r][s][t] được xem xét trong mục này là giá trị thu được từ mã giả trên. Trong trường hợp của dual -prime, hạn chế này mà vector'[r][s][t] phải ở trong phạm vi [thấp: cao] không áp dụng cho vector chuyển động quy mô vector'[2:3][0][0:1] được định nghĩa trong mục 7.6.3.6. Các hạn chế khác đối với các vec tơ chuyển động, bao gồm các vectơ chuyển động hai điểm quy mô được xác định trong mục 7.6.3.8 và mục 8.3.

7.6.3.2. Các hạn chế của vector chuyển động

107

TCVN xxxx : 2017

Trong ảnh khung, thành phần dọc của các vector trường chuyển động sẽ bị hạn chế để chúng chỉ bao phủ một nửa phạm vi được hỗ trợ bởi f_codce có liên quan đến các vec tơ chuyển động đó, hạn chếnày đảm bảo rằng các dự đoán vector sẽ luôn có các giá trị được thích hợp để giải mã khung tiếp theo của vectơ chuyển động. Bảng 7-8 tóm tắt kích thước của vectơ chuyển động có thể được mã hoá dưới dạng một hàm của f_code.

7.6.3.3. Cập nhật dự đoán các vector Một khi tất cả các vec tơ chuyển động có mặt trong macroblock đã được giải mã bằng cách sử dụng quá trình được định nghĩa trong mệnh đề trước, nó đôi khi cần phải cập nhật các dự đoán vector khác, "litis là bởi vì trong một số chế độ dự đoán ít hơn số lượng các vec tơ chuyển động tối đa có thể đã sử dụng. Phần còn lại của các dự đoán có thể được sử dụng trong ảnh phải giữ lại các giá trị "nhạy cảm" trong trường hợp chúng được sử dụng sau đó.

Bảng 7-8 - Vùng vector chuyển động cho phép như một hàm của f_code [s][t]

f_code[s][t] Các thành phần dọc (t == 1) của trường vector trong ảnh khung Tất cả các trường hợp khác

0 (Cấm)1 [-4: +3.5] [-8: +7.5]2 [-8: +7.5] [-16:+15.5]3 [-16: +15.5] [-32: +31.5]4 [-32: +31.5] [-64: +63.5]5 [-64: +63.5) [-128:+127.5]6 [-128;+127.5] [-256: +255.5]7 1-256: +255.5] [-512: +511.5]8 [-512:+511.5] [-1024: +1023.5]9 [-1024; +1023.5] [-2048. +2047.5]

10-14 (Dự phòng)15 (Được sử dụng khi một f_code[s][t] cụ thể sẽ không được sử dụng)

Các dự đoán vector véc tơ sẽ được cập nhật như được chỉ ra trong bảng 7-9 và 7-10. Các quy tắc để cập nhật dự đoán vector dự đoán trong trường hợp của makroblock bỏ qua được xác định trong mục 7.6.6.

Chú ý - Có thể thực hiện để tối ưu hóa việc cập nhật (và đặt lại) các dự đoán vector dự đoán phụ thuộc vào loại hình ảnh, ví dụ như trong một ảnh P, dự đoán cho các vectơ chuyển động ngược không sử dụng và không cần phải duy trì

108

TCVN xxxx : 2017

Bảng 7-9 - Cập nhật các dự đoán tuyến tính chuyển động trong khung ảnh

frame_motion_type

macroblock_motion- macroblock_intra Bộ dự đoán để cập nhậtforward backward

Frame-baseda) - - 1 PMV[1][0][1:0] =PMV[0][0][1:0]b)

Frame-based 1 1 0PMV[1][0][1:0] =PMV[0][0][1:0]PMV[1][1][1:0] =PMV[0][1][1:0]

Frame-based 1 0 0 PMV[1][0][1:0] =PMV[0][0][1:0]Frame-based 0 1 0 PMV[1][1][1:0] =PMV[0][1][1:0]Frame-baseda) 0 0 0 PMV[r][s][t] = 0c)

Field-based 1 1 0 (Không)Field-based 1 0 0 (Không)

Field-based 0 1 0 (Không)

Dual prime 1 0 0 PMV[1][0][1:0] = PMV[0][0][1:0]

a) kiểu chuyển động của khung không có trong dòng bit nhưng được giả định là Frame-basedb) Che giấu các vectơ chuyển động bằng 0 sau đó PMV[r][s][t] được đặt là 0 (cho tất cả các r, s và t).c) (chỉ xảy ra trong P-piclute) PMV[r][s][t] được đặt là 0 (cho tất cả các r và s).Mục 7.6.3 4Chú ý - PMV[r][s][t][1: 0] PMV[u][v][1:0] có nghĩa là:PMV[r][s][1] = PMV[u][v][1] và PMV[r][s][0] = PMV[u][v][0]

Bảng 7-10- Cập nhật các dự đoán vector dự đoán trong các trường ảnh

frame_motion_- macroblock_motion_-macroblock_intratype forward backward Bộ dự đoán để cập nhật

Field-baseda) - - 1 PMV[1][0][1:0] = PMV[0][0][10]b)

Field-based1 1 0 PMV[1][0][1:0] = PMV[0][0][1:0]

PMV[1][1][1:0] = PMV[0][1][1:0]

Field-based 1 0 0 PMV[1][0][1:0] = PMV[0][0][1:0]Field-based 0 1 0 PMV[1][1][1:0] = PMV[0][1][1:0]Field-baseda) 0 0 0 PMV[r][s][t] = 0c)

16 x SMC 1 1 0 (Không)

16 x SMC 1 0 0 (Không)

16 x SMC 0 1 0 (Không)

Dual prime 1 0 0 PMV[1][0][1:0] = PMV[0][0][1:0]

a) frame_motion_type không có trong dòng bits nhưng giả định là Field-basedb) Nếu concealment_motion_vectors là 0 thì PMV[r][s][t] được đặt là 0 (cho tất cả các r và s).c) (Chỉ xảy ra trong ảnh P) PMV[r][s][t] được đặt là 0 (cho tất cả các r, s và t). Xem mục 7.6.3.4.

7.6.3.4. Đặt lại các dự đoán vectorTất cả các dự đoán véc tơ chuyển động sẽ được đặt lại là 0 trong những điều sau đây:

Vào đầu mỗi miếng;

109

TCVN xxxx : 2017

Bất cứ khi nào một khối macroblock được giải mã mà không có giấu vectơ chuyển động;

Trong ảnhP khi một macroblock không phải bên trong được giải mã trong đó macroblock_motion_forward là số không;

Trong một ảnh P khi một macroblock được bỏ qua.

7.6.3.5 Dự đoán trong ảnh PTrong nhóm ảnh P, trong trường hợp macroblock_motion_forward là số không và macroblock_intra cũng zero Không có các vector vectơ được mã hoá cho macroblock nhưng một dự đoán phải được hình thành. Nếu điều này xảy ra trong một trường ảnh P, áp dụng sau đây;

Kiểu dự đoán sẽ là "Field-based"; vector chuyển động (trường) là 0 (0; 0); các dự đoán vector dự đoán sẽ được đặt lại về không; dự đoán sẽ được thực hiện từ trường cùng độ chẵn giống như trường bị thay đổi.

Nếu điều này xảy ra trong một khung ảnh P sau đây áp dụng:

kiểu dự đoán sẽ là " khung cơ sở"; vector chuyển động (frame) là 0 (0; 0): các dự đoán vector dự đoán sẽ được đặt lại về không.

Trong trường hợp một trường ảnh P được sử dụng như là trường thứ hai của một khung trong đó trường đầu tiên là một trường ảnh I, một loạt các hạn chế ngữ nghĩa áp dụng. Điều này đảm bảo rằng dự đoán chỉ được thực hiện từ trường ảnh I. Những hạn chế này là:

Không có macroblocks được mã hoá với macroblock_motion_forwardkhông (zero) và macroblock_intra không(zero).

Dự đoán nguyên tố kép sẽ không được sử dụng. Dự đoán trường trong đó motion_vertical_field_select cho biết mức độ chẵn lẻ

tương tự như trường được dự đoán sẽ không được sử dụng. Sẽ không bỏ qua các macroblock.

7.6.3.6 Bổ sung số nguyên tố kép số họcTrong dự đoán kép, một trường chuyển động vector (vector'[0][0][1:0]) sẽ được giải mã theo quá trình đã mô tả . Điều này đại diện cho vector chuyển động được sử dụng để tạo dự đoán từ trường tham chiếu (hoặc trường tham chiếu trong một khung hình) có cùng độ chẵn lẻ với dự đoán được hình thành. Ở đây chữ "chẵn lẻ" được sử dụng để phân biệt hai trường. Trường trên cùng có chẵn lẻ, phần dưới cùng có chẵn lẻ.

Để tạo thành một vector chuyển động cho sự chẵn lẻ đối nhau (vector'[r][0][1:0]), vectơ chuyển động hiện tại được thu nhỏ để phản ánh khoảng cách thời gian khác nhau giữa các trường. Một sự hiệu chỉnh được thực hiện để thành phần dọc (để phản ánh sự dịch chuyển theo chiều dọc giữa các dòng của trường trên và trường dưới) và sau đó một vector chuyển động nhỏ khác được thêm vào. Quá trình này được minh họa trong Hình 7-12 thể hiện tình huống cho một khung ảnh.

Dmvector[0] là thành phần nằm ngang của vector chuyển động vi phân và dmvector[1] thành phần thẳng đứng. Hai thành phần của vector chuyển động phân giải phải được giải mã trực tiếp bằng Bảng B.11 và sẽ chỉ lấy một trong các giá trị -1, 0, 1.

m[parity_ref][parity_pred] là khoảng cách trường giữa trường dự đoán và trường tham chiếu được định nghĩa trong Bảng 7-11. "panty_ref" là tính chẵn lẻ của trường tham chiếu

110

TCVN xxxx : 2017

mà vector chuyển động mới đang được tính, "parity_pred" là tính chẵn lẻ của trường được dự đoán.

Hình 7-12 -Xác định tỷ lệ của vector chuyển động cho dự đoán kép ban đầuBảng 7-11 - Định nghĩa m [parity_ref] [parity_pred]

picture_structure top_field_first

m[parity_ref][parity_pred]

m[1][0] m[0][1]11 (Khung) 1 1 311 (Khung) 0 3 101 (Trường trên cùng) — 1 —10 (Trường dưới cùng) — — 1

c[parity_ref] [parity_pred] là sự điều chỉnh cần thiết để phản ánh sự dịch chuyển theo chiều dọc giữa các dòng của trường trên cùng và trường dưới cùng như được định nghĩa trong Bảng 7-12.

Bảng 7-12 - Định nghĩa c[parity_ref] [parity_pred]

parity_ref parity_pred c[parity_ref] [parity_pred]0 1 +11 0 -1

Vectơ chuyển động (hoặc các vec tơ chuyển động) được sử dụng để dự đoán độ chẵn lẻ đối diện sẽ được tính như sau:

111

TCVN xxxx : 2017

Trong trường hợp các trường ảnh chỉ cần một vector chuyển động như vậy và ở đây r = 2.Vì vậy, vector mã hoá chuyển động được sử dụng cho cùng một dự đoán chẵn lẻ là vector'[0][1:0] và chuyển động vector được sử dụng cho dự đoán chẵn lẻ đối diện là vector'[2][0][1:0].

Trong trường hợp của khung hình hai vectơ chuyển động như vậy là bắt buộc. Cả hai trường sử dụng vector chuyển động mã hoá (vector'[0][0][1:0]) để dự đoán cùng một chẵn lẻ. Trường đầu phải sử dụng vector'[2][0][1:0] để dự đoán chẵn lẻ đối diện và trường dưới cùng sẽ sử dụng vector'[3][0][1:0] để dự đoán chẵn lẻ đối diện.

7.6.3.7.Vectơ chuyển động cho các thành phần sắc màuCác vec tơ chuyển động được tính trong các khoản trước đó đề cập đến thành phần độ chói khi:

Vector[r][s][t] = vector’[r][s][t] (cho tất cả r, s và t)

Đối với mỗi thành phần của hai chất màu, các vec tơ chuyển động sẽ được thu nhỏ lại như sau:

4:2:0 - Cả hai thành phần ngang và dọc của vector chuyển động được chia tỷ lệ bằng cách chia cho hai:

Vector[r][s][0] = vector’[r][s][0]/2

Vector[r][s][1] = vector’[r][s][1]/24:2:2 - Thành phần nằm ngang của vector chuyển động được chia tỷ lệ bằng cách chia cho hai, thành phần dọc không bị thay đổi:

Vector[r][s][0] = vector’[r][s][0]/2

Vector[r][s][1] = vector’[r][s][1]/24:4:4 - Các vector chuyển động không đổi:

Vector[r][s][0] = vector’[r][s][0]Vector[r][s][1] = vector’[r][s][1]

7.6.3.8. Các hạn chế về ngữ nghĩa liên quan đến dự đoánĐó là một yêu cầu về dòng bit rằng nó sẽ chỉ yêu cầu của một bộ giải mã rằng dự đoán sẽ được thực hiện từ lát cắt thực sự mã hoá trong một khung tham chiếu hoặc trường tham khảo. Quy tắc này áp dụng ngay cả đối với các macroblocks và macroblocks đã bị bỏ qua trong ảnh P, trong đó giả sử rằng một vector chuyển động bằng không (như được giải thích trong mục 7.6.3.5).

Chú ý - Như đã giải thích trong mục 6.1.2 nó được. nói chung, không cần thiết cho các lát cắt để chứa toàn bộ hình ảnh. Tuy nhiên, ở nhiều mức quy định của các cấu hình được xác định, "cấu trúc lát cắt hạn chế" được sử dụng trong trường hợp các lát cắt bao phủ toàn bộ ảnh Trong trường hợp này, nguyên tắc ngữ nghĩa có thể được nói đơn giản hơn: "các vectơ sẽ không tham khảo các mẫu bên ngoài ranh giới của hình mã hoá."

7.6.3.9. Giấu các vectơ chuyển động Giấu vectơ chuyển động là các vec tơ chuyển động có thể được thực hiện bởi các macroblocks bên trong với mục đích giấu các lỗi nếu lỗi dữ liệu ngăn cản việc giải mã dữ liệu hệ số. Giấu vector chuyển động sẽ có mặt cho tất cả các macroblocks bên trong nếu

112

TCVN xxxx : 2017

(và chỉ khi nào) concealment_motion_vectors (trong picture_coding_extension()) có giá trị một.

Trong quá trình bình thường của các sự kiện không có dự đoán sẽ được hình thành cho các macroblocks như vậy (như mong đợi từ macroblock_intra = 1). Tài liệu Tiêu chuẩn kỹ thuật này không chỉ định cách phục hồi lỗi được thực hiện như thế nào. Tuy nhiên, nó là một khuyến cáo rằng giấu vectơ chuyển động thích hợp để sử dụng bởi bộ giải mã thực hiện việc giấu bằng cách định dạng các dự đoán như thể field_motion_type và frame_motion_type (có thể lấy mẫu dự đoán) có các giá trị sau:

Trong một trường ảnh: field_motion_type = "Field-based"; Trong một khung ảnh: frame_motion_type = "Frame-based".

Chú ý - Nếu giấu được sử dụng trong ảnh I, thì bộ giải mã cần thực hiện dự đoán tương tự như ảnh P.

Giấu vectơ chuyển động được sử dụng trong trường hợp lỗi dữ liệu dẫn đến mất thông tin. Do đó, có rất ít điểm trong việc mã hóa giấu vector chuyển động trong macroblock mà nó được dự định sử dụng vì nếu lỗi dữ liệu dẫn đến nhu cầu phục hồi lỗi thì nó rất có thể là bản thân giấu vector chuyển động sẽ bị mất hoặc bị hỏng. Kết quả là các quy tắc ngữ nghĩa sau phù hợp:

Đối với tất cả các macroblocks trừ những gì ở hàng dưới cùng của macroblocks vector che giấu chuyển động nên phù hợp để sử dụng trong macroblock nằm dọc dưới macroblock trong đó vector chuyển động xảy ra.

Khi vector chuyển động được sử dụng đối với macroblock được xác định trong quy tắc trước, bộ giải mã phải giả định rằng vector chuyển động có thể tham khảo các mẫu bên ngoài các lát được mã hoá trong khung tham chiếu hoặc trường tham chiếu.

Đối với tất cả các macroblocks trong hàng dưới cùng của macroblocks các vector chuyển động che giấu lại sẽ không được sử dụng. Do đó vector chuyển động (0;0) có thể được sử dụng để giảm chi phí không cần thiết.

7.6.4. Hình thành dự đoán

Dự đoán được hình thành bằng cách đọc các mẫu dự đoán từ các trường tham chiếu hoặc khung. Một mẫu được dự đoán bằng cách đọc mẫu tương ứng trong trường tham chiếu hoặc bù khung bởi vector chuyển động.

Một giá trị dương của thành phần nằm ngang của một vector chuyển động chỉ ra rằng dự đoán được thực hiện từ các mẫu (trong trường tham chiếu/khung) nằm ở bên phải của các mẫu được dự đoán.

Một giá trị dương của thành phần dọc của một vector chuyển động chỉ ra rằng dự đoán được thực hiện từ các mẫu (trong trường tham chiếu/khung) nằm dưới các mẫu được dự đoán.

Tất cả các vector chuyển động được chỉ định với độ chính xác của một nửa mẫu. Do đó, nếu một thành phần của vector chuyển động là lẻ, các mẫu sẽ được đọc từ giữa đường giữa các mẫu thực tế trong trường tham chiếu/khung. Các mẫu nửa được tính bằng phép nội suy tuyến tính đơn giản từ các mẫu thực tế.

Trong trường hợp dự đoán dựa trên trường, cần xác định hai trường có sẵn để sử dụng để hình thành dự đoán. Trong trường hợp của hai nguyên tố này được xác định trong đó một vector chuyển động có nguồn gốc cho cả hai trường và dự đoán được hình thành từ mỗi. Trong trường hợp tính toán dựa trên trường và 16x8 MC thêm một chút,

113

TCVN xxxx : 2017

motion_vertieal_field_select, được mã hoá để cho biết trường nào cần sử dụng.

Nếu motion_vertical_field_select bằng không, thì dự đoán được lấy từ trường tham chiếu trên cùng.

Nếu motion_vertical_field_select là một, thì dự đoán được lấy từ trường tham chiếu dưới cùng.

Đối với mỗi dự đoán chặn các vectơ chuyển động mẫu số nguyên int_vect(t) và nửa cờ mẫu half_flag[t] sẽ được hình thành như sau;

Sau đó, đối với mỗi mẫu trong khối dự báo, các mẫu được đọc và dự đoán nửa mẫu được áp dụng như sau:

Ở đây: pel_pred[y][x] là mẫu dự đoán đang được hình thành và pel_ref[y][x] là mẫu trong trường tham chiếu hoặc khung.

7.6.5. Lựa chọn vectơ chuyển động

Bảng 7-13 chỉ ra các chế độ dự đoán được sử dụng trong các trường ảnh và Bảng 7-14 cho thấy các dự đoán được sử dụng trong khung ảnh. Trong mỗi bảng các vectơ chuyển động có trong dòng bit được liệt kê theo thứ tự mà chúng xuất hiện trong dòng bit.

114

TCVN xxxx : 2017

Bảng 7-13 - Các dự đoán và các vectơ chuyển động trong các trường ảnh

field_motion

type

inacroblock_motion_-

Macro-block.-_intra vectơ chuyển

động Dự đoán được hình thành choforward backward

Field-baseda) 1 vector'[0][0][l:0]b) Không có (vector chuyển động là để giấu)

Field-based 1 1 0 vcctor'[0][0][1:0] vcctor'[0][1][1:0]

Toàn bộ trường, chuyển tiếp toàn bộ trường, lùi

Field-based 1 0 0 vector'[0][01[l:0] Toàn bộ trường, tiến

Field-based 0 1 0 vcctor'[0][l][l:0] Toàn bộ trường, lùiField-baseda) 0 0 0 vcctor'[0][0][l:0]c)d) Toàn bộ trường, tiến

1 6 x 8 M C 1 1 0 vector'[0][01[1:0] vector'[1][0][1:0] vcctor'[0][1]l1:0] vector'[l][l][l:0]

Trường trên cùng 16x8, chuyển tiếp Xuống trường 16x8, Trường trên cùng 16x8, Trường dưới cùng 16x8, lùi

1 6 x 8 M C 1 0 0 vector'[0][0][1:0] vector'! 1 ][0][1:0]

Trường trên cùng 16x8, Trường dưới cùng 16x8, tiến

1 6 x 8 M C 0 1 0 vector'[0][1][1:0] vector'[1][1][1 :0]

Trường trên cùng 16x8, Trường phía dưới 16x8, lùi

Dual prime 1 0 0 vcctor'(0][0][1:0] vector'[2][0][1:0]c)e)

Toàn bộ trường, từ cùng chẵn lẻ, chuyển tiếp

Toàn bộ trường, từ ngang bằng nhau, chuyển tiếp

a) field_motion_type không có trong dòng bit nhưng giả định là Field-based.

b) Các vector chuyển động chỉ có mặt nếu concealment_motion_vectors là một.

c) Các vector chuyển động này không có trong dòng bit.

d) Vectơ chuyển động được lấy là (0; 0) như được giải thích trong mục 7.6.3.5.

e) Các vec tơ chuyển động này có nguồn gốc từ vector '[0] [0] [1: 0] như mô tả trong mục 1.6.3.6.

Bảng 7-14 - Các dự đoán và các vectơ chuyển động trong khung hình ảnh

frame_-motion -

type

macroblock_motion- macro-block_intraforward backwar

dvector chuyển động Dự đoán được hình thành cho

Frame-baseda) - - 1 vector’[0][0][ 1:0]b) Không có (vector chuyển động là để che giấu)

Frame-based 1 1 0 vector’[0][0J[ 1:0] Khung, tiếnvector’[0][ 1 ][ 1:0] Khung, lùi

Frame-based 1 0 0 vecclor’[0][0][ 1:0] Khung, tiếnFrame-based 0 1 0 vector’[0][l][l:0] Khung, lùiFrame-baseda) 0 0 0 vector’[0][0][l:0Nc)d) Khung, tiếnField-based 1 1 0 vector'[0][0][ 1:0] Trường trên cùng, tiến

vector’l 1 ][0J[ 1:0] Trường dưới cùng, tiếnvector'[0][l][l:0] Trường trên cùng, lùivector’[ 1 ][ 1 ][ 1:0] Trường dưới cùng, lùi

115

TCVN xxxx : 2017

frame_-motion -

type

macroblock_motion- macro-block_intraforward backwar

dvector chuyển động Dự đoán được hình thành cho

Field-based 1 0 0 vector'[0][0][l:0] Trường trên cùng, tiếnvector'll ][0][ 1:0] Trường dưới cùng, tiến

Field-based 0 1 0 vcctor’[0][ 1 ][ 1:0] Trường trên cùng, lùivector^1][1][1:0] Trường dưới cùng, lùi

Dual prime 1 0 0 vector’[0][0]fl:0] Trường trên cùng, từ chẵn,tiếnvector'[0][0][ 1:0] Trường dưới cùng, từ chẵn, tiến

vector’[2][0J[ 1:0]c)e) Trường trên cùng, từ lẻ, tiếnvector,[3][0][l:0]c)e) Trường dưới cùng, từ sự chẵn lẻ đối

diện, về phía trướca) frame_motion_type không có trong dòng bit nhưng được cho là dựa trên khungb) Các vector chuyển động chỉ có mặt nếu concealment_motion_vectors là một.c) Các vec tơ chuyển động này không có trong dòng bit.d) Vectơ chuyển động được lấy là (0; 0) như được giải thích trong mục 7.6.3.5e) Các vectơ chuyển động này bắt nguồn từ vector '[0] [0] [1:0] như mô tả trong mục 7.6.3.6.Chú ý - Các vectơ chuyển động được liệt kê theo thứ tự chúng xuất hiện trong dòng bit.

7.6.6. Bỏ qua macroblocks

Macroblock bị bỏ qua là một macroblock mà không có dữ liệu nào được mã hóa, đó là một phần của một miếng mã hoá. Trừ khi bắt đầu một lát cắt, nếu số (macroblock_address - previous_macroblock_address == 1) lớn hơn không, thì con số này cho biết số macroblocks đã bị bỏ qua. Bộ giải mã sẽ tạo thành một dự đoán cho các macroblock được bỏ qua, sau đó sẽ được sử dụng như các giá trị lấy mẫu cuối cùng được giải mã.

Việc xử lý bỏ qua macroblocks là khác nhau giữa ảnh P và ảnh B. Ngoài ra, quá trình khác nhau giữa các trường ảnh và ảnh khung.

Không được bỏ qua các macroblocks trong ảnh ltrừ khi:

- picture_spatial_scalable_extension() theo sau picture_header() của ảnh hiện tại: hoặc

- sequence_scalable_extension() hiện diện trong dòng bit và scalable_mode = "SNR scalability".

7.6.6.1. Trường ảnh P dự đoán sẽ được thực hiện như thể trường chuyển động trường là "Field-based"; dự đoán sẽ được thực hiện từ trường cùng độ chẵn như trường được dự đoán: dự đoán các vector dự đoán sẽ được đặt lại về không; véc tơ chuyển động bằng 0. véc tơ chuyển động bằng 0.

7.6.6.3.Trường ảnh B Dự đoán sẽ được thực hiện như thể field_motion_type là "Field-based"; Dự đoán sẽ được thực hiện từ các trường của cùng một chẵn lẻ như trườngđược

dự đoán; Hướng của dự đoán trước/sau/hai chiều sẽ giống như macroblock trước đó; Dự đoán các vector dự đoán không bị ảnh hưởng; Các vec tơ chuyển động được lấy từ các dự đoán vector thích hợp. Việc tỉ lệ vectơ

116

TCVN xxxx : 2017

chuyển động cho các thành phần màu phải được thực hiện như mô tả trong 7.6.3.7.

7.6.6.4.Khung ảnh B Dự đoán sẽ được thực hiện như thể frame_motion_type là "Frame-based"; Hướng của dự đoán trước/sau/hai chiều sẽ giống như macroblock trước đó; Dự đoán vector dự đoán không bị ảnh hưởng: Các vec tơ chuyển động được lấy trực tiếp từ các phép dự đoán vector chuyển

động thích hợp. Việc tỉ lệ vectơ chuyển động cho các thành phần màu phải được thực hiện như mô tả trong 7.6.3.7.

7.6.7. Kết hợp các dự đoán

Giai đoạn cuối cùng là kết hợp các dự đoán cùng nhau để hình thành các khối dự đoán cuối cùng.

Cũng cần tổ chức dữ liệu thành các khối được tổ chức hoặc khung tổ chức để có thể được thêm trực tiếp vào hệ số giải mã.

Dữ liệu chuyển đổi là trường được tổ chức hoặc khung được tổ chức theo quy định của dct_type.

7.6.7.1.Dự đoán khung đơn giảnTrong trường hợp dự đoán khung đơn giản, việc xử lý tiếp theo chỉ có thể được yêu cầu là dự đoán trung bình về phía trước và sau trong ảnh B . Nếu pel_pred_forward[y][x] là mẫu dự đoán chuyển tiếp và pel_pred_backward[y][x] là dự đoán ngược tương ứng, sau đó mẫu dự đoán cuối cùng sẽ được hình thành như sau:

pel_pred [y] fx] = (pcl_pred_forward [y] [x) + pcl_pred_backward [y] [x]) // 2Các dự đoán về các thành phần độ sắc màu của các định dạng 4:2:0, 4:2:2 và 4:4:4 sẽ có kích thước 8 mẫu bằng 8 dòng, 8 mẫu bằng 16 dòng và 16 mẫu theo 16 dòng tương ứng.

7.6.7.2. Dự đoán trường đơn giảnTrong trường hợp dự đoán trường đơn giản (tức là không có 16 x 8 hoặc hai nhân tố chính) thì chỉ cần 'xử lý tiếp theo' là dự đoán trung bình về phía trước và ngược lại trong ảnh B . Việc này sẽ được thực hiện như được chỉ rõ cho "Dự đoán khung" trong phần trước.

Trong trường hợp dự đoán trường đơn giản trong ảnh khung, các dự đoán về các thành phần màu của các định dạng 4:2:0, 4:2:2 và 4:4:4 cho mỗi trường phải có kích thước 8 mẫu bằng 4 dòng, 8 mẫu bằng 8 dòng và 16 mẫu theo 8 dòng tương ứng.

Trong trường hợp dự đoán trường đơn giản trong một trường ảnh, dự đoán các thành phần độ sắc mầu của các định dạng 4:2:0, 4:2:2 và 4:4:4 cho mỗi trường phải có kích thước 8 mẫu bằng 8 dòng, 8 mẫu bằng 16 dòng và 16 mẫu theo 16 dòng tương ứng.

7.6.7.3. Bù chuyển động16x8Trong chế độ dự đoán này, dự đoán riêng biệt được tạo ra cho vùng trên 16x8 của macroblock và vùng 16x8 dưới của macroblock.

Các dự đoán về các thành phần sắc mầu, cho mỗi vùng 16x8, các định dạng 4:2 0, 4:2:2 và 4:4:4 phải có kích thước 8 mẫu bằng 4 dòng, 8 mẫu bằng 8 dòng và 16 mẫu xuống 8 dòng tương ứng.

7.6.7.4. Nguyên tố kép - Dual primeTrong chế độ nguyên tố kép, hai dự đoán được hình thành cho mỗi trường tương tự như dự dự đoán và sau trong ảnh B . Nếu pel_pred_same_parity[y][x] là mẫu dự đoán từ cùng

117

TCVN xxxx : 2017

một trường chẵn lẻ và pel_pred_opposite_parity[y][x] là mẫu tương ứng từ trường chẵn lẻ đối diện thì mẫu dự đoán cuối cùng sẽ được hình thành như sau:

pel_pred[y)[x] = (pel_pred_same_parity[y][x] + pel_pred_opposite_parity[y] [x]) // 2;

Trong dự đoán hai nguyên tố trong ảnh khung, dự đoán các thành phần màu của từng trường 4:2:0, 4:2:2 và 4:4:4 sẽ có kích thước 8 mẫu bằng 4 dòng. 8 mẫu bằng 8 dòng và 16 mẫu theo 8 dòng tương ứng.

Trong trường hợp dự đoán nhân đôi trong một trường ảnh , dự đoán các thành phần chất màu thuộc các định dạng 4:2:0, 4:2:2 và 4:4:4 sẽ có kích thước 8 mẫu bằng 8 dòng, 8 mẫu của 16 dòng và 16 mẫu của 16 dòng tương ứng.

7.6.8. Thêm dữ liệu dự đoán và hệ số

Các khối dự đoán đã được hình thành và tổ chức thành các khối các mẫu dự đoán p[y][x] phù hợp với cấu trúc khung mã vạch kết nối được sử dụng bởi các khối dữ liệu biến đổi.

Dữ liệu chuyển đổi f[y][x] sẽ được thêm vào dữ liệu dự đoán và bão hòa để tạo thành các mẫu được giải mã cuối cùng d [y] [x] như sau:

7.7. Khả năng mở rộng không gian

Phần dưới đây xác định quá trình giải mã bổ sung được yêu cầu cho các phần mở rộng không gian có thể mở rộng.

Cả lớp thấp hơn và lớp tăng cường sẽ sử dụng "cấu trúc lát cắt bị hạn chế" (không có khoảng trống giữa các lát cắt).

Hình 7-13 là một sơ đồ của quá trình giải mã video với khả năng mở rộng không gian. Sơ đồ được đơn giản hóa cho rõ ràng.

7.7.1. Cấu trúc cú pháp cao hơn

Nói chung, lớp cơ sở của một phân cấp không gian có thể mở rộng có thể phù hợp với bất kỳ tiêu chuẩn mã hóa bao gồm ở trong ITU-T H.261 ǀ ISO/IEC 11172-2 và Tiêu chuẩn kỹ thuật này. Tuy nhiên, lưu ý rằng trong Tiêu chuẩn kỹ thuật này, tính giải mã của một phân cấp không gian có thể mở rộng không gian chỉ được xem xét trong trường hợp lớp cơ sở phù hợp với Tiêu chuẩn kỹ thuật này hoặc ISO/IEC 11172-2.

Do "mất khớp nối" của các lớp chỉ có một giới hạn cú pháp là cần thiết trong lớp tăng cường nếu cả lớp thấp hơn và lớp tăng cường được xen kẽ nhau. Trong trường hợp đó, picture_structure phải lấy giá trị tương tự như trong khung tham chiếu được sử dụng để dự đoán từ lớp dưới. Xemmục 7.7.3.1 để biết cách nhận dạng đối tượng khung tham chiếu.

7.7.2. Dự đoán trong lớp tăng cường

Một dự đoán bù theo thời gian được thực hiện từ các khung tham chiếu trong lớp tăng cường như mô tả trong 7.6. Ngoài ra, dự đoán theo không gian được hình thành từ khung giải mã lớp dưới (dlower[y][x]), như được mô tả trong mục 7.7.3 Các dự đoán này được

118

TCVN xxxx : 2017

chọn riêng lẻ hoặc kết hợp để tạo thành dự đoán thực tế.

Nói chung, tối đa bốn dự đoán riêng biệt được tạo ra cho mỗi macroblock được kết hợp lại với nhau để tạo thành macroblock dự đoán cuối cùng p[y][x].

Trong trường hợp macroblock không được mã hóa, hoặc vì toàn bộ macroblock bị bỏ qua hoặc macroblock cụ thể không được mã hoá, không có hệ số dữ liệu. Trong trường hợp này f[y][x] là 0 và các mẫu được giải mã chỉ là dự đoán, p[y][x].

Hình 7-13 - Quá trình bù đơn giản cho khả năng mở rộng theo không gian

7.7.3. Hình thành dự đoán theo không gian

Hình thành dự đoán theo không gian đòi hỏi phải xác định được khung tham chiếu chính xác và xác định của quá trình lấy mẫu theo không gian, được thực hiện trong các phần sau đây.

Quá trình lấy mẫu lại được xác định là toàn bộ khung, tuy nhiên, việc giải mã của một macroblock. chỉ cần khu vực 16x16 trong khung được lấy mẫu lên, tương ứng với vị trí của macroblock này, là cần thiết.

119

TCVN xxxx : 2017

7.7.3.1.Lựa chọn khung tham chiếuCác dự đoán theo không gian được làm từ khung tái tạo của lớp dưới được tham chiếu bởi lớp thấp hơn i_strength_reference. Tuy nhiên, nếu các dòng bit thấp hơn và các lớp bit tăng cường được nhúng tronghệ thống ITU-T H 220.0 ǀ ISO/IEC 13818-1, thông tin được ghi đè bởi thông tin theo thời gian cho bởi giải mã mốcthời gian (DTS) trong tiêu đề PES.

Chú ý Nếu group_of_picture_headerd() xảy ra thường xuyên ở dòng bit lớp thấp hơn thì tham chiếu theo thời gian ở lớp dưới có thể không rõ ràng (bởi vì temporal_reference được thiết lập lại sau khi một nhóm group_of_picture_headerd()

ảnh được dựng lại từ dự đoán theo không gian được thực hiện theo những điều sau đây:

Ảnh lớp thấp hơn được giải mã hoặc đồng nhất gần nhất. Ảnh I hoặc ảnhPlớp thấp hơn được giải mã hoặc đồng nhất gần nhất Ảnh I hoặc ảnh P lớp thấp hơn đầu tiên được giải mã gần đây nhất thứ hai cung

cấp lớp thấp hơn không có low_delay được đặt là '1'. Lưu ý thêm rằng khả năng mở rộng theo không gian sẽ chỉ làm việc hiệu quả khi dự đoán được hình thành từ các khung trong lớp dưới cũng đồng nhất (hoặc rất gần) trong thời gian hiển thị với khung dự đoán trong lớp tăng cường.

7.7.3.2.Quá trình lấy mẫu lạiMô hình dự đoán theo không gian được thực hiện bằng cách lấy mẫu lại khung hình tái tạo ở tầng dưới cùng với lưới mẫu giống như lớp tăng cường. Lưới này được xác định trong đề mục tọa độ khung, ngay cả khi một lớp khung xen kẽ thấp hơn thực sự được mã hoá bằng một cặp trườngảnh.

Quá trình lấy mẫu lại này được minh họa trong hình 7-14

Hình 7-14 - Sự hình thành dự đoán "theo không gian" bằng cách nội suy ảnh lớp dưới

Các dự đoán theo không gian sẽ chỉ được thực hiện cho các macroblock trong lớp tăng cường hoàn toàn nằm trong khung tái tạo lớp dưới.

Quá trình lấy mẫu phụ thuộc vào việc liệu lớp khung tái tạo ở phía dưới đượcxen kẽ hay

120

TCVN xxxx : 2017

liên tiếp, như được chỉ ra bởi lớp khung liên tiếp dưới và liệu lớp khung tăng cường có được xen kẽ hay liên tiếp như được chỉ ra bởi progressive_frame.Khi lower_layer_progressive_frame là '1'. Khung tái tạo lớp dưới (được đổi tên thành prog_pic) được làm lại theo chiều dọc như mô tả trong mục 7.7.3. 4 Khung thu được được coi là liên tiếp nếu progressive_frame là '1' và được xen kẽ, nếu khung liên tiếp là '0', Khung thu được được lấy mẫu lại mẫu theo chiều ngang như mô tả trong mục 7.7.3.6. lower_layer_deinterlaced_field_select sẽ có giá trị '1'.

Khi lower_layer_progressive_frame là '0' và progressive_frame là '0', mỗi trường tái tạo ở lớp dưới được xen kẽ lại như mô tả trong mục 7.3.4 để tạo ra một trường liên tiếp (prog_pic). Trường này được lấy mẫu lại theo chiều dọc như mô tả trong mục 7.7.3.5. Trường thu được được lấymẫu lại theo chiều ngang như mô tả trong mục 7.7.3.6. Cuối cùng, trường thu được được lấy mẫu để tạo ra trường xen kẽ.lower_layer_deinterlaced_field_select sẽ có giá trị '1'

Khi lower_layer_progressive_frame là '0' và progressive_frame là '1', mỗi trường tái tạo ở lớp dưới là khung xen kẽ lại như mô tả trong mục 7.7.3.4. để tạo ra một trường xen kẽ (prog_pic). Chỉ cần một trong các trường này là bắt buộc. Khi lower_layer_deinterlaced_field_select là '0' trường trên cùng được sử dụng, nếu không thì sử dụng trường dưới cùng. Loại được sử dụng được lấy mẫu lại theo chiều dọc như mô tả trong mục 7 7.3 5. Khung thu được được lấy mẫu lại theo chiều ngang như mô tả trong mục 7.7.3 6.

Đối với các khung xen kẽ, nếu các khung hiện tạilà mã hoá dưới dạng trường ảnh, quy trình tái xen kẽ được mô tả trong mục 7.7.3.5 được thực hiện trong trường.

lower_layer_vertical_offsetvà lower_layer_horizontal_offset, xác định vị trí của lớp dưới trong khung hiện tại, sẽ được tính đến trong lấy mẫu lại xác định trong mục 7.7.3.5 và mục 7.7.3.6 tương ứng. Bù lớp thấp hơn được giới hạn ở các giá trị khi độ sắc mầu trong lớp tăng cường được lấy mẫu trong chiều đó để sắp xếp các mẫu độ sắc giữa hai lớp

Quá trình lấy mẫu được tổng kết trong Bảng 7-15.

Bảng 7-15 - Quá trình lấy mẫu

7.7.3.3.Xử lý các thành phần sắc màuDo các lưới lấy mẫu khác nhau của các thành phần độ chói và độ sắc, một số biến được sử dụng trong mục 7.7.3.4 đến mục 7.73.6 có các giá trị khác nhau cho độ chói và sắc màu lấy mẫu lại. Hơn nữa, nó cho phép các định dạng độ sắc màu ở tầng dưới và lớp tăng cường khác nhau.

Bảng 7-16 định nghĩa các giá trị cho các biến được sử dụng trong mục 7.7.3.4 đến mục 7.7.3.6

121

TCVN xxxx : 2017

Bảng 7-16 - Các biến nội bộ được sử dụng trong mục 7.7.3.3 đến mục 7.7.3.6

Biến Giá trị cho việc xử lý lý độ chói Giá trị cho việc xử lý sắc màu

11_h_size lower_layer_prediction_horizontal_size lower_layer_prediction_horizontal_size / chroma_ratio_honzontal[lower]

11_v_size lower_layer_prediction_vertical_size lower_layer_prediction_vertical_size/ chroma_ratio_veitcal[lower]

11_h_offset Lower_layer_horizontal_offset lower_layer_horizontal_offset / chroma ratio_horizontal_[enhance]

11_v_offset lower_layer_vertical_offset lower_layer_vertical_offset / chroma_ratio_vertical[enhance]

H_subs_m horizontal_subsampling_factor_m horizontal_subsampling_factor_mH_subs_n horizontal_subsampling_factor_n horizontal_subsampling_factor_n * format

ratio_horizontalV_subs_m vertical_subsampling_factor_m vertical_subsampling_factor_mv_subs_n vertical_subsampling_factor_m vertical_subsampling_factor_n *

format_ratio_vertical

Các bảng 7-17 và 7-18 đưa ra các định nghĩa bổ sung.

Bảng 7-17 - Tỉ lệ lấy mẫu màu cho lớp = {thấp hơn, nâng cao}Định dạng sắc độ Tỷ lệ sắc màu Tỷ lệ sắc màu

tầng thấp hơn ngang[layer] Dọc[layer]4:2:0 2 24:2:2 2 14:4:4 1 1

Bảng 7-18 - Tỷ lệ định dạng sắc màuĐịnh dạng sắc độ Định dạng sắc độ format_ratio Format_ratio

Lớp thấp hơn lớp tăng cường horizontal vertical4:2:0 4:2:0 1 14:2:0 4:2:2 1 24:2:0 4:4:4 2 24:2:2 4:2:2 1 14:2:2 4:4:4 2 14:4:4 4:4:4 1 1

7.7.3.4. Tháo gỡNếu không cần phải tháo gỡ (theo Bảng 7-16), khung tái tạo dưới lớp (d lower[y][x]) được đổi tên thành input_pic.Thứ nhất, mỗi trường lớp dưới được đệm bởi các số không để tạo thành một lưới liên tiếp với tốc độ khung bằng với tốc độ trường của lớp dưới và với cùng số dòng và mẫu trên mỗi dòng như khung dưới. Bảng 7-19 xác định cụ thể các bộ lọc sẽ được áp dụng tiếp theo. Thành phần độ chói được lọc bằng bộ lọc độ trường mở có liên quan nếu picture_structure = = "Frame-picture" hoặc bằng cách sử dụng một bộ lọc khẩu độ trường.

122

TCVN xxxx : 2017

Thành phần sắc màu được lọc bằng một bộ lọc khẩu độ trường.

Bảng 7-19 - Bộ lọc tháo gỡ

Hai khẩu độ trường Một khẩu độ trường

Theo thời gian

Chiều dọcBộ lọc cho trường

đầu tiênBộ lọc cho trường

thứ haiBộ lọc (cả hai trường)

-1 -2 0 -1 0-1 0 0 2 0-1 2 0 -1 00 -1 8 8 80 0 16 16 160 1 8 8 81 -2 -1 0 01 0 2 0 01 +2 -1 0 0

Các cột thời gian và chiều dọc của Bảng 7-19 chỉ ra các toạ độ không gian và thời gian tương đối của các mẫu mà các vòi lọc được xác định trong hai cột khác áp dụng. Một khoản tiền trung gian được hình thành bằng cách thêm các hệ số nhân với nhau.

Đầu ra của bộ lọc (tổng hợp) được thu nhỏ theo công thức sau:

prog_pic[y][x] = sum // 16

và bão hoà nằm trong khoảng [0: 255]

Khẩu độ lọc có thể mở rộng ra ngoài kích thước ảnh mã hoá. Trong trường hợp này, các mẫu của các dòng bên ngoài ảnh hoạt động sẽ lấy giá trị của mẫu hiện tại lân cận gần nhất (bên dưới hoặc trên) của cùng một trường như được định nghĩa dưới đây.

Đối với tất cả các mẫu [y] [x]:

7.7.3.5. Tái lấy mẫu theo chiều dọcKhung phải được lấy mẫu lại theo chiều dọc, prog_pic, được lấy mẫu lại cho lưới lấy mẫu theo chiều dọc bằng cách sử dụng nội suy tuyến tính giữa các vị trí mẫu theo công thức sau, trong đó vert_pic là trường thu được:

vert_pic[yh + 11_v_offset][x] = (16 - phase)*prog_pic[y1][x] + phase *prog_pic [y2][x]

123

TCVN xxxx : 2017

Ở đây:

yh+ 11_v_offset = output sample co-ordinate in vert_pic

y1 = (yh * v_subs_m) / v_subs_n

y2 = y1 + 1 nếu y1 <11_v_size - 1

y1 otherwise

phase = (16 * (( yh * v_subs_m) % v_subs_n)) // v_subs_n

Các mẫu nằm ngoài khung tái tạo ở phía dưới được yêu cầu cho việc lấy mẫu bằng cách mở rộng biên của khung tái tạo lớp dưới.

Chú ý - Tính toán của pha giả định rằng vị trí mẫu trong lớp tăng cường tại yh = 0 là không đồng bộ trùng với vị trí mẫu đầu tiên của lớp dưới Điều này được nhận ra rằng đây là một xấp xỉ cho các thành phần chất màu nếu màu sắc định dạng = 4:2:0.

7.7.3.6. Tái lấy mẫu theo chiều ngangKhung phải được lấy mẫu lại theo chiều ngang, vert_pic, được lấy mẫu lại cho lưới lấy mẫu nằm ngang bằng cách sử dụng nội suy tuyến tính giữa các vị trí mẫu theo công thức sau, trong đó hor_pic là trường kết quả:

hor_pic[y][xh + 11_h_offset] = ((16 - phase)*vert_pic[y][x1] + phase * vert_pic[y][x2]) // 256

Ở đây:

xh+ 11_h_offset = output sample co-ordinate in hor_pic

x1 = (xh * h_subs_m) / h_subs_n

x2 = x1 + 1 nếu x1<11_h_size - 1

x1 otherwise

phase = (16 * (( xh * h_subs_m) % h_subs_n)) // h_subs_n

Các mẫu nằm ngoài khung tái tạo ở phía dưới được yêu cầu cho việc lấy mẫu bằng cách mở rộng biên của khung tái tạo dưới lớp.

7.7.3.7. Lấy lại xen kẽNếu tách lại không cần phải làm, kết quả của quá trình lấy mẫu lại, hor_pic, được đổi tên thành spat_pred_pic.

Nếu hor_pic đã được bắt nguồn từ trường trên của một xen kẽ khung lớp thấp, các dòng chẵn của hor_pic được sao chép vào các dòng chẵn của spat_pred_pic.

Nếu hor_pic đã được bắt nguồn từ trường dưới cùng của một khung xen kẽlớp thấp, các dòng lẻ của hor_pic được sao chép vào các dòng lẻ của spat_pred_pic.

Nếu hor_pic đã được bắt nguồn từ một khung liên tiếp lớp thấp, hor_pic được sao chép vào spat_pred_pic.

7.7.4. Lựa chọn và kết hợp dự đoán không gian và thời gian

Các dự đoán không gian và thời gian có thể được lựa chọn hoặc kết hợp để tạo thành dự đoán thực tế. Macroblock_type (xem Bảng B.5, B.6 và B.7) và mã trọng số không gian thêm thời gian (xem Bảng 7-21) chỉ ra, bằng cách sử dụng spatial_temporal_weight_class, cho dù dự đoán chỉ là thời gian, không gian chỉ hoặc một sự kết hợp có trọng số các dự đoán thời gian và không gian. Các lớp học được định nghĩa theo cách sau:

Lớp 0 chỉ ra dự đoán theo thời gian; Lớp I chỉ ra rằng trường không có dự đoán theo không gian; Lớp 2 chỉ ra rằng trường trên cùng là dự đoán theo không gian;

124

TCVN xxxx : 2017

Lớp 3 chỉ ra rằng trường dưới cùng là dự đoán theo không gian; Lớp 4 chỉ ra dự đoántheokhông gian.

Trong ảnh bên trong, nếu trọng số không gian là 0, bình thường mã hóa bên trong được thực hiện; nếu không, dự đoán chỉ là theo không gian. Trong các ảnh dự đoán và nội suy, nếu spatial_temporal_weight_class là 0, dự đoán chỉ là theo thời gian, nếu spatial_temporal_weight_class là 4, dự đoán chỉ là theo không gian; nếu không, một hoặc một cặp trọng số dự đoán được sử dụng để kết hợp các dự đoán theo không gian và theo thời gian.

Các spatial_temporal_weights có thể được đưa ra trong một bảng trọng số được lựa chọn trong phần mở rộng mở rộng không gian ảnh. Có thể sử dụng đến 4 bảng trọng số khác nhau tùy thuộc vào việc lớp hiện tại và lớp dưới có xen kẽ hoặc liên tiếp, như được chỉ ra trong Bảng 7-20 (cho phép, nhưng không khuyến khích, các giá trị được đưa ra trong ngoặc đơn).

Bảng 7-20 - Giá trị dự kiến (cho phép) spatial_temporal_weight_code_table_index

Định dạng lớp thấp hơn Định dạng lớp tăng cường

spatial_temporal_weight_code_table_index

Liên tiếp hoặc xen kẽ Liên tiếp 00

Trùng lặp liên tiếp với các trường lớp tăng cường trên cùng

Xen kẽ 10 (00, 01, 11)

Trùng lặp liên tiếp với các trường lớp tăng cường dưới cùng

Xen kẽ 01 (00, 10, 11)

Xen kẽ (picture_structure == Frame-Picture) Xen kẽ 00 hoặc 11 (01, 10)

Xen kẽ(picture_structure != Frame-Picture) Xen kẽ 00

Trong macroblock_modes(), mã hai bit, spatial_temporal_weight_code, được sử dụng để mô tả dự đoán cho mỗi trường (hoặc khung), như được biểu thị trong Bảng 7-21. Trong bảng này spatial_temporal_integer_weight các identities những spatial_temporal_weight_codes cũng có thể được sử dụng với dự đoán nguyên tố kép (xem Bảng 7-22, 7-23).

Bảng 7-21 - spatial_temporal_weight Và spatial_temporal_weight_classes cho spatial_temporal_weight_code_table_index và spatial_temporal_weight_codes

spatial_temporal_ spatial_ spatial_ spatial_ spatial_weight_code_table

.tempora_ temporal_ temporal_ temporal_

_Index welght_code weight(s) weight class integer_weight

00a) - (0.5) 1 001 00 (0.1) 3 1

01 (0:0.5) 1 010 (0.5; 1 ) 3 011 (0,5; 0,5) 1 0

10 00 (1:0) 2 101 (0.5; 0) 1 010 (1:0.5) 2 011 (0.5; 0.5) 1 0

11 00 (1:0) 2 101 0:0.5) 2 0

125

TCVN xxxx : 2017

spatial_temporal_ spatial_ spatial_ spatial_ spatial_weight_code_table

.tempora_ temporal_ temporal_ temporal_

_Index welght_code weight(s) weight class integer_weight

10 (0.5; 1 ) 3 011 (0.5.0,5) 1 0

a) Đối với spatial_temporal_weight_code_table_index == 00 không có spatial_temporal_weight_codes được truyền đi

Chú ý - Chỉ dự đoán theokhông gian (weight_class == 4) được báo hiệu bởi các giá trị khác nhau của kiểu macroblock khác nhau (xem Bảng B.5 đến B.7).

Khi kết hợp spatial_temporal_weight được đưa ra dưới dạng (a: b), "a" cho tỷ lệ dự đoán cho trường trên cùng có nguồn gốc từ dự đoán theo không gian và "b" cho tỷ lệ dự đoán cho trường dưới cùng mà được lấy từ dự đoán theo không gian cho trường đó.

Khi tệp spatial_temporal_weight được đưa ra dưới dạng (a), "a" cho tỷ lệ dự đoán cho ảnh bắt nguồn từ dự đoán theo không gian cho ảnh đó.

Phương pháp chính xác để tính toán dự đoán là như sau:

pel_pred_temp[y][x] được sử dụng để biểu thị dự đoán thời gian (được hình thành bên trong lớp tăng cường) như được định nghĩa cho pel_pred[y][x] trong 7.6. pel_pred_spat[y][x] được sử dụng để biểu thị dự đoán được hình thành từ tầng dưới bằng cách chiết xuất các mẫu phù hợp, cùng với vị trí macroblock hiện tại, từ spat_pred_pic.

Nếu spatial_temporal_weight là không, thì không có dự đoán nào được thực hiện từ lớp dưới. Vì thế:

pel_pred[y][x] = pel_pred_temp[v][x];Khi progressive_frame = = 0 độ sắc màu được coi là xen kẽ, nghĩa là, trọng số đầu tiên được sử dụng cho các dòng sắc màu trên cùng của trường và trọng số thứ hai được sử dụng cho các dòng sắc màu trường dưới cùng.

Việc bổ sung dữ liệu dự đoán và hệ số được thực hiện như trong mục 7.6.8.

7.7.5. Cập nhật các dự đoán vector chuyển động và lựa chọn vector chuyển động

Trong khung ảnh nơi dự đoán trường được sử dụng, khả năng tồn tại của một trong các trường được sử dụng chỉ sử dụng không gian dự đoán. Trong trường hợp này, không có vector chuyển động nào có trong dòng bit đối với trường dữ liệu có dự đoán theokhông gian. Cho trường hợp cả hai trường của một khung có dự đoán chỉ theo không gian (spatial-only), như vậy macroblock_type là không có vectơ chuyển động có mặt trong dòng bit cho macroblock đó.

Bảng 7-22 - Cập nhật dự đoán các vectơ chuyển động trong các trường ảnh

126

TCVN xxxx : 2017

7.7.5.1. Đặt lại các dự đoán của vector chuyển độngNgoài các trường hợp được xác định trong 7.6.3.4, các dự đoán vector chuyển động sẽ được đặt lại trong các trường hợp sau:

• Trong một ảnh P khi một macroblock là dự đoán theo không gian thuần túy (spatial_temporal_weight_classes == 4)  Trong ảnh B khi một macroblock được dự đoán không gian thuần túy (spatial_temporal_weight == 4)Chú ý: Trong trường hợp không gian trọng số theo thời gian == 2 trong một khung ảnh khi dự đoán dựa trên trường được sử dụng, vector truyền đi được áp dụng cho trường dưới cùng (xem bảng 7-25). Tuy nhiên, vectơ [0][s][1:0] này được dự đoán từ PMV[0][s][1:0].PMV[0][s][ 1:0]được cập nhật như trong Bảng 7 23.

7.7.6. Bỏ qua macroblocks

Trong tất cả các trường hợp, một macroblock bị bỏ qua là kết quả của một dự đoán chỉ, và tất cả các hệ số DCT được coi là số không.

Nếu sequence_scalable_extension có mặt và scalable_mode = "spatial scalability", các quy tắc sau áp dụng ngoài các quy định trong mục 7.6.6.

Bảng 7-23 - Cập nhật các dự đoán vector chuyển động trong khung hình ảnh

127

TCVN xxxx : 2017

a) frame_motion_type không có trong dòng bits nhưng giả định là Frame-based.b) Không thể sử dụng nguyên tố kép (Dual Prime) khi spatial_temporal_integer_weight = '0'.c) Nếu các vectơ chuyển động che giấu là 0 thì PMV[r][s][t] được đặt là 0 (cho tất cả các r và s).d) PMV[r][s][t] được đặt là 0 (cho tất cả các r, s và t). Mục 7.6.3.4

Trong ảnh l. bỏ qua macroblocks được cho phép. Đây được định nghĩa là dự đoán không gian.

Trong ảnh P và ảnh B, macroblockđã bỏ qua chỉ là dự đoán thời gian.

Trong ảnh B, một macroblock bỏ qua sẽ không theo một macroblock được dự đoán không gian.

7.7.7. Sự tràn bộ đệm VBV ở tầng dưới

Trong trường hợp khả năng mở rộng không gian, tràn bộ đệm VBV ở tầng dưới có thể gây ra vấn đề. Điều này là do sự không chắc chắn có thể trong chính xác mà khung sẽ được lặp lại bởi một bộ giải mã cụ thể.

7.8. Khả năng mở rộng SNR

Xem hình 7-15.

Mục này mô tả quá trình giải mã bổ sung yêu cầu cho các phần mở rộng có khả năng mở rộng SNR.

Khả năng mở rộng SNR định nghĩa một cơ chế để tinh chỉnh các hệ số DCT được mã hóa trong một lớp khác (thấp hơn) của một phân cấp có thể mở rộng. Như được minh họa trong hình 7-15, dữ liệu từ hai dòng bit được kết hợp sau các quy trình lượng tử đảo

128

TCVN xxxx : 2017

ngược bằng cách thêm các hệ số DCT. Cho đến khi dữ liệu được kết hợp, các quá trình giải mã của hai lớp độc lập với nhau.

Bảng 7-24 - Các dự đoán và vector chuyển động trong khung ảnh

a) Field_motion_type không có trong dòng bit nhưng giả định là Field-basedb) Các vector chuyển động nó chỉ hiện diện nếu concealment_motion_vectors là một.c) Các vec tơ chuyển động này không có trong dòng bit.d) Vectơ chuyển động được lấy là (0; 0) như được giải thích trong mục 7.6.3.5.

Mục 7.7.1 xác định làm thế nào để xác định các dòng bits trong một phân cấp khả năng mở rộng; tuy nhiên, chúng có thể được phân loại như sau.

Lớp thấp hơn, có nguồn gốc từ dòng bit đầu tiên, có thể tự hoặc không thể mở rộng được hoặc yêu cầu quy trình giải mã không gian hoặc thời gian mở rộng (và do đó giải mã các dòng bit bổ sung) được áp dụng

Tầng tăng cường, xuất phát từ dòng bit thứ hai, chứa các hệ số DCT mã hoá chủ yếu và một chi phí nhỏ Quá trình giải mã cho lớp này và sự kết hợp của hai lớp được mô tả trong phần dưới đây.Chú ý -. Tất cả các thông tin liên quan đến dự đoán chứa trong dòng bit lớp thấp hơn. Do đó không thể tái tạo lại một lớp tăng cường mà không cần giải mã dữ liệu dòng bit ở lớp thấp hơn song song

Hơn nữa, dự đoán và xây dựng lại các ảnh như mô tả trong mục 7.6.7.7 và mục 7.6 cho kết hợp thấp hơn và lớp tăng cường là giống hệt nhau để sống các bước tương ứng để chỉ giải mã các lớp thấp hơn

Giải thích ngữ nghĩa và quá trình giải mã được mô tả trong phần phụ này bao gồm một cơ chế "chroma simulcast". Điều này có thể được sử dụng (ví dụ) để tăng cường 4:2:0 trong

129

TCVN xxxx : 2017

lớp dưới lên 4:2:2 thay đổi xử lý dữ liệu lớp nâng cao. Trong khi dữ liệu độ chói được xử lý như được mô tả trước đây, trong trường hợp này, thông tin về độ sắc màu lấy ra phía trước (trừ các giá trị intra-DC, xem mục 7.8.3.4) sẽ được loại bỏ và thay thế bằng các thông tin mới với độ phân giải sắc màu cao hơn được giải mã từ lớp tăng cường.

Bảng 7-25 - Các dự đoán và vector chuyển động trong khung hình ảnh

130

TCVN xxxx : 2017

a) kiểu chuyển động của khung không có trong dòng bit nhưng được cho là Frame-based..b) Không thể sử dụng Dual Prime khi không gian trọng số nguyên = '0'.c) Vectơ chuyển động chỉ hiện diện nó là các vec tơ vectơ che giấu là mộtd) Các vec tơ chuyển động này không có trong dòng dòng bit e) Vectơ chuyển động được tính là (0: 0) như được giải thích trong mục 7.6.3.5.

Đó là vốn có trong khả năng mở rộng SNR mà hai lớp kết hợp rất chặt chẽ với nhau. Yêu cầu các ảnh tương ứng trong mỗi lớp phải được giải mã đồng thời với nhau.

Trong trường hợp dòng bit lớp thấp phù hợp với ISO/IEC 11172-2 (và không phải là Tiêu chuẩn kỹ thuật này), thì hai chương trình điều khiển không phù hợp IDCT khác đang được sử dụng trong việc giải mã. Cần lưu ý đến bộ mã hóa để xem xét việc này.

7.8.1. Cấu trúc cú pháp cao hơn

Hai lớp dòng bit trong mục này được xác định bởi layer_id của chúng, được giải mã từ sequence_scalable_extension.

Hai dòng bit phải có các layer_id liên tiếp, với dòng bit tăng cường tầng có layer_id = idenhance và dòng bit lớp thấp có layer_id = idenhance -1

Cú pháp và ngữ nghĩa của lớp tăng cường tương ứng như được định nghĩa trong mục 6.2 và mục 6.3.

Trong trường hợp mà các dòng bit lớp thấp phù hợp với ISO/IEC 11172-2 (và không phải là Tiêu chuẩn kỹ thuật này), sau đó cả hai này thấp hơn và lớp tăng cường sẽ sử dụng "cấu trúc mảnh hạn chế" được xác định trong Tiêu chuẩn kỹ thuật này.

Ngữ nghĩa hạn chế áp dụng cho một số giá trị trong tiêu đề và phần mở rộng của lớp tăng cường như sau.

131

TCVN xxxx : 2017

Hình 7-15 - Mô tả quá trình giải mã cho khả năng mở rộng SNRTiêu đề chuỗiTiêu đề này phải giống với tiêu đề ở dòng bit bên dưới, ngoại trừ các giá trị của bit_rate, vbv_buffer_size, load_intra_quantiser_matrix. intra_quantiser_nuitrix, load_non_intra_quantiser_matrix và non_intra_quantiser_niatrix. Chúng có thể được lựa chọn độc lập, ngoại trừ load_intra_quantiser_matrix sẽ bằng 0.

Mở rộng hiển thị chuỗiPhần mở rộng này sẽ giống với phần ở dòng bit bên dưới trừ các giá trị của profile_and_level_indication, chroma_format, tốc độ bit và vbv_buffer_size_extension. Những gì có thể được lựa chọn một cách độc lập.

Một giá trị khác nhau của sắc màu trong mỗi lớp sẽ làm cho cờ phát sóng (simulcast) sắc màu được thiết lập như được xác định bởi Bảng 7-26.

Sự mở rộng này sẽ không có mặt vì không có quá trình hiển thị riêng biệt cho lớp tăng cường. Trình mở rộng có thể mở rộng theo chuỗi

132

TCVN xxxx : 2017

Phần mở rộng này sẽ có mặt với scalable_mode = "khả năng mở rộng SNR" (“SNR scalability”).

Tiêu đề GOPTiêu đề này phải giống với tiêu đề ở dòng dòng bit thấp hơn.Chú ý 1 - Tiêu đề GOP phải có mặt trong mỗi lớp sao cho temporal_reference trong mỗi lớp

được đặt lại trên cùng một khung.

Tiêu đề ảnh Tiêu đề này phải giống với tiêu đề ở dòng bit bên dưới, ngoại trừ giá trị của vbv_delay.

Điều này có thể được lựa chọn một cách độc lập.

Mở rộng mã hóa hình ảnhPhần mở rộng này sẽ giống với phần ở dòng bit bên dưới, ngoại trừ giá trị của

q_scale_type và quét xen kẽ. Chúng có thể được lựa chọn một cách độc lập.

Chroma_420_type sẽ được đặt thành '0' nếu cài đặt màu simulcast. Khác, nó sẽ có giá trị tương tự như trong dòng bit tầng dưới.

Trong trường hợp dòng bit lớp dưới phù hợp với ISO/IEC 11172-2 (và không phải là Tiêu chuẩn kỹ thuật này), thì picture_coding_extension() không có trong dòng bit lớp thấp và các giá trị sau đây sẽ được giả định cho quá trình giải mã:

f_code[0][0]= forward_f_code trong dòng bit lớp dưới cùng hoặc 15

f_code[0)[1]= forward_f_code trong dòng bit lớp dưới cùng hoặc 15

f_code[l][0]= backward_f_code trong dòng bit lớp dưới cùng hoặc 15

f_codctl][l] = hoặc backward_f_code ở lớp dưới cùng hoặc 15

intra_de_precision = 0

picture_structure = "Frame-picture"

top_field_first = 0

frame_pred_frame_det = 1

concealment_motion_vectors = 0

intra_vlc_format = 0

repeat_first_field = 0

chroma_420_typc = 1

progressive_frame = 1

composite_display_flag = 1

Các picture_coding_extension() trong lớp tăng cường sẽ có các giá trị được hiển thị ở trên.

Đối với lớp thấp q_scale_type và scale_altemate sẽ được giả định có giá trị bằng không.

Chú ý 2 - q_scale_type và anternate_scan có thể được đặt độc lập trong lớp tăng cường.

Phần mở rộng ma trận lượng tửTiện ích mở rộng này là tùy chọn. Mô tả ngữ nghĩa được mô tả trong mục 6.3.11.

load_intra_quantiser_matnx và load_chroma_intra_quantiser_matrix đều bằng 0. Chú ý 3 - Chỉ các ma trận không trong nội bộ sẽ được sử dụng trong quá trình giải mã tiếp theo

Mở rộng hình ảnhSự gia hạn này sẽ không có mặt.

133

TCVN xxxx : 2017

Chú ý 4 - Không có quá trình hiển thị riêng biệt nào cho lớp tăng cường. Nếu chức năng quét pan là mong muốn, nó có thể được thực hiện đã được bằng cách sử dụng các thông tin chuyển tải của quét pan-scan của dòng bit lớp thấp hơn.

Tiêu đề lát cắtCác lát sẽ trùng với những mảnh ở tầng dưới. Giá trị của quantiser_scale_code có thể

được đặt độc lập từ dòng bit tầng dưới.

7.8.2. MacroblockSau đó, "macroblock hiện tại" biểu thị macroblock hiện tại được xử lý. Macroblock hiện

tại của lớp dưới biểu thị các macroblock được xác định bằng cách có cùng một macroblock_address như là macroblock hiện tại.

Việc giải mã thông tin tiêu đề macroblock được thực hiện theo ngữ nghĩa trong mục 6.3.17.

Chú ý - bảng B.8 được sử dụng nếu scalable_mods = = "Khả năng mở rộng SNR" sẽ không bao giờ đặt macroblock_intra, macroblock_motion_forward hoặc macroblock_motion_backward_flags, vì một macroblock trong lớp tăng cường chỉ chứa dữ liệu sàng lọc cho macroblock hiện tại của lớp dưới

Tuy nhiên, các phần tử cú pháp tương ứng và các cờ của macroblock hiện tại trong dòng bit lớp thấp có liên quan đến quá trình giải mã kết hợp của tầng thấp hơn và lớp tăng cường sau DCT nghịch đảo như mô tả trong mục 7.8.3.5.

7.8.2.1.dct_typeThành phần cú pháp dct_type có thể có trong một hoặc cả hai macroblock_modes lớp

thấp và tăng cườngmacroblock_modes(), như được chỉ ra bởi ngữ nghĩa trong mục 6.3.17.

Nếu dct_type hiện diện trong các macroblock_modes() trong cả hai lớp nó sẽ có giá trị giống hệt nhau.

7.8.2.2.Bỏ qua MacroblocksMacroblocks có thể được bỏ qua trong lớp tăng cường dòng bit, có nghĩa là không

tăng cường hệ số được thực hiện (F"enhance[v][u] = 0. cho tất cả các v, u) .Vì vậy, quá trình giải mã chi tiết trong mục 7.8.3 sẽ được áp dụng.

Khi macroblocks được bỏ qua trong cả hai, thấp hơn và nâng cấp lớp dòng bits, quá trình giải mã là chính xác như quy định tại mục 7.6.6.

Macroblocks cũng có thể bị bỏ qua trong các dòng bit lớp thấp hơn, trong khi vẫn đang được mã hoá trong các lớp tăng cường dòng bit. Trong trường hợp đó, quá trình giải mã chi tiết trong phần sau phải được áp dụng, nhưng F"lower[v][u] = 0, cho tất cả v, u.

7.8.3. KhốiPhần đầu tiên quá trình giải mã của khối lớp tăng cường là độc lập với lớp dưới.

Phần thứ hai quá trình giải mã của khối lớp tăng cường phải được thực hiện cùng với quá trình giải mã của khối lớp dưới cùng trùng khớp.

Hai bộ các hệ số lượng tử nghịch đảo ngược F"lower and F"enhance thêm vào dạng F"(xem hình 7-15).

F"lower xuất phát từ dòng bit lớp hạ lưu chính xác như được định nghĩa trong mục 7.1 đến mục 7.4.2.3.

F"enhance xuất phát như được định nghĩa trong các khoản dưới đây.

Kết quả F" được tiếp tục xử lý, bắt đầu với độ bão hòa, như được định nghĩa trong

134

TCVN xxxx : 2017

mục 7.4.3 đến mục 7.6 (mục 7.7, mục 7.9).

7.8.3.1. Giải mã chiều dài thay đổiTrong một khối lớp tăng cường,VLC giải mã sẽ được thực hiện theo mục 7.2, như đối

với một khối không là khối trong (như được chỉ định bởi macroblock_intra = 0).

7.8.3.2.Quét ngượcQuét ngược sẽ được thực hiện chính xác như được định nghĩa trong mục 7.3.

7.8.3.3. Đảo ngược lượng tử hóaTrong một khối lớp tăng cường, Đảo ngược lượng tử hóa sẽ được thực hiện theo mục

7.4.2 như đối với một khối không là khối trong.

Trong trường hợp dòng bit lớp dưới phù hợp với ISO/IEC 11172-2 (và không phải là Tiêu chuẩn kỹ thuật này), thì " lượng tử nghịch đảo số học" được dùng để phát hiện F"lower[v][u] (hình 7-14) bao gồm sự kiểm soát không phù hợp IDCT (phân loại) và độ bão hòa được xác định trong ISO/IEC 11172-2.

7.8.3.4.Bổ sung các hệ số tư hai lớpCác hệ số tương ứng từ các khối của mỗi lớp sẽ được thêm vào với nhau để tạo thành

F"(xem hình 7-15).

F"[v][u] = F”lower[v][u] + F"enhance[v][u], cho tất cả u, v

Nếu chroma_simulcast = 1 được thiết lập chỉ khối độ chói được xử lý như mô tả ở trên.

Đối với các khối sắc màu, hệ số DC của lớp cơ sở được sử dụng như một dự đoán của hệ số DC trong khối trùng khớp trong lớp tăng cường, trong khi các hệ số AC của lớp cơ sở bị loại bỏ và các hệ số AC của lớp tăng cường tạo thành F" trong hình 7-14 theo các công thức sau:

F"[0][0] = F”lower[0][0] + F"enhance[0][0]

F"[v][u] = F"enhance[v][u], cho tất cả u, v ngoại trừ u = v = 0Chú ý - khối phát sóng màu nghịch đảo được lượng tử hóa như khối không là khối trong và sử

dụng ma trận không là ma trận trong sắc màu.

Bảng 7-27 cho biết chỉ số khối sắc màu có hệ số DC (F”lower[0][0] để dự đoán hệ số DC trong khối sắc màu trùng khớp của lớp tăng cường (F"enhance[0][0]

Bảng 7-27 - Chỉ số khối được sử dụng để dự đoán hệ số DC

Chroma_formatChỉ số khối

4 5 6 7 8 9 10 11

base: 4:2:0 upper. 4:2:2 4 5 4 5

base: 4:2:0 upper: 4:4:4 4 5 4 5 4 5 4 5

base: 4:2:2 upper. 4.4:4 4 5 6 7 4 5 6 7

7.8.3.5. Các bước giải mã macroblock còn lạiSau khi thêm các hệ số từ hai lớp, phần còn lại của bước giải mã macroblock chính

xác như được mô tả trong mục 7.4.3 đến mục 7.6 (mục 7.7, mục 7.9, nếu có), vì bây giờ chỉ có một luồng dữ liệu F"[v][u ] để được xử lý.

Trong quá trình này, dự đoán số không gian/ thời gian p[y][x] được tạo ra dựa theo các phần tử cú pháp kiểu macroblock và các cờ cho macroblock hiện tại được biết đến từ dòng bit thấp hơn.

135

TCVN xxxx : 2017

7.9. Khả năng mở rộng thời gianKhả năng mở rộng thời gian bao gồm hai lớp, một lớp thấp hơn và một lớp tăng

cường. Cả lớp dưới cùng và lớp tăng cường xử lý cùng một độ phân giải không gian. Lớp tăng cường tăng cường độ phân giải thời gian của lớp dưới và nếu ghép kênh tạm thời với lớp dưới cung cấp tốc độ thời gian đầy đủ. Đây là tốc độ khung được chỉ ra trong lớp tăng cường. Quá trình giải mã cho các ảnh lớp tăng cường tương tự như quá trình giải mã thông thường được mô tả trong mục 7.1 đến mục 7.6. Sự khác biệt duy nhất là trong "Trường dự đoán và lựa chọn khung" được mô tả trong mục 7.6.2.

Các khung tham chiếu cho dự đoán được chọn bởi mã chọn lựa tham chiếu như mô tả trong các bảng 7-28 và 7-29. Trong ảnh P, ảnh tham chiếu chuyển tiếp có thể là một trong ba ảnh sau: ảnh nâng cao gần nhất, khung dưới cùng gần nhất hoặc khung dưới cùng của lớp hiển thị. Lưu ý rằng trong trường hợp thứ hai, khung tham chiếu trong lớp dưới được sử dụng để dự đoán phía trước theo thời gian.

Bảng 7-28 – Lựa chọn tham chiếu dự đoán trong ảnh P

Mã chọn lựa tham chiếu Tham chiếu dự đoán chuyển tiếp00 Các ảnh liên tiếp gần nhất được giải mã01 Khung lớp thấp hơn gần nhất trong hiển thị cũ hơn10 Khung lớp tiếp theo ở thứ tự hiển thị11 Cấm

Bảng 7-29 - Lựa chọn tham chiếu dự đoán trong ảnh B

Mã chọn lựa tham chiếu

Tham chiếu dự đoán tiến Tham chiếu dự đoán lùi

00 Cấm Cấm

01 Các ảnh liên tiếp gần nhất được giải mã

ảnh dưới lớp gần nhất theo thứ tự hiển thị

10 Gần nhất được giải mã enhancement picture(s)

ảnh dưới lớp tiếp theo để hiển thị

11 ảnh dưới lớp gần nhất theo thứ tự hiển thị

ảnh dưới lớp tiếp theo để hiển thị

Trong ảnh B, tham chiếu về phía trước có thể là một trong hai hình dưới đây: gần nhất là cácảnh tăng cường hoặc khung thấp hơn gần nhất (hoặc tạm thời) trong khi tham chiếu ngược lại có thể là một trong hai ảnh sau: ảnh trùng khớp tạm thời trong thứ tự hiển thị hoặc khung lớp dưới tiếp theo để hiển thị. Lưu ý rằng trong trường hợp này, khung tham chiếu ngược trong lớp dưới được sử dụng để dự đoán được chuyển tiếp theo thời gian.

Dự đoán ngược không thể được thực hiện từ một ảnh trong lớp tăng cường. Điều này tránh được sự cần thiết phải sắp xếp lại khung trong lớp tăng cường. Quá trình bù chuyển động dự đoán các ảnh sử dụng các ảnh được giải mã dưới lớp và /hoặc dự đoán thời gian trước đó từ lớp tăng cường.

Lớp tăng cường có thể chứa ảnh l, ảnh P hoặc ảnh B, nhưng ảnh B trong lớp tăng cường hoạt động giống như ảnh P theo nghĩa là một ảnh B đã được giải mã có thể được sử dụng để dự đoán các ảnh P sau đây hoặc ảnh B trong lớp tăng cường.

Khi khung gần nhất trong lớp dưới được sử dụng làm tài liệu tham khảo, nó bao gồm khung thời gian trùng khớp với khung hoặc trường đầu tiên (dễ dàng bằng trường ảnh) trong lớp tăng cường. Các tham khảo dự đoán được sử dụng cho ảnh P và ảnh B được trình bày trong Bảng 7-28 và Bảng 7-29.

Lớp dưới và lớp tăng cường sẽ sử dụng cấu trúc lát cắt bị giới hạn.

136

TCVN xxxx : 2017

Hình 7-16 cho thấy một sơ đồ đơn giản của quá trình bù chuyển động cho lớp tăng cường sử dụng khả năng mở rộng theo thời gian.

Ảnh I không sử dụng tham chiếu dự đoán; để chỉ ra điều này, reference_select_code cho ảnh Isẽ là '11'

Tùy thuộc vào picture_coding_type, khi forward_temporal_reference hoặc backward_temporal_reference không ngụ ý các tham chiếu được sử dụng để dự đoán, chúng sẽ lấy giá trị 0.

7.9.1. Cấu trúc cú pháp cao hơnHai lớp dòng bit trong phần dưới này được xác định bởi layer_id của chúng, được giải

mã từ sequence_scalable_extension.

Hai dòng bits sẽ có id lớp liên tiếp, với lớp tăng cường có layer_id = idennhnce và lớp dưới có layer_id = idennhnce - 1

Cú pháp và ngữ nghĩa của các lớp tăng cường tương ứng được định nghĩa trong 6.2 và 6.3.

Hạn chế ngữ nghĩa áp dụng cho một số giá trị trong tiêu đề và phần mở rộng của lớp tăng cường như sau.

Lớp thấp hơn phải tuân theo Quy Định này (và không áp dụng cho ISO/IEC 11172-2).

Tiêu đề chuỗiCác giá trị trong tiêu đề này có thể khác với lớp dưới, ngoại trừ thông tin

horizontal_size_value, vertical_size_value và aspect_ratio.Mở rộng chuỗiPhần mở rộng này sẽ giống với phần ở lớp dưới trừ các giá trị của

profile_and_level_indication. tăng tốc độ bit, mở rộng kích thước bộ đệm vbv, chậm trễ, tăng tốc độ khung hình n và mở rộng tốc độ khung d. Chúng có thể được lựa chọn một cách độc lập. Lưu ý rằng progressive_scquence chỉ định định dạng quét của khung lớp nâng cao chứ không phải là các khung đầu ra sau khi ghép kênh. Thứ hai được chỉ ra bởi mux_to_progressive_sequence (xem chuỗi mở rộng có thể mở rộng).

Trình mở rộng hiển thị chuỗiSự mở rộng này sẽ không có mặt vì không có quá trình hiển thị riêng biệt cho lớp nâng

cấp.

Trình mở rộng có thể mở rộng theo chuỗiPhần mở rộng này phải có chế độ có thể mở rộng = "Temporal_scalability".Khi progressive_sequence = 0 và mux_to_progressive_sequence = 0, top_field_frame

và picture_mux_factor có thể được chọn.

Khi progressive_sequence = 0 và mux_to_progressive_sequence = 1, top_field_first sẽ chứa phần bổ sung của giá trị top_field_first của lớp thấp hơn nhưng picture_mux_factor sẽ là 1.

có thể chọn picture_mux_factor.Sự kết hợp của progressive_sequence = 1 và mux_to_progressive_sequence = 0 sẽ

không xảy ra.

137

TCVN xxxx : 2017

Hình 7-16 - Quá trình bù chuyển động đơn giản cho lớp tăng cường sử dụng khả năng mở rộng theo thời gian

Tiêu đề GOPKhông có sự hạn chế đối với tiêu đề GOP (nếu có) giống như đối với tầng dưới.

Tiêu đề ảnh Không có sự hạn chế đối với các tiêu đề ảnh giống như ở tầng dưới.

Mở rộng mã hóa ảnhGiá trị trong phần mở rộng này có thể khác với lớp dưới trừ top_field_first,

concealment_motion_vectors, và chroma_420_type và progressive_frame. Top_field_first sẽ được dựa trên progressive_sequence và mux_to_progressive_sequence và concealment_motion_vectors sẽ là 0. Chroma_420_type sẽ giống hệt với lớp dưới.

138

TCVN xxxx : 2017

Progressive_frame sẽ luôn luôn có cùng giá trị với progressive_sequence.

ảnh mở rộng theo thời gianPhần mở rộng này sẽ có mặt cho mỗi ảnh.

Mở rộng ma trận lượng tửPhần mở rộng này có thể có trong lớp tăng cường.

7.9.2. Những hạn chế dự đoán theo thời gianMặc dù các dự đoán theo thời gian có thể được thực hiện từ các ảnh giải mã được

tham chiếu bởi forward_temporapreference hoặc cả tham chiếu tạm thời và tham chiếu thời gian trong quá khứ, khả năng mở rộng theo thời gian là hiệu quả nếu dự đoán được hình thành bằng cách sử dụng giải mã ảnh/ các ảnh từ lớp dưới và lớp tăng cường rất gần với thời gian để tăng cường ảnh được dự đoán. Đó là yêu cầu về các luồng bit mà các ảnh P và ảnh B sẽ hình thành các dự đoán từ các ảnh gần nhất hoặc tiếp theo như minh họa trong các bảng 7-28 và 7-29.

Trong trường hợp group_of_pictures_header xảy ra rất thường xuyên ở tầng dưới, sự không rõ ràng có thể xảy ra do khả năng không phải là duy nhất của tài liệu tham khảo thời gian (được đặt lại tại mỗi group_of_pictures_header(). Sự không rõ ràng này sẽ được giải quyết với sự trợ giúp của thông tin về thời gian của hệ thống.

7.10. Phân vùng dữ liệuPhân vùng dữ liệu là một kỹ thuật phân chia một dòng bit video thành hai lớp, được gọi

là phân vùng. Một ngưỡng (breakpoint) ưu tiên chỉ ra các phần tử cú pháp được đặt trong phân vùng 0, đó là phân vùng cơ sở (còn được gọi là phân vùng ưu tiên cao). Phần còn lại của dòng bit được đặt trong phân vùng 1 (còn được gọi là phân vùng ưu tiên thấp). Trình tự, GOP và tiêu đề ảnh được sao chép dự phòng trong phân vùng 1 để tạo điều kiện phục hồi lỗi. Chuỗi sequence_end_code cũng được sao chép thừa vào phân vùng 1. Tất cả các trường trong các tiêu đề thừa cần phải giống với các tiêu đề ban đầu. Các phần mở rộng duy nhất cho phép (và yêu cầu) trong phân vùng 1 là sequence_extension(),picture_coding_extension() và sequence_scalable_extension().

Chú ý – Cú phápslice() được đưa ra trong mục 6.2.4 được theo sau trong cả hai phân vùng lên đến (và bao gồm) phần tử cú pháp extra_bit_slice Giải thích priority_breakpoint được đưa ra trong Bảng 7-30.

Bảng 7-30 - Các giá trị ngưỡng ưu tiên và các ngữ nghĩa liên quan

priority _break point

Cú pháp bao gồm trong phân vùng không

0 Giá trị này được dành riêng cho phân vùng 1. Tất cả các lát trong phân vùng 1 sẽ có điểm ưu tiên là 0.

1Tất cả dữ liệu ở chuỗi, GOP, ảnh và slice() xuống đến extra_bit_slice trong slice().

2 Tất cả dữ liệu bao gồm ở trên, cộng với các phần tử cú pháp macroblock đến và bao gồm macroblock_address_increment

3 Tất cả dữ liệu bao gồm ở trên, cộng với các phần tử cú pháp macroblock đến nhưng không bao gồm coded_block_pattern ().

4 ... 63 Dự phòng64 Tất cả các phần tử cú pháp bao gồm cả coded_block_pattern() hoặc hệ

số DC (det_dc_differential), và cặp hệ số DCT (run_level) đầu tiên (hoặc EOB).

139

TCVN xxxx : 2017

priority _break point

Cú pháp bao gồm trong phân vùng không

65Tất cả các phần tử cú pháp ở trên, cộng với cặp hệ số DCT lên tới 2 (run_level).

...

63 + jTất cả các phần tử cú pháp ở trên, cộng với cặp hệ số DCT cặp

j(run_level)....

127Tất cả các phần tử cú pháp bên trên, cộng với tối đa 64 (run_level) các cặp hệ số DCT.

Chú ý - Một điểm dừng ưu tiên ngay sau khi hệ số DC không được phép vì nó có thể gây ra mô phỏng mã bắt đầu.

Ngữ nghĩa của VBV vẫn không thay đổi, nghĩa là VBV đề cập đến tổng của hai phân vùng chứ không phải là một phân vùng duy nhất.

thông số tốc độ dòng bit (giá trị bitrate và tốc độ bit), vbv_buffer_size (giá trị vbv_buffer_size và vbv_buffer_size_extension) và vbv_delay sẽ có giá trị như nhau trong hai phân vùng. Các tham số này đề cập đến các đặc tính của toàn bộ dòng bit được hình thành từ hai phân vùng.

Quá trình giải mã được sửa đổi theo cách sau:

- Đặt current_partition là 0, và bắt đầu giải mã từ dòng bit có chứa sequence_scalable_extension (phân vùng 0).

- Nếu current_partition = 0, kiểm tra để sec nếu điểm hiện tại trong dòng bit là một điểm dừng ưu tiên.

Nếu có, thiết lập current_partitionbằng 1. Mục kế tiếp sẽ được giải mã từ phân vùng 1.

Nếu không, tiếp tục giải mã từ phân vùng 0, Hủy bỏ trình tự, GOP, và tiêu đề ảnh từ cả hai phân vùng.

- Nếu current_partition = 1, kiểm tra điểm dừng ưu tiên để xem liệu mục tiếp theo có thể được giải mã được mong đợi trong phân vùng 0 hay không.

Nếu có, hãy thiết lập current_partitionlà 0. Mục kế tiếp sẽ được giải mã từ phân vùng 0.

Nếu không, tiếp tục giải mã từ phân vùng 1.

140

TCVN xxxx : 2017

hai phân vùng được hiển thị, với mũi tên cho biết bộ giải mã cần phải chuyển đổi giữa các phân vùng như thế nào.

Hình 7-17 - Một phân đoạn tư một dòng bit với hai phân vùng, với ngưỡng ưu tiên đặt là 64 (một cặp (run. level))

7.11. Khả năng mở rộng laiKhả năng mở rộng lai là sự kết hợp của hai loại khả năng mở rộng khác nhau. Các loại

khả năng mở rộng có thể kết hợp được SNR khả năng mở rộng, khả năng mở rộng theo không gian và khả năng mở rộng theo thời gian. Khi hai loại khả năng mở rộng được kết hợp, có ba dòng bit phải được giải mã. Các lớp mà các dòng bit này thuộc về được đặt tên trong Bảng 7-31.

Bảng 7-31 - Tên lớp

Layer_id Tên0 Lớp cơ sở1 Lớp tăng cường 12 Lớp tăng cường 2... ...

Đối với khả năng mở rộng giữa các lớp tăng cường 1 và 2, lớp tăng cường 1 là lớp dưới của nó, và lớp tăng cường 2 là lớp tăng cường của nó. Không có lớp nào có thể được bỏ qua từ thang bậc thang. Ví dụ, nếu có khả năng mở rộng SNR giữa lớp tăng cường 1 và lớp tăng cường 2, các kiểu dự đoán trong lớp tăng cường 1 cũng hợp lệ cho quá trình giải mã kết hợp cho lớp tăng cường 1 và 2.

Sự ghép đôi các lớp lỏng lẻo hơn với khả năng mở rộng theo không gian và theo thời gian hơn so với khả năng mở rộng SNR. Do đó, trong các loại khả năng mở rộng này, đầu tiên lớp cơ sở phải được giải mã và được kiểm tra trước khi có thể được sử dụng trong lớp tăng cường. Trong khả năng mở rộng SNR, cả hai lớp được giải mã đồng thời. Chuỗi giải mã có thể được tóm tắt như sau:

Trường hợp 1

lớp cơ sở

<khả năng mở rộng theo không gian hoặc theo thời gian> lớp tăng cường 1

<Khả năng mở rộng SNR> lớp tăng cường 2

Đầu tiên giải mã lớp cơ sở, và sau đó giải mã cả hai lớp tăng cường đồng thời.

Trường hợp 2

lớp cơ sở

<Khả năng mở rộng SNR> lớp tăng cường 1

<khả năng mở rộng theo không gian hoặc theo thời gian> lớp tăng cường 2

Trước tiên, giải mã lớp cơ sở và lớp nâng cấp 1 đồng thời, và sau đó giải mã lớp tăng cường 2.

Trường hợp 3

lớp cơ sở

<khả năng mở rộng theo không gian hoặc theo thời gian> lớp tăng cường 1

<khả năng mở rộng theo không gian hoặc theo thời gian> lớp tăng cường 2

Đầu tiên giải mã lớp cơ sở, sau đó giải mã lớp tăng cường 1, và cuối cùng giải mã lớp tăng cường 2.

141

TCVN xxxx : 2017

7.12. Kết quả của quá trình giải mãPhân lớp này mô tả đầu ra của mô hình lý thuyết của quá trình giải mã để giải mã các

luồng dòng bit phù hợp với đặc tả này.

Đầu vào của quá trình giải mã là một hoặc nhiều dòng bit mã hoá (một cho mỗi lớp). Các lớp video thường được ghép kênh bằng một luồng hệ thống cũng chứa thông tin về thời gian.

Đầu ra của quá trình giải mã là một loạt các trường hoặc khung thường là đầu vào của một quá trình hiển thị. Thứ tự các trường hoặc khung được xuất ra bởi quá trình giải mã được gọi là thứ tự hiển thị, và có thể khác với thứ tự mã hoá (khi sử dụng các ảnh B). Quá trình hiển thị chịu trách nhiệm cho việc hiển thị các trường hoặc khung được giải mã trên một thiết bị hiển thị. Nếu thiết bị hiển thị không thể hiển thị ở tốc độ khung được chỉ định trong dòng bit, quá trình hiển thị có thể thực hiện chuyển đổi tỷ lệ khung hình. Đặc tả này không mô tả một mô hình lý thuyết của quá trình hiển thị cũng như hoạt động của quá trình hiển thị.

Vì một số phần tử cú pháp, chẳng hạn như progressive_frame. có thể là cần thiết bởi quá trình hiển thị, trong mô hình lý thuyết của quá trình giải mã, tất cả các thành phần cú pháp được giải mã bởi quá trình giải mã được xuất ra bởi quá trình giải mã và có thể được truy cập bằng quá trình hiển thị.

Khi chuỗi liên tiếp được giải mã (progressive_sequence bằng 1), các mẫu độ chói và sắc độ của các khung tái tạo được xuất ra bởi quá trình giải mã ở dạng các khung hình liên tiếp và tốc độ đầu ra là tốc độ khung. Hình 7-18 minh họa điều này trong trường hợp của chroma_format bằng 4:2:0.

X X X XO O O OX X X X

X X X XO O O OX X X X

X X X XO O O OX X X X

X X X XO O O OX X X X

Chu kỳ khung = 1/frame_rate

Hình 7-18 - progressive_sequence = = 1Khung dựng lại giống nhau được xuất ra một lần nếu repeat_first_fiedl bằng 0. và hai

hoặc ba lần liên tiếp nếu lặp lại trường đầu tiên bằng 1, tùy thuộc vào giá trị của trường trên đầu tiên. Hình 7-19 minh họa điều này trong trường hợp của color_format bằng 4:2:0 và repeat_first_fiedl bằng 1.

142

TCVN xxxx : 2017

Hình 7-19 - progressive_sequence = = 1; repeat_first_fiedl = = 1Khi giải mã một chuỗi xen kẽ (progressive_sequence bằng 0), các mẫu độ chói của

khung được dựng lại được xuất ra bởi quá trình giải mã ở dạng các trường xen kẽ với tốc độ gấp đôi tốc độ khung, hình 7-20 minh họa điều này.

Hình 7-20 -progressive_sequence = = 0

143

TCVN xxxx : 2017

Đó là yêu cầu về dòng bit mà các trường ở đầu ra của quá trình giải mã sẽ luôn luôn được luân phiên trên cùng và dưới cùng (lưu ý rằng trường đầu tiên của dãy có thể ở trên hoặc dưới cùng).

Nếu khung tái tạo được xen kẽ (progressive_frame bằng 0), các mẫu độ chói và các mẫu sắc độ được xuất ra bởi quá trình giải mã dưới dạng hai trường liên tiếp. Đầu ra trường đầu tiên của quá trình giải mã là trường đầu trang hoặc trường dưới cùng của khung được tái tạo, tùy thuộc vào giá trị của top_field_first.

Mặc dù tất cả các mẫu của liên tục khung đại diện cho cùng một thời điểm trong thời gian, tất cả các mẫu không được xuất cùng một lúc bởi quá trình giải mã khi chuỗi được xen kẽ.

Nếu khung được dựng lại là liên tục (khung liên tục bằng 1), các mẫu độ chói được xuất ra bởi quá trình giải mã ở dạng hai hoặc ba trường liên tiếp, tùy thuộc vào giá trị của trường lặp lại đầu tiên.

Chú ý - Các thông tin mà các trường này được cập nhật từ liên tục khung cùng trong dòng dòng bit được chuyển đến quá trình hiển thị.

Tất cả các mẫu sắc màu của liên tục khung đã được dựng lại đã xuất ra bởi quá trình giải mã đồng thời với trường đầu tiên của các mẫu độ chói. Điều này được minh họa trong Hình 7-21 và 7-22.

Hình 7-21 -progressive_sequence = = 0; với độ màu sắc 4:2:0

Hình 7-21 -progressive_sequence = = 0; với độ màu sắc 4:2:2 hoặc 4:4:4

144

TCVN xxxx : 2017

8. Các mức và đặc tính (Level- profile)Chú ý: - Trong Tiêu chuẩn kỹ thuật này từ được gọi là "profile" được sử dụng như được định

nghĩa dưới đây .Nhưng không nên nhầm lẫn với các định nghĩa khác của "profile" và đặc biệt nó không có ý nghĩa như được định nghĩa bởi ISO/IEC JTC1/Special Group về tiêu chuẩn hóa chức năng.

Profile và Level cung cấp một phương tiện để xác định các tập con của cú pháp và ngữ nghĩa của Tiêu chuẩn kỹ thuật này và do đó các khả năng bộ giải mã cần thiết để giải mã một dòng bit cụ thể. Một profile là một tập hợp con xác định của toàn bộ cú pháp dòng bit được xác định bởi Tiêu chuẩn kỹ thuật này. Một mức là một tập hợp các ràng buộc được định nghĩa đối với các tham số trong dòng bit. Các kiểm tra phù hợp sẽ được thực hiện với các profiles xác định ở các mức(Level) xác định.

Mục đích của việc xác định các điểm tuân thủ dưới dạng các profiles và các mức là tạo điều kiện trao đổi bit giữa các ứng dụng khác nhau. Các nhà thực hiện Tiêu chuẩn kỹ thuật này được khuyến khích sản xuất bộ giải mã và dòng bit tương ứng với các vùng xác định được xác định. Các profile và các mức được xác định một cách thận trọng là phương tiện trao đổi bit giữa các ứng dụng của Tiêu chuẩn kỹ thuật này.

Trong mục này các phần ràng buộc của các profile được định nghĩa và các mức được mô tả. Tất cả các phần tử cú pháp và giá trị tham số không bị hạn chế một cách rõ ràng có thể mất bất kỳ giá trị nào có thể được cho phép bởi Tiêu chuẩn kỹ thuật này. Nói chung, một bộ giải mã sẽ được coi là phù hợp với một profile nhất định ở một mức cụ thể nếu nó có khả năng giải mã tất cả các giá trị cho phép của tất cả các thành phần cú pháp như quy định bởi profile đó ở mức đó. Một trường hợp ngoại lệ đối với quy tắc này tồn tại trong trường hợp Bộ giải mã Simple profile Main level, cũng phải có khả năng giải mã các dòng bit Main profile, Low level. Một dòng bit sẽ được coi là phù hợp nếu nó không vượt quá phạm vi cho phép của giá trị và tài liệu không bao gồm các yếu tố cú pháp không được phép.

Chú ý ở mục 5.4 để xác định quy ước để xác định một dãy số. Điều này được sử dụng để xác định phạm vi của các giá trị và các thông số.

Profile_and_level_indication trong sequence_extension chỉ ra profile và mức mà dòng bit tuân thủ. Các bit quan trọng nhất của hồ sơ và chỉ thị mức độ được gọi là 'escape_bit'. Khi escape_bit được đặt là 0, profile và level được lấy từ profile_and_level_indication theo bảng 8-1, 8-2 và 8-3.

Bảng 8-1 - Ý nghĩa của các bit trong profile_and_level_indicationBits Kích thước trường (bits) Ý nghĩa[7:7]1

1 Escape bit[6:4]ư

3 Profile identification[3:0] 4 Level identification

Bảng 8-2 xác định mã nhận dạng profile và Bảng 8-3 mã nhận dạng mức. Khi 'escape_bit' bằng 0, một profile có giá trị nhận dạng lớn hơn về số lượng sẽ là tập hợp con của một profile với giá trị nhận dạng nhỏ hơn về số lượng. Tương tự như vậy, bất cứ khi nào 'escape_bit' bằng không, một mức với một giá trị nhận dạng lớn hơn về số lượng sẽ là một tập hợp con của một mức với một giá trị nhận dạng nhỏ hơn về số lượng.

145

TCVN xxxx : 2017

Bảng 8-2 – Nhận diện profileNhận diện profile Profile

110 đến 111 (Dự phòng)101 Simple (Đơn giản)100 Main (chính)011 SNR Scalable(phân cấp SNR)010 Spatially Scalable(phân cấp

không gian)001 High (Cao)000 (Dự phòng)

Bảng 8-2 – Nhận diện mứcNhận diện mức Mức1011 đến 1111 (Dự phòng)

1010 Low (thấp)1001 (Dự phòng)1000 Main (chính)0111 (Dự phòng)0110 High 1440 (mức cao 1440)0101 (Dự phòng)0100 High (cao)0011 (Dự phòng)0010 HighP

0000 và 0001 (Dự phòng)

Bảng 8-4 mô tả các profiles và các mức khi 'escape_bit' bằng 1. Đối với các profiles và các mức không phân cấp từ việc ấn định profile_and_level_indication và các profiles và các mức không nhất thiết là tập con khác.

Chú ý đến Phụ lục E, mô tả chi tiết các bộ phận của Tiêu chuẩn kỹ thuật này được sử dụng cho các profiles và các mức nhất định.

Chú ý 1 - Trong profile 4:2:2: Thuật toán nén của Tiêu chuẩn kỹ thuật này khai thác sự dư thừa thời gian, không gian và các thuộc tính nghe nhìn của con người và không phải là thuật toán không mất dữ liệu. Đối với các dãy có sự dư thừa không gian và thời gian đáng kể, hoặc không có nhiều đường nét/cạnh sắc nét, chất lượng của các dãy thu được sẽ làm giảm sự giải nén sẽ cao hơn so với các dãy có sự thừa thừa thấp hơn, hoặc với một số lượng lớn các đường nét/cạnh.

Profile 4:2:2 có thể cung cấp chất lượng video cao hơn, độ phân giải màu sắc tốt hơn và cho phép tốc độ bit cao hơn ở Main level lên đến 50 Mbit/s so với MP@ML. Nó cũng cung cấp khả năng mã hóa tất cả các dòng hoạt động của video

Mặc dù đây không phải là một phần của phân cấp của các profiles và các mức, Bộ giải mã 4:2:2 profile@Main level được yêu cầu để giải mã tất cả các luồng bit không thể đọc được bởi bộ giải mã MP@ML

Profile 4:2:2 không hỗ trợ khả năng mở rộng. Điều này cho phép thực hiện các kiến trúc tương tự như của MP@ML

Profile này có thể được sử dụng cho các ứng dụng yêu cầu nhiều thế hệ của mã hóa và giải mã Trong trường hợp nhiều thế hệ mà không có thao tác ảnh hoặc thay đổi trong kiểu mã ảnh giữa các thế hệ, chất lượng vẫn gần như không đổi sau thế hệ đầu tiên. Sử dụng thao tác ảnh hoặc thay đổi kiểu mã ảnh giữa các thế hệ gây ra một số sự xuống cấp về chất lượng. Tuy nhiên, chất lượng kết quả là chấp nhận được cho một loạt các ứng dụng.

Profile 4:2:2 cho phép mã hóa ảnh I. Điều này cho phép phục hồi cuối cùng từ lỗi truyền dẫn và

146

TCVN xxxx : 2017

có thể đơn giản hóa các ứng dụng chỉnh sửa Profile này cho phép tốc độ bit cao cần thiết để duy trì chất lượng cao trong khi chỉ sử dụng mã hoá ảnh I. Profile 4:2:2 cũng cho phép sử dụng các loại mã hóa ảnh P và B để cải thiện chất lượng hoặc giảm tốc độ bit cho cùng chất lượng.

Xem Phụ lục J để biết thêm thông tin về chất lượng ảnh của profile 4:2:2Chú ý 2 - Trên đặc tính đa chiều (Multi-view Profile): đặc tính đa chiều (MVP) được hình dung là

một profile thích hợp cho các ứng dụng đòi hỏi nhiều quan điểm trong ngữ cảnh của Tiêu chuẩn kỹ thuật này. MVP hỗ trợ ảnh lập thể như ảnh nguồn của nó cho một loạt các độ phân giải ảnh và chất lượng theo yêu cầu của các ứng dụng sẽ được sử dụng. Một lớp cơ sở của MVP được gán cho một khung cảnh trái và một lớp tăng cường được gán cho một khung cảnh phải

Bảng 8-4- Xác định chỉ số thoát profile_ and_level_indication

profile_ and_level_indication Tên

10001111 đến 111 111 11 (Dự phòng)

10001110 Multi-view profile@Low level

10001101 Multi-view profile@Main level

10001100 (Dự phòng)

10001011 Multi-view profile@High 14-10 level

10001010 Multi-view profile@High level

10000110 đến 10001001 (Dự phòng)

10000101 4:2:2 profile@Main level

10000011 đến 10000100 (Dự phòng)

10000010 4:2:2 profile@ High level

10000000 đến 10000001 (Dự phòng)

Mã hoá đơn với các công cụ tương tự như đặc tính chính Main Profile (MP), bao gồm ISO/IEC 11172-2, được áp dụng cho lớp cơ sở. Một lớp tăng cường được mã hóa sử dụng các công cụ mốc thời gian và một dự đoán lai của chuyển động và chênh lệch có thể được sử dụng trong lớp tăng cường.

MVP được xem là một trong những profile có thể mở rộng về mặt nhiều lớp điểm quan sát, dự kiến sẽ có cùng một loại tính tương thích mà các profile có thể mở rộng khác có, như khả năng tương thích với MP. Ví dụ:

1) bộ giải mã tuân thủ MVP ở một mức nhất định có khả năng giải mã các dòng bit phù hợp với MP ở mức tương ứng (tức là tương thích chuyển tiếp);

2) bộ giải mã tương thích với MP ở một mức nhất định có khả năng giải mã dòng bit trong lớp cơ sở của MVP (tức là tương thích ngược).

8.1. Độ tương thích của ISO/IEC 11172-2"các thông số ràng buộc" của ISO/IEC 11172-2 dòng bit sẽ được giải mã bởi bộ giải

mã Simple, Main, SNR Scalable, Spatially Scalable and High profile, có thể mở rộng không gian và có độ phân giải Cao ở tất cả các mức. Ngoài ra các bộ giải mã Simple, Main, SNR Scalable, Spatially Scalable and High profile sẽ có thể giải mã các dòng bit chỉ có hình D của ISO / IEC 11172-2 nằm trong giới hạn mức của bộ giải mã.

8.2. Mối quan hệ giữa các Profile được xác địnhSimple, Main, SNR Scalable, Scalable và High profiles có một mối quan hệ có tính

phân cấp. Do đó, cú pháp được hỗ trợ bởi profile 'cao hơn' bao gồm tất cả các thành phần cú pháp của profile 'thấp hơn' (ví dụ: cho một cấp nhất định, bộ giải mã Main profile sẽ có thể giải mã dòng bit phù hợp với các ràng buộc Simple profile).Đối với một profile

147

TCVN xxxx : 2017

nhất định, cùng một bộ cú pháp được hỗ trợ bất kể mức độ. Thứ tự phân cấp được trình bày trong Bảng 8-2.

Sự khác nhau giữa các cú pháp ràng buộc của các profile được trình bày trong Bảng 8-5. Bảng này mô tả các giới hạn áp dụng cho một dòng bit. Lưu ý rằng bộ giải mã thích hợp Simple profile phải có khả năng giải mã đầy đủ cả dòng bits Simple profile, Main level and Main profile, Low level.

Bảng 8-5 - Cú pháp các ràng buộc của các Profile

Thành phần cấu thànhProfile

Simple Main SNR Spatial High 4:2:2 Multi-view

chroma_format 4:2:0 4:2:0 4:2:0 4:2:0 4:2:2 hoặc 4:2:0

4:2:2 hoặc 4:2:0

4:2:0

frame_rate_extension_n 0 0 0 0 0 0 0

frame_rate_extensfon_d 0 0 0 0 0 0 0

aspect_ratio_information 0001, 0010,

0011

0001, 0010,

0011

0001, 0010,

0011

0001, 0010,

0011

0001, 0010,

0011

0001, 0010,

0011

0001, 0010,

0011picture_coding_type I, P I, P, B I, P,B I, P, B I, P, B I,P, B I, P,B

repeat_first_field Bắt buộc Không bắt buộc Bắt buộc Không bắt buộc

sequence_scalable_ extension()

Không Không Có Có Có Không Có

scalable_mode- - SNR

SNR hoặc

Spatial

SNR hoặc

Spatial- Theo thời gian

picture_spatial_scalable_ extension()

Không Không Không Có Có Không Không

picture_temporal_scalabe_ extension()

Không Không Không Không Không Không Có

intra_dc_precision 8, 9, 10 8, 9, 10 8, 9, 10 8, 9, 10 8, 9,10, 11 8, 9,10, 11 8, 9, 10

Slice structure Bị hạn chế

6.1.2.2

Đối với tất cả các Profile được xác định, có một hạn chế về độ dài dòng bit rằng tất cả dữ liệu cho một macroblock sẽ được trình bày với số lượng không lớn hơn số bit được chỉ ra trong Bảng 8-6. Tuy nhiên, tối đa hai macroblocks trong mỗi hàng nằm ngang của macroblocks có thể vượt quá giới hạn này.

Bảng 8-6:Số bit tối đa trong một khối macroblock

Định dạng sắc màu Số bit tối đa

4:2:0 46084:2:2 61444:2:2 (in 4:2:2 Profile) Unconstrained (Không bị ràng buộc)4:4:4 9216

Trong ngữ cảnh này, một macroblock được coi là bắt đầu với bit đầu tiên của macroblock_address_increment (hoặc macroblock_escape, nếu có) và tiếp tục cho đến khi bit cuối cùng của cấu trúc cú pháp macroblock(). Các bit cần thiết để đại diện cho bất kỳ slice() nàođi trước (hoặc sau) macroblock không được tính là một phần của macroblock.

148

TCVN xxxx : 2017

Các High profiles cũng được phân biệt bởi có những ràng buộc khác nhau về tỷ lệ mẫu độ chói, tốc độ bit tối đa, và kích thước bộ đệm VBV. Xem bảng 8-12,8-13 và 8-14.

Bộ giải mã là Simple profile@Main level tuân thủ sẽ có khả năng giải mã dòng bit Main profile@Low level.Table 8-7 – Các ràng buộc sử dụng repeat_first_field fhoặc Simple and Main Profiles

frame_rate_code Frame_rate_valueRepeat_first_field

Progressive_Sequence == 0

Progressive_Sequence == 1

0000 Cấm

0001 24 000 ÷ 1001 (23.976...) 0 00010 24 0 00011 25 0 hoặc 1 00100 30 000 ÷1001 (29.97...) 0 hoặc 1 00101 30 0 hoặc 1 00110 50 0 hoặc 1 00111 60 000 ÷ 1001 (59.94...) 0 hoặc 1 0 hoặc 1

1000 60 0 hoặc 1 0 hoặc 1…………. Dự phòng1111 Dự phòng

Các ràng buộc còn tồn tại đối với Main profile @Main và Simple profile @ Main level chỉ khi:

Nếu(vertical_size> 480 lines) hoặc (frame_rate is "25Hz") sau đó nếu loại mã ảnh = = 011 (tức là ảnh B), repeat_first_field sẽ là 0.

nếu vertical_size> 480 dòng frame_rate phải là "25Hz"

Ngoài ra, những ràng buộc sau đây tồn tại cho profile 4:2:2 profile @ Main level chỉ khi:

nếu kích thước theo chiều dọc> 512 dòng, sau đó nếu picture_coding_type = 011 (tức là ảnh B), trường lặp lại đầu tiên sẽ là

0; nếu kích thước theo chiều dọc> tốc độ khung hình 512 dòng sẽ là "25Hz".

8.3. Mối quan hệ giữa các mức đã xác định8.4. Các lớp có thể mở rộng

Các profiles SNR Scalable, Spatial Scalable, High and Multi-view có thể sử dụng nhiều hơn một dòng bit để mã hóa ảnh. Các dòng bit khác nhau đại diện cho các lớp mã hóa, khi kết hợp tạo ra một ảnh chất lượng cao hơn so với có thể đạt được (chỉ phông một lớp) (xem Phụ lục F) Số lớp tối đa cho một profile nhất định được xác định trong Bảng 8-9. được đặt tên theo bảng 7-31 Các ràng buộc cú pháp và tham số cho các kết hợp đặc tính /mức khi mã hóa bằng cách sử dụng số lượng tối đa cho phép các lớp được cho trong các bảng 8-11, 8-12, 8-13 và 8-14. số lớp ít hơn mức tối đa cho phép, nên tham khảo thêm các bảng E-21 đến E-46 nếu thích hợp.

Cần lưu ý rằng một dòng bit của lớp cơ sở SNR Scalable và Multi-view profile luôn có thể được giải mã bằng bộ giải mã Main profile tương đương. Ngược lại, một dòng bit

149

TCVN xxxx : 2017

Main profile sẽ có thể được giải mã hoăc là bằng bộ giải mã profile SNR Scalable hoăc là bằng bộ giải mã profile Multi-view với mức tương đương.

Bảng 8-8 - Các ràng buộc về tham số cho các mức

a) Đối với các bitstream đơn giản mà không bao gồm các ảnh B. f_code [1] [0] và f_code [1] [1] sẽ được đặt thành 15 (không được sử dụng).b) Hạn chế này áp dụng cho vector chuyển động cuối cùng được tái tạo. Trong trường hợp vectơ chuyển động kép, giới hạn này áp dụng cho tất cả các giá trị sau:

c) Trong bảng này, 'NA' chỉ ra một ràng buộc mà không áp dụng do một ràng buộc về giá trị của cấu trúc ảnh.

Bảng 8-9 - Giới hạn trên cho các lớp có thể mở rộng trong SNR Scalable_Spatial Scalable_High and Multi-view profiles

Level Số lớn nhất của… ProfileSNR Spatial High Multi-view

High Tất cả các lớp (cơ sở + tăng cường) 3 2Các lớp tăng cường theo không gian 1 0Các lớp tăng cường SNR 1 0Các lớp phụ trợ theo thời gian 0 1

High-1440

Tất cả các lớp (cơ sở + tăng cường) 3 3 2

Các lớp tăng cường theo không gian 1 1 5

150

TCVN xxxx : 2017

Level Số lớn nhất của… ProfileSNR Spatial High Multi-view

Các lớp tăng cường SNR 1 1 0Các lớp phụ trợ theo thời gian 0 0 1

Main Tất cả các lớp (cơ sở + tăng cường) 2 3 2Các lớp tăng cường theo không gian 0 1 0Các lớp tăng cường SNR 1 1 0Các lớp phụ trợ theo thời gian 0 0 1

Low Tất cả các lớp (cơ sở + tăng cường) 2 2Các lớp tăng cường theo không gian 0 0Các lớp tăng cường SNR 1 0Các lớp phụ trợ theo thời gian 0 1

8.4.1. Kết hợp lớp cho phépBảng 8-10 là tóm tắt các kết hợp cho phép, và phải tuân theo các quy tắc sau:

SNR Scalable and Multi-view profile: tối đa 2 lớp; Spatial Scalable and High profile: tối đa 3 lớp. (Xem bảng 8-9.)

Chỉ có một SNR và một Spatial scale cho phép trong các kết hợp 3 lớp, cho phép SNR/Spatial hoặc Spatial/SNR được cho phép. (Xem Bảng 8-9.)

Chroma simulcast, cho phép thêm 4:2:2 thông tin màu vào một lớp cơ sở 4:2:0 và được định nghĩa trong 7.8 được thực hiện với khả năng mở rộng SNR.

Một lớp 4:2:0 không được phép nếu lớp dưới là 4:2:2. (Xem 7.7.3.3) (level - 1) được định nghĩa như sau:

- if level is Main, (level - 1) is Low;- if level is High - 1440, (level - 1 ) is Main;- if level is High, (level - 1) is High - 1440.

Bảng 8-10 – Kết hợp các lớp cho phép

151

TCVN xxxx : 2017

Chi tiết các giới hạn tham số khác nhau có thể được áp dụng trong mỗi lớp của dòng bit và hồ sơ thích hợp tương ứng và_level_indication cần được sử dụng được đưa ra trong các bảng E.21 đến E.52.

8.4.2. Các ràng buộc cụ thể về Multi-view ProfileCả hai lớp tăng cường và lớp cơ sở có cùng tốc độ khung.

MUX mux cho phép, trật tự picture mux và yếu tố mux ảnh không được sử dụng trong profile này và sẽ bị bỏ qua.

Mã lựa chọn tham chiếu phải là "00" hoặc "01" đối với khung P trong lớp tăng cường. reference_select_code phải là "01" cho các khung B trong lớp tăng cường.

Nếu khung mã căn cứ là khung đầu tiên của Nhóm ảnh, thì khung tương ứng trong lớp tăng cường phải là khung I hoặc khung P với giá trị reference_select_code của "01".

Trong một trường ảnh P với reference_select_code = = "01" và đó là trường đầu tiên của một khung, giới hạn sau đây áp dụng:

- Không được sử dụng dự đoán kép.

- Dự đoán trường trong đó motion_vertieal_field_select cho biết trường thứ hai của khung lớp cơ sở sẽ không được sử dụng.

a) Bộ giải mã tuân thủ đơn giản nhất để giải mã lớp cơ sở được xác định, giả sử rằng dòng bit có thể chứa bất kỳ cú pháp và giá trị tham số nào cho phép đối với profile được nêu ở mức, ngoại trừ khả năng mở rộng. Lưu ý rằng đối với các luồng bitrate không gian High profile@ Main level. 'HP@(level - 1)' trở thành 'MP @ (level - 1)'. Trong trường hợp một lớp cơ sở dòng bit sử dụng ít hơn các yếu tố cú pháp hoặc phạm vi tham số giảm hơn được cho phép, profile_and_level_indication có thể cho biết một 'đơn giản hơn' profile@level

b) Lưu ý rằng định dạng màu 4:2:2 không được hỗ trợ như là một lớp không gian thấp hơn của High profile @ Main level (xem Bảng 8-12).

152

TCVN xxxx : 2017

Nếu lớp cơ sở và các lớp nâng cấp không có cùng giá trị cho trường đầu tiên, sẽ không có macroblocks được mã hoá với macroblock_motion_forward zero và macroblock_intra zero.

- Nếu lớp cơ sở và lớp tăng cường không có cùng giá trị cho top_field_first, sẽ không có macroblocks bỏ qua.

Trong trường ảnh B là trường đầu tiên của một khung, dự đoán sẽ không tạo ra tham chiếu đến trường thứ hai của khung lớp cơ sở tương ứng.

Đó là vốn có trong Multi-view Profile rằng hai lớp được kết hợp chặt chẽ với nhau. Yêu cầu các ảnh trong lớp tăng cường phải được giải mã ngay sau khi các ảnh tham chiếu tương ứng được yêu cầu được giải mã trừ khi yêu cầu này làm cho một lớp giải phóng các ảnh của lớp tăng cường ngoài thứ tự hiển thị. Trong trường hợp đó, các ảnh trong lớp tăng cường phải được giải mã theo thứ tự hiển thị.

8.5. Giá trị tham số cho các profiles, levels và lớp đã xác địnhXem Bảng 8-11.

Bảng 8-11- Giới hạn trên cho mật độ lấy mẫu

LevelSpatial

resolutionlayer

Profile

Simple Main SNR Spatial High 4:2:2 Multi

Enhancement Samples/line 1920

Lines/frame 1080

HighPFrames/sec 60

Lower Samples/line

Lines/frame -

Frames /sec

Enhancement Samples line 1920 1920 1920 1920

Lines frame 1080 1080 1080 1080

HighFrames stv 60 60 60 60

Lower Samples/line 960 1920

Lines/frame - 576 - 1080

Frames/sec 30 60

High- Enhancement Samples/line 1440 1440 1440 1440

1440 Lines/frame 1080 1080 1080 - 1080

Frames/sec 60 60 60 60

Lower Samples/line 720 720 1440

Lines/frame - 576 576 - 1080

Frames/sec 30 30 60

Enhancement Samples/line 720 720 720 720 720 720

Lines/frame 576 576 576 576 576 576

Main Frames/sec 30 30 30 30 30 30

Lower Samples/line 352 720

Lines/frame - - - 288 - 576

Frames/sec 30 30

Enhancement Samples/line 352 352 352

153

TCVN xxxx : 2017

LevelSpatial

resolutionlayer

Profile

Simple Main SNR Spatial High 4:2:2 Multi

Lines/frame 288 288 - 288

Low Frames/sec 30 30 30

Lower Samples/line 352

Lines/frame - - - 288

Frames/sec 30

Trong trường hợp mã hóa một lớp hoặc mã hoá SNR, các giới hạn được chỉ định bởi áp dụng 'Lớp tăng cường'.

a) 512 dòng/khung cho 512/60, 608 dòng/khung cho 625/50

Các thành phần cú pháp được tham chiếu bởi bảng này như sau:

- mẫu/dòng: horizontal_size;- Dòng/Mành: vertical_size;- mành/giây: tốc độ mành.

Giới hạn trên cho frame_rate là như nhau đối với cả hai progressive_sequence = = 0 và progressive_sequence = = 1.

154

TCVN xxxx : 2017

Bảng 8-12 - Giới hạn trên đối với tỷ lệ lấy mẫu độ chói (mẫu/s)

Trong trường hợp mã hóa một lớp hoặc mã hoá SNR, các giới hạn được chỉ định bởi áp dụng ‘Lớp tăng cường'.

Tỷ lệ mẫu độ chói P được định nghĩa như sau:

- For progressive_sequence == 1 :

P = ( 16 * ((horizontal_size + 15)/ 16)) x ( 16 * ((vertical_size + 15)/ 16)) x frame_rate

- For progressive_sequence == 0:

P = ( 16 * ((horizontal_size +15)/ 16)) x (32 * ((vertical_size + 31)/ 32)) x frame_rate

8.6. Yêu cầu về bộ giải mã tương thíchBảng 8-15 xác định các yêu cầu đối với các bộ giải mã. Có một yêu cầu rằng một bộ

giải mã của một profile và mức được biểu diễn bởi một cột trong Bảng 8-15 có khả năng giải mã đúng tất cả các dòng bit với profile và chỉ thị mức đánh dấu bởi một X trong cột. Trong trường hợp hệ thống phân cấp có thể mở rộng của các dòng dòng bit, profile và mức độ chỉ thị là của tầng trên.

Chú ý: Đối với các Profile và mức tuân theo cấu trúc phân cấp, mỗi lớp của dòng bit chứa profile_and_level_indication của bộ giải mã "đơn giản" có khả năng giải mã thành công lớp đó của dòng bit. profile_and_level_indication Escape_bit == 0, đây sẽ là số lớn nhất về số lượng giá trị hợp lệ của profile_and_level_indication.

Bảng 8-13 -Giới hạn trên của tốc độ (Mbit/s)

LevelProfile

Simple Main SNR Spatial High 4:2:2 Multi-view

HighP 80

155

TCVN xxxx : 2017

LevelProfile

Simple Main SNR Spatial High 4:2:2 Multi-view

High80

100 tất cả các lớp 80 giữa + lớp cơ sở 25 lớp cơ sở

300130 cả hai lớp 80 lớp cơ sở

High-

1440 6060 tất cả các lớp 40 giữa + lớp cơ sở 15 lớp cơ sở

80 tất cả các lớp 60 giữa + lớp cơ sở 20 lớp cơ sở

- 100 cả hai lớp 60 lớp cơ sở

Main15 15

15 cả các lớp 10 lớp

cơ bản

20 tất cả các lớp 15 giữa + lớp cơ sở 4 lớp cơ sở

50 25 cả hai lớp 15 lớp cơ sở

Low4

4 cả các lớp 3 lớp cơ bản

- 8 cả hai lớp 4 lớp cơ sở

Chú ý 1 - Điều này (có thể xác định tốc độ hoạt động tối đa của VBV cho một bitstream được mã hoá của profile và mức độ nhất định. Tốc độ này được chỉ ra bởi bit_rate (xem 6.3.3).

Chú ý 2 - Bảng này xác định tốc độ dữ liệu cho phép tối đa cho tất cả các lớp đến và bao gồm cả lớp được định hình. Đối với các ứng dụng mã hóa nhiều lớp, tỷ lệ dữ liệu được phân bổ giữa các lớp được hạn chế bởi tỷ lệ tối đa cho phép đối với một lớp nhất định như đã nêu trong bảng này.

Chú ý 3 - 1 Mbit = 1000 000 bits

Bảng 8-14 - Yêu cầu về kích thước bộ đệm của VBV (bit)

Chú ý 1 - Kích thước bộ đệm được tính tỷ lệ với tốc độ bit cho phép tối đa, được làm tròn xuống đến gần nhất của nhiều bit 16 x 1024 bit. Giá trị tham chiếu cho việc mở rộng là kích thước bộ đệm Main profile, Main level.Chú ý 2 - Bảng này mô tả tổng kích thước bộ đệm bộ giải mã cần thiết để giải mã tất cả các lớp đến và bao gồm cả lớp đã nêu. Đối với các ứng dụng mã hóa đa lớp, việc phân bổ bộ nhớ đệm giữa các lớp được hạn chế bởi kích thước tối đa cho phép của một lớp nhất định như được nêu trong bảng này

156

TCVN xxxx : 2017

Chú ý 3- Phần tử cú pháp tương ứng với bảng này là vbv_buffer_size (xem 6.3.3).

Bảng 8-15 - Khả năng tương thích về chuyển tiếp giữa các profiles và các mức khác nhau

X chỉ ra rằng bộ giải mã sẽ có thể giải mã luồng bit, bao gồm tất cả các lớp dưới có liên quan.

a) Các bộ giải mã SP@ML được yêu cầu giải mã các dòng bit MP @ LL.

b) Bộ giải mã Profile@Main level 4 2: 2 sẽ có thể giải mã các dòng bit Profile@Main level, Profiler@ Low level và Simple profile@Main level, cũng như các các dòng bit tham số của hệ thống bị ràng buộc như trong ISO/IEC 11172-2.

c)Một Bộ giải mã Profile@Main level 4:2:2 có thể giải mã 4:2:2P@ML, MP@HL, MP@H-14, MP@ML, MP@LL và SP@ML như ràng buộc các dòng bit tham số hệ thống ISO/IEC 11172-2.

9. Nhận dạng Đăng ký bản quyền9.1. Tổng quát

Các phần 1.2. và 3 của ISO/IEC 13818 cung cấp hỗ trợ cho việc quản lý bản quyền nghe nhìn. Trong ITU-T H.222.0 │ ISO/IEC 13818-1,mô tả bản quyền, trong khi trong Tiêu chuẩn Kỹ thuật này và ISO/IEC 13818-3 chứa các trường để xác định chủ sở hữu bản quyền thông qua các trường cú pháp trong cú pháp sơ cấp luồng. Tiêu chuẩn Kỹ thuật này trình bày phương pháp thu thập và đăng ký nhận dạng bản quyền ở trong Tiêu chuẩn Kỹ thuật này.

Tiêu chuẩn Kỹ thuật này chỉ định một bản quyền 32 bit độc quyền mà là mã định danh mã loại công việc (như ISBN, ISSN, ISRC, ..v.v..) được thực hiện trong mô tả bản quyền. Các copyright_identifier cho phép xác định một số lượng lớn các cơ quan đăng ký bản quyền. Mỗi cơ quan đăng ký bản quyền có thể chỉ định một cú pháp và ngữ nghĩa để xác

157

TCVN xxxx : 2017

định các tác phẩm nghe nhìn hoặc các tác phẩm có bản quyền khác trong tổ chức bản quyền cụ thể đó thông qua việc sử dụng đúng trường chiều dài biến tố additional_copyright_info có chứa số bản quyền.

Trong phần các phụ lục G, H và I, các lợi ích và trách nhiệm của tất cả các bên trong việc đăng ký bản xác nhận bản quyền được nêu ra.

9.2. Hoạt động của Cơ quan đăng ký bản quyền (RA)ISO/IEC JTC 1 sẽ yêu cầu đề cử cho một tổ chức quốc tế sẽ làm cơ quan đăng ký

cho bản quyền tác giả theo quy định tại Tiêu chuẩn Kỹ thuật này. Tổ chức được lựa chọn sẽ là Cơ quan đăng ký. Cơ quan đăng ký tên như vậy sẽ thực hiện các nghĩa vụ của mình phù hợp với Phụ lục H của Chỉ thị JTC 1. Copyright_identifier được đăng ký dưới đây được gọi là Mã số đăng ký (RID).

Sau khi lựa chọn Cơ quan Đăng ký, JTC 1 yêu cầu thành lập một Nhóm Quản lý Đăng ký (RMG) sẽ xem xét lại trườngkháng cáo của các tổ chức yêu cầu RID được sử dụng kết hợp với Tiêu chuẩn Kỹ thuật này đã bị cơ quan đăng ký chối bỏ.

Phụ lục G, H và I của Tiêu chuẩn Kỹ thuật này cung cấp thông tin về thủ tục đăng ký một bản quyền độc quyền.

158

TCVN xxxx : 2017

Phụ lục A–Phép biến đổi cosine rời rạc đảo ngược

(Quy định)

Biến đổi cosine rời rạc số thực số học hai chiều NxN hai chiều (IDCT) được xác định như sau:

Với:u, v, x, y = 0, 1,2,... N - 1

Trong đó: x, y là tọa độ không gian trong miền mẫu

u, v là tọa độ trong miền biến đổi

f(x,y) và F(u,v) là số thực cho mỗi cặp giá trị (x,y) và (u,v)

π là hằng số Archimedes 3,141 592 653 589 793 238 462 634 …

Biến đổi cosine rời rạc số thực số học hai chiều NxN (DCT) được xác định như sau:

Ơ đây: x, y, u, v, f(x,y) và F(u,v) được định nghĩa như đã nêu ở trên cho định nghĩa IDCT.

Định nghĩa của DCT (còn gọi là chuyển tiếp DCT) là thông tin thuần túy. Chuyển tiếp DCT không được sử dụng bởi quá trình giải mã được quy định trong Tiêu chuẩn Kỹ thuật này.

Đối với các mục đích của Tiêu chuẩn Kỹ thuật này, giá trị N sẽ được tính bằng 8.

Số nguyên số học IDCT được định nghĩa là:

f’(x,y) = round(f(x,y))Với f(x,y) được tạo ra bởi IDCT số thực toán học như đã nêu ở trên cho mỗi giá trị của x và

y, trong đó round()biểu thị làm tròn đến số nguyên gần nhất, với các giá trị nửa số nguyên được làm tròn đi từ số không.

Các IDCT chức năng được sử dụng trong quá trình giải mã để tính các giá trị số nguyên/ f[y][x] có thể sử dụng bất kỳ phương pháp xấp xỉ số nguyên của con số số học IDCT kết quả f'(x,y), miễn là nó phù hợp với tất cả các yêu cầu được quy định trong ISO/IEC 23002-1 và các phụ lục A và B của nó và có độ chính xác đủ để các lỗi đáng kể không xảy ra trong các giá trị cuối cùng của các số nguyên.

Chú ý - Ngoài ra yêu cầu trên, mong muốn rằng đầu ra số nguyên của hàm IDCT f[y][x] được sử dụng trong quá trình giải mã bổ sung tạo ra kết quả càng gần càng khả thi đối với kết quả của số nguyên IDCT cho các giá trị đầu vào gây ra một hoặc nhiều phần tử f'(x,y) của đầu ra của số nguyên IDCT số toán học để phần nào vượt quá phạm vi của [-384. 383].

159

TCVN xxxx : 2017

Phụ lục B- Bảng mã chiều dài thay đổi

(Quy định)

B.1. Địa chỉ MacroblockXem Bảng B.1.

Bảng B.1 – Các mã chiều dài thay đổi cho khối macroblock_address_increment

Chú ý - Mục "macroblock_stuffing" có trong ISO/IEC 11172-2 không có trong Tiêu chuẩn Kỹ thuật này

B.2.Kiểu MacroblockCác thuộc tính của macroblock được xác định bởi các macroblock loại VLC theo bảng B.2

đến B.8.

Bảng B.2 - Mã chiều dài thay đổi cho macroblock_type trong ảnh Imacroblock_type VLC code

Macroblock_quantmacroblock_motion_forward

macroblock_motion_barkwardMacroblock_pattern

Macroblock_infraspatial_temporal_weight_code_flag

Permitted_spatial_temporal_weight_classes

160

TCVN xxxx : 2017

Description1 0 0 0 0 1 0 Intra 001 1 0 0 0 1 0 Intra, Quant 0

Bảng B.3 - Mã chiều dài thay đổi cho macroblock_type trong ảnh P

macroblock_type VLC codeMacroblock_quant

Macroblock_motion_forwardMacroblock_motion_backrward

Marroblock_patternmacroblock intra

spatial_temporal_weighl_code_flagpermitted spatlal_temporal_weight_classes

Mô tả1 0 1 0 1 0 0 MC, Coded 001 0 0 0 1 0 0 No MC, C oded 0001 0 1 0 0 0 0 MC, Not Coded 00001 1 0 0 0 0 1 0 Intra 00001 0 1 1 0 1 0 0 MC, Coded, Quant 00000 1 1 0 0 1 0 0 No MC. Coded, Quant 00000 01 1 0 0 0 1 0 Intra, Quant 0

Bảng B.4 - Mã chiều dài thay đổi cho macroblock_type trong ảnh B

Macroblock_type VLC codeMacroblock_quant

macroblock _motion_forwardmacroblock _motion_backward

macroblock _patternMacroblock_intra

Spatial_temporal_weight_code_flagPermitted-spatial-temporal-weight-classes

Description10 0 I 1 0 0 0 Interp, Not Coded 011 0 1 1 1 0 0 Interp, Coded 0010 0 0 1 0 0 0 Bwd, Not Coded 0011 0 0 1 1 0 0 Bwd,Coded 00010 0 1 0 0 0 0 Fwd, Not Coded 00011 0 1 0 1 0 0 Fwd, Coded 00001 1 0 0 0 0 1 0 Intra 00001 0 1 1 1 1 0 0 Interp, Coded, Quant 00000 11 1 I 0 1 0 0 Fwd, Coded, Quant 00000 10 1 0 1 1 0 0 Bwd, Coded, Quant 00000 01 1 0 0 0 1 0 Intra, Quant 0

161

TCVN xxxx : 2017

Bảng B.5 - Mã chiều dài thay đổi cho macroblock_type trong ảnh I với khả năng mở rộng không gian

Macroblock_type VLC codeMacroblock_quant

Macroblock_motion_forwardmacroblock. _motion_backward

macroblock_patternMacroblock_intra

Spatial_temporal_weight_code_flagspatial_temporal_weight_classes

Description1 0 0 0 1 0 0 Coded, Compatible 4

01 1 0 0 1 0 0 Coded. Compatible, Quant 40011 0 0 0 0 1 0 Intra 00010 1 0 0 0 1 0 Intra, Quant 00001 0 0 0 0 0 0 Not Coded, Compatible 4

Bảng B.6 - Mã chiều dài thay đổi cho macroblock_type trong ảnh P với khả năng mở rộng theo không gian

Macroblock_type VLC codeMacroblock_quant

Macroblock_motion_forwardmacroblock_motion_backward

macroblock_patternMacroblock_intra

Spatial_temporal_weight_code_flagPermitted-spatial-temporal-weight-classes

Description10 0 1 0 1 0 0 MC, Coded 001 0 1 0 1 0 1 MC, Coded, Compatible 1,2,3

0000 100 0 0 0 1 0 0 No MC, Coded 00001 11 0 0 0 1 0 1 No MC, Coded, Compatible 1.2.3

0010 0 1 0 0 0 0 MC, Not Coded 00000 111 0 0 0 0 1 0 Intra 0

0011 0 1 0 0 0 1 MC, Not coded, Compatible 1,2,3

010 1 1 0 1 0 0 MC, Coded, Quant 00001 00 1 0 0 1 0 0 No MC, Coded, Quant 0

0000 110 1 0 0 0 1 0 Intra. Quant 011 1 1 0 1 0 1 MC, Coded, Compatible, Quant 1,2,3

0001 01 1 0 0 1 0 1 No MC, Coded. C'ompatible.Quant 1,2,3

0001 10 0 0 0 0 0 1 No MC, Not Coded, Compatible 1,2,3

0000 101 0 0 0 1 0 0 Coded, Compatible 4

0000 010 1 0 0 1 0 0 Coded, Compatible, Quant 4

0000 001 0 0 0 0 0 0 Not Coded, Compatible 4

162

TCVN xxxx : 2017

Bảng B.7 - Mã chiều dài thay đổi cho macroblock_type trong ảnh B với khả năng mở rộng theo không gian

Macroblock_type VLC codeMacroblock_quant

Macroblock_motion_forwardmacroblock_motion_backward

macroblock_patternMacroblock_intra

Spatial_temporal_weight_code_flagPermitted-spatial-temporal-weight-classes

Description10 0 1 1 0 0 0 Interp, Not coded 011 0 1 1 1 0 0 Interp, Coded 0010 0 0 1 0 0 0 Back, Not coded 0011 0 0 1 1 0 0 Back, Coded 00010 0 1 0 0 0 0 For,Not coded 00011 0 1 0 1 0 0 For. Coded 00001 10 0 0 1 0 0 1 Back, Not Coded.

Compatible1,2,3

0001 11 0 0 1 1 0 1 Back, Coded, Compatible 1,2,30001 00 0 1 0 0 0 1 For, Not Coded, Compatible 1,2,30001 01 0 1 0 1 0 1 For, Coded, Compatible 1,2,30000 110 0 0 0 0 1 0 intra 00000 111 1 1 1 1 0 0 Interp, Coded, Quant 00000 100 1 1 0 1 0 0 For, Crated, Quant 00000 101 1 0 1 1 0 0 Back, Coded, Quant 000000100 1 0 0 0 1 0 Intra, Quant 000000101 1 1 0 1 0 1 For, Coded, Compatible.

Quant1,2,3

000001100 1 0 1 1 0 1 Back, Coded, Compatible. Quant

1,2,3000001110 0 0 0 0 0 0 Not Coded, Compatible 4000001101 1 0 0 1 0 0 Coded, Compatible, Quant 4000001111 0 0 0 1 0 0 Coded, Compatible 4

Bảng B.8- Mã chiều dài thay đổi cho macroblocktype trong ảnh l, ảnh P vàảnh B với khả năng mở rộng SNR

Macroblock_type VLC codeMacroblock_quant

Macroblock_motion_forwardmacroblock_motion_backward

macroblock_patternMacroblock_intra

Spatial_temporal_weight_code_flagPermitted-spatial-temporal-weight-classes

Description1 0 0 0 1 0 0 Coded 001 1 0 0 1 0 0 Coded, Quant 0

163

TCVN xxxx : 2017

001 0 0 0 0 0 0 Not Coded 0

Chú ý - Không có sự phân biệt giữa các loại ảnh, vì các macroblocks được xử lý giống nhau trong ảnh I, ảnh P, và ảnh B. Loại "Không mã hóa" là cần thiết, kể từ khi bỏ qua macroblocks không được phép ở đầu và cuối của một lát cắt.

B.3.Mẫu khối MacroblockXem Bảng B.9.

Bảng B.9 - Mã chiều dài thay đổi cho coded_block_pattern

coded_block_patternVLC code cbp coded_block_pattern

VLC code cbp

111 60 0001 1100 351101 4 0001 1011 131100 8 0001 1010 491011 16 0001 1001 211010 32 0001 1000 411001 1 12 0001 0111 141001 0 48 0001 0110 501000 1 20 0001 0101 221000 0 40 0001 0100 420111 1 28 0001 0011 150 1 1 1 0 4 4 0001 0010 510110 1 52 0001 0001 2301100 56 0001 0000 430101 1 1 0000 1111 250101 0 61 0000 1110 370100 1 2 0000 1101 2601000 62 0000 1100 380011 11 24 0000 1011 290011 10 36 0000 1010 450011 01 3 0000 1001 530011 00 63 0000 1000 570010 111 5 0000 0111 300010 110 9 0000 0110 460010 101 17 0000 0101 540010 100 33 00000100 580010 011 6 0000 00111 310010010 10 0000 00110 470010 001 18 0000 00101 550010 000 34 0000 00100 590001 1111 7 0000 00011 27

164

TCVN xxxx : 2017

coded_block_patternVLC code cbp coded_block_pattern

VLC code cbp

0001 1110 11 0000 00010 390001 1101 19 0000 00001 0 (Chú ý)

Chú ý: Mục này sẽ không được sử dụng với cấu trúc độ sắcmàu 4:2:0.

Bảng B.11 - Mã chiều dài thay đổi cho dmvector[t]

Mã Giá trị11 -10 010 1

B.5. Hệ số DCTXem bảng B. 12 đến B. 16.

Bảng B.12 - Mã chiều dài thay đổi cho dct_dc_size_luminance

Mã chiều dài thay đổi dct_dc_size_luminance

100 000 101 2101 3110 41110 511110 6111110 71111 110 811111110 91111 1110 101111 1111 11

Bảng B.13 - Mã chiều dài thay đổi cho dct_dc_size_chrominance

Mã chiều dài thay đổi dct_dc_size_chrominance

00 001 110 2110 31110 411110 51111 10 61111 110 71111 1110 81111 11110 91111 1111 10 101111111111 11

165

TCVN xxxx : 2017

Bảng B.14 - Các hệ số DCT Bảng 0 (zero)

Mã chiều dài thay đổi (Chú ý 1) Run Level

10 (Chú ý 2) End of Block

1 s (Chú ý 3) 0 1

11 s (Chú ý 4) 0 1

011 s 1 1

0100 s 0 2

0101 s 2 1

0010 1 s 0 3

0011 1 s 3 1

0011 0 s 4 1

0001 10 s 1 2

0001 11 s 5 1

0001 01 s 6 1

0001 00 s 7 1

0000 110 s 0 4

0000 100 s 2 2

0000 111 s 8 1

0000 101 s 9 1

0000 01 Escape

0010 0110 s 0 5

0010 0001 s 0 6

0010 0101 s 1 3

0010 0100 s 3 2

0010 0111 s 10 1

0010 0011 s 11 1

0010 0010 s 12 1

0010 0000 s 13 1

0000 0010 10 s 0 7

0000 0011 00 s 1 4

0000 0010 11 s 2 3

0000 0011 11 s 4 2

0000 0010 01 s 5 2

0000 0011 10 s 14 1

0000 0011 01 s 15 1

166

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1) Run Level

0000 0010 00 s 16 1

0000 0001 1101 s 0 8

0000 0001 1000 s 0 9

0000 0001 0011 s 0 10

0000 0001 0000 s 0 11

0000 0001 1011 s 1 5

0000 0001 0100 s 2 4

0000 0001 1100 s 3 3

0000 0001 0010 s 4 3

0000 0001 1110 s 6 2

0000 0001 0101 s 7 2

0000 0001 0001 s 8 2

0000 0001 1111 s 17 1

0000 0001 1010 s 18 1

0000 0001 1001 s 19 1

0000 0001 011 1 s 20 1

0000 0001 0110 s 21 1

0000 0000 1101 0 s 0 12

0000 0000 1100 1 s 0 13

0000 0000 1100 0 s 0 14

0000 0000 1011 1 s 0 15

0000 0000 1011 0 s 1 6

0000 0000 1010 1 s 1 7

0000 0000 1010 0 s 2 5

0000 0000 1001 1 s 3 4

0000 0000 1001 0 s 5 3

0000 0000 1000 1 s 9 2

0000 0000 1000 0 s 10 2

0000 0000 1111 1 s 22 1

0000 0000 111 10 s 23 1

0000 0000 11101 s 24 1

0000 0000 1110 0 s 25 1

0000 0000 1101 1 s 26 1

167

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1) Run Level

0000 0000 0111 11 s 0 16

0000 0000 011 1 10 s 0 17

0000 0000 0111 01 s 0 18

0000 0000 0111 00 8 0 19

0000 0000 0110 11 s 0 20

0000 0000 0110 10 s 0 21

0000 0000 0110 01 s 0 22

0000 0000 0110 00 s 0 23

0000 0000 0101 11 s 0 24

0000 0000 0101 10 s 0 25

0000 0000 0101 01 s 0 26

0000 0000 0101 00 s 0 27

0000 0000 0100 11 s 0 28

0000 0000 0100 10 s 0 29

0000 0000 0100 01 s 0 30

0000 0000 0100 00 s 0 31

0000 0000 0011 000 s 0 32

0000 0000 0010 111 s 0 33

0000 0000 0010 110 s 0 34

0000 0000 0010 101 s 0 35

0000 0000 0010 100 s 0 36

0000 0000 0010 011 s 0 37

0000 0000 0010 010 s 0 38

0000 0000 0010 001 s 0 39

0000 0000 0010 000 s 0 40

0000 0000 0011 111 s 1 8

0000 0000 0011 110 s 1 9

0000 0000 0011 101 s 1 10

0000 0000 0011 100 s 1 11

0000 0000 0011 011 s 1 12

0000 0000 0011 010 s 1 13

0000 0000 0011 001 s 1 14

0000 0000 0001 0011 s 1 15

168

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1) Run Level

0000 0000 0001 0010 s 1 16

0000 0000 0001 0001 s 1 17

0000 0000 0001 0000 s 1 18

0000 0000 0001 0100 s 6 3

0000 0000 0001 1010 s 11 2

0000 0000 0001 1001 s 12 2

0000 0000 0001 1000 s 13 2

0000 0000 0001 0111 s 14 2

0000 0000 0001 0110 s 15 2

0000 0000 0001 0101 s 16 2

0000 0000 0001 1111 s 27 1

0000 0000 0001 1110 s 28 1

0000 0000 0001 1101 s 29 1

0000 0000 0001 1100 s 30 1

0000 0000 0001 1011 s 31 1

Chú ý 1 - bit 's' cuối cùng 'biểu thị tín hiệu của mức: '0' cho dương, '1' cho âm.

Chú ý 2 - "End of Block" không chỉ là mã duy nhất của khối.

Chú ý 3 - Mã này sẽ được sử dụng cho hệ số DC đầu tiên trong khối.

Chú ý 4 - Mã này sẽ được sử dụng cho tất cả các hệ số khác.

Bảng B.15 - Các hệ số DCT Bảng 1

Mã chiều dài thay đổi (Chú ý 1 ) Run Level

0110 (Chú ý 2) End of Block

10s 0 1

010 s 1 1

110 s 0 2

0010 1 s 2 1

0111 s 0 3

0011 1 s 3 1

0001 10 s 4 1

0011 0 s 1 2

0001 11 s 5 1

0000 110 s 6 1

169

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1 ) Run Level

0000 100 s 7 1

1110 0 s 0 4

0000 111 s 2 2

0000 101 s 8 1

1111 000 s 9 1

0000 01 Escape

1110 1 s 0 5

0001 01 s 0 6

1 111 001 s 1 3

0010 0110 s 3 2

1111 010 s 10 1

0010 0001 s 11 1

001001011 s 12 1

0010 0100 s 13 1

0001 00 s 0 7

0010 0111 s 1 4

1111 1100 s 2 3

1111 1101 s 4 2

0000 0010 0 s 5 2

0000 0010 1 s 14 1

0000 0011 1 s 15 1

0000 0011 01 s 16 1

1111 011 s 0 8

1111 100 s 0 9

0010 0011 s 0 10

0010 0010s 0 11

0010 0000 s 1 5

0000 0011 00 s 2 4

0000 0001 1100 s 3 3

0000 0001 0010 s 4 3

0000 0001 1110 s 6 2

0000 0001 0101 s 7 2

0000 0001 0001 s 8 2

170

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1 ) Run Level

0000 0001 1111 s 17 1

0000 0001 1010 s 18 1

0000 0001 1001 s 19 1

0000 0001 0111 s 20 1

0000 0001 0110 s 21 1

1111 1010 s 0 12

1111 1011 s 0 13

1111 1110 s 0 14

1111 1111 s 0 15

00000000 1011 0 s 1 6

0000 0000 1010 1 s 1 7

0000 0000 1010 0 s 2 5

0000 0000 1001 1 s 3 4

0000 0000 1001 0 s 5 3

0000 0000 1000 1 s 9 2

0000 0000 1000 0 s 10 2

0000 0000 1111 1 s 22 1

0000 0000 1111 0 s 23 1

0000 0000 1110 1 s 24 1

0000 0000 1110 0 s 25 1

0000 0000 1101 1 s 26 1

0000 0000 0111 11 s 0 16

0000 0000 0111 10 s 0 17

0000 0000 0111 01 s 0 18

0000 0000 0111 00 s 0 19

0000 0000 0110 11 s 0 20

0000 0000 0110 10 s 0 21

0000 0000 0110 01 s 0 22

0000 0000 0110 00 s 0 23

0000 0000 0101 11 s 0 24

0000 0000 0101 10 s 0 25

0000 0000 0101 01 s 0 26

171

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1 ) Run Level

0000 0000 0101 00 s 0 27

0000 0000 0100 11 s 0 28

0000 0000 0100 10 s 0 29

0000 0000 0100 01 s 0 30

0000 0000 0100 00 s 0 31

0000 0000 0011 000 s 0 32

0000 0000 0010 111 s 0 33

0000 0000 0010 110 s 0 34

0000 0000 0010 101 s 0 35

0000 0000 0010 100 s 0 36

0000 0000 0010 011 s 0 37

0000 0000 0010 010 s 0 38

0000 0000 0010 001 s 0 39

0000 0000 0010 000 s 0 40

0000 0000 0011 111 s 1 8

0000 0000 0011 110 s 1 9

0000 0000 0011 101 s 1 10

0000 0000 0011 100 s 1 II

000000000011011 s 1 12

0000 0000 0011 010 s 1 13

0000 0000 0011 001 s 1 14

0000 0000 0001 0011 s 1 15

0000 0000 0001 0010 s 1 16

0000 0000 0001 0001 s 1 17

0000 0000 0001 0000 s 1 18

0000 0000 0001 0100 s 6 3

0000 0000 0001 1010 s 11 2

0000 0000 0001 1001 s 12 2

0000 0000 0001 1000 s 13 2

0000 0000 0001 0111 s 14 2

0000 0000 0001 0110 s 15 2

0000 0000 0001 0101 s 16 2

172

TCVN xxxx : 2017

Mã chiều dài thay đổi (Chú ý 1 ) Run Level

0000 0000 0001 1111 s 27 1

0000 0000 0001 1110 s 28 1

0000 0000 0001 1101 s 29 1

0000 0000 0001 1100 s 30 1

0000 0000 0001 1011 s 31 1

Chú ý 1 – bit ‘s’ cuối cùng 'biểu thị tín hiệu của mức: '0' cho dương, '1' cho âm.

Chú ý 2 - "End of Block" không chỉ là mã duy nhất của khối.

Bảng B. 16 - Mã hoá chạy và mức sau một mã ESCAPE

Mã chiều dài không đổi

Chạy

000000 00000 01 10000 10 2... ...

...... ...... ...1111 11 63

Mã chiều dài không đổi

Mức tín hiệu

1000 0000 0000 Dự phòng1000 0000 0001 -2047100000000010 -2046...111111111111 -1000000000000 Cấm000000000001 +1

...011111111111 +2047

173

TCVN xxxx : 2017

Phụ lục C - Xác nhận bộ đệm video

(Quy định)

Các dòng bit mã hoá video phải đáp ứng các ràng buộc được áp đặt thông qua Trình kiểm tra đệm Video (VBV) được định nghĩa trong phụ lục này. Mỗi dòng bit trong một hệ thống phân cấp có thể mở rộng sẽ không vi phạm các ràng buộc VBV được định nghĩa trong phụ lục này.

VBV là một bộ giải mã giả lập, được kết nối với đầu ra của một bộ mã hóa. Nó có một bộ đệm đầu vào được gọi là bộ đệm VBV. Dữ liệu mã hoá được đặt trong bộ đệm như được định nghĩa dưới đây trong C.3 và được lấy ra từ bộ đệm như được định nghĩa trong C.5. C 6. và C.7. Yêu cầu rằng một dòng bit phù hợp với đặc tả này sẽ không gây tràn bộ đệm VBV. Khi sự trễ thấp bằng không, dòng bit sẽ không gây ra sự tràn bộ đệm VBV. Khi low_delay bằng một, việc giải mã một ảnh tại thời điểm dự kiến bình thường có thể làm cho bộ đệm VBV bị giảm. Nếu đây là trường hợp, ảnh không được giải mã và bộ đệm VBV được kiểm tra lại tại một chuỗi sau đó được chỉ định trong C.7 và C.8 cho đến khi nó có mặt trong bộ đệm VBV.

Tất cả các số học trong phụ lục này được thực hiện với các giá trị thực, do đó không có lỗi làm tròn có thể truyền đi. Ví dụ, số bit trong bộ đệm VBV không phải là số nguyên.

C.1.VBV và bộ mã hóa video có cùng tần số đồng hồ cũng như cùng tốc độ khung hình và được vận hành đồng bộ.

C.2.Bộ đệm VBV có kích thước B, trong đó B là vbv_buffer_size được mã hoá trong tiêu đề chuỗi và phần mở rộng chuỗi nếu có.

C.3.Lệnh này xác định đầu vào của dữ liệu vào bộ đệm VBV. Hai trường hợp loại trừ lẫn nhau được định nghĩa trong C.3.1 và C.3.2. Trong cả hai trường hợp, bộ đệm VBV ban đầu đều rỗng. Đặt Rmax là tốc độ bit xác định trong trường bit_rate.

C.3.1. Trong trường hợp vbv_delay được mã hoá với một giá trị không bằng FFFF hệ thập lục phân, dữ liệu ảnh của ảnh mã hoá thứ n vào bộ đệm với tốc độ R(n) trong đó:

Ở đây:

R (n) là tốc độ, tính bằng bits/s, mà dữ liệu ảnh cho ảnh mã hóa thứ n nhập vào VBV.

d * n là số bit sau bit cuối cùng của mã bắt đầu thứ n bắt đầu và trước và bao gồm bit cuối cùng của mã bắt đầu ảnh thứ (n + 1).

X(n) là độ trễ giải mã được mã hoá trong vbv_delay cho ảnh mã hóa thứ n được đo bằng giây.

t (n) là thời gian, được tính bằng giây, khi ảnh được mã hóa thứ n được xóa khỏi bộ đệm VBV. t(n) là được định nghĩa trong C9, C.10, C.11, và C.12.

Sự không rõ ràng ở bắt đầu của một chuỗi:

Khoảng thời gian tn+1- tn giữa việc loại bỏ hai ảnh liên tiếp thường có thể được lấy từ dòng bit như mô tả trong C.9, C.10, C.11 và C.12.

Khi truy cập ngẫu nhiên được thực hiện theo một chuỗi, tn+1- tn không thể được xác định từ dòng bit video một lần cho các ảnh đầu tiên sau tiêu đề chuỗ kể từ khi mã hoá khung P hoặc

174

TCVN xxxx : 2017

khung I đã mã hoá không tồn tại trong dãy đã giải mã . Nếu dòng bit được ghép như là một phần của một hệ thống dòng bit theo ITU-T H.222.0 ǀ ISO/IEC 13818-1, thì có thể (nhưng không chắc chắn) rằng thông tin trong các hệ thống dòng bit có thể được sử dụng để xác định rõ ràng khoảng thời gian này. Thông tin này có sẵn nếu Dấu thời gian giải mã (DTS) được truyền cho ảnh n và n + l.

Nếu không thể xác định được tốc độ R(n) một cách rõ ràng, VBV không thể xác định chính xác độ đầy đủ của quỹ đạo trong bộ đệm VBV trong khoảng thời gian giới hạn (luôn thấp hơn giá trị lớn nhất của vbv_delay, khoảng xấp xỉ 0,73 giây) , do đó xác minh VBV chặt chẽ của toàn bộ dòng bit không phải lúc nào cũng có thể. Lưu ý rằng một bộ mã hóa luôn biết các giá trị của tn+1- tn sau mỗi đoạn mã lặp lại và do đó biết làm thế nào để tạo ra một dòng bit mà không vi phạm các ràng buộc VBV tại những điểm đó.

Sự không rõ ràng có thể trở thành một vấn đề khi dòng bit video được ghép lại và phân phối ở tốc độ khác với tốc độ không đổiR(n).

Cũng cần lưu ý rằng tốc độ đầu vào cho các bit trước tiêu đề ảnh đầu tiên không thể được xác định từ dòng bit.

Sự không rõ ràng ở cuối của một chuỗi:

Đầu vào của tất cả các bit sau mã bắt đầu ảnh của hình trước đoạn cuối của chuỗi mã hóa không thể được xác định từ dòng bit. Sẽ có một tốc độ đầu vào cho các bit không dẫn đến tràn hoặc, nếu low_delay bằng 1, một dòng dưới của bộ đệm VBV. tốc độ này phải nhỏ hơn tốc độ tối đa được chỉ định trong tiêu đề chuỗi.

Sau khi điền vào bộ đệm VBV với tất cả các dữ liệu đi trước mã bắt đầu ảnh đầu tiên của chuỗi và mã bắt đầu của ảnh, bộ đệm VBV được điền vào từ dòng bit cho thời gian xác định bởi trường vbv_delay trong phần đầu ảnh. Tại thời điểm này bắt đầu giải mã. Dữ liệu đầu vào tiếp tục ở mức được quy định trong mục phụ này.

Đối với tất cả các dòng bit R(n) <= Rmax cho tất cả các dữ liệu ảnh.Chú ý: Đối với video tốc độ không đổi, chuỗi các giá trị R(n) là hằng số trong toàn bộ chuỗi nằm trong

độ chính xác cho phép bằng việc định lượng vbv_delay

C.3.2. Trong trường hợp vbv_delay được mã hoá bằng FFFF hệ thập lục phân giá trị, dữ liệu nhập vào bộ đệm VBV như được xác định trong phần phụ này.

Nếu bộ đệm VBV không đầy đủ, dữ liệu nhập vào bộ đệm tại Rmax

Nếu bộ đệm VBV trở nên đầy đủ sau khi thu được tại Rmax một thời gian, không có dữ liệu nào vào bộ đệm cho đến khi một số dữ liệu được lấy ra khỏi bộ đệm.

Sau khi điền vào bộ đệm VBV với tất cả các dữ liệu đi trước mã bắt đầu ảnh đầu tiên của chuỗi và mã bắt đầu ảnh, bộ đệm VBV được chèn từ dòng bit cho đến khi nó đầy. Tại thời điểm này bắt đầu giải mã. Dữ liệu đầu vào tiếp tục ở tốc độ được chỉ định trong mục phụ này.

C.4. Bắt đầu từ thời điểm định nghĩa trong C.3, bộ đệm VBV được kiểm tra theo các lần kế tiếp được định nghĩa trong C.9 đến C. 12. C.5 đến C.8 xác định các hành động được thực hiện tại mỗi lần bộ đệm VBV được kiểm tra.

C.5. Mục tiêu này xác định một yêu cầu đối với tất cả các dòng bits video.

Vào thời điểm bộ đệm VBV được kiểm tra trước khi loại bỏ bất kỳ dữ liệu ảnh nào, số bit trong bộ đệm phải nằm giữa các bit zero và bit B, trong đó B là kích thước của bộ đệm VBV chỉ định bởi vbv_buffer_size.

175

TCVN xxxx : 2017

Đối với mục đích của phụ lục này, dữ liệu ảnh được định nghĩa là tất cả các lần truy cập của ảnh được mã hóa, tất cả các tiêu đề và dữ liệu người dùng ngay trước nó nếu có (bao gồm bất kỳ việc nhồi giữa chúng) và tất cả việc nhồi sau nó, lên đến (nhưng không bao gồm) mã bắt đầu tiếp theo, ngoại trừ trường hợp mã khởi đầu tiếp theo là mã cuối cùng của mã trình tự, trong trường hợp nó được bao gồm trong dữ liệu ảnh.

Hình C1 - Sự chiếm chỗ bộ đệm VBV – Hoạt động tốc độ bit không đổiC.6.Mục này định nghĩa một yêu cầu về dòng bit video khi cờ low_delay bằng không.

Tại mỗi lần kiểm tra bộ đệm VBV và trước khi xóa bất kỳ bit nào, tất cả các dữ liệu cho ảnh có trong bộ đệm dài nhất sẽ có trong bộ đệm VBV. Dữ liệu ảnh này sẽ được gỡ bỏ ngay lập tức vào thời điểm này.

Sự tràn xuống bộ đệm của VBV sẽ không xảy ra khi cờ low_delay bằng 0. Điều này yêu cầu tất cả các dữ liệu ảnh cho ảnh thứ n sẽ có trong bộ đệm VBV tại thời điểm giải mã, tn.

C.7.Điều khoản phụ này chỉ áp dụng khi cờ low_delay bằng một.

Khi low_delay bằng một, có thể có các tình huống mà bộ đệm VBV sẽ được kiểm tra lại nhiều lần trước khi loại bỏ một ảnh mã hoá từ bộ đệm VBV. Có thể biết nếu bộ đệm VBV phải được xem xét lại và bao nhiêu lần bằng cách xem xét thời gian của ảnh tiếp theo (ảnh sau ảnh hiện đang được giải mã), xem 6.3.10. Nếu bộ đệm VBV phải được kiểm tra lại, ảnh hiện đang được giải mã được gọi là một ảnh lớn.

Nếu ảnh hiện đang được giải mã là một ảnh lớn, bộ đệm VBV được kiểm tra lại trong khoảng thời gian 2 giai đoạn trước khi loại bỏ ảnh lớn, và không có dữ liệu ảnh nào bị xóa cho đến khi hoàn thành việc tái phân bổ.

Vào thời điểm này, số bit mà bộ đệm VBV ngay trước khi loại bỏ ảnh lớn sẽ nhỏ hơn B, tất cả các dữ liệu ảnh cho ảnh nằm trong bộ đệm dài nhất (ảnh lớn) sẽ có trong bộ đệm và được gỡ bỏ ngay lập tức. Sau đó, hoạt động bình thường của VBV tiếp tục, và áp dụng C.5.

176

TCVN xxxx : 2017

ảnh được mã hóa cuối cùng của một chuỗi không phải là một ảnh lớn.

C.8.Mục dưới đây chỉ mang tính tham khảo.Tình huống mà bộ đệm VBV sẽ tràn xuống (xem C.7) có thể xảy ra khi các ứng dụng trễ

truyền tải những ảnh lớn, đôi khi trong trường hợp cắt cảnh.

Việc giải mã các dòng bit sẽ làm cho quá trình hiển thị kết hợp với bộ giải mã để lặp lại một trường hoặc khung đã giải mã trước đây cho đến khi hoạt động bình thường của VBV có thể tiếp tục. Quá trình này đôi khi được gọi là sự xuất hiện của ảnh bị bỏ qua. Lưu ý rằng tình trạng này thường thỉnh thoảng xảy ra. Nó sẽ không xảy ra khi low_delay bằng 0.

C.9.Phân lớp này xác định khoảng thời gian giữa lần kiểm tra tiếp theo của bộ đệm VBV trong trường hợp progressive_sequence bằng 1 và low_delay bằng 0. Trong trường hợp này, trễ đặt lại khung luôn tồn tại và ảnh B có thể xảy ra.

Khoảng thời gian tn+1 - tngiữa hai lần kiểm tra kế tiếp của bộ đệm VBV là một bội số của T, trong đó T là nghịch đảo của tốc độ khung.

Nếu ảnh thứ n là ảnh B với trường lặp lại đầu tiên bằng 0 thì tn+1 - tnbằng T.

Nếu ảnh thứ n là ảnh B với repeat_first_field bằng 1 và top_field_first bằng 0 thì tn+1 - tnbằng 2*T.

Nếu hình n thứ hai là ảnh B với repeat_first_field bằng 1 và top_field_first bằng I. sau đó tn+1 - tnbằng 3*T.

Nếu ảnh thứ n là ảnh P hoặc ảnh I và nếu ảnh P hoặc ảnh I trước đó có repeat_first_fieldbằng 0 thì tn+1 - tnbằng với T.

Nếu ảnh thứ n là ảnh P hoặc ảnh I và nếu ảnh P hoặc ảnh I trước đó có trường lặp lại với 1 và trường đầu tiên bằng 0 thì tn+1 - tnbằng 2*T.

Nếu ảnh thứ n là ảnh P hoặc ảnh I và nếu ảnh P hoặc ảnh I trước đó có tần số repeat_first_field bằng 1 và top_field_first bằng 1. sau đó tn+1 - tnbằng 3*T.

C.10.Mục này định nghĩa khoảng thời gian giữa lần kiểm tra tiếp theo của bộ đệm VBV trong trường hợp progressive_sequence bằng 1 và độ trễ thấp bằng 1. Trong trường hợp này chuỗi không chứa ảnh B và không có khung đặt lại trễ.

Khoảng thời gian tn+1 - tngiữa hai lần kiểm tra kế tiếp của bộ đệm VBV là một bội số của T, trong đó T là nghịch đảo của tốc độ khung.

Nếu ảnh thứ n là ảnh P hoặc ảnh I với trường lặp lại đầu tiên bằng 0 thì tn+1 - tnbằng T.

Nếu ảnh thứ n là ảnh P hoặc ảnh I với repeat_first_field bằng 1 và top_field_first bằng 0, thì tn+1

- tnbằng 2*T.

Nếu ảnh thứ n là ảnh P hoặc ảnh I với repeat_first_field bằng 1 và top_field_first bằng 1, thì tn+1 - tn bằng 3*T.

C.11.Mục này xác định khoảng thời gian giữa kiểm tra suôn thành của bộ đệm VBV trong trường hợp progressive_sequence bằng 0 và low_delay bằng 0. Trong trường hợp này, sự trễ đặt lại khung luôn tồn tại và ảnh B có thể xảy ra.

Khoảng thời gian tn+1 - tngiữa hai lần kiểm tra tiếp theo của bộ đệm đầu vào VBV là một bội số của T, trong đó T là nghịch đảo của hai lần tỷ lệ khung.

177

TCVN xxxx : 2017

Nếu ảnh thứ n là cấu trúc khung được mã hóa với khung B với khoảng lặp lại = 0, tn+1 - tn bằng 2*T.

Nếu ảnh thứ n là cấu trúc khung được mã hóa với khung B với giá trị repcat_first_field bằng 1 thì tn+ 1 - tn bằng 3*T.

Nếu ảnh thứ n là một trườngảnh B (B-field picture), thì tn + 1 - tn bằng với T.

Nếu ảnh thứ n là khung nội dung có mã hoá P hoặc khung mã hoá l và nếu khung mã hoá P hoặc khung mã hoá trước đó có tần số lặp lại bằng 0 thì tn+1 - tn bằng 2*T .

Nếu ảnh thứ n là một cấu trúc khung có khung P hoặc khung l được mã hóa và nếu khung P mã đã mã hóa trước đó có lặp lại giá trị bằng 1 thì tn+1 - tn bằng 3*T.

Nếu ảnh thứ n là trường đầu tiên của một khung P mã hoá trường hoặc khung I mã hóa, thì tn+1

- tn bằng với T.

Nếu ảnh thứ n là trường thứ hai của khung P hoặc khung l được mã hóa và nếu khung P đã mã hóa trước đó đang sử dụng cấu trúc trường hoặc có tần số lặp lại với 0, sau đó tn+1 - tn bằng (2 *T - T).

Nếu ảnh thứ n là trường thứ hai của khung cấu trúc mã P hoặc khung I mã hóa và nếu mã P- framc trước đó hoặc mã 1 fratne sử dụng cấu trúc khung và có repeat_first_field bằng 1, sau đó tn+1 - tn bằng (3 *T - T).

Hình C.2 cho thấy VBV trong một trường hợp đơn giản chỉ với ảnh khung. Khung Po, B2 và B4

có thời lượng hiển thị là 3 trường.

Hình C.2 - Ví dụ VBV với ảnh BC12.Mục này định nghĩa khoảng thời gian giữa lần kiểm tra tiếp theo của bộ đệm VBV trong trường hợp progressive_sequence bằng 0 và độ trễ thấp bằng 1. Trong trường hợp này dãy không chứa ảnh B và không có sự sắp xếp lại của khung .

Khoảng thời gian tn+1 - tn giữa hai lần kiểm tra kế tiếp của bộ đệm đầu vào VBV là một bội số của T, trong đó T là nghịch đảo của hai lần tốc độ khung.

Nếu ảnh thứ n là khung cấu trúc khung được mã hóa hoặc khung I mã hoá với giá trị repeat_first_field bằng 0, thì tn+1 - tnbằng 2 * T.

178

TCVN xxxx : 2017

Nếu ảnh thứ n là khung cấu trúc khung được mã hóa hoặc khung I mã hoá với repeat_first_field bằng 1, sau đó tn+1 - tn bằng 3 * T.

Nếu ảnh thứ n là cấu trúc trường được khung P mã hoá hoặc khung I mã hoá, thì tn+1 - tn bằng với T.

Hình C.3 cho thấy VBV trong một trường hợp đơn giản chỉ với khung ảnh. Khung Io, P 2 và P4repeat_first_field bằng 1.

Hình C.3 - Ví dụ VBV với ảnh B

179

TCVN xxxx : 2017

Phụ lục D- Báo hiệu sắp xếp đóng gói khung hình cho nội dung lập thể 3D

(Quy định)

Phụ lục nêu cụ thể một phương pháp để mang thông tin sắp xếp khung đóng gói được sử dụng cho các ứng dụng như chỉ thị video lập thể trong các dòng bit mã hoá theo Tiêu chuẩn kỹ thuật này.

Thông tin sắp xếp gói khung được chèn vào dữ liệu người dùng lớp ảnh của các dòng bit video được mã hoá theo Tiêu chuẩn kỹ thuật này. Các tín hiệu cụ thể trong phụ lục này hỗ trợ chuyển đổi giữa 2D và video lập thể 3D ở ranh giới khung, cũng như giữa các khung gói khác nhau cho video lập thể 3D tại khung ranh giới.

Để tương thích với các bộ giải mã video hiện tại, phương pháp sử dụng một chỉ thị được cung cấp trong extensions_and_user_data(2), nó theo sau các picture_header() và picture_coding_extension().

Cú pháp và ngữ nghĩa sau được xác định để chỉ ra việc sắp xếp gói khung trong các byte user_data của cấu trúc cú pháp user_data() của extensions_and_user_data(2). Cấu trúc cú pháp được gửi trong các byte dữ liệu người dùng này cho mục đích này là cụ thể như sau:

frame_packing_arrangement_data() { Số bit Nhận dạngframe_packing_user_data_identifier 32 bslbfremaining_data_length 8 uimsbfreserved_bit 1 uimsbfarrangement_type 7 bslbfreserved_data 16 bslbffor (i = 3; i < remaining_data_length, i++ )

Additional_reserved_data_byte 8 bslbf}

frame_packing_user_data_ identifier - Chuỗi bit '4a503344' theo hệ thập lục phân. Khi byte dữ liệu người dùng của cấu trúc cú pháp user_data() bắt đầu với chuỗi bit này, các byte còn lại của cấu trúc cú pháp user_data() phải phù hợp với cấu trúc cú pháp frame_packing_arrangement_data().

Chú ý 1 – Bộ nhận dạng frame_packing_user_datanày là giá trị mã 4 byte đã được chọn để tránh xung đột với các ứng dụng khác của cơ chế user_data()

remaining_data_length được đặt là 3. Các giá trị khác được dành riêng cho các phần mở rộng trong tương lai có thể được định nghĩa bởi ITU-T ISO/IEC. Bộ giải mã sẽ sử dụng giá trị của phần tử cú pháp này để xác định số lượng các phần tử cú pháp addition_reserved_data_byte như cụ thể trong sơ đồ cú pháp frame_packing_arrangement_data().

reserved_bit - Được đặt thành Giá trị '1'. Giá trị '0' được dành riêng cho các phần mở rộng trong tương lai có thể được định nghĩa bởi ITU-T ISO/IEC. Bộ giải mã sẽ bỏ qua (tức là gỡ khỏi dòng bit và loại bỏ) giá trị của bit này.

arrangement_type -Xem bảng D.1.

180

TCVN xxxx : 2017

arrangement_type Ý nghĩa0000011 stereo side-by-side (với lưới lấy mẫu hình chữ nhật)0000100 stereo top-and-bottom (với lưới lấy mẫu hình chữ nhật)0001000 2D video (với lưới lấy mẫu hình chữ nhật)0100011 stereo side-by-side với việc lấy mẫu quincunxCác giá trị khác Dự phòng và có thể được sử dụng trong tương lai bởi ITU-T ǀ ISO/IEC

Reserved_data - Đây là một số nguyên 16 bit sẽ được đặt thành chuỗi bit '04FF' trong hệ thập lục phân. Tất cả các giá trị khác được dành riêng cho các phần mở rộng trong tương lai có thể được định nghĩa bởi ITU-T ISO/IEC. Bộ giải mã sẽ bỏ qua (tức là loại bỏ khỏi dòng bit và loại bỏ) giá trị của 16 bit này.

additional_reserved_data_byte - Việc sử dụng phần tử cú pháp này được dành riêng cho các phần mở rộng trong tương lai có thể được định nghĩa bởi ITU-T ISO/IEC.

Đề nghị rằng trong toàn bộ thời lượng của một dòng bit chứa nội dung video 3D stereo, dòng bit video phải chứa dữ liệu người dùng với frame_packing_arrangement_data() cho mỗi bức ảnh.

Trong trường hợp chỉ thị "stereo side-by-side", ảnh được chia thành hai nửa, mỗi phần có độ phân giải một nửa theo chiều ngang (tương ứng với phần hiển thị của hình mã hoá). bên phải của phần có thể hiển thị của ảnh được mã hoá và chế độ xem phải nằm ở phía bên phải của phần được hiển thị của ảnh được mã hóa Vị trí biên giữa hai nửa là giữa phần hiển thị của mỗi đường quét bên trong màn hình có thể hiển thị một phần của ảnh được mã hóa Các vị trí lấy mẫu được chỉ ra, liên quan đến lưới lấy mẫu của một ảnh có độ phân giải cao được giả thiết, giống nhau đối với các mẫu ở cả hai nửa. thể hiện trong hình D.1.

Hình D.1 - Sự sắp xếp lại và giả thiết chuyển đổi của "stereo side-by-side với mẫu quincunx" sắp xếp các khung cảnh chuyển đổi sang độ phân giải đầy đủ của phần có thể

hiển thị của ảnh được mã hóa

181

TCVN xxxx : 2017

Chú ý 2 - Các điểm ảnh được đánh dấu là "-" trong hình D.3. minh hoạ các điểm ảnh trong ảnh được mã hoá nằm ngoài phần có thể hiển thị Những pixel này bị loại bỏ sau giải mã ảnh.

Trong trường hợp chỉ thị "stereo top-and-bottom", ảnh được chia thành hai nửa, mỗi nửa có độ phân giải 1/2 theo chiều dọc (liên quan đến phần có thể hiển thị của ảnh được mã hoá). Chế độ xem bên trái ở phần trên của phần có thể hiển thị của ảnh được mã hoá và chế độ xem phải nằm ở phần dưới của phần có thể hiển thị được của hình được mã hóa. Vị trí biên giữa hai nửa là giữa phần hiển thị của mỗi cột trong phần có thể hiển thị của ảnh được mã hóa. Các vị trí lấy mẫu được chỉ ra, liên quan đến lưới lấy mẫu của một ảnh giả thuyết được sửa đổi lại, giống nhau đối với các mẫu ở cả hai nửa. 'Vị trí lấy mẫu ITIC cho sự sắp xếp "stereo-top-and-bottom" được thể hiện trong hình D.2.

Hình D.2 - Sự sắp xếp lại và giả thiết chuyển đổi của "stereo top-and-bottom" để chuyển đổi sang độ phân giải đầy đủ của phần có thể hiển thị của ảnh được mã hóaChú ý 3 - Các điểm ảnh được đánh dấu là "-" trong hình D.2. minh hoạ các điểm ảnh trong ảnh

được mã hoá nằm ngoài phần có thể hiển thị Những pixel này bị loại bỏ sau khi giải mã hình ảnh.

Trong trường hợp chỉ thị sắp xếp "video 2D", ảnh chỉ chứa các điểm ảnh cho một chế độ xem 2D nội dung cảnh và chế độ xem này bao gồm toàn bộ phần có thể di chuyển được của ảnh được mã hóa.

Khi nội dung 2D và 3D có thể có mặt trong cùng một dòng cơ sở, nên sử dụng arrangement_type để chỉ định loại sắp xếp cho mỗi ảnh. Khi sắp xếp gói khung được thay đổi trong một dòng bit video, chỉ thị arrangement_type sẽ thay đổi trong cùng một ảnh trong đó nội dung thay đổi xảy ra.

Trong trường hợp chỉ thị sự sắp xếp bố trí "stereo side-by-side-with-quincunx-sampling", ảnh được chia thành hai nửa, mỗi phần có độ phân giải một nửa biểu diễn mẫu lấy mẫu quincunx (liên quan đến phần có thể bị di chuyển của mã hóa ảnh) Phía bên trái của phần có thể hiển thị của ảnh được mã hoá và khung nhìn bên phải là phần bên phải của phần được hiển thị của hình được mã hóa Vị trí biên giữa hai nửa là ở giữa của một phần của mỗi dòng quét trong phần có thể hiển thị của ảnh được mã hóa Các vị trí lấy mẫu được chỉ ra, liên quan đến

182

TCVN xxxx : 2017

lưới lấy mẫu của một ảnh có độ phân giải đầy đủ được chuyển đổi lên, khác với mẫu ở mỗi nửa. Các vị trí lấy mẫu cho sắp xếp "stereo side-by-side-with-quincunx-sampling" được thể hiện trong hình D.3.

Hình D.3 - Sắp xếp lại và giả thiết cao về "stereo side-by-side-with-quincunx__sampling" để chuyển đổi sang độ phân giải đầy đủ của phần có thể hiển thị của ảnh được mã hóa

Chú ý 4 - Các điểm ảnh được đánh dấu là "-" trong hình D.3. minh hoạ các điểm ảnh trong ảnh được mã hoá nằm ngoài phần có thể hiển thị Những pixel này bị loại bỏ sau khi giải mã hình ảnh.

183

TCVN xxxx : 2017

Phụ lục E- Giới hạn về đặc tính và

mức(Tham khảo)

E.1. Giới hạn các thành phần cú pháp trong profilesPhụ lục này liệt kê tất cả các thành phần cú pháp được định nghĩa trong Tiêu chuẩn kỹ

thuật này, mỗi loại được phân loại để cho biết nó cần phải được hỗ trợ bởi bộ giải mã phù hợp với một profile và mức cụ thể. Lưu ý rằng các tiêu chuẩn quy chuẩn để tuân thủ được đưa ra trong ISO/IEC 13818-4.

Chú ý - Phụ lục này chỉ có tính tham khảo và chỉ nhằm mục đích tóm tắt các hạn chế quy định nêu tại mục 8. Nếu, do có lỗi trong việc chuẩn bị văn bản này, có sự khác biệt giữa mục 8 và Phụ lục E, văn bản không phải là gốc và mục 8 sẽ luôn được ưu tiên

Trong các bảng E.2 đến E.20, một số chữ viết tắt được sử dụng như trong Bảng E.1

Bảng E.1 - Các tư viết tắt được sử dụng trong các bảng của Phụ lục EChữ viết tắt Sử dụng trong Ý nghĩa

X Trạng thái Phải được hỗ trợ bởi giải mã.

o Trạng thái Không cần bộ giải mã hỗ trợ

D Kiểu Mục với các thông số Level-dependent.

1 Kiểu Mục độc lập của Level trong Profile.

P Kiểu Mục cho quá trình xử lý sau khi giải mã, bộ giải mã phải có khả năng giải mã các dòng bit có chứa các mục này, vì việc sử dụng chúng vượt quá phạm vi của Tiêu chuẩn kỹ thuật này.

Chú ý - "Trạng thái" được để trống nếu mục nhập không phải là thành phần cú pháp.

Bảng E.2 - Tiêu đề chuỗi

Trạng thái Kiểu

Multi-view

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIMPLE

# Các thành phần cú pháp Các đề xuất

01 horizontal_size_value X X X X X X X D Bảng 8-11

02 vertical_size_value X X X X X X X D Bảng 8-11

03 aspect_ratio_inforination X X X X X X X P

184

TCVN xxxx : 2017

04 frame_rate_code X X X X X X X D Bảng 8-1105 (sample rate)

NOTE - This is not a syntactic element

DBảng 8-12. Sample rate is a product of samples/line, lines/frame and frames/sec.

06 bit_rate_value X X X X X X X D Bảng 8-13

06 bit_rate_value X X X X X X X D Bảng 8-13

07 vbv_buffer_size_value X X X X X X X D Bảng 8-14

08 constrained_parameters_flag X X X X X X X I Đặt là"1" nếu bị ràng buộc bởi ISO/IEC 11172-2.

09 load_intra_quantiser_matrix X X X X X X X 1

10 intra_quantiser_matrix[64] X X X X X X X I

11 load_non_intra_quantiser_matrix X X X X X X X I

12 non intra quantiser matrix|64| X X X X X X X 1

13 sequence_extension() X X X X X X X 1 Luôn luôn có mặt nếu tuân thủ Tiêu chuẩn kỹ thuật này

14 sequence_display_extension() X X X X X X X p

15 sequence_scalable_extension() o o X X X o X I Bảng 8-9 cho số lượng tối đa của lớp có thể mở rộng

16 user_data() X X X X X X X I Bộ giải mã có thể bỏ qua dữ liệu này

Bảng E.3 - Mở rộng chuỗi

#

Trạng thái KiểuMulti-view

Các đề xuất

42:2HIGH

SPATIAL

SNR

MAIN

SIMCác thành phần cú pháp

PLE

01 Profile_and_level_indication X X X X X X X D Profile: một trong 8 giá trị Mức, một trong 16 giá trị Escape_bit. một trong hai giá trị

02 progressive_sequence X X X X X X X 1

03 chroniaformal X X X X X X X 1 Bảng 8-5

04 horizontal_size_extension X X X X X X X D kích thước ảnh đầu vào có liên quan

05 vertical_size_extension X X X X X X X D kích thước ảnh đầu vào có liên quan

06 bit_rate_extenslon X X X X X X X D kích thước ảnh đầu vào có liên quan

07 vbv_buffer_size_extension X X X X X X X D kích thước ảnh đầu vào có liên quan

08 low_delay X X X X X X X I

09 frame_rate_extension_n X X X X X X X I Đặt là "0" cho tất cả các profile được xác định

185

TCVN xxxx : 2017

10 frame_rate_extension_d X X X X X X X I Đặt là "0" cho tất cả các profile được xác định

Bảng E.4 - Các phần tử mở rộng hiển thị chuỗi

#

Trạng thái KiểuMulti-view

Các đề xuất

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIM

Các thành phần cú pháp

PLE

01 vldeo_forrnat X X X X X X X P02 colour_description X X X X X X X P Định dạng đầu vào có liên quan03 colour_primaries X X X X X X X P04 transfer_characteristics X X X X X X X P05 matrix_coefficients X X X X X X X P06 display_horizontal_size X X X X X X X P Định dạng đầu vào có liên quan07 display_vertical_size X X X X X X X P Định dạng đầu vào có liên quan

186

TCVN xxxx : 2017

Bảng E.5 – Mở rộng chuỗi có thể mở rộng

187

TCVN xxxx : 2017

Bảng E.6 - Tiêu đề của nhóm ảnh

#

Trạng thái KiểuMulti-view

Các đề xuất

4:2:2HIGH

SPATIALSNR

MAINSIM

Các thành phần cú pháp

PLE

01 time_code X X X X X X X I Bộ giải mã có thể bỏ qua dữ liệu này02 closed_gop X X X X X X X I03 broken _link X X X X X X X I

Bảng E.7 - Tiêu đề hình ảnh

#

Trạng thái KiểuMulti-view

Các đề xuất

4

HIGHSPATIALSNR

MAINSIM

Các thành phần cú pháp

PLE

01 temporal_reference X X X X X X X I

02 picture_coding_type X X X X X X X ISimple Profile: i. P ở Main level. I, P, B ở Low level Main. SNR. Spatial. High và Multi-view Profile: I, P, B

03 vbv_delay X X X X X X X I

04 full_pel_forwrard_vector X X X X X X X I Đặt là "0"choTiêu chuẩn kỹ thuật này

05 forward_f_code X X X X X X X I Đặt là "111" choTiêu chuẩn kỹ thuật này

06 full_pel_backward_vector X X X X X X X I Đặt là "0" cho Tiêu chuẩn kỹ thuật này

07 backward_f_code X X X X X X X I Đặt là "111” cho Tiêu chuẩn kỹ thuật này

08 content_description_data() X X X X X X X I09 Picture_coding_extension() X X X X X X X I10 quant_matrix_extension() X X X X X X X I11 picture_display_extension() X X X X X X X P

12 picture_spatial_scalable_ _extension()

0 0 0 X X 0 0 I

13 picture_temporal_scalable cxtcnsionO

0 0 0 0 0 0 X I14 camera_parameters_extension

()0 0 0 0 0 0 X P

188

TCVN xxxx : 2017

Bảng E.8 – Mở rộng mã hóa ảnh

189

TCVN xxxx : 2017

Bảng E.9 – Mở rộng ma trận lượng tửTrạng thái Kiểu

Multi-view

Các đề xuất

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIM

Các thành phần cú pháp

PLE

01 load-infra_quantiser_matrix X X X X X X X I02 intra_quantiser_matrix[64

]X X X X X X X I

ot load_non_lntra_quantiser__matrix

X X X X X X X I

04 non_intra_quantiser_ matrix|64|

X X X X X X X I

05 load_chroma_intra_quantiser_ matrix

0 0 0 0 X X 0 I

06 chroma_intra_quantiser_ matrix[64]

0 0 0 0 X X 0 I

07 load_chroma_non_intra_ quantisermatrix

0 0 0 0 X X 0 I

08 Chroma_non_intra quantiser_matrix[64]

0 0 0 0 X X 0 I

Bảng E.10 – Mở rộng hiển thị ảnh

#

Trạng thái KiểuMulti-view

Các đề xuất

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIM

Các thành phần cú pháp

PLE

01 frame_centre_horizontal_offset X X X X X X X P Định dạng đầu vào có liên quan02 frame_centre_vertical_offset X X X X X X X P Định dạng đầu vào có liên quan

190

TCVN xxxx : 2017

Bảng E.11 - Mở rộng ảnh có thể mở rộng theo thời gian

#

Trạng thái KiểuMulti-view

Các đề xuất

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIM

Các thành phần cú pháp

PLE

01 reference_select_code 0 0 0 0 0 0 x I02 forward_temporal_reference 0 0 0 0 0 0 x I03 backward_leniporal_reference 0 0 0 0 0 0 x I

Bảng E.12 - Mở rộng ảnh có thể mở rộng theo không gian

Trạng thái KiểuMulti-view

42;2

HIGH

SPATIAL

SNR

MAIN

SIMPLE

# Các thành phần cú pháp Các đề xuất01 lower_layer_temporal_reference 0 0 0 x x 0 0 I02 lower_layer_horiiontal_offset 0 0 0 x x 0 0 D Định dạng đầu vào có liên quan03 lower_layer_vertical_offset 0 0 0 x x 0 0 D Định dạng đầu vào có liên quan04 spatial_temporal_weight_code_

table_index0 0 0 x x 0 0 I

05 lower_layer_progrevsive_frame 0 0 0 x x 0 0 I06 lower_layer_deinterlaced_field_

select0 0 0 x x 0 0 I

191

TCVN xxxx : 2017

Bảng E.13 - Mở rộng thông số máy ảnh (camera)

192

TCVN xxxx : 2017

Bảng E.14 - Lớp lát cắt

Trạng thái KiểuMulti-view

4:2:2

HIGH

SPATIAL

SNRMAIN

SIMPLE

# Các thành phần cú pháp Các đề xuất01 slice_vertical_position

extensionx x x x x x x D Định dạng đầu vào có liên quan

02 Priority_breakpoint 0 0 0 0 0 0 0 I Chỉ cần thiết cho phân vùng dữ liệu03 quantiser_scale_code x x x x x x x I04 slice_extension_flag x x x x x x x I05 intra_slice x x x x x x x I Bộ giải mã có thể bỏ qua dữ liệu này06 slice_picture_id_enable x x x x x x x I Bộ giải mã có thể bỏ qua dữ liệu này07 slice_picture_id x x x x x x x I Bộ giải mã có thể bỏ qua dữ liệu này08 extra_bit_slice x x x x x x x I Bộ giải mã có thể bỏ qua dữ liệu này09 macroblock() x x x x x x x I

193

TCVN xxxx : 2017

Bảng E.15 - Lớp khối Macroblock

Trạng thái KiểuMulti-view

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIMPLE

# Các thành phần cú pháp Các đề xuất01 Macroblock_escape x x x x x x x I02 macroblock_address_increme

ntx x x x x x x I

03 macroblock_modes() x x x x x x x I04 Quantiser_scale_code x x x x x x x I05 motion_vectors(0) x x x x x x x I Véctơ chuyển động tiến06 motion_vectors(1) o x x x x x x I Véctơ chuyển động ngược07 coded_block_pattern() x x x x x x x I08 block(i) x x x x x x x I

Bảng E.16 – Các chế độ Macroblock

#

Trạng thái KiểuMulti-view

Các đề xuất

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIM

Các thành phần cú pháp

PLE

01 macroblock_type x x x x x x x I02 Spatial_ternporal_weight

code0 0 0 0 0 0 0 I

05 frame motion_type x x x x x x x

I

01: Field-based prediction

10. Frame-based prediction

11 : Dual-prime

04 field_motion_type x x x x x x x

I

01: Field-based prediction

10: 16 X 8MC

11: Dual-prime

05 dct_type x x x x x x x I

194

TCVN xxxx : 2017

Bảng E.17 – Các vector chuyển động

Bảng E.18 - Vectơ chuyển động

Trạng thái KiểuMulti-view

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIMPLE

# Các thành phần cú pháp Các đề xuất01 motion_horizontal_code x x x x x x x I0 2 motion_horizontal_r x x x x x x x I05 dmv_horizontal x x x x x x x I04 motion_vertical_code x x x x x x x I05 motion_vertical_r x x x x x x x I06 dmv_vertical x x x x x x x I

195

TCVN xxxx : 2017

Bảng E.19 - Mẫu khối được mã hoá

#

Trạng thái Kiểu

Multi-view

Các đề xuất

4:2:2

HIGH

SPATIAL

SNR

MAIN

SIM

Các thành phần cú pháp

PLE

01 coded_block_pattern 420 x x x x x x x I02 coded_block_pattern_ 1 0 0 0 0 x x 0 I 4:2:205 coded_block_pattern 2 0 0 0 0 0 0 0 I 4:4:4

Bảng E.20 – Lớp khối

E.2.Kết hợp các lớp cho phépCác bảng E.21 đến E.52 minh hoạ các giới hạn tham số có thể được áp dụng trong mỗi lớp

của một dòng bit, và profile_and_level_indication thích hợp tương ứng cần được sử dụng. Mỗi bảng mô tả các giới hạn của một điểm tuân thủ duy nhất trong ma trận profile/mức.

Các ký hiệu sau đây đã được thông qua:

<profile abbreviation>@<level abbreviation> (<tên viết tắt profile > @ <viết tắt mức>)

Các chữ viết tắt được định nghĩa trong Bảng E.21.

196

TCVN xxxx : 2017

Bảng E.21 - Các chữ viết tắt cho tên profile và mức

Profile Tên viết tắt profile Mức Tênviết tắt mức

Simple SP Low LLMain MP Main MLSNR Scalable SNR High-1440 H-14Spatially Sealable Spt High HLHigh HP HighP HPLMulti-view MVPCác thông số ràng buộc ISO/IEC 11172-2 ISO/IEC 11172-2

Bảng E.22 - Simple profile@Main level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và mức

1 0 Base 720/576/30 10 368 000 15 1 835 008 SP@ML

Bảng E.23 - Main profile@Low level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

1 0 Base 352/288/30 3 041 280 4 475 136 MP@iLL

Bảng E.24 - Main profile@Main level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

1 0 Base 720/57600 10 368 000 15 1 835 008 MP@ML

Bảng E.25 - Main profile@High-1440 level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

1 0 Base 1440/1088/60 47 001 600 60 7 340 MP@ML

Bảng E.26 - Main profile@High level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

1 0 Base 1920/1088/60 62 668 800 80 9 781 248 MP@ML

Bảng E.27 - Main profile@HighP level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

1 0 Base 1920/1088/60 125 337 600 80 9 781 248 MP@ML

Bảng E.28 - SNR profile@Low level

197

TCVN xxxx : 2017

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

2 0 Base 352/288/30 2 534 400 1.856 327 680 ISO 111721 SNR 352/288/30 2 534 400 4 475 136 SNR@LL

2 0 Base 352/288/30 3 041 280 3 360 44S SP@ML1 SNR 352/288/30 3 041 280 4 475 136 SNR@LL

2 0 Base 352/288/30 3 041 280 3 360 44S MP@tLL1 SNR 352/288/30 3 041 280 4 475 136 SNR@LL

Bảng E.29 - SNR profile@Main level

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

2 0 Base 720/376/30 2 534 400 1.856 327 680 ISO 11172

1 SNR 720/57W30 2 534 400 15 1 835 008 SNR@ML

2 0 Base 720/576'30 10 368 000 10 1 212 416 SP@ML

1 SNR 720/576/30 10 368 000 15 1 835 008 SNR@ML

2 0 Base 352/288/30 3 041 280 4 475 136 MP@ML

1 SNR 352/288/30 3 041 280 15 1 835 008 SNR@ML

2 0 Base 720/576/30 10 368 000 10 1 212416 MP@ML

1 SNR 720/576/30 10 368 000 15 1 835 008 SNR@ML

Bảng E.30 - Spatial profile@High-1440 level (base Iayer + SNR)

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

2 0 Base 352/288/30 2 534 400 1.856 327 680 ISO II172

1 SNR 352/288/30 2 534 400 60 7340032 Spt@H-14

2 0 Base 720/576/30 10 368 000 15 1 835 008 SP@ML

1 SNR 720/5 76/30 10 368 <881 60 7 340032 Spt@H-14

2 0 Base 352/288/30 3 041 280 4 475 136 MP@ML

1 SNR 352/288/30 3 041 280 60 7 340032 Spi@H-14

2 0 Base 720/576/30 10 368 000 15 1 835 <8)8 MP@ML

1 SNR 720/576/30 10 368 (88) 60 7 340032 Spt@H-14

2 0 Base 1440/1088/60 47 001 600 40 4 882 432 MP@ML

1 SNR 1440/1088/60 47 001 /88) 60 7 340032 Spt@H-14

Bảng E.31 - Spatial profile @ High-1440 level (Base Layer + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

198

TCVN xxxx : 2017

2 0 Base 768/576/30 2 534 400 1.856 327 680 ISO 111721 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

2 0 Base 768/576/30 10 368 000 15 I 835 008 SP@ML1 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

2 0 Base 768/576/30 3 041 280 4 475 136 MP@LL1 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

2 0 Base 768/576/30 10 368 000 15 1 835 008 MP@ML1 Spatial 1440/1088/30 47 001 /88) 60 7 340 032 Spt@H-14

2 0 Base 768/576/30 47 001 600 40 4 882 432 MP@H-141 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

Bảng E.32 - Spatial profile @ High-1440 level (Base Layer +SNR + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

3 0 Base 352/288/30 2 534 400 1.856 327 680 ISO 111721 SNR 352/288/30 2 534 400 4 475 136 SNR@LL2 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 352/288/30 3 041 280 3 327 680 SP@ML1 SNR 352/288/30 3 041 280 4 475 136 SNR@LL2 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 352/288/30 3 041 280 3 327 680 SP@ML1 SNR 352/288/30 3 041 280 4 475 136 SNR@LL2 Spatial 14401088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 720/576/30 2 534 400 1.856 327 680 ISO 111721 SNR 720/576/30 2 534 400 15 1 8.15 008 SNR@LL2 Spatial 1440/1088/30 47 001 /4)0 60 7 340 032 Spt@H-14

3 0 Base 720/576/30 10 368 000 10 1 212 416 SP@ML1 SNR 720/576/30 10 368 000 15 1 835 008 SNR@LL2 Spatial 14401088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 352/288/30 3 041 280 4 475 136 MP@LL1 SNR 352/288/30 3 041 280 15 1 835 008 SNR@LL2 Spatial 1440/1088/30 47 001 /48) 60 7 340 032 Spt@H-14

3 0 Base 720/576/30 10 368 000 10 1 212 416 MP@LL1 SNR 720/576/30 10 368 000 15 1 835 008 SNR@LL2 Spatial 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 1440/1088/60 10 368 000 15 1 835 008 MP@H-141 SNR 1440/1088/60 10 368 000 40 4 882 432 Spt@H-142 Spatial 1440'1088/60 47 001 600 60 7 340 032 Spt@H-14

199

TCVN xxxx : 2017

Bảng E.33 - Spatial profile@High-1440 level (Base leaver + Spatial + SNR)

Số lớpLayer

_id

chế độ có thể mở rộng

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và mức

3 0 Base 768/576/30 2 534 400 1.856 327 680 ISO 111721 Spatial 1440/1088/30 47 001 600 40 4 882 432 Spt@H-142 SNR 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 768/576/30 10 368 000 15 1 835 008 SP@ML1 Spatial 1440/1088/30 47 001 40 4 882 432 Spt@H-142 SNR 1440/1088/30 47 001 MW 60 7 340 032 Spt@H-14

3 0 Base 352/288/30 3 041 280 4 475 136 MP@XL1 Spatial 1440/1088/30 47 001 600 40 4 882 432 Spt@H-142 SNR 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 720/576/30 10 368 000 15 1 835 008 MP@H-141 Spatial 14401088/30 47 001 600 40 4 882 432 Spt@H-142 SNR 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

3 0 Base 720/576/30 10 368 000 15 1 835 008 MP@H-141 Spatial 1440/1088/60 47 001 600 40 4 882 432 Spt@H-142 SNR 1440/1088/30 47 001 600 60 7 340 032 Spt@H-14

Bảng E.34 -High profile @ Main level (Base Layer)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức1 0 Base 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

1 0 Base 4:2:2 720/576/30 11 059 200 20 2441 216 HP@ML

Bảng E.35 - High profile@Main level (Base Layer + SNR)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức2 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 SP@ML

1 SNR 4:2:0 720/576/30 10 368 000 20 2 441 216 HP@ML2 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 SP@ML

1 SNR 4:2:2 720/576/30 10 368 000 20 2 441 216 HP@ML2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@ML

1 SNR 4:2:0 352/288/30 3 041 280 20 2 441 216 HP@ML2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@ML

1 SNR 4:2:2 352/288/30 3 041 280 20 2441 216 HP@ML2 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 MP@ML

1 SNR 4:2:0 720/576/30 10 368 000 20 2 441 216 HP@ML2 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 MP@ML

1 SNR 4:2:2 720/576/30 10 368 000 20 2 441 216 HP@ML2 0 Base 4:2:0 720/576/30 14 745 600 15 1 835 008 HP@ML

1 SNR 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML2 0 Base 4:2:2 720/576/30 11 059 200 15 1 835 008 H@ML

1 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

200

TCVN xxxx : 2017

Bảng E.36 - High profile@Main level (Base Laver + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu tối

đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức2 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 11172

1 Spatial 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

2 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 SP@ML1 Spatial 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 SP@ML1 Spatial 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@ML1 Spatial 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@ML1 Spatial 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

Bảng E.37 - High profile@Main level (Base Layer + SNR + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và mức

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 SP@ML1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 SP@ML1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 SP@ML1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 SP@ML1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

Bảng E.38 - High profile@Main level (Base Layer + Spatial + SNR)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu tối

đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:0 720/576/30 14 745 600 15 1 835 008 HP@ML2 SNR 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:0 720/576/30 11 059 200 15 1 835 008 HP@ML

201

TCVN xxxx : 2017

2 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 11172

1 Spatial 4:2:2 720/576/30 11 059 200 15 1 835 008 HP@ML2 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3041 280 4 475 136 SP@ML1 Spatial 4:2:0 720/576/30 14 745 600 15 1 835 008 HP@ML2 SNR 4:2:0 720/576/30 14 745 600 20 2441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3041 280 4 475 136 SP@ML1 Spatial 4:2:0 720/576/30 11 059 200 15 1 835 008 HP@ML2 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 SP@ML1 Spatial 4:2:2 720/576/30 11 059 200 15 1 835 008 HP@ML2 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@LL1 Spatial 4:2:0 720/576/30 14 745 600 15 1 835 008 HP@ML2 SNR 4:2:0 720/576/30 14 745 600 20 2 441 216 HP@ML

3 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@LL1 Spatial 4:2:0 720/576/30 11 059 200 15 1 835 008 HP@ML2 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

3 0 Rase 4:2:0 352/288/30 3 041 280 4 475 136 MP@LL1 Spatial 4:2:2 720/576/30 11 059 200 15 1 835 008 HP@ML2 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

Bảng E.39- High profile@High-14-10 level (Base Layer)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

1 0 Base 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-141 0 Base 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

Bảng E.40- High profile@High-1440 level (Base Layer + SNR)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu tối

đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức2 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 SP@ML

1 SNR 4:2:0 720/576/30 10 368 000 80 9 781 248 HP@H-142 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 SP@ML

1 SNR 4:2:2 720/576/30 10 368 000 80 9 781 248 HP@H-142 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@ LL

1 SNR 4:2:0 352/288/30 3 041 280 80 9 781 248 HP@H-142 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@ LL

1 SNR 4:2:2 352/288/30 3 041 280 80 9 781 248 HP@H-142 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 MP@ML

1 SNR 4:2:0 720/576/30 10 368 000 80 9 781 248 HP@H-142 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 MP@ML

1 SNR 4:2:2 720/576/30 10 368 000 80 9 781 248 HP@H-14

202

TCVN xxxx : 2017

2 0 Base 4:2:0 1440/1088/60 47 001 600 60 7 340032 HP@H-141 SNR 4:2:0 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 1440/1088/60 47 001 600 60 7340032 HP@H-141 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 720/576/30 14 743 600 20 1 835 008 MP@ML1 SNR 4:2:0 720/576/30 14 745 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 720/576/30 14 745 600 20 1 835 008 MP@ML1 SNR 4:2:2 720/576/30 14 745600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 720/576/30 11 059 200 20 1 835 008 MP@ML1 SNR 4:2:0 720/576/30 11 059 200 80 9 781 248 HP@H-14

2 0 Base 4:2:0 1440/1088/60 62 668 800 60 7 340 032 HP@H-141 SNR 4:2:2 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 1440/1088/60 47 001 600 60 7 340 072 HP@H-141 SNR 4:2:0 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 1440/1088/60 47 001 600 60 7 340 032 HP@H-141 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

Bảng E.41 - High profile@High-1440 level (Base Layer + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu tối

đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

2 0 Base 4:2:0 352/288/30 2 534 400 1 856 327 680 ISO 111721 Spatial 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 2 534 400 1 856 327 680 ISO 111721 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 10 768 000 15 1 835 008 SP@ML1 Spatial 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 10 V.8 000 15 1 875 008 SP@ML1 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@LL1 Spatial 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 3 041 280 4 475 136 MP@LL1 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 10 768 000 15 1 875 008 MP@ML1 Spatial 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 10 768 000 1$ 1 835 008 MP@ML1 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 14 745 600 20 2 441 216 MP@H-141 Spatial 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 14 745 600 20 2 441 216 MP@H-141 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 14 745 600 20 2441 216 HP@ML1 Spatial 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

2 0 Base 4:2:0 352/288/30 14 745 600 20 2 441 216 HP@ML1 Spatial 4:22 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

203

TCVN xxxx : 2017

2 0 Base 4:2:2 352/288/30 11 059 200 20 2 441 216 HP@ML1 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

Bảng E.42 - High profile @ High-1440 level (Base Layer + SNR + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu tối đa

(H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit

tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 SP@ML

1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:0 1440 1088 60 62 668 800 80 9 781 248 HP@H-I4

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 SP(SML

1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:2 1440 1088/60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 10 368 000 10 1 212416 SP(rt;ML

1 SNR 4:2:0 720/576/30 10 368 000 15 1 835 008 SNR@ML

2 Spatial 4:2:0 1440 1088/60 62 668 800 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 10 368 000 10 1 212416 SP(«;ML

1 SNR 4:2:0 720/576/30 10 368 000 15 1 835 008 SNR@ML

2 Spatial 4:2:2 1440 1088 60 47 001 600 80 9 781 248 HP@H-I4

3 0 Base 4:2:0 352/288/30 3 041 280 3 360 448 MP@LL

1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:0 1440 1088/60 62 668 800 80 9 781 248 HP@H-14

3 0 Base 4:2:0 352.288.30 3 041 280 3 360 448 MP@LL

1 SNR 4:2:0 352/288/30 3 041 280 4 475 136 SNR@LL

2 Spatial 4:2:2 1440 1088 60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 10 368 000 10 1 212416 MP@ML

1 SNR 4:2:0 720/576/30 10 368 000 15 1 835 008 SNR@ML

2 Spatial 4:2:0 1440 1088 60 62 668 800 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 10 368 000 10 1 212416 MPtfiMI.

1 SNR 4:2:0 720/576/30 10 368 000 15 1 835 008 SNR@ML

2 Spatial 4:2:2 1440 1088 60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 MP@ML

1 SNR 4:2:2 720/576/30 10 368 000 20 2441 216 HP@ML

2 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 14 745 600 15 1 835 008 HPOML

1 SNR 4:2:0 720/576/30 14 745 600 20 2441 216 HP@ML

2 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 11 059 200 15 1 835 008 HP@ML

204

TCVN xxxx : 2017

1 SNR 4:2:2 720/576/30 11 059 200 20 2 441 216 HP@ML

2 Spatial 4:2:2 1440 1088 60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:2 720/576/30 11 059 200 15 1 835 008 HP@ML

1 SNR 4:2:2 720/576/30 11 059 200 20 2441 216 HP@ML

2 Spatial 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

Bảng E.43 - High profile @ High-1440 level (Base Layer + Spatial + SNR)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

Chroma

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:0 1440/1088/60 47 001 600 60 7 340 032 Spt@H-142 SNR 4:2:0 1440/1088/60 47 001 600 80 9 781 248 HP@H-I4

3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:0 1440/1088/60 47 001 600 60 7 340 032 Spl(tt)H-l42 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:0 1440/1088/60 62 668 800 60 7 340 032 HP@H-I42 SNR 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

3 0 Base 4:2:0 352/288/30 2 534 400 1.856 327 680 ISO 111721 Spatial 4:2:2 1440/1088/60 47 001 600 60 7 340 032 HP@H-I42 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-I4

3 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 SP@ML1 Spatial 4:2:0 1440/1088/60 47 001 600 60 7 340 032 Spt@H-142 SNR 4:2:0 1440/1088/60 47 001 600 80 9 781 248 HP@H-I4

3 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 SP@ML1 Spatial 4:2:0 1440/1088/60 47 001 600 60 7 340 032 Spt@H-142 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-I4

3 0 Base 4:23) 720/576/30 10 36X 000 15 1 835 008 MP@ML1 Spatial 4:23) 1440/1088/60 47 001 600 60 7 340 032 Spt@H-142 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 9 720/576/30 10 36X 000 15 1 835 008 MP@ML1 Spatial 4:23) 1440/1088/60 62 668 800 60 7 340 032 HP@H-142 SNR 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

3 0 Base 4:2:0 720/576/30 10 368 000 15 1 835 008 MP@ML1 Spatial 4:2:2 1440/1088/60 47 001 600 60 7 340 032 HP@H-142 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 [email protected]

3 0 Base 4:23) 720/576/30 14 745 600 15 2 441 216 HP@ML1 Spatial 4:2:0 1440/1088/60 62 668 800 60 7 340 032 HP@H-142 SNR 4:2:0 1440/1088/60 62 668 800 80 9 781 248 HP@H-14

3 0 Base 4:23) 720/576/30 14 745 600 15 2 441 216 HP@ML1 Spatial 4:23) 1440/1088/60 47 001 600 60 7 340 0.32 HP@H-14

205

TCVN xxxx : 2017

2 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-143 0 Base 4:23) 720/576/30 14 745 600 15 2 441 216 HP@ML

1 Spatial 4:2:2 1440/1088/60 47 001 600 60 7 340 032 HP@H-142 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

3 0 Base 4:2:2 720/576/30 11 050 200 15 2 441 216 HP@ML1 Spatial 4:2:2 1440/1088/60 47 001 600 60 7 340 032 HP@H-142 SNR 4:2:2 1440/1088/60 47 001 600 80 9 781 248 HP@H-14

Bảng E.44 - High profile @ High level (Base Layer)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

Chroma

Mật độ mẫu tối đa (H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

1 0 Base 4:2:0 1920/1088/60 83 558 400 100 12 222 464 HP@HL1 0 Base 4:2:2 1920/1088/60 62 668 800 100 12 222 464 HP@HL

Bảng E.45 - High profile @ High level (Base Layer + SNR)

206

TCVN xxxx : 2017

Bảng E.45 - High profile @ High level (Base Layer + SNR) – Tiếp theo

Bảng E.46 - High profile @ High level (Base Layer + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

Chỉ thị Profile và

mức

207

TCVN xxxx : 2017

Bảng E.47 - High profile @ High level (Base Layer + SRN + Spatial)

Số lớpLayer

_id

chế độ có thể mở rộng

Định dạng

ChromaMật độ mẫu

tối đa (H/V/F)Tốc độ mẫu

tối đa

Tổng số tốc độ bit tối

đa /1000000

Tổng số bộ đệm VBV lớn nhất

Chỉ thị Profile và

mức

208

TCVN xxxx : 2017

Bảng E.48 - High profile @ High level (Base Layer + SRN + Spatial)

209

TCVN xxxx : 2017

Bảng E.48 - High profile @ High level (Base Layer + SRN + Spatial) – Tiếp tục

210

TCVN xxxx : 2017

211

TCVN xxxx : 2017

Bảng E.48 - High profile @ High level (Base Layer + SRN + Spatial) – Tiếp tục

212

TCVN xxxx : 2017

Bảng E.48 - High profile @ High level (Base Layer + SRN + Spatial) – Tiếp tục

Bảng E.49 – Multi-view profile @ Low level

Bảng E.50 – Multi-view profile @ Main level

Bảng E.51 – Multi-view profile @ High-1440 level

Bảng E.52 – Multi-view profile @ High level

Số lớp

Layer_id

chế độ có thể mở rộng

Định dạngChroma

Mật độ mẫu tối đa

(H/V/F)

Tốc độ mẫu tối đa

Tổng số tốc độ bit tối đa /1000000

Tổng số bộ đệm VBV lớn

nhất

2 0 Base 1920/1088/60 62 668 800 80 9 781 248 MP@HL

1 Temporal 1920/1088/60 62 668 800 130 15 898 480 MVP@HL

213

TCVN xxxx : 2017

Phụ lục F- Các tính năng được hỗ trợ bởi thuật

toán(Tham khảo)

F.1. Tổng quanDanh sách các tính năng chưa đầy đủ sau đây chưa được hoàn thiện trong Tiêu chuẩn kỹ

thuật này:

1)Các định dạng lấy mẫu sắc màu khác nhau (tức là 4:2:0, 42: 2 và 4:4:4) có thể được đại diện.

2)Video trong cả hai định dạng quét liên tục và quét xen kẽ có thể được mã hóa.

3)Bộ giải mã có thể sử dụng tỷ lệ co 3:2 để thể hiện phim ảnh 24 khung hình/giây dưới dạng phim ảnh 30 khung hình/giây.

4)Video được hiển thị có thể được chọn bằng một cửa sổ Quay - quét (pan-scan) trong một khung lớn hơn.

5)Một loạt các chất lượng ảnh có thể được sử dụng.

6)Cả hai kênh tốc độ cố định và biến được hỗ trợ.

7)Một chế độ trễ thấp cho các ứng dụng face-to-face là có sẵn.

8)Có thể truy cập ngẫu nhiên (cho DSM, thu kênh, và nhảy kênh).

9)Các dòng bit tham số bị ràng buộc của ISO / IEC 11172-2 có thể giải mã được.

10) Dòng bit cho bộ giải mã phức tạp cao và thấp (phần cứng) có thể được tạo ra.

11)Chỉnh sửa video được mã hóa được hỗ trợ.

12)Có thể thực hiện phát lại tốc độ nhanh và chuyển đổi ngược lại.

13)Các dòng bit được mã hoá là có khả năng phục hồi đối với lỗi.

F.2. Các định dạng videoF.2.1. Các định dạng mẫu và màu sắc

Tính năng Mã hóa video này hỗ trợ cả video liên tiếp và video xen kẽ. Chỉ thị tương ứng được cung cấp với một cờ progressive_sequence được truyền trong mã mở rộng chuỗi.

Thông tin tỷ lệ mẫu được cung cấp bằng các phương tiện aspect_ratio_infonnation và (tùy chọn) display_honzontal_size và display_vertical_size trong sequence_display_extension(). Ví dụ về các giá trị thích hợp cho các tín hiệu lấy mẫu theo ITU-R BT. 601 được cho trong Bảng F.1.

Tiêu chuẩn kỹ thuật này thực hiện các công cụ để hỗ trợ độ phân giải 4:4:4, để có thể sử dụng trong tương lai. Tuy nhiên, hiện tại không được hỗ trợ trong bất kỳ profile nào.

Bảng F.1 - Ví dụ về Các giá trị kích thước hiển thị

Định dạng tín hiệu Display_horizontal_size Display_vertical_size525 dòng 711 483625dòng 702 575

F.2.2. Định thời phimBộ giải mã có thể thực hiện độ co 3:2 khi một chuỗi ảnh được mã hóa. Mỗi ảnh được mã

hóa có thể xác định một cách độc lập cho dù nó được hiển thị cho hai hoặc ba khoảng chu kỳ

214

TCVN xxxx : 2017

trường video, do đó độ co 3:2 "không thường xuyên", nguồn tư liệu có thể được truyền như video liên tiếp và mô tả đầy đủ thời gian hiển thị cần thiết.

F.2.3.Điều khiển định dạng hiển thịQuá trình hiển thị chuyển đổi một dãy các khung hình kỹ thuật số (trong trường hợp của

video liên tiếp) hoặc các trường (trong trường hợp của video xen kẽ) để sản xuất video. Đây không phải là một phần quy chuẩn của Tiêu chuẩn kỹ thuật này. Cú pháp video của Tiêu chuẩn kỹ thuật này truyền thông các tham số hiển thị nhất định để sử dụng trong việc tái tạo lại video. Thông tin tùy chọn (trong phần mở rộng hiển thị chuỗi) chỉ định độ sắc nét, hiển thị đầu tiên, đặc điểm truyền tải quang điện (ví dụ: giá trị của gamma) và ma trận chuyển đổi RGB tới độ chói/màu.

Hơn nữa, cửa sổ hiển thị trong quét dòng được mã hoá có thể được định nghĩa là, ví dụ: trong trường hợp chuyển động và quét. Ngoài ra, mã quét dòng được mã hóa có thể được định nghĩa như một cửa sổ trên một thiết bị hiển thị diện tích lớn. Trong trường hợp quay quét (pan-scan) vị trí của cửa sổ đại diện cho khu vực hiển thị của một ảnh lớn hơn có thể được chỉ ra trên từng trường cơ sở. Nó là chỉ ra trong phần mở rộng hiển thị ảnh mô tả trong 6.3.12. Một cách sử dụng điển hình cho cửa sổ quay quét (pan-scan) là mô tả hình chữ nhật tỷ lệ 4:3 quan trọng trong một chuỗi video 16:9. Tương tự như vậy, trong trường hợp các ảnh được mã hoá nhỏ trên một màn hình lớn, kích thước của màn hình hiển thị và vị trí của cửa sổ bên trong màn hình hiển thị có thể là chi tiết.

F.2.4.Mã hóa trong suốt của video ghépGiải mã từ PAL/NTSC trước khi truyền và mã hóa lại cho PAL/NTSC sau khi truyền các tín

hiệu nguồn hỗn hợp trong các ứng dụng chất lượng không thấp, chẳng hạn như tập hợp và phân phối, đòi hỏi phải xây dựng lại chính xác biên độ sóng mang và tín hiệu tham chiếu pha (và v_axis cho PAL).

Định dạng đầu vào có thể được chỉ ra trong tiêu đề chuỗi bằng cách sử dụng các bit video_format. Các định dạng nguồn có thể là: PAL, NTSC, SECAM và MAC. Khôi phục lại tín hiệu của nhà cung cấp có thể bằng cách sử dụng các tham số của nhà cung cấp: v_axis, field_sequence,sub_carrier, burst_amplitude và sub_carrier_phase được kích hoạt bằng cách đặt composite_display_flag trong picture_coding_extension().

F.3.Chất lượng hình ảnhChất lượng ảnh cao được cung cấp theo tỷ lệ bit được sử dụng. Cung cấp cho chất lượng

ảnh rất cao được thực hiện bởi các tỷ lệ bit đủ cao tỷ lệ liên quan đến một mức độ nhất định trong một hồ sơ cụ thể. Chất lượng băng tần cao có thể đạt được bằng cách sử dụng màu sắc 4: 2: 2.

Ma trận lượng tử có thể được tải xuống và sử dụng với một quantiser_scale_code nhỏ để đạt được mã hóa gần như không mất dữ liệu.

Hơn nữa, khả năng mở rộng mã hóa với tốc độ bit linh hoạt cho phép dịch vụ hoặc phân cấp chất lượng và giảm độ đẹp. Ví dụ. giải mã một tập con của dòng bit có độ phân giải thấp hơn cho phép giải mã tín hiệu này trong một máy thu giá rẻ với chất lượng liên quan; giải mã dòng bit hoàn chỉnh cho phép đạt được chất lượng tổng thể cao.

Hơn nữa, hoạt động ở tốc độ bit thấp có thể được điều chỉnh bằng cách sử dụng tỷ lệ khung hình thấp (bằng việc xử lý trước trước khi mã hóa hoặc bỏ qua khung được chỉ ra bởi

215

TCVN xxxx : 2017

temporal_reference trong tiêu đề hình ảnh) và độ phân giải không gian thấp.

F.4. Kiểm soát tốc độ dữ liệuSố bit truyền qua mỗi đơn vị thời gian, được lựa chọn trong một phạm vi rộng, có thể được

kiểm soát theo hai cách, đều được hỗ trợ bởi Tiêu chuẩn kỹ thuật này. Một mô tả bit_rate được truyền đi với mã hóa tiêu đề chuỗi (Sequence Header Code).

Đối với mã hoá tốc độ bit không đổi (CBR), số bit truyền qua mỗi đơn vị thời gian là cố định trên kênh. Vì tốc độ đầu ra của bộ mã hóa thường thay đổi tùy thuộc vào nội dung hình ảnh, nó sẽ điều chỉnh tốc độ tỷ lệ bằng cách đệm, vv Trong CBR, chất lượng ảnh có thể khác nhau tùy thuộc vào nội dung của nó.

Các chế độ khác là mã hoá tốc độ bit biến đổi(VBR), trong trường hợp số bit truyền qua mỗi đơn vị thời gian có thể thay đổi trên kênh dưới một số sự co lại. VBR có nghĩa là cung cấp mã hoá chất lượng không đổi. Một mô hình ứng dụng VBR là mã hoá gần như liên tục về chất lượng đối với các kênh B-ISDN dựa vào kiểm soát thông số sử dụng (UPC).

F.5.Chế độ trễ thấpChế độ trễ mã hóa và giải mã được cung cấp cho các giao tiếp video thời gian thực như

điện thoại hình ảnh, hội nghị truyền hình, giám sát. Có thể đạt được độ trễ mã hoá và giải mã tổng cộng dưới 150 mili giây cho chế độ hoạt động trễ của Tiêu chuẩn kỹ thuật này. Thiết lập cờ low_delay trong mã hóa tiêu đề chuỗi xác định một dòng bit có độ trễ thấp.

Tốc độ mã hoá và giải mã tổng thể có thể được giữ ở mức thấp bằng cách tạo ra một luồng bit không chứa ảnh B. Điều này ngăn cản trễ đặt lại khung. Bằng cách sử dụng dự đoán hai thành phần cho khung P được mã hoá, chất lượng ảnh vẫn có thể cao.

Một bộ đệm thấp cho cả bộ giải mã và bộ giải mã là cần thiết cho độ trễ thấp. Những ảnh mã hoá lớn nên tránh bằng bộ mã hóa. Bằng cách sử dụng cập nhật nội bộ trên cơ sở một hoặc nhiều lát cắt trên một khung (intra slices) thay vì các khung bên trong, điều này có thể được làm cho phù hợp.

Trong trường hợp vượt quá, cho hoạt động trễ, số bit mong muốn trên mỗi bộ mã hóa có thể bỏ qua một hoặc nhiều khung. Hành động này được chỉ ra bởi sự gián đoạn trong giá trị temporal_refcrence cho ảnh tiếp theo (xem định nghĩa ngữ nghĩa ở 6.3.9) và có thể là nguyên nhân để áp dụng C.7 của VBV, nghĩa là bộ đệm bộ giải mã sẽ bị giảm nếu một số khung không được lặp lại bởi bộ giải mã.

F.6.truy cập ngẫu nhiên/nhảy kênhCú pháp của Tiêu chuẩn kỹ thuật này hỗ trợ truy cập ngẫu nhiên và nhảy kênh. Khả năng

truy cập ngẫu nhiên/ nhảy kênh ngẫu nhiên đầy đủ là có thể bằng cách mã hóa các điểm truy cập ngẫu nhiên thích hợp vào luồng dòng bit mà không làm giảm đáng kể chất lượng hình ảnh.

Truy cập ngẫu nhiên là một tính năng thiết yếu cho video trên một phương tiện lưu trữ. Nó đòi hỏi rằng bất kỳ ảnh có thể được truy cập và giải mã trong một số lượng hạn chế về thời gian. Nó ngụ ý sự tồn tại của các điểm truy cập trong dòng bit là các phân đoạn của thông tin có thể nhận dạng được và có thể được giải mã mà không cần tham khảo đến các phân đoạn dữ liệu khác. Trong các điểm truy cập Tiêu chuẩn kỹ thuật này được cung cấp bởi sequence_header() và sau đó là thông tin nội bộ (dữ liệu ảnh có thể được giải mã mà không cần truy cập vào các ảnh đã giải mã trước). Khoảng cách giữa hai điểm truy cập ngẫu nhiên mỗi giây có thể đạt được mà không làm giảm đáng kể chất lượng hình ảnh.

216

TCVN xxxx : 2017

Nhảy kênh là tình huống tương tự trong các ứng dụng truyền dẫn như phát sóng. Ngay khi một kênh mới đã được chọn và dòng bit của kênh đã chọn có sẵn cho bộ giải mã, mục nhập dữ liệu tiếp theo, tức là điểm truy cập ngẫu nhiên phải được tìm thấy để bắt đầu giải mã chương trình mới theo cách được nêu trong đoạn trước.

F.7.Khả năng mở rộngCú pháp của Tiêu chuẩn kỹ thuật này hỗ trợ khả năng mở rộng dòng bit. Để đáp ứng các

yêu cầu chức năng đa dạng của các ứng dụng được dự kiến bởi Đặc tả này, một số công cụ khả năng mở rộng dòng dòng bit đã được phát triển:

Khả năng mở rộng SNR chủ yếu nhắm mục tiêu cho các ứng dụng đã bị xuống cấp.

Phát sóng màu nhắm tới các ứng dụng có yêu cầu chất lượng màu sắc cao.

Phân vùng dữ liệu.chủ yếu được nhắm mục tiêu để phục hồi sự mất tế bào trong các mạng lưới ATM.

Khả năng mở rộng thời gian là một phương pháp phù hợp cho việc tương tác của các dịch vụ bằng cách sử dụng các định dạng video độ phân giải thời gian cao. Cũng thích hợp cho chất lượng cao bị suy giảm trong sự hiện diện của lỗi kênh.

Khả năng mở rộng không gian cho phép kỹ thuật mã hóa đa phân giải thích hợp cho các ứng dụng liên kết dịch vụ video. Công cụ này cũng có thể cung cấp các chế độ mã hóa để đạt được sự tương thích với các tiêu chuẩn mã hoá hiện tại, tức là Tiêu chuẩn kỹ thuật này, ở lớp dưới.

F.7.1.Sử dụng khả năng mở rộng SNR ở một độ phân giải không gian đơn lẻMục đích của khả năng mở rộng SNR là cung cấp cơ chế truyền tải dịch vụ hai lớp, hai lớp

này cung cấp độ phân giải ảnh giống nhau nhưng có mức chất lượng khác nhau. Ví dụ, truyền tải dịch vụ với hai mức chất lượng khác nhau dự kiến sẽ trở nên hữu ích trong tương lai đối với một số ứng dụng phát sóng truyền hình, đặc biệt là khi chất lượng ảnh rất tốt là cần thiết cho máy thu hiển thị kích thước lớn. Chuỗi được mã hoá thành hai dòng dòng bit được gọi là các dòng bit lớp thấp hơn và các lớp tăng cường. Các dòng bit lớp thấp hơn có thể được giải mã độc lập từ các dòng bit lớp tăng cường. Lớp thấp hơn, từ 3 đến 4 Mbit/s, sẽ cung cấp chất lượng ảnh tương đương với chất lượng NTSC/PAL/SECAM hiện tại. Sau đó, bằng cách sử dụng các dòng bits thấp lớp thấp hơn và các lớp tăng cường, một bộ giải mã liên tiếp có thể mang lại chất lượng ảnh một cách khách quan gần với chất lượng phòng thu, với tốc độ bit từ 7 đến 12 Mbit/s.

F.7.1.1. Các tính năng bổ sung

F.7.1.1.1. Khả năng phục hồi lỗi

Như mô tả trong F.13, lược đồ có thể mở rộng SNR có thể được sử dụng như là một cơ chế phục hồi lỗi. Nếu hai lớp dòng bit nhận được với tỷ lệ lỗi khác nhau, lớp dưới, được bảo vệ tốt hơn, đúng như một sự thay thế tốt để phục hồi lại, nếu lớp tăng cường bị hỏng.

F.7.1.1.2. Phát sóng màu

Cú pháp có thể mở rộng SNR có thể được sử dụng trong một hệ thống phát sóng màu. Mục đích của một chương trình như vậy là cung cấp một cơ chế để phân phối đồng thời các

217

TCVN xxxx : 2017

dịch vụ với độ phân giải cùng độ chói nhưng định dạng lấy mẫu khác nhau về màu sắc (ví dụ 4:2:0 ởlớp thấp hơn và 4:2:2 khi bổ sung lớp nâng cao và các thành phần phát sóng màu) cho các ứng dụng sẽ yêu cầu như một tính năng. Lớp tăng cường khả năng mở rộng SNR có chứa một số sàng lọc độ sáng. Chất màu 4: 2: 2 được gửi bằng phát sóng. Chỉ có độ màu sắc DC được dự đoán từ lớp thấp hơn. Sự kết hợp cả lớp độ chói và độ sắc màu 4:2:2 tạo thành mức chất lượng cao.

F.7.1.2. Quá trình mã hóa SNR có thể mở rộng

F.7.1.2.1. Mô tả

Ở lớp thấp hơn, việc mã hoá tương tự như tình huống không thể mở rộng về mặt quyết định, lượng tử hóa thích nghi, bộ đệm quy chuẩn. Macroblocks nội suy hoặc lỗi được chuyển đổi DCT. Các hệ số sau đó được lượng tử hóa bằng cách sử dụng một lượng tử khá thô đầu tiên. Các hệ số lượng hoá sau đó được mã hóa VLC và được gửi cùng với các thông tin phụ yêu cầu (macroblock_type, các vector chuyển động, coded_block_pattern()).

Song song, các hệ số DCT lượng tử đến từ lớp dưới, được khử số lượng. Lỗi dư thừa giữa các hệ số và các hệ số không lượng hoá sau đó được khử số lượng bằng cách sử dụng bộ định lượng thứ hai tốt hơn. Các hệ số sàng lọc kết quả được mã hoá VLC và tạo thành lớp tăng cường bổ sung cùng với một lượng thông tin bên lề (quantiser_scale_code, coded_block_pattem () ...). Bảng VLC không phải trong nội bộ được sử dụng cho tất cả các hệ số trong lớp tăng cường, vì nó có tính chất khác biệt.

F.7.1.2.2. Một số đánh dấu quan trọng

Vì dự báo là như nhau đối với cả hai lớp, nên sử dụng các hình ảnh được tinh chỉnh trong vòng lặp ước lượng chuyển động (ví dụ: các hình ảnh thu được bằng sự liên kết của lớp thấp hơn và lớp nâng cao). Do đó, có một sự trôi giữa dự đoán được sử dụng ở phía bộ mã hóa và bộ giải mã mức thấp có thể có được như là một dự đoán. Sự trôi này tích lũy từ ảnh P đến ảnh P và được đặt lại ở mức 0 tại mỗi ảnh I. Tuy nhiên, trôi ảnh đã được tìm thấy có ít hiệu ứng hình ảnh khi có một ảnh I cho mỗi 15 hình ảnh hay là tương tự như vậy.

Vì lớp tăng cường chỉ chứa các hệ số sàng lọc nên tổng chi phí cần thiết sẽ giảm đáng kể: phần lớn thông tin về các macroblocks (các loại macroblock, các vector chuyển động ...) được bao gồm trong lớp dưới. Vì vậy, cú pháp của dòng này là đơn giản đi rất nhiều:

bảng kiểu macroblock chỉ cho biết nếu quantiser_scale_code trong lớp tăng cường đã thay đổi và nếu macroblock là không mã hóa (NOT-CODED) (cho macroblock đầu tiên và cuối cùng của lát cắt), trong tổng số ba từ VLC.

quantiser_scale_code trong lớp tăng cường được gửi đi nếu giá trị đã thay đổi.

coded_block_pattern() được truyền cho tất cả các macroblock đã được mã hoá.

Tất cả các macroblocks NON-CODED không ở đầu hoặc cuối của một lát cắt được bỏ qua, vì thông tin trên không thể được suy ra từ lớp dưới.

Khuyến nghị nên sử dụng các ma trận trọng số khác nhau cho lớp thấp hơn và lớp tăng cường. Một số kết quả tốt hơn thu được khi lần lượng tử đầu tiên là bước cao hơn lần thứ hai.

218

TCVN xxxx : 2017

Tuy nhiên, không nên lượng tử hóa quá thô các hệ số DCT tương ứng với chuyển động xen kẽ, để tránh hiệu ứng giật.

F.7.2. Đa phân giải dòng bit sử dụng khả năng mở rộng SNR

Mục đích của khả năng mở rộng giải quyết là để giải mã các video lớp cơ sở phù hợp để hiển thị ở giảm độ phân giải không gian. Ngoài ra, nó là mong muốn để thực hiện một bộ giải mã với giảm độ phức tạp cho mục đích này. Chức năng này rất hữu ích cho các ứng dụng mà màn hình máy thu không thể hoặc sẵn sàng để hiển thị độ phân giải không gian đầy đủ được hỗ trợ bởi cả hai lớp và cho các ứng dụng mà phần mềm giải mã được nhắm mục tiêu. Phương pháp được mô tả trong phần phụ này sử dụng cú pháp SNR có khả năng mở rộng được phác thảo trong điều khoản 7 để truyền tải video trong hai lớp. Lưu ý rằng không có lựa chọn nào đề xuất trong phần phụ này sẽ làm thay đổi cấu trúc của bộ giải mã độ phân giải cao nhất, giống như được mô tả trong Hình 7-14. Tín hiệu bit được tạo ra trên cả hai lớp tương thích với cấu hình CAO. Tuy nhiên, bộ giải mã lớp cơ sở có thể được thực hiện khác nhau với sự phức tạp thực hiện giảm phù hợp với phần mềm giải mã.

F.7.2.1. Thực hiện giải mã

Trong giải mã đến một độ phân giải không gian nhỏ hơn, một DCT nghịch đảo có kích thước giảm có thể được sử dụng khi giải mã lớp cơ sở. Yêu cầu về bộ nhớ khung trong vòng lặp MC của bộ giải mã cũng sẽ được giảm xuống tương ứng.

Nếu dòng bit của hai lớp có khả năng mở rộng SNR được tạo ra chỉ với một vòng lặp MC tại bộ mã hóa thì video cơ sở sẽ bị trôi. Sự trôi này có thể hoặc không thể chấp nhận được tùy thuộc vào ứng dụng. Chất lượng ảnh, ở mức độ lớn, phụ thuộc vào độ chính xác mẫu con được sử dụng để bù chuyển động trong bộ giải mã. Có thể sử dụng vector chuyển động chính xác đầy đủ như truyền đi trong lớp cơ sở để bù chuyển động với độ chính xác mẫu con tương thích với lớp cao hơn. Rung pha có thể được giảm thiểu bằng cách sử dụng các bộ lọc nội suy mẫu con liên tiếp (xem (22), (23) và (20) trong Phụ lục L).

F.7.2.2. Thực hiện mã hóa

Có thể điều chỉnh tốc độ bit lớp cơ sở SNR với các yêu cầu cụ thể của bộ giải mã kín niêm phong. Một kích cỡ DCT nhỏ hơn có thể dễ dàng được hỗ trợ bằng cách chỉ truyền các hệ số DCT thích hợp thuộc tập hợp con thích hợp trong dòng bit lớp cơ sở.

Cuối cùng, có thể hỗ trợ giải mã không trôi ở quy mô độ phân giải thấp hơn bằng cách kết hợp nhiều vòng lặp MC trong lược đồ mã hóa. Một quá trình tái thiết giống hệt nhau được sử dụng trong bộ mã hóa và giải mã.

F.7.3. Phân bổ tốc độ bit trong phân vùng dữ liệu

Phân vùng dữ liệu cho phép tách một dòng bit để tăng khả năng chống lại lỗi khi hai kênh với hiệu suất lỗi khác nhau có sẵn. Nó thường được yêu cầu để hạn chế tốc độ bit của mỗi phân vùng. Điều này có thể đạt được ở bộ mã hóa bằng cách thay đổi thích nghi điểm dừng ưu tiên tại mỗi lát cắt.

219

TCVN xxxx : 2017

Bộ mã hóa có thể sử dụng hai bộ đệm ảo cho hai luồng dòng bit và thực hiện điều khiển tỷ lệ phản hồi bằng cách chọn một điểm dừng ưu tiên xung quanh đáp ứng tốc độ mục tiêu cho mỗi kênh. Sự chênh lệch giữa tỷ lệ đích và tỷ lệ thực tế được sử dụng để sửa đổi mục tiêu cho khung tiếp theo trong một vòng phản hồi.

Đó là mong muốn để thay đổi tốc độ bit tách ra từ khung để khung cho khả năng phục hồi lỗi cao hơn. Thông thường, các ảnh I được hưởng lợi từ việc có nhiều dữ liệu hơn trong phân vùng 0 so với các ảnh P, trong khi các ảnh B có thể được đặt hoàn toàn trong phân vùng 1.

F.7.4. Khả năng mở rộng theo thời gian

Một cấu trúc mã hoá có thể mở rộng theo thời gian hai lớp bao gồm một cơ sở và một lớp tăng cường được thể hiện trong hình F.1. Xem xét đầu vào video ở tốc độ toàn bộ thời gian để ghép thời gian; trong ví dụ nó được ghép theo thời gian để tạo thành hai chuỗi video, một đầu vào cho bộ mã hoá lớp cơ sở và đầu vào khác vào bộ mã hóa lớp tăng cường. Bộ mã hóa lớp cơ sở là một bộ mã hóa không theo cấp bậc hoạt động ở nửa tốc độ theo thời gian, bộ mã hoá lớp nâng cao giống như bộ mã hoá profile chính và cũng hoạt động ở nửa tốc độ theo thời gian, ngoại trừ việc sử dụng các hình ảnh giải mã cơ bản để dự đoán được chuyển động. Các dòng bit được mã hoá của các lớp cơ sở và tăng cường được ghép như một luồng đơn trong các bộ ghép kênh hệ thống. Các hệ thống tách biệt tách hai dòng bit và đầu vào dòng bit tương ứng thành các bộ giải mã lớp cơ sở và tăng cường. Đầu ra của bộ giải mã lớp cơ sở có thể được hiển thị độc lập ở nửa tốc độ theo thời gian hoặc sau khi ghép kênh với các khung giải mã lớp tăng cường và hiển thị ở toàn bộ tốc độ theo thời gian.

Hình F.1 - Cấu trúc mã hóa hai lớp cho khả năng mở rộng thời gian

Các dạng sau của khả năng mở rộng theo thời gian được hỗ trợ và được thể hiện dưới dạng các lớp cao hơn: các định dạng ảnh lớp trên lớp cơ bản để tăng cường.

1) Liên tiếp: khả năng mở rộng theo thời gianprogressive-to-progressive.

2) Liên tiếp: Khả năng mở rộng theo thời gian interlac-to-interlace.

3) Xen kẽ: Khả năng mở rộng theo thời gian interlace-to-interlace.

F.7.4.1. Tiến trình - khả năng mở rộng theo thời gian progressive-to-progressive

Giả sử đầu vào videoliên tiếp, nếu cần mã hóa định dạng progressive-format trong các lớp cơ sở và lớp tăng cường, hoạt động giải ghép theo thời gian có thể tương đối đơn giản và liên

220

TCVN xxxx : 2017

quan đến việc ghép theo thời gian của các khung đầu vào thành hai chuỗiliên tiếp. Hoạt động tái ghép theo thời gian là nghịch đảo, nghĩa là nó thực hiện ghép kênh lại hai dãy liên tiếp để tạo ra toàn bộ tốc độ đầu ra liên tiếp theo thời gian (xem hình F.2).

F.7.4.2. Khả năng mở rộng theo thời gian - interlace-to-interlace

Một lần nữa, giả định tốc độ video liên tiếp tăng dần, nếu cần mã hóa video định dạng xen kẽ trong lớp cơ sở, hoạt động giải ghép theo thời gian có thể liên quan tới tiến trình chuyển đổiliên tiếpxen kẽ; quá trình này liên quan đến việc chiết xuất một chuỗi xen kẽ thông thường - và một dãy xen kẽ bổ sung từ video liên tiếp đầu vào. Hoạt động tái ghép theo thời gian là nghịch đảo, nghĩa là nó thực hiện thực hiện hai việc xen kẽ để chuyển đổi liên tiếp tạo ra ở toàn bộ tốc độ theo thời gian.

Hình F.3 và F.4 cho thấy các hoạt động được yêu cầu theo liên tiếp đến haixen kẽ và hai xen kẽ đến chuyển đổi liên tiếp.

Hình F.2 - Bộ ghép theo thời gian và bộ ghép kênh cho các tiến trình - Progressive-to-progressive

221

TCVN xxxx : 2017

Hình F.3 - liên tiếp để chuyển đổi hai giao diện

222

TCVN xxxx : 2017

Hình F.4 – Hai-xen kẽ tới chuyển đổi liên tiếp

223

TCVN xxxx : 2017

Hình F.5 - Bộ ghép và giải ghép theo thời gian cho khả năng có thể mở rộng theo thời gian progressive -Interface-to-interface

F.7.4.3. khả năng mở rộng theo thời gian Interlace - Interlace-to-interlace

Giả sử đầu vào video xen kẽ, nếu cần mã hóa video định dạng xen kẽ trong các lớp cơ sở và các lớp tăng cường, hoạt động giải ghép theo thời gian có thể tương đối đơn giản và liên quan đến việc ghép theo thời gian của khung đầu vào thành hai chuỗi xen kẽ. Hoạt động tái ghép theo thời gian là nghịch đảo, tức là nó thực hiện ghép kênh lại của hai chuỗi xen kẽ để tạo ra đầu ra xen kẽ toàn tốc độ. Việc tách và tái ghép tương tự như trong Hình F.2.

F.7.5. Lai ghép của không gian, SNR và phần mở rộng theo thời gian có thể mở rộng

Tiêu chuẩn quốc gia này cũng cho phép kết hợp các công cụ khả năng mở rộng để sản xuất nhiều hơn 2 lớp video có thể hữu ích và thiết thực để hỗ trợ các ứng dụng đòi hỏi nhiều hơn. Lấy hai lần cùng một lúc, 3 kết quả kết hợp rõ ràng. Hơn nữa, trong mỗi sự kết hợp, thứ tự trong đó mỗi khả năng mở rộng được áp dụng, khi được thay đổi, dẫn đến các ứng dụng khác biệt. Trong các khả năng mở rộng liên quan đến ba lớp, các lớp được gọi là lớp cơ sở, lớp tăng cường 1 và lớp tăng cường 2.

F.7.5.1. Ứng dụng khả năng mở rộng không gian và SNR

a) HDTV với SDTV ở hai chất lượng:

Lớp cơ sở cung cấp độ phân giải SDTV ở chất lượng cơ bản, lớp nâng cao 1 giúp tạo ra độ phân giải SDTV nhưng chất lượng cao hơn theo khả năng mở rộng SNR và lớp nâng cao 2 sử dụng độ phân giải và định dạng HDTV được mã hoá với khả năng mở rộng không gian đối với độ phân giải TV đạt tiêu chuẩn chất lượng cao bằng cách sử dụng lớp tăng cường 1.

b) SDTV ở hai chất lượng và TV/videophone độ nét thấp:

Lớp cơ sở cung cấp chất lượng videophone/low definition, sử dụng lớp nâng cao khả năng mở rộng không gian 1 cung cấp độ phân giải TV tiêu chuẩn ở chất lượng cơ bản và lớp nâng cấp 2 sử dụng khả năng mở rộng SNR để giúp tạo ra TV tiêu chuẩn chất lượng cao.

c) HDTV ở hai chất lượng và TV tiêu chuẩn (SDTV):

224

TCVN xxxx : 2017

Lớp cơ sở cung cấp độ phân giải TV tiêu chuẩn, sử dụng lớp nâng cao khả năng mở rộng không gian 1 cung cấp chất lượng HDTV cơ bản và lớp tăng cường 2 sử dụng khả năng mở rộng SNR để tạo ra HDTV chất lượng cao.

F.7.5.2. Ứng dụng khả năng mở rộng không gian và thời gian

a) HDTV độ phân giải cao theo thời gian với dựa vào HDTV và SDTV xen kẽ:

Lớp cơ sở cung cấp độ phân giải TV tiêu chuẩn, sử dụng lớp nâng cao có khả năng mở rộng không gian 1 cung cấp HDTV cơ bản của định dạng xen kẽ và lớp nâng cao 2 sử dụng khả năng mở rộng theo thời gian để giúp tạo ra đầy đủ tiến trình phân giải theo thời gian HDTV.

b) HDTV với độ phân giải cao với HDTV và HDTV cơ bản:

Lớp cơ sở cung cấp định dạng HDTV căn bản ở độ phân giải theo thời gian, sử dụng lớp nâng cao 1 có khả năng mở rộng thời gian giúp tạo ra HDTV ở độ phân giải theo thời gian đầy đủ và sử dụng lớp nâng cấp 2 có khả năng mở rộng theo không gian để cung cấp độ phân giải theo không gian HDTV (ở độ phân giải theo thời gian đầy đủ).

c) HDTV độ phân giải cao với HDTV nâng cao và HDTV xen kẽ cơ bản:

Lớp cơ sở cung cấp định dạng HDTV cơ bản, sử dụng lớp nâng cấp 1có khả năng mở rộng theo thời gian sẽ giúp tạo ra HDTV cải tiến ở độ phân giải theo thời gian đầy đủ và sử dụng lớp nâng cấp 2 có khả năng mở rộng theo không gian để cung cấp HDTV độ phân giải cao theo không gian (ở độ phân giải thời gian đầy đủ).

F.7.5.3. Các ứng dụng khả năng mở rộng theo thời gian và SNR lai

a) Nâng cao HDTV liên tiếp với HDTV liên tiếp cơ bản ở hai chất lượng:

Lớp cơ sở cung cấp HDTV cải tiến cơ bản với tốc độ thời gian thấp hơn, sử dụng lớp nâng cao 1 có khả năng mở rộng theo thời gian tạo ra HDTV liên tiếp với toàn tốc độ nhưng với chất lượng cơ bản và lớp nâng cao 2 sử dụng khả năng mở rộng SNR để tạo ra HDTV cải tiến với chất lượng cao (ở độ phân giải đầy đủ).

b) HDTV liên tiếp Nâng cao với HDTV xen kẽ cơ bản ở hai chất lượng:

Lớp cơ sở cung cấp chất lượng HDTV xen kẽ với chất lượng cơ bản, sử dụng lớp nâng cao 1 có khả năng mở rộng SNR giúp tạo ra HDTV xen kẽ với chất lượng cao và lớp nâng cấp 2 sử dụng khả năng mở rộng theo thời gian để tạo ra HDTV liên tiếp ở độ phân giải thời gian đầy đủ (chất lượng cao).

F.8. Tương thích

Tiêu chuẩn quốc gia này hỗ trợ sự tương thích giữa các định dạng phân giải khác nhau cũng như khả năng tương thích với ISO/IEC 11172-2 (và Khuyến nghị H.261).

225

TCVN xxxx : 2017

F.8.1. Khả năng tương thích với các định dạng độ phân giải cao hơn và thấp hơn

Đặc điểm này hỗ trợ tương thích giữa các định dạng video độ phân giải khác nhau. Khả năng tương thích được cung cấp cho các giải pháp không gian và thời gian với công cụ Khả năng mở rộng theo không gian và Các công cụ khả năng mở rộng theo thời gian. Video được mã hoá thành hai lớp. Bộ giải mã chỉ có khả năng hoặc sẵn sàng để hiển thị một đoạn video có độ phân giải thấp chấp nhận và giải mã các dòng bit thấp hơn. Video có độ phân giải đầy đủ có thể được tái tạo bằng cách chấp nhận và giải mã cả hai lớp phân giải được cung cấp.

F.8.2. Tương thích với ISO/IEC 11172-2 (và Khuyến nghị H.261)

Cú pháp của Tiêu chuẩn quốc gia này hỗ trợ tương thích ngược với ISO/IEC 11172-2. Tương thích chuyển tiếp với ISO/IEC 11172-2, được cung cấp vì cú pháp của Tiêu chuẩn quốc gia này là sự thay thế của cú pháp ISO/IEC 11172-2. Công cụ Khả năng mở rộng không gian được cung cấp bởi Đặc tả này cho phép sử dụng mã hoá ISO/IEC 11172-2 ở độ phân giải thấp, nghĩa là lớp cơ sở, do đó đạt được tính tương thích ngược.

Cú pháp video chứa các công cụ cần thiết để triển khai khả năng tương thích của ITU-T H.261 cần thiết cho việc sử dụng trong tương lai, tuy nhiên hiện tại nó không được hỗ trợ bởi bất kỳ profile nào.

Phát sóng phát thanh và truyền hình phục vụ như là một phương pháp thay thế đơn giản để cung cấp khả năng tương thích ngược với cả Khuyến nghị ITU-T H.261 và ISO/IEC 11172-2.

F.9. Sự khác biệt giữa đặc tả này và ISO/IEC 11172-2

Mục dưới đây liệt kê sự khác biệt giữa Video MPEG-1 và Video MPEG-2.

Tất cả bộ giải mã Video MPEG-2 phù hợp với các profile và mức được xác định hiện tại đều được yêu cầu để giải mã các dòng bit hạn chế MPEG-1.

Trong hầu hết các trường hợp. MPEG-2 đại diện cho một tập hợp siêu tập hợp của MPEG-1. Chẳng hạn, lệnh quét zigzag hệ số MPEG-I là một trong hai chế độ quét hệ số của MPEG-2. Tuy nhiên, trong một số trường hợp, có các thành phần cú pháp (hoặc ngữ nghĩa) của MPEG-1 không tương đương trực tiếp với MPEG-2. Tiêu chuẩn quốc gia này liệt kê tất cả các yếu tố đó.

Tiêu chuẩn quốc gia này có thể giúp thực hiện xác định những yếu tố của cú pháp video MPEG-1 (hoặc ngữ nghĩa) không tương đương trực tiếp của chúng trong MPEG-2 và do đó cần được quan tâm đặc biệt để đảm bảo khả năng tương thích MPEG-1.

Trong phần dưới đây, MPEG-1 tham chiếu đến ISO/IEC 11172-2 trong khi MPEG-2 tham chiếu đến Tiêu chuẩn quốc gia này.

F.9.1. IDCT Không phù hợp

MPEG-1 Kiểm soát không phù hợp IDCT bao gồm việc thêm (hoặc loại bỏ) một cho mỗi hệ số không bằng 0 thậm chí có thể thay đổi lượng tử nghịch đảo. Đây được mô tả là một phần của quá trình lượng tử nghịch đảo, trong 2.4.4.I, 2.4.4.2 và 2.4.43 của ISO/IEC 11172-2 (MPEG-1).

226

TCVN xxxx : 2017

MPEG-2 - Kiểm soát không phù hợp IDCT bao gồm việc thêm (hoặc loại bỏ) một hệ số coefficient[7][7] nếu tổng của tất cả các hệ số thậm chí sau khi lượng tử nghịch đảo, Điều này được mô tả trong 7,4,4 của MPEG-2,

F.9.2. Nhồi Macroblock

MPEG-1 - Có thể chèn mã VLC '0000 0001 111' (nhồi macroblock) bất kỳ số lần nào trước mỗi macroblock_address_inerement. Mã này phải được bộ giải mã loại bỏ. Điều này được mô tả trong 2.4.2.7 của MPEG-1.

F.9.3. Cú pháp thoát Run-level

MPEG-1 Các giá trị Run-level mà không thể mã hoá bằng VLC được mã hoá bởi mã thoát '0000 01' theo sau hoặc là một FLC 14-bit (-127 <= level <= 127) hoặc một FLC 22-bit -255 <= level <= 255). Điều này được mô tả trong Phụ lục B.2 ÷ B.5 của MPEG-1.

MPEG-2 - Các giá trị Run-level mà không thể mã hoá bằng VLC được mã hoá bởi mã thoát ‘0000 01’ theo sau bởi một FLC 18-bit (-2047 <= level <= 2047) Điều này được mô tả trong phần 72.2.3 của MPEG -2

F.9.4. Vị trí theo chiều ngang các mẫu sắc màu

MPEG-1 - Vị trí theo chiều ngang các mẫu sắc màu là một nửa giữa các mẫu độ sáng. Điều này được mô tả trong 2.4.1 của MPEG-1.

MPEG-2 - Vị trí nằm ngang của các mẫu sắc màu được bố trí đồng thời với các mẫu độ chói. Điều này được mô tả trong 6.1.1.8 của MPEG-2.

F.9.5. Lát cắt

MPEG-1 - Các lát cắt không bắt đầu và kết thúc trên cùng hàng ngang của macroblocks. Do đó, có thể có tất cả các macroblocks của một hình ảnh trong một lát cắt duy nhất. Điều này được mô tả trong 2.4.1 của MPEG-1.

MPEG-2 - Các lát cắt luôn bắt đầu và kết thúc trên cùng một hàng nằm ngang của macroblocks. Điều này được mô tả trong 6.1.2 của MPEG-2.

F.9.6. Ảnh D

MPEG-1 - Một cú pháp đặc biệt được định nghĩa cho các ảnh D (picture_coding_type = 4). các ảnh D giống như các ảnh I chỉ với các hệ số Intra-DC, không có kết thúc của khối, và một mã '1' end_of_macroblock

MPEG-2 - các ảnh D là không được phép (picture_coding_type = 4). Điều này được mô tả trong 6.3.9 của MPEG-2.

F.9.7 Các vectơ chuyển động Full-pel

MPEG-1 - Các thành phần cú pháp full_pel_forward_vector và full_pel_backward_vector có

227

TCVN xxxx : 2017

thể được đặt là '1'. Khi đó, các vectơ chuyển động được mã hoá nằm trong các đơn vị số nguyên thay vì các đơn vị nửa mẫu. Toạ độ vectơ chuyển động phải được nhân với hai lần trước khi được sử dụng để dự đoán. Điều này được mô tả trong 2.4.4.2 và 2.4.4.3 của MPEG-1.

MPEG-2 - Các thành phần cú pháp full_pel_forward_vector và full_pel_backward_vector phải bằng '0'. Các vectơ chuyển động luôn được mã hoá trong các đơn vị nửa mẫu.

F.9.8. Thông tin tỉ lệ khuôn dạng

MPEG-1 - Giá trị pel_aspect_ratio 4 bit được mã hoá trong tiêu đề trình tự xác định tỷ lệ khung hình mẫu. Điều này được mô tả trong 2.4.3.2 của MPEG-1.

MPEG-2 - Giá trị aspect_ratio_infonnation 4 bit được mã hoá trong tiêu đề trình tự xác định tỷ lệ co hiển thị. Tỷ số co mẫu được lấy từ đây và từ kích thước khung và kích thước hiển thị. Điều này được mô tả trong 6.3.3 của MPEG-2.

F.9.9. forward_f_code và backward_f_code

MPEG-1 - Các giá trị f_code được sử dụng để giải mã vectơ chuyển động là forward_f_code và backward_f_code, nằm trong picture_header().

MPEG-2 - Các giá trị f_code được sử dụng để giải mã vectơ chuyển động là f_code [s][t], nằm trong picture_coding_extension(). Các giá trị của mã forward_f và backward_f_code phải là '111' và sẽ bị bỏ qua. Điều này được mô tả trong 6.3.9 của MPEG-2.

F.9.10. constrained_parameter_flag và horizontal_size lớn nhất

MPEG-1 - Khi constrained_parameter_flag được đặt là '1', điều này chỉ ra rằng một số lượng nhất định các ràng buộc được xác minh. Một trong những ràng buộc đó là horizontal_size<= 768. Cần lưu ý rằng dòng bit MPEG-1 hạn chế có thể có hình ảnh với kích thước ngang lên đến 768 mẫu độ chói. Điều này được mô tả trong 2.4.3.2 của MPEG-1.

MPEG-2 - Cơ chế constrained_parameter_flag đã được thay thế bằng cơ chế profile và mức. Tuy nhiên, cần lưu ý rằng MP@ML dòng bits không thể có kích cỡ ngang lớn hơn 720 mẫu độ chói. Điều này được mô tả trong 8.2.3.1 của MPEG-2.

F.9.11. Bit_rate và vbv_delay

MPEG-1 - Bit_rate và vbv_delay được đặt là 3FFFF và EFEE (hex) tương ứng để biết biến đổi tốc độ bit. Các giá trị khác có tốc độ bit không đổi.

MPEG-2 - Các ngữ nghĩa cho tốc độ bit được thay đổi. Trong hoạt động tốc độ bit biến, vbv_delay có thể được đặt thành FFFF (hex), nhưng một giá trị khác không nhất thiết có nghĩa là tốc độ bit là hằng số. Hoạt động tốc độ bit chỉ đơn giản là một trường hợp đặc biệt của hoạt động tốc độ bit biến đổi. Không có cách nào để nói rằng dòng bit là tốc độ bit không đổi mà không kiểm tra tất cả các giá trị vbv_delay và tính toán phức tạp.

Ngay cả khi tốc độ bit không thay đổi, giá trị tốc độ bit có thể không phải là tốc độ bit thực vì

228

TCVN xxxx : 2017

tế bit tốc độ cần là một giới hạn trên tế bit tốc độ thực.

F.9.12. VBV

MPEG-1 - VBV chỉ được định nghĩa cho hoạt động tốc độ bit không đổi. STD thay thế mô hình VBV cho hoạt động tốc độ bit biến đổi.

MPEG-2 - VBV chỉ được xác định cho hoạt động tốc độ bit biến đổi. Hoạt động tốc độ bit liên tục được xem như là một hoạt động dễ thay đổi tốc độ bit.

F.9.13. temporal_reference

MPEG-1 - Temporal_reference được tăng lên theo một modulo 1024 cho mỗi ảnh mã hoá, và đặt lại thành 0 tại mỗi nhóm tiêu đề ảnh.

MPEG-2 - Nếu không có ảnh lớn, chỉ số tạm thời tăng dần theo một mô đun 1024 cho mỗi ảnh được mã hoá và đặt lại là 0 tại mỗi nhóm ảnh tiêu đề (như trong MPEG-1). Nếu có ảnh lớn (trong dòng bits trễ thấp), sau đó tham chiếu thời gian theo các quy tắc khác nhau.

9.14. Cú pháp của MPEG-2 so với cú pháp MPEG-1

Có thể làm cho các dòng bit MPEG-2 có cú pháp rất gần với MPEG-1, bằng cách sử dụng các giá trị đặc biệt cho các thành phần cú pháp MPEG-2 khác không tồn tại trong cú pháp MPEG-1.

Nói cách khác, quá trình giải mã MPEG-1 là như nhau (ngoại trừ những điểm cụ thể đã đề cập ở trên) như quá trình giải mã MPEG-2 khi:

progressive_sequence = '1'

chroma_format = '01' (4: 2: 0)

ffame_rate_extension_n = 0 và frame_rate_extension_d = 0 (tốc độ khung MPEG-1)

intra_dc_precision = '00' (độ chính xác Intra-DC 8 bit)

picture_stnieture = 'l 1' (khung hình, bởi vì progressive_sequenee = '1')

ffame_prcd_framc_dct = 1 (chỉ dựa trên khung dự báo và khung DCT)

concealment_motion_vectors = '0' (không có vectơ chuyển động che giấu)

q_scale_type = '0' (quantiser_scale tuyến tính)

intra_vlc_format = '0' (bảng VLC MPEG-1 dành cho MB nội bộ)

altemate_scan = '0' (thứ tự quét MPEG-1zigzag)

repeat_first_field = '0' (vì progressive_sequence = '1')

229

TCVN xxxx : 2017

chroma_420_type = '1' (độ sắc màu là "frame-based", bởi vì progressive_sequence = '1')

progressive_frame = '1' (vì progressive_sequence = '1')

F.10. Tính phức tạp

Tiêu chuẩn MPEG-2 hỗ trợ kết hợp các bộ giải mã hiệu suất cao / độ phức tạp cao và các bộ giải mã hiệu suất thấp/độ phức tạp thấp. Điều này được hỗ trợ bởi MPEG-2 với định nghĩa Profiles and Levels giới thiệu các tập hợp công cụ và chức năng mới với mọi profile mới. Do đó, có thể giảm hiệu suất của các chương trình mã hóa MPEG-2 bằng cách giảm sự phức tạp của việc thực hiện.

Hơn nữa, một số hạn chế nhất định có thể cho phép giảm chi phí thực hiện bộ giải mã.

F.11. Chỉnh sửa dòng bit mã hoá

Nhiều hoạt động trên dòng bit được mã hóa được hỗ trợ để tránh chi phí và chi phí chất lượng của việc tái mã hóa. Việc chỉnh sửa, và sự ghép nối các dòng bit eneoded mà không cần mã hóa lại và không có sự gián đoạn của trình tự ảnh được giải mã là có thể.

Có mâu thuẫn giữa yêu cầu nén cao và chỉnh sửa dễ dàng. Cấu trúc mã và cú pháp không được thiết kế với mục đích chính là đơn giản hóa việc chỉnh sửa ở bất kỳ hình ảnh nào. Tuy nhiên, một số tính năng đã được bao gồm cho phép chỉnh sửa dữ liệu được mã hóa.

Biên tập dòng bits mã hóa MPEG-2 được hỗ trợ do sự phân cấp cú pháp của dòng bit video được mã hóa. Mã bắt đầu duy nhất được mã hoá với mức khác nhau theo thứ tự ưu tiên (ví dụ: trình tự video, nhóm hình ảnh, v.v.). Video có thể được mã hóa với Intra-picture/intras-slice điểm truy cập trong dòng bit. Điều này cho phép xác định, truy cập và chỉnh sửa các phần của dòng bit mà không cần phải giải mã toàn bộ đoạn video.

F.12. Trick modes

Một số Phương tiện lưu trữ kỹ thuật số (DSM) cung cấp khả năng chế độ trick modes, chẳng hạn như Fast Forward-Fast Reverse (FF/FR). Cú pháp MPFG-2 hỗ trợ tất cả các chế độ truy cập đặc biệt, tìm và quét ISO/IEC 11172-2. Chức năng này được hỗ trợ với hệ thống phân cấp cú pháp của dòng bit video cho phép xác định các phần có liên quan trong một chuỗi video. Nó có thể được hỗ trợ bởi các công cụ MPEG-2 cung cấp khả năng mở rộng dòng bit để giới hạn tốc độ bit truy cập (tức là Phân chia Dữ liệu và cấu trúc phiến chung). Phần dưới đây cung cấp một số hướng dẫn để giải mã một dòng bit do một DSM cung cấp.

Bộ giải mã được thông báo bằng cờ 1-bit (DSM_trick_mode_flag) trong tiêu đề gói tin PES. Cờ này chỉ ra rằng dòng bit được xây dựng lại bởi DSM ở chế độ lừa, và dòng bit có giá trị từ điểm cú pháp view, nhưng không hợp lệ từ ngữ nghĩa ngữ nghĩa. Khi bit này được thiết lập, một trường 8-bit (DSM_trick_modes) theo sau. Các ngữ nghĩa của DSM_trick_modes nằm trong Rec. ITU-T H.220.0 ǀ ISO/IEC 13818-1.

F.12.1. Bộ giải mã

230

TCVN xxxx : 2017

Mặc dù bộ giải mã đang giải mã gói PES mà DSM_trick_mode_flag được đặt là 1, bộ giải mã được khuyến cáo:

- Giải mã dòng bit và hiển thị theo DSM_trick_modes.

Xử lý trước

Khi bộ giải mã nhận gói tin PES mà DSM_trick_mode_flag được đặt là 1, bộ giải mã được khuyến cáo là:

- Xóa dòng bit không có trong chế độ trick_mode từ bộ đệm.

Sau xử lý

Khi bộ giải mã nhận gói tin PES mà DSM_trick_mode_flag được đặt thành 0, bộ giải mã được khuyến cáo là:

- Xóa dòng bit có trong chế độ trick_mode từ bộ đệm.

Phần Video

Trong khi bộ giải mã đang giải mã gói PES mà DSM_trick_mode_flag được đặt thành 1, bộ giải mã được khuyến cáo là:

- Bỏ giá trị vbv_delay và temporal_reference.

- Giải mã một ảnh và hiển thị nó cho đến khi hình ảnh tiếp theo được giải mã.

Các dòng bit trong chế độ trick mode có thể có một khoảng cách giữa lát cắt. Khi bộ giải mã thu được một khoảng cách giữa các lát cắt, bộ giải mã được khuyến cáo là:

- Giải mã lát cắt và hiển thị nó theo vị trí lát cắt dọc trong tiêu đề lát cắt.

- Điền vàokhoảng trống phần có đồng vị trí của hình ảnh được hiển thị lần cuối.

F.12.2. Bộ mã hóa

Bộ mã hóa được khuyến cáo là:- Mã hóa với kích thước ngắn của lát cắt với macroblocks bên trong.

- Mã hoá với sự làm tươi chu kỳ ngắn bằng hình ảnh bên trong hoặc lát cắt bên trong.

DSM

DSM được đề xuất để cung cấp các dòng bit trong trick mode với cú pháp đầy đủ.

Xử lý trước

DSM khuyến cáo là:- Hoàn thành dòng bit "bình thường" tại picture_header() và cấu trúc cú pháp cao

hơn.

Phần hệ thống

DSM khuyến cáo là:

231

TCVN xxxx : 2017

- Đặt DSM_trick_mode_flag là 1 trong một tiêu đề gói tin PES.

- Đặt DSM_trick_modes (8-bit) theo chế trick mode.

Phần Video

DSM khuyến cáo là:- Chèn một sequence_header() với các tham số giống nhau như một dòng bit bình

thường.

- Chèn một sequence_extension() với các thông số giống nhau như một dòng bit bình thường.

- Chèn một picture_header() với các thông số giống như một dòng bit bình thường, ngoại trừ nó có thể được ưu tiên hơn để cho biết hoạt động tốc độ bit biến đổi. Một cách để đạt được điều này là thiết lập vbv_delaylà FFFF (hex).

- Ghi chú - Trong hầu hết các trường hợp tham chiếu thời gian và vbv_delay sẽ bị bỏ qua trong bộ giải mã do đó DSM có thể không cần thiết lập temporal_reference và vbv_delay để sửa các giá trị.

- Kết nối các lát trong đó bao gồm các macroblocks mã hóa nội bộ. Các lát được nối nên có các vị trí theo chiều dọc theo chiều dọc tăng dần.

F.13. Phục hồi lỗi

Hầu hết các phương tiện lưu trữ kỹ thuật số và các kênh truyền thông không phải là không có lỗi. Cần phải sử dụng các lược đồ mã hoá kênh thích hợp và nằm ngoài phạm vi của Tiêu chuẩn kỹ thuật này. Tuy nhiên, cú pháp MPEG-2 hỗ trợ chế độ phục hồi lỗi liên quan đến sự mất ô trong mạng ATM và lỗi bit (bị cô lập trong cụm) trong quá trình truyền đẫn. Cấu trúc slice của lược đồ nén được xác định trong Tiêu chuẩn kỹ thuật này cho phép bộ giải mã phục hồi sau một lỗi dữ liệu còn sót lại và đồng bộ hóa lại giải mã của nó. Do đó, các lỗi bit trong dữ liệu được mã hóa sẽ gây ra lỗi trong các ảnh được giải mã sẽ bị giới hạn trong khu vực. Bộ giải mã có thể sử dụng phương pháp che giấu để bỏ qua các lỗi này. Khả năng phục hồi lỗi bao gồm sự xuống cấp theo tỷ lệ lỗi bit (BER) và khôi phục khi đối mặt với các bit video hoặc gói dữ liệu bị mất. Cần lưu ý rằng tất cả các mục có thể yêu cầu hỗ trợ bổ sung ở mức hệ thống.

Bắt đầu ở một ví dụ của một hệ thống gói cơ sở, B-ISDN với chế độ truyền không đồng bộ (ATM) của nó được xác định địa chỉ trong một số chi tiết sau. Các tuyên bố tương tự có thể được thực hiện cho các hệ thống khác, ở đó một số gói dữ liệu nhất định được bảo vệ riêng bằng cách mã hóa sửa lỗi.

ATM sử dụng các gói tin ngắn, chiều dài cố định, được gọi là các ô, bao gồm một tiêu đề 5 byte chứa thông tin định tuyến và phần mang tải của người dùng là 48 byte. Bản chất của các lỗi trên máy ATM là một số ô có thể bị mất, và phần mang tải người dùng của một số ô có thể chứa lỗi bit. Tùy thuộc vào chức năng AAL (ATM Adaptation layer), các chỉ thị về các ô bị mất và các ô có chứa lỗi bit có thể có sẵn.

Như một dấu hiệu của tác động về sự tổn thất ô trong môi trường ATM Bảng F.2 tóm tắt khoảng cách trung bình giữa tổn thất ô đối với một loạt các CLR và tốc độ bit dịch vụ dựa trên mô hình thống kê đơn giản. (Một gói dữ liệu của ô phải được giả định cho việc này.Cho phép 1 byte/cell cho các hàm AAL để lại 376 bit = 47 byte). Lưu ý, tuy nhiên, điều này tổng hợpcác ô bị bỏ qua, các cụm bị mất và thống kê theo thời gian các mục khác ngắn hơn.

232

TCVN xxxx : 2017

Tỉ số lỗi Bit (BER) tương ứng với thời gian trung bình giữa các lỗi có thể được tính toán dễ dàng cho trường hợp lỗi bit bị cô lập. BER có thể gây ra tỉ lệ lỗi tương tự xảy ra bằng cách chia theo kích thước ô mang tải, nghĩa là BER = CLR/376.

Bảng F.2 - Khoảng cách trung bình giữa tổn thất ô trong phạm vi CLR và tốc độ bit dịch vụ

Khoảng cách trung bình thời gian lỗi5 Mbit/s 10 Mbit/s 50 Mbit/s 100 Mbit/s

10-2 7.52 ms 3.76 ms 0.752 ms 0.376 ms

10-3 75.2 ms 37.6 ms 7.52 ms 3.76 ms

10-4 752 ms 376 ms 75.2 ms 37.6 ms

10-5 7.52 s 3.76 s 752 ms 376 ms

10-6 1.25 min 37.6 s 7.52 s 3.76 s

10-7 12.5 min 6.27 min 1.25 min 37.6 s

10-8 2.09 hour 1.04 hour 12.5 min 6.27 min

Các kỹ thuật giảm thiểu tác động của các ô bị mất và các hiệu ứng lỗi/mất mát khác được cung cấp để tham khảo và chỉ ra các phương pháp sử dụng các công cụ khác nhau có sẵn trong Tiêu chuẩn kỹ thuật này để cung cấp hiệu năng tốt khi có lỗi. Lưu ý rằng các kỹ thuật được mô tả có thể áp dụng trong trường hợp các gói có kích thước khác (ví dụ: LAN hoặc phương tiện lưu trữ nhất định) hoặc dữ liệu video có lỗi không được sửa chữa có các đặc điểm khác nhau, ngoài việc mất tế bào. Có thể thích hợp để xử lý với một lỗi đã biết [sửa chữa sai sót đã biết ở đâu đó trong một khối dữ liệu] như một khối dữ liệu bị mất, vì tác động của các lỗi bit không thể dự đoán được. Tuy nhiên, đây nên là một tùy chọn bộ giải mã. Thảo luận sau đây tham chiếu chung đến "các gói truyền tải" nếu phù hợp, để nhấn mạnh khả năng áp dụng cho một loạt các hệ thống truyền tải và lưu trữ. Tuy nhiên, các ví dụ cụ thể sẽ đề cập tới Tỷ lệ mất ô (CLR) bởi vì truyền tải ô được xác định hoàn toàn tại thời điểm chuẩn bị của Tiêu chuẩn kỹ thuật này.

Các kỹ thuật phục hồi lỗi được tóm tắt trong ba loại, bao gồm các phương pháp giấu lỗi khi nó đã xảy ra, và hạn chế ảnh hưởng của sự mất hoặc lỗi trong cả không gian (bên trong một ảnh) và thời gian (từ ảnh đến ảnh).

F.13.1. Khả năng che giấu

Kỹ thuật che giấu tác động của mất/lỗi một khi chúng đã xảy ra. Một số phương pháp che giấu có thể được thực hiện bằng cách sử dụng bất kỳ bit mã hóa nào, trong khi một số khác thì dựa vào bộ mã hóa để cấu trúc dữ liệu hoặc cung cấp thêm thông tin để tăng hiệu năng.

F.13.1. Giấu dự báo theo thời gian

Bộ giải mã có thể cung cấp giấu các lỗi bằng cách ước lượng dữ liệu bị mất từ dữ liệu không gian vĩnh cửu. Bộ giải mã sử dụng thông tin đã được nhận thành công để ước tính thông tin về những gì sẽ được hiển thị thay cho dữ liệu bị mất/lỗi, với giả thiết rằng các đặc điểm của ảnh tương đối tương tự trên các khối liền kề (cả trong không gian và thời gian) . Trong trường

233

TCVN xxxx : 2017

hợp theo thời gian, điều này có nghĩa là ước lượng dữ liệu bị lỗi hoặc bị mất từ các trường hoặc khung gần đó.

F.13.1.1.1. Thay thế tư khung đoán trước

Cách tiếp cận đơn giản nhất có thể là thay thế một macroblock bị mất với macroblock trong cùng một vị trí trong ảnh trước. Cách tiếp cận này phù hợp với các khu vực ảnh tương đối tĩnh, nhưng sự di chuyển của khối là điều đáng chú ý đối với các khu vực di chuyển.

"Ảnh đoán trước" phải được giải thích cẩn thận do sử dụng dự đoán hai chiều và sự khác biệt giữa trật tự ảnh và thứ tự hiển thị ảnh. Khi macroblock bị mất trong ảnh P hoặc ảnh I, nó có thể được che giấu bằng cách sao chép dữ liệu tương ứng với macroblock trong ảnh P hoặc ảnh I trước đó. Điều này đảm bảo rằng ảnh hoàn chỉnh trước khi nó được sử dụng để dự đoán thêm. Các macroblocks bị mất trong ảnh B có thể được thay thế từ ảnh được hiển thị cuối cùng, của bất kỳ loại nào, hoặc từ một ảnh I hoặc ảnh P trong tương lai được giữ trong bộ nhớ nhưng chưa được hiển thị.

F.13.1.1.2. Giấu bù chuyển động

Việc che giấu từ các ảnh lân cận có thể được cải thiện bằng cách ước lượng các vec tơ chuyển động cho macroblock bị mất, dựa trên các vector chuyển động của các macroblocks lân cận trong ảnh bị ảnh hưởng (miễn là chúng không bị mất). Điều này cải thiện sự che giấu trong các vùng ảnh di chuyển, nhưng có một vấn đề rõ ràng về lỗi trong macroblocks mà macroblocks lân cận được mã hoá trong nội bộ, bởi vì thường không có vectơ chuyển động. Hỗ trợ mã hoá để giải quyết vấn đề này được chỉ ra trong F.13.1.1.3.

Ước lượng vector chuyển động tinh vi có thể liên quan đến việc lưu trữ các vectơ chuyển động macroblock lân cận từ phía trên và dưới Macroblock bị mất, để dự đoán trước cả về phía trước lẫn phía sau (đối với ảnh B). Các vec tơ chuyển động từ phía trên và bên dưới (nếu có) sau đó có thể được tính trung bình.

Các bộ giải mã ít phức tạp hơn có thể sử dụng, ví dụ, chỉ dự đoán trước và/hoặc chỉ vector chuyển động từ macroblock phía trên macroblock bị mất. Điều này sẽ tiết kiệm được lưu trữ và nội suy.

F.13.1.1.3. Sử dụng các MV nội bộ

Kỹ thuật giấu bù chuyển động được phác hoạ trong F. 13.1.1.2 không thể được áp dụng khi các macroblocks ở trên và dưới macroblock bị mất/bị lỗi là mã hóa nội bộ, vì không có vector chuyển động liên kết với macroblock mã hóa nội bộ. Đặc biệt, trong ảnh I, kiểu che giấu này sẽ không thể thực hiện được với việc tính toán và sử dụng các vectơ chuyển động bình thường.

Quá trình mã hóa có thể được mở rộng để bao gồm các vector chuyển động cho các macroblocks bên trong. Tất nhiên, vector chuyển động và thông tin mã hoá cho một macroblock cụ thể phải được truyền riêng (ví dụ như trong các gói tin khác nhau) để vectơ chuyển động vẫn có sẵn trong trường hợp dữ liệu ảnh bị mất.

Khi "concealment_motion_vectors " = 1, các vec tơ chuyển động được truyền đi với các

234

TCVN xxxx : 2017

macroblocks bên trong, cho phép cải thiện hiệu năng che giấu của bộ giải mã. Vòng chuyển động che giấu đi kèm với một macroblock mã hoá nội mã chỉ được sử dụng để che giấu (nếu cần thiết) của macroblock nằm ngay bên dưới mã nguồn macroblock được mã hóa nội bộ.

Để đơn giản, các vectơ chuyển động che giấu liên kết với các mã không mã hoá trong Intra luôn luôn chuyển tiếp và được xem như là các khung hình chuyển động của khung trong các khung ảnh và các trường chuyển động trường trong các trường ảnh.

Do đó, các bộ mã hoá chọn tạo ra các vector chuyển động che giấu nên truyền cho một macroblock đã được mã hóa nội bộ, các vector khung hoặc trường chuyển động nên được sử dụng để che giấu (dự đoán, với dự đoán khung hoặc trường cơ sở đoán trước ) macroblock nằm ngay bên dưới macroblock được mã hóa nội bộ.

Các vec tơ chuyển động che giấu chủ yếu dành cho ảnh I và P, nhưng cú pháp cho phép sử dụng chúng trong ảnh B. Việc che giấu B-pictures không phải là quan trọng vì B-pictures không được sử dụng như dự đoán và do đó các lỗi không được phổ biến cho các ảnh khác. Do đó, có thể lãng phí để chuyển các vectơ chuyển động che giấu trong hình B.

Việc giấu các vec tơ chuyển động truyền đi với các macroblocks bên trong nằm ở hàng dưới cùng của một ảnhkhông thể được sử dụng để giấu. Tuy nhiên, nếu "conccalment_motion_vectors" = 1, giấu các vector chuyển động phải được truyền đi. Bộ mã hoá có thể sử dụng vector chuyển động (0, 0) để giảm thiểu việc mã hóa vượt quá.

Khi sử dụng giấu các vectơ chuyển động, nên có một lát cắt chứa một hàng macroblocks (hoặc nhỏ hơn), để che giấu có thể được giới hạn ở ít hơn một hàng macroblocks khi một lát cắt, hoặc một phần của một lát cắt, bị mất. Điều này có nghĩa là mất macroblocks trong hai hàng liên tiếp ít có khả năng hơn, và do đó cơ hội đạt được hiệu quả che giấu bằng cách sử dụng giấu vectơ chuyển động được cải thiện.

Chú ý - Khi "concealment_motion_vectors" = 1, Dự báo cho các Vùng chuyển động (PMV) không được đặt lại khi một macroblock bên trong được truyền, Thông thường một macroblock trong nội bộ sẽ đặt lại các PMV.

F. 13.1.2. Giấu đoán trước theo không gian

Việc tạo ra các macroblocks giấu, macroblocks đoán trước, cũng có thể bằng cách nội suy từ các macroblocks lân cận trong một ảnh (xem Phụ lục F, tài liệu tham khảo [33]). Điều này phù hợp nhất với các vùng có chuyển động cao, nơi dự báo theo thời gian không thành công, hoặc như là một phương tiện thay thế để giấu các macroblocks bên trong khi giấu các vec tơ chuyển động (xem F.13.1.1.3) không có sẵn. Nó cũng có thể đặc biệt hữu ích cho việc mất ô sau khi thay đổi cảnh.

Có một số cách tiếp cận có thể đối với nội suy theo không gian, và nó có thể được thực hiện trong miền không gian hoặc DCT, nhưng thông thường nó chỉ khả thi và hữu ích để dự đoán các tính năng rộng của một macroblocks bị mất, chẳng hạn như hệ số DC và có lẽ là hệ số AC thấp nhất. Đoán trước chi tiết theo không gian (tần số cao) có thể sẽ không thành công và dầu sao chăng nữa có ít giá trị trong hình ảnh chuyển động nhanh.

Việc giấu các macroblock đoán trước theo không gian cũng có thể hữu ích khi kết hợp với

235

TCVN xxxx : 2017

các phương pháp mã hóa theo lớp (tức là Phân vùng dữ liệu hoặc khả năng mở rộng SNR, xem F. 13.1.3). Nếu trong trường hợp mất ô một số hệ số DCT trong một macroblock được phục hồi từ lớp dưới, có thể sử dụng tất cả các thông tin có sẵn (các hệ số DCT phục hồi trong cùng một macroblock từ lớp thấp hơn và tất cả các hệ số DCT nhận được trong các macroblocks liền kề) để giấu lỗi. Đây là đặc biệt sử dụng điền nếu lớp dưới chỉ có hệ số DC do các ràng buộc về băng thông.

F.13.1.3. Phânl mã hóa để tạo điều kiện che giấu

Có thể hỗ trợ quá trình giấu thêm bằng cách sắp xếp các thông tin video được mã hoá để có thể nhận được nhiều thông tin quan trọng nhất. Việc mất thông tin ít quan trọng hơn có thể được giấu hiệu quả hơn. Cách tiếp cận này có thể thu được từ việc sử dụng phương tiện truyền tải hoặc thiết bị lưu trữ với các mức độ ưu tiên khác nhau (như truyền dẫn dựa trên ô được kiểm soát bởi ưu tiên trong B-ISDN hoặc ở đó có các biện pháp bảo vệ lỗi hoặc hiệu chỉnh khác nhau trên các kênh khác nhau). Các thành phần được tạo ra bởi quá trình mã hóa có thể được đặt trong một mức độ quan trọng theo tác động của việc mất trên hình ảnh tái tạo. Bằng cách chỉ ra mức độ ưu tiên của các thành phần dòng bit và xử lý các thành phần riêng lẻ có tầm quan trọng đáng kể, có thể thực hiện hiệu suất giấu lỗi tốt hơn có thể xảy ra.

Các chiến lược có sẵn để sản xuất dòng bits được sắp xếp theo thứ bậc, hoặc các lớp, bao gồm:

Phân vùng dữ liệu - Dữ liệu macroblock được mã hóa được phân chia thành nhiều lớp sao cho phân vùng zero chứa địa chỉ và thông tin điều khiển và các hệ số DCT thấp hơn, trong khi phân vùng chứa các hệ số DCT tần số cao.

Khả năng mở rộng SNR - Hai tập hợp hệ số là dc-quantized và sau đó cộng lại với nhau tại máy thu trước khi giải mã. Một tập hợp các hệ số có thể là sàng lọc lỗi lượng tử của khác, nhưng các kết hợp khác (bao gồm cả việc mô phỏng phân vùng dữ liệu) là có thể.

Khả năng mở rộng không gian - Lớp thấp hơn có thể được mã hóa mà không cần quan tâm đến lớp nâng cấp, và có thể sử dụng các phương pháp mã hóa tiêu chuẩn khác (ISO / 1EC 11172-2, vv). Lớp nâng cấp chứa lỗi dự đoán được mã hoá từ một dự đoán dựa trên lớp thấp hơn.

Khả năng mở rộng theo thời gian - Lớp nâng cao xác định các hình ảnh bổ sung, khi được ghép lại với lớp cơ sở, cung cấp một chuỗi hình ảnh kết hợp với tỷ lệ hình ảnh lớn hơn.

Những chiến lược này tạo ra các lớp, khi được thêm vào dần dần, tạo ra chất lượng ngày càng tăng của chuỗi tái tạo. Mặc dù một số kỹ thuật mã hóa mã nguồn có thể dẫn đến tăng tốc độ bit so với hệ thống không phân lớp, hiệu suất của các hệ thống phân lớp, khi bị lỗi kênh, có thể lớn hơn.

Xem xét sự hồi phục lỗ iriêng lẻ, các lớp được sắp xếp theo thứ tự được xử lý với chất lượng do đó một số chức năng (chẳng hạn như chất lượng hình ảnh cho một tỷ lệ bit tổng số nhất định) được tối ưu hóa. Các thành phần của dòng bit có thể được xử lý khác ở một hoặc nhiều địa điểm sau:

Bộ mã hóa - Có thể sử dụng mã hóa kênh khác.

236

TCVN xxxx : 2017

Kênh - Kênh có thể cung cấp xác suất xác suất mất ô hoặc gói tin khác nhau hoặc các đặc tính lỗi cho các thành phần dòng bit khác nhau.

Bộ giải mã - Lỗi che giấu có thể được thực hiện khác nhau trong mỗi dòng bit.

F.13.1.3.1. Sử dụng phân vùng dữ liệu

Phân vùng dữ liệu cho phép phân chia dữ liệu macroblock đơn giản thành hai lớp. Con trỏ Điểm Tách Ưu tiên (PBP) xác định nội dung của mỗi lớp. Thông thường, phân vùng dữ liệu 0 chứa địa chỉ và thông tin điều khiển và các hệ số DCT tần số thấp, trong khi phân vùng dữ liệu 1 chứa các hệ số DCT tần số cao.

Tại bộ mã hóa, giá trị của con trỏ PBP có thể khác nhau đối với từng lát cắt để phân bố các bit giữa hai lớp có thể được kiểm soát (ví dụ: duy trì hằng số). Sự phân bố có thể khác nhau đối với khung I-, P- và B. Việc quản lý tốc độ giữa các lớp có thể có nghĩa là, đối với một số macroblocks, phân vùng dữ liệu 0 không chứa các hệ số DCT hoặc vectơ chuyển động.

Khả năng chịu lỗi tốt có thể đạt được nếu lỗi kênh được phân phối sao cho phân vùng dữ liệu 1 nhận được hầu hết các lỗi.

Giả sử có thể phát hiện lỗi ở bộ giải mã, do đó hành động có thể được thực hiện để hiển thị dữ liệu bị lỗi. Đối với phân vùng dữ liệu 1, dữ liệu bị lỗi chỉ đơn giản là không hiển thị (ví dụ: chỉ phân vùng dữ liệu 0 được sử dụng). Mất hoặc lỗi trong phân vùng dữ liệu 0 nên được giảm thiểu thông qua việc sử dụng truyền dẫn độ tin cậy cao. Các hành động che giấu bộ giải mã cũng có thể là cần thiết.

F.13.1.3.2. Sử dụng mã hoá có thể mở rộng SNR

Mã hóa khả năng mở rộng SNR cung cấp hai lớp với độ phân giải không gian giống nhau nhưng chất lượng hình ảnh khác nhau tùy thuộc vào việc một hoặc cả hai lớp được giải mã. Kỹ thuật này chủ yếu nhằm cung cấp một lớp chất lượng thấp hơn có thể sử dụng được ngay cả khi không có lớp nâng cao. Tuy nhiên, nó cũng cung cấp khả năng phục hồi lỗi tốt nếu các lỗi có thể được chủ yếu giới hạn trong lớp tăng cường.

Trong trường hợp có lỗi trong lớp tăng cường, lớp dưới có thể được sử dụng đơn lẻ cho vùng ảnh bị ảnh hưởng. Đặc biệt là trong trường hợp lỗi thường xuyên, việc mất theo thời gian hoặc không có sẵn thường xuyên của lớp tăng cường việc giấu này là rất hiệu quả, vì tín hiệu được hiển thị có thể được thực hiện tương đối tự do của sự biến dạng không tuyến tính như bị chặn hoặc chuyển động bị giật.

Nếu lớp nâng cấp thường xuyên không sẵn có và do đó chỉ lớp dưới được giải mã, sự trôi nhỏ có thể xảy ra trong trường hợp chỉ có một vòng lặp dự đoán MC được thực hiện trong bộ mã hóa. Tuy nhiên, sự trôi này có thể không nhìn thấy được trong hầu hết các cấu hình (ví dụ: M = 3, N = 12 thường cung cấp sự điều chỉnh thường xuyên đầy đủ).

Lớp dưới của một hệ thống có khả năng mở rộng SNR rất phù hợp để che giấu trong trường hợp tỷ lệ lỗi rất cao, mất tín hiệu tạm thời hoặc thường xuyên của tín hiệu lớp tăng cường. Tuy nhiên, chất lượng lớp nâng cao trong trường hợp không có lỗi không đạt được của

237

TCVN xxxx : 2017

một băng tần phụ như lược đồ phân lớp (ví dụ: phân vùng dữ liệu).

F.13.1.3.3. Sử dụng mã hóa không gian có thể mở rộng

Mã hoá khả năng mở rộng không gian cho phép lớp thấp hơn được mã hóa mà không quan tâm đến lớp tăng cường và có thể sử dụng các phương pháp mã hoá tiêu chuẩn khác (ISO/IEC 11172-2, ...). Lớp tăng cường chứa lỗi dự đoán đã được mã hoá từ dự đoán dựa trên lớp thấp hơn. Trong trường hợp có lỗi trong lớp tăng cường, lớp dưới có thể được sử dụng trực tiếp làm thông tin che giấu cho vùng ảnh bị ảnh hưởng. Đặc biệt là trong trường hợp lỗi thường xuyên hoặc mất lớp tăng cường theo thời gian, giấu dữ liệu này tương đối tự do của sự biến dạng không tuyến tính như bị chặn (có thể phát sinh nếu các hệ số DCT tần số cao hoàn toàn không có mặt ở tầng dưới) hoặc sự giật của chuyển động (nếu thông tin chuyển động được bỏ qua từ lớp ưu tiên cao).

Trong trường hợp không có lỗi, tầng thấp hơn được sử dụng như là một nguồn dự đoán bổ sung trong một cách thức cải tiến macroblock để cải thiện hiệu suất mã hóa cấp tăng cường. Do đó, dòng bit lớp tăng cường bao gồm các lỗi dự báo thời gian hoặc lớp dưới đượclượng tử hóa.

Mã hóa khả năng mở rộng không gian cung cấp một lớp thấp hơn rất phù hợp để che giấu trong trường hợp tỷ lệ lỗi cao hoặc mất theo thời gian của lớp tăng cường. Tuy nhiên, chất lượng của hình ảnh được tăng cường khi cả hai lớp sẽ không có sẵn, nói chung là tốt như các phương pháp tiếp cận mã hoá khác.

F.13.1.3.4. Sử dụng mã hóa mở rộng theo thời gian

Khả năng mở rộng thời gian là một kỹ thuật mã hóa cho phép phân lớp khung hình. Độ phân giải không gian của các khung trong mỗi lớp cũng giống nhau nhưng tỷ lệ thời gian của mỗi lớp lại thấp hơn so với nguồn: tuy nhiên tỷ lệ thời gian kết hợp của hai lớp dẫn đến tỷ lệ thời gian trọn vẹn của nguồn. Trong trường hợp lỗi trong lớp tăng cường, lớp cơ sở của độ phân giải không gian đầy đủ có thể dễ dàng sử dụng để che giấu. Đặc biệt là trong trường hợp lỗi thường xuyên hoặc mất tạm thời của lớp tăng cường, lớp cơ sở cung cấp tài sản che giấu tốt.

Trong một số ứng dụng viễn thông, mức độ phục hồi lỗi có thể đạt được với khả năng mở rộng theo thời gian bằng cách mã hóa lớp cơ sở bằng cách sử dụng cùng một độ phân giải không gian nhưng chỉ bằng một nửa độ phân giải thời gian của nguồn; các khung hình còn lại tương ứng với nửa còn lại của độ phân giải thời gian được mã hóa trong lớp tăng cường. Thông thường, dữ liệu lớp tăng cường có thể được gán mức độ ưu tiên thấp hơn và khi bị mất, lớp cơ sở được giải mã khung có thể được sử dụng để che giấu bởi sự lặp lại của khung. Loại che giấu này chỉ dẫn đến sự mất tạm thời của độ phân giải thời gian toàn bộ trong khi duy trì chất lượng không gian đầy đủ và độ phân giải không gian đầy đủ.

Trong các ứng dụng HDTV như những người sử dụng định dạng video độ phân giải theo thời gian cao như là nguồn, mức độ phục hồi lỗi có thể đạt được với khả năng mở rộng theo thời gian. Một ứng dụng như vậy được dự kiến yêu cầu 2 lớp, một lớp cơ sở và một lớp tăng cường, trong đó mỗi quá trình xử lý cùng một hình ảnh định dạng (hoặc là cả hai tiến trình hoặc là cả hai xen kẽ) nhưng ở một nửa tốc đọ theo thời gian. Việc ghép kênh theo thời gian của các

238

TCVN xxxx : 2017

lớp cơ sở và các lớp tăng cường không phân biệt các định dạng đã chọn của chúng luôn cho kết quả độ phân giải theo thời gian lũy tiến của nguồn. Trong truyền dẫn HDTV, nếu lớp tăng cường ưu tiên thấp hơn bị hỏng, lớp cơ sở có thể được sử dụng che giấu hoặc trực tiếp, như trong trường hợp lớp định dạng cải tiến hoặc sau khi đảo chiều tính chẵn lẻ của các trường cho lớp cơ sở định dạng xen kẽ.

Thông thường, dữ liệu lớp tăng cường có thể được gán mức độ ưu tiên thấp hơn và khi bị mất, lớp cơ sở được giải mã khung có thể được sử dụng để che giấu bởi việc lặp lại khung hoặc trung bình khung. Loại che giấu này chỉ dẫn đến sự mất tạm thời không thể phân biệt được trong độ phân giải thời gian trong khi vẫn đảm bảo chất lượng không gian đầy đủ và độ phân giải không gian đầy đủ.

F.13.2. Định vị hoá không gian

Định vị hoá không gian bao gồm các phương pháp nhằm giảm thiểu mức độ mà các lỗi truyền trong một ảnh, bằng cách cung cấp sớm tái đồng bộ hoá của các yếu tố trong dòng bit được mã hóa khác nhau giữa các macroblocks.

Các lỗi bit riêng biệt có thể được phát hiện thông qua các từ mã không hợp lệ và do đó, một nhà thiết kế bộ giải mã có thể chọn để cho phép một chuỗi bị lỗi được giải mã. Tuy nhiên, ảnh hưởng trên hình ảnh rất khó tiên đoán (có thể được tạo ra hợp lệ. không chính xác, các từ mã) có thể điều chỉnh lỗi thông qua việc giấu toàn bộ phần bị ảnh hưởng ngay cả khi chỉ có một bit được biết đến lỗi ở đâu đó trong một khối dữ liệu.

Khi các lỗi liên tiếp xảy ra liên tục (ví dụ như mất gói hoặc ô), hầu như chỉ có một lựa chọn là loại bỏ dữ liệu cho đến khi điểm tái đồng bộ hoá tiếp theo được định vị (một mã bắt đầu ở lát cắt tiếp theo hoặc tiêu đề hình ảnh). Bằng cách cung cấp nhiều điểm tái đồng bộ hoá hơn, diện tích màn hình bị ảnh hưởng bởi việc mất hoặc lỗi có thể được giảm, từ đó giảm nhu cầu về các kỹ thuật che giấu và làm cho các lỗi ít nhìn thấy hơn chi phí mã hóa hiệu quả. Vì vậy, định vị hoá không gian của các lỗi phụ thuộc vào việc kiểm soát kích thước của lát cắt vì đây là đơn vị mã hoá nhỏ nhất có điểm tái đồng bộ hoá (mã bắt đầu).

F.13.2.1. Lát nhỏ

Phương pháp cơ bản nhất để đạt được định vị hoá không gian của các lỗi là giảm số lượng macroblocks (cố định) trong một lát cắt. Tần số gia tăng của các điểm tái đồng bộ hóa sẽ làm giảm diện tích hình ảnh bị ảnh hưởng trong trường hợp mất mát. Nó có hiệu quả trong bất kỳ phương tiện vận tải hoặc phương tiện lưu trữ, và trong bất kỳ hồ sơ vì cấu trúc lát cắt luôn luôn có trong đoạn video mã MPEG.

Phương pháp này làm giảm hiệu quả mã hóa do sự gia tăng thông tin vượt quá. Mức tổn thất khoảng 3% đối với 11 Macroblocks/lát cắt và 12% cho 4 Macroblocks/lát cắt dựa trên Định dạng ITU-R BT.601 ở 4 Mbit/s, (tỷ lệ phần trăm được tính tương ứng với hệ thống sử dụng 44 Macroblocks hoặc một ảnh chiều rộng, mỗilát cắt). Hiệu quả làm giảm chất lượng hình ảnh xuống đến khoảng 1 dB với 4 Macroblocks trên mỗi lát cắt và 0,2 dB với 11 Macroblocks trên mỗi lát cắt mà không có sai sót ở 4 Mbit/s. Tuy nhiên, phương pháp thực hiện khoảng 1 đến 5 dB tốt hơn ở CLR = 10 tùy thuộc vào phương pháp giấu được sử dụng (thay thế macroblock đơn giản hoặc giấu bù chuyển động).

239

TCVN xxxx : 2017

Từ quan điểm nhận thức về chất lượng hình ảnh, sự nổi bật của phương pháp này nói chung phụ thuộc vào kích thước tương đối của kích thước và hình ảnh. Vì vậy, kích thước lát cắt nên được quyết định bằng cách xem xét kích thước hình ảnh (trong macroblocks) và sự thoả hiệp giữa hiệu quả mã hóa và suy thoái thị giác do lỗi.

F.13.2.2. Kích thước lát cắt tương thích

Có một sự khác biệt đáng kể về số lượng bit cần thiết để mã một lát cắt hình ảnh, tùy thuộc vào chế độ mã hóa, hoạt động của hình ảnh, v.v. Nếu lát cắt chỉ chứa một vài macroblocks, có thể là một gói truyền tải, thậm chí một gói ngắn hoặc ô, có thể chứa một vài lát. Cung cấp nhiều điểm tái đồng bộ hóa trong cùng một gói truyền tải không có mục đích. Một vấn đề khác với cách tiếp cận lát cắt đơn giản là vì không có bản báo cáo nào được lấy về cấu trúc gói truyền tải, gói tin truyền tải hợp lệ đầu tiên sau khi mất có thể chứa hầu hết thông tin cho một lát cắt, nhưng không thể sử dụng được vì mã bắt đầu bị mất .

Sự cải tiến về phương pháp lát cắt nhỏ có thể là sử dụng các kích thước lát cắt thích nghi. Khi bộ mã hoá sản xuất dòng bit, nó theo dõi các nội dung dữ liệu bên trong các gói truyền tải. Sự bắt đầu của một mảnh được đặt ở cơ hội đầu tiên trong mỗi gói truyền tải (hoặc trong mỗi giây, thứ ba, ...). Cách tiếp cận này có thể đạt được về cùng một định vị hoá không gian của các lỗi như là kích thước nhỏ, kích thước lát cắt cố định, nhưng với một hiệu quả lớn hơn.

Tuy nhiên, phương pháp này chỉ cung cấp cho một lợi thế cho truyền dẫn dựa trên tế bào hoặc gói, hoặc nơi phát hiện lỗi xảy ra trên một khối lượng lớn dữ liệu. Các điểm đồng bộ hóa thường xuyên của định vị hoá lát nhỏ chỉ là lãng phí nếu có nhiều hơn một bị mất trong trường hợp có lỗi. Nếu các lỗi bit bị cô lập ảnh hưởng đến chỉ một lát cắt nào đó, thì không có lợi ích gì trong việc điều chỉnh kích thước lát cắt.

Hơn nữa, kỹ thuật kích thước lát cắt tương thích đòi hỏi một kết nối mật thiết giữa bộ mã hóa và gói tin, để cho phép một lát cắt mới cho một gói hoặc một ô mới. Do đó, nó có thể không thích hợp đối với một số ứng dụng (ví dụ như video được lưu trữ được phân phối theo nhiều cách) vì chỉ có một cấu trúc gói truyền tải được giả định trong quá trình mã hóa.

F.13.3.1. Ảnh bên trong

Bằng cách sử dụng hình ảnh bên trong một lỗi duy nhất sẽ không ở trong hình ảnh được giải mã lâu hơn (N + M - 1) hình ảnh nếu mọi hình ảnh thứ N được mã hóa trong và (M-1) ảnh B được hiển thị trước mỗi ảnh I.

Trong khi các hình ảnh bên trong, thường được sử dụng như là "neo - anchors" để đồng bộ hoá phần giải mã video qua một dãy, rất hữu ích cho việc định vị theo thời gian, nên cẩn thận khi thêm các hình ảnh bên trong (tức là giảm N) để phục hồi lỗi. Hình ảnh nội bộ đòi hỏi một số lượng lớn các bit để mã hóa, chiếm một tỷ lệ tương đối lớn của dòng bit được mã hóa, và như vậy, có nhiều khả năng bị ảnh hưởng bởi bị mất hoặc lỗi của chính chúng.

F.13.3.2. Lát cắt bên trong

Để tránh sự chậm trễ bổ sung gây ra bởi hình ảnh bên trong, một số ứng dụng yêu cầu độ trễ thấp có thể muốn cập nhật hình ảnh bằng cách mã hóa chỉ các phần của hình ảnh bên

240

TCVN xxxx : 2017

trong. Điều này có thể cung cấp cùng một loại lỗi phục hồi như hình ảnh bên trong. Ví dụ giả sử rằng một số lát liên tục của mỗi ảnh từ trên xuống dưới được mã hóa nội bộ để toàn bộ ảnh được cập nhật mỗi ảnh P. Ba khía cạnh của loại cập nhật này nên được lưu ý:

Trong khi một lỗi vị trí của cảnh sẽ thường bị xóa trong các ảnh P (với thời gian trung bình khoảng P/2), có thể là bù chuyển động sẽ cho phép xáo trộn để bỏ qua làm tươi nội bộ và nó có thể tiếp tục dài như ảnh 2P.

Để đảm bảo rằng các lỗi không truyền lan vào vùng được cập nhật của ảnh, các hạn chế có thể được đặt trên vectơ chuyển động, hạn chế các thành phần vectơ dọc để đảm bảo rằng các tiên đoán không được làm từ phần "cũ nhất" của hình ảnh.

Hiệu ứng thị giác của lỗi làm sạch có thể tương tự như nước làm sạch gạt nước kính chắn gió. hiệu ứng gạt nước kính chắn gió này có thể trở nên đáng chú ý trong một số trường hợp trong dãy lỗi tự do, trừ khi cơ chế kiểm soát tỷ lệ đảm bảo rằng chất lượng của các lát cắt nội bộ gần đó của macroblocks không phải nội bộ xung quanh.

F.13.4. Tổng kết

Bảng F.3 Tổng kết các kỹ thuật phục hồi lỗi ở trên, với một hướng dẫn để áp dụng chúng.

Bảng F.3 - Tổng kết kỹ thuật giấu lỗi

Category kỹ thuật Profile/Ứng dụng có thể

Giấu Dự đoán theo thời gian Thay thế từ ảnh trước

Bất kỳ profile nào. Hầu hết phù hợp với hình ảnh tĩnh

Dự đoán theo thời gian - Bù chuyển động

Bất kỳ profile nào. Sự lựa chọn tinh tế trong tính toán vector chuyển động.

Dự đoán theo thời gian Sử dụng giấu MVs

Bất kỳ profile nào. nhưng tính toán Intra MVs là một lựa chọn bộ mã hóa.

Dự đoán theo không gianBất kỳ profile nào. Not suitable for static, complex pictures

Phân vùng dữ liệu Hiện không được sử dụng trong profile. nhưng có thể được thêm vào như post/pre-processing Tối thiểu vượt quá và phức tạp. Lớp thấp hơn có thể không cung cấp các hình ảnh có thể sử dụng bởi chính nó

Có thể mở rộng SNRCó thể mở rộng SNR, Có thể mở rộng theo không gian, HIGH profiles. Thích hợp với tỷ lệ lỗi rất cao hoặc không có sẵn theo thời gian của lớp tăng cường. Tương đối đơn giản để thực hiện.

Có thể mở rộng theo không gian

Có thể mở rộng theo không gian và HIGH profiles. Thích hợp với tỷ lệ lỗi rất cao hoặc không có sẵn theo thời gian của lớp tăng cường.

Có thể mở rộng theo thời gian

Hiện không được sử dụng trong profile. Thích hợp với tỷ lệ lỗi rất cao hoặc không có sẵn theo thời gian của lớp tăng cường.

Định vị hóa theo không gian Các lát cắt nhỏ Bất kỳ profile nào.

241

TCVN xxxx : 2017

Cáclát cắt phù hợp Bất kỳ profile nào. nhưng đòi hỏi biết về đặc điểm truyền tải khi kích thước gói tin được quyết định.

Định vị hóa theo thời gian Các ảnh bên trong Bất kỳ profile nào. nhưng có ảnh hưởng trễ.

Các lát cắtbên trongBất kỳ hồ sơ, nhưng lỗi có thể tồn tại lâu hơn đối với phương pháp hình ảnh trong Intra.

Không thể cung cấp một chỉ dẫn ngắn gọn về hiệu suất chống lại lỗi, bởi vì các đánh giá nhất thiết phải là chủ quan và phụ thuộc vào ứng dụng, và như vậy nên được coi là không có gì nhiều hơn chỉ dẫn. Cũng đúng là một vài cách tiếp cận khác nhau để phục hồi lỗi có thể được sử dụng kết hợp. Tuy nhiên, các mô tả sau đây được cung cấp như một số hướng dẫn để thực hiện. Đó là kết quả của các thử nghiệm tổn thất ô, chỉ nhìn vào việc truyền tải thông tin video trên ô gốc.

Một sự thay thế macroblock đơn giản từ một khung trước kết hợp với phương pháp lát cắt nhỏ (4 macroblocks/slice) sẽ cung cấp chất lượng ảnh phù hợp cho hầu hết các trình tự với tỷ lệ lỗi tương đối thấp khoảng CLR = 10-5 (trong một tham chiếu 4 Mbit/s, hệ thống Main Profile, Main Level).

Bao gồm việc giấu tinh vi bù chuyển động phức tạp (với việc dò các vector chuyển động đầy đủ và thời gian cho các macroblocks bị mất và giấu các tổn thất trong ảnh P sử dụng cập nhật lát cắt, tức là N =không xác định, M = 1) cung cấp chất lượng ảnh phù hợp tại CLR = 3 (một lần nữa, trong một tham chiếu 4 Mbit/s, hệ thống Main Profile, Main Level).

Hoạt động trong các môi trường có tổn thất lớn hơn có thể yêu cầu sử dụng một trong các phương pháp mã hóa lớp. Với sự bảo vệ đầy đủ các thông tin ưu tiên cao, các kế hoạch này có thể cung cấp hiệu suất đầy đủ khi đối mặt với CLRs cao đến 10-2 hoặc thậm chí 10-1. Phân vùng dữ liệu, được thực hiện như một chức năng xử lý sau cho một cấu hình chính 4 Mbit/s, hệ thống Main Profile, Main Level, với 50% tỷ lệ được phân bổ cho mỗi phân vùng và không bị mất trong lớp cơ sở, đã được trình bày trong một ví dụ để cho khoảng 0.5 dB bị mất trong SNR tại một CLR bằng 10-3 , khoảng 1,5 dB bị mất tại 10-2, và hầu như không có sự xuống cấp có thể nhìn thấy trong cả hai trường hợp.

Do có nhiều cách tiếp cận mã hóa khác nhau có thể, một số nhận xét chung có thể hữu ích. Nhìn chung, người ta không mong đợi rằng việc đưa vào các phương pháp mã hóa phức tạp nhất có thể làhợp lý hoàn toàn dựa trên cơ sở khả năng phục hồi lỗi. Thay vào đó, chúng có thể được sử dụng để phục hồi lỗi nếu chúng được yêu cầu phải thỏa mãn các yêu cầu hệ thống khác. Phân vùng dữ liệu rất đơn giản để thực hiện và có khả năng cung cấp khả năng phục hồi lỗi gần như giống như bất kỳ phương pháp nào khác ngoại trừ trong trường hợp tỷ lệ lỗi rất cao (> 10% bị mất) hoặc nơi mà lớp tăng cường có thể bị mất hoàn toàn. Khả năng mở rộng SNR phức tạp hơn một chút và có hiệu quả thấp hơn phân vùng dữ liệu, nhưng dễ dàng tạo ra các lớp dưới có chất lượng sử dụng được khi không có lớp nâng cấp. Khả năng mở rộng không gian trở nên phức tạp hơn một lần nữa, nhưng cung cấp chất lượng hình ảnh tốt hơn ở mức thấp (2 lớp).

F.14. Kết nối các chuỗi

Kết nối các chuỗi xảy ra khi một dòng cơ sở có chứa một chuỗi kết thúc bằng một

242

TCVN xxxx : 2017

sequence_end_code được theo sau bởi một chuỗi khác bắt đầu bằng một sequence_start_code. Bất kỳ tham số bao gồm nhưng không giới hạn profile, mức, kích thước bộ đệm VBV, tốc độ khung, kích thước ngang, kích thước dọc hoặc tốc độ bit, không được thay đổi trong một chuỗi đơn lẻ có thể thay đổi từ chuỗi sang chuỗi.

cách xử lý của quá trình giải mã và quá trình hiển thị cho kết nối các chuỗi không thuộc phạm vi của Tiêu chuẩn kỹ thuật này. Một ứng dụng cần sử dụng kết nối các chuỗi phải được đảm bảo bởi sự sắp xếp riêng mà bộ giải mã có thể giải mã và trình diễn kết nối các chuỗi.

Các ứng dụng phải đảm bảo rằng bộ giải mã sẽ có cách xử lý chấp nhận được khi các thông số thay đổi. Ví dụ: thay đổi đối với

Kích thước khung; Tốc độ khung; Trường chẵn lẻ của trường hiển thị đầu tiên của dãy mới so với trường chẵn lẻ của

trường hiển thị cuối cùng của dãy trước; Trạng thái bộ đệm.

243

TCVN xxxx : 2017

Phụ lục G - Thủ tục đăng ký

(Tham khảo)

G.1. Thủ tục yêu cầu đăng ký định danh (RID)Người yêu cầu đăng ký định danh RID sẽ nộp đơn cho Cơ quan đăng ký. Mẫu đăng ký sẽ

được cung cấp từ Thông tin Cơ quan đăng ký mà người yêu cầu được cung cấp nêu trong G.3. Các công ty và tổ chức có đủ điều kiện để áp dụng.G.2. Trách nhiệm của Cơ quan đăng ký

Trách nhiệm chính của Cơ quan đăng ký quản trị việc đăng ký dữ liệu cá nhân cho các số liệu xác định được nêu trong phụ lục này: một số trách nhiệm khác có thể được tìm thấy trong Chỉ thị JTC 1. Cơ quan Đăng ký sẽ:

a) thực hiện một thủ tục đăng ký để xin một RID duy nhất phù hợp với các Chỉ thị của JTC 1:

b) nhận và xử lý các đơn xin cấp số nhận dạng từ các nhà cung cấp ứng dụng:c) Xác định các đơn đã nhận được phù hợp với quy trình đăng ký này và thông báo cho

người yêu cầu trong vòng 30 ngày kể từ ngày nhận được đơn của RID được giao;d) thông báo cho các nhà cung cấp dịch vụ ứng dụng mà yêu cầu của họ bị từ chối bằng

văn bản trong vòng 30 ngày kể từ ngày nhận được đơn và xem xét lại việc nộp lại đơn;c) duy trì một sổ đăng ký chính xác của các số nhận diện được phân bổ. Các sửa đổi đối

với các đặc điểm định dạng sẽ được Cơ quan đăng ký chấp nhận và duy trì:f) làm cho nội dung của sổ đăng ký này có sẵn theo yêu cầu của National Bothe of JTC 1 là

thành viên của ISO hoặc IUC. cho các tổ chức liên lạc của ISO hoặc IFC và cho bất kỳ bên liên quan nào:

g) duy trì một cơ sở dữ liệu các mẫu yêu cầu RID, được cấp và từ chối. Các bên tìm kiếm thông tin kỹ thuật về định dạng dữ liệu cá nhân có RID sẽ có quyền truy cập vào các thông tin đó là cơ sở dữ liệu duy trì bởi Cơ quan đăng ký;

h) báo cáo các hoạt động của mình cho JTC 1. ITTF. và Ban Thư ký SC 29, hoặc các người được uỷ quyền tương ứng, hàng năm.

G.3.Thông tin của Cơ quan đăng ký Tên tổ chức:Địa chỉ:Điện thoại:Fax:

G.4.Trách nhiệm của các bên yêu cầu RID Bên yêu cầu RID với mục đích nhận dạng bản quyền sẽ:

a) áp dụng, sử dụng mẫu đơn và thủ tục do Cơ quan đăng ký cung cấp;b) bao gồm mô tả mục đích của dòng bit đã đăng ký, và các chi tiết kỹ thuật cần thiết như

được xác định trong mẫu đơn;

244

TCVN xxxx : 2017

c) cung cấp thông tin liên lạc mô tả cách mô tả đầy đủ có thể thu được trên cơ sở không phân biệt;

d) tiến hành xác định mục đích sử dụng RID được cấp trong khung thời gian hợp lý;c) duy trì hồ sơ vĩnh viễn của mẫu đơn và thông báo nhận được từ Cơ quan đăng ký của

một RID được cấp.

G.5.Thủ tục khiếu nại đối với các đơn bị tư chối Nhóm Quản lý Đăng ký được thành lập để có thẩm quyền đối với khiếu nại từ chối yêu cầu RID. RMG sẽ có một thành viên được định danh bởi thành viên P và L của ủy ban kỹ thuật ISO chịu trách nhiệm về Tiêu chuẩn kỹ thuật này. Nó sẽ có một người triệu tập và ban thư ký được đề cử từ các thành viên của nó. Cơ quan đăng ký có quyền đề cử một thành viên quan sát không bỏ phiếu. Trách nhiệm của RMG là:

a) xem xét và hành động trên tất cả các khiếu nại trong khung thời gian hợp lý;b) thông báo bằng văn bản cho các tổ chức có khiếu nại để xem xét lại đơn kiện của mình

về việc RMG giải quyết vấn đề:c) rà soát lại báo cáo thường niên của Tóm tắt các hoạt động đăng ký;d) cung cấp cho các cơ quan thành viên của ISO và các Uỷ ban Quốc gia của IEC thông

tin liên quan đến phạm vi hoạt động của Cơ quan đăng ký.

245

TCVN xxxx : 2017

Phụ lục H - Đơn đăng

ký(Tham khảo)

H.1.Thông tin của tổ chức yêu cầu RIDTên tổ chức: Địa chỉ:Điện thoại:Số fax:e-mail:Telex:

H.2.Bản công bố về quyết định áp dụng RID được ấn địnhMiền ứng dụng RID: sử dụng hướng dẫn được cung cấp bởi Cơ quan đăng ký.

H.3. Ngày quyết định thực hiện RID

H.4.Đại diện ủy quyền

Tên:Chức vụ:Địa chỉ:Chữ ký:

Tệp đính kèm 1 - Đính kèm các chi tiết kỹ thuật của định dạng dữ liệu đã đăng ký.

Tệp đính kèm 2 - Đính kèm các thông báo các thủ tục khiếu nại cho đơn đăng ký bị từ chối.

H.5. Mẫu sử dụng chính thức của Cơ quan đăng kýĐăng ký bị từ chối:……………………………………………………………………………………….

Lý do từ chối đơn:

246

TCVN xxxx : 2017

Phụ lục I - Cơ quan Đăng ký - Sơ đồ cơ cấu hành chính

(Tham khảo)

Ví dụ:

Tất cả các bản quyền đều được đăng ký bởi Cơ quan đăng ký, duy nhất cho các bản quyền do các tiêu chuẩn của ISO. Mỗi tổ chức phân bổ copyright_numbers, yêu cầu một bản xác định bản quyền cụ thể từ Cơ quan đăng ký, ví dụ.. Staatsbibliothek Preussischer Kulturbesitz được chỉ định bởi ISO để quản lý I.S.B.N., đòi hỏi yêu cầu một copyright_identifier cụ thể từ RA. để đánh số sách.

247

TCVN xxxx : 2017

Phụ lục J - Kết quả kiểm tra Profile 4:2:2

(Tham khảo)

J.1. Giới thiệu Phụ lục này cung cấp hướng dẫn cho người dùng về tính khả thi của sơ đồ 4:2:2 ở Main

Level đối với các ứng dụng có thể yêu cầu: Chất lượng cao hơn so với Main Profile ở Main Level; Độ phân giải màu tốt hơn Main Profile ở Main Level; Xử lý sau khi nén và giải nén; Nhiều thế hệ của nén và giải nén; Nhóm ảnh ngắn (GOP) cho khả năng chỉnh sửa; Khả năng truyền tất cả các video hoạt động; Khả năng truyền thông tin khoảng cách trống theo chiều đứng.

Cần lưu ý rằng việc áp dụng Profile này là một vùng của liên tục đầu ra. Các kết quả được trình bày ở đây phản ánh mức độ tinh chỉnh các mức độ khác nhau, do đó có thể mong đợi liên tiếp hơn nữa.J.2. Kiểm tra các chuỗi

Các chuỗi kiểm tra được tạo ra bằng cách sử dụng máy tính mô phỏng nén và giải nén của tiêu chuẩn kỹ thuật này. Đối với 525/60, bao gồm cả đối tượng thử:

Gwen; Người tiên phong; Điện thoại di động và Lịch; Sự mờ chồng lấn

Đối với 625/50, đối tượng thử nghiệm bao gồm: Cuộn len; Cây xương rồng và cái lược; Bóng rổ; Tường; Điện thoại di động và Lịch.

"Gwen" Là một trình tự kiểm tra màu sắc chính với một phụ nữ ở cận cảnh trong nềntrên một cảnh rừng ở phía sau. "Gwen" là một dãy rất khó để khoá màu sắc nhưng lại dễ nén một chuỗi. Cả "Cây xương rồng và cái lược " và "Cuộn len " đều là chuỗi màu sắc được sử dụng với màu nền. "Người tiên phong " là một đoạn phim chuyển động nhanh với bóng rổ bằng một máy ảnh CCD không đóng cửa chớp. "Bóng rổ" cũng là một chuỗi chuyển động nhanh. Cả hai đều là đối tượng chương trình điển hình và vừa phải khó nén. "Tường" bao gồm một phụ nữ đứng trước một bức tường làm bằng nhiều viên đá nhỏ. "Renata" bao gồm một phụ nữ ở phía trước của một nền phức tạp với một sự mờ chồng lấn cho một ảnh phức tạp. "Điện thoại di động và Lịch" là một chuỗi kiểm tra nén đặc biệt khó với màu bão hòa và chuyển động phức tạp. "mờ chồng lấn" bao gồm hai phân đoạn "Điện thoại di động và Lịch" với sự mờ dần một giây giữa hai phân đoạn và cũng rất khó nén.

Các trình tự kiểm tra được cung cấp bởi: ITU-R; Portland Trailblazers:

248

TCVN xxxx : 2017

SMPTE; Tektronix.

J.3. Thủ tục kiểm traMPEG đã tiến hành các thí nghiệm để xác minh hiệu suất của cấu hình 4:2:2. 1110 kết quả

của những thí nghiệm được trình bày ở đây. Có các bài kiểm tra riêng biệt cho 525/60 và 625/50. Các bài kiểm tra 525/60 khám phá nhiều tỷ lệ dữ liệu và cấu trúc GOP, trong khi các bài kiểm tra 625/50 bao gồm nhiều loại đối tượng thử nghiệm khác nhau nhưng ít kết hợp dữ liệu tốc độ, cấu trúc GOP và số thế hệ. Các thông số được chọn cho các thí nghiệm chỉ là ví dụ và không bao gồm toàn bộ phạm vi các giá trị tham số cho phép. Các ví dụ này không nhằm mục đích cụ thể. Mỗi ứng dụng nên sử dụng sự kết hợp của các thông số phù hợp nhất, tùy thuộc vào yêu cầu về chất lượng, tính dễ chỉnh sửa và chi phí.

Các bài kiểm tra bao gồm cả một thế hệ đơn và tám thế hệ của nén cascaded và giải nén. Đối với tám bài kiểm tra thế hệ, các bài kiểm tra riêng biệt đã được thực hiện mà không cần thay đổi, với hai ca chuyển đổi theo không gian và với hai ca làm việc theo thời gian. Chuyển theo không gian có nghĩa là ảnh được chuyển theo chiều ngang và chiều dọc bởi hai điểm ảnh và hai đường không gian giữa thế hệ thứ nhất và thứ hai và sau đó trở lại giữa thế hệ thứ năm và thứ sáu. Thay đổi theo không gian thể hiện tác động của việc định vị lại ảnh có thể xảy ra trong DVE. Chuyển dịch theo thời gian có nghĩa là cấu trúc GOP đã được chuyển một khung giữa thế hệ thứ nhất và thứ hai và một lần nữa giữa thế hệ thứ năm và thứ sáu. Chuyển dịch theo thời gian thể hiện ảnh hưởng của nhiều thế hệ có sự sắp xếp GOP khác nhau

Thử nghiệm quan trọng màu sắc được thực hiện bằng cách xử lý tiền cảnh với màn hình xanh thông qua nén và giải nén. Sau khi giải nén tín hiệu kỹ thuật số thành phần được chốt màu sắc để thêm nền. Hình nền không được nén.

Các thử nghiệm môi trường hỗn hợp cho 525/60 được sử dụng nén và giải nén 4:2:2 cascaded của Tiêu chuẩn kỹ thuật này. Với một VTR kỹ thuật số nén sử dụng trong trường trường nén 2:1. Các bài kiểm tra đã sử dụng tổng cộng tám thế hệ nén. Có bốn thế hệ số lẻ là MPEG và bốn thế hệ số lượng đã được nén VTR kỹ thuật số. Không có sự thay đổi giữa các thế hệ.

Các thử nghiệm môi trường hỗn hợp cho 625/50 chỉ sử dụng nén MPEG. Các bài kiểm tra đã sử dụng tổng cộng ba thế hệ của sự kết hợp. Các thế hệ thứ nhất và thứ ba là nén 4:2:2 của Tiêu chuẩn kỹ thuật này với cấu trúc IBBP-GOP ở tốc độ 20 Mbits/s, trong khi thế hệ thứ hai là Chuẩn nén 4:2:2 của Tiêu chuẩn kỹ thuật này với cấu trúc GOP chỉ có 1 ở tốc độ 50 Mbits/s. Một sự chuyển đổi tạm thời của một khung đã được đưa vào giữa thế hệ thứ hai và thứ ba.

Xử lý nén và giải nén được đóng góp bởi: CCETT; FTZ; IRT; JVC; Sony; Đại học Kỹ thuật Braunschweig/BTS; Tektronix.Biên tập và sao chép thử băng được đóng góp bởi: RAI; Tektronix.

J.4.Đánh giá chủ quan

249

TCVN xxxx : 2017

Đánh giá chủ quan sử dụng phương pháp DSCQS được mô tả trong ITU-R BT.500-6. Các buổi xem xét của chuyên gia và những ngườ không là phải chuyên gia đã được thực hiện tại một số trang web trên khắp thế giới. Tất cả các kết quả xem xét của chuyên gia đã được kết hợp, và tất cả các kết quả xem xét của không phải là chuyên gia đã được kết hợp. Cả hai chuyên gia và không chuyên gia kết quả được trình bày ở đây. Chỉ những kết quả kiểm tra chủ quan được trình bày, vì tỷ lệ tín hiệu với tiếng ồn không được coi là thước đo đáng tin cậy về chất lượng ảnh trong những trường hợp này.

Các buổi xem xét đánh giá chủ quan được tiến hành bởi: NHK; SMPTE.Các buổi xem xét chủ quan những ngườ không là phải chuyên gia đã được thực hiện bởi: CCETT; JVC / MPT / NIIK / NTV; RAI; Đại học Kỹ thuật Braunschweig / BTS.

J.5. Kết quả kiểm traKết quả kiểm tra được trình bày theo thứ tự sau (xem bảng J.1 và J.2): 525/60 Môi trường Đồng nhất; Môi trường không đồng nhất 525/60; 625/50 môi trường đồng nhất; Môi trường không đồng nhất 625/50.

Các bảng kết quả kiểm tra được tổ chức với tốc độ dữ liệu cao hơn trình bày tốc độ dữ liệu đầu tiên và thấp hơn được trình bày trước. Trong một tốc độ bit nhất định, kết quả được tổ chức bởi cấu trúc GOP, số thế hệ, và loại dịch chuyển. Khoảng trung bình và độ tin cậy được đưa ra cho mỗi chuỗi kiểm tra.

Các thử nghiệm này sử dụng chia tỷ lệ chất lượng liên tục trong ITU-R BT.500-6. Các đánh giá chủ quan được thực hiện liên tục từ 0 đến 100. Độ lệch trung bình giữa xếp hạng trình tự ban đầu và trình tự nén được tính toán, trên thang 0 đến 100, với sự khác biệt thấp hơn hoặc bằng 0 biểu thị không suy giảm thông qua nén và 100 là xếp hạng tồi tệ nhất có thể.

Sau đây, mức trung bình của sự khác biệt giữa xếp hạng trình tự ban đầu và trình tự nén, được tính trên các đối tượng, sẽ được gọi là mức khác nhau.

Các kết quả trình bày ở đây dựa trên các định nghĩa chất lượng sau: Độ trong suốt: khác mức cho tất cả các trình tự kiểm tra không vượt quá 12% quy mô; Gần trong suốt: mức khác của 25% các chuỗi kiểm tra là từ 12% đến 18%, trong khi tất

cả các điểm khác không vượt quá 12% của quy mô;

Chất lượng tốt ở phần lớn các đối tượng, các mức điểm khác biệt trung bình được tính trên các trình tự kiểm tra không vượt quá 18%, trong khi các điểm khác nhau của 25% các chuỗi kiểm tra vượt quá 18% quy mô;

Khó khăn trong một số đối tượng: tất cả các trường hợp khác.

250

TCVN xxxx : 2017

Bảng J.1 - Các kết quả kiểm tra chủ quan cho hệ thống 525/60

Các tham số nén Người xem xếp hạng

525/60 50 Mbits/s Người xem là chuyên gia

Người xem không phải là chuyên gia

GOP = I

Thế hệ1 Trong suốt Trong suốt

8 Thế hệ,không dịch chuyển Chất lượng tốt ở phần lớn các đối tượng

Trong suốt

8 thế hệ,2 dịch chuyển theo không gian

Chất lượng tốt ở phần lớn các đối tượng

Gần trong suốt

GOP = IB

1 Thế hệ Trong suốt Trong suốt8 Thế hệ,không dịch chuyển Trong suốt Trong suốt

8 thế hệ,2 dịch chuyển theo không gian

Chất lượng tốt ở phần lớn các đối tượng

Trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Transparency Trong suốt

525/60 30 Mhits/s Người xem là chuyên gia

Người xem không phải là chuyên gia

GOP = I

1 Thế hệ Khó khăn trong một số đối tượng

Chất lượng tốt ở phần lớn các đối tượng

8 Thế hệ,không dịch chuyển Khó khăn trong một số đối tượng

Trong suốt

8 thế hệ,2 dịch chuyển theo không gian

Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

GOP = IB

1 Thế hệ Khó khăn trong một số đối tượng

Trong suốt

8 Thế hệ,không dịch chuyển Khó khăn trong một số đối tượng

Trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Gần trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Chất lượng tốt ở phần lớn các đối tượng

525/60 20 Mbits/s Người xem là chuyên gia

Người xem không phải là chuyên gia

GOP = IB

1 Thế hệ Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

8 Thế hệ,không dịch chuyển Khó khăn trong một số đối tượng

Trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

GOP = IBBP 1 Thế hệ Khó khăn trong một số đối tượng

Trong suốt

8 Thế hệ,không dịch chuyển Khó khăn trong một số đối tượng

Chất lượng tốt ở phần lớn các đối tượng

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

251

TCVN xxxx : 2017

Các tham số nén Người xem xếp hạng

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

525/60 Môi trường hỗn hợp Người xem là chuyên gia

Người xem không phải là chuyên gia

30 Mbits/s GOP = I

8 Thế hệ,không dịch chuyển Khó khăn trong một số đối tượng

Chất lượng tốt ở phần lớn các đối tượng

20 Mbits/s GOP = IB

8 Thế hệ,không dịch chuyểnKhó khăn trong một số

đối tượngChất lượng tốt ở phần

lớn các đối tượng

Bảng J.2 - Các kết quả kiểm tra chủ quan cho hệ thống 625/50Thông số nén Người xem

625/50 50 Mbits/s Người xem là chuyên gia Người xem không phải là chuyên gia

GOP IB1 Thế hệ Trong suốt Trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Trong suốt Trong suốt

625/50 30 Mbits/s Người xem là chuyên gia Người xem không phải là chuyên gia

GOP = I1 Thế hệ Trong suốt Trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Chất lượng tốt ở phần lớn các đối tượng

Khó khăn trong một số đối tượng

GOP- IB

8 thế hệ,2 dịch chuyển theo thời gian

Chất lượng tốt ở phần lớn các đối tượng Gần trong suốt

8 thế hệ,2 dịch chuyển theo thời gian

Chất lượng tốt ở phần lớn các đối tượng Gần trong suốt

625/50 20 Mbits/s Người xem là chuyên gia Người xem không phải là chuyên gia

GOP = IB

1 Thế hệ Trong suốt Trong suốt8 thế hệ,2 dịch chuyển theo không

gianKhó khăn trong một số đối

tượngKhó khăn trong một số

đối tượng8 thế hệ,2 dịch chuyển theo thời

gianKhó khăn trong một số đối

tượngKhó khăn trong một số

đối tượng

GOP = IBBP

8 thế hệ,2 dịch chuyển theo thời gian

Khó khăn trong một số đối tượng

Khó khăn trong một số đối tượng

8 thế hệ,2 dịch chuyển theo thời gian

Chất lượng tốt ở phần lớn các đối tượng

Chất lượng tốt ở phần lớn các đối tượng

625/50 Môi trường hỗn hợpCascaded 20 Mbits/s + 50 Mbits/s + 20

Mbits/sNgười xem là chuyên gia Người xem không phải

là chuyên gia

GOP IBBP+ 1+ IBBP

3 thế hệ,1 dịch chuyển theo thời gian

Chất lượng tốt ở phần lớn các đối tượng

Chất lượng tốt ở phần lớn các đối tượng

252

TCVN xxxx : 2017

Phụ lục K - Tác động của thực tiễn đối với các chuỗi bit không liên tiếp trong việc xem xét hiển thị quét liên tiếp

(Tham khảo)

K.1.Mã hoá liên tiếp và không liên tiếpPhụ lục này thảo luận về hiệu quả của các thực tiễn mã hóa đối với việc sử dụng các chuỗi

video không liên tiếp được mã hoá theo Tiêu chuẩn kỹ thuật này trên các hệ thống với các màn hình quét liên tiếp. Nó chủ yếu nhằm khuyến khích các nhà sản xuất nội dung mã hóa đối tượng theo cách không có các hiện vật không cần thiết khi trình diễn trên hệ thống với các màn hình quét liên tiếp. Mặc dù quá trình hiển thị vượt quá phạm vi của Tiêu chuẩn kỹ thuật này, một số thành phần cú pháp được đưa vào trong dòng bit có thể giúp quá trình hiển thị, chẳng hạn như phần mở rộng chuỗi hiển thị và phần mở rộng hiển thị hình ảnh. Phụ lục này thảo luận về việc tối ưu hóa việc sử dụng cú pháp theo quan điểm ảnh hưởng của nó đối với quá trình hiển thị.

Các ngữ nghĩa chuẩn của cờ progressive_frame mô tả mối quan hệ nguồn theo thời gian giữa các trường trong một ảnh đã được mã hóa của một chuỗi không liên tiếp, và các bộ giải mã hiển thị nội dung trên các thiết bị quét liên tiếp thường dựa vào cờ này để ghép nối các trường để trình diễn.

Thực tế hiển thị chung như sau: nếu một ảnh được mã hoá như là một khung hình liên tiếp, hai trường được xen kẽ để trình diễn trên thiết bị quét liên tiếp; nếu không, một số chuỗi chuyển đổi giữa các chuỗi được thực hiện để chuyển đổi dữ liệu trường đầu ra sang dữ liệu khung để hiển thị. Nếu ảnh thực sự được tạo ra với chế độ quét liên tiếp, nhưng được mã hóa với một chỉ dẫn nguồn theo thời gian không chính xác, quá trình chuyển đổi giữa các chuỗi sẽ được áp dụng sai và có thể gây ra sự giả tạo nghiêm trọng và mất độ phân giải theo chiều dọc trên màn hình.K.2.Cú pháp thông tin định thời nguồn video

Thời gian lấy mẫu nguồn video được biểu thị cho ảnh trong chuỗi không liên tiếp (khi progressive_sequence là '0') phụ thuộc vào cờ progressive_frame trong phần mở rộng mã hoá ảnh được xác định ở 6.3.10. (Xem các hình 6-2, 6-3, và 6-4.) Điều quan trọng cần lưu ý là trong khung hình của các chuỗi như vậy (khi picture_structure là '11'), progressive_frame có thể là '0' hoặc '1' không ảnh hưởng đến quá trình giải mã và do đó dịch vụ chỉ để chỉ ra thời gian lấy mẫu nguồn.

Bất cứ khi nào cờ progressive_frame một bit là '0', thì thời gian lấy mẫu nguồn được biểu diễn trong một chuỗi không liên tiếp bao gồm một khoảng thời gian thực cho khoảng thời gian giữa hiển thị của hai trường hình ảnh. Điều này bao gồm các trường hợp sau:

• khi picture_structure là '01' (trường trên cùng) hoặc '10' (trường dưới cùng) - trong trường hợp progressive_frame được yêu cầu là '0'; hoặc là

• Khi picture_structure là '11' (khung hình ảnh) và progressive_frame là '0' (không liên tiếp).Thời gian lấy mẫu được lấy mẫu đại diện là thời gian lấy mẫu khung tại một thời điểm duy

nhất trong trường hợp còn lại:• Khi picture_structure là '11' (khung hình ảnh) và progressive_frame là '1' (liên tiếp).Trong trường hợp cuối cùng, ảnh được chỉ định là liên tiếp, như trường hợp nếu

progressive_sequence là '1'.

253

TCVN xxxx : 2017

Quá trình hiển thị cho việc hiển thị progressive-scan của các khung hình liên tiếp thường sử dụng tất cả các dòng của ảnh được giải mã với sự xen kẽ của hai trường. Quá trình hiển thị cho việc hiển thị progressive-scan của các khung hình không liên tiếp thường khác với sự tương tác đơn giản của các trường.K.3. Thực tiễn tạo ra nội dung

Nếu tài liệu nguồn gốc được mã hoá được lấy mẫu như các phần nội dung quét liên tiếp, điều quan trọng là bản chất liên tiếp của đối tượng nguồn đã được trình bày đúng trong bit của video. Nội dung liên tiếp phải được mã hóa, do đó, sử dụng một đại diện liên tiếp hợp lệ. Nếu thực tiễn này không được thực hiện, các hiện vật quan trọng có thể xuất hiện không cần thiết trên các hệ thống bằng cách sử dụng các màn hình hiển thị liên tiếp. Điều tương tự cũng quan trọng là đảm bảo rằng đối tượng xen kẽ thực sự được mã hoá với khung liên tiếp - '0' là để tránh không thích hợp hiển thị không đúng trên các hệ thống sử dụng các màn hình quét liên tiếp.

Nếu toàn bộ chuỗi nguồn bao gồm các khung liên tiếp, thì nếu có thể, trình tự sẽ được mã hoá dưới dạng các khung hình liên tiếp với progressive_sequence được đặt thành '1'. Trong các trình tự không có tính liên tiếp (khi progressive_sequence là '0'), bản chất liên tiếp của các khung riêng lẻ vẫn có thể được biểu diễn bằng cách mã hóa ảnh liên tiếp như khung ảnh với progressive_frame bằng '1'.

Kinh nghiệm cho thấy rằng các nhà sản xuất nội dung đôi khi không quan tâm đúng mức đến mức báo hiệu bản chất liên tiếp của các khung hình liên tiếp được mã hoá trong các chuỗi không mang tính liên tiếp. Một số thực tiễn chỉnh sửa video cũng có thể làm cho một nguồn liên tiếp mất bản chất liên tiếp của nó ở một mức độ nào đó và do đó mất khả năng được mã hoá dưới dạng các khung hình liên tiếp thích hợp. Mục đích chính của phụ lục này là nhằm giúp các nhà sản xuất nội dung tránh tạo ra các dòng bit video tạo ra đối tượng không cần thiết như là kết quả của những vấn đề này.K.3.1. Xử lý trước chuyển đổi tỷ lệ khung

Đối tượng nguồn tạo ra ở một số tốc độ khung hình cụ thể thường được chuyển đổi để mã hóa như một dòng bit video với tốc độ khung hình khác nhau. Nếu tốc độ mã hóa khung nguồn thấp hơn mức tỷ lệ khung hình được mã hoá, điều này thường được thực hiện trong các chuỗi không liên tiếp bằng cách thêm các trường lặp lại nội dung được mã hoá lặp đi lặp lại bằng cách sử dụng progressive_frame = '1' với repeat_first_field = '1'.

Hiện tại, thực tế phổ biến nhất là chuyển đổi khung phim 24 khung hình/giây sang khung hình 30 000/1001 mỗi giây bằng một quá trình được gọi là kéo xuống 3:2 (còn gọi là 2:3pull down). Trong quá trình này, mỗi tập liên tục hợp bốn ảnh được quétliên tiếp, được biểu thị dưới dạng ảnh A. B, C và D, được chuyển thành mười trường nội dung video bằng cách lặp lại trường đầu tiên của ảnh thứ hai và thứ tư ( ảnh B và D) . Cùng một khuôn mẫu sau đó được lặp đi lặp lại một lần nữa và một lần nữa cho mỗi bộ tiếp theo của bốn hình ảnh.

Mỗi ảnh phim được quét để tạo ra hai trường luân phiên nhau, và trong mỗi chuỗi của bốn bức ảnh, hủy bỏ việc truyền tải trường đầu tiên của mỗi ảnh thứ hai và thứ tư sau khi gửi các trường đầu tiên và thứ hai của hình ảnh. Trường nào được gửi đi đầu tiên được điều chỉnh để duy trì một mô hình trường xen kẽ, do đó chuyển đổi bốn khung ảnh 24 Hz thành 10 trường video 29.97 Hz như sau:

Trường trên cùng của ảnh đầu tiên (ảnh A) được gửi; sau đó

Trường dưới cùng của ảnh đầu tiên (ảnh A) được gửi; sau đó

254

TCVN xxxx : 2017

Trường trên cùng của ảnh phim thứ hai (ảnh B) được gửi; sau đó

Trường dưới cùng của ảnh phim thứ hai ( ảnh B ) được gửi; sau đó

Trường trên cùng của ảnh phim thứ hai (ảnh B) được gửi lại (điển ảnh B ằng cách đặt repeat_first_field là 1): sau đó

Trường dưới cùng của ảnh thứ ba (ảnh C) được gửi; sau đó

Trường trên cùng của ảnh thứ ba (ảnh C) được gửi: sau đó

Trường dưới cùng của ảnh phim thứ tư (ảnh D) được gửi; sau đó

Trường trên cùng của ảnh phim thứ tư (ảnh D) được gửi; sau đó

Trường dưới cùng của ảnh thứ tư (ảnh D) được gửi lại (điển ảnh B ằng cách đặt repeat_first_field là 1): sau đó

Quy trình trên lặp lại theo cách thức 10 mođun cho các trường tiếp theo.Quá trình này làm chậm thời gian tổng thể bằng một yếu tố 1001/1000 (tạo ra một nguồn

với khoảng 23.976 ảnh phim mỗi giây) và đại diện cho bộ phim theo cách thích hợp để sử dụng trên các hệ thống có màn hình xen kẽ. Trong trường hợp sử dụng 3:2 pull down, việc xem xét thực tiễn quan trọng nhất được yêu thích là mỗi ảnh nguồn (A, B, C, và D) phải được trình diễn trong dòng bit như một ảnh được mã hóa khác biệt. Nói cách khác, các ảnh nguồn B và D trong mẫu cần được mã hoá dưới dạng các ảnh khác biệt với progressive_frame = '1' và repeat_first_field = '1'. Một ví dụ về việc sử dụng cú pháp sẽ là mã hoá các ảnh nguồn A và B như là hai ảnh được mã hoá đầu tiên (mỗi một với repeat_first_field = '0'), sau đó mã hóa trường trên cùng lặp đi lặp lại của ảnh nguồn B và trường bức của hai trường ảnh nguồn C với nhau như là ảnh được mã hoá thứ ba, sau đó mã hóa trường thứ hai của ảnh nguồn C và trường đầu tiên của ảnh nguồn D với nhau như là ảnh được mã hoá thứ tư, và sau đó mã hóa hai trường của ảnh nguồn D là ảnh mã hoá thứ năm; và lặp lại ảnh này cho mỗi bộ của bốn ảnh nguồn. Sử dụng cú pháp này có thể sẽ tạo ra các đối tượng quan trọng trên một hệ thống có màn hình quét liên tiếp, vì quá trình hiển thị hầu như không thể phục hồi đúng cặp trường và thông tin thời gian cần thiết để tái tạo lại các ảnh định dạng liên tiếp.

Ngoài ra, điều rất quan trọng là ngay cả những ảnh nguồn không có trường lặp lại đầu tiên có chứa một bản mô tả đúng đắn về tính liên tiếp của chúng. Điều này đòi hỏi các ảnh nguồn A và C phải được mã hóa dưới dạng khung hình với progressive_frame = '1' (cũng như với repeat_first_field = '0 ") .Trong trường hợp bộ mã hóa suy luận sự có mặt của tỷ lệ co 3:2 (pull down) trong một đoạn trích của các trường nguồn video, sự hiện diện của các trường lặp lại có thể hữu ích để xác định rằng các đối tượng nguồn là liên tiếp và để xác định sự kết hợp đúng của các trường đến các khung (Chất lượng đầu ra sẽ tốt hơn đáng kể, tuy nhiên, nếu bản chất nguồn thực tế có thể được biết đến bởi bộ mã hóa, thay vì cần phải được phát hiện qua quá trình phát hiện không hoàn hảo như vậy.)

Thực hiện theo các phương pháp mã hoá ưa thích này đòi hỏi bản chất liên tiếp của các khung nguồn và sự kết hợp đúng các trường vào khung được giữ nguyên trong quá trình mã hóa.K.3.2.Thực tiễn chỉnh sửa trường bất lợi

Một số thực tiễn chỉnh sửa video hoạt động không có nhận thức về việc ghép nối chính xác các trường để tạo thành các khung hình liên tục có thể gây bất lợi cho tính liên tiếp của đối tượng gốc và do đó cần tránh ở phạm vi tối đa do sự giả tạo mà chúng tạo ra trên các hệ thống sử dụng màn hình quét liên tiếp. Để tránh những khó khăn phát sinh do thực tiễn này, chuỗi quy

255

TCVN xxxx : 2017

trình sản xuất, chỉnh sửa và mã hoá hoàn chỉnh phải được thiết kế sao cho đảm bảo rằng các thông tin chính xác về sự liên tiếp hoặc xen kẽ tự nhiênbcủa mỗi phần nội dung video được bảo quản. Trong quá trình xử lý tỷ lệ co 3:2 (3:2 pull down), các phương pháp chỉnh sửa phải hoạt động với cùng mẫu của xử lý cặp trường như đối với đối tượng nguồn bên dưới để tránh những khó khăn đó.K.3.2.2. Lớp phủ và kết hợp cấu trúc trường

Một trường hợp chỉnh sửa theo trường khác có thể có ảnh hưởng đến việc liệu ảnh có thể được mô tả chính xác là liên tiếp hay không là việc chèn các lớp phủ văn bản di chuyển và các nội dung khác. Nếu đối tượng đó được chèn vào một cảnh liên tiếp khác bằng cách sử dụng một quá trình chỉnh sửa theo hướng xuyên suốt, đối tượng nguồn không còn có thể được mô tả chính xác như là liên tiếp hoặc thực sự xen kẽ nhau. Do đó, không rõ ảnh có được đánh dấu bằng progressive_frame = '0' hay '1', và các hệ thống sử dụng màn hình quét liên tiếp có thể có khó khăn đáng kể khi xác định cách hiển thị ảnh được giải mã để hiển thị. Trong phạm vi có thể, bất kỳ lớp phủ và ghép ảnh như vậy phải được thực hiện bằng cách sử dụng các biểu diễn quét liên tiếp để tránh những khó khăn đó.K.3.2.3. Sự mờ dần theo trường, chuyển cảnh

Nếu quá trình chuyển đổi dần dần giữa các nội dung quét liên tiếp được thực hiện, chẳng hạn như ‘làm mạnh lên’, ‘làm yếu đi’, chuyển đổi cảnh dần dần hoặc chuyển đổi "quét", các chuyển tiếp đó phải được thực hiện bằng cách sử dụng chế độ quét theo liên tục quét khung mức độ tối đa có thể - hoạt động trên khung đúng liên tục được ghép nối đúng. Trừ khi thực tiễn này được tuân theo, đối tượng nguồn không còn có thể được mô tả chính xác như là liên tiếp thực sự hoặc thực sự xen kẽ nhau. Do đó, không rõ ảnh có nên được đánh dấu bằng progressive_frame = '0' hay '1', và các hệ thống sử dụng màn hình quét liên tiếp có thể có khó khăn đáng kể khi xác định cách hiển thị ảnh được giải mã cho hiển thị.K.3.2.4. Các hiệu ứng đặc biệt theo trường

Các hiệu ứng đặc biệt như phóng to có thể đã được áp dụng sau khi bắt đầu chụp nội dung video cũng nên được thực hiện tương tự như được thực hiện cẩn thận với tính chất liên tiếp của đối tượng gốc. Những hiệu ứng này nên được áp dụng trong hoạt động trên các khung hình được ghép nối đúng cách hơn là theo một cách tùy ý để bảo vệ bản chất liên tiếp của tượng gốc.K.3.2.5. Điều chỉnh tốc độ theo hướng trường

Nếu số lần thực hiện liên quan đến các ảnh quét liên tiếp được thay đổi để điều chỉnh tốc độ chuyển động trong một cảnh, cần phải cẩn thận để đảm bảo rằng các điều chỉnh tốc độ không gây ra quá trình xử lý tiếp theo (ví dụ 3:2 pull down phát hiện một bộ mã hóa như được mô tả trong K.3.1) để mất theo dõi bản chất liên tiếp của các ảnh và sự kết hợp thích hợp của các trường đến các ảnh.K.3.2.6. Khung trung tâm

Nếu trung tâm khung được chỉ ra trong một picture_display_extension() chỉ ra các giá trị khác nhau của frame_centre_vertical_offset hoặc frame_centre_horizontal_offset cho các trường khác nhau trong cùng một ảnh, điều này sẽ tạo ra một hình thức khác của sự thay theo thời gian được chỉ định giữa các trường của những gì có thể là quét ảnh liên tiếp. Tốc độ khung hình cơ bản của ảnh quét liên tiếp sẽ bị thay đổi hiệu quả bởi quá trình này, có khả năng tạo ra một dãy hiển thị có thay đổi theo trường cho mỗi ảnh liên tiếp như vậy.K.4.Chỉnh sửa sau mã hoá của cờ khung liên tiếp trong các dòng bit video

256

TCVN xxxx : 2017

Điều quan trọng cần lưu ý là trong khung hình các chuỗi không liên tiếp (khi progressive_sequence là '0'), giá trị của progressive_frame không ảnh hưởng đến quá trình giải mã và do đó chỉ phục vụ cho việc xác định thời gian lấy mẫu nguồn.

Do tầm quan trọng của giá trị progressive_frame đối với các hệ thống sử dụng các màn hình quét liên tiếp, trong một số trường hợp cần phải xem xét việc thay đổi giá trị của bit này trong các dòng bit đã được tạo ra với việc đặt không hợp lệ của cờ này. Các hạn chế khi những thay đổi như vậy có thể được thực hiện cho mục đích này mà không gây tổn hại cho quá trình giải mã là:

progressive_sequence phải là '0' (một chuỗi không liên tiếp);

picture_structure phải là '11' (khung hình ảnh);

Không thể thay đổi khung liên tiếp từ '1' thành '0' nếu repeat_first_field là '1’ và

progressive_frame không thể thay đổi trừ khi chroma_420_format cũng được thay đổi để có cùng giá trị với progressive_frame.

Chú ý - Các công bố này chỉ nhằm mục đích cung cấp thông tin - như trường hợp với tất cả các công bố trong phụ lục này, các công bố này không thay đổi bằng bất kỳ cách nào các đặc điểm kỹ thuật được tìm thấy trong các phần quy chuẩn của Tiêu chuẩn kỹ thuật này.

K.5. sau xử lý cho các hệ thống với màn hình quét liên tiếpNếu hệ thống giải mã phát hiện sự hiện diện của một khung không liên tiếp bị cô lập trong

một loạt khung hình liên tục, điều này có thể cho thấy sự hiện diện của một trường bị mắc kẹt như mô tả trong K.3.2.1. Nhà thiết kế chế tạo màn hình nên xem xét cung cấp một số xử lý đặc biệt cho tình huống này.

Nếu hệ thống giải mã phát hiện ra sự lặp lại của các khung hình progressive với repeat_first_field = '1' trộn với các khung không liên tiếp, điều này có thể biểu thị hành vi của bộ mã hoá không ý thức bản chất liên tiếp của khung nội dung nguồn và chỉ có thể phát hiện ra rằng một khung hình là liên tiếp nếu trường trên cùng của nó được lặp lại trong chuỗi video nguồn. Các nhà thiết kế chế tạo màn hình nên xem xét xử lý ngay cả các khung với repeat_first_field = '0' và progressive_ frame = '0' như các khung quét thực sự liên tiếp nếu mô hình lặp đi lặp lại của hiện tượng này gặp phải ở dòng bit.K.6. Sử dụng các thông tin về mã thời gian

Thời gian thích hợp của các khung và các trườngvideo để hiển thị sử dụng có thể được chỉ định bằng cách thêm các thông tin về mã thời gianghi vào dòng bits video. Một số ví dụ được cung cấp ở đây về cách thông tin này có thể được sử dụng.K.6.1. Ví dụ: Video 525/60 (29,97 Hz) với số khung không tách ra

Video xen kẽ tiêu biểu 525/60 có thể được biểu diễn trong cấu trúc dữ liệu timecode_capture mà không cần sử dụng định thời drop-frame bằng cách thiết lập các thông số gốc thời gian như sau:

counting_type = '001' (không giảm số khung) nframes_conversion_code = '1' clock_divisor = 45nframes_multiplier = 20

Vì counting_type = '001', prior_count_dropped sẽ luôn luôn bằng không.Kết quả là max_nframes = (26 999 999) / (20 * (1000 + 1) * 45) = 29.Xác định một biến X tính toán bù thời gian, với một giá trị ban đầu là X0 (ví dụ, X0 = 0).

257

TCVN xxxx : 2017

Nếu quá trình bắt đầu bằng nframes = 1 và time_offset = X cho dấu thời gian trên trường đầu tiên, trường thứ hai sẽ có cùng giá trị cho tất cả các tham số ngoại trừ time_offset, tức là X + 10010 = 10010. Đối với trường đầu tiên của trường frame thứ hai, time_offset lại là X, và cho trường thứ hai, nó sẽ là X + 10010 một lần nữa. Điều này lặp lại cho đến khi giá trị của nframes vượt quá 29.

Khi giá trị nframes vượt quá 29, nframes được đặt là 0, units_of_scconds tăng dần (với gói thành các giá trị của tens_of_seconds, Units_of_minutes, vv nếu cần), X được tăng lên 600 và time_offset được đặt thành X. Đối với ba mươi khung, time_offset sẽ là X cho trường trên cùng của mỗi khung và X + 10010 cho trường thứ hai của mỗi khung (sử dụng giá trị gia tăng của X), cho đến khi giá trị của nframes nframes vượt quá 29 lần nữa - tại thời điểm đó X sẽ được tăng thêm 600 và time_offset sẽ là X cho trường đầu tiên với nframes = 0, time_offset sẽ là X - 10010 cho trường thứ hai với nframes = 0, X cho trường trên cùng với nframes = 1, X + 10010 cho trường thứ hai với nframes = 1, v.v ...

Sự khác biệt giữa bất kỳ cặp giá trị equivalent_timestamps liền kề sẽ là 10010 * 45 =450 450 trong ví dụ này. Để minh họa, hãy kiểm tra mốc thời gian trên trường thứ hai của khung thứ 29:

units_of_seconds = 0nframes = 29time_offset - X0+ 10010

equivalent_timestamps = 0 + (29 * 20 * (1000 + 1) + X0+ 10010) * 45 = X0 + 26 576 550Và mốc thời gian trên trường đầu tiên của khung thứ 30:

units_of_seconds = 1 nframes = 0 time_offset = 600

equivalent_timestamps = 27 000 000 + (0 * 20 * (1000 + 1) + X0+ 600) * 45= X0 + 27 027 000Trừ đi sau đó mang lại một sự khác biệt là:

27 027 000 - 26 576 550 = 450 450 như mong muốn.K.6.2.Ví dụ: video 525/60 (29,97 Hz) với đếm số khung tách ra

Video interlaced điển hình 525/60 có thể được biểu diễn trong bắt cấu trúc dữ liệu mã thời gian với việc đếm số lượng khung công nghiệp phổ biến bằng cách thiết lập các thông số gốc thời gian như sau:

counting_type = '100' (bỏ hai giá trị của nframes) nframes_conversion_code = '1'clock_divisor = 45nframes_multiplier = 20

Điều này bắt đầu về cơ bản giống như trong K.6.1 ngoại trừ giá trị của counting_type. Quá trình đếm cũng giống nhau cho đến khi unit_of_minutes trở thành 1, tại thời điểm đó thay vì nframes trở là 0 và X tăng lên 600 từ một khung tiếp theo, prior_frame_dropped được đặt thành '1', nframes được đặt thành 2 thay vì 0 , và X giảm xuống 39 440 thay vì tăng thêm 600. Việc điều chỉnh này xảy ra bất cứ khi nào các units_of_minutes tăng lên và giá trị kết quả của các units_of_minutes không phải bằng không.K.6.3.Ví dụ: Thời lượng video 625/50 (25 Hz)

258

TCVN xxxx : 2017

Video xen kẽ tiêu biểu 625/50 có thể được biểu diễn trong trong bắt cấu trúc dữ liệu mã thời gian bằng cách thiết lập các thông số gốc thời gian như sau:

counting_type = '001' (không giảm số khung) nframes_conversion_code = '0'clock_divisor = 45nframes_multiplier = 24Kể từ khi counting_type = '001', prior_count_dropped sẽ luôn luôn bằng không.Kết quả là max_nframes = (26 999 999) / (24 * (1000 + 0) * 45) = 24.

Trong trường hợp này, nframes được tính từ 0 đến 24, sau đó tăng từng đơn vị và nframes trở lại 0 lần nữa. Giá trị của time_offset vẫn ở giá trị ban đầu X = X0 (ví dụ, X0 = 0) cho tất cả các mốc thời gian tiếp theo có cùng một mẫu thời gian.K.6.4. Ví dụ: quay video 525/60 (29.97 Hz phim) 3:2 pull down 23.976 Hz

Thực tế phổ biến cho quay phim là ảnh quét 24 Hz được chuyển đổi để biểu diễn dưới dạng khung hình 525/60 bằng tỷ lệ co 3:2 (pull down) (xem K.3.1). Điều này liên quan đến việc quét từng ảnh quét liên tiếp để tạo các trường của các dòng xen kẽ, và sau đó đại diện cho 10 trường video mã hoá cho mỗi ảnh quét 4 chiều liên tiếp của đối tượng gốc. Trong trường hợp như vậy, chụp mã thời gian thể hiện bản chất liên tiếp của đối tượng nguồn ban đầu nằm dưới dãy trường đã được chuyển đổi bằng cách chỉ ra cùng một thời gian lấy mẫu cho các trường đến từ cùng một ảnh gốc.

Trong trường hợp như vậy, chụp mã thời gian cho phép bộ giải mã phục hồi cấu trúc ảnh không xen kẽ bằng cách xác định những trường nào thực sự thuộc về nhau trong thời gian lấy mẫu của chúng. Thông tin thời gian bổ sung này có thể được đặc biệt có ích cho các hệ thống với màn hình quét liên tiếp,K.6.-4.1. Ví dụ: 23.976 Hz trong video 525/60 với đếm không tách ra

Thời gian lấy mẫu ảnh cơ bản, kéo dài đến khoảng 23.976 Hz, có thể được chỉ ra dưới dạng mã thời gian không được đặt như sau:

counting_type = '001' (không giảm số khung) nframes_conversion_code = ‘1’ clock_divisor = 45 nframes_multiplier = 20Vì counting_type = '001', prior_count_dropped sẽ luôn luôn bằng không.Kết quả là max_nframes = (26 999 999) / (20 • (1000 + I) • 45) = 29.Xác định mảng 10 phần tử (được lập chỉ số từ 0 đến 9):Y [10] = (0, 0, 5005, 5005, - 15015, 10010, -10010, 15015, -5005, -5005)

Nếu quá trình bắt đầu bằng nframes = 1 và time_offset = X + Y[0] – X 0 (ví dụ: X0 = 0) cho dấu thời gian trên trường đầu tiên của ảnh đầu tiên, thì trường thứ hai có cùng giá trị cho tất cả các tham số ngoại trừ bù thời gian, có thể là X - Y[1] = 0. Đối với trường đầu tiên của khung thứ hai, time_offset sẽ là X + Y[2], và cho trường thứ hai, nó sẽ là X + Y[3], vv .. Quá trình này tiếp tục với chỉ số vào mảng Y là số, modulo 10 của trường đang truyền (0 biểu thị trường đầu tiên với nframes = 1, 1 là trường thứ hai với nframes = 1, 2 là trường đầu tiên với nframes = 2, v.v.).

Điều này lặp lại cho đến khi giá trị của nframes vượt quá 29, tại thời điểm đó giá trị của X được điều chỉnh như trong K.6.4.1, units_of_seconds tăng lên, nframes được đặt là 0 và quá

259

TCVN xxxx : 2017

trình này tiếp tục. Chỉ số đầu vào Y tiếp tục tăng modulo 10 (nó không phải là thiết lập lại để không khi đơn vị giây được tăng lên).

Khi mốc thời gian được tạo ra theo cách này (bỏ qua mốc thời gian cho bất kỳ trường nào được gửi như là trường thứ ba của một ảnh với repeat_first_field = 1 vì chúng có một ảnh tượng trưng tương đương(ngụ ý tương đương với trường đầu tiên của bất kỳ ảnh như vậy), thời gian quét 23.976 Hz theo tiến độ 525/60 được chỉ ra. Giá trị equivalent_timestamp trên các trường liền kề sẽ khác 25025 khi các trường từ những ảnh phim liên tiếp khác nhau, và bằng 0 khi chúng từ cùng ảnh phim quét liên tục.

K.6.4.2. Ví dụ: 23.976 Hz trong video 525/60 với đếm số khung tách raThời gian lấy mẫu ảnh cơ bản, kéo dài đến khoảng 23.976 Hz, có thể được chỉ ra là nền

tảng của mã thời gian drop-frame công nghiệp phổ biến như sau:counting_type = '100' (bỏ hai giá trị của nframes) nframes_conversion_code = '1'clock_divisor - 45nframces_multiplier = 20

Xác định cùng một mảng 10 phần tửnhư trong K.6.4.1, quá trình này giống như trong K.6.4.1 ngoại trừ các giá trị của X và nframes được tính như trong K.6.2 hơn là trong K.6.1. Giá trị của time_offset được đặt thành X + Y [k], trong đó k là chỉ số trường như được sử dụng trong K.6.4.1.

260

TCVN xxxx : 2017

Tài liệu tham khảo

[1] Khuyến nghị 1TU-R BT.500-6 (1994), Phương pháp đánh giá chủ quan về chất lượng ảnh truyền hình.

[2] Khuyến nghị ITU-R BT.709-5 (2002). Giá trị tham số cho các tiêu chuẩn HDT cho sản xuất và trao đổi chương trình quốc tế.

[3] Khuyến nghị ITU-R BT.I358 (2007), Các thông số trường quay của các hệ thống truyền hình liên tiếp 25 và 525.

[4 |Khuyến nghị ITU-R BT.136I (1992), Colorimetry unified trên toàn thế giới và các đặc tính liên quan của các hệ thống ảnh và ảnh tương lai.

[5]Khuyến nghị ITU-R B 1.1700 (2005), Các đặc tính của tín hiệu video kết hợp cho các hệ thống truyền hình analog truyền thống.

[6] Khuyến nghị ITU-T M.222.0 (2012) ISO / IEC 13818-1: 2013, Công nghệ thông tin - Mã hoá ảnh chuyển động và thông tin âm thanh liên quan - Hệ thống.

[7] Khuyến nghị ITU-T 11.261 (1993). Bộ giải mã video cho các dịch vụ nghe nhìn ở tốc độ x64 / giây.

[8 |Khuyến nghị ITU-T T.81 (1992) ISO / IEC 10918-1: 1994, Công nghệ thông tin nén kỹ thuật số và mã hoá ảnh tĩnh liên tục - Yêu cầu và hướng dẫn.

[9] IEC 61966-2-4: 2006, Hệ thống và thiết bị đa phương tiện - Đo màu và Quản lý- Phần 2-4: Quản lý màu - Khoảng không màu YCC mở rộng cho các ứng dụng video - xvYCC.

[10] IEEE Sid 1180-1990, Các thông số kỹ thuật tiêu chuẩn IEEE cho việc thực hiện phép biến đổi Cosine rời rạc của SXS, năm 1991.

[11] IEC 60908 (1999), Audiorecording - Hệ thống âm thanh số compact.[12] ISO / IEC 11172-1: 1993. Công nghệ thông tin - Mã hóa ảnh chuyển động và âm thanh liên

quan cho các phương tiện lưu trữ kỹ thuật số lên tới khoảng 1,5 Mb / s Phần I: Hệ thống.[13] ISO / IEC 11172-3: 1993. Công nghệ thông tin - Mã hoá hóa ảnh chuyển động và âm thanh

liên quan cho các phương tiện lưu trữ kỹ thuật số lên đến khoảng 1,5 Mbit / s - Phần 3: Âm thanh.

[14] ISO / IEC 13818-3: 1998, Công nghệ thông tin - Mã hoá ảnh chuyển động và thông tin âm thanh liên quan - Phần 3: Âm thanh.

[15] ISO / IEC 13818-4: 2004. Công nghệ thông tin - Mã hoá hóa ảnh chuyển động và thông tin âm thanh liên quan Phần 4: Kiểm định phù hợp.

[16] NTSC-1953, Báo cáo và Báo cáo của Ban Hội thẩm II. l- .A. 12-19. với một số tài liệu tham khảo bổ sung trích dẫn trong Báo cáo, và Đơn yêu cầu áp dụng các tiêu chuẩn truyền dẫn cho màu sắc truyền hình trước Ủy ban Truyền thông Liên bang, Ủy ban Hệ thống Truyền hình Quốc gia, n.p., tạo ra năm 1953, Hoa Kỳ.

[17]SMPTE RP I77-I993 (R2002), Sự hình thành các phương trình màu truyền hình cơ bản, Hiệp hội Kỹ thuật Điện ảnh và Truyền hình.

[18]SMPTE ST 170: Năm 2004, Tivi - Kết hợp tín hiệu video analog - NTSC cho các ứng dụng Studio, Hiệp hội Kỹ thuật Điện ảnh và Truyền hình.

[19]SMPTE ST 240: 1999, Hệ thống sản xuất có độ phân giải cao 1125-Line - Các thông số tín hiệu, Hiệp hội Kỹ thuật Điện ảnh và Truyền hình.

[20]47 CFR 73.682, tiêu chuẩn truyền hình TV, Bộ luật Liên bang Hoa Kỳ, 2004.[21] Gonzales, C. và Viscito, E., mã hóa video có khả năng mở rộng linh hoạt,

ImageCommunications, vol. 5, nos. 1-2 tháng 2 năm 1993.[22] Iwahashi, M., Kỹ thuật Bù Biến động cho 2: 1 Scaled-down Moving Pictures, Ảnh Coding

Symposium Viện Công nghệ Liên bang Lausanne - Thụy Sĩ.

261