ocnhoi88
24-03-2011, 16:58
Mục lục
Đồ án tốt nghiệp. 1
Phần 1: Cơ sở lý thuyết. 6
Chương 1: Tiếng nói và các đặc điểm 6
1.1. Bộ máy phát âm 6
1.1.1. Bộ máy phát âm 6
1.1.2. Cơ chế phát âm 6
1.2. Biểu diễn tín hiệu tiếng nói 6
1.2.1. Xác định tần số lấy mẫu. 8
1.2.2. Lượng tử hoá. 9
1.2.3. Nén tín hiệu tiếng nói 9
1.2.4. Mã hoá tín hiệu tiếng nói. 9
1.3. Đặc điểm tín hiệu tiếng nói 11
1.3.1. Âm hữu thanh và âm vô thanh. 11
1.3.2. Âm vị 11
1.3.3. Các đặc tính khác. 12
Chương 2: Một số kỹ thuật xử lý tiếng nói 14
2.1 Lý thuyết bộ lọc nguồn và mô hình toàn cực. 14
2.1.1. Lý thuyết bộ lọc nguồn. 14
2.1.2. Mô hình toàn cực. 14
2.2 Lý thuyết hàm tương quan. 15
2.2.1 Định nghĩa hàm tương quan, tự tương quan. 15
2.2.2. Tính chất hàm tự tương quan: 15
2.2.3. Phân tích tần số cơ bản sử dụng hàm tự tương quan: 16
2.2.4. Tính hàm tương quan sử dụng FFT. 16
2.3 Kỹ thuật tiên đoán tuyến tính và biểu diễn phổ. 17
2.3.1 Giới thiệu. 17
2.3.2. Khái niệm tiên đoán tuyến tính. 17
2.3.3 Giải bài toán LP 18
2.3.4. Phương pháp tự tương quan giải bài toán tiên đoán tuyến tính: 19
2.3.5 Phổ tiên đoán tuyến tính. 20
2.3.6. Biểu diễn LSP 21
Chương 3: Tổng hợp tiếng nói 24
3.1 Tổng hợp mô phỏng bộ máy phát âm 24
3.2. Tổng hợp Formant 25
3.2.1 Tổng hợp Formant nối tiếp: 25
3.2.2 Tổng hợp Formant song song. 25
3.2.3 Tổng hợp Formant kết hợp nối tiếp với song song. 26
3.3. Tổng hợp trực tiếp. 27
Phương pháp PSOLA 28
3.4. Các phương pháp tổng hợp bằng tiên đoán tuyến tính. 29
3.5. Các mô hình dựa trên hàm Sin. 30
Chương 4: Kỹ thuật tổng hợp PSOLA 31
4.1 Cơ sở của kỹ thuật TD-PSOLA 31
4.1.1 Điều khiển tần số cơ bản của tín hiệu tiếng nói. 31
4.1.2. Kỹ thuật PSOLA trên miền thời gian. 31
4.2 Các kỹ thuật PSOLA khác. 33
4.2.1 Kỹ thuật FD-PSOLA 33
4.2.2 Kỹ thuật LP-PSOLA 33
4.3 Chi tiết kỹ thuật PSOLA trên miền thời gian: 33
Thuật toán TD-PSOLA chi tiết: Tính tín hiệu tổng hợp bằng PSOLA từ tín hiệu nguồn 34
Chương 5: Đặc điểm tiếng Việt và bài toán tổng hợp. 35
5.1 Đặc điểm tiếng Việt 35
5.1.1. Âm tiết 35
5.1.2 Âm tố. 38
5.1.3. Âm vị 39
5.1.4. Tiếng. 39
5.1.5. Hình vị 39
5.1.6. Hệ thống âm vị tiếng Việt 40
5.2 Bài toán tổng hợp tiếng Việt 42
5.2.1. Lựa chọn phương pháp thích hợp cho bài toán tổng hợp tiếng Việt 42
5.2.2. Các vấn đề phải giải quyết khi xây dựng bộ tổng hợp tiếng Việt: 43
Phần 2: Bộ tổng hợp tiếng Việt. 46
Chương 6 Phân tích tần số cơ bản và xác định điểm đánh dấu pitch. 46
6.1 Hạn chế của lấy cửa sổ và giải pháp. 46
6.2 Hạn chế của lấy mẫu và giải pháp. 47
6.3 Thuật toán dò tần số cơ bản sử dụng hàm tự tương quan. 48
6.4 Thuật toán xác định các điểm đánh dấu pitch (pitch marker) trên tín hiệu tiếng nói: 50
7.1 Năng lượng tại điểm ghép nối 51
7.2 Tần số cơ bản tại điểm ghép nối 51
7.3 Pha tại điểm ghép nối 52
7.4 Phổ tại điểm ghép nối 52
7.4.1 Làm trơn phổ sử dụng LP 53
7.4.2 Dịch chuyển cực LP 55
7.4.3 Nội suy LSF. 58
7.4.4 Áp dụng: 60
7.4.5 Kết quả: 60
Chương 8 Tổng hợp thanh điệu. 62
8.1 Biến đổi tần số cơ bản. 62
8.1.1 Tần số cơ bản các thanh điệu tiếng Việt 62
8.1.2 Mô hình biểu diễn tần số cơ bản các thanh điệu. 64
8.2 Biến đổi độ dài 66
8.2.1 Nhận xét về biến đổi độ dài giữa các thanh trong tiếng Việt 66
8.2.2 Mô hình biến đổi độ dài của các thanh điệu. 66
8.3 Biến đổi biên độ. 67
8.3.1 Biến đổi biên độ của các thanh điệu. 67
8.3.2 Mô hình biên độ của các thanh điệu. 67
Phần 3: Chương trình tổng hợp Tiếng Việt. 69
Chương 9 Xây dựng chương trình tổng hợp tiếng Việt 69
9.1 Tổng quan chương trình. 69
9.2. Chức năng đọc ghi file .wav và phát tiếng nói ra loa. 70
9.2.1. Chức năng đọc ghi file .wav. 70
9.2.2. Chức năng phát tiếng nói ra loa. 71
9.3. Chức năng phân tích tần số cơ bản của tín hiệu tiếng nói 71
9.3. Chức năng thực hiện thuật toán PSOLA trên miền thời gian: 71
9.4. Chức năng phân tích, tổng hợp LPC, LSP 71
9.4.1 Chức năng phân tích. 71
9.4.2 Chức năng tổng hợp. 72
9.5. Chức năng ghép nối 2 diphone. 72
9.6 Chức năng tổng hợp thanh điệu. 73
Phần 4: Đánh giá kết quả và kết luận. 74
Phụ lục. 75
Đồ án tốt nghiệp. 1
Phần 1: Cơ sở lý thuyết. 6
Chương 1: Tiếng nói và các đặc điểm 6
1.1. Bộ máy phát âm 6
1.1.1. Bộ máy phát âm 6
1.1.2. Cơ chế phát âm 6
1.2. Biểu diễn tín hiệu tiếng nói 6
1.2.1. Xác định tần số lấy mẫu. 8
1.2.2. Lượng tử hoá. 9
1.2.3. Nén tín hiệu tiếng nói 9
1.2.4. Mã hoá tín hiệu tiếng nói. 9
1.3. Đặc điểm tín hiệu tiếng nói 11
1.3.1. Âm hữu thanh và âm vô thanh. 11
1.3.2. Âm vị 11
1.3.3. Các đặc tính khác. 12
Chương 2: Một số kỹ thuật xử lý tiếng nói 14
2.1 Lý thuyết bộ lọc nguồn và mô hình toàn cực. 14
2.1.1. Lý thuyết bộ lọc nguồn. 14
2.1.2. Mô hình toàn cực. 14
2.2 Lý thuyết hàm tương quan. 15
2.2.1 Định nghĩa hàm tương quan, tự tương quan. 15
2.2.2. Tính chất hàm tự tương quan: 15
2.2.3. Phân tích tần số cơ bản sử dụng hàm tự tương quan: 16
2.2.4. Tính hàm tương quan sử dụng FFT. 16
2.3 Kỹ thuật tiên đoán tuyến tính và biểu diễn phổ. 17
2.3.1 Giới thiệu. 17
2.3.2. Khái niệm tiên đoán tuyến tính. 17
2.3.3 Giải bài toán LP 18
2.3.4. Phương pháp tự tương quan giải bài toán tiên đoán tuyến tính: 19
2.3.5 Phổ tiên đoán tuyến tính. 20
2.3.6. Biểu diễn LSP 21
Chương 3: Tổng hợp tiếng nói 24
3.1 Tổng hợp mô phỏng bộ máy phát âm 24
3.2. Tổng hợp Formant 25
3.2.1 Tổng hợp Formant nối tiếp: 25
3.2.2 Tổng hợp Formant song song. 25
3.2.3 Tổng hợp Formant kết hợp nối tiếp với song song. 26
3.3. Tổng hợp trực tiếp. 27
Phương pháp PSOLA 28
3.4. Các phương pháp tổng hợp bằng tiên đoán tuyến tính. 29
3.5. Các mô hình dựa trên hàm Sin. 30
Chương 4: Kỹ thuật tổng hợp PSOLA 31
4.1 Cơ sở của kỹ thuật TD-PSOLA 31
4.1.1 Điều khiển tần số cơ bản của tín hiệu tiếng nói. 31
4.1.2. Kỹ thuật PSOLA trên miền thời gian. 31
4.2 Các kỹ thuật PSOLA khác. 33
4.2.1 Kỹ thuật FD-PSOLA 33
4.2.2 Kỹ thuật LP-PSOLA 33
4.3 Chi tiết kỹ thuật PSOLA trên miền thời gian: 33
Thuật toán TD-PSOLA chi tiết: Tính tín hiệu tổng hợp bằng PSOLA từ tín hiệu nguồn 34
Chương 5: Đặc điểm tiếng Việt và bài toán tổng hợp. 35
5.1 Đặc điểm tiếng Việt 35
5.1.1. Âm tiết 35
5.1.2 Âm tố. 38
5.1.3. Âm vị 39
5.1.4. Tiếng. 39
5.1.5. Hình vị 39
5.1.6. Hệ thống âm vị tiếng Việt 40
5.2 Bài toán tổng hợp tiếng Việt 42
5.2.1. Lựa chọn phương pháp thích hợp cho bài toán tổng hợp tiếng Việt 42
5.2.2. Các vấn đề phải giải quyết khi xây dựng bộ tổng hợp tiếng Việt: 43
Phần 2: Bộ tổng hợp tiếng Việt. 46
Chương 6 Phân tích tần số cơ bản và xác định điểm đánh dấu pitch. 46
6.1 Hạn chế của lấy cửa sổ và giải pháp. 46
6.2 Hạn chế của lấy mẫu và giải pháp. 47
6.3 Thuật toán dò tần số cơ bản sử dụng hàm tự tương quan. 48
6.4 Thuật toán xác định các điểm đánh dấu pitch (pitch marker) trên tín hiệu tiếng nói: 50
7.1 Năng lượng tại điểm ghép nối 51
7.2 Tần số cơ bản tại điểm ghép nối 51
7.3 Pha tại điểm ghép nối 52
7.4 Phổ tại điểm ghép nối 52
7.4.1 Làm trơn phổ sử dụng LP 53
7.4.2 Dịch chuyển cực LP 55
7.4.3 Nội suy LSF. 58
7.4.4 Áp dụng: 60
7.4.5 Kết quả: 60
Chương 8 Tổng hợp thanh điệu. 62
8.1 Biến đổi tần số cơ bản. 62
8.1.1 Tần số cơ bản các thanh điệu tiếng Việt 62
8.1.2 Mô hình biểu diễn tần số cơ bản các thanh điệu. 64
8.2 Biến đổi độ dài 66
8.2.1 Nhận xét về biến đổi độ dài giữa các thanh trong tiếng Việt 66
8.2.2 Mô hình biến đổi độ dài của các thanh điệu. 66
8.3 Biến đổi biên độ. 67
8.3.1 Biến đổi biên độ của các thanh điệu. 67
8.3.2 Mô hình biên độ của các thanh điệu. 67
Phần 3: Chương trình tổng hợp Tiếng Việt. 69
Chương 9 Xây dựng chương trình tổng hợp tiếng Việt 69
9.1 Tổng quan chương trình. 69
9.2. Chức năng đọc ghi file .wav và phát tiếng nói ra loa. 70
9.2.1. Chức năng đọc ghi file .wav. 70
9.2.2. Chức năng phát tiếng nói ra loa. 71
9.3. Chức năng phân tích tần số cơ bản của tín hiệu tiếng nói 71
9.3. Chức năng thực hiện thuật toán PSOLA trên miền thời gian: 71
9.4. Chức năng phân tích, tổng hợp LPC, LSP 71
9.4.1 Chức năng phân tích. 71
9.4.2 Chức năng tổng hợp. 72
9.5. Chức năng ghép nối 2 diphone. 72
9.6 Chức năng tổng hợp thanh điệu. 73
Phần 4: Đánh giá kết quả và kết luận. 74
Phụ lục. 75