161
ประสิทธิภาพของ LPC และ LSP ในการรูจําแนวทางเดินเสียงพูดภาษาไทย รวมกับโครงขายประสาทเทียม AN EFFICIENT OF LPC AND LSP TRAJECTORY IN THAI SPEECH RECOGNITION WITH ARTIFICIAL NEURAL NETWORKS สุวรรณ รื่นสุคนธ SUWAN RUENSUKHON วิทยานิพนธนี้เปนสวนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิศวกรรมศาสตรมหาบัณฑิต สาขาวิศวกรรมไฟฟา ภาควิชาวิศวกรรมไฟฟา คณะวิศวกรรมศาสตร มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี .. 2552

ประสิทธิภาพของ LPC และ LSP ในการรู จําแนวทางเดินเ

  • Upload
    dotuyen

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ประสิทธิภาพของ LPC และ LSP ในการรูจําแนวทางเดินเสียงพูดภาษาไทย รวมกับโครงขายประสาทเทียม

AN EFFICIENT OF LPC AND LSP TRAJECTORY IN THAI SPEECH

RECOGNITION WITH ARTIFICIAL NEURAL NETWORKS

สุวรรณ รื่นสุคนธ SUWAN RUENSUKHON

วิทยานิพนธนี้เปนสวนหน่ึงของการศึกษาตามหลักสูตรปริญญาวิศวกรรมศาสตรมหาบัณฑิต สาขาวิศวกรรมไฟฟา ภาควิชาวิศวกรรมไฟฟา

คณะวิศวกรรมศาสตร มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี

พ.ศ. 2552

Page 2: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ประสิทธิภาพของ LPC และ LSP ในการรูจําแนวทางเดินเสียงพูดภาษาไทย รวมกับโครงขายประสาทเทียม

สุวรรณ ร่ืนสุคนธ

วิทยานิพนธนี้เปนสวนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิศวกรรมศาสตรมหาบัณฑิต สาขาวิศวกรรมไฟฟา ภาควิชาวิศวกรรมไฟฟา

คณะวิศวกรรมศาสตร มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี

พ.ศ. 2552

Page 3: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

AN EFFICIENT OF LPC AND LSP TRAJECTORY IN THAI SPEECH RECOGNITION WITH ARTIFICIAL NEURAL NETWORKS

SUWAN RUENSUKHON

A THESIS SUMITTED IN PARTIAL FULFILMENT OF THE REQUIREMENT FOR THE DEGREE OF MASTER OF ENGINEERING

IN ELECTRICAL ENGINEERING DEPARTMENT OF ELECTRICAL ENGINEERING FACULTY OF ENGINEERING

RAJAMANGALA UNIVERSITY OF TECHNOLOGY THANYABURI 2009

Page 4: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

วิทยานิพนธฉบับนี้เปนงานวิจัยท่ีเกิดจากการคนควาและวิจัยขณะท่ีขาพเจาศึกษาอยูในคณะวิศวกรรมศาสตร มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี ดังนั้นงานวิจัยในวิทยานิพนธฉบับนี้ถือเปนลิขสิทธ์ิของมหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรีและขอความตางๆในวิทยานิพนธฉบับนี้ ขาพเจาขอรับรองวาไมมีการคัดลอกหรือนํางานวิจัยของผูอ่ืนมานําเสนอในช่ือของขาพเจา นายสุวรรณ ร่ืนสุคนธ

COPYRIGHT © 2009 ลิขสิทธิ์ พ.ศ. 2552 FACULTY OF ENGINEERING คณะวิศวกรรมศาสตร RAJAMANGALA UNIVERSITY OF TECHNOLOGY THANYABURI มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี

Page 5: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

หัวขอวิทยานิพนธ ประสิทธิภาพของ LPC และ LSP ในการรูจําแนวทางเดินเสียงพูดภาษาไทยรวมกับโครงขายประสาทเทียม

นักศึกษา นายสุวรรณ ร่ืนสุคนธ รหัสประจําตัว 114960402012-7 ปริญญา วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชา วิศวกรรมไฟฟา แขนงวิศวกรรมอิเล็กทรอนิกสและโทรคมนาคม ปการศึกษา 2552 อาจารยผูควบคุมวิทยานิพนธ ดร.จักรี ศรีนนทฉัตร

บทคัดยอ

วิทยานิพนธฉบับนี้ไดนําเสนอการวิเคราะหหาแนวทางเดินเสียงพูดโดยใชการสกัดคาคุณลักษณะสําคัญแบบสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ในการวิเคราะหหาชวงของระบบท่ีดีท่ีสุด และนํามาวิเคราะหรวมกับโครงขายประสาทเทียม (ANN) เพื่อใหระบบมีการรูจดจําท่ีดีข้ึน และมีความแมนยําในการคัดแยกสัญญาณเสียงแตละสัญญาณออกจากกัน สัญญาณเสียงท่ีนํามาทําการวิเคราะหเปนสัญญาณเสียง “ ศูนย ” ถึง “ เกา ” ซ่ึงเปนลําดับจํานวนนับตัวเลขภาษาไทยจํานวน 10 คํา แบงเปนสัญญาณเสียงผูชาย 100 คน และสัญญาณเสียงผูหญิง 100 คน บันทึกสัญญาณคนละ 3 รอบ จะมีขอมูลโดยรวมจํานวน 600 สัญญาณเสียงท้ังชายและหญิง โดยแบงเปนกลุมตัวอยางและกลุมทดสอบ ในสวนแรกจะนําขอมูลท้ังหมดมาวิเคราะหหาคุณลักษณะสําคัญของ LPC และ LSP ท่ีอันดับ 10, 25, 50 และ 75 ตามลําดับ และนํามาทดสอบหาระยะหางระหวางขอมูล เพื่อเลือกชวงท่ีเหมาะสมไปทําการเรียนรูจดจํากับระบบโครงขายประสาทเทียม จากการสกัดคาคุณลักษณะสําคัญ LSP อันดับท่ี 50 จะเปนชวงเหมาะสมที่สุด จึงนํามาทําการเรียนรูจดจําระบบโครงขายประสาทเทียม โดยความแมนยําในการรูจําของระบบโครงขายประสาทเทียมในกลุมทดสอบท่ีเปนสัญญาณเสียงผูหญิงนั้นใหความถูกตองสูงสุดอยูท่ี 99 เปอรเซ็นต ในชุดสัญญาณเสียงตัวเลข “ ส่ี ” และความถูกตองเฉล่ียอยูท่ี 84.20 เปอรเซ็นต สวนในกลุมทดสอบท่ีเปนสัญญาณเสียงผูชายนั้นใหความถูกตองสูงสุดอยูท่ี 99 เปอรเซ็นต ในชุดสัญญาณเสียงตัวเลข “ ศูนย ” และความถูกตองเฉล่ียอยูท่ี 87.40 เปอรเซ็นต คําสําคัญ : การประมวลผลสัญญาณเสียง, การรูจําเสียงพูด, การเขารหัสเสียงพูด, แนวทางเดินเสียง,

สัมประสิทธ์ิคูเสนสเปกตรัม, โครงขายประสาทเทียม

Page 6: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

Thesis Title : AN EFFICIENT OF LPC AND LSP TRAJECTORY IN THAI SPEECH RECOGNITION WITH ARTIFICIAL NEURAL NETWORKS

Student Name : Mr.Suwan Ruensukhon Student ID : 114960402012-7 Degree Award : Master of Engineering Study Program : Electrical Engineering (Electronics and Telecommunication Engineering) Academic Year : 2009 Thesis Advisor : Dr.Jakkree Srinonchat

ABSTRACT

This thesis presents the analysis speech trajectory using line spectral pair coefficients (LSPs) combine with Artificial Neural Networks (ANN) to improve the speech recognition technique. LSPs technique is used to extract the speech feature and then ANN is used to improve the recognize process of speech features.

The experiment used the Thai numeric sound “ Soon ” “ Neung ” “ Song ” “ Sarm ” “ See ” “ Ha ” “ Hog ” “ Jed ” “ Pad ” and “ Kaw ” from 100 males and females to be input speech signal which each speaker speaks three times of each word. Thus, there are 600 input speech signal that divides to be a set of training and testing signal. Firstly, all the speech signal is extracted the feature using 10, 25, 50 and 75 ordered of LPC and LSP techniques. The feature is then calculated the distance of each data to be the input of ANN.

The results of feature extraction show that the trajectory of speech feature in 50 orders of LSP is appropriate and optimize to be the input of ANN. The ANN provides the accuracy recognition approximately 99% of the “See” signal and the average accuracy recognition is 84.20% for female speech waveform respectively. For the male speech, the ANN provides the accuracy recognition approximately 99% of the “Soon” signal and the average accuracy recognition is 87.40% respectively. Keywords : Speech Processing, Speech Recognition, Speech Coding, Speech Trajectory, Line

Spectrum Pairs , Artificial Neural Network

Page 7: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

กิตติกรรมประกาศ

วิทยานิพนธนี้สําเร็จลุลวงไปได ดวยความชวยเหลือเปนอยางดีของ ดร.จักรี ศรีนนทฉัตร ซ่ึงเปนอาจารยผูควบคุมวิทยานิพนธ และสมาชิกในหองปฏิบัติการและวิจัยทางดานการประมวลผลสัญญาณทุกทานสําหรับคําแนะนําและขอคิดเห็นตางๆ ท้ังในสวนของการทํางานวิจัยและในสวนของการทํารูปเลมวิทยานิพนธ ขอขอบพระคุณคณาจารยทุกทานท่ีไดอบรมส่ังสอนและประสิทธ์ิประสาทความรูวิชาการตางๆ ใหตลอดระยะเวลาที่ผานมา ขอขอบคุณนักศึกษาภาควิชาวิศวกรรมอิเล็กทรอนิกสและโทรคมนาคม คณะวิศวกรรมศาสตร มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี , นักศึกษาคณะบริหารธุรกิจ มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี และนักศึกษามหาวิทยาลัยเทคโนโลยีราชมงคลศรีวิชัย วิทยาเขตภาคใต สําหรับขอมูลเสียงท้ังหมดท่ีนํามาใชในงานวิจัยและวิทยานิพนธนี้ ขอขอบคุณบิดามารดา ญาติพี่นองและเพื่อนสนิททุกคนสําหรับกําลังใจท่ีมีใหเสมอมา สุวรรณ ร่ืนสุคนธ 30 สิงหาคม 2552

Page 8: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญ

หนา บทคัดยอภาษาไทย ก บทคัดยอภาษาอังกฤษ ข กิตติกรรมประกาศ ค สารบัญ ง สารบัญตาราง ฉ สารบัญรูป ฌ คําอธิบายสัญลักษณและคํายอ ฏ บทท่ี 1 บทนํา 1

1.1 ความเปนมาและความสําคัญของปญหา 1 1.2 ความมุงหมายและวัตถุประสงค 1 1.3 ขอบเขตของการวิจยั 2 1.4 ข้ันตอนการวิจัย 2 1.5 ขอจํากัดของการวิจยั 2

บทท่ี 2 วรรณกรรมหรืองานวิจัยท่ีเกีย่วของ 3 2.1 อวัยวะในการออกเสียงและภาษาศาสตร 3 2.2 การวิเคราะหสัญญาณเสียง 8 2.3 การสกัดคาคุณลักษณะสําคัญ 15

โครงขายประสาทเทียม 24 2.4 2.5 งานวิจัยท่ีเกี่ยวของ 33

บทท่ี 3 วิธีการดําเนินการวจิัย 36 3.1 การประมวลผลสัญญาณเสียง 37 3.2 การสกัดคาคุณลักษณะสําคัญ 46 3.3 กรอบเปอรเซ็นตระยะหางระหวางขอมูล 49 3.4 การเรียนรูจําดวยระบบโครงขายประสาทเทียม 50

บทท่ี 4 ผลการวิจัย 56 4.1 ลักษณะของขอมูลในกลุมตัวอยางและกลุมทดสอบ 56 4.2 ผลของขอมูลจากการสกัดคาสัมประสิทธ์ิทํานายพนัธะเชิงเสน 57 4.3 การเปรียบเทียบขอมูลจากการสกัดคาสัมประสิทธ์ิทํานายพนัธะเชิงเสนระหวาง

สัญญาณเสียงผูชายกับสัญญาณเสียงผูหญิง 63

Page 9: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญ (ตอ)

หนา 4.4 ผลของขอมูลจากการสกัดคาสัมประสิทธ์ิคูเสนสเปกตรัม 70 4.5 การเปรียบเทียบขอมูลจากการสกัดคาสัมประสิทธ์ิคูเสนสเปกตรัม ระหวางสัญญาณ

เสียงผูชายกับสัญญาณเสียงผูหญิง 77 4.6 ผลของการจัดการกับระบบการเรียนรูจดจําขอมูลโครงขายประสาทเทียม 82

บทท่ี 5 สรุปผลการวิจัยและขอเสนอแนะ 90 5.1 สรุปผลของการเลือกคาการสกัดคาคุณลักษณะสําคัญและการเรียนรูจํา 90 5.2 ขอเสนอแนะและแนวทางในการพัฒนา 92

เอกสารอางอิง 93 ภาคผนวก 96 ก ตัวอยางสัญญาณเสียงพูด 96 ข ตัวอยางคาสัมประสิทธ์ิคูเสนสเปกตรัม 107 ค ตัวอยางขอมูลการรูจดจําโครงขายประสาทเทียม 118 ง ผลงานวิจัยตีพิมพ 129 ประวัติผูเขียน 145

Page 10: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญตาราง ตารางท่ี หนา 2.1 ฟงกช่ันกระตุนของโครงขายประสาทเทียมชนิดตางๆ 30 3.1 คาตัวแปรของสัมประสิทธ์ิทํานายพันธะเชิงเสนท่ีอันดับแตกตางกัน 48 3.2 คาตัวแปรของสัมประสิทธ์ิคูเสนสเปกตรัมท่ีอันดับแตกตางกัน 49 3.3 รายละเอียดของกรอบระยะหางขอมูลของสัมประสิทธ์ิ LPC และ LSP ชวงท่ีดีท่ีสุด 50 4.1 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 58 4.2 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 59 4.3 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 59 4.4 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลที่จะครอบคลุมสัญญาณเสียงนัน้ๆ 60 4.5 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูหญิงแสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 61 4.6 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 61 4.7 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 62 4.8 คาสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 62 4.9 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 63 4.10 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 64 4.11 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 50 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 64 4.12 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 75 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 65

Page 11: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญตาราง (ตอ) ตารางท่ี หนา 4.13 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 70 4.14 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 71 4.15 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 71 4.16 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 72 4.17 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 73 4.18 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 73 4.19 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 74 4.20 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ 74 4.21 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 75 4.22 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 76 4.23 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 76 4.24 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง 77 4.25 อัตราความถูกตองในการรูจําเสียงพูดตัวเลขภาษาไทยของโครงขายประสาทเทียมกลุม

ทดสอบผูชาย 83 4.26 อัตราความถูกตองในการรูจําเสียงพูดตัวเลขภาษาไทยของโครงขายประสาทเทียมกลุม

ทดสอบผูหญิง 84

Page 12: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญตาราง (ตอ) ตารางท่ี หนา 5.1 เปรียบเทียบอัตราความถูกตองในการรูจาํของสัมประสิทธิ์คูเสนสเปกตรัมกับโครงขายประสาท

เทียม 91

Page 13: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญรูป รูปท่ี หนา 2.1 อวัยวะชองปากในสวนการสรางเสียงพูด 4 2.2 อวัยวะภายในของระบบการพูดของมนุษย 5 2.3 ระดับเสียงสูง เสียงตํ่า ของเสียงวรรณยุกต 8 2.4 ลักษณะของคาฟงกช่ันกรอบแบบตางๆ 10 2.5 ฟงกชันกรอบชนิด Hamming Window 11 2.6 สัญญาณแบบตอเนื่องตนแบบ 12 2.7 สัญญาณท่ีไดจากการสุมตัวอยาง 12 2.8 ลักษณะการตัวหวัทายของสัญญาณเสียง 13 2.9 การกระจายจุดตัดศูนยของ Voice และ Unvoiced 13 2.10 สเปกตรัมของเสียงชวงส้ันๆ และคาสัมประสิทธ์ิ LPC ของเสียงท่ีอันดับ ตางกัน 19 p

2.11 การวางเรียงสลับของรากของพหุนามคูเสนสเปกตรัม P(z) และ Q(z) 23 2.12 ความสัมพันธระหวางรากของ A(z) กับรากของคูเสนสเปกตรัม P(z) และ Q(z) 23 2.13 รูปแบบโครงขายประสาทเทียมหนึ่งเซลลและโครงขายสมองมนุษยทางชีววิทยา 26 2.14 สถาปตยกรรมโครงขายประสาทเทียม 27 2.15 เซลลประสาทแบบหลายอินพุต 29 2.16 (ก)โครงขายประสาทเทียมแบบยอ (ข)โครงขายประสาทเทียมแบบแสดงการเช่ือมโยง 31 2.17 โครงขายประสาทเทียมแบบหลายช้ัน 32 2.18 โครงขายประสาทเทียมหลายช้ันแบบยอ 33 3.1 แผนภาพแสดงการทํางานของโครงสรางท้ังระบบ 36 3.2 ตัวเลขท่ีแสดงใหกลุมตัวอยางและกลุมทดสอบอานออกเสียงภาษาไทย 38 3.3 อารมณตางๆ ท่ีไมสมควรแสดงในขณะออกเสียงตอนเก็บขอมูล 38 3.4 รายละเอียดของโปรแกรม Gold Wave ท่ีนํามาใชในการเก็บขอมูล 39 3.5 รายละเอียดของการเก็บขอมูลกลุมตัวอยางและกลุมทดสอบ 39 3.6 ตัวอยางสัญญาณเสียงพดูท่ีไดทําการบันทึกในกลุมสัญญาณเสียงท่ีใชในการวิเคราะห 40 3.7 ตัวอยางสัญญาณเสียงพดูท่ีไดทําการบันทึกในกลุมสัญญาณเสียงท่ีใชในการทดสอบ 40

ไดอะแกรมในสวนของการประมวลผลสัญญาณเสียง 41 3.8 3.9 ลักษณะสัญญาณเสียงท่ีทําการแยกใหเปนหมวดของเสียงแตละเสียงแบบหยาบ 42 3.10 ตัวอยางการตัดสัญญาณเสียงดวยหลักการ 43 3.11 ตัวอยางการปรับบรรทัดฐานแอมปลิจูด 45

Page 14: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญรูป (ตอ) รูปท่ี หนา 3.12 ไดอะแกรมโครงสรางของการสกัดคาคุณลักษณะสําคัญ 46 3.13 ไดอะแกรมของการเรียนรูจําของโครงขายประสาทเทียมเทียบกับ LSP 51 3.14 สวนประกอบโครงขายประสาทเทียม 3 เลเยอร 52 3.15 โครงขายประสาทเทียมแบบแพรยอนกลับท่ีมีช้ันกลาง 1 ช้ัน 52 3.16 อธิบายการสงผานขอมูลทางดานอินพุตของระบบโครงขายประสาทเทียม 55 3.17 การสงขอมูลอินพุตภายในระบบโครงขายประสาทเทียม 55 4.1 ตัวอยางสัญญาณเสียงท่ีไดจากการบันทึก 56 4.2 การสรางกรอบของสัญญาณเสียงเพื่อทําการแยกสัญญาณเสียงใหเปนกลุม 56 4.3 ลักษณะของสัญญาณเสียงท่ีไดทําการผานกระบวนการปรับระดับสัญญาณ 57 4.4 ตัวแทนของสัญญาณเสียงเปรียบเทียบกับกรอบระยะหางระหวางขอมูล 57 4.5 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูชาย 66 4.6 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูหญิง 66 4.7 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูชาย 67 4.8 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูหญิง 67 4.9 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูชาย 68 4.10 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูหญิง 68 4.11 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูชาย 69 4.12 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูหญิง 69 4.13 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูชาย 78 4.14 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูหญิง 78 4.15 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูชาย 79 4.16 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูหญิง 79 4.17 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูชาย 80

คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูหญิง 80 4.18 4.19 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูชาย 81 4.20 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูหญิง 81 4.21 ลักษณะของขอมูลท่ีไมไดผานกระบวนการเรียนรูจดจําของโครงขายประสาทเทียม 82 4.22 ลักษณะของขอมูลท่ีผานกระบวนการเรียนรูจดจําของโครงขายประสาทเทียม 83

Page 15: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สารบัญรูป (ตอ) รูปท่ี หนา 4.23 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 0.5 เปอรเซ็นต 85 4.24 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 0.5 เปอรเซ็นต 85 4.25 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 0.75 เปอรเซ็นต 86 4.26 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 0.75 เปอรเซ็นต 86 4.27 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 1 เปอรเซ็นต 87 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือนํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 1 เปอรเซ็นต 87

4.28

4.29 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือนํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 1.5 เปอรเซ็นต 88

4.30 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือนํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 1.5 เปอรเซ็นต 88

4.31 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือนํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 2 เปอรเซ็นต 89

4.32 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือนํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 2 เปอรเซ็นต 89

5.1 อัตราความถูกตองของการคัดกรองขอมูลสัญญาณเสียงระหวางสัมประสิทธ์ิการทํานายพันธะแบบเชิงเสนกับสัมประสิทธ์ิคูเสนสเปกตรัม 90

Page 16: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

คําอธิบายสัญลักษณและคํายอ

Artificial Neural Network ANN Barlett Windows BLW Blackman Windows BMW Hamming Windows HNW Hanning Windows HMW Levinson Durbin Theory LDT Linear Predictive Coefficient LPC Linear Predictive Coding Derived Cepstrum LPCC Line Spectrum Pairs LSP Mean Squared Error MSE Mel Frequency Cepstral Coefficient MFCC Multiple Layer Perceptron MLP Nonuniform Frequency Scale NFS Short Time Window STW Single Layer Perceptron SLP

Page 17: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

บทที ่1 บทนํา

1.1 ความเปนมาและความสําคัญของปญหา การรูจดจําเสียง หมายถึง การที่ทําใหคอมพิวเตอรสามารถเขาใจถึงเสียงของมนุษยหรือรับรูในการส่ังงานดวยเสียงได ซ่ึงการท่ีจะทําใหคอมพิวเตอรเขาใจเสียงของมนุษยไดนั้นมีประโยชนหลายประการ เชน การใชงานอุปกรณไรสาย การใชงานอุปกรณท่ีมีขนาดเล็กท่ีไมสามารถตอกับอุปการณท่ีปอนขอมูลไดสะดวก เชน Palm, Pocket Pc, Mobile Phone, Computer และ การใชงานในรถยนต เปนตน นอกจากนี้ระบบรูจํายังสามารถชวยใหกลุมคนพิการสามารถส่ังงานในการใชเคร่ืองคอมพิวเตอรไดสะดวกสบายมากยิ่งข้ึนอีกดวย เชน ผูพิการทางสายตาจะมีปญหาอยางมากในการใชเมาส ผูพิการทางแขนก็จะไมสามารถใชงานในสวนของ คียบอรด และเมาสไดเชนกัน ถาระบบรูจําเสียงมีความแมนยําในการตัดสินใจมากข้ึน ก็จะทําใหการทํางานของกลุมคนผูพิการมีความสะดวกสบายและสามารถที่จะปฏิบัติงานไดเทาเทียมกับบุคคลท่ีความปกติทางรางกาย ในปจจุบันระบบรูจําเสียงภาษาไทยยังไมไดมีการพัฒนาข้ึนมาเปนผลิตภัณฑใหใชงานไดดี โดยระบบการรูจําเสียงท่ีใชงานไดจริงจะมีในตางประเทศซ่ึงสามารถประยุกตใชกับภาษาไทยไดแตยังเกิดความผิดพลาดอยูมาก เนื่องจากความสับซอนของภาษาไทย สําหรับงานวิจัยนี้ เปนการวิจัยและพัฒนาการจําแนกเสียงพูดแบบคําเดี่ยว ไมข้ึนกับผูพูด จํากัดเฉพาะเสียง “ศูนย หนึ่ง สอง สาม ส่ี หา หก เจ็ด แปด และ เกา” โดยใชหลักการวิเคราะหแนวทางเดินเสียงในรูปแบบของการสกัดคาคุณลักษณะสําคัญแบบการทํานายพันธะเชิงเสนและสัมประสิทธ์ิคูเสนสเปกตรัม ควบคูกับวิธีการเรียนรูจดจําโครงขายประสาทเทียม ซ่ึงผลจากงานวิจัยนี้จะไดตัวแทนของเสียงพูด "ศูนย", "หนึ่ง", "สอง", "สาม", "ส่ี", "หา", "หก", "เจ็ด", "แปด" และ "เกา" โดยไมคํานึงถึงผูพูด งานวิจัยนี้เปนการนําเสนอเทคนิคในการรูจําสัญญาณเสียงพูดภาษาไทย โดยมุงเนนท่ีจะศึกษาในสวนของแนวทางเดินของเสียงสําหรับสัมประสิทธ์ิ LPC และสัมประสิทธ์ิ LSP ท่ีอันดับแตกตางกัน ซ่ึงจะเปรียบเทียบจากเปอรเซ็นตระยะหางจากคาเฉล่ียของตัวเลขท้ังหมดในการหาชวงท่ีเหมาะสม และนํามาพัฒนาหาคาสัมประสิทธ์ิท่ีดีท่ีสุด เพ่ือใหไดคาของอัตราความถูกตองเพิ่มมากข้ึนโดยจะใชระบบโครงขายประสาทเทียมทําการเรียนรูจดจํา มาพัฒนาคุณสมบัติใหสอดคลองกับงานวิจัย

1.2 ความมุงหมายและวตัถุประสงค 1.2.1 เพื่อวิเคราะหวิธีการท่ีเหมาะสมในการสรางระบบรูจําเสียง ท่ีเปนตัวแทนตัวเลขของ

เสียงพูด

Page 18: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

1.2.2 เพื่อพัฒนาระบบการรูจําใหมีประสิทธิภาพมากข้ึน 1.2.3 เพื่อศึกษาแนวทางเดินของสัญญาณเสียงพูดและวิธีการประมวลผลสัญญาณเสียง 1.2.4 เพื่อนําแบบจําลองโครงขายประสาทเทียมมาประยุกตใชในการรูจาํเสียงพูด 1.2.5 เพื่อใชประโยชนในการสรางระบบรูจําเสียงท่ีสามารถใชงานไดในทางปฏิบัติ

1.3 ขอบเขตของการวิจัย 1.3.1 ศึกษาระบบการรูจําตัวเลขภาษาไทยแบบไมข้ึนกับผูพูดใหเปนแนวทางท่ีเปนจริงได 1.3.2 สามารถพัฒนาคาลักษณะสําคัญโดยใชโครงขายประสาทเทียมในการรูจําได 1.3.3 สามารถจําแนกคาลักษณะสําคัญของเสียงพูดตัวเลขภาษาไทย ศูนย ถึง เกาได 1.3.4 สรางความถูกตองในการรูจําเสียงพูดตัวเลขภาษาไทยเฉล่ียใหไดสูงท่ีสุด

1.4 ขั้นตอนการวิจัย 1.4.1 ศึกษาขอมูลท่ีเกี่ยวของกับการวิเคราะหและการสังเคราะหสัญญาณเสียงพดู 1.4.2 ศึกษาการดึงคุณลักษณะเดนของสัญญาณเสียงพดู 1.4.3 ศึกษาการใชงานโปรแกรม MATLAB เพื่อการออกแบบโปรแกรม 1.4.4 ศึกษาการใชงานระบบโครงขายประสาทเทียมเพื่อใชในการรูจําเสียงพูด 1.4.5 เก็บรวบรวมขอมูลบันทึกเสียง คัดเลือกและจัดเก็บเปนหนวยเสียง 1.4.6 ทําการวิเคราะหสัญญาณเสียงพดูดวยโปรแกรม MATLAB และระบบโครงขายประสาท

เทียมในการรูจํา 1.4.7 วิเคราะหผลและสรุปผลการวิจัย

1.5 ขอจํากัดของการวิจัย 1.5.1 เสียงพูดท่ีใชในการวิจยัเปน ภาษาไทยภาคกลาง เทานั้น 1.5.2 เสียงพูดในการวิจัยเปนเสียงตัวเลขภาษาไทย ศูนย ถึง เกา ซ่ึงเปนคําโดด เสียงส้ันเทานั้น 1.5.3 น้ําเสียงของผูพูดจะไมแสดงถึงอารมณใดๆ ในขณะทําการบันทึกเสียง 1.5.4 ชวงอายขุองผูพูดอยูระหวาง 20 – 40 ป โดยเปนคนปกติไมมีการพิการทางรางกายแตอยาง

ใด 1.5.5 สภาพรางกายของผูพูดตองอยูในสภาวะปกติ ไมเปนผลตอเสียงพูด 1.5.6 สภาพแวดลอมในขณะทําการบันทึกเสียงพูดเปนแบบปกติ (สัญญาณรบกวนอยูท่ี 0 -

0.5dB)

2

Page 19: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

บทที่ 2 วรรณกรรมหรืองานวิจัยที่เก่ียวของ

ในสวนนี้จะกลาวถึงทฤษฏีตางๆ ท่ีใชในการทําวิทยานิพนธฉบับนี้ โดยจะเร่ิมจากสวนของทฤษฏีทางดานภาษาศาสตร ซ่ึงจะเปนเร่ืองราวของอวัยวะท่ีใชในการออกเสียงและลักษณะของหนวยเสียงวรรณยุกต สระ พยัญชนะ และ พยางคของภาษาไทย ตามลําดับ โดยในเสียงภาษาไทยกจ็ะมีความแตกตางของเสียงท่ีตางไปจากภาษาอ่ืนๆอยางมากมาย เพราะในตัวของภาษาไทยเองไดประกอบไปดวยพยัญชนะถึง 44 ตัวอักษรท่ีผสมผสานกันโดยจะเช่ือมดวย สระและวรรณยุกต เปนตน ในสวนถัดมาจะกลาวถึงหลักการท่ีใชในการวิเคราะหเสียงพูด ไมวาจะเปนการจัดเก็บคําพูดในกลุมตัวอยางและกลุมทดสอบ โดยจะอธิบายถึงความจําเปนท่ีตองใชวิธีการวิเคราะหสัญญาณในชวงเวลาส้ันๆตามดวยการหาคาพลังงาน เพื่อท่ีจะใชในการแยกสวนของคําออกจากกลุมตัวอยาง และการหาคา คุณลักษณะสําคัญของสัญญาณในกลุมตัวอยางท่ีนํามาวิเคราะห ซ่ึงจะอธิบายรวมไปถึงระบบโครงขายประสาทเทียมเพื่อใชในการจําแนกแยกลักษณะของสัญญาณเสียงนั้นๆออกมาเพื่อใหเห็นถึงความแตกตางของสัญญาณ

2.1 อวัยวะในการออกเสียงและภาษาศาสตร [1] มนุษยสามารถท่ีจะทําเสียงตางๆไดมากมาย ซ่ึงบางเสียงออกไดสะดวกและสามารถฟงไดชัดเจน แตเสียงบางเสียงอาจจะออกมาไมสะดวกและฟงไดไมชัดเจน ดังนั้นมนุษยจึงไดเลือกเสียงมาใชในการส่ือสารเพื่อท่ีจะเขาใจในความหมายของกันและกัน จึงเลือกมาเฉพาะบางเสียงที่ออกไดสะดวกและฟงไดชัดเจนซ่ึงจะทําใหพอเห็นถึงความแตกตางของเสียงนั้นๆได เสียงท่ีเปลงออกมาจึงจัดเปนสัญลักษณ เนื่องจากมนุษยสมมุติใหเสียงแทนส่ิงใดส่ิงหนึ่งตามความเขาใจหรือตามแตท่ีตกลงกันระหวางกลุมหรือระหวางชาติ ทําใหกลุมเสียงหรือคําของแตละภาษาไมตรงกัน ภาษาแตละภาษาจึงมีลักษณะเฉพาะของตัวเองท่ีแตกตางกันไปในแตละภูมิประเทศ 2.1.1 อวัยวะท่ีใชในการออกเสียง ธรรมชาติไดกําหนดตําแนงของอวัยวะ ท่ีใชในการทําใหเกิดเสียงของมนุษยเอาไวคือ ริมฝปาก ฟน เพดาน และล้ิน ท่ีอยูตามสําดับตลอดของกลามเน้ือชองคอ เพื่อทําใหสามารถเปล่ียนขนาดและรูปรางไดตามตองการ ดวยการเปลงคําพูดของมนุษยนั้นจะทําใหเกิดการเปล่ียนแปลงของชองทางเดินเสียงท่ีตางออกไป ซ่ึงลักษณะของเสียง ทุมหรือแหลมนั้นก็ข้ึนอยูกับผูพูด เพศ อายุ และสภาพสถานะของรางกายในขณะนั้นๆดวย แตละสวนท่ีใชในการกําเนิดเสียงนั้นก็มีความสําคัญและหนาท่ีแตกตางกันออกไป [1]

Page 20: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.1 อวัยวะชองปากในสวนการสรางเสียงพูด [2]

ริมฝปาก (Lips) อวัยวะสวนท่ีสามารถเคล่ือนไหวไดมากและทําใหเสียงแตกตางกันไดมาก เราอาจจะบังคับริมฝปากใหอยูชิดกัน หางกัน ยื่นออกมาหรือหอกลมทําเปนรูปรี หรืออ่ืนๆ ก็ได ลักษณะริมฝปากตางๆ นี้ลวนแตมีอิทธิพลตอการออกเสียงและทําใหเสียงแตกตาง

ฟน (Teeth) เปนอวัยวะท่ีทําใหเกิดเสียงหลายชนิดเชน เม่ือฟนบนกดลงบนริมฝปากลางหรือกดฟนลาง ลมท่ีผานออกมาแรง จะลอดชองท่ีพอจะผานไดออกมา ทําใหเกิดเปนเสียงชนิดท่ีเรียกวา เสียงเสียดแทรกท่ีเกิดที่ฟน เกิดท่ีระหวางฟนบาง นอกจากนี้เนื่องจากปลายล้ินอยูใกลกับฟน ปลายล้ินซ่ึงมักจะทําอาการตางๆ บริเวณหลังฟนบอยๆ ทําใหเกิดเสียงท่ีเรียกวา เสียงเกิดท่ีฟน (Dental Sound)

ปุมเหงือก (Teeth Ridge) คือสวนนูนออกมาอยูหลังฟนดานบน ถาเอาล้ินแตะดูจะรูสึกวามีลักษณะเปนคล่ืน ปุมเหงือกเปนบริเวณท่ีเกิดเสียงปุมเหงือก (Alveolar Sound) ปุมเหงือกเปนตําแหนงสําคัญในการอธิบายเร่ืองตําแหนงเสียงได

เพดานแข็ง (Hard Palate palatal) หรือเพดานปาก หมายถึงเฉพาะเพดานท่ีโคงเปนกระดูกแข็ง เปนตําแหนงสําคัญอีกตําแหนงหนึ่งในการอธิบายท่ีเกิดเสียงตําแหนงหนึ่ง

เพดานออน (Soft Palate velar) คือสวนของเพดานท่ีอยูตอจากเพดานแข็งไปขางใน มีลักษณะเปนกระดูกออนที่ขยับขึ้นลงได เวลาหายใจเพดานออนและล้ินไกซ่ึงอยูปลายเพดานออนจะลดระดับลงมาเปนชองใหลมออกไปทางจมูก ฉะนั้นเวลาที่เราไมพูด ปลายเพดานออนและล้ินไกจะลดระดับลงมา เวลาพูดสวนใหญปลายเพดานออนและล้ินไกจะถูกยกข้ึนไปจรดกับหลังคอ นอกจากเวลาออกเสียงนาสิกเทานั้นท่ีเพดานจะลดระดับลงมา

ล้ินไก (Uvula) เปนกอนเนื้อเล็กๆ ท่ีอยูตอจากปลายเพดานออนตรงกลางปาก สามารถส่ันรัวได

4

Page 21: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ล้ิน (Tongue) ล้ินเปนสวนท่ีเคล่ือนไหวมากท่ีสุดในการออกเสียงพูด จึงตองแบงออกเปนสวนๆดวยกัน ตามหนาท่ีในการออกเสียง ปลายล้ิน คือสวนปลายซ่ึงสามารถจะยกข้ึนไปแตะอวัยวะสวนตาง ๆในปากตอนบนไดโดยงาย หนาล้ิน คือสวนท่ีอยูตรงขามกับเพดานแข็ง ถาวางล้ินราบกับปากในขณะท่ีไมไดพูด โคนล้ิน คือสวนของลิ้นซ่ึงถาวางล้ินราบกันตามปกติจะอยูตรงขามกับเพดานออน

รูปท่ี 2.2 อวัยวะภายในของระบบการพูดของมนุษย [18]

ชองคอ (Pharynx) สวนของโพรงคอซ่ึงอยูถัดจากปากลงไปจนถึงเสนเสียง ล้ินปดชองคอ (Epiglottis) เปนกอนเนื้อเล็กๆคลายล้ินไกอยูตอจากโคนล้ินลงไปในลําคอมี

หนาท่ีปดชองลมขณะรับประทานอาหารและเปดชองลมขณะพูด กลองเสียง (Including vocal cords) เสนเสียง เปนอวัยวะท่ีสําคัญท่ีเกิดของเสียง เสนเสียงมี

ลักษณะเปนกลามเนื้อสองแผน ปดขวางอยูกับปากชองหลอดลมจากดานหลังมาดานหนา ระหวางเสนเสียงจะมีชองวางซ่ึงเปนทางใหลมผานเขาไปถึงปอดและออกจากปอดได ชองวางนี้เรียกวา ชองวางระหวางเสนเสียง เสนเสียงท้ังสองสามารถจะดึงออกใหหางจากกันหรือดึงเขามาชิดกันก็ได

5

Page 22: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ชองจมูกหรือโพรงจมูก (Nasal cavity) โพรงในชองจมูกซ่ึงอยูเหนือล้ินไกข้ึนไป เปนชองท่ีลมผานเสนเสียงข้ึนมาจะผานออกไปทางจมูกได เม่ือเวลาหายใจและเวลาออกเสียงนาสิก ในเวลาพูดเสียงอ่ืนๆ ล้ินไกจะถูกยกข้ึนปดชองจมูกเพื่อใหลมออกมาทางปาก

ชองปาก (Oral Cavity) หมายถึงบริเวณในปากท้ังหมด ซ่ึงเปนสวนสําคัญในการทําใหเกิดเสียงตามท่ีไดกลาวมาในขางตน 2.1.2 หนวยเสียงพยัญชนะ [1] ลักษณะท่ีลมลอดออกมาตามจุดตางๆในชองปากน้ัน ทําใหเกิดเสียงพยัญชนะชนิดตางๆข้ึนหลายลักษณะ แลวแตวาลมจะออกไปทางชองจมูกหรือลอดออกไปไดดวยการเสียดแทรกออกจากชองปากก็ตาม ในภาษาไทยน้ัน ลักษณะตางๆจะแบงออกเปนประเภทตางๆ ดังนี้ [2] 2.1.2.1 เสียงระเบิดหรือเสียงกัก (Stop) ลักษณะของเสียงล้ินไกปด ลมท่ีผานออกมาจะถูกกักไวและปลอยลมใหระเบิดออกมาทันที เสียงระเบิดในบางเสียงนั้นเปนเสียงกองคือเสนเสียงส่ันสะเทือน เชนเสียง บอ ดอ และ ออ สวนบางเสียงเปนเสียงไมกองคือเสนเสียงไมส่ันสะเทือน เชนเสียง ปอ ตอ กอ พอ ทอ คอ และ จอ สําหรับตําแนงท่ีเกิดเสียงระเบิดจะมีลักษณะคือ เสียงจะออกท่ีริมฝปากท้ังสองขางไดแกเสียง บอ ปอ และ พอ เสียงระเบิดท่ีปุมเหงือกไดแกเสียง ดอ ตอ และ ทอ เสียงระเบิดท่ีเพดานออนไดแกเสียง กอ และ ดอ เสียงระเบิดท่ีปุมเหงือกตอเพดานแข็งไดแกเสียง จอ สุดทายเสียงระเบิดท่ีเสนเสียงไดแกเสียง ออ นอกจากนี้เสียงระเบิดท่ีเปนเสียงกองหากนํามาแยกประเภทเสียงหนัก เบา ยังสามารถแยกไดอีก 2 ประเภทคือเสียงที่ลมพุงออกมาโดยแรงจะเปนพยัญชนะเสียงหนักหรือธนิต กับเสียงท่ีลมพุงออกมาไมแรงเรียกวาเปนพยัญชนะเสียงเบาหรือสิถิล 2.1.2.2 เสียงนาสิก (Nasal) เปนลักษณะของเสียงนาสิกท่ีล้ินไกจะเปด ปลอยใหลมผานไปทางชองจมูกเสนเสียงจะส่ันสะเทือนเกิดเปนเสียงกองมีอยู 3 ลักษณะ คือ ลักษณะแรกเมมริมฝปากเขากันจะไดเสียง มอ ลักษณะท่ีสองเอาล้ินกดปุมเหงือกกับเพดานแข็งคือ เสียง นอ ลักษณะท่ีสามใชล้ินจดเพดานออนคือเสียง งอ 2.1.2.3 เสียงเสียดแทรก (Fricative) คือเสียงท่ีอวัยวะในชองปากกักลมไมสนิทปลอยใหลมเสียดแทรกออกมา ซ่ึงจัดเปนเสียงไมกองมีอยู 3 ลักษณะ คือ ลักษณะแรกเกิดท่ีริมฝปากบนกับฟนลางไดแก เสียง ฟอ ลักษณะท่ีสองเกิดระหวางปุมเหงือกตอเพดานแข็งไดแก เสียง ซอ และลักษณะสามเปนเสียงเสียดแทรกท่ีลูกกระเดือกไดแกเสียง ฮอ 2.1.2.4 เสียงกึ่งเสียดแทรก (Affricate) เสียงท่ีเกิดข้ึนมี 2 ระยะคือ ระยะแรกจะต้ังตนเหมือนเสียงระเบิดแลวตอมาระยะท่ีสองกลายเปนเสียงเสียดแทรก ในสวนของภาษาไทยมีอยูเสียงเดียวคือเสียง ชอ ซ่ึงจัดเปนเสียงกอง 2.1.2.5 เสียงขางล้ิน (Lateral) เสียงนี้เม่ือลมพุงข้ึนมาก็ถูกปลายล้ินกักไวท่ีโคนฟนสองขางของล้ินตอนปลายจะหอในขณะท่ีปลายล้ินชอนข้ึน เปนเหตุใหขางล้ินท้ังสองดานมีชองใหลมหลุดออกไปได แลวลมท่ีไปออกทางริมฝปากเสียงนี้จะไดเสียง ลอ ซ่ึงเปนเสียงกอง

6

Page 23: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

2.1.2.6 เสียงรัว (Trill) เปนเสียงท่ีใชปลายล้ินปดกักลมท่ีปุมเหงือกแลวหอล้ินชอนข้ึนไปท่ีเพดานแข็งและรัวล้ินหลายๆคร้ังเพื่อปลอยใหลมท่ีถูกกักหลุดออกมาไดเปนระยะถ่ีๆกันเสียงนี้จัดเปนเสียงกองไดแกเสียง รอ 2.1.2.7 เสียงกึ่งสระหรืออัฒสระ (Semi-Vowel) เสียงพวกนี้เปลงออกมาอยางเสียงสระแตอาจเอาไปใชในตําแหนงตนพยางคไดเหมือนเสียงพยัญชนะจึงเรียกวา กึ่งสระ 2.1.3 หนวยเสียงสระ (Vowels) เสียงสระในภาษาไทยเปนเสียงท่ีลมพุงออกมาสะดวกและไมมีอวัยวะใดปดกั้นทางลมเอาไวเหมือนเสียงพยัญชนะ อวัยวะสวนท่ีใชทําเสียงสระคือล้ินกับริมฝปาก ในสวนของลิ้นนั้นใชทําเสียงมีอยู 3 สวนคือ ล้ินสวนหนา ล้ินสวนกลาง และล้ินสวนหลัง โดยล้ินแตละสวนสามารถกระดกข้ึนได 3 ระดับจะเกิดเปนเสียงสระท่ีแตกตางกันเชน การกระดกล้ินสวนหนาจะทําใหเกิดเสียง อิ อี เอะ เอ แอะ และ แอ สําหรับการกระดกล้ินสวนกลางจะทําใหเกิดเสียง อึ อื เออะ เออ อะ และ อา สุดทายการกระดกล้ินสวนหลังจะทําใหเกิดเสียง อุ อู โอะ โอ เอาะ และ ออ ตามลําดับ สวนริมฝปากเม่ือเวลาออกเสียงสระ ริมฝปากจะทําหนาท่ีกลอมเกลาเสียงและลักษณะของริมฝปากขณะออกเสียงสระจะแตกตางกันอยู 2 ลักษณะ คือ ริมฝปากแผออกไดแกเสียง อะ อา อิ อี อึ อื เอะ เอ แอะ แอ เออะ และ เออ กับริมฝปากหอกลมไดแก เสียง อุ อู โอะ โอ เอาะ และ ออ นอกจากอวัยวะท้ังสองท่ีใชในการออกเสียงสระแลวระยะเวลาการออกเสียงสระก็จะมีผลทําใหเกิดความแตกตางของสระเชนเดียวกันคือ ถาออกเสียงสระเปนระยะเวลาส้ันก็จะไดสระเสียงส้ัน แตถาออกเสียงใหยาวนานมากข้ึนก็จะไดสระเสียงยาวเปนตน เสียงสระในภาษาไทยท่ีกลาวในขางตนจัดเปนสระเดี่ยว ซ่ึงมีท้ังหมด 18 เสียง นอกจากน้ีเสียงสระในภาษาไทยยังมีเสียงสระประสมอยูอีก 6 เสียง ซ่ึงเกิดจากการเล่ือนของล้ินในระดับลดลงสูระดับตํ่า ไดแกเสียง เอียะ เอีย เอือะ เอือ อัวะ และ อัว ท้ังหมดนี้เปนสระประสมในภาษาไทย 2.1.4 หนวยเสียงวรรณยุกต (Tone) เสียงวรรณยุกตคือ เสียงสูง ต่ํา ในภาษาตางๆ ถาคํามีเสียงสูง ต่ําเปล่ียนแปลงไปและความหมายของคําไมเปล่ียน ก็เรียกภาษานั้นวาไมมีหนวยเสียงวรรณยุกต เชน ภาษาอังกฤษ ภาษาฝร่ังเศส เปนตน แตถาความหมายของคําเปล่ียนแปลงไปตามเสียงสูง ต่ํา จะเรียกวาเปนภาษาท่ีมีหนวยเสียงวรรณยุกต เสียงวรรณยุกตในภาษาไทยมีอยูดวยกัน 5 เสียงคือ 2.1.4.1 เสียงวรรณยุกตเอก (Low Tone) จะมีเสียงระดับตํ่า 2.1.4.2 เสียงวรรณยุกตสามัญ (Mid Tone) จะมีเสียงอยูในระดับกลาง 2.1.4.3 เสียงวรรณยุกตตรี (High Tone) จะมีเสียงในระดับสูง 2.1.4.4 เสียงวรรณยุกตโท (Falling Tone) จะมีหางเสียงตกลงในขณะออกเสียง 2.1.4.5 เสียงวรรณยุกตจัตวา (Rising Tone) จะมีหางเสียงสูงข้ึนในขณะออกเสียง

7

Page 24: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

เสียงของวรรณยุกตจะเปนเสียงท่ีเกาะมากับเสียงสระเสมอ โดยลักษณะทิศทางความถ่ีของเสียงโดยประมาณสามารถดูไดจากรูปท่ี 2.3 [4]

รูปท่ี 2.3 ระดับเสียงสูง เสียงตํ่า ของเสียงวรรณยกุต [4]

2.2 การวิเคราะหสัญญาณเสียง [17] การวิเคราะหสัญญาณเสียงพูดคือการหาคาพารามิเตอร ท่ีเปนลักษณะเฉพาะเพื่อเปนตัวแทนของสัญญาณเสียงตางๆ การวิเคราะหเสียงพูดนั้นมีอยูหลายวิธีดวยกันไมวาจะเปนการวิเคราะหทางดานโดเมนเวลา (Time Domain) คือการวิเคราะหจากรูปคล่ืนของสัญญาณเสียงตามแกนเวลาโดยตรง และการวิเคราะหทางดานโดเมนความถ่ี (Frequency Domain) คือการวิเคราะหจากสเปกตรัมของสัญญาณเสียง เปนตน 2.2.1 การวิเคระหสัญญาณเสียงในชวงเวลาสั้นๆ เนื่องจากวาสัญญาณเสียงเปนสัญญาณท่ีแปรตามเวลา มีการแปรเปล่ียนท่ีไมแนนอน เชน ในขณะท่ีพูดชาๆ รูปรางของโพรงเสียงรวมทั้งลักษณะรูปแบบของการกระตุนอาจจะไมมีการเปล่ียนแปลงในชวงเวลาท่ีนานท่ีสุดประมาณ 200 มิลลิวินาที แตในขณะท่ีพูดอยางรวดเร็วอาจจะมีชวงท่ีไมมีการเปล่ียนแปลงส้ันมากคือประมาณ 80 มิลลิวินาที ในการวิเคราะหเสียงพูดสวนใหญสัญญาณเสียงจะมีคุณสมบัติท่ีเปล่ียนแปลงสัมพันธกับเวลาอยางชา นั่นก็คือ จะตองแบงทําการวิเคราะหหาพารามิเตอรของสัญญาณเสียงพูดในชวงเวลาส้ันๆ เหมือนมองผานชองแคบ เรียกวา ชอตไทมวินโดว (Short Time Window : STW) เม่ือเทียบตามเวลาท่ีเสียงจะมีการเปล่ียนแปลงได เพื่อจะไดมองเห็นเหมือนกับวา เราหาพามิเตอรนั้นๆไดมาจากสัญญาณเสียงท่ีอยูภายในชองแคบๆ และมีความเปนเสถียรภาพภายในชวงเวลาส้ันๆ โดยเทคนิคสวน

8

Page 25: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

2.2.1.1 รูปแบบของชองแคบ กรอบขนาดของสัญญาณ (Window) การกําหนดกรอบของสัญญาณน้ันก็มีอยูดวยกันหลากหลายวิธีโดยการกําหนดขนาดหรือรูปแบบนี้ก็จะข้ึนอยูกับ ชวงหรือชองท่ีตองส้ันพอท่ีจะทําใหคุณสมบัติของสัญญาณเสียงท่ีกําลังพิจาณาไมมีการเปล่ียนแปลงอยางมีนัยสําคัญในชองแคบหรือในกรอบนั้นๆ ชวงหรือชองจะตองยาวพอที่จะทําใหการจัดเตรียมตัวอยางของเสียงเพื่อจะนําไปคํานวณหาพารามิเตอรใหไดตามตองการอยางเชน ในกรณีท่ีสัญญาณรบกวนเขามาแทรกอยูบางชวงในสัญญาณเสียงดวย ถาเราเลือกใชชองแคบท่ีมีขนาดใหญกวา เม่ือทําการหาคาพารามิเตอรโดยเฉล่ียแลวก็จะทําใหสวนประกอบของสัญญาณรบกวนถูกตัดท้ิงหรือมองขามไปน่ันเอง ชวงหรือชองนั้นตองมีความเหมาะสมไมควรส้ันเกินกวาชวงหนึ่งคาบของ สัญญาณเสียงในชวงท่ีกําลังวิเคราะห ซ่ึงเง่ือนไขนี้จะมีผลตอคาเฟรมเรท (Frame rate) ซ่ึงก็คือ จํานวนคร้ังตอวินาทีท่ีทําการวิเคราะหสัญญาณเสียง โดยการขยับชองแคบไปเปนคาบๆ ตามแกนเวลาตามปกติเฟรมเรทจะมีคาประมาณ 2 เทาของสวนกลับของขนาดกรอบ นั่นก็คือในกรอบถัดๆ กันไปจะมีการซอนทับกัน 50 เปอรเซ็นต โดยปกติแลวการประยุกตสวนมากจะใชกรอบของสัญญาณท่ีมีชวงกวางกวาชองของขอมูลท่ีคงท่ีและเนนเฉพาะชองตรงกลางของกรอบใหเปนสวนของขอมูลท่ีใชในการวิเคราะหเชน ขอมูลสัญญาณเสียงที่มีลักษณะคงท่ีในชวงเวลา 10 มิลลิวินาที ก็อาจจะใชชองแคบขนาด 20 มิลลิวินาที โดยชวงกึ่งกลางชองแคบขนาด 10 มิลลิวินาที จะมีการเนนเพิ่มน้ําหนักใหมากกวาชวง 5 มิลลิวินาทีท่ีริมท้ังสองขางของชองแคบ ซ่ึงรูปแบบของกรอบมีอยูดวยกันหลายลักษณะดวยกันเชน Blackman Windows : BMW, Barlett Windows : BLW, Hamming Windows : HNW และ Hanning Windows : HMW เปนตน โดยฟงกช่ันกรอบที่นิยมใชกันมากในการวิเคราะหสัญญาณเสียงคือ Hamming Window : ซ่ึงจะมีรูปรางตามลักษณะของ Cosine Pulse โดยจะมีนิยามดังสมการท่ี (2.1)

(nw )

9

Page 26: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

⎟⎠⎞

⎜⎝⎛

−−−=

12cos)1()(Nnnw παα (2.1)

)(nw เปนฟงกชันหนาตาง

n เปนลําดับขอมูลในกรอบสัญญาณเสียงพูด โดยท่ี n = 0 , 1 , ... , N - 1 N เปนจํานวนขอมูลท้ังหมดในกรอบสัญญาณเสียงพูด สวนท่ีโคงลงไปตามขอบของชองแคบ มีผลทําใหเกิดการเล่ือนออกแบบเปนคาบของเฟรมวิเคราะหตามสัญญาณอินพุท แตไมมีผลกระทบตอพารามิเตอรของเสียง เนื่องมาจากขอบเขตของคาบพิทช (Pitch Periodic Boundaries) หรือการเปล่ียนแปลงอ่ืนๆ ท่ีมีลักษณะเดียวกันนี้ในสัญญาณเสียง ดังแสดงในรูปท่ี 2.4 เปนการทดสอบคุณสมบัติรูปแบบของ Windows แบบตางๆโดยกําหนด = 0.46 เพื่อใชในการทดสอบ [16] α

รูปท่ี 2.4 ลักษณะของคาฟงกช่ันกรอบแบบตางๆ [18]

ในงานวิจัยฉบับนี้ไดเลือกใชฟงกช่ันกรอบชนิด Hamming Window ดังจะแสดงในรูปท่ี 2.5 ซ่ึงจะมีผลทําใหเกิดการลดทอนแอมปลิจูดอยางชาๆ ท่ีบริเวณปลายแตละขางของกรอบสัญญาณเสียงพูดเพื่อปองกันการเปล่ียนแปลงท่ีไมตอเนื่องตรงบริเวณจุดปลาย โดยสมการท่ี (2.1) จะแสดงคาฟงกชันกรอบ และสมการท่ี (2.2) จะแสดงคาสัญญาณเสียงพูดท่ีผานกรรมวิธีการวางกรอบ )(nw

)()()(~

11 nwnxnx = (2.2)

10

Page 27: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

)(nw เปนฟงกชันหนาตางซ่ึงจะทําการลดความไมตอเนื่องของเฟรมท่ี ตัวอยาง l

l เปนลําดับของกรอบสัญญาณเสียงพูด โดยท่ี l= 0 , 1 , ... , - 1 L

L เปนจํานวนของกรอบสัญญาณเสียงพูด )(1 nx เปนคาสัญญาณเสียงพูดของขอมูลท่ี n

)(~1 nx เปนคาสัญญาณเสียงพูดท่ีผานกรรมวิธีการวางกรอบ โดยสัญญาณเสียงท่ีไดจะมี

ความยาวเทากับจํานวนของกรอบสัญญาณเสียงชุดและมีหนวยเปน เฟรม L

n เปนจํานวนตัวอยางท่ีอยูในแตละเฟรม โดยท่ี = 0 , 1 , ... , - 1 n N

N เปนจํานวนตัวอยางท้ังหมดใน 1 เฟรม

รูปท่ี 2.5 ฟงกชันกรอบชนิด Hamming Window [18] 2.2.2 การวิเคราะหสัญญาณเสียงในรูปแบบคาเชิงเวลา (Time Domain Analysis) การวิเคราะหคาเชิงเวลานั้นเปนการวิเคราะหลักษณะสําคัญของเสียงจากสัญญาณในรูปแบบเชิงเวลา โดยสัญญาณเสียงนั้นจะประกอบไปดวยลําดับสัญญาณพัลสและสัญญาณรบกวนแบบสุม ซ่ึงความแตกตางของสัญญาณเสียงพูดนั้นข้ึนอยูกับการไดยินของหูมนุษย บนพื้นฐานของสเปกตรัมชวงเวลาส้ันๆ และสเปกตรัมเหลานี้มีความสัมพันธกับเวลา การสุมตัวอยางของสัญญาณ สัญญาณเสียงพูดเปนสัญญาณแบบตอเนื่อง โดยกอนท่ีสัญญาณเสียงพูดจะผานกระบวนการไดนั้นจะตองผานอุปกรณฮารดแวรแบบดิจิตอลเพ่ือเปล่ียนสัญญาณเสียงพูดแบบตอเนื่องเปนสัญญาณแบบไมตอเนื่องโดยเรียกกระบวนการนี้วาการสุมสัญญาณซ่ึงเปนการวัดระดับสัญญาณในเชิงเวลา

11

Page 28: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.6 สัญญาณแบบตอเนื่องตนแบบ

รูปท่ี 2.7 สัญญาณท่ีไดจากการสุมตัวอยาง

จากรูปท่ี 2.6 และ 2.7 แสดงใหเห็นผลท่ีไดจาการสุมตัวอยางสัญญาณรูปไซน (Sinusoidal Signal) สัญญาณท่ีไดจาการสุมเปนสัญญาณแบบตอเนื่อง โดยรายละเอียดของสัญญาณนั้นก็จะข้ึนอยูกับอัตราการสุม (Bit rate) ของสัญญาณท่ีไดทําการต้ังไว ซ่ึงจะมีรายละเอียดสูงหรือต่ําก็จะข้ึนอยูกับคาอัตราการสุมนี้ 2.2.3 การตัดหัวทายของสัญญาณเสียง (Endpoint Detection) การตัดหัวทายของสัญญาณเสียงนั้น คือการตัดบริเวณท่ีเปน Unvoiced ออกจากสัญญาณเสียงท่ีเราตองการ Voice ซ่ึงโดยปรกติจะอยูตรงบริเวณสวนหัวและสวนทายของรูปคล่ืนสัญญาณเสียงที่ทําการบันทึกมา โดยผลที่ไดจากการตัด จะทําใหขอมูลของสัญญาณเสียงที่จะนําไปประมวลผลมีคานอยลงและทํางานไดเร็วข้ึน

12

Page 29: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.8 ลักษณะการตัวหัวทายของสัญญาณเสียง [18]

2.2.3.1 อัตราการตัดศูนย (Zero Crossing) การเกิดจุดตัดศูนยจะเกิดข้ึนจากการท่ีรูปคล่ืนของสัญญาณมีการตัดกับแกนเวลานั่นคือคาของสัญญาณจะมีการเปล่ียนสัญลักษณทางคณิตศาสตร (Algebraic sign) นั่นเอง อัตราการเกิดจุดตัวศูนยเปนเคร่ืองมืออยางงายท่ีใชอธิบายการเปล่ียนแปลงขอมูลของสัญญาณคาจุดตัวศูนยนั้นสามารถนํามาใชในการตัดสินวาสัญญาณเสียงนั้นเปนเสียงกอง Voice หรือ Unvoiced เนื่องจากสัญญาณเสียงกองสวนใหญจะมีคาพลังงานอยูในชวงความถ่ีต่ํา สวนเสียงไมกองจะมีพลังงานอยูในชวงความถ่ีสูง และคาจุดตัดศูนยก็มีความสัมพันธโดยตรงกับคาความถ่ีของสัญญาณ กลาวไดวาสัญญาณเสียงท่ีมีคาจุดตัดศูนยสูงจะเปนเสียงไมกองและสัญญาณท่ีคาจุดตัดศูนยต่ําจะเปนเสียงกอง แตอยางไรก็ตามการกําหนดขนาดของคาจุดตัดศูนยท่ีแนนอนเพื่อจําแนกชนิดของเสียงนั้น จะตองมาจากการทดลองเปนหลักดังจะแสดงในรูปท่ี 2.8

รูปท่ี 2.9 การกระจายจุดตัดศูนยของ Voice และ Unvoiced [22]

13

Page 30: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

อัตราการตัดผานศูนยเปนการวัดจํานวนครั้งการตัดผานแกนเวลาท่ีระดับศูนยคือมีการเปล่ียนแปลงเคร่ืองหมายจากบวกเปนลบ หรือจากลบเปนบวกของสัญญาณเสียงพูดท่ีอยูติดกันดัง สมการที่ (2.3) จะแสดงใหเห็นถึงคุณสมบัติดังกลาวในการตรวจสอบความถ่ีของสเปกตรัมและคาบของสัญญาณเสียง แตอัตราการตัดผานศูนยนั้น งายตอการถูกกระทบไดจากสัญญาณเสียงท่ีรบกวนจึงมีการปรับปรุงอัตราการตัดผานศูนยใหเปน อัตราการตัดผานระดับท่ีกําหนด ดังสมการท่ี (2.5)

( ) ( )∑=

−−=

N

i

nn isisN

nZ0 2

)1(sgn)(sgn1)( (2.3)

โดยท่ี (2.4) ( )⎩⎨⎧

<−≥+

=0)(;10)(;1

)(sgnisis

isn

nn

)(nZ คืออัตราการตัดผานศูนยของเฟรมท่ี n )(isn คือสัญญาณเสียงพูดท่ี ในเฟรมท่ี i n

N คือจํานวนตัวอยางงเสียงพดูใน 1 เฟรม

( ) ( )∑=

−−=N

inn isisnB

0)1(sgn)(sgn)( (2.5)

โดยท่ี (2.6) ⎪⎩

⎪⎨

<−

≥≤−−≥+

=

Lis

LsLisnLis

is

n

in

n

n

)(1

)1(sgn()(1

))(sgn( )(

)(nB คืออัตราการตัดผานศูนยในระดับท่ีกําหนด L คือความสูงของระดับกําหนด 2.2.3.2 คาพลังงาน (Energy) คาพลังงานนิยมใชในการหาจุดเร่ิมตนและจุดส้ินสุดของเสียงพูด เพราะสามารถแสดงความแตกตางของสัญญาณเสียงพูดและสัญญาณรบกวนพ้ืนหลัง (Background Noise) ไดอยางสะดวกและรวดเร็ว เนื่องจากมีการคํานวณท่ีไมซับซอน ดังสมการท่ี (2.7)

∑−

=

=1

0

2 )()(N

in isnE (2.7)

)(nE เปนคาระดับพลังงานของขอมูลเสียงพูดเฟรมท่ี n )(isn เปนคาสัญญาณเสียงพดูท่ี ในเฟรมท่ี i n

14

Page 31: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

N เปนจํานวนตัวอยางเสียงพดูใน 1 เฟรม โดยจุดเร่ิมตนของเสียงพูดจะอยูกอนจุดท่ีตรวจพบดวยระดับพลังงานเทากับคาบเวลาคงท่ีคาหนึ่ง ซ่ึงจะมีขอดีคือ สามารถลดการตัดคําผิดพลาดเม่ือมีสัญญาณรบกวนท่ีมีแอมพลิจูดสูง สวนขอเสียของวิธีนี้คือจุดเร่ิมตนท่ีคํานวณไดอาจคลาดเคล่ือนจากจุดเร่ิมตนท่ีแทจริงของเสียงพูด

2.3 การสกัดคาคุณลักษณะสําคัญ ในการสกัดคาคุณลักษณะสําคัญ (Feature Extraction) สามารถแบงออกไดเปน 2 ลักษณะดวยกัน ไดแก การสกัดคาคุณลักษณะสําคัญทางฉันทลักษณ (Prosodic Feature) ซ่ึงไดแก คาความถ่ีมูลฐาน (Fundamental Frequency) คาความถ่ีฟอรแมนท (Formant Frequency) และคาพลังงาน (Energy) เปนตน อีกลักษณะคือ การสกัดคาคุณลักษณะสําคัญบนพ้ืนฐานของสเปกตรัม (Spectral-Based Feature) โดยจะมีอยูดวยกันหลากหลายประเภทแลวแตจะนําและเลือกไปใชงานใหตรงกับทางสายงานวิจัยก็คือ สัมประสิทธ์ิการทํานายพันธะเชิงเสน (Linear Predictive Coefficient : LPC) สัมประสิทธ์ิเซปสตรัม (Cepstral Coefficient) ซ่ึงมีท้ังสัมประสิทธ์ิเซปตรัมแบบคํานวณมาจาก LPC (Linear Predictive Coding Derived Cepstrum : LPCC) และแบบท่ีคํานวณบนพื้นฐานของชุดตัวกรอง (Filter Bank) และสเกลของความถ่ีแบบไมสมํ่าเสมอ (Nonuniform Frequency Scale : NFS) เชนสัมประสิทธ์ิเซปสตรัมบนสเกลเมล (Mel Frequency Cepstral Coefficient : MFCC) หรือจะเปนสัมประสิทธ์ิคูเสนสเปกตรัม (Line Spectrum Pairs : LSP) เปนตน 2.3.1 การวิเคราะหหาคาอัตสหสัมพันธ (Autocorrelation) จากการวิเคราะหทฤษฎีพื้นฐานพบวา ตัวอยางเสียงพูดท่ีเวลา สามารถถูกประมาณจากผลรวมเชิงเสนของตัวอยางเสียงพูดกอนหนาจํานวน ตัวอยางไดใกลเคียงท่ีสุด เ ม่ือมีสัมประสิทธ์ิของผลรวมเชิงเสนท่ีเหมาะสม ดังนั้นการวิเคราะหหาคาอัตสหสัมพันธจะเร่ิมจากสมการท่ี (2.8)

n

p

∑=

−≈p

kk knsns

1)()(ˆ α (2.8)

โดยท่ี เปนคาสัมประสิทธ์ิ LPC อันดับท่ี k kα

)(ˆ ns เปนคาประมาณสัญญาณเสียงพูดตัวอยางท่ี n คาประมาณสัญญาณเสียงพูดตัวอยางท่ี นี้ไดจากผลรวมของผลคูณระหวางสัมประสิทธ์ิ LPC กับสัญญาณเสียงพูดตัวอยางกอนหนาจํานวน ตัวอยาง ดังนั้นคาความผิดพลาดจากการประมาณ ซ่ึงเปนผลตางของคาประมาณสัญญาณเสียงพูดตัวอยางท่ี กับสัญญาณเสียงพูดจริงหาไดจากสมการท่ี (2.9)

n

p

)(ne n

15

Page 32: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

∑=

−−=

−=p

kk knsns

nsnsne

1

)()(

)(ˆ)()(

α (2.9)

และในการวิเคราะหการประมาณเชิงเสนนั้นจําเปนตองมีการเลือกคาสัมประสิทธ์ิการประมาณเพื่อทําใหไดคุณสมบัติทางสเปกตรัมใกลเคียงกับสเปกตรัมของเสียงพูดในชวงเวลาท่ีสนใจอยูมากท่ีสุด ท้ังนี้เนื่องจากคุณลักษณะสเปกตรัมของเสียงพูดเปล่ียนแปลงตลอดชวงเวลาคาสัมประสิทธ์ิการประมาณ ณ เวลาท่ีกําหนดให นั้นๆ ดังนั้นจึงมีการคํานวณสัมประสิทธ์ิการประมาณท่ีทําใหเกิดคาผิดพลาดกําลังสองเฉล่ีย (Mean Squared Error : MSE) ของการประมาณนอยท่ีสุดตลอดชวงส้ันๆของสัญญาณเสียงนั้น เพื่อใหสัมประสิทธ์ิดังกลาวทําใหเกิดสเปกตรัมของเสียงพูดท่ีใกลเคียงเสียงจริงมากท่ีสุด ซ่ึงโดยปรกติการวิเคราะหสเปกตรัมของชวงเวลาส้ันๆแบบนี้ จะกระทํากับเสียงพูดท่ีถูกแบงเปนสวนยอยหรือเฟรม นั้นเอง

n

∑ ∑

=

−−=

=

m

p

knkn

mnn

kmsms

meE

1

2

2

)]()([

)(

α (2.10)

โดยท่ี เปนคาความผิดพลาดกําลังสองเฉล่ีย ณ เฟรมท่ี n ใดๆ ซ่ึงมี nE

ตัวอยางเสียงพดู ตัวอยาง m

)(ne เปนคาความผิดพลาดจาการประมาณ ตามสมการท่ี (2.9) ในการแกสมการท่ี (2.10) เพื่อหาคาสัมประสิทธ์ิการประมาณ นั้นจําเปนตองหาคาอนุพันธยอยของ เทียบกับ แลวกําหนดใหผลลัพธเทากับศูนย ดังสมการท่ี (2.11)

nE kα

pkE

k

n ,...,2,1;0 ==∂∂α

(2.11)

จะไดสมการท่ี (2.12)

∑=

=−=p

kk pikiRiR

1,...,2,1;)()( α (2.12)

16

Page 33: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

∑ +=m

imsmsiR )()()( (2.13)

โดยท่ี เปนคาอัตสหสัมพันธ (Autocorrelation) )(iR

2.3.2 สัมประสิทธ์ิการทํานายพันธะเชิงเสน Linear Predictive Coefficient : LPC) การประมาณพันธะเชิงเสน (Linear Predictive : LP) เปนเทคนิคท่ีนิยมนํามาใชในการวิเคราะหคุณสมบัติทางกายภาพสัญญาณ เชน Spectrum Magnitude ของสัญญาณ เทคนิคนี้พิจารณาไดอยางรวดเร็วและมีประสิทธิภาพ ซ่ึงก็ใชไดดีสําหรับสัญญาณเสียงพูดและนํามาประยุกตใชกับระบบรูจําเสียงพูดไดเปนอยางดี การประมาณพันธะเชิงเสนเปนวิธีการที่ถูกพัฒนาข้ึนเพื่อลดอัตราการสงสัญญาณดิจิตอลลงอยางมาก กลาวคือ การวิเคราะหสัญญาณเสียงท่ีผานเขามาเพื่อหาสัมประสิทธ์ิตัวทํานายไปเปรียบเทียบกับสัญญาณจริง เพื่อจะนําคาความผิดพลาดน้ันไปเขากระบวนการเขารหัสพรอมๆ กับชุดสัมประสิทธ์ิท่ีไดวิเคราะห แลวจึงทําการเขารหัสเพื่อสงออกไป โดยคาสัมประสิทธ์ิของการประมาณพันธะเชิงเสนหาไดจากคาสัมประสิทธ์ิอัตสหสัมพันธโดยการใชวิธีของ Levinson Durbin Theory : LDT และแปลงคาท่ีไดเปนสัมประสิทธ์ิเซปตรัม ซ่ึงเปนคาพารามิเตอรท่ีมีลักษณะนาเช่ือถือไดดีกวาและมีความสัมพันธใกลชิดกับการรูจําเสียงตามความรูสึกของมนุษยโดยแทจริง [20] จากสมการในสวนของการหาคาอัตสหสัมพันธขางตนเม่ือทําการแกสมการที่ (2.12) ซ่ึงประกอบดวยสมการเชิงเสน สมการจะไดสัมประสิทธ์ิ ท่ีใชในการประเมินคาสัญญาณจํานวน คา โดยมองใหอยูในรูปของเมตริกซของคาอัตสหสัมพันธ ซ่ึงจะอยูในรูปของเมตริกซ Toeplitz ซ่ึงมีลักษณะสมมาตร และทุกๆสมาชิกในแนวทแยงมุมมีคา ดังน้ี

p kα

p

⎥⎥⎥⎥

⎢⎢⎢⎢

=

⎥⎥⎥⎥

⎢⎢⎢⎢

⎥⎥⎥⎥

⎢⎢⎢⎢

−−

−−

)(...

)2()1(

...)0(...)2()1(

............)2(...)0()1()1(...)1()0(

1

1

1

pR

RR

RpRpR

pRRRpRRR

α

αα

(2.14)

การแกสมการเพื่อหาคาสัมประสิทธ์ิ ทําไดโดยวิธี Levinson Durbin ซ่ึงตองมีการคํานวณแบบวนซํ้าหลายรอบเพ่ือใหได สัมประสิทธ์ิ ดังนี้

pααα ...,,, 21

)0()0( RE = (2.15)

ji

i

j

ij

i E

jiRiRk

=

−∑ −−=

1

1

1 )()( α (2.16)

17

Page 34: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

iii k=)(α (2.17)

)1()1()( −

−− −= i

jiiij

ij k ααα (2.18)

)1(2)( )1( −−= i

ii EkE (2.19)

โดยท่ี คือ สัมประสิทธ์ิ LPC อันดบัท่ี โดยท่ี )(i

iα i pi ≤≤1

)(ijα คือ สัมประสิทธ์ิ LPC อันดบัท่ี โดยท่ี i 11 −≤≤ ij

ik คือ สัมประสิทธ์ิ PARCOR )(iR คือ สัมประสิทธ์ิสหสัมพันธรวม )(iE คือ คาพลังงาน การวิเคราะหหาสัมประสิทธ์ิเซปตรัม (Cepstral Coefficient) ทําไดโดยการแปลงคาสัมประสิทธ์ิ LPC ไปเปนสัมประสิทธ์ิเซปตรัม เพราะเปนชุดสัมประสิทธ์ิท่ีใหความถูกตอง และนาเช่ือถือเพราะใหคาความแมนยําสูง ดังนั้นจึงเลือกมาเปนพารามิเตอรท่ีใชในการรูจําเสียง สัมประสิทธ์ิ LPC Cepstrum สามารถคํานวณจากชุดสัมประสิทธ์ิ LPC ไดโดยตรง ทําใหมีความสะดวกในการคํานวณดังสมการท่ี (2.20)

∑−

=−+=

=1

1

0

)(

)0(i

kkikii c

ikc

Rc

αα (2.20)

โดยท่ี คือสัมประสิทธ์ิ LPC Cepstrum ic pi ≤≤1

iα คือสัมประสิทธ์ิ LPC pi ≤≤1

สวนของเสียงพูดชวงๆสั้นท่ีไดทําการทดสอบโดยสเปกตรัมของเสียงนั้นไดทําการแปลงฟู

เรียรและสเปกตรัมของคาสัมประสิทธ์ิ LPC ท่ีอันดับ แตกตางกัน ตั้งแต 4 ถึง 20 ตามลําดับ ซ่ึงพบวาเม่ือ เพิ่มข้ึน รายละเอียดของสเปกตรัมเสียงจะปรากฏในสเปกตรัมของ LPC มากข้ึนดวย ดังแสดงในรูปท่ี 2.10

p

p

18

Page 35: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.10 สเปกตรัมของเสียงชวงส้ันๆและคาสัมประสิทธ์ิ LPC ของเสียงท่ีอันดับ ตางกัน [22] p

โคแวเรียนต (Covariance Methode) ในการวิเคราะหการทํานายพันธะเชิงเสน ชวงของการรวมจะอยูในชวง ดังนั้นจึงไมจําเปนตองมีการใชรูปแบบของหนาตาง ดังนั้นการทําใหคาผิดพลาดท้ังหมดยกกําลังสองมีคาตํ่าท่ีสุดจะหาไดจากสมการจํานวน สมการ ดังตอไปนี้

),1( Np +

p

01

i

p

kkik cac −=∑

=

เม่ือ (2.21) pi ≤≤1

19

Page 36: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

โดยท่ี (2.22) ∑+=

−−=N

pnkninik ssc

1

สมการจํานวน สมการ สามารถเขียนในรูปของเมตริก ไดดังนี้ p

cCa −= (2.23)

โดยท่ี

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

=

ppppp

p

p

p

cccc

cccccccccccc

C

L

MOMMM

L

L

L

321

3333231

2232221

1131211

(2.24)

a = [ ]T (2.25) paaa ,...,, 21

c = [ ]T (2.26) 02010 ,...,, pccc

เมตริก C เรียกวา เมตริกโคแวเรียนต (Covariance Matrix) และเปนเมตริกสมมาตร นั่นคือ c1p = cp1 และเมตริกไมไดมีโครงสรางเปนแบบโทพลิทซ ดังนั้นการหาสัมประสิทธ์ิการเขารหัสการทํานายพันธะเชิงเสนดวยวิธีนี้จึงมีประสิทธิภาพต่ํากวาวิธีอัตสหสัมพันธ สัมประสิทธ์ิการเขารหัสการทํานายพันธะเชิงเสนท่ีไดจากวิธีนี้จึงไมไดเปนวงจรกรองสังเคราะหท่ีมีความเสถียรเสมอ นอกจากนี้โครงสรางท่ีสมมาตรทําใหการคํานวณบางสวนสามารถใชเทคนิคการคํานวณใหเร็วข้ึนได แตยังไมเร็วเทียบเทากับวิธีเลวินสัน-เดอบิน การวิเคราะหแบบสัมประสิทธ์ิทํานายพันธะเชิงเสน (Linear Predictive Coding : LPC) ในทางดานการประมวลผลสัญญาณเสียง การเขารหัสการทํานายแบบเชิงเสนนี้จะถูกนําไปใชในสองแนวทางใหญๆ คือ การเขารหัสสัญญาณเสียง โดยท่ีการเขารหัสการทํานายแบบเชิงเสนถูกนําไปใชเปนวงจรกรองวิเคราะหการทํานายแบบเชิงเสนเพื่อแยกสวนซํ้าซอนของสัญญาณเสียงออก สวนท่ีเหลือจากการแยกเราจะเรียกวา สัญญาณตกคาง อีกแนวทางคือการวิเคราะหสัญญาณเสียงพูด ในสวนนี้จะถูกนําไปใชเปนวงจรกรองการทํานายแบบเชิงเสนผกผัน หรือวงจรกรองสังเคราะหการทํานาย

20

Page 37: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

2.3.3 สัมประสิทธ์ิคูเสนสเปกตรัม (Line Spectrum Pair : LSP) การพัฒนาในรูปแบบนี้ เปนการพัฒนาท่ีปรับและเพิ่มเติมมาจากรูปแบบของสัมประสิทธ์ิการทํานายแบบเชิงเสน เนื่องดวยพารามิเตอรของการทํานายแบบเชิงเสนนั้นในข้ันตอนของการประมาณคาพารามิเตอรทําใหเกิดความไมเสถียรของสัญญาณ และทําใหเกิดผลกระทบตอคุณภาพของสัญญาณเสียงในขณะท่ีพารามิเตอรแบบสัมประสิทธ์ิคูเสนสเปกตรัมจะมีคุณสมบัติท่ีโดดเดนคือ คาของพารามิเตอรนั้นจะอยูภายในของเขตท่ีจํากัด มีการเรียงลําดับของคาพารามิเตอรและสามารถท่ีจะตรวจสอบเสถียรภาพของวงจรกรองไดงายนอกจากนี้สัมประสิทธ์ิคูเสนสเปกตรัมยังแสดงในรูปเชิงความถ่ี ซ่ึงจะนําไปใชไดกับการหาคุณสมบัติของระบบการรูจดจําของมนุษยได [6] ในการคํานวณ สัมประสิทธ์ิคูเสนสเปกตรัม ของวงจรกรองผกผันในเชิงแซดดังสมการท่ี (2.27) [22]

(2.27) ∑=

−+=p

k

kk zazA

11)(

โดยท่ี คือวงจรกรองไวเทนนิง (Whitening Filter) มีหนาท่ีแยกความสหสัมพันธชวงส้ันท่ีปรากฏในสัญญาณเสียงพูด ซ่ึงก็คือในการวิเคราะหการเขารหัสสัมประสิทธ์ิทํานายพันธะเชิงเสนนั้น จะเริ่มตนจากการพิจารณากรอบสัญญาณเสียงท่ีมีตัวอยาง ตัวอยางคือ โดยอางวาตัวอยางสัญญาณปจจุบันสามารถทํานายไดจากผลรวมของตัวอยางสัญญาณในอดีต ตัวอยาง ดังสมการท่ี (2.28)

)(zA

N Nsss ,...,, 21

p

∑=

−−−−− −=−−−−−=p

kknkpnpnnnn sasasasasas

1332211 ...~ (2.28)

โดยท่ี คืออันดับของการวิ เคราะหการทํานายพันธะเชิงเสนและ คือสัมประสิทธ์ิการเขารหัสการทํานายพันธะเชิงเสน ซ่ึงจะกําหนดให แทนคาผิดพลาดระหวางคาจริงและคาท่ีทํานายได โดยจะไดดังสมการท่ี (2.29) และสมการท่ี (2.30)

p paaa ,...,, 21

ne

nnn sse ~−= (2.29)

∑=

−+=p

kknknn sase

1 (2.30)

21

Page 38: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

โดยท่ี เรียกวาสัญญาณตกคาง เนื่องจากสัญญาณ ไดมาจากผลของการลบสัญญาณ ดวย และเน่ืองดวยคาสหสัมพันธชวงส้ัน (Short-term Correlation) ระหวางตัวอยางของ

สัญญาณตกคางมีคาตํ่า ดังนั้นประมาณไดวากรอบสเปกตรัมกําลังของสัญญาณตกคางจะมีลักษณะราบเรียบ และเม่ือทําการแปลงแซด (Z-Transform) ของสมการท่ี (2.30) ก็จะไดคา ดังสมการท่ี (2.31)

ne ne

ns ns~

)(zE

)()()( zSzAzE ⋅= (2.31)

โดยท่ี เปนผลจากการแปลงแซดของสัญญาณเสียง )(zS

)(zE เปนผลการแปลงแซดของสัญญาณตกคาง ในสวนถัดมาจะทําการแยกสวนสมการที่ (2.27) ใหเปนพหุนามอันดับ M+1 จํานวน 2 พหุนาม ดังสมการท่ี (2.32) และสมการท่ี (2.33)

)()()( 1)1( −+−+= zAzzAzP M (2.32)

)()()( 1)1( −+−−= zAzzAzQ M (2.33)

โดยท่ี และ จะเปนพหุนามที่มีความสัมพนัธกับ ตามสมการท่ี (2.34) )(zP )(zQ )(zA

2)()()( zQzPzA +

= (2.34)

พหุนาม และ สอดคลองกับรูปแบบชองทางเดินเสียงท่ีไรการสูญเสียขณะท่ีชองระหวางเสนเสียง (Glottis) ปดและเปดตามลําดับ และรากของพหุนาม และ เรียกวาความถ่ีเสนสเปกตรัม โดยพหุนามท้ังสองมีคุณสมบัติดังนี้

)(zP )(zQ

)(zP )(zQ

1. ราก (Zeroes) ท้ังหมดของพหุนาม P(z) และ Q(z) นั้นจะต้ังอยูบนวงกลมหนึ่งหนวยเสมอ 2. ราก (Zeroes) ของพหุนาม P(z) และ Q(z) จะวางเรียงสลับกันจากนอยไปหามาก ตามลําดับดังแสดงในรูปท่ี 2.11

22

Page 39: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.11 การวางเรียงสลับของรากของพหุนามคูเสนสเปกตรัม P(z) และ Q(z) [21] โดยแสดงใหเห็นวาวงจรกรองผกผัน A(z) จะมีเฟสต่ําสุด ถาคูเสนสเปกตรัมของ A(z) สอดคลองกับคุณสมบัติท้ังสองนี้ ดังนั้นวงจรสังเคราะหการเขารหัสการทํานายพันธะเชิงเสนสามารถยืนยันไดวามีเสถียรภาพ โดยทําการประมวลพารามิเตอรการเขารหัสทํานายพันธะเชิงเสนในรูปแบบคูเสนสเปกตรัม [15] เม่ือพิจารณารากของพหุนามทั้งสองพบวาพหุนาม P(z) และ Q(z) มีรากจริงอยูท่ี -1 และ 1 ตามลําดับ สําหรับรากอ่ืนๆ อยูบนวงกลมหนึ่งหนวยโดยวางเรียงสลับกันตามคุณสมบัติของพหุนามท้ังสอง และรากท้ังสองของพหุนามมีลักษณะเปนคูเชิงซอนสังยุค ดังนั้นในการเก็บรากของพหุนามเพื่อใชเปนพารามิเตอรจึงเก็บเพียง M คา เนื่องจากรากของพหุนาม A(z) แสดงตําแหนงฟอรแมนตของเสียงพูด และพหุนาม P(z) และ Q(z) สัมพันธกับ A(z) ตามสมการท่ี (2.27) , (2.28) และสมการท่ี (2.29) ดังนั้นรากของพหุนามท้ังสองจึงสัมพันธกับฟอรแมนตดวย โดยรากของพหุนาม A(z) แตละอันจะจับคูกับรากของพหุนาม P(z) และ Q(z) อยางละหนึ่งราก

รูปท่ี 2.12 ความสัมพันธระหวางรากของ A(z) กับรากของคูเสนสเปกตรัม P(z) และ Q(z) [21]

23

Page 40: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

จากรูปท่ี 2.12 รูปวงกลมสีดําจะเปนรากของพหุนาม A(z), สวนรูปส่ีเหล่ียมและรูปวงกลมสีขาวเปนรากของพหุนาม P(z) และ Q(z) ตามลําดับ การเกาะกลุมของรากหรือความถ่ีเสนสเปกตรัมจํานวน 2 หรือ 3 รากจะกําหนดลักษณะความถี่ฟอรแมนตและขนาดแบนดวิดทของฟอรแมนต โดยข้ึนกับความชิดของกลุมรากดังกลาว ถารากชิดกันมากจะทําใหเกิดฟอรแมนตและมีแบนดวิดทแคบ ในทางตรงขามกลุมรากจะแสดงถึงสเปกตรัมท่ีมีแบนดวิดทกวางคือไมเกิดฟอรแมนต นอกจากนี้คุณสมบัติอีกอยางหนึ่งของคูเสนสเปกตรัมคือความไวทางสเปกตรัมของคูเสนสเปกตรัมซ่ึงจะมีลักษณะเฉพาะ คือเม่ือมีการเปล่ียนแปลงคูเสนสเปกตรัมใดๆ จะทําใหเกิดการเปล่ียนแปลงของสเปกตรัมของกําลังการเขารหัสการทํานายพันธะเชิงเสนเฉพาะบริเวณรอบๆ เทานั้น ทําใหสามารถประเมินคา (Quantization) ไดอยางอิสระโดยไมมีผลกระทบจากการลดทอนเน่ืองจากการประเมินคาจากสเปกตรัมหนึ่งไปสูสเปกตรัมอ่ืนๆ

2.4 โครงขายประสาทเทียม โครงขายประสาทเทียม (Artificial Neural Network : ANN) เปนแบบจําลองอีกประเภทหนึ่งท่ีเปนท่ีนิยมใชกันมากในตางประเทศและไดมีการวิจัยกันมาอยางแผหลาย ดวยรูปแบบของระบบโครงขายประสาทเทียมนั้นเปนแบบจําลองระบบประสาททางชีววิทยาหรือท่ีเรียกกันไดวา สมองของมนุษยนั่นเอง ซ่ึงมีการเรียนรูจากขอมูลท่ีถูกสงผานเขาไปทางกิ่งกานของเซลลประสาท (Dendrite) จากน้ันจะถูกคํานวณและสงผานใหกับเซลลประสาทอ่ืนๆ ท่ีเช่ือมโยงกันเปนเครือขายผานทางแกนเซลลประสาท (Axon) ซ่ึงระบบโครงขายประสาทเทียมมักจะนําไปประยุกตใชกับงานเฉพาะทางเชน การรูจํารูปแบบ (Pattern Recognition) หรือการจําแนกประเภทของขอมูล (Data Classification) เปนตน อีกท้ังโครงขายประสาทเทียมยังมีความสามารถท่ีโดดเดนเปนอยางมากคือ มันสามารถท่ีจะหาความหมายของขอมูลท่ีมีลักษณะท่ีคลุมเครือ หรือ ไมแนชัดได ดังนั้นมันจึงถูกนําไปใชในการแยกแยะ สกัดรูปแบบของขอมูลท่ีมีความซับซอนเพื่อใชในการตรวจหาแนวโนมของขอมูล ซ่ึงเปนการยากท่ีจะใชมนุษยหรือเทคนิคการคํานวณอ่ืนๆมาใชได โครงขายประสาทเทียมท่ีมีการสอนหรือการทดสอบ (Trained) แลวนั้น จะเปรียบเสมือนกับผูท่ีมีความชํานาญผานกระบวนการมาแลวหลายๆข้ันตอนจึงสามารถที่จะคิดและตัดสินใจตามประเภทของขอมูลท่ีไดทําการเรียนรูมากอนหนานี้ได ความสามารถของระบบโครงขายประสาทเทียมนั้นมีไวเพื่อแกไขปญหาในงานตางๆท่ีแตกตางจากเคร่ืองคํานวณประเภทอ่ืนๆท่ีมีมาในอดีตและปจจุบัน ซ่ึงระบบโครงขายประสาทเทียมจะสามารถแกไขปญหาไดดีกวา ซ่ึงเคร่ืองคํานวณธรรมดาจะมีวิธีการคํานวณแบบที่ทําตามลําดับข้ันตอน (Algorithmic Approach) กลาวคือ เคร่ืองคํานวณจะทําตามชุดคําส่ังท่ีไดออกแบบไวอยางเปนลําดับข้ันตอน เพ่ือใชในการแกไขปญหาหนึ่งๆซ่ึงถานอกเหนือจากนี้ชุดคําส่ังจะไมสามารถแกไขปญหาได

24

Page 41: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

โครงขายประสาทเทียมท่ีมาจากโครงขายสมองมนุษย 2.4.1 ในทางชีววิทยาโครงขายประสาทเทียมท่ีมีอยูในสมองของมนุษยนั้น เ ม่ือทําการลดรายละเอียดการทํางานลงและนําเฉพาะสวนของการทํางานท่ีสําคัญมาเขียนเปนโปรแกรมเพื่อจําลองการทํางานของระบบเซลลประสาท ยังไมสมบูรณ เนื่องจากเซลลประสาททางชีววิทยานั้นมีขอจํากัดในเร่ืองของการคํานวณ จึงทําใหแบบจําลองท่ีสรางข้ึนมานั้นยังมีการทํางานท่ีหยาบและไมละเอียดเม่ือเปรียบเทียบกับโครงขายประสาทของมนุษยอยางแทจริง จากรูปท่ี 2.14 จะอธิบายถึงโครงขายประสาทเทียมทางชีววิทยาเปรียบเทียบกับโครงขายประสาทเทียม โดยรางกายของมนุษยจะมีเซลลประสาท (Nerve Cell) หรือ นิวรอน (Neuron) จํานวนมาก ซ่ึงจะทําหนาท่ีเกี่ยวกับการรับรูและการตอบสนอง โดยแตละเซลลจะมีการเช่ือมโยงกับเซลลประสาทอ่ืนเปนพันๆลานเซลล นับเปนเร่ืองนาอัศจรรยมากท่ีเซลลจํานวนมากสามารถทํางานเกี่ยวกับการรับสงสัญญาณระหวางส่ิงเราภายนอกกับภายในรางกายไดอยางเปนระบบ เซลลประสาทจะประกอบไปดวยสวนท่ีสําคัญสองสวน คือ ตัวเซลล (Cell Body) และใยประสาท( Nerve Fiber ) ตัวเซลลเปนสวนของไซโทพลาซึมและนิวเคลียส ตัวเซลลมีเสนผานศูนยกลางประมาณ 4 - 25 ไมโครเมตร ภายในมีโครงสรางท่ีสําคัญ คือ ไมโทคอนเดรียเอนโดพลาสมิกเรติกคูลัมและกอลจิคอมเพล็กซจํานวนมาก ใยประสาทเปนสวนของเซลลท่ียื่นออกมาจากตัวเซลลมีลักษณะเปนแขนงเล็กๆ ใยประสาทท่ีนํากระแสประสาทเขาสูตัวเซลล เรียกวา เดนไดรต (Dendrite) ใยประสาทท่ีนํากระแสประสาทออกจากตัวเซลลเรียกวา แอกซอน (Axon) เซลลประสาทแตละเซลลจะมีเดนไดรตแยกออกจากตัวเซลลหนึ่งใยหรือหลายใย สวนแอกซอนมีเพียงใยเดียวเทานั้น ดังรูปท่ี 2.13

25

Page 42: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.13 รูปแบบโครงขายประสาทเทียมหนึ่งเซลลและโครงขายสมองมนุษยทางชีววิทยา [22] การทําความเขาใจในโครงขายประสาทเทียมหรือ การสรางโครงขายประสาทเทียมพื้นฐานนั้นจะมี 2 สวนท่ีตองพิจารณาคือ 2.4.1.1 สถาปตยกรรมโครงขายประสาทเทียม (Neural Architecture) การออกแบบโครงขายประสาทเทียมซ่ึงหมายถึง การกําหนดจํานวนเซลลภายในช้ันของโครงขาย (Layers) คือการกําหนดรูปแบบการเช่ือมตอกันระหวางเซลลในแตละชั้น ซ่ึงท้ังหมดถูกเรียกวา สถาปตยกรรมของโครงขาย (Architecture of the Net) โดยทุกการเช่ือมตอระหวางเซลลในแตละช้ันของโครงขายจะมีคาถวงน้ําหนัก (Weight) คูณอยูดวย โดยท่ีถาโครงขายมีจํานวน 2 ช้ันหรือมากวา ช้ันท่ีอยูตรงกลางระหวางช้ันอินพุต (Input Layer) กับช้ัน เอาทพุต (Output Layer) จะถูกเรียกวาช้ันซอน (Hidden Layer) นอกจากน้ีโครงขายประสาทเทียมยังมีหลากหลายรูปแบบท่ีแตกตางกันออกไปข้ึนอยูกับในงานในแตละสายงานท่ีแตกตางกันเชน Feed Forward, Feedback, Fully Interconnected net, Competitive net และอ่ืนๆ ดังแสดงในรูปท่ี 2.14

26

Page 43: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.14 สถาปตยกรรมโครงขายประสาทเทียม

โครงขายประสาทเทียมชนิด Feed Forward Network จะมีอยูดวยกัน 2 ประเภทดวยกัน คือแบบช้ันเดียว (Single Layer Perceptron : SLP) และแบบหลายช้ัน (Multiple Layer Perceptron : MLP) ซ่ึงโครงขายแบบช้ันเดียวนั้นจะมีช้ัน Input Layer และจะถูกสงขอมูลออกไปยังช้ัน Output Layer ในทันที ในขณะท่ีโครงขายแบบหลายช้ันนั้นจะถูกข้ันดวยช้ันซอนหรือท่ีเรียกวา Hidden Layer แลวจึงคอยสงออกไปยังช้ัน Output Layer ตอไป สวนโครงขายชนิดท่ีเปน Recurrent Net นั้นทุกโหนดใน

27

Page 44: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

2.4.1.2 คาถวงน้ําหนักของระบบโครงขาย (Network Weights) การกําหนดคาถวงน้ําหนัก (Weights) ใหกับโครงขายประสาทเทียมเพื่อทําใหผลลัพธทางเอาทพุตนั้นตรงกับขอมูลอินพุตท่ีตองการ ซ่ึงกระบวนการในการกําหนดคาถวงน้ําหนักนี้คือการเรียนรูจํา (Learning) หรือ การสอนระบบ (Training) ซ่ึงจะมีอยูดวยกัน 2 ประเภทหลักๆคือ Supervised Training คือการเรียนรูแบบมีผูสอน ซ่ึงการสอนแบบนี้จะตองมีคูของขอมูลในการปรับสอนคือ ขอมูลทางอินพุต และ ขอมูลเปาหมาย (Target) โดยคาเอาทพุตจะคํานวณไดจากขอมูลอินพุตซ่ึงจะเปรียบเทียบกับขอมูลเปาหมาย โดยกระบวนการปรับสอนจะตองกําหนดเง่ือนไขการหยุดการปรับสอนวาจะใชวิธีใดเชน การับจํานวนรอบการปรับสอนวาจะกําหนดไวในการคํานวณกี่รอบหรืออีกวิธีหนึ่งคือ การพิจารณาจากจํานวนความผิดพลาดของขอมูล (Error) ท่ีไดจากการเปรียบเทียบระหวางคาเอาทพุตท่ีคํานวณไดจากขอมูลอินพุตกับขอมูลเปาหมาย ซ่ึงหากคาความผิดพลาดท่ีไดมานั้นมีคาท่ีนอยกวาคาท่ีกําหนด จึงจะทําการหยุดการสอน และวิธีการหาคาความผิดพลาดน้ีนั้นจะมีหลายชนิดดวยกันเชน Least Mean Square : LMS หรือ Mean Square Error เปนตน และวิธีการเรียนรูแบบ Supervise Training ท่ีมีการใชงานท่ัวไปไดแก Hebb และ Back Propagation เปนตน Unsupervised Training คือโครงขายท่ีมีการเรียนรูแบบไมมีผูสอนหรือ การเรียนรูดวยตัวเอง (Self Learning Networks) ซ่ึงการสอนแบบนี้ตองการขอมูลอินพุตแตเพียงอยางเดียว โดยท่ีไมจําเปนตองกําหนดขอมูลเปาหมาย (Target) ข้ึนมากอน ซ่ึงโครงขายการเรียนรูแบบนี้จะมีกลไกการทํางานท่ีเหมือนกับสมองมนุษยกลาวคือ โครงขายมีการเรียนรูและทํางานไปพรอมๆกัน ในเวลาเดียวกันก็จะมีการทํางานที่เปนแบบ On Time ไปดวย ซ่ึงในขณะท่ีการสอนแบบ Supervised Training จะตองทําการสอนระบบดวยคาขอมูลอินพุตและคาคําตามท่ีตองการ (Target Value) จากนั้นจึงกลับมาทํางานในโหมดปกติ ซ่ึงการทํางานแบบนี้เรียกวาเปนการทํางานแบบ Off Line นั้นเอง โดยปกติแลวการสอนแบบ Unsupervised Training จะมีความซับซอนและการสรางท่ียากกวาการสอนแบบระบบ Supervised Training ซ่ึงจะมีการสอนระบบแบบไมมีผูสอน โครงขายประสาทเทียมมีหลากหลายรูปแบบดวยกันท้ังท่ีเปนแบบ Supervised และ Unsupervised Learning ในสวนของงานวิจัยฉบับนี้จะมุงเนนในแบบการเรียนรูจําแบบ Supervised Learning ท่ีใชนิวรอลเน็ตเวอรกเปนแบบ Multi-Layer Perceptron ใชการเรียนรูแบบแพรกระจายยอนกลับ (Back Propagation Learning Algorithm) ซ่ึงวิธีนี้จะมีขอดีคือมีการคํานวณท่ีไมซับซอนและสามารถรูจําไดเปนอยางดีไมดอยไปกวาวิธีอ่ืน

28

Page 45: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

2.4.2 โครงขายประสาทเทียมเพอรเซปตรอนเดียว (Single Layer Perceptron : SLP) โครงขายเพอรเซปตรอนเปนโครงขายชนิดช้ันเดียว และเปนโครงขายท่ีนิยมใชงานมากท่ีสุดในการนําไปแยกประเภทส่ิงตางๆแบบเชิงเสนหรือ นําไปใชในกระบวนการรูจํา ซ่ึงโครงขายจะประกอบไปดวยเซลล 1 เซลล ท่ีสามารถปรับคาถวงน้ําหนัก (Weight) และคาไบอัส (Bias) ได ดังแสดงในรูปที่ 2.15 เม่ือโครงขายถูกสอนแลวจะสามารถแยกแยะส่ิงตางๆ ออกเปน 2 ประเภทได ซ่ึงนี่คือขอจํากัดของการทํางานแบบ 1 เซลลนั่นเอง

รูปท่ี 2.15 เซลลประสาทแบบหลายอินพตุ [22] จากรูปท่ี 2.15 จะแสดงในเห็นถึงโครงขายประสาทแบบ 1 เซลลแบบหลายอินพุตโดยตัวแบบในท่ีนี้คือ R เปนจํานวนโหนดอินพุตซ่ึงทุกโหนดในช้ันอินพุตจะถูกเช่ือมตอถึงกันท้ังหมดกบัช้ันเอาทพุต (โดยปกติช้ันอินพุตจะไมถูกนับเปน 1 ช้ัน) โดย 1 เซลลจะมีไบอัส (Bias : b) หนึ่งตัวซ่ึงจะมีคาเปน ‘1’ เสมอและ จะถูกบวกรวมไปกับผลคูณระหวางขอมูลอินพุตกับคาถวงน้ําหนักซ่ึงสามารถอธิบายเปนสมการดังสมการท่ี (2.35)

bpwpwpwn RR ++++= ,122,111,1 ... (2.35) โดยสามารถท่ีจะเขียนรูปแบบของสมการขางตนใหอยูในรูปแบบของสมการเมตริกไดดังสมการท่ี (2.36)

bWPn += (2.36)

โดยท่ี คือ เมตริกของคาถวงน้ําหนกั W

29

Page 46: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

P คือ เมตริกขอมูลทางดานอินพุต จากนั้นจะสามารถแสดงสมการทางดานเอาทพุตไดดังสมการท่ี 2.37

)( bWPfa += (2.37)

โดยท่ี คือ ฟงกช่ันกระตุน (Activation Function) โดยรูปแบบของฟงกช่ันกระตุนก็จะมีอยูดวยกนัหลายรูปแบบดังแสดงในตารางท่ี 2.1

f

ตารางท่ี 2.1 ฟงกช่ันกระตุนของโครงขายประสาทเทียมชนิดตางๆ [24]

Function Name Input and Output Relation

Hard Limit 0100

≥=<=nana

Symmetrical Hard Limit 0101

≥+=<−=nana

Linear na = .

Saturation Linear 11

1000

>=≤≤=

<=

nanna

na

Symmetric Saturating Linear 11

1111

>=≤≤−=

−<−=

nanna

na

Log Sigmoid nea −+=

11

Hyperbolic Tangent Sigmoid nn

nn

eeeea −

+−

=

Positive Linear nnana≥=<=

000

Competitive 1=a neuron with max n

0=a all other neurons

สําหรับโครงขายท่ีมีเซลลประสาทจํานวนมากหรือแบบของโครงขายท่ีมีจํานวนโหนดอินพุตและจํานวนช้ัน (Layer) มากๆน้ัน การเขียนแผนภาพก็จะมีลักษณะคลายกับรูปท่ี 2.17 (ข) จะเห็นวาภาพโครงขายนั้นดูซับซอนยุงเหยิงไปดวยเสนของการเช่ือมโยง ดังนั้นจึงสามารถวาดแผนภาพใหมใหสามารถดูไดงายตอการศึกษามากข้ึนดังแสดงในรูปท่ี 2.17 (ก) ซ่ึงจะเปนการอธิบายแผนภาพ

30

Page 47: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.16 (ก)โครงขายประสาทเทียมแบบยอ (ข)โครงขายประสาทเทียมแบบแสดงการเช่ือมโยง [23] จากรูปท่ี 2.16 (ก) จะเห็นไดวาตัวแปรเมตริกอินพุต P จะมีขนาดเทากับ Rx1 โดย R คือจํานวนโหนดอินพุต สวนเมตริก W จะมีขนาด SxR โดย S คือ จํานวนเซลลประสาทใน 1 ช้ันและเมตริก b จะมีขนาด Sx1 ซ่ึงจะสามารถแสดงไดดังสมการท่ี (2.38)

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

+

⎥⎥⎥⎥

⎢⎢⎢⎢

⋅⋅⋅⋅

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅

⋅⋅⋅

⋅⋅⋅

= b

P

PP

www

wwwwww

fa

RRSSS

R

R

2

1

,2,1,

,12,11,2

,12,11,1

(2.38)

2.4.3 โครงขายประสาทเทียมเพอรเซปตรอนหลายชั้น (Multi Layer Perceptron : MLP)

โครงขายประสาทเทียมแบบหลายช้ันนั้นหรือท่ีเรียกยอๆวา MLP คือโครงขายประสาทเทียมแบบมีหลายช้ันซ่ึงในแตละช้ันจะมีเมตริกคาถวงน้ําหนัก (Weight Matrix) แทนดวยตัวอักษร และมีเวกเตอรไบอัส (Bias Vector) แทนดวยตัวอักษร เปนของตัวมันเองในแตละช้ัน (Layer) ซ่ึงโครงขายประสาทเทียมประเภทนี้จะมีวิธีจําแนกรูปแบบของขอมูลอินพุตในแบบที่ไมเปนเชิงเสน (Nonlinear Separable) แตโครงขายประสาทเทียมประเภทน้ีจะมีวิธีการเรียนรูแบบแพรกลับ (Backpropagation Algorithm) โดยช้ันแรกเรียกวา ช้ันอินพุต (Input Layer) และช้ันสุดทายจะเรียกวาช้ันเอาทพุต (Output Layer) ซ่ึงจะมีช้ันท่ีข้ันอยูระหวางกลางกับช้ันอินพุตและช้ันเอาทพุต จะเรียกวา ช้ันซอน (Hidden Layer) ซ่ึงจะแสดงดังรูปท่ี 2.17

w

b

31

Page 48: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 2.17 โครงขายประสาทเทียมแบบหลายช้ัน [23] จากรูปท่ี 2.17 ตัวเลขยกกําลังยกตัวแปรภาษาอังกฤษจะหมายถึงช้ันของโครงขายประสาทเทียมดังนั้น เมตริกคาถวงน้ําหนักของช้ันแรกจะสามารถจะเขียนไดคือ และเมตริกคาน้ําหนักของช้ันท่ีสองจะสามารถเขียนไดคือ W โดยมีจํานวนช้ันอินพุตเทากับ และตัวแปร คือจํานวนเซลลประสาทในช้ันท่ี 1 และตัวแปร คือจํานวนเซลลประสาทในช้ันท่ี 2 นั้นเอง คาเอาทพุตของโครงขายประสาทเทียมในช้ันท่ี 1 จะเปนขอมูลอินพุตของโครงขายประสาทเทียมในช้ันท่ี 2 และขอมูลเอาทพุตของโครงขายประสาทเทียมช้ันท่ี 2 จะเปนขอมูลอินพุตของโครงขายประสาทเทียมช้ันท่ี 3 ดังนั้นจะเห็นไดวาโครงขายประสาทเทียมช้ันท่ี 2 สามารถมองเปนโครงขายประสาทเทียม 1 ช้ันไดโดยจะมีสมการท่ีเกี่ยวของคือ

1W2 R 1s

2s

( )1111 bpWfa += (2.39)

( )21222 baWfa += (2.40)

( )32333 baWfa += (2.41)

)))((( 3211122333 bbbpWfWfWfa +++= (2.42)

32

Page 49: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สวนของคาไบอัส (Bias) ซ่ึงปกติแลวผูออกแบบโครงขายประสาทเทียมจะสามารถกําหนดใหมีในโครงขายหรือไมมีในโครงขายก็ไดซ่ึงคาไบอัสนี้จะเปนตัวแปรพิเศษท่ีเพ่ิมเติมข้ึนมาซ่ึงจะทําใหโครงขายประสาทเทียมท่ีออกแบบมาน้ันมีความสามารถมากข้ึนในการรูจําอีกดวย

รูปท่ี 2.18 โครงขายประสาทเทียมหลายช้ันแบบยอ [23]

2.5 งานวิจัยท่ีเกี่ยวของ เนื่องจากในปจจุบันการวิจัยทางดานการรูจําเสียงพูด มีการวิจัยกันมาอยางแพรหลาย ท้ังนี้ก็

เหตุท่ีวาดวยความสะดวกสบายของมนุษยยังเปนท่ีตองการอยูในปจจุบัน อีกท้ังคอมพิวเตอรกไ็ดเขามามีบทบาทในชีวิตประจําวันมากข้ึนโดยสวนใหญจะมีเคร่ืองคอมพิวเตอรเพ่ือใชงานกันสวนตัวคนละเคร่ือง ในงานวิจัยนี้จึงมุงเนนใหสามารถสรางระบบการรูจําเสียงแบบไมข้ึนกับผูพูด และระบบจะตองสามารถปรับเขากับผูใชคนอ่ืนไดเม่ือมีการปรับเปล่ียนผูใชใหม

จากการศึกษางานวิจัย มีผูเสนอแนวคิดหลายคนดวยกัน จิตรลดา จารุมิศร [10] ไดทําการวิจัยในเร่ืองของ “แบบจําลองเสียงวรรณยุกตสําหรับภาษาไทยโดยใชเทคนิคการควอนไตซพิทซและ Hidden Markov Model” โดยเสนอวิธีการรูจําเสียงวรรณยุกตแบบไมตอเนื่อง โดยใชวิธีหาคาคาบความถ่ีมูลฐานแบบออโตคอรีเลชัน (Autocorrelation, AUTOC) เวกเตอรควอนไตซเซช่ันวิธีออโตคอรีเลชันเร่ิมจากนําสัญญาณเสียงมาผานตัวกรองสัญญาณความถ่ีต่ําผาน เพื่อกําจัดความถ่ีฮารโมนิคท่ีไมตองการออกไป จากน้ันจึงแบงสัญญาณออกเปนเฟรมๆ โดยใหแตละเฟรมมีชวงซอนทับกัน 2 ใน 3 เฟรม เพื่อลดความผิดพลาดท่ีเกิดจากความไมตอเนื่องของขอมูล กําจัดสัญญาณท่ีมีขนาดแอมปลิจูดตํ่าซ่ึงคาดวาจะเปนสัญญาณรบกวนออก ดวยการตัด (Clipping) สัญญาณ นําสัญญาณท่ีผานการ Clipping มาคํานวณหาคา Autocorrelation ระยะหางจากจุดเ ร่ิมตนของสัญญาณไปยัง ตําแหนง ท่ี มี Autocorrelation peak สูงสุด จะเปนคาคาบเวลาพิทช สุดทายนําคาคาบเวลาพิทชมาคํานวณกับความถ่ีท่ีใชสุมตัวอยาง ผลท่ีไดคือคาความถ่ีมูลฐาน F0 (Pitch) หรือเสียงวรรณยุกต แลวจึงนําความถ่ีมูลฐานท่ีไดนี้มาเขาสูระบบรูจําเสียงท่ีสรางดวยแบบจําลองฮิดเดน มารคอฟ โมเดลไดผลของความถูกตองอยูท่ี 90%

33

Page 50: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ปฏิมากร กิ้มสวัสดิ์ [11] ศึกษาการรูจําตัวเลขภาษาไทยแบบแยกคําชนิดไมข้ึนกับผูพูดโดยใชโครงขายประสาทท่ีมีการเรียนรูแบบแพรกลับ คาพารามิเตอรท่ีใชคือสัมประสิทธ์ิพหุนามอันดับสองของคาบเวลาพิตซ, คาความหนาแนนกลุมความถี่ฟอรแมนต, คาสัมประสิทธการประมาณพันธะเชิงเสน รวมกับพารามิเตอรใหมท่ีนําเสนอคือคาระยะเวลาในการออกเสียง และคาผลรวมของความหนาแนนของสเปกตรัมเชิงกําลังในแตละกลุมความถ่ี ผลการทดลองพบวาพารามิเตอรท่ีเหมาะสมในการรูจําคือ คาระยะเวลาในการออกเสียงรวมกับคาสัมประสิทธ์ิพหุนามอันดับสองของคาบเวลาพิตซ และคาผลรวมของความหนาแนนของสเปกตรัมเชิงกําลังในแตละกลุมความถี่ โดยมีเปอรเซ็นตความถูกตองเฉล่ียสําหรับกลุมทดสอบท่ี 83.365%

จักรกฤษ ออนช่ืนจิตร [12] การนําเสนอหลักการวิเคราะหแนวทางเดินเสียงในรูปแบบของสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) รวมกับเทคนิคของ Double Clustering เพื่อนําประโยชนไปใชสําหรับการประมวลผลสัญญาณเสียงพูด สัญญาณเสียงพูดท่ีนํามาทดลองเปนสัญญาณเสียงพูดภาษาไทยคําโดด "ศูนย", "หนึ่ง", "สอง", "สาม", "ส่ี", "หา", "หก", "เจ็ด", "แปด" และ "เกา" โดยรวบรวมมาจากผูชาย 100 คน และผูหญิง 100 คน พูดคนละ 3 รอบ จะไดขอมูลเสียงพูดละ 300 เสียง นํามาผานกระบวนการหาคาลักษณะสําคัญดวยสัมประสิทธ์ิคูเสนสเปกตรัม ท่ี 10 อันดับ โดยแบงแตละสัญญาณเสียงพูดออกเปน 20 เฟรมเทากัน ดังนั้นแตละสัญญาณเสียงจะประกอบดวย 200 สัมประสิทธ์ิ จากน้ันหาตัวแทนของเสียงพูดดวยวิธีการ Double Clustering แบบอัลกอริทึม K-Means ในการทดสอบ จะนําสัญญาณเสียงพูดมาผานการหาคาลักษณะสําคัญดวยสัมประสิทธ์ิคูเสนสเปกตรัม แลวเปรียบเทียบระยะหางจากจากตัวแทนสัมประสิทธ์ิของแตละเสียงพูด จากผลการทดลองท่ีไดจะเห็นวาเทคนิคท่ีนํามาใชนี้สามารถนําไปใชงานไดดี มีความแมนยําคอนขางสูง เฉล่ียประมาณ 92.85 เปอรเซ็นต โดยมีคาความแมนยําสูงสุดอยูท่ี 100 เปอรเซ็นต ของเสียงพูด "สอง" จากขอมูลเสียงพูดผูหญิง และมีคาความแมนยําตํ่าสุดอยูท่ี 79 เปอรเซ็นต ของเสียงพูด "หา" จากขอมูลเสียงพูดผูหญิง

คณะนักวิจัยและพัฒนาระบบระบุผูพูดสําหรับภาษาไทย NECTEC [13] พัฒนาการระบุผูพูดดวย LPC และ DTW สําหรับภาษาไทย โดยใชตัวเลขโดด 0-9 ใชลักษณะเดนเปนคาสัมประสิทธการประมาณพันธะเชิงเสนท่ีสกัดจากสัญญาณเสียงมาใชเปนขอมูลในการรูจํา และเปรียบเทียบวิธีระบุผูพูด 3 วิธีคือ ไดนามิกทามวารปปงรวมกับการพิจารณาจุดใกล K จุด, โครงขายประสาทเทียมแบบเพอรเซปตรอนหลายช้ัน และการใชระยะหางแบบยูคลิเดียน ผลปรากฎวาวิธีไดนามิกทามวารปปงรวมกับการพิจารณาจุดใกล K จุดใหผลการระบุผูพูดดีท่ีสุดเฉล่ียอยูท่ี 89.42 เปอรเซ็นต และการใชระยะหางแบบยูคลิเดียนใหผลตํ่าท่ีสุดเฉล่ียอยูท่ี 69.75 เปอรเซ็นต

จักรพันธ จิตรทรัพย [14] ทําการศึกษาการรูจําเสียงพูดคําไดแบบระบุคําพูดเพ่ือใชในการส่ังงานโปรแกรมเลนเพลง Winamp โดยมีคําไทยระบุดังนี้ เปดเคร่ือง ปดเครื่อง เพลงกอนหนา เพลงถัดไป เพิ่มเสียง ลดเสียง เลนเพลง หยุดเพลง ตามลําดับ ดวยวิธีการเอ็มเอฟซีซีและโครงขายประสาทเทียม โดยการดึงคุณลักษณะเดนของสัญญาณเสียงของทั้งคําพูดรวมกับพยางคแรกของคําพูดแลว

34

Page 51: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

วิศรุต อาขุบุตร [17] จากมหาวิทยาลัย จุฬาลงกรณไดทําการเปรียบเทียบประสิทธิภาพวิธีตางๆท่ีใชในการรูจําเสียงพูดตัวเลขไทยต้ังแต 0 - 9 โดยใชตัวอยางเสียงจากผูชายและผูหญิงจํานวน 60 คน ท้ังหมด 1200 เสียง โดยใหพูดภายใตสภาพแวดลอมเดียวกัน เทคนิคท่ีใชในการเปรียบเทียบไดแก Discrete Hidden Markov Model ในแบบจําลองนี้ประกอบดวย 15 สเตท เปนแบบ left-to-right ประกอบกับ Vector Quantization ไดผลความถูกตอง 84.25 % Modified Backpropagation Neural Network โดยใช Sigmoid Function เปน Activation Function ไดความถูกตอง 78.00% Fuzzy-Neural Network โดยเพิ่มสวน Fuzzy Feature Measurement และ Fuzzy Output Vector เพื่อวัดคาคุณลักษณะของเสียงแลวจึงนําคาคุณลักษณะท่ีไดเขาสู Multilayer Perceptron Neural Network ไดความถูกตอง 78.30% จะเห็นไดวาแบบจําลองฮิดเด็นมารคอฟไดประสิทธิภาพดีท่ีสุด นอกจากนี้เม่ือเทียบกับวิธี Neural Network แลววิธีแบบจําลองฮิดเด็นมารคอฟ ยังไมจํากัดความยาวของเสียงอินพุต และไมจําเปนท่ีจะตองตัดเสียงประโยคใหเปนคํากอนเขาสูแบบจําลอง

35

Page 52: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

บทที ่3 วิธีการดําเนินการวิจัย

ในสวนนี้ก็จะนําเสนอวิธีการที่ใชในการพัฒนาโครงสรางของระบบของการรูจํา ซ่ึงก็จะทําการทดสอบและวิเคราะหอยางเปนลําดับข้ันตอนโดยในสวนแรกก็จะทําการเก็บในสวนของขอมูลขางตนเพื่อท่ีนํามาใชเปนตนแบบในการทดสอบและทําการวิเคราะห ท้ังในสวนของการหาคาคุณลักษณะสําคัญรวมไปถึงการใหระบบทําการรูจดจําเฉพาะสัญญาณของแตละสัญญาณ เพื่อท่ีจะใหมีความถูกตองในการแยกแยะมากท่ีสุด

รูปท่ี 3.1 แผนภาพแสดงการทํางานของโครงสรางท้ังระบบ

Page 53: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

3.1 การประมวลผลสัญญาณเสียง การประมวลผลสัญญาณเสียงพูดนั้นเปนการเพิ่มหรือดึงขอมูลขาวสารท่ีจะชวยทําใหเราไดศึกษาโครงสรางของสัญญาณเสียงพูดไดเขาใจมากยิ่งข้ึนถึงการเขารหัสสัญญาณ โดยสัญญาณเสียงพูดนั้นไดแบงออกเปน 3 ระดับ คือ สวนของ Voice เกิดข้ึนจากการดันอากาศผานชองสายเสียง (Glottis) ดวยแรงตึงของคอรดเสียง (Vocal Cord) ท่ีทําการปรับคอรดก็เพื่อท่ีจะทําใหเกิดการส่ันท่ีเหมาะสม จึงทําใหเกิดสัญญาณเสียงแบบคาบในอากาศซ่ึงทําใหชองทางเดินของเสียงส่ัน อีกสวนคือ Unvoiced เกิดข้ึนโดยใชรูปแบบที่จํากัดในชองสายเสียงและผลักดันอากาศผานเขาไปดวยความเร็วท่ีสูงข้ึน เพื่อสรางแรงหมุน ซ่ึงเปนการสรางแหลงกําเนิดสัญญาณรบกวนแถบความถ่ีกวาง นั่นเอง และสวนสุดทาย คือ Plosive เกิดจากเสียงท่ีทําการปดลอมอยางสมบูรณของชองเสียงและสรางแรงดันหลังการปดของชองเสียงและปลอยออกมาอยางทันทีทันใด การรูจําแบงออกเปน 2 ประเภทหลักๆดวยกัน คือ การรูจําแบบข้ึนกับผูพูด (Speaker Dependent) และไมข้ึนกับผูพูด (Speaker Independent) ในงานวิจัยฉบับนี้จะเปนการพัฒนาระบบโดยจะมุงเนนในสวนของลักษณะคําโดดและไมข้ึนกับผูพูด ซ่ึงในสวนแรกน้ันก็ไดทําการกําหนดคําโดดท่ีจะมุงเนนในการทําวิจัยเปนคําจํานวน 10 คํา คือ "ศูนย" "หนึ่ง" "สอง" "สาม" "ส่ี" "หา" "หก" "เจ็ด" "แปด" และ "เกา" โดยจะมีข้ันตอนในการเก็บขอมูลตางๆ ดังนี้ 3.1.1 การเก็บขอมูลกลุมตัวอยางและกลุมทดสอบ กลุมตัวอยางและกลุมทดสอบในท่ีจะเปนกลุมเสียงท่ีใชกันอยางปกติโดยจะมีการระบุคําอยางชัดเจนแลวในขางตนแตวาในการเก็บขอมูลหลักนั้นจะตองคํานึงถึงคุณสมบัติตางๆ ดังนี้ 3.1.1.1 เสียงพดูท่ีใชในการวจิัยเปน ภาษาไทยภาคกลาง เทานั้น 3.1.1.2 เสียงพดูในการวิจยัเปนเสียงตัวเลขภาษาไทย ศูนย ถึง เกา ซ่ึงเปนคําโดด เสียงส้ันเทานั้น 3.1.1.3 น้ําเสียงของผูพูดจะไมแสดงถึงอารมณใดๆ ในขณะทําการบันทึกเสียง 3.1.1.4 ชวงอายุของผูพูดอยูระหวาง 20 – 40 ป โดยเปนคนปกติไมมีการพิการทางรางกายแตอยางใด 3.1.1.5 สภาพรางกายของผูพูดตองอยูในสภาวะปกติ ไมเปนผลตอเสียงพูด 3.1.1.6 สภาพแวดลอมในขณะทําการบันทึกเสียงพูดเปนแบบปกติ (สัญญาณรบกวนโดยรวมอยูท่ี 0 - 0.5dB ไมเกิน)

37

Page 54: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 3.2 ตัวเลขท่ีแสดงใหกลุมตัวอยางและกลุมทดสอบอานออกเสียงภาษาไทย

รูปท่ี 3.3 อารมณตางๆ ท่ีไมสมควรแสดงในขณะออกเสียงตอนเก็บขอมูล

3.1.2 อุปกรณท่ีใชในการจัดเก็บกลุมตัวอยางและกลุมทดสอบ อุปกรณท่ีใชในการจัดเก็บกลุมตัวอยางและกลุมทดสอบนั้น จะเปนอุปกรณท่ีไดมาตรฐาน สามารถนํามาทําการบันทึกใชเปนขอมูลจริงได และทําการทดสอบไดจริง และอุปกรณท้ังหมดอยูในสภาพท่ีสมบูรณสามารถใชงานได ซ่ึงจะมีรายละเอียดของอุปกรณตางๆ ดังน้ี

3.2.1.1 เคร่ืองคอมพิวเตอร Notebooks รุน Intel(R) Core(TM)2 Duo CPU T7100 ความเร็วในการประมวลผล 1.80 GHz ท่ีมีหนวยความจําหลักขนาด 1 GHz และหนวยความจําสํารองขนาด 80 GByte

3.2.1.2 การดเสียง (Sound Card) SoundMAX ของบริษัท Analog Devices ทําการติดต้ังมาพรอมกับเคร่ืองคอมพิวเตอร Notebooks

3.2.1.3 ไมโครโฟน ยี่หอ OKER รุน OE-2688M.V 3.2.1.4 โปรแกรม GoldWave Version 5.20 บนระบบปฏิบัติการ Windows XP

38

Page 55: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

หลังจากท่ีไดทําการตรวจสอบในสวนของอุปกรณตางๆเรียบรอยแลวข้ันตอนตอไปก็จะทําการบันทึกขอมูลของกลุมตัวอยางและกลุมทดสอบโดยจะแบงขอมูลออกเปน 2 ประเภทหลักโดยจะแยกแยะประเภทเปน กลุมตัวอยางผูชาย 200 คน และกลุมตัวอยางผูหญิง 200 คน โดยแตละคนจะทําการพูดขอมูลท่ีระบุไวจํานวน 10 คํา เม่ือไดขอมูลท้ังหมดแลวก็จะนํามาแบงกลุมแยกออกเปน 2 กลุมหลักคือ กลุมท่ีใชในการวิเคราะหหรือกลุมตัวอยาง และกลุมท่ีใชในการทดสอบระบบ 3.1.3 ขั้นตอนในการบันทึกขอมูลของกลุมตัวอยางและกลุมทดสอบ

ในสวนนี้เราจะตองทําการกําหนดคาของสัญญาณเสียงท่ีจะทําการบันทึกโดยจะกําหนดใหเปนมาตรฐานเดียวกันซ่ึงจะสามารถกําหนดผานทางโปรแกรม Gold Wave Ver.5.20 กอนท่ีจะทําการบันทึกขอมูลลงไป รูปหนาตาโปรแกรมจะแสดงดังรูปท่ี 3.4

รูปท่ี 3.4 รายละเอียดของโปรแกรม Gold Wave ท่ีนํามาใชในการเก็บขอมูล นามสกุลท่ีไดมาจากการบันทึกขอมูลสัญญาณจะอยูในรูปของไฟล .wav ซ่ึงเปนประเภท

ของไฟลสัญญาณเสียงประเภทหนึ่ง โดยจะกําหนดใหมีอัตราการชักตัวอยาง Sampling Rate อยูท่ี 8000 เฮิรต ตัวอยางละ 8 บิต แบบชองสัญญาณเดียว Mono โดยรูปแบบจะเปนมาตรฐานของระบบ PCM Telephone ดังแสดงในรูปท่ี 3.5

รูปท่ี 3.5 รายละเอียดของการเก็บขอมูลกลุมตัวอยางและกลุมทดสอบ

39

Page 56: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

หลังจากที่ไดทําการต้ังคาตางๆ เปนท่ีเรียบรอยแลวก็จะทําการเก็บบันทึกกลุมขอมูลท่ีตองการ โดยกําหนดเปนสัญญาณเสียงของผูชาย 100 คน และสัญญาณเสียงของผูหญิง 100 คน ในกลุมแรกนี้จะเปนกลุมของสัญญาณเสียงท่ีใชในการวิเคราะหอยางเดียว โดยผูพูดจะตองทําตามขอกําหนดท่ีกลาวมาขางตนและพูดจํานวน 3 รอบดังแสดงผลการบันทึกสัญญาณในรูปท่ี 3.6

Ampli

tude

รูปท่ี 3.6 ตัวอยางสัญญาณเสียงพูดท่ีไดทําการบันทึกในกลุมสัญญาณเสียงท่ีใชในการวิเคราะห

Time (sec)

หลังจากท่ีไดทําการบันทึกกลุมของขอมูลท่ีใชในการวิเคราะหเรียบรอยแลว จะไดจํานวน

ของขอมูลดิบท่ีเปนไฟลนามสกุล *.wav โดยจะแยกขอมูลดิบของสัญญาณเสียงพูดผูชาย 100 ไฟลและสัญญาณเสียงพูดผูหญิง 100 ไฟล ตามลําดับซ่ึงขอมูลเหลานี้ก็จะตองนํามาทําการตัดแยกสัญญาณเสียงออกมาในกระบวนการถัดไป

Ampli

tude

Time (sec)

รูปท่ี 3.7 ตัวอยางสัญญาณเสียงพูดท่ีไดทําการบันทึกในกลุมสัญญาณเสียงท่ีใชในการทดสอบ

40

Page 57: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

สวนถัดไปก็จะทําการบันทึกขอมูลในสวนของกลุมท่ีใชในการทดสอบก็จะทําในลักษณะเดียวกันกับกลุมของขอมูลท่ีใชในการวิเคราะห แตจะแตกตางกันในสวนของขอมูลนั้นจะมีจํานวนท่ีนอยกวาเพราะทําการบันทึก 1 รอบของการออกเสียงเทานั้น โดยในขอมูลสวนนี้ก็จะนํามาเก็บและนํามาแยกสวนเพื่อท่ีใชในกระบวนการทดสอบตอไป ซ่ึงจะแสดงใหเห็นรูปลักษณะของสัญญาณดังรูปท่ี 3.7

ในสวนนี้จะทําการบันทึกขอมูลเพื่อใชในการทดสอบโดยจะแบงออกเปนสัญญาณเสียงกลุมทดสอบผูชายจํานวน 100 ไฟลและสัญญาณเสียงกลุมทดสอบผูหญิงจํานวน 100 ไฟล ซ่ึงก็ตองนํามาผานกระบวนการแยกสวนสัญญาณเสียงอีกเชนกัน

รูปท่ี 3.8 ไดอะแกรมในสวนของการประมวลผลสัญญาณเสียง

ถัดมาจะเปนการแยกสวนของสัญญาณเสียง (Separate Data) ท่ีไดทําการเก็บตัวอยางเปนท่ีเรียบรอยแลว ใหอยูในสวนของสัญญาณเสียงแตละเสียงเปนกลุมๆไป ในหมวดเดียวกัน เชนในกลุมสัญญาณเสียงท่ีใชในการวิเคราะหก็จะประกอบไปดวย สัญญาณเสียงท่ีเปนเสียงพูดตัวเลข ‘ศูนย’ รวมอยูดวยกันจํานวน 300 สัญญาณเสียง และสัญญาณเสียงตัวเลขอ่ืนๆ ซ่ึงรวมแตละสัญญาณเสียงจะไดไฟลขอมูลมาทั้งหมด 3000 สัญญาณเสียงในกลุมท่ีเปนผูชาย และในสวนท่ีเปนสัญญาณเสียงของผูหญิงก็เชนกัน โดยจะใชหลักการตัดสัญญาณเสียงออกซ่ึงจะมีอยูดวยกัน 2 ข้ันตอนก็คือ การตัดแบบหยาบดังแสดงใหเห็นในรูปท่ี 3.9 และเม่ือทําการตัดแบบหยาบเรียบรอยแลว หลังจากนั้นก็จะทําการตัดแยกแบบละเอียดดวยวิธีการ Endpoint Detection ในการแยกสวนสัญญาณเสียง Voice และ Unvoiced ออก เพื่อท่ีใหไดขอมูลท่ีมีความชัดเจนมากท่ีสุดดังแสดงในรูปท่ี 3.10

41

Page 58: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

Ampli

tude

รูปท่ี 3.9 ลักษณะสัญญาณเสียงท่ีทําการแยกใหเปนหมวดของเสียงแตละเสียงแบบหยาบ

Time (sec)

3.1.3.1 การตัดสัญญาณเสียงชวงหัวและทาย (Endpoint Detection) เปนการตัดสัญญาณใน

สวนท่ีไมตองการออกไป หรือจะเรียกวาเปนการตัดสวนท่ีไมใชสัญญาณเสียง (Unvoiced) ออกจากสวนท่ีเปนสัญญาณเสียง (Voiced) เพื่อทําใหการประมวลผลเร็วข้ึน กรรมวิธีการตัดหัวทายของสัญญาณเสียงมีอยูหลายวิธีการดังท่ีไดกลาวแลวในบทท่ี 2 นั้น ในงานวิจัยนี้เลือกใชวิธีการใชคาพลังงาน (Energy) เนื่องจากเปนวิธีการคํานวณท่ีไมยุงยาก ใชเวลานอย และสัญญาณเสียงพูดท่ีนํามาวิจัยมีสัญญาณรบกวนท่ีมีคาแอมปลิจูดไมสูง โดยจะทําการแบงสัญญาณเสียงพูดออกเปน 240 เฟรม แลวคํานวณหาคาพลังงานของแตละเฟรมโดยใชสมการท่ี (3.1)

(3.1) ∑=

=N

inn iSE

1

2 ][

เม่ือ เปนคาพลังงานในแตเฟรม nE

n เปนตัวระบุวาเปนเฟรมท่ีเทาไหร โดยท่ี n = 1 , 2 , ... , 240 i เปนจํานวนตัวอยางท่ีอยูในแตละเฟรม โดยท่ี i = 0 , 1 , ... , N - 1 N เปนจํานวนตัวอยางท้ังหมดใน 1 เฟรม

หลังจากนั้นจะเปรียบเทียบคาพลังงานในแตละเฟรมกับคาท่ีกําหนด (Threshold) โดยในงานวิจัยนี้กําหนด Threshold ไวท่ี 0.5 เนื่องจากท่ีระดับนี้ยังคงรักษาเสียงพูดใหเหมือนเดิม ถาคาพลังงานในเฟรมใดนอยกวาคา Threshold ท่ีกําหนดถือไดวาเปนชวงเร่ิมตนของคํา และจะทําเชนเดียวกันในสวนทายของสัญญาณเสียงเพื่อหาจุดส้ินสุดคํา [6] จากการดําเนินการสวนนี้จะไดสัญญาณท่ีเปนสวนของสัญญาณเสียง (Voiced) อยางเดียว ตัวอยางแสดงดังในรูปท่ี 3.10

42

Page 59: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

(ก) สัญญาณเสียงกอนการผานหลักการ Endpoint Detection

(ข) สัญญาณเสียงหลังการผานหลักการ Endpoint Detection รูปท่ี 3.10 ตัวอยางการตัดสัญญาณเสียงดวยหลักการ Endpoint Detection

จากรูปท่ี 3.10 (ข) จะเห็นไดวาเปนสัญญาณเสียงท่ีมีเฉพาะ Voice หรือสัญญาณเสียง

ท่ีตองการเพียงอยางเดียวคือสัญญาณท่ีจะนํามาทําการวิเคราะหและหาคาของคุณลักษณะสําคัญตอไป แตจะเห็นไดวาระดับของสัญญาณเสียงนั้นจะแตกตางกันไมมีแอมปลิจูดท่ีแนนอนเปนมาตรฐาน จึงตองทําการปรับระดับบรรทัดฐานของสัญญาณท่ีนํามาทําการวิเคราะหและทดสอบใหเปนมาตรฐานเดียวกันกอน ตัวอยางการปรับบรรทัดฐานแอมปลิจูดแสดงดังในรูปท่ี (3.11)

3.1.3.2 สวนการปรับบรรทัดฐานแอมปลิจูด (Amplitude Normalization) เปนการเพิ่มหรือลดขนาดของสัญญาณเสียงพูด เพื่อใหขนาดของสัญญาณเสียงพูดมีความเหมาะสม เนื่องจากสัญญาณเสียงพูดของแตละบุคคลมีขนาดไมเทากัน จึงจําเปนตองปรับใหมีขนาดของสัญญาณเสียงพูดอยูในบรรทัดฐานเดียวกัน เพื่อใหงายตอการวัดคุณลักษณะและเปรียบเทียบสัญญาณเสียง ในงานวิจัยนี้จะทําการปรับเพิ่มสัญญาณเสียงพูดใหยอดสูงสุดเปน 1 หรือยอดต่ําสุดเปน -1 โดยใชสมการท่ี (3.2)

Ampli

tude

Time (sec)

Time (sec)

Ampli

tude

43

Page 60: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

)max(

)()(~XnXnX = (3.2)

โดยท่ี เปนขอมูลชุดใหม )(~ nX

)(nX เปนขอมูลชุดเดิม )max(X เปนขอมูลท่ีมีคาสัมบูรณของแอมปลิจูดสูงสุด

โดยกระบวนนี้ก็จะกระทํารวมกับการปรับระดับคาอัตราสวนลวงหนา คือ สวนของกรรมวิธีเนนลวงหนา (Pre emphasis) ซ่ึงจะเปนการปรับระดับคาอัตราสวนสัญญาณเสียงตอสัญญาณรบกวน (Signal to Noise Ratio) ใหเพ่ิมสูงข้ัน โดยการนําสัญญาณเสียงพูดผานวงจรกรองความถ่ีสูงผาน อันดับหนึ่ง ท่ีมีฟงกช่ันถายโอนตามสมการที่ (3.3) และ (3.4) ซ่ึงในงานวิจัยฉบับนี้ไดกําหนดใหคาสัมประสิทธ์ิของวงจรกรอง a = 0.95 เนื่องจากเปนคาท่ีใหผลดีท่ีสุดในการคํานวณหาคาสัมประสิทธ์ิทํานายพันธะเชิงเสน [6] ทําใหไดฟงกช่ันถายโอนดังสมการท่ี (3.5)

H(z) = 1 - az-1 , 0.95 ≤ a ≤ 1.0 (3.3)

โดย a เปนสัมประสิทธ์ิของตัวกรองอันดบัท่ีหนึ่ง พบวาสัญญาณเสียงเอาทพุทท่ีผานฟงกชันถายโอนแลวจะเปนไปตามสมการที่ (3.4) ซ่ึงจะสัมพันธกับสัญญาณเสียงอินพุท

)1()()(~ −−= nasnsns (3.4)

โดย เปนสัญญาณเสียงเอาทพทุท่ีผานการ Pre-emphasis แลว )(~ ns

)(ns เปนสัญญาณเสียงเอาทพทุ Sample ท่ี n กอนผานการ Pre-emphasis )1( −ns เปนสัญญาณเสียงเอาทพทุ Sample ท่ี n-1 กอนผานการ Pre-emphasis

H(z) = 1 - 0.95z-1 (3.5)

44

Page 61: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

(ก) สัญญาณเสียงกอนผานการปรับบรรทัดฐานแอมปลิจูด

(ข) สัญญาณเสียงหลังผานการปรับบรรทัดฐานแอมปลิจูด รูปท่ี 3.11 ตัวอยางการปรับบรรทัดฐานแอมปลิจูด

เม่ือทํากระบวนการตางๆท่ีผานมาเรียบรอยแลว จะไดขอมูลท่ีนํามาทําการทดสอบและทําการ

วิเคราะหหาคาคุณลักษณะสําคัญ ขอมูลท้ังหมดท่ีมีอยูนั้นจะประกอบไปดวย สัญญาณเสียงในกลุมตัวอยางท่ีเปนเสียงพูดผูชายจํานวน 3,000 สัญญาณเสียง และที่เปนเสียงพูดผูหญิงจํานวน 3,000 สัญญาณเสียง แบงเปนสัญญาณเสียง ศูนย ถึง เกา สัญญาณเสียงละ 300 สัญญาณเสียงตามลําดับ ในสวนของกลุมทดสอบจะมีสัญญาณเสียงพูดผูชายจํานวน 1,000 สัญญาณเสียง และท่ีเปนเสียงพูดผูหญิงจํานวน 1,000 สัญญาณเสียง แบงเปนสัญญาณเสียง ศูนย ถึง เกา สัญญาณเสียงละ 100 สัญญาณเสียงตามลําดับ ในสวนถัดไปก็จะนําขอมูลท่ีไดมาไปเขาสูกระบวนการการสกัดคาคุณลักษณะสําคัญแบบการทํานายพันธะเชิงเสน โดยในท่ีนี้จะไมมีการแบงเฟรมของสัญญาณของกอนท่ีเขาไปทําการสกัดคาแตจะใชหลักการปรับเปล่ียนคาอันดับของพารามิเตอร LPC เพื่อการเปรียบเทียบและทดสอบแทน

Ampli

tude

Time (sec)

Time (sec) Time (sec)

Ampli

tude

45

Page 62: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

3.2 การสกัดคาคุณลักษณะสําคัญ (Feature Extraction) ในการใชสัญญาณเสียงมาเปรียบเทียบกับคําอางอิง (Word Reference) แบบจุดตอจุดโดยตรง ทําใหตองเสียเวลาในการคํานวณและส้ินเปลืองเนื้อท่ีหนวยความจํามาก ซ่ึงการเปรียบเทียบเฉพาะจุดสําคัญหรือจุดเดนของสัญญาณเสียงจะชวยลดการคํานวณใหนอยลงไดมากข้ึน การสกัดคาลักษณะสําคัญท่ีเหมาะสมกับสัญญาณเสียงจึงนับเปนข้ันตอนท่ีสําคัญมากเพราะถาสามารถสกัดลักษณะสําคัญท่ีบงบอกความแตกตางระหวางสัญญาณเสียงแตละเสียงไดเปนอยางดี อัตราการรูจําก็จะสูงข้ึน ในขณะเดียวกันถายิ่งใชจํานวนคาลักษณะเดนนอย การคํานวณเพ่ือฝกฝนและการรูจําก็จะยิ่งลดลงดวย โดยจะมีรูปแบบการทํางาน ดังรูปท่ี 3.12

รูปท่ี 3.12 ไดอะแกรมโครงสรางของการสกัดคาคุณลักษณะสําคัญ สําหรับการสกัดคาลักษณะสําคัญของสัญญาณเสียงนั้นจะแบงออกเปน 2 แนวทางดวยกันคือ การวิเคราะหโดยใชพารามิเตอร (Parameter Analysis) และการวิเคราะหโดยไมใชพารามิเตอร (Non-parameter Analysis) ในงานวิจัยฉบับนี้จะใชหลักการสกัดคาลักษณะสําคัญแบบการวิเคราะหโดยใชคาพารามิเตอร เพราะเปนการวิเคราะหโดยเลือกแบบจําลองท่ีเหมาะสมกับสัญญาณ แลวทําการปรับแตงคาพารามิเตอรท่ีใชในแบบนั้นๆได เพื่อหาสวนท่ีเหมาะสมที่สุดในการคํานวณ โดยจะใชแบบจําลอง 2 รูปแบบคือ แบบจําลองสัมประสิทธ์ิการทํานายพันธะเชิงเสน (Linear Predictive Coding : LPC) และแบบจําลองสัมประสิทธ์ิคูเสนสเปกตรัม (Line Spectrum Pair : LSP)

46

Page 63: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

3.2.1 สัมประสิทธ์ิการทํานายพันธะเชิงเสน สัมประสิทธ์ิการทํานายพันธะเชิงเสนนั้นเปนการสรางแบบจําลองของสเปกตรัมอยางงาย

โดยใชโพล (All-pole Spectrum Modeling) โดยพารามิเตอรตางๆสามารถประมาณคาไดจากคาความแปรปรวนรวม (Covariance) หรือคาอัตสหสัมพันธ (Autocorrelation) ซ่ึงขอดีของวิธีนี้คือ สามารถแทนสัญญาณเสียงไดอยางมีประสิทธิภาพโดยใชพารามิเตอรจํานวนนอยและใชการคํานวณท่ีคอนขางงาย โดยในงานวิจัยฉบับจะใชหลักการแบบแบงพารามิเตอรอันดับ (Order) ท่ีแตกตางกันออกไปตั้งแต 10, 25, 50 และ 75 อันดับ ตามลําดับ ในท่ีนี้จะยกตัวอยางการคํานวณอยางคราวๆ ท่ี 10 อันดับ โดยจะเร่ิมจากความสัมพันธระหวางคาสัญญาณ กับ ซ่ึงจะมีรูปแบบตามสมการท่ี (3.6) )(ns )

)

(nu

∑=

−+=10

1)()()(

ii insansnu (3.6)

โดยคาพารามิเตอรของ LPC10 (อันดับท่ี 10) จะมีคา (a1, a2, a3, …, a10) โดยจะเลือกคา

พลังงานท่ีต่ําท่ีสุดของ ซ่ึงจะคํานวณไดจากการเปรียบเทียบอนุพันธ แลวจะไดสมการเชิงเสน 10 สมการ โดยท่ีคาอัตสหสัมพันธ ของ จะมีคาดังสมการท่ี (3.7)

)(nu

)(iR (ns

∑−

=

+=1

)()()(N

ininsnsiR (3.7)

โดยท่ี คือจํานวนขอมูล n

สามารถเขียนใหอยูในรูปเมตริกซไดดังสมการท่ี (3.8)

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

−−−−−−−−−−

=

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

)10()9()8()7()6()5()4()3()2()1(

)0()9()8()7()6()5()4()3()2()1()1()0()9()8()7()6()5()4()3()2()2()1()0()9()8()7()6()5()4()3()3()2()1()0()9()8()7()6()5()4()4()3()2()1()0()9()8()7()6()5()5()4()3()2()1()0()9()8()7()6()6()5()4()3()2()1()0()9()8()7()7()6()5()4()3()2()1()0()9()8()8()7()6()5()4()3()2()1()0()9()9()8()7()6()5()4()3()2()1()0(

10

9

8

7

6

5

4

3

2

1

RRRRRRRRRR

aaaaaaaaaa

RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR

(3.8)

ใชวิธีการแกไขดวย Levinson Durbin Recursion ซ่ึงขอมูลท่ีไดมากจ็ะมีตวัแปรแตกตางกันออกไปตามลําดับดังแสดงในตารางท่ี 3.1

47

Page 64: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 3.1 คาตัวแปรของสัมประสิทธ์ิทํานายพันธะเชิงเสนท่ีอันดับแตกตางกัน LPC Order Parameter Orders

10 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10

25 a1 a2 a3 a4 a5 a6 a7 a8 … a24 a25

50 a1 a2 a3 a4 a5 a6 a7 a8 … a49 a50

75 a1 a2 a3 a4 a5 a6 a7 a8 … a74 a75

3.2.2 สัมประสิทธ์ิคูเสนสเปกตรัม (Line Spectrum Pair : LSP)

สัมประสิทธ์ิคูเสนสเปกตรัม เปนพารามิเตอรรูปแบบหนึ่งท่ีพัฒนามาจากพารามิเตอร สัมประสิทธ์ิทํานายพันธะเชิงเสน เนื่องจากพารามิเตอรแบบ LPC นั้น ในข้ันตอนการประมาณคาพารามิเตอรทําใหเกิดความไมเสถียรของสัญญาณได ซ่ึงจะสงผลตอคุณภาพของสัญญาณเสียง ในขณะท่ีพารามิเตอร LSP จะมีคุณสมบัติท่ีเดนคือ คาพารามิเตอรอยูภายในขอบเขตท่ีจํากัด มีการเรียงลําดับของคาพารามิเตอรและสามารถตรวจสอบเสถียรภาพของวงจรกรองไดงาย อีกท้ังสัมประสิทธ์ิคูเสนสเปกตรัม ยังแสดงในรูปเชิงความถ่ีจึงสามารถนําไปใชในการหาคุณสมบัติท่ีแนนอนในระบบการรับรูของเสียงได ในการคํานวณสามารถออกแบบกรอบสเปกตรัมของสัญญาณชวงส้ันไดจากการวิเคราะหการทํานายแบบเชิงเสนในรูปแบบของ All Pole Model ดังสมการท่ี (3.9)

)(

1)(zA

zH = (3.9)

โดยวงจรกรอง A(z) ไดเรียกอีกช่ือหนึ่งวาวงจรกรองผกผัน (Inverse Filter) เนื่องจากเปนสวนผกผันของรูปแบบ All Pole H(z) ของสัญญาณเสียงพูด และรากของ A(z) ทําใหเกิดโพลใน H(z) นั่นคือตําแหนงของเสียงท่ีไดจากชองทางเดินเสียง ในการคํานวณหาสัมประสิทธ์ิคูเสนสเปกตรัมเร่ิมตนจากพหุนามอันดับ M ของวงจรผกผันในเชิงแซดดังสมการท่ี (3.9) โดยทําการแยกสวนสมการดังกลาวเปนพหุนามอันดับ M+1 เปนจํานวนสองพหุนามดังสมการท่ี (3.10) และ (3.11)

(3.10) )()()( 1)1( −+−+= zAzzAzP M

(3.11) )()()( 1)1( −+−−= zAzzAzQ M

48

Page 65: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

1110110

383

292

1101 )(...)()()(1)( −−−−− +−++−+−+−+= zzaazaazaazaazP (3.12)

1110

1103

832

921

101 )(...)()()(1)( −−−−− +−++−+−+−−= zzaazaazaazaazQ (3.13) ความสัมพันธของ A(z) เปนไปดังสมการ (3.14)

2

)()()( zQzPzA += (3.14)

พหุนามของ P(z) และ Q(z) สอดคลองกับรูปแบบชองทางเดินเสียงท่ีไรการสูญเสียขณะท่ี

ชองระหวางเสนเสียง ปด เปดตามลําดับ และรากของพหุนาม P(z) และ Q(z) เรียกวา ความถ่ีสเปกตรัม โดยท่ีคาสัมประสิทธ์ิของ LPC จะเปนคาพารามิเตอรของสัมประสิทธ์ิแบบ LSP จะมีคาฟงกช่ันแบบ 1 ตอ 1 โดย LSP สามารถท่ีจะปรับคาระดับสัญญาณไดมากกวา LPC เพราะคาของ LSP นั้นจะมีอันดับท่ีอยูในขอบเขตชวงท่ีแคบกวา LPC คือชวง นั่นเอง ซ่ึงขอมูลท่ีไดมาก็จะมีตัวแปรแตกตางกันออกไปตามลําดับดังแสดงในตารางท่ี 3.2

πωωω <<<< 1021 ...0

ตารางท่ี 3.2 คาตัวแปรของสัมประสิทธ์ิคูเสนสเปกตรัมท่ีอันดับแตกตางกัน

LSP Order Parameter Orders

10 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10

25 a1 a2 a3 a4 a5 a6 a7 a8 … a24 a25

50 a1 a2 a3 a4 a5 a6 a7 a8 … a49 a50

75 a1 a2 a3 a4 a5 a6 a7 a8 … a74 a75

3.3 กรอบเปอรเซ็นตระยะหางระหวางขอมูล (Distance to Fault) จากสัมประสิทธ์ิท้ังสองประเภทท่ีไดมานั้น ก็นํามาคํานวณหาคาระยะหางจากตัวแทนของ

สัญญาณเสียงพูดเฉลี่ยของแตละสัมประสิทธ์ิ แตละตัวเลข แตละกลุม ของสัญญาณเสียงทั้งหมด ของแตละชุด หลังจากนั้นจึงคํานวณหาเปอรเซ็นตระยะหางของขอมูล แตละขอมูลกับคาเฉล่ีย โดยใชสมการท่ี (3.15)

%100% ×−

=Average

DataAverageDistance (3.15)

49

Page 66: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

เม่ือได %Distance เปนเปอรเซ็นตระยะหางของขอมูลแตละขอมูลกับคาเฉล่ีย (Average) เปนคาเฉล่ียของแตละสัมประสิทธ์ิ แตละตัวเลข แตละกลุม และ Data เปนสัมประสิทธ์ิของแตละสัญญาณเสียง พิจารณาจํานวนสัมประสิทธ์ิของแตละสัญญาณเสียงท่ีมีเปอรเซ็นตระยะหางจากคาเฉลี่ยท่ีเปอรเซ็นตตางๆ ในงานวิจัยฉบับนี้จะใชการหาคาระยะหางของขอมูล ท่ีตางกันดังแสดงในตารางท่ี 3.3 ซ่ึงทางนักวิจัยไดทําการทดสอบและเลือกคาท่ีจะนํามาใชเปนมาตรฐานแลวจากการนําคา Average ของสัมประสิทธ์ิในแตละตัวมาทําการทดสอบกอนท่ีจะตัดสินใจ

ตางรางท่ี 3.3 รายละเอียดของกรอบระยะหางขอมูลของสัมประสิทธ์ิ LPC และ LSP ชวงท่ีดีท่ีสุด

Order Parameter Feature Extraction

10 25 50 75 Linear Predictive Coding 75 % 50 % 50 % 100 % Line Spectrum Pair 7 % 3 % 2 % 1 %

ในสวนของผลการทดสอบจะอยูในสวนของบทถัดไปซ่ึงจะกลาวและแสดงผลอยางละเอียด

เพื่อใหทราบถึงท่ีมาของการจัดลําดับกรอบระยะหางของขอมูล

3.4 การเรียนรูจําดวยระบบโครงขายประสาทเทียม โครงขายประสาทเทียมถูกสรางข้ึนมาเพื่อเรียนแบบการทํางานของสมองมนุษย มีการทํางานแบบขนานจํานวนมาก ในงานวิจัยฉบับนี้เลือกใชโครงขายประสาทเทียมแบบเพอรเซฟตรอนหลายช้ัน (Multilayer Neural Network : MLP) หรือโครงขายประสาทเทียมแบบแพรยอนกลับ (Feedforward Backpropagation Neural Network) ซ่ึงเปนโครงขายประสาทเทียมแบบตองมีผูสอน (Supervised Learning) และใชฟงกช่ันกระตุนท่ีเปนแบบ Hyperbolic Tangent Sigmoid โดยกําหนดขอมูลอินพุต 100 ขอมูลของสัญญารเสียงผูชายและ 100 ขอมูลของสัญญาณเสียงผูหญิง ในสวนของช้ันกลางหรือช้ันซอน (Hidden Layer : HD) จะกําหนดอยูท่ี 10 โหนด และสุดทายช้ันเอาทพุตอยูท่ี 1 โหนด โดยจะใชหลักการเปรียบเทียบขอมูลและทําการเลือกขอมูลท่ีไดทําการวิเคราะหมาแลวในขางตน ทางนักวิจัยทําการเลือกใชขอมูลของสัญาณเสียงตัวอยางผูชายและผูหญิงอันดับท่ี 50 ของสัมประสิทธ์ิเสนคูสเปกตรัม (LSP) เทานั้น เนื่องจากไดมีการทดสอบผลความถูกตอง ซ่ึงมีความเปนไปไดสูงท่ีสุด จึงนําขอมูลขางตนมาเปนรูปแบบในการรูจํา เพื่อเปนการวิเคราะห หาคาของความถูกตองสูงสุด และในสวนของกระบวนการนี้จะแสดงใหเห็นดังไดอะแกรมรูปท่ี 3.13

50

Page 67: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

Result

NeuralNetwork

Line Spectral Pair

Order50

Parameter

Training net

Test net

Record net

net data0 - 9

Compare Distance Error Rate

Result Data

รูปท่ี 3.13 ไดอะแกรมของการเรียนรูจําของโครงขายประสาทเทียมเทียบกับ LSP

3.4.1 การเรียนรูแบบแพรกลับของโครงขายประสาทเทียม (Backpropagation Learning ANN) วิธีการเรียนรูแบบ Backpropagation Neural Network จะเปนอัลกอริทึมแบบหนึ่งท่ีใช

สําหรับสอนโครงขายประสาทเทียมชนิดเพอรเซปตรอนหลายช้ัน (Multilayer Perceptrons : MLP) ซ่ึงเอาทพุตของช้ันหนึ่งจะกลายเปนขอมูลอินพุตในช้ันถัดไปหรือเรียกกระบวนการน้ีวา Feed Forward เพอรเซฟตรอนหลายช้ันมีลักษณะหลักๆ ดังนี้คือ

3.4.1.1 จํานวนช้ันตางๆ โครงขายประสาทเทียมจะประกอบดวยช้ันตางๆ คือ ช้ันอินพุต (Input layer) ช้ันเอาตพุต (Output layer) และช้ันซอน (Hidden layer) ซ่ึงจะอยูระหวางช้ันอินพุตและช้ันเอาตพุต

3.4.1.2 การเช่ือมตอระหวางช้ันตางๆ การเช่ือมตอระหวางช้ันตางๆนั้น ทุกๆโหนดในช้ันอินพุตจะสงสัญญาณไปยังทุกๆ โหนดในช้ันซอนช้ันแรก และทุกๆโหนดในช้ันซอนช้ันแรกจะสงสัญญาณ ไปยังทุกๆโหนดในช้ันถัดไป จนในท่ีสุดทุกๆโหนดในช้ันซอนช้ันสุดทาย จะสงสัญญาณไปยังทุกๆโหนดในช้ันเอาตพุต

3.4.1.3 การทํางานของช้ันตางๆ ช้ันอินพุตไมมีการประมวลผล จะทําหนาท่ีรับสัญญาณเขาแลวกระจายออกไปยังแตละโหนด ในช้ันถัดไปเทานั้น สวนช้ันซอนและช้ันเอาตพุต นั้นมีการประมวลผล ดังแสดงในรูปท่ี 3.14 โครงขายประสาทเทียมแบบเพอรเซพตรอนหลายช้ัน ซ่ึงจะประกอบไปดวย ช้ันของอินพุต, ช้ันซอนจํานวน 1 ช้ัน และช้ันของเอาตพุต โดยแตละโหนดจะถูกเช่ือมตอกันเปนโครงขาย

51

Page 68: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

Inputs

Input LayerHidden Layer

Output Layer

Outputs

รูปท่ี 3.14 สวนประกอบโครงขายประสาทเทียม 3 เลเยอร

3.4.2 ขั้นตอนและวิธีการรูจําแบบแพรยอนกลับของโครงขายประสาทเทียม วิธีการเรียนรูแบบแพรยอนกลับนั้นจะมีข้ันตอนวิธีการเรียนรูของโครงขายประสาทเทียม

แบบพื้นฐานท่ีมีช้ันกลาง 1 ช้ัน พรอมตัวแปรตางๆ แสดงในรูปท่ี 3.15

x1

x2

x3

xN

x1

x2

x3

xN

w11

wNM

y1

yM

w11

wMJ

z1

zJ

z3

z2

e1

e3

e2

eJ

INPUT LAYERBRANCHING

NODES

MIDDLE LAYER NEURODES

OUTPUT LAYERNEURODES

OUTPUTS

DESIREDOUTPUTS

t1

t2

t3

tJ

รูปท่ี 3.15 โครงขายประสาทเทียมแบบแพรยอนกลับท่ีมีช้ันกลาง 1 ช้ัน ข้ันตอนการเรียนรูของโครงขายประสาทเทียมแบบแพรยอนกลับ แบงเปนข้ันตอน

ดังตอไปนี้ 3.4.2.1 กําหนดจํานวนโหนดอินพุต (N), จํานวนโหนดเอาตพุต (J), จํานวนโหนด

ของช้ันซอน (M), ขอมูลอินพุต และขอมูลเอาตพุต ตอจากนั้น ทําการรับจํานวนรอบสูงสุดท่ีจะทําการ

52

Page 69: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

เรียนรู (R) และคาผิดพลาดท่ียอมรับได ในงานวิจัยฉบับนี้ไดกําหนดคาตางๆ ดังนี้ โหนดอินพุต 50 โหนด ของแตละอินพุตท้ังหมด 200 อินพุต ท้ังสัญญาณเสียงผูชายและสัญญาณเสียงผูหญิง โหนดเอาตพุตจํานวน 1 โหนด โหนดของชั้นซอนจํานวน 10 โหนด จํานวนรอบสูงสุดท่ีจะทําการเรียนรู 20,000 รอบในการคํานวณ และคาความผิดพลาดของขอมูลอยูท่ี 5101 −×

ตั้งคาพารามิเตอรของอัตราการเรียนรู ( η ) ใหอยูในชวง [0, 1] 3.4.2.2 3.4.2.3 สุมน้ําหนักเร่ิมตนใหกับทุกๆ เสนในโครงขายประสาทเทียมในท้ัง 2 ช้ัน โดย

ใหมีคาอยูระหวาง [0 0.5] เนื่องจากขอมูลของสัมประสิทธ์ิคูเสนสเปกตรัมมีคาท่ีอยูในชวงนี้ท้ังหมดจากการทดลอง

3.4.2.4 รับคาอินพุตของขอมูลชุดแรก เพื่อใชในการคํานวณหาคาเอาตพุตของโครงขายประสาทเทียม

3.4.2.5 คํานวณคาเอาตพุตของช้ันซอน นําคาอินพุตของชุดท่ีจะทําการคํานวณหาคาเอาตพุตของช้ันซอนออกมา แลวจึงทําการคํานวณคาเอาตพุตของช้ันซอน กอนทําการปรับคาฟงกช่ันกระตุน ใหอยูในชวง [0, 1] สําหรับแตละโหนดของช้ันซอน คาเอาตพุตของช้ันซอนกอนทําการปรับจะแสดงดังสมการท่ี (3.16) สวนของคาเอาตพุตช้ันซอนหลังทําการปรับแลวจะแสดงดังสมการท่ี (3.17) และฟงกช่ันกระตุน ท่ีใชในการปรับคาจะแสดงดังสมการท่ี (3.18) )(nf

∑=

×=1n

nmnm wxs (3.16)

)( mm sfy = (3.17)

โดยท่ี เปนอินพุตโหนดท่ี n มีท้ังหมด N โหนด nx

ms เปนเอาตพุตของชั้นซอน กอนทําการปรับคา (activation) เปน my

my เปนเอาตพุตของชั้นซอน หลังทําการปรับคาของโหนดท่ี m มีท้ังหมด M โหนด

nmw เปนน้ําหนักของเสนเช่ือมระหวางช้ันอินพุต กับช้ันซอน

nn

nn

eeeenf −

+−

=)( (3.18)

3.4.2.6 คํานวณคาเอาตพุตของช้ันเอาตพุต กอนทําการปรับคา แลวทําการปรับคา

เอาตพุตของช้ันเอาตพุต ใหอยูในชวง [0 1] สําหรับแตละโหนดของช้ันเอาตพุต โดยคาเอาตพุตของ

53

Page 70: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ช้ันเอาตพุตกอนทําการปรับคา จะแสดงดังสมการท่ี (3.19) และคาเอาตพุตของช้ันเอาตพุตหลังทําการปรับคาแลว จะแสดงดังสมการท่ี (3.20)

∑=

=M

mmjmj wyv

1

(3.19)

โดยท่ี เปนเอาตพุตของชั้นเอาตพตุ กอนทําการปรับคา (activation) เปน jv jz

mjw เปนน้ําหนักของเสนเช่ือมระหวางช้ันซอน กับช้ันเอาตพุต

)( jj vfz = (3.20)

โดยท่ี เปนคาเอาตพตุท่ีไดทําการปรับคาแลวของช้ันเอาตพุตโหนดท่ี j มีท้ังหมด J โหนด

jz

3.4.2.7 หาคาความผิดพลาดและปรับน้ําหนัก นําเอาตพุตท่ีได กับ เอาตพุตท่ีกําหนดไว มาหาคาความผิดพลาดของขอมูล ถาคาผิดพลาดของขอมูลนอยกวาคาผิดพลาดท่ียอมรับได ทําการรับขอมูลชุดตอไป ถาไมใชปรับน้ําหนักแลวทําการรับขอมูลของชุดถัดไปแลวจึงกลับไปทํากระบวนการที่ 3.4.2.5 แตถาเปนขอมูลชุดสุดทายใหไปทํากระบวนการขอ 3.4.2.8 คาความผิดพลาดในแตละชุดของขอมูลตัวอยาง แสดงดังสมการท่ี (3.21) ในสวนของการปรับคาถวงน้ําหนักจะแสดงดังสมการท่ี (3.22) และ (3.23)

∑=

−=J

jjj

q zte1

)(21 (3.21)

โดยท่ี เปนคาผิดพลาดของขอมูลตัวอยาง qe

jt เปนคาเอาตพุตท่ีตองการที่ช้ันเอาตพุตโหนดท่ี j มีท้ังหมด J โหนด q เปนจํานวนชุดของขอมูลตัวอยาง มี Q เปนตัวกําหนด

{ }qmqj

qj

qj

qj

rmj

rmj yzzztww )]1()[(1 −−+=+ η (3.22)

qn

qm

qm

J

j

rmj

qj

qj

qj

qj

rnm

rnm xyywzzztww )]1([)]1()[(

1

1 −⎭⎬⎫

⎩⎨⎧

−−+= ∑=

+ η (3.23)

3.4.2.8 หาคาผิดพลาดรวมเฉล่ีย นําคาผิดพลาดของชุดขอมูลแตละชุดมารวมกัน แลว

ทําการหาคาเฉล่ีย เพื่อใชในการตรวจสอบวาผลลัพธของทุกๆ ขอมูลในแตละรอบนั้นมีคานอยกวาคา

54

Page 71: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ผิดพลาดท่ียอมรับไดในทุกๆ ขอมูลหรือไม ถาใชแสดงวาโครงขายประสาทเทียมสามารถใหผลลัพธท่ีถูกตองของทุกๆขอมูลแลวจบการเรียนรู โดยจะแสดงดังสมการท่ี (3.24)

∑=

=Q

q

qeQ

E1

1 (3.24)

โดยท่ี เปนคาความผิดพลาดเฉล่ียของขอมูลตัวอยาง E

รูปท่ี 3.16 อธิบายการสงผานขอมูลทางดานอินพุตของระบบโครงขายประสาทเทียม [20]

รูปท่ี 3.17 การสงขอมูลอินพุตภายในระบบโครงขายประสาทเทียม [20]

55

Page 72: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

บทที ่4 ผลการวิจยั

ในสวนนี้ก็จะเปนการแสดงผลในสวนของขอมูลท้ังหมดท่ีไดทําการเก็บบันทึก และทําการทดสอบ ในเร่ืองของการสกัดคาคุณลักษณะสําคัญ การทดสอบกรอบระยะหางระหวางขอมูล การเรียนรูจําจดดวยคุณลักษณโครงขายประสาทเทียม รวมไปถึงขอมูลท่ีใชในการสรุปผลขอมูลดวย

4.1 ลักษณะของขอมลูในกลุมตัวอยางและกลุมทดสอบ ผลของขอมูลในการเก็บตัวอยางและกลุมทดสอบนั้นเสียงแตละเสียงก็จะมีรูปรางท่ีแตกตางกันออกไปและจํานวนของขอมูลท่ีไดมานั้นก็จะมีความยาวที่ไมเทากันเพียงแตวา จะมีลักษณะของสัญญาณท่ีคลายกันซะสวนใหญ ดังแสดงลักษณะของสัญญาณใหเห็นดังรูปท่ี 4.1 ในสวนของการหาคาพลังงานเพ่ือจะทําการแยกสวนของสัญญาณเสียงออกนั้นก็จะแสดงใหเห็นในรูปท่ี 4.2 โดยจะใชลักษณะของการแยกเฟรมในเบื้องตนกอนแลวหาคาของพลังงานท่ีตางกันออกไปเพื่อทําการกําหนดในสวนหัวและทายของสัญญาณเสียง ถัดมาคือการแสดงการปรับระดับของสัญญาณเสียงเพื่อใหมีมาตรฐานในแบบเดียวกันก็คือใหมีคาสูงสุดอยู +1 และ -1 ดังแสดงใหเห็นในรูปท่ี 4.3 นั่นเอง

รูปท่ี 4.1 ตัวอยางสัญญาณเสียงท่ีไดจากการบันทึก

รูปท่ี 4.2 การสรางกรอบของสัญญาณเสียงเพื่อทําการแยกสัญญาณเสียงใหเปนกลุม

Page 73: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.3 ลักษณะของสัญญาณเสียงท่ีไดทําการผานกระบวนการปรับระดับสัญญาณ

4.2 ผลของขอมูลจากการสกัดคาสัมประสิทธิ์ทํานายพันธะเชิงเสน ในการหาคาสัมประสิทธ์ิทํานายพันธะเชิงเสนของสัญญาณเสียงนั้นจะกําหนดคาของพารามิเตอรท่ีตางกันโดยอาศัยจํานวนอันดับเปนตัวเปรียบเทียบขอมูล และใชหลักการหากรอบของขอมูลซ่ึงวาดวยระยะหางระหวางขอมูลใหกลุมเดียวกันท่ีเปนเปอรเซนตท่ีตางกันออกไปเชนกันโดยผลของขอมูลนั้นจะแสดงตั้งแตอันดับท่ี 10 25 50 และ 75 ตามลําดับ และในแตละอันดับก็จะประกอบไปดวยกรอบของระยะหางระหวางขอมูลท่ี 10 25 50 และ 75 เปอรเซนต ตามลําดับเพื่อทําการหาชวงท่ีดีท่ีสุดของขอมูลดังแสดงในรูปท่ี 4.4

รูปท่ี 4.4 ตัวแทนของสัญญาณเสียงเปรียบเทียบกับกรอบระยะหางระหวางขอมูล

จากรูปท่ี 4.4 เปนการเปรียบเทียบขอมูลของกลุมทดสอบกับระยะหางระหวางขอมูลในกรอบท่ี 10 %, 25%, 50% และ 75% ตามลําดับ แสดงใหเห็นถึงการจับกลุมกับชุดของตัวแทนของสัญญาณเสียงแตละสัญญาณ โดยจะเห็นไดวายังมีขอมูลบางขอมูลท่ีอยูนอกกรอบหรือไปผสม

57

Page 74: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ใกลเคียงกับชุดตัวแทนสัญญาณเสียงตัวอ่ืนดวย แตยังคงเห็นถึงความชัดเจนของการเขาใกลตัวแทนของสัญญาณเสียงตัวเอง และไดทําการเปรียบใหเห็นดังตารางท่ี 4.1 ถึง 4.8 ในแตละอันดับท่ีไดทําการทดสอบ เพื่อท่ีจะหาจุดและกรอบท่ีเหมาะสมท่ีสุดในการวิเคราะห [15] ตารางท่ี 4.1 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูชาย แสดงถึง

ลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนั้นๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 10 25 50 75

ศูนย 81.10 52.10 24.37 11.77 หนึ่ง 84.37 62.37 33.23 15.33 สอง 85.97 65.70 40.00 24.83 สาม 79.83 51.23 23.03 10.23 ส่ี 85.13 68.40 53.93 44.90 หา 83.33 59.93 30.07 13.70 หก 84.60 63.47 35.17 18.80 เจ็ด 83.20 60.20 33.73 17.20 แปด 79.40 52.40 21.80 8.37 เกา 79.77 53.97 22.27 8.73

จากตารางท่ี 4.1 แสดงใหเห็นถึงคาความผิดพลาดของสัญญาณเสียงผูชาย ท่ีจะเปนสัญญาณเสียงนั้นๆโดยจะทําการกําหนดกรอบของขอมูลใหเห็นใน 4 ลําดับดวยกัน ตัวอยางเชนเม่ือนาํขอมูลของสัมประสิทธ์ิทํานายพันธะแบบเชิงเสนอันดับท่ี 10 มาทําการวิเคราะหเปรียบเทียบกับสัญญาณเสียงท่ีแตกตางกันโดยเร่ิมตนจากการนําสัญญาณเสียง ศูนยมาเปรียบเทียบกับสัญญาณเสียง หนึ่ง ถึง เกา จะเห็นไดวามีคาความผิดพลาดท่ีจะเปนสัญญาณเสียงอ่ืนอยูท่ี 81.10 เปอรเซ็นต แตเม่ือทําการปรับกรอบระยะหางระหวางขอมูลเปน 25 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 52.10 เปอรเซ็นต สวนท่ีกรอบระยะหางระหวางขอมูล 50 เปอรเซ็นตจะมีคาความผิดพลาด 24.37 เปอรเซ็นตและท่ีกรอบระยะหางระหวางขอมูล 75 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 11.77 เปอรเซ็นต ดวยกัน

58

Page 75: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.2 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

10 25 50 75

ศูนย 79.68 52.55 19.07 6.79 หนึ่ง 83.00 56.29 22.37 7.79 สอง 80.83 54.75 22.09 7.85 สาม 78.61 52.92 19.52 6.76 ส่ี 83.57 59.23 26.69 14.91 หา 84.05 59.17 26.05 10.91 หก 83.29 57.71 24.09 8.53 เจ็ด 81.80 54.57 21.52 9.85 แปด 79.87 52.40 20.95 7.69 เกา 80.21 52.23 20.57 8.31

ตารางท่ี 4.3 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูชาย แสดงถึง

ลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 10 25 50 75

ศูนย 80.71 54.66 21.02 6.57 หนึ่ง 83.63 62.11 28.92 9.33 สอง 82.22 53.31 19.97 5.63 สาม 81.03 57.05 22.93 7.75 ส่ี 86.48 64.36 26.56 10.25 หา 84.60 61.63 30.50 10.79 หก 83.82 59.09 25.33 10.19 เจ็ด 81.16 57.07 25.39 9.09 แปด 81.05 55.87 22.34 8.27 เกา 79.77 55.87 22.16 6.67

59

Page 76: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.4 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

75 80 90 100

ศูนย 29.89 28.12 25.36 22.91 หนึ่ง 27.79 25.01 21.68 18.98 สอง 24.44 22.29 19.07 16.60 สาม 29.30 26.60 22.70 20.00 ส่ี 26.56 24.09 20.20 17.11 หา 29.24 26.34 22.18 19.29 หก 41.10 38.87 35.20 31.71 เจ็ด 27.45 25.29 21.78 19.14 แปด 28.14 25.89 22.12 19.17 เกา 26.07 23.87 20.18 17.65

ในสวนตารางท่ี 4.4 นั้นจะเห็นไดวาทางนักวิจัยไดใชคาของสัมประสิทธ์ิทํานายพันธะแบบเชิงเสนอันดับท่ี 75 แตในสวนของกรอบระยะหางระหวางขอมูลนั้นจะใชท่ี 75 80 90 และ 100 เปอรเซ็นต ดวยสาเหตุท่ีวาในชวงของขอมูลท่ี 10 25 50 เปอรเซ็นต นั้นทางนักวิจัยไดทําการทดสอบแลวผลที่ไดออกมาคาของความผิดพลาดท่ีไมแนชัดและไมเห็นภาพรวมทางนักวิจัยจึงนําคาของขอมูลดังกลาวท่ีเห็นถึงความแตกตางอยางมีเหตุผลมาแสดงใหทราบถึงคาท่ีผิดพลาดอยางชัดเจน อยางไรก็ตามทางนักวิจัยก็ไดทําการทดสอบเปนท่ีเรียบรอยแลว [15]

ในสวนตารางที่ 4.5 แสดงใหเห็นถึงคาความผิดพลาดของสัญญาณเสียงผูหญิง ท่ีจะเปนสัญญาณเสียงนั้นๆ เชนเดียวกันกับสัญญาณเสียงผูชาย โดยจะทําการกําหนดกรอบของขอมูลใหเห็นใน 4 ลําดับดวยกัน ตัวอยางเชนเม่ือนําขอมูลของสัมประสิทธ์ิทํานายพันธะแบบเชิงเสนอันดับท่ี 10 มาทําการวิเคราะหเปรียบเทียบกับสัญญาณเสียงท่ีแตกตางกันโดยเร่ิมตนจากการนําสัญญาณเสียง ศูนยมาเปรียบเทียบกับสัญญาณเสียง หนึ่ง ถึง เกา จะเห็นไดวามีคาความผิดพลาดท่ีจะเปนสัญญาณเสียงอ่ืนอยูท่ี 71.27 เปอรเซ็นต แตเม่ือทําการปรับกรอบระยะหางระหวางขอมูลเปน 25 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 41.43 เปอรเซ็นต สวนที่กรอบระยะหางระหวางขอมูล 50 เปอรเซ็นตจะมีคาความผิดพลาด 17.17 เปอรเซ็นตและท่ีกรอบระยะหางระหวางขอมูล 75 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 6.73 เปอรเซ็นต ดวยกัน

60

Page 77: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.5 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูหญิงแสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

10 25 50 75

ศูนย 71.27 41.43 17.17 6.73 หนึ่ง 83.80 59.30 25.83 8.30 สอง 77.07 49.50 22.73 9.60 สาม 82.53 55.87 24.83 9.13 ส่ี 88.57 71.63 51.07 36.97 หา 85.67 65.40 35.10 15.77 หก 71.87 42.47 17.73 6.60 เจ็ด 84.47 61.50 34.60 19.83 แปด 81.90 57.87 25.97 8.80 เกา 83.70 60.97 29.57 10.67

ตารางท่ี 4.6 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูหญิง แสดงถึง

ลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 10 25 50 75

ศูนย 73.37 43.93 18.93 7.83 หนึ่ง 82.55 59.21 30.52 13.60 สอง 78.21 54.71 25.41 8.36 สาม 76.64 49.87 20.31 6.61 ส่ี 89.56 74.20 47.03 23.03 หา 89.81 74.08 45.93 25.67 หก 73.68 40.51 15.15 7.33 เจ็ด 87.49 65.80 34.77 14.73 แปด 86.25 66.01 33.25 11.53 เกา 86.28 68.37 41.15 18.55

61

Page 78: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.7 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

10 25 50 75

ศูนย 82.92 61.65 33.25 15.80 หนึ่ง 83.35 58.19 30.85 12.45 สอง 86.45 67.39 39.78 16.71 สาม 79.81 56.15 27.89 9.39 ส่ี 90.64 73.88 43.10 19.07 หา 88.04 71.35 38.98 17.72 หก 81.55 54.41 25.44 8.37 เจ็ด 88.17 67.93 38.41 15.46 แปด 85.39 66.65 34.79 13.44 เกา 84.71 65.12 35.50 14.33

ตารางท่ี 4.8 คาสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูหญิง แสดงถึง

ลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 75 80 90 100

ศูนย 47.84 45.48 41.08 36.50 หนึ่ง 43.29 41.05 37.63 34.55 สอง 48.28 45.57 40.88 36.47 สาม 39.93 37.45 33.48 29.99 ส่ี 42.94 40.33 36.32 32.67 หา 44.41 42.16 38.24 34.96 หก 44.58 42.42 38.73 35.10 เจ็ด 39.44 37.15 33.23 29.56 แปด 39.53 37.42 33.73 30.54 เกา 40.75 38.49 34.48 30.96

62

Page 79: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ในสวนตารางท่ี 4.8 นั้นจะเห็นไดวาทางนักวิจัยไดใชคาของสัมประสิทธ์ิทํานายพันธะแบบเชิงเสนอันดับท่ี 75 แตในสวนของกรอบระยะหางระหวางขอมูลนั้นจะใชท่ี 75 80 90 และ 100 เปอรเซ็นต ดวยสาเหตุท่ีวาในชวงของขอมูลท่ี 10 25 50 นั้นทางนักวิจัยไดทําการทดสอบแลวผลที่ไดออกมาคาของความผิดพลาดที่ไมแนชัดและไมเห็นภาพรวมทางนักวิจัยจึงนําคาของขอมูลดังกลาวท่ีเห็นถึงความแตกตางอยางมีเหตุผลมาแสดงใหทราบถึงคาท่ีผิดพลาดอยางชัดเจนอยางไรก็ตามทางนักวิจัยก็ไดทําการทดสอบเปนท่ีเรียบรอยแลว

4.3 การเปรียบเทียบขอมูลจากการสกัดคาสัมประสิทธิ์ทํานายพันธะเชิงเสนระหวางสัญญาณเสียงผูชายกับสัญญาณเสียงผูหญิง

ในการเปรียบเทียบขอมูลระหวางสัญญาณเสียงพูดผูชายกับสัญญาณเสียงพูดผูหญิงนั้นจะกระทําข้ึนเพื่อใชในการเลือกอันดับและกรอบของระยะหางระหวางขอมูลของสัญญาณท้ังสอง และจะแสดงใหเห็นถึงคาท่ีมีความถูกตองใกลเคียงกันมากท่ีสุด เพื่อจะนําไปเปนมาตรฐานของการวิเคราะหในสวนถัดไป และจะยิ่งทําใหเห็นถึงคุณลักษณะของสัญญาณท้ังสองท่ีไปดวยกันไดในความเปนจริง โดยในการเปรียบเทียบขอมูลจะใชการหาคากลาง คือการนําขอมูลของท้ังสองมาคิดหาเปอรเซ็นตของขอมูล โดยจะดูจากคาความผิดพลาดท่ีนอยท่ีสุดและมีความหางของขอมูลท่ีแตกตางกันนอยท่ีสุดเปนหลัก [15] ดังแสดงในตารางดังนี้ ตารางท่ี 4.9 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดบัท่ี 10 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 10 25 50 75

ศูนย 76.18 46.77 20.77 9.25 หนึ่ง 84.08 60.83 29.53 11.82 สอง 81.52 57.60 31.37 17.22 สาม 81.18 53.55 23.93 9.68 ส่ี 86.85 70.02 52.50 40.93 หา 84.50 62.67 32.58 14.73 หก 78.23 52.97 26.45 12.70 เจ็ด 83.83 60.85 34.17 18.52 แปด 80.65 55.13 23.88 8.58 เกา 81.73 57.47 25.92 9.70

63

Page 80: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.10 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

10 25 50 75

ศูนย 76.53 48.24 19.00 7.31 หนึ่ง 82.77 57.75 26.45 10.69 สอง 79.52 54.73 23.75 8.11 สาม 77.63 51.39 19.91 6.69 ส่ี 86.57 66.71 36.86 18.97 หา 86.93 66.63 35.99 18.29 หก 78.49 49.11 19.62 7.93 เจ็ด 84.65 60.19 28.15 12.29 แปด 83.06 59.21 27.10 9.61 เกา 83.25 60.30 30.86 13.43

ตารางท่ี 4.11 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 50 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 10 25 50 75

ศูนย 81.82 58.15 27.13 11.18 หนึ่ง 83.49 60.15 29.88 10.89 สอง 84.33 60.35 29.88 11.17 สาม 80.42 56.60 25.41 8.57 ส่ี 88.56 69.12 34.83 14.66 หา 86.32 66.49 34.74 14.25 หก 82.69 56.75 25.38 9.28 เจ็ด 84.67 62.50 31.90 12.28 แปด 83.22 61.26 28.56 10.85 เกา 82.24 60.50 28.83 10.50

64

Page 81: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.12 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

75 80 90 100

ศูนย 38.87 36.80 33.22 29.70 หนึ่ง 35.54 33.03 29.65 26.76 สอง 36.36 33.93 29.97 26.53 สาม 34.62 32.02 28.09 24.99 ส่ี 34.75 32.21 28.26 24.89 หา 36.83 34.25 30.21 27.12 หก 42.84 40.64 36.96 33.40 เจ็ด 33.44 31.22 27.51 24.35 แปด 33.84 31.66 27.92 24.86 เกา 33.41 31.18 27.33 24.30

จากตารางท่ี 4.9 เปนการเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิการทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูชายกับสัญญาณเสียงผูหญิงนั้นคาของขอมูลท่ีใหคาความผิดพลาดนอยท่ีสุดและมีระยะหางระหวางขอมูลนอยท่ีสุดจะอยูในชวงของกรอบท่ี 75 เปอรเซ็นต ทางนักวิจัยจึงจะนําการเปรียบเทียบในลักษณะนี้มาแสดงใหเห็นชัดเจนมากข้ึนในรูปท่ี 4.5 และ รูปท่ี 4.6 โดยจะเปนการเปรียบเทียบกันระหวางสัญญาณตอสัญญาณอยางเห็นไดชัด เชนกันในตารางท่ี 4.10 เปนการเปรียบเทียบคาสัมประสิทธ์ิการทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูชายกับสัญญาณเสียงผูหญิงนั้นคาของขอมูลท่ีใหคาความผิดพลาดนอยท่ีสุดและมีระยะหางระหวางขอมูลนอยท่ีสุดจะอยูในชวงของกรอบท่ี 50 เปอรเซ็นต เชนเดียวกับ ตารางที่ 4.11 ท่ีใชอันดับของการทํานายพันธะเชิงเสนท่ี 50 อันดับ ก็จะเลือกในสวนของกรอบขอมูลท่ี 50 เปอรเซ็นตเชนกัน ในสวนของตารางท่ี 4.12 นั้นก็จะใชอันดับของการทํานายพันธะแบบเชิงเสนอยูท่ี 75 อันดับ ทางนักวิจัยไดทําการเปรียบเทียบแลวเห็นวาในชวงกรอบของขอมูลท่ี 100 เปอรเซ็นตนั้นจะใหคาความผิดพลาดท่ีนอยท่ีสุด จึงใชกรอบในลักษณะนี้เปนการเปรียบเทียบ ดังจะแสดงในรูปท่ี 4.11 และ 4.12 โดยก็จะแสดงใหเห็นถึงความแตกตางกันออกไป [15]

65

Page 82: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.5 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูชาย

รูปท่ี 4.6 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 10 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.5 และ 4.6 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LPC อันดับท่ี 10 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดท่ีต่ําท่ีสุดจะอยูในชวงท่ี 75 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 25 เปอรเซ็นต สําหรับอันดับท่ี 10

66

Page 83: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.7 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูชาย

รูปท่ี 4.8 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 25 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.7 และ 4.8 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LPC อันดับท่ี

25 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดท่ีต่ําท่ีสุดจะอยูในชวงท่ี 50 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 50 เปอรเซ็นต สําหรับอันดับท่ี 25

67

Page 84: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.9 คาความผิดพลาดสัมประสิทธ์ิทํานายพันธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูชาย

รูปท่ี 4.10 คาความผิดพลาดสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 50 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.9 และ 4.10 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LPC อันดับ

ท่ี 50 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดท่ีต่ําท่ีสุดจะอยูในชวงท่ี 50 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 50 เปอรเซ็นต สําหรับอันดับท่ี 50

68

Page 85: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.11 คาความผิดพลาดสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูชาย

รูปท่ี 4.12 คาความผิดพลาดสัมประสิทธ์ิทํานายพนัธะเชิงเสนอันดับท่ี 75 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.10 และ 4.11 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LPC

อันดับท่ี 75 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดที่ต่ําท่ีสุดจะอยูในชวงท่ี 100 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 100 เปอรเซ็นต สําหรับอันดับท่ี 75

69

Page 86: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

4.4 ผลของขอมูลจากการสกัดคาสัมประสิทธิ์คูเสนสเปกตรัม ในการหาคาสัมประสิทธ์ิคูเสนสเปกตรัมของสัญญาณเสียงนั้นจะกําหนดคาของพารามิเตอรท่ีตางกันโดยอาศัยจํานวนอันดับเปนตัวเปรียบเทียบขอมูล และใชหลักการหากรอบของขอมูลซ่ึงวาดวยระยะหางระหวางขอมูลใหกลุมเดียวกันท่ีเปนเปอรเซนตท่ีตางกันออกไปเชนกันโดยผลของขอมูลนั้นจะแสดงต้ังแตอันดับท่ี 10 25 50 และ 75 ตามลําดับ และในแตละอันดับก็จะประกอบไปดวยกรอบของระยะหางระหวางขอมูลท่ีแตกตางกัน เพื่อหาชวงท่ีดีท่ีสุดของขอมูลดังแสดงในตารางดังนี้ [15] ตารางท่ี 4.13 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 6 7 8 9

ศูนย 23.60 18.10 13.60 10.37 หนึ่ง 27.93 22.20 18.00 14.50 สอง 26.53 20.97 15.60 12.20 สาม 23.00 17.23 12.27 9.13 ส่ี 23.73 19.10 16.03 13.40 หา 27.03 20.47 15.10 11.30 หก 22.57 16.60 11.50 8.77 เจ็ด 23.97 19.13 15.20 11.57 แปด 23.23 17.47 13.07 10.13 เกา 18.27 13.17 9.10 6.60

จากตารางท่ี 4.13 แสดงใหเห็นถึงคาความผิดพลาดของสัญญาณเสียงผูชาย ท่ีจะเปนสัญญาณเสียงนั้นๆโดยจะทําการกําหนดกรอบของขอมูลใหเห็นใน 4 ลําดับดวยกัน ตัวอยางเชนเม่ือนาํขอมูลของสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 มาทําการวิเคราะหเปรียบเทียบกับสัญญาณเสียงท่ีแตกตางกันโดยเริ่มตนจากการนําสัญญาณเสียง ศูนยมาเปรียบเทียบกับสัญญาณเสียง หนึ่ง ถึง เกา จะเห็นไดวามีคาความผิดพลาดท่ีจะเปนสัญญาณเสียงอ่ืนอยูท่ี 23.60 เปอรเซ็นต แตเม่ือทําการปรับกรอบระยะหางระหวางขอมูลเปน 7 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 18.10 เปอรเซ็นต สวนท่ีกรอบระยะหางระหวางขอมูล 8 เปอรเซ็นตจะมีคาความผิดพลาด 13.60 เปอรเซ็นตและท่ีกรอบระยะหางระหวางขอมูล 9 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 10.37 เปอรเซ็นต ดวยกัน

70

Page 87: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.14 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

2 3 4 5

ศูนย 34.57 19.83 11.23 6.51 หนึ่ง 37.80 23.03 14.96 9.67 สอง 37.00 21.13 12.21 6.96 สาม 35.12 19.43 11.37 6.20 ส่ี 34.87 21.15 13.25 8.87 หา 39.31 22.84 12.85 7.48 หก 36.35 20.91 12.48 7.43 เจ็ด 34.79 20.61 12.39 7.67 แปด 36.79 20.57 11.96 7.21 เกา 33.16 17.47 8.84 4.93

ตารางท่ี 4.15 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 1 1.5 2 3

ศูนย 35.38 21.56 14.20 7.31 หนึ่ง 38.63 24.18 16.11 7.74 สอง 39.08 23.56 15.00 6.57 สาม 35.71 21.33 13.49 5.74 ส่ี 36.10 22.31 14.54 7.79 หา 40.14 24.25 15.55 6.74 หก 37.89 23.49 15.54 7.57 เจ็ด 37.00 22.60 14.61 7.22 แปด 37.90 22.61 14.06 6.51 เกา 34.13 19.50 11.62 4.99

71

Page 88: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.16 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูชาย แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

0.5 1 2 3

ศูนย 46.80 22.08 8.57 4.09 หนึ่ง 51.42 25.34 9.22 4.55 สอง 49.61 24.89 8.66 4.07 สาม 48.89 23.78 7.78 3.52 ส่ี 47.65 23.10 8.74 4.81 หา 52.86 27.03 9.10 4.26 หก 50.55 24.16 8.92 4.52 เจ็ด 48.82 24.14 8.16 3.78 แปด 50.28 25.48 8.22 3.96 เกา 47.18 22.28 7.35 3.53

ในสวนขอมูลของการหาคาสัมประสิทธ์ิเสนคูสเปกตรัมนั้นจะเห็นไดวาคากรอบของขอมูลจะมีความแตกตางกันและคาของความผิดพลาดก็มีคาคอนขางต่ําทําใหเห็นถึงความแตกตางกับคาสัมประสิทธ์ิทํานายพันธะเชิงเสน ซ่ึงในสวนของสัมประสิทธ์ิคูเสนสเปกตรัมจะเปนการพัฒนามาจากระบบการทํานายพันธะเชิงเสนนั่นเอง

ในสวนตารางท่ี 4.17 แสดงใหเห็นถึงคาความผิดพลาดของสัญญาณเสียงผูหญิง ท่ีจะเปนสัญญาณเสียงนั้นๆ เชนเดียวกันกับสัญญาณเสียงผูชาย โดยจะทําการกําหนดกรอบของขอมูลใหเห็นใน 4 ลําดับดวยกัน ตัวอยางเชนเม่ือนําขอมูลของสัมประสิทธ์ิทํานายพันธะแบบเชิงเสนอันดับท่ี 10 มาทําการวิเคราะหเปรียบเทียบกับสัญญาณเสียงท่ีแตกตางกันโดยเร่ิมตนจากการนําสัญญาณเสียง ศูนยมาเปรียบเทียบกับสัญญาณเสียง หนึ่ง ถึง เกา จะเห็นไดวามีคาความผิดพลาดท่ีจะเปนสัญญาณเสียงอ่ืนอยูท่ี 27.87 เปอรเซ็นต แตเม่ือทําการปรับกรอบระยะหางระหวางขอมูลเปน 7 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 21.63 เปอรเซ็นต สวนท่ีกรอบระยะหางระหวางขอมูล 8 เปอรเซ็นตจะมีคาความผิดพลาด 16.60 เปอรเซ็นตและท่ีกรอบระยะหางระหวางขอมูล 9 เปอรเซ็นตจะมีคาความผิดพลาดอยูท่ี 12.43 เปอรเซ็นต ดวยกัน

72

Page 89: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.17 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

6 7 8 9

ศูนย 27.87 21.63 16.60 12.43 หนึ่ง 37.83 30.33 24.73 19.97 สอง 32.07 26.23 20.03 16.10 สาม 33.83 26.83 22.10 17.47 ส่ี 37.13 31.73 26.83 22.90 หา 37.83 31.67 26.47 22.47 หก 21.40 16.30 12.73 10.17 เจ็ด 33.13 26.93 22.57 18.67 แปด 31.93 25.53 21.00 16.57 เกา 30.63 23.67 18.30 13.90

ตารางท่ี 4.18 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 2 3 4 5

ศูนย 38.96 25.72 17.32 12.07 หนึ่ง 49.91 34.33 23.27 15.60 สอง 44.56 29.55 20.11 13.49 สาม 46.29 31.56 20.35 13.67 ส่ี 48.88 32.84 22.71 15.25 หา 51.49 35.01 22.92 15.36 หก 33.52 22.91 16.12 11.03 เจ็ด 47.67 32.13 22.16 15.33 แปด 47.17 32.33 21.33 14.73 เกา 44.72 28.89 18.71 12.04

73

Page 90: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.19 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคาความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

1 1.5 2 3

ศูนย 38.67 26.75 19.21 10.34 หนึ่ง 51.82 37.87 27.79 15.12 สอง 44.76 31.74 22.93 11.81 สาม 45.83 31.61 21.91 10.66 ส่ี 49.60 33.85 23.28 12.10 หา 50.91 36.02 25.48 13.09 หก 35.35 24.25 17.93 9.77 เจ็ด 50.42 34.49 24.31 13.01 แปด 49.49 34.87 24.47 12.09 เกา 46.71 31.89 21.37 9.84

ตารางท่ี 4.20 คาสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูหญิง แสดงถึงลักษณะคา

ความผิดพลาดของขอมูลท่ีจะครอบคลุมสัญญาณเสียงนัน้ๆ ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 0.5 1 2 3

ศูนย 48.10 27.58 12.08 6.08 หนึ่ง 59.99 37.33 15.19 7.48 สอง 53.55 31.66 12.46 5.52 สาม 56.73 32.12 11.20 4.92 ส่ี 59.36 33.71 13.11 7.81 หา 60.60 35.57 13.33 6.11 หก 47.18 27.56 13.16 6.64 เจ็ด 60.36 34.36 13.31 6.56 แปด 58.49 34.56 12.26 4.84 เกา 56.86 32.02 10.33 4.33

74

Page 91: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

จากขอมูลท้ังหมดนักวิจัยตองทําการเลือกคาของกรอบระยะหางระหวางขอมูลของสัมประสิทธ์ิคูเสนสเปกตรัมระหวางสัญญาณเสียงผูชายและสัญญาณเสียงผูหญิง เพื่อท่ีจําใหขอมูลมีความเปนกลางและสามารถทํางานไดกับท้ังสองสวนตัวอยาง ในสวนของการเลือกสัญญาณน้ันก็จะแสดงใหเห็นในหัวขอถัดไป

4.5 การเปรียบเทียบขอมูลจากการสกัดคาสัมประสิทธิ์คูเสนสเปกตรัม ระหวางสัญญาณ เสียงผูชายกับสัญญาณเสียงผูหญิง

ในการเปรียบเทียบขอมูลระหวางสัญญาณเสียงพูดผูชายกับสัญญาณเสียงพูดผูหญิงนั้นจะกระทําข้ึนเพื่อใชในการเลือกอันดับและกรอบของระยะหางระหวางขอมูลของสัญญาณท้ังสอง และจะแสดงใหเห็นถึงคาท่ีมีความถูกตองใกลเคียงกันมากท่ีสุด เพื่อจะนําไปเปนมาตรฐานของการวิเคราะหในสวนถัดไป และจะยิ่งทําใหเห็นถึงคุณลักษณะของสัญญาณท้ังสองท่ีไปดวยกันไดในความเปนจริง โดยในการเปรียบเทียบขอมูลนั้นจะใชหลักการคากลาง คือการนําขอมูลของทั้งสองสวนมารวมกันและหาสวนตาง แลวนํามาคิดเปอรเซ็นตของขอมูลโดยจะดูจากคาความผิดพลาดท่ีนอยท่ีสุดและมีความหางของขอมูลท่ีแตกตางกันนอยท่ีสุดเปนหลักดังแสดงในตารางท่ี 4.21 ถึง 4.24 [15] ตารางท่ี 4.21 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 6 7 8 9

ศูนย 25.73 19.87 15.10 11.40 หนึ่ง 32.88 26.27 21.37 17.23 สอง 29.30 23.60 17.82 14.15 สาม 28.42 22.03 17.18 13.30 ส่ี 30.43 25.42 21.43 18.15 หา 32.43 26.07 20.78 16.88 หก 21.98 16.45 12.12 9.47 เจ็ด 28.55 23.03 18.88 15.12 แปด 27.58 21.50 17.03 13.35 เกา 24.45 18.42 13.70 10.25

75

Page 92: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.22 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

2 3 4 5

ศูนย 36.77 22.77 14.27 9.29 หนึ่ง 43.85 28.68 19.11 12.63 สอง 40.78 25.34 16.16 10.23 สาม 40.71 25.49 15.86 9.93 ส่ี 41.87 26.99 17.98 12.06 หา 45.40 28.93 17.89 11.42 หก 34.93 21.91 14.30 9.23 เจ็ด 41.23 26.37 17.27 11.50 แปด 41.98 26.45 16.65 10.97 เกา 38.94 23.18 13.77 8.49

ตารางท่ี 4.23 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของ

สัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง ระยะหางระหวางขอมูล (เปอรเซ็นต)

สัญญาณเสียง 1 1.5 2 3

ศูนย 37.02 24.15 16.70 8.83 หนึ่ง 45.23 31.02 21.95 11.43 สอง 41.92 27.65 18.96 9.19 สาม 40.77 26.47 17.70 8.20 ส่ี 42.85 28.08 18.91 9.94 หา 45.53 30.14 20.51 9.92 หก 36.62 23.87 16.74 8.67 เจ็ด 43.71 28.54 19.46 10.11 แปด 43.69 28.74 19.27 9.30 เกา 40.42 25.70 16.49 7.42

76

Page 93: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.24 การเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูชาย กับสัญญาณเสียงผูหญิง

ระยะหางระหวางขอมูล (เปอรเซ็นต) สัญญาณเสียง

0.5 1 2 3

ศูนย 47.45 24.83 10.32 5.09 หนึ่ง 55.70 31.34 12.20 6.01 สอง 51.58 28.27 10.56 4.80 สาม 52.81 27.95 9.49 4.22 ส่ี 53.51 28.40 10.93 6.31 หา 56.73 31.30 11.21 5.18 หก 48.87 25.86 11.04 5.58 เจ็ด 54.59 29.25 10.74 5.17 แปด 54.39 30.02 10.24 4.40 เกา 52.02 27.15 8.84 3.93

จากตารางท่ี 4.21 เปนการเปรียบเทียบคาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูชายกับสัญญาณเสียงผูหญิง โดยจะแสดงใหเห็นขอมูลท่ีมีคาความผิดพลาดนอยท่ีสุดและมีระยะหางระหวางขอมูลนอยท่ีสุดจะอยูในชวงของกรอบท่ี 7 เปอรเซ็นตทางนักวิจัยจึงจะนําการเปรียบเทียบในลักษณะนี้มาแสดงใหเห็นชัดเจนมากข้ึนในรูปท่ี 4.13 และ รูปท่ี 4.14 โดยจะเปนการเปรียบเทียบกันระหวางสัญญาณตอสัญญาณอยางเห็นไดชัด เชนกันในตารางท่ี 4.22 เปนการเปรียบเทียบคาสัมประสิทธ์ิการคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูชายกับสัญญาณเสียงผูหญิงนั้น คาของขอมูลท่ีใหคาความผิดพลาดนอยท่ีสุดและมีระยะหางระหวางขอมูลนอยท่ีสุดจะอยูในชวงของกรอบท่ี 3 เปอรเซ็นต เชนเดียวกับ ตารางท่ี 4.23 ท่ีใชอันดับของการคูเสนสเปกตรัมท่ี 50 อันดับ ก็จะเลือกในสวนของกรอบขอมูลท่ี 2 เปอรเซ็นตเชนกัน ในสวนของตารางท่ี 4.24 นั้นก็จะใชอันดับของสัมประสิทธ์ิคูเสนสเปกตรัมอยูท่ี 75 อันดับ ทางนักวิจัยไดทําการเปรียบเทียบแลวเห็นวาในชวงกรอบของขอมูลท่ี 1 เปอรเซ็นตนั้นจะใหคาความผิดพลาดท่ีนอยท่ีสุดจึงจะใหกรอบในลักษณะนี้เปนการเปรียบเทียบกัน ดังจะแสดงในรูปท่ี 4.15 และ 4.20 โดยจะแสดงใหเห็นถึงความแตกตางกันออกไป [15]

77

Page 94: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.13 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูชาย

รูปท่ี 4.14 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 10 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.13 และ 4.14 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LSP

อันดับท่ี 10 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดที่ต่ําท่ีสุดจะอยูในชวงท่ี 7 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 7 เปอรเซ็นต สําหรับอันดับท่ี 10

78

Page 95: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.15 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูชาย

รูปท่ี 4.16 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 25 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.15 และ 4.16 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LSP

อันดับท่ี 25 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดที่ต่ําท่ีสุดจะอยูในชวงท่ี 3 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 3 เปอรเซ็นต สําหรับอันดับท่ี 25

79

Page 96: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.17 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูชาย

รูปท่ี 4.18 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 50 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.17 และ 4.18 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LSP

อันดับท่ี 50 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดที่ต่ําท่ีสุดจะอยูในชวงท่ี 2 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 2 เปอรเซ็นต สําหรับอันดับท่ี 50

80

Page 97: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.19 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูชาย

รูปท่ี 4.20 คาความผิดพลาดสัมประสิทธ์ิคูเสนสเปกตรัมอันดับท่ี 75 ของสัญญาณเสียงผูหญิง

จากรูปท่ี 4.19 และ 4.20 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของ LSP

อันดับท่ี 75 ของสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูลแลว ซ่ึงสัญญาณเสียงผูชายคาผลลัพธของความผิดพลาดที่ต่ําท่ีสุดจะอยูในชวงท่ี 1 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 1 เปอรเซ็นต สําหรับอันดับท่ี 75

81

Page 98: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

4.6 ผลของการจัดการกับระบบการเรียนรูจดจําขอมูลโครงขายประสาทเทียม ในสวนนี้จะเปนการนําขอมูลท่ีผานกระบวนการสกัดคาคุณลักษณะสําคัญแลว ดวยกระบวนการสัมประสิทธ์ิคูเสนสเปกตรัม อันดับท่ี 50 ของสัญญาณเสียงผูชายและสัญญาณเสียงผูหญิง ซ่ึงทางนักวิจัยไดทําการเลือกชวงท่ีดีท่ีสุดของลักษณะของสัญญาณเสียงท้ังสอง [15] เพื่อท่ีจะนาํขอมูลท้ังหมดมาทําการเรียนรูจํา ดวยระบบโครงขายประสาทเทียม โดยมีจํานวนช้ันอินพุตอยูท่ี 100 โหนด จํานวนชั้นซอนอยูท่ี 10 โหนด และช้ันเอาตพุต 1 โหนด ซ่ึงจะประกอบไปดวย 3 เลเยอร โดย สัญญาณเสียงของกลุมตัวอยางแตละสัญญาณจะถูกนําเขามาสอนท่ีละ 1 ชุดสัญญาณของสัญญาณแตละเสียงท่ีเปนเลขเดียวกันจนครบและระบบจะทําการจัดเก็บ net ของตัวเลขท่ีแสดงถึงสัญญาณเสียงนั้น จนครบท้ังหมด 20 ขอมูล แบงเปน เสียงผูชายจํานวน 10 ขอมูล เสียงผูหญิงจํานวน 10 ขอมูล โดยใชกลุมตัวอยาง จํานวน 200 คน (ผูชาย 100 คน และผูหญิง 100 คน) โดยแตละสัญญาณเสียงไดจากการพูดเสียงตัวเลขภาษาไทยจาก ศูนย ถึง เกา จํานวน 1 รอบ และใชกลุมทดสอบ จํานวน 200 คน โดยแตละสัญญาณเสียงก็ไดจากการพูดเสียงตัวเลขภาษาไทยจาก ศูนย ถึง เกา เชนกัน สัญญาณเสียงท้ังหมดจะผานกระบวนการของ Pre – Processing ท่ีไมมีการแบงเฟรม กอนท่ีจะนํามาทําการสอนใหระบบทําการรูจําโดยใชโครงขายประสาทเทียม

รูปท่ี 4.21 ลักษณะของขอมูลท่ีไมไดผานกระบวนการเรียนรูจดจําของโครงขายประสาทเทียม

จากรูปท่ี 4.21 เปนการแสดงคาขอมูลเปรียบเทียบกับระบบการรูจดจําท่ีไมไดทําการสอนระบบใหกับขอมูลโครงขายประสาทเทียม นํามาเปรียบเทียบกับขอมูลเอาทพุตของสัมประสิทธคูเสนสเปกตรัมท่ี 50 อันดับ จะเห็นไดวาขอมูลท่ีไดมานั้นจะกระจายไมเปนรูปรางและมีความไมแนนอนของขอมูล อยางเห็นไดชัด แตเม่ือทางนักวิจัยไดนําขอมูลมาผานกระบวนการเรียนรูจดจําโครงขาย

82

Page 99: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ประสาทเทียมแลวจะเห็นไดวาขอมูลนั้นมีคาความใกลเคียงกับขอมูลจริงท่ีตองการมากท่ีสุดและใหความสม่ําเสมอของขอมูลอยางเห็นไดชัดในรูปท่ี 4.22 เปนขอมูลของการรูจดจําขอมูลแลว [16]

รูปท่ี 4.22 ลักษณะของขอมูลท่ีผานกระบวนการเรียนรูจดจําของโครงขายประสาทเทียม

ตารางท่ี 4.25 อัตราความถูกตองในการรูจําเสียงพูดตัวเลขภาษาไทยของโครงขายประสาทเทียมกลุม

ทดสอบผูชาย

Male Neural Network Distance (%)

Data 0.5 0.75 1 1.5 2 2.5 2.75

0 91.00 95.00 95.00 96.00 99.00 98.00 98.00 1 75.00 86.00 87.00 89.00 90.00 89.00 86.00 2 74.00 77.00 76.00 79.00 86.00 90.00 88.00 3 77.00 76.00 83.00 78.00 79.00 75.00 75.00 4 71.00 76.00 79.00 88.00 90.00 89.00 87.00 5 65.00 69.00 68.00 74.00 68.00 69.00 71.00 6 83.00 85.00 81.00 85.00 91.00 94.00 92.00 7 73.00 79.00 81.00 88.00 93.00 94.00 92.00 8 72.00 77.00 79.00 93.00 95.00 89.00 87.00 9 79.00 83.00 81.00 84.00 83.00 83.00 82.00

Accuracy 76.00 80.30 81.00 85.40 87.40 87.00 85.80

83

Page 100: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 4.26 อัตราความถูกตองในการรูจําเสียงพูดตัวเลขภาษาไทยของโครงขายประสาทเทียมกลุมทดสอบผูหญิง

Female Neural Network Distance (%)

Data 0.5 0.75 1 1.5 2 2.5 2.75

0 85.00 84.00 86.00 85.00 81.00 82.00 80.00 1 41.00 46.00 48.00 52.00 60.00 65.00 65.00 2 88.00 94.00 92.00 93.00 95.00 97.00 97.00 3 79.00 78.00 78.00 72.00 77.00 74.00 79.00 4 99.00 98.00 97.00 98.00 99.00 98.00 96.00 5 87.00 89.00 88.00 87.00 82.00 82.00 80.00 6 91.00 90.00 87.00 86.00 84.00 84.00 83.00 7 90.00 89.00 93.00 95.00 97.00 98.00 99.00 8 73.00 75.00 75.00 72.00 77.00 82.00 83.00 9 74.00 83.00 81.00 81.00 79.00 80.00 75.00

Accuracy 80.70 82.60 82.50 82.10 83.10 84.20 83.70

ตารางที่ 4.25 และ 4.26 แสดงการเปรียบเทียบอัตราความถูกตองในการรูจําโดยท่ีมีคาพารามิเตอรของกรอบของระบบการรูจําอยูท่ี 0.5 0.75 1 1.5 2 2.5 และ 2.75 เปอรเซ็นต ตามลําดับ เพื่อท่ีจะหาสวนท่ีมีความใกลเคียงและมีความถูกตองมากท่ีสุดในการรูจํา ของสัญญาณเสียงผูชายและผูหญิง โดยในการเปรียบเทียบนี้จะแสดงใหเห็นใหรูปแบบของกราฟ ดังรูปท่ี 4.23 ถึง 4.32 เพื่อเปนการเปรียบเทียบขอมูลของสัญญาณเสียงแตละสัญญาณเสียง จะเห็นวาชวงท่ีดีท่ีสุดในการรูจําขอมูลเสียงผูหญิงนั้นจะอยูในกรอบขอมูลท่ี 2.5 % เปนสวนมาก และชวงท่ีดีท่ีสุดในการรูจําขอมูลเสียงผูชายน้ันจะอยูในกรอบขอมูลท่ี 2% เปนสวนมากเชนกัน โดยความแมนยําในการรูจําของระบบโครงขายประสาทเทียมในกลุมทดสอบท่ีเปนสัญญาณเสียงผูหญิงนั้นใหความถูกตองสูงสุดอยูท่ี 99 เปอรเซ็นต ในชุดสัญญาณเสียงตัวเลข “ ส่ี ” สวนในกลุมทดสอบท่ีเปนสัญญาณเสียงผูชายน้ันใหความถูกตองสูงสุดอยูท่ี 99 เปอรเซ็นต ในชุดสัญญาณเสียงตัวเลข “ ศูนย ”

84

Page 101: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.23 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 0.5 เปอรเซ็นต

รูปท่ี 4.24 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 0.5 เปอรเซ็นต จากรูปท่ี 4.23 และ 4.24 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของโครงขาย

ประสาทเทียม ท่ีผานการทดสอบดวยตัวแทนสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูล ซ่ึงสัญญาณเสียงผูชายคาผลลัพธจะอยูในชวงท่ี 0.5 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 0.5 เปอรเซ็นต

85

Page 102: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.25 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 0.75 เปอรเซ็นต

รูปท่ี 4.26 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 0.75 เปอรเซ็นต จากรูปท่ี 4.25 และ 4.26 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของโครงขาย

ประสาทเทียม ท่ีผานการทดสอบดวยตัวแทนสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูล ซ่ึงสัญญาณเสียงผูชายคาผลลัพธจะอยูในชวงท่ี 0.75 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 0.75 เปอรเซ็นต

86

Page 103: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.27 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 1 เปอรเซ็นต

รูปท่ี 4.28 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 1 เปอรเซ็นต

จากรูปท่ี 4.27 และ 4.28 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของโครงขายประสาทเทียม ท่ีผานการทดสอบดวยตัวแทนสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูล ซ่ึงสัญญาณเสียงผูชายคาผลลัพธจะอยูในชวงท่ี 1 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 1 เปอรเซ็นต

87

Page 104: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.29 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 1.5 เปอรเซ็นต

รูปท่ี 4.30 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 1.5 เปอรเซ็นต

จากรูปท่ี 4.29 และ 4.30 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของโครงขายประสาทเทียม ท่ีผานการทดสอบดวยตัวแทนสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูล ซ่ึงสัญญาณเสียงผูชายคาผลลัพธจะอยูในชวงท่ี 1.5 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 1.5 เปอรเซ็นต

88

Page 105: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 4.31 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูชาย ท่ีกรอบ 2 เปอรเซ็นต

รูปท่ี 4.32 จํานวนขอมูลท่ีอยูนอกกรอบท่ีกําหนดของระบบในการรูจดจําโครงขายประสาทเทียมเม่ือ

นํามาเปรียบเทียบกับสัญญาณเสียงแตละสัญญาณเสียงผูหญิง ท่ีกรอบ 2 เปอรเซ็นต

จากรูปท่ี 4.31 และ 4.32 เปนการยกตัวอยาง การเปรียบเทียบคาความผิดพลาดของโครงขายประสาทเทียม ท่ีผานการทดสอบดวยตัวแทนสัญญาณเสียงผูชายและผูหญิง โดยเทียบกับกลุมของตัวแทนสัญญาณเสียงตัวเองกับทุกกลุม โดยไดเลือกกรอบของขอมูล ซ่ึงสัญญาณเสียงผูชายคาผลลัพธจะอยูในชวงท่ี 2 เปอรเซนต และสัญญาณเสียงผูหญิงจะอยูในชวงท่ี 2 เปอรเซ็นต

89

Page 106: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

บทที ่5 สรุปผลการวิจัยและขอเสนอแนะ

จากการที่ไดทําการศึกษาและวิจัยในสวนท่ีผานมานั้นทําใหคนพบวาในการสกัดคาคุณลักษณะสําคัญนั้นมีสวนทําใหคาของระบบในการรูจํามีคาท่ีดีข้ึน หรือสูงข้ึนนั้นเอง โดยในสวนนี้จะเปนการสรุปขอมูลใน 2 รูปแบบดวยกัน คือสวนท่ี 1 จะเปนการสรุปในสวนของการเลือกคาของการสกัดคาคุณลักษณะสําคัญกอนท่ีจะนําไปเขาสูระบบของการรูจดจํา ในสวนท่ี 2 เปนการสรุปในเร่ืองของการรูจดจําคาขอมูลท่ีทําการวิเคราะหในสวนผลของขอมูลท่ีดีข้ึน ถัดไปจะเปนการนําเสนอขอคิดเห็นและขอเสนอแนะ ตอไป

5.1 สรุปผลของการเลือกคาการสกัดคาคุณลักษณะสําคัญและการเรียนรูจํา งานวิจัยฉบับนี้เปนการนําเสนอเทคนิคใหมในการรูจําสัญญาณเสียงพูดภาษาไทย โดยมุงเนนท่ีจะศึกษาในสวนของการเดินทางของเสียงสําหรับสัมประสิทธ์ิ LPC และสัมประสิทธ์ิ LSP ท่ีอันดับแตกตางกัน ซ่ึงจากการทดลองในข้ันแรกจะดูจากเปอรเซ็นตระยะหางจากคาเฉล่ียของตัวเลขท้ังหมด สังเกตไดวาอันดับของสัมประสิทธ์ิ LPC ท่ีเพิ่มข้ึนไมไดทําใหระยะจากคาเฉล่ียลดลง แตอันดับท่ีแตกตางกันของสัมประสิทธ์ิ LSP ท่ีเพ่ิมข้ึนสงผลใหระยะจากคาเฉล่ียลดลง และเทคนิคนี้ยังสามารถนําไปใชไดดีในการจําแนกสัญญาณเสียงพูดท่ีตางกัน โดยสังเกตไดจากการนําขอมูลเสียงพูดของตัวเลขตัวหนึ่งไปแทนในคาเฉลี่ยของสัญญาณเสียงพูดเลขเดียวกัน และแทนในคาเฉล่ียของสัญญาณเสียงพูดเลขท่ีตางกัน ทําใหทราบถึงระยะหางท่ีแตกตางกันอยางเห็นไดชัด โดยความแมนยําในการรูจําดวยเทคนิคของสัมประสิทธ์ิ LPC สูงสุดเฉล่ียอยูท่ี 72.63% อันดับ 25 สัญญาณเสียงพูดผูชาย และสัญญาณเสียงพูดผูหญิงสูงสุดเฉล่ียอยูท่ี 65.40% อันดับ 10 และในสวนของสัมประสิทธ์ิ LSP สูงสุดเฉล่ียอยูท่ี 82.27% อันดับ 50 สัญญาณเสียงพูดผูชาย และสัญญาณเสียงพูดผูหญิงสูงสุดเฉล่ียอยูท่ี 79.90% อันดับ 50 เชนกัน ดังแสดงในรูปท่ี 5.1

โดยในสวนนี้ทางนักวิจัยจึงไดนําขอมูลของการสกัดคาคุณลักษณะสําคัญ แบบสัมประสิทธ์ิคูเสนสเปกตรัมท่ี 50 อันดับ ไปทําการเรียนรูจดจําขอมูลเพื่อใหระบบสามารถใหคาของความถูกตองเพิ่มมาข้ึนดังแสดงในตารางท่ี 5.1

Page 107: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

Accu

racy

รูปท่ี 5.1 อัตราความถูกตองของการคัดกรองขอมูลสัญญาณเสียงระหวางสัมประสิทธ์ิการทํานายพันธะแบบเชิงเสนกับสัมประสิทธ์ิคูเสนสเปกตรัม

ตารางท่ี 5.1 เปรียบเทียบอัตราความถูกตองในการรูจําของสัมประสิทธิ์คูเสนสเปกตรัมกับโครงขาย

ประสาทเทียม

Accuracy of Line Spectrum Pair and Neural Network

Male (%) Female (%)

LSP ANN LSP ANN 82.27 87.40 79.90 84.20

จากตารางท่ี 5.1 เปนการทดสอบโดยนําคาขอมูลของการสกัดคาคุณลักษณะสําคัญแบบ

สัมประสิทธ์ิคูเสนสเปกตรัมท่ี 50 อันดับ ของสัญญาณเสียงผูชายและผูหญิง มาผานระบบของการสอนขอมูลใหมีการรูจดจํา มีผลทําใหการวิเคราะหดีข้ึนและใหคาของอัตราความถูกตองเพ่ิมมากข้ึน โดยจะใชกลุมของขอมูลท่ีใหระบบโครงขายประสาทเทียมทําการเรียนรูจดทําจํานวน 200 ขอมูล โดยแบงเปนสัญญาณเสียงผูชายจํานวน 100 สัญญาณเสียง และสัญญาณเสียงผูหญิงจํานวน 100 สัญญาณเสียง เชนกัน ในสวนของกลุมของการทดสอบนั้นก็จะประกอบไปดวยจํานวนของขอมูล 200 ขอมูลเชนกัน โดยจะไมใชขอมูลเดียวกับกลุมตัวอยางในการทดสอบ ทําใหผลของความถูกตองมีคาสูงสุดอยูท่ี 99 เปอรเซ็นต ของสัญญาณเสียงผูหญิงในสัญญาณเสียงตัวเลข ส่ี ท่ีกรอบระยะหาง

91

Page 108: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ระหวางขอมูลอยูท่ี 2 เปอรเซ็นต ในสวนของสัญญาณเสียงผูชายก็ใหผลของความถูกตองอยูท่ี 99 เปอรเซ็นตเชนกัน ในสัญญาณเสียงตัวเลข ศูนย ท่ีกรอบระยะหางระหวางขอมูลท่ี 2 เปอรเซ็นต และในสวนของผลรวมของอัตราความถูกตองของระบบโครงขายประสาทเทียมนั้นใหคาสูงสุดอยูท่ี 87.40 เปอรเซ็นตของสัญญาณเสียงผูชาย สวนของสัญญาณเสียงผูหญิงนั้น จะไดผลรวมของอัตราความถูกตองของระบบโครงขายประสาทเทียมสูงสุดอยูท่ี 84.20 เปอรเซ็นต ซ่ึงใหผลดีกวาการวิเคราะหแบบสัมประสิทธ์ิคูเสนสเปกตรัม

5.2 ขอเสนอแนะและแนวทางในการพัฒนา จากการวิจัยท่ีผานมาทําใหเห็นวาในสวนท่ีสําคัญนั้นจะเปนในสวนของการบันทึกขอมูลในกลุมตัวอยางและกลุมทดสอบ โดยในการบันทึกนั้นควรจะมีสภาวะแวดลอมเดียวกันในทุกชวงของการบันทึก เชน การดในการบันทึกควรจะเปนอันเดียวกัน ไมโครโฟนตัวเดียวกัน โปรแกรมท่ีใชในการบันทึกแบบเดียวกัน และการปรับคาของพารามิเตอรตางๆก็ตองอยูในสวนเดียวกันเทานั้น รวมถึงสัญญาณท่ีทําการบันทึกนั้นก็ตองมีขนาดท่ีใกลเคียงกันมากท่ีสุด ในสวนของการสกัดคาคุณลักษณะสําคัญนั้นก็ตองใหความสําคัญกับการคัดเลือกในสวนนี้ดวย ถาสามารถกําหนดหรือแบงชวงของการสกัดคาลักษณะสําคัญไดมากก็จะทําใหเห็นถึงสวนท่ีมีความชัดเจนในเร่ืองของอัตราความถูกตองมากท่ีสุดดวย ดังนั้นในสวนนี้จึงนาจะมีการปรับในเร่ืองของพารามิเตอรตางๆใหมากข้ึน ละเอียดข้ึน ครอบคลุมสูงข้ึน ก็จะทําใหมีความชัดเจนมากข้ึนตามมา ในสวนของระบบการรูจําก็เชนกัน ถาเรานํากลุมตัวอยางมาทําการสอนใหระบบรับทราบหลากหลายขอมูลมากเทาไรก็จะทําใหระบบนาจะมีการรูจําลักษณะของขอมูลท่ีสูงข้ึนดวย และถาทําชุดคาถวงน้ําหนักใหเปนหลายชุดเพื่อใหสามารถรองรับผูพูดท่ีไมไดอยูในกลุมเสียงท่ีใชในการสอน ระบบไดมากข้ึน ก็จะสามารถทําใหครอบคลุมกลุมท่ีตองการมากข้ึนไปดวย แตถาหากตองการพัฒนาระบบเพื่อนําไปสูการใชงานจริงใหดีข้ึนนั้น ควรจะมีการวิจัยหากลุมของสัญญาณเสียงท่ีเหมาะสมสําหรับการสอนโครงขายประสาทเทียมซ่ึงไมควรมีจํานวนมากนัก เพราะจะทําใหการสอนชา และควรมีการวิจัยเพื่อหาแบบหนวยเสียงของคําศัพทตางๆ นอกเหนือจากแบบหนวยเสียงท่ีไดจากการถอดรหัสแบบทางภาษาศาสตร

92

Page 109: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

เอกสารอางอิง

[1] กาญจนา นาคสกุล, ระบบเสียงภาษาไทย. กรุงเทพมหานคร: โรงพิมพจุฬาลงกรณมหาวิทยาลัย, 2524.

[2] สุธิวงค พงศไพบูลย, หลักภาษาไทย. พิมพคร้ังท่ี 7. กรุงเทพมหานคร : สํานักพิมพไทยวัฒนาพานิชย จํากัด, 2523.

[3] ประสิทธ์ิ กาพยกลอน, การศึกษาภาษาไทยตามแนวภาษาศาสตร. พิมพคร้ังท่ี 3. กรุงเทพมหา นคร : สํานักพมิพไทวัฒนาพานิชย จํากัด, 2523.

[4] ผ.ศ. ชาคริต อนันทราวัน, หลักภาษาไทย. กรุงเทพมหานคร : สํานักพิมพโอเดียนสโตร, 2536 [5] คณะนักวิจัยและพัฒนาระบบระบุผูพูดสําหรับภาษาไทย, “การระบุผูพูดดวย LPC และ DTW

สําหรับภาษาไทย”, เอกสารประกอบการประชุมวิชาการ NECTEC, 30 มีนาคม – 1 เมษายน 2542. หนา 238-246.

[6] ชัชวาลย หาญสกุลบรรเทิง, การสังเคราะหพยางคภาษาไทยดวยวิธีการสังเคราะหแบบวิเคราะหโดยใชคู เสนสเปกตรัม, วิทยานิพนธปริญญามหาบัณฑิต ภาควิชาวิศวกรรมไฟฟา คณะวิศวกรรมศาสตร จุฬาลงกรณมหาวิทยาลัย, 2542

[7] ณัฐกร ทับทอง, การรูจําคําพูดภาษาไทยโดยใชลักษณะบงความแตกตางของหนวยเสียง, วิทยานิพนธปริญญาวิศวกรรมศาสตรมหาบัณฑิต, จุฬาลงกรณมหาวิทยาลัย, 2538.

[8] ทวิ ประทุมทาน, การตรวจรูเสียงพูดภาษาไทยโดยใชหนวยพยางค, วิทยานิพนธปริญญาวิศวกรรมศาสตรมหาบัณฑิต, จุฬาลงกรณมหาวิทยาลัย, 2530.

[9] ระพีพัฒน เพ็ญศิริ, การรูจําเสียงตัวเลขภาษาไทยโดยไมขึ้นตอผูพูด โดยการใชไดนามิกไทม วารปปง, วิทยานิพนธปริญญาวิศวกรรมศาสตรมหาบัณฑิต, จุฬาลงกรณมหาวิทยาลัย, 2538.

[10] จิตรลดา จารุมิศร, ไกรสิน สงวัฒนา, อิทธิชัย อรุณศรีแสงชัย, “แบบจําลองเสียงวรรณยุกตสําหรับภาษาไทยดยใชเทคนิคการควอนไตซพิทซและ Hidden Markov Model”, National Computer Science and Engineering Conference (NCSEC'1998), 2541.

[11] ปฏิมากร กิ้มสวัสดิ์, “การศึกษาการรูจําตัวเลขภาษาไทยแบบแยกคําชนิดไมขึ้นกับผูพูดโดยใชโครงขายประสาทท่ีมีการเรียนรูแบบแพรกลับ”, วิทยานิพนธปริญญามหาบัณฑิต, คณะวิศวกรรมศาสตร, มหาวิทยาลัยสงขลานครินทร, 2544.

[12] จักรกฤษ ออนช่ืนจิตร, การวิเคราะหแนวทางเดินเสียงพูดในรูปแบบของสัมประสิทธ์ิคูเสนสเปกตรัมรวมกับ Double Clustering, วิทยานิพนธปริญญามหาบัณฑิต, ภาควิชาวิศวกรรมไฟฟา คณะวิศวกรรมศาสตร, มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี, 2551.

Page 110: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

[13] คณะนักวิจัยและพัฒนาระบบระบุผูพูดสําหรับภาษาไทย, “การระบุผูพูดดวย LPC และ DTW สําหรับภาษาไทย”, เอกสารประกอบการประชุมวิชาการ NECTEC, 30 มีนาคม – 1 เมษายน 2542. หนา 238-246. จักรพันธ จิตรทรัพย, การรูจําเสียงพูดคําไทยดวยวิธีการเอ็มเอ็ฟซีซีและโครงขายประสาทเทียม, วิทยานิพนธปริญญามหาบัณฑิต, คณะวิศวกรรมศาสตร, สถาบันเทคโนโลยีพระจอมเกลาเจาคุรทหารลาดกระบัง, 2550.

[14]

[15] สุวรรณ ร่ืนสุคนธ, “ประสิทธิภาพของ LPC และ LSP ในการรูจําแนวทางเดินเสียงพูดภาษาไทย”, International Joint Conference on Computer Science and Software Engineering (JCSSE2008), Vol 5, No.2, 2008. pp 287 - 293. สุวรรณ ร่ืนสุคนธ, “การรูจําเสียงพูดภาษาไทยโดยใชสัมประสิทธ์ิคูเสนสเปกตรัมรวมกับโครงขายประสาทเทียม”, International Joint Conference on Computer Science and Software Engineering (JCSSE2009), Vol 6, No.2, 2009. pp 341 - 346.

[16]

[17] Visarut Ahkuputra, Somchai Jitapunkul, Ekkarit Maneenoi, Sawit Kasuriya and Phakapong Amornkul, “Comparison of Different Techniques on Thai Speech Recognition”, Circuits and Systems, IEEE APCCAS 1998. The 1998 IEEE Asia-Pacific Conference on, 1998

[18] F.J. Owens, Signal Processing of Speech. The Macmillan Press LTD, Hampshire, 1993.

[19] O’Shaughnessy, D. Speech Communication Human and Machine. Addison – Wesley Publishing Company, 1987.

[20] Kleijn, W.B. and Paliwal, K.K., Speech coding and synthesis. Amsterdam : Elsevier Science B.V., 1995.

[21] Deller, J.R., Proakis, J.G. and Hansen, J.H., Discrete – Time Processing of Speech Signals. New Jersey : Prentice – Hall., 1993

[22] Rabiner Lawrence and Juang Biing-Hwang, Fundamentals of Speech Recognition. U.S.A. Prentice-Hall Inc., 1993.

[23] Bengio,Y., Neural Networks for Speech and Sequence Recognition. London : International Thomson Computer Press, 1996.

[24] Morgan, David P. and Scofield, Christopher L., Neural Network and Speech Processing. U.S.A. : Kluwer Academic Publishers, 1994.

[25] F.K. Soong and B-H. Juang, “Linear spectrum Pair (LSP) and speech data compression”, in Proc. IEEE Acoustics Speech and Signal Proc, March 1984, San diego,CA, vol. 1, 1984. pp. 1.10.1-1.10.4.

94

Page 111: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

[26] F. Itakura, “Line spectrum representation of linear predictive coefficients of speech signals”, Journal of Acoustic Society of America, vol.57, pp. 535, April 1975.

[27] Nikil Jayant, “Signal Compression: Technology Targets and Research Directions”, IEEE Journal on Selected Areas in Communications, June 1992, vol.10, No.5, 1992. pp. 796-818,

[28] S. Limpanakorn, C. Tanprasert, “Voice articulator for Thai speaker recognition system”, ICONIP'02 Proceedings of the 9th International Conference, November 2002, vol.5, 2002. pp. 2396-2400.

[29] J. Srinonchat, S. Danaher, J. I. H. Allen and A. Murray, "New Bit Rate CELP coder for Speaker Dependent Coding System", IASTED International Conference on Artificial Intelligence and Applications, 2004. pp. 432-435.

[30] Han, Y., de Veth, J., and Boves, L., “Trajectory Clustering for Automatic Speech Recognition,” EUSIPCO-2005, Antalya, Turkey, 2005.

[31] J. Srinonchat, “New Technique to Reduce Bit Rate of LPC-10 Speech Coder”, TENCON 2006, 2006 IEEE Region 10 Conference, November 2006. pp. 1-4,

[32] Bäckström T. and Magi C., "Properties of Line Spectrum Pair Polynomials - A Review", Signal Processing, vol. 86, no. 11, 2006. pp. 3286-3298,

[33] Li J., Yu Y. and Rui X., “A New Algorithm for Calculating LSP Parameters of Speech Signal”, The 8th International Conference on signal Processing, Volume 1, 2006. pp. 16-20,

95

Page 112: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ภาคผนวก ก

ตัวอยางสัญญาณเสียงพดู

Page 113: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 1 ตัวอยางสัญญาณเสียงพูด "ศูนย" ของผูชาย

รูปท่ี 2 ตัวอยางสัญญาณเสียงพูด "หนึ่ง" ของผูชาย

97

Page 114: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 3 ตัวอยางสัญญาณเสียงพูด "สอง" ของผูชาย

รูปท่ี 4 ตัวอยางสัญญาณเสียงพูด "สาม" ของผูชาย

98

Page 115: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 5 ตัวอยางสัญญาณเสียงพูด "ส่ี" ของผูชาย

รูปท่ี 6 ตัวอยางสัญญาณเสียงพูด "หา" ของผูชาย

99

Page 116: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 7 ตัวอยางสัญญาณเสียงพูด "หก" ของผูชาย

รูปท่ี 8 ตัวอยางสัญญาณเสียงพูด "เจ็ด" ของผูชาย

100

Page 117: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 9 ตัวอยางสัญญาณเสียงพูด "แปด" ของผูชาย

รูปท่ี 10 ตัวอยางสัญญาณเสียงพูด "เกา" ของผูชาย

101

Page 118: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 11 ตัวอยางสัญญาณเสียงพูด "ศูนย" ของผูหญิง

รูปท่ี 12 ตัวอยางสัญญาณเสียงพูด "หนึ่ง" ของผูหญิง

102

Page 119: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 13 ตัวอยางสัญญาณเสียงพูด "สอง" ของผูหญิง

รูปท่ี 14 ตัวอยางสัญญาณเสียงพูด "สาม" ของผูหญิง

103

Page 120: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 15 ตัวอยางสัญญาณเสียงพูด "ส่ี" ของผูหญิง

รูปท่ี 16 ตัวอยางสัญญาณเสียงพูด "หา" ของผูหญิง

104

Page 121: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 17 ตัวอยางสัญญาณเสียงพูด "หก" ของผูหญิง

รูปท่ี 18 ตัวอยางสัญญาณเสียงพูด "เจ็ด" ของผูหญิง

105

Page 122: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

รูปท่ี 19 ตัวอยางสัญญาณเสียงพูด "แปด" ของผูหญิง

รูปท่ี 20 ตัวอยางสัญญาณเสียงพูด "เกา" ของผูหญิง

106

Page 123: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ภาคผนวก ข

ตัวอยางคาสัมประสิทธ์ิคูเสนสเปกตรัม

Page 124: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 1 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "ศูนย"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0171 0.0262 0.0336 0.0405 0.0473 0.0837 0.0923 0.1009 0.1096M002 0.0180 0.0272 0.0350 0.0424 0.0492 0.0830 0.0915 0.0989 0.1072M003 0.0163 0.0261 0.0342 0.0418 0.0496 0.0838 0.0914 0.0991 0.1077M004 0.0179 0.0274 0.0360 0.0437 0.0501 0.0850 0.0942 0.1030 0.1120M005 0.0187 0.0274 0.0350 0.0419 0.0489 0.0809 0.0895 0.0972 0.1047

M096 0.0188 0.0282 0.0362 0.0436 0.0509 0.4423 0.4506 0.4597 0.4723M097 0.0168 0.0276 0.0353 0.0428 0.0493 0.4421 0.4507 0.4603 0.4739M098 0.0181 0.0275 0.0350 0.0422 0.0496 0.4431 0.4520 0.4618 0.4741M099 0.0162 0.0269 0.0347 0.0421 0.0488 0.4399 0.4487 0.4581 0.4719M100 0.0189 0.0282 0.0362 0.0433 0.0500 0.4424 0.4518 0.4621 0.4750

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 2 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "หนึ่ง"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0186 0.0275 0.0353 0.0429 0.0508 0.4404 0.4477 0.4559 0.4684M002 0.0181 0.0266 0.0341 0.0413 0.0483 0.4488 0.4563 0.4645 0.4766M003 0.0157 0.0262 0.0349 0.0426 0.0511 0.4459 0.4535 0.4617 0.4743M004 0.0182 0.0271 0.0347 0.0420 0.0491 0.4409 0.4501 0.4597 0.4718M005 0.0174 0.0266 0.0342 0.0420 0.0497 0.4427 0.4507 0.4597 0.4723

M096 0.0165 0.0260 0.0331 0.0409 0.0496 0.4433 0.4521 0.4621 0.4758M097 0.0151 0.0260 0.0336 0.0419 0.0497 0.4474 0.4562 0.4651 0.4764M098 0.0158 0.0262 0.0333 0.0410 0.0496 0.4409 0.4485 0.4571 0.4702M099 0.0164 0.0272 0.0349 0.0429 0.0502 0.4429 0.4532 0.4632 0.4750M100 0.0181 0.0271 0.0352 0.0432 0.0508 0.4455 0.4538 0.4626 0.4744

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

108

Page 125: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 3 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "สอง"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0184 0.0284 0.0368 0.0450 0.0533 0.4432 0.4512 0.4600 0.4722M002 0.0178 0.0272 0.0355 0.0442 0.0531 0.4470 0.4545 0.4628 0.4746M003 0.0153 0.0273 0.0360 0.0449 0.0531 0.4463 0.4548 0.4634 0.4748M004 0.0182 0.0278 0.0375 0.0458 0.0541 0.4428 0.4522 0.4625 0.4750M005 0.0184 0.0277 0.0361 0.0442 0.0531 0.4433 0.4513 0.4606 0.4733

M096 0.0183 0.0277 0.0359 0.0441 0.0541 0.4460 0.4543 0.4640 0.4759M097 0.0187 0.0281 0.0374 0.0468 0.0557 0.4462 0.4549 0.4641 0.4759M098 0.0186 0.0281 0.0365 0.0452 0.0545 0.4459 0.4541 0.4631 0.4749M099 0.0196 0.0289 0.0380 0.0467 0.0555 0.4459 0.4550 0.4653 0.4765M100 0.0189 0.0282 0.0375 0.0465 0.0556 0.4437 0.4514 0.4602 0.4724

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 4 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "สาม"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0183 0.0282 0.0364 0.0446 0.0534 0.4438 0.4522 0.4617 0.4743M002 0.0176 0.0270 0.0352 0.0440 0.0534 0.4464 0.4541 0.4623 0.4739M003 0.0174 0.0287 0.0373 0.0459 0.0546 0.4456 0.4550 0.4646 0.4767M004 0.0180 0.0276 0.0374 0.0459 0.0552 0.4427 0.4519 0.4617 0.4742M005 0.0186 0.0278 0.0361 0.0442 0.0534 0.4453 0.4540 0.4632 0.4746

M096 0.0188 0.0277 0.0359 0.0441 0.0543 0.4446 0.4536 0.4631 0.4751M097 0.0189 0.0283 0.0376 0.0468 0.0563 0.4449 0.4539 0.4634 0.4754M098 0.0188 0.0281 0.0367 0.0456 0.0550 0.4452 0.4540 0.4633 0.4754M099 0.0192 0.0290 0.0379 0.0466 0.0553 0.4440 0.4533 0.4623 0.4739M100 0.0189 0.0281 0.0372 0.0460 0.0554 0.4406 0.4493 0.4594 0.4724

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

109

Page 126: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 5 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "ส่ี"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0178 0.0266 0.0339 0.0403 0.0467 0.4438 0.4517 0.4603 0.4728M002 0.0173 0.0257 0.0329 0.0395 0.0463 0.4484 0.4584 0.4673 0.4780M003 0.0149 0.0252 0.0332 0.0401 0.0474 0.4458 0.4549 0.4646 0.4766M004 0.0176 0.0263 0.0336 0.0401 0.0469 0.4419 0.4504 0.4595 0.4720M005 0.0172 0.0260 0.0331 0.0396 0.0461 0.4449 0.4538 0.4631 0.4749

M096 0.0173 0.0266 0.0338 0.0405 0.0467 0.4437 0.4521 0.4616 0.4739M097 0.0167 0.0263 0.0332 0.0402 0.0466 0.4467 0.4548 0.4637 0.4755M098 0.0173 0.0271 0.0343 0.0413 0.0478 0.4448 0.4529 0.4615 0.4732M099 0.0168 0.0264 0.0334 0.0401 0.0463 0.4370 0.4458 0.4558 0.4705M100 0.0181 0.0268 0.0343 0.0409 0.0475 0.4462 0.4547 0.4634 0.4754

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 6 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "หา"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0175 0.0283 0.0360 0.0443 0.0527 0.4435 0.4519 0.4611 0.4741M002 0.0155 0.0270 0.0350 0.0438 0.0533 0.4499 0.4578 0.4663 0.4774M003 0.0185 0.0276 0.0385 0.0472 0.0553 0.4464 0.4555 0.4652 0.4770M004 0.0187 0.0286 0.0372 0.0456 0.0540 0.4407 0.4503 0.4607 0.4729M005 0.0151 0.0266 0.0348 0.0434 0.0516 0.4423 0.4505 0.4599 0.4727

M096 0.0151 0.0259 0.0333 0.0423 0.0528 0.4454 0.4537 0.4628 0.4748M097 0.0171 0.0264 0.0368 0.0452 0.0559 0.4423 0.4515 0.4616 0.4741M098 0.0154 0.0263 0.0344 0.0422 0.0527 0.4463 0.4548 0.4641 0.4753M099 0.0165 0.0264 0.0362 0.0448 0.0551 0.4385 0.4475 0.4578 0.4717M100 0.0167 0.0280 0.0363 0.0447 0.0537 0.4465 0.4552 0.4647 0.4759

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

110

Page 127: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 7 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "หก"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0185 0.0286 0.0367 0.0441 0.0516 0.4430 0.4509 0.4599 0.4722M002 0.0171 0.0263 0.0350 0.0432 0.0509 0.4498 0.4585 0.4667 0.4771M003 0.0160 0.0261 0.0357 0.0439 0.0529 0.4472 0.4549 0.4631 0.4747M004 0.0176 0.0276 0.0362 0.0443 0.0512 0.4445 0.4542 0.4637 0.4765M005 0.0191 0.0285 0.0367 0.0443 0.0518 0.4407 0.4496 0.4596 0.4727

M096 0.0192 0.0286 0.0369 0.0451 0.0525 0.4433 0.4532 0.4636 0.4761M097 0.0164 0.0275 0.0358 0.0438 0.0510 0.4413 0.4487 0.4570 0.4705M098 0.0163 0.0267 0.0341 0.0438 0.0537 0.4405 0.4492 0.4588 0.4723M099 0.0197 0.0290 0.0373 0.0450 0.0528 0.4428 0.4524 0.4626 0.4745M100 0.0189 0.0281 0.0363 0.0443 0.0515 0.4455 0.4539 0.4630 0.4748

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 8 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "เจด็"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0185 0.0280 0.0362 0.0438 0.0508 0.4453 0.4534 0.4621 0.4736M002 0.0178 0.0270 0.0358 0.0442 0.0525 0.4434 0.4514 0.4601 0.4728M003 0.0161 0.0261 0.0359 0.0441 0.0535 0.4461 0.4551 0.4650 0.4759M004 0.0183 0.0280 0.0372 0.0459 0.0533 0.4423 0.4514 0.4612 0.4735M005 0.0193 0.0284 0.0365 0.0438 0.0513 0.4415 0.4504 0.4610 0.4739

M096 0.0201 0.0292 0.0374 0.0451 0.0525 0.4430 0.4516 0.4608 0.4727M097 0.0181 0.0285 0.0369 0.0457 0.0535 0.4459 0.4543 0.4631 0.4750M098 0.0183 0.0282 0.0364 0.0452 0.0532 0.4428 0.4513 0.4609 0.4742M099 0.0194 0.0288 0.0371 0.0458 0.0540 0.4432 0.4525 0.4621 0.4751M100 0.0176 0.0269 0.0368 0.0459 0.0527 0.4439 0.4520 0.4613 0.4737

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

111

Page 128: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 9 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "แปด"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0182 0.0282 0.0368 0.0450 0.0538 0.4442 0.4522 0.4610 0.4731M002 0.0178 0.0271 0.0359 0.0445 0.0532 0.4441 0.4551 0.4652 0.4767M003 0.0156 0.0283 0.0368 0.0459 0.0545 0.4447 0.4539 0.4635 0.4757M004 0.0188 0.0284 0.0382 0.0472 0.0562 0.4413 0.4508 0.4614 0.4745M005 0.0192 0.0284 0.0366 0.0444 0.0533 0.4449 0.4526 0.4611 0.4734

M096 0.0185 0.0276 0.0367 0.0464 0.0554 0.4406 0.4497 0.4599 0.4729M097 0.0185 0.0281 0.0369 0.0465 0.0557 0.4454 0.4539 0.4630 0.4749M098 0.0188 0.0281 0.0369 0.0464 0.0555 0.4463 0.4545 0.4634 0.4750M099 0.0194 0.0288 0.0380 0.0470 0.0557 0.4429 0.4518 0.4617 0.4730M100 0.0186 0.0279 0.0385 0.0474 0.0561 0.4419 0.4506 0.4603 0.4729

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 10 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูชาย คําวา "เกา"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50M001 0.0189 0.0290 0.0375 0.0457 0.0545 0.4439 0.4524 0.4617 0.4743M002 0.0174 0.0281 0.0365 0.0455 0.0548 0.4502 0.4581 0.4663 0.4774M003 0.0182 0.0274 0.0388 0.0474 0.0572 0.4471 0.4560 0.4652 0.4767M004 0.0187 0.0285 0.0372 0.0458 0.0545 0.4422 0.4513 0.4611 0.4738M005 0.0167 0.0281 0.0361 0.0447 0.0532 0.4451 0.4541 0.4636 0.4754

M096 0.0157 0.0269 0.0349 0.0440 0.0532 0.4429 0.4521 0.4618 0.4743M097 0.0160 0.0264 0.0357 0.0446 0.0558 0.4454 0.4538 0.4631 0.4745M098 0.0165 0.0280 0.0360 0.0453 0.0551 0.4468 0.4562 0.4662 0.4782M099 0.0168 0.0283 0.0370 0.0458 0.0560 0.4438 0.4520 0.4608 0.4733M100 0.0194 0.0296 0.0377 0.0462 0.0555 0.4423 0.4514 0.4610 0.4731

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

112

Page 129: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 11 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "ศูนย"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0213 0.0304 0.0383 0.0477 0.0559 0.4460 0.4551 0.4661 0.4770F002 0.0183 0.0272 0.0369 0.0455 0.0513 0.4440 0.4537 0.4638 0.4763F003 0.0187 0.0278 0.0372 0.0461 0.0519 0.4463 0.4544 0.4637 0.4756F004 0.0188 0.0277 0.0382 0.0463 0.0527 0.4466 0.4539 0.4619 0.4739F005 0.0221 0.0322 0.0380 0.0442 0.0537 0.4424 0.4521 0.4622 0.4742

F096 0.0190 0.0281 0.0378 0.0464 0.0522 0.4436 0.4527 0.4623 0.4742F097 0.0186 0.0275 0.0374 0.0451 0.0506 0.4439 0.4528 0.4627 0.4750F098 0.0186 0.0275 0.0373 0.0446 0.0501 0.4450 0.4545 0.4645 0.4774F099 0.0186 0.0274 0.0371 0.0446 0.0502 0.4434 0.4525 0.4621 0.4745F100 0.0196 0.0287 0.0383 0.0461 0.0524 0.4436 0.4527 0.4626 0.4749

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 12 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "หนึ่ง"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0190 0.0290 0.0367 0.0468 0.0554 0.4427 0.4519 0.4618 0.4743F002 0.0177 0.0271 0.0348 0.0440 0.0509 0.4419 0.4512 0.4604 0.4736F003 0.0173 0.0268 0.0351 0.0448 0.0518 0.4444 0.4547 0.4647 0.4762F004 0.0192 0.0281 0.0386 0.0477 0.0545 0.4480 0.4566 0.4649 0.4767F005 0.0235 0.0325 0.0380 0.0452 0.0572 0.4434 0.4527 0.4630 0.4756

F096 0.0184 0.0275 0.0363 0.0454 0.0520 0.4404 0.4502 0.4605 0.4742F097 0.0183 0.0273 0.0362 0.0450 0.0514 0.4398 0.4496 0.4596 0.4718F098 0.0191 0.0278 0.0373 0.0450 0.0511 0.4415 0.4511 0.4606 0.4726F099 0.0190 0.0278 0.0372 0.0454 0.0515 0.4433 0.4525 0.4643 0.4769F100 0.0199 0.0289 0.0390 0.0463 0.0519 0.4404 0.4502 0.4607 0.4731

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

113

Page 130: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 13 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "สอง"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0210 0.0303 0.0419 0.0513 0.0586 0.4472 0.4558 0.4658 0.4769F002 0.0182 0.0273 0.0385 0.0471 0.0556 0.4454 0.4547 0.4632 0.4740F003 0.0183 0.0275 0.0393 0.0480 0.0584 0.4439 0.4525 0.4619 0.4747F004 0.0174 0.0263 0.0370 0.0457 0.0546 0.4461 0.4557 0.4660 0.4778F005 0.0230 0.0316 0.0375 0.0454 0.0570 0.4447 0.4544 0.4650 0.4783

F096 0.0180 0.0273 0.0381 0.0463 0.0559 0.4451 0.4538 0.4642 0.4752F097 0.0179 0.0274 0.0386 0.0470 0.0576 0.4418 0.4509 0.4611 0.4733F098 0.0179 0.0276 0.0383 0.0467 0.0571 0.4416 0.4506 0.4601 0.4728F099 0.0180 0.0272 0.0381 0.0464 0.0568 0.4429 0.4521 0.4619 0.4741F100 0.0186 0.0281 0.0397 0.0483 0.0594 0.4423 0.4520 0.4621 0.4749

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 14 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "สาม"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0205 0.0296 0.0404 0.0497 0.0570 0.4428 0.4518 0.4611 0.4726F002 0.0191 0.0282 0.0393 0.0477 0.0554 0.4462 0.4544 0.4638 0.4769F003 0.0174 0.0264 0.0374 0.0463 0.0559 0.4443 0.4532 0.4630 0.4758F004 0.0180 0.0271 0.0386 0.0472 0.0573 0.4477 0.4565 0.4652 0.4765F005 0.0231 0.0321 0.0379 0.0452 0.0566 0.4407 0.4496 0.4599 0.4726

F096 0.0181 0.0273 0.0380 0.0463 0.0556 0.4425 0.4505 0.4598 0.4741F097 0.0181 0.0275 0.0388 0.0472 0.0575 0.4451 0.4539 0.4634 0.4757F098 0.0182 0.0277 0.0385 0.0468 0.0570 0.4434 0.4526 0.4625 0.4746F099 0.0181 0.0276 0.0388 0.0472 0.0576 0.4451 0.4539 0.4635 0.4751F100 0.0191 0.0285 0.0397 0.0483 0.0591 0.4405 0.4501 0.4603 0.4729

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

114

Page 131: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 15 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "ส่ี"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0194 0.0284 0.0355 0.0441 0.0520 0.4460 0.4540 0.4628 0.4750F002 0.0180 0.0267 0.0344 0.0430 0.0496 0.4440 0.4520 0.4607 0.4728F003 0.0169 0.0257 0.0340 0.0429 0.0491 0.4482 0.4562 0.4656 0.4769F004 0.0188 0.0277 0.0379 0.0456 0.0510 0.4436 0.4526 0.4619 0.4741F005 0.0215 0.0304 0.0359 0.0425 0.0530 0.4424 0.4511 0.4602 0.4732

F096 0.0168 0.0253 0.0333 0.0411 0.0468 0.4460 0.4542 0.4625 0.4741F097 0.0173 0.0259 0.0347 0.0421 0.0474 0.4448 0.4548 0.4648 0.4792F098 0.0172 0.0258 0.0342 0.0416 0.0470 0.4462 0.4550 0.4640 0.4788F099 0.0168 0.0253 0.0339 0.0414 0.0468 0.4457 0.4543 0.4637 0.4760F100 0.0187 0.0276 0.0373 0.0447 0.0503 0.4426 0.4511 0.4605 0.4740

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 16 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "หา"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0215 0.0316 0.0380 0.0462 0.0582 0.4440 0.4544 0.4645 0.4757F002 0.0215 0.0311 0.0395 0.0496 0.0584 0.4414 0.4524 0.4623 0.4740F003 0.0203 0.0301 0.0379 0.0480 0.0574 0.4423 0.4516 0.4637 0.4747F004 0.0192 0.0284 0.0361 0.0462 0.0557 0.4406 0.4499 0.4613 0.4753F005 0.0227 0.0340 0.0402 0.0461 0.0555 0.4412 0.4514 0.4640 0.4760

F096 0.0197 0.0293 0.0361 0.0449 0.0557 0.4410 0.4505 0.4632 0.4780F097 0.0196 0.0292 0.0374 0.0482 0.0572 0.4422 0.4513 0.4626 0.4740F098 0.0209 0.0302 0.0403 0.0509 0.0584 0.4416 0.4515 0.4595 0.4723F099 0.0199 0.0293 0.0386 0.0493 0.0570 0.4431 0.4534 0.4648 0.4805F100 0.0213 0.0308 0.0406 0.0518 0.0600 0.4419 0.4516 0.4618 0.4741

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

115

Page 132: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 17 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "หก"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0204 0.0307 0.0399 0.0506 0.0577 0.4462 0.4566 0.4664 0.4778F002 0.0204 0.0295 0.0402 0.0488 0.0548 0.4446 0.4531 0.4639 0.4767F003 0.0192 0.0283 0.0392 0.0476 0.0542 0.4482 0.4556 0.4632 0.4740F004 0.0192 0.0283 0.0397 0.0486 0.0560 0.4463 0.4553 0.4656 0.4770F005 0.0238 0.0325 0.0381 0.0462 0.0590 0.4458 0.4548 0.4641 0.4751

F096 0.0189 0.0281 0.0388 0.0476 0.0555 0.4438 0.4529 0.4627 0.4751F097 0.0192 0.0282 0.0383 0.0472 0.0539 0.4436 0.4527 0.4634 0.4779F098 0.0197 0.0291 0.0405 0.0494 0.0571 0.4426 0.4520 0.4616 0.4741F099 0.0192 0.0283 0.0388 0.0473 0.0539 0.4448 0.4546 0.4657 0.4813F100 0.0196 0.0289 0.0403 0.0489 0.0569 0.4431 0.4523 0.4628 0.4750

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 18 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "เจ็ด"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0213 0.0306 0.0408 0.0505 0.0570 0.4423 0.4517 0.4604 0.4728F002 0.0199 0.0289 0.0386 0.0477 0.0543 0.4437 0.4523 0.4623 0.4771F003 0.0194 0.0284 0.0394 0.0479 0.0545 0.4428 0.4517 0.4625 0.4739F004 0.0193 0.0284 0.0397 0.0486 0.0560 0.4431 0.4522 0.4622 0.4739F005 0.0241 0.0328 0.0384 0.0465 0.0594 0.4402 0.4504 0.4626 0.4749

F096 0.0189 0.0278 0.0385 0.0470 0.0537 0.4385 0.4480 0.4591 0.4717F097 0.0181 0.0272 0.0382 0.0464 0.0549 0.4408 0.4509 0.4609 0.4733F098 0.0188 0.0281 0.0392 0.0475 0.0557 0.4412 0.4504 0.4608 0.4728F099 0.0188 0.0281 0.0390 0.0474 0.0548 0.4417 0.4505 0.4594 0.4723F100 0.0196 0.0291 0.0406 0.0488 0.0574 0.4404 0.4501 0.4600 0.4725

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

116

Page 133: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 19 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "แปด"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0212 0.0304 0.0407 0.0504 0.0577 0.4429 0.4518 0.4617 0.4743F002 0.0196 0.0288 0.0407 0.0502 0.0587 0.4420 0.4517 0.4609 0.4730F003 0.0184 0.0276 0.0392 0.0479 0.0579 0.4422 0.4512 0.4609 0.4733F004 0.0188 0.0279 0.0397 0.0485 0.0579 0.4425 0.4518 0.4614 0.4738F005 0.0235 0.0322 0.0380 0.0465 0.0596 0.4413 0.4504 0.4598 0.4724

F096 0.0185 0.0275 0.0383 0.0469 0.0546 0.4379 0.4477 0.4587 0.4719F097 0.0189 0.0282 0.0399 0.0484 0.0585 0.4432 0.4523 0.4623 0.4742F098 0.0186 0.0281 0.0396 0.0480 0.0582 0.4450 0.4538 0.4641 0.4753F099 0.0184 0.0278 0.0391 0.0475 0.0574 0.4450 0.4542 0.4631 0.4755F100 0.0213 0.0338 0.0416 0.0500 0.0589 0.4398 0.4495 0.4607 0.4744

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

ตารางท่ี 20 คาสัมประสิทธ์ิคูเสนสเปกตรัม (LSP) ของสัญญาณเสียงผูหญิง คําวา "เกา"

A1 A2 A3 A4 A5 A6-A46 A47 A48 A49 A50F001 0.0213 0.0313 0.0395 0.0503 0.0599 0.4434 0.4514 0.4605 0.4750F002 0.0221 0.0315 0.0400 0.0501 0.0591 0.4445 0.4555 0.4655 0.4773F003 0.0215 0.0308 0.0401 0.0500 0.0580 0.4440 0.4525 0.4631 0.4755F004 0.0211 0.0303 0.0398 0.0496 0.0571 0.4437 0.4549 0.4664 0.4783F005 0.0256 0.0349 0.0412 0.0486 0.0605 0.4436 0.4533 0.4628 0.4733

F096 0.0201 0.0292 0.0399 0.0493 0.0565 0.4423 0.4518 0.4614 0.4736F097 0.0206 0.0298 0.0410 0.0507 0.0580 0.4449 0.4544 0.4634 0.4749F098 0.0204 0.0296 0.0412 0.0505 0.0583 0.4469 0.4554 0.4653 0.4769F099 0.0206 0.0299 0.0408 0.0507 0.0580 0.4464 0.4552 0.4644 0.4761F100 0.0214 0.0308 0.0428 0.0521 0.0597 0.4422 0.4518 0.4610 0.4739

ขอมูล

… …

ขอมูลตัวอยางสัมปรสิทธิ์คูเสนสเปกตรัม 50 อันดับ

117

Page 134: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ภาคผนวก ค

ตัวอยางขอมูลการรูจดจําโครงขายประสาทเทียม

Page 135: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 1 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "ศูนย"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0122 0.0277 0.0330 0.0379 0.0440 0.4398 0.4518 0.4616 0.4708M002 0.0123 0.0265 0.0326 0.0370 0.0436 0.4419 0.4541 0.4623 0.4715M003 0.0170 0.0283 0.0335 0.0380 0.0440 0.4466 0.4564 0.4635 0.4720M004 0.0171 0.0285 0.0339 0.0386 0.0453 0.4386 0.4513 0.4616 0.4708M005 0.0160 0.0288 0.0340 0.0389 0.0450 0.4387 0.4502 0.4596 0.4687

M096 0.0182 0.0292 0.0345 0.0397 0.0461 0.4418 0.4526 0.4606 0.4686M097 0.0186 0.0291 0.0341 0.0389 0.0452 0.4381 0.4501 0.4599 0.4693M098 0.0192 0.0293 0.0343 0.0391 0.0458 0.4394 0.4505 0.4599 0.4692M099 0.0175 0.0285 0.0337 0.0382 0.0444 0.4398 0.4514 0.4604 0.4692M100 0.0165 0.0284 0.0336 0.0382 0.0442 0.4388 0.4506 0.4601 0.4691

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 2 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "หนึ่ง"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0116 0.0261 0.0315 0.0366 0.0436 0.4463 0.4568 0.4637 0.4711M002 0.0133 0.0254 0.0322 0.0371 0.0428 0.4424 0.4539 0.4624 0.4699M003 0.0181 0.0279 0.0329 0.0374 0.0442 0.4453 0.4568 0.4647 0.4726M004 0.0150 0.0274 0.0327 0.0383 0.0465 0.4408 0.4516 0.4604 0.4691M005 0.0123 0.0268 0.0327 0.0381 0.0453 0.4391 0.4513 0.4609 0.4692

M096 0.0189 0.0287 0.0338 0.0400 0.0486 0.4319 0.4441 0.4572 0.4689M097 0.0195 0.0287 0.0340 0.0405 0.0492 0.4332 0.4457 0.4578 0.4682M098 0.0191 0.0286 0.0338 0.0403 0.0495 0.4338 0.4466 0.4584 0.4683M099 0.0151 0.0272 0.0320 0.0373 0.0447 0.4406 0.4516 0.4606 0.4692M100 0.0151 0.0271 0.0320 0.0373 0.0446 0.4422 0.4532 0.4618 0.4699

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

119

Page 136: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 3 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "สอง"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0179 0.0273 0.0329 0.0407 0.0523 0.4464 0.4562 0.4636 0.4761M002 0.0147 0.0272 0.0325 0.0398 0.0509 0.4472 0.4578 0.4664 0.4819M003 0.0183 0.0273 0.0328 0.0399 0.0522 0.4504 0.4594 0.4662 0.4784M004 0.0185 0.0274 0.0333 0.0414 0.0524 0.4452 0.4556 0.4635 0.4752M005 0.0172 0.0280 0.0345 0.0429 0.0551 0.4436 0.4549 0.4636 0.4752

M096 0.0183 0.0276 0.0341 0.0429 0.0560 0.4436 0.4547 0.4628 0.4740M097 0.0184 0.0275 0.0336 0.0422 0.0553 0.4446 0.4549 0.4627 0.4733M098 0.0186 0.0275 0.0334 0.0418 0.0548 0.4435 0.4543 0.4624 0.4730M099 0.0188 0.0277 0.0336 0.0418 0.0537 0.4472 0.4561 0.4633 0.4745M100 0.0190 0.0277 0.0337 0.0420 0.0539 0.4489 0.4576 0.4643 0.4761

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 4 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "สาม"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0157 0.0291 0.0354 0.0417 0.0514 0.4441 0.4565 0.4667 0.4742M002 0.0153 0.0299 0.0356 0.0418 0.0512 0.4486 0.4602 0.4684 0.4754M003 0.0144 0.0280 0.0343 0.0396 0.0475 0.4454 0.4583 0.4682 0.4750M004 0.0160 0.0288 0.0351 0.0411 0.0494 0.4420 0.4562 0.4679 0.4751M005 0.0141 0.0296 0.0361 0.0427 0.0532 0.4419 0.4562 0.4674 0.4745

M096 0.0163 0.0295 0.0359 0.0424 0.0533 0.4421 0.4546 0.4651 0.4733M097 0.0165 0.0295 0.0358 0.0423 0.0534 0.4434 0.4558 0.4659 0.4737M098 0.0167 0.0297 0.0361 0.0427 0.0535 0.4432 0.4556 0.4657 0.4737M099 0.0171 0.0296 0.0358 0.0422 0.0520 0.4449 0.4576 0.4671 0.4742M100 0.0170 0.0296 0.0360 0.0426 0.0522 0.4468 0.4593 0.4685 0.4752

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

120

Page 137: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 5 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "ส่ี"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0156 0.0297 0.0348 0.0394 0.0447 0.4446 0.4556 0.4638 0.4739M002 0.0138 0.0270 0.0332 0.0371 0.0411 0.4468 0.4567 0.4642 0.4749M003 0.0169 0.0290 0.0342 0.0383 0.0432 0.4459 0.4572 0.4655 0.4771M004 0.0162 0.0294 0.0348 0.0394 0.0449 0.4400 0.4531 0.4632 0.4741M005 0.0125 0.0287 0.0345 0.0391 0.0443 0.4441 0.4550 0.4633 0.4741

M096 0.0217 0.0313 0.0364 0.0412 0.0481 0.4360 0.4472 0.4580 0.4690M097 0.0215 0.0313 0.0365 0.0413 0.0481 0.4351 0.4467 0.4580 0.4697M098 0.0209 0.0309 0.0360 0.0407 0.0474 0.4349 0.4466 0.4578 0.4693M099 0.0170 0.0293 0.0343 0.0385 0.0435 0.4437 0.4539 0.4624 0.4729M100 0.0162 0.0292 0.0343 0.0385 0.0433 0.4409 0.4517 0.4610 0.4718

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 6 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "หา"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0157 0.0286 0.0349 0.0408 0.0511 0.4434 0.4543 0.4627 0.4724M002 0.0202 0.0299 0.0366 0.0436 0.0519 0.4421 0.4529 0.4623 0.4724M003 0.0153 0.0294 0.0346 0.0399 0.0465 0.4442 0.4552 0.4634 0.4743M004 0.0170 0.0298 0.0349 0.0412 0.0512 0.4386 0.4507 0.4603 0.4707M005 0.0164 0.0290 0.0357 0.0419 0.0530 0.4441 0.4541 0.4617 0.4720

M096 0.0175 0.0308 0.0358 0.0426 0.0536 0.4399 0.4517 0.4610 0.4717M097 0.0182 0.0308 0.0358 0.0424 0.0535 0.4407 0.4522 0.4610 0.4722M098 0.0176 0.0306 0.0357 0.0422 0.0530 0.4394 0.4511 0.4600 0.4717M099 0.0149 0.0299 0.0353 0.0414 0.0514 0.4423 0.4545 0.4636 0.4749M100 0.0150 0.0301 0.0356 0.0419 0.0519 0.4416 0.4533 0.4625 0.4724

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

121

Page 138: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 7 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "หก"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0145 0.0285 0.0342 0.0400 0.0474 0.4398 0.4509 0.4594 0.4693M002 0.0136 0.0269 0.0346 0.0403 0.0490 0.4415 0.4530 0.4614 0.4726M003 0.0162 0.0284 0.0346 0.0406 0.0481 0.4440 0.4539 0.4619 0.4721M004 0.0166 0.0286 0.0346 0.0408 0.0492 0.4417 0.4529 0.4614 0.4714M005 0.0135 0.0286 0.0351 0.0414 0.0499 0.4434 0.4541 0.4619 0.4726

M096 0.0185 0.0293 0.0353 0.0424 0.0511 0.4425 0.4526 0.4603 0.4700M097 0.0172 0.0289 0.0355 0.0435 0.0525 0.4397 0.4521 0.4617 0.4733M098 0.0179 0.0292 0.0356 0.0431 0.0518 0.4388 0.4512 0.4608 0.4709M099 0.0164 0.0284 0.0342 0.0408 0.0496 0.4467 0.4567 0.4651 0.4838M100 0.0170 0.0286 0.0343 0.0409 0.0502 0.4461 0.4559 0.4639 0.4777

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 8 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "เจด็"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0192 0.0290 0.0345 0.0405 0.0483 0.4465 0.4559 0.4633 0.4774M002 0.0161 0.0276 0.0345 0.0408 0.0507 0.4458 0.4547 0.4612 0.4722M003 0.0193 0.0290 0.0350 0.0423 0.0524 0.4458 0.4550 0.4619 0.4737M004 0.0197 0.0291 0.0348 0.0420 0.0518 0.4447 0.4540 0.4611 0.4721M005 0.0120 0.0270 0.0337 0.0410 0.0498 0.4440 0.4539 0.4615 0.4738

M096 0.0200 0.0295 0.0361 0.0447 0.0544 0.4359 0.4473 0.4572 0.4679M097 0.0198 0.0293 0.0359 0.0442 0.0537 0.4368 0.4483 0.4576 0.4686M098 0.0197 0.0294 0.0361 0.0447 0.0543 0.4356 0.4476 0.4577 0.4687M099 0.0202 0.0293 0.0351 0.0419 0.0511 0.4467 0.4553 0.4620 0.4742M100 0.0201 0.0294 0.0351 0.0418 0.0507 0.4475 0.4557 0.4620 0.4740

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

122

Page 139: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 9 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "แปด"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0155 0.0290 0.0351 0.0411 0.0509 0.4398 0.4525 0.4631 0.4723M002 0.0108 0.0284 0.0348 0.0404 0.0496 0.4463 0.4577 0.4661 0.4728M003 0.0162 0.0290 0.0351 0.0407 0.0502 0.4451 0.4571 0.4662 0.4736M004 0.0168 0.0291 0.0353 0.0412 0.0496 0.4397 0.4532 0.4645 0.4726M005 0.0136 0.0294 0.0360 0.0423 0.0530 0.4423 0.4559 0.4658 0.4734

M096 0.0171 0.0297 0.0365 0.0440 0.0548 0.4417 0.4546 0.4647 0.4729M097 0.0174 0.0298 0.0366 0.0438 0.0549 0.4423 0.4548 0.4646 0.4725M098 0.0171 0.0298 0.0367 0.0442 0.0551 0.4408 0.4534 0.4637 0.4718M099 0.0180 0.0297 0.0359 0.0423 0.0517 0.4441 0.4566 0.4659 0.4732M100 0.0178 0.0297 0.0360 0.0424 0.0521 0.4454 0.4575 0.4664 0.4735

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 10 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูชาย คําวา "เกา"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50M001 0.0175 0.0279 0.0334 0.0419 0.0539 0.4428 0.4546 0.4633 0.4756M002 0.0187 0.0270 0.0342 0.0426 0.0545 0.4471 0.4568 0.4644 0.4764M003 0.0198 0.0277 0.0330 0.0402 0.0520 0.4463 0.4572 0.4652 0.4771M004 0.0191 0.0275 0.0326 0.0409 0.0532 0.4460 0.4567 0.4649 0.4764M005 0.0154 0.0268 0.0329 0.0411 0.0543 0.4432 0.4543 0.4634 0.4742

M096 0.0194 0.0283 0.0337 0.0430 0.0559 0.4450 0.4550 0.4629 0.4731M097 0.0190 0.0281 0.0337 0.0426 0.0551 0.4447 0.4553 0.4633 0.4747M098 0.0195 0.0282 0.0339 0.0430 0.0558 0.4445 0.4554 0.4638 0.4757M099 0.0169 0.0277 0.0332 0.0418 0.0545 0.4464 0.4575 0.4657 0.4792M100 0.0164 0.0277 0.0332 0.0416 0.0535 0.4450 0.4567 0.4651 0.4784

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

123

Page 140: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 11 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "ศูนย"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0162 0.0292 0.0365 0.0427 0.0496 0.4411 0.4561 0.4684 0.4724F002 0.0175 0.0296 0.0363 0.0421 0.0498 0.4411 0.4564 0.4683 0.4725F003 0.0149 0.0294 0.0357 0.0410 0.0499 0.4406 0.4540 0.4659 0.4726F004 0.0106 0.0278 0.0343 0.0392 0.0469 0.4406 0.4552 0.4678 0.4726F005 0.0094 0.0260 0.0336 0.0385 0.0458 0.4417 0.4565 0.4682 0.4725

F096 0.0158 0.0286 0.0354 0.0428 0.0499 0.4415 0.4560 0.4678 0.4726F097 0.0161 0.0287 0.0358 0.0427 0.0490 0.4406 0.4549 0.4674 0.4726F098 0.0157 0.0286 0.0356 0.0426 0.0489 0.4409 0.4551 0.4677 0.4725F099 0.0149 0.0279 0.0337 0.0396 0.0464 0.4426 0.4578 0.4693 0.4721F100 0.0152 0.0287 0.0354 0.0428 0.0498 0.4381 0.4527 0.4664 0.4726

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 12 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "หนึ่ง"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0196 0.0296 0.0366 0.0429 0.0497 0.4442 0.4555 0.4647 0.4787F002 0.0174 0.0286 0.0360 0.0433 0.0521 0.4433 0.4555 0.4641 0.4771F003 0.0136 0.0267 0.0336 0.0388 0.0444 0.4445 0.4549 0.4639 0.4733F004 0.0121 0.0256 0.0327 0.0375 0.0423 0.4451 0.4559 0.4642 0.4760F005 0.0121 0.0254 0.0328 0.0379 0.0428 0.4465 0.4573 0.4653 0.4822

F096 0.0158 0.0280 0.0346 0.0422 0.0495 0.4454 0.4561 0.4640 0.4770F097 0.0164 0.0281 0.0349 0.0420 0.0490 0.4457 0.4562 0.4647 0.4803F098 0.0144 0.0275 0.0340 0.0413 0.0490 0.4439 0.4548 0.4630 0.4757F099 0.0155 0.0275 0.0329 0.0392 0.0479 0.4416 0.4534 0.4625 0.4763F100 0.0144 0.0273 0.0330 0.0395 0.0479 0.4409 0.4532 0.4624 0.4740

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

124

Page 141: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 13 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "สอง"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0194 0.0289 0.0359 0.0436 0.0580 0.4441 0.4551 0.4634 0.4738F002 0.0192 0.0296 0.0361 0.0438 0.0575 0.4454 0.4563 0.4647 0.4772F003 0.0174 0.0293 0.0344 0.0407 0.0507 0.4395 0.4517 0.4615 0.4724F004 0.0157 0.0283 0.0338 0.0399 0.0498 0.4444 0.4552 0.4633 0.4736F005 0.0152 0.0274 0.0332 0.0390 0.0485 0.4455 0.4561 0.4637 0.4749

F096 0.0194 0.0285 0.0360 0.0441 0.0527 0.4485 0.4585 0.4668 0.4885F097 0.0179 0.0276 0.0350 0.0428 0.0522 0.4437 0.4552 0.4634 0.4746F098 0.0183 0.0278 0.0352 0.0432 0.0523 0.4455 0.4564 0.4651 0.4792F099 0.0160 0.0266 0.0330 0.0406 0.0492 0.4475 0.4579 0.4656 0.4832F100 0.0165 0.0266 0.0321 0.0384 0.0463 0.4444 0.4555 0.4636 0.4761

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 14 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "สาม"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0174 0.0293 0.0362 0.0426 0.0558 0.4395 0.4535 0.4655 0.4714F002 0.0233 0.0328 0.0377 0.0445 0.0538 0.4400 0.4547 0.4663 0.4716F003 0.0221 0.0319 0.0361 0.0415 0.0503 0.4428 0.4565 0.4669 0.4716F004 0.0167 0.0294 0.0346 0.0395 0.0475 0.4428 0.4562 0.4667 0.4716F005 0.0157 0.0292 0.0350 0.0405 0.0500 0.4421 0.4558 0.4667 0.4716

F096 0.0177 0.0286 0.0361 0.0429 0.0519 0.4394 0.4539 0.4658 0.4717F097 0.0176 0.0286 0.0361 0.0427 0.0520 0.4414 0.4560 0.4672 0.4717F098 0.0179 0.0288 0.0363 0.0429 0.0524 0.4384 0.4528 0.4655 0.4715F099 0.0162 0.0275 0.0335 0.0394 0.0463 0.4432 0.4578 0.4677 0.4717F100 0.0154 0.0273 0.0333 0.0392 0.0463 0.4423 0.4574 0.4677 0.4717

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

125

Page 142: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 15 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "ส่ี"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0180 0.0286 0.0356 0.0412 0.0467 0.4402 0.4549 0.4668 0.4717F002 0.0149 0.0278 0.0342 0.0389 0.0442 0.4440 0.4597 0.4703 0.4691F003 0.0111 0.0255 0.0321 0.0363 0.0406 0.4435 0.4566 0.4673 0.4717F004 0.0126 0.0264 0.0327 0.0369 0.0414 0.4433 0.4565 0.4675 0.4717F005 0.0126 0.0256 0.0327 0.0372 0.0417 0.4446 0.4581 0.4684 0.4716

F096 0.0150 0.0270 0.0331 0.0390 0.0448 0.4433 0.4550 0.4652 0.4716F097 0.0140 0.0265 0.0328 0.0389 0.0448 0.4484 0.4598 0.4685 0.4717F098 0.0141 0.0264 0.0322 0.0378 0.0437 0.4442 0.4553 0.4655 0.4716F099 0.0147 0.0266 0.0321 0.0378 0.0451 0.4401 0.4537 0.4657 0.4716F100 0.0144 0.0266 0.0321 0.0380 0.0453 0.4345 0.4468 0.4630 0.4716

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 16 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "หา"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0207 0.0309 0.0371 0.0463 0.0564 0.4405 0.4542 0.4650 0.4741F002 0.0204 0.0306 0.0369 0.0450 0.0545 0.4351 0.4492 0.4608 0.4704F003 0.0152 0.0278 0.0353 0.0411 0.0485 0.4452 0.4560 0.4646 0.4742F004 0.0157 0.0280 0.0351 0.0401 0.0459 0.4383 0.4518 0.4631 0.4728F005 0.0173 0.0288 0.0357 0.0406 0.0461 0.4390 0.4508 0.4631 0.4734

F096 0.0187 0.0305 0.0352 0.0415 0.0522 0.4430 0.4523 0.4622 0.4737F097 0.0171 0.0300 0.0352 0.0418 0.0514 0.4394 0.4537 0.4643 0.4717F098 0.0173 0.0301 0.0350 0.0415 0.0518 0.4389 0.4524 0.4643 0.4718F099 0.0187 0.0290 0.0331 0.0378 0.0482 0.4396 0.4526 0.4634 0.4732F100 0.0191 0.0293 0.0333 0.0381 0.0493 0.4374 0.4508 0.4625 0.4716

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

126

Page 143: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 17 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "หก"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0196 0.0301 0.0374 0.0445 0.0522 0.4455 0.4559 0.4640 0.4760F002 0.0194 0.0301 0.0375 0.0446 0.0524 0.4472 0.4582 0.4657 0.4812F003 0.0141 0.0276 0.0355 0.0413 0.0516 0.4454 0.4556 0.4636 0.4745F004 0.0136 0.0277 0.0353 0.0408 0.0505 0.4425 0.4536 0.4620 0.4729F005 0.0130 0.0278 0.0348 0.0399 0.0477 0.4443 0.4558 0.4643 0.4780

F096 0.0199 0.0301 0.0367 0.0440 0.0518 0.4442 0.4550 0.4635 0.4737F097 0.0201 0.0302 0.0367 0.0441 0.0521 0.4450 0.4553 0.4635 0.4744F098 0.0194 0.0299 0.0367 0.0442 0.0519 0.4440 0.4550 0.4627 0.4743F099 0.0169 0.0290 0.0347 0.0412 0.0492 0.4453 0.4570 0.4644 0.4793F100 0.0182 0.0296 0.0357 0.0430 0.0509 0.4443 0.4553 0.4637 0.4744

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 18 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "เจ็ด"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0182 0.0295 0.0372 0.0442 0.0546 0.4337 0.4492 0.4624 0.4712F002 0.0193 0.0299 0.0375 0.0451 0.0542 0.4357 0.4540 0.4646 0.4744F003 0.0147 0.0279 0.0354 0.0413 0.0513 0.4376 0.4527 0.4641 0.4728F004 0.0152 0.0279 0.0357 0.0418 0.0523 0.4371 0.4517 0.4633 0.4715F005 0.0137 0.0272 0.0349 0.0406 0.0504 0.4387 0.4524 0.4639 0.4716

F096 0.0220 0.0311 0.0384 0.0473 0.0560 0.4380 0.4516 0.4630 0.4715F097 0.0207 0.0304 0.0373 0.0456 0.0541 0.4355 0.4505 0.4625 0.4723F098 0.0209 0.0305 0.0374 0.0458 0.0544 0.4336 0.4478 0.4614 0.4712F099 0.0200 0.0303 0.0368 0.0452 0.0534 0.4260 0.4419 0.4594 0.4702F100 0.0203 0.0303 0.0373 0.0454 0.0532 0.4295 0.4457 0.4614 0.4720

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

127

Page 144: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ตารางท่ี 19 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "แปด"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0160 0.0276 0.0363 0.0445 0.0593 0.4397 0.4519 0.4618 0.4713F002 0.0164 0.0282 0.0367 0.0452 0.0609 0.4394 0.4518 0.4622 0.4715F003 0.0128 0.0260 0.0337 0.0401 0.0518 0.4420 0.4536 0.4620 0.4724F004 0.0131 0.0261 0.0340 0.0406 0.0531 0.4428 0.4543 0.4629 0.4731F005 0.0126 0.0259 0.0338 0.0403 0.0526 0.4467 0.4586 0.4689 0.4916

F096 0.0183 0.0284 0.0365 0.0447 0.0537 0.4343 0.4471 0.4591 0.4693F097 0.0188 0.0287 0.0363 0.0450 0.0540 0.4374 0.4494 0.4603 0.4705F098 0.0184 0.0284 0.0361 0.0444 0.0535 0.4342 0.4459 0.4580 0.4689F099 0.0178 0.0282 0.0358 0.0452 0.0548 0.4408 0.4551 0.4655 0.4844F100 0.0175 0.0281 0.0360 0.0457 0.0559 0.4393 0.4537 0.4650 0.4837

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

ตารางท่ี 20 คาเอาตพุตของโครงขายประสาทเทียม ของสัญญาณเสียงผูหญิง คําวา "เกา"

Y1 Y2 Y3 Y4 Y5 Y6-Y46 Y47 Y48 Y49 Y50F001 0.0192 0.0302 0.0381 0.0466 0.0555 0.4465 0.4579 0.4658 0.4766F002 0.0195 0.0304 0.0383 0.0466 0.0552 0.4462 0.4581 0.4665 0.4775F003 0.0122 0.0268 0.0354 0.0418 0.0515 0.4441 0.4560 0.4653 0.4746F004 0.0126 0.0269 0.0352 0.0413 0.0495 0.4429 0.4554 0.4645 0.4767F005 0.0090 0.0252 0.0342 0.0406 0.0506 0.4447 0.4569 0.4660 0.4788

F096 0.0179 0.0297 0.0360 0.0439 0.0525 0.4435 0.4554 0.4666 0.4791F097 0.0175 0.0295 0.0355 0.0435 0.0531 0.4444 0.4555 0.4645 0.4760F098 0.0173 0.0292 0.0352 0.0428 0.0521 0.4412 0.4553 0.4663 0.4761F099 0.0169 0.0288 0.0338 0.0406 0.0528 0.4384 0.4523 0.4637 0.4748F100 0.0158 0.0285 0.0335 0.0400 0.0517 0.4406 0.4549 0.4657 0.4763

ขอมูล

… …

ขอมูลตัวอยางการรูจดจําโครงขายประสาทเทียม

128

Page 145: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ภาคผนวก ง

ผลงานวิจัยตพีิมพ

Page 146: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

130

Page 147: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

131

Page 148: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

132

Page 149: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

133

Page 150: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

134

Page 151: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

135

Page 152: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

136

Page 153: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

137

Page 154: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

138

Page 155: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

139

Page 156: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

140

Page 157: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

141

Page 158: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

142

Page 159: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

143

Page 160: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

144

Page 161: ประสิทธิภาพของ LPC และ LSP ในการรู  จําแนวทางเดินเ

ประวัติผูเขียน ชื่อ - นามสกุล นายสุวรรณ ร่ืนสุคนธ วัน เดือน ปเกิด 16 กันยายน พ.ศ.2525 ท่ีอยู 7/1250 ถ.บานกลวย-ไทรนอย ต.ทววีัฒนา

อ.ไทรนอย นนทบุรี 11150 ประวัติการศึกษา สําเร็จการศึกษาระดับวิศวกรรมศาสตรบัณฑิต สาขาวิศวกรรมอิเล็กทรอนิกสและโทรคมนาคม จากมหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี เม่ือ พ.ศ.2548 ความชํานาญเฉพาะทาง 1. การประมวลผลสัญญาณ 2. ระบบส่ังงานอัตโนมัต ิ 3. การวิเคราะหวงจรอิเล็กทรอนิกส ประวัติการทํางาน ปจจุบัน ประกอบกิจการสวน หจก.ดํารงคทรัพยทว ี ผลงานวิจัย สุวรรณ ร่ืนสุคนธ, “ประสิทธิภาพของ LPC และ LSP ในการรูจําแนวทางเดินเสียงพูดภาษาไทย”, International Joint Conference on Computer Science and Software Engineering (JCSSE2008), Vol 5, No.2, 2008. pp 287 - 293.

สุวรรณ ร่ืนสุคนธ, “การรูจําเสียงพูดภาษาไทยโดยใชสัมประสิทธ์ิคูเสนสเปกตรัมรวมกับโครงขายประสาทเทียม”, International Joint Conference on Computer Science and Software Engineering (JCSSE2009), Vol 6, No.2, 2009. pp 341 - 346.

จักรกฤษ ออนช่ืนจิตร, สุวรรณ ร่ืนสุคนธ และ จักรี ศรีนนทฉัตร, "การวิเคราะหแนวทางเดินเสียงในรูปแบบของสัมประสิทธ์ิคูเสนสเปกตรัม", การประชุมวิชาการทางวิศวกรรมไฟฟา (EECON), คร้ังท่ี 31, 29-31 ตุลาคม 2551, นครนายก, 2551, หนา 1133-1136.

145