การประมวลผลคำพูด

จากวิกิพีเดีย สารานุกรมเสรี

การประมวลผลคำพูด (speech processing) เป็นการศึกษาสัญญาณเสียงพูด และ วิธีในการประมวลผลสัญญาณประเภทนี้

การประมวลผลสัญญาณเสียงพูดในปัจจุบัน จะอยู่ในรูปของสัญญาณดิจิทัล โดยสาขานี้มีเนื้อหาร่วมระหว่าง การประมวลผลสัญญาณดิจิทัล และ การประมวลผลภาษาธรรมชาติ. กล่าวคือมีการประมวลผลทั้งสองส่วน ทั้งตัวสัญญาณเสียง (พาหะนำสาร) และภาษา (สาร)

การประมวลผลคำพูด อาจแบ่งเป็นหัวข้อย่อยได้ดังนี้

  • การจดจำคำพูด (speech recognition) เป็นการวิเคราะห์ และ จดจำ เนื้อความคำพูด จากสัญญาณเสียงพูด
  • การจดจำเสียงผู้พูด (speaker recognition) เป็นการใช้เสียงในการระบุตัวผู้พูด
  • การปรับแต่งเสียงพูด (speech signal enhancement)
  • การเข้ารหัสเสียงพูด (speech coding) เพื่อการบีบอัดข้อมูล
  • การวิเคราะห์เสียงพูด (voice analysis) เพื่อใช้ประโยชน์ในทางการแพทย์ เช่นการวิเคราะห์ความผิดปกติของสายเสียง
  • การสังเคราะห์เสียงพูด (speech synthesis) โดยทั่วไปหมายถึงการใช้คอมพิวเตอร์ในการสร้างเลียนเสียงพูดของมนุษย์