การใช้ Praat สำหรับการวิเคราะห์โทนเสียงของภาษาไทย

Praat คืออะไร?…

This article was originally posted on WomenLearnThai.com.

บทความนี้ใช้เวลาอ่านประมาณ 5 นาที ยังไม่มีเวลาตอนนี้ใช่ไหม? ไม่เป็นไร ส่งบทความเวอร์ชันไม่มีโฆษณาไปที่อีเมลของคุณ แล้วกลับมาอ่านภายหลังได้!

loading image

Praat เป็นภาษาเนเธอร์แลนด์แปลว่า “พูด” มันคือ โปรแกรมที่ใช้สำหรับการวิเคราะห์เสียง มันเป็นโปรแกรมที่ทรงพลังและมีฟังก์ชันขั้นสูงมากมาย แต่ในบทความนี้จะพูดถึงฟังก์ชันพื้นฐานที่สุด: การหาความถี่เสียงจากไฟล์เสียง

Pitch คืออะไร?…

ก่อนอื่นเรามาพูดถึง “เสียงบริสุทธิ์” เสียงบริสุทธิ์คือคลื่นเสียงที่มีความถี่เดียวกัน เป็นเสียงที่ได้ยินจากส้อมเสียง หากนำคลื่นนี้มาแสดงในกราฟทั้งในด้านเวลาและพื้นที่ กราฟทั้งสองจะเป็นคลื่นไซน์

เสียงของเราไม่ใช่เสียงบริสุทธิ์ หากวิเคราะห์เสียงของเราจะพบว่าประกอบด้วยคลื่นไซน์หลายความถี่ (ความสูงของเสียง) แต่ละความถี่มีความแรง (amplitude) และจุดเริ่มต้น (phase) ที่ต่างกัน คลื่นทั้งหมดนี้เกิดขึ้นจากเสียงของเราในเวลาเดียวกัน

“Pitch” ในทางภาษาเสียงคือความถี่ (หรือความสูงของเสียง) ของคลื่นเสียงที่มีความถี่ต่ำสุดในเสียงของเรา มันเหมือนเสียงพื้นฐานของเรา และคือสิ่งที่เราเรียกว่า “เสียง” ในภาษาไทย

จุดประสงค์ของเอกสารนี้คือการแสดงให้คุณเห็นว่าคุณสามารถแสดงผลความถี่เสียงได้อย่างไร ซึ่งสามารถช่วยวิเคราะห์และปรับปรุงการออกเสียงของคุณเอง หรือช่วยให้คุณจำแนกเสียงในกรณีที่คุณจำแนกไม่ได้จากการฟัง

โปรแกรมที่เราจะใช้สามารถแสดงผลความถี่เสียงของไฟล์เสียง (ตามเวลา) ผลลัพธ์จะมีลักษณะดังนี้ เส้นสีน้ำเงินแสดงถึงความถี่เสียง

เสียงในภาษาไทยมีลักษณะอย่างไร?…

พื้นฐานแล้วจะมีลักษณะดังนี้:

  • เสียงกลางคงที่ (อาจลดลงเล็กน้อยตอนท้าย)
  • เสียงต่ำเริ่มต้นต่ำและอาจลดต่ำลงอีกเล็กน้อย
  • เสียงตกเริ่มต้นสูงและลดลงอย่างมาก
  • เสียงสูงเริ่มต้นสูงและยิ่งสูงขึ้น
  • เสียงขึ้นเริ่มต้นต่ำและขึ้นสูงอย่างมาก

การติดตั้ง Praat…

คุณสามารถดาวน์โหลดและติดตั้ง Praat ได้จาก Praat: doing phonetics by computer ซึ่งมีให้สำหรับ Linux 32/64bit, MAC OSX, FreeBSD และ Windows

การใช้งาน Praat…

เมื่อคุณเริ่มต้น Praat คุณจะพบหน้าต่างสองบาน: หน้าต่าง Objects และ Picture คุณจะใช้เฉพาะหน้าต่าง Objects หน้าต่าง Picture ใช้สำหรับการวาดและจัดการภาพที่ Praat สร้างขึ้น

จากเมนูหน้าต่าง Objects เลือก “Open – Open long sound file …” และเลือกไฟล์เสียงที่คุณต้องการวิเคราะห์ อาจเป็นไฟล์ใดก็ได้ เช่น การบันทึกการพูดของคุณเอง หากเป็นไปได้ให้บันทึกไฟล์เสียงเป็น “.wav” ไม่ใช่ “.mp3” เพราะไฟล์ “.mp3” อาจทำให้เกิดการเลื่อนเวลาเล็กน้อยระหว่างกราฟและเสียงจริง

ในหน้าต่าง Objects เลือกไฟล์เสียงของคุณ (1. LongSound tones ในกรณีนี้) และคลิก “View”

ตอนนี้จะมีหน้าต่างใหม่ปรากฏขึ้น

เมื่อคุณคลิกที่ปุ่มเล่นใต้ส่วนรายละเอียดเสียง/ความถี่ คุณสามารถเล่นเสียงทางซ้ายหรือขวาของเคอร์เซอร์ เมื่อคุณทำการเลือก เสียงจะถูกแบ่งเป็น 3 ส่วน: ส่วนหนึ่งก่อนเริ่มการเลือกของคุณ จากนั้นการเลือกของคุณ และสุดท้ายส่วนหลังการเลือกของคุณ และจะมีปุ่มเล่น 3 ปุ่ม

คุณสามารถใช้ปุ่ม “in” (ซูมเข้า), ปุ่ม “out” (ซูมออก), ปุ่ม “sel” (ซูมไปที่การเลือก) และปุ่ม “all” (ซูมไปทั้งหมด) ใต้รายละเอียดเสียง พร้อมกับปุ่มเล่นและแถบเลื่อนใต้รายละเอียดเสียงเพื่อไปยังส่วนที่คุณสนใจ

โปรดทราบว่าความถี่เสียงและรายละเอียดเสียงจะถูกแสดงเมื่อไฟล์เสียงที่มองเห็นมีความยาวน้อยกว่า 10 วินาทีเท่านั้น

โดยการคลิกที่ตัวเลขความถี่ด้านขวาของรายละเอียดเสียง คุณสามารถซูมเข้าและซูมออกสเกลความถี่ได้

ส่วนแรกของภาพด้านบนดูเหมือนเสียงกลาง หลังจากนั้นเราจะเห็นเสียงต่ำ เสียงตก เสียงสูง และเสียงขึ้น

เส้นโค้งสีเหลืองในแผนภูมิแสดงถึงความเข้มของเสียง

เสียงสูงอาจดูแปลกสำหรับคุณ เพราะการกระโดดใหญ่สุดท้ายมีความเข้มหรือระดับเสียงต่ำมากและสามารถละเว้นได้ เพื่อแสดงความเข้มให้เลือก “Intensity-Show Intensity” จากเมนู เส้นโค้งสีเหลืองแสดงถึงความเข้ม

วิธีดูความแตกต่างระหว่างเสียงมีลมดันกับไม่มีลมดัน?…

ความแตกต่างระหว่างเสียงมีลมดันเช่น พ ใน พา และเสียงไม่มีลมดันเช่น ป ใน ปา คือเวลาเริ่มต้นของเสียง (VOT) ซึ่งคือเวลาระหว่างการเริ่มต้นพยางค์และการเกิดเสียงสระที่มีเสียงครั้งแรก สำหรับเสียงมีลมดัน VOT จะมากกว่า ปกติจุดเริ่มต้นของเส้นความถี่สีน้ำเงินแสดงถึงการเริ่มต้นของการเกิดเสียง ในขณะที่ส่วนที่เพิ่มขึ้นของเส้นความเข้มสีเหลืองแสดงถึงการเริ่มต้นของพยางค์ การเกิดเสียงคือการสั่นของเส้นเสียง การจำแนกความถี่ในเสียงเหล่านี้ง่ายกว่าเสียงที่เกิดจากปาก นั่นคือเหตุผลที่เส้นความถี่สีน้ำเงินเริ่มต้นที่เสียงสระ า รูปภาพต่อไปนี้แสดง VOT ในคำว่า ปา ซึ่งมีเพียงประมาณ 18ms

Advertisement

รูปภาพนี้แสดง VOT ในคำว่า พา พ เป็นพยัญชนะมีลมดัน VOT ที่นี่คือ 78 ms ซึ่งมากกว่าเสียงพยัญชนะไม่มีลมดันอย่างมีนัยสำคัญ คุณควรเล่นและฟังการเลือกเพื่อให้แน่ใจว่าไม่ได้รวมส่วนใดของเสียงสระ

หมายเหตุ: โปรดทราบว่าสเกลเวลาของทั้งสองภาพไม่เหมือนกัน

อ่านในภาษาอื่น
บทความนี้มีให้บริการในภาษา: