ปกติแล้วเสียงของมนุษย์จะแบ่งเป็น 4 ประเภท โดยเรียงจากเสียงสูงไปหาต่ำ ได้แก่
โซปราโน (Soprano) = ผู้หญิงเสียงสูง
อัลโต (Alto) = ผู้หญิงเสียงต่ำ
เทเนอร์ (Tenor) = ผู้ชายเสียงสูง
เบส (Bass) = ผู้ชายเสียงต่ำ
แต่ก็อาจมีข้ามระดับกันได้บ้างในกรณีที่ฝ่ายหญิงมีโทนเสียงต่ำหรือฝ่ายชายมีโทนเสียงที่สูงกว่าปกติ ในบางครั้งจึงอาจเห็นผู้ชายร้องเสียงโซปราโนได้ หรือผู้หญิงร้องเสียงเบสได้
โทนของเสียงสามารถแบ่งได้อย่างคร่าวๆตามลักษณะทางกายภาพ ได้ 3 โทน คือ Chest Tone, Mix Tone,และ Head Tone (เสียงต่ำ,กลาง,สูง)
โทนเสียงต่ำ (Chest Tone) เป็นการขับร้องในระดับเสียงต่ำ เป็นเสียงที่เปล่งออกมาได้ง่ายที่สุด โดยจะรู้สึกสั่นสะเทือนบริเวณหน้าอก เสียงที่ได้จะมีความกังวาล ทุ้ม ใหญ่ เป็นโทนที่แสดงออกถึงอารมณ์ความรู้สึกสุขุม, รอบคอบ, เศร้า, เหงา, โรแมนติก ฯลฯ ลักษณะของเนื้อเสียงจะเหมือนกับเสียงพูดปกติของชาวตะวันตก ตำแหน่งเสียงทางกายภาพจะอยู่ที่บริเวณ หน้าท้องถึงบริเวณริมฝีปากล่าง
โทนเสียงกลาง (Mix Tone) เป็นโทนเสียงที่แสดงออกถึงอารมณ์ที่ปกติ สบายๆ เมื่อปล่อยเสียงจะรู้สึกถึงการสั่นสะเทือนบริเวณช่องปาก และในโพรงอากาศบริเวณจมูก ลักษณะของเนื้อเสียงจะเหมือนกับเสียงพูดปกติของชาวตะวันออก ตำแหน่งเสียงทางกายภาพจะอยู่ที่บริเวณ ริมฝีปากถึงโหนกแก้ม
โทนเสียงสูง (Headtone) เป็นโทนเสียงที่แสดงออกถึงอารมณ์ที่ดีใจสุดๆ เสียใจสุดๆ สนุกสนาน เป็นการขับร้องในเสียงสูงระดับเทนเนอร์ และ โซปราโน ขณะเปล่งเสียงจะรู้สึกสั่นสะเทือนก้องบริเวณ เหนือลิ้นไก่และพริ้วไปตามส่วนหลังของศรีษะ เกิดความก้องกังวานในโพรงกระโหลกศรีษะแผ่กระจายมาถึงโพรงอากาศบริเวณหน้าผาก ตำแหน่งเสียงทางกายภาพจะอยู่ที่บริเวณหว่างคิ้ว