Menggunakan beberapa jendela waktu didalam satu proses pengukuran sebagai cara untuk mengukur dan mengoptimasi respon sebuah sound system didalam sebuah ruangan.

Jika kita bisa hanya mendengar suara yang datang langsung dari sebuah speaker pengeras suara saja tanpa pantulan, dunia akan menjadi tempat yang sangat berbeda!

Namun sayangnya, pendengaran bidang bebas, dimana tidak ada refleksi suara, modus ruangan atau suara noise ambient, sangat sulit dicapai, jadi selama ini kita semua mendengar suara dari sound system didalam ruangan nyata. Interaksi dari sebush istem tata suara dengan sebuah ruangan bisa jadi sangat rumit untuk dimengerti, dimodelkan dan diukur.

Salah satu cara untuk mengukur interaksi ini adalah dengan mengukur respon awal atau impulse Dari sistem speaker / ruangan. Respon impulse dari sebuah sound system yang tipikal didalam sebuah ruangan berisi banyak informasi yang menaril, termasuk :

1) Waktu delay antara speaker dan mikrofon pengukur

2) Rasio level suara langsung dengan gema

3) Waktu tida dari konten frekuensi dan level refleksi dari suara

4) Nilai decay awal dan akhir dari suara

5) Respon frekuensi dari suara langsung.

Point terakhir adalah yang paling menarik. Pertanyaannya adalah “Apa yang ingin kita ukur dan mengapa?”

Satu pertanyaan yang langsung masuk kedalam inti dari masalah pengukuran dan optimasi “sistem” adalah “Jika respon impulse mengandung respon frekuensi dari suara langsung, bisa gak sih kita misahin respon dari speaker dari respon ruangan?” Dan “Kalau bisa, apa perlu?”

Gambar 1 menunjukkan sebuah respon impulse dari sebuah aula serbaguna dengan 1,250 tempat duduk. Ditampilin dalam ranah waktu. Sudut axis x adalah waktu (~0.75 detik) dan sudut axis y adalah magnitudo dalam dB. Perhatikan suara langsung, refleksi, reverberasi decay dan dasar noise.

Gambar 1

Ujung runcing “spike” yang mewakili suara langsung sebenarnya mengandung informasi frekuensi dan fase dari pengeras suara. Untuk melihat informasi ini kita harus merubah porsi dari respon impulse kedalam ranah frekuensi.

Untuk mengisolasi suara langsung dari respon ruangan, kalian harus memilih sebuah jendela waktu yang menyertakan suara langsung diluar refleksi dan decay ruangan.

Gambar 2 menampilkan jendela waktu yang dimaksud. Pengukuran ini, didalam aula dengan 1,250 tempat duduk yang sama, dibuat menggunakan sebuah sistem speaker full range dengan mikrofon yang berjarak kira kira 60 kaki dari unit pengeras suara. Memakai pink noise sebagai sinyal referensi dan respon impulse awal dihitung menggunakan sebuah FFT 512K (walaupun hanya ~0.75 detik pertama yang ditampilkan).

Garis garis vertikal menunjukkan sebuah jendela waktu yang mengesampingkan kebanyakan efek efek dari ruangan pada frekuensi yang periodenya lebih panjang ketimbang jendela waktu yang dipilih (contohnya frekuensi bawah).

Kita lalu bisa mengambil data dari jendela waktu yang terpilih dan merubahnya menjadi ranah frekuensi menggunakan perhitungan matematika FFT. Transformasi ini akan menghasilkan tampilan yang menunjukkan seberapa banyak energi yang ada pada setiap frekuensi, ditampilkan pada gambar 3, menunjukkan respon frekuensi dari porsi suara langsung dan respon impulse didalam ruangan aula dengan 1,250 tempat duduk.

Respon ini dihitung menggunakan sebuah FFT 512 titik (yang setara dengan 512/48000 atau ~11 milidetik). Seperti yang bisa kalian lihat, respon frekuensi menunjukkan sebuah pemotongan LF yang cukup tajam. Kalian juga akan menyadari kurangnya resolusi LF didalam gambar ini. Kurangnya resolusi pada LF ketiban sama resolusi HF yang lebih dominan.

Resolusi yang tidak seimbang antara energi LF ( low frequency ) dan HF ( high frequency ) adalah hasil dari matematika FFT yang dipakai untuk merubah data dari ranah waktu ke ranah frekuensi. Hasil data FFT standar yang terdistribusi secara linear dalam frekuensi (satu titik data pada setiap nilai Hertz). Sayangnya, manusia mempersepsikan frekuensi secara logaritmik.

Kurangnya resolusi LF pada gambar 3 adalah hasil langsung dari penggunaan jendela waktu yang pendek dalam transformasi dari ranah waktu kedalam ranah frekuensi. Sangat menarik untuk diperhatikan bahwa plot ini tidak berhubungan dengan apa yang kita dengar. Dengan mendengar sistem pengeras suara rentang penuh yang sedang kita ukur akan memperjelas bahwa sound system mereproduksi energi LF paling tidak turun sampai 100 Hz!

Akan jauh lebih baik jika kita menerapkan pengukuran yang efektif yang berkorelasi dengan apa yang bisa kuping kita dengar. Sebagai alternatif untuk melakukan pengukuran yang berkorelasi dengan apa yang kita dengar, kita bisa menggunakan jendela waktu yang lebih panjang untuk melihat respon LF dengan resolusi yang lebih baik.

Jendela waktu yang lebih panjang kira kira 250 milidetik seperti yang tertampil pada Gambar 4, menunjukkan respon impulse awal dalam ruang aula serbaguna dengan 1,250 tempat duduk. Garis garis vertikal memperlihatkan sebuah jendela waktu yang menyertakan kebanyakan dari efek efek suara didalam ruangan. Jendela waktu yang ditampilkan kira kira 0.25 detik.

Untuk merubah potongan respon impulse yang lebih panjang ini menjadi ranah frekuensi, kita akan menggunakan sebuah FFT 8k yang mewakili 8k/48000 detik, atau 0.171 detik.

Perhatikan kembali kalau pada jendela waktu ini termasuk suara langsung dan respon dari ruangan.

Gambar 5 menunjukkan respon frekuensi dari porsi suara langsung dari respon impulse dari aula berkapasitas 1,250 tempat duduk. Respon terkalkulasi menggunakan sebuah FFT 8192 titik (yang sama dengan 8192/48000 atau ~107 milidetik). Seperti yang bisa kalian lihat, respon frekuensi memperlihatkan bahwa energi frekuensi bawah lebih jelas dibanding yang tampak pada jendela waktu yang lebih pendek.

Sementara informasi frekuensi rendah tampak dalam resolusi yang cukup, hasil frekuensi atas terlihat membingungkan. Plot menampilkan data yang memiliki resolusi 5 Hz ( satu titik data setiap 5 Hz). Resolusi ini menyediakan tampilan resolusi LF yang mantap (antara 31 Hz dan 62.5 Hz terdapat 15 titik data).

Namun, pada area HF kita mendapatkan resolusi yang berlebihan —antara 4 kHz dan 8 kHz terdapat kira kira 800 titik data. Sederhananya, semakin panjang jendela waktu yang kalian terapkan, maka akan semakin baik tampilan resolusi LF, namun resolusi HF yang berlebihan.

Hasil dari pelajaran tentang plot ini akan membantu kalian menyimpulkan kalau, untuk melakukan pengukuran yang berkorelasi dengan kemampuan mendengar kita, kita kudu memakai jendela waktu yang sangat pendek yang mengisolasi paparan suara langsung pada frekuensi atas, dan memperpanjang jendela waktu jika kita ingin melihat frekuensi bawah. Sekilas ide ini mungin terlihat melanggar frasa yang sering dikutip, “Kalian hanya dapat mempengaruhi suara langsung dengan pemrosesan.”

Namun bukan hal ini yang dimaksud. Pada frekuensi menengah bawah dan bawah, interaksi dari sebuah sound system dan sebuah ruangan dapat dipengaruhi dan dioptimasi menggunakan pemrosesan sinyal. Dengan kata lain, pada frekuensi bawah (gelombang suara panjang ) paparan suara langsung dan refleksi dari permukaan yang dekat saling terkombinasi untuk membentuk sebuah respon komposit campuran. Respon komposit inilah yang didengar oleh para hadirin.

Kemampuan untuk mengukur beberapa jendela waktu secara bersamaan menyediakan sebuah pengukuran yang berkorelasi dengan kemampuan pendengaran manusia dan menyediakan wawasan kedalam bagaimana sinyal yang terkirim ke perangkat speaker dapat disesuaikan (via equalizer, atau alat pemrosesan audio lainnya) untuk mengoptimasi interaksi antara sound system dengan ruangan.

Gambar yang terakhir memperlihatkan hasil pengukuran dari sebuah sistem pengeras suara yang menyertakan beberapa jendela waktu dan menampilkan kedua respon magnitudo dan fase dari sistem. Penggunaan beberapa jendela waktu memungkinkan kalian untuk mengisolasi paparan suara langsung dari speaker didalam situasi dunia nyata pada frekuensi atas.

Sedangkan pada frekuensi yang lebih rendah, jendela waktu yang menyertakan interaksi antara speaker dan ruangan terbukti berkorelasi baik dengan kemampuan kita dalam mendengar. Beberapa jendela waktu didalam sebuah pengukuran adalah cara yang sangat mumpuni untuk mengukur dan mengoptimasi respon dari sebuah sound system didalam sebuah ruangan.

Artikel ini ditulis berdasarkan referensi dari Sam Berkow, pencipta software pengukuran akustik Smaart.