Saya sering dapat pertanyaan mengenai bagaimana tampilan video conference itu, sebagian besar menanyakan tentang perbedaan antara Continuous Presence (CP) dan Voice Switching (VS).
Jadi, apakah yang dimaksud CP dan VS dan apa yang pengaruhnya terhadap video conference ?
VS
VS adalah kependekan dari Voice Switching. Pada dasarnya VS yang dimaksud adalah pembicara (orang yang sedang berbicara dalam vicon) akan tampil di layar dan dapat dilihat oleh seluruh partisipan saat dia aktif berbicara.
Contohnya saat kita conference dengan 4 participan – David, James, Susan dan Heather – jika David berbicara, gambar dia akan muncul di layar dan yang lainnya secara otomatis tidak tampak :

Secara gampangnya, saat James memulai berbicara, dia akan menggantikan gambar David di layar :

Pada system yang lebih canggih lagi, James bisa melihat David (pembicara terakhir), saat yang lainnya hanya melihat James. Inilah yang dikenal dengan fitur “no self-see” , dimana seorang partisipan tidak akan melihat dirinya sendiri.
Algoritma “voice activity detection”, atau VAD, biasanya digunakan untuk menentukan partisipan mana yang sedang berbicara, dan suatu saat komponen lain (mixer) menangani perbandingan beberapa suara dari partisipan yang masuk dan menentukan salah satu yang diutamakan.
CP
CP adalah kependekan dari Continuous Presence. Maksud dari CP adalah semua partisipan , atau sekelompok partisipan, termasuk pembicara yang aktif, tampak pada layar secara keseluruhan dan bersamaan.
Seperti pada contoh sebelumnya di atas yang menyebutkan bahwa ada 4 partisipan yang akan ditampilkan di layar :

Kiri: a 2×2 CP layout. Kanan: a 1+3 CP layout.
CP juga mempunyai proses identifikasi “pembicara aktif”, seperti pada beberapa kasus (lihat layout 1+3 di atas) seorang “pembicara aktif” akan pindah ke sub-frame yang telah ditentukan, untuk ditampilkan dalam sub-frame yang lebih besar atau pada bentuk yang lainnya yang menandakan bahwa dialah pembicara utama.
CP mempunyai banyak manipulasi grafis pada data stream yang diterima pada endpoint yang berbeda, termasuk penentuan ukuran dan penggabungan gambar-gambar yang akan diterima. Saat ini, dengan teknologi SVC (scalable video coding), CP dapat diterima tanpa perlu manipulasi grafis, namun hanya bisa diaplikasikan pada deployment berbasis H.264, yang memang saat ini masih belum umum.
VAS, CP and Video Conferencing
CP pada dasarnya adalah evolusi dari VS saat pertama kali diperkenalkan pada video conference. Sementara saat CPU tidak cukup mampu memproses manipulasi grafis yang dibutuhkan untuk CP dan juga saat ukuran layar terlalu kecil untuk layout CP, VS menjadi solusi terbaik untuk masalah tersebut. Faktanya, jika kita lihat pada kebanyakan client UC (Unified Communication) yang melakukan conference, mereka masih menggunakan VS sebagai jawaban atas kebutuhan dari “multiple participant” dalam suatu skenario multipoint conference.
Dengan diperkenalkannya layar yang lebih besar dan platform conference yang lebih baik, CP menjadi sesuatu hal yang tidak hanya relevan tetapi juga semakin populer. Pada video kualitas High Definition (HD) saat ini, suatu MCU seperti Radvision Elite MCU, mampu menampilkan sampai 28 partisipan dalam 1 (satu) layout HD, dan hasilnya pun juga bagus. Seperti yang kita lihat di bawah ini :

Pada sisi lain, saat video conference memungkinkan untuk dilakukan via desktop PC, perangkat mobile (HP, tablet comp) dan seperti semuanya tersambung pada suatu “cloud”, lagi-lagi kekuatan CPU menjadi factor yang relevan, dan saya percaya VS mampu dan sudah seharusnya bisa menawarkan mode operasional yang layak dengan harga yang lebih efektif.
So what should you use for your video conferencing service, VAS or CP? It all depends, I guess, on the type of devices and the type of infrastructure that you want to roll out, and the exact user interface you want to provide. As explained above both make for great user experience with excellent market-proven examples out there.
Jadi apa yang seharusnya kita gunakan untuk sistem video conference kita, CP atau VS ? Saya rasa itu semua tergantung pada tipe perangkat dan tipe infrastruktur yang kita inginkan dan interface user seperti apa yang kita tawarkan. Seperti penjelasan di atas, keduanya menawarkan suatu pengalaman yang bagus pada user dan diperkuat dengan pembuktian yang kuat pada pasar di dunia saat ini.