Transkripsi dulunya merupakan proses manual dan membosankan. Dokter, jurnalis, dan sekelompok profesional akan merekam catatan dan percakapan mereka pada pita Dictaphone yang kasar, dan kemudian duduk di depan komputer untuk mengetiknya.
Maju cepat hingga tahun 2020, dan ada berbagai layanan yang dapat Anda gunakan untuk mengubah rekaman audio menjadi teks di layar komputer. Namun, satu pertanyaan tetap: Apakah mereka aman? Lagipula, Anda mungkin mengupload rekaman suara dari percakapan sensitif dan pesan suara pribadi.
Mari kita lihat layanan ini, dan bagaimana Anda dapat melindungi informasi Anda.
Bagaimana Layanan Transkripsi Audio Bekerja
Layanan transkripsi audio cenderung terbagi dalam tiga kubu. Yang pertama sepenuhnya digerakkan oleh komputer dan menggunakan AI dan model pembelajaran mesin yang ada untuk memproses percakapan. Yang kedua adalah yang paling mahal karena orang melakukan pekerjaan berat. Ketiga adalah kombinasi pemrosesan komputer dan manusia.
Kemungkinan Anda paling akrab dengan kategori pertama. Layanan transkripsi suara — seperti yang ditawarkan oleh Google, Apple, dan Otter.ai —Mengubah gelombang analog yang dihasilkan suara Anda menjadi representasi digital. Kemudian memecahnya menjadi segmen kecil (terkadang, seperseribu detik) dan mencocokkannya dengan "fonem", atau elemen bahasa yang dikenal.
Algoritme ini kemudian mencoba memeriksanya dalam konteks fonem lain dan menempatkannya melalui model statistik dan AI yang pada akhirnya menghasilkan teks. Karena layanan transkripsi ini sepenuhnya digerakkan oleh komputer, layanan ini cenderung paling murah untuk dijalankan. Namun, keakuratan tidak selalu tepat, terutama dalam hal mengekstrak teks dari lingkungan yang berisik atau banyak orang.
Transkripsi bertenaga manusia melibatkan platform khusus, seperti Rev , yang menghubungkan pelanggan dengan kumpulan transkrip yang telah disetujui sebelumnya. Anda juga dapat mempekerjakan seseorang dari pasar freelance, seperti Upwork atau Fiverr, untuk mentranskripsikannya untukmu.
Terakhir, ada perpaduan keduanya. Untuk mempercepat proses transkripsi, beberapa situs mengizinkan AI melakukan pekerjaan pendahuluan, lalu seseorang merapikan hasilnya dan memperbaiki kesalahan apa pun.
Layanan Transkripsi Berperilaku Buruk
Dalam beberapa tahun terakhir, banyak layanan transkripsi menjadi sasaran pelanggaran dan skandal.
Mungkin yang tertua (dan, bisa dibilang, paling mengejutkan) adalah SpinVox, yang, di tahun 00-an, menawarkan layanan yang mengubah pesan suara menjadi pesan SMS. Pada saat itu, ini dianggap sebagai terobosan teknologi. Perusahaan dengan cepat menarik pers yang positif, pelanggan, dan pendanaan yang luas.
Masalah? Tanpa sepengetahuan pelanggan, pesan suara mereka memang demikian diproses oleh orang yang bekerja dari kantor di tempat-tempat seperti Pakistan, Mauritius, dan Afrika Selatan . Salah satu orang dalam perusahaan mengklaim bahwa hanya 2 persen pesan suara yang diproses oleh mesin, dan sisanya ditangani oleh sekitar 10.000 pekerja yang dieksploitasi.
Ketika staf di kantor SpinVox Pakistan tidak dibayar, mereka mulai mengirim pesan langsung ke pelanggan untuk memprotes. Akhirnya, kebenaran terungkap, dan SpinVox kehilangan sebagian besar nilainya. Akhirnya, sisa-sisa perusahaan dijual Nuansa , salah satu penyedia pengenalan suara terbesar di dunia.
Baru-baru ini, jurnalis keamanan siber, Brian Krebs, menemukan pelanggaran besar yang terjadi di MEDantex , penyedia layanan transkripsi suara yang berbasis di Kansas untuk para profesional medis. Bisa ditebak, data (beberapa di antaranya tertanggal 2007) yang berisi rekam medis sensitif bocor. Konten dapat diunduh dari portal yang tidak aman sebagai file Microsoft Word.
Bahkan layanan transkripsi digital pun tidak aman. Lagi pula, ketika Anda menggunakan layanan yang sepenuhnya digerakkan oleh komputer, perusahaan mungkin menggunakan kontraktor manusia untuk melakukan kontrol kualitas.
Pada 2019, situs berita Belgia, VRT NWS , menemukan kontraktor Google sedang mendengarkan percakapan antara individu dan asisten pintar Google Home mereka. Salah satu kontraktor bahkan memberi VRT NWS akses ke percakapan, banyak di antaranya bersifat sangat sensitif (dan, dalam beberapa kasus, intim secara seksual).
Amazon, Apple, dan Microsoft juga menggunakan kontraktor dengan cara ini. Dengan kata lain, seseorang mungkin mendengarkan rekaman suara dari asisten virtual Anda .
TERKAIT: Bagaimana Menghentikan Perusahaan Mendengarkan Rekaman Asisten Suara Anda
Apakah Layanan Transkripsi Online Aman?
Masalah yang paling penting adalah apakah layanan transkripsi online aman. Sayangnya, jawabannya agak rumit.
Ruang transkripsi suara, pada saat ini, sebagian besar sudah matang. Aktor jahat paling mengerikan telah disingkirkan.
Namun demikian, ketika Anda mempercayakan data Anda (dalam hal ini, percakapan pribadi) kepada pihak ketiga, Anda mengandalkannya untuk melindunginya. Hal ini berlaku untuk layanan online seperti halnya untuk transkrip manusia.
Pada akhirnya, Anda harus bertanya pada diri sendiri dua hal: Apakah Anda mempercayai layanan tersebut, dan seberapa sensitif percakapan Anda?
Saat Anda mencari layanan transkripsi, selalu ada gunanya melakukan penelitian. Apakah perusahaan memiliki reputasi yang baik? Apakah sudah mapan? Apakah pernah terjadi pelanggaran data di masa lalu? Apakah ada kebijakan privasi yang secara eksplisit menjelaskan bagaimana data Anda akan ditangani dan diamankan?
Seperti yang kami sebutkan sebelumnya, layanan yang digerakkan oleh AI sering kali mengandalkan karyawan dan kontraktor pihak ketiga untuk melakukan pemeriksaan kontrol kualitas. Meskipun pemeriksaan ini mewakili sebagian kecil dari semua transkripsi, selalu ada kemungkinan seseorang akan mendengarkan percakapan Anda.
Namun, dalam banyak kasus, ini bukan pemecah kesepakatan. Namun, jika percakapan Anda sangat pribadi atau sensitif secara komersial, Anda mungkin ingin mempertimbangkan untuk membuka editor teks dan menyalinnya dengan cara lama.