Oleh Teguh Budiarto, Co-Founder & CEO Prosa.ai
Teknologi pemrosesan bahasa alami atau lebih dikenal dengan istilah NLP (Natural Language Processing) merupakan salah satu cabang dari kecerdasan artifisial (AI) yang memungkinkan mesin untuk memahami bahasa manusia. Bahasa manusia sangat kompleks dan memiliki banyak aspek serta ragamnya. Penerapan teknologi ini pada mesin, memungkinkan pemrosesan jumlah data yang sangat besar dan melakukan strukturasi dari data yang sejatinya tidak terstruktur.
Dengan semakin meningkatnya jumlah data tidak terstruktur dalam bentuk teks, suara dan video setiap harinya, NLP akan menjadi semakin penting untuk memahami data yang beredar di antara kita. Teknologi ini juga terus berevolusi dan menjadi semakin baik dalam memahami nilai rasa, konteks, dan ambiguitas dari bahasa manusia. Peningkatan kemampuan teknologi ini membuat NLP dapat diterapkan ke berbagai aplikasi penting lainnya untuk meningkatkan produktivitas manusia.
Berbagai penerapan teknologi NLP sudah mulai banyak ditemukan di era transformasi digital ini. Kita perlu memahami bagaimana teknologi NLP tersebut diadopsi di berbagai industri dan bagaimana hal tersebut akan memengaruhi masa depan kita. Contoh penerapan NLP pada kakas produktivitas adalah text analytics, robocall,chatbot, voice-bot, virtual assistant, transkripsi rapat, dan sebagainya.
Berikut beberapa inovasi penting di bidang NLP untuk teks maupun suara.
Transfer Learning
Teknik pembelajaran mesin ini memungkinkan sebuah model yang sudah dilatih untuk sebuah tugas, dapat dilatih kembali untuk tugas lainnya yang berhubungan, sehingga menghemat sumber daya, waktu, dan kebutuhan data. Dengan teknik ini kita dapat melakukan penyesuaian parameter dari model pre-trained dengan data tambahan yang tidak banyak. Dengan begitu, bisnis bisa memanfaatkan NLP untuk membuat fungsi baru dengan lebih ekonomis dan dengan data yang lebih sedikit.
Reinforcement Learning
Pada dasarnya, algoritma reinforcement adalah belajar sambil melakukan, melalui proses trial and errormenggunakan umpan balik dari aksi dan pengalaman sebelumnya. Teknik ini dapat digunakan untuk mempercepat tugas seperti tanya jawab, translasi dan membuat ringkasan.
Transformer: BERT & ELMo
Hal unik dari transformer adalah kemampuan untuk memahami konteks kata-kata dengan cara yang sebelumnya tidak dapat dilakukan. Ada dua teknik yang banyak digunakan di bidang NLP, yaitu ELMo (Embeddings from Language Models) dan BERT (Bidirectional Encoder Representations from Transformers). Model tersebut telah dilatih dengan data yang sangat banyak, sehingga dapat meningkatkan performa teknologi NLP secara drastis di berbagai penerapan. Salah satu penemuan besar terbaru di bidang NLP adalah model pembelajaran mesin yang dapat membuat artikel dari nol, misalnya dengan GPT-3 (Generative Pre-trained Transformer 3).
Kombinasi Metode Pembelajaran Mesin Supervised & Unsupervised
Supervised learning memerlukan jumlah pelabelan data yang besar untuk sebuah model agar dapat memiliki tingkat akurasi prediksi yang tinggi. Contoh penggunaannya ada pada klasifikasi topik. Di sisi lain, unsupervised learning tidak memerlukan pelabelan data, tetapi melakukan deteksi dari pola yang terdapat pada data masukan untuk menghasilkan prediksi terhadap data lainnya. Contohnya adalah clustering dimana sejumlah objek yang serupa diberi kelompok yang sama. Mengkombinasikan kedua teknik tersebut dapat meningkatkan performa model pembelajaran mesin, terutama untuk text analytics.
Kakas Low-Code
Sebelumnya, untuk membangun sebuah model NLP, kita memerlukan dasar pendidikan di bidang tersebut, keahlian membuat program untuk menggunakan open-source library dan pengetahuan pembelajaran mesin. Dengan bantuan kakas low-code, melatih model NLP untuk mempunyai kemampuan lebih baik dengan data yang kita punya dapat dilakukan dengan semudah point-and-click. Hal ini memungkinkan adopsi penerapan NLP yang lebih banyak lagi dan memungkinkan demokratisasi AI-NLP.
“Suara adalah masa depan untuk interaksi manusia dan komputer, NLP adalah otak untuk komunikasinya.”
Dengan adanya teknologi pemrosesan suara yang lebih baik, manusia dapat berinteraksi dengan mesin menggunakan cara yang lebih alami dan mudah, seperti ketika berbicara dengan manusia. Pada saat ini, eMarketer memperkirakan 25% penduduk dewasa di U.S memiliki smart speaker, dan diperkirakan 92.3% pengguna smartphone akan menggunakan voice assistants pada tahun 2023. Pada 2019, diperkirakan 59% pencarian online menggunakan suara. Pasar untuk antarmuka suara diperkirakan akan mencapai US$ 24.9 miliar pada tahun 2025.
Data adalah kunci untuk implementasi AI-NLP. Oleh karena itu, kami di Prosa.ai memfokuskan usaha untuk membangun data dan skenario penggunaan NLP spesifik untuk Bahasa Indonesia. Dengan begitu, kami membangun dasar yang solid untuk pembangunan teknologi NLP teks dan suara yang lebih advanced untuk memahami komunitas digital kita lebih baik lagi di masa depan.
*Rubrik ini merupakan rubrik kolaborasi Marketeers x GDP