Di dalam ilmu bahasa, disambiguasi adalah proses menentukan rasa mana dari a kata sedang digunakan secara khusus konteks. Juga dikenal sebagai disambiguasi leksikal.
Dalam linguistik komputasi, proses diskriminatif ini disebut disambiguasi kata-sense (WSD).
Contoh dan Pengamatan
"Kebetulan kita komunikasi, cuek bahasa sama, memungkinkan bentuk kata yang sama digunakan untuk mengartikan hal yang berbeda dalam transaksi komunikatif individu. Konsekuensinya adalah bahwa seseorang harus mencari tahu, dalam transaksi tertentu, arti yang dimaksudkan dari kata tertentu di antara indra yang berpotensi terkait. Selagi ambiguitas yang timbul dari asosiasi makna-bentuk ganda seperti itu berada di leksikal tingkat, mereka sering harus diselesaikan melalui konteks yang lebih besar dari ceramah penyematan kata. Oleh karena itu, pengertian yang berbeda dari kata 'layanan' hanya dapat dibedakan jika seseorang dapat melihat melampaui kata itu sendiri, seperti membandingkan 'pelayanan'. layanan pemain di Wimbledon' dengan 'layanan pelayan di Sheraton.' Proses mengidentifikasi makna kata dalam sebuah wacana umumnya dikenal sebagai
arti kata disambiguasi (WSD)." (Oi Yee Kwong, Perspektif Baru tentang Strategi Komputasi dan Kognitif untuk Disambiguasi Word Sense. Pegas, 2013)Disambiguasi Leksikal dan Disambiguasi Kata-Sense (WSD)
leksikal disambiguasi dalam definisinya yang paling luas tidak lain adalah menentukan makna setiap kata dalam konteks, yang tampaknya merupakan proses yang sebagian besar tidak disadari dalam diri manusia. Sebagai masalah komputasi, sering digambarkan sebagai 'AI-lengkap,' yaitu masalah yang solusinya mengandaikan solusi untuk menyelesaikan bahasa alami pemahaman atau penalaran yang masuk akal (Ide dan Veronis 1998).
Dalam bidang linguistik komputasi, masalah ini secara umum disebut disambiguasi arti kata (WSD) dan didefinisikan sebagai masalah komputasi menentukan 'rasa' kata yang diaktifkan oleh penggunaan kata tertentu konteks. WSD pada dasarnya adalah tugas klasifikasi: indera kata adalah kelas, konteksnya menyediakan bukti, dan setiap kemunculan kata ditugaskan ke satu atau lebih kelas yang mungkin berdasarkan pada bukti. Ini adalah karakterisasi tradisional dan umum dari WSD yang melihatnya sebagai proses eksplisit disambiguasi sehubungan dengan inventaris indra kata yang tetap. Kata-kata diasumsikan memiliki seperangkat indera yang terbatas dan diskrit dari a kamus, basis pengetahuan leksikal, atau ontologi (yang terakhir, indra sesuai dengan konsep yang dileksikalkan oleh sebuah kata). Inventaris khusus aplikasi juga dapat digunakan. Misalnya, dalam pengaturan terjemahan mesin (MT), seseorang dapat memperlakukan terjemahan kata sebagai indra kata, dan pendekatan yang menjadi semakin layak karena ketersediaan multi-bahasa yang besar paralel badan yang dapat dijadikan sebagai data pelatihan. Inventarisasi tetap WSD tradisional mengurangi kompleksitas masalah, tetapi ada bidang alternatif.. .." (Eneko Agirre dan Philip Edmonds, "Pengantar." Disambiguasi Word Sense: Algoritma dan Aplikasi. Springer, 2007)
Homonim dan Disambiguasi
leksikal disambiguasi sangat cocok terutama untuk kasus kehomoniman, misalnya, terjadinya bas harus dipetakan ke salah satu item leksikal bass1 atau bass2, tergantung pada maksud yang dimaksudkan.
"Disambiguasi leksikal menyiratkan pilihan kognitif dan merupakan tugas yang menghambat proses pemahaman. Ini harus dibedakan dari proses yang mengarah pada diferensiasi indera kata. Tugas pertama diselesaikan dengan cukup andal juga tanpa banyak informasi kontekstual sedangkan yang terakhir tidak (lih. Veronis 1998, 2001). Juga telah ditunjukkan bahwa kata-kata homonim, yang membutuhkan disambiguasi, memperlambat akses leksikal, sedangkan kata polisemi, yang mengaktifkan multiplisitas indera kata, mempercepat akses leksikal (Rodd e.a. 2002).
"Namun, baik modifikasi produktif nilai semantik dan pilihan langsung antara item yang berbeda secara leksikal memiliki secara umum bahwa mereka memerlukan informasi non-leksikal tambahan." (Peter Bosch, "Produktivitas, Polisemi, dan Indeksitas Predikat." Logika, Bahasa, dan Komputasi: Simposium Tbilisi Internasional ke-6 tentang Logika, Bahasa, dan Komputasi, ed. oleh Balder D. sepuluh Cate dan Henk W. Zeevat. Springer, 2007)
Disambiguasi Kategori Leksikal dan Prinsip Kemungkinan
"Corley dan Crocker (2000) menyajikan model cakupan luas dari kategori leksikaldisambiguasi berdasarkan Prinsip Kemungkinan. Secara khusus, mereka menyarankan bahwa untuk kalimat yang terdiri dari kata-kata w0... wn, pengolah kalimat mengadopsi yang paling mungkin bagian dari pidato urutan T0... Tn. Lebih khusus, model mereka mengeksploitasi dua probabilitas sederhana: (Saya) peluang bersyarat kata wSaya diberikan bagian tertentu dari pidato TSaya, dan (ii) kemungkinan TSaya mengingat bagian pidato sebelumnya Ti-1. Saat setiap kata dari kalimat ditemukan, sistem menetapkan bagian-of-speech itu TSaya, yang memaksimalkan produk dari dua probabilitas ini. Model ini memanfaatkan wawasan bahwa banyak sintaksis ambiguitas memiliki dasar leksikal (MacDonald et al., 1994), seperti pada (3):
(3) Harga/produk gudang lebih murah dari yang lain.
"Kalimat-kalimat ini untuk sementara ambigu antara bacaan di mana harga atau membuat adalah kata kerja utama atau bagian dari kata benda majemuk. Setelah dilatih pada korpus besar, model memprediksi bagian pidato yang paling mungkin untuk harga, dengan benar memperhitungkan fakta bahwa orang-orang mengerti harga sebagai kata benda tapi membuat sebagai kata kerja (lihat Crocker & Corley, 2002, dan referensi yang dikutip di dalamnya). Model tidak hanya menjelaskan berbagai preferensi disambiguasi yang berakar pada kategori leksikal ambiguitas, itu juga menjelaskan mengapa, secara umum, orang sangat akurat dalam menyelesaikan ambiguitas seperti itu." (Matius W. Crocker, "Model Pemahaman Rasional: Mengatasi Paradoks Kinerja." Psikolinguistik Abad Dua Puluh Satu: Empat Landasan, ed. oleh Anne Cutler. Lawrence Erlbaum, 2005)