Javascript must be enabled to continue!

Evaluasi Pengukuran Semantik Sinonim KBBI Menggunakan Pendekatan Word Embedding

Kamus Besar Bahasa Indonesia (KBBI) ialah salah satu sumber utama penyedia data dalam penelitian penentuan kemiripan makna kata dalam bahasa Indonesia. Penelitian ini membahas cara metode word embedding dan teknik pembobotan term frequency-inverse document frequency (TF-IDF) mengukur tingkat kemiripan pasangan makna kata sinonim untuk mengukur kemiripan pasangan makna kata sinonim dalam KBBI menggunakan cosine similarity dengan memanfaatkan teknik pembobotan TF-IDF dan beberapa model word embedding serta menerapkan latent semantic analysis (LSA). Metodologi penelitian ini dimulai dengan pengumpulan data, kemudian prapemrosesan teks yang terdiri atas case folding, stopword removal, stemming, dan tokenization. Selanjutnya, data yang telah diproses direpresentasikan ke dalam bentuk vektor menggunakan model word embedding, seperti Word2Vec, fastText, GloVe, sentence - bidirectional encoder representations from transformers (Sentence-BERT, S-BERT), dan teknik pembobotan TF-IDF. Lalu, LSA diterapkan untuk mereduksi dimensi vektor sebelum dilakukan uji kesamaan dengan cosine similarity dan diakhiri dengan evaluasi hasil. Hasil penelitian menunjukkan bahwa penggunaan fastText berhasil meningkatkan nilai kesamaan antara makna dua kata sinonim dengan nilai rata-rata yang diperoleh pada uji kesamaan dari 30 pasang makna kata sinonim adalah 0,901, dengan hasil evaluasi menunjukkan akurasi 0,88, recall 1,00, presisi 0,81, dan F1-score 0,90. Temuan ini menyimpulkan bahwa penggunaan fastText lebih efektif dalam meningkatkan akurasi pengukuran kemiripan makna kata sinonim. Rekomendasi untuk penelitian selanjutnya melibatkan perluasan korpus data dan eksplorasi lebih lanjut terhadap word embedding dalam uji kesamaan makna kata. Penelitian ini memberikan kontribusi pada pengembangan pemrosesan bahasa alami dan berpotensi menjadi dasar untuk aplikasi berbasis pemrosesan bahasa yang lebih akurat dalam mengukur kemiripan makna kata dalam KBBI.

Universitas Gadjah Mada

Muhammad Rafli Aditya H. Muhammad Ilham Dewi Fatmarani Surianto Abdul Muis Mappalotteng

Jurnal Nasional Teknik Elektro dan Teknologi Informasi

2025

Title: Evaluasi Pengukuran Semantik Sinonim KBBI Menggunakan Pendekatan Word Embedding

Description:

Kamus Besar Bahasa Indonesia (KBBI) ialah salah satu sumber utama penyedia data dalam penelitian penentuan kemiripan makna kata dalam bahasa Indonesia.

Penelitian ini membahas cara metode word embedding dan teknik pembobotan term frequency-inverse document frequency (TF-IDF) mengukur tingkat kemiripan pasangan makna kata sinonim untuk mengukur kemiripan pasangan makna kata sinonim dalam KBBI menggunakan cosine similarity dengan memanfaatkan teknik pembobotan TF-IDF dan beberapa model word embedding serta menerapkan latent semantic analysis (LSA).

Metodologi penelitian ini dimulai dengan pengumpulan data, kemudian prapemrosesan teks yang terdiri atas case folding, stopword removal, stemming, dan tokenization.

Selanjutnya, data yang telah diproses direpresentasikan ke dalam bentuk vektor menggunakan model word embedding, seperti Word2Vec, fastText, GloVe, sentence - bidirectional encoder representations from transformers (Sentence-BERT, S-BERT), dan teknik pembobotan TF-IDF.

Lalu, LSA diterapkan untuk mereduksi dimensi vektor sebelum dilakukan uji kesamaan dengan cosine similarity dan diakhiri dengan evaluasi hasil.

Hasil penelitian menunjukkan bahwa penggunaan fastText berhasil meningkatkan nilai kesamaan antara makna dua kata sinonim dengan nilai rata-rata yang diperoleh pada uji kesamaan dari 30 pasang makna kata sinonim adalah 0,901, dengan hasil evaluasi menunjukkan akurasi 0,88, recall 1,00, presisi 0,81, dan F1-score 0,90.

Temuan ini menyimpulkan bahwa penggunaan fastText lebih efektif dalam meningkatkan akurasi pengukuran kemiripan makna kata sinonim.

Rekomendasi untuk penelitian selanjutnya melibatkan perluasan korpus data dan eksplorasi lebih lanjut terhadap word embedding dalam uji kesamaan makna kata.

Penelitian ini memberikan kontribusi pada pengembangan pemrosesan bahasa alami dan berpotensi menjadi dasar untuk aplikasi berbasis pemrosesan bahasa yang lebih akurat dalam mengukur kemiripan makna kata dalam KBBI.

Back

Related Results

PENGEMBANGAN EVALUASI PEMBELAJARAN

Dalam sebuah proses pembelajaran komponen yang turut menentukan keberhasilan sebuah proses adalah evaluasi. Melalui evaluasi orang akan mengetahui sampai sejauh mana penyampaian pe...

BEBERAPA TEORI DAN PENDEKATAN SEMANTIK

Tujuan penulisan makalah ini untuk mendeskripsikan pengertian semantik, beberapa teori dan pendekatan. Data dikumpulkan dari pendapat beberapa ahli linguistik. Metode pengumpulan d...

A Technique for Constructing <span class="changedDisabl

To solve the problem of constructing the frequency responses (FR) of filters on switched capacitors, which belong to the class of electronic circuits with a periodically changing s...

MENINGKATKAN HASIL BELAJAR MELALUI MODEL PEMBELAJARAN AKTIF TIPE QUIZ TEAM

Rendahnya hasil belajar disebabkan oleh berbagai faktor, model pembelajaran. Salah satu model pembelajaran yang dapat digunakan pada mata pelajaran ekonomi yaitu model pembelajaran...

Validitas dan Reliabilitas Pengukuran Posisi Horizontal Menton dalam Penilaian Kesimetrisan Mandibulofasial (Kajian Sefalometri Postero-Anterior)

Latar belakang : Pengukuran sefalometri melibatkan penentuan titik-titik anatomis secara objektif namun juga dapat melibatkan subjektifitas pengukur dengan faktor-faktor yang dapat...

Successful Replacement Therapy After <span c

Background. Vitamin D has recognized immunomodulatory, anti-proliferative, and differentiation-regulating effects primarily mediated through its genomic effects via the vitamin D r...

Exploratory AI-Assisted ML Screening <s

This technical note reports an exploratory, AI-assisted in silico proof of concept implementing a “signaling first, killing later” discovery paradigm: prioritizing compounds with h...

IMGT® Nomenclature of Immunoglobulins (IG) <spa

The immunoglobulins (IG) or antibodies and the T cell receptors (TR) are the antigen receptors of the adaptive immune responses (AIR) of the jawed vertebrates (Gnathostomata). IMGT...

Email:
Password:

Email: