Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Evaluasi Pengukuran Semantik Sinonim KBBI Menggunakan Pendekatan Word Embedding

View through CrossRef
Kamus Besar Bahasa Indonesia (KBBI) ialah salah satu sumber utama penyedia data dalam penelitian penentuan kemiripan makna kata dalam bahasa Indonesia. Penelitian ini membahas cara metode word embedding dan teknik pembobotan term frequency-inverse document frequency (TF-IDF) mengukur tingkat kemiripan pasangan makna kata sinonim untuk mengukur kemiripan pasangan makna kata sinonim dalam KBBI menggunakan cosine similarity dengan memanfaatkan teknik pembobotan TF-IDF dan beberapa model word embedding serta menerapkan latent semantic analysis (LSA). Metodologi penelitian ini dimulai dengan pengumpulan data, kemudian prapemrosesan teks yang terdiri atas case folding, stopword removal, stemming, dan tokenization. Selanjutnya, data yang telah diproses direpresentasikan ke dalam bentuk vektor menggunakan model word embedding, seperti Word2Vec, fastText, GloVe, sentence - bidirectional encoder representations from transformers (Sentence-BERT, S-BERT), dan teknik pembobotan TF-IDF. Lalu, LSA diterapkan untuk mereduksi dimensi vektor sebelum dilakukan uji kesamaan dengan cosine similarity dan diakhiri dengan evaluasi hasil. Hasil penelitian menunjukkan bahwa penggunaan fastText berhasil meningkatkan nilai kesamaan antara makna dua kata sinonim dengan nilai rata-rata yang diperoleh pada uji kesamaan dari 30 pasang makna kata sinonim adalah 0,901, dengan hasil evaluasi menunjukkan akurasi 0,88, recall 1,00, presisi 0,81, dan F1-score 0,90. Temuan ini menyimpulkan bahwa penggunaan fastText lebih efektif dalam meningkatkan akurasi pengukuran kemiripan makna kata sinonim. Rekomendasi untuk penelitian selanjutnya melibatkan perluasan korpus data dan eksplorasi lebih lanjut terhadap word embedding dalam uji kesamaan makna kata. Penelitian ini memberikan kontribusi pada pengembangan pemrosesan bahasa alami dan berpotensi menjadi dasar untuk aplikasi berbasis pemrosesan bahasa yang lebih akurat dalam mengukur kemiripan makna kata dalam KBBI.
Title: Evaluasi Pengukuran Semantik Sinonim KBBI Menggunakan Pendekatan Word Embedding
Description:
Kamus Besar Bahasa Indonesia (KBBI) ialah salah satu sumber utama penyedia data dalam penelitian penentuan kemiripan makna kata dalam bahasa Indonesia.
Penelitian ini membahas cara metode word embedding dan teknik pembobotan term frequency-inverse document frequency (TF-IDF) mengukur tingkat kemiripan pasangan makna kata sinonim untuk mengukur kemiripan pasangan makna kata sinonim dalam KBBI menggunakan cosine similarity dengan memanfaatkan teknik pembobotan TF-IDF dan beberapa model word embedding serta menerapkan latent semantic analysis (LSA).
Metodologi penelitian ini dimulai dengan pengumpulan data, kemudian prapemrosesan teks yang terdiri atas case folding, stopword removal, stemming, dan tokenization.
Selanjutnya, data yang telah diproses direpresentasikan ke dalam bentuk vektor menggunakan model word embedding, seperti Word2Vec, fastText, GloVe, sentence - bidirectional encoder representations from transformers (Sentence-BERT, S-BERT), dan teknik pembobotan TF-IDF.
Lalu, LSA diterapkan untuk mereduksi dimensi vektor sebelum dilakukan uji kesamaan dengan cosine similarity dan diakhiri dengan evaluasi hasil.
Hasil penelitian menunjukkan bahwa penggunaan fastText berhasil meningkatkan nilai kesamaan antara makna dua kata sinonim dengan nilai rata-rata yang diperoleh pada uji kesamaan dari 30 pasang makna kata sinonim adalah 0,901, dengan hasil evaluasi menunjukkan akurasi 0,88, recall 1,00, presisi 0,81, dan F1-score 0,90.
Temuan ini menyimpulkan bahwa penggunaan fastText lebih efektif dalam meningkatkan akurasi pengukuran kemiripan makna kata sinonim.
Rekomendasi untuk penelitian selanjutnya melibatkan perluasan korpus data dan eksplorasi lebih lanjut terhadap word embedding dalam uji kesamaan makna kata.
Penelitian ini memberikan kontribusi pada pengembangan pemrosesan bahasa alami dan berpotensi menjadi dasar untuk aplikasi berbasis pemrosesan bahasa yang lebih akurat dalam mengukur kemiripan makna kata dalam KBBI.

Related Results

PENGEMBANGAN EVALUASI PEMBELAJARAN
PENGEMBANGAN EVALUASI PEMBELAJARAN
Dalam sebuah proses pembelajaran komponen yang turut menentukan keberhasilan sebuah proses adalah evaluasi. Melalui evaluasi orang akan mengetahui sampai sejauh mana penyampaian pe...
BEBERAPA TEORI DAN PENDEKATAN SEMANTIK
BEBERAPA TEORI DAN PENDEKATAN SEMANTIK
Tujuan penulisan makalah ini untuk mendeskripsikan pengertian semantik, beberapa teori dan pendekatan. Data dikumpulkan dari pendapat beberapa ahli linguistik. Metode pengumpulan d...
MENINGKATKAN HASIL BELAJAR MELALUI MODEL PEMBELAJARAN AKTIF TIPE QUIZ TEAM
MENINGKATKAN HASIL BELAJAR MELALUI MODEL PEMBELAJARAN AKTIF TIPE QUIZ TEAM
Rendahnya hasil belajar disebabkan oleh berbagai faktor, model pembelajaran. Salah satu model pembelajaran yang dapat digunakan pada mata pelajaran ekonomi yaitu model pembelajaran...

Back to Top