Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

IDENTIFIKASI DAN NORMALISASI TEKS SLANG DENGAN FASTTEXT PADA TWITTER DALAM BAHASA INDONESIA

View through CrossRef
Salah satu dampak yang signifikan dari popularitas media sosial adalah munculnya istilah slang yang semakin banyak. Istilah slang adalah bahasa yang digunakan oleh kelompok-kelompok tertentu untuk berkomunikasi secara informal. Slang juga dapat muncul melalui singkatan, penggunaan kata-kata yang berbeda dari arti aslinya, atau penggabungan kata-kata yang tidak konvensional. Dalam pengolahan bahasa alami (Natural Language Processing) Slang sering kali memiliki makna yang tidak jelas atau ambigu, dan kata-kata slang dapat memiliki konotasi yang berbeda tergantung pada konteks dan subkultur tertentu. Ini dapat menyebabkan kesalahan dalam pemrosesan bahasa alami dan menghasilkan hasil yang tidak akurat atau salah dalam tugas seperti klasifikasi teks atau analisis sentimen. Dari permasalahan tersebut dalam penelitian ini dikembangkan suatu metode untuk mengidentifikasi dan melakukan normalisasi slang pada kalimat yang akan diproses oleh NLP. Proses normalisasi slang ke bahasa yang lebih standar dilakukan dengan memanfaatkan pretrain model dari fasttext untuk mencari kata – kata yang memiliki kedekatan dengan slang. Data yang digunakan pada penelitian ini didapatkan dari sosial media twitter. Sebelum dinormalisasi data melewati beberapa proses seperti preprocessing data yang meliputi proses cleaning, case folding, dan stopword removal kemudian dilanjutkan dengan proses identifikasi slang pada kalimat dan terakhir dilakukan proses normalisasi slang yang didapatkan. Penelitian ini menemukan bahwa metode fasttext masih belum cukup baik melakukan normalisasi slang dikarenakan masih ada sekitar 1329 data dari 3239 data yang tidak berhasil dinormalisasi dengan baik yaitu sekitar 41%. Penelitian ini memberikan kontribusi dalam membantu proses pengolahan kata yang lebih baik untuk NLP.   Kata kunci: slang, normalisasi, fasttext, NLP
Title: IDENTIFIKASI DAN NORMALISASI TEKS SLANG DENGAN FASTTEXT PADA TWITTER DALAM BAHASA INDONESIA
Description:
Salah satu dampak yang signifikan dari popularitas media sosial adalah munculnya istilah slang yang semakin banyak.
Istilah slang adalah bahasa yang digunakan oleh kelompok-kelompok tertentu untuk berkomunikasi secara informal.
Slang juga dapat muncul melalui singkatan, penggunaan kata-kata yang berbeda dari arti aslinya, atau penggabungan kata-kata yang tidak konvensional.
Dalam pengolahan bahasa alami (Natural Language Processing) Slang sering kali memiliki makna yang tidak jelas atau ambigu, dan kata-kata slang dapat memiliki konotasi yang berbeda tergantung pada konteks dan subkultur tertentu.
Ini dapat menyebabkan kesalahan dalam pemrosesan bahasa alami dan menghasilkan hasil yang tidak akurat atau salah dalam tugas seperti klasifikasi teks atau analisis sentimen.
Dari permasalahan tersebut dalam penelitian ini dikembangkan suatu metode untuk mengidentifikasi dan melakukan normalisasi slang pada kalimat yang akan diproses oleh NLP.
Proses normalisasi slang ke bahasa yang lebih standar dilakukan dengan memanfaatkan pretrain model dari fasttext untuk mencari kata – kata yang memiliki kedekatan dengan slang.
Data yang digunakan pada penelitian ini didapatkan dari sosial media twitter.
Sebelum dinormalisasi data melewati beberapa proses seperti preprocessing data yang meliputi proses cleaning, case folding, dan stopword removal kemudian dilanjutkan dengan proses identifikasi slang pada kalimat dan terakhir dilakukan proses normalisasi slang yang didapatkan.
Penelitian ini menemukan bahwa metode fasttext masih belum cukup baik melakukan normalisasi slang dikarenakan masih ada sekitar 1329 data dari 3239 data yang tidak berhasil dinormalisasi dengan baik yaitu sekitar 41%.
Penelitian ini memberikan kontribusi dalam membantu proses pengolahan kata yang lebih baik untuk NLP.
  Kata kunci: slang, normalisasi, fasttext, NLP.

Related Results

FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature  Review Anna Tri Wahyuni1), Masfuri2),  Liya Arista3)1,2,3 Fakultas Ilmu Keperawatan Univers...
KECEMASAN SAAT PANDEMI COVID 19: LITERATUR REVIEW Hardiyati, Efri Widianti, Taty Hernawaty Departemen Keperawatan Jiwa Poltekkes Kemenkes Mamuju Sulbar, Universitas Pad...
Faith Tweets: Ambient Religious Communication and Microblogging Rituals
Faith Tweets: Ambient Religious Communication and Microblogging Rituals
There’s no reason to think that Jesus wouldn’t have Facebooked or twittered if he came into the world now. Can you imagine his killer status updates? Reverend Schenck, New York, Al...
AN ANALYSIS OF SLANG LANGUAGE USED IN THE TEENAGER INTERACTION
AN ANALYSIS OF SLANG LANGUAGE USED IN THE TEENAGER INTERACTION
Language variation, slang, is one of the recently language uses in mostly teenager interaction. They use this language variation in having various types and reasons. This paper is ...
SLANG LANGUANGE AND THE DAILY LIFE OF TWITTER USERS
SLANG LANGUANGE AND THE DAILY LIFE OF TWITTER USERS
Slang language is a style of language that consists of phrases and terms that are considered to be very casual, it is more popular in written speech and is usually limited to a cer...
RAGAM BAHASA SLANG PADA KOMUNITAS PEKERJA SALON (KAJIAN SOSIOLINGUISTIK)
RAGAM BAHASA SLANG PADA KOMUNITAS PEKERJA SALON (KAJIAN SOSIOLINGUISTIK)
The aim of this research is to describe the forms of use of various slang languages in the salon worker community and to describe the function of the use of various slang languages...
A Twitter Sentimen Analysis on Islamic Banking Using Drone Emprit Academic (DEA): Evidence from Indonesia
A Twitter Sentimen Analysis on Islamic Banking Using Drone Emprit Academic (DEA): Evidence from Indonesia
ABSTRACT The research aimed to identify and collect issues discussed regarding Islamic banking from user activity, sentimen, and content on Twitter. This study used a qualitative a...
DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR
DAMPAK TEKNOLOGI TERHADAP PROSES BELAJAR MENGAJAR
DAFTAR PUSTAKAAditama, M. H. R., & Selfiardy, S. (2022). Kehidupan Mahasiswa Kuliah Sambil Bekerja di Masa Pandemi Covid-19. Kidspedia: Jurnal Pendidikan Anak Usia Dini, 3(...

Back to Top