Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Automatic Text Summarization Berdasarkan Pendekatan Statistika pada Dokumen Berbahasa Indonesia

View through CrossRef
Abstract—Propelled by the modern technological innovations data and text will be more abundant throughout the year. With this much text, automatic text summarization is needed now more than ever to help summarize a text. Automatic text summarization is defined as the creation of a shortened version of a text by a computer program, the product of this procedure still contains the most important points of the original text. Statistical approaches is one of automatic text summarization method. There is 5 statistical approaches that being used namely aggregation similarity method, frequency method, location method, title method (if text has a title), dan tf-based query method (if text doesn’t have a title). Cosine similarity is used to calculate title method, aggregation similarity method, and tf- based query method. There is two type of validation, user validation and system validation. For system validation compare the similarity between human summary and summary generated by program, which result in accuracy of 76.7647% for summary with 30% length of the original journal. For user validation result in 82% accuracy. The conclusion based on user validation and system validation is statistical approaches is suitable for automatic text summarization.Keywords: automatic text summarization, statistical approaches, Indonesian document, cosine similarity Abstrak— Dengan kemajuan teknologi jumlah data dan teks akan semakin melimpah sepanjang tahun. Dengan banyaknya teks ini dibutuhkan bantuan automatic text summarization untuk merangkum teks tersebut. Automatic text summarization didefinisikan sebagai versi singkat dari suatu teks menggunakan program komputer yang hasilnya masih memiliki informasi penting berupa gagasan dasar dan kata atau kalimat yang dapat merepresentasikan keseluruhan teks original. Salah satu metode dalam automatic text summarization adalah pendekatan statistika. Pendekatan statistika yang digunakan ada 5 yaitu aggregation similarity method, frequency method, location method, title method (bila teks memiliki judul), dan tf-based query method (bila teks tidak memiliki judul). Cosine similarity dipakai untuk perhitungan title method, tf-based query method, dan aggregation similarity method. Validasi dilakukan dengan dua macam validasi. Pertama adalah validasi sistem dengan membandingkan similaritas antara rangkuman program dan rangkuman manusia, yang menghasilkan akurasi 76.7647% untuk rangkuman dengan panjang 30% dari jurnal original. Kedua adalah validasi user yang menghasilkan akurasi 81%. Kesimpulannya berdasarkan validasi user dan validasi sistem yang cukup baik maka pendekatan statistika cocok dipakai dalam kasus automatic text summarization.Kata kunci: automatic text summarization, pendekatan statistika, cosine similarity, dokumen berbahasa Indonesia
Title: Automatic Text Summarization Berdasarkan Pendekatan Statistika pada Dokumen Berbahasa Indonesia
Description:
Abstract—Propelled by the modern technological innovations data and text will be more abundant throughout the year.
With this much text, automatic text summarization is needed now more than ever to help summarize a text.
Automatic text summarization is defined as the creation of a shortened version of a text by a computer program, the product of this procedure still contains the most important points of the original text.
Statistical approaches is one of automatic text summarization method.
There is 5 statistical approaches that being used namely aggregation similarity method, frequency method, location method, title method (if text has a title), dan tf-based query method (if text doesn’t have a title).
Cosine similarity is used to calculate title method, aggregation similarity method, and tf- based query method.
There is two type of validation, user validation and system validation.
For system validation compare the similarity between human summary and summary generated by program, which result in accuracy of 76.
7647% for summary with 30% length of the original journal.
For user validation result in 82% accuracy.
The conclusion based on user validation and system validation is statistical approaches is suitable for automatic text summarization.
Keywords: automatic text summarization, statistical approaches, Indonesian document, cosine similarity Abstrak— Dengan kemajuan teknologi jumlah data dan teks akan semakin melimpah sepanjang tahun.
Dengan banyaknya teks ini dibutuhkan bantuan automatic text summarization untuk merangkum teks tersebut.
Automatic text summarization didefinisikan sebagai versi singkat dari suatu teks menggunakan program komputer yang hasilnya masih memiliki informasi penting berupa gagasan dasar dan kata atau kalimat yang dapat merepresentasikan keseluruhan teks original.
Salah satu metode dalam automatic text summarization adalah pendekatan statistika.
Pendekatan statistika yang digunakan ada 5 yaitu aggregation similarity method, frequency method, location method, title method (bila teks memiliki judul), dan tf-based query method (bila teks tidak memiliki judul).
Cosine similarity dipakai untuk perhitungan title method, tf-based query method, dan aggregation similarity method.
Validasi dilakukan dengan dua macam validasi.
Pertama adalah validasi sistem dengan membandingkan similaritas antara rangkuman program dan rangkuman manusia, yang menghasilkan akurasi 76.
7647% untuk rangkuman dengan panjang 30% dari jurnal original.
Kedua adalah validasi user yang menghasilkan akurasi 81%.
Kesimpulannya berdasarkan validasi user dan validasi sistem yang cukup baik maka pendekatan statistika cocok dipakai dalam kasus automatic text summarization.
Kata kunci: automatic text summarization, pendekatan statistika, cosine similarity, dokumen berbahasa Indonesia.

Related Results

FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature Review
FAKTOR-FAKTOR YANG MEMPENGARUHI MORTALITAS PADA PASIEN DENGAN FRAKTUR COSTA: Literature  Review Anna Tri Wahyuni1), Masfuri2),  Liya Arista3)1,2,3 Fakultas Ilmu Keperawatan Univers...
Sleep Habits and Occurrence of Lowback Pain among Craftsmen
Sleep Habits and Occurrence of Lowback Pain among Craftsmen
<span style="color: #000000; font-family: Verdana, Arial, Helvetica, sans-serif; font-size: 10px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; ...
Sleep Habits and Occurrence of Lowback Pain among Craftsmen
Sleep Habits and Occurrence of Lowback Pain among Craftsmen
<span style="color: #000000; font-family: Verdana, Arial, Helvetica, sans-serif; font-size: 10px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; ...
IMPLEMENTASI QUICK RESPONSE (QR) CODE PADA APLIKASI VALIDASI DOKUMEN MENGGUNAKAN PERANCANGAN UNIFIED MODELLING LANGUAGE (UML)
IMPLEMENTASI QUICK RESPONSE (QR) CODE PADA APLIKASI VALIDASI DOKUMEN MENGGUNAKAN PERANCANGAN UNIFIED MODELLING LANGUAGE (UML)
Dengan berkembangnya teknologi informasi, sering sekali terjadi penyelewengan dokumen terutama pada dokumen-dokumen cetak. Dokumen merupakan salah satu data yang sangat penting, ka...
IMPLEMENTASI QUICK RESPONSE (QR) CODE PADA APLIKASI VALIDASI DOKUMEN MENGGUNAKAN PERANCANGAN UNIFIED MODELLING LANGUAGE (UML)
IMPLEMENTASI QUICK RESPONSE (QR) CODE PADA APLIKASI VALIDASI DOKUMEN MENGGUNAKAN PERANCANGAN UNIFIED MODELLING LANGUAGE (UML)
Dengan berkembangnya teknologi informasi, sering sekali terjadi penyelewengan dokumen terutama pada dokumen-dokumen cetak. Dokumen merupakan salah satu data yang sangat penting, ka...
Advancements in Automatic Text Summarization using Natural Language Processing
Advancements in Automatic Text Summarization using Natural Language Processing
With the rapid expansion of data across various domains, the need for automated text summarization has become increasingly crucial. Given the overwhelming volu...
Bounds on the sum of broadcast domination number and strong metric dimension of graphs
Bounds on the sum of broadcast domination number and strong metric dimension of graphs
Let [Formula: see text] be a connected graph of order at least two with vertex set [Formula: see text]. For [Formula: see text], let [Formula: see text] denote the length of an [Fo...
SISTEM INFORMASI E-DOCUMENT PADA BADAN PENJAMIN MUTU AKADEMIK UNIVERSITAS RESPATI YOGYAKARTA
SISTEM INFORMASI E-DOCUMENT PADA BADAN PENJAMIN MUTU AKADEMIK UNIVERSITAS RESPATI YOGYAKARTA
Badan Penjamin Mutu Akademik Universitas Respati Yogyakarta  merupakan salah satu badan yang bertugas melakukan pengawasan dan pengendalian jaminan mutu dari perguruan tinggi. Kegi...

Back to Top