Data Preparation Untuk Automatic Summarization Video To Text

Putry Wahyu Setyaningsih, Arita Witanti, Indah Susilawati

Abstract


Berbagai video yang diunggah setiap hari di seluruh dunia pada halaman Youtube dengan durasi yang sangat panjang, di saat pandemi covid 19 sebagian besar video yang di unggah adalah video tentang pembelajaran. Pencarian video yang berbasis informasi tertentu sesuai dengan pencarian yang kita inginkan membutuhkan sumber daya waktu khusus. Sebagian besar video berisi begitu banyak konten buffer yang mungkin tidak sesuai dengan pencarian yang kita inginkan. Untuk mendapatkan informasi kita harus menonton seluruh video yang mungkin menghabiskan banyak waktu. Setelah itu kita seleksi dan pilih video yang benar benar sesuai dengan informasi yang kita maksud . Youtube memiliki fasilitas API subtitle sesuai dengan bahasa yang kita pilih. Dari menu subtitle inilah penelitian ini akan mencoba melakukan crawling database text video kemudian mengolahnya. Pengolahan yang dilakukan berupa tahap preprocessing data kemudian melakukan proses summary atau resume singkat dari kalimat yang penting. Ringkasan ini akan lebih cepat memberikan informasi yang berguna dan penting dari video tersebut, yang pasti akan menghemat waktu untuk menonton seluruh video. Hasil dari preprocesing data Kata sarah menduduki tempat tertinggi dari sisi TF-IDF yaitu 0,254. Kata Otak Rake tertinggi dengan nilai 1700 dan untuk embeding dengan dimensi sejumlah kata tertinggi nilainya diduduki kata mitos dengan ilai 0.602.

Kata Kunci: Automatic summarization, extractive summary, video to text


Full Text:

PDF

References


Agham, V., & Shandilya, V. K. (2021). A Survey Paper on Extractive and Abstractive Techniques in Automatic Text Summarization. International Journal of Research Publication and Reviews, 2(4), 619–625. www.ijrpr.com

Alami, N., Meknassi, M., & Rais, N. (2015). Automatic Texts Summarization: Current State of the Art. Journal of Asian Scientific Research, 5(1), 1–15. https://doi.org/10.18488/journal.2/2015.5.1/2.1.1.15

Aristoteles. (2013). Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia. Semirata FMIPA Universitas Lampung, 29–33. http://jurnal.fmipa.unila.ac.id/index.php/semirata/article/download/703/523

Aulia, T. M. P., Jamaludin, A., & ... (2021). Extractive Text Summerization Pada Berita Berbahasa Indonesia Menggunakan Algoritma Support Vector Machine. J-SAKTI (Jurnal Sains …, 5(September), 727–735. http://ejurnal.tunasbangsa.ac.id/index.php/jsakti/article/view/371

Burhan Ul Haq, H., Asif, M., & Bin Ahmad, M. (2021). Video Summarization Techniques: A Review Article in. International Journal of Scientific & Technology Research, 9(11), 146–153. www.ijstr.org

Hai-Jew, S. (2019). Applying Qualitative Matrix Coding Queries and Qualitative Crosstab Matrices for Explorations of Online Survey Data. 181–204. https://doi.org/10.4018/978-1-5225-8563-3.ch008

Mardi, Y. (2017). Data Mining : Klasifikasi Menggunakan Algoritma C4.5. Edik Informatika, 2(2), 213–219. https://doi.org/10.22202/ei.2016.v2i2.1465

Romadhony, A., Z.R, F., Yusliani, N., & Abednego, L. (2017). Text Summarization untuk Dokumen Berita Berbahasa Indonesia. Konferensi Nasional ICT-M Politeknik Telkom, 408–414. //journals.telkomuniversity.ac.id/knip/article/view/586

Sah, S., Kulhare, S., Gray, A., Venugopalan, S., Prud’hommeaux, E., & Ptucha, R. (2017). Semantic text summarization of long videos. Proceedings - 2017 IEEE Winter Conference on Applications of Computer Vision, WACV 2017, March, 989–997. https://doi.org/10.1109/WACV.2017.115

Setiawan, A., Kurniawan, E., & Handiwidjojo, W. (2013). Implementasi Stop Word Removal Untuk Pembangunan Aplikasi Alkitab Berbasis Windows 8. Jurnal EKSIS, 6(2), 1–11.

Suputra, I. P. G. H. (2018). Peringkasan Teks Otomatis Untuk Dokumen Bahasa Bali Berbasis Metode Ektraktif. Jurnal Ilmu Komputer, 10(1), 33–38.

Wijayanto, I. R., Cholissodin, I., & Sari, Y. A. (2021). Pengaruh Metode Word Embedding dalam Vector Space Model pada Pemerolehan Informasi Materi IPA Siswa SMP. 5(3), 950–959.

Yuliska, Y., & Syaliman, K. U. (2020). Literatur Review Terhadap Metode, Aplikasi dan Dataset Peringkasan Dokumen Teks Otomatis untuk Teks Berbahasa Indonesia. IT Journal Research and Development, 5(1), 19–31. https://doi.org/10.25299/itjrd.2020.vol5(1).4688




DOI: http://dx.doi.org/10.51530/jutekin.v10i2.664

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Putry Wahyu Setyaningsih, Arita Witanti, Indah Susilawati

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License

klik-4d.com