Data Preparation Untuk Automatic Summarization Video To Text
Abstract
Berbagai video yang diunggah setiap hari di seluruh dunia pada halaman Youtube dengan durasi yang sangat panjang, di saat pandemi covid 19 sebagian besar video yang di unggah adalah video tentang pembelajaran. Pencarian video yang berbasis informasi tertentu sesuai dengan pencarian yang kita inginkan membutuhkan sumber daya waktu khusus. Sebagian besar video berisi begitu banyak konten buffer yang mungkin tidak sesuai dengan pencarian yang kita inginkan. Untuk mendapatkan informasi kita harus menonton seluruh video yang mungkin menghabiskan banyak waktu. Setelah itu kita seleksi dan pilih video yang benar benar sesuai dengan informasi yang kita maksud . Youtube memiliki fasilitas API subtitle sesuai dengan bahasa yang kita pilih. Dari menu subtitle inilah penelitian ini akan mencoba melakukan crawling database text video kemudian mengolahnya. Pengolahan yang dilakukan berupa tahap preprocessing data kemudian melakukan proses summary atau resume singkat dari kalimat yang penting. Ringkasan ini akan lebih cepat memberikan informasi yang berguna dan penting dari video tersebut, yang pasti akan menghemat waktu untuk menonton seluruh video. Hasil dari preprocesing data Kata sarah menduduki tempat tertinggi dari sisi TF-IDF yaitu 0,254. Kata Otak Rake tertinggi dengan nilai 1700 dan untuk embeding dengan dimensi sejumlah kata tertinggi nilainya diduduki kata mitos dengan ilai 0.602.
Kata Kunci: Automatic summarization, extractive summary, video to text
Full Text:
PDFReferences
Agham, V., & Shandilya, V. K. (2021). A Survey Paper on Extractive and Abstractive Techniques in Automatic Text Summarization. International Journal of Research Publication and Reviews, 2(4), 619–625. www.ijrpr.com
Alami, N., Meknassi, M., & Rais, N. (2015). Automatic Texts Summarization: Current State of the Art. Journal of Asian Scientific Research, 5(1), 1–15. https://doi.org/10.18488/journal.2/2015.5.1/2.1.1.15
Aristoteles. (2013). Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia. Semirata FMIPA Universitas Lampung, 29–33. http://jurnal.fmipa.unila.ac.id/index.php/semirata/article/download/703/523
Aulia, T. M. P., Jamaludin, A., & ... (2021). Extractive Text Summerization Pada Berita Berbahasa Indonesia Menggunakan Algoritma Support Vector Machine. J-SAKTI (Jurnal Sains …, 5(September), 727–735. http://ejurnal.tunasbangsa.ac.id/index.php/jsakti/article/view/371
Burhan Ul Haq, H., Asif, M., & Bin Ahmad, M. (2021). Video Summarization Techniques: A Review Article in. International Journal of Scientific & Technology Research, 9(11), 146–153. www.ijstr.org
Hai-Jew, S. (2019). Applying Qualitative Matrix Coding Queries and Qualitative Crosstab Matrices for Explorations of Online Survey Data. 181–204. https://doi.org/10.4018/978-1-5225-8563-3.ch008
Mardi, Y. (2017). Data Mining : Klasifikasi Menggunakan Algoritma C4.5. Edik Informatika, 2(2), 213–219. https://doi.org/10.22202/ei.2016.v2i2.1465
Romadhony, A., Z.R, F., Yusliani, N., & Abednego, L. (2017). Text Summarization untuk Dokumen Berita Berbahasa Indonesia. Konferensi Nasional ICT-M Politeknik Telkom, 408–414. //journals.telkomuniversity.ac.id/knip/article/view/586
Sah, S., Kulhare, S., Gray, A., Venugopalan, S., Prud’hommeaux, E., & Ptucha, R. (2017). Semantic text summarization of long videos. Proceedings - 2017 IEEE Winter Conference on Applications of Computer Vision, WACV 2017, March, 989–997. https://doi.org/10.1109/WACV.2017.115
Setiawan, A., Kurniawan, E., & Handiwidjojo, W. (2013). Implementasi Stop Word Removal Untuk Pembangunan Aplikasi Alkitab Berbasis Windows 8. Jurnal EKSIS, 6(2), 1–11.
Suputra, I. P. G. H. (2018). Peringkasan Teks Otomatis Untuk Dokumen Bahasa Bali Berbasis Metode Ektraktif. Jurnal Ilmu Komputer, 10(1), 33–38.
Wijayanto, I. R., Cholissodin, I., & Sari, Y. A. (2021). Pengaruh Metode Word Embedding dalam Vector Space Model pada Pemerolehan Informasi Materi IPA Siswa SMP. 5(3), 950–959.
Yuliska, Y., & Syaliman, K. U. (2020). Literatur Review Terhadap Metode, Aplikasi dan Dataset Peringkasan Dokumen Teks Otomatis untuk Teks Berbahasa Indonesia. IT Journal Research and Development, 5(1), 19–31. https://doi.org/10.25299/itjrd.2020.vol5(1).4688
DOI: http://dx.doi.org/10.51530/jutekin.v10i2.664
Refbacks
- There are currently no refbacks.
Copyright (c) 2022 Putry Wahyu Setyaningsih, Arita Witanti, Indah Susilawati
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.