Treffer: A GRAPH CONVOLUTIONAL NETWORK AND RECURRENT NEURAL NETWORK ENSEMBLE FOR EXTRACTIVE TEXT SUMMARISATION IN THE HAUSA LANGUAGE.
Weitere Informationen
Automatic Text Summarisation (ATS) is crucial for managing information overload, especially in low-resource languages like Hausa. This study proposes a hybrid extractive approach that combines Graph Convolutional Networks (GCN) and Recurrent Neural Networks (RNN) to improve sentence ranking accuracy. By integrating GCN's structural learning with RNN's sequential modeling, the method overcomes limitations of existing graph-based techniques. The research was conducted in Visual Studio IDE using Python 3.12.4, with key libraries like NLTK, Pandas, and NetworkX. A pre-processed Hausa news dataset was tokenised, normalised, and vectorised using TF-IDF and a pre-trained Hausa FastText model to build a sentence similarity graph. GCNs propagated sentence embeddings, while RNNs refined rankings by capturing sequential dependencies. Experiments on 113 Hausa news articles showed the GCN-RNN model outperformed Modified PageRank, achieving higher ROUGE-1 precision (90.00) and balanced F1-scores. The Wilcoxon Signed-Rank Test confirmed significant improvements. Despite added computational overhead, the approach remains feasible for moderate datasets, with scalability as a key future focus. This study offers a robust and contextually coherent approach to Hausa text summarisation, advancing extractive summarisation techniques and multilingual ATS research. Future work will focus on optimising model efficiency and scalability while exploring transformer-based architectures for further enhancements. [ABSTRACT FROM AUTHOR]
Sumarizarea automată a textului (ATS) este crucială pentru gestionarea supraîncărcării cu informații, în special în limbile cu resurse reduse, cum ar fi hausa. Acest studiu propune o abordare extractivă hibridă care combină rețelele convoluționale grafice (GCN) și rețelele neuronale recurente (RNN) pentru a îmbunătăți acuratețea clasificării propozițiilor. Prin integrarea învățării structurale a GCN cu modelarea secvențială a RNN, metoda depășește limitele tehnicilor existente bazate pe grafuri. Cercetarea a fost efectuată în Visual Studio IDE folosind Python 3.12.4, cu biblioteci cheie precum NLTK, Pandas și NetworkX. Un set de date de știri hausa preprocesat a fost tokenizat, normalizat și vectorizat folosind TF-IDF ș i u n m odel h ausa F astText p re-antrenat pentru a construi un grafic de similaritate a propozițiilor. GCN-urile au propagat încorporările de propoziții, în timp ce RNNurile au rafinat clasamentele prin captarea dependențelor secvențiale. Experimentele pe 113 articole de știri hausa au arătat că modelul GCN-RNN a depășit performanța Modified PageRank, atingând o precizie ROUGE-1 mai mare (90,00) și scoruri F1 echilibrate. Testul Wilcoxon Signed-Rank a confirmat îmbunătățiri semnificative. În ciuda costurilor de calcul suplimentare, abordarea rămâne fezabilă pentru seturi de date moderate, scalabilitatea fiind un obiectiv cheie în viitor. Acest studiu oferă o a bordare robustă și c oerentă din punct de vedere contextual a rezumării textului în limba hausa, avansând tehnicile de rezumare extractivă și cercetarea ATS multilingvă. Lucrările viitoare se vor concentra pe optimizarea eficienței și scalabilității modelului, explorând în același timp arhitecturi bazate pe transformatoare pentru îmbunătățiri suplimentare. [ABSTRACT FROM AUTHOR]
Copyright of Journal of Engineering Science (JES) is the property of Technical University of Moldova and its content may not be copied or emailed to multiple sites without the copyright holder's express written permission. Additionally, content may not be used with any artificial intelligence tools or machine learning technologies. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)