TTG-Text: A Graph-Based Text Representation Framework Enhanced by Typical Testors for Improved Classification

Carlos Sánchez-Antonio; José E. Valdez-Rodríguez; Hiram Calvo

doi:10.3390/math12223576

Mathematics (Nov 2024)

TTG-Text: A Graph-Based Text Representation Framework Enhanced by Typical Testors for Improved Classification

Carlos Sánchez-Antonio,
José E. Valdez-Rodríguez,
Hiram Calvo

Affiliations

Carlos Sánchez-Antonio: Cognitive Sciences Laboratory, Center for Computing Research, Instituto Politécnico Nacional, Mexico City 07738, Mexico
José E. Valdez-Rodríguez: Cognitive Sciences Laboratory, Center for Computing Research, Instituto Politécnico Nacional, Mexico City 07738, Mexico
Hiram Calvo: Cognitive Sciences Laboratory, Center for Computing Research, Instituto Politécnico Nacional, Mexico City 07738, Mexico

DOI: https://doi.org/10.3390/math12223576
Journal volume & issue: Vol. 12, no. 22
p. 3576

Abstract

Read online

Recent advancements in graph-based text representation, particularly with embedding models and transformers such as BERT, have shown significant potential for enhancing natural language processing (NLP) tasks. However, challenges related to data sparsity and limited interpretability remain, especially when working with small or imbalanced datasets. This paper introduces TTG-Text, a novel framework that strengthens graph-based text representation by integrating typical testors—a symbolic feature selection technique that refines feature importance while reducing dimensionality. Unlike traditional TF-IDF weighting, TTG-Text leverages typical testors to enhance feature relevance within text graphs, resulting in improved model interpretability and performance, particularly for smaller datasets. Our evaluation on a text classification task using a graph convolutional network (GCN) demonstrates that TTG-Text achieves a 95% accuracy rate, surpassing conventional methods and BERT with fewer required training epochs. By combining symbolic algorithms with graph-based models, this hybrid approach offers a more interpretable, efficient, and high-performing solution for complex NLP tasks.

Published in Mathematics

ISSN: 2227-7390 (Online)
Publisher: MDPI AG
Country of publisher: Switzerland
LCC subjects: Science: Mathematics
Website: http://www.mdpi.com/journal/mathematics

About the journal

Abstract

Keywords