C&T (Jan 2022)
Modelagem de Dados para Cassandra
Abstract
Devido à crescente demanda por escalabilidade e distribuição de dados, uma variedade de sistemas gerenciadores de banco de dados NOSQL surgiram e vêm sendo usados com diferentes objetivos. Entre as abordagens mais populares podemos citar a orientada a documentos, a orientada a colunas e a chave-valor. Embora já existam vários sistemas de banco de dados que adotam essas abordagens, até onde foi possível investigar, quase não há diretrizes de modelagem de dados para eles. O algoritmo proposto neste artigo analisa um conjunto de consultas pré-definido e, baseado nas cláusulas de filtro dessas consultas, ele define as chaves primárias e de clustering para um conjunto de visões materializadas. Adicionalmente, ele define um conjunto pares indicando quais consultas cada visão materializada atende. Para avaliar o algoritmo, foi realizado um experimento que compara o desempenho entre usar diversas tabelas para cada consulta e usar as visões materializadas sugeridas pelo algoritmo. Os resultados mostraram-se promissores e apontam para novas direções com relação à modelagem de dados para sistemas NOSQL.