大数据 (Jul 2024)
面向大数据场景的系统性能优化实践
Abstract
在现有大规模分布式环境中,大数据应用的性能与计算效率仍有较大的提升空间。然而,在大规模环境中进行性能分析与优化需要大量领域专家。针对大数据应用中的性能优化问题,提出了一个通用的低效查询语句检测与优化流程,总结了4类显著影响大数据应用性能的低效行为,并针对每一类低效行为,提出了具体的优化策略。最后,通过实验评估验证了提出的优化方案在实际大规模集群中的有效性。
Keywords
大数据 (Jul 2024)
在现有大规模分布式环境中,大数据应用的性能与计算效率仍有较大的提升空间。然而,在大规模环境中进行性能分析与优化需要大量领域专家。针对大数据应用中的性能优化问题,提出了一个通用的低效查询语句检测与优化流程,总结了4类显著影响大数据应用性能的低效行为,并针对每一类低效行为,提出了具体的优化策略。最后,通过实验评估验证了提出的优化方案在实际大规模集群中的有效性。