龙空技术网

基于CPU-FPGA异构系统的排序算法加速

电子技术应用ChinaAET 208

前言:

现在你们对“fpga 算法加速”都比较注重,咱们都想要分析一些“fpga 算法加速”的相关资讯。那么小编也在网络上收集了一些关于“fpga 算法加速””的相关资讯,希望兄弟们能喜欢,朋友们一起来学习一下吧!

排序问题是计算机科学中的经典问题,人们已对此提出了许多解决办法。而大规模数据的排序问题仍然是一个困难的问题。这一问题广泛发生在图计算领域,如社交网络、推荐系统等[1]。

传统的计算平台CPU和GPU存在计算效率低和高功耗的问题,不能很好地满足图计算领域的计算需求。为了解决这一问题,研究者们采用定制硬件平台来进行图数据的处理和算法的加速[2]。其中,基于的图计算加速器因满足复杂性高、数据规模大和基本操作多变的图计算的性能要求[3]受到青睐。

目前,国内外已经存在大量的基于FPGA的硬件加速器。GraphOps[4]提供了一个硬件库,可以让用户快速且轻松地构造用于图分析算法的节能型加速器。FlashGraph[5]在具有极端并行性的SSD文件系统之上实现了图处理引擎,它可以在性能损失最小的情况下利用SSD处理超大规模的图数据。FPGA开发门槛较高,但如果使用ThunderGP[6],开发人员只需要使用C++编写API函数,ThunderGP就会自动生成一个高性能的加速器,极为方便。大规模世界图往往具有强大的社区结构,其中一小部分顶点比其他顶点的访问频率更高,利用这一潜在局部性,可以大幅提高图计算的性能[7]。除了单机图计算系统,一些典型的分布式的图计算系统,如ForeGraph[8]和FPGP[9],也可以处理超大规模的数据。

本文详细内容请下载:。

作者信息:

寇远博,邱泽宇,王 亮,黄建强

(青海大学 计算机技术与应用系,青海 西宁810016)

标签: #fpga 算法加速