PowerLyra:解决 Power-law 幂律图计算分配不均匀问题的新方法

配资网 阅读: 2024-10-01
后台-插件-广告管理-内容页头部广告(手机)

在图处理这块,顶点计算挺麻烦,怎么快算是个谜。PowerLyra研究发现,顶点类型不同,尤其是低度和高度顶点,用不同方法分划很重要。它们用Mirror顶点和vertex-cut法想提升效率,但低度顶点上效果不好,还多出了很多Mirror。我们得好好看看这些方法的利弊,还有实操怎么样。

一、Mirror顶点的引入与挑战

顶点管理_顶点策略_顶点计划

顶点策略_顶点计划_顶点管理

在图处理这事儿里,加Mirror顶点是想减轻那些顶儿多的点的计算压力。那些顶儿多的点关系复杂,不处理容易卡住。分割成好几个Mirror能平衡一下,PowerLyra就图谋这么干。可弄Mirror也不是没代价,低度顶点要是用切割法,反而可能弄出更多Mirror,弄得更复杂。本来想着在地儿算能减少延迟,结果Mirror多了,通信费用倒高了。

在这个情况下,虽然Mirror顶点多少解决了高度顶点计算的问题,但低度顶点的处理更麻烦了。特别是一遇到大块图数据,低度顶点计算如果不能在本地上解决,肯定会影响整体效率。图处理的难点就在这儿,既要高效计算,还得避免浪费资源,这是咱们得好好琢磨的问题。

二、顶点哲学的局限性

顶点计划_顶点策略_顶点管理

好多图处理系统都喜欢以顶点为中间思想,想着并行处理每个顶点能更快。但用这法子的时候,碰到不同顶点问题就来了。那些顶点多的顶点通过这种方式是挺快,可对顶点少的来说,不一定有用。咱们希望顶点少的计算能在本地解决,减少网路延时,可用了那个vertex-cut法子,结果反倒是多了好些跨机器的交流。

咱们往往没重视那些低顶点的特点,结果做得不够好。有些低顶点因为重复太多和通信太多,效率可就差远了。这事儿得提醒咱们,做图算法的时候得看看每个顶点都不一样,不能光图着多并行,得兼顾实际需求。

顶点管理_顶点计划_顶点策略

三、vertex-cut与edge-cut的思考

PowerLyra对顶点切割和边切割的策略研究得很彻底。他们给高度顶点弄了个叫High-Cut的方法,意思就是平均分摊高度顶点的输入边到机器上,想这样能少点跨机器的通信。至于低度顶点,用的是Low-cut,就是平衡分配低度顶点的输入边,保证计算在本机进行。这个分法主要是为了让计算更快,同时减少浪费的资源。

不过,用这招在实际里不一定灵。就算Low-cut本来想提高速度,低顶点那儿还可能因为机器间通信不好,反而慢了。这矛盾提醒咱们,做图处理得见机行事,找办法更靠谱。

四、局部性与通信干扰的难题

顶点计划_顶点策略_顶点管理

顶点管理_顶点计划_顶点策略

在用并行图搞处理的时候,咱经常得跟局部性不好和通信闹别扭的问题较劲。PowerLyra在通信这方面做了一些好调整,专门提升了咱们对数据本地的敏感度,不过这事儿一搞,图数据的启动时间就得花得多一些。对于那些顶点不多的计算来说,这局部性可是关键,优化好它,就是咱能更好地掩盖那网络延迟,算得更快。但通信这边总是不老实,想优化局部性可不容易!

在这种情况里,PowerLyra推出了一种专门计算顶点的单向访问法。它尽量减少多余的信息交流,想在保持计算速度的同时,增强数据局部性。但这个方法在实际使用时还要不断改进,得根据不同类型的图数据来调整。

顶点计划_顶点策略_顶点管理

五、未来的探索与思考

在图处理这块儿,找准顶点多和顶点少的计算量平衡点,还挺关键。PowerLyra给咱们打开了思路,不过还得在实际操作中边学边改。划分法五花八门,效果也各异,搞图算法时可别只看表面,得好好琢磨顶点的特点,随机应变应对各种难题。

以后咱们得多招些研究者来,一起看看怎么弄出更给力的图处理算法。怎么在保证电脑不忙过头儿的前提下,提高效率和减少信息乱窜,这是个挺费脑筋的课题。咱们得多琢磨琢磨,争取给图处理技术的未来带来点新思路。

顶点管理_顶点策略_顶点计划

本文 融资融券杠杆炒股 原创,转载保留链接!网址:http://www.junxuezl.com/zmt/335.html

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

后台-插件-广告管理-内容页尾部广告(手机)
关注我们

扫一扫关注我们,了解最新精彩内容

搜索