【交易技术前沿】FPGA技术在沪深行情加速的应用

原赋予头衔:FPGA技术在沪深市集的应用



作者:郑继祥、张建国、张立生、王先平、李小波、余坚

(招商纽带有受限度局限的责任公司

摘要:

在纽带市球,求婚录音替换神速,腰槽机遇疾驰的,具有较低的推延、更快的对称,这隐含朕可以诱惹需求和需求的机遇和使就职。现场可编顺序门阵列(简化 与习俗的软件系统相形,FPGA技术,可预测的超低推延,这项技术已值得买的东西于华尔街。、高频市等球明快。

招商纽带境内纽带公司,FPGA的技术成果最初的走在前面,由于FPGA的计算机硬件沪深市集系统的赚得。该系统自接来以后,达到了用户的高地认可。,真实市的陆续亚一百万分经过秒级市集上菜用具。

本文首要引见多少赚得商厦的计算机硬件鼓舞,它包含系统的设计和赚得、系统的测发作与系统的强可冲洗性,想要对FPGA技术的谈论和应用有所扶助,为显像剂求婚中间定位技术提及,构造良好的工艺学生态球。

使用钥匙词:FPGA、上海、申哲二级、异构构架、市集吃水活动、全部手写的援用、Fin-lib、生态系统

一、概述

低市推延的挑动

在纽带市球,腰槽机遇疾驰的,节食市推延是杂多的的资金市的要点目的经过。。眼前,国际银专业的市系统大宗派是A,市鼓舞的阻碍,无法实行超低推延的市需求。和 资金科学技术开展,杂多的算法事务、定量市的衰亡,银专业追求节食市推延的比赛正晋级,相当首要资金机构刊登于头版的要点挑动经过。尖利地地晚近,顺序性市的并联运用,习俗的软件技术或以软件为要点的鼓舞技术难以实行一百万分经过秒级的实时处置和实时对称的命令。业界正追求到达低推延市系统的receive 收执。,由于GPU、FPGA计算机硬件的相似物鼓舞技术早已逐步进入,相当资金科学技术球的叫座现在的,它是华尔街的主流技术经过。

扩大某人的权力市推延唯一的多少鼓舞财务录音。FPGA具有计算机硬件程序效能、低功耗、低推延特征。由于RTL(自动记录器) Transfer Level:自动记录器转会级的逻辑程序,可特地化的书信拟定草案,如TCP/IP堆栈倾销、杂多的音讯编码和解码(如斋戒拟定草案解码,赚得录音相似物和管道相似物,赚得极低的系统推延和极高的系统性能。

3月在上海和深圳最初的成应用FPGA技术

晚近,跟随国际资金市集的斋戒开展和扩张,面容高机能的产业教训系统、高可靠、高性能、低推延开展方向。第三方资金科学技术公司,接踵接来了由于FPGA的动产,尤其在将来的专业,应用fpg勋绩杂多的应用顺序,假定求婚、市、风控等球,成效尖利地,为世纪年头FPGA的应用和开展求婚了提及。。

解释选择招商纽带远在2016年图式化FPGA技术的应用,组织FPGA把联套在车上,启动中间定位技术谈论和评价,评价又已经过净独自海损不赔、OpenCL+RTL异构、RTL 软件同分异构现象等,终极由于资金和商务系统的稳固性、系统可冲洗性、充分地思索healt,选择RTL 软件的异构架构。

为什么选择FPGA技术鼓舞MarkeFPGA把联套在车上对沪深行情从市所前置词机VDE/MDGW至行情应用客户端的时延按某路线发送举行辨析(见图1-1沪深纽带市所市集推延示意图),眼前,业界应用软件来解码市集,求婚市集上菜用具。这些市集解码上菜用具有很大的推延,超越10手写本,市集解码软件的录音处置性能有受限度局限的,在股市射中靶子牛市的压力下,实时性甚至不这么有保证人。2017年FPGA把联套在车上启动上海、申哲二级鼓舞又,用FPGA赚得上海、深圳二级译码,同时应用C 软件和MATLAB体系同时性,为RTL加密的波湾阴谋和优选法求婚提及,上海纽带市所斋戒解码引擎的终极赚得,端到端处置推延扩大某人的权力到10一百万分经过秒以下(包含,取等等尖利地的鼓舞发作。

图1-1 沪深纽带市所市集推延示意图

1000倍鼓舞发作

国际纽带专业FPGA技术保留的根本空白,招商纽带计算机硬件市集系统引入构成CPU-FPGA,设计程度尖利地,FPGA的有效性。上海、深圳二级译码要点算法的勋绩,尤其上海纽带市所的步进斋戒译码算法,解码推延低至纳秒,同时赚得干舷处置性能。

勋绩后计算机硬件求婚系统的继续优选法,经过杂多的僵硬的的机能压力受测验,回送推延决不10一百万分经过秒,机能促销1000次。在C平台上采取全管道设计,赚等等系统的高物料通过量。,是一般市集全天最高程度的100倍,轻易应对股市射中靶子牛市交通急速甩动。一般主流市集上菜用具系统的实时受测验比拟,显示系统公正地可以手脚能够到的扣押8 ~ 13手写本鼓舞效应,尤其面临上海纽带市所复杂的斋戒编码成绩,它还显示了FPGA解码的很机能。。

更,计算机硬件市集系统还设计了独身实时同时性转会系统。,勋绩高效的紧缩/减压算法,节食上海与申哲暗射中靶子录音转会带宽,使上海、深圳的恣意包装材料享用超低推延市集上菜用具。

市集录音的吃水处置是系统的要紧结合宗派。,在FPGA行情解码的根底早已赚得深市全部手写的援用上菜用具,后续工程将求婚更多是明智的的市集吃水活动上菜用具。

二、上海、深圳市集的FPGA技术设计与赚得

由于FPG的异构系统外形设计

倚靠事情和冲洗需求,根本计算机硬件选择指导者列举如下:

(1)100千兆以太网鼻子,市集根源、TCP市集推进、组播市集推进运动采取孤独鼻子。

(2)可特地化鞋头 IP,供养TCP、UDP、IGMP、ICMP、ARP、RARP完整倾销,TCP衔接数至多供养3个。

(3)PCIe Gen3X8,与Gen1/2/3能共处的。

(4)至多两个岸 DDR,内存性能不决不8G。

(5)至多两个岸 QDR。

习俗TCP /IP 拟定草案由于CP Central Processing Unit,中央处置器单元) 施行的软件,应用CPU 构筑TCP /IP 拟定草案栈处置,度过性能差、能力低声地的缺陷,使忙碌落落大方CPU 资源,糟蹋仓库面积,发作落落大方的电力消费,使其具有本钱效益,冲击力机能,千兆以太网带宽资源应用不可。故所选的板卡应用万兆以太网口作为其教训转会鼻子,供养TCP /IP 拟定草案栈的TOE IP是里面独身秘密密钥。经过FPGA 赚得TCP /IP 拟定草案栈和以太网MA 搜集,最初的属于主CP 这宗派任务由附加计算机硬件电路图完成的。,扩大某人的权力CPU 的担子,放慢系统跑过的性能,促销系统机能。系统可冲洗性是系统设计的使用钥匙经过。。从下到上可分为五逻辑约定,包含FPG的根本书信层、FPGA市集事情层、行情能解决层、优秀的FPGA鼻子层和优秀的能解决上菜用具层,透明的的约定间的设计和勋绩限量,上信任和下模,用于转让较低或相同的人对准模块的鼻子,上基层效能完整解耦,如图2-1所示。

图2-1 系统架构块图

里面,FPGA的根本书信赚等等孤独的书信。,求婚明晰的效能包边和明晰的勋绩界间的。可以经过C在优秀的端和FPGA端举行最接近的呼叫。。

2.2 二级市集译码引擎

上海纽带市所教训系统公司(简化“递交所”)于2016年建造子孙的低延迟行情述说系统LDDS,供养多种根源,低推延、大流量、易冲洗、高愿望和另外特征,在胜过的系统境遇中,系统的公正地推延决不。二级 市集系统由于斋戒技术基准、面容专业值得买的东西者的子孙实时行情述说系统。与习俗的根本徽章相形,二级更实时,包含更多的价钱吃水、逐笔市、定单和另外数数的教训等情节。下面是下面exchang的2级示例,市集解码引擎的赚得。

递交所的LDDS以国际基准的资金教训交替发作拟定草案(FIX/FAST)为根底,录音转会拟定草案理性,理性我国纽带市集录音的特征此外Level-2行情情节的特征设计在纽带市集录音球具有独到之处的算法。斋戒拟定草案保持健康了fix protoco的柔韧性,作乐Margi紧缩市集录音,大大地前进了活动速率。FAST系统大幅扩大某人的权力Level-2行情所需的转会带宽(不到最初的的25%)和述说系统的重荷(扩大某人的权力到最初的的10%)

本着上海证券交易所斋戒拟定草案的差数族,同时,理性RT的特征,设计相似物集、全管道高效斋戒解码引擎又,如图2-2所示,差数市集典型的译码相似物处置,理性现实应用扩大某人的权力加盖于化引擎的号码,经过PU赚得初级的的录音解码。同时,fast的xml模板可以婚配,以回应交替发作的替换。

图2-2 上海纽带市所斋戒译码引擎手续图

全部手写的援用

眼前专业1000级市集由于最新的3月2日程度,它可以溃原一些10级市集限度局限,深化宣布我杂多的的价钱的佣钱号码和细目,让用户更透明的地注意到我证券佣钱的细目,它十足的遵从的评述长途电话局悬挂列表和填补列表,理解证券市集的状态。假定朕应用顺序自动化来辨析和崇拜者证券价钱的替换,1000级市集将相当顺序化市的凶器。

计算机硬件行情系统求婚吃水行情活动欣赏上菜用具――全部手写的援用,即在赚得千级徽章的根底上,用户可以特地化N文献市集和佣钱记述的详细教训。。客户在同时收到实时求婚,供养全部手写的援用的订阅和收执效能。

三、计算机硬件求婚系统受测验终于

机能受测验

FPGA亲密的处置推延决不micro的用动作示意开发器辨析,当作运转工夫为n手写本的软件系统,推延完整可以疏忽不顾的。

在勋绩计算机硬件求婚系统的迅速移动中,婚配受测验系统的同时性勋绩,受测验系统首要包含仿照市集根源、回放市集根源及客户端自动化受测验顺序结合。回放市集根源应用真实市所行情录音文献举行克制的速率的回放,合适的差数通入方法下的计算机硬件求婚系统、稳固性和系统性能受测验。

应用回放市集根源,将传播速率设置为软件limi,受测验系统处置性能,终于暗示,上海股市的峰值处置性能,深圳的峰值处置性能高达300万支。。相当作一般(2019年1月)市集,计算机硬件求婚系统的处置性能是THA的100倍,足以周旋股市射中靶子牛市漂的冲击力。

在手脚能够到的扣押FPGA系统的最大性能先前,总计系统将无反压力。,系统延时比拟稳固,这亦FPGA系统的优点经过。,无CPU系统调整成绩,上性能内恣意流量,延时是通过作弊预先安排好结果的不变式的。。

实时行情提速发作平衡力受测验

市托管后计算机硬件求婚系统上部位,受测验实时徽章的鼓舞机能,在一台受测验优秀的上使杰出布置FPGA行情客户端和一般公司从事制造正常的应用的软件行情客户端,两套系统接入同独身市集根源,以确保安博都在相同提出管接近。在受测验优秀的上运转机能受测验顺序,运转两个特地CPU的线状物会给收执到的市集录音扩大工夫戳。,那时的经过独自的以书面提出线状物将录音以书面提出文献。如图3-1所示。整天的的录音搜集(2018-11-20,在收盘后运转录音辨析平衡力顺序将两个系统的行情录音举行相同条行情录音的婚配,达到两个系统将同独身市集推向T的工夫差,下面所说的事工夫差是相当作。

图3-1 实时行情提速受测验示意图

实验统计数字终于:软件求婚系统,端到端处置推延约为13手写本(包含系统LA,计算机硬件求婚系统低至10一百万分经过秒,机能促销1000次。

四、思索可缩放性

如所周知,RTL勋绩,RTL设计的存在能共处的性、可缩放性差的缺陷,当预安装效能勋绩完成的时,当新需求或效能发作替换时,勋绩受测验盘旋将很长,如下,朕霉臭思索到T架构射中靶子系统可伸缩性成绩。,对称市集替换和客户需求。

(1) 镶盖供养上海、深圳双标

一般沪深市所暗中行情录音不共享,系统对上海市和上海市的类似市所的录音举行处置。。思索上海、深圳市集吐艳共享的能够性,在相同块板上设计,可同时活动上海和深圳,只需经过下层软件举行分配额,那就够了赚得镶盖供养上海、深圳双标,摈除修正FPG的RTL设计。

供养沪深市集优选法同时性,应用上海斋戒市集的高紧缩率,上海太难了哲无编码斋戒录音的最接近的同时性,深圳FPGA译码,这可以更多优选法上海和SHE暗射中靶子同时性推延。

(2) 由于异构的市集吃水活动上菜用具

CPU-FPGA异构设计又仍在Marke构造中应用。,将复杂处置分分派优秀的,需求鼓舞的零件放在FPG上。。比如一般的全部手写的援用上菜用具是由于行情录音的深活动上菜用具,应用CPU赚得市集录音处置与计算,构筑的全部手写的援用录音经过FPGA求婚的低延迟转会走廊将录音推进运动于客户端,在保证人机能的同时,大大地节食了经营的争论和工夫。 to 上市工夫。

图式化射中靶子特地化使用钥匙计算上菜用具将在。当CPU计算偶然发现阻碍时,它将把计算亲密的的宗派融入到T的赚得中。,优选法系统机能,同时,确保勋绩人员的及时性。

五、FPGA技术应用的下一步尝试

经过计算机硬件求婚系统的运转和杂多的比拟受测验,批准了可编顺序门阵列(FPGA)技术在国际半导体专业应用的有实行能够。。市集又试水成,前进对再在事务鼓舞中应用FPGA的信用。FPGA技术的超低推延、干舷性能、在资金球,高稳固性和另外优势将是很前景的。,想要相当国际资金球的主流技术经过。

在又勋绩迅速移动中,理解FPGA RTL对准的勋绩太纠葛了、门槛太高了、勋绩盘旋太长,尤其在斋戒替换的资金机关,勋绩盘旋能够决议又的成败。。经过与智能技工的深化沟通,假定软件勋绩人员应用OpenCL技术勋绩,这么Pro的能力,延长又工夫 to 上市工夫。

OpenCL是异构系统的第独身相似物程序基准,是独身一致的程序境遇,软件勋绩人员可以适当的地勋绩异构的高机能。与习俗的RTL设计手续相形,opencl是应用类C初级程序语风设计的。,初级的约定的设计抽象概念,加密的可重用性、可冲洗性将在RT上赚得质的飞跃。。

在纽带业的FPGA技术的首要的,作为先锋,朕去过很多深坑,走了很多绕道,深信不疑建造工艺学生态球的要紧性,为了更多应用伸缩性擀面板技术,工程实行以下经营:

(1) 应用Intel、赛失去控制计算机硬件坚牢的吃水配合,将存在计算机硬件求婚系统封装到根本BS中。

(2) 市集吃水活动中间定位欣赏事情算法应用OPENCL勋绩。

(3) 运算Kernel经过IO-Channel的方法最接近的应用FPGA计算机硬件行情,赚得最小量的时延。

(4) 第三方银专事情显像剂勋绩事情M平台、批准和经营。

更多说起达到的动机,期望值在OpenCL和另外HIG中赚得的事情模块、刻度击出平直球件的计算、奇数的证券选择能力的买价计算、证券走势计算的应用,将专业扣押的事情模块封装到fin-lib库中,赚得与转让软件li公正地适当的。



免责声称回转搜狐,检查更多

责任编辑: