`
猫耳呀
  • 浏览: 167094 次
社区版块
存档分类
最新评论

【F3使用场景】F3经典使用场景

阅读更多

摘要: 概括F3经典使用场景

1. 人工智能深度学习客户,推理应用
最近两年,人工智能在全球掀起了巨大的应用热潮,除了互联网巨头,如Google,Facebook,Alibaba之外,涌现出众多的Start up公司,也都逐渐成为行业翘楚。
在人工智能技术方案选择上,GPU无疑是现阶段的首选,这其中的主要原因,一方面,GPU完善的生态,高并行度的计算力,很好地帮助客户完成了方案的实现和部署上线;另外一方面,人工智能发展,仍处于早期阶段,各个行业都在从算法层面尝试寻找商业落地的可能性,是一个从“0”到“1”的过程。在可以预见的未来几年,随着人工智能落地应用越来越多,大规模商业部署渐渐成为可能,进而对于更低功耗,更低成本,更低处理延时,更多定制化等的需求,将会逐渐凸显。可是F3在人工智能大规模商业部署(推理应用)中,具备独特的性能优势和广阔的潜在空间不可小视。

  • 低延迟

相比于F3(FPGA),GPU计算的处理优势,在于其众多专用的并行计算单元以及超高的显存带宽,让多路大规模数据搬移快速并行计算成为典型的计算模式,但这一模式导致了每路数据的处理延迟增加,对于一些低延迟需求的在线业务场景,如语音识别等。在Batch值较小的情况下,F3(FPGA)的处理延时,仅为GPU的1/10。

  • 超高的定点计算力

对于深度神经网络的计算,一个发展趋势就是降低数据表示的精度,降低网络对于计算力的需求,以提高计算吞吐量。从双精度浮点到单精度浮点,再到定点处理。而定点运算却是FPGA的传统优势,相比于GPU,FPGA内部配备了众多的定点处理单元,甚至整个FPGA芯片内部逻辑资源全部可以配置成定点处理单元,进而具备了超高的顶点运算能力。
目前申请测试的客户中,有很大一部分就是冲着F3的这些优势而来,期望在其业务上带来创新和产品的性价比提升。

2. 基因测序
基因测序是一种新型基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性,基因测序技术能锁定个人病变基因,提前预防和治疗,目前基因测序广为人知的是针对唐氏综合征筛查的无创产前基因检测。伴随着基因测序技术的快速发展,基因数据的生成呈现指数级增长,而应用也越来越广泛,对分析能力提出更高要求。

传统的计算系统通过采用多个高端CPU搭建HPC系统实现了缩短时间的目的,但这样也使得成本增加,行业应用规模以及基因企业发展规模受限。目前国内基因企业,面临基因计算成本偏高,而业务需求旺盛,急需高性价比的算力资源解决行业困境。

以人类全基因组(WGS)分析为例,单个WGS,使用一台16c/64GB的CPU实例,完成分析需要近100小时的时间,而F3在30分钟以内即可完成。极大地缩减了计算时间和成本。

通过选用F3云主机,基因企业在基因计算环节可以大幅提升产能;而普通大众,也能享受成本降低带来的普惠。

3. IC设计原型验证
在传统的数字IC设计流程中,使用FPGA搭建芯片原型验证平台,测试功能是重要的一个环节,在这个过程中,需要大量的FPGA逻辑单元。而对于传统数字芯片设计公司来讲,购买或者自研复杂的FPGA验证单板/或平台,耗时耗力,且不是公司主要业务方案,加之FPGA平台升级换代速度超过芯片设计周期,对于更大逻辑量FGPA板卡的追求,不断研制最新fpga板卡一直是大型数字芯片设计的痛点之一。
F3云主机,选用单芯片逻辑单元达250万个的VU9P,支持双芯片600Gbps的互联,以及多板块间的100Gbps的互联,最大实例支持16个VU9P芯片,很好地满足了数字芯片原型验证阶段,对于大逻辑量的需求。
而客户选用F3云主机,避免了维护复杂FPGA板卡的大量人力物力的投入,缩减了验证平台的维护成本。

4. 视频处理(视频编码,视频内容处理)
随着视频采集及传输技术的发展,视频素材的分辨率和帧率在不断提升。分辨率从2K到4K到8K;帧率从30到60到120;新的标准及技术,比如HDR,也不断出现。
素材质量的增长,图像码流量也随之增长。人们需要压缩率更好的压缩算法标准,才能够适应新的图像压缩需求:
• 同样的压缩率得到更好的画质
• 同样的画质得到更好的压缩率
以H.265编码为例,目前客户选择的主流技术平台为CPU或者GPU。
对于H.265/HEVC编码处理,FPGA方案有着最完善的功能和preset配置,支持最多的有利于提高画质和降低bitrate的功能,适合各个场景下H265/HEVC的编解码配置。同时具有灵活部署,易于升级的特点,非常容易就可以在某一个平台上升级IP特性,甚至根据需求,随时更换成其他协议的编解码功能。
FPGA的可扩展性也是GPU不可比拟的,能非常容易的在同一块FPGA上pipeline部署编解码相关的上下游应用;同时,因为FPGA之间的高速互联特性,也可以方便地在不同FPGA、不同FPGA板卡间部署完整的相关应用方案。
成本方面,高画质IP虽然通道数量基本与GPU持平,但是带来的bitrate的大幅降低,可以显著降低带宽成本、存储成本,综合成本是降低的; 
以下为一个典型的H.265编码测试场景,在编码速度对应x265的“very slow”配置结果,FPGA编码器能够达到1080p60(60帧/秒)的处理能力,远大于x265的3帧/秒。

5.数据库加速
在数据规模爆炸式增长的背景下,数据处理的速度,无疑是用户所关心的。
以大型互联网公司为例,每天处理的数据量级都在 PB ,每天更新的网页以亿计,每 24 小时更新的日志超过PB。这样的数据规模,对于目前的处理平台,是个巨大的挑战,需要大型的集群来完成。而在这样的数据处理规模中,数据仓库的性能,直接关系到了数据本身的处理能力。

F3(FPGA)云主机,得益于FPGA细颗粒度的数据处理能力,高并发度的并行计算能力,能够大幅提升数据库产品的性能:

  • 以数据库处理中的排序单元为例,在PostgreSQL的核心处理单元加速中,F3相比CPU能够带来10倍以上的性能提升。
  • 再以时序数据的处理为例,大数据领域中,时序数据使用超过一半。广泛应用于物联网(IoT)设备监控系统 ,企业能源管理系统(EMS),生产安全监控系统,电力检测系统等行业场景。F3单路数据吞吐性能是单核CPU的30倍以上!

原文链接

分享到:
评论

相关推荐

    F3jsFake3D实现在canvasContext2d上绘制3D场景

    F3.js通过矩阵变换来实现这一目标,例如使用投影矩阵将3D坐标转换为2D坐标,以及使用模型视图矩阵进行物体的移动、旋转和缩放。 使用F3.js时,开发者需要定义3D对象的几何形状,这通常包括顶点坐标、法线向量(用于...

    stm8s003f3使用杂记

    STM8S003F3是意法半导体公司生产的8位微控制器,属于STM8系列,适用于要求成本低而性能适中的应用场景。在使用STM8S003F3微控制器进行开发时,用户可能会遇到各种问题,并需要采取不同的解决策略。本杂记将根据个人...

    STM8L051F3P6使用手册(中文).zip

    5. **封装选项**:提供不同封装形式,如QFN20、TSSOP20等,适应不同应用场景。 使用手册会详细讲解以下内容: - **系统架构**:详细介绍STM8L051F3P6的CPU、寄存器结构、中断系统以及电源管理。 - **外设功能**:...

    GD32F3x0_Demo_Suites_V2.0.0_GD32F3x0_Demo_gd32f3x0_DEMO_dojpp_

    总之,GD32F3x0_Demo_Suites_V2.0.0是一个强大的工具,它不仅提供了丰富的代码示例,还展示了GD32F3x0微控制器在不同应用场景下的强大功能,是GD32F3x0开发者的必备参考资料。通过深入研究和实践这些示例,开发者...

    Keil.STM32F3xx_DFP.2.1.0.zip

    STM32F3系列是意法半导体(STMicroelectronics)推出的一款基于ARM Cortex-M4内核的微控制器,集成了浮点单元(FPU),在嵌入式领域中广泛应用于实时控制、数字信号处理和传感器接口等场景。Keil.STM32F3xx_DFP....

    四信F3X36 ROUTER系列无线路由器说明书.zip

    四信F3X36系列路由器是一款专为各种行业应用设计的高性能无线路由器,这款路由器在各类企业网络、物联网(IoT)系统以及远程监控场景中广泛应用。本说明书旨在为用户提供详细的产品信息、安装步骤以及参数配置指南,...

    stm8s003f3最小系统原理图

    - 微控制器需要时钟信号来驱动其内部操作,STM8S003F3可以使用内部RC振荡器或外部晶体振荡器。内部RC振荡器简单但精度较低,外部晶体振荡器精度高但需要额外的电路。 4. **复位电路**: - 复位电路是确保微控制器...

    F3智能识别车辆管理系统使用说明书.doc

    F3智能识别车辆管理系统使用说明书 F3智能识别车辆管理系统使用说明书是用于...F3智能识别车辆管理系统使用说明书提供了详细的安装、配置和使用指南,旨在帮助用户正确地安装、配置和使用系统,以满足不同的使用场景。

    四信F3A26 LTE WIFI 无线路由器技术规范.zip

    - **电源管理**:可能具有节能模式,降低功耗,延长设备工作时间,适用于移动场景。 2. **规格**: - **频段支持**:F3A26路由器可能支持多种LTE频段,以覆盖全球范围内的4G网络。 - **最大下载/上传速度**:...

    蒙德(MODROL)变频器f3使用手册.rar

    【蒙德(MODROL)变频器f3使用手册】是专为操作和维护MODROL公司的F3系列变频器而编写的详细指南。这份手册旨在帮助用户充分理解和有效地使用这款变频器,以实现对电动机速度和扭矩的精确控制。在工业自动化领域,变频...

    stm32f3-examples.rar_ STM32F3_9SS_stm32f3_stm32f3 例程_stm32f3官方例程

    STM32F3系列是意法半导体(STMicroelectronics)推出的一款基于ARM Cortex-M4内核的微控制器,它在嵌入式系统设计领域广泛应用,特别是在实时控制和数字信号处理等场景。STM32F3系列芯片融合了高性能的浮点单元、...

    STM8L051F3P6(中文).pdf

    - **工业控制**:在工业自动化领域,需要长时间运行且对电池寿命有严格要求的场景,STM8L051F3能够提供低功耗和高性能的平衡。 - **医疗设备**:在医疗保健领域,特别是穿戴式医疗设备,需要长时间工作且对功耗极为...

    欧姆龙F3WN-X说明书

    通过使用F3WN-X系列传感器,可以大大提高生产效率和产品质量,同时减少人工成本和错误率。 #### 五、总结 综上所述,欧姆龙F3WN-X工件检测用区域传感器以其多样化的型号选择、灵活的检测宽度配置以及高精度的检测...

    STM8L051F3与STM8L101F3的PCB封装

    总结来说,STM8L051F3和STM8L101F3是STMicroelectronics推出的低功耗微控制器,它们各有特点,适合不同应用场景。STMicroelectronics+STM8L.IntLib是这些芯片的PCB封装库,用于电路设计软件中,确保了设计的准确性与...

    STM8S003F3.pdf

    STM8S003F3微控制器(MCU)属于STMicroelectronics(意法半导体)的STM8S系列,具有8位STM8内核。其设计目标是用于需要性能和功能丰富度平衡应用的场合,同时考虑到成本和能耗效率。本文将详细介绍STM8S003F3的主要...

    STM32F3Discover 样板的官网例程(包含LSM303DLM芯片和L3GD20芯片的驱动的驱动)

    通过学习和分析这些例程,开发者可以了解到STM32F3如何与LSM303DLM和L3GD20通信,以及如何在实际项目中有效地使用这些传感器。同时,这些示例代码也可以作为自己项目的基础,进行必要的修改和扩展,以适应不同的应用...

    C18615_STM8S003F3P6_2013-09-03_stm8s_STM8S003F3P6_

    4. 电源管理:具备多种低功耗模式,如休眠、停机和待机,适应不同应用场景的能效需求。 5. I/O端口:多个数字输入/输出端口,支持中断和复用功能,方便连接外部设备。 6. 定时器:包括定时器、计数器和PWM发生器,...

    STM32F3SDADC

    在文档AN4207中,提供了关于STM32F37x/38x系列SDADC的主要特性以及如何在不同应用场景下使用SDADC的具体案例。文中涉及了四个主要应用案例:使用PT100的温度测量、使用MPX2102A的压力测量、波形记录器和心电图(ECG...

    腾达无线路由器F3说明书

    ### 腾达无线路由器F3使用说明及关键知识点解析 #### 一、产品介绍 **1.1 产品简介** 腾达F3是一款专为中小户型家庭设计的无线路由器,旨在提供稳定的家庭网络解决方案。它能够有效解决信号盲区问题,确保用户在...

    贴片铝电解电容封装(F3-F6)

    不同的尺寸对应不同的电容容量和耐压值,适用于不同的应用场景。例如,F3尺寸的电容可能适用于需要小巧、高频响应的场合,而F6尺寸的电容则可能用于需要更大容量和更高耐压的系统中。 AD封装库是电路设计软件Altium...

Global site tag (gtag.js) - Google Analytics