集成电路技术分享

 找回密码
 我要注册

QQ登录

只需一步,快速开始

搜索
楼主: lcytms

FPGA名师讲堂之 至芯科技带你领略FPGA(2017.6.20李凡老师)课程回顾

[复制链接]
 楼主| lcytms 发表于 2017-7-15 14:15:50 | 显示全部楼层
60
        每个处理器有8个核,支持32个线程。
        它是用巨大的计算机系统把它算出来的。
        当然这个算法里面体现了对语言的理解的问题、对问题检索的问题。
        这些问题都得到了发展,但是它仍然是一个计算机,一个图灵机的系统。
        站在功耗和效率的角度上,我们讲,无论是当初IBM的深蓝,和卡斯帕罗夫的对决,还是阿尔法狗和李世石、柯洁的对决,或者是一站到底、最强大脑中的对决。
        这里面都有一个不公平,就是计算机是很大的一个系统,很大的体积和功耗,它是一台专用的图灵机。
 楼主| lcytms 发表于 2017-7-15 14:16:50 | 显示全部楼层
61
        如果把它集成到一个人类体积、功耗的设备里面,它能否实现呢?
        现代的神经生物学告诉我们,人的大脑只有15W,IBM最新的研发团队,它就在研发这件事情。
        图灵机并不像生物系统那样,只有做到生物系统那样的效率和体积,才能做到将来的设想有一天,真正的人和身边的机器人的对话。
 楼主| lcytms 发表于 2017-7-15 14:18:35 | 显示全部楼层
62
        机器人管家像人那样的尽职,解决问题。
        如果图灵机不是一个生物系统,那么谁会是呢?
        有观点指出,现代的机器里面,FPGA长得更像一点。
        说到后图灵时代,FPGA的其中一个加速器的应用,用到图像上,方方面面,像模式识别、3D技术、图像压缩、边沿检测、机器人视觉、虚拟现实,这些都可以用语言体系来实现,都可以用计算机系统来实现。
        这个时候用FPGA、用硬件、用芯片级解决方案、用有限自动机会达到什么样的效果呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?我要注册

x
 楼主| lcytms 发表于 2017-7-15 14:20:59 | 显示全部楼层
63
        比方说,像人脸识别,要做到非常快的人脸识别并不是一件易事。
        特别是如果要把它集成到一个小型化的设备里面,并非易事。
        这里面就有一个用FPGA来加速的问题。
        另一个例子,巴西世界杯的时候,用的一个门线技术。
        用计算机来判定这个足球,有没有进门限的坐标,进了门限的坐标,就算进球。怎么样才能得到这个球的坐标呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?我要注册

x
 楼主| lcytms 发表于 2017-7-15 14:23:49 | 显示全部楼层
64
        16台高速计算机,每秒500帧,实时地来捕获现场的图像,算出这个球的坐标。
        还有用鹰眼的越位,越位了以后,草坪的图像会反转,裁判员的手表会有震动,这是怎么得到的呢?
        是用鹰眼得到的,是用计算机算出来的。
        而这些算的过程中都体现了加速的算法。
        用计算机,即便是用服务器阵列来算,效率都是很低的。
        这个是用加速器来实现的。要用到芯片级解决方案。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?我要注册

x
 楼主| lcytms 发表于 2017-7-15 14:26:11 | 显示全部楼层
65
        另外呢,谈到算法实现和算法加速的时候,我们要说到神经网络。因为阿尔法狗战胜柯洁之后,大家对人工智能都情有独钟。
        津津乐道于神经卷积的算法,深度学习等等这些概念。
        其实神经网络它形成的这颗树,在计算机系统里面,无论是Watson还是AlphaGo,类似的服务器阵列里面,都是用一个数据结构来描述的神经网络。
        根据这个数据结构来调用多核多线程,来把它强行地算出来。所以说需要巨大的服务器阵列。
        另外一个例子,就是算法实现和算法加速。
        一个非常简单的例子就是排序。
        排序有很多种算法,经典的就是冒泡法。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?我要注册

x
 楼主| lcytms 发表于 2017-7-15 14:27:46 | 显示全部楼层
66
        无论是冒泡法,还是珠排序,或者是其它的一些排序算法,总之要把排序的数据读进来,逐一地进行比较。
        多核多线程也是如此。
        一次只能做一次比较。
        那么现代的硬件的排序是怎么做的?
        已经打包成专利的形式,集成到类似酷睿芯片、高通骁龙芯片里面的,这些排序是怎么做的?
        非常之快,就是一拍排序。
        数据进来就排好了,它一次做n个比较。
        N呢它是一个排序栈,排序栈的深度是n,一次可以做n个比较,那当然就快多了。
        比多核多线程还要快。
        这个里面呢,就体现了一种算法。
 楼主| lcytms 发表于 2017-7-15 14:30:26 | 显示全部楼层
67
        我们在说到排序算法的时候,打开文献,一系列的算法大多都是软件的算法,硬件算法肯定要搜索专利文件。
        当我们看到这些算法的时候,我们第一个感觉,是把这些用C语言写的算法,转变为用HDL语言写的算法。
        如果你这样做,就大错特错了。
        特别是我刚才讲的神经元卷积,现在也有用神经元卷积来写HDL语言的,如果你执意把你的FPGA当CPU来用,那就得不偿失了,也得不到FPGA的优势所在。
        另外呢,就是我们该如何学习硬件,学习EDA技术?
        今天我们仍然看见拿来主义。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?我要注册

x
 楼主| lcytms 发表于 2017-7-15 14:31:28 | 显示全部楼层
68
        我们的今天的硬件学习过程之中,包括工程师,包括企业和高校,我们很大程度上在看说明书,在看西方的手册。
        当手册上有了,或者同类产品上有了,我们要跟进。
        通过这样的学习,我们可以看见什么呢?
        能够看见最新的技术,能够跟进最新的技术,都没有问题,这个仍然是现代的拿来,我们承认,这个还是需要的。
        但是我们也看到了它的不足之处,当我们如果没有一个创造的拿来,我们怎么能够成为一个人无我有的企业呢?
        怎么能够拿到一个先进的技术体系在手上,领先于其它的企业呢?
        我们不仅要学到先进的技术,还要看到先进技术支持的基础理论的发展。
 楼主| lcytms 发表于 2017-7-15 14:37:09 | 显示全部楼层
69
        摩尔周期40多年过去了,走到了摩尔周期的极限,走到了后摩尔周期。
        西方的理论体系也发生了翻天覆地的变化,所以说我们在学习的过程之中,不仅要跟进现代技术,更要跟进它的基础理论体系方面。
        今天的课程就到这。
        下节课呢,我们会具体来讨论一些运用过程之中的细节,工具的细节,以及EDA建模的方方面面。
        通过我们至芯的公开课,我们可以给你一个方向,给你打开一扇窗,你可以知道,在这个方向发生了什么?
        你后面的路该怎么走?
        我们总结一下,对嵌入和FPGA的比较而言。
您需要登录后才可以回帖 登录 | 我要注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

QQ|小黑屋|手机版|Archiver|集成电路技术分享 ( 京ICP备20003123号-1 )

GMT+8, 2024-4-19 20:15 , Processed in 0.070923 second(s), 17 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表