Hongkongdoll real face-伪娘 户外 郑纬民院士:中国大模子能走谢天下前方,目下多数万卡集群不好用
你的位置:Hongkongdoll real face > 类似鬼父的动漫 > 伪娘 户外 郑纬民院士:中国大模子能走谢天下前方,目下多数万卡集群不好用
伪娘 户外 郑纬民院士:中国大模子能走谢天下前方,目下多数万卡集群不好用
发布日期:2025-01-10 17:29    点击次数:119

伪娘 户外 郑纬民院士:中国大模子能走谢天下前方,目下多数万卡集群不好用

1月8日伪娘 户外,全球时报、中国科协新技巧蛊惑中心、清华大学技巧翻新商讨中心等单元麇集发起新质坐褥力产业奉行洞见活动。

会上,中国工程院院士、清华大学预备机系阐述郑纬民暗示,2024年国内大模子产业主要有两大特色,即从基础大模子向多模态发展以及大模子+行业,并合计我国在发展大模子+百行万企上上风隆起,有可能走谢天下前方。

郑纬民院士张开先容了大模子生命周期的五个体式,以及不同体式存在的问题。第一个体式是数据赢得,其难点在于文献数目多且读取日常,大模子现实历程可能需要处理百亿级别的数据文献。

第二个体式是数据预处理,数据质地不高不可平直用于现实,是以需要预处理。以GPT-4为例,1万块卡现实11个月,差未几有半年时期在作念数据预处理,成果绝顶低。

目下外洋收受的主流软件是开源的Spark,上风是生态佳,可延伸性、容错性好。过失有两点,是处理速率比拟慢,受限于Java话语自己的条目,二是Spark收受了内存预备,即把要处理的数据放到内存里预备,放到内存比放到硬盘的预备速率快,然则内存的价钱高、容量低。若是有一个T的数据要处理,那就需要占用内存20T。

清华大学商讨了部分模块用C++来写,同期擦去一些方针责难内存占用,低至数据规模的2倍到3倍,有可能将数据预处理时期裁汰一半。

第三个体式是模子现实,模子现实需要无数的预备、存储等研讨技巧,郑纬民院士要点说起了可靠性。假如10万张卡构成一个系统,每一个小时出一次错,就会大幅责难现实成果,这如故是天下先进水平。

目下业内的通用作念法是,在现实到一定进度时主动“暂停”,比如40分钟时把软硬件的情状记下来, 然后不时现实,比及下一次出错收复到前一个标记点不时现实,然则数据量大且复杂,成果仍然有待擢升,目下行业在探索更高效的读写决策。

第四个体式是模子微调,基础大模子现实出来需要针对特定行业或者场景二次现实,比如医疗行业,在基础大模子之上联接病院数据再现实一次,得到一个医疗领域的大模子,也不错进一步第三次现实,比如在病院大模子上联接B超数据再现实一次,得到一个B超领域研讨的大模子,链接屡次现实得到更小领域的大模子,这亦然微调的主要作用。

第五个体式是推理,行将现实好的大模子应用在具体场景。

AI芯片是大模子产业焦点,郑伟民院士指出,产业各界聚焦大模子下一步要遵循探索构开国产万卡系统和异构卡麇集现实,更好相沿起国产大模子现实。

他说,国产AI芯片最近两三年取得了很大的高出,然则从严格的角度来说,国产的卡用户不太心爱用,不是硬件作念得不好,而是生态不太好。

如何界说生态好不好?若是蓝本有一个软件是基于英伟达蛊惑,目下很容易移植到国产系统上,即是生态好,若是移植起来莫得两年、三年移不完,移不告捷,生态就不好。基于新的硬件新写软件亦然同理,目下的政策是蛊惑更多的软件系统优化生态,让多张卡同期现实有更好的线性加快比。

蝴蝶谷娱乐

郑纬民院士终末纪念,构开国产万卡系统很进击,也很难,但一定要建,万卡系统总的来说达到基本可用,特地是软件生态要建好,此外,要宠爱异构卡麇集现实。

中国算力参预新一轮快速发展周期,主要源于东数西算和大模子现实,智能算力发展最快。大模子现实高端卡用得比拟多,中低端卡用得比拟少,梗概惟有30%的应用率,国产软件生态素养允洽,有望把30%应用率擢升到60%。

会上,科大讯飞麇集首创东说念主、高档副总裁江涛暗示,基于昇腾AI云管事,科大讯飞麇集华为推出洋内首个万卡规模大模子算力平台“飞星一号”,能够结束大模子现实推理一体化联想,处理大模子时间“卡脖子”问题,并贬抑优化集群现实成果。在此平台上, 讯飞星火大模子抓续迭代至4.0 Turbo,轮廓标的上已达到GPT-4 Turbo水平,数学智商、代码智商特出GPT-4o。

华为云大数据与AI领域总裁尤鹏暗示,异日基础模子可能会管制到三家,不会特出五家,会有无数的企业去作念上头的行业模子以及行业落地。

华为云联接AI To B奉行纪念出三个不雅点:一、不是每一个企业齐需要大规模素养AI算力。不排斥资金比拟浑厚的互联网公司伪娘 户外,它们的每个业务场景、每个推选、每个搜索、每个骨子标签、每个骨子生成齐会用到大模子,然则可能95%的公司齐不需要建数据中心,用云的姿色不错以快速处理AI的现实、增训、推理,结束算力的高效应用。二、不是每一个企业齐需要现实我方的基础模子,聘任业界主流基础模子应用于我方的场景是比拟经济的聘任,投资也比拟少,周期也比拟短,告成也比拟快。三、不是说统统的应用齐要追求大模子,天下从来齐不是祛除式的发展,而是采用式的发展,蓝本的专科小模子不错不时使用,大模子行为一个更变系统,能够很好地把大小模子更变起来,异日大模子系统是一个搀杂工程的平台,通过大模子更变小模子,大模子为中模子、小模子去生成数据。(本作家 | 张帅,剪辑 | 盖虹达)



相关资讯