教育一个AI大模子需要些许钱?97播播
OpenAI CEO山姆·奥特曼曾暗示,GPT-4的教育老本节略1亿好意思元(约合东说念主民币7.3亿元),将来教育大模子的老本将高于10亿好意思元。尚未完成教育的GPT-5大模子,为时约半年的一轮教育就破费了节略5亿好意思元,可见AI公司的开销老本有多高。
但是在AI行业却有一个异类,被广大网友奉为“AI行业的拼多多”,这家公司便是DeepSeek(深度求索),网传其大模子教育老本压缩到极致,最新推出的DeepSeek-V3大模子教育老本仅为557.6万好意思元(约合东说念主民币4070万元),大要是GPT-4的二相当之一,推测约破费了278.8万个GPU小时,参数为6710亿,其中激活参数为370亿。
DeepSeek官网的价钱暗示泄露,缓存射中输入价钱仅为0.1元/百万tokens,缓冲未射中输入价钱为1元/百万tokens,输出价钱则为2元/百万tokens,在诸多AI大模子中属于最低的一档。(注明:1token约等于1.5个汉字或3个英笔墨母)
(图源:DeepSeek截图)
豆包、通义千问等AI大模子,智商较低的版块差未几亦然这个价钱,但性能较强的大模子如Doubao-pro-128k,输入价钱5元/百万tokens,输出价钱为9元/百万tokens,Kimi的moonshot-v1-128k输出价钱更是高达60元/百万tokens。(注明:数据来自AI公司官方)
(图源:雷科技制作)
DeepSeek-V3超低的教育老本和最低一档的输入、输出价钱,令东说念主不禁猜忌,到底是其他AI公司资源哄骗率太差,如故DeepSeek手艺实力太强,抑或DeepSeek-V3的智商是吹的?
好在,尽管DeepSeek-V3的大模子主翻开源和API接口使用,但也为用户准备了可以浅易使用的网页版。只须对其测试一番,对比与主流大谈话模子的差距,咱们就能获知DeepSeek的果然实力。
DeepSeek-V3实测,适度令东说念主诧异DeepSeek页面极为直爽,主框仅有深度想考、联网搜索、上传文献、发送四个按钮。淌若不翻开联网搜索功能,将无法搜索网上关系的信息,只可看成腹地大模子使用,且深度想考和联网搜索无法同期开启,但依然需要电脑联网将问题发送给DeepSeek。
针对DeepSeek-V3,小雷准备了四轮测试,包括通用问答、推行追念、专科数学题、金融学问问答,部分测试还将与豆包、Kimi等大谈话模子进行对比,以便于更直不雅地不雅察DeepSeek-V3的智商。
一、通例问答:简略整洁、可读性高。作为又名科技剪辑,小雷每天都会向AI商议“今天科技圈有什么新闻”,让AI大模子匡助我快速齐集新闻,绝大多数大模子也能够自便胜任。于是,小雷将其作为第一轮测试题目。
DeepSeek为我寻找了10条新闻,新闻之间用分割线辩认,视觉上愈加明晰明了。每一段新闻的末尾,还会提供可一键直达的网页流畅。该项指标测试中,DeepSeek的亮点在于,新闻的追念直爽且卓著了要点,所齐集的推行也不局限于国内平台,部分音信来自国外新闻媒体,点击流畅可直达国外的新闻网站。意想的是,DeepSeek还找到了我方的“黑料”,DeepSeek-V3大模子会称我方是ChatGPT,山姆·奥特曼发文复兴,认为原因是数据羞辱。
(图源:DeepSeek截图)
小雷用豆包和Kimi齐集新闻时,豆包回复的推行笔墨太多,推行不够直爽明晰,Kimi则过于精简,新闻的追念基本只好一句话。
随后小雷还让AI保举几首古典音乐,在未联网的现象下,DeepSeek依然可以准确回答我的问题,仅仅通盘推行全部造成了英文。而切换至联网阵势后,再次发问磋议的问题,回答的推行则又造成了华文。
本着求真的心态,小雷又进行了几次测试,发现未联网现象下商议西方古典音乐时,DeepSeek给出的回答是英文,商议中国关系的音乐推行,如周杰伦的歌曲,DeepSeek就会是华文。DeepSeek竟然是笔据回答推行的关系性遴荐谈话,而不是发问所用的谈话,令小雷些许有点愕然。
一言以蔽之,在通例问答神志中,DeepSeek推崇出色,无论是联网现象还长短联网现象都能准确回答出小雷提议的问题,推崇涓滴不逊色豆包、Kimi等国内第一梯队的AI大模子。
二、推行追念:适度很精简,要点有缺失。在之前大模子横评中,小雷曾让豆包、Kimi、文心一言、讯飞星火等多款AI大模子追念小红书发布的《潮水数码白皮书》,适度大模子追念出的推行广阔缺失要点,有车轱辘话往来转的情况。
与大多数大模子磋议,DeepSeek给出的推行遗失了太多要点,尤其是《潮水数码白皮书》给出的部分事例,DeepSeek实足莫得归纳出来。(着名:淡色部分为想考范例,深色部分为正文)
(图源:DeepSeek截图)
AI大模子基本存在磋议的问题,追念推行时容易造成“归纳大纲和标题”,导致广阔信息无法展现出来,用户仅凭“脑补”也难以归附出原来推行。
就生成的推行而言,DeepSeek的推崇与Kimi、文心一言较为接近,略强于讯飞星火,稍逊于豆包。能够达到这个着力,还是很出乎小雷的预见了。
三、数学题解答:快速、准确、有过程。在数学题解答中,小雷先后准备了三说念数学题,第一王人题是较为毛糙的小学数学题,第二说念题则是经典的三门问题,DeepSeek全部自便回答正确,因而小雷不再展示AI给出的谜底,小伙伴们可以我方想考一下。
在DeepSeek获得两连胜后,小雷决定给AI大模子上一上强度,拿出了也曾打败过多个AI大模子的第三说念题:
某班有39名同学进入短跑、跳远、投掷三项体育比赛,东说念主数分别为23东说念主、18东说念主、21东说念主,其中三项比赛全部进入的有5东说念主,仅进入跳远的有3东说念主,仅进入投掷的有9东说念主,求教仅进入短跑的有些许东说念主?(正确谜底:9东说念主)
此前的测试中,唯有付费版o1-preview狡计出了该问题的正确谜底,豆包、Kimi、文心3.5、免费版GPT-4o等大模子全部回答失实。令小雷没猜想的是,DeepSeek竟然给出了正确谜底。
(图源:DeepSeek截图)
一时分小雷怀疑,是不是经过这段时分的教育,通盘大模子都能狡计出该问题的谜底了,于是小雷又测试了几款大模子,适度豆包和文心3.5依然未能回答正确,分别给出了3东说念主和12东说念主的谜底,升级了k1视觉想考模子的Kimi和讯飞星火则给出了正确谜底。
除了能够正确回答问题,DeepSeek还够详备展示了想考范例,部分问题还会反复考证谜底,以至使用其他相貌再狡计一次,况兼解答问题的速率更是唯独档。
依依色情在本轮测试中,DeepSeek的推崇号称优秀,通盘问题全部答对、解答速率快、有想考范例,反而是遐迩闻名的豆包、文心3.5再次折戟,未能解答出第三说念题,DeepSeek推崇出的实力远繁密于它的名气。
四、金融问题答疑:精确和会,给出了得当建议。面向通盘消费者的大谈话模子,于今大多仍免费提供干事,反而主攻是B端市集和主打专科功能的AI大模子,迟缓收费干事。C端市集用户众口难调,且很多东说念主不肯意付费使用,唯有打造专科使用场景,面向有对应需求的用户,AI公司方能有契机结束盈利。因而在第四轮测试中,小雷准备了一王人金融学问问题:
当市集利率上涨或下落时,债券价钱会怎样变化?投资者应怎样搪塞利率波动以保护债券投资组合价值?
这一轮测试中,通盘AI大模子给出的谜底大同小异,均能准确解读市利率变化和债券价钱的关系,并给出一些投资建议,包括漫步投资、缩小久期、投资债券基金等有筹算。
(图源:DeepSeek截图)
网上金融关系的信息过于紊乱,查询、挑选、提纯信息的经过也较为缺乏,AI能很好地不休这一问题,匡助咱们汇集关系信息并索取有效的推行。
金融问题关系测试中,小雷仍未开启联网搜索功能,DeepSeek给出的谜底中规中矩,与其他AI大模子拉不开差距,但这已实足阐述DeepSeek的优秀,毕竟它的教育老本仅557.6万好意思元。
追念:智商出乎预见,功能有待丰富测试DeepSeek-V3之前,小雷有点轻慢这款大模子,OpenAI教育GPT的老本以“亿好意思元”为单元,一个教育老本仅557.6万好意思元的AI大模子,推崇能高到哪去?适度实测适度狠狠给了小雷一巴掌。
几轮测试下来,除了险些通盘大模子都存在丢失要点的推行追念要津,其他几轮测试DeepSeek都拿到了高分,推崇涓滴不逊色国内遐迩闻名的文心一言、Kimi、豆包等AI大模子。
在数学题解答神志中,即便靠近豆包、文心3.5都未能给出正确谜底的贫穷,DeepSeek依然飞速解出谜底。讯飞星火和Kimi前次测试给出了失实谜底,此次告捷答对,普及幅度不小。
部分小伙伴看到这里可能就会合计,DeepSeek花几百万好意思元就能教育出这样优秀的大模子,OpenAI、百度、字节逾越都是在浪花钱。其实否则,DeepSeek纵令在逻辑推理方面推崇出色,但其功能枯竭是最大的问题,无法用于创作图片、PPT,也不提供智能体可选,功能相对较少。
(图源:豆包生成)
豆包、文心一言、ChatGPT等,则在野着“全能大模子”进发,即Any To Any,用户可以输入任何模态的推行,并输出任何模态的推行。针对很多专科限制,豆包、文心一言纷纷推出了对应的智能体,涵盖生存、学习、创作等方方面面,这是DeepSeek远不行及的。
关于以笔墨生成为主要需求的用户来说,DeepSeek-V3是一款可以的AI大模子,但若有更多需求,如写长篇演义、创作图片、投资狡计,豆包、Kimi等免费干事的AI大模子迥殊提供的智能体或然更合适。
虽然,DeepSeek也确乎作念到了花小钱办大事,通过更先进的MoE架构、多手艺交融优化、FP8搀杂精度教育框架等手艺,以及与开源社区协作的范例,在老本较低的情况下,就教育出笔墨生成和逻辑推明智商不输乃至最初主流AI大模子DeepSeek-V3。
教育老本崇高、竞争愈发强烈已成趋势,将来几年国表里将有广阔AI公司倒闭,怎样开源与节流已成AI公司必须想考的贫穷,DeepSeek攻讦老本的范例值得其他AI公司学习。
25年1月7日,CES(国际消费电子展) 2025 行将弥远开幕,雷科技报说念团已飞赴好意思国现场整备97播播,届时咱们将对CES张开全程专科报说念,敬请激情。
举报/响应