您好,欢迎来到游6网!

当前位置:首页 > 软件教程 > DeepSeek R1后,AI应用、职业与行业!

DeepSeek R1后,AI应用、职业与行业!

发布时间:2025-04-23    编辑:游乐网

deepseek r1后,ai应用、职业与行业!

Datawhale经验

作者:长琴,Datawhale成员

最近,我突然想写一些关于应用和开发的文章。一方面,越来越多的企业和朋友问我如何利用DeepSeek;另一方面,这个领域的职业和行业也在悄然发生变化。既然如此,不妨一起梳理一下,并记录下来。

行业变化

主要从就业、应用和研究三个方面展开讨论。

就业

自从DeepSeek(或ChatGPT)爆红后,最焦虑的应该是第一线的NLP和LLM从业者,我自己也身在其中。专门从事大模型开发的团队(如DeepSeek、达摩院等)数量稀少,门槛极高,导致大多数从业者集中在“应用”和“业务”方面。然而,LLM的发展速度如此之快,应用开发的门槛不断降低,我在2023年的《ChatGPT影响冲击:职业、行业与产业 | Yam》[1]一文中就提到过,当时已深感焦虑。R1发布后,所有LLM似乎都需要进行一次R1升级,而且它还在不断进化,LLM变得越来越聪明,我们的焦虑也越来越多。

现在明显能感受到的趋势是,绝大多数与应用相关的职位几乎都集中在Agent开发上,不需要训练模型,但对工程能力有要求;反之,对于工程开发人员,则需要了解算法的基本知识。按理说,职位增多不应感到焦虑,但实际上,虽然职位增多了,但“好职位”并不多。而且由于职位增多,进入这一领域的人也更多,包括之前从事NLP的、开发人员、其他领域转行的人,以及大量毕业生。我认为这一趋势不可阻挡,而且会愈演愈烈。当LLM聪明到一定程度后,剩下的就是大量的应用工作。LLM还需要继续研究吗?当然需要!但那只是不到1%的人和企业要做的,突破是渐进式的,不可能一步跨出很大步,足够聪明的LLM已经能够在很多地方发挥作用,整个社会的跟进需要时间。等到下一次大突破,无非就是重新开始现在的循环。

应用

一年前的Agent可能还比较简单,现在的Agent已经相当复杂了。虽然一句话完成一个需求(如MetaGPT[2])目前大部分时候还不可用,但这只是暂时的。一方面,AI还在不断进步,另一方面,Agent相关的标准也在不断完善(如MCP[3])。一旦很多东西标准化了,AI表现出来的威力将突破性地增强。根据我自己的经验,目前的Agent在执行复杂任务时有一个很大的问题——中间某个环节出问题后,需要耗费大量的时间和Token才有可能解决,很多时候还解决不了。这当然可能是AI不够聪明,但更多的问题还是标准化不足,类似MCP这样的协议有望解决这一问题。

顺便科普一下,简单来说,MCP就是将与LLM交互的各种组件统一成不同的模块服务,它提供了一种将AI模型连接到不同数据源和工具的标准化方式。从LLM的角度看,它标准化了应用程序如何为LLM提供上下文。例如,你让LLM帮你在电脑里找一个文件,一般我们都会借助一个软件来完成(比如Windows的Everything、Linux的find命令等),这时候就可以写一个类似的Server(比如就叫Everything MCP Server),然后LLM就通过这个Server使用具体的软件,LLM侧是比较清爽简单的,所有“变”和“不一样”的东西都放在这个MCP Server这里,类似于一个适配于LLM的Adapter。我只能说,潜力无限!在此之上就是各种Agent工具啦,比如现在比较有名的扣子,它允许用户通过工作流的方式创建复杂Agent和应用。我相信它底层的通用模块应该也是有类似MCP Server这样的Adapter的。随着Agent和应用不断复杂,是一定需要单独抽一层这样的Adapter出来的。

研究

多模态自不必说,就LLM方向其实也还有很多可以做的工作,尤其是与RL结合,大有可为(感兴趣的读者可以关注hscspring/rl-llm-nlp: Reinforcement Learning in LLM and NLP.[4])。这里顺带说一下我自己的两个感觉。第一个就是LLM相关的前沿论文大部分都来自国内机构或华人作者,这个趋势近两年是越来越明显,中国人的卷真不是吹的。第二个就是高品质前沿资料也开始集中在中文社区,尤其是知乎和微信公众号,有不少高质量的内容,虽然也不是很多,但相比英文社区貌似好很多。现在搜索前沿内容,能搜到的英文社区的资料越来越少了。感觉R1之后,算法领域国内比国外沸腾的更厉害。

另一个方向是模型架构方面的优化,DeepSeek在这方面走的很快,近期提出了NSA[5],Kimi也提出了类似的MoBA[6],以及优化了新的更省资源的优化器Muon[7],还有YOLU-12[8]对Attention架构的优化,近期何恺明大神的Transformers without Normalization[9]。相关的工作层出不穷,且看起来都相当有吸引力。还有量化、蒸馏方向也不断有新的成果出现。

除此之外,Agent方向的算法也在逐步发展,比如搞Scaling的camel[10],以及相关的应用OWL[11],还有相关的具身智能、世界模型,AI方向的研究如火如荼。

值得一提的是,以上提到的很多研究都是国内公司或华人主导。R1之后,据说很多之前专搞LLM的都压力山大,不知道又在埋头憋什么大招。AI可能从来没像今天这样繁荣。这块内容就不展开多说了,实在是有点多,感兴趣的读者可以关注我的博客。

职业变化

这部分主要梳理岗位和职业方向的变化。

岗位

这里主要探讨一下大部分LLM算法工程师这个职业的工作内容,目前看来主要是下面这么几个方向。

第一,基于LLM做业务开发。说到做业务,Agent就是标配,最简单的Agent就是一个LLM+RAG,复杂的就涉及到多个LLM、多个环节、多个组件。这个工作内容的工程能力要求大于算法能力,尤其是架构设计能力。

第二,LLM模型优化。R1后出现了一些新的范式,让我们有可能用更低的成本和更小的模型达到更好的效果,小模型(SLM)的春天来了。无论从成本、效率还是端侧部署考虑,模型优化都值得投入,但投入确实不需要那么多。因为推理方向进展太迅速,成本下降趋势明显,当大模型的推理成本低到一定程度时,优化小模型就显得多此一举了。同等条件下模型越大效果越好,这是真理。

第三,Agent交互优化。这是个老瓶装新酒的方向,其实就是LLM前用强化搞Agent那一套。目前研究还不多,主要是业界都还处于“构建”Agent阶段,这个属于优化方向。等大部分Agent构建完成要进一步提升效果时,老瓶的RL可能会登场。

热门合集

MORE

+

MORE

+

变态游戏推荐

MORE

+

最新专题

MORE

+

热门游戏推荐

MORE

+

关于我们  |  游戏下载排行榜  |  专题合集  |  端游游戏  |  手机游戏  |  联系方式: youleyoucom@outlook.com

Copyright 2013-2019 www.youleyou.com    湘公网安备 43070202000716号

声明:游6网为非赢利性网站 不接受任何赞助和广告 湘ICP备2022003375号-4