最近DeepSeek(深度求索)真的非常火,DeepSeek在24年12月26日推出对标GPT4o的V3之后,用户数就开始大量增长,在1月20日发布对标GPT-o1的R1之后开始迅速爆火,DeepSeek在美国下载排名从1月22日的201名比较出名的配资平台,到1月27日迅速登顶第一名;截至1月30日,DeepSeek已经在168个国家位居下载榜第一名了
图片
DeepSeek的爆火还一度带崩美股芯片股,英伟达股票在1月28日下跌17%,29日反弹7%之后30日又下跌4%(虽然英伟达说股票下跌和DeepSeek关系不大)
作为一个关注财经的博主,尝试的下载了几个关于DeepSeek的研报,想简单看看DeepSeek的厉害之处,结果发现稍微深入一点就看不懂了,一些最基本的名词还需要查,所以只能捡重点简单说
根据20250122-财通证券-DeepSeek-R1:强化学习+知识蒸馏,比肩o1的介绍DeepSeek主要的优点有三个:
1、DeepSeek大规模强化学习,成为首个不需要监督微调,完全依赖强化学习训练的语言大模型
要看懂这句话需要补充一些基础知识。首先大模型的训练过程主要分为两个阶段:预训练和后训练。预训练是通过大量数据的反复输入,先建立一个比较基础的大模型,这一阶段会有大量资金消耗。基础的大模型到可以使用的大模型中间还需要后训练的打磨,比如可以使用另一个基础大模型模仿人类进行反复提问,或者是OpenAI使用的人类反馈强化学习(RLHF),简单说就是人工对大模型产生的答案进行打分,以便不断优化答案
以上说到的需要借助人工打分标记或者人工提问的方式都可以称作“监督”,但是DeepSeek通过群组相对策略优化(GRPO)构建“智能体群体间的相对优势评估机制”,简单说就是不使用任何“监督”而使用完全自动化的强化学习步骤取代了监督微调和RLHF,使用机器对大模型的答案进行打分
2、DeepSeek使用知识蒸馏技术把R1模型里面的推理能力传递给其他模型
蒸馏技术早在2015年就被提出了,在Transformer模型之前,谷歌也有在使用蒸馏技术进行优化
我查了很多资料,对知识蒸馏技术的说法和举例存在一定的出入,我理解的知识蒸馏大概意思是:先有一个教师模型,这个模型已经比较成熟,可以解答各种复杂问题;还有一个学生模型,比较小,使用它去对教师模型进行学习(蒸馏),但并不是简单的“抄答案”。比如判断一个图片里面的物体,教师模型判断出来这是一个自行车,学生模型不是直接标记这是个自行车(这种标记被称为硬标记),而是参考教师模型的“思考方式”,进行软标记:这个图片95%是自行车,4%是电动车,1%是摩托车,顺便还学习了自行车和其他的车的相似性。这样的好处是小模型完成了大模型的任务,但是所需要的资源就少了很多,速度还更快
3、便宜,还是便宜
研报原文直接粘过来:
DeepSeekR1 API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,而OpenAI o1模型API服务定价为每百万输入tokens 55元(缓存命中)/110元(缓存未命中),每百万输出tokens是438元
图片
简单解释一下上面这段话里面的词:
API服务是应用程序编程接口服务,是不同软件系统之间的连接桥梁,比如在京东上面购物但使用微信进行付款,API把你的建议信息传递给了商家完成了交易,其实这个词不懂也无所谓,不太影响阅读
Token是自然语言处理(NLP)中的基本单位,代表文本或数据的最小单元,简单理解就是个单位
缓存可以简单理解成是用户和服务器中间的一部分资源的暂存站,如果需要的信息在缓存里面,就是“缓存命中”,这样就不用去服务器里面找信息了,速度就会快,也就便宜;如果缓存里面没有,也就是“缓存未命中”,那就得回服务器里面找了,那就慢一点,也就贵点
DeepSeek本来只想简单说说,但确实里面很多东西都不懂,写着写着就多了,如果有写的不对的地方请给我留言,十分感谢!
说完DeepSeek肯定需要提到它的母公司:幻方量化
幻方量化由梁文锋于2015年在杭州成立。2016年,幻方的第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用GPU进行计算。2017年,幻方的所有投资策略都实现AI化。2018年确立以 AI 为公司的主要发展方向,并且获得了私募的金牛奖。2019年,幻方自主研发了“萤火一号”训练平台,并且幻方私募规模已经达到百亿。2020年,“萤火一号”正式投入运作。2021年,幻方投入10亿元建设“萤火二号”。2023年,梁文锋宣布幻方正式进军通用人工智能领域,创办了DeepSeek
(参考材料:观察者网:DeepSeek创始人,一个“技术理想主义者”及幻方官网https://www.high-flyer.cn/history)
最后聊聊幻方的老本行:量化投资
量化投资简单来说就是用AI模型来炒股,大部分都没有基金经理主动选股,所有的买入卖出指令都是靠电脑自动进行,投资期间AI在不断地分析-判断-交易-分析-判断-交易,交易频率特别高
先简单说一下我对量化的态度,我觉得量化投资是一种很好的策略:
首先,从一些头部公司的业绩来看这种策略是有效的,能赚钱的就是好策略;其次,国内还是以散户为主,在不断向专业投资者为主的市场进化的过程中,量化也是很好的推动因素;最后,很多人一直在说量化影响了A股的生态,把很多下跌亏损的原因归集在量化投资上,我认为量化投资因为其策略的特殊性,可能还会涉及到对冲等策略,所以肯定会对A股有一定影响,但是影响肯定没有那么大,而且韭菜就算不被量化噶,还会被各种各样的其他东西排队等着噶
图片
最后,说说量化投资的具体策略,我们个人去选择股票肯定是有一定的依据,我们可能会看K线、PE、PB、交易量、公司季报,甚至是股票的名字(川大智胜
图片
),那么量化投资肯定是人给AI模型设置了很多对股票的考量参数(因子),通过这些因子的综合考量,来判断这支股票上涨的的概率大还是下跌的概率大,要上涨就买入,要下跌就卖出有可能涉及到的因子,在这里举几个例子,方便大家理解:
1、价值因子:市盈率(PE)、市净率(PB)、股息收益率
2、动量因子:过去12个月收益率、相对强弱指数
3、规模因子:市值、流通市值
4、情绪因子:投资者情绪指数、新闻情绪分析
5、技术因子:移动平均线、布林带
看完这些例子,大家大概就清楚了,量化投资其实就是AI把我们人能判断的所有选股因素全部考虑到了,按照不停地重复实践,不停的优化模型,来增强选股的成功率,但其实因子远远不止这些,而且里面因子的不断优化远比我们想象的要难得多
参考研报20250127-民生证券-量化专题报告:深度学习如何自适应市场状态以提升模型稳健性?里面的模型给大家截几个图看看
进行股票收益排序的预测方式:
图片
训练的设置(已经有点看不懂了):
图片
这个研报主要不是讲述Transformer训练的,上面的图只是给大家一个参考,让大家更好的理解量化投资,对原文有兴趣的话大家可以自行搜索~
量化策略我们在主线理财入门里面还会提到,到时候会讲讲量化增强和量化中性等策略,这篇文章就到这了
如果您觉得对您有帮助的话点个关注比较出名的配资平台,这是我不断更新的最大动力,谢谢~
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。