首页 > 公众号研报 > 【银河计算机吴砚靖】行业点评丨国产开源MoE模型DeepSeek-V2性能媲美GPT-4,大模型价格战拉开帷幕

【银河计算机吴砚靖】行业点评丨国产开源MoE模型DeepSeek-V2性能媲美GPT-4,大模型价格战拉开帷幕

作者：微信公众号【中国银河证券研究】/ 发布时间：2024-05-14 / 悟空智库整理

（以下内容从中国银河《【银河计算机吴砚靖】行业点评丨国产开源MoE模型DeepSeek-V2性能媲美GPT-4,大模型价格战拉开帷幕》研报附件原文摘录）
　　【报告导读】 1. 性能直逼GPT-4 Turbo，综合能力位于大模型第一梯队。 2. DeepSeek-V2训练计算量降低，推理能力表现高效。 3. API价格降至约GPT-4 Turbo百分之一，大模型价格战即将拉开帷幕，利好AI应用层快速渗透。核心观点事件：5月7日，知名私募巨头幻方量化旗下的AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2。性能直逼GPT-4 Turbo，综合能力位于大模型第一梯队。DeepSeek-V2是一个参数为2360亿的MoE模型，每个token仅激活210亿参数，支持128K的上下文长度。1）纵向对比：对比去年11月发布的DeepSeek 67B性能取得显著提升，训练成本节省了42.5%，KV缓存减少了93.3%，最大生成吞吐量提高到了5.76倍。2）横向对比：上下文长度对标GPT-4 Turbo（128K）；中文综合能力（AlignBench）超越Llama 3，在开源模型中表现最强，与文心4.0等闭源模型在评测中处于同一梯队，仅次于GPT-4 Turbo；英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B处于同一梯队，超过MoE开源模型Mixtral 8x22B。此外在知识、数学、推理、代码等方面也有出色的性能。 DeepSeek-V2训练计算量降低，推理能力表现高效。DeepSeek-V2训练数据集是由8.1T token的高质量、多源预训练语料库组成，采用的Transformer架构中由一个注意力模块和一个前馈网络（FFN）组成，并且在注意力机制和FFN方面采用了创新架构：一方面设计了MLA（Multi-head Latent Attention），利用低秩键值联合压缩来消除推理时键值缓存的瓶颈，DeepSeek-V2消耗的显存（KV Cache）只有同级别Dense模型的1/5-1/100，每token成本大幅降低；另一方面，FFN采用高性能MoE架构DeepSeekMoE，以经济的成本训练强大的模型。我们认为，DeepSeek-V2大幅提升训练效率，训练所需计算量约为GPT-4的1/20，但性能基本上相差无几，目前来看参数是影响大模型性能的关键因素之一，除此之外，架构优化能有效提升降低训练成本，提升训练效率，将成为另一个影响大模型性能的关键因素。 API价格降至约GPT-4 Turbo百分之一，大模型价格战即将拉开帷幕，利好AI应用层快速渗透。目前DeepSeek-V2 API定价为每百万token输入1元、输出2元（32K上下文），几乎低于所有市面上主流大模型价格，约为GPT-4 Turbo的1/100。我们认为，DeepSeek-V2提升数据集质量及优化架构，成本大幅降低，在价格方面提升竞争力，大模型将逐渐进入价格战时期，AI应用将快速渗透。投资建议国产大模型迭代加速，训练成本降低，进一步加速应用端落地，而应用端推广又将进一步催生算力新需求。建议重点关注：1、国产算力：海光信息、中科曙光、神州数码、曙光数创、润泽科技；2、大模型及多模态：科大讯飞、昆仑万维（传媒覆盖）、万兴科技、拓尔思、海康威视、大华股份、商汤-W（0020.HK）；3、AI 医疗：嘉和美康、卫宁健康；4、AI 办公：金山办公、彩讯股份；5、AI 教育：科大讯飞、欧玛软件、拓维信息；6、AI 法律：通达海、金桥信息、华宇软件；7、AI 金融：恒生电子、财富趋势、同花顺；8、AI 能源：国网信通、国能日新等。风险提示技术研发进度不及预期风险；供应链风险；政策推进不及预期风险；消费需求不及预期风险；行业竞争加剧风险。如需获取报告全文，请联系您的客户经理，谢谢！本文摘自：中国银河证券2024年5月13日发布的研究报告《【银河计算机】行业点评_国产开源MoE模型DeepSeek-V2性能媲美GPT-4，大模型价格战拉开帷幕》分析师：吴砚靖研究助理：胡天昊评级体系：评级标准为报告发布日后的6到12个月行业指数（或公司股价）相对市场表现，其中：A 股市场以沪深 300指数为基准，新三板市场以三板成指（针对协议转让标的）或三板做市指数（针对做市转让标的）为基准，北交所市场以北证50指数为基准，香港市场以摩根士丹利中国指数为基准。行业评级推荐：相对基准指数涨幅10%以上。中性：相对基准指数涨幅在-5%～10%之间。回避：相对基准指数跌幅5%以上。公司评级推荐：相对基准指数涨幅20%以上。谨慎推荐：相对基准指数涨幅在5%～20%之间。中性：相对基准指数涨幅在-5%～5%之间。回避：相对基准指数跌幅5%以上。法律申明：本公众订阅号为中国银河证券股份有限公司（以下简称“银河证券”）研究院依法设立、运营的两个研究官方订阅号之一（另一为“中国银河宏观”）。其他机构或个人在微信平台以中国银河证券股份有限公司研究院名义注册的，或含有“银河研究”，或含有与银河研究品牌名称等相关信息的其他订阅号均不是银河研究官方订阅号。本订阅号不是银河证券研究报告的发布平台，本订阅号所载内容均来自于银河证券研究院已正式发布的研究报告，本订阅号所摘录的研究报告内容经相关流程及微信信息发布审核等环节后在本订阅号内转载，本订阅号不承诺在第一时间转载相关内容，如需了解详细、完整的证券研究信息，请参见银河证券研究院发布的完整报告，任何研究观点以银河证券发布的完整报告为准。本订阅号旨在交流证券研究经验。本订阅号所载的全部内容只提供给订阅人做参考之用，订阅人须自行确认自己具备理解证券研究报告的专业能力，保持自身的独立判断，不应认为本订阅号的内容可以取代自己的独立判断。在任何情况下本订阅号并不构成对订阅人的投资建议，并非作为买卖、认购证券或其它金融工具的邀请或保证，银河证券不对任何人因使用本订阅号发布的任何内容所产生的任何直接或间接损失或与此有关的其他损失承担任何责任，订阅号所提及的任何证券均可能含有重大的风险，订阅人需自行承担依据订阅号发布的任何内容进行投资决策可能产生的一切风险。本订阅号所载内容仅代表银河证券研究院在相关证券研究报告发布当日的判断，相关的分析结果及预测结论，会根据银河证券研究院后续发布的证券研究报告，在不发出预先通知的情况下做出更改，敬请订阅者密切关注后续研究报告的最新相关结论。本订阅号所转发的研究报告，均只代表银河证券研究院的观点。本订阅号不保证银河证券其他业务部门或附属机构给出与本微信公众号所发布研报结论不同甚至相反的投资意见，敬请订阅者留意。《证券期货投资者适当性管理办法》于2017年7月1日起正式实施，通过微信订阅号发布的本图文消息仅面向银河证券客户中的机构专业投资者，请勿对本图文消息进行任何形式的转发。若您并非银河证券客户中的机构专业投资者，为保证服务质量、控制投资风险，请取消关注，请勿订阅、接收或使用本订阅号中的任何信息。本订阅号所载内容的版权归银河证券所有，银河证券对本订阅号保留一切法律权利。订阅人对本订阅号发布的所有内容（包括文字、影像等）的复制、转载，均需注明银河研究的出处，且不得对本订阅号所在内容进行任何有悖原意的引用、删节和修改。投资有风险，入市请谨慎。

大部分微信公众号研报本站已有pdf详细完整版：https://www.wkzk.com/report/（可搜索研报标题关键词或机构名称查询原报告）

郑重声明：悟空智库网发布此信息的目的在于传播更多信息，与本站立场无关，不构成任何投资建议。

【银河计算机吴砚靖】行业点评丨国产开源MoE模型DeepSeek-V2性能媲美GPT-4,大模型价格战拉开帷幕

每日观点丨期货行情观点1122

【行情解析】棕榈油:谨防高位波动性风险加剧

光期能化:LLDPE强势上涨的背后——供需变局与策略应对

期市早班车 | 观点概览、品种解读

【周度关注】原油:EIA周度库存报告

【专题研究】期权:量化视角评估期权组合效益(一)

晨会聚焦241122

早盘 | 早盘提示