行业点评:ChatGPT推出语音和图像功能,多模态AI加速突破【开源计算机陈宝健团队】
(以下内容从开源证券《行业点评:ChatGPT推出语音和图像功能,多模态AI加速突破【开源计算机陈宝健团队】》研报附件原文摘录)
评论 1、事件:ChatGPT推出语音和图像功能 9月25日,OpenAI在官网发文表示在ChatGPT推出语音和图像功能,未来两周将向Plus和Enterprise用户推出,语音功能支持iOS和Android平台,图像功能支持全平台。 (1)语音功能:用户可以与ChatGPT进行语音对话,让ChatGPT讲故事、读诗等。语音输入端,由开源语音识别系统Whisper将口语转录为文本;语音输出端,由新的文本转语音模型支持,可以从文本和几秒的语音样本中生成类似人类的音频。 (2)图像功能:用户可以用图片向ChatGPT提问,支持多轮对话和多图识别,比如拍下冰箱照片询问ChatGPT晚餐吃什么。从OpenAI官网展示的应用案例来看,ChatGPT可以根据用户上传的自行车、说明书、工具箱照片,指引用户完成自行车座椅的调节。 2、谷歌和OpenAI持续加码,多模态AI加速突破 在5月的I/O大会上,谷歌推出对标GPT-4的大模型PaLM2,同时表示未来研究重心正转向多模态的Gemini。9月20日,OpenAI宣布推出新版文生图AI工具DALL-E3,DALL-E3通过集成ChatGPT能力实现多项升级。此前,根据The Information报告,OpenAI即将推出多模态大模型GPT-vision。谷歌、OpenAI等科技巨头纷纷加码,多模态AI加速突破。 3、多模态大模型推动AI迈向“通感”时代,算力需求将大幅提升 随着人工智能感知、交互和生成能力的快速发展,多模态大模型正推动人工智能迈进“通感”时代,应用场景和生态也将进一步丰富。语音和图像数据大小显著高于文本,多模态大模型训练和推理的算力需求将大幅提升。根据SemiAnalysis表示,谷歌下一代多模态大模型Gemini已开启训练,算力达到1e26 FLOPS,是训练GPT-4算力的5倍。孟晚舟在2023华为全球分析师大会上表示,预计到2030年通用计算能力将增长10倍,AI计算能力将增长500倍,AI算力有望持续高景气。 4、投资建议 龙头推荐金山办公、科大讯飞、同花顺、三六零等。应用领域,推荐鼎捷软件、彩讯股份、焦点科技、拓尔思、致远互联等,受益标的包括泛微网络、普元信息、汉仪股份、新致软件、福昕软件、万兴科技、汉得信息等。底层算力领域,服务器端推荐中科曙光、浪潮信息,受益标的包括紫光股份等;GPU端,推荐海光信息,受益标的包括寒武纪、景嘉微等;华为昇腾生态,推荐卓易信息、神州数码等,受益标的包括四川长虹、烽火通信、拓维信息、同方股份等。AI监管领域,受益标的包括美亚柏科、永信至诚、人民网等。 风险提示:AI落地不及预期;市场竞争加剧风险;公司研发不及预期风险。 注:上述报告内容详见开源证券公司行业点评报告20230926:《 ChatGPT推出语音和图像功能,多模态AI加速突破》 陈宝健,执业证书编号:S0790520080001 闫宁,执业证书编号:S0790523080003 法律申明 开源证券股份有限公司是经中国证监会批准设立的证券经营机构,具备证券投资咨询业务资格。 本报告仅供开源证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告是发送给开源证券客户的,属于商业秘密材料,只有开源证券客户才能参考或使用,如接收人并非开源证券客户,请及时退回并删除。 本报告是基于本公司认为可靠的已公开信息,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他金融工具的邀请或向人做出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突,不应视本报告为做出投资决策的唯一因素。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。本公司未确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。若本报告的接收人非本公司的客户,应在基于本报告做出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。 本报告可能附带其它网站的地址或超级链接,对于可能涉及的开源证券网站以外的地址或超级链接,开源证券不对其内容负责。本报告提供这些地址或超级链接的目的纯粹是为了客户使用方便,链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。 开源证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。开源证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。 本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。
评论 1、事件:ChatGPT推出语音和图像功能 9月25日,OpenAI在官网发文表示在ChatGPT推出语音和图像功能,未来两周将向Plus和Enterprise用户推出,语音功能支持iOS和Android平台,图像功能支持全平台。 (1)语音功能:用户可以与ChatGPT进行语音对话,让ChatGPT讲故事、读诗等。语音输入端,由开源语音识别系统Whisper将口语转录为文本;语音输出端,由新的文本转语音模型支持,可以从文本和几秒的语音样本中生成类似人类的音频。 (2)图像功能:用户可以用图片向ChatGPT提问,支持多轮对话和多图识别,比如拍下冰箱照片询问ChatGPT晚餐吃什么。从OpenAI官网展示的应用案例来看,ChatGPT可以根据用户上传的自行车、说明书、工具箱照片,指引用户完成自行车座椅的调节。 2、谷歌和OpenAI持续加码,多模态AI加速突破 在5月的I/O大会上,谷歌推出对标GPT-4的大模型PaLM2,同时表示未来研究重心正转向多模态的Gemini。9月20日,OpenAI宣布推出新版文生图AI工具DALL-E3,DALL-E3通过集成ChatGPT能力实现多项升级。此前,根据The Information报告,OpenAI即将推出多模态大模型GPT-vision。谷歌、OpenAI等科技巨头纷纷加码,多模态AI加速突破。 3、多模态大模型推动AI迈向“通感”时代,算力需求将大幅提升 随着人工智能感知、交互和生成能力的快速发展,多模态大模型正推动人工智能迈进“通感”时代,应用场景和生态也将进一步丰富。语音和图像数据大小显著高于文本,多模态大模型训练和推理的算力需求将大幅提升。根据SemiAnalysis表示,谷歌下一代多模态大模型Gemini已开启训练,算力达到1e26 FLOPS,是训练GPT-4算力的5倍。孟晚舟在2023华为全球分析师大会上表示,预计到2030年通用计算能力将增长10倍,AI计算能力将增长500倍,AI算力有望持续高景气。 4、投资建议 龙头推荐金山办公、科大讯飞、同花顺、三六零等。应用领域,推荐鼎捷软件、彩讯股份、焦点科技、拓尔思、致远互联等,受益标的包括泛微网络、普元信息、汉仪股份、新致软件、福昕软件、万兴科技、汉得信息等。底层算力领域,服务器端推荐中科曙光、浪潮信息,受益标的包括紫光股份等;GPU端,推荐海光信息,受益标的包括寒武纪、景嘉微等;华为昇腾生态,推荐卓易信息、神州数码等,受益标的包括四川长虹、烽火通信、拓维信息、同方股份等。AI监管领域,受益标的包括美亚柏科、永信至诚、人民网等。 风险提示:AI落地不及预期;市场竞争加剧风险;公司研发不及预期风险。 注:上述报告内容详见开源证券公司行业点评报告20230926:《 ChatGPT推出语音和图像功能,多模态AI加速突破》 陈宝健,执业证书编号:S0790520080001 闫宁,执业证书编号:S0790523080003 法律申明 开源证券股份有限公司是经中国证监会批准设立的证券经营机构,具备证券投资咨询业务资格。 本报告仅供开源证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告是发送给开源证券客户的,属于商业秘密材料,只有开源证券客户才能参考或使用,如接收人并非开源证券客户,请及时退回并删除。 本报告是基于本公司认为可靠的已公开信息,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他金融工具的邀请或向人做出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突,不应视本报告为做出投资决策的唯一因素。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。本公司未确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。若本报告的接收人非本公司的客户,应在基于本报告做出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。 本报告可能附带其它网站的地址或超级链接,对于可能涉及的开源证券网站以外的地址或超级链接,开源证券不对其内容负责。本报告提供这些地址或超级链接的目的纯粹是为了客户使用方便,链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。 开源证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。开源证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。 本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。