首页 > 公众号研报 > 【国信传媒】AIGC周度更新第三十期(20240318-20240324)

【国信传媒】AIGC周度更新第三十期(20240318-20240324)

作者:微信公众号【观媒万象】/ 发布时间:2024-03-25 / 悟空智库整理
(以下内容从国信证券《【国信传媒】AIGC周度更新第三十期(20240318-20240324)》研报附件原文摘录)
  本周大模型及算法进展 海外模型方面,1)大模型上,OpenAI或在今年年中发布GPT-5大模型,或包括调用AI代理自主执行任务功能;马斯克旗下大模型公司xAI宣布开源3140亿参数的混合专家(MoE)模型Grok-1,以及该模型的权重和网络架构。2)图生3D模型方面,Stability AI开源图生3D模型SV3D,只用一张图片就能生成高质量3D网格;3)音乐生成模型方面,人工智能初创公司Suno发布v3版本AI音乐生成模型,几秒生成两分钟歌曲。 国内模型方面,1)语言模型在长文本处理方面取得新的突破。通用人工智能创业公司“月之暗面”(Moonshot AI)的Kimi Chat智能助手已支持200万字超长无损上下文;阿里通义千问升级,将免费开放1000万字长文档处理功能;百度即将免费开放200万-500万长文本能力。2)国内大模型参数量及模型能力持续增长。腾讯混元采用混合专家模型结构,已扩展为万亿参数规模,目前已具备文生图、视频生成等能力;通用大模型创业公司阶跃星辰发布Step-2万亿参数MoE语言大模型预览版。3)轻量化模型方面,百度智能云发布包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内的三款轻量级大模型,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销;4)垂类模型方面,淘宝“星辰”大模型亮相,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。 B端工具及垂类应用,1)AI+硬件端方面,苹果正在洽谈将谷歌的Gemini人工智能引擎植入iPhone,以便让苹果授权谷歌的生成式人工智能模型Gemini,为今年iPhone软件的一些新功能提供动力;2)AI+电商,亚马逊推出电商AI工具,可辅助生成产品详情、标题等,已有超10万卖家使用过AI生成工具;3)AI+设计,Adobe首次将Firefly生成式AI功能集成到Substance 3D Sampler和Stager中,使工业设计师、游戏开发人员和VFX专业人士的3D工作流程更加无缝和高效;4)AI+游戏,腾讯发布GiiNEX游戏AI引擎,用AIGC助力游戏研发运营;5)AI+视频,OpenAI拟携Sora进军电影市场,在娱乐行业建立合作关系,同时鼓励电影制片人将Sora工具融入到他们的创作流程中。 C端应用及服务,1)Chatbot方面,阿里大模型产品“通义听悟”上线音视频问答助手“小悟”、一键AI改写、思维导图生成等六大功能;知乎发布全新AI功能“发现·AI搜索”, 以社区可信赖内容为来源,给用户带来集搜索、实时问答和追问功能于一体的全新体验。2)AI视频方面,国内首部AI全流程微短剧《中国神话》启播;3)AI+浏览器方面,360 AI浏览器APP即将上线,支持500万字长文本处理。 重要上市公司变化方面,1)完美世界端游《诛仙世界》正式接入英伟达Audio2Face技术;2)芒果超媒:国内首个AI导演上岗,将在《我们仨》中以助理导演的身份与嘉宾共同参与节目;3)中文在线成为阶跃大模型应用重要合作伙伴。 01 大模型&算法 【消息称OpenAI将在今年年中发布GPT-5大模型,或在今年夏天期间(凤凰网科技)】 知情人士称,OpenAI将在今年年中的某个时候发布GPT-5,很可能是在今年夏天期间。一些企业客户最近已经收到了GPT-5大模型及其对ChatGPT相关改进的演示。“它的性能非常棒,提升很大。”一位看过GPT-5大模型演示的CEO表示。该CEO表示,OpenAI使用他的公司独有的用例和数据展示了GPT-5。他说,OpenAI还提到了该模型尚未发布的其他功能,包括调用OpenAI正在开发的AI代理来自主执行任务。 【OpenAI申请Voice Engine新商标,或将开发一款AI个人助理(金融界)】 OpenAI正在申请一个新商标Voice Engine,商标的覆盖范围主要是围绕语音识别、语音合成和语音生成几个方面。这暗示着OpenAI可能即将推出围绕语音引擎开发的产品或者服务,很有可能是类似Siri那样的个人助理产品。尽管这是商标申请,但是谷歌前雇员透露的信息以及上个月泄露的OpenAI正在开发的Agent产品都似乎印证着OpenAI要做的事情:开发一个全球最强的个人助理,接管个人设备,以Jarvis那样的形式提供服务。此前,谷歌前雇员Jonathan Chavez在X平台上也发布过一个消息,他说OpenAI在今年会推出一个全球最好的个人助理产品,就像钢铁侠中的Jarvis。 【马斯克旗下xAI开源Grok-1:3140亿参数,权重架构全开放(机器之心)】 今天凌晨,马斯克旗下大模型公司xAI宣布开源3140亿参数的混合专家(MoE)模型Grok-1,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。Grok-1的模型细节包括如下:基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;3140亿参数的MoE模型,在给定token上的激活权重为25%;2023年10月,xAI使用JAX库和Rust语言组成的自定义训练堆栈从头开始训练。xAI遵守Apache 2.0许可证来开源Grok-1的权重和架构。 【月之暗面Kimi智能助手宣布支持200万字无损上下文(36氪)】 通用人工智能创业公司“月之暗面”(Moonshot AI)宣布在大模型上下文窗口技术上取得新的突破,Kimi Chat智能助手已支持200万字超长无损上下文,并于即日起开启产品“内测”。 【月之暗面:所有合规开发者和企业均可接入(财联社)】 3月22日电,针对Kimi概念股近期的股价波动, Kimi 智能助手的开发商北京月之暗面科技有限公司回应称,月之暗面的开放平台(platform.moonshot.cn)是面向所有开发者和企业用户开放的,任何合规的开发者和企业,都可以将 Kimi 智能助手背后的同款大模型API(应用程序编程接口)接入到自己的产品或服务中,基于 Kimi 大模型的长文本处理和指令遵循能力,升级或打造全新的、有创造力的产品或服务。 【Suno发布v3版本AI音乐生成模型,几秒生成两分钟歌曲(Suno)】 人工智能初创公司Suno今天正式宣布推出v3版本的AI音乐生成模型,可在几秒钟内创建完整的两分钟歌曲,现在所有用户都可以通过Suno的官网进行使用。v3版本提供了更好的音频质量、更多音乐风格流派、更好的一致性,包括更少的幻觉和更优雅的歌曲结尾。 【Stability AI开源上新:3D生成引入视频扩散模型SV3D(量子位)】 Stable Diffusion背后公司Stability AI又上新了。这次带来的是图生3D方面的新进展:基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。Stable Video Diffusion(SVD)是Stability AI此前推出的高分辨率视频生成模型。也就是说,此番登场的SV3D首次将视频扩散模型应用到3D生成领域。官方表示,基于此,SV3D大大提高了3D生成的质量和视图一致性。 【腾讯混元大模型参数规模扩至万亿,去年视频号总用户数使用时长翻番(财联社)】 腾讯控股发布的2023年度业绩透露出信号:得益于视频号、AI大模型等多项业务渐露头角,代表数实经济的腾讯三大主业之一金融科技及企业服务业实现了双位数增长。腾讯在财报中首度披露腾讯混元采用混合专家模型结构,已扩展为万亿参数规模。财报显示,目前腾讯混元大模型已具备文生图、视频生成等能力。腾讯内部超过400个业务及场景已接入腾讯混元测试。 【360安全大模型3.0正式发布(科创板日报)】 20日讯,360安全大模型3.0今日发布。360集团首席科学家兼360数字安全集团CTO潘剑锋称,“我们参考了人类大脑的运行逻辑,构建360安全大模型3.0框架。实际应用中,在多个专业任务效果上超过GPT4。” 【百度智能云宣布发布3款轻量级大模型+2款场景大模型(新浪科技)】 百度智能云召开千帆产品发布会,发布包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内的三款轻量级大模型。相比千亿级别参数的大模型,轻量级大模型的参数量更小,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销。此外,百度智能云ModelBuilder还基于百度自身业务沉淀,推出了ERNIE Character和ERNIE Functions两款垂直场景大模型。 【淘宝“星辰”大模型亮相,布局电商和生活服务场景(Tech星球)】 淘宝天猫集团自研大模型“星辰淘宝”官网已经上线,这也是淘天集团公开的首个自研大模型。官网除了显示该大模型的介绍外,还设置有“立即体验”和“登录/注册“入口,或将在不久对外开放。据悉,星辰大模型基于Transformer架构,采用半自研的Megatron-ama框架进行训练,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。 【阿里通义千问升级:免费开放1000万字长文档处理功能(科创板日报)】 22日讯,阿里通义千问今日升级,向所有人免费开放1000万字的长文档处理功能。即日起,可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。 【微软同意向AI公司支付6.5亿美元现金 纳入其大模型和人才(科创板日报)】 22日讯,知情人士透露,微软已经同意向人工智能初创公司Inflection支付大约6.5亿美元现金,这笔交易将允许微软使用该公司的大模型,并雇佣这家初创公司的大部分员工,包括其联合创始人。Inflection将利用这笔许可费支付给Freylock、Dragoneer等一些投资者,这些投资者将获得1.5倍回报。据悉,Inflection在2023年6月从微软与英伟达融资13亿美元,在现金和云信贷方面人工智能领域取得成果。该公司已建立自己的大模型,并运行一个名为“Pi”的聊天机器人,如今月活已达100万人。 【财跃星辰发布国内首个千亿参数多模态金融大模型(科创板日报)】 23日讯 ,国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”今日在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训练,具备强大的通用图像处理和图表理解能力,相比GPT-4等通用大模型在金融知识理解方面更为突出。财跃星辰由上海报业集团旗下界面财联社与国内头部通用大模型公司阶跃星辰联合创办,前微软全球副总裁姜大昕任首席科学家。公司围绕金融信息服务、智能投顾、智能投研等场景,助力金融机构打造新质生产力。 【阶跃星辰发布Step-2万亿参数MoE语言大模型预览版(科创板日报)】 23日讯,在今日上海开幕的2024全球开发者先锋大会上,通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰研发的Step-1V 千亿参数多模态大模型,在中国权威的大型模型评估平台“司南”(OpenCompass)多模态模型评测榜单中位列第一,性能比肩 GPT-4V。阶跃星辰创始人、CEO姜大昕博士在大会上正式对外发布了Step-2万亿参数MoE语言大模型预览版。模型采用 MoE 架构,聚焦深度智能的探索,并提供API接口给部分合作伙伴试用。据了解,参数量从千亿到万亿,对算力、系统、数据、算法四个方面都提出了极高的要求,业内只有极少数公司能做到。训练万亿参数模型体现了阶跃星辰的核心技术能力,也表明阶跃星辰在通用人工智能领域追赶OpenAI的实力和决心。 【百度即将免费开放200万-500万长文本能力(科创板日报)】 22日讯,百度文心一言下个月将进行版本升级,届时也将开放长文本能力,文字范围会在200万-500万。目前,文心一言的文本上限大致在2.8万字。 【Colossal-AI团队全面开源全球首个类Sora架构视频生成模型Open-Sora 1.0(机器之心)】 继2周前推出成本直降46%的Sora训练推理复现流程后,Colossal-AI团队全面开源全球首个类Sora架构视频生成模型Open-Sora 1.0,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球AI热爱者共同推进视频创作的新纪元。 02 工具&垂类应用(2B) 【苹果公司据悉洽谈将谷歌的Gemini嵌入iPhone(界面新闻)】 知情人士称,苹果公司正在洽谈将谷歌的Gemini人工智能引擎植入iPhone。这两家公司正在积极谈判,以便让苹果授权谷歌的生成式人工智能模型Gemini,为今年iPhone软件的一些新功能提供动力。知情人士还称,苹果最近还与OpenAI进行了讨论,并考虑使用其模型。 【亚马逊推出电商AI工具 可辅助生成产品详情、标题等(财联社)】 3月19日电,近日,亚马逊透露,已上线AI新功能,可帮助卖家自动生成亚马逊产品详情页面。据介绍,AI工具可以利用卖家提供的关键词、产品图片等,自动生成产品标题、描述以及其他详细信息。目前该功能仍处于早期应用阶段,但已有超10万卖家使用过AI生成工具。 【Adobe将Firefly生成式AI引入Substance 3D设计软件(The Verge)】 Adobe首次将Firefly生成式AI功能集成到Substance 3D Sampler和Stager中,使工业设计师、游戏开发人员和VFX专业人士的3D工作流程更加无缝和高效,提供的文本到纹理和生成背景功能大大加速了传统上耗时且复杂的3D纹理和分段任务。 【腾讯发布GiiNEX游戏AI引擎,用AIGC助力游戏研发运营(快科技)】 3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术,GiiNEX将为游戏全生命周期提供丰富的AI解决方案。借助大模型等生成式AI技术,GiiNEX面向AI NPC、场景制作、内容生成等场景,提供了包括2D图像、动画、3D城市、剧情、对话、关卡以及音乐等多样化的AIGC能力,帮助开发者提升高质量内容生成的效率。 【OpenAI拟携Sora进军电影市场,安排下周与电影工作室和导演们开会(财联社)】 周五有媒体报道称,OpenAI将在下周前往洛杉矶,与一众好莱坞电影公司、媒体行业高管和经纪公司展开会面。主要目的有二:首先是在娱乐行业建立合作关系,同时鼓励电影制片人将Sora工具融入到他们的创作流程中。 03 应用及服务(2C) 【阿里大模型产品“通义听悟”发布音视频问答助手等新功能(财联社)】 3月19日电,阿里大模型产品“通义听悟”3月19日发布多项新功能,上线音视频问答助手“小悟”、一键AI改写、思维导图生成等六大功能。其中,音视频问答助手“小悟”支持对单个最长6小时、一次性上百条音视频的内容理解问答。通义听悟向所有中国大陆高校师生赠送500小时音视频转写时长。 【知乎发布全新AI功能“发现·AI搜索”(财联社)】 3月20日电,知乎创始人、董事长兼CEO周源带来了知乎大模型的最新进展,发布了全新AI功能“发现·AI搜索”。据介绍,该功能以社区可信赖内容为来源,给用户带来集搜索、实时问答和追问功能于一体的全新体验。 【国内首部AI全流程微短剧《中国神话》启播(财联社)】 3月22日电,央视频AI微短剧启播暨AI频道3月22日正式上线,我国首部AI全流程微短剧《中国神话》与受众见面。 【360AI浏览器APP即将上线 支持500万字长文本处理(财联社)】 3月23日电,360智脑宣布正式内测500万字长文本处理功能,该功能即将入驻360AI浏览器,同时360AI浏览器APP也即将上线。此前,360AI浏览器已向用户免费开放100万字长文本阅读功能,可一分钟读完《三体》,并就文本外的“超纲”问题进行问答和延展学习,此次长文本处理能力进一步提升。 04 重要上市公司变化 【完美世界端游《诛仙世界》正式接入英伟达Audio2Face技术(财联社)】 3月19日电,在英伟达GTC2024上,完美世界游戏公布了旗下仙侠MMORPG端游《诛仙世界》正式接入了英伟达Audio2Face技术(生成式AI将音频转为动画技术),并借此次大会向全球观众展示了与《诛仙世界》的结合成果。完美世界称,还将和英伟达在AI的多个领域和场景继续保持密切交流与合作。 【芒果超媒:国内首个AI导演上岗(财联社)】 3月18日电,伴随着湖南卫视、芒果TV的综艺《我们仨》官宣,国内首个AI导演上岗了。这位AI导演名叫爱芒,将在《我们仨》中以助理导演的身份与嘉宾共同参与节目。 【中文在线成为阶跃大模型应用重要合作伙伴(科创板日报)】 23日讯,中文在线成为国内AI大模型独角兽上海阶跃星辰智能科技有限公司重点应用合作伙伴。在知识服务领域,阶跃星辰与中国知网、中文在线达成合作,围绕严肃知识数据、大众知识服务等领域推进大模型的应用。在网络文学领域,阶跃星辰与中文在线达成战略合作,共同探索大模型在灵感激发、剧情设计、内容创作等网络文学创作领域的应用。 05 近期AIGC热度趋势 抖音 百度搜索 微博 法律声明 本公众号(名称:观媒万象)为国信证券股份有限公司(下称“国信证券”)研究所传媒组依法设立、独立运营的唯一官方公众号。 本公众号所载内容仅面向符合《证券期货投资者适当性管理办法》规定的机构类专业投资者。国信证券不因任何订阅或接收本公众号内容的行为而将订阅人视为国信证券的客户。 本公众号不是国信证券研究报告的发布平台,本公众号只是转发国信证券发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解和歧义。提请订阅者参阅国信证券已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。 国信证券对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本公众号中资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据国信证券后续发布的证券研究报告在不发布通知的情形下作出更改。国信证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本公众号中资料意见不一致的市场评论和/或观点。 本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本 公众号内容做出的任何决策与国信证券或相关作者无关。 本公众号发布的内容仅为国信证券所有。未经国信证券事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本公众号发布的全部或部分内容,亦不得从未经国信证券书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本公众号发布的全部或部分内容。国信证券将保留追究一切法律责任的权利。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。