【国信传媒】AIGC周度更新第二十六期(20240219-20240225)
(以下内容从国信证券《【国信传媒】AIGC周度更新第二十六期(20240219-20240225)》研报附件原文摘录)
本周大模型及算法进展 海外模型方面,1)轻量级开源模型上,谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B;2)图像生成模型上,Stability AI发布第三代图像生成模型Stable Diffusion 3,新一代模型在文字渲染能力、多主体提示能力和图像质量方面有大幅提升;3)多模态模型方面,UC伯克利推出开源大世界模型,支持百万token上下文,还能生成视频。 国内方面,文生图模型上,字节发布文生图开放模型SDXL-Lightning,该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 B端工具及垂类应用,1)英伟达营收和利润已连续三个季度创历史纪录,2024年全财年营收增长126%,黄仁勋称人工智能已触及“引爆点”;英伟达成立新研究部门GEAR,研究团队将专注于四大关键领域:多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。2)美国社交平台Reddit表示与训练AI模型公司签订的数据许可协议总价值2.03亿美元。3)Hugging Face开源“世界最大”AI训练合成数据集Cosmopedia,包含大量教科书、博客文章、故事小说、WikiHow教程等内容,共计250亿个Token。 C端应用及服务方面,1)文生视频方面,中国首部文生视频AI系列动画片《千秋诗颂》将启播,是小学语文课本诗词动画故事系列片,由CCTV-1与人教社合作制作。2)Chatbot上,马斯克人工智能公司xAI将在两周后发布Grok V1.5聊天机器人。3)文件处理及办公方面,微软Copilot聊天机器人开放“笔记本”功能,最高支持处理1.8万个字符;Adobe为其Acrobat PDF软件推出AI文档阅读助手测试版,可总结文件、回答问题并根据内容推荐更多内容,让用户可以“轻松地与文档聊天”获取他们需要的信息;腾讯会议AI小助手上线,可通过自然指令完成信息提取、内容分析、会管会控等多任务,提升开会和信息流转效率。4)教育方面,字节跳动上线面向小初高学生的AI教育产品“河马爱学”APP;网易有道听力宝E6发布,可教材同步、AI口语听读,首发价399元。5)AI+浏览器方面,谷歌Chrome浏览器基于Gemini模型新增“Help Me Write”AI写作工具,可以帮助写作或者完善已经写好的内容,例如可以让其完善销售文案、餐厅评价,或者查询酒店预订信息。6)AI+图片处理方面,Windows照片应用支持“生成式擦除”功能,消除照片中的干扰。 重要上市公司变化方面,1)芒果超媒:将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新;2)顺网AI算法成功通过算法备案;3)华策影视:目前技术储备已可实现4秒时长的文生视频;4)巨人网络:人工智能为公司第二大业务;5)蓝色光标:预计2024年由AI驱动的收入有望实现10倍以上增长;6)万兴科技:公司大模型天幕除文生视频外还包含文生3D视频、视频AI配乐等。 01 相关政策更新 【国家网信办发布第四批深度合成服务算法备案信息,vivo 蓝心大模型等 266 个算法在列(IT之家)】 2 月 18 日消息,国家网信办今日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第四批境内深度合成服务算法备案信息。本次共有 266 个算法通过备案,其中包括扫描全能王、vivo 蓝心大模型算法、TCL 智能问答内容生成算法、网易元气生成合成算法、唯品会虚拟试衣算法、摩尔线程多模态大模型算法、京东文生图模型算法、小冰数字人合成算法等。 02 大模型&算法 【谷歌发布开源AI大模型Gemma 称其性能在同等规模中最为先进(财联社)】 2月22日电,当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。 【Stability AI发布第三代图像生成模型Stable Diffusion 3(量子位)】 Stability AI发布第三代图像生成模型Stable Diffusion 3,新一代模型在文字渲染能力、多主体提示能力和图像质量方面有大幅提升,从官方公布的图片来看,生成效果与Midjourney不相上下,甚至有超越。技术方面,目前模型可选择的参数范围在800M到8B。详细技术报告还未公布,官方目前只透露主要结合了扩散型Transformer架构(DiT)以及Flow matching。 【UC伯克利推出大世界模型,支持百万token上下文,还能生成视频(量子位)】 今日GitHub热榜榜首为最新的开源世界模型。上下文窗口长度达到100万token,持平了谷歌同时推出的Gemini 1.5,伯克利出品。强大的模型命名没有任何额外点缀,直接叫LargeWorldModel(LWM)。LWM支持处理多模态信息,能在100万token中准确找到目标文本,还能一口气看完1小时视频。 【字节发布文生图开放模型SDXL-Lightning(财联社)】 2月23日电,字节发布文生图开放模型SDXL-Lightning。从AI开源社区Hugging Face的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 03 工具&垂类应用(2B) 【“生成式AI已达引爆点”!英伟达四季度应收、利润、一季度指引均超预期(华尔街见闻)】 英伟达营收和利润已连续三个季度创历史纪录,2024年全财年营收增长126%。根据财报,受益于服务器AI芯片需求暴增,英伟达四季度应收221亿美元,环比增长22%,同比猛增265%,高于预期204.1亿美元,单季度收入甚至高于2021年全年。四季度净利润123亿美元,同比暴增769%。黄仁勋称人工智能已触及“引爆点”。CFO称,公司下一代产品的市场需求远超过供给水平。 【英伟达成立新研究部门GEAR,打造虚拟与现实世界中的全能智能体(AI寒武纪)】 英伟达宣布成立新的研究部门“GEAR”,全称为通用具身智能体研究(Generalist Embodied Agent Research)。这个新部门由AI高级研究科学家、AI代理计划的负责人Jim Fan和Yuke Zhu教授领导。GEAR的核心使命是构建适用于虚拟与物理世界的具身智能体的基础模型,致力于实现跨多模态、多场景的智能应用。研究团队将专注于四大关键领域:多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。 【纽约时报计划于今年晚些时候推出新的生成式人工智能广告工具(Axios)】 《纽约时报》正在招募合作伙伴,从下个季度开始使用生成式人工智能(GenAI)测试新的广告定位解决方案,计划在今年下半年向营销人员广泛使用这一新工具。该项技术由《纽约时报》内部开发,将根据广告活动的信息或目标,提出广告活动在哪些方面可以发挥最佳效果的建议。 【美国社交平台Reddit据悉同谷歌达成AI内容授权协议 每年价值6000万美元(财联社)】 2月22日电,知情人士称,美国社交媒体平台Reddit已同谷歌达成协议,将其内容用于训练后者的人工智能模型。协议价值约为每年6000万美元。知情人士透露,Reddit可能最快本周四提交IPO文件。 【Reddit表示与训练AI模型公司签订的数据许可协议总价值2.03亿美元(TechCrunch)】 在IPO招股说明书中,Reddit反复强调其将从利用该平台上超过10亿帖文和超过16亿评论训练AI模型的公司签订的数据许可协议中获益匪浅。招股说明书中写道:“2024年1月,我们签订了某些数据许可协议,合同总价值为2.03亿美元,期限为两到三年。” 【苹果正在内测类ChatGPT工具ASK(华尔街见闻)】 据MacRumors报道,苹果为其AppleCare支持顾问开发了一款类似ChatGPT的工具,名为“Ask”,该工具可以自动生成针对客户技术问题的回复。然后,顾问可以通过在线聊天或电话将信息转发给客户。 【Hugging Face开源“世界最大”AI训练合成数据集Cosmopedia(IT之家))】 Hugging Face近日开源了一款名为“Cosmopedia”的AI训练数据集,号称是目前世界上最大的合成数据集。该数据集内容均由Mixtral 7b模型汇总生成,其中收录3000万以上文本文件,包含大量教科书、博客文章、故事小说、WikiHow教程等内容,共计250亿个Token。 【OpenAI更新GPT商店:提供评级和扩展者资料(VentureBeat)】 OpenAI在社交平台X上宣布对GPT商店进行更新,第三方GPT的用户可以使用该机器人对其进行评分。此外,GPT构建者现在可以在他们的账户资料中包含更多信息,这些资料会在用户点击其名字时显示。这些信息包括添加构建者的LinkedIn页面或个人资料、X账户、网站链接,以及GPT的平均分数、总评分数、“对话”数量(即使用该GPT的会话数量)。 04 应用及服务(2C) 【中国首部文生视频AI系列动画片《千秋诗颂》将启播(科创板日报)】 据央视频消息,中国首部文生视频AI系列动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式将在今日举行。据官网介绍,《千秋诗颂》面向小学生,是小学语文课本诗词动画故事系列片,由CCTV-1与人教社合作制作,栏目结合人教社提供的诗词内容及相关背景故事,制作成国风动画诗词故事,在尊重历史的前提下重构故事剧本,以求最大限度再现诗词意境和感情。 【微软Copilot聊天机器人开放“笔记本”功能,最高1.8万个字符(IT之家)】 微软公司副总裁兼Copilot和必应工程与产品负责人约尔迪·里巴斯(Jordi Ribas)近日发布推文,宣布网页版Copilot聊天机器人正式上线“笔记本”功能,最高支持18000个字符。 【Adobe为其Acrobat PDF软件推出AI文档阅读助手测试版(The Verge)】 Adobe正在为其Acrobat PDF管理软件添加新的生成式AI体验,该软件旨在通过使长文档中的信息更易于查找和理解来“彻底改变数字文档体验”。Adobe在新闻稿中宣布,这款新工具被称为“AI Assistant in Acrobat”,可总结文件、回答问题并根据内容推荐更多内容,让用户可以“轻松地与文档聊天”获取他们需要的信息。 【腾讯张军:腾讯会议AI小助手上线(科创板日报)】 22日讯,腾讯张军在微博表示,腾讯会议的AI小助手上线了,并称其为一个真正的大模型应用。 【马斯克:人工智能公司xAI将在两周后发布Grok V1.5聊天机器人(财联社)】 2月22日电,马斯克当地时间21日在社交媒体平台X发文称,人工智能初创公司xAI将在两周后发布Grok V1.5聊天机器人,“目前还远非完美,但会迅速改进”。 【字节跳动上线面向小初高学生的AI教育产品“河马爱学”APP(界面新闻)】 近日,字节跳动上线“河马爱学”APP,该产品瞄准小初高学生,主要功能为拍照答题,提供作业、口算、作文批改以及语文作文、英语作文、文学素养等服务。这是该公司针对大语言模型在教育领域的应用所进行的探索,例如“问答”功能,通过AI机器人“盐盐”提供各类问答服务。根据官网介绍,该产品希望利用大模型技术帮学生自适应学习,提升学习效率,制定科学合适的学习方案,同时帮助老师开展教学。2022年2月,河马爱学智能学习系统已进入安徽省阜南亲情高级中学。 【网易有道听力宝E6发布:教材同步、AI口语听读,首发价399元(IT之家)】 网易有道推出了一款“有道听力宝E6”新品,是一款练习听力口语的便携设备,首发价399元。该设备支持课内教材同步,覆盖小初高中英文,还支持站外导入资源,拥有10TB云空间。有道听力宝E6配有AI口语助手,支持英语定级,还与雅思官方合作,用户可逐句跟读纠音。 【Sora新视频只发TikTok:OpenAI4天涨粉10万(量子位)】 Sora新视频,变成“抖音独占”了。悄无声息,OpenAI正式入驻TikTok,更新了不少全新生成视频,加上洗脑配乐让人刷到停不下来,引流吸粉,在没有宣传的情况下,短短4天涨粉10万,获得50万点赞。 【微软高管表示OpenAI的Sora视频生成模型将集成到Copilot中(MSPowerUser)】 在最近的一次推文交流中,微软广告和网络服务首席执行官Mikhail Oarakhin暗示Sora最终将与Copilot集成,但这需要一些时间。 【基于Gemini模型,谷歌Chrome浏览器新增“Help Me Write”AI写作工具(IT之家)】 谷歌今天发布新闻稿,宣布自Chrome 122浏览器版本开始,邀请Mac和Windows PC用户体验全新的“Help me write”功能。这项功能使用Gemini模型,可以帮助写作或者完善已经写好的内容,例如可以让其完善销售文案、餐厅评价,或者查询酒店预订信息。 【Windows照片应用支持“生成式擦除”功能,消除照片中的干扰(IT之家)】 微软今天发布博客文章,向用户分享照片应用的最新编辑功能“生成式擦除”。该功能允许用户修复和删除照片中的干扰因素,例如背景物体或各种视觉混乱。生成擦除在擦除照片中的物体后可创建更无缝和更真实的结果,即时在擦除大面积区域时也是如此。 05 重要上市公司变化 【芒果超媒:将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新(金十)】 2月20日讯,芒果超媒在互动平台表示,公司高度重视各类AI技术的研发和应用,对以Sora为代表的新兴AI文生视频技术平台保持密切关注。此前,公司已经组建了AIGC创新应用团队,研发上线“AIGCHUB”等内部应用平台,将AIGC技术广泛应用于媒体运营、广告投放、会员互动、视频剪辑、内容生产等业务场景。后续,公司将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新。 【顺网AI算法成功通过算法备案(金十)】 2月20日讯,2月18日根据《互联网信息服务深度合成管理规定》,国家互联网信息办公室公开发布第四批境内深度合成服务算法备案信息。作为灵悉引擎的底层算法,顺网灵悉文本生成算法通过国家网信办深度合成服务算法备案。顺网灵悉文本生成算法拥有任务规划、角色扮演、记忆等构建Agent所需基础能力。通过此次算法备案,意味着顺网科技具备了正式向用户开放使用该算法的资质。 【华策影视:目前技术储备已可实现4秒时长的文生视频(财联社)】 2月21日电,华策影视在互动平台表示,公司高度重视各类AI技术的研发和应用,对以Sora为代表的新兴AI文生视频技术平台保持密切关注。公司去年组建了AIGC应用研究院,自研的编剧助手、剧本评估、视频检索、AI剧照等功能已在内部应用或内测。通过对开源技术的学习吸收和消化,目前技术储备已可实现4秒时长的文生视频。公司将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新。公司在AI领域的技术储备短期内不会直接贡献业绩。 【巨人网络:人工智能为公司第二大业务(财联社)】 2月22日电,巨人网络董事长史玉柱在公司内部会议上提出,尽管公司早期对AI的投入并未立即见效(包括收购以色列AI游戏公司Playtika),但随着美国几家大公司的技术开源,巨人网络迎来了转机。“我们过去只有一个游戏业务,现在增加了第二大块业务,就是人工智能。”展望2024年,巨人网络方面表示,计划在其手游《太空杀》中引入由GiantGPT驱动的AI新玩法。此外,新开发的AI NPC(非玩家角色)已在部分核心产品中测试,预计今年将广泛应用于更多产品中。 【蓝色光标:预计2024年由AI驱动的收入有望实现10倍以上增长(财联社)】 2月22日电,近期,文生视频模型Sora引发市场极大关注,蓝色光标CEO潘飞在接受财联社记者采访时表示,蓝色光标在去年已经在大量实践用AI的方式生成视频,团队已能熟练运用包括Runway、Pika、Wonder Studio在内的多种模型,根据内容需要生产AI视频。Sora全面应用后,一定会让视频创作得到新的智能涌现,视频案例也将呈现井喷式发展。公司已有过千个案例(含出海业务)是通过生成式AI赋能创造出来的,其中深度驱动并带来规模化收入的案例约在1/3以上,AI驱动的收入在1个亿以上。预计2024年由AI驱动的收入有望实现10倍以上的增长。 【万兴科技:公司大模型天幕除文生视频外还包含文生3D视频、视频AI配乐等(财联社)】 2月20日电,万兴科技在互动平台表示,近期公司正式发布的音视频多媒体大模型天幕,聚焦数字创意垂类创作场景。区别于Sora,天幕是以音视频生成式AI技术为基础的垂类多媒体大模型,除文生视频外,还包含文生3D视频、视频AI配乐、数字人播报等近百项音视频原子能力,更专注于面向细分垂直市场,如泛知识、泛营销、泛娱乐等领域,以助力广大创作者更好地进行音视频创作。 06 近期AIGC热度趋势 抖音 百度搜索 微博 法律声明 本公众号(名称:观媒万象)为国信证券股份有限公司(下称“国信证券”)研究所传媒组依法设立、独立运营的唯一官方公众号。 本公众号所载内容仅面向符合《证券期货投资者适当性管理办法》规定的机构类专业投资者。国信证券不因任何订阅或接收本公众号内容的行为而将订阅人视为国信证券的客户。 本公众号不是国信证券研究报告的发布平台,本公众号只是转发国信证券发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解和歧义。提请订阅者参阅国信证券已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。 国信证券对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本公众号中资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据国信证券后续发布的证券研究报告在不发布通知的情形下作出更改。国信证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本公众号中资料意见不一致的市场评论和/或观点。 本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本 公众号内容做出的任何决策与国信证券或相关作者无关。 本公众号发布的内容仅为国信证券所有。未经国信证券事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本公众号发布的全部或部分内容,亦不得从未经国信证券书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本公众号发布的全部或部分内容。国信证券将保留追究一切法律责任的权利。
本周大模型及算法进展 海外模型方面,1)轻量级开源模型上,谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B;2)图像生成模型上,Stability AI发布第三代图像生成模型Stable Diffusion 3,新一代模型在文字渲染能力、多主体提示能力和图像质量方面有大幅提升;3)多模态模型方面,UC伯克利推出开源大世界模型,支持百万token上下文,还能生成视频。 国内方面,文生图模型上,字节发布文生图开放模型SDXL-Lightning,该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 B端工具及垂类应用,1)英伟达营收和利润已连续三个季度创历史纪录,2024年全财年营收增长126%,黄仁勋称人工智能已触及“引爆点”;英伟达成立新研究部门GEAR,研究团队将专注于四大关键领域:多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。2)美国社交平台Reddit表示与训练AI模型公司签订的数据许可协议总价值2.03亿美元。3)Hugging Face开源“世界最大”AI训练合成数据集Cosmopedia,包含大量教科书、博客文章、故事小说、WikiHow教程等内容,共计250亿个Token。 C端应用及服务方面,1)文生视频方面,中国首部文生视频AI系列动画片《千秋诗颂》将启播,是小学语文课本诗词动画故事系列片,由CCTV-1与人教社合作制作。2)Chatbot上,马斯克人工智能公司xAI将在两周后发布Grok V1.5聊天机器人。3)文件处理及办公方面,微软Copilot聊天机器人开放“笔记本”功能,最高支持处理1.8万个字符;Adobe为其Acrobat PDF软件推出AI文档阅读助手测试版,可总结文件、回答问题并根据内容推荐更多内容,让用户可以“轻松地与文档聊天”获取他们需要的信息;腾讯会议AI小助手上线,可通过自然指令完成信息提取、内容分析、会管会控等多任务,提升开会和信息流转效率。4)教育方面,字节跳动上线面向小初高学生的AI教育产品“河马爱学”APP;网易有道听力宝E6发布,可教材同步、AI口语听读,首发价399元。5)AI+浏览器方面,谷歌Chrome浏览器基于Gemini模型新增“Help Me Write”AI写作工具,可以帮助写作或者完善已经写好的内容,例如可以让其完善销售文案、餐厅评价,或者查询酒店预订信息。6)AI+图片处理方面,Windows照片应用支持“生成式擦除”功能,消除照片中的干扰。 重要上市公司变化方面,1)芒果超媒:将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新;2)顺网AI算法成功通过算法备案;3)华策影视:目前技术储备已可实现4秒时长的文生视频;4)巨人网络:人工智能为公司第二大业务;5)蓝色光标:预计2024年由AI驱动的收入有望实现10倍以上增长;6)万兴科技:公司大模型天幕除文生视频外还包含文生3D视频、视频AI配乐等。 01 相关政策更新 【国家网信办发布第四批深度合成服务算法备案信息,vivo 蓝心大模型等 266 个算法在列(IT之家)】 2 月 18 日消息,国家网信办今日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第四批境内深度合成服务算法备案信息。本次共有 266 个算法通过备案,其中包括扫描全能王、vivo 蓝心大模型算法、TCL 智能问答内容生成算法、网易元气生成合成算法、唯品会虚拟试衣算法、摩尔线程多模态大模型算法、京东文生图模型算法、小冰数字人合成算法等。 02 大模型&算法 【谷歌发布开源AI大模型Gemma 称其性能在同等规模中最为先进(财联社)】 2月22日电,当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。 【Stability AI发布第三代图像生成模型Stable Diffusion 3(量子位)】 Stability AI发布第三代图像生成模型Stable Diffusion 3,新一代模型在文字渲染能力、多主体提示能力和图像质量方面有大幅提升,从官方公布的图片来看,生成效果与Midjourney不相上下,甚至有超越。技术方面,目前模型可选择的参数范围在800M到8B。详细技术报告还未公布,官方目前只透露主要结合了扩散型Transformer架构(DiT)以及Flow matching。 【UC伯克利推出大世界模型,支持百万token上下文,还能生成视频(量子位)】 今日GitHub热榜榜首为最新的开源世界模型。上下文窗口长度达到100万token,持平了谷歌同时推出的Gemini 1.5,伯克利出品。强大的模型命名没有任何额外点缀,直接叫LargeWorldModel(LWM)。LWM支持处理多模态信息,能在100万token中准确找到目标文本,还能一口气看完1小时视频。 【字节发布文生图开放模型SDXL-Lightning(财联社)】 2月23日电,字节发布文生图开放模型SDXL-Lightning。从AI开源社区Hugging Face的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 03 工具&垂类应用(2B) 【“生成式AI已达引爆点”!英伟达四季度应收、利润、一季度指引均超预期(华尔街见闻)】 英伟达营收和利润已连续三个季度创历史纪录,2024年全财年营收增长126%。根据财报,受益于服务器AI芯片需求暴增,英伟达四季度应收221亿美元,环比增长22%,同比猛增265%,高于预期204.1亿美元,单季度收入甚至高于2021年全年。四季度净利润123亿美元,同比暴增769%。黄仁勋称人工智能已触及“引爆点”。CFO称,公司下一代产品的市场需求远超过供给水平。 【英伟达成立新研究部门GEAR,打造虚拟与现实世界中的全能智能体(AI寒武纪)】 英伟达宣布成立新的研究部门“GEAR”,全称为通用具身智能体研究(Generalist Embodied Agent Research)。这个新部门由AI高级研究科学家、AI代理计划的负责人Jim Fan和Yuke Zhu教授领导。GEAR的核心使命是构建适用于虚拟与物理世界的具身智能体的基础模型,致力于实现跨多模态、多场景的智能应用。研究团队将专注于四大关键领域:多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术。 【纽约时报计划于今年晚些时候推出新的生成式人工智能广告工具(Axios)】 《纽约时报》正在招募合作伙伴,从下个季度开始使用生成式人工智能(GenAI)测试新的广告定位解决方案,计划在今年下半年向营销人员广泛使用这一新工具。该项技术由《纽约时报》内部开发,将根据广告活动的信息或目标,提出广告活动在哪些方面可以发挥最佳效果的建议。 【美国社交平台Reddit据悉同谷歌达成AI内容授权协议 每年价值6000万美元(财联社)】 2月22日电,知情人士称,美国社交媒体平台Reddit已同谷歌达成协议,将其内容用于训练后者的人工智能模型。协议价值约为每年6000万美元。知情人士透露,Reddit可能最快本周四提交IPO文件。 【Reddit表示与训练AI模型公司签订的数据许可协议总价值2.03亿美元(TechCrunch)】 在IPO招股说明书中,Reddit反复强调其将从利用该平台上超过10亿帖文和超过16亿评论训练AI模型的公司签订的数据许可协议中获益匪浅。招股说明书中写道:“2024年1月,我们签订了某些数据许可协议,合同总价值为2.03亿美元,期限为两到三年。” 【苹果正在内测类ChatGPT工具ASK(华尔街见闻)】 据MacRumors报道,苹果为其AppleCare支持顾问开发了一款类似ChatGPT的工具,名为“Ask”,该工具可以自动生成针对客户技术问题的回复。然后,顾问可以通过在线聊天或电话将信息转发给客户。 【Hugging Face开源“世界最大”AI训练合成数据集Cosmopedia(IT之家))】 Hugging Face近日开源了一款名为“Cosmopedia”的AI训练数据集,号称是目前世界上最大的合成数据集。该数据集内容均由Mixtral 7b模型汇总生成,其中收录3000万以上文本文件,包含大量教科书、博客文章、故事小说、WikiHow教程等内容,共计250亿个Token。 【OpenAI更新GPT商店:提供评级和扩展者资料(VentureBeat)】 OpenAI在社交平台X上宣布对GPT商店进行更新,第三方GPT的用户可以使用该机器人对其进行评分。此外,GPT构建者现在可以在他们的账户资料中包含更多信息,这些资料会在用户点击其名字时显示。这些信息包括添加构建者的LinkedIn页面或个人资料、X账户、网站链接,以及GPT的平均分数、总评分数、“对话”数量(即使用该GPT的会话数量)。 04 应用及服务(2C) 【中国首部文生视频AI系列动画片《千秋诗颂》将启播(科创板日报)】 据央视频消息,中国首部文生视频AI系列动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式将在今日举行。据官网介绍,《千秋诗颂》面向小学生,是小学语文课本诗词动画故事系列片,由CCTV-1与人教社合作制作,栏目结合人教社提供的诗词内容及相关背景故事,制作成国风动画诗词故事,在尊重历史的前提下重构故事剧本,以求最大限度再现诗词意境和感情。 【微软Copilot聊天机器人开放“笔记本”功能,最高1.8万个字符(IT之家)】 微软公司副总裁兼Copilot和必应工程与产品负责人约尔迪·里巴斯(Jordi Ribas)近日发布推文,宣布网页版Copilot聊天机器人正式上线“笔记本”功能,最高支持18000个字符。 【Adobe为其Acrobat PDF软件推出AI文档阅读助手测试版(The Verge)】 Adobe正在为其Acrobat PDF管理软件添加新的生成式AI体验,该软件旨在通过使长文档中的信息更易于查找和理解来“彻底改变数字文档体验”。Adobe在新闻稿中宣布,这款新工具被称为“AI Assistant in Acrobat”,可总结文件、回答问题并根据内容推荐更多内容,让用户可以“轻松地与文档聊天”获取他们需要的信息。 【腾讯张军:腾讯会议AI小助手上线(科创板日报)】 22日讯,腾讯张军在微博表示,腾讯会议的AI小助手上线了,并称其为一个真正的大模型应用。 【马斯克:人工智能公司xAI将在两周后发布Grok V1.5聊天机器人(财联社)】 2月22日电,马斯克当地时间21日在社交媒体平台X发文称,人工智能初创公司xAI将在两周后发布Grok V1.5聊天机器人,“目前还远非完美,但会迅速改进”。 【字节跳动上线面向小初高学生的AI教育产品“河马爱学”APP(界面新闻)】 近日,字节跳动上线“河马爱学”APP,该产品瞄准小初高学生,主要功能为拍照答题,提供作业、口算、作文批改以及语文作文、英语作文、文学素养等服务。这是该公司针对大语言模型在教育领域的应用所进行的探索,例如“问答”功能,通过AI机器人“盐盐”提供各类问答服务。根据官网介绍,该产品希望利用大模型技术帮学生自适应学习,提升学习效率,制定科学合适的学习方案,同时帮助老师开展教学。2022年2月,河马爱学智能学习系统已进入安徽省阜南亲情高级中学。 【网易有道听力宝E6发布:教材同步、AI口语听读,首发价399元(IT之家)】 网易有道推出了一款“有道听力宝E6”新品,是一款练习听力口语的便携设备,首发价399元。该设备支持课内教材同步,覆盖小初高中英文,还支持站外导入资源,拥有10TB云空间。有道听力宝E6配有AI口语助手,支持英语定级,还与雅思官方合作,用户可逐句跟读纠音。 【Sora新视频只发TikTok:OpenAI4天涨粉10万(量子位)】 Sora新视频,变成“抖音独占”了。悄无声息,OpenAI正式入驻TikTok,更新了不少全新生成视频,加上洗脑配乐让人刷到停不下来,引流吸粉,在没有宣传的情况下,短短4天涨粉10万,获得50万点赞。 【微软高管表示OpenAI的Sora视频生成模型将集成到Copilot中(MSPowerUser)】 在最近的一次推文交流中,微软广告和网络服务首席执行官Mikhail Oarakhin暗示Sora最终将与Copilot集成,但这需要一些时间。 【基于Gemini模型,谷歌Chrome浏览器新增“Help Me Write”AI写作工具(IT之家)】 谷歌今天发布新闻稿,宣布自Chrome 122浏览器版本开始,邀请Mac和Windows PC用户体验全新的“Help me write”功能。这项功能使用Gemini模型,可以帮助写作或者完善已经写好的内容,例如可以让其完善销售文案、餐厅评价,或者查询酒店预订信息。 【Windows照片应用支持“生成式擦除”功能,消除照片中的干扰(IT之家)】 微软今天发布博客文章,向用户分享照片应用的最新编辑功能“生成式擦除”。该功能允许用户修复和删除照片中的干扰因素,例如背景物体或各种视觉混乱。生成擦除在擦除照片中的物体后可创建更无缝和更真实的结果,即时在擦除大面积区域时也是如此。 05 重要上市公司变化 【芒果超媒:将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新(金十)】 2月20日讯,芒果超媒在互动平台表示,公司高度重视各类AI技术的研发和应用,对以Sora为代表的新兴AI文生视频技术平台保持密切关注。此前,公司已经组建了AIGC创新应用团队,研发上线“AIGCHUB”等内部应用平台,将AIGC技术广泛应用于媒体运营、广告投放、会员互动、视频剪辑、内容生产等业务场景。后续,公司将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新。 【顺网AI算法成功通过算法备案(金十)】 2月20日讯,2月18日根据《互联网信息服务深度合成管理规定》,国家互联网信息办公室公开发布第四批境内深度合成服务算法备案信息。作为灵悉引擎的底层算法,顺网灵悉文本生成算法通过国家网信办深度合成服务算法备案。顺网灵悉文本生成算法拥有任务规划、角色扮演、记忆等构建Agent所需基础能力。通过此次算法备案,意味着顺网科技具备了正式向用户开放使用该算法的资质。 【华策影视:目前技术储备已可实现4秒时长的文生视频(财联社)】 2月21日电,华策影视在互动平台表示,公司高度重视各类AI技术的研发和应用,对以Sora为代表的新兴AI文生视频技术平台保持密切关注。公司去年组建了AIGC应用研究院,自研的编剧助手、剧本评估、视频检索、AI剧照等功能已在内部应用或内测。通过对开源技术的学习吸收和消化,目前技术储备已可实现4秒时长的文生视频。公司将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新。公司在AI领域的技术储备短期内不会直接贡献业绩。 【巨人网络:人工智能为公司第二大业务(财联社)】 2月22日电,巨人网络董事长史玉柱在公司内部会议上提出,尽管公司早期对AI的投入并未立即见效(包括收购以色列AI游戏公司Playtika),但随着美国几家大公司的技术开源,巨人网络迎来了转机。“我们过去只有一个游戏业务,现在增加了第二大块业务,就是人工智能。”展望2024年,巨人网络方面表示,计划在其手游《太空杀》中引入由GiantGPT驱动的AI新玩法。此外,新开发的AI NPC(非玩家角色)已在部分核心产品中测试,预计今年将广泛应用于更多产品中。 【蓝色光标:预计2024年由AI驱动的收入有望实现10倍以上增长(财联社)】 2月22日电,近期,文生视频模型Sora引发市场极大关注,蓝色光标CEO潘飞在接受财联社记者采访时表示,蓝色光标在去年已经在大量实践用AI的方式生成视频,团队已能熟练运用包括Runway、Pika、Wonder Studio在内的多种模型,根据内容需要生产AI视频。Sora全面应用后,一定会让视频创作得到新的智能涌现,视频案例也将呈现井喷式发展。公司已有过千个案例(含出海业务)是通过生成式AI赋能创造出来的,其中深度驱动并带来规模化收入的案例约在1/3以上,AI驱动的收入在1个亿以上。预计2024年由AI驱动的收入有望实现10倍以上的增长。 【万兴科技:公司大模型天幕除文生视频外还包含文生3D视频、视频AI配乐等(财联社)】 2月20日电,万兴科技在互动平台表示,近期公司正式发布的音视频多媒体大模型天幕,聚焦数字创意垂类创作场景。区别于Sora,天幕是以音视频生成式AI技术为基础的垂类多媒体大模型,除文生视频外,还包含文生3D视频、视频AI配乐、数字人播报等近百项音视频原子能力,更专注于面向细分垂直市场,如泛知识、泛营销、泛娱乐等领域,以助力广大创作者更好地进行音视频创作。 06 近期AIGC热度趋势 抖音 百度搜索 微博 法律声明 本公众号(名称:观媒万象)为国信证券股份有限公司(下称“国信证券”)研究所传媒组依法设立、独立运营的唯一官方公众号。 本公众号所载内容仅面向符合《证券期货投资者适当性管理办法》规定的机构类专业投资者。国信证券不因任何订阅或接收本公众号内容的行为而将订阅人视为国信证券的客户。 本公众号不是国信证券研究报告的发布平台,本公众号只是转发国信证券发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解和歧义。提请订阅者参阅国信证券已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。 国信证券对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本公众号中资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据国信证券后续发布的证券研究报告在不发布通知的情形下作出更改。国信证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本公众号中资料意见不一致的市场评论和/或观点。 本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本 公众号内容做出的任何决策与国信证券或相关作者无关。 本公众号发布的内容仅为国信证券所有。未经国信证券事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本公众号发布的全部或部分内容,亦不得从未经国信证券书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本公众号发布的全部或部分内容。国信证券将保留追究一切法律责任的权利。
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。