欢迎访问悟空智库——专业行业公司研究报告文档大数据平台!

国盛证券-传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2-230514

上传日期:2023-05-15 11:14:58 / 研报作者:顾晟吴珺刘书含 / 分享者:1002694
研报附件
国盛证券-传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2-230514.pdf
大小:1.1M
立即下载 在线阅读

国盛证券-传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2-230514

国盛证券-传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2-230514
文本预览:

《国盛证券-传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2-230514(10页).pdf》由会员分享,可在线阅读,更多相关《国盛证券-传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2-230514(10页).pdf(10页精品完整版)》请在悟空智库报告文库上搜索。

(以下内容从国盛证券《传媒行业周报:OpenAI开源3D模型生成器,谷歌发布AI语言模型PaLM 2》研报附件原文摘录)
  行情概览: 本周( 5.8-5.12)中信一级传媒板块下跌 5.92%。 本周 AI 板块出现调整,并带动传媒板块调整, 我们认为调整是在短期录得较大涨幅以后的正常现象,长期看 AI 产业才刚刚起步,后续 AI 垂直应用将陆续落地,在助力板块估值提升的同时,将提升市场对于 AI 产业的认知,同时传媒一季报的强劲表现显示板块触底反弹后的业绩弹性。 我们继续维持年度策略观点, 处于估值底部+基金低配+新技术驱动的传媒板块配置正当时, 建议重视今年传媒板块机会。   板块观点与推荐标的: AI 方向: 1) 核心资产大模型:昆仑万维; 2)游戏:恺英网络、神州泰岳、盛天网络、 巨人网络、完美世界、 汤姆猫、游族网络等;3) 数据:中国科传、同方股份、 中国出版、中信出版等; 4) 出版:南方传媒、凤凰传媒、中文传媒、长江传媒、城市传媒等; 5) IP:奥飞娱乐、 唐德影视、中文在线、上海电影等; 6) AI 陪伴:华策影视、欢瑞世纪、遥望科技等。 港股: 关注降本增效推进亏损收窄的平台型企业【快手】,与消费复苏进展相关的潮玩盲盒龙头【泡泡玛特】,产业爆发在即的【阜博集团】 。   OpenAI 开源 3D 模型生成器 Shap-E,文本转 3D 模型再度提速。 OpenAI 发布全新隐式 text-to-3D模型 Shap-E,通过进一步研发通用人工智能核心应用技术的自然语言描述技术 Prompt Engineering( PE),在 3D 领域再度做出了前沿探索。该创新型 3D 模型生成器能将描述性的文本转化为相应具有高度细节和复杂度的 3D 模型。此前, OpenAI 曾于去年 12 月发布基于点云的显式 3D 生成模型Point-E,其相比竞品模型 DreamFusion 提速约 600 倍, Shap-E 则在 Point-E 的基础之上再次升级。利用生成隐函数的参数来渲染纹理网格和神经辐射场, Shap-E能适用于各种复杂三维隐性表征的条件生成。在共享相同的模型结构、数据集和条件机制的情况下, Shap-E 优化了性能表现,能在更高维的多表示输出空间中提高样本质量,同时在收敛速度方面也有所提升。随着文本转 3D 技术的再度提速, AICG 领域再获利好,创作效率与质量均有望进一步提高。   谷歌发布 AI 语言模型 PaLM 2,赋能谷歌 25 项功能产品。 5 月 11 日,谷歌在I/O 大会上发布最新的人工智能( AI)语言模型 PaLM 2,该产品相比 PaLM 1 而言在推理、编码和翻译等一系列基于文本的任务上均有显著提升。通过广泛的逻辑与推理训练以及多语言文本训练, PaLM 2 已具备极强的逻辑推理能力,支持以 100 多种语言进行输出,适应多种消费者与企业环境。为更好地执行企业客户的特定任务, PaLM 2 推出了不同版本, 目前其分为四种规格,从小到大依次为Gecko、 Otter、 Bison 和 Unicorn,依据特定领域的数据进行了微调。其中,体积最小的 Gecko 支持手机运行,其每秒可处理 20 个 Token,大约相当于 16 或 17个单词。目前, PaLM 2 已被用于支持谷歌 25 项功能和产品,其中包括 AI 聊天机器人 Bard、谷歌文档、幻灯片和工作表等。   Meta 开源 AI 模型 ImageBind, 利用多模态链接创造多感官体验。 Meta 发布开源 AI 模型 ImageBind,该模型支持横跨 6 种不同模态,包括视觉数据(以图像和视频的形式)、温度(红外图像)、文本音频深度信息、由惯性测量单元IMU 产生的运动读数 6 种数据类型,是首个将 6 种类型的数据组合到单个嵌入空间中的模型。该模型的核心概念是将多种类型的数据链接到一个多维索引中,即嵌入空间,使不同模态的数据类型能够相互链接,让单类型输入能实现跨模态检索,从而为用户创造包含视觉、声音、触感等各类互动的多感官体验。目前该模型正处于研究阶段,暂未开发直接的消费者应用。随着多模态 AI 模型的不断研发,未来模型将可能添加其他感官输入流,包括“触摸、语音、嗅觉和大脑功能磁共振信号”,进一步创造丰富的多感官体验,助力沉浸式内容创作。   风险提示: 政策监管风险,竞争加剧风险。
展开>> 收起<<

#免责声明#

本站页面所示及下载的一切研究报告、文档和内容信息皆为本站用户上传分享,仅限用于个人学习、收藏和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。如若内容侵犯了您的权利,请参见底部免责申明联系我们及时删除处理。