【国信传媒】AIGC周度动态更新第一期(20230821-20230827)
(以下内容从国信证券《【国信传媒】AIGC周度动态更新第一期(20230821-20230827)》研报附件原文摘录)
01 大模型&算法 【云从科技正式发布从容大模型 1.5 版本(36 氪)】 云从科技于 8 月 21 日发布从容大模型 1.5 版本。该版本包含十亿级、百亿级、千亿级多种模型规格,实测性能在全球大模型综合性考试评测(C-Eval)中位居百亿级第 1,总榜单第 4。从容 1.5 版本的重点是参数量为 130 亿的行业大模型,该模型从千亿大模型中蒸馏产生,在 52 类测试指标中有 44 类超过 ChatGPT、29 类超过 GPT-4。 【网易AI算法软件著作权获批(界面新闻)】 2023年8月21日,天眼查App显示,近日网易(杭州)网络有限公司“网易数帆人工智能算法软件”“恰似chats手机端应用软件”获得登记批准,版本号均为V1.0。 【雷军:小米研发大模型的方向是轻量化和本地部署(巴比特)】 8 月 25 日,据公众号“雷军”,小米雷军表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。目前小米自研的 13 亿参数的端侧模型已经在手机端跑通,部分场景效果媲美 60 亿模型在云端的运算结果。与早些时候市场上放出的手机端大模型的方案相比,小米会调整模型结构和参数大小,适配各种芯片在内存和算力上的特点,致力于达到功耗、推理速度和生成效果的最佳平衡。 【快手自研大模型“快意”已开启内测(站长之家)】 8 月 21 日报道,快手自主研发的大模型“快意”在多个大模型榜单上表现出色。其中,新版本的 KwaiYii-13B 在 CMMLU 中文向排名第一。目前,“快意”已经开启内测,并为业务团队提供 API 和定制化项目合作方案。 【好未来数学大模型MathGPT上线开启公测(科创板日报)】 24日,好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测。用户使用MathGPT时,可用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。 【度小满轩辕大模型2.0版本将在10月份发布(科创板日报)】 度小满轩辕大模型2.0版本将在10月份发布。2.0版本在对话和金融理解等场景下进行能力提升。在增量预训练和指令微调阶段,该版本加入了海量金融数据;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能处理更长的金融报告、研究和分析。今年5月份,度小满开源了国内首个千亿级中文金融大模型“轩辕”,“开源以来已经有上百家金融机构申请试用“。 【清华大学联合字节跳动,开源听觉大语言模型 SALMONN(IT之家)】 清华大学日前与字节跳动的火山语音团队携手合作,推出开源大语言模型 SALMONN。目前 SALMONN 能够胜任英语语音识别、英语到中文的语音翻译、情感识别、音频字幕生成、音乐描述等重要的语音和音频任务,同时又涌现出多种在模型训练中没有专门学习过的多语言和跨模态能力,涵盖非英语语音识别、英语到(中文以外)其他语言的语音翻译、对语音内容的摘要和关键词提取、基于音频的故事生成、音频问答、语音和音频联合推理等任务。 【阿里云开源通义千问多模态大模型Qwen-VL(科创板日报)】 阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。 【李彦宏:垂类模型不是基础模型的竞品,应该建立在最强大的基础模型之上(金十数据)】 百度创始人、董事长兼首席执行官李彦宏透露,百度正在研发文心大模型 4.0,并计划于今年年底推出。在从文心大模型 3.5 到 4.0 的这一过渡时期,百度正在努力为不同的行业和场景构建文心大模型驱动的应用程序和解决方案。李彦宏还提到,基础模型和行业垂类模型不是竞品关系,行业垂类模型应该建立在最强大的基础模型之上:“基础模型迭代迅速,而行业垂类模型很难跟上创新的步伐。” 02 工具&垂类应用(2B) 【视觉中国:公司会基于开源的大模型,打造公司自己的垂直模型(Wind)】 视觉中国在最新披露的投资者关系活动记录表中表示,丰富的数字内容版权交易场景也是公司的优势之一,公司会基于开源的大模型,结合公司的核心数据、业务场景,打造公司自己的垂直模型。 【Meta 计划本周推出开源 AI 编程软件 Code Llama(The Information)】 8 月 21 日报道,Meta 计划于本周推出开源 AI 软件 Code Llama,旨在帮助开发人员自动生成编程代码。这款开创性的产品将挑战 OpenAI 和 Google 等科技巨头的专有软件。 此外,Meta 还在开发名为 CodeCompose 的 AI 辅助代码编写工具。该工具已经扩展到 Meta 的数万名开发人员,涵盖多种编程语言和编码界面。 【巨量引擎推出 AI 智能混剪工具(36 氪)】 巨量引擎推出一款 AI 智能混剪工具,免费开放给抖音商家使用。该款工具只需 3 条商品空镜素材,智能成片 5 分钟即可生成 10 + 条符合抖音爆款的带货短视频。 【钉钉将推出 AI PaaS 平台,客户可基于其开发各类 AI 应用(科创板日报 & 36 氪)】 钉钉总裁叶军表示,将推出 AI PaaS 平台,上连用户需求,下接大模型,生态伙伴和客户可基于其开发各类 AI 应用。据了解,AI PaaS 平台包括模型调度平台、模型训练平台、插件开发平台。钉钉专业版年费 9800 元基础上,增加 10000 元即可获得 20 万次大模型调用额度;在专属钉钉年费基础上,增加 20000 元即可获得 45 万次大模型调用额度,调用一次大模型平均只要 5 分钱。 【无代码游戏开发平台 buildbox 发布集成生成式 AI 的平台 StoryGames.AI(AIGC开放社区)】 知名无代码游戏开发平台 buildbox 正式发布集成生成式 AI 的游戏开发平台 StoryGames.AI。用户通过文本提示,5 分钟左右能生成一个 10 章节的视频小游戏。StoryGames.AI 可以单独在网页上使用,也可以集成在 buildbox Classic 开发平台中做更深度的游戏开发/更改,例如增加场景、障碍、置换背景音乐、编辑 NPC 生命、编辑故事脚本等。全球著名游戏开发商育碧已推出一款名为“Ubisoft Ghostwriter”的类 ChatGPT 产品,可帮助游戏脚本师自动生成 NPC 对话、游戏剧情、任务内容等,以提升游戏开发效率和创意。 【英伟达将推出新 AI 游戏图形技术 DLSS 3.5,以改进游戏画面(界面新闻)】 英伟达推出多个 AI 技术以改进游戏画面和制作流程,其中包括将于今年秋季推出基于 AI 增强光线重建技术的 DLSS 3.5。通过英伟达超级计算机训练的 AI,可为密集型光线追踪游戏和应用创建更高质量的光线追踪图像,进一步提升游戏在光线追踪下的表现。 【消息称微软将与Databricks合作 提供AI开发服务(财联社)】 微软将与Databricks公司展开合作,其计划在Azure云服务中应用Databricks AI技术,这项服务可让用户打造自己的AI模型,或使用平台提供的预设AI模型。(财联社) 【GPT-3.5 Turbo推出微调功能 可打造专属ChatGPT(财联社)】 OpenAI在官网宣布,推出GPT-3.5 Turbo微调功能并更新API,使企业、开发人员可以使用自己的数据,结合业务用例构建专属ChatGPT。GPT-4的微调功能将于今年秋天推出。 【Meta 推出可转录和翻译近百种语言的人工智能模型 SeamlessM4T(TechCrunch)】 为开发能够理解各种方言的人工智能,Meta 公司创建出一个名为 SeamlessM4T 的人工智能模型,可以翻译和转录近 100 种语言的文本和语音。Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。 【阿里云发布基于通义千问 7B 模型的智海 - 三乐教育大模型(阿里云)】 阿里云宣布与浙江大学联合高等教育出版社等合作发布基于通义千问 7B 模型训练的智海 - 三乐教育垂直大模型,该模型已在阿里云灵积平台(DashScope)上线服务,开发者仅需一行代码即可使用。智海 - 三乐以阿里云通义千问 7B 通用模型为基座,基于核心教材、领域论文和学位论文等教科书级高质量语料和专业指令数据集继续预训练和微调,集成了搜索引擎、计算引擎和本地知识库等功能,将于 9 月在全国 12 所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。 【科蓝软件与百度智能云签署战略合作协议 共同构建金融大模型(上证报)】 8 月 24 日,科蓝软件与百度智能云签署战略合作协议,双方将在金融领域深化合作,共同研发和推广先进的金融智能化解决方案。在大模型技术领域,双方还将携手探索并孵化多个智能金融大模型应用场景,助力金融业迈入智能化新时代。 【OpenAI:与 Scale 合作,为企业微调模型提供支持(巴比特)】 8 月 24 日,OpenAI 发文称,将在今年秋季对 Gpt-4 进行微调,并与 Scale AI 展开合作,为企业微调模型提供支持。 【Meta推出AI编程工具Code Llama 商业领域免费可用(科创板日报)】 当地时间8月24日,Meta宣布推出名为Code Llama的AI编码工具,其号称“最先进的大型编码语言模型”。该模型基于Llama2大型语言模型打造,可以理解为“Llama2的写代码专用版”,可用于“生成新的代码并调试人类编写的工作”,目前已上线Github。据悉,CodeLlama将采用与Llama2相同的社区许可,并对研究和商业领域免费开放。 【爱奇艺公布引入 AIGC 辅助剧本评估(界面新闻)】 爱奇艺发布 2023 年第二季度财报,其中首次公布 AIGC 方面取得的进展:引入 AIGC 辅助剧本评估。据爱奇艺内部数据显示,AIGC 目前对场景和人物拆解的准确率超过 90%。截至目前,爱奇艺站内全端 AIGC 视频看点卡段、图文等运营素材超 70 万条。 03 应用及服务(2C) 【百度:将在 10 月 17 日发布多款 AI 原生应用(IT之家)】 百度近日宣布,10 月 17 日,以“生成未来(PROMPT THE WORLD)”为主题的 Baidu World 2023 将在北京首钢园举办。百度将发布多款 AI 原生应用,介绍大模型最新进展,分享如何通过 AI 原生思维,与企业、用户、以及合作伙伴一起抓住新机遇。 【AI 搜索引擎 You.com 在 WhatsApp 上推出人工智能搜索功能(BusinessWire)】 8 月 23 日,AI 搜索引擎 You.com 宣布在 WhatsApp 上推出人工智能搜索功能,允许用户体验 AI 聊天和搜索,并获得带有来源和直接网络链接的答案。 【昆仑万维发布国内第一款AI搜索产品(财联社)】 昆仑万维正式推出国内第一款融入大语言模型的搜索引擎——天工AI搜索,并开启内测申请。 【AI 作画工具 Midjourney 推出“Inpainting”功能,可对已生成图片进行局部重绘(IT之家)】 知名 AI 作画工具 Midjourney 日前上线了一项新功能“Inpainting”,以每月 10 美元的价格订阅 Midjourney 的用户现可体验。据称,该功能能够使用户对已生成图片的局部或细节进行修改,不需要重新创建一个全新作品。外媒 PCMag 报道称,例如用户可以先利用该工具生成一张“一条鱼从水面跃出”的图片,随后通过“Vary(Region)”按钮,可输入一个新的提示,例如将此前生成的鱼替换成鲨鱼。Midjourney 表示,该功能在所选区域占图像大小 20%-50% 的情况下,能够拥有最佳表现。此外,如果更改的局部细节与图片匹配度更高,效果也就更好。 04 重要上市公司变化 【Opera 二季度财报:营收同比增长 21% 至 9410 万美元,净利润为 1350 万美元(PRNewswire)】 纳斯达克上市公司 Web3 浏览器开发商 Opera 公布二季度财报,二季度营收同比增长 21% 至 9410 万美元,其中,广告营收达到 5380 万美元,同比增长 25%;搜索收入达到 3890 万美元,同比增长 15%;技术许可和其他收入为 150 万美元。 【英伟达第二财季营收和业绩展望均远高于预期(财联社)】 英伟达第二财季营收135.1亿美元,分析师预期110.4亿美元;第二财季数据中心营收103.2亿美元,分析师预期79.8亿美元;预计第三财季营收在160亿美元上下2%区间,分析师预期125亿美元;第二财季游戏营收24.9亿美元,分析师预期23.8亿美元;第二财季汽车营收2.53亿美元,分析师预期3.094亿美元;第二财季调整后每股收益2.70美元,分析师预期2.07美元;第二财季调整后毛利润率71.2%,分析师预期70.1%;批准额外的250亿美元股票回购计划。
01 大模型&算法 【云从科技正式发布从容大模型 1.5 版本(36 氪)】 云从科技于 8 月 21 日发布从容大模型 1.5 版本。该版本包含十亿级、百亿级、千亿级多种模型规格,实测性能在全球大模型综合性考试评测(C-Eval)中位居百亿级第 1,总榜单第 4。从容 1.5 版本的重点是参数量为 130 亿的行业大模型,该模型从千亿大模型中蒸馏产生,在 52 类测试指标中有 44 类超过 ChatGPT、29 类超过 GPT-4。 【网易AI算法软件著作权获批(界面新闻)】 2023年8月21日,天眼查App显示,近日网易(杭州)网络有限公司“网易数帆人工智能算法软件”“恰似chats手机端应用软件”获得登记批准,版本号均为V1.0。 【雷军:小米研发大模型的方向是轻量化和本地部署(巴比特)】 8 月 25 日,据公众号“雷军”,小米雷军表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。目前小米自研的 13 亿参数的端侧模型已经在手机端跑通,部分场景效果媲美 60 亿模型在云端的运算结果。与早些时候市场上放出的手机端大模型的方案相比,小米会调整模型结构和参数大小,适配各种芯片在内存和算力上的特点,致力于达到功耗、推理速度和生成效果的最佳平衡。 【快手自研大模型“快意”已开启内测(站长之家)】 8 月 21 日报道,快手自主研发的大模型“快意”在多个大模型榜单上表现出色。其中,新版本的 KwaiYii-13B 在 CMMLU 中文向排名第一。目前,“快意”已经开启内测,并为业务团队提供 API 和定制化项目合作方案。 【好未来数学大模型MathGPT上线开启公测(科创板日报)】 24日,好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测。用户使用MathGPT时,可用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。 【度小满轩辕大模型2.0版本将在10月份发布(科创板日报)】 度小满轩辕大模型2.0版本将在10月份发布。2.0版本在对话和金融理解等场景下进行能力提升。在增量预训练和指令微调阶段,该版本加入了海量金融数据;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能处理更长的金融报告、研究和分析。今年5月份,度小满开源了国内首个千亿级中文金融大模型“轩辕”,“开源以来已经有上百家金融机构申请试用“。 【清华大学联合字节跳动,开源听觉大语言模型 SALMONN(IT之家)】 清华大学日前与字节跳动的火山语音团队携手合作,推出开源大语言模型 SALMONN。目前 SALMONN 能够胜任英语语音识别、英语到中文的语音翻译、情感识别、音频字幕生成、音乐描述等重要的语音和音频任务,同时又涌现出多种在模型训练中没有专门学习过的多语言和跨模态能力,涵盖非英语语音识别、英语到(中文以外)其他语言的语音翻译、对语音内容的摘要和关键词提取、基于音频的故事生成、音频问答、语音和音频联合推理等任务。 【阿里云开源通义千问多模态大模型Qwen-VL(科创板日报)】 阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。 【李彦宏:垂类模型不是基础模型的竞品,应该建立在最强大的基础模型之上(金十数据)】 百度创始人、董事长兼首席执行官李彦宏透露,百度正在研发文心大模型 4.0,并计划于今年年底推出。在从文心大模型 3.5 到 4.0 的这一过渡时期,百度正在努力为不同的行业和场景构建文心大模型驱动的应用程序和解决方案。李彦宏还提到,基础模型和行业垂类模型不是竞品关系,行业垂类模型应该建立在最强大的基础模型之上:“基础模型迭代迅速,而行业垂类模型很难跟上创新的步伐。” 02 工具&垂类应用(2B) 【视觉中国:公司会基于开源的大模型,打造公司自己的垂直模型(Wind)】 视觉中国在最新披露的投资者关系活动记录表中表示,丰富的数字内容版权交易场景也是公司的优势之一,公司会基于开源的大模型,结合公司的核心数据、业务场景,打造公司自己的垂直模型。 【Meta 计划本周推出开源 AI 编程软件 Code Llama(The Information)】 8 月 21 日报道,Meta 计划于本周推出开源 AI 软件 Code Llama,旨在帮助开发人员自动生成编程代码。这款开创性的产品将挑战 OpenAI 和 Google 等科技巨头的专有软件。 此外,Meta 还在开发名为 CodeCompose 的 AI 辅助代码编写工具。该工具已经扩展到 Meta 的数万名开发人员,涵盖多种编程语言和编码界面。 【巨量引擎推出 AI 智能混剪工具(36 氪)】 巨量引擎推出一款 AI 智能混剪工具,免费开放给抖音商家使用。该款工具只需 3 条商品空镜素材,智能成片 5 分钟即可生成 10 + 条符合抖音爆款的带货短视频。 【钉钉将推出 AI PaaS 平台,客户可基于其开发各类 AI 应用(科创板日报 & 36 氪)】 钉钉总裁叶军表示,将推出 AI PaaS 平台,上连用户需求,下接大模型,生态伙伴和客户可基于其开发各类 AI 应用。据了解,AI PaaS 平台包括模型调度平台、模型训练平台、插件开发平台。钉钉专业版年费 9800 元基础上,增加 10000 元即可获得 20 万次大模型调用额度;在专属钉钉年费基础上,增加 20000 元即可获得 45 万次大模型调用额度,调用一次大模型平均只要 5 分钱。 【无代码游戏开发平台 buildbox 发布集成生成式 AI 的平台 StoryGames.AI(AIGC开放社区)】 知名无代码游戏开发平台 buildbox 正式发布集成生成式 AI 的游戏开发平台 StoryGames.AI。用户通过文本提示,5 分钟左右能生成一个 10 章节的视频小游戏。StoryGames.AI 可以单独在网页上使用,也可以集成在 buildbox Classic 开发平台中做更深度的游戏开发/更改,例如增加场景、障碍、置换背景音乐、编辑 NPC 生命、编辑故事脚本等。全球著名游戏开发商育碧已推出一款名为“Ubisoft Ghostwriter”的类 ChatGPT 产品,可帮助游戏脚本师自动生成 NPC 对话、游戏剧情、任务内容等,以提升游戏开发效率和创意。 【英伟达将推出新 AI 游戏图形技术 DLSS 3.5,以改进游戏画面(界面新闻)】 英伟达推出多个 AI 技术以改进游戏画面和制作流程,其中包括将于今年秋季推出基于 AI 增强光线重建技术的 DLSS 3.5。通过英伟达超级计算机训练的 AI,可为密集型光线追踪游戏和应用创建更高质量的光线追踪图像,进一步提升游戏在光线追踪下的表现。 【消息称微软将与Databricks合作 提供AI开发服务(财联社)】 微软将与Databricks公司展开合作,其计划在Azure云服务中应用Databricks AI技术,这项服务可让用户打造自己的AI模型,或使用平台提供的预设AI模型。(财联社) 【GPT-3.5 Turbo推出微调功能 可打造专属ChatGPT(财联社)】 OpenAI在官网宣布,推出GPT-3.5 Turbo微调功能并更新API,使企业、开发人员可以使用自己的数据,结合业务用例构建专属ChatGPT。GPT-4的微调功能将于今年秋天推出。 【Meta 推出可转录和翻译近百种语言的人工智能模型 SeamlessM4T(TechCrunch)】 为开发能够理解各种方言的人工智能,Meta 公司创建出一个名为 SeamlessM4T 的人工智能模型,可以翻译和转录近 100 种语言的文本和语音。Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。 【阿里云发布基于通义千问 7B 模型的智海 - 三乐教育大模型(阿里云)】 阿里云宣布与浙江大学联合高等教育出版社等合作发布基于通义千问 7B 模型训练的智海 - 三乐教育垂直大模型,该模型已在阿里云灵积平台(DashScope)上线服务,开发者仅需一行代码即可使用。智海 - 三乐以阿里云通义千问 7B 通用模型为基座,基于核心教材、领域论文和学位论文等教科书级高质量语料和专业指令数据集继续预训练和微调,集成了搜索引擎、计算引擎和本地知识库等功能,将于 9 月在全国 12 所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。 【科蓝软件与百度智能云签署战略合作协议 共同构建金融大模型(上证报)】 8 月 24 日,科蓝软件与百度智能云签署战略合作协议,双方将在金融领域深化合作,共同研发和推广先进的金融智能化解决方案。在大模型技术领域,双方还将携手探索并孵化多个智能金融大模型应用场景,助力金融业迈入智能化新时代。 【OpenAI:与 Scale 合作,为企业微调模型提供支持(巴比特)】 8 月 24 日,OpenAI 发文称,将在今年秋季对 Gpt-4 进行微调,并与 Scale AI 展开合作,为企业微调模型提供支持。 【Meta推出AI编程工具Code Llama 商业领域免费可用(科创板日报)】 当地时间8月24日,Meta宣布推出名为Code Llama的AI编码工具,其号称“最先进的大型编码语言模型”。该模型基于Llama2大型语言模型打造,可以理解为“Llama2的写代码专用版”,可用于“生成新的代码并调试人类编写的工作”,目前已上线Github。据悉,CodeLlama将采用与Llama2相同的社区许可,并对研究和商业领域免费开放。 【爱奇艺公布引入 AIGC 辅助剧本评估(界面新闻)】 爱奇艺发布 2023 年第二季度财报,其中首次公布 AIGC 方面取得的进展:引入 AIGC 辅助剧本评估。据爱奇艺内部数据显示,AIGC 目前对场景和人物拆解的准确率超过 90%。截至目前,爱奇艺站内全端 AIGC 视频看点卡段、图文等运营素材超 70 万条。 03 应用及服务(2C) 【百度:将在 10 月 17 日发布多款 AI 原生应用(IT之家)】 百度近日宣布,10 月 17 日,以“生成未来(PROMPT THE WORLD)”为主题的 Baidu World 2023 将在北京首钢园举办。百度将发布多款 AI 原生应用,介绍大模型最新进展,分享如何通过 AI 原生思维,与企业、用户、以及合作伙伴一起抓住新机遇。 【AI 搜索引擎 You.com 在 WhatsApp 上推出人工智能搜索功能(BusinessWire)】 8 月 23 日,AI 搜索引擎 You.com 宣布在 WhatsApp 上推出人工智能搜索功能,允许用户体验 AI 聊天和搜索,并获得带有来源和直接网络链接的答案。 【昆仑万维发布国内第一款AI搜索产品(财联社)】 昆仑万维正式推出国内第一款融入大语言模型的搜索引擎——天工AI搜索,并开启内测申请。 【AI 作画工具 Midjourney 推出“Inpainting”功能,可对已生成图片进行局部重绘(IT之家)】 知名 AI 作画工具 Midjourney 日前上线了一项新功能“Inpainting”,以每月 10 美元的价格订阅 Midjourney 的用户现可体验。据称,该功能能够使用户对已生成图片的局部或细节进行修改,不需要重新创建一个全新作品。外媒 PCMag 报道称,例如用户可以先利用该工具生成一张“一条鱼从水面跃出”的图片,随后通过“Vary(Region)”按钮,可输入一个新的提示,例如将此前生成的鱼替换成鲨鱼。Midjourney 表示,该功能在所选区域占图像大小 20%-50% 的情况下,能够拥有最佳表现。此外,如果更改的局部细节与图片匹配度更高,效果也就更好。 04 重要上市公司变化 【Opera 二季度财报:营收同比增长 21% 至 9410 万美元,净利润为 1350 万美元(PRNewswire)】 纳斯达克上市公司 Web3 浏览器开发商 Opera 公布二季度财报,二季度营收同比增长 21% 至 9410 万美元,其中,广告营收达到 5380 万美元,同比增长 25%;搜索收入达到 3890 万美元,同比增长 15%;技术许可和其他收入为 150 万美元。 【英伟达第二财季营收和业绩展望均远高于预期(财联社)】 英伟达第二财季营收135.1亿美元,分析师预期110.4亿美元;第二财季数据中心营收103.2亿美元,分析师预期79.8亿美元;预计第三财季营收在160亿美元上下2%区间,分析师预期125亿美元;第二财季游戏营收24.9亿美元,分析师预期23.8亿美元;第二财季汽车营收2.53亿美元,分析师预期3.094亿美元;第二财季调整后每股收益2.70美元,分析师预期2.07美元;第二财季调整后毛利润率71.2%,分析师预期70.1%;批准额外的250亿美元股票回购计划。
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。