欢迎访问悟空智库——专业行业公司研究报告文档大数据平台!

开源证券-计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化-230410

上传日期:2023-04-10 19:26:16 / 研报作者:陈宝健闫宁 / 分享者:1005672
研报附件
开源证券-计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化-230410.pdf
大小:325K
立即下载 在线阅读

开源证券-计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化-230410

开源证券-计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化-230410
文本预览:

《开源证券-计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化-230410(3页).pdf》由会员分享,可在线阅读,更多相关《开源证券-计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化-230410(3页).pdf(3页精品完整版)》请在悟空智库报告文库上搜索。

(以下内容从开源证券《计算机行业点评报告:Meta发布SAM模型,视觉CV迎来重大变化》研报附件原文摘录)
  Meta发布首个基础图像分割模型SAM   (1)SAM概况:2023年4月,Meta发布CV模型SAM(即Segment AnythingModel),以及对应的数据库SA-1B。SAM是面向通用场景的图像分割模型,并且引入NLP领域的prompt范式,用户通过合理的prompt即可完成图像分割任务,无需额外训练实现“开箱即用”。   (2)SAM训练方法:SAM由SA-1B数据库训练而来,SAM通过人工交互式分割后(先训练再人工注释),再用注释后的数据更新SAM,多次重复循环,不断优化模型和数据集。SA-1B(1Billion)数据库包括1100万张高分辨率的图像以及11亿个高质量的分割掩码(masks),图像数量和masks数量分别是现有数据集的6倍和400倍,图片平均分辨率达1500×2250,颗粒度可以达到门把手级别,是目前最大的分割数据集。   (3)SAM应用场景:SAM可用于任何需要对图像进行识别和分割的场景,基于prompt工程,可以成为内容创作、AR/VR、科学领域或通用AI系统的组件,实现多模态处理。比如在AR/VR领域,SAM可以把用户注视的对象升维至3D;对于内容创作者,SAM可以提取图像用于拼贴或视频剪辑。   SAM分割能力大幅提升,有望降低计算机识别门槛   (1)SAM分割能力大幅提升。CV模型的核心任务是图像识别,难点在于图像可以无限细分、逻辑关系复杂,识别的颗粒度和准确性存在冲突。SAM目前对于未知和模棱两可的场景也能实现较好的图像分割效果。英伟达AI科学家JimFan表示“SAM是计算机视觉领域的GPT-3时刻”。   (2)有望降低计算机识别门槛。图像分割是计算机视觉的基础技术之一,由于图像的复杂性,面对不同场景需要设计不同的图像分割模型。SAM的目标在于建立一套图像分割基础模型,降低对于特定场景建模知识、训练计算、数据标记的需求,有望在统一框架下完成图像分割任务。Meta表示将SAM模型和SA-1B数据库开源,未来有望作为基础模型,大幅降低计算机识别门槛。   投资建议:看好在CV领域具备技术储备和应用场景的公司   CV技术在自动驾驶(物体检测、车道标记、信号识别等)、面部识别(安防、支付等)、医疗、制造、遥感等场景有广阔应用前景,根据福布斯数据,2022年计算机视觉和硬件市场规模达486亿美元。我们认为,SAM大幅降低计算机识别门槛,CV通用场景应用有望加速推广,多模态技术的应用也有望进一步提速,看好在CV领域具备技术储备和应用场景的公司:(1)图像识别领域,受益标的云从科技、千方科技、格灵深瞳、虹软科技、海康威视、大华股份等;(2)遥感卫星领域,受益标的航天宏图,中科星图等;(3)自动驾驶领域,受益标的中科创达、四维图新、光庭信息、东软集团等。   风险提示:技术发展不及预期;商业落地不及预期;政策支持不及预期。
展开>> 收起<<

#免责声明#

本站页面所示及下载的一切研究报告、文档和内容信息皆为本站用户上传分享,仅限用于个人学习、收藏和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。如若内容侵犯了您的权利,请参见底部免责申明联系我们及时删除处理。