您的位置 首页 智能

手机的想象力到底有多大?揭秘小米10背后的AI想象力

另一个AI技术在小米10上的展现,是通过智能算法,让以往需要滑轨、手摇等技巧才能实现的镜头效果,不用动手机就能完成运镜,制作vlog。 语音方面,小米自研的语音识别、合成、语音唤醒和声纹识别等关键技…

beplay安卓下载生活网是立足beplay安卓下载面向全国融新闻资讯,体育赛事,娱乐八卦,IT科技,财经资讯,公益资讯,旅游资讯,教育资讯等知识性和娱乐性、服务性于一体的综合性门户网站。本站致力于为广大网民提供最新最及时的新闻热点资讯。

在小米10的发布会上,这些关于手机的想象力借助AI被进一步延展开来。相比配置,AI技术在小米10上有更突出的体现,除了小爱同学新发布的定制声音、定制唤醒词功能,换天技术、文档拍照和语音合成,这些使用简单的功能背后都积累着小米自研AI多年的技术积累。

换天技术、语音合成、文档拍照

小米10最亮眼的AI技术都在这里

在小米10上,AI技术帮助拍照实现了换天功能。尽管许多手机厂商也提出过类似功能,但实际上能够达到小米10所呈现的效果的并不多。

小米AI实验室通过数万张高精度、场景覆盖广泛的天空图片作为训练集,不断优化模型结构,训练出了高精度的天空分割模型。 这样的做法下,使得小米的天空分割算法能精准分析天空和前景,边缘识别准确,分割细腻,达到像素级抠图标准。在包含各类场景的全面评测集上,小米换天成片率达到90%+。

到了后4G时代,对于画面的记录,人们已经不满足于单个画面的拍摄,而是更多地往视频、短视频、动态图片等方向延伸。这对手机厂商的相机功能和图像处理技术提出了更高的要求,视频相较于图片的拍摄以及后期,处理难度都更大。

展开全文

另一个AI技术在小米10上的展现,是通过智能算法,让以往需要滑轨、手摇等技巧才能实现的镜头效果,不用动手机就能完成运镜,制作vlog。如果想在视频中增加字幕,可以直接通过语音识别的方式,自动转化成字幕。让用户在使用小米10拍vlog后,后期制作的成本大大减轻。

之所以能够达成这样的效果,背后是小米AI实验室做了大量的算法优化和实时调校,把多个计算单元有机结合,最大限度发挥了手机平台的计算性能。

语音和文档解析方面,小米10也提出了更优的AI解决方案。语音正在逐步解放人们的双手,语音技术在智能硬件,虚拟助手,智能客服,智能车载等场景中扮演者非常重要而关键的角色。

小米语音合成从数据积累,算法创新和工程优化等多方面,实现了流畅的中英文合成效果,尤其是在中英文衔接处如真人般的流畅自然,无切换感。此外合成速度很快,减小了用户的等待成本。

小米拍文档能够识别到图片复杂场景中的文档/身份证的边缘,沿着边缘,将其“抠”出来。根据用户的选择,将文档图片变成黑白效果/增强效果,保留细节,去除阴影,增强色泽。和语音合成一样,合成速度很快,用户无等待感知。

值得一提的是,拍文档功能的算法由小米AI实验室武汉视觉团队完全独立负责,在疫情之下他们依然交出了优秀答卷。

仅靠列举,小米10所能够产生的想象力已超出边界。尽管从整个智能手机行业来看,创新遇到瓶颈、换机潮遇冷的负面舆论不绝于耳,但依然有先驱者在其中发现了用户的需求,而这些需求依然需要通过更精准、更有沉淀的技术进行解决。

小米AI的自研之路

罗马不是一日建成的。相比于简单堆砌配置,AI技术的展示更能显示出手机厂商的前驱性。小米10所展示的AI技术,意味着小米必须在2-3年前就预想到消费者的潜在需求,并经过长时间的实验和测试,最终推向大众消费市场。在这一点上,小米在2019年2月就将人工智能部拆分为独立事业部,去年11月,国际语音顶级学者Daniel Povey加盟小米,在AI自主研发这条道路上,为小米添砖加瓦。在小米“手机+AIoT”的双引擎战略里,AI扮演了非常重要的角色。

目前在整个行业,手机相机研发有一个明显的趋势,就是人工智能的深度整合,具体来讲有两个方面:

一个就是手机相机的软件化和算法化,之前很多手机相机的体验是靠硬件去做,但是最近这两年,一些领先的体验是通过软件算法实现。第二个趋势就是算法AI化,越来越多的相机算法从传统图像处理算法转变成AI算法。这些都在小米10上集中体现出来。

尽管是一家互联网公司,但实际上,小米的所有产品,包括硬件产品、软件产品和互联网服务都需要AI来赋能。

通过小米AI实验室的两年研究,目前小米已经在声学、语音、视觉,NLP、知识图谱、机器学习6大方向取得一系列成果。

视觉上,小米换天得到了众多用户的喜爱,除此之外,单摄虚化、人脸解锁、美颜、场景识别等AI主导的功能,也早已应用在小米的系列手机上。

语音方面,小米自研的语音识别、合成、语音唤醒和声纹识别等关键技术也已经落地在手机、电视、音箱等众多小米产品上。其中最新的小爱音箱Pro,就包含了“就近唤醒、全屋播放、声源定位、多通道降噪、回声消除、去混响”等功能。近日,小米语音团队自研的“多通道端到端语音技术”,取得比“传统多通道阵列增强模块加单通道语音技术”更好的性能。

相比价格、商业模式,只有真正的技术实力能成为竞争对手难以逾越的门槛,小米花了两年时间,构筑了足够高的城墙。

技术立业自研AI让小米更具想象力

厚积薄发和专注极致,二者在小米身上得到了难得的平衡。手机厂商都在进行自我转型,每一家都先后付出了不少代价。但即使从功能机时代就开始打拼,手握诸多优势,仍然长期不能打开局面,最终还是借助智能手机的浪潮才成功突围。基于与用户的沟通和市场嗅觉,电子产品依然有令人着迷的想象空间。但这些想象力未必是硬件本身带来的,而是驱动这些硬件背后的技术,例如AI。

换做其他人或者很难想象,就在两年前,消费者可供使用的手机AI功能还十分有限,人工智能更像是一个高不可攀的宏大词汇。但截止到2019年,《2019智能手机影像技术应用观察及趋势分析》报告已经指出,随着人工智能技术在智能手机拍照领域的成熟运用,影像技术已经成为影响手机销量的重要指标之一。

2020年以后,随着5G的普及,智能手机的影像性能和外观设计仍将是推动创新的两大源动力,在这其中,小米10背后的AI技术将更具想象空间。

beplay安卓下载生活网所有文章均来源于网络,文章所涉观点及言论不代表本站立场,如文章有侵犯他人权利,请联系我们删除,转载请注明出处http://www.gl879.com/tech/zn/126098/

为您推荐

返回顶部

友情链接: