推广 热搜:   公司  快速  中国  企业    行业  设备  上海  未来 

CIIS 2019 | 百度CTO王海峰解读AI发展趋势

   日期:2024-11-11     移动:http://keair.bhha.com.cn/mobile/quote/838.html

10月26日消息,第九届中国智能产业高峰论坛(CIIS 2019)在西安开幕。会上,百度首席技术官、ACL/CAAI 会士王海峰出席峰会,并发表题为《AI大生产平台推动产业智能化》的演讲,全面介绍百度如何通过探索顶尖AI技术、打造AI大生产平台,助力产业智能化发展。

CIIS 2019 | 百度CTO王海峰解读AI发展趋势

王海峰介绍称,人类经历的前三次工业革命中,驱动工业革命的核心技术都表现出很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征。而百度人工智能技术多年积累和产业实践的集大成——百度大脑,实现了AI能力与应用场景融合创新,已升级为“软硬一体AI大生产平台”。

据了解,在数据和算力的基础上,百度大脑“软硬一体AI大生产平台”以飞桨深度学习 平台为基础技术底座,打通了人工智能产业化应用落地相关的全部流程,包括深度学习 平台、通用AI能力、定制化训练平台、部署与集成,以及应用的技术解决方案,同时有完整的AI安全体系保障,实现了AI技术的标准化、自动化、模块化,推动产业智能化。

人工智能的发展离不开算力的支撑,而芯片是算力层面被关注的焦点。他表示,百度自研云端通用AI处理器——百度“昆仑”,针对语音、自然语言处理、图像等专门进行了优化,同等性能下将成本降低了10倍。此外,百度打造了远场语音交互芯片百度“鸿鹄”,“鸿鹄”芯片按照车规级标准打造,采用HiFi4自定义指令集,双核DSP核心,具备超大内存,包含TCM Cache SRAM,而且能耗极低,平均功耗仅100mW,可实现远场阵列信号的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。

王海峰指出,底层的芯片和上层的应用之间,还需要操作系统承接。在智能时代,深度学习框架向下对接硬件、芯片,向上承接各种业务模型、行业应用,起到承上启下的作用,是“智能时代的操作系统”。百度在多年深度学习和人工智能技术的积累和产业实践的基础上,打造了自主可控的飞桨产业级深度学习开源开放平台。

据介绍,飞桨平台核心技术领先,具备开发便捷的产业级深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、开源开放覆盖多领域的产业级模型库四大领先技术;飞桨平台集深度学习训练和预测框架、模型库、开发套件、工具组件和服务平台等为一体,是功能完备、全面开源开放的产业级深度学习  平台。王海峰介绍,基于飞桨的EasyDL等服务平台,企业和开发者即使不懂深度学习,也可以训练出满足应用需求的模型,加速AI的应用落地。

语音技术领域,百度大脑的流式多级截断注意力模型(SMLTA)使识别准确率提升15%-20%。王海峰现场展示了基于SMLTA中英文混合识别能力,这一能力目前已在的百度输入法上大规模应用;风格迁移的语音合成技术把声音中的音色、风格、情感等不同元素解耦分离,独立组合,灵活控制合成的声音,只需录制20句话,就可以制作一个人的专属声音。基于此技术,百度上线了全球首个地图语音定制功能,为用户带来了前所未有的个性化体验。

在视觉技术方面,基于图像技术、人脸人体技术和视频分析技术,百度已经形成适用于不同应用场景的技术矩阵,如OCR文字识别、车辆识别、物体识别、风格转化,以及人脸检测、人脸对比、驾驶行为检测、人流量统计等,在机械制造、金融、医疗、教育等领域得到广泛的应用。而通过3D和AR的手段,已经实现人脸、手势、环境、肢体多维度的技术突破,可用于一体化人机交互等创新应用。

综合应用语音和视觉技术,机器可以自动合成虚拟形象。百度大脑的虚拟形象合成技术,首先对语音信号和视频信号进行识别与理解,再通过唇动生成,以及语音、面部和肢体的合成,合成一个虚拟形象。

在语言与知识技术方面,百度建立了完整的、包含知识图谱、语言理解、语言生成等在内的语言和知识技术布局,全面支持搜索、问答、对话等百度产品,同时开放赋能,支持各行业的创新应用。百度构建了世界上最大的多元异构知识图谱,在能够满足90%用户需求的实体图谱的基础上,针对不同的应用场景和知识形态建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。

自然语言处理技术也在持续创新突破。百度结合知识和语义理解打造的可持续学习的知识增强语义理解框架ERNIE,通过建模海量数据中的实体概念等先验知识,学习真实世界的语义关系。这种融合知识的语义建模大幅增强了模型的语义表示能力,在共计16个中英文自然语言处理任务上效果超越了谷歌BERT和XLNet;在机器同声传译方面,百度首创感知上下文的机器同传模型,可以实现端到端实时同声传译,翻译准确率和时延与人类水平相当。百度构建的面向任务的理解与交互技术,现在已经积累了6.8万个定制技能、累计交互570亿次,在车载交互、地图导航、智能音箱、政务咨询等诸多场景中得到广泛应用。

他还表示,以百度大脑为核心,以飞桨为基础底座,依托百度智能云,百度大脑AI大生产平台为各行各业的智能化转型升级提供了强有力支撑。例如,百度联合浦发银行推出了金融领域首个“数字”员工小浦,凭借专业的金融知识、对用户需求的深刻理解,为客户带来全新的服务;百度的AI质检技术应用于工厂的质检车间,帮助人员成本节省90%,占地面积减少80%,将漏检率从0.5%-1%降低到0.1%以内;为重庆气象局打造的智能预报预测系统,可以覆盖短临、短期和气候预测,大幅提升气候预报的准确率、缩短气象预警信息的发布时间。

资料显示,目前,百度大脑AI大生产平台已开放216项核心AI能力,日调用量突破1万亿次,开发者超过150万,企业用户发布模型超过16.9万个。

本文地址:http://keair.bhha.com.cn/quote/838.html    康宝晨 http://keair.bhha.com.cn/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关最新动态
推荐最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号