国内人工智能产业近年迎来大爆发。
无论是萝卜快跑的自动驾驶出租车,还是智能识图、语音识别与输入、影音剪辑等方面,产业智能化实践正在遍地开花。
市场上并不缺乏新的技术,但决定市场走向的,是那些把技术应用扎进各行各业当中的技术创新。曾几何时,国内人工智能的开发者、程序员、工程师,用的深度学习框架都来自海外,包括TensorFlow、PyTorch等。
而如今,历经6年开发并逐渐成熟的百度飞桨,成为越来越多中国开发者、算法工程师们的优选。
伴随着应用飞桨项目和产业端结合的越来越频繁紧密,截至年11月,飞桨平台已凝聚万开发者,服务20万企事业单位,基于飞桨创建了67万个模型,逐渐成为一个非常易于开发的通用性人工智能深度学习平台。就在刚刚过去的WAVESUMMIT+深度学习开发者峰会上,百度飞桨发布开源框架2.4版本,框架开发更加灵活便捷,深入产业融合创新。
作为国内首个自主研发、功能丰富、开源开放的产业级深度学习平台,从创新自身技术,并对外共享这种创新能力,让人们更好开发、使用技术,推动产业加速迈向成熟,到目前综合份额已经位列市场第一,飞桨到底是如何做到的?
#01
技术改变世界
人工智能领域刚起步的时候,核心技术能力不足、人力成本高、领域专业性强等,让AI曾一度停留在技术理论积累和工具平台构建的发力储备期。
到谷歌年推出超级人工智能阿尔法狗之后,深度学习开始成为很多人工智能公司追求的系统技术基础。阿尔法狗的底层框架,正是建立在谷歌公司和另一个从谷歌出来的资深程序员提出的TensorFlow之上。
当时TensorFlow带着计算图与可视化理念,通过在业界疯狂营销培养生态杀入AI框架后,很快就凭借着低门槛特性赢得了一众业内同仁的高度认可,另一个平台PyTorch诞生伊始,凭借其巨大的灵活性优势受到了学界的广泛欢迎。彼时,这两个新生的深度学习框架迅速在业内走红,成为后续各个创业项目技术积累的基础。
年之后,国内大大小小的人工智能应用,绝大多数也都是基于这两个框架所提供的各种服务和封装模块进行,虽然大大降低了开发人员的难度,但很大程度上也将技术核心的支持能力拱手相让。
而且,TensorFlow过于注重工业,PyTorch专注学界,随着数字化浪潮渐起,AI应用需求日益升级,如何让技术既能兼顾了学界的灵活,又可以实现产业界希望的高效?
尤其随着人工智能的规模化落地,基于深度学习框架上下延伸、构建AI生态平台成为国内AI技术发展的迫切需要。得框架者得天下,我们需要更懂中国的开发平台,需要属于我们自己的核心技术。
谁能弯下腰去创新,去研发?
年7月,李彦宏在百度AI开发者大会上喊出了要让“EveryoneCanAI”的口号,其实这句口号后面还要加上一个限定——“通过百度的AI平台”。飞桨就是这一口号付诸实践的突破点之一。
年4月,时任百度高级副总裁(现百度CTO)王海峰在WaveSummit深度学习开发者峰会上,为深度学习框架PaddlePaddle在百度内部的战略地位进行了定调。PaddlePaddle发布中文名“飞桨”,并强调更懂中国开发者,以及更加专注于深度学习模型的工业生产和部署。
作为自主可控的全栈平台,飞桨提供了人工智能模型开发、训练、推理部署全流程平台,并提供模型库、开发套件、配套工具与组件,通过开源开放,让开发者无需从第一行算法代码写起,可以直接调用飞桨提供的相关模块,大幅降低了人工智能技术开发与应用的门槛,是加速我国技术普惠与产业赋能,构建国产化生态体系的重要一环。
李彦宏曾说:“专注技术,信仰技术,相信技术可以改变世界。从创建百度的第一天起,我对它的期待,始终没变。”
过去在数字化路上摸爬滚打的10年,百度累计研发投入超过亿,每年研发投入都占据营收15%以上,去年这个比例甚至高达23%,而去年中国民营企业强研发投入名单中,研发投入强度超过15%的,只有百度与华为。
高强度的科技投入不仅让百度建立起领先的人工智能技术优势,还让其不断自研出产品,形成丰富的生态矩阵。据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,基于飞桨深度学习平台,百度还打造了产业级知识增强文心大模型。从最新的文心全景图可以看到,文心大模型已经形成“模型层+工具与平台层+产品与社区层”的整体布局。
目前,文心大模型总量增至36个,构建起业界规模最大的产业大模型体系,并通过大模型工具与平台的升级和文心一格、文心百中等基于大模型技术的产品应用,进一步降低大模型产业化门槛,让更多企业和开发者步入AI应用的新阶段。
基于这些大模型的产业实践,百度一方面加强大模型技术突破,联合研制行业大模型,建设配套的工具平台;另一方面,支撑大模型开发、训练和推理部署的深度学习平台,也在持续进化。
最近,飞桨正式发布开源框架2.4版本,框架开发更加灵活便捷,大模型分布式训练性能持续领先,实现了全场景高性能部署,并发布部署工具FastDeploy;为了更好地支撑大模型应用落地,业界首发端到端大模型开发套件PaddleFleetX;联合12家硬件生态伙伴发布飞桨生态发行版;联合行业龙头企业发布产业范例征集计划;发布飞桨产业级模型库一站式入口;AIStudio学习与实训社区升级推出企业实训库和生态异构算力中心等,一系列举措夯实AI技术基座,深入产业融合创新。
#02
让AI更接地气
从市场和用户的需求、反馈中汲取营养,创新迭代适应变化的技术产品和服务,让AI从技术概念到真正落地解决实际问题。AI底层框架的“接地气”是让技术与产业应用更加贴近,这也是飞桨一直强化的低门槛、产业级特性。通过不断降低应用门槛,让AI技术更好地应用到广泛的产业实际场景中去,真正做到为产业智能化升级的助力。
我们看到,不管是开源框架、产业级模型库还是飞桨的企业版,飞桨推出的一系列新发布与升级都致力于加速AI的落地应用。通过让更多人零距离接触到先进的深度学习和大模型技术,激发更多落地的创新与创意。
值得一提的是,今年飞桨还发布了年度“飞桨产业应用创新奖”,14家企业项目入选,包括工商银行()、中国联通()软件研究院、中国外运()、TCL工业研究院、龙源电力、泰康保险、浙江恒逸石化()、国家农业智能装备工程技术研究中心、韵达控股、铁科院基础所、NI中国、用友网络()、润建股份()、信润富联。
还有更多飞桨广泛应用的案例:比如,广东荣旭智能技术有限公司基于飞桨开发出一套高检出率、高速的电子元器件外观瑕疵检测系统,瑕疵检测率提升到99.98%以上,助力工业自主智造把好“质量关”;比如,广州市微柏软件股份有限公司,依托20余年基建行业信息化实施经验,基于飞桨企业版EasyDL零门槛AI开发平台,研发出一套智慧梁场解决方案,并成功应用于汉巴南铁路的蓬安制梁场,实现梁片生产工序识别准确率高达98%,节省30%人力成本;比如,宁夏建筑设计研究院的一位建筑电气工程师基于飞桨自然语言处理模型库PaddleNLP用两周时间开发完成工程规范AI搜索引擎“寻规”,工程规范查询效率提升60倍,已在宁夏建筑设计研究院实际应用......
当然飞桨的合作伙伴不仅仅局限在企业,很多高校、研究机构也都在实践研究应用中选择了飞桨。内蒙古工业大学教授秦俊平带领团队与内蒙古智慧牧业信息技术集团公司合作,使用飞桨开发出母羊分娩预测和预警系统,不仅减轻了牧民工作量,也提高羊羔成活率;在近年