新闻动态

晚上9点的办公室,同事们都陆续结束了一天的工作,但对于华仔和他的小伙伴来说,另一场战斗却刚刚开始。他们修正数据模型,整理结果,每天要忙到深夜1点。去年,他们所在的队伍在昆仑首席数据科学家田博士的指导下,在业余时间参赛一举拿下了2017PHM竞赛的冠军。今年,考虑到更多客户项目的交付压力,分析团队没有计划参与任何赛事,但年轻的小伙伴还是想挑战自己,于是自行组队,利用愈加宝贵的深夜时段,参加了2018KDD-CUP,最终位列十强。   年轻数据科学家的竞赛之路   KDD-Cup被称为数据挖掘领域“奥运会”, 每年都会吸引来自世界各地数据挖掘领域的顶尖专家、学者和工程师参赛,今年参赛队伍更是突破往年的数量,达4000多支。K2Data的这三位年轻的90后数据分析师,也成为了今年的4000分之一。   比赛由ACM协会的国际顶级会议SIGKDD举办,自1997年以来每年举办一次。该比赛一直以来都强调在实际场景中的应用性。本届赛题十分独特,空气污染物(PM2.5,PM10,O3)预测不仅具有规律性弱、不稳定、易突变的特点,并且因为要预测未来48小时中的每个小时,以及北京/伦敦城市内几十个预测地点,建模时间序列以及地点拓扑关系给机器学习模型带来挑战。   现有的方法针对的预测的时间段较短,没有基于位置拓扑以及利用天气预报进行建模,在机器学习尤其深度学习模型的运用也处于探索阶段。并且,由于比赛赛制每天需提交未来结果,相对于很多基于固定测试集的方案或比赛更接近真实工业界,对模型的稳定性以及迭代开销也有很多挑战。     其中最大的挑战是数据的缺失问题。因为站点有时需要维护或传感器出现故障,可能出现数据延迟或数据缺失的情况,官方提供的训练集数据的缺失情况如图1所示。       由图1可知,缺失最多的是PM10,缺失比例已经超过了25%,不能够直接用来建模。不过华仔和他的小分队发现了PM2.5,PM10之间有着非常好的线性关系,O3与温度之间则有非常好的指数关系,由此可以建立PM2.5与PM10线性模型,利用该模型对PM2.5和PM10进行相互插补(如图2所示)。此外可以建立O3与温度的指数关系模型,利用该模型对O3缺失值进行插补。但是,又发现同一时刻的PM2.5、PM10、O3存在同时缺失的情况,这种情况可以利用空间关系进行缺失值插补。基于上面的思路,建立了3-phase插补算法,有效解决了核心的数据缺失问题,基本就一直锁定了TOP30的排名优势。   在华仔看来,最终保持TOP10成绩主要来自于有效特征的挖掘。以weather type(天气类型)字段为例,挖掘了weather scoring 和binning feature两大类的有效特征,基于上面的数据预处理和特征工程,得出参赛最终提交的整体O3、PM10、PM2.5的预测效果。     昆仑数据:用人工智能解决工业问题   对参加KDD-CUP的夙愿,华仔表示,KDD-Cup是工业界和学术界都非常关注的一个比赛,也产出过很多对业界有影响的技术,比如KDD-Cup 2012产出的XGBOOST和FFM模型对工业界产生了很大的推进作用,而在工业界有了一定应用沉淀后,又不断地对这两种模型进行优化。   随着人工智能AI的红利,越来越多的领域开始尝试使用机器学习来解决现实问题,从KDD-Cup赛事命题方向的变化就可以反映这种趋势。以往的赛题多集中在推荐系统的设计,近年来开始转向机器学习技术在教育、交通等传统行业的实际应用问题。   人工智能已经从技术概念逐步开始了场景化、商业化的落地,随着技术与人才的逐步成熟,用大数据与人工智能技术推动工业智慧升级,将从昆仑数据的使命演进成不远的现实。...

Read More

8月2日-3日,2018中国大数据产业生态大会在北京隆重召开。此次大会以“深挖数据智能•助推数字经济”为主题,由中国电子信息产业发展研究院主办,中国电子信息产业发展研究院卢山院长、工信部党组成员、总工程师张峰,工信部原副部长杨学山等出席并致辞。昆仑数据作为工业大数据行业领军企业受邀出席活动,并获得两项重磅大奖。   会上表彰通过中国大数据产业生态地图调研而评选出的,代表中国大数据中坚力量的“2018中国大数据企业50强” ,这是昆仑数据自2016年该奖项启动以来,连续第三次入选中国大数据企业50强,该奖项评选着重评定企业在大数据业务上的研发投入、创新能力、应用案例、产品及方案成熟度、投资及发展潜力等。一同入选的还有阿里巴巴、华为、腾讯等企业。     2018中国大数据专有领域奖项中,KSTONE工业互联网平台获得业内专家一致认可,被评选为“2018中国大数据工业互联网领域最佳产品”。作为昆仑数据强有力的进阶性产品,昆仑工业互联网平台KSTONE更多强调的是垂直工业领域的资源整合及数据连接。KSTONE集成了KMX平台的原有能力,并扩展了工业智能流水线、工业应用商店等功能,提供工业APP创新端到端支持。不止于底层通用技术平台,KSTONE更强调垂直领域的行业属性与行业服务,携手行业龙头,打造数据价值驱动的新型工业互联网生态。     此次大会重磅发布了《2018中国大数据产业生态地图暨中国大数据产业发展白皮书》,与产业同仁分享赛迪研究院对中国大数据产业发展现状及大数据产业生态格局调查的最新研究成果。来自七十多家国内知名大数据创投机构及产业资本的一百多位投资人,青岛、福州、杭州、武汉、贵阳等地市政府,国内外优秀的大数据企业和用户代表,中国大数据产业生态联盟的专家和企业领袖,知名高校、科研机构及主流媒体,约计1500多人出席了本次会议。 ...

Read More

2018年7月20日,中国机械工业联合会智能制造分会在北京成立,同时召开一届一次理事会。中国机械工业联合会会长王瑞祥、工信部装备司副司长王瑞华出席会议并致辞,昆仑数据CEO/创始人、工业大数据创新中心主任 陆薇博士当选协会理事。     智能制造已成为机械工业调结构、转方式、换动能的重要引擎。目前,机械工业转型升级进入了爬坡过坎的攻坚期。如何抓住机遇,加快智能转型,实现高质量发展,是关系全局与行业长远发展的当务之急。相关企业、研究院所、高校对于智能制造的发展有着迫切需求,根据推动行业技术创新和产业转型升级的需要,中国机械工业联合会成立智能制造分会。   此次分会发起单位84家,其中包括清华大学、北京机床研究所、沈阳重工等企业、研究院所、高校及行业协会,涉及自动化、仪器仪表、工程机械、电工电器、汽车、轨道交通、航空航天等产业,以及人工智能等领域。昆仑数据将联合协会的相关领域的产学研用资源,为智能制造领域成员单位提供产业发展和市场服务,促进成员单位共享资源、共同发展。   ...

Read More

为贯彻落实工业和信息化部《工业互联网 APP 培育工程 实施方案(2018-2020)》到 2020 年培育 30 万个面向特定行业、特定场景的工业 APP 的重点工作。中国工业技术软件化产业联盟于 2018 年 7 月 18 日召开第一届理事会第三次工作会议,会议由联盟理事长单位工信部电第五所副所长王蕴辉主持,工业和信息化部信息化和软件服务业司李冠宇副司长、商超处长出席会议并作重要发言,联盟常务副秘书长阎丽娟做工作汇报。   本次会议就 2018 年下半年联盟总体工作计划听取联盟成员意见,审议联盟工作组组长、副组长单位的报名情况,成立技术委员会、按分行业建立分委会,分配工作组任务。昆仑数据CTO、北京工业大数据创新中心总工程师王晨当选联盟工作组标准组副组长。     昆仑数据将和其他成员单位一同努力,建立工业技术软件化标准预研和推进机制,建立工业技术软件化标准体系,组织开展标准研制,推动联盟其他分组 的技术攻关、解决方案等业务活动形成行业/国家技术规范、标准,开展国际标准化交流与合作等工作中发挥自己的作用。...

Read More

智能制造不是一场突然而至的革命,也不是一蹴而就的革新。   今天,我们不谈大数据和人工智能将为中国工业带来什么,也不谈昆仑数据服务的行业巨头企业在数字化转型上可圈可点的成果,我们希望抛开智能,看看中国万千中小型制造企业谈及对新兴技术渴求为何会如鲠在喉。   ·技术不解决最根本的问题   如果真的到中西部、东南沿海乃至江浙工业重镇走一圈,你就会了解到,目前大多数中小企业仍旧处在工业2.0阶段。企业为了保证交期、减少质量问题而疲于奔命,甚至缺乏最基本的标准化流程和作业的标准化,更不用谈管理的系统化,生产交付永远处于救火状态,而粗放的管理方式一旦在企业内部形成恶性循环,不是靠“机器换人”和“信息化系统”可以解决的。我们认为管理水平的提升、流程的优化、标准化的建立是当前企业应该首要解决的问题,才能让“智能”发挥出最大的价值。   ·智能化才刚刚起步   有多少制造企业长期依靠低廉劳动力或牺牲环境资源赚得一手利润差,就将会有多少企业在低端制造业外流的浪潮下朝不保夕。有关数据显示,时至今日,我国企业信息化应用水平较高的企业仅占14.6%,多数企业使用智能设备替代人工的动力不足。现阶段,即使引入智能设备,也仅停留在初级应用阶段,远没有形成构建智能制造体系的战略思维和总体规划。我国制造业全面实现数字化、网络化、智能化还有很长的路要走。   ·人才瓶颈制约   我国传统的工业重镇一般都地处偏远,且不说北上广深,也很难与人才抢夺战中的网红省会城市一拼。这种人才的缺乏不仅仅是技术型岗位。从经营管理层面来看,企业缺少具有预见力的领军人物,以及在高水平的研发、市场开拓、财务管理等方面的专门人才。从技术员工队伍层面来看,初级技工多,高级技工少;传统型技工多,现代型技工少;单一技能的技工多,复合型的技工少的现象普遍存在。员工综合素质偏低,直接制约了智能制造系统的应用和推广。而在国家战略层面,涉及智能制造标准制定、国际谈判、法律法规等方面的高级专业人才更是明显的“短板”。   ·工业界缺乏国际话语权   不得不承认,在工业领域,我国产、学、研的整体科技水平与美日欧等先进国家仍有较大差距。智能化的软硬件缺乏自主研发技术,除了被美国拿来要挟中兴生死的“高端芯片”,工业制造中大量高端传感器、操作系统、关键零部件主要依赖进口,在一定程度上阻碍了智能制造的发展。我国虽然是制造大国,但是由我国主导制定的制造业国际标准并不多,国际上对中国标准的认可度也不高,中国在全球制造标准领域缺少话语权及影响力。   与昆仑数据服务的大型行业龙头企业相比,新兴技术的快速更迭正在加大这种制造业“贫富差距”。 “智能制造”、“企业上云”的观点都会每年不断被重复,在中国万千中小型制造企业中,有的为了顺应政策号召却只在表面做到了形似,而我们,更愿意以长期价值来衡量新兴技术如何渗透到一线,给企业带来多少利润和价值提升。   如何将显性知识、隐性经验、隐藏在过程数据中的模式规律透过新型感知、执行应用到设备控制、生产管理、工艺设计或经营过程中?   每个工业领域都经历了几十年的发展,有其特殊的行业知识沉淀。以敬畏之心做工业大数据与工业智能,只有扎根行业,常驻一线,才能完成行业知识重构。   弯下身子搞“制造”,虽然不及翘起脚尖搞“智能”听起来高大上,但这正是当下工业界需要正面应对的问题。...

Read More