Author: way

2018年9月16日,为贺清华大学计算机系60周年,“人工智能 启迪未来”论坛在清华大学举办。昆仑数据创始人&CEO陆薇作为清华计算机系2001年博士毕业生代表参与活动,与多位人工智能的学者、企业家、创业者共同出席,探讨人工智能将如何启迪未来。     中国工程院院士、清华大学计算机系主任吴建平出席活动并致辞。启迪控股董事长王济武,日本工程院院士、欧盟科学院院士、中国人工智能学会副理事长任福继分别发表主题演讲。   吴建平院士在演讲中提到,人工智能为什么这么热?一方面是人工智能遇到了两个对它有最大促进作用的技术,计算机技术和互联网。另一方面,人工智能现在有了很多的应用场景。   任福继理事长谈到对于人工智能的发展,未来30年要做到以下几点:产业上有效利用大数据,做好算法,深挖场景。只有这样,才可能研发出更好的人工智能产品。这仍然是数据加算法驱动。   在清华校友AI大数据专委会秘书长王霞的主持下,清华大学计算机系原党委书记、清华科技园启迪孵化器原董事长罗建北,昆仑数据CEO陆薇,瓜子二手车CTO张小沛,Face++ 创始团队成员陈可卿,速感科技CEO陈震共同就话题“人工智能与产业实践”进行了对话。四位来自不同领域的嘉宾,在对于人工智能未来的趋势分析中,不约而同的提到了一个关键词:产业。     陆薇在圆桌论坛中提到,昆仑数据是一家技术公司,技术很重要,但却不是最重要的。在工业智能的应用中,我们认为有另外三个因素比技术更重要。   第一是场景。一定要从业界觉得非常痛,而你能解决这个痛点的场景出发。   第二是场景所在领域的专业知识。这一点在工业领域尤其重要。例如,对昆仑数据来说,在风力发电领域,我们需要有空气动力学的原理,做石油管道要有流体力学原理。   第三是一定要有相关的数据,没有数据就是巧妇难为无米之炊。   另外,有相关的技术,还要有一个最适合它的算法。比如最近流行的深度学习算法,其实已经被发明了很多年,但是把一个算法应用到场景之后,还要结合这个场景做算法的增强改进,使得它在这个场景下的应用能达到最优的结果。   自1958年建系以来,清华大学计算机系人才辈出。60年中,中国计算机技术的进步,每一步都有清华计算机系校友的贡献。此次活动,来自清华、北大等高校的学子,创业公司CEO,投资人,人工智能领域从业者等近300人来到现场,和与会嘉宾共同探讨人工智能与产业实践的观点与思考。   昆仑数据致力于用大数据和人工智能技术推动中国工业智慧升级,自公司成立之初,昆仑数据的数据科学家就已经尝试使用人工智能技术处理工业问题,并将其应用于一些数据量较大的工业应用案例。如何把统计模型与领域内的知识与机理模型深度融合,让数学模型具有工业语义中的可解释性,将成为我们在工业领域探索和应用人工智能技术的重要方向。...

Read More

晚上9点的办公室,同事们都陆续结束了一天的工作,但对于华仔和他的小伙伴来说,另一场战斗却刚刚开始。他们修正数据模型,整理结果,每天要忙到深夜1点。去年,他们所在的队伍在昆仑首席数据科学家田博士的指导下,在业余时间参赛一举拿下了2017PHM竞赛的冠军。今年,考虑到更多客户项目的交付压力,分析团队没有计划参与任何赛事,但年轻的小伙伴还是想挑战自己,于是自行组队,利用愈加宝贵的深夜时段,参加了2018KDD-CUP,最终位列十强。   年轻数据科学家的竞赛之路   KDD-Cup被称为数据挖掘领域“奥运会”, 每年都会吸引来自世界各地数据挖掘领域的顶尖专家、学者和工程师参赛,今年参赛队伍更是突破往年的数量,达4000多支。K2Data的这三位年轻的90后数据分析师,也成为了今年的4000分之一。   比赛由ACM协会的国际顶级会议SIGKDD举办,自1997年以来每年举办一次。该比赛一直以来都强调在实际场景中的应用性。本届赛题十分独特,空气污染物(PM2.5,PM10,O3)预测不仅具有规律性弱、不稳定、易突变的特点,并且因为要预测未来48小时中的每个小时,以及北京/伦敦城市内几十个预测地点,建模时间序列以及地点拓扑关系给机器学习模型带来挑战。   现有的方法针对的预测的时间段较短,没有基于位置拓扑以及利用天气预报进行建模,在机器学习尤其深度学习模型的运用也处于探索阶段。并且,由于比赛赛制每天需提交未来结果,相对于很多基于固定测试集的方案或比赛更接近真实工业界,对模型的稳定性以及迭代开销也有很多挑战。     其中最大的挑战是数据的缺失问题。因为站点有时需要维护或传感器出现故障,可能出现数据延迟或数据缺失的情况,官方提供的训练集数据的缺失情况如图1所示。       由图1可知,缺失最多的是PM10,缺失比例已经超过了25%,不能够直接用来建模。不过华仔和他的小分队发现了PM2.5,PM10之间有着非常好的线性关系,O3与温度之间则有非常好的指数关系,由此可以建立PM2.5与PM10线性模型,利用该模型对PM2.5和PM10进行相互插补(如图2所示)。此外可以建立O3与温度的指数关系模型,利用该模型对O3缺失值进行插补。但是,又发现同一时刻的PM2.5、PM10、O3存在同时缺失的情况,这种情况可以利用空间关系进行缺失值插补。基于上面的思路,建立了3-phase插补算法,有效解决了核心的数据缺失问题,基本就一直锁定了TOP30的排名优势。   在华仔看来,最终保持TOP10成绩主要来自于有效特征的挖掘。以weather type(天气类型)字段为例,挖掘了weather scoring 和binning feature两大类的有效特征,基于上面的数据预处理和特征工程,得出参赛最终提交的整体O3、PM10、PM2.5的预测效果。     昆仑数据:用人工智能解决工业问题   对参加KDD-CUP的夙愿,华仔表示,KDD-Cup是工业界和学术界都非常关注的一个比赛,也产出过很多对业界有影响的技术,比如KDD-Cup 2012产出的XGBOOST和FFM模型对工业界产生了很大的推进作用,而在工业界有了一定应用沉淀后,又不断地对这两种模型进行优化。   随着人工智能AI的红利,越来越多的领域开始尝试使用机器学习来解决现实问题,从KDD-Cup赛事命题方向的变化就可以反映这种趋势。以往的赛题多集中在推荐系统的设计,近年来开始转向机器学习技术在教育、交通等传统行业的实际应用问题。   人工智能已经从技术概念逐步开始了场景化、商业化的落地,随着技术与人才的逐步成熟,用大数据与人工智能技术推动工业智慧升级,将从昆仑数据的使命演进成不远的现实。...

Read More

8月2日-3日,2018中国大数据产业生态大会在北京隆重召开。此次大会以“深挖数据智能•助推数字经济”为主题,由中国电子信息产业发展研究院主办,中国电子信息产业发展研究院卢山院长、工信部党组成员、总工程师张峰,工信部原副部长杨学山等出席并致辞。昆仑数据作为工业大数据行业领军企业受邀出席活动,并获得两项重磅大奖。   会上表彰通过中国大数据产业生态地图调研而评选出的,代表中国大数据中坚力量的“2018中国大数据企业50强” ,这是昆仑数据自2016年该奖项启动以来,连续第三次入选中国大数据企业50强,该奖项评选着重评定企业在大数据业务上的研发投入、创新能力、应用案例、产品及方案成熟度、投资及发展潜力等。一同入选的还有阿里巴巴、华为、腾讯等企业。     2018中国大数据专有领域奖项中,KSTONE工业互联网平台获得业内专家一致认可,被评选为“2018中国大数据工业互联网领域最佳产品”。作为昆仑数据强有力的进阶性产品,昆仑工业互联网平台KSTONE更多强调的是垂直工业领域的资源整合及数据连接。KSTONE集成了KMX平台的原有能力,并扩展了工业智能流水线、工业应用商店等功能,提供工业APP创新端到端支持。不止于底层通用技术平台,KSTONE更强调垂直领域的行业属性与行业服务,携手行业龙头,打造数据价值驱动的新型工业互联网生态。     此次大会重磅发布了《2018中国大数据产业生态地图暨中国大数据产业发展白皮书》,与产业同仁分享赛迪研究院对中国大数据产业发展现状及大数据产业生态格局调查的最新研究成果。来自七十多家国内知名大数据创投机构及产业资本的一百多位投资人,青岛、福州、杭州、武汉、贵阳等地市政府,国内外优秀的大数据企业和用户代表,中国大数据产业生态联盟的专家和企业领袖,知名高校、科研机构及主流媒体,约计1500多人出席了本次会议。 ...

Read More

2018年7月20日,中国机械工业联合会智能制造分会在北京成立,同时召开一届一次理事会。中国机械工业联合会会长王瑞祥、工信部装备司副司长王瑞华出席会议并致辞,昆仑数据CEO/创始人、工业大数据创新中心主任 陆薇博士当选协会理事。     智能制造已成为机械工业调结构、转方式、换动能的重要引擎。目前,机械工业转型升级进入了爬坡过坎的攻坚期。如何抓住机遇,加快智能转型,实现高质量发展,是关系全局与行业长远发展的当务之急。相关企业、研究院所、高校对于智能制造的发展有着迫切需求,根据推动行业技术创新和产业转型升级的需要,中国机械工业联合会成立智能制造分会。   此次分会发起单位84家,其中包括清华大学、北京机床研究所、沈阳重工等企业、研究院所、高校及行业协会,涉及自动化、仪器仪表、工程机械、电工电器、汽车、轨道交通、航空航天等产业,以及人工智能等领域。昆仑数据将联合协会的相关领域的产学研用资源,为智能制造领域成员单位提供产业发展和市场服务,促进成员单位共享资源、共同发展。   ...

Read More

为贯彻落实工业和信息化部《工业互联网 APP 培育工程 实施方案(2018-2020)》到 2020 年培育 30 万个面向特定行业、特定场景的工业 APP 的重点工作。中国工业技术软件化产业联盟于 2018 年 7 月 18 日召开第一届理事会第三次工作会议,会议由联盟理事长单位工信部电第五所副所长王蕴辉主持,工业和信息化部信息化和软件服务业司李冠宇副司长、商超处长出席会议并作重要发言,联盟常务副秘书长阎丽娟做工作汇报。   本次会议就 2018 年下半年联盟总体工作计划听取联盟成员意见,审议联盟工作组组长、副组长单位的报名情况,成立技术委员会、按分行业建立分委会,分配工作组任务。昆仑数据CTO、北京工业大数据创新中心总工程师王晨当选联盟工作组标准组副组长。     昆仑数据将和其他成员单位一同努力,建立工业技术软件化标准预研和推进机制,建立工业技术软件化标准体系,组织开展标准研制,推动联盟其他分组 的技术攻关、解决方案等业务活动形成行业/国家技术规范、标准,开展国际标准化交流与合作等工作中发挥自己的作用。...

Read More

智能制造不是一场突然而至的革命,也不是一蹴而就的革新。   今天,我们不谈大数据和人工智能将为中国工业带来什么,也不谈昆仑数据服务的行业巨头企业在数字化转型上可圈可点的成果,我们希望抛开智能,看看中国万千中小型制造企业谈及对新兴技术渴求为何会如鲠在喉。   ·技术不解决最根本的问题   如果真的到中西部、东南沿海乃至江浙工业重镇走一圈,你就会了解到,目前大多数中小企业仍旧处在工业2.0阶段。企业为了保证交期、减少质量问题而疲于奔命,甚至缺乏最基本的标准化流程和作业的标准化,更不用谈管理的系统化,生产交付永远处于救火状态,而粗放的管理方式一旦在企业内部形成恶性循环,不是靠“机器换人”和“信息化系统”可以解决的。我们认为管理水平的提升、流程的优化、标准化的建立是当前企业应该首要解决的问题,才能让“智能”发挥出最大的价值。   ·智能化才刚刚起步   有多少制造企业长期依靠低廉劳动力或牺牲环境资源赚得一手利润差,就将会有多少企业在低端制造业外流的浪潮下朝不保夕。有关数据显示,时至今日,我国企业信息化应用水平较高的企业仅占14.6%,多数企业使用智能设备替代人工的动力不足。现阶段,即使引入智能设备,也仅停留在初级应用阶段,远没有形成构建智能制造体系的战略思维和总体规划。我国制造业全面实现数字化、网络化、智能化还有很长的路要走。   ·人才瓶颈制约   我国传统的工业重镇一般都地处偏远,且不说北上广深,也很难与人才抢夺战中的网红省会城市一拼。这种人才的缺乏不仅仅是技术型岗位。从经营管理层面来看,企业缺少具有预见力的领军人物,以及在高水平的研发、市场开拓、财务管理等方面的专门人才。从技术员工队伍层面来看,初级技工多,高级技工少;传统型技工多,现代型技工少;单一技能的技工多,复合型的技工少的现象普遍存在。员工综合素质偏低,直接制约了智能制造系统的应用和推广。而在国家战略层面,涉及智能制造标准制定、国际谈判、法律法规等方面的高级专业人才更是明显的“短板”。   ·工业界缺乏国际话语权   不得不承认,在工业领域,我国产、学、研的整体科技水平与美日欧等先进国家仍有较大差距。智能化的软硬件缺乏自主研发技术,除了被美国拿来要挟中兴生死的“高端芯片”,工业制造中大量高端传感器、操作系统、关键零部件主要依赖进口,在一定程度上阻碍了智能制造的发展。我国虽然是制造大国,但是由我国主导制定的制造业国际标准并不多,国际上对中国标准的认可度也不高,中国在全球制造标准领域缺少话语权及影响力。   与昆仑数据服务的大型行业龙头企业相比,新兴技术的快速更迭正在加大这种制造业“贫富差距”。 “智能制造”、“企业上云”的观点都会每年不断被重复,在中国万千中小型制造企业中,有的为了顺应政策号召却只在表面做到了形似,而我们,更愿意以长期价值来衡量新兴技术如何渗透到一线,给企业带来多少利润和价值提升。   如何将显性知识、隐性经验、隐藏在过程数据中的模式规律透过新型感知、执行应用到设备控制、生产管理、工艺设计或经营过程中?   每个工业领域都经历了几十年的发展,有其特殊的行业知识沉淀。以敬畏之心做工业大数据与工业智能,只有扎根行业,常驻一线,才能完成行业知识重构。   弯下身子搞“制造”,虽然不及翘起脚尖搞“智能”听起来高大上,但这正是当下工业界需要正面应对的问题。...

Read More

2018年7月5日,昆仑数据CEO陆薇出席冰山集团与旗下大连开尔文科技有限公司,与国内综合支付巨头银联商务股份有限公司在上海举行合作签约仪式,全方位开创新零售时代战略合作新格局。     本次战略合作将聚焦新零售领域,充分发挥冰山集团在自动贩卖机设备和冷链设备行业第一的制造资源优势,银联商务在综合支付、互联网金融、资金管理、大数据共享等产品优势,强强联手,共同打造以产品为起点、以大数据为驱动的新零售生态系统,在深刻理解行业痛点和用户真实需求的基础上,为广大运营商和用户提供无人零售应用的完整解决方案。   银联商务是业内领先的综合支付和信息服务提供商,也是国内最大的银行卡收单与专业化服务机构,金融服务覆盖国内337个地级以上城市,拥有强大的线下金融服务渠道和服务能力。   开尔文科技作为冰山集团和中国工业大数据领军企业昆仑数据共同成立的创新性科技企业,致力于以用户为中心,打造产品、服务、平台“三位一体”的智慧、健康新零售生态系统。此次战略合作对国内新零售的探索发展具有里程碑式的价值和意义,也是产融合作在新零售领域跨界融合的创新之举。   ...

Read More

6月29日,2018第二十二届中国国际软件博览会在北京展览馆盛大开幕。作为国内历史最悠久、覆盖最全面的国际软件展会,全面展示我国软件产业的发展成果及新兴趋势,是业界不可或缺的年度盛会。智能制造与工业互联网成为今年软博会的亮点之一。昆仑数据作为国内工业互联网领域领军企业受邀参展,展示以工业大数据为驱动,赋能工业互联网发展的整体解决方案与行业案例,得到来自政府领导及行业伙伴的高度认可。     习近平总书记曾提到,要深入实施工业互联网创新发展战略,系统推进工业互联网基础设施和数据资源管理体系建设,发挥数据的基础资源作用和创新引擎作用,加快形成以创新为主要引领和支撑的数字经济。本次工业互联网展团将着重展现工业技术软件化对制造强国建设、助力实体经济发展的有力支撑。   在第四展区7号馆工业互联网展区,昆仑数据以“携手龙头企业打造行业工业互联网平台,携手地方政府服务区域智造升级”双轮驱动,以工业大数据分析为核心竞争力,携两大产品“工业大数据平台KMX” 及“工业互联网平台 KSTONE”亮相软博会。     与该展区内其他工业互联网企业不同,昆仑数据更强调了其工业大数据特色,以及从工业大数据到工业互联网的能力延伸。   昆仑数据核心工业大数据平台KMX,自推出以来载誉颇丰,得到工信部、产业联盟及行业客户的多方认可。目前,该平台已经在金风、陕鼓、中石油等工业企业落地应用,支持金风科技2万台风机每日400亿数据点的实时接入,在陕鼓动力实现高达1000Hz的高频振动数据高效管理,极大降低工业企业利用大数据的门槛。   昆仑工业互联网平台KSTONE则集成了KMX平台的原有能力,并扩展了工业智能流水线、工业应用商店等功能,携手行业龙头,加速特定领域的工业互联网建设。与青海电网合作的国内首个覆盖源网荷一体化的新能源互联网平台“绿能互联”、与国内最大的风机整机制造商金风科技共建的风电互联网应用平台“金风云”、与国内最大的冷热设备制造商大连冰山集团打造面向国内冷暖设备行业互联网平台“开尔文云”等多个行业互联网平台正在稳步推进中。     而作为“世界工厂”的中国,也拥有大量呈现块状经济的工业形态,基于KSTONE,与制造业产业聚集区当地政府合作,搭建公有云平台为集聚产业的企业解决共性需求,提升其管理水平以及关键工艺能力,也成为昆仑数据正在探索的另一个方向。   软博会期间,将以“数字经济”、“工业互联网”、“人工智能”、“大数据”为关键词,举办5场高峰论坛,议题环环相扣、内容层层递进。以“大数据赋能实体经济”为主题的第五场高峰论坛将于7月1日上午9:00-12:00在北京展览馆11号馆压轴揭幕。论坛特邀清华大学副校长杨斌、多位中国工程院院士、清华大学教授以及企业高管出席,昆仑数据联合创始人&CTO 王晨将作为该论坛特邀主持人,为与会者激发并提炼演讲精华,揭示大数据从概念走向深化应用的发展趋势。     自1997年开始,软博会已成为树立我国软件产业整体形象、全面展示我国软件服务业最新发展的权威盛会,吸引了来自腾讯、阿里、华为、用友、今日头条、美团、360、网易等知名企业,来自泰国、瑞士、德国等国内外著名专家学者、企业家就互联网、大数据、人工智能和实体经济深度融合发展,以及软件与经济、文化、社会、生态融合应用的发展方向进行研讨。   本届软博会由工业和信息化部及北京市人民政府主办,国家工业信息安全发展研究中心、北京市经济和信息化委员会、北京市海淀区人民政府、北京市西城区人民政府、中国软件行业协会共同承办。预计软博会上将有来自10多个国家、100多个地方省市,以及超过300家企业和机构的代表参会,参观人数将达到10万人,其中专业观众将超过2万人。   ...

Read More

去年6月,青海省在全国首次实现连续7天168小时100%清洁能源供电,打破此前葡萄牙创造的107小时全清洁能源供电的记录,引起了国内外的广泛关注。今年,青海省将谋划更长时间连续使用清洁能源,从6月20日零时开始,青海省将连续9天216小时实施青海“绿电9日”行动,实现青海全省用电零排放。   根据青海新能源大数据创新平台预测,绿电9日期间,预计青海全省日均用电量1.89亿千瓦时。而在此期间,青海省的清洁能源发电量不仅足够省内使用,还能实现外送。其中,新能源大数据中心建设开发针对新能源企业的集中监控、功率预测、设备健康管理、共享储能、备件联储等21项大数据业务应用功不可没。目前,青海新能源大数据创新平台目前已接入35座新能源场站,接入电站容量达到1174.69兆瓦。     青海新能源大数据创新平台是中国首个新能源大数据创新平台。该平台于2018年1月上线运营,目前已引入金风科技、昆仑数据等13家开发团队,为包括大唐、鲁能、绿电等新能源企业及政府、金融机构等29家客户提供新能源大数据服务。   中国国家电网青海新能源大数据科技公司筹备组组长王国强介绍,目前平台接入的35座新能源场站中,除33座在青海省内外,还涵盖内蒙古达茂风电场以及海外的巴拿马风力发电场,平台数据接入速率达到每秒2500条左右,累计接入数据已超过47亿条,每天新增数据总量超过60GB。     “依托新能源大数据创新平台建设,已构建出线上线下全面支撑的新能源产业生态圈,并形成融合跨行业、跨专业以及跨地域的融合发展模式。”王国强说,平台旨在促进信息共享,规范数据录入与管理,最终达到释放数据价值、减少弃风弃光的目的。2018年2月中国官方正式批复同意青海建设全国清洁能源示范省。   昆仑数据作为国网青海省电力公司的重要产业合作伙伴之一,负责青海新能源大数据创新平台的底层技术平台的建设,并参与该平台的运营体系搭建,引入昆仑数据资深数据科学家为平台注入业务服务。通过平台应用降低了新能源电厂人工成本20%以上,预警模型准确率达到75%,发电量提升1%~5%,新能源电厂能耗降低10%。   未来,昆仑数据将继续深度服务于国网青海省电力公司,利用KSTONE昆仑工业互联网共性技术平台及新能源数字化转型经验,持续探索基于能源互联网平台的开放、共享生态运营模式。   ...

Read More

对于已经工作的我们 每年高考都是一波回忆杀 有时候不经意想起那段时光还是会热血沸腾 回望那个夏天总是有很多感动 其实高考不是终点,而是新的起点 …… 各位超龄考生们 与其感慨高考作文题 不如来刷一波昆仑数据热招岗位的考试题 现在开考↓↓↓ ...

Read More