6月 29 日,由工业和信息化部、北京市人民政府主办,千方科技承办的第22届北京国际软件博览会-交通大数据论坛在北京西苑饭店举行公安部交通管理科学研究所副所长包勇强发表了《公安交通管理大数据应用》的演讲,本文由演讲速记整理,未经演讲者本人审核。
包勇强:很高兴来参加今天的论坛。我的分享主要围绕交通管理工作的大数据应用展开。
我们交科所一直把信息化作为核心发展战略,努力用先进的信息技术实现交通管理的深度融合,为执法办案、打击犯罪服务提供支持。其中的核心任务之一,就是全国交管信息系统的设计开发、推广应用和运营维护。另外就是基于这些交管信息系统进行大数据资源的应用。
讲到大数据,首先要有数据,交管系统的数据实际上就是源于近十几年以来,我们实施的几个重大的全国性信息化项目。
第一,以机动车驾驶员为核心的信息化管理平台建设
系统建设背景就是在我国机动车驾驶员快速增长的情况下,实现对机动车驾驶员信息以及相关业务的规范、高效管理,确保基础数据的准确鲜活。我们按照统一数据标准,统一法定流程,统一核心软件,统一推广应用,设计开发了业务深度融合,资源高度共享的综合应用平台。这个平台目前管理了我国3.9亿的驾驶人和3.1亿的机动车信息,汇聚了机动车管理的车辆信息、驾驶员,包括剧毒化学品运输、交通事故的处理,交通违法等。也就是说,除了3.9亿的驾驶员和3.1亿辆机动车,每年还有6亿多的交通违法数据和数百万的交通事故信息。作为交管业务核心的支撑平台,交管的窗口业务全部靠这平台实现一网办理。目前已经实现了规模化的应用,平台里面已经有55万个用户,除了28万交警用户,还有协警等也在用。每年大概办理9亿多笔业务,每天上传公安部的业务数据有1000多万条。
机动车驾驶员作为国家的基础信息,我们实现了大范围的信息共享应用。在公安内部,驾驶员信息跟人口基础信息,包括在逃人员,吸毒,盗抢车等等数据都实现了共享。对外方面,我们跟海关总署的进口车、电子口岸的数据,跟工信部的国产车数据,跟税务总局的购车发票和附加税数据,跟财政部的交通违法罚款缴款的数据,跟央行的跨省缴款数据,跟法院的交通事故、刑事案件的信息对接。同时我们还建立了信息服务平台,每天除了对接公安部统一开发的核心信息之外,还有各省市自行开发的一万多个系统提供了信息共享,每天来自他们的服务请求达到了5000万次。
第二,基于全国主干公路网交通指挥平台的建设
目前,我国道路建设速度很快,人流、车流大增长,存在路面的安全隐患和风险也很多。第一,“看不见”,也就是路面信息感知的问题,信息采集能力不足。第二“控不住”,“控不住”就是快速反应、跨省区间的协同反馈问题。第三,“打不准”,就是如何实现情报研判、精准推送。民警在路上执勤,不可能每个车都拦,拦什么样的车?哪些车有问题?哪些人是坏人?这需要精准的情报推送。
在这种情况下,我们需要构建一个高效的指挥体系,来提升路面动态管控能力。我们设计开发了公安交通集成指挥平台,实现了地市、省到公安部三级的联网架构。纵向把部、省、市三级连起来,横向是跨省、跨区的指挥中心连起来,目前已经有29个省完成交通管理集成指挥平台建设,310个城市开展应用,每天实现精准地拦截1.2万次。目前我们已经把路面上的一些执法装备、视频监控以及卡口定位系统等,全部连到指挥平台里,总共45万套设备接入联网。
我们建立了全国规模最大的公路执法装备物联网平台,平台里的点覆盖了全国主要的高速国道、省道的主要节点,路面图像、视频流。目前每天上传到交科所的数据信息是3.5亿条,而且规模还在扩大。
大家看这个图,东部红点密度很大是因为设备联网的密度大,西部空白地区比较多一点。根据数据中心统计,现在每天大概有4.5亿条数据进入平台。传统基于Oracle数据库的存储架构没有办法支撑这么庞大的数据,所以我们设计嵌入了大数据云计算架构,目前布控的黑名单车辆,经过路面监控设备时能实现秒级响应。另外,现在汇聚了全国将近3000亿条车辆信息数据,如果在Oracle数据库查询,是跑不动的,只有用分布式数据库技术才能实现秒级响应。另外,还有路面车辆的过车数据,比如说车辆的轨迹信息,经过几个卡口传到公安部,平均一分钟就可以获得,当然这也要看每个地方的网络情况,还有其他一些条件。
通过汇聚这些数据,利用人工智能技术实现结构化。比方说左边一辆车过去,我们采集图片的同时,也会把车牌号、类型、品牌型号都提取出来。一旦结构化之后,就可以跟后台数据库对比,如果发现假牌车、无牌车,或者是其他需要布控的车辆都能实现及时报警。大家可以看到(图),通过对图像、视频的结构分析发现问题,比如这个车里塞满人超员了,比如三轮车不能坐人,或者一个小面包车拉了很多人。原来这种情况只是依靠单纯警力在路面上巡逻,现在通过人工智能可以实现快速提醒。
目前公安交通集成指挥平台在保障道路安全,打击犯罪,重大安保等方面都发挥了非常重要的作用。全国交警每天基于该系统,拦截查出假套牌车、违法未处理、逾期未报废等等严重的交通违法行为。同时,还协助禁毒等其他部门破获案件等等。另外,在重大安保方面,比如刚刚举办的青岛上合组织峰会和去年的厦门金砖国家峰会,我们都派出了技术人员到现场,保障平台的正常工作。
第三,互联网交通安全服务平台建设
我们设计开发了互联网交通安全服务平台以及手机12123 App,前者涵盖了手机约考、手机选号、网上交罚款、快速理赔等功能;12123APP已经成为 “交通管理+互联网服务”的一个品牌,目前实际注册用户1.8亿,App下载量1.7亿,日均访问量15000万次,服务群众超过7亿多次。
目前,驾驶员用手机App约考驾校科目一、科目二、科目三的大概有4.2亿次。用手机在家里选号的有500多万人次。在网上交罚款处理的也有9000多万次,还有快速理赔流程。前几天我在苹果官网上看到一周内的APP下载热度排行榜,12123 APP排在抖音后面,第二位,第三才是微信。目前12123已经成为交通管理+互联网服务的品牌,前两天刚好在宁波开了全国交管“放管服”工作的部署,很多措施都要依托12123系统去实现。
第四,大数据应用
有了上面三个系统的建设,我们汇聚了海量的信息,怎么用?目前交科所里建立了一个大数据平台,数据分析研判的效益提升了将近100倍。交科所是全国交管数据中心,汇聚了海量大数据资源,包括170亿条机动车、驾驶员基础数据,包括车辆、驾驶员、交通事故、交通违法等信息;大约有2000亿条路面动态数据,每天数据增量4亿多;还有互联网的路况数据,与百度、高德共享信息。这些数据都是通过十多年来的信息化建设,通过信息系统的庞大用户规模积累起来的。
这些数据,我们主要应用于路面管控、业务监管、信息安全、公众出行。以下是几个大数据的应用案例。
01大数据+路面管控
我国现有5000多个省际、市际的公安检查站和执法站,每天这么多的检查站,实际上都是后台海量数据在为路面执法检查的时候提供跨省机动车、高风险驾驶员等对比信息服务。通过大数据平台进行套牌车分析、流量预测、失驾驾驶员分析等。类似于这样的,先是以人找车,再以车找人等分析模型,在我们平台里都实战化应用了。同时,我们基于这么多的车辆轨迹,涉车的情报分析,也在为治安、刑侦,情报等部门服务。
2大数据+业务监管
这是一些重点违规业务的分析。比如说机动车违规体检,你说在北京年检,我在新疆又发现了你车辆轨迹,肯定是造假了。原本这样的数据是没法发现的,因为不知道是谁。但在平台里面,我们嵌入了GIS技术,去年做了违规年检分析之后,一下子发现了几百辆违规车辆,马上进行通报,也查处了很多的造假年检机构。
3大数据+信息安全
就是信息安全审计。比如说我们可以对系统里海量查询日志进行分析,通过用户查询的频次和内容,我们可以分析查询有没有异常,建立一个模型对查询的特征进行画像。比如某用户专查尾数是888的车,肯定就有问题,因为执法不可能这么查车,你专门查这些车的号码是有目的和利益在里面。这种模型的数据应用,我们已经进行日常化了,每个季度都在分析。
4大数据+公路出行服务
公路出行方面,我们主要跟百度、高德合作,把交通事故的多发点段,包括管制信息、轨迹信息,交换给互联网银河国际,然后他们把全国主干公路网的拥堵信息给我们,实现信息共享。在五一黄金周或者春运期间,分享路况信息。
5大数据+信用评价
这个是现在正在做的事情,目前还不成熟。我们希望利用这些海量的交通违法、交通事故数据,同时结合其他的信息开展机动车驾驶人交通信用研究。比如说我下载注册了12123手机App,我们搞一个交通安全信用分,就像芝麻信用。一打开就能查到驾驶人信用分。这个信用分,现在到底怎么用,还没想好,但是我觉得做这件事是有意义的,就是不同数据源进行建模处理,最后建立一个评价指标体系得出评分。
利用科技让道路交通更安全、更畅通,这是我们交科所的发展愿景。下一步,我们将坚持创新,加速推进交通管理工作与先进信息技术深度融合,提升交通管理的智能化、现代化水平,我就汇报这么多,谢谢大家。