APP下载

政府大资料应用初步成果揭露,靠大资料预防犯罪再往前迈进一步

消息来源:baojiabao.com 作者: 发布时间:2024-05-20

报价宝综合消息政府大资料应用初步成果揭露,靠大资料预防犯罪再往前迈进一步

中正大学犯罪防治中心和新北市警察局合作,利用其警勤区刑案资料绘制报案斑点图,并经由大资料分析技术,分析犯罪成长曲线,找出预测模型,下一步便要透过资料探勘和分析预测技术,从过去已发生的犯罪热点图,转换成未来的犯罪机会图,协助警方更有效的预防犯罪。

先前台北市释出各种犯罪地图,公布最常发生窃盗案和妇女受害的地点,引发民众对于影响房价的疑虑,台北市市长柯文哲认为公开这些资料后,警方或民众能针对高犯罪地点加强防范措施。

不过,只知道过去的高犯罪地点还不够,若要有效预防犯罪,还得进一步预测出未来可能发生犯罪的地点。近日科技部针对教育、防疫医疗、灾害预警与犯罪防治领域,提出5项大资料应用的阶段性研究成果。其中,在预防犯罪领域,中正大学犯罪防治中心和新北市警察局合作,利用警勤区刑案资料绘制报案斑点图,再经由大资料分析技术,分析犯罪成长曲线,希望能进一步透过资料探勘和分析技术找出预测模型,从过去已发生的犯罪热点图,转换成未来的犯罪机会图,更有效预防犯罪。

其实这样的做法在国外早有实际成果案例,如美国洛杉矶警察局导入警政预测分析云端服务,将过去10年的各类型犯罪资料结合算法,建构犯罪行为模型,能精准定位地图上各区块最有可能发生犯罪的地点和时间,并让警方加强特定区域巡逻。导入预测服务后该地区犯罪率下降2成,甚至有其中一个地区出现50年来第一次24小时内无犯罪纪录。

这也是中正大学犯罪防治中心接下来要进行的方向,中央大学教授兼副校长及犯罪研究中心主任杨士隆表示,除了第一阶段和新北市警察局合作,第二阶段则进一步将司法院的刑事判决纪录、法务部资讯处及法务部矫治署提供的狱政数据库整合,找出法官、检察官、被害人自身、被告及原告之间的关联性,进而得出影响判决的关键因子,如被告手段是否凶残、被害人的性别、国籍、年龄,及检察官是否具体求刑,都是主要的影响关键。

这么做的目的之一就是要提供法官一个客观的量测判决参考依据,让法官不会局限于个人的经验,也能参考到整体的判决结果分布。杨士隆表示,从犯罪动机与法官判死刑或无期徒刑之间关联性的资料分析结果可以看出,若犯罪动机为财产纠纷,包括保险及债务问题,被判死刑的概率是无期徒刑的2倍以上,但若犯罪动机是感情纠纷,则有超过6成判无期徒刑,不到4成判死刑,而没有犯罪动机的,则有9成以上被判无期徒刑。

第三阶段则要用资料探勘技术,依照受刑人特性,演算出受刑人的高、中、低再犯概率,建构出再犯风险评估模型,再分析狱政数据库中,存在可能导致犯罪类型的家庭、环境、性格等因素,进而找出某段时距中发生再犯的概率,及各种犯罪成因的序列样态。

目前,他们也针对毒品危害防制领域,透过狱政组与法务部资讯处、矫正署教化辅导组、矫正医疗组及毒瘾戒治科等单位的资料整合,找出可能的犯罪构成要素,调整受刑人辅导方向,并根据再犯概率等因素,建立假释审查的评量标准,提供假释委员参考依据,做出有效判断。

除了用来预防犯罪,另一个政府大资料应用是在防疫医疗领域,元智大学与卫福部、台湾台风洪水研究中心,以及环保署合作,将医疗健保就诊资料、环境污染资讯及气候等异质资料结合,进行医学健康大资料分析。

元智大学资管系教授詹前隆表示,他们先建立底层的医疗、环境异质大数据分析平台,以及动态医疗趋势分析预测模型,运用资料分析、视觉化分析及趋势事件分析等方式,找出其关联样态,再开发医疗健康创新应用,如个人化健康事件及风险事件预测通报。

目前研究成果包括分析气候、空污因子对呼吸道疾病的影响,并找出关键模型与规则,来预防呼吸道疾病。另外,过去的研究认为低温容易造成60位老人发生颅内出血,不过他们从目前的大资料分析研究中发现,45岁以上的中年人发生颅内出血的概率,就会受到气候关系影响。

此外,由于花东地区的发生概率是台北的3倍以上,因此除了气候与环境,医疗可近性也是可能的影响因素。其他进行中的研究还包括心肌梗塞、红斑性狼疮、头部创伤、眼中风、创伤骨折、乳癌、再入院事件及慢性肺阻塞等研究。

詹前隆也说,他们采用大资料运算平台Hadoop的分散式档案系统HDFS,再搭配分散式资料仓储系统Hive,以及采用内存式运算的即时分析技术Impala,并利用R Studio来做线上资料分析及探勘。

而另一方面,台湾大学医学院教授郭育良也以国人健康为主题,结合卫福部的健康资料及环保署的环境资料,研究空气污染暴露对人体健康的影响性,并建立评估指标用来预测未来的影响可能。

在教育领域的大资料应用上,中央大学资工系特聘教授杨镇华以教育云、教育大市集及磨课师线上学习平台(MOOCs)作为研究对象,分析其资源使用情形,并提供教材相似度分析工具与服务、资源使用率及教师使用行为分析。

杨镇华进一步解释资料处理流程,他们先用Scrapy网页爬虫工具来搜集资料,再分别用Jieba/CKIP及Python做中文分词和噪声过滤,资料前处理后储存到数据库管理系统Cassandra,再进行资料萃取,包括资料萃取模组、数据库导览模组及资料处理模组,并使用SparkSQL资料查询套件及机器学习套件MLlib。

杨镇华表示,这些教材资料与使用者行为资料,可以透过资料探勘、机器学习技术,找出未知关联性和隐藏模式,进行预测分析,进而帮助学校、教师或学生使用更好的教材资源与服务。

而灾害防治方面,国家灾害防救科技中心副主任周学政表示,他们计划建立社群网络灾情综整平台,撷取社群网络上的灾情相关资讯撷取,绘制成地理资讯,之后则计划结合国家灾害防救科技中心的灾害防救资料,来制定社群灾害防救资料标准,及自动化资讯分析技术。

科技部推大资料应用,再将成果反馈回施政

政府锁定学界作为第一阶段合作对象,科技部部长徐爵民表示,在推动政府大资料应用计划过程中,曾遇到一些问题,例如资料该怎么开放,由于有些资料牵扯个资法问题,需顾虑的层面较多,未来科技部也将进一步建立跨部会的资料共享和应用机制,催生更多大资料的创新研究与应用。

他也表示,在大资料应用上,台湾起步稍慢,但可以看到近2~3年的应用越来越多,特别是在政府施政方面,将政府释出的资料加值分析后,再反馈回来帮助施政,进而激发更多产业商机。

前任科技部长,也是现任行政院院长张善政表示,在大资料时代下,“对一个国家来说,政府手上有最丰富的资料和资源”,他也观察到这几年推动过程中,状况较好的政府单位,由资讯部门提出想法,主动协助部会做资料分析,但是,一旦资料分析需跨出部会时,其他部会未必也能配合,此外,也不是每个部会自己都有想法。

“会使用你的资料的人,不一定是自己人。”张善政表示,常常外面的人才知道要怎么用你的资料,过去他也常听闻学校教授想进行研究,但却没有资料的窘境。他将资金、人才、点子归类为政府推动大资料的三大关键要素,他说,若没点子、没钱、没人,这些政府的资料只能躺在原地睡觉,不能被善加利用。

因此,2014年他担任科技部部长时,便开始推动政府大资料应用计划。张善政认为,对学界而言,能让教授的研究范畴跨出一步,帮助教授与学生作出更多创新应用,提升校园人才培养,甚至在国际舞台上有更好的表现,而对政府而言,也能让政府对大资料的应用和观念都将有新的眼界,并在施政与决策上有所助益。

他也说,即使教授作出来的研究不一定会为政府带来直接帮助,这样的合作仍然可以促进政府跨出既有局限,而且,这些教授带出来的学生,也将是台湾未来的资料科学人才。

2018-01-31 22:25:00

相关文章