在很多领域,需要对人携带的各类卡(如含磁卡、接触类芯片卡、非接触类芯片)、证件、名片、电子存储设备、移动手机等智能设备的信息进行采集并加以应用。这类信息的记录方式,一方面采集内容会印刷在卡面,如名片卡;另一方面采集内容会分布在芯片内,如我国居民身份证、银行磁卡、门禁卡;同时还有部分以文件方式存储在u盘、数码相机、移动手机等智能设备中。
现有的采集方法效率较低,容易重复采集物件或信息,更没有对采集后的数据进行进一步加工,所以无法有效应用采集的数据。
为了克服现有技术的不足,本发明提供了一种信息智能加工方法,将采取到的信息进行处理为后续的应用提供了数据支持。
s4:包括根据s3得到的元素集合确定元素和人的关系强弱、关系方向,进行人员关系分析,建立人员关系图谱;
优选地,所述信息数字化步骤输出的数字文件类型包括图片文件、语音文件、视频文件、文本文件、网页文件和其他指定文件类型。
优选地,所述信息文字化步骤处理的方式包括ocr图像、语音、条码的媒体文字化、类型文件的去格式化、线索文件列表的文件化。
优选地,所述信息元素化步骤算法包括单属性提取算法、单属性动态关系分析算法、固定关系分析算法、关系表分析算法、同类表最优处理机算法、智能识别。
优选地,所述信息元素化步骤的元素类型包括唯一性线索、集合性线索、广泛性线索。
优选地,所述信息关系化步骤的关系是不同人员与物品之间存在的关系;强关系是人员与本身的物品卡片提取线索的关系;弱关系是人员与身上携带的他人的物品或含有他人信息的物品的关系。
优选地,所述信息关系化步骤的关系方向包括单向关系、双向关系、弱双向关系、强双向关系,所述单向关系是指人员与线索之间具有单一指向;所述双向关系是指人员和线索之间相互指向。
优选地,所述信息关系化步骤的人员关系分析包括采集集合关系、线索对比、组织集合关系、模糊关系等级划分。
优选地,所述信息关系化步骤的人员关系图谱包括将在同一个采集任务中采集到的被采集人员之间建立被采集人员关系图;通过个人身份线索和集合性线索的比对分析,建立相应被采集人员的关系图;通过不确定线索的比对分析,建立相应被采集人员的关系图。
本发明的有益效果是:通过本信息智能加工方法,可以一次性将被采集人员的随身物件的信息进行有效提取,提高了采集效率;将采集获得各种关键的线索信息经过信息数字化步骤、信息文字化步骤、信息元素化步骤、信息关系化步骤和线索预警步骤的处理,不仅可以完成个人身份的认定、采集到事件需要的相应必要信息、构建个人信息库,还可以得到不同人员与物品之间关系的强弱以及方向;在此基础上通过线索比对建立被采集人员关系图;同时对采集的信息进行重复采集预警、线索出现预警和多次出现级别预警,为后续的关系串并、关系评估、身份标识、关系挖掘、固定证据等提供数据支持。
一种信息智能加工方法,包括信息数字化步骤、信息文字化步骤、信息元素化步骤、信息关系化步骤和线)信息数字化步骤包括把输入的实物、数字设备、网络转化成输出数字文件;数字文件类型包括图片文件、语音文件、视频文件、文本文件、网页文件和其他指定文件类型。
存储采集主要针对u盘、硬盘等存储设备的采集;网络采集针对邮箱、qq、微信msn等个人社交平台。
(2)信息文字化步骤包括把步骤(1)输出的数字文件进一步转化成文字文件和/或格式文件输出;主要包括文本文件、xml格式文件等。
所述信息文字化步骤处理的方式包括ocr图像、语音、条码的媒体文字化、类型文件的去格式化、线索文件列表的文件化。
(3)信息元素化步骤包括把步骤(2)得到的文件转化成元素集合输出,包括内存表和/或元素文件;元素文件可以是xml元素文件。
信息元素化步骤算法包括单属性提取算法、单属性动态关系分析算法、固定关系分析算法、关系表分析算法、同类表最优处理机算法、智能识别。
单属性动态关系分析算法包括单属性字典集,如电话、身份证、邮箱等;单属性字典分析算法;构造属性集,如内存数组、文件结果,文件结果可以是xml形式。
所述信息关系化步骤的关系是不同人员与物品之间存在的关系;强关系是人员与本身的物品卡片提取线索的关系,如人员本人的身份证、银行卡、社保卡;从上面提取的各类证件号、银行账号、电话号码等既为强关系线索;弱关系是人员与身上携带的他人的物品或含有他人信息的物品的关系,如他人的名片卡、其他证件等;从上面提取的各类证件号、银行账号、电话号码等既为弱关系线索。
所述信息关系化步骤的关系方向包括单向关系、双向关系、弱双向关系、强双向关系,单向关系是指人员与线索之间具有单一指向;双向关系是指人员和线索之间相互指向;弱双向关系是指人员与线索之间存在两个关系,且相互指向;强双向关系是指人员与线索之间的关系元素重合。
所述信息关系化步骤的人员关系分析包括采集集合关系、线索对比、组织集合关系、模糊关系等级划分。
所述信息关系化步骤的人员关系图谱包括将在同一个采集任务中采集到的被采集人员之间建立被采集人员关系图;通过个人身份线索和集合性线索的比对分析,建立相应被采集人员的关系图;通过不确定线索的比对分析,建立相应被采集人员的关系图。
(4)信息关系化步骤包括根据步骤(3)得到的元素集合确定元素和人的关系强弱、关系方向,进行人员关系分析,建立人员关系图谱;
在实施例1的基础上,利用正则表达式、语义识别、人工智能等,对采集信息加工提取后的文字内容等信息,进行分析挖掘提炼,并抽取建立该物品的三类线索元素集合,该线索元素集合作为比对、预警、关系分析等计算的基础元素,为进一步应用提供服务。
网站、论坛、公用电话(单位)、单位代码等其他各类集体性线索,该线索往往含有多个子元素。
姓名、单位、地址等口语化线索元素,该类元素由于口语化不精准等原因,往往能映射到多个不同元素上。
以人员卡片等物品线索提取的分析集合,建立的人员线索图谱,进行综合比对应用,可以实现人员关系图谱的建立工作:
①采集集合关系,同一采集任务中的不同人员之间,既存在该采集任务的采集集合关系。
⑤模糊关系等级划分,对于广泛性关系,由于口语化原因而导致存在同一元素无法进行准确相等关系判断,该类元素现成的元素既为模糊关系,如同一口语地址、同一姓名,该模糊关系建立不同的相似度规则等级划分制,进行模糊关系等级划分。
在本发明中包含构建人员关系图的方法。同一采集任务中采集到的不同被采集人员之间,即存在该采集任务的采集集合关系,根据该集合关系即可以建立被采集人员的关系图。
通过线索比对分析,建立相应被采集人员的关系图。例如从张三的物件获得的某个线索与从李四的物件中获得的某个线索,经过比对分析有关联,即可以建立串并分析,从而建立起张三和李四的关系图。建立串并引擎,即线索相等判断算法。
通过分析集合性线索,建立相应被采集人员的关系图ob体育。例如,从被采集物件中获得了某个论坛网址(集合性线索),因此可以进一步获得该论坛下的论坛会员,从而可以获得这个论坛人员的关系图;又如基于名片的集合分析,例如在某一次采集任务中,获得了某个名片上的公司名称,则可以进一步获得该公司下的所有员工的信息,从而建立起公司人员的关系图;又如基于门禁的居住关系分析,可以分析出居住人员的关系图。
本发明中,可以用采集机具对相关的人员的随身物件进行采集信息。采集机具可以包括光学采集模块(例如相机、摄像机)、指纹采集模块、磁记录读取模块、芯片(id卡、接触式ic卡、cpu卡、二代身份证)读取模块、射频读取模块、二代身份证读取模块、国际民航组织机读旅行证件模块、以太网络接口模块、蓝牙模块wifi模块和usb接口模块中的至少一者,上述模块可以根据具体应用和需要,选择任意的组合。
经过本发明的方法加工,将提取到的线索与已采集库已提炼分析出的线索数据库存储的原线索集合进行碰撞比对,实现以下线索采集的预警工作。
重复采集预警:若判断所述提取到的线索对应的物件被重复采集,则发出提示信息。例如,在依次采集任务中,采集员已经把从张三本人身上的名片已经采集完,然后又在李四的身上携带的张三的名片进行采集,这时候可以判断名片被重复采集,可以发出提示信息进行预警。
线索出现预警:检测到设定线索出现,则发出提示信息。例如,预先设定了一旦采集到张三的物件即预警,在某次采集任务中,一旦采集到了张三的名片,则可以发出预警。
多次出现等级预警:若所述提取到的线索出现多次,则记录该线索对应的等级并发出提示信息,若在一次采集任务重,某个线索重复出现,则每出现一次该线索,则给该线索相应得分,出现次数越多等级越高。
通过对信息结构的设计、采集流程的规划、采集方式的集成和信息的进步一步加工,采集的信息具有良好的应用价值,可用于多个方面。
身份认定。通过身份证信息的采集以及芯片内存储照片与现场人脸拍摄照片进行对比,就能基本确认一个人的身份。基于身份认定,可以对人员类别进行甄别,对于公安机关,可判别是否是违法犯罪嫌疑人在逃分子,是否是刑事前科人员等。
关系串并。针对采集的各类银行卡、门禁卡、会员卡、名片在信息采集、加工后,就能提取各种能标识卡证唯一性的id以及各类帐号、会员号、电话、网址、地址能具有关系关联性的线索实体。通过这些实体关联,就能在采集库中勾勒出其社会关系。
关系评估。针对不同的实体,可以赋予不同的关联权重。如银行卡、门禁卡的权重高于地址地点、网址的权重。通过对关系表征的权重划分,就能对关联形成的关系网络进行关系评估。通过关系评估,就能较为准确的勾勒出人员关系网络。结合其他信息,能进一步勾画出人员社会特征。
身份标识。随着采集系统应用时间的推移,特定人员被采集的次数会增多。对于一些与身份相关紧密的卡证(如银行卡、门禁卡、公交卡、车钥匙、手机imei)如果多次均与固定的人员绑定,则该类卡证芯片id以及卡号就形成人员新的身份标识。通过这个标识,在特定的领域就能较为容易的确定人员身份。
关系挖掘。基于关系串并和关系评估,可以按照关系网络逐步拓展,挖掘出并不具有直接关系的关系网络(如通多位过吸毒人员关联出贩毒人员,通过多个贩毒人员关联出制毒人员)。
固定证据。与只采集卡证内容不同,本方案还对被采集物品进行正反两面的拍照。通过拍照,固定了被采集物品的实有特征。这个特征照片可以作为证据存在,可有效弥补卡证补办或文档内容一致但实际来源不一致的情况。
形成物品清单。每一个人随身物品(含卡证)一般会超过10件,在特定环境下需要逐一记录。以前靠记录人员书写,往往因为繁琐而简化,导致双方对结果认定不一致的纠纷。通过本方案,不仅能明细采集随身物品内涵信息,还能拍照留下影像证据。根据采集结果,可自动形成详细的物品清单,无需逐一录入。
串并案件。对于公安侦查工作,可以全面收集已发侵财案件被侵害人员的物品线索库、嫌疑人员工具线索库、以及嫌疑人员强关系线索库,在上述几类库的支持下,采集时将分析提取的线索进行同步比对,即可实现串并案见的功能。
真伪核验。分别采用设备真伪性校验:利用专门采集设备,如二代身份证采集模块对二代身份证进行真伪校验;光学外观校验,通过对国家(国际)标准卡证的外观规范,对采集卡片的外观进行光学比对,校验有无符合相关标准;后台数据校验,和后台数据库中已采集的信息、后台其他数据资源进行比对,校验是否存在不一致。
交叉核验。对于有多层信息载体的物品,进行不同层面的存储的信息之间进行多层信息之间交叉核验。如磁条银行卡,对于磁条银行卡分别通过ocr读取识别银行卡外观卡号和银行卡磁条卡号,进行交叉比对,如两个卡号不一致,即为伪造银行卡;再如金融ic卡,既芯片银行卡,卡的外观、卡的磁条、卡的ic芯片,三层载体分别储存了银行卡信息,通过外观ocr、磁条读取以及ic芯片内容读取后,对三层信息中的卡号分别进行对比,如不一致,则该银行卡为伪造银行卡。
有效核验。运行数据库存储制证身份证信息、采集身份证信息;若待验证的身份证信息与采集身份证信息一致,则发送需要核实待验证的身份证的信息;若待验证的身份证信息与制证身份证信息一致,则发送待验证的身份证有效的信息;若与对应的身份证信息相比待验证的身份证信息具有相同的身份证号码但不同的射频识别卡芯片序列号,则比较待验证的身份证与对应身份证的有效期开始日期,若待验证的身份证的有效期开始日期较晚,则将待验证的身份证信息更新至运行数据库,若待验证的身份证的有效期开始日期较早,则发送待验证身份证无效的信息,将相关信息写入高危数据库。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。
Contact: ob体育
Phone: 13800000000
Tel: 400-123-4567
E-mail: www.dongyuanshangpin.com
Add: 这里是ob体育有限公司