(21)申请号 201710588721 .2
(22)申请日 2017 .07 .19
(65)同一申请的已公布的文献号申请公布号 CN 107463640 A
(43)申请公布日 2017 .12 .12
(73)专利权人 一拓通信集团股份有限公司
地址 230000 安徽省合肥市蜀山新产业园湖光路1201号电商园3期
(72)发明人 吴强生 武明根 叶强
(74)专利代理机构 合肥律众知识产权代理有限
公司 34147
(56)对比文件
CN 106656945 A ,2017 .05 .10
代理人 殷娟
1 .一种基于人工智能信息数据采集方法,其特征在于,包括以下步骤:
步骤1:获取所需会话元素作为会话集合,所述会话元素包括会话问题,场景开始标识,场景结束标识,和预期答案,所述会话问题包括手机ICCID或者电脑IP和参与者的身份证信息;
步骤2:统计所有会话元素的行为特征并输出;
步骤3:根据步骤2输出结果判断收集信息的种类进行归类; 步骤4:根据步骤3做得出的判断进行所采集的信息过滤取舍。
2. .根据权利要求1所述的一种基于人工智能信息数据采集方法,其特征在于所述会话集合是通过手机或电脑登录网页为场景开始标识,关闭或退出所登录的网页为场景结束标识。
3. .根据权利要求2所述的一种基于人工智能信息数据采集方法,其特征在于,所述的场景开始标识,与场景结束标识,需要以参与者参与信息收集会话问题的当时照片作为标识。 4 .根据权利要求3所述的一种基于人工智能信息数据采集方法,其特征在于,所述的会
话问题中包括的手机ICCID或者电脑IP,不需参与者本人手动输入,只需授权读取即可,参与者的身份证信息则需要手写输入,或者本人手写以照片的形式上传,确保是本人参与。
5. .根据权利要求1或3所述的一种基于人工智能信息数据采集方法,其特征在于,所述步骤3归类策略和步骤4过滤取舍策略包括手机ICCID电脑IP是否重复,参与者的身份证信息是否重复,会话问题结果:
手机ICCID电脑IP,重复、参与者的身份证信息,重复、会话问题结果重复,舍去; 手机ICCID电脑IP,重复、参与者的身份证信息,重复、会话问题结果,不重复,舍去;
手机ICCID电脑IP,重复、参与者的身份证信息,不重复、会话问题结果,不重复,舍去;手机ICCID电脑IP,重复、参与者的身份证信息,不重复、会话问题结果,重复,舍去; 手机ICCID电脑IP,不重复、参与者的身份证信息,重复、会话问题结果,不重复,舍去;手机ICCID电脑IP,不重复、参与者的身份证信息,重复、会话问题结果,重复,舍去; 手机ICCID电脑IP,不重复、参与者的身份证信息,不重复、会话问题结果,重复,保存数
据;
手机ICCID电脑IP,不重复、参与者的身份证信息,不重复、会话问题结果,不重复,保存数据。
.根据权利要求1所述的一种基于人工智能信息数据采集方法,其特征在于所述在步骤4过滤取舍所收集的信息,舍弃的信息进入信息保护单元的粉碎删除防止再生的渠道; 有效信息,进入加强保护渠道,防止信息泄露,保护参与者的信息安全