发明名称 METHOD AND DEVICE FOR MINING DATA REGULAR EXPRESSION
摘要 본 발명은 저장 데이터를 획득하고, 사전 트리 구조로 저장하는 단계; 정규표현식 규칙에 따라 노드 업그레이드를 진행하는 단계; 업그레이드된 후의 노드의 서브노드의 개수와 동일한 문자의 서브노드의 개수에 따라 각각 분기 병합하는 단계; 간섭 분기를 식별하고, 분기 삭제를 진행하는 단계; 규칙 트리를 문자열 포맷으로 전환하여 출력하는 단계를 포함하는 데이터 정규표현식의 마이닝 방법을 제공한다.획득된 데이터를 사전 트리 구조 중에 저장하는 것을 통하여, 대량 데이터에 대한 마이닝을 실현할 수 있고, 데이터 노드에 대한 업그레이드, 분기 병합, 간섭 분기의 삭제를 거쳐, 마지막으로 생성된 규칙 트리를 문자열 포맷으로 전환하여 출력한다. 본 발명은 잘못된 데이터를 포함한 대량 데이터의 정규표현식에 대한 마이닝을 실현하였고, 상기 규칙 트리는 잘못된 데이터에 대한 마이닝을 만족시킬 수 있으며, 데이터에 대하여 검사를 진행하고 잘못된 데이터를 찾아내는데 사용할 수 있다. 이 밖에, 본 발명은 데이터 정규표현식의 마이닝 장치를 더 제공한다.
申请公布号 KR101617696(B1) 申请公布日期 2016.05.03
申请号 KR20157018961 申请日期 2014.08.08
申请人 센젠 아우다크 데이터 테크놀로지 리미티드 发明人 왕, 밍싱;지아, 시베이
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人
主权项
地址