gsp.rar_GSP_gspjava_序列模式_序列模式挖掘资源-CSDN下载

共11个文件

java：7个

ucd：2个

txt：1个

版权申诉

序列模式

序列模式挖掘

3 浏览量 2022-09-20 14:48:17 上传评论收藏 12KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

gsp.rar （11个子文件）

gsp

Element-d.uml 20KB

GSP-i.ucd 1KB

GSP.java 10KB

Sequence.java 5KB

GSPTest.java 408B

Element-d.ucd 5KB

SeqDB.java 2KB

SeqDBhw.java 2KB

Element.java 6KB

Test.java 354B

www.pudn.com.txt 218B

package gsp; import java.util.ArrayList; import java.util.Map; import java.util.HashMap; /** * <title>GSP算法实现类</title> * 本类为核心类，在本类中实现了GSP算法 * @author guangqingzhong * */ public class GSP { private ArrayList<Sequence> c; //长度为i的候选序列模式 private ArrayList<Sequence> l; //长度为i的序列模式 private ArrayList<Sequence> result; private SeqDB db; private int support; /** * 构造方法 * 在实例化GSP对象时，同时赋值支持度 * 并获取序列集和初始化序列模式结果 * @param support 支持度 */ public GSP(int support) { this.support = support; //赋值支持度 this.db = new SeqDB(); //从SeqDB类中获取设置好的序列集 this.result = new ArrayList<Sequence>(); //初始化序列模式结果对象 } /** * 产生序列模式 * 核心方法，在该方法中调用连接和剪枝操作，并将最后获得的序列模式放到result中 * @return 序列模式 */ public ArrayList getSequences() { long start = System.currentTimeMillis(); //调用初始化方法 initialize(); System.out.println("序列模式L(1) 为：" +l); System.out.println("................................................."); for (int i = 0; i < l.size(); i++) { //产生进行连接操作后的候选集 genCandidate(); if (!(c.size() > 0)) { break; } System.out.println("剪枝前候选集的大小为："+c.size()+" 候选集c为："+c); // System.out.println(c); //进行剪枝操作 pruneC(); System.out.println("剪枝后候选集的大小为："+c.size()+" 候选集c为："+c); //产生序列模式 generateL(); System.out.println("序列模式L(" + (i + 2) + ") 为：" +l); addToResult(l); System.out.println("................................................."); } long end = System.currentTimeMillis(); System.out.println("计算花费时间" + (end - start) + "毫秒!"); return this.result; } /* * 初始化方法 * 获取设置好的序列集 */ private void initializehw() { this.l = new ArrayList<Sequence>(); Sequence s; //<{123}> s = new Sequence(); s.addElement(new Element(new int[] {1,2,3})); l.add(s); //<{12}3> s = new Sequence(); s.addElement(new Element(new int[] {1,2})); s.addElement(new Element(new int[] {3})); l.add(s); //<1{23}> s = new Sequence(); s.addElement(new Element(new int[] {1})); s.addElement(new Element(new int[] {2,3})); l.add(s); //<{12}4> s = new Sequence(); s.addElement(new Element(new int[] {1,2})); s.addElement(new Element(new int[] {4})); l.add(s); //<{13}4> s = new Sequence(); s.addElement(new Element(new int[] {1,3})); s.addElement(new Element(new int[] {4})); l.add(s); //<{124}> s = new Sequence(); s.addElement(new Element(new int[] {1,2,4})); l.add(s); //<{23}3> s = new Sequence(); s.addElement(new Element(new int[] {2,3})); s.addElement(new Element(new int[] {3})); l.add(s); //<{23}4> s = new Sequence(); s.addElement(new Element(new int[] {2,3})); s.addElement(new Element(new int[] {4})); l.add(s); //<233> s = new Sequence(); s.addElement(new Element(new int[] {2})); s.addElement(new Element(new int[] {3})); s.addElement(new Element(new int[] {3})); l.add(s); //<234> s = new Sequence(); s.addElement(new Element(new int[] {2})); s.addElement(new Element(new int[] {3})); s.addElement(new Element(new int[] {4})); l.add(s); } /* * 初始化方法 * 获取设置好的序列集 */ private void initialize() { Map<Integer, Integer> can = new HashMap<Integer, Integer>(); //对于序列集中的所有序列 for (Sequence s : db.getSeqs()) { //对于序列中的所有项目集 for (Element e : s.getElements()) { //对于项目集中的所有项目 for (int i : e.getItems()) { //比较项目的出现次数，并计数，用于与支持度比较 if (can.containsKey(i)) { int count = can.get(i).intValue() + 1; can.put(i, count); } else { can.put(i, 1); } } } } this.l = new ArrayList<Sequence>(); //对于产生的候选集，如果支持度大于最小支持度阈值，则添加到序列模式L中 for (int i : can.keySet()) { if (can.get(i).intValue() >= support) { Element e = new Element(new int[] {i}); Sequence seq = new Sequence(); seq.addElement(e); this.l.add(seq); } } //将第一次频繁序列模式加入结果集中 this.addToResult(l); } /* * 产生经过连接操作后的候选集 * */ private void genCandidate() { this.c = new ArrayList<Sequence>(); //对于种子集L进行连接操作 for (int i = 0; i < this.l.size(); i++) { for (int j = i; j < this.l.size(); j++) { this.joinAndInsert(l.get(i), l.get(j)); if (i != j) { this.joinAndInsert(l.get(j), l.get(i)); } } } } /* * 对种子集进行连接操作 */ private void joinAndInsert(Sequence s1, Sequence s2) { Sequence s, st; //去除第一个元素 Element ef = s1.getElement(0).getWithoutFistItem(); //去除最后一个元素 Element ee = s2.getElement(s2.size() - 1).getWithoutLastItem(); int i = 0, j = 0; if (ef.size() == 0) { i++; } for (; i < s1.size() && j < s2.size(); i++, j++) { Element e1, e2; if (i == 0) { e1 = ef; } else { e1 = s1.getElement(i); } if (j == s2.size() - 1) { e2 = ee; } else { e2 = s2.getElement(j); } if (!e1.equalsTo(e2)) { return; } } //end of for s = new Sequence(s1); //将s2的最后一个元素添加到s中 (s.getElement(s.size() - 1)).addItem(s2.getElement(s2.size() - 1). getLastItem()); //如果候选集中没有s，则添加到候选集 if (s.notInSeqs(c)) { c.add(s); } st = new Sequence(s1); //将s2的最后一个元素添加到st中 st.addElement(new Element(new int[] {s2.getElement(s2.size() - 1). getLastItem()})); //如果候选集中没有st，则添加到候选集 if (st.notInSeqs(c)) { c.add(st); } return; } /* * 剪枝操作 * 看每个候选序列的连续子序列是不是频繁序列 * 采用逐个取元素，只去其中一个项目，然后看是不是有相应的频繁序列在l中。 * 如果元素只有一个项目，则去除该元素做相应判断。 */ private void pruneC() { Sequence s; //对于序列中

评论收藏

内容反馈

版权申诉