src/main/java/de/ids_mannheim/korap/query/spans/ExpandedSpans.java - KorAP/Krill - Gitiles

 package de.ids_mannheim.korap.query.spans;

 import java.io.IOException;
 import java.nio.ByteBuffer;
 import java.util.ArrayList;
 import java.util.List;
 import java.util.Map;

 import org.apache.lucene.index.AtomicReaderContext;
 import org.apache.lucene.index.Term;
 import org.apache.lucene.index.TermContext;
 import org.apache.lucene.util.Bits;

 import de.ids_mannheim.korap.query.SpanExpansionQuery;

 /**
  * @author margaretha
  * */
 public class ExpandedSpans extends SimpleSpans{

 	private int min, max;
 	private byte classNumber;
 	private boolean isBefore;
 	private List<CandidateSpan> candidateSpans;
 	private long matchCost;

 	public ExpandedSpans(SpanExpansionQuery spanExpansionQuery,
 			AtomicReaderContext context, Bits acceptDocs,
 			Map<Term, TermContext> termContexts) throws IOException {
 		super(spanExpansionQuery, context, acceptDocs, termContexts);
 		this.min = spanExpansionQuery.getMin();
 		this.max = spanExpansionQuery.getMax();
 		this.classNumber = spanExpansionQuery.getClassNumber();
 		this.isBefore = spanExpansionQuery.isBefore();

 		candidateSpans = new ArrayList<CandidateSpan>();
 		hasMoreSpans = true;
 	}

 	@Override
 	public boolean next() throws IOException {
 		matchPayload.clear();
 		isStartEnumeration = false;
 		return advance();
 	}

 	private boolean advance() throws IOException {
 		while (hasMoreSpans || candidateSpans.size() > 0) {
 			if (candidateSpans.size() > 0 ){
 				setMatch(candidateSpans.get(0));
 				candidateSpans.remove(0);
 				return true;
 			}
 			else {
 				hasMoreSpans = firstSpans.next();
 				setCandidateList();
 			}
 		}
 		return false;
 	}

 	private void setCandidateList() throws IOException {
 		CandidateSpan cs;
 		int counter, start, end;

 		if (isBefore){
 			counter = max;
 			while (counter >= min ){
 				start =  Math.max(0,firstSpans.start() - counter);
 				cs = new CandidateSpan(
 						start,
 						firstSpans.end(),
 						firstSpans.doc(),
 						firstSpans.cost(),
 						calculatePayload(start, firstSpans.start())
 				);

 				candidateSpans.add(cs);
 				counter--;
 			}
 		}
 		else{
 			counter = min;
 			while (counter <= max){
 				// TODO: How do I know if the end is already too far (over the end of the doc)?
 				end = firstSpans.end() + counter;
 				cs = new CandidateSpan(
 						firstSpans.start(),
 						end,
 						firstSpans.doc(),
 						firstSpans.cost(),
 						calculatePayload(firstSpans.end(), end)
 				);
 				candidateSpans.add(cs);
 				counter++;
 			}
 		}
 	}

 	private ArrayList<byte[]> calculatePayload(int start, int end)
 			throws IOException{

 		ArrayList<byte[]> payload = new ArrayList<byte[]>();

 		if (classNumber > 0 ){
 			if (firstSpans.isPayloadAvailable()){
 				payload.addAll(firstSpans.getPayload());
 			}

 			//System.out.println("Extension offsets "+start+","+end);
 			payload.add(calculateExtensionOffsets(start, end));
 		}
 		return payload;
 	}

 	private byte[] calculateExtensionOffsets(int start, int end) {
 		ByteBuffer buffer = ByteBuffer.allocate(9);
 		buffer.put(classNumber);
 		buffer.putInt(start);
 		buffer.putInt(end);
 		return buffer.array();
 	}

 	private void setMatch(CandidateSpan candidateSpan) {
 		matchDocNumber = candidateSpan.getDoc();
 		matchStartPosition = candidateSpan.getStart();
 		matchEndPosition = candidateSpan.getEnd();
 		matchPayload = candidateSpan.getPayloads();
 		matchCost = candidateSpan.getCost();
 	}

 	@Override
 	public boolean skipTo(int target) throws IOException {
 		if (hasMoreSpans && (firstSpans.doc() < target)){
   			if (!firstSpans.skipTo(target)){
   				hasMoreSpans = false;
   				return false;
   			}
   		}
   		matchPayload.clear();
   		return advance();
 	}

 	@Override
 	public long cost() {
 		return matchCost;
 	}

 }
	package de.ids_mannheim.korap.query.spans;

	import java.io.IOException;
	import java.nio.ByteBuffer;
	import java.util.ArrayList;
	import java.util.List;
	import java.util.Map;

	import org.apache.lucene.index.AtomicReaderContext;
	import org.apache.lucene.index.Term;
	import org.apache.lucene.index.TermContext;
	import org.apache.lucene.util.Bits;

	import de.ids_mannheim.korap.query.SpanExpansionQuery;

	/**
	* @author margaretha
	* */
	public class ExpandedSpans extends SimpleSpans{

	private int min, max;
	private byte classNumber;
	private boolean isBefore;
	private List<CandidateSpan> candidateSpans;
	private long matchCost;

	public ExpandedSpans(SpanExpansionQuery spanExpansionQuery,
	AtomicReaderContext context, Bits acceptDocs,
	Map<Term, TermContext> termContexts) throws IOException {
	super(spanExpansionQuery, context, acceptDocs, termContexts);
	this.min = spanExpansionQuery.getMin();
	this.max = spanExpansionQuery.getMax();
	this.classNumber = spanExpansionQuery.getClassNumber();
	this.isBefore = spanExpansionQuery.isBefore();

	candidateSpans = new ArrayList<CandidateSpan>();
	hasMoreSpans = true;
	}

	@Override
	public boolean next() throws IOException {
	matchPayload.clear();
	isStartEnumeration = false;
	return advance();
	}

	private boolean advance() throws IOException {
	while (hasMoreSpans \|\| candidateSpans.size() > 0) {
	if (candidateSpans.size() > 0 ){
	setMatch(candidateSpans.get(0));
	candidateSpans.remove(0);
	return true;
	}
	else {
	hasMoreSpans = firstSpans.next();
	setCandidateList();
	}
	}
	return false;
	}

	private void setCandidateList() throws IOException {
	CandidateSpan cs;
	int counter, start, end;

	if (isBefore){
	counter = max;
	while (counter >= min ){
	start = Math.max(0,firstSpans.start() - counter);
	cs = new CandidateSpan(
	start,
	firstSpans.end(),
	firstSpans.doc(),
	firstSpans.cost(),
	calculatePayload(start, firstSpans.start())
	);

	candidateSpans.add(cs);
	counter--;
	}
	}
	else{
	counter = min;
	while (counter <= max){
	// TODO: How do I know if the end is already too far (over the end of the doc)?
	end = firstSpans.end() + counter;
	cs = new CandidateSpan(
	firstSpans.start(),
	end,
	firstSpans.doc(),
	firstSpans.cost(),
	calculatePayload(firstSpans.end(), end)
	);
	candidateSpans.add(cs);
	counter++;
	}
	}
	}

	private ArrayList<byte[]> calculatePayload(int start, int end)
	throws IOException{

	ArrayList<byte[]> payload = new ArrayList<byte[]>();

	if (classNumber > 0 ){
	if (firstSpans.isPayloadAvailable()){
	payload.addAll(firstSpans.getPayload());
	}

	//System.out.println("Extension offsets "+start+","+end);
	payload.add(calculateExtensionOffsets(start, end));
	}
	return payload;
	}

	private byte[] calculateExtensionOffsets(int start, int end) {
	ByteBuffer buffer = ByteBuffer.allocate(9);
	buffer.put(classNumber);
	buffer.putInt(start);
	buffer.putInt(end);
	return buffer.array();
	}

	private void setMatch(CandidateSpan candidateSpan) {
	matchDocNumber = candidateSpan.getDoc();
	matchStartPosition = candidateSpan.getStart();
	matchEndPosition = candidateSpan.getEnd();
	matchPayload = candidateSpan.getPayloads();
	matchCost = candidateSpan.getCost();
	}

	@Override
	public boolean skipTo(int target) throws IOException {
	if (hasMoreSpans && (firstSpans.doc() < target)){
	if (!firstSpans.skipTo(target)){
	hasMoreSpans = false;
	return false;
	}
	}
	matchPayload.clear();
	return advance();
	}

	@Override
	public long cost() {
	return matchCost;
	}

	}