Bug #3453: Exception extracting text from doc11.pdf - FIRST - Ecoinformatics Redmine

Actions

Copy link

Bug #3453

closed

Exception extracting text from doc11.pdf

Added by Ryan McFall over 16 years ago. Updated over 16 years ago.

Status:

Resolved

Priority:

Normal

Assignee:

Ryan McFall

Category:

parser

Target version:

Unspecified

Start date:

07/16/2008

Due date:

% Done:

Estimated time:

Bugzilla-Id:

3453

Description

When parsing doc11.pdf from the private/samples directory, calling PDFExtract.extract gives the following stack trace:

java.util.NoSuchElementException
at java.util.LinkedList$ListItr.next(Unknown Source)
at edu.msu.first.parser.extract.PDFExtract.stripHeaders(PDFExtract.java:931)
at edu.msu.first.parser.extract.PDFExtract.extractContent(PDFExtract.java:206)
at edu.msu.first.parser.extract.PDFExtract.extract(PDFExtract.java:136)