|
|
|||||
Парсинг PDF
Если я не ошибаюсь, PDF стал открытым форматом, и парсить его можно беспрепятственно.
Сталкивался ли уже кто-то с этим процессом, и что вы использовали для этого? PHP-библиотеку? Или есть уже написанные на AS3 парсеры? Нагуглить получилось только PHP. В принципе, устраивает, но еще не полазила в нем, заранее решила спросить - самый ли это оптимальный путь, вдруг кто сталкивался. |
|
|||||
Регистрация: Jan 2009
Сообщений: 1,651
|
Я делал небольшую админку, которая предлагала экспорт статистики в pdf. В конечном итоге решил, что удобнее генерировать пдфку на сервере с помощью php. Сначала думал использовать zend'а расширение, но в итоге удобнее всего оказалось tcpdf -там нормальная поддержка русских шрифтов и наиболее удобное построение таблиц было(но это было давно, 4 года назад). Для флеша есть AlivePDF, но возможности у него бедненькие.
Единственная проблема - это графики, которые рисовались у меня во флеше. Вернее во флексе. Можно было бы конечно генерировать графики отдельно в пхп, но я захотел, чтобы графики на экране и при распечатке выглядели одинаково. Поэтому у меня флешка-админка отправляла битмап с графиком на сервер, а тот ее встраивал в пдф-ку. Не очень оптимально, конечно. --- А,черт, вам нужно распарсить готовую пдфку, а я все про генерацию =(
__________________
мой пустой блог |
|
|||||
Да, но все эти штуки вроде только для создания, но не чтения и парсинга PDF
|
|
|||||
Регистрация: Jan 2009
Сообщений: 1,651
|
Да, да я уже заметил. Боюсь, это более сложная задача. Вон, скажем, в purePDF можно прочесть пдф-ку, но из нее можно извлечь текст, картинки, отдельные элементы, а как это дело отображать на экране - ваши проблемы.
Есть еще swftools где есть консольная программка pdf2swf которая позволяет вам превращать пдф-ки в сфк-ки(каждый кадр - отдельная страница), можно ее как-то прикрутить, т.е. пользователь загружает pdf=>отправили на сервер=>конвертировали=>загрузили как swf. Есть еще компонент flexpaper, но, судя, по документации, он использует тоже самое конвертирование пдфки консольной командой на стороне сервера.
__________________
мой пустой блог |
Часовой пояс GMT +4, время: 16:42. |
|
« Предыдущая тема | Следующая тема » |
Теги |
pdf , парсинг |
|
|