|
ИзвлечениеТекста() при работе с файлами формата pdf |
☑ |
0
DreamMaster
10.04.14
✎
11:54
|
Доброго времени суток!
Столкнулся с такой проблемой: необходимо программно перевести файл из pdf в txt (либо просто получить текст из pdf).
НайденныеФайлы = НайтиФайлы(Путь,"*");
Для каждого Файл из НайденныеФайлы Цикл
Попытка
Объект = Новый ИзвлечениеТекста(Файл.ПолноеИмя);
Текст = Объект.ПолучитьТекст();
Сообщить(Текст);;
Объект.Записать(Путь+Файл.ИмяБезРасширения+" new"+".txt");
Исключение
Сообщить (ОписаниеОшибки());
КонецПопытки;
КонецЦикла;
Выдает сообщение : Ошибка при вызове метода контекста (ПолучитьТекст): Ошибка извлечения текста из файла
Фильтр подключал установив Acrobat reader и Adobe PDF IFilter v6.0
Через программку IFilter вижу, что фильтры установились.
В чем может быть проблема?
|
|
1
Wobland
10.04.14
✎
11:55
|
а текст есть?
|
|
2
DreamMaster
10.04.14
✎
11:57
|
(1) Да, pdf представляет собой заказ от покупателя (там и текст и таблицы...)
|
|
3
Wobland
10.04.14
✎
11:58
|
хорошо, по-другому. а картинка есть?
|
|
4
DreamMaster
10.04.14
✎
11:58
|
Пробовал с word, txt - всё работает, но вот на pdf ругается
|
|
5
le_
10.04.14
✎
12:00
|
|
|
6
DreamMaster
10.04.14
✎
12:01
|
(3) сейчас скину
|
|
7
Wobland
10.04.14
✎
12:01
|
(6) я его не хочу
|
|
8
DreamMaster
10.04.14
✎
12:01
|
(5) необходимо обработать файл именно программно, через 1С
|
|
9
DreamMaster
10.04.14
✎
12:02
|
(7) ты имеешь ввиду картинку в файле pdf?
|
|
10
DreamMaster
10.04.14
✎
12:03
|
Скрин IFilter
|
|
11
Wobland
10.04.14
✎
12:10
|
или я с djvu путаю?..
|
|
12
Wobland
10.04.14
✎
12:17
|
не, не путаю
п. с. потом окажется, что пдф - это распечатанный скриншот
© v8: Как скопировать файл в буфер обмена
|
|
13
DreamMaster
10.04.14
✎
12:21
|
(12) не, pdf не картинка (могу руками копировать нужные строки)
|
|
14
DreamMaster
10.04.14
✎
12:27
|
Меня смущают в IFilter колонки с текстом "no". Может фильтр установился не так как нужно?
|
|
15
DreamMaster
10.04.14
✎
12:47
|
ап!
|
|