Имя: Пароль:
1C
 
ДО 3.0 Автоматическая адресация входящих писем
0 xraf
 
28.04.26
12:38
Суть задачи :
Делопроизводитель регистрирует входящую корреспонденцию, сканирует и прикрепляет. 1С должна этот файл распознать и поставить задачу на исполнение по данному письму.
Дружить с ИИ?
1 vicof
 
28.04.26
13:24
Не, бить заказчика
2 Garykom
 
гуру
28.04.26
13:24
(0) Не хочу огорчать но ИИ вам для данной задачи выйдет не дешевле чем платить зарплату паре девочек
3 Garykom
 
гуру
28.04.26
13:27
ИИ это не удешевить
ИИ это дороже но быстрей и на больших объемах

Если у вас там сотни и тысячи документов в секунду, ну пусть хотя бы в минуту
То да, вам нужен ИИ и пофиг на процент ошибок

Но если у вас смешные объемы - наймите человека...
4 xraf
 
28.04.26
14:14
(3) вроде же есть бесплатные модели уже, скормить ей сканы прошлых лет
5 Garykom
 
гуру
28.04.26
14:22
(4) Эмм. Советую изучить тему LLM.

Обучить свою модель встанет в такие деньги что всего бюджета конторы не хватит.

Готовую большую модель крутить у себя - тоже на железе и счетах за электричество разоритесь.

Облачную? На счетах за токены аналогично разоритесь, но не сразу.
И требуется стабильный канал.

И самое главное готовы все свои входящие документы отправлять в облако? Неважно чье.
А 152-ФЗ и прочее учли?
Там сча ипут даже за трансграничную передачу между своими серверами.

Но самая большая проблема готовой модели - размер контекста!
6 xraf
 
28.04.26
14:28
(6) У меня есть куча старых pdf и назначенный по ним сотрудник, распознать их контекст
7 Garykom
 
гуру
28.04.26
16:51
Чисто теоретически задача конечно решаема.
Но вряд ли есть объемы чтобы стоило браться ее решать.
Например нанять спеца по ML, чтобы обработал сканы прошлых лет.
Сначала прогнал через распознавание - это будет не быстро или дорого.
Затем выделил ключевые признаки, создал обучающую выборку и контрольные - тут нужны будут офигенные объемы, примерно так в миллионы документов.
Точнее объемы выборок зависят от кол-ва вариантов распределения.

Далее когда данные для обучения и контрольные выборки готовы - можно приступать или к обучению своей модели.
Или к файнтюнингу готовых.

Файнтюнинг он дешевле, но сама модель денег стоит!
Почти все "бесплатные" модели в паблике они бесплатны для не коммерческого применения.
Как и на железо под готовую много денег надо.

Свою модель дико дорого обучать с нуля (или почти с нуля)!
Но в итоге будет небольшая и можно крутить на дешевом железе - вместо настоящего кластера GPU хватит дешман-кластера из игровых RTX 5090 или нечто вроде.

А вот просто взять большую готовую модель, настроить ее (называется файнтюнинг - дообучение = докидывание своих данных).
Встанет очень затратно по железу.
Там стоимость одной видяхи от 1.5 ляма рублей!
А на кластер надо таких штук 8 или более.
Ну и прочее железо, надо же куда-то "видеокарты" втыкать.
8 xraf
 
28.04.26
14:32
(7) у Вас все время "дорого" и "дорого" :)
9 xraf
 
28.04.26
14:34
(8) Мне нужна локальная бесплатная модель, которая на основе файлов прошлых лет "запомнит" кто за подобные входящие письма отвечал, и "сообщит" об этом в 1С
Неужели это все стоит больших денег?
10 Garykom
 
гуру
28.04.26
14:37
(9) Да.
Человека нанять дешевле, если у вас смешной оборот в десятки или сотни документов в день.
11 xraf
 
28.04.26
14:38
(10) Значит у нас будущее еще не наступило
12 Garykom
 
гуру
28.04.26
14:41
(11) Не все так плохо, не забываем про прогресс.
Первые компьютеры когда появились?
Сколько стоили?
Сколько места занимали и кушали энергии?

А через сколько они настолько улучшились что теперь обычный человек таскает на себе несколько компьютеров, по мощности легко перекрывающие любые из первых компьютеров.
13 d4rkmesa
 
28.04.26
14:43
(6) Есть сканеры, навроде Kyocera, где можно докупить встроенную функцию создания текстового слоя в сканах (сканы  pdf).
(9) Есть бесплатные модели, но все утыкается в системные требования и производительность в токенах. Локальные модели - это небыстро.
>>Неужели это все стоит больших денег?
Ну, видеокарты нынче стоят уже прилично, так что не бесплатно, да.
14 Garykom
 
гуру
28.04.26
14:54
(13) Спецсканеры не обязательны если качество уже имеющихся сканов приличное.
Но крутить модельку локально денег стоит.
https://cloud.mail.ru/public/RsMo/V7jcWKoXk
15 Garykom
 
гуру
28.04.26
14:56
(14) Вот это оно за 30 сек скриншот локально распознало
На экономичном режиме электропитания Win10
Если на максимальную производительность поменять - будет быстрей, но кулеры воют и кушает сильно больше
16 d4rkmesa
 
28.04.26
14:58
(13) >> Спецсканеры не обязательны если качество уже имеющихся сканов приличное.

Не, сканеры обычные, просто в Киосерах уже давно есть эта функция, но ее не покупают обычно. Как там по факту работает, не знаю, но наличие текстового слоя круто бы помогло. А так, видимо, нужно будет сканы медленно и печально скармливать локальной модели.

(14) Это на каком "железе"? 24-32Gb видеокарта?
17 xraf
 
28.04.26
15:16
(15) Нормально :) Там уж в день не так много писем
18 Garykom
 
гуру
28.04.26
15:18
(16) >Это на каком "железе"? 24-32Gb видеокарта?
Две RTX 5060 Ti по 16Gb
19 Garykom
 
гуру
28.04.26
15:39
(18)+ Уже жалею что 3-ю такую же видяху сразу не взял
Моделькам места для контекста не хватает, на 48 вместо 32 было бы лучше
А видяхи уже подскочили еще цены
Кaк может человек ожидaть, что его мольбaм о снисхождении ответит тот, кто превыше, когдa сaм он откaзывaет в милосердии тем, кто ниже его? Петр Трубецкой