1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.

Распознавание рукописного текста. OCR

Тема в разделе "Беседка", создана пользователем Dimka_69, 27 ноя 2020.

  1. Здравствуйте.
    Достались по наследству рукописи человека, прошедшего всю Великую отечественную.
    Качество за 80 лет очень пострадало, да и почерк как у врача.
    Сканирую в jpeg, скармливаю программам по OCR и ничего.
    ABBYY FineReader OCR выдаёт вообще просто набор символов.
    Не могут проги справиться даже вот с таким простым текстом, см. ниже.
    Может кто что подскажет?

    CCI27112020_0001.jpg
     
  2. На любой фриланс бирже сделают за небольшие деньги.
     
  3. GregB, вопрос: наёмный работник будет сидеть и пытаться прочесть текст? Не думаю. Работу нужно сделать быстро, быстрее получить оплату. Значит, программное распознавание.
    Я, конечно, попробую, уже смотрел на fl.ru.
    Но мне хочется всё сделать самому. И съэкономить денег, в том числе.
     
  4. Думаю тут программы не помогут, надо сидеть самому от руки переписывать или набирать текст. Может есть знакомый или знакомая из школьных учителей, может даже и бывших? Они хорошо разбирают разный почерк.
     
  5. Robert, да, я уже начал. Сделал сканы, в редакторе добился максимального контраста текста.
    Сижу, читаю и оригинал и скан, достаточно быстро втянулся. Есть сложности, где текст утерян, там ставлю пробел :(

    CCI28112020_0008.jpg
     
    Стася нравится это.
  6. Помню, как записывала со слов деда несколько воспоминаний из 41-42 года... Было очень интересно.
    В Ваших руках, вероятно, сейчас страницы, имеющие ценность для исследователей истории - возможно, есть энтузиасты, которые расшифруют стопку рукописей для включения избранных эпизодов в фонд памяти ВОВ? У них база пополнится, у Вас появится распознанный текст.

    Даже не думала, что сть проги, которые в состоянии распознать такой текст, учитывая, что даже человек не все слова понимает и где-то приходится догадываться о смысле.
     
  7. Стася, на самом деле, ценности для историков мало, если нет упоминания о чём-то таком, чего никто не слышал и не видел, что до сих пор засекречено. Например, история Ржевско - Вяземского УРа до сих пор не известна, всё за семью печатями. И в книгах, изданных за всё время после войны, правды об этом укрепрайоне нет.
    Ценно как память внутри семьи.
    Если Вам это интересно, напишите в личку, дам ссылку на жж, куда я пишу то, что смог прочесть из дневника. Пока очень мало и писАть буду долго.
     
  8. Dimka_69, посмотрел первое попавшееся предложение на kwork.ru, ввод текста с рукописи 25000 знаков за 500 руб., это примерно 10 страниц. Делают за 1-2 дня.
    Другое дело, какую ценность имеет эта работа для Вас.
     
  9. GregB, в моей рукописи чуть более 200 страниц :) я уж как нибудь сам :) тем более, что мне это дело очень понравилось.
    Не знаю, впринципе, тема исчерпана, можно закрыть или удалить?
     

Поделиться этой страницей