Dodany: 11.02.2011 15:20|Autor: kocio

Nie tylko papier...> Czytniki

Skany - i co dalej?


Ostatnio się wgłębiłem w tematykę taniej digitalizacji (głównie tworzenia e-booków w warunkach amatorskich) i skoro już o skanerze była mowa, to tym razem jakie swobodnie dostępne programy do tego znalazłem:

- ScanTailor ( http://scantailor.sourceforge.net/ ) - to kombajn do obróbki optycznej skanów, można nim obracać obrazki, zaznaczać obszary tekstu/grafik, określać marginesy, oczyszczać z zabrudzeń optycznych czy wybielać kolor kartki. Wkrótce nadchodzi wersja 1.0, w której będzie miał automatyczne (i ręczne) "prostowanie" wygiętych kartek, a także polskie tłumaczenie.

- CuneiForm ( http://www.cuneiform.ru/eng/ ) - program do rozpoznawania tekstu ze skanów (OCR), obsługuje między innymi język polski (trzeba to tylko zmienić w ustawieniach); jakość rozpoznawania naprawdę porządna.

To pod Windows, ale ku mojemu zaskoczeniu pod Linuksem już też jest tak samo dobrze - ScanTailor jest dostępny równolegle, a do graficznej obróbki OCR rozwija się program OCRFeeder ( http://live.gnome.org/OCRFeeder ), który do faktycznego rozpoznawania tekstu używa różnych programów, w tym dwóch najlepszych - portu CuneiForm (można tez uruchamiać wersję windowsową pod Wine) oraz Tesseract, który daje porównywalne efekty. Żeby rozpoznawać teksty po polsku do ich konfiguracji trzeba dodać "-l pol", przy czym ważne, żeby to były nowsze wersje, dostępne np. pod Ubuntu w repozytorium https://launchpad.net/~alex-p/+archive/notesalexp . Wkrótce powinien mieć też polskie tłumaczenie, czekam już tylko aż autor je zaaplikuje i opublikuje nową wersję.

Jeśli ktoś nie potrzebuje wygodnego skanera do książek (samoróbki albo ION Book Savera, który ma się pojawić latem) i wystarczy mu zwykły, to już nic tylko zacząć szykować domową biblioteczkę do przeniesienia na czytnik! =}
Wyświetleń: 4898
Dodaj komentarz
Przeczytaj komentarze
ilość komentarzy: 4
Użytkownik: moriakaice 12.02.2011 18:32 napisał(a):
Odpowiedź na: Ostatnio się wgłębiłem w ... | kocio
Nie wiem, jak opisywane przez Ciebie programy - ale może warto rozważyć zakup Abbyy Finereadera? Wersja 8.0 to koszt 245 zł, a radzi sobie całkiem nieźle.
Użytkownik: kocio 12.02.2011 18:52 napisał(a):
Odpowiedź na: Nie wiem, jak opisywane p... | moriakaice
Z różnych powodów (choćby dlatego, że używam Linuksa oraz generalnie unikam rzeczy z ograniczeniami licencyjnymi) szukałem narzędzi na wolnych licencjach i nie wymagających zakupów. Tesseract w latach 90. był najlepszym programem jeśli idzie o dokładność, a CuneiForm jest zdaje się dodawany do różnych skanerów, trafił do CorelDraw i do 2008 r. (kiedy go zmienili na freeware, a potem otwarli licencję źródeł) był rynkowym konkurentem FineReadera, więc sroce spod ogona nie wypadły. =} W krótkim teście, jaki im urządziłem, oba wypadły przyzwoicie - używam czasem FR 5.0 i na oko też wypada podobnie, ale to już każdy musi sam spróbować co mu pasuje.

ScanTailor też zdaje się ma jakiegoś komercyjnego odpowiednika, ale nie interesowałem się bliżej.
Użytkownik: moriakaice 13.02.2011 11:21 napisał(a):
Odpowiedź na: Z różnych powodów (choćby... | kocio
Nie, nie, ja nie chciałem deprecjonować wartości darmowych rozwiązań - mówię tylko, że FR 8.0 nie jest taki drogi, a radzi sobie z OCRem bardzo dobrze :)
Użytkownik: ma-ruda 15.02.2011 21:27 napisał(a):
Odpowiedź na: Z różnych powodów (choćby... | kocio
Różnica między FR 5.0 a nowszymi wersjami jest kolosalna, więc jeśli rozwiązania darmowe są porównywalne tylko z nim to chyba warto zainwestować.
Patronaty Biblionetki
Biblionetka potrzebuje opiekunów
Recenzje

Użytkownicy polecają:

Redakcja poleca: