gPDFText w repozytorium Debiana
- Dodano: 22 listopada 2009
- Wprowadził: Szymon Barczak
- Komentarze: 15
gPDFText, program umożliwiający wyciąganie tekstu z pliku PDF i zapisywanie go w dowolnym formacie, trafił do repozytorium niestabilnej wersji Debiana.
W ciągu dwóch tygodni, czyli od kiedy ostatni raz pisałem o programie, aplikacja doczekała się drugiego wydania – 0.0.2, które przynosi takie zmiany jak między innymi dodanie funkcji cofnij/ponów, czy dostarczenie zarówno programu, jak i podręcznika pomocy, w aż siedmiu wersjach językowych: czeskiej, niemieckiej, włoskiej, portugalskiej, rosyjskiej, szwedzkiej oraz oczywiście angielskiej. Jednocześnie autor zachęca inne osoby do zgłaszania nowych tłumaczeń. W informacji źródłowej jest powiedziane w jaki sposób można dołączyć do zaszczytnego grona tłumaczy aplikacji.
Autor mówi o tym, iż rozpoczął pracę nad mechanizmem przepisywania plików PDF, tzn. wyciągania tekstu z pliku wielkości A4 i przepisywanie go w czystym tekście do pliku PDF rozmiaru np. A5. Programista udostępnił także plan rozwoju dla wersji 0.1.0
Użytkownicy Debiana w wersji niestabilnej (Sid) mogą tu i teraz pobrać program za pomocą komendy apt-get install gpdftext. Powodzenia!
Więcej informacji: http://www.linux.codehelp.co.uk/serendip...-guid.html
Znalazłeś literówkę? Zgłoś ją używając formularza!
Jeśli uważasz, że ten nius jest nieobiektywny, przedstawia nieprawdziwe wydarzenie, jest spamem lub nie spełnia standardów serwisu, napisz raport.
Niusy na podobny temat:
Komentarze są prywatnymi opiniami dodających je osób. Prosimy o zachowanie kultury wypowiedzi. Komentarze obraźliwe oraz obniżające poziom serwisu będą usuwane. Więcej w regulaminie komentowania.
15 komentarzy
Wszystkie autorskie niusy w serwisie publikowane są na licencji Creative Commons Uznanie autorstwa 2.5 Polska.


b.YISK'u błagam Cię, przestań pisać o nowych paczkach dla Debiana. Każdy, kto się tym interesuje, znajdzie to sobie w Internecie. Wiem, że liczba niusów jest dla Ciebie ważniejsza, ale, litości, pomyśl czasem o poziomie serwisu, który przez takie niby-niusy spada na łeb na szyję.
Pozdrawiam, Cichy Obserwator.
Z tego co zauważyłem pisze tylko o tych ważniejszych. Dla porównania wszystkie nowe (jest też RSS, jeśli ktoś — podobnie jak ja — chce je śledzić ;])
Nie bądź egoistą, staram się, aby czytelnicy LinuxNews też mieli co poczytać. Nie wiem czy wiesz, ale niusy z OSnews otagowane linux trafiają automatycznie na LinuxNews, bo dla serwisów OSmedia jest wspólna baza danych i dlatego powstał taki ficzer.
I czy to oznacza że trzeba informować o nowych paczkach dla Debiania? Bez przesady.
Nie chodzi o sam fakt pisania o czymkolwiek, tylko o fakt pisania o paczkach dla Debiana. Gdyby chodziło o nową wersję programu mój poprzedni post nigdy by nie powstał.
Powodzenia? Aż tak źle jest? ;]
Tor: oprocz tego jest pdf2ascii albo zaznaczanie tekstu w KPFD/okular,
i pewnie w Evince. choc oczywiscie skanowanych pdfow sie nie zrobi.
chyba, ze przespalem jakas rewolucje w OCR dla *nixow.
Właśnie przydałoby się coś do zamiany zeskanowanych pdf-ów w tekst… Czy to naprawdę nieosiągalne? W końcu taki tucan manager radzi sobie z captchą na wszelkiej maści rapidach… Nie jestem specjalistą w ocr, ale captcha z tych serwisów wydaje się bardziej skomplikowana niż czarne literki na białym tle…
nie wiem; mi sie nie przydaje, choc duzo korzystam ze starych
artykulow.
ostatnie programy, jakie pamietam, to ocrad, gocr i jeszcze cos
tam. no i dzialalo, ale po prostu beznadziejnie — mozna bylo
spisac tekst timesem albo helvetica 20+pt, przepuscic przez dvipsa
i convert do pbm i i tak bylo zle. ale to stan z 2004-5 roku;
dzis nie sprawdzalem.
w tej chwili rozwija się:
http://code.google.com/p/tesseract-ocr/
oraz trochę mniej dynamicznie jego polska odmiana;
http://code.google.com/p/tesseract-polish/
Jest jeszcze program pdftotext ( w ubuntu i zapewnie w debianie)
byc moze ze zle napisalem pdf2ascii — w kazdym razie rozchodzi
mie sie o to, co sprawia, ze mc potrafi ogladac niektore pdfy.
oczywiscie w przypadku mocno matematycznych tekstow dostaje sie
przyslowiowa kaszane..
chętnie poznam przysłowie o kaszanie
Ten news jest akurat interesujący…
Trzeba publikować! dzięki temu newsowi zmobilizowałem się i już jest polska wersja językowa.