Kategorie:
14

gPDFText w repozytorium Debiana

gPDFText, program umożliwiający wyciąganie tekstu z pliku PDF i zapisywanie go w dowolnym formacie, trafił do repozytorium niestabilnej wersji Debiana.

W ciągu dwóch tygodni, czyli od kiedy ostatni raz pisałem o programie, aplikacja doczekała się drugiego wydania – 0.0.2, które przynosi takie zmiany jak między innymi dodanie funkcji cofnij/ponów, czy dostarczenie zarówno programu, jak i podręcznika pomocy, w aż siedmiu wersjach językowych: czeskiej, niemieckiej, włoskiej, portugalskiej, rosyjskiej, szwedzkiej oraz oczywiście angielskiej. Jednocześnie autor zachęca inne osoby do zgłaszania nowych tłumaczeń. W informacji źródłowej jest powiedziane w jaki sposób można dołączyć do zaszczytnego grona tłumaczy aplikacji.

Autor mówi o tym, iż rozpoczął pracę nad mechanizmem przepisywania plików PDF, tzn. wyciągania tekstu z pliku wielkości A4 i przepisywanie go w czystym tekście do pliku PDF rozmiaru np. A5. Programista udostępnił także plan rozwoju dla wersji 0.1.0

Użytkownicy Debiana w wersji niestabilnej (Sid) mogą tu i teraz pobrać program za pomocą komendy apt-get install gpdftext. Powodzenia!

Więcej informacji: http://www.linux.codehelp.co.uk/serendip...-guid.html

«
»

Znalazłeś literówkę? Zgłoś ją używając formularza!


Jeśli uważasz, że ten nius jest nieobiektywny, przedstawia nieprawdziwe wydarzenie, jest spamem lub nie spełnia standardów serwisu, napisz raport.

Niusy na podobny temat:

Komentarze (RSS)

Komentarze są prywatnymi opiniami dodających je osób. Prosimy o zachowanie kultury wypowiedzi. Komentarze obraźliwe oraz obniżające poziom serwisu będą usuwane. Więcej w regulaminie komentowania.

15 komentarzy

zwiń wątek Cichy Obserwator  22 listopada 2009 o godz. 17:26 #
Gravatar

b.YISK'u błagam Cię, przestań pisać o nowych paczkach dla Debiana. Każdy, kto się tym interesuje, znajdzie to sobie w Internecie. Wiem, że liczba niusów jest dla Ciebie ważniejsza, ale, litości, pomyśl czasem o poziomie serwisu, który przez takie niby-niusy spada na łeb na szyję.

Pozdrawiam, Cichy Obserwator.

(Poniżej tego poziomu komentarze nie będą zagnieżdżane)
zwiń wątek azhag  22 listopada 2009 o godz. 23:06 #
Gravatar

Z tego co zauważyłem pisze tylko o tych ważniejszych. Dla porównania wszystkie nowe (jest też RSS, jeśli ktoś — podobnie jak ja — chce je śledzić ;])

 
zwiń wątek b.YISK  22 listopada 2009 o godz. 23:30 #
Gravatar

Nie bądź egoistą, staram się, aby czytelnicy LinuxNews też mieli co poczytać. Nie wiem czy wiesz, ale niusy z OSnews otagowane linux trafiają automatycznie na LinuxNews, bo dla serwisów OSmedia jest wspólna baza danych i dlatego powstał taki ficzer.

zwiń wątek Sit  23 listopada 2009 o godz. 7:37 #
Gravatar

I czy to oznacza że trzeba informować o nowych paczkach dla Debiania? Bez przesady.

 
zwiń wątek Cichy Obserwator  23 listopada 2009 o godz. 21:47 #
Gravatar

Nie chodzi o sam fakt pisania o czymkolwiek, tylko o fakt pisania o paczkach dla Debiana. Gdyby chodziło o nową wersję programu mój poprzedni post nigdy by nie powstał.

 
 
 
zwiń wątek Tor  22 listopada 2009 o godz. 22:20 #
Gravatar

Powodzenia? Aż tak źle jest? ;]

(Poniżej tego poziomu komentarze nie będą zagnieżdżane)
zwiń wątek nat  23 listopada 2009 o godz. 11:16 #
Gravatar

Tor: oprocz tego jest pdf2ascii albo zaznaczanie tekstu w KPFD/okular,
i pewnie w Evince. choc oczywiscie skanowanych pdfow sie nie zrobi.
chyba, ze przespalem jakas rewolucje w OCR dla *nixow.

zwiń wątek Tor  23 listopada 2009 o godz. 12:28 #
Gravatar

Właśnie przydałoby się coś do zamiany zeskanowanych pdf-ów w tekst… Czy to naprawdę nieosiągalne? W końcu taki tucan manager radzi sobie z captchą na wszelkiej maści rapidach… Nie jestem specjalistą w ocr, ale captcha z tych serwisów wydaje się bardziej skomplikowana niż czarne literki na białym tle…

zwiń wątek nat  23 listopada 2009 o godz. 13:08 #
Gravatar

nie wiem; mi sie nie przydaje, choc duzo korzystam ze starych
artykulow.
ostatnie programy, jakie pamietam, to ocrad, gocr i jeszcze cos
tam. no i dzialalo, ale po prostu beznadziejnie — mozna bylo
spisac tekst timesem albo helvetica 20+pt, przepuscic przez dvipsa
i convert do pbm i i tak bylo zle. ale to stan z 2004-5 roku;
dzis nie sprawdzalem.

 
zwiń wątek Cunio  23 listopada 2009 o godz. 16:48 #
Gravatar

w tej chwili rozwija się:
http://code.google.com/p/tesseract-ocr/

oraz trochę mniej dynamicznie jego polska odmiana;

http://code.google.com/p/tesseract-polish/

 
 
zwiń wątek misiek  23 listopada 2009 o godz. 13:54 #
Gravatar

Jest jeszcze program pdftotext ( w ubuntu i zapewnie w debianie)

zwiń wątek nat  23 listopada 2009 o godz. 17:24 #
Gravatar

byc moze ze zle napisalem pdf2ascii — w kazdym razie rozchodzi

mie sie o to, co sprawia, ze mc potrafi ogladac niektore pdfy.

oczywiscie w przypadku mocno matematycznych tekstow dostaje sie

przyslowiowa kaszane..

 
zwiń wątek D3X  25 listopada 2009 o godz. 2:36 #
Gravatar

chętnie poznam przysłowie o kaszanie :)

 
 
 
 
zwiń wątek RzuraF  23 listopada 2009 o godz. 11:44 #
Gravatar

Ten news jest akurat interesujący…

(Poniżej tego poziomu komentarze nie będą zagnieżdżane)
 
zwiń wątek LS  23 listopada 2009 o godz. 19:58 #
Gravatar

Trzeba publikować! dzięki temu newsowi zmobilizowałem się i już jest polska wersja językowa.

(Poniżej tego poziomu komentarze nie będą zagnieżdżane)
 

Uwaga! Niektóre komentarze, m.in. te dodane przez niezalogowanych i nowych użytkowników, są ręcznie moderowane. Jeśli Twój komentarz nie ukaże się od razu, nie dodawaj go ponownie, tylko cierpliwie poczekaj na akceptację.

W komentarzach możesz używać prostych znaczników HTML. Przykłady:
  • Link: <a href="http://osnews.pl">OSnews: niusy IT</a>,
  • Wytłuszczenie: <strong>tekst pogrubiony</strong>,
  • Kursywa: <em>tekst pochylony</em>,
  • Przekreślenie: <strike>tekst przekreślony</strike>,
  • Kod: <code>printf("blok kodu");</code>,
  • Cytat: <blockquote>cytat</blockquote>
Uwaga: jeśli dodasz nieznany znacznik, będzie on niewidoczny, gdyż system filtruje takie znaczniki.

Wszystkie autorskie niusy w serwisie publikowane są na licencji Creative Commons Uznanie autorstwa 2.5 Polska.

Twoja sugestia