PDF to TEXT

Προβλήματα που αντιμετωπίζουμε χρησιμοποιώντας τα Windows και τα προγράμματά τους. Νέα & ειδήσεις.

Συντονιστές: Super-Moderators, Software & Hardware Moderators

Απάντηση
Intefix
Δημοσιεύσεις: 186
Εγγραφή: 22 Σεπ 2007 16:21
Τοποθεσία: Ηράκλειο Κρήτης
Επικοινωνία:

PDF to TEXT

Δημοσίευση από Intefix » 07 Μάιος 2009 12:13

Αντιμετοπίζω ένα πρόβλημα.
Έχω χτυπηθεί αρκετά αλλά άκρη επι της ουσίας ΔΕΝ έχω βρεί.
Έχω κείμενα PDF (mstt31 fonts) από την εφημερίδα της κυβέρνησης.
Κάνοντας copy paste σε οποιονδήποτε κειμενογράφο μου τα βγάζει με λάθος γραμματοσειρές.
Ένα δείγμα ...

Κώδικας: Επιλογή όλων

Ôçò ðáñ. 3 ôïõ Üñèñïõ 222 ôïõ Ð.Ä. 410/1995 «Äç-
ìïôéêüò êáé Êïéíïôéêüò Êþäéêáò» (ÖÅÊ 231/Á/1995), üðùò
áõôÞ áíôéêáôáóôÜèçêå ìå ôçí ðåñ. (â) ôïõ Üñèñïõ 15 ôïõ
Í. 3146/2003 «ÏñãÜíùóç êáé Üóêçóç ôïõ åêëïãéêïý äé-
êáéþìáôïò ôùí åôåñïäçìïôþí êáé Üëëåò äéáôÜîåéò» (ÖÅÊ
125/Á/2003).
Ο Acrobat Pro βγάζει το παρακάτω μύμημα.
1) Μπορώ να αλλάξω γραμματοσειρά από τον Acrobat?
2) Τα mstt31 fonts είναι True type Core microsoft fonts. Οπότε εγγενώς τα έχουν τα Windows.

Εκτός από OCR η σωστή λύση ποια είναι;
Συνημμένα
error_pdf.png
error_pdf.png (6.57 KiB) Προβλήθηκε 12513 φορές

Άβαταρ μέλους
DGeorge
Honorary Member
Δημοσιεύσεις: 3752
Εγγραφή: 13 Σεπ 2007 12:59
Τοποθεσία: Καλλιθέα Γενικώς

PDF to TEXT

Δημοσίευση από DGeorge » 07 Μάιος 2009 17:04

Κάποια Softwareάκια του τύπου ReadIris, ή FineReader! Κυκλοφορούν από τις μαμμάδες τους στο Internet σε Trial μορφή.
Για το FineReader, θα σε παραπέμψω εδώ για τις απόψεις μου. Ωστόσο, ίσως φανείς πιο τυχερός από εμένα, ή ίσως έχεις λιγότερες απαιτήσεις...
Δοκίμασε τουλάχιστον να 'παίξεις' με Trial versions :P
PC-Ponemenos
Εικόνα

Apostolis_38
Δημοσιεύσεις: 1969
Εγγραφή: 14 Φεβ 2008 16:20
Τοποθεσία: ΠΕΙΡΑΙΑΣ

PDF to TEXT

Δημοσίευση από Apostolis_38 » 08 Μάιος 2009 03:16

Βρές το πρόγραμμα ABBY TRANSFORMER. Μετατρέπει τα pdf σε αρχεία του office.
Εν προκειμένω εσύ θα το μετατρέψεις σε word.
Δεν κάνει τέλεια δουλειά μιάς και ορισμένοι συνδυασμοί χαρακτήρων του ξεφεύγουν, αλλά σε ποσοστό 95% θα κάνει δουλειά.
Πρόσεχε μόνο στίς ρυθμίσεις να μην βάζεις να γίνεται μετατροπή μόνο σε μία γλώσσα (π.χ. Ελληνικά) γιατί ορισμένες λέξεις δεν μεταφράζονται (Cambridge ή Oxford για παράδειγμα).

Άβαταρ μέλους
korgr
Honorary Member
Δημοσιεύσεις: 5067
Εγγραφή: 07 Οκτ 2008 18:30
Τοποθεσία: Corinth
Επικοινωνία:

PDF to TEXT

Δημοσίευση από korgr » 08 Μάιος 2009 21:14

Εγω απλα θα προτεινω και μια μεθοδο ωστε να μπορεις να μετατρεπεις τα "κινεζικα" σε ελληνικα!
Απόδειξη, το κειμενο που μας εδωσες ειναι το:
Της παρ. 3 του άρθρου 222 του Π.Δ. 410/1995 «Δη-
μοτικός και Κοινοτικός Κώδικας» (ΦΕΚ 231/Α/1995), όπως
αυτή αντικαταστάθηκε με την περ. (β) του άρθρου 15 του
Ν. 3146/2003 «Οργάνωση και άσκηση του εκλογικού δι-
καιώματος των ετεροδημοτών και άλλες διατάξεις» (ΦΕΚ
125/Α/2003).
1. Κατεβάζεις το Notepad2 απο http://www.flos-freeware.ch/notepad2.html
2. Δηλώνεις σαν Default font την Verdana με Script Greek και default encoding utf-8
3. Δημιουργεις ενα νεο έγγραφο στο notepad2 και κανεις paste το κινεζικο κειμενο
4. Επιλεγεις File --> Encoding --> ANSI

το κειμενο μετατρεπεται οπως βλεπεις σε ελληνικοτατο και μπορεις να το χρησιμοποιησεις σε οποιαδηποτε εφαρμογη.

Επισης σε καποια pc configurations εχω παρατηρησει πως οταν κανεις copy ελληνικο κειμενο απο pdf ΦΕΚ και εχεις επιλεγμενο το ελληνικο πληκτρολογιο την στιγμη της αντιγραφης, ολα ειναι οκ με τα ελληνικα στο paste...
Δεν "πιανει" το κολπο ομως σε ολα τα pc configurations...

Intefix
Δημοσιεύσεις: 186
Εγγραφή: 22 Σεπ 2007 16:21
Τοποθεσία: Ηράκλειο Κρήτης
Επικοινωνία:

PDF to TEXT

Δημοσίευση από Intefix » 29 Ιουν 2009 09:32

korgr έγραψε:Εγω απλα θα προτεινω και μια μεθοδο ωστε να μπορεις να μετατρεπεις τα "κινεζικα" σε ελληνικα!
Απόδειξη, το κειμενο που μας εδωσες ειναι το:
Της παρ. 3 του άρθρου 222 του Π.Δ. 410/1995 «Δη-
μοτικός και Κοινοτικός Κώδικας»...
1. Κατεβάζεις το Notepad2 απο http://www.flos-freeware.ch/notepad2.html
2. Δηλώνεις σαν Default font την Verdana με Script Greek και default encoding utf-8
3. Δημιουργεις ενα νεο έγγραφο στο notepad2 και κανεις paste το κινεζικο κειμενο
4. Επιλεγεις File --> Encoding --> ANSI

...
Τα έκανα αυτά...αλλά όσο και αν προσπάθησα δεν τα κατάφερα.
οι ρυθμίσεις του notepad2
Συνημμένα
Notepad2.rar
Notepad2.ini
(3.9 KiB) Μεταφορτώθηκε 700 φορές

Άβαταρ μέλους
korgr
Honorary Member
Δημοσιεύσεις: 5067
Εγγραφή: 07 Οκτ 2008 18:30
Τοποθεσία: Corinth
Επικοινωνία:

PDF to TEXT

Δημοσίευση από korgr » 29 Ιουν 2009 10:09

Στο Control Panel σου στις ρυθμισεις γλωσσας, εχεις ορισει ελληνικα εκει που λεει default language for non-unicode programs?

Intefix
Δημοσιεύσεις: 186
Εγγραφή: 22 Σεπ 2007 16:21
Τοποθεσία: Ηράκλειο Κρήτης
Επικοινωνία:

PDF to TEXT

Δημοσίευση από Intefix » 06 Ιούλ 2009 09:16

korgr έγραψε:Στο Control Panel σου στις ρυθμισεις γλωσσας, εχεις ορισει ελληνικα εκει που λεει default language for non-unicode programs?
Έχω ελληνικά Win. Βέβαια έχει τα ελληνικά για non-unicode programs...
Ευχαριστώ για τη βοήθεια. Δώσε μια λύση γιατί ταχω παίξει...

Άβαταρ μέλους
korgr
Honorary Member
Δημοσιεύσεις: 5067
Εγγραφή: 07 Οκτ 2008 18:30
Τοποθεσία: Corinth
Επικοινωνία:

PDF to TEXT

Δημοσίευση από korgr » 06 Ιούλ 2009 10:48

Το κολπακι αυτο μου δουλευε μια χαρα σε win xp pro αγγλικα με τις ρυθμισεις που σου ειπα.
Οταν εβαλα Win 7 Ultimate αγγλικα, ειδα πως το κολπακι δεν επιανε...μεχρι που αλλαξα αυτη τη ρυθμιση σε ελληνικα (για τα non-unicode programs) και ολα δουλεψαν ξανα ρολοϊ. Γι' αυτο στο προτεινα. Μαλλον θα παιζουν κι αλλοι παραμετροι ρολο :roll:

Άβαταρ μέλους
Hermeia
Honorary Member
Δημοσιεύσεις: 987
Εγγραφή: 02 Αύγ 2004 00:14
Τοποθεσία: Αθήνα
Επικοινωνία:

PDF to TEXT

Δημοσίευση από Hermeia » 06 Ιούλ 2009 20:56

οπως λει ο korgr
και με το OpenOffice.

Τα βασικά συστατικά που χρειάζεσαι είναι
1. ένα πρόγραμμα που να υποστηρίζει εναλλακτικές κωδικοσελίδες (πχ notepad2 ή OpenOffoce)
2. επιλεγμένη ελληνική κωδικοσελίδα στις προκαθορισμένες του προγράμματος (και του συστήματος/λειτουργικού) - εναλλακτικά το πρόγραμμα να υποστηρίζει να αλλάξεις κωδικοσελίδα ή να την έχεις βάλει στο νεο/αδειο έγγραφο πριν την επικόληση
3. μετά την επικόληση, αν βλέπεις παπάκια, διαλέγεις το κείμενο και διαλέγεις μια γραμματοσειρά που σίγουρα υποστηρίζει ελληνικά.

με τις υγείες σου
Hermeia the InfoSharer
Η Γνώση είναι Δύναμη
Εικόνα

Intefix
Δημοσιεύσεις: 186
Εγγραφή: 22 Σεπ 2007 16:21
Τοποθεσία: Ηράκλειο Κρήτης
Επικοινωνία:

PDF to TEXT

Δημοσίευση από Intefix » 23 Σεπ 2009 08:56

Ρε παιδια προσπάθησα με όλα τα παραπάνω...Έχω και OpenOffice και Acrobat pro Κλπ.
Πως διάολο το κάνω γιατι με έχει πηδήξει στο OCR...

πάρτε ένα μικρό και πες τε μου τι να κάνω....
Συνημμένα
1224-2009.pdf
1224
(193.18 KiB) Μεταφορτώθηκε 602 φορές

aris1987
Δημοσιεύσεις: 1
Εγγραφή: 22 Ιαν 2012 14:23

PDF to TEXT

Δημοσίευση από aris1987 » 22 Ιαν 2012 14:30

Παιδιά αντιμετώπιζω και γω ένα παρόμοιο πρόβλημα .βασικα κανω μετατροπη τα PDF που εχω σε txt με το PDF to text μου.Σε 10 απο 13 PDF τα εχειμετατρεψειολα κομπλε.Ομως στα υπόλοιπα 3 μου βγάζει μεν ελληνικά αλλα όχι ακριβώς πχ τη λέξη περιβάλλον τη βγάζει σεριβαλλον ,αποθεσεων αποκζσεων
Εχω το notepad 2 και έκανα αυτές τις ρυθμισεις αλλα δεν έλυσαν το πρόβλημα ,ξέρει κανεις τι μπορεί να φταει?

Απάντηση

Επιστροφή στο “Windows Software Guide”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 0 επισκέπτες