Εύρεση επικεφαλίδων σε site

Σε αυτή την περιοχή μπορείτε να βρείτε ή να αναζητήσετε πληροφορίες σχετικές με την PHP

Συντονιστές: WebDev Moderators, Super-Moderators, PHP Moderators

Απάντηση
prokopios
Δημοσιεύσεις: 155
Εγγραφή: 17 Φεβ 2006 15:47

Εύρεση επικεφαλίδων σε site

Δημοσίευση από prokopios » 23 Σεπ 2008 19:31

Γεια σας,
έχω φτιάξει έναν κώδικα που παίρνει τις επικεφαλίδες από τον πηγαίο κώδικα μιας σελίδας και τις αποθηκεύει σε μια βάση δεδομένων.

Αλλά δυστυχώς δε μου δουλεύει καλά. Για παράδειγμα το δοκιμάζω στο site του contra και μου εμφανίζει μόνο 2 επικεφαλίδες τύπου <h1> ενώ υπάρχουν και άλλες τύπου <h4>.

Σας επισυνάπτω τον κώδικα!
Μήπως καταλάβετε τι συμβαίνει . .

Ευχαριστώ πολύ
Συνημμένα
project.rar
(1.38 KiB) Μεταφορτώθηκε 346 φορές
ΑΥΤΑ!!!

Άβαταρ μέλους
soteres2002
S. & H. Moderator
Δημοσιεύσεις: 1524
Εγγραφή: 05 Μαρ 2004 22:17
Τοποθεσία: Ιωάννινα

Εύρεση επικεφαλίδων σε site

Δημοσίευση από soteres2002 » 24 Σεπ 2008 13:13

Βασικά, κάνεις παντού σε όλο τον κώδικα το ίδιο πράγμα για να κάνεις match όλα τα <h{number}> tags. Γιατί δεν κάνεις ένα regular expression να τα κάνεις όλα match μια και καλή (το έχεις μάλιστα και σε σχόλιο); Το μόνο που χρειάζεσαι είναι να τροποποιήσεις το regexp στο σημείο μετά το h βάζοντας "([1-6]?)". Μετά μπορείς να κάνεις local processing τα matches και να τα κατηγοριοποιήσεις ανάλογα με το νούμερο που έχει δίπλα του το header tag αφού το "είδος" της επικεφαλίδας θα μπει σε buffer.

prokopios
Δημοσιεύσεις: 155
Εγγραφή: 17 Φεβ 2006 15:47

Εύρεση επικεφαλίδων σε site

Δημοσίευση από prokopios » 25 Σεπ 2008 14:06

Το ξέρω ότι κάνω συνεχώς το ίδιο πράγμα, αλλά δε καταλαβαίνω πως μπορώ να αποθηκεύσω τον τύπο επικεφαλίδας στη βάση.

Μπορεί κανείς να με βοηθήσει να το φτιάξω ??

Ευχαριστώ
ΑΥΤΑ!!!

Άβαταρ μέλους
MaZz
Script Master
Δημοσιεύσεις: 345
Εγγραφή: 20 Ιούλ 2005 19:41
Τοποθεσία: Beyond the dark sun
Επικοινωνία:

Εύρεση επικεφαλίδων σε site

Δημοσίευση από MaZz » 25 Σεπ 2008 19:58

το regex pattern θα έχει αυτή τη μορφή: /h[1-6]/i
full doc με παραδείγματα εδώ
If nothing in the world can change our children will inherit nothing.

Άβαταρ μέλους
Basilakis
PHP Moderator
Δημοσιεύσεις: 8574
Εγγραφή: 17 Νοέμ 2003 13:03
Τοποθεσία: Womans' Brain
Επικοινωνία:

Εύρεση επικεφαλίδων σε site

Δημοσίευση από Basilakis » 25 Σεπ 2008 20:12

checkare to feedboil Που είχα κάνει για το football247.gr... Διάβαζε τις επικεφαλίδες το text και κάποια ακόμη πεδεία μέσα απο την σελίδα και τα αποθήκευε σε xml files (έφτιαχνε RSS feeds) μπορεί να σε βοηθήσει η δομή και ο τρόπος
Συνημμένα
feedboil.rar
(3.99 KiB) Μεταφορτώθηκε 371 φορές

Απάντηση

Επιστροφή στο “PHP Προγραμματισμός”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 0 επισκέπτες