Anazhthsh xwris regexes ?

Σε αυτή την περιοχή μπορείτε να βρείτε ή να αναζητήσετε πληροφορίες σχετικές με την PHP

Συντονιστές: WebDev Moderators, Super-Moderators, PHP Moderators

Απάντηση
silo
Δημοσιεύσεις: 66
Εγγραφή: 22 Οκτ 2006 14:20

Anazhthsh xwris regexes ?

Δημοσίευση από silo » 18 Νοέμ 2007 21:36

Hello,

Pws mporw na kanw search se ena html arxeio H se ena opoiodhpote arxeio gia ena string xwris na xrhsimopoihsw regex. To rwtaw auto gt ta regex einai baria gia to cpu. Kai 8elw na ma8w an uparxei kapoio alternative .

Άβαταρ μέλους
dik_
Δημοσιεύσεις: 476
Εγγραφή: 07 Ιουν 2007 11:28

Anazhthsh xwris regexes ?

Δημοσίευση από dik_ » 19 Νοέμ 2007 01:10

Ανάλογα τι ψάχνεις... ίσως με την str_pos().

Άβαταρ μέλους
soteres2002
S. & H. Moderator
Δημοσιεύσεις: 1524
Εγγραφή: 05 Μαρ 2004 22:17
Τοποθεσία: Ιωάννινα

Anazhthsh xwris regexes ?

Δημοσίευση από soteres2002 » 19 Νοέμ 2007 03:12

me to na apothikeuseis text data i alles HTML perioxes tou kodika sou tis opoies theoreis eksarxis searchable se mia database, tha epitaxineis tin diadikasia tis anazitisis kai tha mioseis to kostos se CPU. auto se antithesi me to na psaxneis sto filesystem kai na kaneis regex search.

silo
Δημοσιεύσεις: 66
Εγγραφή: 22 Οκτ 2006 14:20

Anazhthsh xwris regexes ?

Δημοσίευση από silo » 19 Νοέμ 2007 14:32

DB den pisteuw pws einai lush dld otan prepei na kanw extract kapoia tags html dn 8a boh8hsei. 8a dokimasw tn str_pos() kai ta diafora str :)

Άβαταρ μέλους
soteres2002
S. & H. Moderator
Δημοσιεύσεις: 1524
Εγγραφή: 05 Μαρ 2004 22:17
Τοποθεσία: Ιωάννινα

Anazhthsh xwris regexes ?

Δημοσίευση από soteres2002 » 19 Νοέμ 2007 18:00

pistebo pos einai kalitero na psaxneis me kapoia texniki meso mias database, para na fortoneis tin mnimi me strstr ktl. fantasou dld na einai kana ogodestato HTML arxeio ti exei na ginei... episis, akoma kai an o ogkos tou kodika HTML einai mikros, borei to "parsing" pou tha kaneis na min einai eparkes kai na exeis anapantexi simperifora. akoma ki an kaneis search pio eksipna, anazitontas mono se sigekrimena nodes tou DOM, tha xaseis adika xrono CPU -- kai pithanon xristes tis efarmogis sou. gia auto kalitera na ginetai mia kai kali ena ksekatharisma tou content kai na apothikeuetai gia reuse se mia database.

Άβαταρ μέλους
soteres2002
S. & H. Moderator
Δημοσιεύσεις: 1524
Εγγραφή: 05 Μαρ 2004 22:17
Τοποθεσία: Ιωάννινα

Anazhthsh xwris regexes ?

Δημοσίευση από soteres2002 » 19 Νοέμ 2007 18:10

pantos kalitera tha itan na afines oli autin tin diadikasia se ena indexing service opos to swishe i to xapian, kai meta na kaneis queries se auto to index meso tou interface tou swishe i tou xapian antistoixa. to indexing ginetai meso cron job kathe px 3 meres i mia bdomada, analoga me ton ogko ton dedomenon. kai pio epaggelmatika tha kaneis tin doulia sou, kai me perissoteri asfalia apo liseis tipou regex/str*.

Des to: http://www.xapian.org kai http://www.swishe-e.org/ (sou sinisto to proto, ontas pio robust). ta dio auta indexing engines xrisimopoiountai apo sites me indexes pollon GiBs. An boreis na egatastiseis to xapian lib stin PHP sou, exo kai plires sample code diko mou na sou doso me pagination ktl.
Xapian is an Open Source Search Engine Library, released under the GPL. It's written in C++, with bindings to allow use from Perl, Python, PHP, Java, Tcl, C# and Ruby (so far!)

Xapian is a highly adaptable toolkit which allows developers to easily add advanced indexing and search facilities to their own applications. It supports the Probabilistic Information Retrieval model and also supports a rich set of boolean query operators.

If you're after a packaged search engine for your website, you should take a look at Omega: an application we supply built upon Xapian. Unlike most other website search solutions, Xapian's versatility allows you to extend Omega to meet your needs as they grow.
poy
t supports the Probabilistic Information Retrieval model and also supports a rich set of boolean query operators.
kai pou o bakalis regexp/str* functions.

fantazomai pos tin anazitisi tha itheles na tin kaneis se pollapla HTML documents.

silo
Δημοσιεύσεις: 66
Εγγραφή: 22 Οκτ 2006 14:20

Anazhthsh xwris regexes ?

Δημοσίευση από silo » 20 Νοέμ 2007 13:46

Idio dn einai ? ti na xrhsimopoihsw regex ti na balw ena module parapanw sthn php. Exw ftiaksei ena megalo meros tou crawler, sundeseis me DB admin panel kai kolhsa se auto twra, dn kserw poso me sumferei to xapian H to swish-e. 8a dw omws an den mporw na to ftiaksw 8a katafugw se auta pou proteineis.

Άβαταρ μέλους
soteres2002
S. & H. Moderator
Δημοσιεύσεις: 1524
Εγγραφή: 05 Μαρ 2004 22:17
Τοποθεσία: Ιωάννινα

Anazhthsh xwris regexes ?

Δημοσίευση από soteres2002 » 20 Νοέμ 2007 16:27

an se bolebei auto p kaneis kai doulebei apodotika tote ok. omos to xapian kanei indexing kai einai grigoro, opote an exeis perissoteres anagkes kai theleis taxitita tote dokimase to Xapian. Alla an kai pali den exeis dikaiomata na fortoseis diko s module, tote mine kai pali se autin tin lisi. ur choice!

Απάντηση

Επιστροφή στο “PHP Προγραμματισμός”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 2 επισκέπτες