Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Τεχνολογικά Θέματα, Νέα και Ειδήσεις. Θέματα προς συζήτηση.

Συντονιστές: Super-Moderators, Reporters

Απάντηση
Άβαταρ μέλους
dimsis
Reporter
Δημοσιεύσεις: 7994
Εγγραφή: 25 Ιούλ 2001 03:00

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από dimsis » 31 Ιαν 2011 21:06

Οι αλλαγές αυτές έγιναν ως απάντηση στην αυξανόμενη κριτική κατά της Google σχετικά με τα αποτελεσμάτα αναζήτησης της μηχανής. Η κριτική εν μέρει έχει προέλθει από την εμφάνιση νεότερων μορφών webspam παράλληλα με το παραδοσιακό webspam (σελίδες που αποτελούνται από πολλές λέξεις-κλειδιά και φράσεις χωρίς συνάφεια ή γενικότερα "εξαπάτηση" με σκοπό την άνοδο στις υψηλότερες βαθμίδες των αποτελεσμάτων αναζήτησης).

Οι τελευταίες εστίες webspam συνήθως προέρχονται από τα λεγόμενα content farms και τοποθεσίες που αναπαράγουν περιεχόμενο (syndication sites). Νωρίτερα αυτό το μήνα, ο Jeff Atwood του Stack Overflow επεσήμανε ότι κατά το τελευταίο έτος, μερικοί από τους αναπαραγωγείς του περιεχόμενου τους έβγαιναν υψηλότερα στα αποτελέσματα ακόμα και από το ίδιο το site. Με άλλα λόγια, τα κέντρα αναπαραγωγής περιεχομένου υπερέχουν των πρωτοτύπων.

Στην περίπτωση του Stack Overflow, το πρόβλημα ήταν τόσο μεγάλο που οδήγησε ένα μέλος της κοινότητας να γράψει μια επέκταση για το Google Chrome που είχε ως σκοπό να ανακατευθύνει στο Stack Overflow όταν αναγνώριζε πως γινόταν αναπαραγωγή από τρίτα syndicate sites.

Ο Matt Cutts, μηχανικός της Google και επικεφαλής της ομάδας για το webspam, απάντησε σε ορισμένες από τις επικρίσεις σε ένα blog post του και είπε πως η Google θα "δρομολογήσει πολλαπλές αλλαγές που θα μειώσουν τα επίπεδα του spam ακόμα χαμηλότερα, μεταξύ των οποίων μία αλλαγή που επηρεάζει κυρίως τα sites που αντιγράφουν περιεχόμενο από άλλους και τους τόπους με ελάχιστο πρωτότυπο περιεχόμενο." Στο προσωπικό του blog, ο Cutts επιβεβαίωσε ότι οι αλλαγές αυτές έχουν όντως αρχίσει να ισχύουν.

Ο Cutts γράφει ότι αυτό ήταν μια "αρκετά στοχευμένη έναρξη" και ότι "το τελικό αποτέλεσμα για όσους χρησιμοποιούν την μηχανή αναζήτησης της google, θα είναι να βλέπουν περισσότερο τα websites περιοχές που έγραψαν το αρχικό περιεχόμενο και όχι τα sites που αντέγραψαν ή υπέκλεψαν το περιεχόμενο της αρχικής τοποθεσίας".

Πηγή άρθρου: log.gr, Μετάφραση από mashable.com, διαβάστε σχετικό άρθρο και στο wired

Άβαταρ μέλους
adiaforosgr
Δημοσιεύσεις: 1339
Εγγραφή: 19 Ιούλ 2004 17:52
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από adiaforosgr » 31 Ιαν 2011 21:43

Καιρός ήταν, θάνατος στους copypasters.

mijalis
Δημοσιεύσεις: 13
Εγγραφή: 27 Νοέμ 2009 12:21

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από mijalis » 01 Φεβ 2011 16:18

Και πως βρίσκει άραγε ποιο είναι το πρωτότυπο? Από την ώρα;
Αν το έχουν αλλάξει λίγο; μου φαίνεται πολύ δύσκολο...

Άβαταρ μέλους
dimsis
Reporter
Δημοσιεύσεις: 7994
Εγγραφή: 25 Ιούλ 2001 03:00

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από dimsis » 01 Φεβ 2011 17:07

Και εγώ αυτό σκεφτόμουν... ότι ίσως τσεκάρει την ώρα που το έκανε index η ίδια η google, αλλά και πάλι δεν στέκει γιατί βάση του δικού της αλγόριθμου μπορεί να επισκέπτεται πολύ πιο συχνά το site που έχει κάνει την αντιγραφή από το άλλο που είχε το πρωτότυπο και να θάψει το πρωτότυπο....
Αν πάλι ελέγχει καταχωρημένες ημερομηνίες στα ίδια τα άρθρα που επισκέπτεται, εκεί είναι που θα δούμε αλχημείες του στυλ το site που αντέγραψε να παρουσιάζει παλιότερη ημερομηνία από το original...

Και έχει και τα sites που αναδημοσιεύουν αλλά βάζουν πηγή το site από όπου το πήραν. Αυτό θα υπολογίζεται; θα ανιχνεύεται;

Ερωτήματα που θα μείνουν αναπάντητα αφού δεν νομίζω πως η google θα ανακοινώσει τι ακριβώς κάνει, γιατί αν το έκανε θα έδινε και την λύση στους αντιγραφείς και στους spammers να το "αντιμετωπίσουν".

Ότι τεχνικές κυκλοφορούν για έλεγχο του plagiarism μου φαίνεται θα ξεσηκώσουν :)

Σίγουρα θα παίξουν πολλά κριτήρια ρόλο και κάτι μου λέει πως σε κάποιες περιπτώσεις θα πέφτει και ανθρώπινος έλεγχος...

mantech
Δημοσιεύσεις: 3
Εγγραφή: 10 Ιουν 2010 14:35
Τοποθεσία: Thessaloniki
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από mantech » 01 Φεβ 2011 17:32

Θάνατος! Έχω μπουχτήσει πιά από τα copy paste άρθρων και δελτίων τύπου. Εκεί που το δελτίο τύπου ήταν απλά ενημερωτικό, τώρα έχει πάρει τη μορφή ενός -φρουφρου κι αρώματα- άρθρου επειδή όλοι το κάνουν copy paste

Άβαταρ μέλους
dimsis
Reporter
Δημοσιεύσεις: 7994
Εγγραφή: 25 Ιούλ 2001 03:00

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από dimsis » 01 Φεβ 2011 17:43

Οι copy pasters αυξήθηκαν ραγδαία από την εποχή που άρχισε η google μέσω του adsense να μοιράζει λεφτά και στην Ελλάδα... και εκεί που κάποτε ΕΙΔΙΚΑ το να έχεις blog σήμαινε πως γράφεις τις δικές σου απόψεις, γνώμη, έκφραση, μετετράπησαν σε ενημερωτικά - δημοσιογραφικά sites και πολλά κατάντησαν να είναι το ίδιο άθλια σε ποιότητα με αυτά της ελληνικής trash tv.

Άβαταρ μέλους
apsuh0s
Script Master
Δημοσιεύσεις: 410
Εγγραφή: 01 Νοέμ 2005 21:38
Τοποθεσία: Ηράκλειο
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από apsuh0s » 01 Φεβ 2011 19:04

Συμπερασματικά, κάθε δουλειά της οποίας αυτοσκοπός είναι το χρήμα είναι αναγκαστικά χαμηλού επιπέδου. Μια προσπάθεια που κατορθώθηκε με κόπο και ιδρώτα και συνεχίζει να στηρίζεται με κόπο και ιδρώτα σίγουρα θα αναδειχθεί.

Πραγματικά, έχω μεγάλη περιέργεια να δω, τι συνέπειες θα έχει όλο αυτό στα ελληνικά ενημερωτικά(?) blogs.. Να δω μετά που θα φτάσει η τιμή του ctrl+c και ctrl+v από την εξωφρενική τιμή των 99 λεπτών την μέρα που είναι σήμερα..
.ninja { color: black; visibility: hidden !important; }

Άβαταρ μέλους
Yiannistaos
Δημοσιεύσεις: 140
Εγγραφή: 10 Οκτ 2007 21:01
Τοποθεσία: Λεμεσός
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από Yiannistaos » 01 Φεβ 2011 22:17

Καιρός δεν ήταν; Θα ανέβουν οι καλοί και θα πέσουν οι κακοί. Δίκαια πράγματα, μπράβο στην Google.
web357.eu - Free & Premium Joomla! Extensions

Άβαταρ μέλους
Figaro
Honorary Member
Δημοσιεύσεις: 2706
Εγγραφή: 08 Φεβ 2004 19:48

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από Figaro » 01 Φεβ 2011 22:51

Πολλες σελίδες που γέμιζουν με content --> copy/paste .. έχουν γίνει πιο δημοφιλείς απο τις σελίδες που παίρνουν το content.

Εγω πάντως δε βιάζομαι να πώ.. "καιρός ήταν" αν δεν μάθουμε τα κριτήρια.

Άβαταρ μέλους
Geobak
SEM Moderator
Δημοσιεύσεις: 736
Εγγραφή: 03 Ιουν 2008 19:04
Τοποθεσία: Athens,Greece
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από Geobak » 01 Φεβ 2011 23:24

To ehow.com είναι απο τις μεγαλύτερες content farms.



Για να δούμε. Θα το φάει το google slap?

Άβαταρ μέλους
EneMe
Super Moderator
Δημοσιεύσεις: 13307
Εγγραφή: 09 Ιούλ 2002 13:29
Τοποθεσία: Στο κέντρο της Ελλάδας!
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από EneMe » 02 Φεβ 2011 01:23

Εγώ που έχω συνεργασία με ηλεκτρονική έκδοση μεγάλης εφημερίδας και αλληλοαντιγραφόμαστε??

Άβαταρ μέλους
dimsis
Reporter
Δημοσιεύσεις: 7994
Εγγραφή: 25 Ιούλ 2001 03:00

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από dimsis » 02 Φεβ 2011 09:29

Το ehow αντιγράφει από όπου να'ναι χωρίς την άδεια των συγγραφέων;

EneMe είναι πάρα πολλές αυτές οι "νόμιμες" περιπτώσεις. Για παράδειγμα και εγώ κάποια κείμενα από το log τα αναδημοσιεύω και εδώ με αναφορά πηγής. Το ίδιο και με το apn.gr .

Άλλο παράδειγμα, το e-thraki έχει συνεργασία με το Πρώτο Θέμα, όπως και αρκετά άλλα επαρχιακά sites και αναδημοσιεύουν μεταξύ τους άρθρα.

Άλλο παράδειγμα τα δελτία τύπου που στέλνονται μαζικώς σε πολλά ειδησεογραφικά sites και δημοσιεύονται σε πολλά sites ταυτόχρονα και αυτούσια.

Πως θα καταφέρει με αλγόριθμους και αυτοματοποιημένα να κάνει δίκαιο διαχωρισμό τέτοιων περιπτώσεων η google, από αυτών που αντιγράφουν χωρίς καμία άδεια θα ήθελα πολύ να το ξέρω...

Για εμένα το "ζουμί" της είδησης είναι πως παρόλο που διάφοροι προσπαθούν να μας πείσουν ότι η google δεν έχει πρόβλημα με τις διάφορες μαρκετίστικες τεχνικές που χρησιμοποιούνται και επηρεάζουν τα αποτελέσματα αναζήτησης, αποδεικνύεται το αντίθετο ότι και την ίδια την απασχολεί, αλλά και ότι πολλοί χρήστες του web έχουν πρόβλημα με την όλη κατάσταση. Και ότι πλέον στα μάτια πολλών ανθρώπων το moto της google "do no evil" δείχνει ολοένα και πιο σαθρό...

Διαβάστε και αυτό:
http://www.businessinsider.com/bing-eng ... pam-2011-2
όπου περιληπτικά η Microsoft κατηγορεί την Google, ότι κερδίζουν από το Search Spam.
Shum basically accused Google of playing both sides of the spam game -- on one hand, Google wants to make its search site as useful as possible so users don't turn to alternatives. On the other hand, a lot of spam sites make their money by running ads provided by Google, from which Google takes a cut. As Shum put it:

I'd say you are really sidestepping the big problems, the origin of the spam, why they appeared in the first place. There must be an economic incentive to create his kind of content. Why? 70% of those pages show Google Ads....You can't just say because you don't report to VP of ad sales you have no problem.
και προσέξτε και τι απάντησε ο Matt Cutts της google:
Cutts said that Google monitors spam regardless of whether sites use Google Ads or not, and when it kicks a site out of Google's search results it also removes it from the advertising program. He also noted that sites have other economic incentives to try and game search results -- porn and casino sites, for example, pay a bounty to third-party sites who guide users to them.

Cutts also noted that Google values long-term loyalty over short-term gain, pointing to the search engine's refusal in the early 2000s to use paid inclusion -- where sites could actually pay to be included in algorithmic search results -- when competitors like Microsoft and Yahoo were happy to do so.
να το έχουμε λοιπόν στα υπόψη, πως αν ένα site ορθώς ή λανθασμένα διαγνωστεί από την google πως σπαμάρει τα αποτελέσματα, ας ξεχάσει έπειτα και τις διαφημίσεις μέσω adsense...


later edit: "Συμμάζεψα" λίγο τις σκέψεις μου και τις έβαλα σε ένα άρθρο με τίτλο "Σχετικά με το πρόβλημα του search spam και των αλλαγών της google στον αλγόριθμο της"

Άβαταρ μέλους
EneMe
Super Moderator
Δημοσιεύσεις: 13307
Εγγραφή: 09 Ιούλ 2002 13:29
Τοποθεσία: Στο κέντρο της Ελλάδας!
Επικοινωνία:

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από EneMe » 02 Φεβ 2011 18:35

Kι εγώ αναφέρομαι στο Πρώτο Θέμα, αλλά και σε κάποιες ακόμα ηλεκτρονικές εκδόσεις εφημερίδων και τηλεοπτικών σταθμών με σημαντική επισκεψιμότητα.

Δηλαδή το ορθότερο είναι να αναγράφεται το site-πηγή ή να υπάρχει και link?

Άβαταρ μέλους
dimsis
Reporter
Δημοσιεύσεις: 7994
Εγγραφή: 25 Ιούλ 2001 03:00

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από dimsis » 02 Φεβ 2011 19:01

Δεν έχω δει να έβγαλαν κάποιον "οδηγό" για το συγκεκριμένο θέμα, αλλά αν το δούμε λογικά τι κριτήρια θα μπορούσαν να περιλαμβάνονται για να γίνει ένας τέτοιος έλεγχος;

* Ημερομηνία που κάσαρε το άρθρο η google
* Ημερομηνία που γράφει (αν έχει) το άρθρο από όπου το βρήκε
* Πηγή με backlink
* Πλήθος δημοσιεύσεων που έχουν βρεθεί και σε άλλα sites. Αν δηλαδή σε ένα site βρει 9 στα 10 άρθρα που είναι αναδημοσιεύσεις πιστεύω θα είναι σε χειρότερη μοίρα από αυτά που έχουν 1 στα 20. (thanx CyberCr33p )
* Πλήθος backlinks προς το άρθρο και από που ποιότητα αυτών (αν δηλαδή ένα άρθρο έχει 20 backlinks, συγκριτικά με ένα που έχει 2 θα θεωρείτε πιο πιθανό αυτό με τα 20 να έχει το αυθεντικό)
* Έλεγχος μια στις τόσες και αν τύχει από προσωπικό της google (άνθρωπο)
Άλλα;

Αλλά εννοείται υποθέσεις κάνουμε εφόσον δεν πρόκειται να μάθουμε ποτέ πως ακριβώς τι θα ισχύει...

pimpogio
Δημοσιεύσεις: 1080
Εγγραφή: 28 Δεκ 2010 14:08

Η Google ενημέρωσε τον αλγόριθμο αναζήτησης της

Δημοσίευση από pimpogio » 02 Φεβ 2011 20:37

για το plagiarism εχουνε γραφτει πολυ προχωρημενοι αλγοριθμοι απο τις αρχες τις δεκαετιας του 90 στην αμερικη απο το stanford berkley ktlp.

Οι αλγοριθμοι αυτοι ειναι μυστικοι και αρχικα γραφτηκανε για να σταματησουνε οι αντιγραφες μεταξυ φοιτητων.
Ειναι τοσο προχωρημενοι και πολυπλοκοι που δεν κανουνε ελεγχο αντιγραφης λεξη λεξη αλλα κανουνε ελεγχο αντιγραφης στο νοημα του κειμενου και στον κωδικα κανουνε ελεγχο στην λογικη του.
Σε 2 πανεπιστημια στην ελλαδα εχουνε σχεδον παταξει τις αντιγραφες με λογισμικο που ερχετε απο αμερικανικα πανεπιστημια και βρισκει ολες τις αντιγραφες...

Απάντηση

Επιστροφή στο “Τεχνολογικά Θέματα, Νέα και Ειδήσεις”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 1 επισκέπτης