Τι charset να βάλω;

Ερωτήσεις και απαντήσεις σχετικές με την HTML, XHTML και την κατασκευή σελίδων για το Web.

Συντονιστές: WebDev Moderators, Super-Moderators

Απάντηση
Evi_J
Δημοσιεύσεις: 84
Εγγραφή: 08 Αύγ 2006 09:10

Τι charset να βάλω;

Δημοσίευση από Evi_J » 03 Νοέμ 2006 16:51

Αν θέλω να φτιάξω μια σελίδα π.χ στα αγγλικά, στα ελληνικά, στα.... αραβικά, στα... κινέζικα και ξέρω γω σε όποια άλλη κουφή γλώσσα θέλω, πως γίνεται όλοι να την βλέπουν στην γλώσσα τους; Τι encoding θα βάλω; Ένα ελληνικό, ένα αραβικό κ.τ.λ; Ποιο από όλα θα "πιάσει"; Δηλ θα πιάσει για την αντίστοιχη σελίδα; Αν π.χ βάλω ελληνικό θα το βλέπουν οι έλληνες ή οι κινέζοι οι οποίοι θα βλέπουν (γι' αυτούς) αλαμπουρνέζικα;;

Ο λόγος που ρωτάω ήταν επειδή κάποιος μου είπε ότι το unicode δημιουργεί προβλήματα στο Mac δηλ σε ορισμένους browsers. Αν λοιπόν δεν βάλω unicode μπορώ να βάλω ένα για την κάθε γλώσσα; Είναι πολλά; Θα γίνει μπέρδεμα; Αν ναι τι σοϊ μπέρδεμα;

Άβαταρ μέλους
cherouvim
Script Master
Δημοσιεύσεις: 3137
Εγγραφή: 13 Ιούλ 2005 22:56
Τοποθεσία: Athens, Greece
Επικοινωνία:

Τι charset να βάλω;

Δημοσίευση από cherouvim » 03 Νοέμ 2006 17:08

UTF-8


υ.γ Δεν καλύπτει κινέζικα που θέλουν UTF-16

Άβαταρ μέλους
skeftomilos
Script Master
Δημοσιεύσεις: 2888
Εγγραφή: 07 Ιαν 2005 07:22
Τοποθεσία: Αθήνα

Τι charset να βάλω;

Δημοσίευση από skeftomilos » 03 Νοέμ 2006 19:12

Αν δεν κάνω λάθος το UTF-8 μπορεί κωδικοποιήσει κάθε γράμμα κάθε αλφαβήτου. Του το επιτρέπει το μεταβλητό πλήθος bytes ανά χαρακτήρα.
The pure and simple truth is rarely pure and never simple. Ο μη νους δε σκέπτεται μη σκέψεις για το τίποτα.

Άβαταρ μέλους
alkisg
Δημοσιεύσεις: 265
Εγγραφή: 03 Ιουν 2005 11:53
Τοποθεσία: Ιωάννινα
Επικοινωνία:

Τι charset να βάλω;

Δημοσίευση από alkisg » 03 Νοέμ 2006 23:25

Μπορείς να βάλεις οποιοδήποτε encoding θες. Με άλλα λόγια, μπορείς να γράψεις κινέζικα σε windows-1253 (ελληνική) σελίδα.
Όποιοι χαρακτήρες δεν αναπαριστώνται με το encoding που διάλεξες, θα πρέπει να γράφονται σαν &# 1234;
Το μειονέκτημα είναι ότι έτσι ένας χαρακτήρας χρειάζεται 5-8 bytes, ενώ αν χρησιμοποιούσες π.χ. UTF-16 θα χρειαζόταν ας πούμε 2 bytes.

Το UTF-8 και το UTF-16 καλύπτουν και τα δύο πλήρως το Unicode πρότυπο, δηλαδή μπορούν να αναπαραστήσουν οποιονδήποτε χαρακτήρα χωρίς να χρειάζεται να γραφεί σαν &# 1234;
Και τα δύο είναι μεταβλητού πλάτους, δηλαδή ένας χαρακτήρας μπορεί να είναι 2, 3, 4 κτλ bytes.
Μη μεταβλητού πλάτους που να περιλαμβάνει όλους τους χαρακτήρες είναι μόνο το UCS-4, αλλά χρειάζεται 4 bytes ανά χαρακτήρα και είναι ασύμφορο.

Με δυο λόγια, το UTF-8 είναι το καλύτερο για πολυγλωσσικές σελίδες.

Evi_J
Δημοσιεύσεις: 84
Εγγραφή: 08 Αύγ 2006 09:10

Τι charset να βάλω;

Δημοσίευση από Evi_J » 04 Νοέμ 2006 13:13

cherouvim
Δηλ μπορώ να βάλω και τα ΔΥΟ (ή περισσότερα) στο ίδιο html document; Π.χ:
<html>
<head>
encoding πρώτο
encoding δεύτερο
encoding τρίτο

μπλα, μπλα άλλοι κώδικες
</head>

<body></body>
</html>

skeftomilos
Όταν λες "πλήθος bytes"; Που είναι αυτά τα bytes; Στο html document; Δηλ με αυτά θα κάνει ποιο πολύ ώρα να φορτωθεί μια σελίδα;


alkisg
Όταν λες "θα πρέπει να γράφονται σαν &# 1234;".... που θα τα βρω αυτά τα &#1234; Σε τι οφείλονται οι αριθμοί; Δηλ θα γράφω παράδειγμα &#1234, &#5678, κ.τ.λ;;

Άβαταρ μέλους
cherouvim
Script Master
Δημοσιεύσεις: 3137
Εγγραφή: 13 Ιούλ 2005 22:56
Τοποθεσία: Athens, Greece
Επικοινωνία:

Τι charset να βάλω;

Δημοσίευση από cherouvim » 04 Νοέμ 2006 13:24

Το κάθε document έχει ένα encoding. Βάλε UTF-8 που προφανώς καλύπτει τα πάντα.

Για να δεις το μέγεθος μιας σελίδας (σε bytes) κάνε δεξί click και view page info (στον firefox). Στο General tab θα δεις το Size: 10,67 KB (10.930 bytes)

Άβαταρ μέλους
alkisg
Δημοσιεύσεις: 265
Εγγραφή: 03 Ιουν 2005 11:53
Τοποθεσία: Ιωάννινα
Επικοινωνία:

Τι charset να βάλω;

Δημοσίευση από alkisg » 04 Νοέμ 2006 19:43

Τη μετατροπή από χαρακτήρες σε &#1234 την κάνει υποτίθεται μόνος του ο html editor που έχεις, π.χ. frontpage.
Για παράδειγμα, το freestuff χρησιμοποιεί iso-8859-7 και χρειάζεται μόνο ένα byte ανά ελληνικό χαρακτήρα. Αν τώρα που απαντάω γράψω κινέζικα,
&#20223;&#20225;&#20226;
το κουτί "Γρήγορη απάντηση" που γράφω τα μετατρέπει αυτόματα στα αντίστοιχα &#1234 νούμερα. Δες προβολή->προέλευση για να δεις τη μετατροπή.
Αν θες από περιέργεια να δεις την αντιστοίχηση γραμμάτων σε νούμερα, κάνε έναρξη->εκτέλεση->charmap.

Άβαταρ μέλους
Croc
Δημοσιεύσεις: 105
Εγγραφή: 18 Μαρ 2006 22:40
Τοποθεσία: Volos
Επικοινωνία:

Τι charset να βάλω;

Δημοσίευση από Croc » 08 Νοέμ 2006 01:37

παιδια εχω ενα php shoutbox και δεν μπορω να γραψω ελληνικα...μηπως φταει το encode γι αυτο?

Δηλαδαη γραφω αλλα οταν κανω ποστ βγαζει αλλαμπορνεζικα.
Μπορειτε να μου πειτε τι encode να βαλω?Λογικα εχει (utf-8 αλλα τα ελληνικα δν τα βλεπω)
Πρεπει να βαλω το iso-8859-7 ???
ευχαριστω

η εντολη αλλαζει απο html σε php?
H ειναι ιδια?Εαν ναι ποια ειναι αυτη.

Άβαταρ μέλους
tsiger
Honorary Member
Δημοσιεύσεις: 1431
Εγγραφή: 11 Νοέμ 2002 13:40
Τοποθεσία: Thessaloniki Observation Center
Επικοινωνία:

Τι charset να βάλω;

Δημοσίευση από tsiger » 08 Νοέμ 2006 11:21

Διαβασε αυτη τη συζητηση:

http://forums.devnetwork.net/viewtopic. ... e973696151

Βγαινουν αρκετα χρησιμα συμπερασματα για τη χρηση utf8 :)

Απάντηση

Επιστροφή στο “HTML και XHTML”

Μέλη σε σύνδεση

Μέλη σε αυτήν τη Δ. Συζήτηση: Δεν υπάρχουν εγγεγραμμένα μέλη και 1 επισκέπτης