Skip to content

Commit

Permalink
Evolutions de charset.xml pour PostgreSQL 13.
Browse files Browse the repository at this point in the history
  • Loading branch information
dverite authored and gleu committed Oct 19, 2020
1 parent 4f8dc7a commit d7b69fe
Showing 1 changed file with 52 additions and 49 deletions.
101 changes: 52 additions & 49 deletions postgresql/charset.xml
Original file line number Diff line number Diff line change
Expand Up @@ -975,20 +975,22 @@ CREATE COLLATION ignore_accents (provider = icu, locale = 'und-u-ks-level1-kc-tr
d'Unicode et ses nombreux cas spécifiques, elles ont aussi quelques
inconvénients.
D'abord, leur utilisation génère une pénalité de performance.
Note, in particular, that B-tree cannot use
deduplication with indexes that use a nondeterministic collation. Also,
certain operations are not possible with nondeterministic collations,
such as pattern matching operations. Therefore, they should be used
only in cases where they are specifically wanted.
Il est à noter en particulier que le B-tree ne peut pas utiliser
la déduplication avec les index utilisant une collation non déterministe.
Par ailleurs, certaines opérations ne sont pas possibles avec des
collations non déterministes, comme la recherche par motif.
Par conséquent, elles devraient être utilisées uniquement dans les cas
où elles sont spécifiquement désirables.
</para>

<tip>
<para>
To deal with text in different Unicode normalization forms, it is also
an option to use the functions/expressions
<function>normalize</function> and <literal>is normalized</literal> to
preprocess or check the strings, instead of using nondeterministic
collations. There are different trade-offs for each approach.
Pour gérer du texte sous différentes formes de normalisation Unicode, il
est possible d'utiliser les fonctions ou expressions
<function>normalize</function> et <literal>is normalized</literal> pour
prétraiter ou contrôler les chaînes de caractères, au lieu d'utiliser des
collations non déterministes. Il y a des avantages et inconvénients différents
à chaque approche.
</para>
</tip>
</sect3>
Expand Down Expand Up @@ -1668,47 +1670,48 @@ by pg_wchar_table.mblen function for each encoding.
<para>
Si l'encodage client est défini en tant que <literal>SQL_ASCII</literal>,
la conversion de l'encodage est désactivée quelque soit celui du serveur.
(However, if the server's character set is not
<literal>SQL_ASCII</literal>, the server will still check that incoming
data is valid for that encoding; so the net effect is as though the
client character set were the same as the server's.) Comme pour le
serveur, <literal>SQL_ASCII</literal> est déconseillé sauf à ne
(Toutefois, si l'encodage serveur n'est pas
<literal>SQL_ASCII</literal>, le serveur testera toujours que les données
en entrée sont valides pour cet encodage; le résultat final est que c'est
comme si l'encodage client était le même que celui du serveur).
Comme pour le serveur, <literal>SQL_ASCII</literal> est déconseillé sauf à ne
travailler qu'avec des données ASCII.
</para>
</sect2>

<sect2 id="multibyte-conversions-supported">
<title>Available Character Set Conversions</title>
<title>Conversions disponibles entre jeux de caractères</title>

<para>
<productname>PostgreSQL</productname> allows conversion between any
two character sets for which a conversion function is listed in the
<link linkend="catalog-pg-conversion"><structname>pg_conversion</structname></link>
system catalog. <productname>PostgreSQL</productname> comes with
some predefined conversions, as summarized in
<xref linkend="multibyte-translation-table"/> and shown in more
detail in <xref linkend="builtin-conversions-table"/>. You can
create a new conversion using the SQL command
<xref linkend="sql-createconversion"/>. (To be used for automatic
client/server conversions, a conversion must be marked
as <quote>default</quote> for its character set pair.)
<productname>PostgreSQL</productname> permet les conversions entre deux
jeux de caractères quand une fonction de conversion est listée dans
le catalogue système
<link linkend="catalog-pg-conversion"><structname>pg_conversion</structname></link>.
<productname>PostgreSQL</productname> est fourni avec des conversions prédéfinies,
comme résumé dans
<xref linkend="multibyte-translation-table"/> et détaillé dans
<xref linkend="builtin-conversions-table"/>. On peut créer une nouvelle
conversion en utilisant la commande SQL
<xref linkend="sql-createconversion"/>. (Pour être utilisée pour les
conversions client/serveur automatiques, une conversion doit être marquée
en tant que <quote>default</quote> pour son couple de jeux de caractères).
</para>

<table id="multibyte-translation-table">
<title>Built-in Client/Server Character Set Conversions</title>
<title>Conversions client/serveur fournies de base pour les jeux de caractères</title>
<tgroup cols="2">
<colspec colname="col1" colwidth="1*"/>
<colspec colname="col2" colwidth="3*"/>
<thead>
<row>
<entry>Server Character Set</entry>
<entry>Available Client Character Sets</entry>
<entry>Jeux de caractères sur le serveur</entry>
<entry>Jeux de caractères disponibles sur le client</entry>
</row>
</thead>
<tbody>
<row>
<entry><literal>BIG5</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
Expand Down Expand Up @@ -1750,12 +1753,12 @@ by pg_wchar_table.mblen function for each encoding.
</row>
<row>
<entry><literal>GB18030</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
<entry><literal>GBK</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
Expand Down Expand Up @@ -1788,7 +1791,7 @@ by pg_wchar_table.mblen function for each encoding.
</row>
<row>
<entry><literal>JOHAB</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
Expand Down Expand Up @@ -1891,12 +1894,12 @@ by pg_wchar_table.mblen function for each encoding.
</row>
<row>
<entry><literal>SJIS</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
<entry><literal>SHIFT_JIS_2004</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
Expand All @@ -1906,12 +1909,12 @@ by pg_wchar_table.mblen function for each encoding.
</row>
<row>
<entry><literal>UHC</literal></entry>
<entry><emphasis>not supported as a server encoding</emphasis>
<entry><emphasis>non supporté comme encodage serveur</emphasis>
</entry>
</row>
<row>
<entry><literal>UTF8</literal></entry>
<entry><emphasis>all supported encodings</emphasis>
<entry><emphasis>tous les encodages supportés</emphasis>
</entry>
</row>
<row>
Expand Down Expand Up @@ -1995,28 +1998,28 @@ by pg_wchar_table.mblen function for each encoding.
</table>

<table id="builtin-conversions-table">
<title>All Built-in Character Set Conversions</title>
<title>Toutes les conversions fournies de base entre jeux de caractères</title>
<tgroup cols="3">
<colspec colname="col1" colwidth="2*"/>
<colspec colname="col2" colwidth="1*"/>
<colspec colname="col3" colwidth="1*"/>
<thead>
<row>
<entry>Conversion Name
<entry>Nom de la conversion
<footnote>
<para>
The conversion names follow a standard naming scheme: The
official name of the source encoding with all
non-alphanumeric characters replaced by underscores, followed
by <literal>_to_</literal>, followed by the similarly processed
destination encoding name. Therefore, these names sometimes
deviate from the customary encoding names shown in
<xref linkend="charset-table"/>.
Les noms des conversions suivent un standard de nommage&nbsp;:
Le nom officiel de l'encodage source dont tous les caractères
non alphanumériques sont remplacés par le caractère de soulignement,
suivi de <literal>_to_</literal>, suivi du nom de l'encodage
de destination transformé de la même manière.
Par conséquent, ces noms diffèrent parfois des noms d'encodage
montrés dans le <xref linkend="charset-table"/>.
</para>
</footnote>
</entry>
<entry>Source Encoding</entry>
<entry>Destination Encoding</entry>
<entry>Encodage source</entry>
<entry>Encodage de destination</entry>
</row>
</thead>

Expand Down

0 comments on commit d7b69fe

Please sign in to comment.