utf-8 жолы MySQL кестесінде Perl/DBI арқылы қысқартылады

Perl/DBI арқылы MySQL кестесіне utf-8 жолдарын жазуға тырысамын. Кез-келген себепке байланысты, жол ацистік емес бірінші таңбадан қиылады.

Мысалы, келесі кестені орнатсам:

CREATE DATABASE testdb DEFAULT CHARSET=utf8;
CREATE TABLE testdb.testtable (textval CHAR(30)) DEFAULT CHARSET=utf8;

Содан кейін келесі Perl кодын іске қосыңыз:

#!/usr/bin/perl
use strict;
use DBI;
my $dbh = DBI->connect('DBI:mysql:host=localhost;database=testdb', 'testuser', 'somepassword', {mysql_enable_utf8 => 1}) or die $DBI::errstr;
$dbh->do('SET NAMES utf8');
$dbh->do("INSERT INTO testtable (textval) VALUES ('the N\xFCrburgring')");

Бұл шын мәнінде «N» деп жазады. («Нюрбургрингтен» жазу керек болғанда)

MySQL сұрау журналын қарап шыққанда, мынаны көремін:

271 Query INSERT INTO testtable (textval) VALUES ('the Nürburgring')

Сонымен, жол DB серверін сақтамайды.

Егер сол сұрауды тікелей MySQL консоліне енгізсем:

INSERT INTO testtable (textval) VALUES ('the Nürburgring');

Бүкіл жол дұрыс жазылған. Мен дұрыс емес деп ойлаймын ба?

5
Егер сценарийде \ xFC ü параметрін өзгертсеңіз, ол не жазады?
қосылды автор TLP, көзі
Perl-кода литералы пайдалансам, дәл солай.
қосылды автор plasticinsect, көзі

1 жауаптар

Сіз mysql_enable_utf8 атрибутын орнатдыңыз, сонда интерфейске сіз оны Перлдің таңбалар жолын беретінін уәде еткенсіз. Дегенмен, бұл латын1 кодтауындағы октеттердің буфері.

use Devel::Peek qw(Dump);
Dump "the N\xfcrburgring";
#  FLAGS = (POK,READONLY,pPOK)
#  PV = 0x208e4f0 "the N\374rburgring"\0

Түзету оңай. \ x жазылмайтын әріптік белгілер болса, utf8 pragma-ін қолданып, Perl-ға бастапқы код UTF-8-де жазылғанын және UTF-8 кодының редактор…

use utf8;
use Devel::Peek qw(Dump);
Dump "the Nürburgring";
#  FLAGS = (POK,READONLY,pPOK,UTF8)
#  PV = 0x20999f0 "the N\303\274rburgring"\0 [UTF8 "the N\x{fc}rburgring"]

... немесе сегіз октетаны жолға қайта кодтау. Уақыттың көп бөлігін литералдармен емес, сырттан келген деректермен де жақсыырақ Кодтаманың толық тақырыбын біліңіз .

use Encode qw(decode);
use Devel::Peek qw(Dump);
Dump decode 'Latin1', "the N\xfcrburgring";
#  FLAGS = (TEMP,POK,pPOK,UTF8)
#  PV = 0x208f6b0 "the N\303\274rburgring"\0 [UTF8 "the N\x{fc}rburgring"]
4
қосылды
Түсініктеме үшін рахмет. Мен қазір оны аламын деп ойлаймын. Мен кірістіру жолын $ dbh-> do (decode ('Latin1', 'INSERT INTO testtable (textval) VALUES (' N \ xFCrburgring '))); .
қосылды автор plasticinsect, көзі