服务热线400-928-2622
QR码生成原理
一、什么是QR码
QR码属于矩阵式二维码中的一个种类,由DENSO(日本电装)公司开发,由JIS和ISO将其标准化。QR码的样子其实在很多场合已经能够被看到了。
说到QR码的特点,一是高速读取(QR就是取自“Quick Response”的首字母),对读取速度的体验源自于我手机上的一个软件,象上面贴出的码图,通过摄像头从拍摄到解码到显示内容也就三秒左右,对摄像的角度也没有什么要求;
二是高容量、高密度;理论上内容经过压缩处理后可以存7089个数字,4296 个字母和数字混合字符,2953个8位字节数据,1817个汉字;
三是支持纠错处理;纠错处理相对复杂,目前我还没有深入了解,按照QR码的标准文档说明,QR码的纠错分为4个级别,分别是:
· level L : 很大 7% 的错误能够被纠正;
· level M : 很大 15% 的错误能够被纠正;
· level Q : 很大 25% 的错误能够被纠正;
· level H : 很大 30% 的错误能够被纠正;
四是结构化;看似无规则的图形,其实对区域有严格的定义,下图就是一个模式2、版本1的QR图结构(关于QR码的"模式"、"版本"将在后面进行介绍):
在上图21*21的矩阵中,黑白的区域在QR码规范中被指定为固定的位置,称为寻像图形(finder pattern) 和 定位图形(timing pattern)。寻像图形和定位图形用来帮助解码程序确定图形中具体符号的坐标。
黄色的区域用来保存被编码的数据内容以及纠错信息码。
蓝色的区域,用来标识纠错的级别(也就是Level L到Level H)和所谓的"Mask pattern",这个区域被称为“格式化信息”(format information)。
五是扩展能力。QR码的Structure Append特点,使一个QR码可以分解成多个QR码,反之,也可以将多个QR码的数据组合到一个QR码中来。
三、QR码的模式和版本
前面提到过QR码的模式(Model)和版本(Version)。QR码分为Model1和Model2两种模式,Model1是对QR的初始定义,Model2是对Model1的扩展,目前使用较为普遍的是Model2,本文的所有说明也仅用于Model2。
QR图的大小(size)被定义为版本(Version),版本号从1到40。版本1就是一个21*21的矩阵,每增加一个版本号,矩阵的大小就增 加4个模块(Module),因此,版本40就是一个177*177的矩阵。(版本越高,意味着存储的内容越多,纠错能力也越强)。
三、QR码支持的编码内容
QR码支持编码的内容包括纯数字、数字和字符混合编码、8位字节码和包含汉字在内的多字节字符。其中:
数字:每三个为一组压缩成10bit。
字母数字混合:每两个为一组,压缩成11bit。
8bit字节数据:无压缩直接保存。
多字节字符:每一个字符被压缩成13bit。
QR码编码原理(编码)
编码就是把常见的数字、字符等转换成QR码的方法。说具体的编码之前,先说一下QR码的很大容量问题。
一、很大容量
QR码的很大容量取决于选择的版本、纠错级别和编码模式(Mode:数字、字符、多字节字符等)。以版本1、纠错级别为Level Q的QR码为例,可以存储27个纯数字,或17个字母数字混合字符或11个8bit字节数据。如果要存储同样多的内容同时提高纠错级别,则需要采用更高的 版本。版本1~9 数据容量、纠错码容量对照如下表:
(version) |
(error correcting level) |
(count of data code words) |
count of EC code words |
(numeric) |
(alphanumeric) |
8bit |
1 |
L |
19 |
7 |
41 |
25 |
17 |
M |
16 |
10 |
34 |
20 |
14 |
|
Q |
13 |
13 |
27 |
16 |
11 |
|
H |
9 |
17 |
17 |
10 |
7 |
|
2 |
L |
34 |
10 |
77 |
47 |
32 |
M |
28 |
16 |
63 |
38 |
26 |
|
Q |
22 |
22 |
48 |
29 |
20 |
|
H |
16 |
28 |
34 |
20 |
14 |
|
3 |
L |
55 |
15 |
127 |
77 |
53 |
M |
44 |
26 |
101 |
61 |
42 |
|
Q |
34 |
36 |
77 |
47 |
32 |
|
H |
26 |
44 |
58 |
35 |
24 |
|
4 |
L |
80 |
20 |
187 |
114 |
78 |
M |
64 |
36 |
149 |
90 |
62 |
|
Q |
48 |
52 |
111 |
67 |
46 |
|
H |
36 |
64 |
82 |
50 |
34 |
|
5 |
L |
108 |
26 |
255 |
154 |
106 |
M |
86 |
48 |
202 |
122 |
84 |
|
Q |
62 |
72 |
144 |
87 |
60 |
|
H |
46 |
88 |
106 |
64 |
44 |
|
6 |
L |
136 |
36 |
322 |
195 |
134 |
M |
108 |
64 |
255 |
154 |
106 |
|
Q |
76 |
96 |
175 |
108 |
74 |
|
H |
60 |
112 |
139 |
84 |
58 |
|
7 |
L |
156 |
40 |
370 |
224 |
154 |
M |
124 |
72 |
293 |
178 |
122 |
|
Q |
88 |
108 |
207 |
125 |
86 |
|
H |
66 |
130 |
154 |
93 |
64 |
|
8 |
L |
194 |
48 |
461 |
279 |
192 |
M |
154 |
88 |
365 |
221 |
152 |
|
Q |
110 |
132 |
259 |
157 |
108 |
|
H |
86 |
156 |
202 |
122 |
84 |
|
9 |
L |
232 |
60 |
552 |
335 |
230 |
M |
182 |
110 |
432 |
262 |
180 |
|
Q |
132 |
160 |
312 |
189 |
130 |
|
H |
100 |
192 |
235 |
143 |
98 |
下面,就举例说明将“ABCDE123”转换成为版本1、Level H的QR码转换方法。
二、模式标识符(Mode Indicator)
QR码的模式(Mode)就是前文提到的数字、字符、8bit 字节码、多字节码等。对于不同的模式,都有对应的模式标识符(Mode Indicator)来帮助解码程序进行匹配,模式标识符是4bit的二进制数:
1、数字模式(numeric mode ): 0001
2、混合字符模式(alphanumeric mode) : 0010
3、8bit byte mode: 0100
4、日本汉字(KANJI mode) : 1000
5、中国汉字(GB2312):1101
由于示例文本串是混合字符,因此将选择alphanumeric mode,其标识码为:0010
三、文本串计数标识符(Character count indicator)
文本串计数标识符用来存储源内容字符串的长度,在版本1-9的QR码中,文本串长度标识符自身的长度被定义为:
数字 : 10bit
混合字符 : 9bit
8bit 字节码 : 8bit
多字节码 : 8bit
在本例中,源文本串的长度为8个字符,混合字符的长度为9bit,因此将字符个数8编码为9位二进制表示:000001000
加上混合字符模式标识码,总的编码为0010 000001000
四、数据内容编码
1、数字模式下的编码
在数字模式下,数据被限制为3个数字一段,分成若干段。如:"123456" 将分成"123" 和 "456",分别被编码成10bit的二进制数。“123”的10bit二进制表示法为:0001111011,实际上就是二进制的123。
当数据的长度不足3个数字时,如果只有1个数字则用4bit,如果有2个数字就用7个bit来表示。
如:"9876"被分成"987"和"6"两段,因此被表示为"1111011011 0110"。
2、混合字符模式下的编码
混合字符模式编码,其字符对照表如下:
0 |
0 |
A |
10 |
K |
20 |
U |
30 |
+ |
40 |
||||
1 |
1 |
B |
11 |
L |
21 |
V |
31 |
- |
41 |
||||
2 |
2 |
C |
12 |
M |
22 |
W |
32 |
. |
42 |
||||
3 |
3 |
D |
13 |
N |
23 |
X |
33 |
/ |
43 |
||||
4 |
4 |
E |
14 |
O |
24 |
Y |
34 |
: |
44 |
||||
5 |
5 |
F |
15 |
P |
25 |
Z |
35 |
||||||
6 |
6 |
G |
16 |
Q |
26 |
[sp] |
36 |
||||||
7 |
7 |
H |
17 |
R |
27 |
$ |
37 |
||||||
8 |
8 |
I |
18 |
S |
28 |
% |
38 |
||||||
9 |
9 |
J |
19 |
T |
29 |
* |
3 |
编码方式为:
源码被分成两个字符一段,如下所示,每段的一 个字符乘上45,再用第二个数字相加。因此每段变成了11bit的2进制码,如果字符个数只有1个,则用6bit表示。
示例:
"AB" |
"CD" |
"E1" |
"23" |
||
45*10+11 |
45*12+13 |
45*14+1 |
45*2+3 |
||
461 |
553 |
631 |
93 |
||
0010 |
000001000 |
00111001101 |
01000101001 |
01001110111 |
00001011101 |
3、8bit字节数据不经编码转换直接保存。
五、编码终止符(Terminator)
如果编码后的字符长度不足当前版本和纠错级别所存储的容量,则在后续补"0000",如果容量已满则无需添加终止符。此时得到的编码串为:
0010 000001000 00111001101 01000101001 01001110111 00001011101 0000
六、编成8bit码字(Code words)
将以上的编码再按8bit一组,形成码字(code words):
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000
如果尾部数据不足8bit,则在尾部充0:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000
如果编码后的数据不足版本及纠错级别的很大容量,则在尾部补充 "11101100" 和 "00010001",直到全部填满。很后,版本1、Level H下的"ABCDE123" 的QR码是:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100
十进制表示法为:
32 65 205 69 41 220 46 128 236
QR码编码原理三(日本汉字和中文编码)
一、日本汉字(KANJI)是两个字节表示的字符码,编码的方式是将其转换为13字节的二进制码制。
转换步骤为:
1、对于JIS值为8140(hex) 到9FFC(hex)之间字符:
a)将待转换的JIS值减去8140(hex);
b)将高位字节乘以C0(hex);
c)将b)步骤生成的数据加上低位字节;
d)将结果转换为13位二进制串。
2、对于JIS值为E040(hex)到EBBF(hex)之间的字符:
a)将待转换的JIS值减去C140(hex);
b)将高位字节乘以C0(hex);
c)将b)步骤生成的数据加上低位字节;
d)将结果转换为13位二进制串。
二、中文汉字的与日文汉字转换步骤相似:
1、对于一 字节为0xA1~0xAA之间,第二字节在0xA1~0xFE之间字符:
a)一 字节减去0xA1;
b)上一步结果乘以0x60;
c)第二字节减去0xA1;
d)将b)步骤的结果加上c步骤的结果;
e)将结果转换为13位二进制串。
1、对于一 字节为0xB0~0xFA之间,第二字节在0xA1~0xFE之间字符:
a)一 字节减去0xA6;
b)上一步结果乘以0x60;
c)第二字节减去0xA1;
d)将b)步骤的结果加上c步骤的结果;
e)将结果转换为13位二进制串。
苏州远景达专业提供条码标签打印机,RFID标签,条码扫描器,数据采集器,扫描模组,tsc条码打印机等周边耗材。同时在线提供专业条码打印机价格和相关打印软件等条码打印产品咨询维修。