当前位置:首页 > 关于CNNIC > CNNIC通讯 > CNNIC通讯第二十三期 >> 正文

国际化域名(IDN)综述
 
    
                                   中国互联网络信息中心(CNNIC)技术部 姚健康
1. IDN背景:

1.1 什么是IDN

    国际化域名IDN (Internationalized Domain Name)也称多语种域名,是指非英语国家为推广本国语言的域名系统的一个总称,例如含有日文的为日文域名,含有中文的域名为中文域名。
    IDN域名具有以下特点:
 以用户自己喜爱的语言接触互联网
 消除域名意译或音译书写引起的混乱状况
 拓展和保护各个实体的网上品牌形象
 确保各民族品牌和各民族语言的一致性
 表明尊重当地语言文化
 容易记忆,容易使用

1.2 域名起源

    网络名称访问技术的演变大致经历了以下过程。最初为便于记忆,网络人员将由二进制"0"、"1"组成的网络地址分割成四段,并采用十进制的方式加以表示,这就是IP地址。随后,科研人员又将纯数字表示的IP地址基础上推出更加便于记忆的字符型访问标识,即基于IP地址的域名系统。这些域名只能使用63个ASCII字符("a-z","A-Z","0-9","-"),如www.cnnic.cn. 域名系统婕幢还惴涸擞糜诨チ母鞲鲇τ弥校鏦WW浏览、电子邮件和FTP等,极大地推动了互联网络的普及。随着互联网在非英语国家的迅猛发展,九十年代末期国际互联网界提出了将原本只能使用63个ASCII字符的域名,采用本地语言文字来表示,也就是出现了对多语种域名的需求。

1.3 IDN基础

    互联网上最主要的技术标准组织IETF,在1999年11月,第46届IETF会议上成立了一个关于多语种域名的兴趣小组(BOF),在2000年3月,第47届IETF(The Internet Engineering Task Force)会议上正式成立了多语种域名工作组(IDN Working Group)来研究制定多语种域名的相关技术标准。北京时间2003年3月8日,IETF通过互联网正式公布了与IDN域名相关的三个标准(RFC3490、RFC3491、RFC3492),至此,经过全球技术专家共同讨论且被广泛接受的多语种域名技术标准最终定稿。 RFC 3490是“Internationalizing Domain Names in Applications (IDNA)”,描述了如何在应用程序中实现支持国际化域名,是IDN的架构性协议文档;RFC 3491是“Nameprep: A Stringprep Profile for Internationalized Domain Names (IDN)”,描述了如何准备一个国际化域名,包括对一个域名字段进行映射、正规化以及禁止性过滤等等操作。RFC 3492是“Punycode: A Bootstring Encoding of Unicode for Internationalized Domain Names in Applications (IDNA)”,主要描述了如何在八位的国际化统一码Unicode和七位ASCII字符(含数字字母)之间进行编码转换。这三个标准分别解决了应用程序支持多语种域名的技术框架、多语种域名编码范围和预处理方法,以及多语种编码与多语种域名传输编码之间的转换算法等问题。它们和RFC3454(国际化字符串准备,Preparation of Internationalized Strings )共同构成了整个国际化域名的技术体系。

1.4 中文域名简介

    中文域名是IDN的重要组成部分,也可以说最重要的组成部分。中文域名是含有中文的新一代域名,同英文域名一样,是互联网上的门牌号码。中文域名在技术上符合IETF发布的多语种域名国际标准。中文域名属于互联网上的基础服务,注册后可以对外提供WWW、EMAIL、FTP等应用服务。注册的中文域名至少需要含有一个中文文字。用户可以选择中文、字母(A-Z,a-z,大小写等价)、数字(0-9)或符号(-)命名中文域名,但最多不超过20个字符。目前CNNIC有".CN"、".中国"、".公司"、".网络"四种类型的中文域名供注册。中文域名便于普通老百姓上网,对推动我国信息化建设有着重要的战略意义。

2.IDN的发展

2.1多语种域名发展的需求

    在IDN出现以前,全球六亿六千五百多万互联网用户必须输入英文字符的域名,才能浏览网络和发送电子邮件。现在,英文域名不应该只是浏览互联网的唯一途径。
  

图表 1. 2002年全球互联网网民按母语分布

    从上面的图我们可以了解63.5%的互联网用户的母语并不是英语。对他们中的很多人来说,用英语上网会感到很不方便。而且:
 不讲英语者构成了66% 多的世界经济。
 43% 的互联网用户从不讲英语。
 90%的互联网用户喜欢浏览自己母语的当地信息。
    所以广大英语非母语的网民迫切需要IDN

    
图表 2 没有中文IDN和有中文IDN的比较

    从图表2可以看出,我们有了IDN以后,各个国家各个民族的人都可以利用自己的语言输入网址上网,极大地方便了世界上网民的上网。尤其是对占世界人口22%强的母语为华文的人口来说,中文IDN无疑是更大的福音。从图表3可以看出,这些公司、学校或各种组织采用中文IDN后,使广大华文人口在上网时倍感亲切。

    2.2 IDN在全世界的推出

2003年6月20日,国际组织ICANN(The Internet Corporation for Assigned Names and Numbers,互联网名字与号码分配机构)签署了《多语种域名实施指导原则》,此《原则》为全球互联网政策性原则,从而标志着多语种域名在全球范围内正式启动。CNNIC专家认为,《原则》的发布对于有效地、规范地推动多语种域名乃至中文域名的注册、管理和应用都将具有重要的意义。“.CN”、“.JP”、“.TW”、 “.COM” 、“.NET”、“.ORG”以及“.INFO”的注册管理机构均表示支持此《原则》。

    3.IDN在世界的发展
   

    图表 4. 2000-2005服联网用户按地区分布

    随着《多语种域名实施指导原则》的颁布,随着互联网用户在亚洲、欧洲以及北美以外其他地区呈爆炸性增长(可以参看图表3),IDN域名愈加成为紧迫的需求。经过全球各家注册机构和注册商的共同努力,我们现在能够使用 350 多种语言注册和使用域名。从中文到俄文,从希腊文到日文,域名已经多语种化!域名现在能够使用当地语言字符进行注册,例如:。我们实际上能够将不同的字符、数字或符号进行随意组合,创建一个域名。这样全球大部分网民都可以使用自己熟悉的语言进行上网。

    以数字信任服务厂商 VeriSign, Inc.为首的世界各个注册机构宣布其对IDN的支持,即支持IETF出版的 IDN 标准。VeriSign 的 IDN 计划为世界各地展示其品牌的商业和网上浏览的互联网用户时提供非英语语言的选择。为了进一步推广对 IDN 标准的全球性采纳,VeriSign 宣布其 i-NavTM 插件能力将扩充以支持其他遵循 IDN 标准的注册操作系统。VeriSign 还宣布对其 IDN 计划的改进以便处理简体和繁体中文(script)中的字符变异。 Internet Assigned Numbers Authority (IANA) 于 2003 年 2 月 14 日宣布 IDNA(“应用程序中多语种域名”)RFC 的前缀组成部分:xn。此项发展意味着在 IETF 公布 IDN 标准方面的重大进展。VeriSign 的 IDN 计划已经将以前使用的前缀来自 Row-Based ASCII Compatible Encoding (RACE,是 RFC 其中之一)的一个早先草稿版迁移到RFC3492中规定的 Punycode编码。2003年底,VeriSign完成其部署以支持公布的 IDN 标准。为了进一步推广对 IDN 标准的全球性采纳,VeriSign 宣布对 i-NavTM 插件进行升级以支持其他遵循 IDN 标准的gTLD 和 ccTLD IDN 例如JPRS 的.jp 和 KRNIC 的 .kr 以及CNNIC的.cn 等IDN。

4.IDN在中国的发展

4.1 CNNIC的注册支持

    全世界中文人口,占总数的25%以上。语言障碍成为中文地区电子商务发展的绊脚石。无论是用自己企业或组织的英译,还是全拼、拼音缩写,甚至是数字,网站的名称都不能直接反映企业或组织的身份,如果不将企业或组织名和域名同时宣传,许多用户只能靠猜测。而且众多的域名后缀不仅会使刚接触网络的人摸不到头脑,熟练的网民也会因为用错后缀而无功而返。同时,当商家不得不舍弃耳熟能详的中文品牌而另创全然陌生的英文代号时,无疑会使品牌价值大打折扣,一个有意义和容易记忆的中文域名能为一个企业或组织建立良好的外在形象,在宣传、推广和开展他们的品牌方面有极高的广告价值。

    CNNIC推出的中文域名是IDN的重要组成部分,CNNIC为了促进中文域名的发展做了不懈的努力。早在2000年,CNNIC就已经在全球范围内推出中文国际化域名服务,走在了IDN研究和应用的国际前列。其中文.cn, 中文.公司, 中文.网络,中文.中国等域名注册服务扫清了全球华人上网的语言障碍,使网络符合华人的习惯,更能帮助企业或建立一个适合与全球华人客户交互的平台。

4.2 CNNIC的国际化努力

    为了维护广大中文域名用户的利益,以钱华林教授为主的CNNIC各方面人员积极倡导和推动中文域名的简繁体异体等效处理,在IETF中引起了广泛的关注和重视。最终,促成了以钱华林教授为作者之一的“中日韩多语种域名注册和管理方针”的IETF技术标准RFC3743的颁布,这是7年来由中国制定的唯一一个互联网国际标准。这一标准直接涉及互联网域名系统这一基础层面,是中国对世界互联网异体字等效互通技术做出的贡献,是我国参与互联网国际技术标准制定的一个重大突破。

    ICANN签署的《多语种域名实施指导原则》则是与此技术标准方案紧密相关的管理政策。值得指出的是,由于包括CNNIC在内的中国技术人员的努力推动,IETF发布的国际技术标准在英文句号“.”的基础上,增加了中文句号作为多语种域名的分隔符,省去了中文域名用户输入域名时中英文之间切换的麻烦。同时,基于CNNIC的评估,国际技术标准采用的Punycode编码也是对中文域名字段长度的限制最低,效率最高的一种编码方案。

5.发展IDN的意义:

    IDN的发展不但对互联网用户有着积极的意义,对注册商来说也是一个事业发展的机会。

5.1 对用户的意义
 保留当地文化并支持当地互联网用户喜爱的语言(民族文化)
 IDN 使用户能够浏览互联网上的内容,并将用于IDN电子邮件地址。
 用目标读者喜爱的语言与之沟通,因此能够更加有效地接触目标读者
 保护,巩固,和拓展现有品牌、商标和形象;确保品牌在当地市场中的权益, 消除任何乱用品牌的现象,让顾客浏览更加顺畅
 符合国际标准、使用域名系统的全球性工具;稳定可靠
 IDN 使企业和个人能够拓展和保护其在世界各地市场中的网上形象。
 IDN 不需要将品牌意译或音译成英文字符即可用作互联网地址,因此使企业或组织能够更加有效地用顾客喜爱的语言和脚本进入目标市场。
 IDN 采纳国际标准,因此任何人都能够随时随地用自己选择的语言浏览互联网。
 IDN 依靠高度安全可靠、可缩放的全球性基础设施为其提供驱动力。

    6.IDN发展前瞻:

    为了促进IDN在全世界的发展,CNNIC正在努力牵头与全世界的对IDN有兴趣的专家一起建立基于IDN的国际化邮件地址的标准化(internationlization of email addresses)。如果这一标准得以建立,必将促进全世界IDN的发展。到时候,全世界各民族的人将用自己喜爱的语言的IDN域名上网,用基于IDN的邮件地址收发电子邮件。在不久的将来,IDN肯定会在全球被广大网民更广泛地使用。

【附1:中文域名发展大事记】

 2000年1月18日 — 中国互联网络信息中心(CNNIC)开始中文域名实验注册

 2000年5月1日 — TWNIC开放中文网域及个人网域名称线上注册申请服务

 2000年5月20日 — CDNC在北京成立

 2000年11月7日 — 信息产业部发布《关于互联网中文域名管理的通告》,对大陆境内中文域名注册服务和管理加以规范,并明确授权CNNIC为中文域名注册管理机构

 2000年11月7日 — CNNIC中文域名注册系统全面升级,推出".CN"、".中国"、".公司"、".网络"为后缀的中文域名服务

 2000年11月13日 — TWNIC开放泛用型中文网域名称优先登记与预先登记

 2001年1月1日 — 中国国际经济贸易仲裁委员会域名争议解决中心通过CNNIC和相关专家评审,开始受理域名争议投诉

 2001年2月5日 — TWNIC开始受理‘争议处理机构认可’申请

 2001年2月16日 — TWNIC 全面开放泛用型中文网域名称

 2004年4月14日,IETF正式发布《中日韩多语种域名注册标准》,编号RFC3743,这是历史长中国人参与撰写的第二个IETF标准。

【附2:参考资料】

1.http://www.verisign.com
2.http://www.cnnic.cn
3.RFC 3490 - Internationalizing Domain Names in Applications (IDNA)
http://www.faqs.org/rfcs/rfc3490.html
4.RFC 3491 - Nameprep: A Stringprep Profile for Internationalized Domain Names (IDN) http://www.faqs.org/rfcs/rfc3491.html
5.RFC 3492 - Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA) http://www.faqs.org/rfcs/rfc3492.html
6.RFC 3454 - Preparation of Internationalized Strings ("stringprep")
http://www.faqs.org/rfcs/rfc3454.html
7.Guidelines for the Implementation of Internationalized Domain Names Version 1.0 http://www.icann.org/general/idn-guidelines-20jun03.htm
8.http://www.cdnc.org




[ 2004年12月16日 ] 
 
ICP备案编号:京ICP备010225号 版权所有:中国互联网络信息中心