一、中心基本概况
1.中心发展概况
1994年学校成立了民族文字信息处理研究所,2002年在此基础上建立了民族文字信息处理实验室(四川省高校重点实验室),2010年成立了民族语言文字信息处理技术研发中心。中心先后3次获国家财政部专项建设经费的支持,共计1080万。中心成立以来,开设了民族文字信息处理硕士研究生专业和本科专业,实验室在民族语言文字信息处理领域(彝、藏、傣、纳西)的研究成果突出,一直是我校的特色研究方向。
中心现有1个省级重点实验室(民族语言文字信息处理实验室);1个硕士点(民族语言文字信息处理硕士点);4依托建设机构:中国西南少数民族语言资源库建设基地(与中国社会科学院共建)、全国彝语术语标准化工作委员会、全国高等院校彝汉双语教材编译审定委员会、四川省民族语言文学研究所)。
2.中心建设目标
1)坚持为民族地区的信息化建设、社会进步和发展服务的宗旨,根据学校一体两翼发展规划,坚持走内涵发展的道路,实现中心科研和学科建设工作的可特色化、持续化、科学化的发展。
2)坚持教、学、研相结合的指导思想,将理论和实践相结合,把中心研究工作与社会需求紧密结合起来,并且依托民族语言文字信息技术中心、中国西南少数民族语言资源库建设基地的优势,不断开拓民族文字文信息处理研究的新领域,把实验室建成全国具有着鲜明学术特色的民族语言文字信息处理化建设的人才培养基地,成为发展少数民族地区科学、技术、文化,促进社会进步的新型科研中心。
3.中心研究定位与方向
1)研究定位:以语言学、中文信息处理科学原理为依托,综合运用语言学、语音学、民族学、统计学、信息科学、计算机科学等理论和技术,研究和开发民族语言文字信息处理技术。
2)研究方向:在民族语言信息处理系统的开发、民族语言语料库的研究与建设、民族语言声学研究、民族古籍文献的信息化、数字化开发、民族语言的自然理解研究、民族语言资源数据库的建设、民族语言移动设备信息处理研究等领域开展交叉研究和创新研究。
二、中心研究工作进展
中心在民族文字信息处理技术研究方面取得了科研成果49项,完成国家自然科学基金项目1项;完成国家社会科学基金项目2项;主持制定了信息处理国家标准3项,国际标准1项;获国家专利1项;完成省部级科研项目12项;完成合作开发项目6项;完成省部级以下项目22项;发表相关学术论文数70余篇;获省部级以上教学科研成果奖励9项。目前在研国家社科基金重大项目1项,省部级项目5项,厅局级项目7项。
1.主研科研项目:
1)《中国彝文古籍文献整理与保护及其数字化建设》,国家社科重大招标项目,在研;
2)《彝文信息处理及标准彝文字符集与编码的研制》,国家自然科学基金项目,完成;
3)《彝语语料库的研究与建设》,国家社会科学基金项目,完成;
4)《汉彝对照标注词库的建设》,国家社会科学基金项目,完成;
5)《高校彝汉双语教材数字化建设》,教育部项目,在研;
6)《彝汉双语教材建设与双语人才培养研究》,教育部项目,在研;
7)《彝语声学参数数据库的研究与建设》,教育部项目,完成;
8)《彝族传统医药术语整理及规范》,教育部项目,完成;
9)《彝语人名汉字音译转写规范》,教育部项目,完成;
10)《彝语常用术语汉字转写规范标准研制》,教育部项目,完成;
11)《藏、彝文全文献数据库》,国家民委项目,完成;
12)《彝族研究文献数据库》,国家民委项目,完成;
13)《信息处理用规范彝文分词系统的设计与实现》,国家民委项目,完成;
14)《少数民族语言水平测试标准研究(彝语文)》,国家民委项目,在研;
15)《彝文文献数据库》,四川省社科规划项目,完成;
16)《羌语语音数字化资源库建设》,四川省社科规划项目,完成;
17)《中小学教材汉彝对照电子词典》,四川省教育厅科研项目,完成;
18)《彝文信息处理分词技术研究与实现》,四川省重点研究基地项目,在研;
2.主要科研成果:
1)《YWIN彝文系统》;
2)《ZWIN藏文系统》;
3)《DWIN傣文系统》;
4)《中小学教材汉彝对照电子词典》;
5)《基于滇川黔桂古彝文系统》;
6)《彝语元音声学参数库》;
7)《通用彝文系统》;
8)《彝文智能输入系统》;
9)《藏文智能输入系统》;
10)《纳西东巴文输入系统》;
11)《彝语基础例句语料数据库》;
12)《彝语分词、词性标注加工规范》;
13)《汉彝对照词性标注系统》;
14)《信息处理用彝、汉语平行语料库》;
15)《彝语自动分析系统》;
16)《彝语六大方言语音库》;
17)《中国彝文典籍译丛电子多媒体光盘》;
18)《跟我学彝语多媒体教学软件》;
19)《规范彝文字词频统计系统》;
20)《彝语自动分析系统》;
21)《彝语基础例句语料数据库》;
22)《彝语分词、词性标注加工规范》;
23)《方正unicode彝文系统》;
24)《方正彝文书版系统》;
25)《彝、藏文手写手机》;
26)《彝、藏文智能手机》;
27)《彝、藏、傣语言学习平台》;
28)《花瑶语音资源库》;
29)《藏语尔苏语音数据库》;
30)《藏语嘉绒语音数据库》。
3.科研成果获奖情况
1)《信息交换用彝文编码字符集》,获四川省人民政府第六次哲学社会科学优秀科研成果三等奖;
2)《计算机信息处理彝文输入编码》,获四川省人民政府科技进步三等奖;
3)《计算机彝文信息处理》,获第五届中国民族图书奖二等奖;
4)《计算机彝文字输入方法》,获第五十一届尤里卡世界发明博览会金奖;
5)《计算机彝文信息处理》,获四川省第十次哲学社会科学优秀成果奖三等奖;
6)《四川民族地区少数民族语言文字应用的调查报告》,获国家民委社会科学研究成果奖调研报告三等奖;
7)《计算机彝文信息处理系统及系列研究成果》,获钱伟长中文信息处理科学技术奖二等奖;
8)《彝语言文学专业的多语言教学与实践》,获得四川省人民政府教学成果一等奖;
9)《彝语语料库的研究与建设》,获四川省第十六次哲学社会科学优秀成果奖二等奖。
研制的计算机彝文输入法被应用于计算机彝文激光照排系统,填补了我国少数民族信息处理的一项空白,被两院院士王选命名为“沙马拉毅输入法”;2003年“计算机彝文输入码及其键盘”获国家专利;2005年研制出的“中小学汉彝对照电子词典”和“藏、彝文文献全文数据库研究与开发”均填补了国内相关方面的空白;2006年西南民族大学与北大方正合作开发的UNICODE彝文系统问世,计算机彝文字体从开始的2种发展到现在的白体、黑体、细黑体、宋体、仿宋体、综艺体、圆头体、手写体等8种字体;2007年西南民族大学与北大方正合作研发的彝文书版研发成功;2008年完成了“彝语六大方言语音库”的建设;2008年研制出的“彝汉双语平行语料库和术语库”是我国,也是世界上,第一个针对彝语和汉语的平行语料库和术语库。
2009年研制出的“彝语语料库”是我国,也是世界上,第一个大规模的彝语语料资源库;2009年西南民族大学与中国社会科学院民族学与人类学所合作“彝语声学参数数据库”的研制成功,开创了彝语实验语音学研究的先河,也为西南少数民族语言实验语音学研究工作的开展进行了有意义的探索;2009年研制成功基于展讯平台藏、彝文手写机被誉为“藏、彝语文发展进程中的里程碑”,使历史悠久的藏、彝族传统文化与移动通信技术相结合,2012年又升级为藏、彝文安卓智能手写手机,为藏、彝语言文字向科技化、信息化迈进开辟了一条新路。2010年彝汉双语词语标注语料库、彝汉人名汉字音译数据库、彝族传统医药术语数据库; 2011年彝、汉、英三语平行语料库、通用彝文系统;2012年彝文智能输入法、藏文智能输入法、藏文拉丁转写方案;2013年3月完成藏语尔苏语音数据库、纳西东巴文智能输入系统;2014年开始藏语嘉绒语音库、花瑶语音库、藏、彝、傣民族语言学习平台的研发,这些研究成果的完成都为相应民族语言文字信息处理技术的发展奠定了一个坚实的基础。而且,这些科研成果已相关领域得到广泛应用,为民族语文工作的现代化、信息化的全面开展提供了强有力的技术支撑。
3.人才培养
中心在学校少数民族语言文学相关专业的基础上,相继开设了民族语言文字信息处理硕士研究生专业和本科专业,为学校民族学博士学开设了计算机民族文字信息处理课程,开设了民族语言文字信息处理技术本科课程,形成了较为完整的专业人才培养体系,共计培养硕士研究生32人,毕业27人。
4.社会服务
中心一直在推进民族地区的信息化标准的建设,主持制定了计算机彝文信息处理国家标准3项,国际标准1项,特别是依托全国彝语术语标准化工作委员会,先后完成了《彝族传统医药术语整理及规范》、《彝语人名汉字音译转写规范》等规范的制定,为彝语文的规范化、标准化提供了依据,也为彝语文的应用和推广起到了积极的引导作用。
中心研究工作与社会需求相一直结合紧密,研发的藏、彝、傣文手机及学习平台,把藏、彝、傣语言文字的现代化传播手段带进了现代化的通讯时代。
完成的彝语六大方言语音库、羌语语音数据库、藏语尔苏语音数据库、花瑶语音数据库,为少数民族语言实验语音学研究工作的进一步开展奠定了丰富的语言数据基础。
中央政治局常委、中央书记处书记、刘云山,中国中央政治局委员、中宣部部长刘奇葆,全国政协副主席、国家民委主任王正伟,全国政协副主席周明普、国家民委副主任陈改户、原四川省副省长张作哈、中央候补委员旦科、原国家民委副主任吴仕民、微软公司总裁比尔盖茨等参观了中心或会见了中心负责人沙马拉毅教授,并对中心的科研成果都给予了很高的评价。
中央电视台、光明日报、中国民族报、华西都市报、四川新闻网、人民网、新华网、国家民委网站、教育部网站等多家媒体和权威网站都用专题对中心主研完成的民族语言文字信息处理研究成果进行了报道,都给予了很高的评价。