寻心 | 蒙古文输入法最全知识
蒙古文信息处理——这个词对于很多人来说可能很陌生。简单来说,蒙古文信息处理就是针对蒙古文文件进行综合编辑。而在蒙古文信息处理中我们生活中最常接触到的便是蒙古文输入法了。但是我们在使用蒙古文输入法的过程中总会遇到这样那样的问题,例如有的时候在电脑上做好的PPT,换个电脑就乱码。诸如此类的问题让人很是头痛。贴心的小编为了解答大家的疑惑,
专门请教了社科院的研究员哦~
本期内容是面向大众的科普性解答
不是专业的学术论文哦~
(文中提到的任何软件及产品并非广告,只是涉及其部分功能)
本期嘉宾:
内蒙古社科院白双成研究员
Q
A
额日乐勤
额日乐勤
公众号的编辑
白双成
内蒙古社科院研究员
关于PC端的问题
额日乐勤
就我们日常上课时所用的PPT而言,我们在自己的电脑上用蒙古文做的PPT,在没有转成图片或PDF格式的情况下,在别的电脑上打开时会发生乱码的情况,请问这是什么原因呢?
白老师
主要原因是蒙古文目前还不是操作系统所完美支持的语言文字,一个电脑上有蒙古文字体,而另一个上没有或有的字体与原来电脑字体不兼容。彻底的解决方法是让操作系统支持蒙古文,而且是完美支持。
白老师
临时解决方法是可以PowerPoint、Word等办公软件中选择“字体嵌入”,这样即使另一个电脑的蒙古文环境不一样也能正常看到。以PowerPoint2016为例,打开“选项-保存”,勾选“将字体嵌入文件”即可。
额日乐勤
用蒙古文输入法输入某些异形字会出现很难输入的情况,例如会出现显示错误或写出来后文字分体的情况是因为什么原因呢?如何解决这一问题?
白老师
简单说,这还是操作系统对蒙古文支持不够彻底的问题。
额日乐勤
蒙古文输入法是否具备联想输入的技术?如果现在还不具备的话大概多久可以实现这一技术?
白老师
目前只能说部分具备了联想功能。现在的一般做法是将常用词语搭配(不一定是严格意义上的词组、复合词、惯用语等)放到库中,实现简码输入这种搭配或输入第一个单词后,自动推荐后续单词。
白老师
目前还没有成熟的蒙古文整句输入产品出现,而与其类似的汉文产品已经非常成熟和普遍。实际上其中的关键技术无非是较成熟的n元搭配模型,当然理论技术转化为产品,还有很多细节性工程化工作,还要构建有与之配套的生态环境,更何况,蒙古文信息化还存在语料资源稀缺、蒙古文编码个性等问题,单单从技术角度考虑,这一切都是可以克服。
白老师
所以,我认为这已经不是技术问题,而是输入法开发团队能持续投入多少精力的问题。虽然输入法是关键性、基础性产品,但从商业角度考虑,必须要依托可挣钱、可转化的项目来养活或干脆需要一个机构“抱养”。即使偶尔有项目团队能获得国家或地区基金项目支持,但也不是持续性投入,消费完项目资金还得为生计奔波。
额日乐勤
蒙古文输入法是否可以识别错别字拼写?若要实现这一技术的话会涉及到哪些难题?
白老师
输入法识别错别拼写,也叫做容错输入,是指当用户输入错误时能自动提示正确的输入候选词。例如,蒙科立手机输入法中支持4/5元音、6/7元音和t/d辅音的混合输入算是容错输入,当用户将orloge错误拼写为urluge时提示正确读音。
白老师
白老师
敖尔弘输入法提供直接的纠错输入功能,但我没有细致研究过这个输入法,大家可以试一试。
白老师
除了上述的个别字母间的混合输入和纠错外,还可以实现多输入、少输入、交替输入字母时也能纠错,甚至可以结合上面问题中提到的整句输入,可以对搭配层面的错误也可以纠错。
额日乐勤
就电脑上蒙古文字体样式少的问题有什么解决的方法?
白老师
如果所有字体都能通用的话,实际也不少。目前蒙科立可以下载使用的28款字体,加上已经产品化的方正、华光、德力海、内大等字体,去掉相近风格字体也有不少款式。尤其,嘎拉图字体发布了有很多个性字体,也出现天格思等个性蒙古文字体设计人员。但我们的最大问题是,各种字体还无法通用。
白老师
另一方面,我们还是缺少激励字体创作、产品化及维护的土壤,或者更为庸俗地讲,从字体创作中获利方式还不够,只有解决这些问题,才能激励更多的人投入这项工作,使其蓬勃发展。
请输入文字
关于手机端的问题
额日乐勤
手机上写蒙古文时只能横着输入,有很多人反应这样一来不美观、二来不能体现蒙古文竖着写的特点,那么请问这个问题有解决方法吗?
白老师
因为多数文字是横排,而只有蒙古文及蒙古文相关几个文字是竖排,竖排成为个别应用需求。操作系统层面兼顾横排、竖排的投入远大于支持单个横排,而竖排市场又极小而已被忽略,所以在操作系统层面,短期内很难从根本上改变这一局面。
白老师
在我们所急需的个别应用、网站、APP层面竖排是没有问题,输入法做成全竖排也没有技术难题(出于节省屏幕空间考虑,有的输入法选择了横排候选词,随着手机屏幕分辨率提高,改成竖排,屏幕空间变大也能达到舒适程度)。
白老师
在我们常用的第三方APP(例如QQ、微信)中,情况与操作系统层面的问题类似,“市场小,兼顾竖排成本大,已被忽略”。所以目前来讲,让腾讯等大公司在他们的产品上开发竖排功能,基本上是不可能的。
额日乐勤
安卓系统中蒙古文输入法的键盘字母排序没有自己的体系,用英语字母键盘,拼写蒙古文不方便,这个问题能否得到有效的解决?
白老师
如果是实体按键,没法改变,不可能所有人都买定制键盘手机。
白老师
如果是触摸屏中的软键盘,完全可以定制,仅仅是个抉择问题。使用通用键盘布局还是自定义键盘布局,各有各的好处。对于刚入手的手机用户(指不熟悉通用键盘)来说,定制键盘容易入手。而对于老用户,尤其是熟悉QWERTY通用键盘布局的人来说,通用键盘更具普遍性。使用通用键盘布局是为了兼顾人们的键盘使用习惯。
额日乐勤
很多手机不能支持蒙古文输入,系统自带的语言库里没有传统蒙古文输入法,这个问题可以得到有效的解决吗?有人正在做这项工作吗?这项工作进行到哪一步了?
白老师
有效解决是一定能解决的。但需要我们努力:1.专家们需要努力,尽快统一标准细节问题,让各大厂商拿到没有歧义的稳定的标准。2.广大用户也不能总是各种抱怨,要积极使用蒙古文,加大使用呼声,哪怕从局部开始解决。3. 相关主管部门及领导们要平衡利弊、整合力量、果断抉择,为蒙古文信息化提供好的生态环境。
白老师
实际上各方面都在努力,但距离我们的需求还是差那么一点,还需一起努力。
额日乐勤
在日常生活中使用的社交软件(类似于微信、QQ)中不能用使用蒙古文是因为什么原因?这个问题如何得到解决?
白老师
这个问题说简单也是非常简单的事情,如果想做好任重道远。实现在QQ、微信中正常使用蒙古文时也可以分为两种,一种是当操作系统较好地实现蒙古文支持时,微信、QQ自然有了。另一种,先行在微信、QQ中嵌入一个常用的蒙古文字体就可以解决我们眼下急需。据我所知,已有多个人找过腾讯公司商谈过这个问题,但他们认为蒙古文用户数量有限,应用需求不迫切,积极性不高。所以用户通过各种渠道反映需求也很关键。
额日乐勤
微信现有翻译功能,但这个功能现在还不能翻译蒙古文,如果微信支持蒙古文输入之后是否就可以翻译蒙古文了呢?
白老师
输入和翻译是完全两个功能点,翻译需要单独做。目前google、bing、百度等多数公司的翻译系统都采取数据驱动的翻译引擎,能否支持你的这个语言,基本取决于他们手里有没有你这个语言与另一种语言的对照语料,只要这个数据量上去了,他们就可以做个版本。如果双语对齐语料不够大,基本是使用统计翻译模型,如果数据量足够大,还可以使用深度神经网络模型获得更好的效果。
额日乐勤
蒙古文输入法的输入方式单一的问题,没有手写以及语音输入的功能,如果想要完成这些技术需要解决哪些难题?大概多久可以实现这一技术?
白老师
手写输入和语音输入都是完全可能的,有大量其他语言成功案例,可以合作的国内外科研院所和企业也很多,甚至可参考可利用的开源项目也很多,完全可以小团队自己动手撑起来。目前已经有研究人员做了这方面的工作,已有公开论文及新闻报道。科研研究、试验成果和产品化推广还是有些区别,中间要走的路也很长,就看原成果转化速度有多快。
额日乐勤
老师,您可以大概的总结一下蒙古文信息处理的现状吗?
白老师
总体而言,我们现在科研、产业都严重缺人,应该做、必须做的事情很多,其中可以做、能做好的事情也很多,但真正能干的人严重不足。现在成规模专业化公司太少,即使有的几个公司也是所有事情需要亲力亲为,没有自己的专精特,还处于你干的我都干的“恶性竞争”处境中,这也是蒙古文信息技术及产业发展阶段所导致的常态。而科研院所有了科研成果后,如果没有合适的对接产业公司,要不写完论文搁置,要不小打小闹业余时间推进,要不自己创业转化成果,但也不是所有科研人员都适合自己开公司,甚至有的科研人员进行创业是对其创造力的扼杀。
请输入文字
再次强调:
本期内容是面向大众的科普性解答
不是专业的学术论文哦~
特别感谢
内蒙古社科院白双成研究员
内蒙古社科院呼斯勒副研究员
蒙科立公司乌力吉那仁工程师
中央民大蒙古语言文学系雪艳老师