“我快吐血了……”
盖茨趴在电脑面前,然后用脸滚键盘……嗯,这感觉还真不错。
他自己自己以前和人玩《魔法世界》的时候,有一个名叫爱尔奎特的真祖女魔法师,对方最喜欢说的事情就是“我现在正在用脸滚键盘……”
而这个时候,盖茨才发现,原来这么做还真不错来着……
“耐心点,我们在人物建模方面,也没有什么进展,我们的计划才刚刚开始,机会总是有的……”
乔布斯也在挠头。
不知不觉中,原本搞到的十几万美金,现在已经用掉了一半了,但是接下来的事情,却比盖茨想象中的困难许多。
语音合成可不是那么简单的事情,这个时候的盖茨,就几乎被这个技术搞得吐血。
在给那群苏联间.谍开发的时候,盖茨使用的是硬件的而现在,他却需要纯软件的技术。
语音合成,要求能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。
盖茨先前思考的文语转换系统实际上可以看作是一个人工智能系统。
为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。下图显示了一个完整的文语转换系统示意图。文语转换过程是先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音bō形。
其中第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则;第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。因此一般说来,文语转换系统都需要一套复杂的文字序列到音素序列的转换程序,也就是说,文语转换系统不仅要应用数字信号处理技术,而且必须有大量的语言学知识的支持。
进展之所以这么慢,是因为盖茨的资金已经捉襟见肘了,他急需一笔资金来维持自己的研究,要知道,为了自己的公司,盖茨已经是费尽了心血,让他自己接下来再去请人,那盖茨的公司最多两个月,可就要彻底的崩溃了。
但是这个计划却是无底洞,各类专家首先便需要一大堆,所谓的语言学,也仅仅只是一个开始而已。
语音合成的理论基础是语音生成的数学模型。该模型语音生成过程是在jī励信号的jī励下,声bō经谐振腔(声道),由嘴或鼻辐射声bō。因此,声道参数、声道谐振特xing一直是研究的重点。习惯上,把声道传输频率响应上的极点称之为共振峰,而语音的共振峰频率(极点频率)的分布特xing决定着该语音的音sè。
音sè各异的语音具有不同的共振峰模式,因此,以每个共振峰频率及其带宽作为参数,可以构成共振峰滤bō器。再用若干个这种滤bō器的组合来模拟声道的传输特xi频率响应),对jī励源发出的信号进行调制,再经过辐射模型就可以得到合成语音。
而建立数学模型,也不是一个高中生能够做到了,这至少需要大学生,才有这方面的知识。
“是我做的不好么?”旁边的音无似乎感觉是自己的错一样。
“啊……不是这样的,只是技术上稍微有些问题……”
音无的音源本身倒是很完美,只是在语音合成上面,盖茨却发现这事情比自己想要实现的,要艰难许多。
盖茨有些后悔自己一开始就去邀请对方过来了,现在看来,当时自己就应该只留下一个联系然后等到以后再说嘛,虽然对方不拿钱,但是被人期待的感觉……盖茨反而觉得有些慌了。
“不如我们换个角度思考,我们究竟要建立一个怎样的角sè出来呢?”
这个时候,乔布斯提出了不一样的看法。
“建立一个怎么样的角sè?”
“好吧,这方面……嗯,应该是一个可爱的女xing吧……男人的话,总是少些魅力的,而且音无已经是我们的音源了。”
“然后,是最重要的问题——我们怎么赚钱,并且,我们怎么将我们的这个角sè兜售和推销出去?我们获得投资来源,也是来自于此。”
乔布斯开始冷静分析了。
“我们可以将这个人物打造成一个偶像、一个大众偶像……不,甚至我们可以开发以这个偶像为音源的编造电子歌、朗读的软件!”
盖茨说道自己的计划的时候,倒是头头是道。
“不过说起来,我们这个角sè叫什么好呢?”盖茨喃喃着回问着。
而乔布斯也愣了。
这个似乎还真没那么简单。
而旁边的音无则是歪着头,好像似乎想到了什么。
“初音未来……很好!”乔布斯眼前一