第八十九章 备受关注(1/2)

投票推荐 加入书签

方远虽然火起来了,但是他还没有“飘”起来。  

以他现在的水平来说,在本科生中可以说是出类拔萃的了!  

特别是他有着其他本科生没有的实践经历。  

但是相比那些真正的牛人来说,他的实力还是不够看的。  

但是年轻才是他最大的资本,在今后的几年时间里都会是他飞速进步的时期。  

这个时期可能就是玄幻小说里面说的厚积薄发的时期。  

前面十几年时间积累的底蕴,将会让他在这段时间内得到最大的进步。  

和别人不一样的是,方远在释放潜力的同时,在系统的帮助下加强自己的潜力。  

通俗点说,方远飞速进步的持续时间要比其他人更长一些。  

也就是说方远能在这条路上走的更远,变得更强。  

翻译软件其他方面都很好解决,方远毕竟有编写qoqo的经验。  

但是有一点并不是很好解决的,那就是语言数据库和词库的建立。  

为什么要建立这两个东西呢?  

那就要从现在市面上翻译软件的弊端说起了。  

现有的翻译软件只能对我们输入的文字或语音进行直译,也就是说它们不会根据语境进行翻译。  

特别是语音方面,现有的技术对于一些方言的识别率着实让人头疼。  

但是方远要做的这款软件可以完美的解决这个问题。  

关键就是上面说的两个数据库的建立。  

不仅仅要建立这两个数据库,还需要对二者进行关联操作。  

除了这两个数据库之外,还有一个匹配库需要方远来完成。  

这里面的关系十分复杂。  

这款智能翻译软件,首先通过匹配库,对你当前的使用场景(默认为最常使用的场景)进行识别。  

然后通过语言数据库中的资料对你输入的文字或者语音进行拆分。  

用拆分出来的各个小单元在在词库中进行匹配。  

并且按照翻译后语言的语法规则进行重新排序。  

并且在语音输入方面进行了一定的优化处理,可以通过语言库中的数据,对方言进行良好的识别。  

说来说去,最重要的就是语言库的建立。  

这方面系统也为方远想好了办法,就是通过爬虫的办法,通过对短视频网站、直播网站、自媒体网站等进行数据获取。  

当然这个过程并不是短时间内可以完成的。  

而且对计算机配置的要求非常高,方远现在用的X星人电脑根本就支持不了这个软件的需求。  

好在上次去“九州”公司的时候,他听到刘志军说道公司目前还有几台服务器暂时是空余的!  

这也省了方远很大的功夫。  

拿起电话,向刘志军说明情况后,这几台服务器的使用权就暂时交给了方远。  

实际上,对于汉语的翻译是所有翻译软件头疼的事情。  

经过五千年历史的沉淀,汉语的语意是所有语言中最复杂的情况。  

特别是现在非常火的东北话,里面有很多词的对应词库是非常难以建立的。  

这里就不得不感慨系统的厉害之处了!  

在整段程序中,语意匹配算法是方远最喜欢的地方。  

这里通过一个数学模型,建立文字和语意匹配模型。  

所有字都相当于一个模型,一句话中有多少个文字,就相当于多少个模型相连接。  

这样,只需要对每个模型进行处理,就可以得到这个字在这段话中的意思。  

说起来复杂,实际上就是把每个字的所有意思都关联起来,然后词库中找到对应的意思即可。  

接下来的工作,方远就不着急了,经过了AXM大赛的锻炼,他在编程方面的进步是肉眼可见的。  

他把写好的爬虫程序投放了出去,然后建立好与服务器的连接。  

接下来只需要等待,等待收集的数据可以支撑起语言库的建立。  

那个时候,就是完成这款软件的时刻。  

除了这方面的工作,方远现在最重要的是改善这款智能软件的学习算法。  

这可不是一件简单的事情,通过和qoqo的学习算法进行比较。  

方远发现这款软件的学习算法需要改进的地方还真不少。  

如果一一改进下来,还不如重新写一个算法省事呢!  

说易行难,看着并不麻烦的事情,却让方远花费最多的时间来完成。  

其他的部分,方远只需要按照系统给的程序员编写好即可,就连系统给的学习算法,方远都写了一遍。  

不为别的,就算是为了这款翻译软件可以快点上线,方远也应该这么做。  

至于改善学习算法的事情,并不是当前最重要的事情。  

方远打算先上线一个版本,然后通过更新的方式,神不知鬼不觉的将学习算法更换了。  

但是该做的工作一个都不能少,算法的升级工作,方远打算在语言数据库建立之前完成。  

“方远,方远!没想到你小子偷偷摸摸的就为我们333寝室争了这么大的光!”刚刚回到寝室的张华说道!  

“就是了,以后有这种好事别忘了咱们寝室的兄弟们啊!”孙文正跟着起哄道!  

“那是必须的,有好事我还能不想着咱们333的兄弟们吗?”方远拍了拍胸脯,脸上写满了你们躺好,我能carry全场的表情。  

不提方远这些室友,qoqo这款语音助手已经成为目前网络

本章未完,点击下一页继续阅读

章节目录