“这个翻译软件应用在用户体验上要做到尽量傻瓜式,越简单越好。”
罗晟望着许勇有条不紊的说道:“例如,如果我不懂英语,我打开一个英语网页当场傻眼,看不懂。怎么做到呢?当用户进入一个他完全看不懂的网页时,他的电脑如果运行了我们的翻译服务,该页面的文字信息应该立刻自动翻译成他的母语文字,这样他就一目了然。”
许勇思考了片刻便说道:“软件的兼容问题会成为最突出的矛盾体。”
罗晟笑道:“这一点并不困难,我们完全可以通过云计算服务的相关技术支持来解决这个问题,我们当然不会去改动原网页,否则页面会产生崩溃的可能,但是我们可以通过解析然后在云端运行,然后在客户端呈现一个继承的子页,原页是父项,两者既独立又关联。”
冯毅眼前一亮,道:“这是个可行的办法,算是一种云服务的开发。”
众人心中莫名的感到惊叹,合着这个想法恐怕不是老大刚刚想出去来的,而是在去年甚至更久就已经有了。
坐在这里的人都是具备工程师和开发者的能力,片刻之后便意识到大数据和云计算服务将会在其中起到核心骨架支撑的作用,是实现这一切的前提,而再往前就是人工智能了。
换句话说,这个设想可以把即时翻译应用包装在云计算服务进行销售,可以分为企业级服务和个人服务两个板块。
企业级服务,例如蓝星科技这样的网站,其社交属性和跨国的特性,就很需要这样的服务,买了这样的服务支持,蓝色空间BlueSpace、微博MicroBlog、蓝星视频BluestarVideo等用户在登陆这些网站的时候,就不需要购买了,直接就可以免费使用,因为网站本身已经购买了这样的服务。
当然这本来是就是蓝星科技自己的云服务支持,自然是免费的了。
可是别的企业网站呢?例如微软、例如谷歌、雅虎等等,他们想要这种解决方案,就得购买。
还有个人版也是。
罗晟望着众人说道:“如果现在就实现强人工智能一切都会变得简单多了,但这不是一时半刻就能实现的,好在云计算服务可以让我们提前优化许多应用场景,但这需要超大量的数据和足够的算力资源来支持,我们的解决方案可采用分布式计算,拥有超大规模的数据中心来支持词库的收录,并且支持实况更新词库。”
数据时代,数据就是一切,垄断了数据,等同于垄断了全世界。
罗晟补充道:“所以,接下来蓝星科技应该要在世界范围内招募包括语言学家、工程师、分析师、统计学等专业人才、还需要招募语言学的考古队,当然也可以直接赞助的方式合作,还要派出大量的线下考研团队深入世界各地去采集各类文化、风俗、俚语等信息,博物馆、图书馆等等,可开放的都要采集,不开放的争取说服对方,给一笔钱或者合作什么的都行。”
许勇笑道:“看来我们也得给维基百科一笔赞助费了。”
当这些数据词库等信息都收拢在数据中心,这是一个基本的前提条件,把数据库建立完成了,才能做到可对照的解析翻译。
而数据中心的打造会不断的扩大,因为这个世界每时每刻都在产生新的词汇,尤其是网络流行语,这个反而是最容易采集的,能在网络上解决收录问题是最简单的。
难的地方是一些小众类、线下类的,你还不能忽略,别看他们小众,但却分散开来的,统计一下汇总依然是巨量的。
数据库打造完成了,这对开发人工智能有着巨大的裨益,也就可以通过开发一个巨大的分发系统,通过用户访问数据中心请求解析再通过云端而实现用户的翻译需求。
如此一来,海量的数据支持也能承载初级人工智能的诞生,最后人工智能再反哺回去,诞生初级人工智能才能往强人工智能升级,这一点在罗晟的上一世已经得到了证明,所以不会有任何怀疑,必须这么做。
许勇琢磨着自言自语:“这是一项浩瀚无边的超级数据工程,得投入多少人力、物力、财力才能实现?”