第十九章.与内二实验室的对话(5 / 6)

过多模态大语言模型,为我们提供精确的特征组,对应到内容,抽离关键字形成tag组关联模型,我们再根据词元组,查找对应的信息元编码,只要能够得到信息元编码,那么拟脑思维就可以开始了。”。

“可以,我们现在的大语言模型不只是类似于tag的token标识,而且还可以利用多维嵌入模组,在不同维度的空间进行语义定义,可以把观察对象多维度多层次拆分特征码组,然后定义对象描述,抽离成关键字,把多关键字在多元关联拟脑模型中,形成tag组模型,并把这个模型输出给你们这边,然后你们去定义或指向信息元,这种固定的流程和算法可以芯片化了。”鲁少校说道。

“对,基于词元的token可以形成关联模型吗,输出给我们。”安静又问。

这时,林久浩插了一句话:“师姐,不需要输出,我们可以把大语言模型的token,以及对内容定义的由嵌入向量组,直接对应到信息元的第二个地址上。”

安静也小声回了一句,“我知道,我们两个都需要,尤其是前期训练的时候,需要对方先输出给我们内容特征组。”

“小声讨论什么呢?还背着我。”鲁少校笑眯眯地看着。

“哦,老鲁,我们继续吧。”安静转头说道。

“其实我们前端的大语言模型可以直接向多元关联拟脑模型发出公式化指令,这个层面不需要提供tag类组,因为大语言模型可以识别信息元。”鲁少校又发出了惊人言论,这个言论正好于林久浩的一致了,鲁少校认为前端可以识别信息元,就能够发起思维行走,而林久浩的意见是,将前端大语言模型定义的向量数组,直接写在信息元编码地址位置,那么信息元与语义就对应上了,但是。。。

“确实是可以,你们大语言模型能够准确地了解语义,然后通过对语义的了解,对应到信息元上,直接发出公式化指令,但是,我们多元关联拟脑模型这边不只是执行呀,还需要在信息变动的过程中,定义信息元、修改信息元及查询信息元,所以,还是需要的。”安静说清楚了,这个训练的过程,必须先提交特征组,才能形成信息元与语义的对应,而且这个过程是需要不断训练,不断优化的,其中还涉及到内容固化与信息元固化的问题。

“确实啊,其实我们都多向对方走一步,两边的系统结合就更紧密了。”鲁少校也明白了,安静部门为什么强调需要特征组对应到信息元的过程内容。

“然后,你提供的特征码组模型,就会产生多个特征码循环输出及关联模型匹配的情况,这样可以更准确的命中信息元集合。”安静接着说道。

“你们那边在特征码定义上要注意分类等级,不是所有的特征码都是平等的关系。”鲁少校也提出要求。

“这一点已经考虑过了,特征码不但有等级,例如医疗、军事、人群等有些词本来就是大合集,同时我们还考虑的其他分类,例如,方位特征码、数量词特征码。而且这些基本的特征码直接采用基础信息元编码,可以直接进入多元关联拟脑模型计算。”安静接着说道。

“对,这些带有特殊含义的特征码,在处理芯片中的标识应该能区别出来,避免了信息字段无法直接计算的缺点。”鲁少校称赞了一下编码方式。

安静接着说道:“这就是我师父陆教授的想法,以前叫计算机,是做数值计算处理的,以后叫人工智能,要做信息思维处理。”。

大家又休息了一会儿,看看时间,再看看会议内容,该结束了。。。

鲁少校最后发出了三联问:“我们的工作界限定好了吧?我没事了吧?我可以走了吧?”。

“可以了,谢谢你老鲁,这智慧的脑袋不长草的。”安静开了个玩笑。

“你,安静,你‘过桥拆河’,拿别人的缺陷开玩笑不好。”鲁少校摸了摸自己的脑袋,出门回自己实验室了。

“师姐,这个鲁少校果然很厉害呀。”林久浩惊叹道。

“什么厉害,头秃的厉害?”安静继续开玩笑。

“不是,他几句话就说明白了,给我们提供关键字组成的特征码组关联模型,我们利用特征码组关联模型,再利用我们自己训练的nlp语义处理,找到对应的信息元编码。”林久浩兴奋地说道。

安静也点了点头,表示赞同,然后说道:“我也没想到,这老鲁进展这么快,看来我们要加倍努力了。”。

“师姐,如果他们的特征码组提供的不够全面,我们是不是就无法命中信息元编码了?”林久浩又提出了一个关键问题。

“集合类命中,分步命中,循环命中,类似rnn算法,这是你父亲早期做的多元关联拟脑就解决的问题呀,你忘了吗?”安静反问。

“哦,想起来了,如果看到一架飞机,无法准确知道型号,那么就命中它的上一个大类,飞行器。”林久浩比喻着。

“对呀,看到人,认不出是谁,至少知道是个人吧,可以