第二百二十二章 这个数据不太对 路大头
博士反而比较奇怪。
但是至少在这个组,能叫刘博士的,就只有刘大海,其他人都是直接名字相称。
这自然是因为刘大海的地位最高,鼎盛人工智能首席科学家。
刘大海看了看组员,指着屏幕上的一条标注问他:“你看这个,觉得怎么样?”
组员一头雾水,看了看,说:“挺好的啊。”
刘大海又指着另一条,问:“那你看这个呢?”
组员仔细地读了一遍,又说:“这个也挺好的……吧?”
他已经被刘大海问的有点儿不自信了。
刘大海接着问:“那你看这两条标注,有什么共同点?”
组员想了想,然后试探地说:“质量高?”
刘大海一愣,这倒是说对了,但是明显是没用的信息:“你不觉得,这些标注的语义里,对数据合规的引导太重了?”
啊?组员愣了愣,标注数据引导的是模型的行为模式,或者说,人格。
对合规有要求是很正常的吧,对齐训练不就是干这个的吗?
组员看着刘大海的样子,觉得他有点儿杞人忧天。
这批标注的质量是高,高得惊人。
你要是出去跟别人说,我现在有一批高质量的标注数据,质量太高了,还包含了合规引导。
那不会被当成是抱怨,只会被当成是炫耀。
欠打的那种炫耀。
要知道,鼎盛研究院做大模型的几个组,这段时间最苦恼的就是没有足够的高质量标注数据。
不管是外面外包的标注团队,还是鼎盛内部的标注团队,量是有的,但是质量就一眼难进,有的时候把标注加进去,模型的能力和理解力反而还下降了。
这些科学家们花在挑标注里的时间,可能比标注员花在标注上的时间都多。
组员没再搭话,接着去干自己的活儿了。
数据到位,大家都兴奋,忙的是连轴转。
刘大海看自己的怀疑没有人响应,摇了摇头,还是决定找上级汇报一下。
大模型这个事,马虎不得。
“你们先把下轮的训练停一下,等我回来再继续。”刘大海喊了一声,出了实验室,直奔林绍峰的办公室。
林绍峰是鼎盛研究院的vp,刘大海的直属领导。
两人虽然职级相同,但刘大海是ic,不管人,林绍峰却是管理岗,刘大海的考评都要林绍峰定,那自然还是有高低之分的。
刘大海是临时来的,在门口和秘书说了一声,过了一会,秘书请他进去。
“林总。”一进屋,刘大海就开门见山,“前天来的那批数据,我觉得有点儿问题,我建议训练先停一下。”
“哦?”林绍峰挑了挑眉,“你昨天不是还跟我说数据的质量很高,训练的效果也很好吗?怎么一天就变卦了。”
“不,没变。”刘大海说,“我不是说质量问题,我是觉得,里面的逻辑引导好像有点儿重。”
“有什么影响呢?”林绍峰问道。
“这个还说不好,我还得再琢磨琢磨。”刘大海实话实说。
林绍峰皱了皱眉头,坤元可是现在全集团的重点,他的
章节内容不完整,请退出阅读模式查看完整内容!