第五百六十八章神经网络(2 / 2)
因此姜老医生才猜出来了,陆语想要说什么。
既然一家医院的数据量不够完成要求,那就号召其他医院一起把自己的数据贡献出来。
反正成果如果真正能够做出来的话,能够受益的也不仅仅只是一家两家的医院,而是整个龙国的大小患者们!
“您算是理解了我的意思。”
“但是我们需要的也不仅仅只是数据量,光是足够的大量数据库,恐怕也不足以满足神经网络的深度学习要求。”
陆语道。
“什么意思?”
姜老医生问道:“除了需要建立起一个足够大量的数据库之外,还有什么额外的要求吗?”
“老师,他说的应该是数据质量的要求。”林医生突然说道。
“没错!”
“我的意思就是这个。”陆语转头看了一眼林医生,眼神中流露出了一抹满意之色:
“看来林医生您对于人工智能技术也有些了解啊?”
“哪里哪里,我哪算得上是有什么了解?我只是以前看过类似的科普视频罢了。”
林医生非常谦虚的笑道:
“毕竟现在这个年代。”
“什么事情不多讲究一个+吗?玩互联网要搞什么互联网+概念,人工智能也有一个所谓的人工智能+的概念。”
“这些概念到底能不能够落到实际上,虽然是一个未知数,但是概念本身提出来,还是能够帮咱们这些大众们了解一些相关的技术嘛。”
虽然说在医术上,他比起自己的老师有不小的差距。
但...或许也是得益于林医生比较年轻一点的原因,他对于人工技术的知识和把握相比较于姜老医生而言要更加丰富一些。
所以当陆语提到数据这个问题的时候,他第一反应想到的不是数据的量,而是数据的质量。
对于人工智能需要学习的数据库而言,光是数据量极为庞大...那是远远不够的,还需要把控一个数据的质量问题!
如果质量不够高的话,那么这些数量也就是变成了所谓的毒数据。
把这些读数据喂给深层次的人工智能神经网络学习,非但无法起到众人想要他们起到的效果,反倒可能会起到副作用!
关于这一点用人工智能的概念来讲述的话,要理解的确是有一点难度。
但是用生活中其他的例子来讲述,那就简单很多了。这就像是下棋,如果你天天跟一个臭棋篓子下的话,恐怕技术非但不会提升,还会变得越来越臭。
但是如果你每天都跟不同的高手来较量,认真广泛地去学习不同的棋谱。
那么你的棋艺想要不精进都难!
这也就是数据的质量问题带来的差异性,同样大小的数据包,质量不同的话喂给一样的人工智能算法模型,最后得到的结果也会大大不同!
“也就是说我们还需要对数据进行一轮筛选?”姜老医生有些弄明白了。
“没错。”
“如果这个数据库能够顺利的建造下来。”
“那么在将数据扔进数据库里面之前,我们还需要对数据进行一个初步的筛查,把那部分有毒的毒数据给筛出去。”
“确保我们喂给模型的....是一个真正有效的数据!”
陆语非常认真的说道。
“如果这一点要落实下来的话,难度大吗?”姜老医生再度问道。
他是医学界的人,理论上来说应该是陆语问他才对。
但是目前涉及到的人工智能领域问题还是陆语的了解比他更多一些,到底是多毒的数据才能算毒数据,多好的数据才能够算优质数据?
又需要多少的数据才能够建立一个合适完善的数据库,喂给人工智能算法模型?
这些问题的答案显然都掌握在陆语的手里。
所以对于迫切想要弄清楚这一切的姜老医生而言,自然也就只能把这个疑惑抛给陆语。
“这个您放心,既然我今天向您提出这个问题,那就证明这个问题是可以解决的。”
“生殖数据库的问题,恰恰还是我们龙国的一个优势。”
“优势?此话怎讲。”姜老医生已经隐隐有些猜到陆语接下来要说什么了,只不过还是想听陆语把话说完。
“这就跟我们龙国外科手术大夫的水平是一个道理。”
“相比较于海外的绝大多数国家,我们龙国的人口更多,而且在保持如此高的人口同时,还拥有着至少是平均水平以上的医疗条件。”
“这就导致我们在有一个大量的数据同时,绝大多数的数据质量也还过得去。”
“这跟那些文字工作者的情况还不一样。”
想到这里,陆语忍不住笑了。
龙国地大物博,人口广泛。
在这个问题上,人口资源也是一个特殊的优势,病人多了病例就多能够作为人工智能深度学习的数据也就变得更多!
这还不像是前世的一些语言类人工智能模型。
前世国内捣鼓出来的一些语言类人工智能模型遇到的最大问题...
并不仅仅只是人工智能模型的这个模型本身不够智能,而是喂进去的数据存在着大量的毒数据,这也得益于网上的大量营销号捣鼓出来的各种营销稿、b家号。
这个问题至少在医学界是不存在的。
营销号敢在新闻方面乱搞,玩标题党和注水数据...那是因为乱搞了,也不会真的有人过来捉他们。
但是医疗层面就不同了!
人命关天啊!
涉及到人命的问题,谁敢胡来?最近转码严重,让我们更有动力,更新更快,麻烦你动动小手退出阅读模式。谢谢
↑返回顶部↑