qweasjd 发布于2024-03-11 03:59:10 体育赛场逐梦 16 次
在人工智能领域,理解和改进神经网络的行为一直是一个挑战。大型语言模型如ChatGPT的训练成本高昂,而微软研究人员提出了一个新的方法:使用儿童故事来训练微小模型,以此模拟神经网络的学习过程。
这种方法的灵感来自于果蝇基因组测序与人类基因组测序的类比。研究人员在较小的数据集上训练语言模型,从而更容易理解这些模型的行为。在最新的研究成果中,微软的研究人员发现,即使是比现有最先进系统小数千倍的语言模型,在接受儿童故事训练后,也能迅速学会讲述连贯且符合语法的故事。
为了生成这些训练数据,研究人员首先创建了一个由大型语言模型生成的合成儿童故事库。然后,他们使用这些故事训练了参数规模介于100万到3000万的模型,并比较了它们的性能。结果表明,较小的模型也能表现出色,尤其是在掌握语法和故事一致性方面。
这项研究表明,微小模型的成功为训练更大、更复杂的模型提供了宝贵的见解。同时,它也为如何构建高质量的训练数据集提供了新的思路。研究人员希望,这一发现能激发更多关于语言模型的科学研究。
和讯自选股写手风险提示:以上内容仅作为作者或者嘉宾的观点,不代表和讯的任何立场,不构成与和讯相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性,对此和讯不做任何保证和承诺。云天励飞2024年半年报:营收同比增长97.4%,边缘AI战略初显成效(yun tian li fei nian ban nian bao ying shou tong bi zeng zhang bian yuan zhan lue chu xian cheng xiao)
ChatGPT家族上新 OpenAI“草莓”落地?(jia zu shang xin cao mei luo di)
脉脉CEO林凡:大模型技术专家人才供需比仅0.25,相当于4岗争1人(mo mo lin fan da mo xing ji shu zhuan jia ren cai gong xu bi jin xiang dang yu gang zheng ren)
美měi国guó前qián景jǐng看kàn好hǎo的de行xíng业yè及jí其qí评píng估gū方fāng法fǎ在...
专zhuān题tí:三sān只zhǐ羊yáng带dài货huò美měi诚chéng月yuè饼bǐng陷xiàn风fēng...
2024年nián上shàng半bàn年nián酒jiǔ企qǐ增zēng速sù放fàng缓huǎn,主zhǔ要yào...
汇huì通tōng财cái经jīngAPP讯xùn—— 周zhōu四sì(9月yuè19日rì)亚yà市shì,...
雷léi凌líng车chē型xíng的de汽qì油yóu选xuǎn择zé及jí对duì车chē辆liàng性xìng能n...
赢yíng时shí胜shèng公gōng告gào,近jìn日rì,公gōng司sī收shōu到dào唐táng球qiú的...
记jì者zhě|赵zhào阳yáng(金jīn麒qí麟lín分fēn析xī师shī)戈gē 随suí着zhe2023...
快kuài讯xùn摘zhāi要yào...
快kuài讯xùn摘zhāi要yào...
技jì术shù入rù股gǔ资zī金jīn分fēn配pèi方fāng法fǎ与yǔ规guī则zé技jì术shù入rù股gǔ作...