配资正规网上炒股
股票杠杆实盘 学术论文正被高价出售给大模型训练,作者却零收入
资料图。
越来越多的学术出版商正将研究论文卖给科技公司用以训练人工智能(AI)模型,而作者收入为零。
大语言模型(LLM)因训练数据问题再次引发争议。日前,国际著名期刊《自然》(《Nature》)杂志编辑伊丽莎白·吉普尼(Elizabeth Gibney)发布一篇题为《你的论文被用来训练人工智能模型了吗?几乎可以肯定》一文。文中作者表示,当前有越来越多的学术出版商正在将研究论文授权给科技公司,用于训练人工智能(AI)模型。有学术出版商借此赚取了2300万美元,而作者却收入为零。这些交易在很多情况下并未征求作者的意见,引发了部分研究人员的强烈不满。
“如果你的论文还没有被用作AI训练数据,很可能很快就会成为训练的一部分。”伊丽莎白·吉普尼在文中指出,当前学术论文作者在面对出版商出售其版权作品时几乎无权干涉。对于公开发表的文章,也没有现成机制来确认这些内容是否被用作AI训练数据。在大语言模型使用中,如何建立更加公平的机制保护创作者的权益,值得学术界和版权界广泛讨论。
根据《大国工匠人才培育工程实施办法(试行)》,大国工匠培育期一般为两年,全国总工会设立大国工匠激励保障专项资金,支持工匠开展项目攻关、技能传承等工作,如创建以其领衔、命名的创新工作室,支持若干在国家重大战略、重大工程、重大项目、重点产业中担当重任的培育对象开展创新攻关项目等,培育期满获得大国工匠证书后,比照全国劳模标准为人选落实待遇,并加强对大国工匠的推荐使用。张伟的成功入选无疑是对中金岭南将产业工人队伍建设改革与发展新质生产力紧密融合,大力培育知识型、技能型、创新型劳动者的充分肯定。
铆足“君子力学,昼夜不息”的劲头,常学常得淬炼“信仰之心”。理想信念是共产党人的精神支柱和政治灵魂,是共产党人精神上的“钙”。百年党史就是选择信仰、坚定信仰、追逐信仰的历史。历史和实践都证明,只有全体党员始终坚定理想信念,全党才能做到党性坚强、党纪严明。但是坚定的理想信念并不是与生俱来、凭空产生的。习近平总书记指出:“要炼就‘金刚不坏之身’,必须用科学理论武装头脑,不断培植我们的精神家园”。广大党员干部要保持孜孜不倦的学习热情、学而不辍的学习自觉,持续加强党的创新理论武装,打深打牢理论基础,解决好世界观、人生观、价值观这个“总开关”问题。要学好党章党规党纪,通过集中学、自主学、现场学,深刻领悟党性教育这门“心经”,切实从思想上正本清源、固本培元,永葆政治本色,确保思想不迷航、行动无偏差。
大语言模型(LLM)通常依赖从互联网上抓取的大量数据进行训练。这些数据包括数十亿片段的语言信息(称为“标记”),通过分析这些标记之间的模式,模型得以生成流畅的文本。学术论文因其内容丰富、信息密度高,相比大量普通数据更有价值,是AI训练中的重要数据来源。数据分析师斯特凡·巴克(Stefan Baack)来自全球非营利组织Mozilla基金会,他分析指出,科学论文对大语言模型的训练有很大帮助,尤其是在科学主题上的推理能力方面。正是由于数据的高价值,各大科技公司纷纷斥巨资购买数据集。
该文指出,今年《金融时报》与OpenAI达成协议,将其内容授权给后者;被称为“美国贴吧”的Reddit也与谷歌签署了类似的交易。这些交易体现出版商试图通过合法授权避免自己的内容被AI模型无偿抓取。
文章透露,上月英国的学术出版商Taylor & Francis与微软签署了一项价值1000万美元的协议,允许微软访问其数据以改进AI系统。而在6月,美国出版商Wiley通过向某家公司提供内容用于AI训练,收入高达2300万美元。而这些巨额收入与论文作者没有任何关系。
当前,研究人员正尝试用技术手段帮助作者识别其作品是否被用于AI模型训练。西雅图华盛顿大学的人工智能研究员露西·卢·王( Lucy Lu Wang) 称,如果一篇论文已经被用作模型的训练数据,在模型训练完成后就无法将这篇论文移除。
不过,即便能证明论文被用于AI训练,但在法律层面仍然面临争议。文中指出,出版商认为,使用未经授权的受版权保护内容进行训练是侵权行为;而另一种法律观点则认为,大语言模型并未直接复制内容,而是通过学习来生成新文本。
值得注意的是,并非所有研究者都反对将他们的作品用于AI训练。斯特凡·巴克表示,他很乐于看到自己的研究成果被用来提高AI的准确性,并且不介意AI“模仿”自己的写作风格。然而,他也承认,并非所有人都能轻松应对这一问题,尤其是那些面临AI竞争压力的职业,如艺术家和作家。
事实上,关于使用受版权保护的知识作品来训练 AI 模型的诉讼案件此前已引起过广泛关注。
8月14日股票杠杆实盘,《华盛顿邮报》报道,美国多名视觉艺术家和插画家对AI图像生成工具的集体诉讼案取得突破进展。他们曾指控Midjourney和Stability AI等初创公司在未经同意的情况下使用作品来训练AI模型。这起案件在本周取得了关键性进展。美国地区法官威廉·奥里克允许该案的关键部分继续推进,这意味着法庭已经决定某些指控有足够的法律证据,可以继续审理下去,接下来随着法律审理的过程,可能会披露这些公司在开发AI工具时的内部交流情况。■