一、Al纪元,ChatGPT
1.ChatGPT: AI的旷世巨作
ChatGPT是一种聊天机器人软件:全名为Chat Generative Pre-Trained Transformer,是OpenAl于2022年11月推出的聊天机器人,该软件使用方便快捷,只需向ChatGPT提出需求,即可实现文章创作、代码创作、回答问题等功能。
ChatGPT 功能强大: ChatGPT目前仍以文字方式互动,而除了通过人类语言交互外,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。
2.ChatGPT的背后:强大的AI公司OpenAl
OpenAl是美国一个人工智能研究实验室,是促进和发展友好的人工智能,使人类整体受益。OpenAl成立于2015年底,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。此外根据新浪消息,埃隆·马斯克为公司的创始人,但于2018年提出离职,原因是特斯拉与Al的关联越来越深,外界担忧特斯拉将运用OpenAl的技术实现升级。
根据Insider消息,ChatGPT于2022年11月发布后,OpenAl估值已涨至290亿美元;此外根据新浪科技消息,OpenAl最近告诉投资者,预计2023年营收将会达到2亿美元,2024年将达到10亿美元。
3.ChatGPT工作原理:基于人类反馈对语言模型进行强化学习
OpenAl基于GPT模型,使用监督学习和强化学习的组合来调优ChatGPT,其中人类反馈强化学习(RLHF)使ChatGPT趋近人类价值观及意图。
(1)︰收集数据微调GPT3.5模型:预训练的GPT3.5在少量已标注的数据上进行调优,以学习从给定的提示词(prompt)列表生成输出的有监督的策略;2)模拟人类偏好,训练奖励模型:对大量的模型输出进行排序,创建了一个由比较数据组成的新数据集。在此数据集上训练新模型,被称为训练奖励模型(Reward Model,RM) ; 3)使用奖励模型,基于PPO进行最优化:强化学习被应用于通过优化 RM模型来调优模型,所使用的特定算法称为近端策略优化(PPO)。
源达信息证券研究所隶属于河北源达信息技术股份有限公司(经营证券期货业务许可证:911301001043661976)源达信息证券研究所由吴起涤所长领衔,汇聚了一批业内顶尖的分析师和研究员,专注于宏观经济研究、行业研究和公司研究,致力于为投资者、政府、企业提供最有价值的研究咨询服务。