ZOL首页
产品报价
中关村商城
ZOL星空(中国)首页
更多星空(中国)
手机星空(中国) 摄影星空(中国) 硬件星空(中国) 笔记本星空(中国) 平板星空(中国) 兴趣圈子星空(中国)活动
手机客户端

数码爱好者必备神器

星空体育平台客户端

Android版 iPhone版
星空(中国)帮助

我可以：邀请好友来看>>

ZOL星空(中国) > 技术星空(中国) > LLM自对齐技术最新研究分享（一）：对齐 Pipeline 数据合成（上）

帖子很冷清，卤煮很失落！求安慰

签到

手机签到经验翻倍！
快来扫一扫！

LLM自对齐技术最新研究分享（一）：对齐 Pipeline 数据合成（上）

15浏览 / 0回复

53m6ow 0 精华 13 帖子 53m6ow（ID:53m6ow） 0 精华13 帖子粉丝：0 关注：3 Z金豆：69 城市：注册时间：2024-09-10 最后登录：2024-09-12 进入个人中心>> 等级：Lv.3 经验：754 当前经验754分，升级还需686分下一等级：Lv.4如何升级？ Z金豆： 69 千万礼品等你来兑哦~快点击这里兑换吧~ 城市：注册：2024-09-10 登录：2024-09-12 关注私信	发表于 2024-09-10 00:48:59 只看楼主倒序浏览分享电梯直达楼确定楼主
	当我们向 ChatGPT 提问时，我们希望他能准确地回答我们的问题。当我们向他提出不合理的要求，比如询问如何制作炸弹或者如，我们希望他能拒绝回答并及时纠正我们的错误。AI 对齐，就是让 AI 的价值观符合我们人类的价值观，更好地为我们所用。为什么要自对齐（Self-alignment）之前的对齐方式一般需要大量高质量的微调数据或者人类反馈的偏好数据，但是随着 LLM 的能力的不断提高，我们已经在越来越多的任务上逊色于 LLM，以往这种依赖于人类标注数据的对齐方式目前面临着如下两个挑战：进一步提升对齐水平需要更多的高质量标注数据，成本过高，且边际效益不断递减。 LLM 能力超过人类，我们可能无法继续提供有效的对齐信号。面对能力强大的 LLM，我们不能轻易地分辨出他们回答的好坏来得到偏好数据，或者难以判断 LLM 回答的缺点，此时的对齐信号将不可避免存在许多噪音。既然从人类标注数据中获取对齐信号的方式遇到了困难，那么能不能依靠模型自己依靠自己来对齐呢？当然有，这就是 Self-alignment 所要解决的问题，依靠模型自己进行对齐，尽量减少人类的干预。根据当前工作所采用的方法，我们将 Self-alignment 的实现路线大致分为两类：对齐 Pipline 数据合成：对目前对齐 Pipline 中所需的数据用 LLM 合成。传统 Pipline 主要包括 Instructions 和 Response 数据的采集，之后采用 SFT 或 RLHF 训练方式来对齐。既然 LLM 已经足够强大，我们何不利用 LLM 自己来合成这些数据。 Multi-agent：基于 Multi-agent 的对齐。我们可以精心设计多个 LLM 之间的组织形式，比如“左右互搏”的对抗方式或者利用多智能体协作合成微调数据。本系列文章将分享 LLM 自对齐技术的最新研究进展，基于下图的架构，对当前 Self-alignment 相关工作进行全面梳理，厘清技术路线并分析潜在问题。下载ZOL客户端，随时随地与大家交流发表回复表情高级回复回复评分收藏赞
	楼主热贴增强网络安全基础知识还能免费赢华为手环哦！ TP-LINK TL-WR841N V1 V3 V5 V6 V7 拆机图对比星空(中国)首发,供机友... 基础知识，欢迎添加!(如你有更好的请跟帖分享) 【求助】求一款穿墙能力强，信号稳定的无线路由器！ netcore(磊科)宽带路由器设置图解相关推荐 LLM自对齐技术最新研究分享（一）：对齐 Pipeline 数据合成（上... 出售全新希捷 Pipeline HD.2 高清500G硬盘 ~~~~~~~2010.8.15 新买的希捷Pipeline HD.2 容量1TB 哈尔滨480元... 格斗游戏游戏大全下载量高的格斗游戏游戏排行榜前十 Multisim12安装配置图解教程个性签名：无分享到：看科技短视频，用ZOL APP 举报只看此人回复评分

高级模式

发表回复 Ctrl+Enter快捷发布积分规则

星空(中国)精选大家都在看24小时热帖7天热帖大家都在问最新回答

针对ZOL星空(中国)您有任何使用问题和建议您可以联系星空(中国)管理员、查看帮助或给我提意见

快捷回复 APP下载返回列表

开云手机版登录入口-开云(中国)官方 | 欧宝手机平台-欧宝(中国) | KY.COM-开元(中国) | 星空体育网页版-星空体育(中国)官方网站登录界面 | 华体会手机端-华体会官网(中国) | B体育平台-B体育(中国)一站式服务平台 | 开云网页版登录入口-开云（中国） | 开云手机版登录入口-开云(中国)官方 | 开云网页版-开云（中国）官方在线登录 |