大模型微调 和嵌入有什么区别?微调(fine-tuning),嵌入(embedding)的用法!

AI领导力,应该把AI当做人事工作对待。选用育留是人事部门HRBP应该干的活儿。

选AI就太重要了 ,好的AI模型才能够更好的出生产力和业绩!

AI模型选的好是关键,然后才是使用者的水平。

换句话说AI模型很关键。当然使用AI的领导力也很关键。

相比传统对领导力的要求,AI的好处是对领导力要求弱一些了。

AI没有情绪,AI接收无限制的PUA!

 

GPT擅长回答问题,但是只能回答它以前被训练过的问题,如果是没有训练过的数据,比如一些私有数据或者最新的数据该怎么办呢?

 

这种情况下通常有两种办法,一种是微调(fine-tuning),一种是嵌入(embedding)。

 

现在基于自然语言和文档进行对话的背后都是使用的基于嵌入的向量搜索。

OpenAI在这方面做的很好,它的Cookbook(http://github.com/OpenAi/openai-cookbook) 上有很多案例,最近他们对文档做了一些更新。

 

大模型GPT微调 和嵌入有什么区别?

微调就是在大模型的数据基础上做二次训练,事先准备好一批prompt-complition(类似于问答Q&A)的数据,生成新的模型,这个模型将会包含微调后的数据。

而嵌入则是每次向GPT发送消息(prompt)的时候,把你自己数据结果带上。

王建硕老师对于微调和嵌入有过精妙的比喻:

GPT就像一个已经训练好的家政阿姨,她懂中文,会做家务,但是对你家里的情况不了解。

微调就相当于阿姨第一次到你家干活的时候,你要花一小时时间告诉她家里的情况,比如物件的摆放、哪些地方不能动,哪些地方要重点照顾。

嵌入就相当于你省去了对阿姨进行二次培训的,而是在家里贴满纸条,这样阿姨一看到纸条就知道该怎么做了。

 

大模型LLM嵌入和微调哪个更好?

嵌入embedding的OpenAI的Cookbook也有类似的比喻:

微调就像你通过学习准备考试,是一种长期记忆,但过了一周后考试来临,模型可能会忘记一些,或者记错它从来没有读过的事实。

 

嵌入就像记笔记,是一种短期记忆,当考试的时候,你把笔记带上,随时翻看笔记,对于笔记上有的内容可以得到准确的答案。

640.jpg

什么是 Search-Ask-RAG?

也就是先在本地文档库中Search,拿到本地的数据结果,再去Ask,把搜索结果和问题一起交给GPT,这样GPT可以根据你提供的内容以及它模型中的数据,一起将结果返还给你。

 

必须用向量搜索RAG吗?

并非一定要基于向量的搜索,可以有多重搜索方式:

 

· 基于关键字搜索

 

· 基于图形的搜索

 

· 基于向量的搜索

 

对于技术实现的细节,OpenAI的Cookbook上也有详细的介绍。

 

LLM嵌入embedding有什么限制?

嵌入的文本搜索相对于微调来说,会有输入限制

嵌入的搜索提问方式相对于微调有一个缺点就是它每次附带的文本数量是有限制的,因为除了原始的问题,它还需要带上搜索出来的问题。

就好比你有成书架的教科书可以借鉴,但每次却只能翻看其中几页笔记。

如果你想构建一个对大量文本问答的系统,OpenAI建议(Search-Ask)的方法。

文本搜索相对于微调来说,search-ask的缺点是每次带上下文,所有会有输入字数限制,但是这种对于准确问答,前面有一层精准的search,准确度来说模型更容易得到正确的答案

 

这两种方案,用户自有数据也都必须做成q&a形式吗?

比如我有1MB的纯文本私有数据,没有经过人工q&a处理。我想对这些数据提问,当问题不在笔记中时才用

chatgpt。

 对于嵌入的方案,数据不必做成Q&A,但是需要拆成小块,因为Ask的时候也是受最大长度限制的,所以先搜索到文本块(chunk),然后提问的时候带上搜索出来的若干块

 

GPT 的上下文窗口限制,你怎么能在 pdf、书籍、文档等上“训练”它呢?推荐qwen-long模型进行内容提取和压缩!

你必须:将数据压缩成数据嵌入并将其传递给提示(称为“上下文压缩”),或者使用通义千问的pdf api long text 进行提取!如果嵌入的数据太大而无法放入上下文窗口,则需要使用矢量数据库并使用一些搜索/排名启发式方法分两部分回答查询:

1. 找到与此矢量化用户查询相关的所有相关文档,然后

2. 将前 n 个最接近的文档与用户查询一起传递到上下文中,并要求 ai 仅引用其上下文中的内容来回答用户问题。这称为“语义查询”

 

作者:默拉智能AI系统

 

免责声明:本文仅代表作者观点,与本站无关。对本文全部或者部分内容的真实性、完整性、及时性,本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本文如有侵权,请联系我们将立即删除。
您的账号尚未绑定微信,可能无法及时接收到平台的通知,点击 绑定微信
【内容创作承诺】

0 回答

排序

默认排序

时间排序

暂无评论,快来发表你的评论吧!

推荐阅读

【高效省钱】亚马逊捡漏广告打法,快来试试!
【高效省钱】亚马逊捡漏广告打法,快来试试!原创李真言小马说跨境小马说跨境微信号xiaomadeal功能介绍提供最前沿跨境电商行业资讯,分享跨境电商平台运营技巧和经验。发表于收录于合集小马推荐公众号跨境大罗洞观,一位想探索跨境一切的年轻人,有说产品,有说讯息,有分享实用技巧,有分析产品,关注我,你能找到你想要的答案。最新推荐内容:1.2023年将会流行的双站外推新品方法2.【亚马逊3.0时代】小卖家
21赞
1评论
12627浏览
全套推亚马逊新品的流程!(32篇)
全套推亚马逊新品的流程!(32篇)原创一味君一味君一味君微信号yiweijun222功能介绍七年亚马逊经验,精通站外站内的结合打法,毫无保留的分享亚马逊技巧,同时也喜欢交朋友。记得关注,可能你就是我的下一位朋友。发表于收录于合集#第1系列:亚马逊运营干货44个【本文约3000字,阅读需要8分钟】公众号推送改革,建议老铁们把一味君公众号【设为星标】,公众号文章才会第一时间推送给你。一,开篇之言二,推
19赞
0评论
12385浏览
韩国酷澎电商平台2023年第一季度净收入58亿美元
韩国酷澎电商平台2023年第一季度净收入58亿美元原创跨境365我做Coupang的365天我做Coupang的365天微信号Coupang365功能介绍这是Coupang平台粉丝最多的公众号,感谢认可!发表于收录于合集近日,韩国电商平台Coupang公布了2023年第一季度财报,其中营业净收入为58亿美元,同比增加20%,创下单季业绩历史新高。毛利润为14亿美元,营业利润为1.677亿美元,实现
22赞
0评论
12331浏览
你有认真对待广告分组吗?瞬间找到浪费钱的词
你有认真对待广告分组吗?瞬间找到浪费钱的词原创跨境人雨果哥藏龙荟跨境电商藏龙荟跨境电商微信号amz12306功能介绍分享跨境电商的干货,帮助从业者解开眼前困惑大熊自媒体联盟发表于收录于合集(2023跨境电商新周期!2本书带你学习系统,全面,立体式的亚马逊运营)随着跨境电商进入大众视野站内广告引流,推新成为必备技能现阶段大家都会开广告但广告的重点在于优化,而不是开启优化的重点也不仅仅是竞价和否词如果
22赞
0评论
12308浏览
Wayfair中文运营详解丨一本全面指导手册
Wayfair的运营与其他平台相比,有哪些特点和区别?如何有效地运营,实现迅速并且持续的订单增长?为了解答供应商的这些疑惑,Wayfair正式发布了中文运营指导手册!
19赞
0评论
12297浏览
亚马逊运营如何安全获取Review?
亚马逊运营如何安全获取Review?原创助教张瑞晓跨境电商赢商荟跨境电商赢商荟微信号dianshangwin_com功能介绍推送跨境电商新闻,分享跨境电商干货,传递跨境电商技巧,揭秘跨境电商黑幕。365天,每天更新不断,您口袋里的跨境电商小助手。发表于收录于合集1.Vine计划亚马逊邀请最值得信任的reviewer留评,卖家无法与reviewer直接联系,而为了保住自己的VineVoice地位,r
18赞
0评论
12248浏览
Coupang卖家被韩国本土店跟卖如何投诉
Coupang卖家被韩国本土店跟卖如何投诉原创跨境365我做Coupang的365天我做Coupang的365天微信号Coupang365功能介绍这是Coupang平台粉丝最多的公众号,感谢认可!发表于收录于合集很多Coupang卖家都深受跟卖的困扰,尤其是跨境店铺取消自发货之后,越来越多的卖家开始使用本土店进行恶意跟卖,连CGF也都不放过,很多卖家好不容易做起来一个链接,就被跟卖导致销量下降,非
20赞
0评论
12223浏览
物流费用暴涨!海运、FedEx价格直线飙升,卖家如何节省物流成本?
因红海局势再恶化,四大航运巨头(马士基、达飞、赫伯罗特及MSC)均宣布暂停航行至曼德海峡的红海航线。这也意味着他们会从红海区域转移到南非的好望角,而这一次绕行,将导致卖家成本增加、海运费上涨和船期延误等情况出现。依美国标普全球公司估算,从荷兰鹿特丹驶往新加坡的货轮,如果绕行好望角不走苏伊士运河的话,航程会增加40%。
19赞
0评论
12208浏览
​怎么提高Listing页面的转化率?
​怎么提高Listing页面的转化率?原创简单小马说跨境小马说跨境微信号xiaomadeal功能介绍提供最前沿跨境电商行业资讯,分享跨境电商平台运营技巧和经验。发表于收录于合集#亚马逊运营144个#亚马逊145个推荐公众号简单跨境,跨境何必想那么复杂?跟着简单跨境,化繁为简,简单,再简单,清晰,再清晰,明白再明白,简简单单,明明白白,跨境吧!!请叫我简单,简单致力于有趣的亚马逊知识分享,并结合视觉
19赞
0评论
12205浏览
TikTok Shop推进UK入仓背后的逻辑是什么?商家应该如何应对?
TikTokShop推进UK入仓背后的逻辑是什么?商家应该如何应对?原创Sky老思Sky老思Sky老思微信号skylaosi功能介绍TikTok电商干货知识分享,主要探索与分享TikTok电商方向内容。TikTok/跨境电商/小店/独立站/运营发表于收录于合集大家好,这里是Sky频道深耕TikTok与跨境电商,一起加油最近一周,TikTokShop跨境的商家们讨论最多的就是UK入仓问题了,由于这次
23赞
0评论
12201浏览
17
1
收藏
分享
举报