韩城市网站建设局电话重庆网站建设找重庆最佳科技

张小明 2026/1/13 7:09:05
韩城市网站建设局电话,重庆网站建设找重庆最佳科技,网站模板移植,重庆seo网站排名优化RAG检索增强生成技术#xff0c;“先检索、后生成”的模式#xff0c;能有效地将精准的外部知识与大模型结合#xff0c;从而在不超出限制的前提下#xff0c;让模型能够回答私域知识问题。在你的大模型应用中引入RAG方案能够扩展大模型所能处理的知识范围#xff0c;本篇…RAG检索增强生成技术“先检索、后生成”的模式能有效地将精准的外部知识与大模型结合从而在不超出限制的前提下让模型能够回答私域知识问题。在你的大模型应用中引入RAG方案能够扩展大模型所能处理的知识范围本篇我们将基于阿里云大模型ACP培训课程内容更深入地了解RAG工作流程并尝试提升你的RAG应用问答准确度。1RAG的工作流程及原理2RAG应用效果评估3RAG应用各个环节常见问题及改进策略1.熟悉 RAG 的工作流程RAGRetrieval Augmented Generation检索增强生成是一种结合了信息检索和生成式模型的技术能够在生成答案时利用外部知识库中的相关信息。它的工作流程可以分为几个关键步骤解析与切片、向量存储、检索召回、生成答案等正如前言提到的你需要让大模型拿到正确的参考书才能给出正确的答案。因此你可以尝试增加每次拿到参考书的数量增加召回的文档切片数量或者将参考书中的知识点整理成结构化的表格文档内容结构化。基本优惠思路1.1 让大模型获取到更多参考信息既然知识库中存在我们想要的信息那么你可以通过增加一次性召回的文档切片数量的方式从而扩大检索范围提升找到相关信息的概率也即是增加代码中召回文档切片的数量观察召回效果是否得到了提升。1调整代码index rag.load_index()query_engine index.as_query_engine(streamingTrue,similarity_top_k5# 一次检索出 5 个文档切片默认为 22评估改进效果为了评估改进效果需要引入Ragas量化改进效果。如何通过 Ragas 对 RAG 应用进行评测如何通过 Ragas 分数来定位并解决问题RAG 自动化评测体系为了系统化地评测RAG系统业界出现了一些非常实用的开源自动化评测框架这些框架通常会从以下几个维度进行评估✧ 召回质量 (Retrieval Quality) RAG系统是否检索到了正确且相关的文档片段✧ 答案忠实度 (Faithfulness) 生成的答案是否完全基于检索到的上下文没有“胡编乱造”幻觉✧ 答案相关性 (Answer Relevance) 生成的答案是否准确地回答了用户的问题✧ 上下文利用率/效率 (Context Utilization/Efficiency) 大模型是否有效地利用了所有提供给它的上下文信息这与我们之前提到的“Lost in the Middle”和“知识浓度”密切相关1.1.1Ragas评估效果Ragas的评估指标高度契合RAG系统的痛点主要包括1整体回答质量的评估Answer Correctness用于评估 RAG 应用生成答案的准确度。2生成环节的评估✧ Answer Relevancy用于评估 RAG 应用生成的答案是否与问题相关。✧ Faithfulness用于评估RAG应用生成答案和检索到的参考资料的事实一致性。3召回阶段的评估✧ Context Precision用于评估 contexts 中与准确答案相关的条目是否排名靠前、占比高信噪比。✧ Context Recall用于评估有多少相关参考资料被检索到越高的得分意味着更少的相关参考资料被遗漏。Ragas 还提供了很多其他的指标这里就不一一介绍你可以访问Ragas的文档来查看更多指标的适用场景和工作原理。Ragas支持的指标可以访问https://docs.ragas.io/en/stable/concepts/metrics/available_metrics/1.1.2上下文是 RAG 的生命线当用户提出一个问题时大模型通过阅读理解你提供的上下文Context 来给出回答。上下文决定了大模型能否给出准确、完整的答案。如果上下文缺失重要知识点或存在错误、无关的内容大模型就无法给出正确的结论。为了不丢失有效知识有人提出把全部可用资料“一股脑全部灌给大模型”让大模型来做甄别结果产生了一个更复杂的问题即使某个关键线索确实存在于你提供的大量资料中但如果它被埋藏在海量的无关信息里大模型也很可能会“视而不见”这便是 RAG 系统中常说的“Lost in the Middle”现象。RAG精度的瓶颈往往不在于大模型本身是否足够“聪明”而在于你提供给它的上下文Context的“知识浓度”。一个高质量的上下文理应具有较高的知识浓度意味着其中的相关信息密度高、噪音少、与问题直接关联。能让大模型准确地专注问题核心得出正确结论。因此你提供的上下文质量直接决定了 RAG 系统的上限。在Ragas中Context Recall 和 Context Precision 就是来衡量召回的上下文的有效性的。你可以通过分析这两个指标来确认你的RAG系统召回上下文的质量有没有提升。1context recallcontext recall指标评测的是RAG应用在检索阶段的表现。如果该指标得分较低你可以尝试从以下方面进行优化✧ 检查知识库知识库是RAG应用的源头如果知识库的内容不够完备则会导致召回的参考信息不充分从而影响context recall。你可以对比知识库的内容与测试样本观察知识库的内容是否可以支持每一条测试样本这个过程你也可以借助大模型来完成。如果你发现某些测试样本缺少相关知识则需要对知识库进行补充。✧ 更换embedding模型如果你的知识库内容已经很完备则可以考虑更换embedding模型。好的embedding模型可以理解文本的深层次语义如果两句话深层次相关那么即使“看上去”不相关也可以获得较高的相似度分数。2context precision与context recall一样context precision指标评测的也是RAG应用在检索阶段的表现但是更注重相关的文本段是否具有靠前的排名。如果该指标得分较低你可以尝试context recall中的优化措施并且可以尝试在检索阶段加入rerank重排序来提升相关文本段的排名。3answer correctnessanswer correctness指标评测的是RAG系统整体的综合指标。如果该指标得分较低而前两项分数较高说明RAG系统在检索阶段表现良好但是生成阶段出了问题。你可以尝试前边教程学到的方法如优化prompt、调整大模型生成的超参数如temperature等你也可以更换性能更加强劲的大模型甚至对大模型进行微调后边的教程会介绍等方法来提升生成答案的准确度。1.2给大模型结构更清晰的参考信息在实际应用中文档的组织结构对检索效果有着重要影响。想象一下同样的信息放在一个结构清晰的表格中和散落在一段普通文字里哪个更容易查找和理解显然是前者。大语言模型也是如此。当把原本在表格中的信息转换成普通文本时虽然信息本身没有丢失但结构性却降低了。这就像是把一个整齐的抽屉变成了一堆散乱的物品虽然东西都在但查找起来就没那么方便了。1重建索引Markdown格式是一个很好的选择因为它✧结构清晰层次分明✧语法简单易于阅读和维护✧特别适合RAG检索增强生成场景下的文档组织2评估改进效果改为Markdown格式之后可以重新评估RAG应用效果。2. RAG应用各个环节与改进策略为了进一步优化RAG应用效果接下来将从 RAG 中的每一个环节入手尝试优化 RAG 的效果。2.1 文档准备阶段在没有大模型之前我们会根据用户所提问题积累知识库并共享其他人。在构建 RAG 应用时这一过程同样不可缺少。✧ 意图空间我们可以把用户提问背后的需求绘制成点这些点组成了一个用户意图空间。✧ 知识空间而你沉淀在知识库文档中的知识点则构成了组成一个知识空间。这里的知识点可以是一个段落、或者一个章节。当我们将意图空间和知识空间投影到一起会发现两个空间存在交集与差异用户意图空间vs知识空间映射示意。这些区域分别对应了我们后续的三个优化策略。✧ 重叠区域即可以依靠知识库的内容来回答用户问题的部分这是 RAG 应用效果保障的基础。对于这部分用户意图你可以通过优化内容质量、优化工程和算法不断地提升回答质量。✧ 未被覆盖的意图空间因为缺乏知识库内容的支撑大模型容易输出“幻觉”回答。例如由于新业务发展我们需要引入“qRPC核酸检测扩增曲线分析方面的理论与技术“但知识库中没有相关文档不论如何改进工程算法RAG 应用都无法准确回答这一问题。你需要做的是主动补充缺漏的知识不断跟进用户意图空间的变化。✧ 未被利用的知识空间召回不相关知识点可能会干扰大模型的回答。因此需要你优化召回算法避免召回无关内容。此外你还需要定期查验知识库剔除无关内容。在尝试优化工程或算法之前你应该优先构建一套可以持续收集用户意图的机制。通过系统化采集真实用户需求来完善知识库内容并邀请对用户意图有深刻理解的领域专家参与效果评估形成数据采集-知识更新-专家验证的闭环优化流程保障RAG 应用的效果。2.2 文档解析与切片阶段首先RAG 应用会解析你的文档内容然后对文档内容进行切片。大模型在回答问题时拿到的文档切片如果缺少关键信息会回答不准确如果拿到的文档切片非关联信息过多噪声也会影响回答质量。即过少或过多的信息都会影响模型的回答效果。因此在对文档进行解析与切片时需要确保最终的切片信息完整但不要包含太多干扰信息。2.2.1 问题分类及改进策略在文档解析与切片阶段你可能会遇到以下问题类别细分类型改进策略场景化示例文档解析文档类型不统一部分格式的文档不支持解析比如前面用到的 SimpleDirectoryLoader 并不支持 Keynote 格式的文件开发对应格式的解析器或转换文档格式Keynote文件-Keynote 解析器或将文件转换为支持的格式如 PDF-PDF解析器。已支持解析的文档格式里存在一些特殊内容比如文档里嵌入了表格、图片、视频等改进文档解析器例如某文档中包含了大量的表格和图片现有解析器无法正确提取表格中的信息。可以改进解析器使其能够处理表格和图片。………文档切片文档中有很多主题接近的内容比如工作手册文档中需求分析、开发、发布等每个阶段都有注意事项、操作指导扩写文档标题及子标题「注意事项」「需求分析注意事项」建立文档元数据打标例如某文档中包含多个阶段的注意事项用户提问“需求分析的注意事项是什么”时系统返回了所有阶段的注意事项。可以通过扩展标题和打标来区分不同阶段的内容。文档切片长度过大引入过多干扰项减少切片长度或结合具体业务开发为更合适的切片策略例如某文档的切片长度过大包含了多个不相关的主题导致检索时返回了无关信息。可以减少切片长度确保每个切片只包含一个主题。文档切片长度过短有效信息被截断扩大切片长度或结合具体业务开发为更合适的切片策略例如某文档中每个切片只有一句话导致检索时无法获取完整的上下文信息。可以增加切片长度确保每个切片包含完整的上下文。………2.2.2 借助百炼解析 PDF 文件在前面的学习过程中为了让你更快地看到格式转换带来的效果直接提供了一份从 PDF转换的Markdown格式文档开源PDF解析器Grobid。但在实际工作中编写代码将PDF妥善地转为 Markdown并非易事。实际工作中你也可以借助百炼提供的 DashScopeParse 来完成 PDF、Word 等格式的文件解析。DashScopeParse 背后使用了阿里云的文档智能服务能够帮助你从 PDF、Word 等格式的文件中识别文档中的图片、提取出结构化的文本信息。2.2.3 使用多种文档切片方法在文档切片的过程中切片方式会影响检索召回的效果。让我们通过具体例子来了解不同切片方法的特点。2.2.3.1 Token 切片适合对 Token 数量有严格要求的场景比如使用上下文长度较小的模型时。示例文本 “LlamaIndex是一个强大的RAG框架。它提供了多种文档处理方式。用户可以根据需要选择合适的方法。”使用Token切片(chunk_size10)后可能的结果切片1 “LlamaIndex是一个强大的RAG”切片2 “框架。它提供了多种文”切片3 “档处理方式。用户可以”token_splitter TokenTextSplitter( chunk_size1024, chunk_overlap20)evaluate_splitter(token_splitter, documents, question, ground_truth,Token)2.2.3.2 句子切片这是默认的切片策略会保持句子的完整性。同样的文本使用句子切片后切片1: “LlamaIndex是一个强大的RAG框架。”切片2: “它提供了多种文档处理方式。”切片3: “用户可以根据需求选择合适的方法。”sentence_splitter SentenceSplitter( chunk_size512, chunk_overlap50)evaluate_splitter(sentence_splitter, documents, question, ground_truth,Sentence)2.2.3.3 句子窗口切片每个切片都包含周围的句子作为上下文窗口。示例文本使用句子窗口切片(window_size1)后切片1 “LlamaIndex是一个强大的RAG框架。” 上下文 “它提供了多种文档处理方式。”切片2 “它提供了多种文档处理方式。” 上下文 “LlamaIndex是一个强大的RAG框架。用户可以根据需求选择合适的方法。”切片3 “用户可以根据需求选择合适的方法。” 上下文 “它提供了多种文档处理方式。”sentence_window_splitter SentenceWindowNodeParser.from_defaults( window_size3, window_metadata_keywindow, original_text_metadata_keyoriginal_text)# 注意句子窗口切片需要特殊的后处理器query_engine index.as_query_engine( similarity_top_k5, streamingTrue,node_postprocessors[MetadataReplacementPostProcessor(target_metadata_keywindow)])evaluate_splitter(sentence_window_splitter, documents, question, ground_truth,Sentence Window)2.2.3.4 语义切片根据语义相关性自适应地选择切片点。示例文本 “LlamaIndex是一个强大的RAG框架。它提供了多种文档处理方式。用户可以根据需求选择合适的方法。此外它还支持向量检索。这种检索方式非常高效。”语义切片可能的结果切片1 “LlamaIndex是一个强大的RAG框架。它提供了多种文档处理方式。用户可以根据需求选择合适的方法。”切片2 “此外它还支持向量检索。这种检索方式非常高效。” 注意这里是按语义相关性分组的semantic_splitter SemanticSplitterNodeParser( buffer_size1, breakpoint_percentile_threshold95, embed_modelSettings.embed_model)evaluate_splitter(semantic_splitter, documents, question, ground_truth,Semantic)2.2.3.5 Markdown 切片专门针对 Markdown 文档优化的切片方法。示例 Markdown 文本# RAG框架LlamaIndex是一个强大的RAG框架。## 特点- 提供多种文档处理方式- 支持向量检索- 使用简单方便### 详细说明用户可以根据需求选择合适的方法Markdown切片会根据标题层级进行智能分割切片1 “# RAG框架\nLlamaIndex是一个强大的RAG框架。”切片2 “## 特点\n- 提供多种文档处理方式\n- 支持向量检索\n- 使用简单方便”切片3 “### 详细说明\n用户可以根据需求选择合适的方法。”markdown_splitter MarkdownNodeParser()evaluate_splitter(markdown_splitter, documents, question, ground_truth,Markdown)在实际应用中选择切片方法时不必过于纠结你可以这样思考✧ 如果你刚开始接触 RAG建议先使用默认的句子切片方法它在大多数场景下都能提供不错的效果✧ 当你发现检索结果不够理想时可以尝试处理长文档且需要保持上下文句子窗口切片➢ 文档逻辑性强、内容专业语义切片可能会有帮助➢ 模型总是报 Token 超限Token 切片可以帮你精确控制➢ 处理 Markdown 文档别忘了有专门的 Markdown 切片没有最好的切片方法只有最适合你场景的方法。你可以尝试不同的切片方法观察 Ragas 评估结果找到最适合你需求的方案。学习的过程就是不断尝试和调整的过程2.3 切片向量化与存储阶段文档切片后你还需要对其建立索引以便后续检索。一个常见的方案是使用嵌入Embedding模型将切片向量化并存储到向量数据库中。在这一阶段你需要选择合适的 Embedding 模型以及向量数据库这对于提升检索效果至关重要。2.3.1 了解 Embedding 与向量化Embedding 模型可以将文本转换为高维向量用于表示文本语义相似的文本会映射到相近的向量上检索时可以根据问题的向量找到相似度高的文档切片。平面坐标系中的有向线段是 2 维向量。例如从原点 (0, 0) 到 A (xa, ya) 的有向线段可以称为向量 A。向量 A 与向量 B 之间的夹角越小也就意味着其相似度越高。2.3.2 选择合适的 Embedding 模型不同的 Embedding 模型对相同的几段文字进行计算时得到的向量可能会完全不同。通常越新的 Embedding 模型其表现越好。例如前文中使用的是阿里云百炼上提供的 text-embedding-v2。如果换成更新的版本 text-embedding-v3 你会发现即使不去做前面的优化检索效果也会有一定的提升。2.3.3 选择合适的向量数据库在构建 RAG 应用时,你有多种向量存储方案可以选择,从简单到复杂依次是2.3.3.1 内存向量存储最简单的方式是使用 LlamaIndex 内置的内存向量存储。只需安装 llama-index 包,无需额外配置,就能快速开发和测试 RAG 应用from llama_index.core import VectorStoreIndex# 创建内存向量索引index VectorStoreIndex.from_documents(documents)优点是快速上手适合开发测试缺点是数据无法持久化且受限于内存大小。2.3.3.2 本地向量数据库当数据量增大时,可以使用开源的向量数据库,如 Milvus、Qdrant 等。这些数据库提供了数据持久化和高效检索能力优点是功能完整、可控性强缺点是需要自行部署维护。2.3.3.3 云服务向量存储对于生产环境,推荐使用云服务提供的向量存储能力。阿里云提供了多种选择✧ 向量检索服务DashVector按量付费、自动扩容适合快速启动项目。详细功能请参考向量检索服务DashVector。✧ 向量检索服务 Milvus 版兼容开源 Milvus便于迁移已有应用。详细功能请参考向量检索服务 Milvus 版。✧ 已有数据库的向量能力如果已使用阿里云数据库(RDS、PolarDB等)可直接使用其向量功能云服务的优势在于✧ 无需关注运维自动扩容✧ 提供完善的监控和管理工具✧ 按量付费成本可控✧ 支持向量 标量的混合检索提升检索准确性选择建议✧ 开发测试时使用内存向量存储✧ 小规模应用可以使用本地向量数据库✧ 生产环境推荐使用云服务可根据具体需求选择合适的服务类型2.4 检索召回阶段检索阶段会遇到的主要问题就是很难从众多文档切片中找出和用户问题最相关、且包含正确答案信息的片段。从切入时机来看可以将解法分为两大类✧ 在执行检索前很多用户问题描述是不完整、甚至有歧义的你需要想办法还原用户真实意图以便提升检索效果。➢ 问题改写➢ 问题扩写 通过增加更多信息让检索结果更全面➢ 基于用户画像扩展上下文 结合用户信息、行为等数据扩写问题➢ 提取标签 提取标签用于后续标签过滤向量相似度检索➢ 反问用户➢ 思考并规划多次检索✧ 在执行检索后你可能会发现存在一些无关的信息需要想办法减少无关信息避免干扰下一步的答案生成。➢ 重排序 ReRank 过滤 多数向量数据库会考虑效率牺牲一定精确度召回的切片中可能有一些实际相关性不够高➢ 滑动窗口检索 在检索到一个切片后补充前后相邻的若干个切片。这样做的原因是相邻切片之间往往存在语义联系仅看单个切片可能会丢失重要信息。 滑动窗口检索确保了不会因为过度切分而丢失文本间的语义连接。2.5 生成答案阶段现在大模型会根据你的问题和检索召回的内容生成最终的答案。然而这个答案可能还是不及你的预期。你可能会遇到的问题有1没有检索到相关信息大模型捏造答案。2检索到了相关信息但是大模型没有按照要求生成答案。3检索到了相关信息大模型也给出了答案但是你希望 AI 给出更全面的答案。为了解决这些问题你可以从以下角度着手分析与解决1选择合适的大模型简单常识问题、推理问题、专业领域2充分优化提示词模板明确要求不编造答案、添加内容分隔标记、根据问题类型调整模板3调整大模型的参数temperature、seed、top_p、top_k、max_tokens4调优大模型如果上述方法都做了充分的尝试仍然不及预期或者希望有更进一步的效果提升你也可以尝试面向你的场景调优一个模型。在后续的章节中你将学习和实践这一点。3. 小结通过前面的学习你已经了解了一个简单 RAG 的工作流程以及常见优化手段。你也可以结合前面学习到的知识结合实际需求将不同的问题路由到不同的 RAG 应用中以构建一个能力更强大的模块化 RAG 应用。此外通过前面的学习你应该也能发现大模型不只是可以用于构建问答系统。借助大模型识别用户意图、提取结构化信息比如前面的根据用户问题提取标签也能在很多其他应用场景中发挥作用。当然RAG 的优化手段远不止课程中介绍的这些业内关于 RAG 的研究和探索也在持续进行还有很多高级 RAG 课题值得你去学习。从前面的学习可以看到构建一个完善、表现得足够好的 RAG 应用并不简单。而在实际工作中你可能需要更快地捕捉业务机会没有时间投入到这些细节完善中。以下是一些值得探索的方向1GraphRAG技术巧妙地结合了检索增强生成RAG和查询聚焦摘要QFS的优点为处理大规模文本数据提供了一个强大的解决方案。它把两种技术的特长融合在一起RAG 擅长找出精确的细节信息而 QFS 则更善于理解和总结文章的整体内容。通过这种结合GraphRAG 既能准确回答具体问题又能处理需要深入理解的复杂查询特别适合用来构建智能问答系统。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容​一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容​2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

酒水食品做的好网站wordpress不买域名可以吗

游戏内存中常见数据结构解析 在游戏开发和内存分析中,了解常见的数据结构及其在内存中的存储方式是非常重要的。下面将详细介绍几种常见的数据结构,包括 std::vector 、 std::list 和 std::map ,并说明如何判断游戏数据是否存储在这些结构中。 1. 字符串相关类 在处…

张小明 2026/1/11 8:57:40 网站建设

手机公众平台网站开发鲜花网站开发

RuoYi架构升级实战:从贫血模型到DDD领域驱动设计的华丽转身 【免费下载链接】RuoYi :tada: (RuoYi)官方仓库 基于SpringBoot的权限管理系统 易读易懂、界面简洁美观。 核心技术采用Spring、MyBatis、Shiro没有任何其它重度依赖。直接运行即可用 项目地址: https:/…

张小明 2026/1/11 0:08:02 网站建设

国内优秀网页设计网站成都生物城建设有限公司网站

CentOS 7 入门:Bash shell 与文件系统导航 1. 认识 Bash shell GNU Bash 主要是一个解释用户在提示符下输入命令的程序。用户输入的每个命令通常由三部分组成: - 命令 - 选项(以 - 或 – 开头) - 参数 每个输入到 shell 中的单词之间用空格分隔。命令是系统上安装的各…

张小明 2026/1/10 17:33:53 网站建设

免费建立自己的网站代码网站快捷导航ie怎么做

ComfyUI工作流导入导出终极指南:从零基础到精通应用 【免费下载链接】ComfyUI 最强大且模块化的具有图形/节点界面的稳定扩散GUI。 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI 在当今AI创作领域,ComfyUI工作流已成为众多创作者的…

张小明 2026/1/10 19:19:15 网站建设

厦门外贸网站建设英文网站域名注册

Mermaid CLI:图表自动化的革命性工具 【免费下载链接】mermaid-cli Command line tool for the Mermaid library 项目地址: https://gitcode.com/gh_mirrors/me/mermaid-cli 还在为文档中的图表同步问题而烦恼吗?Mermaid CLI正是解决这一痛点的强…

张小明 2026/1/11 1:45:06 网站建设