首页
文章
文库
登录
|
注册
最新
推荐
热门
主题
关注
收藏
反馈
关注公众号
更多关联主题
文章
文档
大模型是怎么被训练出来的?
随着DeepSeek的爆火,人们对LLM(LargeLanguageModel,大语言模型)兴趣与日激增,很多人觉得LLM常常显得近乎魔法般神奇。接下来我们就来揭开LLM的神秘面纱。拆解一下LLM的基本原理——深入探讨......
深度学习五大模型:CNN、Transformer、BERT、RNN、GAN解析
深度学习是人工智能领域的一个最核心分支,深度学习的五个常用模型分别是RNN(循环神经网络)、CNN(卷积神经网络)、Transformer、BERT(BidirectionalEncoderRepresentationsfromTr......
一文看完大模型微调技术:微调背景、分类和微调全流程
微调技术就是解决这最后一公里的方案之一(另外类似的还有RAG,详见RAG的介绍和使用,但各有优缺点),本文比较全面的介绍关于大模型微调技术,让你有一个全面的认知,结合本站其他实操案例,希......
什么是Token?
它一般是指大语言模型的一个基本单位,短的一个英文单词可能就被定为一个token,比如"refers",而长的英文单词可能会被拆分成多个token,比如”Tokenization“。......
一文读懂大模型RAG:检索、增强与生成的技术详解
大模型(LargeLanguageModel,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型往往面临专业知识不足的问题。相对于成本昂贵的“Post-Training”或“Supervis......
什么是大模型(LLMs)?一文读懂什么是大模型
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。......
一文彻底搞懂大模型 - RAG(检索、增强、生成)
RAG(Retrieval-AugmentedGeneration,检索增强生成)是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言......
大模型领域常用名词解释
本文总结了大模型领域常用的近100个名词解释,并按照模型架构与基础概念,训练方法与技术,模型优化与压缩,推理与应用,计算与性能优化,数据与标签,模型评估与调试,特征与数据处理,伦理与......
构建AI大模型应用技术栈有哪些
随着人工智能技术的飞速发展,AI大模型已经成为推动各行各业技术革新的关键力量。本文将深入探讨AI大模型的核心技术栈的构建,以及不同技术组件的关键作用。......
如何构建高效的智能应用:大模型五层技术架构详解
随着人工智能技术的不断发展,各类智能应用正在迅速普及,成为推动各行业数字化转型的重要力量。本文将通过大模型五层技术架构,详细解析智能应用的技术架构,帮助读者更好地理解和应用这些技术......
大语言模型(LLM)工作的3个步骤
生成式AI中常说的token是什么?嵌入(Embeddings)是什么意思?为什么现在的AI具有生成能力?AI是怎么和你进行对话的?为什么都说提示词很重要?为什么同一段提示词,同一个AI模型/工具,多问几......
大模型应用的10种架构模式
在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重要技能。然而,当我们转向大模......
AI大模型+RAG的综述
大型语言模型(LLMs)展现了显著的能力,但面临诸如幻觉、过时知识以及不透明、无法追踪的推理过程等挑战。检索增强生成(RAG)通过整合外部数据库的知识,已成为一个有前途的解决方案。......
企业内部如何更好落地大模型
对于软件企业而言,在已有的软件上增加AI功能,并带来新产值,已经被Notion、多邻国等产品所验证。除此之外,在企业生产场景中,集成LLM的能力,并为企业组织赋能,也成为人们关注AI落地的一个......
AI大模型赋能制造业的4个基本趋势
数字化是巨变时代的分水岭,已成为企业、城市、国家之间竞争急剧分化的催化剂。制造业是数实融合最主要的产业部门,其融合的方式、广度和深度,能够直接影响甚至决定制造业的先进水平和全球竞争......
AI 智能体:应用前景与对算力需求的影响
AI技术和大语言模型的飞速进步,使得AI智能体这一人工智能技术的重要载体,得以凭借大数据、算法和计算能力的提升,实现对现实世界的感知、理解、决策和执行能力。随着研究的不断深入,AI智能体......
企业数字化智能体:打造企业数智化AI底座
2023年算得上是AI爆发的元年,自ChatGPT问世之后,国内外各种人工智能大模型都迅速出击,只为赶上这趟高铁。各式各样的人工智能应用软件层出不穷,多种AI应用创新场景被不断挖掘出来,例如文本......
企业构建AI大模型应用的步骤流程与关键问题解析
构建企业级AI大模型驱动的应用系统是一项跨越技术与业务边界的综合性任务,它不仅考验着企业在业务领域知识的深度,也挑战着企业基于AI大模型构建应用的技术高度。这一过程要求业务专家与AI大模......
一文了解AI Agent
AIAgent,即人工智能体,是一种能够感知环境、进行自主理解、决策和执行动作的智能实体。简单理解,是一种基于大语言模型,能够通过独立思考、调用工具来逐步完成给定目标的计算机程序。......
AI大模型技术的四大核心架构演进之路
本文将深入探讨四种关键的大模型技术架构:纯粹Prompt提示词法、Agent+FunctionCalling机制、RAG(检索增强生成)以及Fine-tuning微调技术,揭示它们的特性和应用场景。......
深入了解大语言模型运维 (LLMOps)
大语言模型正在如何改变我们构建人工智能产品的方式,以及重塑MLOps的全貌......
理解 AI 大模型:参数、Token、上下文窗口、上下文长度和温度
随着人工智能技术的不断发展,AI大模型在各个领域展现出强大的能力,也引起了广泛关注。在了解这些模型时,我们经常会看到诸如「参数」、「Token」、「上下文窗口」、「上下文长度」和「温度」......
一文彻底搞定 RAG、知识库、 Llama-3
检索增强生成(RetrievalAugmentedGeneration,RAG)是一种强大的工具,它通过将企业外部知识整合到生成过程中,增强了大语言模型(LLM)的性能。......
RAG 的工作流程和架构
RAG可以从权威的、预先确定的知识库中检索出相关的上下文片段,然后将问题和检索结果一起传给大模型,大模型依赖这些特定输入生成最终的答案。这样既保证了来源的可靠性,避免了大模型的过度发......
大模型
主题文档
Bert和Transformer到底学到了什么
华为预训练语言模型
基于GPU的大规模语言模型加速
FASTER TRANSFORMER TRANSFORMER 网络推理的高效实现
基于预训练语言模型的Intent模版引擎
计算机视觉中的自监督学习与Transformer注意力建模
基于动态知识选择的预训练语言模型
Contrastive Triple Extraction with Generative Transformer
Beyond Efficient Transformer for Long Sequence Time
Future Guided Incremental Transformer for Simultaneous Translation