Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读
检索增强生成(RAG:Retrieval Augmented Generation)技术旨在把信息检索与大模型结合,以缓解大模型推理“幻觉”的问题。近来关于RAG的研究如火如荼,支持RAG的开源框架也层出不穷,并孕育了大量专业领域的AI工程应用。我们设计了一个通用的开源RAG框架,以兼容未来多样化的基础研究建设和工程化应用诉求。
发表于 9月以前   ·   阅读量:748
一文带你了解大模型——智能体(Agent)
大语言模型很强大,就像人类的大脑一样拥有思考的能力。如果人类只有大脑,没有四肢,没有工具,是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢?大模型是不是就会打破次元壁,从数字世界走向现实世界,与现实世界实现梦幻联动呢?
发表于 10月以前   ·   阅读量:1014
腾讯文档AI助手技术实践
本文从技术应用架构以及AI大模型赋能角度介绍腾讯文档AI智能助手的探索和实践之路。作为一款集多功能为一体的AI产品,腾讯文档全品类与AI进行了深度融合,全面提升用户生活和办公中的效率。通过腾讯文档AI,你脑海中灵光一现的Idea可以快速转化为详细的内容,在各种类型的文档中同源流转。同时,面对纷繁复杂的信息,腾讯文档AI也可以加以分析处理,帮助你从海量的信息中提炼出有价值的内容,从而将他们转化为属于你的认知。
发表于 11月以前   ·   阅读量:861
LLM 安全 | 大语言模型应用安全入门
在本文中,无恒实验室以应用安全工程师的视角,汇总梳理有关 LLM 的原理和基础知识,以赋能安全工程师为后续新型使用 LLM 的产品的信息安全保驾护航。
发表于 11月以前   ·   阅读量:710
轻松上手的LangChain学习说明书
本文为笔者学习LangChain时对官方文档以及一系列资料进行一些总结~覆盖对Langchain的核心六大模块的理解与核心使用方法,全文篇幅较长,共计50000+字,可先码住辅助用于学习Langchain。
发表于 1年以前   ·   阅读量:808
基于LLM大模型Agent的适用范围和困境
文章讨论了知识库问答和个人助手两个应用场景,并分析了各自面临的困境,如知识库无法有效处理多模态信息和大型文档,个人助手则受限于工具参数的复杂性和令牌长度。
发表于 1年以前   ·   阅读量:739
调教 AI:让 ChatGPT 陪你玩猜单词游戏(附完整提示词)
当我做过几个项目之后,我才发现,原来 Prompt 真的是有很大的想象空间,一些看起来简单的指令,就能让 AI 帮你完成不可思议的事情,并且马上能看到效果。这一点,有一丢丢像前端,曾经让我痴迷于前端的原因,也是因为前端通过很简单的几行代码,就能做出非常令人惊叹的效果。
发表于 1年以前   ·   阅读量:991
搜狐新闻Hybrid AI引擎端侧离线大语言模型探索
LLM(Large Language Models)大语言模型,是机器学习模型的一种,它由大量的文字数据生成各种的NLP(自然语言处理)任务。比如问答,翻译,补全句子等。
发表于 1年以前   ·   阅读量:802
Simhash在内容去重中的应用
信息流个性化推荐场景中依赖爬虫抓取的海量新闻库,这些新闻中不乏互相抄袭的新闻,这些内容相似的文章,会造成内容的同质化并加重数据库的存储负担,更糟糕的是降低了信息流内容的体验。所以需要一种准确高效的文本去重算法。
发表于 1年以前   ·   阅读量:730
LLM 让你的 LowCode 平台更智能!
ChatGPT,作为一个先进的自然语言处理工具,可以理解和生成人类语言,提供智能编程建议,自动化代码生成,以及提供交互式编程教学。这些功能为开发者提供了前所未有的便利,大大减少了编程的时间和复杂性。
发表于 1年以前   ·   阅读量:783
如何利用ChatGPT和Midjourney轻松创作绘本故事
面对AI工具的强大创作能力,设计师一直担心工作被AI所取代,然而AI真的会取代设计师吗?本篇文章从比较简单的绘本故事下手,整理一套全流程AI创作的方法。
发表于 1年以前   ·   阅读量:813
Stable Diffusion你需要知道的算法原理(通俗版)
本篇文章旨在以更加通俗易懂的给大家讲解Stable Diffusion生成原理,通过本文,你将掌握以下知识:Stable Diffusion原理介绍,模型训练相关原理,大模型微调技术。
发表于 1年以前   ·   阅读量:1530
领先99%小白的Sora关键信息!
Sora是一个以视频生成为核心的多能力模型,本文简单介绍了什么是Sora,主要从Sora有多强、Sora技术突破以及复刻难度、意义和启发三个方向出发展开讨论。
发表于 1年以前   ·   阅读量:951
Wolfram:ChatGPT 的内部原理
我认为必须将其视为一项(可能非常惊人的)科学发现:在像 ChatGPT这样的神经网络中,能以某种方式捕捉到人类大脑在生成语言时所做事情的本质。
发表于 1年以前   ·   阅读量:770
LangChain原理学习笔记
最新越发觉得AI的发展,对未来是一场革命,LangChain已经在工程设计上有了最佳实践,类似于AI时代的编程模型或编程框架,有点Spring框架的意思。之前在LangChain上也有些最佳实践,所以在这里分享记录下。
发表于 1年以前   ·   阅读量:917
零基础也能使用Midjourney打造个性化3D风格头像
在近期,许多人热衷于学习和实践AIGC(人工智能生成内容)技术,他们坚信“最好的学习方式就是通过实践”。为了更好地掌握这项技术,有些人在业余时间纷纷尝试使用「Midjourney」来创作个性化的头像。今天,我将与大家分享这一过程,希望能够为大家提供一些参考、启发和交流的机会。
发表于 1年以前   ·   阅读量:863
一文带你了解OpenAI Sora
最近AI圈最火的无疑是OpenAI在2月15日发布的Sora。Sora可以根据文本生成一分钟的高清视频,生成的视频画质、连续性、光影等都令人叹为观止,Sora无疑将视觉生成推到新的高度。本文将重点回答三个问题:(1)Sora的原理是什么?(2)Sora到底是不是世界模型?(3)Sora会影响哪些行业?
发表于 1年以前   ·   阅读量:846
解读OpenAI Sora文生视频技术原理
OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。OpenAI 随后公布的技术综述[文献1],难掩其勃勃雄心:视频生成模型作为世界模拟器。
发表于 1年以前   ·   阅读量:842
我在模拟世界!OpenAI刚刚公布Sora技术细节:是数据驱动物理引擎
OpenAI 的首个视频生成模型 Sora,让「一句话生成视频」的前沿 AI 技术向上突破了一大截,引发了业界对于生成式 AI 技术方向的大讨论。
发表于 1年以前   ·   阅读量:1565
OpenAI 的 ​Sora 技术报告详解
Sora 详细的技术报告发布了,相关从业者可能都需要看看。里面有 Open AI的训练思路以及 Sora 详细的技术特性,我从里面找了一些要点,详细的可以去看完整内容。
发表于 1年以前   ·   阅读量:961
人人都是AI大师 - Prompt工程
prompt工程不需要复杂的编程知识,人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程,不涉及模型训练等内容。只讨论文本生成,不涉及图像等领域。
发表于 1年以前   ·   阅读量:893
几个好玩好用的AI站点
ai能力在去年一年飞速增长,各种AI产品如雨后春笋般冒出来,在各种垂直领域上似乎都有AI的身影出现,今天就总结几款好玩的场景,看大家工作生活中是否会用到。
发表于 1年以前   ·   阅读量:835
重新思考终端 LLMs 和 Agents
LLM (Large Language Models) 的风头一时无两,席卷万千行业。业内不乏有关于 LLM 的研究和讨论,但鲜有立足终端的视角。团队上半年曾有过对 GPT 进终端的分析,但 LLM 日新月异,旧分析已经不完全跟得上变化了。适逢年底规划季,尝试重新梳理 LLM 的现状,预判未来变化的趋势,希望能为迷茫的同仁提供思考的角度,也希望获得战斗在一线的友军的指点。
发表于 1年以前   ·   阅读量:823
深入剖析开源大模型+Langchain框架智能问答系统性能下降原因
大模型(LLM)相关理论研究与工程实践随着 GPT3 的发布,在学术界、工业界大爆发,备受各行各业关注,并涌现出一些赋能行业、促进生产力、生产关系变革的实践。GPT3 [1] 以及斯坦福计算机学院近 100+ 教授联名论文 [2] 将大模型列为第三轮 AI 浪潮,相对于传统的机器学习与深度学习,以 GPT3 为例的大模型涌现出处理各类任务的新范式:zero-shot、few-shot、in-context 等,同时也支持深度学习领域的 finetune,新范式让大模型能够低成本、快速处理各种任务,极大的缩短了数据准备与工程开发流程。
发表于 1年以前   ·   阅读量:1055
听说你把 ChatGPT 当成搜索引擎用了?
看到一些读者朋友把 ChatGPT 当成搜索引擎使用了,当然这样使用也没有问题,只是并不能发挥出 ChatGPT 背后大型语言模型(LLM)的优势,似乎有一种在“拿斧头切菜”的感觉。
发表于 1年以前   ·   阅读量:852
OpenAI新开放了这些好用的API功能
OpenAI近期召开了开发者大会,同时也发布和开放了一些新的功能特性,比如新版本GPT-4 Turbo,支持128k上下文,知识截止更新到2023年4月,视觉能力、DALL·E3,文字转语音TTS等等全都对API开放,GPTs商店已经对Plus账户开放。本文将对OpenAI截止到目前的大部分开放API能力进行介绍,注意的是这里使用的账号必须是绑定了信用卡的正式账户,非正常渠道购买的账号不能调用大部分API。
发表于 1年以前   ·   阅读量:953
拆解Token:深入了解ChatGPT背后的构建单元
ChatGPT彻底点燃大家对大语言模型(LLM)的热情,越来越多的同学开始自己动手来实现自己的AI应用,而调用过OpenAI API的同学都知道,其API调用是按照Token来计费的,那么Token到底是什么?Token和单词/字有什么不同?Token是如何构建的?它在LLM中到底起到了什么作用?本文就来回答这些问题。
发表于 1年以前   ·   阅读量:1096
LangChain:打造自己的LLM应用
LangChain是一个框架,用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring,以及开源版的ChatGPT插件系统。
发表于 1年以前   ·   阅读量:1109
文生图大型实践:揭秘百度搜索AIGC绘画工具的背后故事!
近日,百度搜索主任架构师Tianbao应邀参加了知名技术媒体InfoQ的“极客有约”对话节目,与主持人和观众们就图像生成技术进行了深入探讨,包括百度搜索的应用场景、相关技术的思考,以及在搜索业务场景的应用落地经验。
发表于 1年以前   ·   阅读量:841
一门号称比Python快68000倍的新型AI编程语言
Modular 公司在 9 月正式对外发布了 Mojo,这是一门面向 AI 领域的新型编程语言,号称比 python 快 68000 倍,而且会“着火”,真有那么猛吗?跟随着这篇文章咱来一探究竟。
发表于 1年以前   ·   阅读量:1045
深夜炸场!OpenAI 首次开发者日:新模型发布,支持 128K 上下文,价格直降,GPT 商店要来了
OpenAI 的首次 DevDay 开发者日活动,于今日北京时间 11 月 7 日凌晨 02:00 开始,Keynote 主论坛环节由 Sam Altman 主讲并在油管现场直播,配合现场的演示,展示了多款新产品的发布,整整 45 分钟,内容紧凑而真诚。
发表于 1年以前   ·   阅读量:830
信息流场景下的AIGC实践
以QQ浏览器的信息流场景为例,每个内容都展示有标题和封面图。这是用户在决定是否点击查看详细内容时的关键参考因素,对于用户来说,标题和封面图是否命中用户兴趣极大影响用户的消费行为。所以,吸引人的标题和封面图无论是对创作者、平台方还是广告商来说都非常重要。
发表于 1年以前   ·   阅读量:945
大模型LangChain框架基础与使用示例
一图胜千言,`LangChain`已经成为当前 LLM 应用框架的事实标准,这篇文章就来对 LangChain 基本概念以及其具体使用场景做一个整理。
发表于 1年以前   ·   阅读量:1203
生成式推荐系统初探
随着 ChatGPT 的横空出世与 GPT-4 的重磅登场,生成式 AI(Generative AI)引起了前所未有的关注,基于 GPT(Generative Pre-Trained Transformer)的模型在各类 NLP 和 CV 任务上取得了惊人的效果。
发表于 1年以前   ·   阅读量:889
一文入门最热的LLM应用开发框架LangChain
在人工智能领域的不断发展中,语言模型扮演着重要的角色。特别是大型语言模型(LLM),如 ChatGPT,已经成为科技领域的热门话题,并受到广泛认可。在这个背景下,LangChain 作为一个以 LLM 模型为核心的开发框架出现,为自然语言处理开启了一个充满可能性的世界。借助 LangChain,我们可以创建各种应用程序,包括聊天机器人和智能问答工具。
发表于 1年以前   ·   阅读量:832
用强化学习构建个性化的二维码
AIGC 在图像生成领域如火如荼,StableDiffusion 加各种 LORA,ControlNet,大家玩得不亦乐乎。但是基于扩散模型的方式,仍然存在很多问题,比如抽卡成功率过低,生成图像的细节仍需优化。
发表于 1年以前   ·   阅读量:969
由浅入深了解机器学习和GPT原理
我不是一个机器学习专家,本来是一名软件工程师,与人工智能的互动很少。我一直渴望深入了解机器学习,但一直没有找到适合自己的入门方式。这就是为什么,当谷歌在2015年11月开源TensorFlow时,我非常兴奋,知道是时候开始学习之旅了。不想过于夸张,但对我来说,这就像是普罗米修斯从机器学习的奥林匹斯山上将火种赠予人类。在我脑海中,整个大数据领域,以及像Hadoop这样的技术,都得到了极大的加速,当谷歌研究人员发布他们的Map Reduce论文时。这一次不仅是论文,而是实际的软件,是他们在多年的发展之后所使用的内部工具。
发表于 1年以前   ·   阅读量:951