从零开始解析Transformer,目标是:(1) 解析Transformer如何运作,以及为何如此运作,让新同学可以入门;(2) 力争融入一些比较新的或者有特色的论文或者理念,让老鸟也可以有所收获。 ...
时代的浪潮滚滚向前,AI技术的演进正悄然改变着我们认知世界和创造价值的方式。从数据、信息到知识、智慧,从大数据到大模型,从单一智能体到多智能体协作,这是一场深刻的认知革命,也是生产力解放的新纪元。 AI粉嫩特攻队,2025年3月15日。 最近跟几个朋友讨论AI发展,突然意识到现在的科技变化真的太快了 ...
本文是Ollama系列教程的第5篇,在前面的4篇内容中,给大家分享了如何再本地通过Ollama运行DeepSeek等大模型,演示了chatbox、CherryStudio等UI界面中集成Ollama的服务,并介绍了如何通过cherryStudio构建私有知识库。 在今天的分享中,我将分享如何通过AP ...
DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏(Distillation) 本文重点进行DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏(Distillation),由于硬件资源有限,只能只用cpu进行模型蒸馏。 1. 蒸馏目标 1.1. 知 ...
AI技术正在深刻改变电商行业的运营模式,从精准营销到供应链优化,从用户体验提升到成本效率革命。 亚马逊的推荐系统贡献35%以上销售额,通过实时更新用户画像推送“猜你喜欢”。 抖音电商的“兴趣推荐”结合短视频内容偏好,转化率提升3倍。 对于初涉电商领域的新手而言,这既是一个充满挑战的时代,也是一个前所 ...
售后助手主要针对售后场景进行设计,涵盖了多个关键功能。具体而言,它包括车辆故障识别、提供相应的修理建议、预约维修服务以及通过电子邮件通知等功能,旨在为用户提供高效、便捷的售后服务体验。除了支持常规的自然语言沟通外,助手还深度集成了后端数据交互机制,确保用户的隐私信息得到充分保护。在数据处理和信息交互 ...
本文是Ollama系列教程的第4篇,在前面的3篇内容中,我们分享了如何在本地安装ollama、运行deepseek等大模型、以及如何在chatbox和cherryStudio中使用本地ollama中的大模型,我们创建了私有的AI对话框和智能体。 Ollama系列教程目录(持续更新中): 轻松3步本地 ...
原文链接:MCP Server 开发实战指南(Python版) 资料 MCP 官方文档 https://modelcontextprotocol.io/introduction 各个 clients 对 MCP 的支持情况 https://modelcontextprotocol.io/client ...
大部分程序员在学习大语言模型的时候都比较痛苦,感觉AI是如此之近又如此之远,仿佛能搞明白一点,又好像什么也没明白。就像我们在很远的地方看珠穆拉玛峰,感觉它就像一个不大的山包,感觉只要自己做足准备咬咬牙还是能登顶的。但当你越走越近,试图接近它并翻越它时就会发现它的庞大和自己的渺小,以至于你每走一步都无 ...
1 啥是注意力? 人类观察事物,能快速判断一种事物,是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断,而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践,产生了注意力机制(Attention Mechanism)。 想象你在人群中找一个穿红衣服的人。你不会一一检查每个人的鞋子、裤 ...
目录基础概念什么是 LangChain什么是 Ollama环境搭建与配置安装 Ollama安装 LangChain文档加载加载 JSON 数据加载文件夹中的文档文本向量化实现问答应用 检索增强生成(Retrieval-Augmented Generation,RAG)是一种优化大型语言模型输出的方法 ...
MCP 本机服务端和客户端Python例子 下面我将为你提供一个简单的 MCP(Model Context Protocol)协议的服务端和客户端的 Python 示例。这个示例基于 Anthropic 官方的 Python SDK,并展示如何创建一个基本的 MCP 服务端(提供工具和资源)以及一个 ...
本文是Ollama系列教程的第3篇,在上一篇中我们介绍了将Ollama部署的本地大模型应用到chatbox中,并在chatbox开启本地AI对话框、构建属于自己的专属大模型。 本篇将介绍另一款好用的AI桌面应用CherryStudio,除了具备chatbox的对话、构建智能体功能之外,还具备构建本地 ...
记一次茶余饭后的AI问答,记录于:20250317-21:10,转载请注明出处 Q:什么是向量数据库?与关系型数据库和时序库有什么区别? 好的,我们来详细解释一下向量数据库,以及它与关系型数据库和时序数据库的区别。 什么是向量数据库? 向量数据库是一种专门用于存储、索引和查询向量嵌入(vector ...
准备环境 miniconda 作用: 虚拟环境:为每个项目创建独立的Python环境(如Python 3.10),避免全局安装导致版本冲突。 依赖管理:通过conda或pip精准安装AI框架(如PyTorch、LangChain),解决库版本兼容性问题。 安装: 下载地址:miniconda下载 ...
引言:AI时代下的聊天机器人开发范式演进 在生成式AI技术爆发的当下,基于大语言模型(LLM)的聊天机器人开发已形成标准化技术链路。本文将结合DeepSeek API与微软Semantic Kernel框架,以C#语言实战演示从基础API调用到高级框架集成的完整开发流程。 环境准备与基础配置 .NE ...
大家好,我是 V 哥。 前不久,字节重磅推出 AI 原生 IDE Trae,有了这款工具,程序员的开发效率得到了大大的提升,如何你是程序员,还没有使用起来,那 V 哥建议你即刻起马上安装上,谁用谁知道。废话不多说,一起来看看它的牛逼之处。 一、Trae 开发工具深度介绍:AI 原生 IDE 重塑编程 ...
一:前言: 那么为什么要本地部署,主要就是企业或者个人为了数据安全和防止受限网络等其 数据安全:数据不用上传到外面,在本地处理,不用担心数据泄露,像金融、医疗这些对数据安全要求高的行业特别需要。 功能方面 定制:可以根据自身业务需求和用户特点对模型进行个性化改造,比如制造业调整生产流程等 使用体验方 ...
背景STAR法则的应用 STAR法则常被用作面试官评估应聘者过去工作经历和能力的一种工具,能够帮助面试官系统地了解应聘者过去的工作经历,揭示他们面临挑战时的应对策略,以及所取得的工作成果。通过这一法则,面试官能够更全面地评估应聘者的专业能力和工作态度。应聘者也可以通过STAR法则来准备面试,提前梳理 ...
1 回译增强的核心机理 1.1 跨语言语义重构原理 目前文本数据增强方面效果较好的增强方法。回译数据增强(Back-translation Augmentation)是基于神经机器翻译的文本再生技术,其核心运作流程包含三个关键阶段: 语义编码阶段:源语言文本通过NMT模型编码为中间语义表示 跨语言迁 ...