精准与效率:RAG应用PDF文档图文提取OCR策略

  在RAG应用中通常需要对各种文档进行文本提取,如果稳定是纯文本那文档提取会简单很多,但通常文档中会存在各种图片信息,这是就需要使用OCR在提取文档文本信息的同时对图片进行OCR获取图片中的文本内容。本文只介绍PDF文档中OCR技术方案。PDF文档解析目前有不少开源框架亦可支持对PDF中的图片进行

详解智能体应用——资讯简报智能体

  在智能体爆发的浪潮中,信息的获取与处理效率无论是对企业亦或是个人都是保持竞争力的关键。面对日益分散和爆炸式增长的信息源,常常极易使人沉迷其中,陷入碎片化消耗陷阱,时间萧然流失。本文将深度剖析一个智能体的构建的全自动 AI 资讯简报智能体,从架构设计、技术实现和应用价值三个层面,揭示如何打造一个可

AI工作流与智能体的人机协作及应用

      AI正改变着各行各业,从内容创作到客户服务、知识问答等AI的应用日益广泛。为了更有效的利用AI,通常需要构建智能体或其初级形式的workflow。但在目前阶段无论是智能体亦或许Workflow都无法保证其自动运行能达到100%的可靠性,根源在于大模型存在着下面的一些问题:幻觉问题、工具调

开发ESP32大模型AI语音助手-从软件到硬件

      去年底开始基于ESP32开发DIY的各种AI语音智能助手层出不穷,AI智能玩偶也比较火热。目前市面上也都有比较成熟的开发板集成了各种模块麦克风、OLED、功放、摄像头等几乎是开箱即用,普通开发者买了折腾一通总能搞点什么出来,当然对于批量推出市场的使用这种开发板成本比较高,通常比较少人这么

小玩具:ESP32——刷固件与亮屏

      去年开始大模型火爆后也带动了ESP32芯片的爆发出圈带动股票暴涨。各种AI玩具层出不穷。ESP32的低门槛再加上B站UP的带动,光开源的小智AI两月就带动了10万AI设备,当然这和原来的智能音箱如小爱同学比只能算是毛毛雨,而且门槛很低智能音箱厂商发个OTA或新出个版本也就接入大模型了,而

数说海南—五年来各市县城市建设概况

      这里简单通过2019年到2023年这五年的城区面积、建成区面积、城市人口密度、征用土地情况、城市规划建设用地情况几个指标简单看看海南各市县发展。       海南各市县规模差别巨大,最大与最小的无论是城市规模或是人口规模都不是一个数量级,但由于海南省直辖县的特性县和地市通常也是放在一个图

浅看浅谈浅体验DeepSeek-R1模型

      DeepSeek-V2.5的时就有听说过,直到 V3出来时开始使用已经体验了一个多月,说实话效果没那么惊艳会莫名从中文会话突然吐出英文。用的官方Web网页稍微多点,Api接口也有在使用其性价比比较高,价格性能相对于其他模型比较便宜,目前注册就送十块钱使用额度。       V3推出时就已

AI Agents(智能体)是什么能做什么

      Agents从去年大模型火后就开始爆发,特别是今年2025又被成为Agents元年,像是要无处不存在Agents似的。Agent是什么,直译过来就是代理,但在国内人工智能领域通常被译为智能体。从智能体这个名字可以大概想象出这个Agents可能与智能相关,此概念出现已经有相当长时间了。随着

模型上下文协议MCP

      MCP(Model Context Protocol) Anthropic推出的一种开放协议,旨在统一LLM应用于外部数据源之间的通讯协议使之无缝集成,MCP提供了标准化协议使得LLM与所需要的上下文无缝衔接。使用MCP可以插件式为LLM的集成各种外部数据源。 MCP概念       

大模型微调—海南小百科(一)

      语言大模型是通过大规模数据集训练而来可以帮我们进行文本生成、内容总结,但对于一些小众知识、内部数据模型不一定知道怎么回答,这时候可能会胡言乱语。目前要想在特定领域小众知识或私密数据时模型能够表现出比较好的水平目前主要有两种方式可以实现:模型微调、外挂知识库也就是RAG模式,RAG模式之前
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×